Cloudera發(fā)布全新數(shù)據(jù)平臺CDP,強(qiáng)化企業(yè)數(shù)據(jù)云公司定位
Cloudera日前發(fā)布了最新一代產(chǎn)品Cloudera Data Platform(CDP),該平臺產(chǎn)品可在混合和多云環(huán)境中提供強(qiáng)大的自助式服務(wù)分析,實(shí)現(xiàn)從邊緣到人工智能的價(jià)值交付。這是Cloudera與Hortonworks合并之后的重大產(chǎn)品升級,集合了Cloudera的旗艦產(chǎn)品CDH和Hortonworks旗艦產(chǎn)品HDP之精華,集成了Apache開源社區(qū)的30多個(gè)開源項(xiàng)目,經(jīng)過充分測試、整合而成。Cloudera與Hortonworks合并后的新定位是企業(yè)數(shù)據(jù)云公司,這一產(chǎn)品的推出將進(jìn)一步強(qiáng)化Cloudera企業(yè)數(shù)據(jù)云公司的新定位。
全新數(shù)據(jù)云平臺CDP
今天,云已經(jīng)成為越來越多企業(yè)的主流IT環(huán)境,將數(shù)據(jù)相關(guān)處理架構(gòu)在云上勢在必行,CDP的推出也是順應(yīng)了這一趨勢。CDP分為兩個(gè)版本:公有云版本和Private Cloud(CDP私有云),兩個(gè)版本完全同構(gòu)。其中,CDP公有云版本是一個(gè)PaaS服務(wù),以公有云服務(wù)的形式提供,目前已經(jīng)可以在AWS、Azure上面獲取。CDP私有云專為混合云構(gòu)建,,以統(tǒng)一的內(nèi)置安全治理能力將本地部署環(huán)境無縫連接至公有云。
Cloudera大中華區(qū)總經(jīng)理徐晉介紹,CDP可以提供六大能力。首先是提供數(shù)據(jù)中心 (Data Hub) 的能力,也就是提供一個(gè)基礎(chǔ)性的集中存放數(shù)據(jù)、管理數(shù)據(jù)的能力。第二個(gè)是Data Flow & Streaming,包括用于數(shù)據(jù)收集和流式的實(shí)時(shí)數(shù)據(jù)處理的一整套產(chǎn)品。第三個(gè)是Cloudera Data Engineering,主要是用來進(jìn)行批量數(shù)據(jù)處理。第四個(gè)是Cloudera Data Warehouse,也就是數(shù)據(jù)倉庫,可以替換原有的傳統(tǒng)數(shù)據(jù)倉庫。第五個(gè)是Operational Database,基于Hbase等一些實(shí)時(shí)的非結(jié)構(gòu)化的數(shù)據(jù)庫,提供互聯(lián)網(wǎng)級別的對外服務(wù)。第六個(gè)是機(jī)器學(xué)習(xí)的平臺。
除了上述六大核心能力之外,CDP還提供了一個(gè)非常獨(dú)特的數(shù)據(jù)管理的平臺,Cloudera稱之為SDX,即共享數(shù)據(jù)體驗(yàn)。
“其含義是:所有存放在CDP平臺上的數(shù)據(jù),無論用戶是想把這些數(shù)據(jù)用做批量處理還是做報(bào)表,還是做機(jī)器學(xué)習(xí),CDP都會提供統(tǒng)一的數(shù)據(jù)管理、統(tǒng)一的數(shù)據(jù)目錄、統(tǒng)一數(shù)據(jù)的安全管控,也就是會有同一套的數(shù)據(jù)治理機(jī)制。”徐晉解釋說。
此外,容器化的安裝部署也是CDP的一大特點(diǎn)。CDP私有云版本以紅帽O(jiān)penShift為支撐,以Kubernetes支持的強(qiáng)大混合架構(gòu)完善了企業(yè)數(shù)據(jù)云愿景,該架構(gòu)將計(jì)算和存儲分離,提高了敏捷性、易用性以及私有云和公有云基礎(chǔ)架構(gòu)的使用效率。
“Cloudera把自己的數(shù)據(jù)持久化能力集成在產(chǎn)品中,允許把工作負(fù)載從物理架構(gòu)中抽離出來,讓工作負(fù)載在容器化的計(jì)算平臺上面靈活地部署和使用。而且,CDP還可以和其他非Cloudera應(yīng)用共享基礎(chǔ)架構(gòu),這樣客戶不必重復(fù)投資。” Cloudera大中華區(qū)技術(shù)總監(jiān)劉隸放介紹。
賦能客戶5大能力
近幾年,隨著數(shù)據(jù)的爆炸性增長,構(gòu)建大數(shù)據(jù)平臺成為不少企業(yè)的選擇,而市場上也出現(xiàn)了不少類似的大數(shù)據(jù)平臺,不少企業(yè)甚至還往前再進(jìn)一步,開始構(gòu)建數(shù)據(jù)中臺。作為新一代的大數(shù)據(jù)平臺,CDP具有自己的獨(dú)特優(yōu)勢。
對此徐晉表示,相對市場上其他類似的平臺。CDP一大優(yōu)勢是其作為Hadoop的代表,成為很多用戶的默認(rèn)選擇。作為大數(shù)據(jù)的代表,圍繞Hadoop形成了非常完善的產(chǎn)業(yè)生態(tài),組件成熟和完善,這是其他平臺很難有的。其次是CDP的完整性。CDP并不是一個(gè)單一功能的產(chǎn)品,而是一個(gè)覆蓋數(shù)據(jù)整個(gè)生命周期的平臺產(chǎn)品,提供了全套的數(shù)據(jù)安全和數(shù)據(jù)治理這方面的功能。第三是CDP平臺的開放性,CDP全部開源。
“Cloudera后續(xù)產(chǎn)品所有源代碼都會100%開源,我們會繼續(xù)在社區(qū)做開源項(xiàng)目的貢獻(xiàn)。” 徐晉說。
徐晉表示,如今Cloudera的定位是企業(yè)數(shù)據(jù)云公司,CDP是為支撐這個(gè)定位邁出的重要一步。Cloudera最終希望從以下五個(gè)方面來幫助客戶:
1.數(shù)據(jù)安全。不管企業(yè)在哪里運(yùn)行其數(shù)據(jù)都能夠確保一致的數(shù)據(jù)安全性,能實(shí)現(xiàn)對數(shù)據(jù)進(jìn)行有效的治理。
2. 影子IT的管理。影子IT指的是IT部門掌控之外的IT系統(tǒng),大多數(shù)是由業(yè)務(wù)部門自己主導(dǎo)采購。因?yàn)椴煌琁T系統(tǒng)往往會帶入不同的數(shù)據(jù)平臺,這非常不利于企業(yè)實(shí)現(xiàn)統(tǒng)一的數(shù)據(jù)戰(zhàn)略。
3. 跨公有云、私有云的云原生服務(wù)。無論用戶是在自己的私有云還是裸金屬服務(wù)器、還是在不同的公有云上都能有一致的體驗(yàn)。
4. 支持完整的數(shù)據(jù)生命周期。提供的不是某個(gè)單點(diǎn)的解決方案,而是一個(gè)端到端的從邊緣計(jì)算到中心,經(jīng)過粗加工、精加工,到能夠提供前瞻性預(yù)測,數(shù)據(jù)全生命周期的管理所需要的全部功能的平臺。
5.建立AI工廠。能夠賦能客戶以標(biāo)準(zhǔn)的方式來做數(shù)據(jù)驅(qū)動的決策,進(jìn)一步提升他們的能力。
“這些是Cloudera在應(yīng)對我們目前的大環(huán)境滿足客戶提出的新的需求時(shí)我們希望產(chǎn)品發(fā)展的五個(gè)方向,為此Cloduera將持續(xù)完善和推出自己的產(chǎn)品和服務(wù)。” 徐晉說。