王永
“從去年與Hortonworks完成合并后,Cloudera的定位和愿景是成為一家企業(yè)數(shù)據(jù)云的公司,包括Cloudera即將推出的下一代產(chǎn)品都是以企業(yè)的數(shù)據(jù)云作為主要方向。” Cloudera大中華區(qū)總經(jīng)理徐晉在接受筆者的采訪時表示,Cloudera希望能夠賦能于用戶把復(fù)雜的數(shù)據(jù)轉(zhuǎn)化成為清晰可行的洞察力,且能夠適用于任何云環(huán)境或者數(shù)據(jù)中心,提供數(shù)據(jù)全生命周期的云原生服務(wù)和軟件平臺。
關(guān)于數(shù)據(jù),幾乎全球所有的企業(yè)都數(shù)字化轉(zhuǎn)型,同樣也在尋求轉(zhuǎn)變成為數(shù)據(jù)驅(qū)動類型的企業(yè)。尤其是在國內(nèi)新冠疫情后,企業(yè)的數(shù)字化轉(zhuǎn)型也進(jìn)一步提速,在這一過程中,數(shù)據(jù)的價值日益重要。
在這樣一個大的背景下,各行各業(yè)在數(shù)據(jù)方面投入越來越多的資源來實現(xiàn)盡快將企業(yè)經(jīng)營各個環(huán)節(jié)數(shù)字化,以促進(jìn)整個數(shù)字化轉(zhuǎn)型的進(jìn)程,這也勢必使整個企業(yè)收集的數(shù)據(jù)量越來越大。
去年哈佛商學(xué)院曾發(fā)布一個研究報告數(shù)據(jù)表明,無論是企業(yè)還是政府機(jī)關(guān),他們在不同的環(huán)境中收集、處理和管理數(shù)據(jù)。而且,在云環(huán)境中,不管是在組織內(nèi)部,還是在私有云、混合云,還是在多云或者單云,都有大量客戶把他們的數(shù)據(jù)存放在不同的地方進(jìn)行運維和管理。
此時,帶給企業(yè)的挑戰(zhàn)主要體現(xiàn)體現(xiàn)在兩個方面:面對復(fù)雜多變的環(huán)境,企業(yè)要如何正確的收集、管理數(shù)據(jù),以及如何形成一個統(tǒng)一的數(shù)據(jù)戰(zhàn)略,做到真正的把數(shù)據(jù)轉(zhuǎn)化成為真實可見的業(yè)務(wù)價值。
“對于Cloudera而言,我們是希望從數(shù)據(jù)安全、管理影子IT、云原生服務(wù)、完整的數(shù)據(jù)周期以及AI五個方面賦能企業(yè)客戶,”徐晉表示,安全問題是企業(yè)上云過程中首要考慮的問題。Cloudera希望客戶在任何地方運行其數(shù)據(jù)資產(chǎn)都能夠確保一致的數(shù)據(jù)的安全性。實現(xiàn)對數(shù)據(jù)可行進(jìn)行有效的治理,很大程度上在整個企業(yè)范圍內(nèi)能夠確保這些數(shù)據(jù)的安全。
影子IT是Gartner提出來的概念,是指企業(yè)員工使用沒有經(jīng)過IT批準(zhǔn)的應(yīng)用程序。很多時候,IT往往在跟隨業(yè)務(wù)需求方面會有一定的遲滯,這造成很多業(yè)務(wù)部門會自己在外部去采購很多的業(yè)務(wù)系統(tǒng),這就會造成很多數(shù)據(jù)孤島,對企業(yè)實現(xiàn)統(tǒng)一的數(shù)據(jù)戰(zhàn)略形成障礙。
“如何解決好業(yè)務(wù)部門和IT部門之間不同步的問題,這需要通過諸如云原生數(shù)據(jù)技術(shù)來增加整個IT部門的敏捷來得以解決。”徐晉表示,Cloudera希望賦能客戶跨公、私有云的云原生的服務(wù)。幫助企業(yè)IT能夠連接完整的數(shù)據(jù)生命周期,從邊緣計算到經(jīng)過粗加工、精加工、以及數(shù)據(jù)科學(xué)和AI等能夠提供前瞻性預(yù)測的端到端的解決方案,為客戶提供一致的使用體驗。
Cloudera Data Platform(CDP)是Cloudera與Hortonworks合并后推出的全新一代的數(shù)據(jù)平臺產(chǎn)品。它結(jié)合了Cloudera原產(chǎn)品CDH以及Hortonworks原產(chǎn)品HDP當(dāng)中最精華的部分融為一體,。它基本上是基于Apache開源社區(qū)的將近30多個開源項目,經(jīng)過研發(fā)、測試、整合后提供的一個可靠的基礎(chǔ)的大數(shù)據(jù)運營環(huán)境。
在此基礎(chǔ)之上,它還可以提供六方面的能力——數(shù)據(jù)中心、Data Flow & Streaming,用于數(shù)據(jù)的采集、Cloudera Data Engineering,做批量數(shù)據(jù)處理的組件、數(shù)據(jù)倉庫、Operational Database,基于Hbase等一些實時的非結(jié)構(gòu)化的數(shù)據(jù)庫、以及機(jī)器學(xué)習(xí)平臺。
值得一提的是,在六大核心能力之上是Cloudera非常獨特的數(shù)據(jù)管理的一層——SDX,即共享數(shù)據(jù)體驗。存放在Cloudera平臺上的數(shù)據(jù),用戶無論是把這些數(shù)據(jù)用做批量處理還是報表,都會提供統(tǒng)一的數(shù)據(jù)管理、統(tǒng)一的數(shù)據(jù)目錄、統(tǒng)一數(shù)據(jù)的安全管控。
除此之外,CDP的特點是可以在運行不同的環(huán)境當(dāng)中,包括企業(yè)自己內(nèi)部的數(shù)據(jù)中心、私有云環(huán)境或者是多云/公有云,可都可以去運行CDP,而且用戶的體驗也是一致的。
近日,Cloudera發(fā)布了CDP的兩個最新版本:CDP的public cloud——基于PAAS層,以公有云服務(wù)的形式提供。以及 CDP的private cloud,這是Cloudera私有云的產(chǎn)品,主要是部署在企業(yè)的數(shù)據(jù)中心內(nèi)部。
“Cloudera的私有云版本跟傳統(tǒng)方式有些不同,我們會借用容器化的private cloud方式,一次性的去安裝CDP的private cloud版本,在設(shè)計好環(huán)境之后,可以在幾分鐘之內(nèi)就可部署好環(huán)境?!贝笾腥A區(qū)技術(shù)總監(jiān)劉隸放表示,部署在新的環(huán)境里面,用戶的安全管控機(jī)制是跟DC版本完全一致的,這完全符合Cloudera企業(yè)級的客戶對數(shù)據(jù)管控的要求。所以說Cloudera私有云為用戶提供了一個上手更快、且真正意義上多租戶的版本。
劉隸放強(qiáng)調(diào),Cloudera會在公有云和私有云平臺上,用一種開發(fā)模式在兩種云上都部署,這樣既可以保證產(chǎn)品的開發(fā),又可以保證用戶的使用體驗。也就是說如果客戶有需求,比如從公有云往私有云上面去移自己的應(yīng)用或者反向去移自己的應(yīng)用都是可以實現(xiàn)的。
“邁向私有云是基于裸數(shù)據(jù)中心的數(shù)據(jù)分析體驗的版本,這樣在已有的環(huán)境上面能夠快速去部署,用戶的IT或者業(yè)務(wù)部門可以自動化的去做自主服務(wù)?!?劉隸放表示,Cloudera的私有云產(chǎn)品會為客戶帶來兩點改變——企業(yè)級的安全性和管控的機(jī)制,這是Cloudera在市場生存的重中之重,以及跨云的環(huán)境,讓用戶公有云、私有云,包括私有平臺上面得到一致的體驗。
“Cloudera整個企業(yè)數(shù)據(jù)云在整個市場當(dāng)中,跟其他一些解決方案不一樣的地方?!痹谛鞎x看來,Cloudera的產(chǎn)品可以運行在任何云環(huán)境里面,不管是私有云、公有云還是公有云中。其次,Cloudera提供的是全生命周期的平臺,并且在整個數(shù)據(jù)生命周期里面提供了全套的數(shù)據(jù)安全跟數(shù)據(jù)治理這方面的功能。更重要的是,Cloudera平臺的開放性。
“在Cloudera進(jìn)入中國這5年之內(nèi),可能我們最大的友商就是我們自己的開源的版本?!毙鞎x表示,接下來Cloudera的各類Apache組件依舊會按照Apache的協(xié)議提交到Apache社區(qū),任何對Apache社區(qū)的貢獻(xiàn),Cloudera會100%的開源,繼續(xù)在社區(qū)做開源項目的貢獻(xiàn),這也是Cloudera接下來產(chǎn)品發(fā)展堅持的最重要元素。