鄭悅
大數(shù)據(jù)革命日益凸顯Hadoop技術(shù)的商業(yè)模式及前景。
大數(shù)據(jù)的勃興使得數(shù)據(jù)處理成為熱點(diǎn)應(yīng)用,實(shí)踐證明從數(shù)據(jù)中挖掘價(jià)值成為企業(yè)需要解決的大數(shù)據(jù)痛點(diǎn)。這使得Hadoop這項(xiàng)大數(shù)據(jù)技術(shù)從后臺(tái)走向前臺(tái),成為人們關(guān)注的重點(diǎn)。
Hadoop是一個(gè)基于Java的分布式密集數(shù)據(jù)處理和數(shù)據(jù)分析的軟件框架?;贘ava語(yǔ)言構(gòu)建的Hadoop框架實(shí)際上是一種分布式處理大數(shù)據(jù)平臺(tái),其包括軟件和眾多子項(xiàng)目。自2005年Hadoop誕生以來(lái),十年中Hadoop已成為大數(shù)據(jù)革命的中心。Hadoop的生態(tài)系統(tǒng)構(gòu)建于Linux生態(tài)系統(tǒng)并發(fā)展,一個(gè)顯而易見(jiàn)的事實(shí)是,社交媒體和基于web的應(yīng)用驅(qū)動(dòng)了Hadoop的發(fā)展。而Hadoop技術(shù)的商業(yè)應(yīng)用代表公司Cloudera也隨之迎來(lái)了發(fā)展的機(jī)遇。
CIoude陽(yáng)是為Hadoop提供咨詢和技術(shù)服務(wù)的平臺(tái),其客戶大多來(lái)自于傳統(tǒng)行業(yè),希望通過(guò)HadoQp來(lái)處理之前只能被直接拋棄的大規(guī)模數(shù)據(jù)。現(xiàn)在,除了這些傳統(tǒng)行業(yè)之外,Yahoo!、Facebook、eBav、Lmked Jn等公司都在使用Hadoop。
本期高端訪談邀請(qǐng)Hadoop的聯(lián)合發(fā)明者,人稱“Hadoop之父”、C1oudera公司首席架構(gòu)師Doug Cutting談?wù)凥adoop技術(shù)本身的發(fā)展以及商業(yè)應(yīng)用前景。Cutting的目標(biāo)是將Hadoop發(fā)展成云計(jì)算領(lǐng)域的RedHat,“我從來(lái)沒(méi)有想過(guò),除了搜索引擎,Hadoop的作用還能在其他方面有所發(fā)揮,它今天所受到的關(guān)注程度,已超過(guò)了我之前的所有想象”。
Q:Hadoop作為一項(xiàng)發(fā)展了十年的技術(shù),在您看來(lái)未來(lái)將有怎樣的發(fā)展?
A:開(kāi)源技術(shù)的魅力在于身處社區(qū)之中,發(fā)展方向?qū)⒂砷_(kāi)發(fā)者所決定。作為Hadoop的聯(lián)合發(fā)明者,我很欣喜地觀察著這一過(guò)程。我也贊賞“Hadoop+”或者“后HadOop“|這樣的名稱,關(guān)注基于這一技術(shù)的相關(guān)應(yīng)用及生態(tài)。
Cloudera作為Hadoop的商業(yè)應(yīng)用代表之一,我們注意到基于Hadoop的行業(yè)應(yīng)用剛剛開(kāi)始,依然處于早期階段。電信、金融、政府、零售、醫(yī)療、制造等領(lǐng)域都開(kāi)始有Hadoop的應(yīng)用。而這些行業(yè)的特點(diǎn)是,在大數(shù)據(jù)的應(yīng)用浪潮中,以往基于每一個(gè)具體功能的“豎井式”應(yīng)用都亟需一個(gè)平臺(tái),而這正是Hadoop的擅長(zhǎng)之處。
在中國(guó),有改造傳統(tǒng)產(chǎn)業(yè)的現(xiàn)實(shí)需求,這使得我們更加看好未來(lái)基于Hadoop技術(shù)的應(yīng)用發(fā)展。在平臺(tái)化的過(guò)程中,企業(yè)級(jí)的應(yīng)用需要安全、穩(wěn)定、可管理的產(chǎn)品,而Cloudera所能提供的Hadoop商業(yè)套件可以滿足這樣的需求。
在我看來(lái),2016年是基于Hadoop技術(shù)應(yīng)用發(fā)展的高峰期。我們已經(jīng)在日本看到金融和電信的相關(guān)應(yīng)用,在汽車行業(yè)對(duì)于維修的可預(yù)測(cè)性的需求,也將觸發(fā)更多的應(yīng)用,不過(guò)由于這一過(guò)程時(shí)間較短,尚需要知識(shí)和經(jīng)驗(yàn)的積累。
Q:您覺(jué)得Hadoop的發(fā)展過(guò)程中目前有哪些挑戰(zhàn)?
A:我覺(jué)得在這一點(diǎn)上Hadoop所面臨的挑戰(zhàn)和數(shù)據(jù)生態(tài)系統(tǒng)的是一樣的。首先是成熟度問(wèn)題,這是一個(gè)需要完善的過(guò)程,Hadoop在商業(yè)化場(chǎng)景中的應(yīng)用依然很新。其次是人才問(wèn)題,無(wú)論是在中國(guó)還是在美國(guó),都需要大量能夠熟練使用Hadoop的程序員。第三是復(fù)雜度,云計(jì)算與大數(shù)據(jù)帶來(lái)的使用環(huán)境的復(fù)雜,這催生了平臺(tái)化工具的用武之地。第四是安全與信任,這在任何使用場(chǎng)景中同樣重要。最后一點(diǎn)是變化,如何迎接變化是需要持續(xù)關(guān)注的話題。
Q:CIOUdera公司的業(yè)務(wù)處于一個(gè)快速增長(zhǎng)階段,您對(duì)此有怎樣的看法?
A:我能看到自己的發(fā)明正在變得越來(lái)越有力量。Cloudera公司每年的增長(zhǎng)率都在百分百以上,在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)利潤(rùn)和客戶數(shù)也都在成倍增長(zhǎng)。限制Hadoop增長(zhǎng)的是能力和經(jīng)驗(yàn)的欠缺,這也和人才問(wèn)題密切相關(guān)。
對(duì)于目前的企業(yè)客戶來(lái)說(shuō),使用Cloude ra提供的套件化的Hadoop依然只是自身IT架構(gòu)的一小部分,而隨著最佳實(shí)踐的普及,將可以讓更多公司能夠更容易地使用該技術(shù)。毫無(wú)疑問(wèn),Hadoop將成為公司IT架構(gòu)中更大的部分。