帶你了解“大數(shù)據(jù)”
1980年,著名未來學家阿爾文·托夫勒在《第三次浪潮》一書中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂章”。大約從2009年開始,“大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術行業(yè)的流行詞匯。
大數(shù)據(jù),或稱巨量數(shù)據(jù)、海量數(shù)據(jù),是由數(shù)量巨大、結(jié)構(gòu)復雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,是基于云計算的數(shù)據(jù)處理與應用模式,通過數(shù)據(jù)的集成共享、交叉復用形成的智力資源和知識服務能力。
有研究機構(gòu)如此定義“大數(shù)據(jù)”:“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。從某種程度上說,大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術。簡言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價值信息的能力,就是大數(shù)據(jù)技術。
美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便將翻一番,目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。此外,全世界的工業(yè)設備、汽車、電表上有著無數(shù)的數(shù)碼傳感器,隨時測量和傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
物聯(lián)網(wǎng)、云計算、移動互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機、平板電腦、PC以及各種各樣的傳感器,無一不是數(shù)據(jù)來源或者承載的方式。
大數(shù)據(jù)的4個“V”,指的是大數(shù)據(jù)的4個特點:第一,數(shù)據(jù)體量巨大。從TB級別,躍升到PB級別;第二,數(shù)據(jù)類型繁多,數(shù)據(jù)來源于各種各樣的渠道。第三,價值密度低,商業(yè)價值高。以視頻為例,連續(xù)不間斷監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅有一兩秒。第四,處理速度快。一般要在秒級時間范圍內(nèi)給出分析結(jié)果,時間太長就失去價值了。這個速度要求是大數(shù)據(jù)處理技術和傳統(tǒng)的數(shù)據(jù)挖掘技術最大的區(qū)別。
由此,業(yè)界將大數(shù)據(jù)的特點歸納為4個“V”——Volume(大量)、Velocity(高速)、Variety(多樣)、Veracity(精確)。
大數(shù)據(jù)對社會經(jīng)濟生活產(chǎn)生的影響絕不限于技術層面,它為我們看待世界提供了一種全新的方法,即決策行為將日益基于數(shù)據(jù)分析做出,而不是像過去更多憑借經(jīng)驗和直覺做出。
“這是一場革命,龐大的數(shù)據(jù)資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程?!惫鸫髮W社會學教授加里·金指出。
業(yè)內(nèi)人士指出,大數(shù)據(jù)是一種全新的致富手段,它的價值堪比石油和黃金。
雖然大數(shù)據(jù)在國內(nèi)還處于初級階段,但是商業(yè)價值已經(jīng)顯現(xiàn)出來。首先,手中握有數(shù)據(jù)的公司站在金礦上,基于數(shù)據(jù)交易即可產(chǎn)生很好的效益;其次,基于數(shù)據(jù)挖掘會有很多商業(yè)模式誕生,定位角度不同,或側(cè)重數(shù)據(jù)分析。比如幫企業(yè)做內(nèi)部數(shù)據(jù)挖掘,或側(cè)重優(yōu)化,幫企業(yè)更精準找到用戶,降低營銷成本,提高企業(yè)銷售率,增加利潤。
與此同時,大數(shù)據(jù)在社會管理等方面,也具有不可替代的重大價值。