隨著云計(jì)算、互聯(lián)網(wǎng)和存儲(chǔ)能力的發(fā)展,互聯(lián)網(wǎng)進(jìn)入了大數(shù)據(jù)時(shí)代。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)的挑戰(zhàn)包括了數(shù)據(jù)搜集、云計(jì)算、數(shù)據(jù)挖掘和智能應(yīng)用,每個(gè)階段還有相當(dāng)多的決策。
近兩年,大數(shù)據(jù)這個(gè)詞已經(jīng)耳熟能詳,異?;馃?。大數(shù)據(jù)其實(shí)就是所謂的信息海洋。移動(dòng)互聯(lián)網(wǎng)每天產(chǎn)生大數(shù)據(jù),譬如中國(guó)聯(lián)通每天會(huì)在移動(dòng)互聯(lián)網(wǎng)上產(chǎn)生600億條的商業(yè)記錄。數(shù)據(jù)速度、總量和種類都很有突破性。
移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)的價(jià)值
如今都在談大數(shù)據(jù),那么相對(duì)而言小數(shù)據(jù)是什么呢?“人類的發(fā)展史其實(shí)就是小數(shù)據(jù)的挖掘史。比如牛頓的三大定律,其實(shí)就是從對(duì)小數(shù)據(jù)的分析得到的。名醫(yī)華佗做的也是小數(shù)據(jù)挖掘,通過(guò)診斷一些病人,得到經(jīng)驗(yàn)并總結(jié)規(guī)律。因此,人類的發(fā)展至今都在不斷分析小樣本數(shù)據(jù),從中抽取一般性規(guī)律和一些大概率事件”,陳一昕解釋說(shuō)。
隨著云計(jì)算、互聯(lián)網(wǎng)和存儲(chǔ)能力的發(fā)展,互聯(lián)網(wǎng)進(jìn)入了大數(shù)據(jù)時(shí)代。大數(shù)據(jù)必然對(duì)人類發(fā)展帶來(lái)新的變革,為此陳一昕分析了大數(shù)據(jù)的三個(gè)創(chuàng)新點(diǎn):
首先,當(dāng)數(shù)據(jù)量非常大的時(shí)候人們對(duì)于數(shù)據(jù)的質(zhì)量要求比較低,而數(shù)據(jù)非常多的時(shí)候則可以容忍數(shù)據(jù)中的“噪音”。第二,數(shù)據(jù)量越來(lái)越多的時(shí)候會(huì)出現(xiàn)更令人感興趣的內(nèi)容。也許可以通過(guò)一個(gè)大數(shù)據(jù)模型更好地發(fā)現(xiàn)更有價(jià)值的東西。所以小數(shù)據(jù)當(dāng)中可以發(fā)現(xiàn)大概率事件,大數(shù)據(jù)可以發(fā)現(xiàn)小概率事件和突發(fā)性事件。突發(fā)性事件往往更有價(jià)值。比如金融危機(jī)、海嘯、地震和金融欺詐等都是突發(fā)性事件。另一點(diǎn)很重要,在大數(shù)據(jù)時(shí)代人們更加關(guān)注數(shù)據(jù)間的關(guān)聯(lián)性而不是因果性?!?/p>
移動(dòng)互聯(lián)網(wǎng)時(shí)代大數(shù)據(jù)的挑戰(zhàn)
移動(dòng)互聯(lián)網(wǎng)運(yùn)營(yíng)商擁有大量數(shù)據(jù),也有無(wú)限的應(yīng)用,如何體現(xiàn)這些價(jià)值?
“作為運(yùn)營(yíng)商,我們主要的戰(zhàn)略就在于把握大數(shù)據(jù)的倉(cāng)庫(kù),因?yàn)槲覀冋莆樟艘粋€(gè)金礦。作為電信企業(yè),沒(méi)有必要和其他的企業(yè)比拼如何打造金戒指,誰(shuí)打造得更漂亮。我們要做的是把金礦管理好,把金條做好”,陳一昕打比方說(shuō)道。中國(guó)聯(lián)通目前開(kāi)發(fā)的沃云就是大數(shù)據(jù)的支撐平臺(tái),同時(shí)也開(kāi)發(fā)了移動(dòng)上網(wǎng)的大數(shù)據(jù)平臺(tái),每天上網(wǎng)的數(shù)據(jù)會(huì)傳輸?shù)酱髷?shù)據(jù)平臺(tái),并且對(duì)外開(kāi)放數(shù)據(jù)挖掘的能力。
在移動(dòng)互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)的挑戰(zhàn)包括了數(shù)據(jù)搜集、云計(jì)算、數(shù)據(jù)挖掘和智能應(yīng)用,每個(gè)階段還有相當(dāng)多的決策。比如,結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)如何整合,如何支持?jǐn)?shù)據(jù)速度,處理能力能否滿足數(shù)據(jù)速度,以及數(shù)據(jù)安全隱私問(wèn)題等。
陳一昕強(qiáng)調(diào)大數(shù)據(jù)時(shí)代最大的挑戰(zhàn)可能是人才?!懊绹?guó)麥肯錫全球研究院報(bào)告指出到2018年,具有深度大數(shù)據(jù)分析的人才缺口可能達(dá)到60%以上。大數(shù)據(jù)人才不光需要有理工科的知識(shí)和數(shù)學(xué)建模的知識(shí),也需要了解企業(yè)和商業(yè)的痛點(diǎn)在哪里,并據(jù)此提出正確的模型。所以包括聯(lián)通在內(nèi),現(xiàn)在都要打造這樣一支團(tuán)隊(duì)?!?/p>