謝麗聃
三分技術(shù),七分?jǐn)?shù)據(jù),得數(shù)據(jù)者得天下。大數(shù)據(jù)并不在“大”,而在于“有用”。價值含量、挖掘成本比數(shù)量更為重要。
“明天看《紙牌屋》,請大家別劇透。”
發(fā)這條Twitter的人除了是《紙牌屋》的粉絲外,他還有另外一個身份一美國總統(tǒng)奧巴馬。不僅如此,連中國一些官員也對這部劇頗感興趣。
《紙牌屋》里的數(shù)據(jù)秘密
《紙牌屋》究竟是何“神劇”,竟能受到眾名人的關(guān)注。
作為一家從在線影片租賃提供商,到現(xiàn)今美國最大互聯(lián)網(wǎng)視頻公司之一的奈飛視頻網(wǎng)站,十幾年來積累了龐大的客戶數(shù)據(jù):每天奈飛公司能夠獲得用戶3000多萬個,包括停止、回放、暫停、快進等行為,另外還會搜集訂閱用戶每天給出的400萬個評分,300萬次搜索請求。將這些數(shù)據(jù)加工整合后,形成數(shù)百億數(shù)據(jù)池。公司根據(jù)數(shù)據(jù)池里整合的數(shù)據(jù)利用推薦算法,來識別具有相似品味的觀眾。
《紙牌屋》的爆紅不僅讓它的制作方奈飛公司賺得盆滿缽盈,還讓一個前沿技術(shù)再次進入大眾視野,它就是被稱之為“可預(yù)測未來”的“大數(shù)據(jù)技術(shù)”。
“大數(shù)據(jù)”一詞對于我們已經(jīng)并不陌生,我們可從近兩年的眾多報道和文章中尋到它的蹤影。但“大數(shù)據(jù)”究竟如何運用,至今又取得哪些成果?恐怕大眾還無法準(zhǔn)確地一語道出。
讓“大數(shù)據(jù)”走下神壇
早在1980年,著名未來學(xué)家阿爾文·托夫勒便在《第三次革命浪潮》一書中,將“大數(shù)據(jù)”熱情地頌贊為“第三次浪潮的華彩樂章”。不過,大約從2009年,“大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。此后,大數(shù)據(jù)時代帶來的變革便在國外商界初露倪端。
總部位于美國阿肯色州的世界著名商業(yè)零售連鎖企業(yè)沃爾瑪,為了能夠準(zhǔn)確了解顧客在其門店的購買習(xí)慣,沃爾瑪利用NCR數(shù)據(jù)挖掘工具對顧客原始交易數(shù)據(jù)進行分析和挖掘,便可輕松地知道顧客經(jīng)常一起購買的商品有哪些。經(jīng)過大量信息的整合研究,一個意外的發(fā)現(xiàn)是:“跟尿布一起購買最多的商品竟是啤酒!”
沃爾瑪?shù)臄?shù)據(jù),揭示了隱藏在“尿布與啤酒”背后的美國人的一種行為模式:在美國,一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。產(chǎn)生這一現(xiàn)象的原因是:美國的太太們常叮囑她們的丈夫下班后為小孩買尿布,而丈夫們在買尿布后又隨手帶回了他們喜歡的啤酒。
既然尿布與啤酒一起被購買的機會很多,于是沃爾瑪就在其一個個門店將尿布與啤酒擺放在一起,結(jié)果是尿布與啤酒的銷售量雙雙增長。
這個故事的意義在于,將看似不相關(guān)的商品數(shù)據(jù)放在一起分析,找到他們之間的相關(guān)性,而后進行交叉營銷,最終可大大促進商品的銷量。
不管是《紙牌屋》的數(shù)據(jù)池,還是沃爾瑪?shù)慕徊鏀?shù)據(jù)分析,大數(shù)據(jù)是使其最終受益的關(guān)鍵所在。在互聯(lián)網(wǎng)、信息技術(shù)飛速發(fā)展的今天,海量數(shù)據(jù)的收集與挖掘已不再是天方夜譚,它的神秘面紗隨著科技的進步被逐漸揭開。曾經(jīng)讓眾人敬畏、驚嘆的“大數(shù)據(jù)”現(xiàn)已走下神壇,為民所用。
數(shù)據(jù)的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,但絕大部分則隱藏在表面之下。而現(xiàn)在已有不少創(chuàng)新型企業(yè)開始深挖數(shù)據(jù)的水下礦藏。谷歌重復(fù)使用搜索關(guān)鍵詞來監(jiān)測流感的傳播;Farecast利用機票銷售數(shù)據(jù)來預(yù)測未來的機票價格;麥格雷戈博士用嬰兒的生命體征來預(yù)測傳染病的發(fā)生;亞馬遜通過分析用戶習(xí)慣、喜好進行精準(zhǔn)的產(chǎn)品推薦。
數(shù)據(jù)不僅在“大”,更在于“有用”
龐大的人群和應(yīng)用市場,海量信息及傳播增速,使得中國成為世界上最復(fù)雜的大數(shù)據(jù)國家。自2009年“大數(shù)據(jù)”一詞傳入我國,就有不少行業(yè)人士對此產(chǎn)生濃厚興趣。此后幾年間,國內(nèi)不少擁有大量用戶數(shù)據(jù)的公司,都宣稱將采用大數(shù)據(jù)分析的方法,根據(jù)用戶喜好定制產(chǎn)品內(nèi)容。
就在《紙牌屋》借力“大數(shù)據(jù)”春風(fēng)得意時,我國視頻網(wǎng)站也在摩拳擦掌,奮力登上這塊新大陸,一覽科技所帶來的無限光景。
愛奇藝表示,愿意嘗試依靠大數(shù)據(jù)分析實現(xiàn)“千人千面”的首頁全個性化內(nèi)容推薦;搜狐視頻借助大數(shù)據(jù),根據(jù)用戶需求制作本土自制劇。
雖然我國有不少試水“大數(shù)據(jù)”技術(shù)的案列,但僅僅收集海量數(shù)據(jù),用數(shù)字作為信息統(tǒng)計的證明,而不去開發(fā)、挖掘數(shù)據(jù)的潛在價值,那么“大數(shù)據(jù)”的小宇宙依然沒被喚醒。例如去年央視春晚微信紅包用戶的數(shù)據(jù)統(tǒng)計:除夕20時至年初一零時48分,春晚微信搖一搖互動總量超過110億次;春晚微信祝福在185個國家和地區(qū)之間傳遞了約3萬億公里。數(shù)據(jù)量、信息量都已達到“大數(shù)據(jù)”標(biāo)準(zhǔn),但孤單的數(shù)字之間有何聯(lián)系,我們又能從這些數(shù)字背后看到什么,業(yè)界卻沒有進一步的研究。
阿里巴巴集團董事局主席馬云在淘寶十周年晚會上說:“我們還沒搞懂PC互聯(lián)網(wǎng)的時候,移動互聯(lián)網(wǎng)來了,我們還沒搞懂移動互聯(lián)網(wǎng)的時候,大數(shù)據(jù)來了?!?/p>
確實,我們以前經(jīng)常說計劃趕不上時間的流逝,現(xiàn)在可以說時間已跟不上科技更新的步伐。現(xiàn)階段的“大數(shù)據(jù)”已不能只停留在“收集”的層面上,分析和挖掘數(shù)據(jù)的潛在信息,用信息創(chuàng)造價值,這才是“大數(shù)據(jù)”存在的意義。
阿里巴巴在2008年就把大數(shù)據(jù)作為一項公司基本戰(zhàn)略,經(jīng)過多年的沉淀,其在經(jīng)濟領(lǐng)域的數(shù)據(jù)量可謂恐怖。但數(shù)據(jù)量大并不一定能解決問題。以天貓分期購的例子來說,消費者在天貓上的每一次消費行為,購買商品時填寫的手機號和地址,余額寶中的存款數(shù)目,都會被阿里抓取放入數(shù)據(jù)庫中。當(dāng)然,這些數(shù)據(jù)在平時就會淹沒在茫茫的數(shù)據(jù)海洋中,不被人注意。但當(dāng)要對用戶進行信用評估時,這些數(shù)據(jù)便可發(fā)揮出巨大作用,因為這些數(shù)據(jù)完全可以直接轉(zhuǎn)化為真實的經(jīng)濟行為,天貓可利用這些關(guān)聯(lián)性極強的信息,幫助消費者和商家優(yōu)化分期購配置。
在各個行業(yè)的垂直特色化應(yīng)用,大數(shù)據(jù)也有巨大的想象空間,例如:金融公司可以通過大數(shù)據(jù)進行客戶信用評級,為銀行、保險公司或P2P平臺服務(wù);零售商可借助大數(shù)據(jù)進行店面選址服務(wù),并利用關(guān)聯(lián)規(guī)則進行客戶購物籃分析,從而給客戶推薦相應(yīng)的促銷活動;房地產(chǎn)商通過互聯(lián)網(wǎng)平臺的大數(shù)據(jù)進行購房潛在客戶挖掘,或通過大數(shù)據(jù)提供精準(zhǔn)的社區(qū)O2O服務(wù);大數(shù)據(jù)公司可以基于自然語言處理和語義分析,為政府提供輿情監(jiān)測服務(wù),使政府及時了解民聲,優(yōu)化政府相關(guān)服務(wù)。
2014年8月18日,中國國家主席習(xí)近平主持召開中央全面深化改革領(lǐng)導(dǎo)小組第四次會議,并發(fā)表關(guān)于傳統(tǒng)媒體與新媒體融合的重要講話。會上習(xí)近平強調(diào),要利用大數(shù)據(jù)和云計算技術(shù)推進新聞生產(chǎn)。這就為新聞媒體行業(yè)進行大數(shù)據(jù)技術(shù)改革提供了良好契機。媒體可通過大數(shù)據(jù)實現(xiàn)更科學(xué)的媒介選擇;可推動新聞預(yù)測性報道的興起;還可利用大數(shù)據(jù)后臺改變傳統(tǒng)新聞編寫模式。
“數(shù)據(jù)將成為一種戰(zhàn)略性原料,每一個企業(yè)、科研團隊和政府,都有責(zé)任有目的地搜集、處理、分析、索引數(shù)據(jù)。”電子科技大學(xué)互聯(lián)網(wǎng)中心主任周濤號召企業(yè)投身大數(shù)據(jù),用更先進的武器裝備應(yīng)戰(zhàn)愈加激烈的市場競爭。
近期,總投資220億元惠普全球大數(shù)據(jù)應(yīng)用研究及產(chǎn)業(yè)示范基地項目落戶青島,該項目主要是建設(shè)全球大數(shù)據(jù)應(yīng)用研究中心、大數(shù)據(jù)處理中心、大數(shù)據(jù)測試中心、全球戰(zhàn)略伙伴智慧產(chǎn)業(yè)實驗區(qū)等惠普研發(fā)機構(gòu),以便為惠普的升級拓展提供先進的技術(shù)支撐。
今天,我們生活在一個計算型的社會,因為我們相信世界是可以通過數(shù)字和數(shù)學(xué)而獲得解釋?!傲炕磺小睂τ诨钤跀?shù)字時代的我們,已經(jīng)成為一種習(xí)慣。
大數(shù)據(jù)給了中國一個大機會,它除了將更好地解決社會問題、商業(yè)營銷問題、科學(xué)技術(shù)問題,還有一個可預(yù)見的趨勢就是以人為本的大數(shù)據(jù)方針。用不了多久,每個人便可以獨自利用“大數(shù)據(jù)”預(yù)測明天。