大數(shù)據(jù)1.0版本,2.0版本和3.0版本
大數(shù)據(jù)時代的到來是顛覆性變化
“大數(shù)據(jù)”是“數(shù)據(jù)化”趨勢下的必然產(chǎn)物!數(shù)據(jù)化最核心的理念是: “一切都被記錄,一切都被數(shù)字化”,它帶來了兩個重大的變化:一是數(shù)據(jù)量的爆炸性劇增,最近兩年所產(chǎn)生的數(shù)據(jù)量等同于2010年以前整個人類文明產(chǎn)生的數(shù)據(jù)量總和;二是數(shù)據(jù)來源的極大豐富,形成了多源異構(gòu)的數(shù)據(jù)形態(tài),其中非結(jié)構(gòu)化數(shù)據(jù)所占比重逐年增大。牛津大學(xué)互聯(lián)網(wǎng)研究所Mayer-Schonberger教授指出,“大數(shù)據(jù)”所代表的是當(dāng)今社會所獨(dú)有的一種新型的能力——以一種前所未有的方式,通過對海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價值的產(chǎn)品和服務(wù),或深刻的洞見。我認(rèn)為,這種“前所未有的”巨大價值和深刻洞見,并不僅僅來自于單一數(shù)據(jù)集量上的變化,而是不同領(lǐng)域數(shù)據(jù)集之間深度的交叉關(guān)聯(lián),姑且稱之為“跨域關(guān)聯(lián)”。譬如微博上的內(nèi)容和社交關(guān)系,F(xiàn)lickr上的圖片共享,手機(jī)通訊關(guān)系,淘寶上的購物記錄等數(shù)據(jù)通過同一個用戶關(guān)聯(lián)起來;又如移動手機(jī)定位的移動軌跡,車載GPS的移動數(shù)據(jù)通過同一個地點關(guān)聯(lián)起來??缬蜿P(guān)聯(lián)是數(shù)據(jù)量增大后從量變到質(zhì)變的飛躍,是大數(shù)據(jù)巨大價值的基礎(chǔ)。
大數(shù)據(jù)會給整個社會帶來從生活到思維上革命性的變化:企業(yè)和政府的管理人員在進(jìn)行決策的時候,會出現(xiàn)從“經(jīng)驗即決策”到“數(shù)據(jù)輔助決策”再到“數(shù)據(jù)即決策”的變化;人們所接受的服務(wù),將以數(shù)字化和個性化的方式呈現(xiàn),借助3D打印技術(shù)和生物基因工程,零售業(yè)和醫(yī)療業(yè)亦將實現(xiàn)數(shù)字化和個性化的服務(wù);以小規(guī)模實驗、定性或半定量分析為主要手段的科學(xué)分支,如社會學(xué)、心理學(xué)、管理學(xué)等,將會向大規(guī)模定量化數(shù)據(jù)分析轉(zhuǎn)型;將會出現(xiàn)數(shù)據(jù)運(yùn)營商和數(shù)據(jù)市場,以數(shù)據(jù)和數(shù)據(jù)產(chǎn)品為對象,通過加工和交易數(shù)據(jù)獲取商業(yè)價值;人類將在哲學(xué)層面上重新思考諸如“物質(zhì)和信息誰更基礎(chǔ)”“生命的本質(zhì)是什么”“生命存在的最終形態(tài)是什么”等本體論問題……綜上,大數(shù)據(jù)不是數(shù)據(jù)量的簡單刻畫,也不是特定算法、技術(shù)或商業(yè)模式上的發(fā)展,而是從數(shù)據(jù)量、數(shù)據(jù)形態(tài)和數(shù)據(jù)分析處理方式,到理念和形態(tài)上重大變革的總和——大數(shù)據(jù)是基于多源異構(gòu)、跨域關(guān)聯(lián)的海量數(shù)據(jù)分析所產(chǎn)生的決策流程、商業(yè)模式、科學(xué)范式、生活方式和觀念形態(tài)上的顛覆性變化的總和。
大數(shù)據(jù)的戰(zhàn)略地位
大數(shù)據(jù)被認(rèn)為是繼信息化和互聯(lián)網(wǎng)后整個信息革命的又一次高峰。云計算和大數(shù)據(jù)共同引領(lǐng)以數(shù)據(jù)為材料,計算為能源的又一次生產(chǎn)力的大解放,甚至可以與以蒸汽機(jī)的使用和電氣的使用為代表的第一次工業(yè)革命和第二次工業(yè)革命相媲美。與提升國家競爭力及國民幸福程度密切相關(guān)的重大戰(zhàn)略都與大數(shù)據(jù)的分析和利用息息相關(guān),包括與國家安全、社會穩(wěn)定相關(guān)的尖端武器制造與性能模擬實驗,群體事件和謠言的預(yù)警和干預(yù);與國家科技能力相關(guān)的等離子即高能粒子實驗分析,納米材料及生物基因工程;與國民經(jīng)濟(jì)繁榮相關(guān)的經(jīng)濟(jì)金融態(tài)勢感知與失穩(wěn)預(yù)測,精準(zhǔn)營銷與智能物流倉儲;與環(huán)境問題相關(guān)的全球氣候及生態(tài)系統(tǒng)的分析,局部天氣及空氣質(zhì)量預(yù)測;與醫(yī)療衛(wèi)生相關(guān)的個性化健康監(jiān)護(hù)及醫(yī)療方案,大規(guī)模流行病趨勢預(yù)測和防控策略;與人民幸福生活相關(guān)的個性化保險理財方案,智能交通系統(tǒng)等等。數(shù)據(jù)儲備和數(shù)據(jù)分析能力將成為未來新型國家最重要的核心戰(zhàn)略能力。
2012年3月29日,美國政府宣布了“大數(shù)據(jù)研究和發(fā)展倡議”,來推進(jìn)從大量的、復(fù)雜的數(shù)據(jù)集合中獲取知識和洞見的能力。2012年5月,我國召開第424次香山科學(xué)會議,這是我國第一個以大數(shù)據(jù)為主題的重大科學(xué)工作會議。中國計算機(jī)學(xué)會、通信學(xué)會等于2012年分別成立了“大數(shù)據(jù)專家委員會”。2012年9月13日,北京航空航天大學(xué)聯(lián)合英國愛丁堡大學(xué)、英國利茲大學(xué)、香港科技大學(xué)、美國賓夕法尼亞大學(xué)、美國亞利桑那州立大學(xué)、加拿大渥太華大學(xué)等共同組建大數(shù)據(jù)科學(xué)與工程國際研究中心。2012年12月13日,在“中關(guān)村大數(shù)據(jù)日”活動會上,由寬帶資本、百度、用友、中國聯(lián)通、聯(lián)想集團(tuán)、北京大學(xué)、北京航空航天大學(xué)、阿里巴巴、騰訊等企業(yè)、高校共同發(fā)起成立了大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟,并在中關(guān)村云基地揭牌成立大數(shù)據(jù)實驗室,該實驗室以大數(shù)據(jù)產(chǎn)業(yè)孵化基金形態(tài)成立,致力于推動學(xué)術(shù)界大數(shù)據(jù)創(chuàng)新科技成果產(chǎn)業(yè)化以及為相關(guān)產(chǎn)業(yè)引導(dǎo)注入大數(shù)據(jù)科技元素。自然科學(xué)基金委于2013年3月5日至7日,在上海同濟(jì)大學(xué)舉辦了第89屆“雙清”論壇,論壇的主題是“大數(shù)據(jù)技術(shù)與應(yīng)用中的挑戰(zhàn)性科學(xué)問題”,與會的有近十名院士。
大數(shù)據(jù)與商業(yè)革命
傳統(tǒng)的商務(wù)智能已經(jīng)應(yīng)用了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的技術(shù),對企業(yè)自身的數(shù)據(jù)進(jìn)行存儲、清洗、索引和分析,并能夠提供包括客戶價值評價、客戶滿意度評價、服務(wù)質(zhì)量評價、營銷效果評價、市場需求評估等各種基于簡單統(tǒng)計和關(guān)聯(lián)挖掘的報表——這些統(tǒng)計結(jié)果對于企業(yè)自身評估和決策起到了重要的作用。在商務(wù)智能時代積累起來的和數(shù)據(jù)打交道的經(jīng)驗既是大數(shù)據(jù)新商業(yè)模式技術(shù)和理念的基礎(chǔ),又有可能束縛大數(shù)據(jù)商業(yè)革命,因為有經(jīng)驗的商務(wù)智能人士會不自覺地把大數(shù)據(jù)分析庸俗化,認(rèn)為只是傳統(tǒng)商務(wù)智能針對更大規(guī)模數(shù)據(jù)集的一種平凡推廣。
大數(shù)據(jù)商業(yè)模式也可以粗略地分為1.0版本,2.0版本和3.0版本。大數(shù)據(jù)1.0是指企業(yè)自身的產(chǎn)品和服務(wù)產(chǎn)生了大量的數(shù)據(jù),通過對這些數(shù)據(jù)進(jìn)行深入的挖掘分析,改進(jìn)自身業(yè)務(wù),改進(jìn)后的業(yè)務(wù)吸引更多用戶或客戶,產(chǎn)生更大量的數(shù)據(jù),形成正向的循環(huán)。亞馬遜是一個典型的例子,他們利用以“基于商品的協(xié)同過濾”為主要代表的一系列推薦算法,幫助用戶找到他們可能喜歡的商品。這種精準(zhǔn)的個性化服務(wù)的背后,是非常復(fù)雜的算法和實時大數(shù)據(jù)處理能力。亞馬遜的算法大大提高了用戶的黏度和企業(yè)的銷售額,從而產(chǎn)生了更多有價值的數(shù)據(jù),這些數(shù)據(jù)又幫助亞馬遜做得更好。
大數(shù)據(jù)2.0是指企業(yè)用自身業(yè)務(wù)產(chǎn)生的數(shù)據(jù),去解決主營業(yè)務(wù)以外的其他問題,獲得重大的價值;或者引入非企業(yè)自身業(yè)務(wù)的外部數(shù)據(jù),來解決企業(yè)自己遇到的問題。大數(shù)據(jù)2.0強(qiáng)調(diào)的是數(shù)據(jù)的外部性。Google曾利用網(wǎng)頁搜索詞的記錄,來預(yù)測流感爆發(fā)后隨時間變化的新增病例數(shù)。顯然,預(yù)測流感趨勢這一需求并不包含在記錄網(wǎng)頁搜索詞的初衷中。ZestFinance有一個口號,就是一切數(shù)據(jù)都是信用數(shù)據(jù),實際上,他們大量采集用戶在社會媒體上留下的數(shù)據(jù),從這些數(shù)據(jù)中對用戶的信用進(jìn)行判斷,預(yù)測用戶拖延還貸的概率。ZestFinance通過這種分析,能夠在低于行業(yè)平均拖延還貸率的條件下,進(jìn)行更快更低成本的貸款發(fā)放。顯然,用戶在社交媒體上產(chǎn)生的數(shù)據(jù),并不是ZestFinance自身業(yè)務(wù)產(chǎn)生的,但是一樣可以服務(wù)于它的業(yè)務(wù)。
大數(shù)據(jù)3.0是一個尚在探索中的商業(yè)形態(tài)。它首先要求政府和行業(yè),對數(shù)據(jù)質(zhì)量、價值、權(quán)益、隱私、安全等產(chǎn)生充分認(rèn)識,出臺量化與保障措施。在此基礎(chǔ)上,數(shù)據(jù)運(yùn)營商出現(xiàn),形成了以加工粗?jǐn)?shù)據(jù)和已有數(shù)據(jù)產(chǎn)品,產(chǎn)生新的數(shù)據(jù)產(chǎn)品的“數(shù)據(jù)客”(Dacker) 。個人、團(tuán)隊和企業(yè)通過數(shù)據(jù)API接口或其他方式付費(fèi)使用數(shù)據(jù)產(chǎn)品,數(shù)據(jù)客、運(yùn)營商和被加工原料所有者共同分享數(shù)據(jù)產(chǎn)品的利益。數(shù)據(jù)市場也可能應(yīng)運(yùn)而生,數(shù)據(jù)和數(shù)據(jù)產(chǎn)品有可能像今天淘寶集市上的商品被售賣交換。于是,一種新的以數(shù)據(jù)/數(shù)據(jù)產(chǎn)品為輸入,數(shù)據(jù)/數(shù)據(jù)產(chǎn)品為輸出的新商業(yè)模式誕生,這種模式不同于2B(to business)和2C(to customer)的模式——譬如一款精確位置告知實時空氣質(zhì)量的API接口,既可能被企業(yè)和政府使用,也可能被個人使用。為了區(qū)分,我們稱這種模式為2D(to data)的商業(yè)模式。新商業(yè)模式的直接后果,就是促進(jìn)學(xué)術(shù)團(tuán)體、企業(yè)和政府通過大量異質(zhì)數(shù)據(jù)和數(shù)據(jù)產(chǎn)品產(chǎn)生科學(xué)、社會、經(jīng)濟(jì)等方面的新價值。
(作者為電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心教授)
責(zé)編/劉建 美編/李祥峰