其實,早在30多年前的1980年,未來學家阿爾文·托夫勒就在《第三次浪潮》一書中,把大數(shù)據(jù)熱情贊頌為“第三次科技浪潮的華彩樂章”。
力量核心是“預測”
2008年,英國《自然》雜志首先提出了大數(shù)據(jù)概念。然而,什么是大數(shù)據(jù),依然眾說紛紜。目前比較流行的大數(shù)據(jù)特性被歸納為4個V,即Volume,Variety,Value,Velocity,分別對應:數(shù)據(jù)體量巨大;數(shù)據(jù)類型繁多;數(shù)據(jù)本身有潛在的價值,但價值比較分散;數(shù)據(jù)高速產(chǎn)生,需高速處理。
雖然目前對大數(shù)據(jù)還沒有一個權威性的定義,但它已然在改變我們的生存方式。
“大數(shù)據(jù)的核心就是預測,不是要教機器像人一樣思考,而是要把數(shù)學計算運用到海量數(shù)據(jù)上,來預測事情發(fā)生的可能性”,被稱為“大數(shù)據(jù)時代預言家”的牛津大學網(wǎng)絡學院互聯(lián)網(wǎng)研究所治理與管理專業(yè)教授維克托·邁爾-舍恩伯格說。
預測,作為大數(shù)據(jù)的力量核心,早已被多次證明。
微軟公司全球常務副總裁布拉德·史密斯曾介紹說,微軟生產(chǎn)的一款數(shù)據(jù)驅(qū)動軟件,通過跟蹤取暖器、空調(diào)、風扇以及燈光等積累下來的超大量數(shù)據(jù),便可知道如何杜絕能源浪費,“可以為世界節(jié)約40%的能源?!迸c之類似的,谷歌公司也通過對搜索關鍵詞進行分析,比政府檢測部門提早兩周預測到禽流感散布,提供預警服務。
美劇《超感警探》中的心理專家只能依靠神奇的特異功能破獲毫無頭緒的案件。而現(xiàn)實中,洛杉磯警察已經(jīng)可以通過犯罪預測軟件的使用,計算出某地發(fā)生犯罪的概率、犯罪類型,以及最有可能犯罪的時間段,使洛杉磯山麓地區(qū)的盜竊案減少25%。
“大數(shù)據(jù)的出現(xiàn),使得通過數(shù)據(jù)分析獲得知識、商機和社會服務的能力,從以往局限于學術精英圈子擴大到了普通的機構(gòu)、企業(yè)和政府部門?!盜T評論人謝文這樣評價大數(shù)據(jù)帶來的變化。
“大數(shù)據(jù)開啟了一個重大的時代轉(zhuǎn)型。就像望遠鏡讓我們感受宇宙,顯微鏡讓我們能夠觀測到微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式,成為新發(fā)明和新服務的源泉,而更多的改變正蓄勢待發(fā)”,維克托·邁爾-舍恩伯格預言,圍繞大數(shù)據(jù)的商業(yè)價值開發(fā)和利用,將成為行業(yè)人士爭相追捧的焦點。
多個領域試水大數(shù)據(jù)
“與國外相比,我國的大數(shù)據(jù)在產(chǎn)業(yè)覺醒、產(chǎn)業(yè)創(chuàng)新和投資等方面大約存在一年半的差距,主要體現(xiàn)在國外的基礎設施硬技術創(chuàng)新方面明顯超過我國。國內(nèi)目前多集中在泡沫較多的垂直應用領域,但是這個差距并不可怕,基本上可以說還處在同一起跑線上?!薄洞髷?shù)據(jù)時代》譯者、電子科技大學互聯(lián)網(wǎng)科學中心主任周濤認為。
近年來,國內(nèi)很多基于大數(shù)據(jù)技術的科技企業(yè)誕生,為互聯(lián)網(wǎng)行業(yè)甚至傳統(tǒng)行業(yè)帶來了新氣息。
2009年,蘇萌和朋友合伙成立了北京百分點信息科技有限公司,成為國內(nèi)最早從事第三方數(shù)據(jù)提供和分析的企業(yè)之一。他們通過分析客戶的消費偏好,為企業(yè)提供精準的營銷服務,“我們實際是在為網(wǎng)絡上每個匿名的ID‘畫像’。通過多個維度分析,顧客偏好和特征逐漸清晰?!碧K萌介紹,當顧客登錄凡客或者1號店時,機器會根據(jù)數(shù)據(jù)進行分析,就像一位懂得讀心術的導購,能預測到顧客最有可能對哪件或者哪類商品感興趣。
除了像“百分點”這樣從事第三方數(shù)據(jù)提供的公司,很多大型互聯(lián)網(wǎng)公司早已通過挖掘自身數(shù)據(jù)資源,為己所用。同時,一些高校也開始試水大數(shù)據(jù)。如華東師范大學云計算與大數(shù)據(jù)科學與工程研究院的建立,“通過開展大數(shù)據(jù)相關的基礎和應用研究,集聚和造就一批大數(shù)據(jù)研究創(chuàng)新團隊,培養(yǎng)一批具備大數(shù)據(jù)思維方式和分析能力的創(chuàng)新型人才。”華東師范大學副校長朱自強說。
近年來,國家也積極布局大數(shù)據(jù)。2011年,工信部發(fā)布物聯(lián)網(wǎng)“十二五”規(guī)劃,把信息處理技術作為4項關鍵技術創(chuàng)新工程之一,其中包括海量數(shù)據(jù)存儲、數(shù)據(jù)挖掘、圖像視頻智能分析,都是大數(shù)據(jù)的重要組成部分。我國還把基于物聯(lián)網(wǎng)、云計算等新一代信息技術的智慧城市建設搬上日程。目前,我國智慧城市試點已達193個,將在智慧交通、醫(yī)療、家居等方面與大數(shù)據(jù)建立聯(lián)系。
“互聯(lián)網(wǎng)大數(shù)據(jù)是和公眾最接近的大數(shù)據(jù)應用,但在科學研究、企業(yè)和政府決策、金融等領域的大數(shù)據(jù)應用對我們生活的影響力可能會更大。對有些行業(yè),數(shù)據(jù)的利用可能會顛覆原有的采購、生產(chǎn)、銷售等決策流程?!比A東師范大學軟件學院教授錢衛(wèi)寧認為。
用戶隱私易泄露
有一個經(jīng)典案例被從事大數(shù)據(jù)的人常常提到。
一位生活在美國的父親怒氣沖沖地跑到一家超市與經(jīng)理大吵,原因是只有15歲的女兒購物后,回家發(fā)現(xiàn)商品中被加入了很多針對嬰兒孕婦商品的廣告。
兩周后,父親向經(jīng)理道歉,這時他才知道自己女兒已經(jīng)懷孕近兩個月,父女都不知道??墒菙?shù)據(jù)分析公司已經(jīng)“知道”——根據(jù)她女兒近期的網(wǎng)絡數(shù)據(jù)預測到,接著把數(shù)據(jù)推送給超市,告訴超市可能有一個已經(jīng)懷孕的顧客正在購物。
還有一個離我們比較近的例子。華東師大數(shù)據(jù)中心的預警系統(tǒng)模塊之一,餐飲預警系統(tǒng)可以對學生的餐飲消費數(shù)據(jù)進行統(tǒng)計分析,發(fā)現(xiàn)低于警戒值就會發(fā)出短信慰問,確定學生是否有經(jīng)濟困難。
這就是大數(shù)據(jù)洞察人的方式。在體會到大數(shù)據(jù)神奇力量的同時,也讓很多人對自身數(shù)據(jù)安全而擔憂。
“大量數(shù)據(jù)的匯集不可避免地加大了用戶隱私泄露的風險。一方面,數(shù)據(jù)集中存儲增加了泄露風險,也成為人身安全的一部分;另一方面,一些敏感數(shù)據(jù)的所有權和使用權并沒有明確界定,很多基于大數(shù)據(jù)的分析都未考慮到其中涉及的個體隱私問題?!惫I(yè)和信息化部賽迪智庫的馮偉在刊載于媒體的署名文章中指出。
對一般用戶的擔憂,周濤卻認為,普通用戶如果要真正融入大數(shù)據(jù)時代,享受個性化專屬信息服務,不得不犧牲一部分個人隱私。
“政府和業(yè)界需要做的,是設計非??量虈栏竦姆蓷l例和行業(yè)規(guī)則,全力打擊那些除了提供非侵入性的或用戶同意的服務外,以傷害用戶的方式利用用戶隱私牟利的企業(yè)。通過提高對侵害用戶隱私行為的懲罰力度,使得這種行為本身變得得不償失?!敝軡J為這才是根本保護治理數(shù)據(jù)安全的辦法。
“大數(shù)據(jù)對技術和應用所帶來的挑戰(zhàn)是全方位的?!卞X衛(wèi)寧認為,“數(shù)據(jù)資產(chǎn)化后,數(shù)據(jù)監(jiān)護將成為一個新的核心問題,是對數(shù)據(jù)的產(chǎn)生、收集、保存、維護、處理、利用的整個生命周期的管理。數(shù)據(jù)安全與隱私保護也是數(shù)據(jù)監(jiān)護的一個方面。有效的數(shù)據(jù)監(jiān)護和服務模型是大數(shù)據(jù)從一系列的問題走向成功應用的關鍵?!保▉碓矗汗饷骶W(wǎng))