王興偉
大數(shù)據(jù)一詞最早出現(xiàn)于1980年,是由著名未來學家阿爾文-托夫勒在自己的《第三次浪潮》一書中提出來的。當時的阿爾文·托夫勒將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂章”。大約到了2009年,大數(shù)據(jù)這一詞才成為信息領域的流行詞匯。據(jù)悉,互聯(lián)網上的數(shù)據(jù)每年大約會增長40%,每兩年便會翻一番,目前世界上90%的數(shù)據(jù)是在近幾年才產生的。2010年以互聯(lián)網為基礎所產生的數(shù)據(jù)比之前所有年份的數(shù)據(jù)總和還多,不僅數(shù)據(jù)量在激增,而且數(shù)據(jù)結構也在發(fā)生演變。
大數(shù)據(jù)的特點
除數(shù)據(jù)激增、數(shù)據(jù)結構演變等最基本的特點外,個人還認為大數(shù)據(jù)具有以下幾個特點:一是變化性,即數(shù)據(jù)隨著事物的變化而變化;二是真?zhèn)涡裕覀儷@得的數(shù)據(jù)不完全是可信的,有可能是有問題的,收集到的數(shù)據(jù)并不是我們所預期的,也不是我們所需要的;三是價值易時性,數(shù)據(jù)的價值有一定時效,時過境遷,如股市數(shù)據(jù);四是易損性,數(shù)據(jù)有可能丟失,也可能被篡改;五是可視化,數(shù)據(jù)需要以合理的形式呈現(xiàn)給用戶,加以適當表達,否則絕大多數(shù)用戶僅以數(shù)據(jù)是無法理解的;六是可驗證性,含有數(shù)據(jù)的分析結果必須是可以驗證的,得以驗證其正確與否。
大數(shù)據(jù)會提供怎樣的機遇與挑戰(zhàn)
大數(shù)據(jù)已成為繼云計算、物聯(lián)網后IT領域的又一次重大變革,它提供了難得的洗牌機會,數(shù)據(jù)已成為國家的寶貴財富、單位的核心資產,影響極其深遠,并不局限于IT領域,實際上它對國家的治理模式、企事業(yè)單位的決策組織業(yè)務流程、個人的生活方式都可能產生很大的影響。如致力于管理的層級更加扁平化,網民和消費者的界限正在逐漸消失,過去網民是網民,消費者是消費者,而如今網民在瀏覽的同時便可以完成消費行為。另外,充分地利用大數(shù)據(jù),高效地分析信息,可以準確的捕捉需求,滿足受眾需要。例如每天收到的垃圾廣告,但通過數(shù)據(jù)對網民上網習慣進行分析,便可以推送相應的廣告。單位的界限也變得模糊,業(yè)務模式、文化和組織都需要進行重構。
大數(shù)據(jù)技術需要關注的是如何解決在大數(shù)據(jù)收集、處理、存儲、傳送、管理和維護過程中突破和發(fā)現(xiàn)的關鍵技術。再次,是大數(shù)據(jù)工程,我們需要構建大數(shù)據(jù)的規(guī)劃、運營和管理的系統(tǒng)工程。最后,其實也是最重要的,是開發(fā)大數(shù)據(jù)應用,基于大數(shù)據(jù)解決現(xiàn)實問題才是根本所在。應該說發(fā)展大數(shù)據(jù)產業(yè)的基礎已經具備,即已經有了無所不在的信息聚集與積累,以及不斷在發(fā)展進度中的信息采集、存儲、分析和挖掘技術。發(fā)展大數(shù)據(jù)產業(yè)的動力也已經形成,遍布世界采集不盡的信息資源為發(fā)展大數(shù)據(jù)產業(yè)提供了可能。看似毫無意義的數(shù)據(jù),經過技術處理可以轉換成有交換價值和使用價值的信息,這就為企業(yè)創(chuàng)造財富提供了可能。
發(fā)展大數(shù)據(jù)產業(yè)應該是迫在眉睫,從狹義的角度出發(fā)看待大數(shù)據(jù)產業(yè)就是發(fā)展與大數(shù)據(jù)的采集、處理、存儲、管理、運行、維護等相關的IT產業(yè),要開發(fā)相應的軟硬件設備、建設大數(shù)據(jù)中心等等;從廣義的角度發(fā)展大數(shù)據(jù)產業(yè),就是要與消費、生產領域相融合,發(fā)展大數(shù)據(jù)應用產業(yè),如醫(yī)療健康大數(shù)據(jù)、交通數(shù)據(jù)、運輸大數(shù)據(jù)等等。與此同時,培育大數(shù)據(jù)相關人才也刻不容緩,麥肯錫預測,到2018年,僅美國就需要深度數(shù)據(jù)分析人才44萬到49萬,缺口14萬到19萬,需要既熟悉本單位的業(yè)務需求、又了解大數(shù)據(jù)技術與應用的人才150萬,我國的需求一定會更大。
為此,中國已將大數(shù)據(jù)技術與產業(yè)優(yōu)先發(fā)展列為戰(zhàn)略新興產業(yè)。國務院于2015年5月8日發(fā)布了《中國制造2025》,明確提出要加強高端服務器大容量存儲設施建設,促進云計算和大數(shù)據(jù)應用。2015年7月1日發(fā)布了《推進“互聯(lián)網+”行動指導意見》,也明確了大數(shù)據(jù)設施的建設目標,提出了鼓勵大數(shù)據(jù)應用、大數(shù)據(jù)技術開發(fā)的政策,承諾推動公共數(shù)據(jù)資源開放。2015年8月9日,國務院又通過了《關于促進大數(shù)據(jù)發(fā)展的行動綱要》(以下簡稱《綱要》),在《綱要》中明確指出要推動政府信息系統(tǒng)和公共數(shù)據(jù)的互聯(lián)互享,消除信息孤島,整合各類政府信息平臺,避免重復建設和數(shù)據(jù)打架,增強政府的公信力,促進社會信用體系建設。國家要推動交通、醫(yī)療、就業(yè)、社保等民生領域,政府數(shù)據(jù)向社會開放,在城市建設、社會救助、質量安全、社區(qū)服務等方面開展大數(shù)據(jù)應用與示范,提高社區(qū)的治理水平。
國家要順應潮流,引導支持大數(shù)據(jù)產業(yè)發(fā)展,以企業(yè)為主體、以市場為導向,加大政策支持,著力營造寬松、公平的競爭環(huán)境,建立市場化應用機制,深化大數(shù)據(jù)在各個行業(yè)的創(chuàng)新應用,催生新業(yè)態(tài)、新模式,形成與需求緊密結合的大數(shù)據(jù)產品體系,使開放的大數(shù)據(jù)成為促進創(chuàng)新創(chuàng)業(yè)的新動力,強化信息安全保障,完善產業(yè)標準體系,依法依規(guī)打擊數(shù)據(jù)濫用、侵犯隱私等行為,讓各類主體公平分享大數(shù)據(jù)帶來的技術、制度和創(chuàng)新的紅利。
大數(shù)據(jù)帶來的啟示與思考
研究的超前性。其實早在1980年托夫勒便指出了大數(shù)據(jù)的極端重要性和美好未來。假設我們早在1980年就意識到大數(shù)據(jù)的極端重要性,超前部署相關研發(fā)工作,那么目前的局面又會如何。因此,我們在尋求引領發(fā)展和先發(fā)優(yōu)勢時,它呼喚著極具前瞻眼光的戰(zhàn)略思維和視野,這也告訴高等學校必須做超前的人才培養(yǎng),必須做明天的科學研究;企業(yè)必須有超前的技術儲備,為明天產品的開發(fā)做積累,如華為等智能手機的成功不是偶然的,就在于其前瞻性的布局。
人才培養(yǎng)與知識體系的快速適應性。面向未來的人力資源需求,如今的IT類專業(yè)人才的培養(yǎng)模式、知識體系、實驗課程設置應如何應對?如何培養(yǎng)復合型人才等都是高等教育領域需要考慮的問題。個人認為,不宜過多設立過度的大數(shù)據(jù)專業(yè)與學院。從狹義的大數(shù)據(jù)角度來看,更多的是要將大數(shù)據(jù)作為計算機和軟件工程等專業(yè)方向,面向大數(shù)據(jù)對IT技術提出的新要求,如對計算機系統(tǒng)結構、硬件結構設計、網絡體系結構、軟件體系結構、編程模式等提出的新要求,數(shù)據(jù)采集、存儲、組織、訪問管理等面臨新的要求來培養(yǎng)專業(yè)人才。從廣義大數(shù)據(jù)的角度來看,更多地應與其他專業(yè)相交叉,培育大數(shù)據(jù)方向的復合人才,如金融大數(shù)據(jù)、工業(yè)大數(shù)據(jù)、交通大數(shù)據(jù)等,這樣才能更好地適應大數(shù)據(jù)在行業(yè)發(fā)展的需要。因此,高等教育必須迅速適應大數(shù)據(jù)要求,適時進行專業(yè)培養(yǎng)方向轉型,這樣便不會出現(xiàn)在幾年后面臨巨大的人才需求所謂的人才過剩及人才匱乏等現(xiàn)象。但在人才培養(yǎng)過程中切忌跟風,不要盲目蜂擁而上,必須看清自己是否有真正意義上的教師資源,否則也不會達到很好的效果。
加快發(fā)展大數(shù)據(jù)產業(yè)。一個產業(yè)的興旺發(fā)達必須具備以下兩點:一個是市場需求。沒有市場需求的產業(yè)不可能長久。另一個是與產業(yè)相關的各個主體的利益保障,主體權益得不到保障,便沒有發(fā)展產業(yè)的動力。在完善大數(shù)據(jù)產業(yè)政策的過程中必須考慮解決如下的問題:社會成員隱私權的保護、社會各類主體信息所有權的保護、公共數(shù)據(jù)資源開放與國家安全的甄別。思考這些問題不僅是政策制定者的責任,也是大數(shù)據(jù)技術開發(fā)工作者的責任,在數(shù)據(jù)進行專業(yè)化處理的過程中必須兼顧隱私的保護和數(shù)據(jù)資源公共安全的保護。在大數(shù)據(jù)產業(yè)發(fā)展的過程中必須科學布局、理性發(fā)展,切忌低水平的重復建設。如今到處在建大數(shù)據(jù)中心、智慧城市,但這些并不等于大數(shù)據(jù)產業(yè)中的全部。我們需要適當聚焦基礎理論、關鍵技術及核心軟硬件產品的突破,需要進一步梳理需求、開發(fā)大數(shù)據(jù)應用才能使大數(shù)據(jù)落地生根,需要選擇置換應用發(fā)展才能使得大數(shù)據(jù)在中國更好地普及。
在此過程中一定要注重與其他關鍵技術領域的協(xié)同發(fā)展。如與云計算、物聯(lián)網等的協(xié)同發(fā)展,云計算本身可以為大數(shù)據(jù)提供解決方案,物聯(lián)網是數(shù)據(jù)采集和獲取的主要手段。同時在發(fā)展大數(shù)據(jù)時要注重與國家戰(zhàn)略的聯(lián)動統(tǒng)籌,如互聯(lián)網+、中國制造2025等的聯(lián)動統(tǒng)籌,這樣才能更好地推動中國社會經濟發(fā)展的提效。另外一方面,隨著數(shù)據(jù)處理技術的圖片,特別是圖像語音等分析處理技術,大數(shù)據(jù)已不像如今理解的那么大。大數(shù)據(jù)量很大,但價值不一。真正有用的數(shù)據(jù)是呈現(xiàn)某種狀況,如安全事件幾秒的影響。如今無法實時理解和分析發(fā)生事件的信息。因此,隨著數(shù)據(jù)處理技術的發(fā)展,大數(shù)據(jù)可能沒有今天想象的那么大了。
(作者系東北大學軟件學院院長、教授)