王海蘊(yùn)
大數(shù)據(jù)為社會(huì)帶來(lái)的變化已經(jīng)遠(yuǎn)超過(guò)我們的想象,誰(shuí)也不知道明天還會(huì)有什么驚喜發(fā)生
在人和物加速互聯(lián)的全球信息化背景下,以及我國(guó)轉(zhuǎn)型升級(jí)關(guān)鍵時(shí)期,數(shù)字經(jīng)濟(jì)對(duì)我們經(jīng)濟(jì)發(fā)展具有的重要意義不言而喻。
《“十三五”國(guó)家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》,首次把數(shù)字創(chuàng)意產(chǎn)業(yè)納入戰(zhàn)略性新興產(chǎn)業(yè)范疇,計(jì)劃到2020年數(shù)字創(chuàng)意產(chǎn)業(yè)相關(guān)行業(yè)產(chǎn)值規(guī)模達(dá)到8萬(wàn)億元,這就意味著,未來(lái)平均每年需要增長(zhǎng)70%,遠(yuǎn)遠(yuǎn)高于其它行業(yè)。
國(guó)家信息中心研究員、中經(jīng)網(wǎng)副主任朱幼平已經(jīng)專注信息化研究三十余年,他在接受本刊記者專訪時(shí)指出,要達(dá)到8萬(wàn)億元的產(chǎn)業(yè)規(guī)模雖然有一定難度,但放眼全國(guó)各地,發(fā)展大數(shù)據(jù)積極性都較高,行業(yè)應(yīng)用也得到快速推廣,市場(chǎng)規(guī)模增速明顯,國(guó)家和政府應(yīng)乘勢(shì)而為,以寬容的態(tài)度進(jìn)一步引導(dǎo)行業(yè)的未來(lái)發(fā)展。
未來(lái)已來(lái)
幾年前,大數(shù)據(jù)還是專業(yè)領(lǐng)域里的抽象概念;如今,它已在切切實(shí)實(shí)地改變著人們的生活,改變著經(jīng)濟(jì)、社會(huì)發(fā)展的軌跡。
就拿生活中最簡(jiǎn)便的應(yīng)用來(lái)說(shuō),無(wú)論是出門用手機(jī)地圖導(dǎo)航,還是掃碼騎共享單車的智能出行,多數(shù)都與大數(shù)據(jù)相關(guān)。而基于大數(shù)據(jù)的個(gè)性化醫(yī)療服務(wù)和具有彈性學(xué)制、個(gè)性化等特點(diǎn)的教育,以及無(wú)人駕駛等,三五年前還被認(rèn)為是“天方夜譚”,現(xiàn)在都在日益成為可以觸摸到的現(xiàn)實(shí)。
正如中國(guó)工程院院士、中科院計(jì)算所研究員倪光南在2017中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上描述的那樣:“大數(shù)據(jù)為社會(huì)帶來(lái)的變化已經(jīng)遠(yuǎn)超過(guò)我們的想象,誰(shuí)也不知道明天還會(huì)有什么驚喜發(fā)生?!?/p>
的確,大數(shù)據(jù)的價(jià)值已經(jīng)毋庸置疑?!丁笆濉眹?guó)家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》首次把數(shù)字創(chuàng)意產(chǎn)業(yè)納入戰(zhàn)略性新興產(chǎn)業(yè)范疇,計(jì)劃到2020年數(shù)字創(chuàng)意產(chǎn)業(yè)相關(guān)行業(yè)產(chǎn)值規(guī)模達(dá)到8萬(wàn)億元。
“大數(shù)據(jù)從權(quán)屬角度看,就是數(shù)字資產(chǎn)?!敝煊灼秸f(shuō),互聯(lián)網(wǎng)飛速發(fā)展,產(chǎn)生了大量的信息,人、物加速互聯(lián),整個(gè)世界已經(jīng)高度信息化,進(jìn)入大數(shù)據(jù)時(shí)代。
另外,資產(chǎn)數(shù)字化也在飛速發(fā)展。比如,比特幣、以太幣等數(shù)字貨幣是最為人們熟悉的一類數(shù)字資產(chǎn)。目前各色各樣的數(shù)字貨幣大概有300多種,市值約120億美元。未來(lái)央行會(huì)發(fā)行法定的數(shù)字貨幣也是一種數(shù)字資產(chǎn),智能股票、智能債券也是數(shù)字資產(chǎn)。
朱幼平認(rèn)為,除數(shù)字貨幣、數(shù)字股票、數(shù)字債券外,數(shù)字資產(chǎn)的范圍比這要大得多,包括所有數(shù)字化了的資產(chǎn),比如數(shù)據(jù)、專利、版權(quán)、創(chuàng)意、信用等知識(shí)文化資產(chǎn)。更廣義的還包括實(shí)物產(chǎn)品以數(shù)字權(quán)證形式存在的形態(tài),比如商場(chǎng)購(gòu)物卡、房產(chǎn)證等。
破解人工智能困境
聚焦現(xiàn)在這個(gè)時(shí)間點(diǎn),大數(shù)據(jù)取得了怎樣的發(fā)展成果?朱幼平認(rèn)為,目前看來(lái),最大的突破是基于大數(shù)據(jù)的人工智能(AI)?;蛘哒f(shuō),以深度學(xué)習(xí)為代表的人工智能技術(shù)之所以能取得突飛猛進(jìn)的進(jìn)展,正是得益于良好的大數(shù)據(jù)基礎(chǔ)。
AI誕生于1956年達(dá)特茅斯學(xué)院(Dartmouth)的探索問(wèn)題解決和符號(hào)化方法等科研項(xiàng)目課題,但人類在推進(jìn)AI的研究一度遇到了巨大的障礙,最后幾乎絕望。
以機(jī)器翻譯來(lái)說(shuō),語(yǔ)言專家必須不辭勞苦地編撰大型詞典和與語(yǔ)法、句法、語(yǔ)義學(xué)有關(guān)的規(guī)則,數(shù)十萬(wàn)詞匯構(gòu)成詞庫(kù),語(yǔ)法規(guī)則高達(dá)數(shù)萬(wàn)條,考慮各種情景、各種語(yǔ)境,模擬人類翻譯,計(jì)算機(jī)專家再構(gòu)建復(fù)雜的程序。最后發(fā)現(xiàn)人類語(yǔ)言實(shí)在是太復(fù)雜了,窮舉式的做法根本達(dá)不到最基本的翻譯質(zhì)量。這條道路最后的結(jié)果是,1960年代后人工智能的技術(shù)研發(fā)停滯不前數(shù)年后,科學(xué)家痛苦地發(fā)現(xiàn)以“模擬人腦”、“重建人腦”的方式來(lái)定義人工智能走入一條死胡同,這導(dǎo)致后來(lái)幾乎所有的人工智能項(xiàng)目都進(jìn)入了冷宮。
這種困境一直持續(xù)到計(jì)算機(jī)“深藍(lán)”出現(xiàn)。1997年5月11日,國(guó)際象棋大師卡斯帕羅夫在和IBM公司開發(fā)的計(jì)算機(jī)“深藍(lán)”進(jìn)行對(duì)弈時(shí)宣布失敗,計(jì)算機(jī)“深藍(lán)”因此贏得了這場(chǎng)意義深遠(yuǎn)的“人機(jī)對(duì)抗”。
朱幼平指出,“深藍(lán)”不是靠邏輯或所謂的人工智能取勝的,而是靠超強(qiáng)的計(jì)算能力取勝。去年Alpha Go大勝李世石的人機(jī)圍棋對(duì)戰(zhàn)更進(jìn)一步印證了大數(shù)據(jù)的巨大威力。
移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術(shù)的發(fā)展讓我們擁有了以往難以想象的海量數(shù)據(jù),尤其是在某一細(xì)分領(lǐng)域更深度的、邏輯化的數(shù)據(jù),而這些都是訓(xùn)練某一領(lǐng)域智能的前提。從軟件時(shí)代到互聯(lián)網(wǎng),再到如今的大數(shù)據(jù)時(shí)代,數(shù)據(jù)的量和復(fù)雜性都經(jīng)歷了從量到質(zhì)的改變。
人機(jī)對(duì)戰(zhàn)只是其中一種,它屬于已有實(shí)質(zhì)性突破的計(jì)算型的AI。朱幼平說(shuō),還有一類是感知型的AI,人臉識(shí)別、語(yǔ)音識(shí)別等都屬于此類?!坝辛俗銐虼蟮男畔⒘?,別管是導(dǎo)航、理解話語(yǔ)、翻譯語(yǔ)言,還是識(shí)別人臉,或者模擬人類對(duì)話,都可以讓機(jī)器來(lái)做。未來(lái)基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)基礎(chǔ)上的人工智能達(dá)到比較流暢地模擬人類對(duì)話,就是人類可以和機(jī)器進(jìn)行比較自如的對(duì)話?!?/p>
而隨著人工智能技術(shù)進(jìn)展,數(shù)據(jù)采集、清洗、建模、分析、可視化等都有了突破性進(jìn)展。朱幼平認(rèn)為,兩者的融合發(fā)展,將釋放出更多的市場(chǎng)潛力。
麥肯錫預(yù)計(jì),至2025年人工智能應(yīng)用市場(chǎng)總值將達(dá)到1270億美元。在未來(lái)10年甚至更久的時(shí)間里,人工智能將是眾多智能產(chǎn)業(yè)技術(shù)和應(yīng)用發(fā)展的突破點(diǎn)。隨著人工智能被寫入“十三五”規(guī)劃綱要,有預(yù)測(cè)說(shuō)我國(guó)人工智能市場(chǎng)規(guī)模2018年將突破380億元。
大數(shù)據(jù)典型應(yīng)用
朱幼平認(rèn)為,我國(guó)大數(shù)據(jù)產(chǎn)業(yè)雖仍處于起步發(fā)展階段,但各地發(fā)展大數(shù)據(jù)積極性較高,行業(yè)應(yīng)用得到快速推廣,市場(chǎng)規(guī)模增速明顯。有研究稱,2015年我國(guó)大數(shù)據(jù)市場(chǎng)規(guī)模為115.9億元,增速達(dá)53.10%。
從行業(yè)應(yīng)用情況來(lái)看,已經(jīng)涵蓋投資機(jī)構(gòu)采用的量化投資、銀行貸前和貸后風(fēng)控、出行線路優(yōu)化、精準(zhǔn)營(yíng)銷、健康管理、犯罪預(yù)測(cè)等內(nèi)容。而從更加具象的角度看,朱幼平還列舉了全球大數(shù)據(jù)應(yīng)用的幾個(gè)典型案例:endprint
自動(dòng)駕駛汽車。一輛自動(dòng)駕駛汽車每秒會(huì)產(chǎn)生100G的數(shù)據(jù)。特斯拉用機(jī)器學(xué)習(xí)AI技術(shù),從它的自動(dòng)駕駛汽車那里收集的數(shù)據(jù)越多,就越能改進(jìn)自動(dòng)駕駛技術(shù)。特斯拉第一季度只賣出了2.5萬(wàn)輛車,但目前市值比賣出230萬(wàn)輛車的通用汽車還高。UBER、滴滴打車等目前我國(guó)流行的共享單車,未來(lái)有可能由無(wú)人駕駛代替出行等,都是大數(shù)據(jù)典型應(yīng)用。
PRADA試衣間。PRADA在紐約的旗艦店中每件衣服上都有RFID碼。每當(dāng)一個(gè)顧客拿起一件衣服進(jìn)試衣間,RFID會(huì)被自動(dòng)識(shí)別。同時(shí),數(shù)據(jù)會(huì)傳至PRADA總部。每一件衣服在哪個(gè)城市哪個(gè)旗艦店、什么時(shí)間被拿進(jìn)試衣間、停留多長(zhǎng)時(shí)間,數(shù)據(jù)都被存儲(chǔ)起來(lái)加以分析。如果有一件衣服銷量很低,以往的作法是直接下架。但如果RFID傳回的數(shù)據(jù)顯示這件衣服雖然銷量低,但進(jìn)試衣間的次數(shù)多,也許在某個(gè)細(xì)節(jié)進(jìn)行微小改變就會(huì)重新創(chuàng)造出一件非常流行的產(chǎn)品。
遙感衛(wèi)星。采用遙感衛(wèi)星,通過(guò)圖像識(shí)別,把所有的耕地標(biāo)識(shí)計(jì)算出來(lái),然后把耕地網(wǎng)格化,對(duì)每個(gè)網(wǎng)格的耕地抽樣進(jìn)行跟蹤、調(diào)查和統(tǒng)計(jì),然后按照統(tǒng)計(jì)學(xué)的原理,計(jì)算(或者說(shuō)估算)出整體糧食數(shù)據(jù)。這種做法是典型采用大數(shù)據(jù)建模的方法,打破傳統(tǒng)流程和組織,直接獲得最終的結(jié)果。
炒股票。2011年好萊塢電影《永無(wú)止境》中,落魄的作家?guī)扃攴昧艘环N可以迅速提升智力的神奇藍(lán)色藥物,然后他將這種高智商用于炒股。庫(kù)珀能在短時(shí)間掌握無(wú)數(shù)公司資料和背景,也就是將世界上已經(jīng)存在的海量數(shù)據(jù)(包括公司財(cái)報(bào)、電視、幾十年前的報(bào)紙、互聯(lián)網(wǎng)、小道消息等)挖掘出來(lái),串聯(lián)起來(lái),甚至將Facebook、Twitter的海量社交數(shù)據(jù)挖掘得到普通大眾對(duì)某種股票的感情傾向,通過(guò)海量信息的挖掘、分析,使一切內(nèi)幕都不是內(nèi)幕,使一切趨勢(shì)都在眼前,結(jié)果在10天內(nèi)他就贏得了200萬(wàn)美元,神奇的表現(xiàn)讓身邊的職業(yè)投資者目瞪口呆。這部電影簡(jiǎn)直是展現(xiàn)大數(shù)據(jù)魔力的教材性電影。
找對(duì)象。如果碰上一位心愛(ài)的姑娘,大數(shù)據(jù)系統(tǒng)就像算命系統(tǒng)一樣,根據(jù)雙方海量數(shù)據(jù)的挖掘,告訴你和姑娘匹配指數(shù)是多少,告訴你全球類似情況的夫妻日后離婚概率是多少,低于某個(gè)匹配指數(shù),大數(shù)據(jù)系統(tǒng)會(huì)慎重建議你認(rèn)真考慮不要這個(gè)姑娘繼續(xù)交往下去。門當(dāng)戶對(duì)有了數(shù)字化解決方案。
寬容式引導(dǎo)
霍金曾指出未來(lái)100年中,人類將面臨比人類更聰明的人工智能的挑戰(zhàn)。人工智能機(jī)器人如果產(chǎn)生了意識(shí),那么人類最終會(huì)被機(jī)器人吞并掉,一如最近上映的《異形:契約》給人類帶來(lái)的恐慌。
朱幼平并不擔(dān)心霍金所說(shuō)的AI將毀滅人類,“還很遙遠(yuǎn)。現(xiàn)在不是擔(dān)心誰(shuí)控制人工智能的時(shí)候,而應(yīng)該擔(dān)心人工智能是否能被完全控制住。”
因此,談到如何引導(dǎo)和規(guī)范大數(shù)據(jù)+人工智能的發(fā)展問(wèn)題,朱幼平主張更加寬容的方式?!安灰腥魏螚l條框框,有點(diǎn)泡沫也不怕,大方向肯定是對(duì)的,新的行業(yè)必須大膽試錯(cuò)?!?/p>
“一些企業(yè)如果死掉了,也是有價(jià)值的犧牲。”朱幼平說(shuō),但在如何處理好數(shù)據(jù)開放和保護(hù)隱私的問(wèn)題上,這是政府要發(fā)揮作用的地方。他同時(shí)提出了幾點(diǎn)具體建議:
首先可以設(shè)立國(guó)家級(jí)的AI實(shí)驗(yàn)室,以舉國(guó)體制搞研發(fā),我國(guó)不能在這個(gè)人類未來(lái)發(fā)展方向領(lǐng)域落伍。
其次,建立政府引導(dǎo)基金,作為母基金,通過(guò)PPP等,設(shè)置杠桿機(jī)制和風(fēng)險(xiǎn)保障機(jī)制,把我國(guó)堆積在房地產(chǎn)、金融領(lǐng)域的資金引流到這個(gè)領(lǐng)域。
第三,編制行業(yè)標(biāo)準(zhǔn)和技術(shù)標(biāo)準(zhǔn)。
第四,制定國(guó)家數(shù)據(jù)安全和個(gè)人隱私安全法律法規(guī)。
第五,加大公共基礎(chǔ)設(shè)施建設(shè),比如數(shù)字版權(quán)公共服務(wù)平臺(tái)、北斗衛(wèi)星建設(shè)與升級(jí)、5G,以及公民和法人數(shù)據(jù)庫(kù)、空間地理信息系統(tǒng)、信用信息系統(tǒng)等。
《“十三五”國(guó)家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》提出,計(jì)劃到2020年數(shù)字創(chuàng)意產(chǎn)業(yè)相關(guān)行業(yè)產(chǎn)值規(guī)模達(dá)到8萬(wàn)億元,未來(lái)平均每年需要增長(zhǎng)70%才能實(shí)現(xiàn),難度不小。
朱幼平因此還從產(chǎn)權(quán)方面提出了一些可行性措施,比如要加快區(qū)塊鏈技術(shù)的研發(fā)和可信網(wǎng)建設(shè),打擊侵權(quán)盜版,保護(hù)知識(shí)產(chǎn)權(quán),積極推進(jìn)從信息互聯(lián)網(wǎng)向價(jià)值互聯(lián)網(wǎng)的變革。同時(shí),加快DCI(數(shù)字版權(quán)唯一標(biāo)識(shí)符,Digital Copyright Identifier)公共服務(wù)體系建設(shè),把版權(quán)登記、審核、發(fā)證、保管、交易、存證、維權(quán)、監(jiān)測(cè)、評(píng)估、咨詢等政務(wù)服務(wù)搬到網(wǎng)上,推進(jìn)版權(quán)線上公共服務(wù)。endprint