◎ 中國工程院院士 鄔賀銓
利用開放數(shù)據(jù)打造智慧城市
◎ 中國工程院院士 鄔賀銓
信息化的深化應(yīng)用已經(jīng)發(fā)展到以“大智移云”(大數(shù)據(jù)、智能化、移動(dòng)互聯(lián)網(wǎng)和云計(jì)算)為特征的新時(shí)代?!按笾且圃啤?互為關(guān)聯(lián),寬帶化、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和產(chǎn)業(yè)互聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù),大數(shù)據(jù)的挖掘應(yīng)用需要云計(jì)算,大數(shù)據(jù)的應(yīng)用還提升了移動(dòng)互聯(lián)網(wǎng)、產(chǎn)業(yè)互聯(lián)網(wǎng)的價(jià)值。
信息社會(huì),數(shù)據(jù)無處不在,數(shù)據(jù)量以驚人的速度增長。例如,現(xiàn)在視頻監(jiān)控?cái)z像頭廣泛應(yīng)用于主要道路、熱點(diǎn)地區(qū)、地鐵和小區(qū)的安全監(jiān)視。一個(gè)8Mbps攝像頭每小時(shí)產(chǎn)生3.6GB,很多城市的攝像頭多達(dá)幾十萬個(gè),一個(gè)月的數(shù)據(jù)量達(dá)到數(shù)百PB,若需保存3個(gè)月則存儲(chǔ)量達(dá)EB量級(jí)。國家稅務(wù)總局每月收集全國數(shù)據(jù)4TB,已集中的結(jié)構(gòu)化數(shù)據(jù)260TB。北京市政府部門數(shù)據(jù)庫總量2011年63PB,2012年95PB。北京的“檢立方”系統(tǒng)覆蓋北京市三級(jí)檢察院的50萬件案件、380萬份法律文書、9800萬項(xiàng)檢察數(shù)據(jù)。大量的環(huán)保傳感器實(shí)時(shí)地檢測大氣、河流、湖泊和土壤,不間斷地收集環(huán)保數(shù)據(jù)。
醫(yī)療也產(chǎn)生大數(shù)據(jù),廣州中山大學(xué)第一附屬醫(yī)院存儲(chǔ)的數(shù)據(jù)量在2008年就達(dá)到了100TB,預(yù)計(jì)2015年將超過1000TB。交通也產(chǎn)生大數(shù)據(jù),北京交通中心每天數(shù)據(jù)增量30GB,存儲(chǔ)量20TB。服務(wù)業(yè)也是大數(shù)據(jù)之源,國家電網(wǎng)公司年均產(chǎn)生數(shù)據(jù)510TB(未計(jì)視頻),2013年累計(jì)產(chǎn)生數(shù)據(jù)5PB。中國聯(lián)通用戶上網(wǎng)記錄每秒83萬條,對(duì)應(yīng)年數(shù)據(jù)量3.6PB,中國移動(dòng)每天話單數(shù)據(jù)10TB,信令數(shù)據(jù)100TB,上網(wǎng)日志500TB。中國工商銀行企業(yè)級(jí)數(shù)據(jù)倉庫存儲(chǔ)量已超過350TB,積累的數(shù)據(jù)4.5PB。
互聯(lián)網(wǎng)公司更是大數(shù)據(jù)的收集者,阿里公司單日數(shù)據(jù)產(chǎn)生量超過50TB,峰值處理交易3.8萬筆/秒,已存100PB已處理過的數(shù)據(jù),百度每天處理60億次搜索請(qǐng)求,新增800TB,存儲(chǔ)網(wǎng)頁數(shù)近1萬億,數(shù)據(jù)總量達(dá)到EB級(jí),騰訊活躍用戶QQ超8億,微信超5億,日新增300TB數(shù)據(jù),數(shù)據(jù)總存儲(chǔ)量100PB。
我國有約300個(gè)城市明確要建設(shè)智慧城市。關(guān)于智慧城市普遍認(rèn)為無線城市、數(shù)字城市、寬帶城市、感知城市是智慧城市的必要條件,創(chuàng)新城市、綠色城市、宜居城市、平安城市、健康城市、幸福城市、人文城市等是智慧城市應(yīng)有之意。關(guān)于智慧城市目前還沒有權(quán)威的評(píng)價(jià)標(biāo)準(zhǔn),歐盟等國家認(rèn)為開放政府和市民參與城市管理是重要的標(biāo)志,開放政府是智慧政府的前提。
2013年6月在英國召開的G8會(huì)議,簽署了“開放數(shù)據(jù)憲章”,提出了開放數(shù)據(jù)五原則,即開放數(shù)據(jù)是基本要求、注重?cái)?shù)據(jù)的質(zhì)量與數(shù)量、讓所有人都可用、為改善治理而發(fā)布數(shù)據(jù)、發(fā)布數(shù)據(jù)以激勵(lì)創(chuàng)新。美國政府建立了統(tǒng)一數(shù)據(jù)開放門戶--Data.Gov,按原始數(shù)據(jù)、地理數(shù)據(jù)和數(shù)據(jù)工具三類開放政府擁有(屏蔽了個(gè)人隱私)的公共數(shù)據(jù)。
政府開放數(shù)據(jù)助力城市治安管理。紐約市詳盡犯罪記錄數(shù)據(jù)開放后,出現(xiàn)了提示公眾避免進(jìn)入犯罪高發(fā)區(qū)域和提高警惕的手機(jī)應(yīng)用,同時(shí)還能將犯罪記錄信息和動(dòng)態(tài)交通數(shù)據(jù)結(jié)合起來,起到指導(dǎo)調(diào)配警力的作用。2012年,美國加州大學(xué)分析洛杉磯市政府提供的過去1300多萬起案件數(shù)據(jù),找到了各小區(qū)發(fā)案與日期、天氣、交通狀況及其它相關(guān)事件的關(guān)系,建立犯罪活動(dòng)預(yù)測平臺(tái),該系統(tǒng)已使該地區(qū)財(cái)產(chǎn)犯罪率和盜竊案件分別下降了12%和26%。
開放數(shù)據(jù)的應(yīng)用還可以預(yù)測流行病的發(fā)生。谷歌把搜索詞和美國疾控中心的流感傳播歷史數(shù)據(jù)進(jìn)行比較,在2009年甲型H1N1流感爆發(fā)的幾周前,谷歌就給出了預(yù)測,與疾控中心數(shù)據(jù)相關(guān)性高達(dá)97%。中科院與百度合作,精選了160多條關(guān)鍵詞,對(duì)5年來的數(shù)據(jù)進(jìn)行建模分析,先于衛(wèi)生部門公布前幾周得出了中國艾滋感染人群的分布情況,估值基本一致。
開放數(shù)據(jù)能夠促進(jìn)公用事業(yè)效率提升。美國交通部開放了全美航班飛行數(shù)據(jù),有市民利用這些數(shù)據(jù)開發(fā)了航班延誤時(shí)間的分析系統(tǒng),幫助旅客選擇正點(diǎn)率高的航班,同時(shí)推動(dòng)航空公司提升正點(diǎn)率,美國航班延誤率從2008年的27%下降到了2010年的20.23%。公共交通系統(tǒng)的動(dòng)態(tài)數(shù)據(jù)公布后,公眾進(jìn)行深度挖掘,不僅創(chuàng)造出了手機(jī)應(yīng)用為公眾出行提供實(shí)時(shí)建議,同時(shí)為地鐵系統(tǒng)在客流高低峰時(shí)段、熱點(diǎn)站和普通站之間的調(diào)配提出了更優(yōu)方案。
開放數(shù)據(jù)有利于扶持中小企業(yè)發(fā)展。美國Panjiva公司(磐聚網(wǎng))利用政府開放的海關(guān)貨運(yùn)數(shù)據(jù)建立全球外貿(mào)搜索引擎,成為面向采購商和供應(yīng)商的智能B2B平臺(tái),每年采集上億條貨運(yùn)記錄,包括發(fā)貨人、收貨人、集裝箱內(nèi)貨物內(nèi)容和價(jià)值等。同時(shí)提供信用報(bào)告、合格證、網(wǎng)站和供應(yīng)商等信息。2013年美國政府公布了氣象方面的數(shù)據(jù)信息,有公司通過數(shù)據(jù)分析預(yù)測某一段時(shí)間的氣候變化趨勢,再將結(jié)果銷售給農(nóng)業(yè)、物流等領(lǐng)域的企業(yè)。據(jù)不完全統(tǒng)計(jì),類似的氣象數(shù)據(jù)應(yīng)用已延伸出數(shù)百億美元的新興產(chǎn)業(yè)。
眾包數(shù)據(jù)能夠幫助改進(jìn)城市管理。2012年7月,美國波士頓啟動(dòng)“街道坑洼”項(xiàng)目,支持開發(fā)專用的應(yīng)用程序,司機(jī)將裝有這一應(yīng)用程序和加速器的智能手機(jī)放在汽車儀表盤上,當(dāng)汽車遇到坑洼而顛簸時(shí),手機(jī)就會(huì)向指定的服務(wù)器發(fā)送包括所在地GPS位置的信息。這一專用應(yīng)用程序在應(yīng)用初期時(shí)誤報(bào)頻繁,波士頓市政府委托一家眾包公司InnoCentive來完善這一工作,該公司設(shè)計(jì)出一個(gè)游戲化程序,以2.5萬美元獎(jiǎng)金公開征集解決方案,現(xiàn)在新版本的應(yīng)用程序已有很大改進(jìn)。目前“街道坑洼”網(wǎng)站已報(bào)告探測到波士頓有11萬多個(gè)坑洼。美國其他城市也在仿效。高德公司以眾包思路采集3億多高德地圖用戶的出行數(shù)據(jù),每天近千萬使用高德圖在線導(dǎo)航的用戶給高德實(shí)時(shí)交通貢獻(xiàn)了大量的用戶出行服務(wù)數(shù)據(jù)。高德還融合了幾十萬輛出租車及幾百萬輛物流車的浮動(dòng)車數(shù)據(jù),得出全國城市擁堵排名。例如2014年第三季度,北京位于我國十大擁堵城市之首,平均速度22km/小時(shí),每10公里需時(shí)27.3分鐘、每10公里延時(shí)14.4分鐘。電信運(yùn)營商不僅利用自身收集的數(shù)據(jù),還通過發(fā)展手機(jī)用戶作為網(wǎng)絡(luò)性能測試的志愿者,獲得網(wǎng)絡(luò)的實(shí)時(shí)性能,以此來優(yōu)化網(wǎng)絡(luò)性能,改善對(duì)客戶的服務(wù),手機(jī)的數(shù)據(jù)還可以用來反映馬路上車流速度以及城市突發(fā)事件。
科技開發(fā)眾包化。GE公司公開基于3D打印的設(shè)計(jì)工具并征求噴氣式發(fā)動(dòng)機(jī)拖架設(shè)計(jì),鼓勵(lì)創(chuàng)客社區(qū)參與設(shè)計(jì),從56個(gè)國家/地區(qū)將近700件設(shè)計(jì)作品中選出10件進(jìn)入決賽,勝出的設(shè)計(jì)將重量減輕了85%。紐約時(shí)報(bào)早年的報(bào)紙都發(fā)黃了,用計(jì)算機(jī)掃描方法已很難識(shí)別其中的文字,不過計(jì)算機(jī)識(shí)別不了而人是可以識(shí)別的,但從哪里找這么多人力呢?將待識(shí)別的文字貼到網(wǎng)站作為驗(yàn)證碼,紐約時(shí)報(bào)130年存檔發(fā)黃的報(bào)紙的數(shù)字化工作在幾個(gè)月內(nèi)就由網(wǎng)民不知不覺完成了。
1935年地理學(xué)者胡煥庸根據(jù)當(dāng)時(shí)的全國人口數(shù)據(jù),在中國地圖上從黑龍江的璦暉到云南的騰沖畫了一根線,后來被稱為胡煥庸線,線的東側(cè)面積占43%而人口占94%,東西兩側(cè)經(jīng)濟(jì)發(fā)展水平差距很大。騰訊給出的QQ用戶在我國的分布密度與胡煥庸線非常吻合,從中可見QQ或者手機(jī)用戶的分布能反映地區(qū)經(jīng)濟(jì)發(fā)展的差異。
綜上所述,移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計(jì)算產(chǎn)生大數(shù)據(jù),城市數(shù)據(jù)是智慧城市的重要資產(chǎn)。開放政府是智慧城市的前提,數(shù)據(jù)開放是評(píng)價(jià)開放政府的重要指標(biāo),開放數(shù)據(jù)將營造創(chuàng)新環(huán)境和釋放商業(yè)機(jī)會(huì)。市民的參與性是智慧城市的評(píng)價(jià)標(biāo)志,眾包是挖掘社會(huì)智力資源潛力的有效模式,推動(dòng)建設(shè)眾志成城和“眾智成城”的生態(tài)。