李棟 北京清華同衡規(guī)劃設(shè)計(jì)研究院技術(shù)創(chuàng)新中心常務(wù)副主任
當(dāng)下數(shù)據(jù)發(fā)展有以下幾個(gè)大趨勢(shì):
首先全社會(huì)數(shù)據(jù)可用性極大增加。當(dāng)前全球超30億人、約170億設(shè)備聯(lián)網(wǎng)在線,這些設(shè)備無(wú)時(shí)無(wú)刻不在產(chǎn)生數(shù)據(jù)。據(jù)統(tǒng)計(jì),人類從直立行走到2003年所創(chuàng)造數(shù)據(jù)量總計(jì)5艾字節(jié),到2007年短短幾年間數(shù)據(jù)量已超了300艾字節(jié),而到了2015年,全球網(wǎng)絡(luò)流量接連翻番,數(shù)據(jù)量達(dá)到接近1000艾字節(jié),預(yù)測(cè)到2025年,全球數(shù)據(jù)總量將增長(zhǎng)至現(xiàn)在的200倍到170,000艾字節(jié)。可以說(shuō)展望未來(lái),大數(shù)據(jù)時(shí)代其實(shí)還沒(méi)有真正來(lái)臨,數(shù)據(jù)發(fā)展將呈現(xiàn)更加富集的趨勢(shì)。
圖1 大數(shù)據(jù)富集趨勢(shì)
其次計(jì)算能力和算法挖掘手段全面提升。計(jì)算能力得到飛速?gòu)?qiáng)化。強(qiáng)大的計(jì)算機(jī)通過(guò)網(wǎng)絡(luò)連接,大量數(shù)據(jù)的并行處理成為可能,硬件方面也有很大的提升?,F(xiàn)在的手機(jī)計(jì)算能力已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了早期的電腦。而且所使用的算法獲得了全面的更新。十余年機(jī)器學(xué)習(xí)發(fā)展基礎(chǔ)上,可以將這些龐大的數(shù)據(jù)和算力用于算法的訓(xùn)練,開(kāi)發(fā)新規(guī)則來(lái)執(zhí)行日益復(fù)雜的任務(wù)。以深度學(xué)習(xí)為代表的新手段得到持續(xù)優(yōu)化,啟發(fā)新服務(wù),刺激了對(duì)AI領(lǐng)域各方面的投資和研究。數(shù)據(jù)、設(shè)備、算法幾個(gè)方面快速的發(fā)展,終將整個(gè)人類社會(huì)信息化的趨勢(shì)逐漸推向一個(gè)又一個(gè)高潮。
數(shù)據(jù)分析只是廣義信息化的一個(gè)環(huán)節(jié),我們可以簡(jiǎn)單做下分類,一類是流程信息化(狹義信息化),指在既有機(jī)制下對(duì)業(yè)務(wù)的信息化改造,如政府委辦局的辦公OA等,流程和機(jī)制是預(yù)先規(guī)定好的。另一類是決策智能化(廣義信息化),比如說(shuō)我們要對(duì)城市發(fā)展的信息化做整合,而城市管理的規(guī)則和機(jī)制是開(kāi)放的、不斷發(fā)展和變化的,我們的挑戰(zhàn)是如何運(yùn)用信息化的手段處理這種挑戰(zhàn)。利用信息化對(duì)開(kāi)放系統(tǒng)進(jìn)行綜合決策,需要采集整理決策所需信息、設(shè)計(jì)多種決策方案、對(duì)方案開(kāi)展模擬與預(yù)評(píng)估、對(duì)方案進(jìn)行比選優(yōu)化,對(duì)方案實(shí)施開(kāi)展周期性監(jiān)控、方案實(shí)施后評(píng)估等等,這是一個(gè)值得開(kāi)展長(zhǎng)期探索的方向,也是數(shù)據(jù)應(yīng)用高附加值所在之處。
流程信息化,規(guī)則相對(duì)清晰、條件相對(duì)封閉、目標(biāo)相對(duì)明確。而決策智能化規(guī)則相對(duì)模糊、條件相對(duì)開(kāi)放、目標(biāo)不夠明確,依賴更多、更復(fù)雜、非標(biāo)準(zhǔn)化信息輸入作為基礎(chǔ)。當(dāng)面對(duì)決策智能化的時(shí)候,作為規(guī)劃師往往會(huì)感到信息焦慮以及對(duì)工具的渴求,會(huì)懷疑自己是不是遺漏了什么關(guān)鍵信息、從而對(duì)項(xiàng)目造成一些決定性影響,這是所有咨詢者、決策者共同面對(duì)的一個(gè)很大挑戰(zhàn)。
以規(guī)劃編制為例,即使是同一個(gè)地區(qū),即使是遵循相同的規(guī)劃編制技術(shù)要求等規(guī)則,但由于每一次規(guī)劃編制的背景不同、規(guī)劃目標(biāo)和實(shí)施手段也大相徑庭,因此對(duì)規(guī)劃內(nèi)容本身(即待決策的方案)的評(píng)判標(biāo)準(zhǔn)也會(huì)存在很大的差異,更毋論如何對(duì)規(guī)劃方案進(jìn)行優(yōu)化和持續(xù)改進(jìn)了。
如果從一個(gè)更大的、數(shù)據(jù)的視角來(lái)看待這個(gè)問(wèn)題,流程信息化指利用自有數(shù)據(jù)解決自己的問(wèn)題,比如財(cái)務(wù)報(bào)銷自動(dòng)化等,而決策智能化則意味著要綜合使用自有數(shù)據(jù)和他類數(shù)據(jù)(alternative data),一起來(lái)解決自己的問(wèn)題。
他類數(shù)據(jù)是指全社會(huì)其他部門(mén)數(shù)字化、信息化之后的積累,例如原本用于運(yùn)營(yíng)商計(jì)費(fèi)和網(wǎng)優(yōu)的手機(jī)信令數(shù)據(jù),原本用于公交系統(tǒng)計(jì)費(fèi)的市政一卡通刷卡數(shù)據(jù),原本用于網(wǎng)站和APP經(jīng)營(yíng)的移動(dòng)互聯(lián)網(wǎng)流量?jī)?nèi)容數(shù)據(jù)等等。我們現(xiàn)在之所以能夠在城市規(guī)劃中利用這些大數(shù)據(jù),其實(shí)都要感謝早年其他部門(mén)所做的信息化基礎(chǔ)工作,雖然這些數(shù)據(jù)出現(xiàn)的動(dòng)機(jī)并非是服務(wù)規(guī)劃師。推廣而言,所以若想解決城市這類開(kāi)放系統(tǒng)的決策智能化問(wèn)題,就需要全社會(huì)每個(gè)部門(mén)都把自己的信息化工作做好。
規(guī)劃師扮演的是決策咨詢的角色,為決策者出謀劃策。因此我們自己首先要建立一個(gè)邏輯閉環(huán),按照了解、認(rèn)識(shí)、見(jiàn)解、行動(dòng)的順序。一般規(guī)劃師往往更關(guān)注感知、認(rèn)知與決策這三個(gè)環(huán)節(jié),但對(duì)于“行動(dòng)”,或者說(shuō)“實(shí)施”,則是規(guī)劃或者咨詢業(yè)者不太擅長(zhǎng)的。規(guī)劃信息化的工作其實(shí)在另一個(gè)層面就是在做“行動(dòng)”或“實(shí)施”,在不斷地修補(bǔ)、完善信息化系統(tǒng)。所以我也特別希望規(guī)劃從業(yè)者能夠再多走一步,將分析出來(lái)的好方案親手實(shí)現(xiàn)出來(lái),建立起完整的數(shù)據(jù)思維閉環(huán)。
數(shù)據(jù)思維體現(xiàn)為對(duì)數(shù)據(jù)應(yīng)用的工作流程(workflow),一是感知:數(shù)據(jù)的清洗收集,對(duì)現(xiàn)實(shí)了解得更精細(xì);二是測(cè)度:數(shù)據(jù)的分析評(píng)價(jià),對(duì)狀況判斷得更合理;三是挖掘:數(shù)據(jù)的綜合解讀,對(duì)原因理解得更深入。
1.?dāng)?shù)據(jù)感知:對(duì)現(xiàn)實(shí)的精細(xì)了解
用精細(xì)化的數(shù)據(jù)感知來(lái)滿足規(guī)劃師對(duì)于信息渴求的狀態(tài),例如2017年做朝陽(yáng)區(qū)人口統(tǒng)計(jì)時(shí),數(shù)據(jù)分析的目的不僅想了解朝陽(yáng)區(qū)的總?cè)丝谝?guī)模,還想知道人口分布的具體位置、根據(jù)每個(gè)位置人口活動(dòng)的24小時(shí)規(guī)律進(jìn)行分類等等。
圖2 朝陽(yáng)區(qū)人口分布
圖3 朝陽(yáng)區(qū)人口24小時(shí)活動(dòng)規(guī)律
再進(jìn)一步細(xì)化,比如了解CBD片區(qū)每個(gè)小建筑里面大致人口分布的多少,工作日與非工作日的變化。甚至包括對(duì)每一個(gè)網(wǎng)格,都想去了解人口構(gòu)成的結(jié)構(gòu)與信息等等。
多源數(shù)據(jù)耦合、交叉檢驗(yàn)。當(dāng)數(shù)據(jù)源不同時(shí)需要做一些檢驗(yàn),例如對(duì)一個(gè)地區(qū)的移動(dòng)信令數(shù)據(jù)、滴滴出行數(shù)據(jù)、互聯(lián)網(wǎng)定位數(shù)據(jù)做交叉對(duì)比,判斷出哪個(gè)數(shù)據(jù)相對(duì)更合理。
2.?dāng)?shù)據(jù)測(cè)度:分析與評(píng)價(jià)
通過(guò)設(shè)計(jì)評(píng)價(jià)指標(biāo)體系來(lái)聯(lián)系物理世界與信息世界。將信息空間和物理空間聯(lián)系起來(lái)就是信息-物理系統(tǒng)(Cyber-Physical System),二者通過(guò)指標(biāo)體系相互反饋、調(diào)控。
圖4 信息-物理系統(tǒng)
通過(guò)算法工具對(duì)狀況的合理判斷。數(shù)據(jù)評(píng)價(jià)包括許多內(nèi)容,包括評(píng)價(jià)方式。單純把收集的數(shù)據(jù)落在圖上,很難直觀看出規(guī)律,需要模型、算法、工具來(lái)幫助形成一定的結(jié)構(gòu)化指標(biāo),從而可得到諸如聚類、分析等結(jié)論。例如下面右圖中的方塊是共享自行車騎行軌跡的時(shí)空熱點(diǎn),在相同時(shí)間空間,可以識(shí)別出哪里是騎行行為相對(duì)比較聚集的區(qū)域,并進(jìn)一步分析聚集的原因和影響等。
圖5 自行車騎行軌跡熱點(diǎn)時(shí)空分析
此外還需要把非結(jié)構(gòu)化數(shù)據(jù)(如街景圖片)變成可計(jì)算的結(jié)構(gòu)化指標(biāo),這是大數(shù)據(jù)很關(guān)鍵的核心問(wèn)題,需要借助專門(mén)的工具或一些技術(shù)手段來(lái)實(shí)現(xiàn)。
數(shù)據(jù)評(píng)價(jià):對(duì)狀況的合理判斷。在充分感知數(shù)據(jù)、分析評(píng)價(jià)數(shù)據(jù)之后,就加入結(jié)論判斷環(huán)節(jié)了。例如我們可以根據(jù)騎行軌跡、街道狀況等要素,對(duì)騎行環(huán)境做出綜合評(píng)判。將結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)疊合后,形成關(guān)鍵指標(biāo),根據(jù)問(wèn)題和目標(biāo)進(jìn)行打分,最后得出好中差的觀點(diǎn)。
疊合分析的應(yīng)用示例。比如在對(duì)北京危險(xiǎn)品運(yùn)輸風(fēng)險(xiǎn)的大數(shù)據(jù)分析工作中,通過(guò)將危險(xiǎn)品車輛GPS和同一時(shí)段人口分布進(jìn)行重疊,識(shí)別出重疊率高的危險(xiǎn)路段。左邊是進(jìn)城的路段中重合較高的部分、右邊是危險(xiǎn)品有大量聚集并停留較長(zhǎng)時(shí)間的區(qū)域,把這些路段與片區(qū)識(shí)別出來(lái),可以較好地預(yù)防一些危險(xiǎn)品的泄露、爆炸等事故,避免不必要的生命財(cái)產(chǎn)損失。
圖6 危險(xiǎn)品車輛出入城時(shí)段高重疊區(qū)(左);危險(xiǎn)品車集中地(右)
在設(shè)施評(píng)估案例里,我們對(duì)朝陽(yáng)區(qū)32個(gè)2、3級(jí)醫(yī)院開(kāi)展了就診人群分析,用醫(yī)院的到訪人口來(lái)源與分布情況,觀測(cè)京內(nèi)京外比重,看哪些醫(yī)院是受外地人歡迎。
圖7 千人床位指標(biāo)推算的理論覆蓋范圍(左);手機(jī)數(shù)據(jù)表示的實(shí)際覆蓋范圍(右)
傳統(tǒng)醫(yī)院的配給指標(biāo)是以一個(gè)區(qū)域的千人床位數(shù)來(lái)確定的,那我們可以根據(jù)這個(gè)指標(biāo)反推出一個(gè)醫(yī)院的理論覆蓋范圍,如圖7(左),但用人流數(shù)據(jù)可以更直觀的看到一個(gè)醫(yī)院的實(shí)際覆蓋范圍,如圖7(右)。通過(guò)對(duì)比,我們可以得到一些初步結(jié)論:一是四環(huán)以外的人口聚集區(qū)缺乏醫(yī)療設(shè)施的覆蓋;二是醫(yī)院的就診來(lái)源主要但不限于醫(yī)院周邊;三是某些外圍的衛(wèi)生設(shè)施如地壇醫(yī)院存在覆蓋范圍重疊浪費(fèi)的情況。
圖8 朝陽(yáng)區(qū)32個(gè)二、三級(jí)醫(yī)院評(píng)估
結(jié)合人口的本外地屬性,可以看到,中國(guó)醫(yī)學(xué)院腫瘤醫(yī)院的外地患者最多,占到了44%,而其他的醫(yī)院則逐次下降。
3.?dāng)?shù)據(jù)挖掘:深入理解現(xiàn)象背后的機(jī)制和規(guī)律
除通過(guò)數(shù)據(jù)分析了解現(xiàn)象本身,繼續(xù)探索現(xiàn)象背后發(fā)生的原因規(guī)律及內(nèi)在機(jī)制,在大量評(píng)價(jià)指標(biāo)中找出隱藏的規(guī)律,簡(jiǎn)單的方式如線性回歸,對(duì)于城市這樣非線性的復(fù)雜系統(tǒng),最基礎(chǔ)但有效的包括隨機(jī)森林等。以騎行行為挖掘?yàn)槔?,隨機(jī)森林模型展示了影響騎行軌跡分布權(quán)重較大的因素,主要包括道路長(zhǎng)度、功能興趣點(diǎn)POI 總數(shù)、道路適宜度水平、公交車站300米覆蓋路段長(zhǎng)等。
圖9 上海城市人口隨機(jī)森林模型
以上海城市人口結(jié)構(gòu)挖掘?yàn)槔?,隨機(jī)森林模型所示,影響上海年輕人分布權(quán)重較大的因素主要包括外地人口比重、最近軌道站點(diǎn)距離等。
表1 隨機(jī)森林各變量權(quán)重計(jì)算結(jié)果
最后,將利用仿真、模擬為主要手段,反向使用前述數(shù)據(jù)挖掘得到的結(jié)果,應(yīng)用所獲得的規(guī)律。通過(guò)改變某些指標(biāo)(對(duì)應(yīng)城市規(guī)劃或管理措施),使得決策樹(shù)的走向發(fā)生變化,也即開(kāi)展了一次政策預(yù)演,反復(fù)試算,使得我們可以基于隱含的規(guī)律對(duì)城市發(fā)展進(jìn)行大量的沙箱模擬,尋求政策工具的最佳組合。
因此自然而然地會(huì)觀察到,圍繞數(shù)據(jù)流開(kāi)展的這些工作,無(wú)論是處理非結(jié)構(gòu)化數(shù)據(jù)還是剖析非線性關(guān)系時(shí),我們都在嚴(yán)重地依賴算法作為工具。在數(shù)據(jù)時(shí)代,算法的價(jià)值怎么重視都不為過(guò)。
全社會(huì)廣義信息化需求將越來(lái)越旺盛。如果把上述數(shù)據(jù)流過(guò)程拓展到整個(gè)社會(huì)來(lái)觀察,會(huì)發(fā)現(xiàn)他們是相輔相成的,不同行業(yè)之間需要互相依賴彼此對(duì)數(shù)據(jù)的感知、測(cè)度、挖掘,最終實(shí)現(xiàn)整個(gè)社會(huì)的信息化和智能化。
圖10 城市規(guī)劃與運(yùn)行管理信息化
1.信息化系統(tǒng)
建設(shè)信息化系統(tǒng)體現(xiàn)為解決問(wèn)題的創(chuàng)造性、實(shí)踐性策略。主要強(qiáng)調(diào)三個(gè)原則,一是以人為本:同理用戶感觸、貼近用戶需求。二是模糊推進(jìn):在知識(shí)和能力的范圍上保留足夠彈性、充分嘗試。三是原型迭代:由粗略簡(jiǎn)易的原型開(kāi)始設(shè)計(jì)和實(shí)施,快速持續(xù)地進(jìn)行修正。
以呼市新城區(qū)居家養(yǎng)老服務(wù)體系為例,其涵蓋了政策法規(guī)、運(yùn)作機(jī)制、引導(dǎo)監(jiān)督機(jī)制、居家養(yǎng)老智慧管理平臺(tái)等內(nèi)容,以老年人需求為導(dǎo)向,社會(huì)服務(wù)力量整合,政府監(jiān)管體系為目標(biāo),提供多元化、專業(yè)化、高品質(zhì)的養(yǎng)老服務(wù)。
2.化系統(tǒng)實(shí)施
首先是需求分析。信息技術(shù)為養(yǎng)老精細(xì)化管理與精準(zhǔn)服務(wù)提供新的方法和手段,主要用戶面向政府、老人、服務(wù)單位。
圖11 呼市新城區(qū)居家養(yǎng)老服務(wù)體系需求分析
其次是定位與策略。我們認(rèn)為居家養(yǎng)老智慧管理平臺(tái)應(yīng)該實(shí)現(xiàn)連通政府各級(jí)部門(mén)、老人、服務(wù)單位等對(duì)象的基本能力,促使信息互通互聯(lián)、養(yǎng)老業(yè)務(wù)全過(guò)程留痕、線上線下有效互動(dòng),實(shí)現(xiàn)老年事務(wù)的聯(lián)動(dòng)管理、服務(wù)單位的監(jiān)督監(jiān)管、智慧養(yǎng)老決策支持等核心功能。
實(shí)施中利用軟硬件進(jìn)行整合支撐。以養(yǎng)老卡為核心載體,利用手機(jī)APP、信息查詢一體機(jī)、智能穿戴設(shè)備等各類線上線下手段,采集老人基本信息、為老交易、健康狀況等各類數(shù)據(jù),聯(lián)動(dòng)衛(wèi)計(jì)、民政等多個(gè)政府部門(mén)的業(yè)務(wù)數(shù)據(jù),實(shí)現(xiàn)老人數(shù)據(jù)的全面覆蓋和聯(lián)動(dòng)更新,在此基礎(chǔ)上合理實(shí)施技術(shù)架構(gòu),通過(guò)統(tǒng)一的底層數(shù)據(jù)庫(kù)支撐上層各類應(yīng)用系統(tǒng),采用模塊化的方式,后期可按照需求進(jìn)行功能的增減調(diào)整。
上線運(yùn)行、迭代維護(hù)。信息系統(tǒng)建設(shè)交付其實(shí)只是一個(gè)開(kāi)始,更加重要的是提供長(zhǎng)期的線上線下運(yùn)維服務(wù)。目前平臺(tái)初步實(shí)現(xiàn)了國(guó)家及各地的相關(guān)公開(kāi)數(shù)據(jù)的整合,為新城區(qū)居家養(yǎng)老服務(wù)體系建設(shè)提供參考;融合本地老年人各類健康數(shù)據(jù),全方位實(shí)時(shí)掌握老人健康信息;實(shí)現(xiàn)服務(wù)商信息的統(tǒng)計(jì)、審核、以及監(jiān)管,對(duì)服務(wù)商相關(guān)數(shù)據(jù)收集、分析;為政府部門(mén)對(duì)養(yǎng)老事業(yè)相關(guān)決策提供科學(xué)、客觀的數(shù)據(jù)支撐。
我們重新把視角聚焦在城市規(guī)劃與管理上,未來(lái)遠(yuǎn)景目標(biāo)是在規(guī)劃師個(gè)體認(rèn)知閉環(huán)的基礎(chǔ)上,完善城市發(fā)展相關(guān)業(yè)務(wù)智能化的閉環(huán)。
以決策咨詢?yōu)橐暯?,有兩個(gè)關(guān)鍵支撐點(diǎn),一方面是必須整合多源大數(shù)據(jù),數(shù)據(jù)可獲得性、維度、屬性決定了數(shù)據(jù)分析、信息化工作的基本面。另一方面是必須熟悉業(yè)務(wù)領(lǐng)域需求,應(yīng)該說(shuō)數(shù)據(jù)分析和挖掘的視角是多樣化的,而城市問(wèn)題又是如此復(fù)雜,需要識(shí)別并緊密圍繞領(lǐng)域內(nèi)的關(guān)鍵需求來(lái)工作,科學(xué)設(shè)計(jì)指標(biāo)體系,指導(dǎo)實(shí)施措施,在有限的數(shù)據(jù)分析結(jié)論中催生最大化的現(xiàn)實(shí)價(jià)值。
數(shù)據(jù)思維與實(shí)施思維并非是割裂的,更好的做法是把二者有機(jī)地結(jié)合在一起。數(shù)據(jù)思維可能比較陽(yáng)春白雪,進(jìn)行大數(shù)據(jù)分析,做各種酷炫的展示,屬于腦力勞動(dòng),但其實(shí)真正發(fā)揮作用的也許是一些不起眼的信息化項(xiàng)目、實(shí)干項(xiàng)目,姑且稱之為下里巴人。我正試圖在二者之間建立一種能夠相互促進(jìn)的正向反饋模式,未來(lái)肯定還需要大量的探索和完善。