孫軒 孫濤
摘? 要: 近年來,大數(shù)據(jù)在公共管理領(lǐng)域的應(yīng)用日趨增加,但由于缺乏理論指導(dǎo),其應(yīng)用決策往往無一定之規(guī)。相比于技術(shù)層面創(chuàng)新,思維方式變革在大數(shù)據(jù)時(shí)代更為重要。本質(zhì)上,公共大數(shù)據(jù)具有“廣泛記錄”和“有限描述”特性。為保證其利用的科學(xué)性、合理性和可靠性,在公共管理應(yīng)用決策中,應(yīng)建立4M思維:即通過微觀探究(Microscope),發(fā)掘數(shù)據(jù)的內(nèi)在價(jià)值;憑借復(fù)合利用(Mixability),提升數(shù)據(jù)的知識(shí)挖掘廣度;以語義為導(dǎo)向(Meaning),實(shí)現(xiàn)數(shù)據(jù)與應(yīng)用的有效結(jié)合;采用多維分析(Multidimension),保證數(shù)據(jù)應(yīng)用結(jié)論的有效性。在分析的基礎(chǔ)上,結(jié)合北京市交通治理的實(shí)踐,對大數(shù)據(jù)的應(yīng)用思維進(jìn)一步詮釋。
關(guān)鍵詞: 大數(shù)據(jù);公共管理;4M思維;應(yīng)用決策;治理能力
中圖分類號(hào): D035? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?文章編號(hào):1009-3176(2019)01-056-(10)
作為信息化和數(shù)字化技術(shù)高速發(fā)展的產(chǎn)物,大數(shù)據(jù)正深刻地影響著人們社會(huì)、經(jīng)濟(jì)生活的方方面面。如今,借助OA、ERP以及在此基礎(chǔ)上發(fā)展起來的各類數(shù)字化應(yīng)用系統(tǒng),企業(yè)和政府的所有經(jīng)營、管理活動(dòng)可以被實(shí)時(shí)記錄;利用教育、醫(yī)療、社保等網(wǎng)絡(luò)共享平臺(tái),居民全生命周期的個(gè)人信息能夠被完整保存;而通過傳感器、物聯(lián)網(wǎng)和UGC(User Generated Content)網(wǎng)絡(luò)資源,社會(huì)、經(jīng)濟(jì)、文化等多方面的特征參數(shù)和輔助信息也不斷得以豐富和更新。這些數(shù)據(jù)都為物理世界和非物理世界的描述、分析、理解和管理提供了多維度、詳盡的數(shù)據(jù)資料[1],并推動(dòng)管理學(xué)科朝著科學(xué)化、智慧化的方向發(fā)展[2][3]。
從其所產(chǎn)生的價(jià)值效應(yīng)來看,在某種程度上可以說,大數(shù)據(jù)是當(dāng)前先進(jìn)生產(chǎn)力的體現(xiàn)。它既是一種現(xiàn)象,也涉及一系列相關(guān)技術(shù),更需要新的研究范式和思維方式與之相適應(yīng)[4]。近年來,大數(shù)據(jù)在公共管理領(lǐng)域的應(yīng)用越來越多[5],從國家到地方,都在積極探索數(shù)據(jù)治理的體系架構(gòu)[6]、政策法規(guī)[7]和應(yīng)用方法[8]。但現(xiàn)有的研究成果通常只能為政府部門的特定業(yè)務(wù)提供技術(shù)方案和案例參考。因此,大部分政府公職人員對于大數(shù)據(jù)的認(rèn)識(shí)仍然停留在其表面特征,現(xiàn)實(shí)工作中技術(shù)與方法的學(xué)習(xí)、模仿遠(yuǎn)大于數(shù)據(jù)資源的有效利用。一方面,日益復(fù)雜的經(jīng)濟(jì)、社會(huì)環(huán)境對公共管理提出了越來越高的要求,各個(gè)部門都希望通過大數(shù)據(jù)的分析、挖掘提升應(yīng)用決策的科學(xué)性;另一方面,大量公共數(shù)據(jù)被存儲(chǔ)在政府的數(shù)據(jù)庫中,卻往往難以得到充分、有效利用,有的甚至因?yàn)槿狈?yīng)用需求而被直接清除或動(dòng)態(tài)覆蓋。究其原因,傳統(tǒng)的數(shù)據(jù)思維方式已經(jīng)無法滿足大數(shù)據(jù)時(shí)代公共管理應(yīng)用決策的需要。
一、大數(shù)據(jù)的應(yīng)用挑戰(zhàn)
隨著應(yīng)用的深入,研究學(xué)者和工程專家從不同角度對大數(shù)據(jù)進(jìn)行定義,提出了3V(Volume、Velocity、Variety)、4V(3V + Value)、5V(4V + Veracity)等一系列特征描述框架[9]。其中,4V在各領(lǐng)域得到最為廣泛的認(rèn)同,被認(rèn)為是大數(shù)據(jù)不同于傳統(tǒng)數(shù)據(jù)資料的本質(zhì)特征。一直以來,無論是數(shù)據(jù)收集、整理,還是分析、應(yīng)用,對于大數(shù)據(jù)的研究和探討,大多圍繞其4V特征展開,嘗試從技術(shù)層面解決現(xiàn)實(shí)工作中所面臨的復(fù)雜問題[10]。然而,以數(shù)據(jù)處理能力提升和計(jì)算方法創(chuàng)新為導(dǎo)向的思路,往往容易陷入技術(shù)陷阱,并產(chǎn)生許多脫離實(shí)際的錯(cuò)誤,特別是在人文社會(huì)科學(xué)和公共管理領(lǐng)域,例如:對政治傾向的錯(cuò)誤預(yù)測,對疾病發(fā)病率的高估,對災(zāi)害影響的失效描述[11]。大數(shù)據(jù)在創(chuàng)造機(jī)遇的同時(shí),也給管理和應(yīng)用帶來了諸多挑戰(zhàn)。
1.體量增長與價(jià)值提升
體量大小通常被看作是表征數(shù)據(jù)資源豐富程度的最重要參考指標(biāo)。從TB(萬億字節(jié))到PB(千萬億字節(jié)),甚至是EB(百億億字節(jié)),日趨完善、多樣的數(shù)據(jù)收集體系和信息平臺(tái)使我們能夠獲得的數(shù)據(jù)資料比以往任何時(shí)期都要多。由IBM2011年的統(tǒng)計(jì)結(jié)果可知,我們每天都可以創(chuàng)造出超過2.5EB的新數(shù)據(jù)。根據(jù)Human Face of big data于2012年發(fā)布的項(xiàng)目報(bào)告,F(xiàn)acebook每天會(huì)產(chǎn)生300億條以上的信息記錄,Youtube上每分鐘都會(huì)新增時(shí)長達(dá)48小時(shí)的視頻資料并帶來每天40億的瀏覽量,Google每天處理超過20PB的信息請求。而在我國,百度2015年收錄的網(wǎng)頁數(shù)量也已超過一萬億張,每天響應(yīng)中國網(wǎng)民請求達(dá)幾十億次;阿里集團(tuán)擁有近千PB的數(shù)據(jù),日處理數(shù)據(jù)量等同于幾千個(gè)國家圖書館信息總量之和;騰訊數(shù)據(jù)中心存儲(chǔ)的數(shù)據(jù)總量超過1000PB,且日均數(shù)據(jù)增速達(dá)500TB;據(jù)九次方大數(shù)據(jù)創(chuàng)始人王參壽描述,我國全國的政府?dāng)?shù)據(jù)加起來實(shí)際已有數(shù)百甚至上千個(gè)阿里的數(shù)據(jù)體量。
然而,數(shù)據(jù)量的增長并不能完全代表其內(nèi)在價(jià)值的提升。特別是,當(dāng)我們面對的是復(fù)雜、異構(gòu)、無序的大數(shù)據(jù)集時(shí),信息理解和知識(shí)發(fā)現(xiàn)的成本已遠(yuǎn)遠(yuǎn)超過了通過統(tǒng)計(jì)匯總和抽樣調(diào)查所獲得的小數(shù)據(jù)。從應(yīng)用角度看,雖然數(shù)據(jù)的準(zhǔn)確性、有效性和完整性在整體上決定了其分析結(jié)果的合理性,但當(dāng)數(shù)據(jù)規(guī)模達(dá)到一定程度時(shí)其分析利用的投資收益往往會(huì)隨著數(shù)據(jù)量的進(jìn)一步增加而急劇降低[12];而從數(shù)據(jù)共享角度看,盡管各級(jí)政府都在努力推動(dòng)部門間數(shù)據(jù)的互聯(lián)互通以及各領(lǐng)域大數(shù)據(jù)的開放與利用,卻由于數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、結(jié)構(gòu)化不足、語義缺失,其實(shí)際應(yīng)用范圍、使用效率和產(chǎn)生的社會(huì)、經(jīng)濟(jì)價(jià)值都受到嚴(yán)重制約[13]。為了保證數(shù)據(jù)的可用性,提高其價(jià)值密度和使用效率,很多時(shí)候有必要對原始數(shù)據(jù)進(jìn)行適當(dāng)清洗、整理和提煉,將粗放的數(shù)據(jù)資源轉(zhuǎn)化為高質(zhì)量的數(shù)據(jù)資產(chǎn)[14]。
2.技術(shù)革新與模式轉(zhuǎn)變
面對海量、多樣化、快速更新的大數(shù)據(jù),公共管理輔助決策的信息應(yīng)用技術(shù)和手段正在產(chǎn)生巨大變革[15]。隨著各單位間溝通與協(xié)作的加強(qiáng),跨領(lǐng)域的數(shù)據(jù)互通與共享越來越多,過去廣泛使用的關(guān)系型數(shù)據(jù)庫逐漸被Hadoop、NoSQL數(shù)據(jù)系統(tǒng)所取代,靈活、網(wǎng)絡(luò)化的數(shù)據(jù)中心和云計(jì)算平臺(tái)成為政府大數(shù)據(jù)存儲(chǔ)、管理的基礎(chǔ)。針對復(fù)雜的數(shù)據(jù)類型、全新的現(xiàn)實(shí)問題,習(xí)慣于使用統(tǒng)計(jì)表格對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化整理與匯總的信息部門,在新時(shí)期不得不開始嘗試借助R、Phython、GIS(GeographicInformation System)或各類專業(yè)化應(yīng)用系統(tǒng)進(jìn)行多層面的數(shù)據(jù)分析,以提升數(shù)據(jù)認(rèn)知和理解的深度。特別是那些直接參與城市運(yùn)營的政府機(jī)構(gòu),如今也不再滿足于傳統(tǒng)的程序化處理機(jī)制,而是更多地通過引入智能化輔助決策系統(tǒng),基于實(shí)時(shí)的數(shù)據(jù)收集能力和高效的可視化監(jiān)測手段,對轄區(qū)環(huán)境、事務(wù)和突發(fā)狀況進(jìn)行動(dòng)態(tài)管理。
但是,大數(shù)據(jù)帶來的不僅僅是技術(shù)手段的革新,數(shù)據(jù)分析方法和利用方式轉(zhuǎn)變對于管理決策制定具有更為重要的意義[16]。從量化指標(biāo)的比較到數(shù)據(jù)壓縮與融合、從公式計(jì)算到變量間的泛在關(guān)聯(lián),各領(lǐng)域應(yīng)用在進(jìn)行數(shù)據(jù)分析時(shí)已不再單純強(qiáng)調(diào)理論模型的科學(xué)性,而是日益關(guān)注于數(shù)據(jù)本身的加工、處理和信息表達(dá)。例如,進(jìn)行智慧交通管理,需要以數(shù)據(jù)所反映的動(dòng)態(tài)交通現(xiàn)象為基礎(chǔ)進(jìn)行道路流量預(yù)測和復(fù)雜網(wǎng)絡(luò)控制[17];實(shí)現(xiàn)網(wǎng)絡(luò)社會(huì)的數(shù)字化治理,關(guān)鍵在于識(shí)別信息流通的復(fù)雜結(jié)構(gòu)特征和核心節(jié)點(diǎn)間的連接關(guān)系[18];而在公共政策分析方面,只有從具體語境出發(fā)對不同數(shù)據(jù)集進(jìn)行闡釋,才能有效理解和推斷多利益群體、多階層的行為反應(yīng),明確執(zhí)行過程中的潛在影響和問題[19]。知識(shí)既來源于數(shù)據(jù)又作用于數(shù)據(jù),圍繞流動(dòng)性強(qiáng)、碎片化、不規(guī)則且來源各異的數(shù)據(jù)資料,從實(shí)證視角對事物的共性規(guī)律和個(gè)性特征進(jìn)行探索成為大數(shù)據(jù)分析、應(yīng)用的關(guān)鍵。
3.數(shù)據(jù)挖掘與事務(wù)管理
為了發(fā)現(xiàn)大數(shù)據(jù)背后的潛藏價(jià)值,數(shù)據(jù)挖掘在當(dāng)下得到了前所未有的關(guān)注。越來越多的大數(shù)據(jù)應(yīng)用嘗試通過不同方式的數(shù)據(jù)解譯和時(shí)間、空間維度的深入剖析,對已知經(jīng)驗(yàn)與未知問題進(jìn)行驗(yàn)證和說明[20]。不同于簡單的統(tǒng)計(jì)描述與比較,數(shù)據(jù)挖掘往往更關(guān)注于研究對象的組成結(jié)構(gòu)、變化規(guī)律和關(guān)聯(lián)關(guān)系。采用聚類分析或機(jī)器學(xué)習(xí)手段對數(shù)據(jù)樣本的個(gè)體屬性與群體特質(zhì)進(jìn)行研究,能夠了解相關(guān)事物的系統(tǒng)構(gòu)成和基本模式;憑借函數(shù)擬合與特征識(shí)別方法,對數(shù)據(jù)的變化和差異進(jìn)行分析,可以有效認(rèn)知事物的發(fā)生、發(fā)展規(guī)律;通過對數(shù)據(jù)間的關(guān)聯(lián)關(guān)系進(jìn)行細(xì)致探討,我們能找出現(xiàn)象的產(chǎn)生原因和影響因素,并在此基礎(chǔ)上更好地理解事物的相互作用機(jī)制[21]。而除此之外,可視化作為一種更加靈活、綜合的數(shù)據(jù)挖掘手段,如今也被廣泛運(yùn)用于社會(huì)科學(xué)領(lǐng)域的各項(xiàng)實(shí)踐活動(dòng)中[22]。
不過,大數(shù)據(jù)應(yīng)用絕不是純粹的科學(xué)計(jì)算與研究,其實(shí)際價(jià)值應(yīng)更多地體現(xiàn)于事務(wù)管理的改革創(chuàng)新[23]。公共管理在逐漸走向精細(xì)化、現(xiàn)代化、智能化的過程中,公眾需求理解、資源優(yōu)化配置、應(yīng)急動(dòng)態(tài)響應(yīng)等方面都存在著大量的復(fù)雜問題[24]。雖然大數(shù)據(jù)的重要性近年來一再得到認(rèn)可,但供給與需求對接不暢、理論支撐不足、應(yīng)用框架缺失使得基層的數(shù)字化治理往往“名過其實(shí)”,許多有價(jià)值的數(shù)據(jù)得不到充分利用。以應(yīng)用為導(dǎo)向,如何將大數(shù)據(jù)分析融入公共部門的日常工作,實(shí)現(xiàn)問題探索與治理實(shí)踐的統(tǒng)一,切實(shí)提升基礎(chǔ)設(shè)施運(yùn)行效率和民生服務(wù)質(zhì)量、保障社會(huì)安全、改善生活環(huán)境,是各級(jí)地方政府所面臨的巨大挑戰(zhàn)。
二、公共大數(shù)據(jù)的本質(zhì)
公共數(shù)據(jù)涉及經(jīng)濟(jì)、文化、教育、公安、交通、醫(yī)療、衛(wèi)生、就業(yè)、社保、環(huán)境等眾多領(lǐng)域。它既包括政府因工作開展而產(chǎn)生和采集的業(yè)務(wù)數(shù)據(jù),也包括與公共管理實(shí)踐相關(guān)的各類外部網(wǎng)絡(luò)數(shù)據(jù)。相比純粹的商業(yè)數(shù)據(jù)和科學(xué)數(shù)據(jù),其來源更豐富、復(fù)雜性更強(qiáng)、應(yīng)用更多元化,而且與日常生活的關(guān)系更加密切。在大數(shù)據(jù)時(shí)代,公共數(shù)據(jù)收集的途徑、方式和速度與過去相比有著巨大差異,不僅數(shù)據(jù)量急劇增加,而且數(shù)據(jù)內(nèi)涵也發(fā)生了深刻變化。
1.廣泛記錄
數(shù)據(jù)的本質(zhì)是記錄。在數(shù)字化手段和信息化技術(shù)還不夠發(fā)達(dá)的時(shí)期,人們往往只能通過抽樣調(diào)查方法,對部分典型或特殊事物在特定時(shí)段的狀態(tài)進(jìn)行有針對性的記錄。由此獲得的傳統(tǒng)數(shù)據(jù)雖然也具有一定代表性,但相對于現(xiàn)實(shí)世界的復(fù)雜情況,卻是不全面、不完整、不連續(xù)的。與之相比,大數(shù)據(jù)所記錄的內(nèi)容則要更為廣泛。
一方面,大數(shù)據(jù)屬于強(qiáng)細(xì)節(jié)記錄(Full-detailed)。過去那些用于反映經(jīng)濟(jì)、社會(huì)生活中各種現(xiàn)象和事件的抽象指標(biāo)參數(shù)正在被一系列直觀的數(shù)字檔案所取代。這些數(shù)字檔案不再僅僅聚焦于個(gè)別感興趣的對象,而是力圖對整個(gè)場景進(jìn)行細(xì)致刻畫。例如,安裝在各個(gè)交通路口的攝像頭不僅記錄了該位置通過的車輛信息,也記錄了車輛通過時(shí)刻的路況環(huán)境;網(wǎng)絡(luò)電商的交易數(shù)據(jù),不僅記錄最終的交易金額,也記錄了買賣雙方交易事前、事中和事后的交流內(nèi)容;各大醫(yī)院保存的電子病歷,不僅包括病人的診斷結(jié)果,也涉及其病發(fā)癥狀、應(yīng)診醫(yī)生、醫(yī)療處方和后續(xù)療程。
另一方面,大數(shù)據(jù)傾向于全樣本記錄(Full-sampled)。隨著傳感器、物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)等技術(shù)手段的廣泛應(yīng)用,公共數(shù)據(jù)的收集能力相比過去得到了大幅提高,其關(guān)注對象也不再限于群體集合或少數(shù)個(gè)體,而是針對集合中的每一個(gè)組成單元。利用號(hào)牌識(shí)別和ETC技術(shù),我們可以了解通過特定路口的每一輛車,而不僅僅是記錄通行的車輛數(shù)目;借助信用卡、一卡通等帶有身份標(biāo)識(shí)的消費(fèi)工具,每個(gè)人在購買商品或服務(wù)的過程中,其社會(huì)、經(jīng)濟(jì)活動(dòng)可以被有效記錄;而通過GPS和手機(jī)信令的空間定位信息,每一部正在使用手機(jī)的當(dāng)前位置也都能夠被實(shí)時(shí)掌握。
與此同時(shí),大數(shù)據(jù)往往是全周期記錄(Full-period)。在數(shù)字化管理體系下,數(shù)據(jù)的產(chǎn)生和收集已成為日常工作的重要組成部分。伴隨著公共服務(wù)提供和公共事務(wù)辦理的過程,一系列相關(guān)數(shù)據(jù)得以不斷更新。如今,我們能夠獲得的不單單是代表事物當(dāng)前狀態(tài)的片段數(shù)據(jù),而是反映其變化和發(fā)展的完整歷史軌跡。比如,通過連續(xù)的空氣質(zhì)量監(jiān)測,各城市能夠了解其近一周、一月、一年甚至多年的大氣環(huán)境狀況;基于出租車、鐵路和航空公司的銷售運(yùn)營記錄,城市內(nèi)和城際間每天、每周、每月乃至每年的人流情況都可以被清晰地反映;而根據(jù)公交車乘坐、公共自行車租賃和水、電、氣等生活必需品的使用記錄,政府能夠掌握公共資源在不同時(shí)段的使用需求。
大數(shù)據(jù)的廣泛記錄背后充斥著海量信息。海量信息在給公共管理帶來眾多潛在應(yīng)用的同時(shí),卻也給每一個(gè)應(yīng)用的信息利用帶來了巨大的認(rèn)知負(fù)擔(dān)。針對具體的管理實(shí)踐需求,我們往往只關(guān)注大數(shù)據(jù)所反映的某些特定現(xiàn)象和問題,而其絕大部分內(nèi)容則會(huì)被認(rèn)為是“無效信息”和“暗數(shù)據(jù)”[25]。
2.有限描述
數(shù)據(jù)的應(yīng)用目標(biāo)在于描述。為了清晰、有效、準(zhǔn)確地描述特定問題、現(xiàn)象和規(guī)律,過去我們制定了許多標(biāo)準(zhǔn)化的數(shù)據(jù)收集、整理和分析流程,以獲得盡可能可靠的小數(shù)據(jù)。與之相比,大數(shù)據(jù)雖然蘊(yùn)藏著更多信息,但很多時(shí)候它只能對事物進(jìn)行有限描述。
一方面,大數(shù)據(jù)的描述具有表面性(Superficial)。不同于傳統(tǒng)的社會(huì)調(diào)查和調(diào)研數(shù)據(jù),以計(jì)算機(jī)技術(shù)為支撐和以自動(dòng)化數(shù)據(jù)采集、整理為主導(dǎo)的大數(shù)據(jù),通常只是對于所發(fā)生事物的現(xiàn)象進(jìn)行描述,而難以深入其本質(zhì)?,F(xiàn)象與現(xiàn)象之間,通過統(tǒng)計(jì)計(jì)算歸納出的泛相關(guān)性,也僅能說明一些表面問題,無法科學(xué)地闡釋其內(nèi)在機(jī)理。面對啤酒與尿布的關(guān)聯(lián)、男性內(nèi)褲與經(jīng)濟(jì)形勢的聯(lián)系、女服務(wù)員顏值與股市波動(dòng)的關(guān)系、不同星座人群的性格特點(diǎn),雖然我們都能夠從數(shù)據(jù)中找出一些規(guī)律,并嘗試從不同角度給出看似合理的解釋,但其真實(shí)原因及影響過程卻始終不得而知。
另一方面,大數(shù)據(jù)的描述存在有偏性(Biased)。如今,企事業(yè)單位和政府機(jī)構(gòu)的數(shù)據(jù)獲取能力越來越強(qiáng),通過各種渠道所獲得的每一個(gè)數(shù)據(jù)集都足夠大。但由于業(yè)務(wù)領(lǐng)域的區(qū)別、觀察視角的不同、用戶群體的差異,其數(shù)據(jù)描述實(shí)際上只能代表特定情況、特定方面或特定人群,而并非對普適規(guī)律的系統(tǒng)詮釋。例如:通過對社交媒體數(shù)據(jù)進(jìn)行跟蹤分析,我們能夠了解公眾對各類事件的網(wǎng)絡(luò)輿情變化,但用戶的線上活動(dòng)很多時(shí)候并不能完全反映其真實(shí)想法和線下行為;司機(jī)的駕駛習(xí)慣對車輛保險(xiǎn)的定額有著重要參考價(jià)值,然而個(gè)人交通事故的發(fā)生率還與其視力水平、身體狀況、所駕車輛、行駛路線等內(nèi)容有著密切關(guān)系;滴滴打車雖然能夠通過對出租車的行駛軌跡進(jìn)行數(shù)據(jù)挖掘,理解居民在不同時(shí)段的乘車出行模式,卻無法涵蓋通過公交、地鐵出行人群的行為選擇。
另外,大數(shù)據(jù)的描述還缺乏精確性(Inaccurate)。在這個(gè)數(shù)據(jù)爆炸的時(shí)代,快速的更新頻率和錯(cuò)綜復(fù)雜的來源,都給數(shù)據(jù)的精度控制和評(píng)定帶來了極大困難。特別是那些基于網(wǎng)絡(luò)開放平臺(tái)所獲得的大數(shù)據(jù),很多時(shí)候,我們根本無法對其誤差和真實(shí)性進(jìn)行有效估量與驗(yàn)證。以中關(guān)村在線、搜房網(wǎng)、汽車之家為代表的交易門戶網(wǎng)站,雖然能夠提供相關(guān)領(lǐng)域商品的一系列資訊數(shù)據(jù),但其數(shù)據(jù)的采集方式、計(jì)算方法都不得而知;以大眾點(diǎn)評(píng)、口碑網(wǎng)為代表的眾源信息平臺(tái),盡管為事物認(rèn)知提供了豐富的資料描述,但該類數(shù)據(jù)在語義表達(dá)方面卻存在巨大的模糊性;對于論壇、貼吧、微博等自媒體數(shù)據(jù)而言,網(wǎng)絡(luò)水軍的廣泛存在,也使得其實(shí)際參考價(jià)值大打折扣。
大數(shù)據(jù)并不能完美地解決所有問題,其有限描述能力給應(yīng)用實(shí)踐帶來了一定風(fēng)險(xiǎn)。但不可否認(rèn),它為我們了解現(xiàn)實(shí)世界開辟了一個(gè)全新的視角[26]。在DT時(shí)代,尋求答案不能僅依靠簡單的量化計(jì)算,而是要在充分認(rèn)識(shí)大數(shù)據(jù)的價(jià)值和不足基礎(chǔ)上,對其進(jìn)行有效利用。
三、應(yīng)用決策的4M思維
作為政府公職行使的主要形式和政策制定的基礎(chǔ),應(yīng)用決策在公共管理實(shí)踐中具有重要意義[27]。高效的公共服務(wù)應(yīng)用離不開合理的數(shù)據(jù)分析,而科學(xué)的決策制定過程也需要依靠充分的數(shù)據(jù)支撐。為了提升公共管理質(zhì)量,保證應(yīng)用決策的可靠性,面對大數(shù)據(jù)的廣泛記錄和有限描述能力,其數(shù)據(jù)利用的思維方式必須進(jìn)行相應(yīng)轉(zhuǎn)變。
1.微觀探究(Microscope)
受到計(jì)算機(jī)技術(shù)發(fā)展和人類認(rèn)知能力制約,各級(jí)政府機(jī)構(gòu)和機(jī)關(guān)單位長期以來習(xí)慣于通過宏觀分析了解事物的當(dāng)前狀況和歷史變化,并在此基礎(chǔ)上總結(jié)歸納其發(fā)生、發(fā)展規(guī)律。所使用的數(shù)據(jù)大多嚴(yán)重缺乏微觀細(xì)節(jié);即便通過特殊手段進(jìn)行詳盡的數(shù)據(jù)收集,經(jīng)過一層層匯集、整理,最終也轉(zhuǎn)化為一目了然的指標(biāo)參數(shù)。匯總數(shù)據(jù)固然簡潔、明了,但同時(shí)也丟失了許多對于應(yīng)用決策而言極為重要的參考信息。它不僅無法對事物的不同組成部分進(jìn)行細(xì)致刻畫,也不能對其描述內(nèi)容進(jìn)行深入剖析,清晰說明相關(guān)分項(xiàng)指標(biāo)對最終數(shù)據(jù)的影響,更難以明確知道該數(shù)據(jù)在不同情況下的差異和變化。
隨著經(jīng)濟(jì)、社會(huì)發(fā)展與改革的推進(jìn),數(shù)據(jù)的深度理解對于保障應(yīng)用決策的合理性具有越來越重要的意義。很多復(fù)雜問題的解決有賴于細(xì)致的數(shù)據(jù)分析,而大數(shù)據(jù)的強(qiáng)細(xì)節(jié)、全樣本和全周期記錄特性則為事物的微觀探究創(chuàng)造了先決條件?;谡Z境的數(shù)據(jù)統(tǒng)計(jì)與比較,可以為現(xiàn)象理解提供更完整的信息[28];從個(gè)體出發(fā)的數(shù)據(jù)描述與多層次綜合,能夠?yàn)橐?guī)律發(fā)現(xiàn)提供更系統(tǒng)的知識(shí)[29];而完整、有效的時(shí)序分析與模擬仿真,則為我們認(rèn)識(shí)事物的變化過程和機(jī)制提供了更加科學(xué)的手段[30]。無論是政策分析、社會(huì)治理,還是資源優(yōu)化與應(yīng)急處置,數(shù)據(jù)的分析與利用已不能僅僅停留在宏觀層面,只有在微觀視角下對問題的本質(zhì)進(jìn)行探討,才能充分發(fā)掘大數(shù)據(jù)的內(nèi)在價(jià)值。
2.復(fù)合利用(Mixability)
面對制度化、標(biāo)準(zhǔn)化的日常工作,政府部門的數(shù)據(jù)使用往往具有極強(qiáng)的獨(dú)立性和針對性。各單位在對具體事務(wù)進(jìn)行分析和處理時(shí),都習(xí)慣基于自身的應(yīng)用體系和流程進(jìn)行封閉式的信息整理,而較少考慮數(shù)據(jù)的多重價(jià)值以及數(shù)據(jù)與數(shù)據(jù)之間的潛在聯(lián)系。然而,對于包含豐富細(xì)節(jié)的大數(shù)據(jù)來說,傳統(tǒng)的單通道數(shù)據(jù)解讀與應(yīng)用不僅難以滿足復(fù)雜事物認(rèn)知和現(xiàn)象理解的現(xiàn)實(shí)需求,而且也是對信息資源的極大浪費(fèi)。同一份數(shù)據(jù),采用不同手段、從不同層面進(jìn)行分析和探討,可以獲得多樣、系統(tǒng)的知識(shí);各部門所收集和掌握的數(shù)據(jù)資料,不僅對其自身的業(yè)務(wù)開展具有重要意義,很多時(shí)候也有利于其他相關(guān)單位的資源規(guī)劃、配置與調(diào)度、管理。
大數(shù)據(jù)對于應(yīng)用決策的支持,不只體現(xiàn)在問題探究的深度上,也反映于其知識(shí)挖掘的廣度。廣泛記錄所帶來的多元信息,決定了大數(shù)據(jù)分析方式和使用過程的復(fù)合性。對數(shù)據(jù)的信息利用,并不局限于個(gè)別問題的解決,更多的是通過時(shí)序關(guān)聯(lián)、業(yè)務(wù)關(guān)聯(lián)和知識(shí)關(guān)聯(lián),實(shí)現(xiàn)不同應(yīng)用場景下的形勢判斷與發(fā)展預(yù)測[31]。由于內(nèi)容的開放性和可重用性,大數(shù)據(jù)的計(jì)算框架正從過去的“以流程為中心”轉(zhuǎn)變?yōu)椤耙詳?shù)據(jù)為中心”[32],從強(qiáng)調(diào)數(shù)據(jù)的保密和自主管理逐漸過渡到注重其在線應(yīng)用與互操作[33]??紤]到數(shù)據(jù)外部關(guān)聯(lián)所帶來的乘數(shù)效應(yīng),跨領(lǐng)域互通與共享被認(rèn)為是大數(shù)據(jù)價(jià)值放大的有效途徑,而“塊數(shù)據(jù)”的推廣與應(yīng)用則能夠進(jìn)一步為數(shù)據(jù)復(fù)合和信息流動(dòng)奠定基礎(chǔ)[34]。
3.語義導(dǎo)向(Meaning)
不同于直觀、明確的小數(shù)據(jù),大數(shù)據(jù)由于內(nèi)容描述的表面性,其分析、處理過程通常離不開隱含信息的挖掘和語義屬性的探討。相比數(shù)據(jù)本身的變化、差異和量化特征,其價(jià)值更多地應(yīng)體現(xiàn)于對內(nèi)容和結(jié)果的應(yīng)用解釋[35]。對于文本數(shù)據(jù)而言,傳統(tǒng)的詞頻統(tǒng)計(jì)方法僅能揭示語料記錄的關(guān)注重點(diǎn),只有通過句法解析和語境理解才可以明確其表述的真實(shí)含義和背后所反映的情感、態(tài)度;多媒體數(shù)據(jù)的挖掘,不能僅依靠資料的分類組織與整理,如果缺乏深入、有效的語義標(biāo)注和索引,大量有價(jià)值的信息將埋沒于復(fù)雜、異構(gòu)的數(shù)據(jù)文件中而難以被利用;即便是數(shù)值數(shù)據(jù)的分析與應(yīng)用,離開了知識(shí)推理與語義論證,其參數(shù)計(jì)算最多也只能反映一些表面現(xiàn)象,而無法說明現(xiàn)實(shí)世界的事物本質(zhì)與客觀規(guī)律。
從數(shù)據(jù)選擇、加工到存儲(chǔ)、管理與分發(fā)、利用,語義在基于大數(shù)據(jù)應(yīng)用決策的整個(gè)流程中起到了越來越重要的作用,它既是數(shù)據(jù)和應(yīng)用之間的黏合劑,也是信息融合與知識(shí)創(chuàng)新的基礎(chǔ)。語義場景的構(gòu)建、語義內(nèi)涵的闡釋、語義關(guān)系的剖析日益成為大數(shù)據(jù)分析、探索的關(guān)鍵。為了提高大數(shù)據(jù)的應(yīng)用效率,保證信息的合理、有效利用,一方面,需要根據(jù)數(shù)據(jù)的語義內(nèi)涵對其進(jìn)行結(jié)構(gòu)化、標(biāo)簽化處理,將隱含信息顯性、規(guī)范地表達(dá)出來,以滿足大規(guī)模計(jì)算和機(jī)器學(xué)習(xí)的現(xiàn)實(shí)要求[36];另一方面,還要考慮事物間的內(nèi)在關(guān)聯(lián),依據(jù)本體論、知識(shí)圖譜和語義網(wǎng),圍繞實(shí)際應(yīng)用構(gòu)建具有針對性的語義計(jì)算框架,實(shí)現(xiàn)從表層感知到深入理解[37]、從被動(dòng)響應(yīng)到智慧服務(wù)[38]的價(jià)值過渡和升華。
4.多維分析(Multidimension)
大數(shù)據(jù)雖然為我們了解現(xiàn)實(shí)世界提供了更多精細(xì)、完整的記錄資料,但面對復(fù)雜的內(nèi)、外部環(huán)境,有偏性和不精確的內(nèi)容描述卻使得其分析結(jié)果的真實(shí)性和可信度大打折扣。使用大數(shù)據(jù)對事物進(jìn)行探索,就好比“盲人摸象”,通過單一視角或依靠單一數(shù)據(jù)源所得出的結(jié)論通常都難以全面、準(zhǔn)確地反映其實(shí)際情況和變化規(guī)律[39]。從現(xiàn)有的眾多應(yīng)用來看,數(shù)據(jù)本身的代表性問題往往是一系列誤差的主要來源。與此同時(shí),在對事物的當(dāng)前狀態(tài)進(jìn)行量化評(píng)價(jià)時(shí),由于其多維度的外在表現(xiàn)形式,僅依據(jù)某類屬性特征進(jìn)行比較和判斷,相應(yīng)結(jié)論必然會(huì)有所偏頗;基于歷史數(shù)據(jù)對事件的發(fā)展過程進(jìn)行推演和預(yù)測,也非常容易因?yàn)橄嗨茦颖居邢藓驼T導(dǎo)因素的多樣化,導(dǎo)致最終結(jié)果存在較大的不確定性。
在推動(dòng)國家治理體系和治理能力現(xiàn)代化的發(fā)展背景下,“尋數(shù)治理”需要通過不同視角的補(bǔ)充、完善和相互印證,盡量避免數(shù)據(jù)利用過程中的無效探討和由此造成的錯(cuò)誤決策。在大數(shù)據(jù)收集方面,采用不同方式獲得的數(shù)據(jù)越多,對事物的描述往往越接近其真實(shí)狀態(tài)[40];在數(shù)據(jù)計(jì)算方面,借助多源數(shù)據(jù)的交叉比較與融合糾正,能夠使系統(tǒng)誤差得以科學(xué)評(píng)估與有效控制[41];而在數(shù)據(jù)內(nèi)容的表達(dá)方面,則可充分利用可視化仿真、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等全方位展示手段,最大限度提高應(yīng)用決策者的信息綜合能力[42]。從“全息感知”到立體化理解,從單一標(biāo)簽到多層面畫像,大數(shù)據(jù)分析維度增加帶來的不僅僅是數(shù)量上的變化,更是應(yīng)用決策質(zhì)量的躍升。
四、4M思維在北京市交通治理中的實(shí)踐探索
交通擁堵是當(dāng)前各大城市公共治理過程中普遍面臨的難題。地方交管部門雖然采用特定的車流限制和疏導(dǎo)措施,也出臺(tái)了一系列相關(guān)政策,但過高的人口密度、逐年攀升的汽車保有量和巨大的區(qū)域通勤壓力使得城市“車-路矛盾”始終難以得到有效解決,并由此帶來了包括環(huán)境污染在內(nèi)的諸多經(jīng)濟(jì)、社會(huì)問題。而借助大數(shù)據(jù),我們可以在有限條件下盡可能地提高城市治理水平,改善道路通行環(huán)境、完善城市功能系統(tǒng)。
相比全國其他城市,北京市的交通數(shù)據(jù)積累和應(yīng)用探索都比較超前,其實(shí)踐經(jīng)驗(yàn)具有很強(qiáng)的參考、借鑒意義。在沒有先進(jìn)的數(shù)據(jù)獲取手段下,早在1986年,北京就開始開展軍民出行調(diào)查,詳細(xì)記錄每一戶當(dāng)天的出行日志;2008年之前,北京市五環(huán)以內(nèi)快速主干道基本都安裝了車流量監(jiān)測器,而所有出租車也裝配了GPS接收機(jī),進(jìn)行浮動(dòng)車動(dòng)態(tài)數(shù)據(jù)采集。如今,為了更好地發(fā)現(xiàn)問題、找出規(guī)律、提出方案,基于大數(shù)據(jù)的城市交通治理正在得到越來越多的認(rèn)可,并被寫入《北京市“十三五”時(shí)期交通發(fā)展建設(shè)規(guī)劃》。綜觀當(dāng)前的諸多應(yīng)用,其大數(shù)據(jù)的分析、利用過程實(shí)際上都離不開4M思維的理論框架。
北京市交通委員會(huì)和市公交集團(tuán)聯(lián)合多所高校與科研院所共建的“北京城市交通協(xié)同創(chuàng)新中心”,在利用大數(shù)據(jù)開展城市交通研究與治理方面做了大量工作。其中,以“微觀探究”思維為主導(dǎo),利用公交ID卡數(shù)據(jù)和每一臺(tái)運(yùn)營出租車的GPS定位數(shù)據(jù)對不同時(shí)段的公共交通出行和道路交通流量進(jìn)行細(xì)致分析,并借助模擬仿真手段實(shí)現(xiàn)由微觀到宏觀的城市交通過程推演與預(yù)測;基于“復(fù)合利用”的思路,不僅將車流量數(shù)據(jù)應(yīng)用于城市交通狀況的評(píng)價(jià),而且與北京市交通行業(yè)節(jié)能減排中心合作,利用該數(shù)據(jù)對道路網(wǎng)周邊的空氣質(zhì)量變化進(jìn)行研究,探討綠色可持續(xù)交通體系構(gòu)建問題;而且采用“多維分析”方法,在展現(xiàn)道路擁堵的變化規(guī)律時(shí),充分綜合出租車、公交車以及手機(jī)定位等各類數(shù)據(jù),全方位涵蓋不同交通出行方式,以提升信息的完整性與準(zhǔn)確性。
為了深化大數(shù)據(jù)的行業(yè)應(yīng)用,給交通規(guī)劃、管理提供決策支持,北京交通發(fā)展研究院與中國電信共建的“城市與交通大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室”致力于數(shù)據(jù)資源的有效整合與利用。在對人流和車流的運(yùn)動(dòng)規(guī)律進(jìn)行研究時(shí),從“微觀”層面入手,嘗試?yán)么髷?shù)據(jù)探索每個(gè)區(qū)域、每條道路的人和車都從哪來、要到哪去;出于理解城市居民出行需求的目的,根據(jù)數(shù)據(jù)背后隱含的“語義”信息,對城市空間布局、業(yè)態(tài)和區(qū)位作用機(jī)制進(jìn)行量化描述和分析,力求弄清行人、車輛和道路網(wǎng)絡(luò)之間的復(fù)雜關(guān)系與相互影響;更通過打造交通大數(shù)據(jù)生態(tài)圈,實(shí)現(xiàn)多方數(shù)據(jù)的“復(fù)合”與交叉利用,在借助電信數(shù)據(jù)提升交通治理能力的同時(shí),也將公共交通數(shù)據(jù)應(yīng)用于移動(dòng)端的智能服務(wù)推廣。
另外,北京市交管局以及騰訊、百度、滴滴打車等企業(yè)也都從不同角度收集并擁有大量的城市交通相關(guān)數(shù)據(jù)。對于這些數(shù)據(jù)的利用,絕不是僅僅依靠傳統(tǒng)的指標(biāo)監(jiān)測手段進(jìn)行路況播報(bào)和車輛監(jiān)管,而是通過“微觀探究”,對市區(qū)交通現(xiàn)象和過程進(jìn)行細(xì)致剖析,發(fā)掘不同區(qū)域、不同人群的出行特征和行為模式;憑借“復(fù)合利用”,拓展交通數(shù)據(jù)在多個(gè)相關(guān)部門和服務(wù)行業(yè)的應(yīng)用,實(shí)現(xiàn)政府、企業(yè)、社會(huì)的多元協(xié)同治理與基于位置的服務(wù);以“語義導(dǎo)向”,分析交通問題的表征內(nèi)容、產(chǎn)生原因和后續(xù)影響,推動(dòng)公共服務(wù)的供給側(cè)改革和精細(xì)化管理;采用“多維分析”,完善和補(bǔ)充對復(fù)雜交通體系的認(rèn)知,保證管理決策的正確性和有效性。
五、結(jié)? 語
大數(shù)據(jù)不是簡單的“大存儲(chǔ)+大計(jì)算”,它給整個(gè)社會(huì)帶來的挑戰(zhàn),不完全在于技術(shù)層面。其價(jià)值更多地體現(xiàn)于對實(shí)際應(yīng)用決策的支持,而應(yīng)用決策的最終需求往往又會(huì)到影響到數(shù)據(jù)收集、整理、分發(fā)、利用的各個(gè)環(huán)節(jié)。只有明確公共大數(shù)據(jù)的特性與差異,才能清晰地了解數(shù)據(jù)應(yīng)當(dāng)怎樣科學(xué)利用、如何有效共享、怎么合理開放。特別是,隨著人工智能(Artificial Intelligence)技術(shù)的進(jìn)一步發(fā)展,機(jī)器對數(shù)據(jù)的自動(dòng)化學(xué)習(xí)和智能化處理將越來越廣泛。人類對數(shù)據(jù)分析和應(yīng)用過程的管理,也將逐漸從程序化干預(yù)過渡到方向性控制,而此時(shí)其應(yīng)用決策的思維方式將顯得更為關(guān)鍵。
通過分析、探討所總結(jié)的4M思維,在公共管理大數(shù)據(jù)應(yīng)用決策中扮演著重要角色。不僅是交通治理,人口、經(jīng)濟(jì)、文化、教育、醫(yī)療衛(wèi)生、土地資源、公共安全等領(lǐng)域的數(shù)據(jù)利用都面臨著思維方式轉(zhuǎn)變的問題。雖然大數(shù)據(jù)的分析、應(yīng)用和開放還涉及社會(huì)倫理、經(jīng)濟(jì)效益、部門關(guān)系、政策法規(guī)等眾多方面,而且需要考慮數(shù)據(jù)脫敏、數(shù)據(jù)流通、數(shù)據(jù)權(quán)益和數(shù)據(jù)標(biāo)準(zhǔn)化等一系列問題,但從大數(shù)據(jù)的廣泛記錄和有限描述特性出發(fā),微觀探究、復(fù)合利用、語義導(dǎo)向和多維分析對于保證數(shù)據(jù)的科學(xué)、合理、可靠利用具有指導(dǎo)意義。
參考文獻(xiàn):
[1] Lynch C. Big data: How do your data grow?[J]. Nature, 2008, 455(7209): 28-29.
[2] McAfee A, Brynjolfsson E. Big data: the management revolution[J]. Harvard business review, 2012, 90(10): 60-68.
[3] George G, Haas M R, Pentland A. Big data and management[J]. Academy of Management Journal, 2014, 57(2): 321-326.
[4] 徐宗本, 馮芷艷, 郭迅華等. 大數(shù)據(jù)驅(qū)動(dòng)的管理與決策前沿課題[J]. 管理世界, 2014(11):158-163.
[5] Kim G H, Trimi S, Chung J H. Big-data applications in the government sector[J]. Communications of the ACM, 2014, 57(3): 78-85.
[6] 陳之常. 應(yīng)用大數(shù)據(jù)推進(jìn)政府治理能力現(xiàn)代化——以北京市東城區(qū)為例[J]. 中國行政管理, 2015(2): 38-42.
[7] 張勇進(jìn), 王璟璇. 主要發(fā)達(dá)國家大數(shù)據(jù)政策比較研究[J]. 中國行政管理, 2014(12): 113-117.
[8] 米加寧, 章昌平, 李大宇, 林濤. 第四研究范式: 大數(shù)據(jù)驅(qū)動(dòng)的社會(huì)科學(xué)研究轉(zhuǎn)型[J]. 學(xué)海, 2018(02): 11-27.
[9] Wamba S, Akter S, Edwards A, et al. How 'big data'can make big impact: Findings from a systematic review and a longitudinal case study[J]. International Journal of Production Economics, 2015, 165: 234-246.
[10] 李國杰, 程學(xué)旗. 大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域--大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J]. 中國科學(xué)院院刊, 2012, 27(6):5-15.
[11] Lazer D, Kennedy R, King G, et al. The parable of Google Flu: traps in big data analysis[J]. Science, 2014, 343(6176): 1203-1205.
[12] Nair B. Reaping ROI from Big Data[J]. CSI Communications, 2014, 38(3):29-30.
[13] Zuiderwijk A, Janssen M. Open data policies, their implementation and impact: A framework for comparison[J]. Government Information Quarterly, 2014, 31(1): 17-29.
[14] Tang, N. Big data cleaning[A]. In Asia-Pacific Web Conference[C]. Berlin Heidelberg: Springer-Verlag, 2014.
[15] Jagadish H V, Gehrke J, Labrinidis A, et al. Big data and its technical challenges[J]. Communications of the ACM, 2014, 57(7): 86-94.
[16] Provost F, Fawcett T. Data science and its relationship to big data and data-driven decision making[J]. Big Data, 2013, 1(1): 51-59.
[17] Shi Q, Abdel-Aty M. Big data applications in real-time traffic operation and safety monitoring and improvement on urban expressways[J]. Transportation Research Part C: Emerging Technologies, 2015, 58: 380-394.
[18] Tan W, Blake M B, Saleh I, et al. Social-network-sourced big data analytics[J]. IEEE Internet Computing, 2013, 17(5): 62-69.
[19] Schintler L A, Kulkarni R. Big data for policy analysis: The good, the bad, and the ugly[J]. Review of Policy Research, 2014, 31(4): 343-348.
[20] Fan W, Bifet A. Mining big data: current status, and forecast to the future[J]. ACM SIGKDD Explorations Newsletter, 2013, 14(2): 1-5.
[21] Kantardzic M. Data mining: concepts, models, methods, and algorithms[M]. New Jersey: John Wiley & Sons, 2011.
[22] 孫軒, 孫濤. 基于大數(shù)據(jù)的城市可視化治理:輔助決策模型與應(yīng)用[J], 公共管理學(xué)報(bào), 2018, 15,(2): 120-129.
[23] LaValle S, Lesser E, Shockley R, et al. Big data, analytics and the path from insights to value[J]. MIT sloan management review, 2011, 52(2): 21-31.
[24] Teisman G R, Klijn E H. Complexity theory and public management: An introduction[J]. Public Management Review, 2008, 10(3): 287-297.
[25] Heidorn P B. Shedding light on the dark data in the long tail of science[J]. Library Trends, 2008, 57(2): 280-299.
[26] Davenport T H, Barth P, Bean R. How big data is different[J]. MIT Sloan Management Review, 2012, 54(1): 22-24.
[27] Bozeman B, Pandey S K. Public management decision making: Effects of decision content[J]. Public Administration Review, 2004, 64(5): 553-565.
[28] Light, Paul, and George Butterworth (eds). Context and cognition: Ways of learning and knowing[M]. New York: Routledge, 2016.
[29] Girard Y, Hett F, Schunk D. How individual characteristics shape the structure of social networks[J]. Journal of Economic Behavior & Organization, 2015, 115: 197-216.
[30] Hassan, S., Antunes, L., & Arroyo, M. Deepening the demographic mechanisms in a data-driven social simulation of moral values evolution[A]. In International Workshop on Multi-Agent Systems and Agent-Based Simulation[C]. Berlin Heidelberg: Springer-Verlag, 2008.
[31] Fan W, Bifet A. Mining big data: current status, and forecast to the future[J]. ACM SIGKDD Explorations Newsletter, 2013, 14(2): 1-5.
[32] Li A S, Soh B, Bhatti M I, et al. Data-centric view of knowledge in information systems literature review[J]. International Journal of Services, Economics and Management, 2016, 7(2-4): 111-123.
[33] Madden S. From databases to big data[J]. IEEE Internet Computing, 2012, 16(3): 4-6.
[34] 大數(shù)據(jù)戰(zhàn)略重點(diǎn)實(shí)驗(yàn)室. 塊數(shù)據(jù)[M]. 北京: 中信出版社, 2015.
[35] Frankel F, Reid R. Big data: Distilling meaning from data[J]. Nature, 2008, 455(7209): 30-30.
[36] Berman J J. Principles of big data: preparing, sharing, and analyzing complex information[M]. San Francisco: Morgan Kaufmann Publishers Inc., 2013.
[37] 王天思. 大數(shù)據(jù)中的因果關(guān)系及其哲學(xué)內(nèi)涵[J]. 中國社會(huì)科學(xué), 2016,(5):22-42.
[38} 溫有奎, 喬曉東. 大數(shù)據(jù)下智慧發(fā)現(xiàn)服務(wù)平臺(tái)研究[J]. 情報(bào)學(xué)報(bào), 2015, 34,(11):1181-1189.
[39] Wu X, Zhu X, Wu G Q, et al. Data mining with big data[J]. IEEE transactions on knowledge and data engineering, 2014, 26(1): 97-107.
[40] Kostyuchenko, Y. V., Movchan, D., Kopachevsky, I., &Bilous, Y. Robust algorithm of multi-source data analysis for evaluation of social vulnerability in risk assessment tasks[A]. In SAI Intelligent Systems Conference (IntelliSys)[C]. London: IEEE, 2015.
[41] Rssler S. Data fusion: identification problems, validity, and multiple imputation[J]. Austrian Journal of Statistics, 2016, 33(1&2): 153-171.
[42] Olshannikova E, Ometov A, Koucheryavy Y, et al. Visualizing Big Data with augmented and virtual reality: challenges and research agenda[J]. Journal of Big Data, 2015, 2(1): 1-27.