呂 鵬
(清華大學(xué) 公共管理學(xué)院,北京 100084)
?
ABM仿真模擬方法漫談
呂 鵬
(清華大學(xué) 公共管理學(xué)院,北京 100084)
長期以來,研究人員都試圖最大限度地刻畫個體行為特征并預(yù)測社會宏觀現(xiàn)象,若能通過計算機科學(xué)將“個體—社會”進行全息建模則堪稱完美。在前大數(shù)據(jù)時代,這種努力通常會很難如愿,核心問題是我們無法得到特征變量的準確參數(shù)估計,因為數(shù)據(jù)獲得、數(shù)據(jù)清理、知識建構(gòu)、規(guī)律推廣等方面均存在現(xiàn)實障礙和信息缺失。大數(shù)據(jù)時代,這個問題可以得到較好的解決。大數(shù)據(jù)時代,計算社會科學(xué)的核心任務(wù)是:通過對接近全樣本的數(shù)據(jù)量進行深度挖掘、機器學(xué)習(xí)、變量搭橋、模式探索等,實現(xiàn)個體特征畫像、行為模式預(yù)測、社會系統(tǒng)剖析與宏觀政策預(yù)演。在個體畫像、行為預(yù)測、系統(tǒng)剖析與政策預(yù)演等方面,社會科學(xué)仿真模擬方法發(fā)揮著重要作用。本文主要對ABM仿真模擬這種最新的方法進行解讀,重點介紹其產(chǎn)生土壤、模式特征、邏輯結(jié)構(gòu)與操作流程等。
研究活動包括自然科學(xué)研究與社會科學(xué)研究,是人類運用有限理性規(guī)則動態(tài)地認識世界進而改造世界的思維意識活動。(1)認識世界指的是現(xiàn)象發(fā)現(xiàn)、規(guī)律獲取與知識構(gòu)建。其中,現(xiàn)象發(fā)現(xiàn)指的是發(fā)現(xiàn)了新的實體現(xiàn)象,規(guī)律獲取指透過現(xiàn)象探求其內(nèi)部本質(zhì)或運作機制,知識構(gòu)建是對“現(xiàn)象—規(guī)律”的理論化表述;(2)改造世界指的是新造物質(zhì)與新創(chuàng)制度。自然科學(xué)研究中的改造世界,側(cè)重于通過制造新的產(chǎn)品物質(zhì)形態(tài),使得現(xiàn)實世界更加富有效率;社會科學(xué)研究中的改造世界,側(cè)重于通過新制度或政策的提出,來解決社會問題并使得社會總體運行更加良好。
理論研究、數(shù)據(jù)統(tǒng)計與仿真模擬,是社會科學(xué)研究方法的三駕馬車。除了理論分析之外,后兩種方法是從自然科學(xué)研究(物理、氣象、水文、建筑、工程)中借鑒學(xué)習(xí)而來。人類首先認識到自然客體,然后自然而然地將其研究方法遷移到認識人類社會自身,此即為社會科學(xué)。理論研究范式在社會科學(xué)研究中屬于傳統(tǒng)方法,數(shù)據(jù)統(tǒng)計模式現(xiàn)在在我國社會科學(xué)研究中得到普遍的應(yīng)用,唯有第三種方法即仿真模擬范式尚未得到推廣應(yīng)用。其原因固然與方法傳入中國科研社區(qū)的時間早晚有關(guān),也與國內(nèi)科研社區(qū)迷信數(shù)據(jù)統(tǒng)計、排斥方法創(chuàng)新、固步自封,不愿更新范式的“路徑依賴”心態(tài)相關(guān)?!氨鵁o常勢、水無常形”,好的研究方法應(yīng)該是動態(tài)、優(yōu)化且開放民主的,只要該方法有助于提高發(fā)現(xiàn)規(guī)律與改造世界的信度與效度,就應(yīng)該被納入社會科學(xué)家工具箱(Social Scientists’ Toolbox)。
仿真模擬與數(shù)據(jù)統(tǒng)計是兩種截然不同的科學(xué)研究范式,其內(nèi)在假設(shè)與邏輯基礎(chǔ)大相迥異。請設(shè)想場景A:一只貓走在沙灘上留下了一連串腳印。如果是數(shù)據(jù)統(tǒng)計范式,囿于研究范式,將會研究腳印的間距、面積、角度、方位、趨勢、深淺等指標之間的函數(shù)關(guān)系,然后得出相應(yīng)的結(jié)論。如果是仿真模擬范式,不僅這些指標將得到研究,還會考慮到行動者(Agent)的心情、動機、習(xí)慣、轉(zhuǎn)向、態(tài)度、決策。即這只貓在何種情緒心理、動因機制、行為習(xí)慣、腦體朝向、傾向態(tài)度的作用下,才產(chǎn)生了具備上述特征變量的一串腳印。場景A道出了仿真模擬范式的五方面的研究優(yōu)勢:(1)更高維度的過程信息;(2)清晰的因果關(guān)系;(3)動態(tài)的多種可能;(4)研究的保守主義;(5)平行宇宙預(yù)演問題。因為重要,故將其上升為主標題重點闡述。
《三體》中多處描述了宇宙空間從三維向二維坍塌的場景,如果說數(shù)據(jù)統(tǒng)計研究三維場景,仿真模擬則研究四維場景,后者增加了動態(tài)的連續(xù)過程維度。數(shù)據(jù)統(tǒng)計所面對的數(shù)據(jù)是結(jié)果數(shù)據(jù),始終是一個靜態(tài)狀態(tài)瞬間(例如截面數(shù)據(jù)和時間序列數(shù)據(jù)),稍好的是多個靜態(tài)狀態(tài)瞬間(例如面板數(shù)據(jù)),從屬性上而言,可類比為截圖或圖片(Picture)。而仿真模擬處理的是連續(xù)動態(tài)過程,即隨著時間不斷呈現(xiàn)無數(shù)個結(jié)果即無數(shù)個靜態(tài)瞬間,屬性為電影或視頻(Movie)。Movie與Picture相比多了一個持續(xù)時間維度,統(tǒng)計數(shù)據(jù)是電影視頻的屏幕瞬間截圖,電影視頻是無數(shù)個連續(xù)截圖的高維度存在形態(tài)。四維可以隨時制造或還原成三維空間,而反之則行不通。仿真模擬處理的是更高維度的動態(tài)過程信息,而數(shù)據(jù)統(tǒng)計處理的是更低維度的瞬間結(jié)果信息。數(shù)據(jù)統(tǒng)計的致命缺陷是無法揭示過程機制,除非要做無數(shù)次瞬間截面統(tǒng)計。數(shù)據(jù)統(tǒng)計系數(shù)推斷表只能證明其本身,無法揭示過程(因為維度低)。其統(tǒng)計結(jié)果解釋部分所言的過程機制不過是研究者們主觀似然的腦海推測或頭腦構(gòu)想,瞬間結(jié)果數(shù)據(jù)顯然無法說明動態(tài)演化過程。
數(shù)據(jù)統(tǒng)計的興奮點無疑是找到較為穩(wěn)健的因果機制,但此路不通,使得該范式之下的研究者非??鄲?。為了找因果,數(shù)據(jù)統(tǒng)計領(lǐng)域也發(fā)展出很多工具方法來試圖使得因果關(guān)系更加清晰,例如反事實視野下的傾向值匹配(PSM)方法等。但是,此類方法所找到的所謂因果機制仍然是相關(guān)機制,無非是更加精細的事實狀態(tài)與反事實狀態(tài)的變量之間相關(guān)性對比。反事實狀態(tài)無法找到,故只能采用事實中的類似個體進行“偽對比”。數(shù)據(jù)統(tǒng)計理論上無法找到因果的核心問題在于其內(nèi)在限制性,而非研究者無能,這是高要求與低維度的矛盾。而在更高維度的仿真模擬之下,因果無處不在且無比清晰,因為其本質(zhì)就是用清晰預(yù)設(shè)的因果機制進行動態(tài)持續(xù)試驗并獲得動態(tài)數(shù)據(jù)。數(shù)據(jù)統(tǒng)計興奮點是肯定因果,仿真模擬興奮點是否定因果。由于因果無處不在且無比清晰,需要對其進行判斷,而被否定的因果機制可以證明其不存在,更符合科學(xué)的“可證偽性”原則。即:要么“此種因果不存在”,要么“無法排除此因果存在”,不存在“此因果存在”的表述。
統(tǒng)計學(xué)的最核心問題是參數(shù)確定,即想方設(shè)法找到“最佳線性無偏估計量(BLUE)”。這是一種追求確定性結(jié)果的科研情結(jié)之下的集體性研究焦慮與本能沖動,如果統(tǒng)計分析找不到目標變量的參數(shù)估計量,那將是失望的、很難做文章的。慶幸的是,我們還有仿真模擬。在我們?yōu)檎也坏秸鎸嵰蚬禂?shù)估計而煩惱的時候,它清楚地告訴我們,還有另外的路。從最高預(yù)測準則來看,數(shù)據(jù)統(tǒng)計與仿真模擬都是以最大程度地擬合觀測現(xiàn)象為終極目標,但是他們走了不同的路:(1)數(shù)據(jù)統(tǒng)計是通過找到最佳參數(shù)估計量來擬合自然與社會現(xiàn)象,故其核心任務(wù)是確定參數(shù);(2)仿真模擬通過遍歷各種變量參數(shù)的可能取值范圍即參數(shù)譜系來擬合研究現(xiàn)象,故其核心任務(wù)是窮盡所有可能,尋找最佳參數(shù)組合即看何種組合之下因果機制更容易被理解和被確定。我們經(jīng)??吹降氖牵抡婺M方法通常對參數(shù)的可能范圍進行全域化設(shè)置,對自然、社會現(xiàn)象的動態(tài)演化與過程機制進行全域化考察。由于數(shù)據(jù)統(tǒng)計只能揭示結(jié)果而不能揭示過程,所以不得不進行參數(shù)確定;由于仿真模擬足以揭示過程更遑論結(jié)果,所以參數(shù)研究更加靈活,可以上升至參數(shù)譜系。
科學(xué)研究方面,“保守主義”恰是最真實的激進,“激進主義”恰是最真實的保守?!氨J刂髁x”是基于動態(tài)有限信息的持續(xù)優(yōu)化,即通過對手頭信息不斷進行學(xué)習(xí)與優(yōu)化,得到臨時或局部最優(yōu)解。當信息出現(xiàn)動態(tài)變化,“持續(xù)挖掘”的保守主義精神使得人類知識得以不斷產(chǎn)生、改造自然得以不斷推進、認識社會得以不斷深化,科研之光的照耀范圍不斷擴展,這種碎步快走的模式“看似很慢、實則很快”。而反觀“激進主義”,天生具有“高大上”的訴求,試圖將天地人萬物納入其中,搭建宏觀概念與宏大概念模型,這種激進主義恰恰是限制學(xué)科專業(yè)發(fā)展、封閉微觀過程研究、助力學(xué)術(shù)霸權(quán)構(gòu)建的重要原因,恰恰是保守的。這種追求“一步到位”研究社會的精神出發(fā)點是好的,但實際效果“看似很快,實則很慢”。人類認識自然與社會的思維過程本質(zhì)是保守主義的,具備持續(xù)、漸進、動態(tài)、優(yōu)化的特征。人們從本能、興趣、好奇出發(fā),不斷向深挖掘、動態(tài)認識現(xiàn)象。仿真模擬則直視人的本能思維與好奇機制,從不否認好奇與猜測的合理性,將其操作化、具象化、過程化。
數(shù)據(jù)統(tǒng)計處理的觀測數(shù)據(jù)屬于單一宇宙屬性,而仿真模擬的面向?qū)ο髣t是多重宇宙或平行宇宙(Parallel Universes)。統(tǒng)計數(shù)據(jù)不能擺脫單一宇宙問題,此系其低維度數(shù)據(jù)屬性使然。統(tǒng)計方法也意識到了此局限性,發(fā)展反事實概念試圖解決統(tǒng)計數(shù)據(jù)的單一宇宙問題。值得肯定的是,反事實概念確實在一定程度上推進了問題的解決(例如PSM方法的引入),但仍然無法解決根本問題。盡管其意識到反事實問題,但解決方式仍然是從相同宇宙中,找到類似替代物即“偽等價個體”(按照傾向概率或傾向值進行相似度匹配),而并非來自另一個宇宙。仿真模擬恰恰提出了更好的解決路徑,即通過更高維度信息的處理解決“反事實狀態(tài)無法獲得”的悖論,展開所謂平行宇宙的研究。仿真模擬中存在無數(shù)個參數(shù)組合與異質(zhì)性個體,故存在多重宇宙,每一次模擬就具有一重宇宙之含義。我們不再需要從本宇宙找出“偽等價個體”(用PSM方法),只需要從另外一重宇宙中尋找即可。我們所觀測到的宇宙(本宇宙,低維度)理論上只是多重宇宙(高維度)的一種可能,通過數(shù)據(jù)分析研究本宇宙數(shù)據(jù)得出的所謂因果僅僅是一種可能性而已,尚且不論得到此因果機制難度極大或者僅存在理論可能性。
基于頭腦構(gòu)想的思想實驗是仿真模擬的核心特征。仿真模擬從想象出發(fā)去模擬社會,而非從結(jié)果出發(fā)“馬后炮”式地解釋或論證社會現(xiàn)象,這更符合本能與直覺。ABM(agent-based modeling)是當前仿真模擬的主流研究方法,賦予智能體(agents)更大的決策自主性、更強的情境模糊性,力求更貼近真實場景。ABM仿真模擬邏輯流程如下:(1)思維預(yù)想。如果腦海中沒有所謂“社會學(xué)想象力”,則無法進行仿真模擬,仿真模擬核心特征就是研究者思維預(yù)想的操作化;(2)場景預(yù)演。任何被模擬的自然與社會現(xiàn)象都有具體場景,場景或情境預(yù)設(shè)是仿真模擬的前提。有的場景比較理想,例如元胞自動機(Cellular Automation)模型;有的更貼近真實,例如將GIS地圖導(dǎo)入程序模擬群體運動規(guī)律;(3)機制設(shè)計(mechanism design)。機制設(shè)計是核心工作,決定著智能體以何種規(guī)則運行,即:個體行為規(guī)則(decision rule)是什么、策略更新規(guī)則(strategy updating)是什么等;(4)條件假設(shè)。相關(guān)變量參數(shù)的分布特征(正態(tài)/偏態(tài)分布、連續(xù)/離散型假設(shè)等)需要進行特定假設(shè),仿真模擬結(jié)果在此基礎(chǔ)之上才能夠呈現(xiàn)。換言之,不存在沒有條件假設(shè)之下的仿真模擬與結(jié)果;(5)窮盡可能。仿真模擬很重要的任務(wù)是窮盡模型納入的參數(shù)與變量的所有取值譜系,即考察所有因素、變量與參數(shù)的所有可能性,對其影響效果進行譜系化系統(tǒng)呈現(xiàn);(6)結(jié)果解讀。根據(jù)所記錄的仿真模擬相關(guān)變量的數(shù)據(jù),計算或估計之間的函數(shù)關(guān)系,進而對目標社會現(xiàn)象進行相應(yīng)的解讀。重點之一是揭示現(xiàn)象的過程演化機制,重點之二是對由此過程導(dǎo)致的特定結(jié)果或現(xiàn)象進行解釋。仿真模擬的結(jié)果解讀具有有限性和條件性,是特定機制與特定模型之下的結(jié)果與結(jié)論;(7)再次循環(huán)。
如同其他研究方法與研究范式,不存在永遠正確,只是相對合適。數(shù)據(jù)統(tǒng)計基于現(xiàn)實得到的數(shù)據(jù)認識內(nèi)在規(guī)律,仿真模擬(ABM)則基于個體思維意識活動,試圖用不斷逼近真相的個體理性與基于數(shù)學(xué)與系統(tǒng)控制的模型設(shè)計,認識社會現(xiàn)象及其內(nèi)在規(guī)律。仿真模擬的研究范式與具體方法具有內(nèi)在條件性與局限性,即仿真模擬永遠揭示可能性與或然性,而非絕對真理,這可能在目前或今后都無法解決。因為社會科學(xué)比自然科學(xué)具備更大的復(fù)雜性,仿真模擬所發(fā)現(xiàn)的因果、規(guī)律與機制僅僅是現(xiàn)實世界的一種當前似然最優(yōu)的可能性,具有條件性與局限性。但是,我們并不能因噎廢食,因為仿真模擬在高維信息處理、過程機制演化、因果關(guān)系檢視、變量參數(shù)譜系與持續(xù)動態(tài)優(yōu)化等方面具有顯著的優(yōu)越性。
2016-10-12
國家社科基金重大項目“大數(shù)據(jù)時代計算社會科學(xué)的產(chǎn)生、現(xiàn)狀與發(fā)展前景研究”(16ZDA086)的階段性成果。
呂鵬(1984-),男,江蘇徐州人,清華大學(xué)社會學(xué)博士、自動化系博士后。研究方向:計算社會科學(xué)、仿真模擬、空間博弈論。