編譯 蔡立英
極為復(fù)雜的模型可以模擬數(shù)百萬模擬人的災(zāi)難情景
從這張基于主體的模型快照中可以看到,一顆原子彈在美國白宮附近爆炸,幾小時后,一股放射性塵埃橫穿華盛頓特區(qū)向東蔓延。柱狀圖顯示某個地點的人數(shù)和該處人們的健康狀況
5月的一個星期一上午11:15,一輛看似普通的貨車駛?cè)朊绹A盛頓市中心西北第16大街和K大街的交叉路口,就在白宮北邊相隔幾個街區(qū)遠(yuǎn)的地方。貨車中,自殺式炸彈襲擊者接通了開關(guān)。
這顆原子彈以恐怖分子幾個星期前劫持的5公斤高濃縮鈾為動力,爆炸后形成的火球是日本廣島原子彈的2/3,整個城市街區(qū)瞬間化為烏有,至少1公里范圍的房屋向四面八方炸裂,數(shù)十萬人在廢墟中死去或掙扎。電磁脈沖燒毀了方圓5公里以內(nèi)的手機(jī),城市的大部分電網(wǎng)跳閘。原子彈爆炸產(chǎn)生的蘑菇云被風(fēng)刮成放射性塵埃,向東蔓延到馬里蘭州郊區(qū)。道路很快被混亂的人群堵塞,一些人試圖逃離,但是更多的人在尋找失散的家庭成員或?qū)で筢t(yī)療救助。
當(dāng)然,這些都是虛構(gòu)的,但是有著非常嚴(yán)肅的目的。這個被稱為“國家計劃情景1”(NPS1)的核攻擊故事情節(jié)起源于20世紀(jì)50年代。作為一種戰(zhàn)爭游戲,在必須面對的真災(zāi)難發(fā)生之前,美國國家安全官員和應(yīng)急管理者用于測試其應(yīng)對方案的安全方法。
60年后的今天,官員依然用常規(guī)的NPS1演習(xí)來估算核災(zāi)難的后果。只是現(xiàn)在,他們并非遵循固定的故事情節(jié)和提前集成的預(yù)測,而是使用計算機(jī)進(jìn)行整個人工社會(artificial society)的假設(shè)分析:稱之為“基于主體的模型的先進(jìn)計算機(jī)模擬。
NPS1模型的現(xiàn)代版本包括了受原子彈影響地區(qū)的每一棟建筑的數(shù)字模擬,道路、電線、醫(yī)院甚至手機(jī)信號塔也涵蓋其中;模型也包括用以模擬放射性塵埃的天氣數(shù)據(jù)。這個場景布滿了大約73萬個主體,這是合成人口(synthetic populations),從統(tǒng)計上等同于受影響地區(qū)的真實人口,考慮年齡、性別和職業(yè)等因素。每個主體是一個自發(fā)的子程序,能夠在多種行為模式之間切換(比如恐慌、逃離和努力尋找家庭成員),從而以合理的人類方式響應(yīng)其他主體和不斷演變的災(zāi)難。
這種模型的目的是避免用固定的方程自上而下的描述人類事件,像經(jīng)濟(jì)學(xué)和流行病學(xué)等領(lǐng)域的傳統(tǒng)做法那樣。事實上,諸如金融崩潰或疾病傳播這樣的事件,其后果是從底層開始顯現(xiàn)的,通過很多個體的相互作用,導(dǎo)致了現(xiàn)實世界豐富和自發(fā)的事件,而這是很難模擬的。
這樣的細(xì)節(jié)正是應(yīng)急管理者需要的,計算機(jī)科學(xué)家克里斯托弗·巴雷特(Christopher Barrett)說,他是布萊克斯堡(Blacksburg)的弗吉尼亞理工學(xué)院暨州立大學(xué)(弗吉尼亞理工)的生物復(fù)雜性研究所所長。該研究所為美國政府研發(fā)了NPS1模型。NPS1模型可以提醒管理者,X點的電力故障可能導(dǎo)致Y點出現(xiàn)意外的交通擁堵。如果他們決定在危機(jī)發(fā)生后幾個小時內(nèi)部署移動手機(jī)信號塔來恢復(fù)通信,NPS1會告訴他們是否會有更多或更少市民涌到路上。巴雷特說:“基于主體的模型就是你如何把所有這些碎片化的信息梳理出來,并審視其相互作用?!?/p>
美國政府依靠基于主體的模型來預(yù)測發(fā)生在華盛頓市中心的核攻擊的影響。該模型包含很多層——基礎(chǔ)設(shè)施、交通、天氣,還有數(shù)十萬個“主體”在這個虛擬情景中相互作用,以模仿真實人類行為的方式改變他們的行為。該模型幫助規(guī)劃者辨識麻煩點,并評估潛在的危害。模型也產(chǎn)生了令人驚訝的模式,比如一些主體朝著爆炸的方向移動,努力尋找家庭成員
缺點是:像NPS1這樣的模型往往十分龐大,每個模型的初始運(yùn)行就讓具有500個微處理器的計算集群忙碌1天半,迫使參與主體相對簡單。喬納森·普福茨(Jonathan Pfautz)說:“在每個主體的復(fù)雜性和模擬的規(guī)模之間存在基本的權(quán)衡?!逼崭4氖敲绹鴩啦扛呒壯芯坑媱澗郑―efense Ad-vanced Research Projects Agency)的項目經(jīng)理,資助了社會行為的基于主體模型。
但是,隨著計算機(jī)越來越強(qiáng)大、用來模擬人口和校準(zhǔn)模型的數(shù)據(jù)集變得越來越龐大,在經(jīng)濟(jì)、交通、公共衛(wèi)生和城市規(guī)劃等諸多領(lǐng)域,越來越多的決策者開始認(rèn)真對待基于主體的模型。艾拉·隆吉尼(Ira Longini)說:“這種模型是現(xiàn)有的模型中最靈活最詳細(xì)的模型,在理解和指導(dǎo)政策方面最有效?!?隆吉尼在佛羅里達(dá)大學(xué)做傳染病建模。
基于主體模型的起源至少可以追溯到20世紀(jì)40年代,當(dāng)時像艾倫·圖靈(Alan Turing)這樣的計算機(jī)先驅(qū),嘗試用本地交互軟件為物理學(xué)和生物學(xué)的復(fù)雜行為建模。但是,當(dāng)前的發(fā)展浪潮是20世紀(jì)90年代中期發(fā)展起來的。
一個早期的成功案例是喬治梅森大學(xué)的經(jīng)濟(jì)學(xué)家羅伯特·阿克斯特爾(Robert Axtell)和紐約大學(xué)的約書亞·愛潑斯坦(Joshua Epstein)共同開發(fā)的“糖域”(Sugarscape)模型。他們的目標(biāo)是在普通的臺式計算機(jī)上模擬社會現(xiàn)象,于是他們把基于主體的建模簡化:在網(wǎng)格中四處游走尋找“糖”的一群簡單主體,糖為類似食物的資源,在某些地方很豐富,而在另一些地方很稀缺。這個模型盡管很簡單,卻產(chǎn)生了令人驚訝的復(fù)雜群體行為,比如遷徙、戰(zhàn)斗和鄰里隔離。
20世紀(jì)90年代的另一個里程碑是交通分析和模擬系統(tǒng)(Transims),這是一個基于主體的交通模型,由巴雷特和新墨西哥州洛斯阿拉莫斯國家實驗室的其他研究者共同開發(fā)。不像傳統(tǒng)的交通模型用方程把移動的車輛整體描述為一種流體,Transims為每輛車和司機(jī)建模,將其視為在城市道路網(wǎng)上移動的主體。這個模擬包括了轎車、卡車、公交車的實際混合,并對司機(jī)的年齡、駕駛能力和目的地進(jìn)行實際混合。應(yīng)用到實際城市的道路網(wǎng)時,Transims在預(yù)測交通擁堵和地方污染水平方面比傳統(tǒng)模型做得更好。之所以受到Transims啟發(fā)的基于主體的模型如今成為交通規(guī)劃中的標(biāo)準(zhǔn)工具,這也是其中一個原因。
流行病學(xué)家也在經(jīng)歷類似轉(zhuǎn)變。在20世紀(jì)的很長一段時間里,流行病學(xué)家用一組相對簡單的方程來評估疾病暴發(fā),這些方程把人們劃分為幾類:比如易感人群、傳染人群和免疫人群,并且假設(shè)不同的人群進(jìn)行完美混合,這意味著受影響地區(qū)的每個人都與其他所有人保持聯(lián)系。這些基于方程的模型起初是在紙上運(yùn)算,后來在計算機(jī)上運(yùn)算,至今仍然被廣泛使用。但是,流行病學(xué)家日益轉(zhuǎn)向使用基于主體的模型來囊括方程忽視的因素,比如地理、交通網(wǎng)絡(luò)、家庭結(jié)構(gòu)和行為變化,所有這些因素都能強(qiáng)烈影響疾病的傳播。
例如,2014年埃博拉(Ebola)疫情在西非暴發(fā)期間,弗吉尼亞理工學(xué)院團(tuán)隊運(yùn)用基于主體的模型,幫助美國軍方確定了戰(zhàn)地醫(yī)院的地點。規(guī)劃者需要知道:當(dāng)流動醫(yī)療隊最終抵達(dá)時,哪里將是感染率最高的地方;病人在該地區(qū)著名的惡劣路段上能移動多遠(yuǎn)和多快;還有傳統(tǒng)模型的方程中沒有捕捉到的一系列其他問題。
在另一個例子中,紐約大學(xué)的愛潑斯坦實驗室正在與紐約市公共衛(wèi)生部門合作,為可能暴發(fā)的寨卡(Zika)疫情建模。寨卡病毒是一種通過蚊子傳播的病毒,可能會導(dǎo)致災(zāi)難性的新生兒感染。該團(tuán)隊設(shè)計了一個模型,包括了代表所有850萬紐約人的主體,加上一群規(guī)模小一點的代表了所有蚊子個體的主體。該模型還整合了如下的數(shù)據(jù):人們通常如何在家、上班地點、學(xué)校和購物場所之間移動、性行為(寨卡病毒可以通過無防護(hù)措施的性行為傳播)、影響蚊子種群數(shù)量的因素(比如季節(jié)性氣溫波動、降雨)、繁殖場所(比如舊輪胎堆放地)等。結(jié)果是,模型不僅能預(yù)測寨卡疫情暴發(fā)的嚴(yán)重程度(流行病學(xué)家根據(jù)方程也能確定),而且還提示了疫情最嚴(yán)重的熱點地方。
世界銀行經(jīng)濟(jì)學(xué)家斯特凡·哈勒加特(St é phane Hallegatte)指出:在經(jīng)濟(jì)學(xué)上,基于主體的模型可能是理解全球貧困的強(qiáng)大工具。如果你看的都是標(biāo)準(zhǔn)指標(biāo),比如國內(nèi)生產(chǎn)總值(GDP)和總收入,那么,在大多數(shù)國家你看到的只是富人,窮人錢太少了,他們幾乎沒有登記相關(guān)數(shù)據(jù)。
為了得出更好的結(jié)論,哈勒加特及其同事正在研究單個家庭。他的研究團(tuán)隊搭建了一個模型,用主體代表全球140萬個家庭,大約每個國家1萬個家庭,并研究氣候變化和災(zāi)難會如何影響健康、食品安全和勞動生產(chǎn)率。該模型估計了風(fēng)暴和干旱如何影響農(nóng)民的莊稼收成和市場價格,估計了地震如何通過摧毀汽車、道路乃至工廠而削減工人的收入。
模型表明了一些顯而易見的事情:窮人在相當(dāng)大的程度上比富人更容易受災(zāi)難和氣候變化的影響。但是,哈勒加特的團(tuán)隊發(fā)現(xiàn)了一個顯著的變量:比如,如果一個特定國家的窮人大多數(shù)是農(nóng)民,當(dāng)全球的食品價格因為氣候變化而上漲時,他們實際上可能從氣候變化中受益。但是,如果這個國家的窮人大多數(shù)都涌入城市中,則食品價格上漲反而可能會嚴(yán)重?fù)p害窮人的利益。
這種模型具有的個體化分析功能使得世界銀行更容易根據(jù)每個國家的需求給出有針對性的建議,而且更容易用人們聽得懂的語言而非晦澀的經(jīng)濟(jì)學(xué)術(shù)語來解釋模型的結(jié)果。他說:“與其告訴一個國家說,氣候變化將會令其GDP下降X%;你可以說,1 000萬人將陷入貧困,這個數(shù)據(jù)更容易理解?!?/p>
巴雷特指出:考慮到這些模擬的風(fēng)險有多大,用戶總是想知道為什么他們應(yīng)該相信模擬結(jié)果,他們?nèi)绾文艽_定模型的輸出結(jié)果與現(xiàn)實世界有關(guān)?尤其諸如核災(zāi)難這樣的情況,沒有任何經(jīng)驗數(shù)據(jù)可循。
巴雷特指出這個問題有若干答案:其一,用戶不應(yīng)該期待模型給出具體預(yù)測,比如,預(yù)測下周二的股市崩盤。大多數(shù)建模者通過如下方法來調(diào)節(jié)不可避免的不確定性:在每個情景的多次運(yùn)行之間取平均,展現(xiàn)可能的結(jié)果范圍。這很像颶風(fēng)的登陸預(yù)測。這仍然允許規(guī)劃者使用模型作為試驗臺,來模擬采取行動A、B或C的結(jié)果。其二,巴雷特指出:建模者不應(yīng)該只是把模型拼湊起來看最終結(jié)果是否說得通,而是應(yīng)該在建模時驗證它,分析每一個模塊,與現(xiàn)實世界的數(shù)據(jù)(來自運(yùn)輸機(jī)構(gòu)、普查或其他來源)進(jìn)行對比。他說:“每一步,都有你用于校準(zhǔn)的數(shù)據(jù)?!?/p>
建模者還應(yīng)該利用人類心理學(xué)的研究來校準(zhǔn)主體的行為。這樣做可能比較棘手,人類是很復(fù)雜的;但是在危機(jī)情形下,行為建模變得更容易,因為人類的行為往往是原始的。例如,NPS1模型設(shè)置了一些內(nèi)在的規(guī)則,致使主體僅僅在少數(shù)幾種行為之間變換,比如“尋求醫(yī)療救助”、“尋找避難所”和“撤離”。
朱莉·達(dá)格代爾(Julie Dugdale)提出:即便如此,實地研究指出了關(guān)鍵的細(xì)微差別。達(dá)格代爾是法國格勒諾布爾大學(xué)的人工智能研究者,研究壓力下的人類行為。她說:“在地震中我們發(fā)現(xiàn),比起害怕危機(jī)本身,人們會更害怕身邊沒有家人或朋友?!比藗儠紫葘ふ宜麄儛鄣娜?,而且在尋找過程中自己甘冒危險。在火災(zāi)中同樣如此,工程師往往假設(shè)當(dāng)火災(zāi)警報響起時,人們會迅速有秩序地涌向出口。但是,當(dāng)你所在的大樓進(jìn)行消防演習(xí)時,你觀察一下就會發(fā)現(xiàn),她說:“人們總是首先跟其他人交談,才會疏散。”而且如有必要,會集合朋友和家人一起撤離。
證據(jù)還表明,盲目的不假思索的恐慌很罕見。2011年,特拉華大學(xué)社會學(xué)家本·阿奎爾(Ben Aguirre)及其同事發(fā)表了基于主體的模型,試圖再現(xiàn)2003年發(fā)生在羅德島的夜總會火災(zāi)。人群緊緊地?fù)矶略谝黄?,以致無人能夠移動,最后導(dǎo)致100人在火災(zāi)中喪生。從警方、當(dāng)?shù)貓蠹埡托掖嬲叩臄⑹鲋?,阿奎爾的團(tuán)隊得到了關(guān)于遇難者的詳細(xì)數(shù)據(jù),包括其行為、與他人的關(guān)系等。當(dāng)研究人員把這些關(guān)系整合到模型中時,他說,模型運(yùn)行下來,結(jié)果與幾乎沒有恐慌的真實火災(zāi)最一致。阿奎爾說:“我們發(fā)現(xiàn),人們總是努力想與朋友、同事和愛的人一起逃生,他們并不想互相傷害,那只是偶然事件?!?/p>
NPS1模型試圖整合這樣的洞見,讓其主體進(jìn)入“家庭重建”模式(尋找朋友和家人)而非“恐慌”模式(沒有一致目標(biāo)的到處亂竄),而結(jié)果有時候可能是反直覺的。例如,模型建議,在災(zāi)難發(fā)生后,應(yīng)急管理者應(yīng)該馬上預(yù)期看見一些人沖向1層,努力在人群中尋找放學(xué)的孩子或是失散的配偶,導(dǎo)致道路擁堵。模型還提出減小混亂的好方法:迅速恢復(fù)部分手機(jī)通信服務(wù),這樣人們能證實他們愛的人是安全的。
如果基于主體的模型的建模者要選擇最高的優(yōu)先級,那就是讓模擬更容易構(gòu)建、運(yùn)行和使用,尤其是因為這樣做能讓現(xiàn)實世界的決策者更容易理解模型。例如,愛潑斯坦設(shè)想了一個國家中心,在那里決策者可以訪問他所稱的千萬億字節(jié)的“劇本”(petabyte playbook):這是一個圖書館,包括了每個大城市的數(shù)字檔案,對每個可能的危險都有預(yù)先計算好的模型。他說:“然后,如果真的發(fā)生了什么事情,比如毒煙彌漫,我們可以挑選出匹配度最高的模型,進(jìn)行近乎實時的計算,得出有用的結(jié)果,比如就地避難和疏散的最優(yōu)組合?!?/p>
在弗吉尼亞理工學(xué)院,計算機(jī)科學(xué)家馬達(dá)夫·馬拉泰(Madhav Marathe)也在思考同樣的問題。他說,當(dāng)一場五級颶風(fēng)鋪天蓋地襲來時,某人,比如波多黎各首府圣胡安(San Juan)的女市長不會坐以待斃,耐心等待專家用長達(dá)一周的時間分析這場風(fēng)暴可能對波多黎電網(wǎng)造成的影響。他說,市長需要的是可操作的信息,“這意味著模型要界面簡便,在云端運(yùn)行,在非常短的時間內(nèi)給出非常全面的分析?!?/p>
馬拉泰稱其為“基于主體的建模服務(wù)”。他的實驗室在過去4年里一直在開發(fā)和測試一種基于互聯(lián)網(wǎng)的工具,能讓公共衛(wèi)生官員建立傳染病模擬,并且無需雇傭程序員,自己就能進(jìn)行假設(shè)分析。只需點擊幾下鼠標(biāo),用戶就可以指定關(guān)鍵變量,比如,感興趣的地區(qū)和疾病的類型,前者可小到一個城市也可大到全美國,后者如流感、麻疹、埃博拉或某種新疾病等。然后,使用工具內(nèi)置的地圖和圖表,用戶可以觀看模擬過程,并看到他們提出的治療方案的效果。
盡管這個工具專門用于傳染病的模擬,馬拉泰說,作為工具基礎(chǔ)的地理模型和統(tǒng)計合成人口是通用的,可以用于其他類型的災(zāi)難模擬,比如化學(xué)品泄漏、颶風(fēng)和電網(wǎng)的連鎖故障等。最終,他說:“我們的希望是建立這樣的模型,為你、你的家庭或你的城市提供個性化服務(wù)?!被蛘撸冒屠滋氐脑捳f:“如果我今天送吉米上學(xué),模型會告訴我,他感染寨卡病毒的可能性有多大?”
所以,這些模擬系統(tǒng)的用戶不僅僅是政府官員,巴雷特補(bǔ)充道,用戶將會是你,“這些模型會變得像谷歌地圖一樣常用?!?/p>