荊磊,劉明皓,陳春,曹逸凡,劉天林
1. 重慶郵電大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,重慶 400065;2. 重慶郵電大學(xué) 空間信息研究中心,重慶 400065;3. 重慶交通大學(xué) 建筑與城市規(guī)劃學(xué)院,重慶 400074;4. 重慶交通大學(xué) 生態(tài)人居與綠色交通研究中心,重慶 400074
新型冠狀病毒肺炎(Corona Virus Disease 2019,COVID-19)的快速傳播,對(duì)全球政治、經(jīng)濟(jì)和社會(huì)造成了嚴(yán)重危害[1].傳染病的傳播是個(gè)復(fù)雜的時(shí)空擴(kuò)散過(guò)程,對(duì)傳染病擴(kuò)散建模有助于理解傳染病的傳播機(jī)理與內(nèi)在規(guī)律[2].學(xué)術(shù)界針對(duì)COVID-19傳播進(jìn)行了大量的模擬研究,但如何通過(guò)模型的構(gòu)建揭示傳染病的傳播機(jī)制,提高對(duì)疫情傳播的時(shí)空預(yù)測(cè)預(yù)警能力仍面臨很大挑戰(zhàn).目前數(shù)量預(yù)測(cè)模型主要有傳染病動(dòng)力學(xué)模型,這類(lèi)模型根據(jù)人群的S,E,I,R狀態(tài)分為多個(gè)倉(cāng)室[S,E,I,R分別表示易感者(susceptible)、接觸者(exposed)、感染者(infected)、康復(fù)人群(removed)],采用微分方程刻畫(huà)人群數(shù)量的變化,主要用來(lái)預(yù)測(cè)疫情的拐點(diǎn)和規(guī)模.依據(jù)病原體、傳染性、感染后免疫、傳染源、傳播途徑、易感人群等流行病學(xué)特征,傳染病動(dòng)力學(xué)模型又可分為SI,SIS,SIR,SEIR等基本模型,分別適用于感染者不可恢復(fù)和治愈[3]、感染者治愈后可能反復(fù)感染[4]、感染者具有免疫力但潛伏期短且癥狀強(qiáng)烈[5]以及具有強(qiáng)免疫力但潛伏期較長(zhǎng)[6]這4種情況.根據(jù)COVID-19的流行病學(xué)特征(人傳人、癥狀前傳播、呼吸道吸出物、飛沫、接觸物和糞便傳播、易感者與年齡或性別無(wú)關(guān)、感染后免疫等),目前揭示COVID-19傳播機(jī)理的動(dòng)力學(xué)模型研究仍然以SEIR模型為主[7].數(shù)量預(yù)測(cè)方面,傳統(tǒng)數(shù)學(xué)模型主要考慮參數(shù)如何準(zhǔn)確地獲取,而機(jī)器學(xué)習(xí)主要考慮驅(qū)動(dòng)因子的相關(guān)性,另外,發(fā)揮不同時(shí)間序列模型優(yōu)勢(shì)的數(shù)量預(yù)測(cè)整合模型也相繼被開(kāi)發(fā)出來(lái)[8].除了數(shù)量預(yù)測(cè),揭示傳染病在空間上的擴(kuò)散規(guī)律與機(jī)理也是模型研究的重要方向,這類(lèi)模型主要包括多智能體[9]、CA模型等.SEIRD-agent模型用來(lái)模擬人類(lèi)活動(dòng)(如人為干預(yù)措施)對(duì)COVID-19疫情防控的效果[10-11].元胞自動(dòng)機(jī)(Cellular Automata,CA)是一種時(shí)間、空間、狀態(tài)都離散,空間相互作用和時(shí)間因果關(guān)系為局部的網(wǎng)格動(dòng)力學(xué)模型[12-16].近年來(lái),CA與傳染病預(yù)測(cè)模型相結(jié)合被廣泛應(yīng)用于傳染病傳播的模擬研究中[17-18].Almuzakki等[19]利用SEIR-CA模型模擬疫情在人群中的傳播方式和疫苗接種策略對(duì)傳播方式的影響;Cissé等[20]利用SEIR-CA模型證明鄰近元胞的空間分布對(duì)疾病傳播的實(shí)際影響;Medrek等[21]利用SEIR-CA模型模擬柵格與人數(shù)的對(duì)應(yīng)關(guān)系,但并沒(méi)有反映前一日感染者對(duì)后一日感染者的迭代過(guò)程;Gwizdaa[22]利用SEIR-CA從個(gè)體行為對(duì)群體的影響出發(fā),利用網(wǎng)絡(luò)中鄰居之間接觸人數(shù)的變化對(duì)干預(yù)措施進(jìn)行分析.
歸納起來(lái),目前對(duì)于傳染病的數(shù)量預(yù)測(cè)、聚集特征與擴(kuò)散機(jī)制的模型構(gòu)建主要集中在以下兩方面.一是從傳染病的傳統(tǒng)模型出發(fā),對(duì)一定統(tǒng)計(jì)區(qū)域的傳染病人數(shù)進(jìn)行推估,較少考慮細(xì)粒度的空間交互,如SEIR模型,這類(lèi)模型盡管有較好的時(shí)間分辨率,但空間分辨率很差;二是從CA出發(fā),CA模型盡可能地將研究區(qū)域劃分為較小的格網(wǎng)來(lái)模擬傳染病在不同情景下的空間擴(kuò)散情況.在一定程度上揭示了流行機(jī)理與內(nèi)在規(guī)律,但大多數(shù)研究沒(méi)有將傳染病的擴(kuò)散與生物生存環(huán)境的地理相似性有效結(jié)合起來(lái),不具有真正的生物地理學(xué)意義,本質(zhì)上是一種數(shù)值仿真模擬.鑒于其在模擬復(fù)雜系統(tǒng)時(shí)強(qiáng)大的時(shí)空演變過(guò)程能力,通過(guò)與機(jī)器學(xué)習(xí)和人工智能等算法的結(jié)合,構(gòu)建高時(shí)空分辨率的耦合模型,是傳染病傳播模型需進(jìn)一步探討的方向.另外,傳染病的空間擴(kuò)散,既存在空間上隨距離衰減的連續(xù)蔓延的擴(kuò)散方式,也存在從高級(jí)節(jié)點(diǎn)向低級(jí)節(jié)點(diǎn)城市滲透的空間跳躍式等級(jí)擴(kuò)散方式[23-24].傳染病的擴(kuò)散與蔓延是在一定時(shí)間、空間尺度上的傳播過(guò)程,其時(shí)空關(guān)系相互依存、不可分割[25-26].相關(guān)研究也發(fā)現(xiàn)傳染病感染者不僅具有很強(qiáng)的時(shí)間關(guān)聯(lián)性,而且感染者的空間分布與其生活的其他空間屬性也具有強(qiáng)相關(guān)性[27-30],因此構(gòu)建時(shí)空耦合模型,并將上述空間擴(kuò)散機(jī)制融入傳染病擴(kuò)散模型中用來(lái)揭示傳染病的空間傳播機(jī)制具有十分重要的理論和實(shí)踐意義.
本研究①為充分發(fā)揮SEIR模型和CA模型在時(shí)間分辨率預(yù)測(cè)和空間分辨率仿真方面的優(yōu)勢(shì),依據(jù)空間現(xiàn)象地理相似性原理,構(gòu)建了一種基于SEIRD-GEOCA的傳染病時(shí)空耦合模型;②在模型中融入接觸擴(kuò)散和隨機(jī)遷移擴(kuò)散策略,采用重慶市感染者軌跡數(shù)據(jù)和統(tǒng)計(jì)數(shù)據(jù)實(shí)現(xiàn)對(duì)重慶市COVID-19疫情時(shí)空分布的情景模擬和預(yù)測(cè),揭示COVID-19疫情的時(shí)空擴(kuò)散規(guī)律和傳播機(jī)理;③實(shí)現(xiàn)不同感染源與干預(yù)情景下的時(shí)空擴(kuò)散模擬與效應(yīng)評(píng)估.
本研究構(gòu)建了SEIRD-GEOCA時(shí)空耦合模型用于模擬COVID-19疫情的時(shí)空擴(kuò)散規(guī)律,該模型包括數(shù)量預(yù)測(cè)模塊、空間映射模塊和時(shí)空耦合模塊.數(shù)量預(yù)測(cè)模塊在經(jīng)典的SEIR模型基礎(chǔ)上引入了有無(wú)封城的情景,用來(lái)表示隨著時(shí)間變化新增的感染者數(shù)量;空間映射模塊利用CA模型將感染者分配到空間柵格上,將感染源分為本地潛在感染源和外部輸入感染源,加入了有無(wú)排查政策;時(shí)空耦合模塊將前2部分進(jìn)行整合,實(shí)現(xiàn)每日疫情地圖的動(dòng)態(tài)迭代.空間適宜性概率充分考慮地理相似性原理,即某種傳染病病毒的傳播和生存與”生物島”的大小、島與島的關(guān)聯(lián)性、自然環(huán)境與文化環(huán)境的相似性等密切相關(guān).
經(jīng)典SEIR模型將人群分為易感人群、接觸人群、感染人群和康復(fù)人群,但不能很好地表現(xiàn)政府干預(yù)措施的影響.該模型假設(shè)人群中所有個(gè)體都有被感染的概率,當(dāng)被感染個(gè)體痊愈后,會(huì)產(chǎn)生抗體.考慮到防治傳染病的隔離措施,在傳統(tǒng)SEIR模型上,將R細(xì)分為R和D,并調(diào)整封城前后每人每天接觸的人數(shù),形成新的傳染病動(dòng)力學(xué)模型SEIRD模型[7].
如圖1中SEIRD模型所示,S,E,I,R,D分別表示易感人群、接觸人群、感染人群、康復(fù)人群(治愈人群)、死亡人群;α代表每人每天接觸的人數(shù),β代表被感染的概率,α×β代表感染力;σ代表E轉(zhuǎn)為I的概率;γ代表I轉(zhuǎn)為R的概率(治愈率);κ代表I轉(zhuǎn)為D的概率(致死率).
SEIRD模型如下所示:
(1)
式中:St代表t時(shí)刻易感人數(shù),對(duì)應(yīng)統(tǒng)計(jì)數(shù)據(jù)中的健康人數(shù),S=N-E-I-R-D;Et代表t時(shí)刻接觸人數(shù),對(duì)應(yīng)統(tǒng)計(jì)數(shù)據(jù)中的新增疑似人數(shù);It代表t時(shí)刻感染人數(shù),對(duì)應(yīng)統(tǒng)計(jì)數(shù)據(jù)中的新增確診人數(shù);Rt代表t時(shí)刻治愈人數(shù),對(duì)應(yīng)統(tǒng)計(jì)數(shù)據(jù)中的累計(jì)治愈人數(shù);Dt代表t時(shí)刻死亡人數(shù),對(duì)應(yīng)統(tǒng)計(jì)數(shù)據(jù)中的累計(jì)死亡人數(shù);N代表總?cè)丝跀?shù),對(duì)應(yīng)研究區(qū)域內(nèi)的總?cè)丝跀?shù);t代表時(shí)間;α代表每人每天接觸的人數(shù),與防控政策有關(guān).封城隔離前,α=15,封城隔離后,α=3[6];β1代表感染人群的感染率;β2代表潛伏人群的感染率;σ代表潛伏人群(E)轉(zhuǎn)為感染人群(I)的概率;γ代表感染人群(I)轉(zhuǎn)為治愈人群(R)的概率(即治愈率);κ代表感染人群(I)轉(zhuǎn)為死亡人群(D)的概率(即致死率).
GEOCA模塊將研究區(qū)域劃分為若干個(gè)均質(zhì)空間.為了簡(jiǎn)化計(jì)算,GEOCA狀態(tài)設(shè)置為感染與非感染2種狀態(tài),其中感染格網(wǎng)還記錄該格網(wǎng)在病毒生命周期范圍內(nèi)(7 d)感染者的累計(jì)數(shù)量.格網(wǎng)轉(zhuǎn)換規(guī)則最終受全局影響因素(如適宜性、約束性和隨機(jī)性)和局部影響因素(如鄰域)的影響.通過(guò)建立影響疾病傳播的空間驅(qū)動(dòng)因子與疾病分布的相關(guān)關(guān)系,借助機(jī)器學(xué)習(xí)等相關(guān)算法,學(xué)習(xí)觀測(cè)時(shí)段內(nèi)某傳染性疾病在不同空間位置發(fā)生的概率,形成傳染性疾病的空間適宜性概率地圖.同時(shí)通過(guò)整合傳染性疾病的空間適宜性、約束性概率、鄰域概率和隨機(jī)概率等形成綜合概率.GEOCA模塊中如何完成新增患者數(shù)量的空間配置十分關(guān)鍵.本研究采用2種策略(蔓延擴(kuò)散策略和隨機(jī)遷移擴(kuò)散策略)完成新增傳染性疾病個(gè)體的空間配置.蔓延擴(kuò)散策略依據(jù)傳染鄰域概率的高低來(lái)完成新增傳染者個(gè)體的空間配置.隨機(jī)遷移擴(kuò)散策略依據(jù)某格網(wǎng)空間綜合概率越高,新增傳染性疾病的個(gè)體映射到該格網(wǎng)空間的可能性越大的原則完成新增傳染者個(gè)體的空間配置.根據(jù)地理學(xué)第三定律,地理環(huán)境越相似,在該環(huán)境中地理個(gè)體的目標(biāo)特征相近的概率越大.借助地理相似性原理可判斷某區(qū)域與感染區(qū)域是否具有相似的環(huán)境特征,一旦種子點(diǎn)落入該環(huán)境,則該區(qū)域傳染該病毒的可能性也比較大.可通過(guò)機(jī)器學(xué)習(xí)方法獲得觀測(cè)期間新冠病毒的空間適宜性(見(jiàn)圖1).
CA模型中每個(gè)元胞的總體轉(zhuǎn)換概率取決于疫情發(fā)展的適宜性Ps、鄰域效應(yīng)Ω與限制因素Pc.疫情發(fā)展的適宜性通過(guò)隨機(jī)森林算法計(jì)算得到.隨機(jī)森林利用多棵決策樹(shù)對(duì)樣本進(jìn)行訓(xùn)練預(yù)測(cè),可用于回歸和分類(lèi)預(yù)測(cè)算法中,屬于集成學(xué)習(xí)的bagging算法[24-25],如式(2)所示.
(2)
(3)
在疫情擴(kuò)張模擬研究中,非感染元胞i在時(shí)刻t轉(zhuǎn)換為感染元胞的概率可表示為
(4)
鄰域效應(yīng)是CA模型的重要組成部分,代表n×n鄰域范圍內(nèi)的中心元胞與周邊元胞的相互作用.具體表現(xiàn)為中心元胞n×n鄰域范圍內(nèi)感染元胞的密度.元胞i在時(shí)刻t的鄰域效應(yīng)可表示為
(5)
限制因素約束了特殊區(qū)域向感染者所在柵格的轉(zhuǎn)換.在實(shí)際疫情擴(kuò)張過(guò)程中,考慮到地理和政策因素,諸如水體和無(wú)人區(qū)等不會(huì)轉(zhuǎn)變?yōu)楦腥緰鸥?限制因素可表示為
(6)
其中,LUk表示第k種土地利用類(lèi)型;當(dāng)元胞i在時(shí)刻t滿(mǎn)足擴(kuò)張約束條件時(shí),con()取值為1,否則取值為0.本研究對(duì)河流、湖泊、無(wú)人區(qū)進(jìn)行限制,規(guī)定其不會(huì)轉(zhuǎn)換為城市.
因此,元胞i在時(shí)刻t的總體轉(zhuǎn)換概率可表示為
(7)
CA模型的最終停止條件為
(8)
其中,A代表將新增加的n個(gè)感染者分配到空間柵格的疫情地圖圖層.Ai代表第i個(gè)感染者所在元胞的位置.
本研究利用CA模型的動(dòng)態(tài)演化特征,將CA模型用于新型冠狀病毒感染者的空間分布模擬中,充分發(fā)掘其空間動(dòng)態(tài)演化規(guī)則.SEIRD模型產(chǎn)生每日感染者的數(shù)量,CA模型分配感染者.時(shí)空耦合模塊通過(guò)構(gòu)建約束函數(shù)將上述2種模型耦合,形成CA迭代與轉(zhuǎn)換規(guī)則,完成模型的運(yùn)算(見(jiàn)圖1).
時(shí)空耦合模型的最終停止條件可表示為
(9)
其中,A代表預(yù)測(cè)期間累計(jì)n天時(shí)間范圍內(nèi)待分配感染者最終被分配的疫情地圖圖層;Aij代表第i天第j個(gè)感染者所在元胞的位置.
重慶市位于中國(guó)西南部,地跨東經(jīng) 105°11′~110°11′、北緯 28°10′~32°13′,是青藏高原與長(zhǎng)江中下游平原的過(guò)渡地帶.東鄰湖北、湖南,南靠貴州,西接四川,北連陜西,總面積約 8.24萬(wàn)平方千米,轄26個(gè)市,8個(gè)縣,4個(gè)自治縣.重慶市鄰近湖北,與湖北人員來(lái)往頻繁,受COVID-19疫情影響較大.疫情期間,重慶市先后設(shè)立新型冠狀病毒肺炎治療定點(diǎn)醫(yī)院48個(gè),故選擇重慶作為研究區(qū)域.
圖片來(lái)源于國(guó)家基礎(chǔ)地理信息中心標(biāo)準(zhǔn)地圖服務(wù)網(wǎng)站“中國(guó)分省地圖—重慶市”,審圖號(hào)為GS(2019)3333.圖2 研究區(qū)域示意圖
COVID-19疫情數(shù)據(jù)主要來(lái)自國(guó)家衛(wèi)生健康委員會(huì)官網(wǎng)(http://www.nhc.gov.cn/)、世界衛(wèi)生組織(https://www.who.int/westernpacific)、MIDAS network等官方公布的統(tǒng)計(jì)數(shù)據(jù).從MIDAS network的統(tǒng)計(jì)數(shù)據(jù)可看出,重慶市COVID-19疫情新增確診者主要分布在2020年1月21日至2月29日,故選取該時(shí)間段數(shù)據(jù)對(duì)重慶市COVID-19疫情進(jìn)行分析模擬預(yù)測(cè).本研究使用的COVID-19數(shù)據(jù)包括統(tǒng)計(jì)數(shù)據(jù)和感染者軌跡數(shù)據(jù),統(tǒng)計(jì)數(shù)據(jù)涉及新增疑似、新增確診、累計(jì)死亡、累計(jì)治愈等,數(shù)據(jù)來(lái)自美國(guó)匹茲堡大學(xué)公共衛(wèi)生研究生院公共衛(wèi)生動(dòng)力學(xué)實(shí)驗(yàn)室(Public Health Dynamics Lab,PHDL).感染者軌跡數(shù)據(jù)通過(guò)華龍網(wǎng)獲取.
考慮到COVID-19的傳播與人類(lèi)活動(dòng)密切相關(guān),本文選取自然環(huán)境和社會(huì)經(jīng)濟(jì)2類(lèi)數(shù)據(jù)作為影響其傳播的主要驅(qū)動(dòng)因子(見(jiàn)表1).
將表中的異構(gòu)數(shù)據(jù)統(tǒng)一研究區(qū)域范圍、空間坐標(biāo)系和分辨率.9類(lèi)POI數(shù)據(jù)采用網(wǎng)絡(luò)爬蟲(chóng)軟件爬取后,進(jìn)行核密度分析獲得核密度分布圖層.由于COVID-19感染者的分布與用地類(lèi)型有一定的相關(guān)性,水域和無(wú)人區(qū)完全不可能出現(xiàn)COVID-19感染者,故本研究將用地類(lèi)型重新分為3類(lèi),其中未利用土地和水域等無(wú)人區(qū)分為1類(lèi),耕地、林地、草地分為1類(lèi),城鄉(xiāng)居民用地分為1類(lèi).無(wú)人區(qū)作為模型構(gòu)建過(guò)程中的約束概率層.高程數(shù)據(jù)來(lái)自ASTERGDEM,分辨率為30m,經(jīng)過(guò)掩膜提取得到重慶市的高程圖層;借助ARCGIS經(jīng)過(guò)坡度計(jì)算得到坡度圖層.距河流、鐵路、高速公路、主干道、二級(jí)道路的距離數(shù)據(jù)來(lái)源于開(kāi)放街道地圖(Open Street Map,OSM),在ARCGIS中經(jīng)過(guò)歐氏距離分析得到各交通線路的歐氏距離圖層.重慶市COVID-19感染者活動(dòng)軌跡數(shù)據(jù)來(lái)源于華龍網(wǎng),首先將COVID-19感染者文本信息中涉及的小區(qū)、街道、村、鄉(xiāng)鎮(zhèn)、縣等位置數(shù)據(jù)通過(guò)網(wǎng)絡(luò)爬蟲(chóng)軟件在高德地圖中爬取其對(duì)應(yīng)的帶地理坐標(biāo)的點(diǎn)數(shù)據(jù),然后進(jìn)行坐標(biāo)轉(zhuǎn)換(GCJ-02→WGS-84),從而得到不同時(shí)間COVID-19感染者的位置分布圖層.
表1 空間模型驅(qū)動(dòng)因子的選擇和數(shù)據(jù)說(shuō)明
3.1.1 SEIRD模型構(gòu)建
采集重慶市2020.1.21-2020.2.29的COVID-19感染者統(tǒng)計(jì)數(shù)據(jù)進(jìn)行探索性分析(圖3a),將COVID-19感染者統(tǒng)計(jì)數(shù)據(jù)和采用SEIRD模型模擬的結(jié)果進(jìn)行對(duì)比(圖3b),從數(shù)據(jù)走勢(shì)可看出,實(shí)際數(shù)據(jù)曲線趨勢(shì)與SEIRD曲線趨勢(shì)相同,表明SEIRD模型能夠有效反映COVID-19感染者數(shù)量的發(fā)展趨勢(shì).COVID-19存活時(shí)間為2~14 d,將平均潛伏期定為符合報(bào)道的7 d,死亡率設(shè)置為3%[6].在采取嚴(yán)格的防控措施下,感染者數(shù)量峰值顯著降低,疫情高峰更早地到來(lái).
圖3b中,藍(lán)色曲線反映實(shí)際感染者數(shù)量隨天數(shù)的變化情況,紅色曲線代表模擬的感染者數(shù)量在有干預(yù)的情況下隨天數(shù)的變化情況.采用SEIRD模型,對(duì)重新調(diào)優(yōu)后的模擬感染者曲線進(jìn)行格網(wǎng)搜索,尋找最優(yōu)參數(shù).實(shí)驗(yàn)得出,在β1為0.02,β2為0.03,σ為0.2,γ為0.29時(shí),這條曲線擬合效果最好.
3.1.2 融入不同擴(kuò)散策略的GEOCA模型構(gòu)建
1) 基于地理相似性原理的概率圖層生成
COVID-19疫情的傳播與人類(lèi)活動(dòng)密切相關(guān).本文選用隨機(jī)森林(利用多棵樹(shù)對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)的一種分類(lèi)器)算法,以重慶市為研究區(qū)域,將高程、坡度、用地類(lèi)型、河流作為自然環(huán)境驅(qū)動(dòng)因子,將醫(yī)院、學(xué)校、賓館、購(gòu)物、餐飲、風(fēng)景名勝、娛樂(lè)場(chǎng)所、銀行、車(chē)站站點(diǎn)、鐵路、高速公路、主干道、二級(jí)道路、人口密度作為社會(huì)經(jīng)濟(jì)驅(qū)動(dòng)因子,將2020年1月21日到2020年2月29日整個(gè)時(shí)間范圍內(nèi)疫情感染者的空間位置作為標(biāo)簽,進(jìn)行回歸,得到適宜性概率層(Ps),如圖1綜合空間適宜性概率所示.
圖3 COVID-19統(tǒng)計(jì)分析與SEIRD感染者數(shù)量模擬
隨機(jī)森林可利用袋外數(shù)據(jù)計(jì)算驅(qū)動(dòng)因子的重要性.各個(gè)驅(qū)動(dòng)因子中銀行核密度對(duì)感染者分布影響最大,其次各種興趣點(diǎn)以及人口是影響疫情感染者分布的重要因素,說(shuō)明社會(huì)經(jīng)濟(jì)因素對(duì)疫情感染者分布具有主要影響力.另外,高程坡度、用地類(lèi)型等對(duì)感染者分布影響較弱,原因在于重慶以丘陵和山地為主,坡度面積較大,城市基本在復(fù)雜的地形地貌上進(jìn)行擴(kuò)張,因此感染者的空間分布對(duì)地理環(huán)境相對(duì)不敏感.
2) 空間擴(kuò)散策略的實(shí)現(xiàn)
如何將預(yù)測(cè)的新增感染者映射到某一格網(wǎng)空間,實(shí)現(xiàn)從數(shù)量預(yù)測(cè)到空間位置預(yù)測(cè)的轉(zhuǎn)變,是該時(shí)空耦合模型構(gòu)建的關(guān)鍵.空間擴(kuò)散建模需模擬傳染病的2種空間擴(kuò)散機(jī)制:一種是輸入型病例,另一種是在已有病例基礎(chǔ)上的接觸蔓延(“生根發(fā)芽”).本研究采用2種策略,一種是蔓延擴(kuò)散策略,另一種是隨機(jī)遷移擴(kuò)散策略.
① 蔓延擴(kuò)散策略
在某一格網(wǎng)位置一旦發(fā)現(xiàn)有COVID-19感染者,病毒便依托已有感染者沿著交際鏈、交通鏈按一定概率在“生物島”內(nèi)近距離接觸擴(kuò)散.它的傳播與人際交往、防護(hù)措施和病毒防范意識(shí)等密切相關(guān),以聚會(huì)或親朋交往等近距離接觸傳播為主.其觀測(cè)區(qū)域是已有COVID-19感染者分布格網(wǎng)的近鄰區(qū)域.鑒于蔓延擴(kuò)散以“在地型”病例或已“落地生根”的輸入型病例近距離蔓延為特征,因此預(yù)測(cè)的新增感染者位置落在何處同時(shí)受傳染周期內(nèi)已有的COVID-19感染者的位置分布和鄰域概率影響.本研究擬將已有COVID-19感染者柵格作為候選點(diǎn),使得在該點(diǎn)鄰域范圍內(nèi),綜合概率圖層最大者,新增感染者落在該點(diǎn)的可能性最大,即已有的COVID-19感染者柵格鄰域范圍內(nèi)概率大者優(yōu)先配置位置,直到新增感染者全部分配完畢,完成蔓延擴(kuò)散策略(見(jiàn)圖1).隨機(jī)遷移擴(kuò)散和蔓延擴(kuò)散在時(shí)間上將同時(shí)發(fā)生.如COVID-19患者發(fā)生位置移動(dòng),則擴(kuò)散方式由蔓延擴(kuò)散轉(zhuǎn)變?yōu)殡S機(jī)遷移擴(kuò)散.
② 隨機(jī)遷移擴(kuò)散策略
因COVID-19接觸者從感染到爆發(fā)具有潛伏期,且在潛伏期已經(jīng)具有傳染性,使得病毒從源頭通過(guò)中間宿主輸入到”生物島”,在病毒爆發(fā)直至采取隔離措施之前,接觸者并不知道該病毒是什么,來(lái)自何方,去往何處.因此這里的隨機(jī)擴(kuò)散是指在對(duì)病毒位置信息雙盲情形下,病毒傳播宛如“隨風(fēng)飄散的蒲公英”,蒲公英種子點(diǎn)到底花落何家,一切隨機(jī)(病毒的初始傳播具有很強(qiáng)的隨機(jī)性和危害性).隨機(jī)遷移擴(kuò)散主要表現(xiàn)為通過(guò)交通鏈在“生物島”間的遠(yuǎn)距離輸入性傳播,它類(lèi)似蛙跳在不同的”生物島”間跳躍性遷移擴(kuò)散.隨機(jī)擴(kuò)散在傳染病早期表現(xiàn)比較明顯,即使后期采取核酸檢測(cè)、禁足限行等措施,大大減少了傳播的強(qiáng)度,但也常有“漏網(wǎng)之魚(yú)”,如時(shí)有發(fā)生的輸入性病例就是隨機(jī)遷移擴(kuò)散的表現(xiàn).
由于遠(yuǎn)距離流通形式(物流、人流)的存在,增強(qiáng)了種子點(diǎn)在“生物島”之間或島內(nèi)不確定性位置上傳播的可能性,使得采取隨機(jī)遷移擴(kuò)散策略成為必要.隨機(jī)遷移擴(kuò)散策略的觀測(cè)區(qū)域是整個(gè)研究區(qū)域的各“生物島”.鑒于預(yù)測(cè)的新增感染者個(gè)體可能通過(guò)輸入的方式以不同的概率進(jìn)入“生物島”的任何格網(wǎng)空間,因此本研究借助輪盤(pán)賭的思想,在COVID-19感染空間適宜性圖層上疊加隨機(jī)因子,實(shí)現(xiàn)新增感染者在空間上的隨機(jī)遷移擴(kuò)散策略(見(jiàn)圖1).
當(dāng)然,隨著時(shí)間的推移,預(yù)測(cè)的感染者數(shù)量與位置將不斷得到糾正,通過(guò)元胞的不斷更新迭代,得到若干日的疫情分布圖層.時(shí)間越長(zhǎng)學(xué)習(xí)的知識(shí)越充分,預(yù)測(cè)能力越強(qiáng).為了實(shí)現(xiàn)一日感染者空間分布圖層,將適宜性概率層與用地類(lèi)型重分類(lèi)后得到的約束性概率層(Pcon)相乘得到全局概率層(Pglo),根據(jù)前一日疫情地圖圖層,按柵格的概率選取一個(gè)感染者所在的柵格作為種子點(diǎn)(i,j),即可得到該種子點(diǎn)在全局概率層中的綜合概率,由ROI(PROI)相乘鄰域概率層(Pnei)得到,按照柵格概率隨機(jī)選取感染柵格,重復(fù)上述過(guò)程,待當(dāng)日感染者全部分配完成后,即完成一次CA迭代.COVID-19疫情的傳播表現(xiàn)為外界輸入和繼發(fā)性蔓延機(jī)制,前者表現(xiàn)為隨機(jī)突變點(diǎn),發(fā)生在疫情早期,后者表現(xiàn)為從本地種子點(diǎn)蔓延到周邊柵格,發(fā)生在疫情中后期.
3.1.3 時(shí)空耦合模型構(gòu)建
將SEIRD模型與GEOCA模型相結(jié)合,在封城有排查,平均潛伏期為7 d的情景下,利用前7日的感染者圖層結(jié)合第8日感染者的數(shù)目,產(chǎn)生第8日的疫情地圖圖層,依次迭代,即可得到整個(gè)時(shí)間段的疫情地圖圖層,從而完成時(shí)空耦合模型的構(gòu)建.
3.2.1 對(duì)比方案設(shè)計(jì)
本研究基于以下假設(shè):
1) 使用不同的圖層(感染者核密度圖層、實(shí)際人數(shù)柵格圖層以及有無(wú)感染者的01柵格圖層)作為鄰域分析圖層,將對(duì)結(jié)果產(chǎn)生影響,且差異有統(tǒng)計(jì)學(xué)意義.
2) 模擬過(guò)程中,是否采取干預(yù)措施以及采取不同的干預(yù)措施將對(duì)結(jié)果產(chǎn)生影響且差異有統(tǒng)計(jì)學(xué)意義.
3) 將新聞報(bào)道中的2~14 d的潛伏期設(shè)為7 d.
選取2020年1月21日到2020年2月29日的COVID-19感染者統(tǒng)計(jì)數(shù)據(jù)和點(diǎn)數(shù)據(jù),針對(duì)上述假設(shè)設(shè)計(jì)了5種對(duì)比方案,并分別與實(shí)際疫情地圖圖層進(jìn)行對(duì)比分析,其具體方案為:
方案一(封城有排查kernel):采取封城有排查的干預(yù)措施,用感染者核密度圖層作為鄰域分析圖層,簡(jiǎn)稱(chēng)kernel,采用SEIRD-GEOCA模型模擬感染者時(shí)空分布.
方案二(封城有排查pop):采取封城有排查的干預(yù)措施,用實(shí)際人數(shù)柵格分布圖層作為鄰域分析圖層,簡(jiǎn)稱(chēng)pop,采用SEIRD-GEOCA模型模擬感染者時(shí)空分布.
方案三(封城有排查01):采取封城有排查的干預(yù)措施,用感染者01柵格分布圖層作為鄰域分析圖層,簡(jiǎn)稱(chēng)01,采用SEIRD-GEOCA模型模擬感染者時(shí)空分布.
方案四(封城無(wú)排查):采取封城無(wú)排查的干預(yù)措施,用實(shí)際人數(shù)柵格圖層作為鄰域分析圖層,采用SEIRD-GEOCA模型模擬感染者時(shí)空分布.
方案五(無(wú)干預(yù)):不采取干預(yù)措施,用實(shí)際人數(shù)柵格圖層作為鄰域分析圖層,采用SEIRD-GEOCA模型模擬感染者時(shí)空分布.
這里的有排查是指針對(duì)疫情發(fā)展?fàn)顩r,積極采取必要的隔離(限行、禁足、集中隔離)、病例調(diào)查、紅外溫度計(jì)測(cè)溫和核酸檢測(cè)等措施.在模型中表現(xiàn)為通過(guò)調(diào)整種子點(diǎn)的生命周期,使得種子點(diǎn)在病毒潛伏期內(nèi)能感染其他人,但超過(guò)7 d,由于對(duì)種子點(diǎn)采取了積極的隔離和治療等措施,從而使得種子點(diǎn)自動(dòng)消亡.無(wú)排查是指針對(duì)疫情發(fā)展?fàn)顩r,未及時(shí)采取必要的排查措施,在模型中表現(xiàn)為種子點(diǎn)在病毒潛伏期內(nèi)不會(huì)失活,種子點(diǎn)將會(huì)一直傳染他人.封城措施是指針對(duì)疫情發(fā)展?fàn)顩r,政府采取了果斷的城市封鎖政策,防止疫情在城外快速擴(kuò)張.在模型中表現(xiàn)為讓種子點(diǎn)每天接觸的人數(shù)從無(wú)任何防護(hù)措施的情況下接觸15人/日,調(diào)整到3人/日.通過(guò)調(diào)控種子點(diǎn)是否消亡區(qū)分有無(wú)排查,通過(guò)調(diào)整SEIRD模型接觸人數(shù)來(lái)區(qū)分是否封城.
3.2.2 對(duì)比方案設(shè)計(jì)
分別從柵格尺度和區(qū)縣尺度,利用均方誤差(Mean Square Error,MSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)對(duì)模型的精度進(jìn)行檢驗(yàn).
均方誤差是各數(shù)據(jù)偏離真實(shí)值差值平方和的平均數(shù),也就是誤差平方和的平均數(shù);平均絕對(duì)誤差是指觀測(cè)值與真實(shí)值的誤差絕對(duì)值的平均值;均方根誤差是指觀測(cè)值與真實(shí)值偏差的平方和與觀測(cè)次數(shù)n比值的平方根.
選取重慶市2020年1月21日到2020年2月29日的感染者為研究對(duì)象,通過(guò)SEIRD-GEOCA模型得到不同情形下感染者的空間分布模擬結(jié)果,同時(shí)將不同情形下的模擬結(jié)果和真實(shí)環(huán)境下的COVID-19感染者時(shí)空分布進(jìn)行對(duì)比(表2).同時(shí),采用核密度制圖法直觀展示模擬結(jié)果,并與觀測(cè)期間真實(shí)環(huán)境下的COVID-19感染者時(shí)空分布進(jìn)行對(duì)比(見(jiàn)圖4).
表2 不同情景模擬結(jié)果與真實(shí)情況的對(duì)比
圖4 不同方案下COVID-19感染者空間分布模擬結(jié)果對(duì)比圖
方案一、二、三表明,MSE,MAE,RMSE三者差距并不顯著,且上述三類(lèi)誤差的最大偏離度為5.52%.但相較于實(shí)際人數(shù)柵格圖層和有無(wú)感染者的01柵格圖層,選取感染者核密度圖層作為鄰域分析圖層能獲得更好的可視化效果(方案一)(圖4a).根據(jù)表2各項(xiàng)指標(biāo)可看出,方案一中各精度項(xiàng)指標(biāo)比其他方案稍?xún)?yōu).方案二的擴(kuò)散中心圍繞著以主城區(qū)為核心的渝西南地區(qū),與實(shí)際情況稍有偏離(圖4b),方案三的擴(kuò)散中心則圍繞著以萬(wàn)州區(qū)為核心的渝東北地區(qū),與實(shí)際情況偏離程度最大(圖4c).因此,方案一更顯合理.方案一、四對(duì)比可看出,在封城的前提下,相較于有排查情形,無(wú)排查情形呈現(xiàn)出團(tuán)簇現(xiàn)象,表明封城無(wú)排查會(huì)產(chǎn)生超級(jí)傳播者,在人口較為集中的區(qū)域傳播.方案一、五對(duì)比可看出,有無(wú)干預(yù)對(duì)COVID-19疫情空間擴(kuò)散影響顯著,防控措施可有效地遏制COVID-19疫情大面積傳播.重慶重點(diǎn)防控區(qū)域?yàn)橐匀f(wàn)州區(qū)為核心的渝東北地區(qū)和以主城區(qū)為核心的渝西南地區(qū).從數(shù)量來(lái)看,無(wú)干預(yù)比有干預(yù)在觀測(cè)期間里數(shù)量上要多很多倍,無(wú)干預(yù)使得局面失控,整個(gè)重慶市形成了以各區(qū)縣為中心的眾多熱點(diǎn)區(qū)域.
本研究賦予CA模型生物地理學(xué)意義,構(gòu)建了一種基于SEIRD-GEOCA的COVID-19疫情時(shí)空分布模型,在模型中融入蔓延擴(kuò)散和隨機(jī)遷移擴(kuò)散策略,設(shè)計(jì)了5種方案用于驗(yàn)證干預(yù)措施,同時(shí)驗(yàn)證鄰域分析圖層的不同是否對(duì)傳染病時(shí)空模擬結(jié)果產(chǎn)生影響.
結(jié)果顯示:① 采用SEIRD-GEOCA時(shí)空耦合模型,能很好地模擬COVID-19疫情的時(shí)空擴(kuò)散;② 是否采取封城措施在空間分布上呈現(xiàn)出明顯的爆發(fā)式擴(kuò)散和局部區(qū)域擴(kuò)散的差別;③ 實(shí)施不同的干預(yù)措施呈現(xiàn)出了不同的時(shí)空擴(kuò)散效應(yīng).封城措施下,有排查能有效避免產(chǎn)生超級(jí)傳播者.采取干預(yù)措施,感染者數(shù)量大幅度降低,空間上的擴(kuò)散被約束在很小的區(qū)域.
傳統(tǒng)的SEIR模型只提供了數(shù)量預(yù)測(cè),并不能給出空間擴(kuò)散上的指導(dǎo).SEIRD-GEOCA模型在歷史觀測(cè)數(shù)據(jù)基礎(chǔ)上,借助SEIRD模型預(yù)測(cè)新增確診病例,采用隨機(jī)種子點(diǎn)與已有的概率地圖圖層結(jié)合來(lái)預(yù)測(cè)未來(lái)空間的擴(kuò)散情況,研究范圍內(nèi)精度較高,可以較好地滿(mǎn)足COVID-19疫情的時(shí)空預(yù)測(cè).