吳 姍
(華北水利水電大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,河南 鄭州 450046)
2019年12 月,湖北省武漢市報(bào)告了不明原因肺炎病例,疫情發(fā)生后武漢地區(qū)采取了嚴(yán)厲的防控措施,由于武漢市特殊的交通地理區(qū)位,新冠肺炎疫情很快蔓延至中國(guó)其他省市,特別是湖北省內(nèi)城市[1],并逐漸波及各地。醫(yī)療衛(wèi)生領(lǐng)域科學(xué)家曾提出,新型冠狀病毒病大概率會(huì)間歇性暴發(fā),并且有概率會(huì)與人類(lèi)長(zhǎng)期共存。目前關(guān)于COVID-19時(shí)空演變特征的研究主要包括對(duì)疫情發(fā)展的預(yù)測(cè)、確診病例時(shí)空聚集的探測(cè)以及確診病例分布的影響因素分析。文獻(xiàn)[2]中提出確診病例時(shí)空聚集的探測(cè)常采用的方法有描述性統(tǒng)計(jì)分析、時(shí)空掃描統(tǒng)計(jì)和空間自相關(guān)分析。Kang等[3]發(fā)現(xiàn)中國(guó)省級(jí)尺度疫情存在顯著的空間相關(guān)性。武文韜等[4]以廣東省為研究對(duì)象,側(cè)重于分析確診病例在該區(qū)域的分布特征,從而對(duì)疫情的發(fā)展趨勢(shì)做出預(yù)測(cè)。簡(jiǎn)子菡等[5]從鎮(zhèn)域尺度對(duì)河南省新冠肺炎疫情病例的時(shí)空演化特征進(jìn)行分析,結(jié)論表明疫情在空間上整體呈現(xiàn)“南重北輕”,確診病例數(shù)東南多西北少。Mo等[6]使用時(shí)空立方體研究中國(guó)各城市的疫情熱點(diǎn)區(qū)域。Xiong等[7]發(fā)現(xiàn)湖北各縣市的疫情與人口、經(jīng)濟(jì)等因素相關(guān)。Jia等[8]發(fā)現(xiàn)在疫情早期,各省的累積確診病例與當(dāng)?shù)厝丝跀?shù)的相關(guān)性不顯著,而與從武漢輸入當(dāng)?shù)氐娜藬?shù)相關(guān)性很強(qiáng)。
了解疾病的空間動(dòng)態(tài)及其與社會(huì)因素之間的關(guān)系,有利于確定感染傳播潛力增大的地區(qū)、優(yōu)先在這些地區(qū)采取預(yù)防和控制措施,加大衛(wèi)生系統(tǒng)對(duì)治療病例的管控。本研究通過(guò)對(duì)確診病例進(jìn)行空間自相關(guān)分析,描述其時(shí)間和空間上的聚集性。通過(guò)空間回歸分析模型探索影響確診病例的空間分布相關(guān)因素,有助于公共決策者更好地規(guī)劃衛(wèi)生政策干預(yù)措施,為今后此類(lèi)傳染病防控提供參考。
本文以2020年1月23日至3月25日湖北及鄰省區(qū)為研究區(qū)域來(lái)探索新冠肺炎疫情的時(shí)空分布特征,湖北省是此次疫情爆發(fā)的起點(diǎn),其周?chē)貐^(qū)與湖北交通來(lái)往密切且人口眾多,皆在疫情早期受到了不同程度的影響。以湖北及鄰省區(qū)為研究區(qū)可以直觀地反映人群遷徙及社會(huì)因素對(duì)COVID-19疫情擴(kuò)散的影響。
2020年1 月下旬至2月中旬是華中地區(qū)疫情傳播的主要階段,本次搜集了研究區(qū)域各省衛(wèi)生健康委員會(huì)2020年1月23日至3月25日每日疫情通報(bào)信息中確診病例和每日新增病例數(shù)據(jù),湖北及鄰省各行政區(qū)劃地圖數(shù)據(jù)以及百度遷徙大數(shù)據(jù)平臺(tái)1月13日至1月23日期間武漢市的人口遷徙指數(shù)及遷出人口比例數(shù)據(jù),湖北省、河南省、安徽省、江西省、湖南省、重慶市和陜西省2020年統(tǒng)計(jì)年鑒人口密度數(shù)據(jù)。
研究分別從時(shí)間和空間的角度對(duì)疫情的演變趨勢(shì)以及聚集性特征進(jìn)行分析。在時(shí)間上分析了新冠肺炎確診病例的演變趨勢(shì)??臻g上分析了聚集性特征,探尋湖北及鄰省地區(qū)累計(jì)確診病例的具體聚集區(qū)域,最后采用了空間回歸分析的方法來(lái)探究影響疫情確診病例的因素。
空間自相關(guān)檢驗(yàn)方法是檢驗(yàn)?zāi)骋灰貙傩灾翟诳臻g范圍內(nèi)是否與其鄰近空間點(diǎn)的屬性值相關(guān)聯(lián)的重要指標(biāo),一般來(lái)說(shuō),方法在功能上可大致分為兩大類(lèi):一類(lèi)為全局型(Global Spatial Autocorrelation),另一類(lèi)是局部型(Local Spatial Autocorrelation)。全局空間自相關(guān)用于探測(cè)整個(gè)研究區(qū)域的空間模式,這種相關(guān)性的大小由Moran值表示,Moran’sI的取值范圍在-1和1之間,Mroan’sI>0表示存在正的空間自相關(guān),Mroan’sI<0表示存在負(fù)的空間相關(guān)性,Mroan’sI=0表示不存在空間上的相關(guān)關(guān)系,其計(jì)算公式為:
其中,N為湖北及鄰省各地級(jí)市個(gè)數(shù)(即N=87),y為各市截至2020年3月25日新冠肺炎累計(jì)確診人數(shù);yˉ為各市累計(jì)確診人數(shù)的均值;wij為空間權(quán)重矩陣。
全局空間自相關(guān)的功能在于描述某個(gè)現(xiàn)象的整體分布狀況,判斷此種現(xiàn)象在空間是否有聚集特性存在,但是卻不能具體地指出聚集的區(qū)域。這時(shí)就可以采用局部空間自相關(guān)(Local Spatial Autocorrelation)對(duì)各地級(jí)市累計(jì)確診人數(shù)進(jìn)行局部特征進(jìn)行分析,LocalMoran’sI計(jì)算公式如下:
公式(2)中的變量與公式(1)變量相同[9]。
構(gòu)建空間權(quán)重矩陣是空間建模的基本前提,權(quán)重矩陣類(lèi)型可劃分為鄰接的空間權(quán)重矩陣和基于距離的空間權(quán)重矩陣,空間鄰接關(guān)系可分為三種類(lèi)型:Bishop鄰接、Rock鄰接以及Queen鄰接,Bishop是共頂點(diǎn)連接,Rock為共鄰邊連接,Queen是即共頂點(diǎn)又共鄰邊連接。
空間回歸分析模型可應(yīng)用于對(duì)存在空間相關(guān)性的事故數(shù)據(jù)的研究??臻g回歸模型主要包括空間滯后模型,空間誤差模型以及空間自回歸組合(SAC)模型[10]??臻g滯后模型是一種考察一個(gè)地級(jí)市的感染人數(shù)是如何受鄰近市的感染人數(shù)影響的模型,空間誤差模型估計(jì)了一個(gè)市的普通最小二乘殘差與其鄰近地市的殘差相關(guān)的程度,而空間自回歸組合(SAC)模型是前兩個(gè)模型的組合,同時(shí)考慮空間滯后和空間誤差參數(shù)。空間滯后模型公式如下:
Y是因變量即確診病例個(gè)數(shù),WY是帶有權(quán)重矩陣的空間滯后因子,它與觀測(cè)目標(biāo)周?chē)腨值有關(guān),X是解釋變量,β為參數(shù)向量,W為基于鄰近的空間權(quán)重矩陣,ρ的作用是衡量觀測(cè)值之間的空間相互作用程度,為空間滯后項(xiàng)的參數(shù),μ是噪音干擾項(xiàng)。
想要同時(shí)且全面地分析確診病例時(shí)空分布信息是比較困難的,繪制折線(xiàn)趨勢(shì)圖可以很直觀地顯示新增病例隨時(shí)間變化的趨勢(shì),但是反映空間上的信息是不容易的,華中地區(qū)的累計(jì)新增確診病例時(shí)間趨勢(shì)分布如圖1所示。
圖1 累計(jì)新增確診病例時(shí)間趨勢(shì)分布圖
由新增病例增長(zhǎng)的趨勢(shì)圖可知1月下旬到2月中旬確診病例的增長(zhǎng)較為明顯,2月下旬病例的增長(zhǎng)明顯緩慢了許多,2月12號(hào)新增病例急劇增長(zhǎng),因2020年2月12號(hào)國(guó)家出臺(tái)相關(guān)政策在湖北省的病例診斷分類(lèi)中增加了“臨床診斷”,自2月12號(hào)起湖北省將臨床診斷病例數(shù)納入確診病例數(shù),而到3月份確診病例的增長(zhǎng)逐漸歸零,數(shù)據(jù)表明各級(jí)政府以及社會(huì)公眾的防控措施在2月中旬有效地遏制了疫情的傳播,確診病例的增長(zhǎng)呈現(xiàn)了由少到多,再由多到少的變化趨勢(shì)。
使用ARCGIS10.2進(jìn)行全局空間自相關(guān)分析,華中地區(qū)各地級(jí)市1月23日-3月25日的累計(jì)確診病例全局空間自相關(guān)分析結(jié)果如圖2所示,1月23日空間自相關(guān)指數(shù)為小于零,自1月25日起Moran指數(shù)迅速增大,P值均小于0.001,說(shuō)明此時(shí)間段內(nèi)確診病例全局分布存在正向空間自相關(guān)性,病例表現(xiàn)出快速聚集的趨勢(shì),Moran指數(shù)在2月1日達(dá)到最大值,2月12日至3月25日逐步減少直至趨于平緩,病例分布保持穩(wěn)定的較高聚集水平[2]。
圖2 累計(jì)確診病例全局空間自相關(guān)分析結(jié)果分布圖
本文選取華中地區(qū)新冠肺炎累計(jì)確診病例數(shù)和人口遷徙數(shù)據(jù)中的武漢人口遷出規(guī)模指數(shù)與武漢遷入到華中地區(qū)各市人口比例的乘積累計(jì)值,運(yùn)用空間回歸分析探討影響疫情空間分布的影響因素,首先構(gòu)建出一般的普通線(xiàn)性回歸模型,然后在其基礎(chǔ)上構(gòu)建空間回歸分析模型。
3.3.1 普通線(xiàn)性回歸模型
空間相關(guān)分析已經(jīng)證明華中地區(qū)各市確診病例具有空間相關(guān)性,下一步需采用空間回歸分析模型來(lái)進(jìn)行估計(jì),選取各市累計(jì)確診病例、人口密度和遷徙指數(shù)數(shù)據(jù),首先用普通線(xiàn)性回歸分析對(duì)基本模型進(jìn)行估計(jì),然后用極大似然方法估計(jì)普通線(xiàn)性回歸模型,結(jié)果見(jiàn)表1。
由表1可知,普通線(xiàn)性回歸模型的擬合優(yōu)度為0.408 8,因殘差具有空間相關(guān)性,數(shù)據(jù)是否適用于空間回歸模型以及模型的選擇可通過(guò)采用拉格朗日乘子誤差和滯后及其穩(wěn)健性(LM)檢驗(yàn),若LM(lag)比LM(error)統(tǒng)計(jì)量中有一個(gè)比較顯著,則選擇統(tǒng)計(jì)量顯著的空間回歸分析模型[11]。LM檢驗(yàn)中滯后檢驗(yàn)統(tǒng)計(jì)量和誤差檢驗(yàn)統(tǒng)計(jì)量都不顯著則不適用空間回歸分析模型[12]。由表1可知LM(lag)比LM(error)顯著,且RobustLM(lag)顯著而RobustLM(error)不顯著,可判定空間滯后回歸模型要比空間誤差模型更適合。
表1 普通線(xiàn)性回歸模型分析結(jié)果
3.3.2 空間滯后回歸模型的極大似然估計(jì)
從由3.3.1節(jié)結(jié)果分析可知空間滯后模型更加適用,因此對(duì)空間滯后模型進(jìn)行極大似然估計(jì)結(jié)果見(jiàn)表2。采用極大似然法估計(jì)參數(shù)時(shí),基于殘差平方和分解的擬合優(yōu)度檢驗(yàn)意義不是很大,可比較對(duì)數(shù)似然函數(shù)值Log L值,空間滯后回歸模型的Log L值大于普通線(xiàn)性回歸模型的,并且SLM的AIC值(253.48)均小于普通線(xiàn)性回歸模型的AIC值(303.74),因此空間滯后回歸模型比普通線(xiàn)性回歸估計(jì)的模型要好。空間滯后回歸模型中空間自回歸系數(shù)0.086 3在1%水平下顯著,表明一個(gè)區(qū)域確診病例的增加會(huì)影響到其鄰近區(qū)域的確診病例人數(shù)。似然比檢驗(yàn)值(LR=52.268,p<0.01)也很顯著。在空間滯后回歸模型中,空間滯后系數(shù)為0.1(p<0.01),說(shuō)明確診病例數(shù)與相鄰地區(qū)的確診病例呈正相關(guān),遷徙累計(jì)值與人口密度的顯著性概率小于0.01,兩種因素對(duì)確診病例的空間分布均有較為顯著的影響,說(shuō)明累計(jì)確診病例數(shù)與人口遷移量和人口密度存在明顯的回歸關(guān)系。
表2 空間滯后回歸模型分析結(jié)果
分析結(jié)果顯示,COVID-19在華中地區(qū)的爆發(fā)因地理位置的不同而不同,疫情總體在空間上呈現(xiàn)聚集性,與傳染病客觀規(guī)律也是相符合的。傳染病具有傳染性和普遍性,鄰近區(qū)域間大多具有共同的危險(xiǎn)因素,使用空間權(quán)重矩陣表達(dá)空間相關(guān)性,使模型估計(jì)更加有效,同時(shí)估計(jì)空間相關(guān)性的大小也反映區(qū)域之間相互作用的程度,遷徙指數(shù)對(duì)疫情發(fā)展作用非常顯著,表明在疫情暴發(fā)的初始時(shí)期武漢人員的流動(dòng)對(duì)疫情的擴(kuò)散起到了非常大的影響,但遷徙指數(shù)在解釋確診病例時(shí)在準(zhǔn)確性以及充分性上仍有所欠缺,今后還需要獲取更充分的人口流動(dòng)數(shù)據(jù)來(lái)進(jìn)行分析,由此可知交通管制政策和人員隔離措施是防疫政策中很重要的一部分,今后隨著更多數(shù)據(jù)的豐富,嚴(yán)格的時(shí)空分析將會(huì)發(fā)揮重要作用。在防控措施的實(shí)施上,不同區(qū)域和階段的防控策略需要按照當(dāng)?shù)匾咔榫珳?zhǔn)施策。通過(guò)對(duì)疫情發(fā)展過(guò)程的回顧分析把握疫情發(fā)展的時(shí)空規(guī)律,爭(zhēng)取為疫情防控及其他傳染病防控工作提供借鑒。