周千千,涂 平
(福州大學(xué) 數(shù)字中國研究院(福建),福建 福州 350002)
2019年12月31日, 中國湖北省衛(wèi)生委員會宣布了一系列不明原因的病毒性肺炎病例, 最早的一例發(fā)病于2019年12月1日[1]。新型冠狀病毒肺炎(2019 novel coronavirus pneumonia,COVID-19)(以下簡稱“新冠肺炎”)疫情在武漢爆發(fā)后,在極短時(shí)間內(nèi)迅速蔓延。截至2020年2月16日,中國報(bào)告了新冠肺炎確診病例58 010例,死亡病例1 772例。新冠肺炎疫情給人類社會造成了巨大的損失與威脅。
目前,不同研究領(lǐng)域的學(xué)者已對新冠肺炎疫情進(jìn)行了大量的研究工作,關(guān)注的方向有所不同?;A(chǔ)醫(yī)療研究者主要集中在病原學(xué)、致病機(jī)理、傳染源及傳播途徑等方面的研究[2-3],其他學(xué)科的研究者則大多致力于新冠肺炎的空間擴(kuò)散特征、發(fā)展預(yù)測與疾病傳播因素的分析[4-9]。在地理學(xué)對傳染性疾病的研究中,楊斯棋等[10]結(jié)合空間分析方法與地理加權(quán)回歸模型,探究了北京市甲型H1N1流感對氣象因子的時(shí)空響應(yīng)規(guī)律;李浩等[11]運(yùn)用時(shí)間序列及空間分析方法,分析了寧夏涇源縣兒童呼吸系統(tǒng)疾病的區(qū)域時(shí)空分布規(guī)律及區(qū)域地理環(huán)境因素;陶海燕等[12]運(yùn)用擴(kuò)展Knox檢驗(yàn)的疾病時(shí)空傳播網(wǎng)絡(luò)模型,研究了登革熱疫情早期時(shí)空傳播特征;張利娜等[13]運(yùn)用因子分析和多元線性回歸,分析了健康老年前期女性紅細(xì)胞比積正常參考值與地理因素的依賴關(guān)系,并依此進(jìn)行了區(qū)域劃分。
綜上,本文按照新增確診病例數(shù)變化趨勢劃分時(shí)間階段,對新冠肺炎發(fā)病率的時(shí)空特征及發(fā)病率熱點(diǎn)區(qū)域進(jìn)行分析,并對新冠肺炎的發(fā)病率產(chǎn)生作用的影響因素進(jìn)行篩選。以新冠肺炎發(fā)病率為因變量,以篩選后的空間距離、鐵路路網(wǎng)密度、運(yùn)客率、單位人均床位數(shù)4類影響因素為自變量,利用地理加權(quán)回歸模型對影響因素進(jìn)行定量分析,利用t值檢驗(yàn)確定影響因素的顯著性分析了來自地理、醫(yī)療、交通等方面的影響因素對發(fā)病率的影響,以期為探究新冠肺炎發(fā)病率的影響因素提供相關(guān)參考。
新冠肺炎發(fā)病率的影響因素選擇遵循指標(biāo)可定量表達(dá)性和數(shù)據(jù)可獲得性原則。通過參考相關(guān)文獻(xiàn)[10-11]并結(jié)合社會經(jīng)濟(jì)數(shù)據(jù),從地理空間、醫(yī)療設(shè)施、交通通達(dá)度等多重維度選取影響因素指標(biāo)。具體影響因素選取如下:(1)疫情的傳播以武漢市為中心。從空間上考慮,選取各個(gè)城市距武漢市的空間距離探究發(fā)病率是否與其密切相關(guān)。(2)各類公共交通工具的運(yùn)轉(zhuǎn)與疫情阻斷的矛盾較為突出,而從交通條件考慮疫情傳播可分為兩類,分別是與其他城市的往來及城市內(nèi)自身的交通流通水平。選取鐵路路網(wǎng)密度衡量與其他城市來往水平,選取單位公共汽車數(shù)量、單位出租車數(shù)量及運(yùn)客率3種影響因素衡量城市內(nèi)部的流通性。(3)醫(yī)院作為疫情防控的重要單位,醫(yī)院床位作為診療救治的必要條件。選取單位醫(yī)院數(shù)量、單位人均床位數(shù)及醫(yī)生率作為衡量城市醫(yī)療水平的指標(biāo)。最終構(gòu)建出候選影響因素,如表1所示。
表1 候選影響因素
對表1中各維度下的影響因素進(jìn)行Pearson相關(guān)分析,篩選出與新型冠狀病毒發(fā)病率呈顯著相關(guān)的指標(biāo)。其中,單位公共汽車數(shù)量、單位出租車數(shù)量、醫(yī)生率與發(fā)病率并無顯著相關(guān),故將此3種因素剔除。同時(shí),運(yùn)用多重共線性檢驗(yàn)分析每種影響因素的方差膨脹因子(variance inflation factor, VIF),以VIF值<7.5為標(biāo)準(zhǔn)確定最終影響因素指標(biāo)體系。在多重共線性檢驗(yàn)中,單位醫(yī)院數(shù)量的VIF值高達(dá)8.135,存在變量冗余問題,故將此因素剔除。最終確定的影響因素指標(biāo)體系,如表2所示。
表2 影響因素指標(biāo)體系
本文所用的新冠肺炎數(shù)據(jù)來源于國家衛(wèi)健委官網(wǎng)發(fā)布的每日疫情通報(bào)。通過爬蟲程序采集了2020年1月26日至2月15日的每日疫情數(shù)據(jù),每日采集時(shí)間為當(dāng)日0點(diǎn)。為減少研究分析中的代表性誤差,在影響因素顯著性分析和空間異質(zhì)性分析時(shí),本文僅選取采集期間新冠肺炎累計(jì)確證病例數(shù)大于500的湖北、廣東、河南、浙江等10個(gè)省市的地級市作為研究對象,樣本數(shù)量為131。
空間距離由每個(gè)城市經(jīng)緯度與武漢市經(jīng)緯度計(jì)算所得,經(jīng)緯度數(shù)據(jù)來自百度地圖開發(fā)平臺;鐵路路網(wǎng)數(shù)據(jù)下載于Open Street Map 開放平臺,通過ArcGIS 軟件計(jì)算每個(gè)城市的鐵路總長度并除以城市面積以求得鐵路路網(wǎng)密度;公共汽車數(shù)量、出租車數(shù)量、運(yùn)客量、醫(yī)生數(shù)量、互聯(lián)網(wǎng)用戶數(shù)量、城市總?cè)丝诘壬鐣y(tǒng)計(jì)數(shù)據(jù)均來源于《中國城市統(tǒng)計(jì)年鑒》。為消除影響因素量綱帶來的數(shù)量級差異,采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化對各項(xiàng)影響因素進(jìn)行標(biāo)準(zhǔn)化處理,公式如下:
(1)
1.3.1空間自相關(guān)
空間自相關(guān)分析就是研究空間單元觀測值是否與其相鄰單元的觀測值存在相關(guān)性的一種分析方法,是空間單元觀測值聚集程度的一種度量[14-16]。本文采用全局Moran’sI統(tǒng)計(jì)量對發(fā)病率分布的空間關(guān)聯(lián)性與差異性進(jìn)行分析,其計(jì)算公式為
(2)
1.3.2地理加權(quán)回歸模型
地理加權(quán)回歸(geographically weighted regression,GWR)模型是一種針對空間非穩(wěn)態(tài)數(shù)據(jù)的局域空間分析方法,能夠有效避免自變量系數(shù)的均質(zhì)化,探究研究區(qū)域內(nèi)部的空間變化[17-18]。GWR模型的表達(dá)式為
(3)
式中:yi、xik、θi分別為第i個(gè)城市的因變量、自變量和隨機(jī)誤差;(ui,vi)為第i個(gè)城市的空間坐標(biāo);β0(ui,vi)為常數(shù)項(xiàng);βk(ui,vi)為第i個(gè)城市的第k個(gè)自變量的回歸系數(shù)。本文以采集期間累計(jì)確診病例數(shù)大于500的131個(gè)地級市為研究單元,以發(fā)病率為因變量,以標(biāo)準(zhǔn)化后的各項(xiàng)影響因素為自變量,根據(jù)回歸系數(shù)在不同空間位置的數(shù)值及變化來探究各項(xiàng)影響因素對新冠肺炎發(fā)病率的影響程度及空間異質(zhì)性。
1.3.3影響因素顯著性檢驗(yàn)
為分析影響因素的邊際作用方向差異與各階段影響因素的時(shí)效性,結(jié)合GWR結(jié)果中各影響因素的回歸系數(shù)值,將影響因素對發(fā)病率的顯著性檢驗(yàn)值定義如下[10]:
(4)
2020年1月26日至2月15日新冠肺炎新增確診病例數(shù)時(shí)序變化,如圖1所示。按照圖1時(shí)序變化呈現(xiàn)的特征,新冠肺炎新增確診病例的時(shí)序變化分為以下3個(gè)階段:(1)階段A,1月26日至2月4日,為疫情爆發(fā)初期,新增確診病例數(shù)逐漸遞增且變化較為平緩,至2月4日新增確診病例數(shù)達(dá)到第一個(gè)高峰(3 887)是全國確診病例走勢的關(guān)鍵節(jié)點(diǎn);(2)階段B,2月5日至2月10日,新增確診病例數(shù)由2月4日達(dá)到階段峰值后呈逐步下降的態(tài)勢,新增確診病例數(shù)有所減少;(3)階段C,2月11日至2月15日,新增確診病例數(shù)由2月11日起急劇上升,數(shù)量突破10 000人達(dá)到峰值,繼而于2月12日起又呈急劇下降的趨勢,并于2月14日起逐漸下降。
圖1 新冠肺炎新增確診病例時(shí)序圖
結(jié)合新冠肺炎發(fā)病率的時(shí)序變化特征,選取上述過程中的3個(gè)階段對新冠肺炎發(fā)病率的空間集聚特征進(jìn)行定量分析。
利用空間自相關(guān)方法計(jì)算新冠肺炎各個(gè)階段發(fā)病率的全局Moran’sI指數(shù),從而確定發(fā)病率的空間自相關(guān)性及其變化情況,結(jié)果如表3所示。由表3可知:各階段的z值均大于1.96,表明計(jì)算結(jié)果具有統(tǒng)計(jì)學(xué)意義,且Moran’sI指數(shù)值大于0說明發(fā)病率的空間分布具有空間正自相關(guān)性,即發(fā)病率的值隨著測定距離的縮小而變得更相似,由此也說明發(fā)病率受到了來自空間距離的影響。其中,A、B、C3個(gè)階段的Moran’sI指數(shù)值依次逐漸減弱,直至C階段Moran’sI指數(shù)值達(dá)到最小,未達(dá)到0.01,從而呈現(xiàn)出較弱的集聚性。發(fā)病率在前期新增病例數(shù)迅速上升的階段 A 的空間自相關(guān)性強(qiáng)于其余階段,但整體上均呈現(xiàn)空間集聚特征,且集聚性隨時(shí)間的推移而減弱。
表3 新冠肺炎發(fā)病率Moran’s I指數(shù)分析
分別以A、B、C 3個(gè)階段的發(fā)病率為因變量,以表2中的空間距離、鐵路路網(wǎng)密度、運(yùn)客量、單位人均床位數(shù)4類影響因素為自變量構(gòu)建GWR模型,共統(tǒng)計(jì)了255個(gè)地級城市,樣本數(shù)量為255,擬合結(jié)果如表4所示。由表4可知:階段A的擬合R2可達(dá)0.208,對于發(fā)病率空間分異解釋度可達(dá)20.8%;而在階段C,GWR模型對于發(fā)病率的解釋度僅有6.3%,赤池信息量準(zhǔn)則(Akaike information criterion,AIC)由533.160上升至882.428。根據(jù)已有研究對GWR模型擬合效果的評價(jià)標(biāo)準(zhǔn)[19],AICc值越小則模型擬合效果越佳,而表4中的AICc值由階段A的533.160上升至階段C的882.428,則表明GWR模型的擬合效果隨時(shí)間的推移而減弱。
表4 GWR模型擬合結(jié)果
為探究各類影響因素對新冠肺炎發(fā)病率的顯著程度,由式(4)計(jì)算t值離差統(tǒng)計(jì)量,并以累計(jì)確診病例數(shù)大于500的10個(gè)省市131個(gè)地級市為單元進(jìn)行統(tǒng)計(jì),結(jié)果如圖2所示。
從圖2可知:空間距離、單位人均床位數(shù)在A、B、C3個(gè)階段中的t值絕對值均大于1.96,通過了顯著性水平為0.05的檢驗(yàn),對新冠肺炎發(fā)病率的影響較為顯著;鐵路路網(wǎng)密度的t值絕對值則在A、B、C3個(gè)階段中均未通過顯著性檢驗(yàn),因此,可認(rèn)為該影響因素對于新冠肺炎發(fā)病率的影響不顯著,故在后續(xù)研究中將鐵路路網(wǎng)密度這一影響因素剔除;而運(yùn)客率僅在階段A中通過顯著性水平為0.1的檢驗(yàn),對發(fā)病率的影響程度不如空間距離和單位人均床位數(shù)顯著。這一現(xiàn)象可能與新冠肺炎疫情后期各大城市公共交通系統(tǒng)防疫啟動應(yīng)急響應(yīng)機(jī)制有關(guān),通過減少公共交通運(yùn)輸以免造成交叉感染,降低了作為衡量城市交通條件水平的運(yùn)客率對發(fā)病率的影響程度[20]。當(dāng)顯著性水平為0.1時(shí),空間距離的檢驗(yàn)通過率為100%,運(yùn)客率的檢驗(yàn)通過率為26.1%,單位人均床位數(shù)的檢驗(yàn)通過率為95.8%。
圖2 影響因素t值絕對值柱狀圖
將GWR模型中各影響因素的回歸系數(shù)按累計(jì)確診病例數(shù)大于500的10個(gè)省市進(jìn)行統(tǒng)計(jì),結(jié)果見表5。由表5可知:空間距離指標(biāo)是新增病例數(shù)變化的負(fù)向主導(dǎo)因素,發(fā)病率與湖北省的空間距離呈負(fù)相關(guān),與湖北省的空間距離越小則發(fā)病率越高。回歸系數(shù)絕對值體現(xiàn)了空間距離指標(biāo)的強(qiáng)作用區(qū)域主要集聚在南部的廣東、湖南、江西等省份,表明這些省份的城市受到空間距離的影響程度較大,而與湖北省距離較遠(yuǎn)的區(qū)域的發(fā)病率受到來自空間距離的作用力較小,如山東、浙江、江蘇等省份。已有研究可知:武漢市作為疫情中心,各省市的病例數(shù)均與武漢流入人口數(shù)量呈較強(qiáng)的正相關(guān)[21],而近鄰的周邊南部城市與武漢市的交通往來相比空間距離較遠(yuǎn)的其他城市更加頻繁,接觸武漢流入人口的機(jī)會也更大;因此,空間距離的作用力也凸顯在包括湖北省在內(nèi)的中南部及東南部地區(qū)。因此,在疫情防控中,從空間距離層面考慮,南部地區(qū)的防控工作應(yīng)予以高度重視,尤其是武漢市周邊中小城市的衛(wèi)生醫(yī)療條件有限,更應(yīng)該加強(qiáng)該類地區(qū)的管控力度。
表5 GWR模型回歸系數(shù)統(tǒng)計(jì)
運(yùn)客率的回歸系數(shù)均為正,是發(fā)病率空間變化的正向主導(dǎo)因素,即一個(gè)城市的運(yùn)客率越高、交通條件越好,則會在一定程度上提高發(fā)病率;但該影響因素的整體系數(shù)值不高,回歸系數(shù)值均小于0.1,影響因素作用強(qiáng)度較小。其中,運(yùn)客率的回歸系數(shù)高值區(qū)域主要集中在河南、江蘇、安徽、湖北等省份,應(yīng)該特別注意此區(qū)域的交通流通,適當(dāng)降低運(yùn)客率從而降低該地區(qū)的發(fā)病率。
床位作為診療救治的必要條件之一,單位人均床位數(shù)卻是發(fā)病率的正向主導(dǎo)因素,其原因可能與新冠肺炎需要較長的住院時(shí)間與治愈周期有關(guān)。單位人均床位數(shù)的回歸系數(shù)高值區(qū)域主要集中在浙江、安徽、江蘇等東部省份。究其原因可知:截至2020年1月23日,武漢市“封城”前遷出人口主要為正常的在外務(wù)工或求學(xué)返鄉(xiāng)人流,但涌出的人數(shù)仍是異于往常;而浙江、江蘇等東部地區(qū)可能會因其優(yōu)越的醫(yī)療條件[22],從而吸引了部分武漢市遷出人口,導(dǎo)致單位人均床位數(shù)的回歸系數(shù)在該區(qū)域內(nèi)有小幅度提高,回歸系數(shù)值均大于0.25。
新冠肺炎疫情是新中國成立以來在我國發(fā)生的傳播速度最快、感染范圍最廣、防控難度最大的一次重大突發(fā)公共衛(wèi)生事件。本文研究能夠?yàn)橐咔榈姆揽毓ぷ魈峁﹨⒖迹?1)利用地理學(xué)的GIS空間分析技術(shù),能夠更加精細(xì)地獲取全國范圍內(nèi)新冠肺炎發(fā)病率的時(shí)空特征。當(dāng)前發(fā)病率的各方面均處于穩(wěn)步下降的趨勢,各方面的防控工作初見成效,較好地遏制了疫情蔓延勢頭,但各項(xiàng)防控工作仍然不能放松,以防疫情再次抬頭。(2)通過空間距離、鐵路路網(wǎng)密度、運(yùn)客率、單位人均床位數(shù)4類影響因素構(gòu)建GWR模型,探討了來自地理、醫(yī)療、交通等外部因素對發(fā)病率的影響程度,并指出了各項(xiàng)影響因素的顯著程度及重點(diǎn)作用區(qū)域。(3)新冠肺炎發(fā)病率在一定程度上還受到了地理空間、交通運(yùn)轉(zhuǎn)、社會要素等多方面外因的綜合作用,但影響發(fā)病率的因素復(fù)雜多樣,后續(xù)研究應(yīng)融合醫(yī)學(xué)、地理學(xué)、心理學(xué)等多個(gè)科學(xué)領(lǐng)域,積極運(yùn)用遙感、交通、社交媒體等多源數(shù)據(jù)對疫情的防控研究進(jìn)行深層次分析。
本文存在以下局限性:(1)對于新冠肺炎此類急性傳染性疾病,未探討氣象因素,應(yīng)該在后續(xù)研究中補(bǔ)充。(2)相應(yīng)的防控措施會導(dǎo)致影響因素?cái)?shù)值的動態(tài)變化,但由于實(shí)時(shí)數(shù)據(jù)難以獲取,僅以當(dāng)前可獲取的數(shù)據(jù)衡量了每個(gè)城市的醫(yī)療、交通的發(fā)展水平,若能收集到疫情期間每個(gè)城市的新增床位數(shù)量與具體鐵路交通的變動情況,模型擬合效果將會有所提升。