鄭嘉麗,張豐,杜震洪*,來麗芳,劉仁義,劉堯
(1. 浙江大學(xué) 浙江省資源與環(huán)境信息系統(tǒng)重點(diǎn)實(shí)驗(yàn)室, 浙江 杭州 310028; 2. 浙江大學(xué) 地理信息科學(xué)研究所, 浙江 杭州 310027; 3. 浙江建設(shè)職業(yè)技術(shù)學(xué)院 城市建設(shè)工程系, 浙江 杭州 311231)
近年來,隨著醫(yī)療衛(wèi)生水平的提高,部分傳染病已得到有效控制,但城市擴(kuò)張、人口密度增大、環(huán)境惡化等問題也促使某些傳染病疫情的發(fā)生和蔓延,許多已被控制的傳染病有死灰復(fù)燃之勢,新發(fā)傳染病也不斷涌現(xiàn)[1-2].傳染病的流行和傳播不僅威脅人類健康,也對經(jīng)濟(jì)發(fā)展和社會穩(wěn)定造成了嚴(yán)重影響[3-4].如何有效預(yù)防和控制傳染病的發(fā)生,一直是流行病學(xué)、統(tǒng)計學(xué)、人口學(xué)、地理學(xué)及環(huán)境學(xué)等眾多領(lǐng)域?qū)W者致力解決的問題.
隨著地理信息系統(tǒng)(geographic information system,GIS)技術(shù)的迅速發(fā)展和廣泛使用,結(jié)合地理模型方法研究傳染病的時空分布特征,已成為公共衛(wèi)生領(lǐng)域的研究熱點(diǎn)之一.例如,查文婷等[5]應(yīng)用分級統(tǒng)計圖法,按年份對湖南省各市2004—2013年細(xì)菌性痢疾的發(fā)病率進(jìn)行空間分析,發(fā)現(xiàn)大部分地區(qū)的疫情呈逐年下降趨勢;COULIBALY等[6]采用空間掃描統(tǒng)計量法,以季節(jié)為尺度對馬里共和國邦賈加拉鎮(zhèn)2009年6月至2010年5月的瘧疾數(shù)據(jù)進(jìn)行聚集性分析,并利用GIS技術(shù)對聚類結(jié)果進(jìn)行可視化展示,結(jié)果表明,瘧疾的空間分布存在明顯的季節(jié)性差異;陳江平等[7]以月為分析時間單元,以中國大陸各省2009年5月到2010年3月的甲流疫情數(shù)據(jù)為研究對象,利用空間自相關(guān)方法對其進(jìn)行統(tǒng)計分析,發(fā)現(xiàn)疫情傳播的聚集性是由弱到強(qiáng)變化的,但聚集重心始終在中東部的福建、浙江、上海等地.這些研究在傳染病的時空分析上取得了一定的成果,但缺乏對時間的多尺度考量.而尺度問題是地理學(xué)研究中的重要內(nèi)容之一,尺度過大,大量細(xì)節(jié)會被忽略;尺度過小,易陷入局部而不能把握整體態(tài)勢[8-9].因此,探索傳染病在不同時間尺度下的時空模式和規(guī)律,有助于相關(guān)部門從宏觀到微觀層面更全面地認(rèn)識傳染病的分布特征,從而制定更合理、更有效的防控策略.此外,不同傳播途徑的傳染病在流行病學(xué)及時空分布特征上存在一定差異,但現(xiàn)有研究主要集中于采用描述性流行病學(xué)法和時間序列法對不同類型傳染病的流行規(guī)律進(jìn)行比較分析[10-13],鮮有從時空分析角度開展對比研究的案例.
在傳染病時空分析的研究中,目前主要使用的方法有時空重排掃描統(tǒng)計量法[14-16]、貝葉斯時空模型法[2, 17-18]、空間自相關(guān)方法[7, 19-20]等.其中,時空重排掃描統(tǒng)計量法的基本假設(shè)是研究區(qū)域內(nèi)各空間單元的人口在時間上呈均勻、平穩(wěn)的增長態(tài)勢,而當(dāng)分析的時間跨度較大時,各個空間單元的人口增長速率很可能不一致,易導(dǎo)致分析結(jié)果出現(xiàn)偏差[21-22];貝葉斯時空模型需利用數(shù)據(jù)的先驗(yàn)信息進(jìn)行統(tǒng)計推斷,存在一定的主觀性[18];空間自相關(guān)方法需人為選擇鄰接或距離矩陣,產(chǎn)生選擇偏倚性問題的可能性較大[23].此外,已有研究大多只選用一種時空方法開展實(shí)證分析,而不同方法的分析視角及挖掘的時空特性有所不同,因此,綜合應(yīng)用多種模型方法,能更全面、更深入地揭示傳染病的時空規(guī)律.
總體而言,目前尚缺乏應(yīng)用多種GIS分析手段,從多個時間尺度充分挖掘傳染病多維度(空間維、時間維以及類型維)特征的實(shí)證研究.因此,本文基于自組織神經(jīng)網(wǎng)絡(luò)、核密度估計和時空掃描統(tǒng)計量等模型方法,提出一種傳染病多尺度時空特征分析框架,分別從年份、季節(jié)和月份3個尺度對杭州市2006—2013年淋病、細(xì)菌性痢疾和流行性腮腺炎的時空分布規(guī)律及其差異展開對比研究,以期為傳染病時空模式的探索提供新的分析視角,并為杭州市傳染病防控工作的有效開展提供科學(xué)指導(dǎo).
本文從時空動態(tài)分析視角出發(fā),構(gòu)建一種面向多尺度的傳染病時空分析框架(見圖1). 在方法的選擇上,考慮到基于離散Poisson模型的時空掃描統(tǒng)計量法,通過引入人口數(shù)據(jù)有效解決了時空重排掃描統(tǒng)計量法探測結(jié)果出現(xiàn)偏倚的問題[24];相較于貝葉斯時空模型,核密度估計法無須利用與數(shù)據(jù)分布有關(guān)的任何先驗(yàn)知識,同時對數(shù)據(jù)的分布也不必附加任何前提假設(shè),而是從數(shù)據(jù)本身出發(fā)分析其分布特征[25];自組織神經(jīng)網(wǎng)絡(luò),由于引入了具有拓?fù)浣Y(jié)構(gòu)的鄰域函數(shù),聚類效果受初值的影響較傳統(tǒng)的K-means等聚類算法小,結(jié)果較為穩(wěn)定[26].此外,與其他時空分析方法相比,自組織神經(jīng)網(wǎng)絡(luò)法、核密度估計法和時空掃描統(tǒng)計量法能相對簡單有效地將空間分析和空間統(tǒng)計功能從二維空間擴(kuò)展到三維空間,并能將分析結(jié)果很好地與GIS環(huán)境相結(jié)合.因此,本文選用此方法構(gòu)建多尺度時空分析框架.
圖1 面向多尺度的傳染病時空分析框架Fig.1 A multi-scale spatial-temporal analytical framework for identifying characteristics of infectious diseases
在年尺度下,結(jié)合自組織神經(jīng)網(wǎng)絡(luò)、平行坐標(biāo)系和時空顏色矩陣,挖掘傳染病空間分布狀況的年際變化特征,從而在宏觀層面對傳染病整體的時空發(fā)展趨勢進(jìn)行理解和把握;在季節(jié)尺度下,利用核密度估計法揭示不同季節(jié)傳染病的熱點(diǎn)分布位置及熱度的變化情況,旨在從中觀角度探索傳染病的時空聚集性及其演變特征;在月尺度下,應(yīng)用時空掃描統(tǒng)計量法,以月和鄉(xiāng)鎮(zhèn)街道為分析的時間和空間單元,探討該尺度下傳染病的時空分異特征,以期在微觀層面更精細(xì)地闡釋其背后的時空規(guī)律.不同尺度下的主要研究方法介紹如下:
自組織神經(jīng)網(wǎng)絡(luò)[27](self-organizing map,SOM)是一種非監(jiān)督的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,通過自適應(yīng)的學(xué)習(xí)競爭,可實(shí)現(xiàn)對數(shù)據(jù)的聚類劃分.網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)由輸入層和輸出層構(gòu)成,輸入層和輸出層分別包含m個和n個神經(jīng)元,輸出層的每個神經(jīng)元代表1個類別.SOM的網(wǎng)絡(luò)是全連接的,因此,每個輸入神經(jīng)元均與所有的輸出神經(jīng)元相連,連接的權(quán)值為wij(i= 1, 2,…,m;j= 1, 2,…,n).算法的具體步驟如下:
1) 隨機(jī)初始化網(wǎng)絡(luò)權(quán)值wij(i= 1, 2,…,m;j= 1, 2,…,n),設(shè)定一個較大的初始鄰域,并令迭代次數(shù)t=0;
2) 將輸入向量x隨機(jī)加載進(jìn)網(wǎng)絡(luò);
3) 計算輸入向量x=(x1,x2,… ,xm)與輸出層神經(jīng)元j(j= 1,2,…,n)之間的距離dj:
(1)
4) 選擇與輸入向量x距離最近的輸出層神經(jīng)元c作為獲勝神經(jīng)元;
5) 更新神經(jīng)元c及其鄰域Nc(t)內(nèi)的其他神經(jīng)元的連接權(quán)值:
wij(t+1)=wij(t)+α(t)(xi-wij(t)),
(2)
α(t) =1/t,
(3)
其中,α(t)為學(xué)習(xí)速率,隨迭代次數(shù)t的增加而遞減.
6) 令t=t+1,轉(zhuǎn)步驟2),直至t達(dá)到最大迭代次數(shù)時聚類結(jié)束.
核密度估計法[28-29](kernel density estimation,KDE)是空間點(diǎn)模式分析中應(yīng)用廣泛的非參數(shù)估計技術(shù),能在平面空間中生成一個反映點(diǎn)數(shù)據(jù)的密度連續(xù)變化的光滑表面.對于一個二維的地理空間而言,空間中每個格網(wǎng)的密度估計值可表示為:
(4)
式中,n為點(diǎn)數(shù)據(jù)數(shù)目,(x,y)為格網(wǎng)中心點(diǎn)的空間位置,(xi,yi)為第i個點(diǎn)數(shù)據(jù)的空間位置,h為搜索半徑,K為核函數(shù).
核函數(shù)屬于距離衰減函數(shù),距數(shù)據(jù)點(diǎn)越遠(yuǎn),計算得到的密度值越小,在搜索半徑邊緣處時密度為0.鑒于Epanechnikov核函數(shù)所產(chǎn)生的均方誤差和效率損失均較Normal, Uniform, Gaussian等核函數(shù)的小[30-31],本研究選用Epanechnikov內(nèi)核計算傳染病的KDE值,其公式為:
(5)
式中,
在KDE中,搜索半徑h對最終的熱點(diǎn)可視化效果有重要影響.搜索半徑越大,越能突顯研究對象的整體分布特征;搜索半徑越小,則越能反映研究對象的局部特征差異.為得到更好的熱點(diǎn)可視化效果,本研究采用試錯法比較不同h值時的KDE結(jié)果,以確定最優(yōu)的搜索半徑[32].
時空掃描統(tǒng)計量法[33]在疾病監(jiān)測和衛(wèi)生決策領(lǐng)域中應(yīng)用廣泛,不僅能探測疾病是否存在時空聚集性,還能對聚集位置和時間進(jìn)行定位. 該方法基于的概率模型主要有Poisson分布模型和Bernoulli分布模型.本研究利用SaTScan 9.4軟件[34]提供的基于離散Poisson模型的時空掃描統(tǒng)計量法對傳染病的時空聚集性進(jìn)行掃描分析,探測過程為: (1) 在所研究的時空區(qū)間中隨機(jī)選取1個點(diǎn),將其作為圓柱形掃描窗口的底面中心;(2) 不斷擴(kuò)大圓柱體底面半徑以改變掃描區(qū)域的大小,同時逐漸增加圓柱體的高度,使掃描窗口所覆蓋的時間長度逐步延長,直至達(dá)到預(yù)先設(shè)置的空間和時間上限;(3) 不斷移動掃描窗口,并在其他時空區(qū)域重復(fù)相同的掃描過程;(4) 依據(jù)窗口內(nèi)外的真實(shí)發(fā)病人數(shù)與預(yù)期發(fā)病人數(shù)計算每個窗口的對數(shù)似然比(log likelihood ratio,LLR),并將其用于檢驗(yàn)窗口的掃描統(tǒng)計量[33,35].LLR的計算公式為:
(6)
式中,D代表某個圓柱形掃描窗口,nD是窗口D中的真實(shí)發(fā)病人數(shù),μD為在無效假設(shè)下,結(jié)合真實(shí)發(fā)病人數(shù)和人口數(shù)計算而得的窗口D內(nèi)預(yù)期的發(fā)病人數(shù),nG和μG分別為整個研究區(qū)域的總發(fā)病數(shù)和預(yù)期發(fā)病數(shù).
應(yīng)用LLR對窗口內(nèi)發(fā)病情況的異常水平進(jìn)行評估,LLR值越大,表示該窗口中的發(fā)病人數(shù)越異常,其時空聚集性越強(qiáng).同時,為避免虛假檢驗(yàn)的產(chǎn)生,通常會利用蒙特卡洛模擬法對各個窗口的統(tǒng)計學(xué)意義進(jìn)行定量評價.
杭州市位于浙江省西北部錢塘江下游,是浙江省的政治、經(jīng)濟(jì)、文化和金融中心,也是華東地區(qū)的中心城市之一.2013年,該市下轄8個區(qū)、2個縣,代管3個縣級市(如圖2所示),全市總面積1.66×104km2,屬亞熱帶季風(fēng)區(qū),四季分明,光照充足,雨量充沛,年平均氣溫15~17 ℃,一月份最冷,七月份最熱.年平均降水量1 100~1 600 mm,以春雨、梅雨和臺風(fēng)雨為主.杭州年鑒[36]的數(shù)據(jù)顯示,2013年全市擁有884.4萬常住人口,流動人口數(shù)則高達(dá)426萬,是全省流動人口最多的城市.
圖2 研究區(qū)位置及2013年人口密度分布Fig.2 Study area and population density distribution in 2013
由圖2的人口密度圖可知,杭州市人口分布極其不均勻,上城區(qū)、下城區(qū)、拱墅區(qū)、西湖區(qū)、江干區(qū)、濱江區(qū)等主城區(qū)人口稠密,而周邊的臨安市、淳安縣、建德市等區(qū)縣的人口密度較低.杭州作為浙江省的省會,地理位置特殊,人口流動頻繁,自然災(zāi)害時有發(fā)生,其傳染病發(fā)病率在省內(nèi)一直處于較高水平.如2013年,該市報告的法定傳染病發(fā)病數(shù)多達(dá)7.1萬人次,占全省發(fā)病總數(shù)的19.2%,居全省第一,因此,研究杭州市傳染病的時空分布規(guī)律,對該市乃至全省疫情的防控具有重要的指導(dǎo)意義.
本文的研究對象為杭州市2006—2013年淋病、細(xì)菌性痢疾和流行性腮腺炎的發(fā)病數(shù)據(jù),這三類疾病分別屬于典型的性傳播疾病、腸道傳染病和呼吸道傳染病.數(shù)據(jù)來源于國家疾病監(jiān)測信息報告管理系統(tǒng),每條信息記錄了患者的年齡、性別、職業(yè)、患病類型、家庭住址和發(fā)病時間.去除地址不詳?shù)挠涗?,按家庭住址對有效?shù)據(jù)進(jìn)行空間化處理,最終得到的發(fā)病例數(shù)及男女患者的比例如表1所示.
表1 三類傳染病的發(fā)病數(shù)及男女患者的比例Table1 The total number and the gender proportion of cases of three types of infectious diseases
2.2.1 總體特征
圖4 箱線圖結(jié)構(gòu)Fig.4 The structure of the boxplot
圖3利用百分比堆積柱形圖和箱線圖刻畫了各類傳染病的人群分布特征,箱線圖中各橫線的含義如圖4所示.從圖3(a)的職業(yè)分布以及圖3(b)的性別、年齡組成來看,淋病患者以農(nóng)民(34.6%)和工人(32.6%)居多,這與其文化水平和經(jīng)濟(jì)基礎(chǔ)及性病防治意識相對薄弱有關(guān)[37],病例主要集中于性活躍的青壯年,50%的男性患者處于25~42歲的年齡段,50%的女性患者年齡在24~50歲.細(xì)菌性痢疾職業(yè)構(gòu)成中以兒童(33.2%)、學(xué)生(15.0%)和農(nóng)民(14.3%)為主,這主要是因?yàn)樵擃惣膊〉陌l(fā)病與衛(wèi)生習(xí)慣和周圍環(huán)境有關(guān),而這三類人群的衛(wèi)生知識水平相對較低,受菌痢病原體感染的概率更高[38].在年齡分布上,36歲以下的男性患者占75%,47歲以下的女性患者占75%,女性患者的平均年齡(29歲)明顯高于男性患者(23歲).流行性腮腺炎的高發(fā)人群為兒童(37.9%)和學(xué)生(52.8%),患者的平均年齡在10歲左右,在不考慮異常點(diǎn)的情況下,女性患者的年齡跨度(0~25歲)略大于男性(0~20歲).由表1可知,各類疾病發(fā)病數(shù)均為男性多于女性,對于淋病而言,主要由于女性被感染后癥狀不明顯,就診率低,因此在報告病例中,男性居多[11];其他兩類疾病,男性病例數(shù)較高可能與其活動范圍較廣,接觸傳染源的機(jī)會更多有關(guān).
圖5為應(yīng)用平均中心法(mean center,MC)和標(biāo)準(zhǔn)差橢圓法(standard deviational ellipse,SDE)對三類疾病分布的描述.其中,平均中心法確定了病例分布的平均位置,標(biāo)準(zhǔn)差橢圓可度量傳染病的擴(kuò)散方向和聚集程度,橢圓長軸的方向表征數(shù)據(jù)的總體擴(kuò)散方向,橢圓越小表明數(shù)據(jù)越聚集[39]. 直觀分析可知,淋病病例的平均中心較其他兩類疾病更偏向西南側(cè),而細(xì)菌性痢疾則更偏向東北側(cè).3個平均中心的直線距離在6 km以內(nèi),均分布在西湖區(qū),說明病例在研究區(qū)域的東北部分布較多,這可能是因?yàn)闁|北部的人口密度大,疾病在人群中傳播與流行的概率比較高.從圖5的標(biāo)準(zhǔn)差橢圓可見,三類疾病的總體擴(kuò)散趨勢均為從東北到西南,其中,細(xì)菌性痢疾感染者的空間分布最聚集,而淋病和流行性腮腺炎的分布較分散.
圖5 三類傳染病的平均中心及標(biāo)準(zhǔn)差橢圓Fig.5 Mean centers and standard deviational ellipses for three types of infectious diseases
平均中心和標(biāo)準(zhǔn)差橢圓均很好地反映了疾病的總體分布特點(diǎn),但不能精確表示病例的聚集程度和時空分布差異性.因此,需進(jìn)一步探究疾病數(shù)據(jù)的時空特征.
2.2.2 基于年尺度的時空特征
在三類傳染病年際變化規(guī)律的時空分析上,本研究使用SOM對傳染病的發(fā)病率進(jìn)行聚類分析,并集成了地圖矩陣、平行坐標(biāo)系和時空顏色矩陣等可視化聚類結(jié)果[40](見圖6).SOM中的每個輸入向量由特定年份、特定區(qū)縣三類傳染病的發(fā)病率構(gòu)成.各類傳染病數(shù)據(jù)在時間維度上均包含8個年份,空間維度上涵蓋了杭州的13個區(qū)、縣,因此,整個輸入數(shù)據(jù)集含有8×13=104條樣本數(shù)據(jù).SOM的輸出層采用2×4(8類)的二維網(wǎng)絡(luò)結(jié)構(gòu),最大迭代次數(shù)設(shè)為1 000.圖6(a)~(h)為地圖矩陣應(yīng)用分層設(shè)色法可視化分類結(jié)果,每種顏色代表1種聚類;圖6(i)的平行坐標(biāo)系具有多維圖例作用,橫軸代表不同類型的傳染病,縱軸代表相應(yīng)傳染病的發(fā)病率,每條折線為SOM中的一個聚類中心(該聚類內(nèi)所有樣本的平均值);圖6(j)的時空顏色矩陣與地圖矩陣相對應(yīng),表達(dá)時間、空間信息,可輔助增強(qiáng)可視化效果.
結(jié)合圖6(a)~(h)和圖6(j)可知,屬于紅色和橙色聚類的區(qū)、縣數(shù)目逐年增多(2013年的數(shù)目和2012年持平),而這2個聚類所對應(yīng)的三類疾病的發(fā)病率均較低,說明2006—2013年杭州市淋病、細(xì)菌性痢疾和流行性腮腺炎發(fā)病率總體呈下降趨勢.隨著淋病防治知識的宣傳、人民群眾衛(wèi)生意識的提高、飲食衛(wèi)生環(huán)境的改善以及腮腺炎疫苗的大規(guī)模推廣使用等,這三類傳染病得到了有效控制.圖6亦顯示了傳染病年際變化的空間異質(zhì)性.例如,桐廬縣、建德市、臨安市等人口密度相對較低的市縣,這三類傳染病的發(fā)病率未表現(xiàn)出顯著的年際變化特征,一直處于較低的水平;而江干區(qū)、下城區(qū)及拱墅區(qū)等人口稠密、流動人口多的市區(qū),傳染病發(fā)病率波動明顯,具有較顯著的年份差異.如,拱墅區(qū)2006—2008年淋病和細(xì)菌性痢疾的發(fā)病率均相對較高(粉紅聚類),至2009年,這兩類疾病的發(fā)病率有所下降,但流行性腮腺炎的發(fā)病率卻出現(xiàn)上升現(xiàn)象(靛青聚類),隨后,細(xì)菌性痢疾和流行性腮腺炎都得到了有效控制,而淋病的發(fā)病率卻一直處于相對較高的水平(綠色聚類).由此可見,加強(qiáng)宣傳、提高人們主動預(yù)防淋病的意識,依然是拱墅區(qū)傳染病防控工作的重點(diǎn).
圖6 杭州市各轄區(qū)不同年份三類傳染病發(fā)病率SOM聚類圖Fig.6 SOM clustering maps of the incidences of the three types of infectious diseases for different years in different districts of Hangzhou
圖6綜合SOM、平行坐標(biāo)系和時空顏色矩陣等方法,做基于年尺度的傳染病時空多維可視化分析,有利于研究人員把握傳染病時空分布的整體特征,但為了更全面、更深入地挖掘各類傳染病的時空規(guī)律,還需要在季節(jié)、月份等更微觀的時間尺度下探討時空分異特征及差異.
2.2.3 基于季節(jié)尺度的時空特征
本文在研究三類疾病的季節(jié)變化特點(diǎn)時,按照3—5月、6—8月、9—11月和12—2月將數(shù)據(jù)劃分為春夏秋冬4個季節(jié),將劃分好的數(shù)據(jù)作為KDE輸入,以100 m×100 m的格網(wǎng)大小,1 km的搜索半徑為參數(shù),采用Epanechnikov核函數(shù)繪制各類傳染病的核密度分布圖(如圖7所示).由圖7可知,3種疾病的發(fā)病率在空間分布上均具有明顯的聚集性,各季節(jié)密度值最高的區(qū)域主要都集中在人口稠密的主城區(qū),與圖5平均中心的分布情況相吻合.這些區(qū)域人與人之間頻繁的近距離接觸增大了傳染病的傳播風(fēng)險和人員被感染的概率,在空間上表現(xiàn)出很強(qiáng)的聚集性.雖然這三類疾病的熱點(diǎn)分布位置大致相同,但從總體熱度值來看,流行性腮腺炎感染者的空間分布熱度遠(yuǎn)低于其他兩類疾病.
由圖7(a)~(d)可知,淋病在空間分布上無明顯的季節(jié)性差異,不同季節(jié)熱點(diǎn)基本都分布于主城區(qū)的中心處,且熱度值十分接近,可見淋病全年散發(fā),因此,對于該類疾病,全年均要做好相關(guān)的防控工作.圖7(e)~(h)的結(jié)果表明,細(xì)菌性痢疾的季節(jié)性特征顯著,夏、秋季是發(fā)病高峰期,進(jìn)入冬季后,病例的空間分布熱度迅速下降,到春季又有所上升.這可能是因?yàn)榧?xì)菌性痢疾屬于腸道傳染病,病原菌可通過蒼蠅、蟑螂等間接傳播,通過污染食品、水源或手,最終病從口入,使易感者被感染,而夏、秋季蒼蠅、細(xì)菌易滋生,增大了疾病傳播的概率,故夏、秋細(xì)菌性痢疾多發(fā)[38].不同季節(jié)流行性腮腺炎的核密度分布情況恰好與細(xì)菌性痢疾相反,表現(xiàn)為冬、春季發(fā)病密度高,夏、秋季發(fā)病密度低(如圖7(i)~(l)所示),與LI等[41]的研究結(jié)果一致.這是由于流行性腮腺炎是以唾液、飛沫為主要傳播途徑,冬、春季氣溫較低,通常門窗緊閉,空氣流通差,易引發(fā)該類疾病.
圖7 三類傳染病不同季節(jié)核密度分布圖Fig.7 Kernel density maps for the three types of infectious diseases in different seasons
與基于年尺度的時空特征研究相比,以季節(jié)為時間單元的分析,通過采用分時段核密度估計法,直觀、具體地展示了杭州市淋病、細(xì)菌性痢疾和流行性腮腺炎病例的空間熱度分布情況及其季節(jié)性差異,不僅可以為疾病病因的探索提供更詳細(xì)的線索,而且可為疾病防治對策的制定提供科學(xué)依據(jù).
2.2.4 基于月尺度的時空特征
為進(jìn)一步挖掘三類傳染病的時空分布特征及其差異,應(yīng)用基于離散Poisson模型的時空掃描統(tǒng)計量法,以鄉(xiāng)鎮(zhèn)街道為地理單元,以月為時間尺度,對杭州市2006—2013年淋病、細(xì)菌性痢疾和流行性腮腺炎的分月發(fā)病數(shù)和平均人口數(shù)進(jìn)行回顧性時空掃描分析.在模型參數(shù)的設(shè)置上,將聚類范圍的上限設(shè)定為覆蓋30%總?cè)丝?,最大空間掃描半徑設(shè)為10 km,最大時間掃描半徑設(shè)為6個月,蒙特卡洛模擬數(shù)設(shè)為999次,當(dāng)檢驗(yàn)統(tǒng)計量的P值小于0.001時,可認(rèn)為掃描窗口內(nèi)外發(fā)病數(shù)的差異有統(tǒng)計學(xué)意義,窗口所在的區(qū)域?qū)儆趥魅静〉母甙l(fā)時空聚集區(qū).圖8和表2展示了P<0.001時的時空聚集信號.
從圖8(a)~(c)中可直觀地看到,被識別的各類傳染病時空聚集信號主要出現(xiàn)在杭州主城區(qū)及其附近區(qū)域,這與KDE分析中(見圖7)的熱點(diǎn)分布較一致. 值得注意的是,有些區(qū)域雖然在圖7中未呈現(xiàn)很高的熱度值,卻被掃描統(tǒng)計為高發(fā)病時空聚集區(qū)(如: 圖8(a)的聚類6;圖8(b)的聚類4和5;圖8(c)的聚類4,12,13).這是因?yàn)楫?dāng)對KDE的結(jié)果進(jìn)行可視化渲染時,其全局密度閾值易導(dǎo)致小范圍內(nèi)的局部高發(fā)熱度被減弱甚至被忽略,而時空掃描統(tǒng)計量法的圓柱體掃描窗口的大小和位置是動態(tài)變化的,從而實(shí)現(xiàn)對數(shù)據(jù)聚集性的探測和數(shù)據(jù)的最大挖掘,因此,對局部高發(fā)的時空聚集信號有更好的檢測能力[22, 42].由表2(a)可知,淋病的時空聚集區(qū)域在月份分布上比較分散,1號和3號聚類發(fā)生于6—11月,2號聚類出現(xiàn)在4—9月,4~6號聚類則分別產(chǎn)生于3—7月、11月至次年2月和1—5月.而細(xì)菌性痢疾和流行性腮腺炎聚類所處的月份均比較集中,前者發(fā)病聚集時間主要在每年的6—11月(見表2(b)),后者則為每年的12月至次年5月(見表2(c)),與前述基于季節(jié)尺度的分析結(jié)果基本吻合.總體而言,相較于以年份和季節(jié)為時間單元的研究,基于月份尺度的分析更精細(xì)地體現(xiàn)了各類傳染病在不同時空區(qū)間上的聚集性特征.
圖8 三類傳染病回顧性時空掃描統(tǒng)計結(jié)果分布圖(以月和鄉(xiāng)鎮(zhèn)街道為時間和空間基本單元)Fig.8 Maps of the results of the retrospective space-time scan statistic for three types of infectious diseases at month scale and sub-district level
(a) 淋病
聚類編號聚類中心坐標(biāo)/°聚類中心所在的鄉(xiāng)鎮(zhèn)、街道聚類半徑/m聚集時間實(shí)際發(fā)病數(shù)/例預(yù)期發(fā)病數(shù)/例LLR值1(120.177 5 E, 30.227 5 N)上城區(qū)紫陽街道2 850.30 2006/06—2006/112149.08471.892(120.149 8 E, 30.329 6 N)拱墅區(qū)上塘街道7 109.34 2007/04—2007/09680401.7680.713(120.280 8 E, 30.242 2 N)蕭山區(qū)寧圍鎮(zhèn)6 544.62 2013/06—2013/1115344.7779.974(120.264 9 E, 30.442 8 N)余杭區(qū)臨平街道5 027.09 2007/03—2007/079723.3364.645(119.882 2 E, 29.994 7 N)富陽市鹿山街道7 900.57 2008/11—2009/0218072.7755.956(120.031 1 E, 30.075 9 N)富陽市東洲街道7 433.18 2006/01—2006/056921.8932.14
(b) 細(xì)菌性痢疾
聚類編號聚類中心坐標(biāo)/°聚類中心所在的鄉(xiāng)鎮(zhèn)、街道聚類半徑/m聚集時間實(shí)際發(fā)病數(shù)/例預(yù)期發(fā)病數(shù)/例LLR值1(120.160 8 E, 30.271 3 N)下城區(qū)天水街道7 530.86 2007/06—2007/102 637482.852 398.922(120.308 1 E, 30.155 4 N)蕭山區(qū)新塘街道7 813.38 2007/06—2007/10480127.13286.833(120.264 9 E, 30.442 8 N)余杭區(qū)臨平街道6 880.53 2006/06—2006/1134683.79229.554(120.088 4 E, 30.119 6 N)西湖區(qū)雙浦鎮(zhèn)6 495.70 2008/07—2008/1110524.0873.815(119.983 4 E, 30.219 1 N)余杭區(qū)閑林街道6 677.84 2007/06—2007/1113037.4569.366(119.892 5 E, 30.053 6 N)富陽市富春街道6 614.96 2009/12—2010/0415651.9567.657(119.985 5 E, 30.303 8 N)余杭區(qū)倉前街道7 147.65 2009/08—2009/1112651.1138.898(119.966 1 E, 30.005 4 N)富陽市春江街道7 127.52 2007/07—2007/114512.8724.20
(c) 流行性腮腺炎
聚類編號聚類中心坐標(biāo)/°聚類中心所在的鄉(xiāng)鎮(zhèn)、街道聚類半徑/m聚集時間實(shí)際發(fā)病數(shù)/例預(yù)期發(fā)病數(shù)/例LLR值1(120.294 2 E, 30.490 5 N)余杭區(qū)運(yùn)河街道5 985.93 2009/01—2009/0526616.32494.422(119.882 2 E, 29.994 7 N)富陽市鹿山街道7 900.57 2010/02—2010/0530138.68357.103(120.177 5 E, 30.227 5 N)上城區(qū)紫陽街道2 850.30 2009/12—2010/051374.91324.504(119.914 3 E, 29.859 7 N)富陽市常安鎮(zhèn)7 784.33 2010/12—2011/041527.13320.795(120.189 1 E, 30.335 0 N)下城區(qū)石橋街道7 817.08 2008/12—2009/03557214.94191.446(120.512 6 E, 30.189 6 N)蕭山區(qū)黨山鎮(zhèn)6 598.51 2012/03—2012/0812818.22140.077(120.343 2 E, 30.208 4 N)蕭山區(qū)新街鎮(zhèn)7 081.382008/01—2008/0511923.7896.658(120.497 9 E, 30.298 6 N)蕭山區(qū)義蓬街道7 264.462009/10—2010/019114.1992.459(120.031 1 E, 30.075 9 N)富陽市東洲街道7 433.182010/02—2010/05505.9162.7010(120.035 9 E, 30.273 1 N)余杭區(qū)五常街道5 597.242012/12—2013/039025.1350.0511(120.242 1 E, 30.160 8 N)蕭山區(qū)城廂街道4 680.162008/03—2008/056115.6337.7612(120.157 9 E, 29.996 9 N)蕭山區(qū)戴村鎮(zhèn)6 550.062009/12201.9828.2713(119.759 5 E, 30.059 8 N)富陽市永昌鎮(zhèn)7 009.30 2006/02—2006/05233.0426.58
傳染病在不同尺度下的時空分布特征有所不同,因此在多尺度下對其進(jìn)行考察和研究才能充分把握其內(nèi)在規(guī)律.目前,對傳染病的時空分析尚缺乏對時間的多尺度考量,且研究的疾病類型也較單一.針對以上問題,本文運(yùn)用多種統(tǒng)計學(xué)和地理學(xué)方法,選取典型的性傳播疾病(淋病)、腸道傳染病(細(xì)菌性痢疾)和呼吸道傳染病(流行性腮腺炎),通過不同時間尺度的分析,將3種傳染病的時空分布特征納入整體框架進(jìn)行探究.研究結(jié)果表明,三類傳染病在年份、季節(jié)和月份尺度上均表現(xiàn)出特定的時空分布特點(diǎn).在年尺度上,各類疾病的發(fā)病率在人口密度大、人員流動頻繁的轄區(qū)變化和波動較明顯,總體呈逐年下降趨勢;而人口稀疏的區(qū)、縣發(fā)病率長期處于較低水平,未表現(xiàn)出明顯的年際變化特征.在季節(jié)尺度下,各季節(jié)不同傳染病的高發(fā)區(qū)主要都集中在人口稠密的主城區(qū);淋病的空間熱度分布無明顯的季節(jié)性差異,細(xì)菌性痢疾表現(xiàn)為夏、秋高發(fā),冬、春低發(fā),流行性腮腺炎則相反.在月尺度上,三類傳染病的時空聚集信號主要出現(xiàn)在主城區(qū), 周邊KDE值較低的區(qū)、縣,也有部分聚類;淋病的時空聚集區(qū)域在月份分布上較分散,而細(xì)菌性痢疾的聚集時間多為每年的6—11月,流行性腮腺炎則為12月至次年5月.
在框架構(gòu)建上,綜合SOM、平行坐標(biāo)系和時空顏色矩陣等方法,做基于年尺度的分析,有利于從宏觀角度把握傳染病時空分布的整體特征;以季節(jié)為時間單元采用KDE開展研究,可直觀了解疾病的熱度分布及季節(jié)性差異;利用時空掃描統(tǒng)計量法進(jìn)行月尺度探究,可更精細(xì)地檢測和識別局部高發(fā)的時空聚集信號.不同尺度下所應(yīng)用的模型相輔相成,從宏觀到微觀層面較深入地剖析了傳染病的時空分布規(guī)律.
本文的研究成果對杭州市傳染病防控措施的制定和防控資源的優(yōu)化配置具有一定的指導(dǎo)意義,構(gòu)建的多尺度時空分析框架可為今后類似流行病研究提供新的分析視角.本文僅定性分析了傳染病的時空分布特征與人口密度、氣象因素的關(guān)系,下一步將考慮應(yīng)用地理加權(quán)回歸分析等方法對發(fā)病率與空間風(fēng)險因子之間的關(guān)聯(lián)進(jìn)行定量研究.