潘 蕾 賀曉新 羅艷俠 高 琦 吳立娟 李 霞△ 郭秀花△
基于Bayes時空理論探討北京市結核病演化特征及生態(tài)影響因素分析*
潘 蕾1賀曉新2羅艷俠1高 琦1吳立娟1李 霞1△郭秀花1△
目的 探討北京市結核病時空演化特征與生態(tài)影響因素。方法 基于Bayes時空理論,對2005-2009年北京市18區(qū)縣結核病患病數(shù)據(jù)進行時空建模,以DIC值最小為標準找出最優(yōu)模型,并研究協(xié)變量對模型的影響,結合ArcGis10.0軟件繪制北京市18區(qū)縣結核病時空危險度的分布圖譜。結果 全部模型中,含協(xié)變量的時空交互效應模型最優(yōu)(DIC=818.834),生態(tài)分析的結果表明,除人均地區(qū)生產(chǎn)總值的升高會降低結核病危險度之外,每千人口擁有床位數(shù)、年平均相對濕度、年平均空氣質量指數(shù)和年平均最高溫度的升高會增高結核病患病危險度。結論 Bayes時空模型與生態(tài)學分析技術結合,能動態(tài)分析結核病的時空演化特征和生態(tài)影響因素,有利于發(fā)現(xiàn)重點疫區(qū),為制定適宜的防治措施提供科學依據(jù)。
結核病 相對危險度 Bayes理論 時空模型
*:國家科技部艾滋病和病毒性肝炎等重大傳染病防治重大專項課題(2012ZX10005009-003);國家科技部973項目(2011CB505404);國家科技部重大專項中醫(yī)藥防治重大傳染病的臨床科研一體化技術平臺課題(2009ZX10005-019)
1.首都醫(yī)科大學公共衛(wèi)生學院(100069)
2.北京結核病控制研究所
△通信作者:郭秀花,E-mail:guoxiuh@ccmu.edu.cn;李霞,E-mail:lixia_new@163.com
結核病的發(fā)生其影響因素較多并且有明顯的區(qū)域性差異〔1〕,在時空傳播上具有多尺度效應〔2〕。雖然現(xiàn)已建立起較完備的流行病學監(jiān)測網(wǎng),但大多數(shù)資料是孤立、分散的,極大地限制了其在指導制定預防措施方面的作用。近年來,隨著空間掃描統(tǒng)計分析軟件SaTScan〔3〕、Bayes 統(tǒng)計分析軟件 WinBUGS〔4,5〕的推廣應用,以及地理信息系統(tǒng)(GIS)等技術的發(fā)展,可動態(tài)分析傳染病時空分布特征。國內(nèi)雖有應用ArcGis中的熱點分析對北京市結核病2005-2009年的報告率進行建模,發(fā)現(xiàn)其區(qū)域聚集性明顯〔6〕。但以上分析在時空上是分離的,本文采用Bayes時空交互模型,并使用生態(tài)學分析,研究了協(xié)變量對模型的貢獻,由此可以估計出各個區(qū)縣的患病危險度,該指標可以在患病率的基礎上更好的反應出每個區(qū)縣實際患結核病的危險程度,為結核病的防控提供一定的參考依據(jù)。
數(shù)據(jù)來自北京市結核病網(wǎng)絡直報系統(tǒng)中的電子病例信息,包含北京市18區(qū)縣從2005年1月1日到2009年12月31日登記的所有結核病數(shù)據(jù)。北京市18區(qū)縣地圖來自于北京超圖軟件有限公司。通過查閱2006-2010年《北京區(qū)域統(tǒng)計年鑒》獲得2005-2009年北京市18個區(qū)縣的基本人口及社會經(jīng)濟數(shù)據(jù),主要包括常住人口、土地面積、地區(qū)生產(chǎn)總值和平均每千人口擁有醫(yī)院床位數(shù)。常住人口/土地面積整理得到常住人口密度,單位為人/平方公里;地區(qū)生產(chǎn)總值來自全國第二次經(jīng)濟普查后核實數(shù),以2000年人口普查數(shù)據(jù)為基準,整理得到人均地區(qū)生產(chǎn)總值,單位為萬元;每千人口擁有醫(yī)院床位數(shù)由北京市衛(wèi)生局提供,單位為個。林木綠化資料來自北京市園林綠化局,單位為%,其中城四區(qū)(東城、西城、崇文、宣武)使用的是2005年普查數(shù)據(jù);氣溫、相對濕度、空氣質量指數(shù)來自北京市氣象局。
(1)Bayes時空模型
表1中i表示第i個區(qū)縣,j表示第j年,yij表示患病人數(shù),eij表示期望發(fā)病人數(shù),θij表示患病危險度,α0是截距,α1j是第j年的截距,vi表示不相關空間異質效應,gj表示自回歸時間效應,tj表示時間趨勢效應,α1表示時間效應的系數(shù),time1j表示第j年的時間效應,di表示距離效應,psiij表示時空交互效應。
表1 Bayes泊松模型的建立
以上模型均在WinBUGS1.4.3中實現(xiàn),經(jīng)過模型的加工、更新進而推斷樣本參數(shù),得到后驗分布的均值、眾數(shù)、標準差和可信區(qū)間等。此過程采用蒙特卡洛馬爾可夫算法(MCMC)。UH(uncorrelated heterogeneity models)模型,即空間不相關異質模型,在模型中用vi表示,其先驗分布選擇正態(tài)分布。CH(correlated heterogeneity models)模型,即空間相關異質模型,在模型中用ui表示。其先驗分布選擇現(xiàn)在最為廣泛使用的CAR模型。CAR(conditional autoregressive model)模型,即條件自回歸模型,區(qū)縣間的空間關系用簡單鄰接權重矩陣(simple adjacency weights matrix)表示,如果兩個區(qū)縣相鄰,則權重賦值為1;反之,賦值為0。截距項的先驗分布選擇無信息先驗分布dflat(),模型的參數(shù)先驗分布選擇正態(tài)分布 dnorm(0,taubeta),其參數(shù)的先驗分布即超先驗分布選擇均勻分布U(0,10)。
(2)生態(tài)學分析
生態(tài)學分析用于疾病結局變量具有地理信息,并且疾病發(fā)生與協(xié)變量或預測因素有關的數(shù)據(jù)分析〔8〕。這些協(xié)變量可以在空間聚集的不同水平上獲得。
本研究將第一部分中的最優(yōu)模型時空交互CH模型帶入?yún)f(xié)變量,由于協(xié)變量中存在共線性,所以剔除了最低氣溫、人口密度、綠化率三個變量,進入模型的是人均地區(qū)生產(chǎn)總值、每千人口擁有醫(yī)院床位數(shù)、相對濕度、空氣質量指數(shù)和年平均最高氣溫,模型如下及圖1所示:
式中,β1,…,β5表示協(xié)變量的回歸系數(shù)。
模型的擬合結果見表2,可以看出UH模型和自回歸時間效應的UH模型的DIC值接近,其差值小于4,可以認為這兩個模型沒有統(tǒng)計學差異,即加入對模型的貢獻不大,而時間趨勢效應UH模型的DIC值相比前兩者都增大。從CH模型開始,DIC值均下降,說明使用相關空間異質性模型的效果要比不相關空間異質性模型好,其中以時空交互效應的CH模型的效果最好(DIC=821.296),因為其使用了時空交互項,所以DIC值銳減。含有協(xié)變量的模型同不含協(xié)變量的模型相比較,各模型的DIC值均下降,并且從UH各個模型來看,gi和tj對模型的影響不大,使用相關空間異質性模型后,模型DIC值下降,也與不帶協(xié)變量的模型結果一致。
圖1 有向圖模型結構示意圖
表2 結核病Bayes時空模型擬合優(yōu)度比較
Bayes時空模型的最優(yōu)結果是CH時空交互模型,對模型所計算出的結核病的患病危險度與患病率進行比較,點的大小代表患病率的高低,點越大,患病率越高;圖層的顏色代表患病危險度的大小,圖層顏色越深,患病危險度越大。從圖2可以看出,患病率高的地方,其患病危險度不一定也高。如2005年患病率最高的為昌平區(qū),其患病率為7.68/萬,但從危險度來看,順義區(qū)的患病危險度最高(0.000883)。從地圖上可以看出2005-2009年都存在一定的空間相關性。
最優(yōu)模型中納入了人均地區(qū)生產(chǎn)總值、每千人口擁有醫(yī)院床位數(shù)、空氣質量指數(shù)、年平均相對濕度和年平均最高氣溫5個協(xié)變量,見表3。除了人均地區(qū)生產(chǎn)總值的增加會降低結核病的相對危險度之外,隨著每千人口擁有醫(yī)院床位數(shù)的增加、空氣質量指數(shù)的增加、年平均相對濕度的增加和年平均最高氣溫的增加,患結核病的相對危險度也會增加。
從表3標化系數(shù)也可以看出人均地區(qū)生產(chǎn)總值對危險度的影響貢獻是最大的,年平均最高氣溫對危險度的影響貢獻最小。
圖2 北京市18區(qū)縣2005-2009年結核病患病率與患病危險度的疊加圖
表3 協(xié)變量對結核病患病危險度的影響
貝葉斯時空模型運用了貝葉斯理論,考慮了先驗概率和樣本信息,同時將時空兩個維度結合起來,生態(tài)分析技術的運用,進一步完善了貝葉斯時空模型,使得結核病患病危險度的估計更加準確。這樣不僅可以從宏觀上更加合理的解釋結核病的時空傳播動態(tài)演化過程,并且可以看出這些因素對患病危險度的影響,還可以輔助解決公共衛(wèi)生資源的配置等問題。
平均年最高氣溫升高,結核病患病危險也增高,這與其他研究證實的結核病發(fā)病率與平均最高氣溫呈負相關相?!?〕,造成結果不一致的原因可能是尺度不一對結局的影響不同。平均相對濕度增大,結核病患病危險也增高,這與楊子丹〔10〕等的報道相符??諝赓|量差會增高患結核病的風險,在其他研究中也有類似報道。人均地區(qū)生產(chǎn)總值增高,結核病患病相對危險度降低,這與以往認為的結核病是“窮病”的研究觀點相一致。每千人口擁有床位數(shù)越多,結核病的危險度越高,這也在一定程度上反應了醫(yī)療資源的配置合理。各區(qū)縣之間存在一定的空間相關性和聚集性,患病率高的地區(qū),其患病危險度不一定也高,反之亦然。其患病危險度隨著年份也會發(fā)生改變。從其趨勢來看,2005年的高危險度區(qū)縣包括順義區(qū)、昌平區(qū)、門頭溝區(qū),中危險度區(qū)縣:平谷區(qū)、石景山區(qū)、密云縣;低危險度區(qū)縣:海淀區(qū)、東城區(qū)、朝陽區(qū);與2009年相比,高危險度區(qū)縣:房山區(qū)、豐臺區(qū),中危險度區(qū)縣:西城區(qū)、朝陽區(qū)、石景山區(qū),低危險度區(qū)縣:延慶縣、順義區(qū)、昌平區(qū)。提示近年來結核病患病危險區(qū)域已發(fā)生了變化。
1.劉云霞,姜世聞,劉言訓,等.基于潛變量與空間統(tǒng)計理論的耐多藥結核病空間流行病學模型研究.中國衛(wèi)生統(tǒng)計,2011,28(6):648-653.
2.Liu YN,Wang W,Li X,et al.Geographic distribution and risk factors of the initial adult hospitalized cases of 2009 pandemic influenza A(H1N1)virus infection in mainland China.PLoS One,2011,6(10):e25934.
3.李秀央,陳坤.掃描統(tǒng)計量的理論及其在空間流行病學中的應用.中華流行病學雜志,2008,29(8):828-831.
4.Cowles,MK.Review of WinBUGS 1.4.The American Statistician.2004;58(4):330-336.
5.孟海英,劉桂芬,羅天娥.WinBUGS軟件應用.中國衛(wèi)生統(tǒng)計.2006;23(8):375-377.
6.Liu Y,Li X,Wang W,et al.Investigation of space-time clusters and geo-spatial hotspots for the occurrence of tuberculosis in Beijing.International Journal of Tuberculosis and Lung Disease,2012,16(4):486-491.
7.Lawson,AB.Bayes Disease Mapping:Hierarchical Modeling in spatial,2008.
8.Sales CM,F(xiàn)igueiredo TA,Zandonade E,et al.Spatial analysis on childhood tuberculosis in the state of Espirito Santo,Brazil,2000 to 2007.Revista da Sociedade Brasileira de Medicina Tropical,2010,43(4):435-439.
9.霍愛梅,趙達生,方立群,等.華北地區(qū)主要呼吸道傳染病與氣象條件的關系.中國醫(yī)藥導報,2011,8(32):153-156.
10.楊子丹.五峰縣2005年-2010年結核病疫情分析.中外健康文摘,2011,8(27):203-204.
Exploration of Tuberculosis Evolution Characteristics and Ecological Factors Based on the Bayes Temporal-Spatial Theory
Pan Lei,He Xiaoxin,Luo Yanxia,et al.School of Public Health and Family Medicine,Capital Medical University(100069),Beijing
ObjectiveTo explore tuberculosis temporal-spatial evolution characteristics and ecological factors.MethodsThe model is based on the tuberculosis data in Beijing 18 districts and counties between 2005 and 2009,find out the optimum model(DIC minimum value),and by using ecology analysis technology,finding out association of tuberculosis risk and covariates,and combined with ArcGis10.0 show the distribution of space and time risk of tuberculosis in Beijing 18 districts and counties.ResultsThe optimization model is Bayes spatial-temporal interactive model(DIC=818.834).The results of ecological analysis shows that the risk of tuberculosis are significantly associated with the number of bed in hospital,annual average relative humidity,annual average air quality index and annual average temperature.ConclusionCombination of Bayes spatial-temporal model and ecological analysis will help for finding key areas of tuberculosis.
Tuberculosis;Relative risk;Bayes theory;Spatial-temporal model
(責任編輯:劉 壯)