王海峰,尤愛國
腎綜合出血熱是由漢坦病毒引起,伴有腎損綜合征的一組出血熱的綜合名稱[1]。河南省于1963年首次報告腎綜合征出血熱病例,上世紀80年代經歷過2次發(fā)病高峰,2次高峰發(fā)病人數(shù)均接近萬例,此后疫情逐漸呈下降趨勢[2]。但近年來,河南省腎綜合征出血熱疫情又開始小幅度回升。因此,搞清腎綜合征出血熱病例時空分布特點,對探索疾病流行因素,進一步指導防治腎綜合征出血熱工作具有較高的應用價值。本文將河南省2010年度腎綜合征出血熱報告病例數(shù)按日期和縣區(qū)分布,分別進行Poisson分布和負二項分布的擬合,并進行檢驗,對病例的時間和空間聚集性進行分析。
1.1 疫情數(shù)據(jù)2010年河南省腎綜合征出血熱疫情資料來自“中國疾病預防控制系統(tǒng)V2.0”中的子系統(tǒng)“疾病監(jiān)測信息報告管理系統(tǒng)”。
1.2 概率模型
1.2.1 Poisson分布[3]
(1)式中,e為自然對數(shù)的底,e=2.71828;λ為總體平均數(shù),可用樣本平均數(shù)代替。X為報告病例數(shù),X=0,1,2,3……n。計算出X對應的P之后,理論頻數(shù)T X=NP(X)。N為觀察單位總數(shù)。
1.2.2 負二項分布[3]負二項分布的參數(shù)μ一般用樣本均數(shù)作為其估計值,但參數(shù)k的估計就復雜一些。k值有4種估計方法[4],本文先用矩法估計一個粗略的k值,然后再用最大似然法估算精確的k值。所謂矩法就是用樣本的均數(shù)和方差S2分別作為負二項分布的均數(shù)μ和方差σ2的估計值,由下面式(2)求得。
f為樣本陽性數(shù),X對應的頻數(shù),N為觀察單位總數(shù)。
所謂最大似然法(maximum likelihood method)是指能夠滿足下面式(3)的Z=0的k值即為所求。
(3)式中m=Xmax,即樣本計數(shù)X所取得到的最大值;即樣本中所有計數(shù)大于X的頻數(shù)之和
求出精確k值后,令,則負二項分布的概率計算公式為
計算出X對應的P之后,理論頻數(shù)T X=NP(X)。N為觀察單位總數(shù)。
2.1 發(fā)病概況 2010年河南省共報告腎綜合征出血熱病例186例。按天計算發(fā)病數(shù),則254 d沒有報告病例,其余每天發(fā)病數(shù)1~8例,每天平均發(fā)病數(shù);按縣區(qū)計算發(fā)病數(shù),則分布在88個縣區(qū),每個縣區(qū)病例數(shù)1~9例。有79個縣區(qū)沒有報告病例。每縣區(qū)平均發(fā)病數(shù)
2.2 時間(日)分布與Poisson分布和負二項分布的擬合 按照X=0,1,2,3……8,將一年365 d對應的實際頻數(shù)進行歸類計數(shù)(見表1)。根據(jù)式(1)計算X對應的Poisson分布概率,求出各組的理論頻數(shù)T X;負二項分布則先由矩法求出粗略的k=0.557 3,再由最大似然法求出精確的k=0.561 3,根據(jù)(4)求出各組的理論頻數(shù)T X。擬合優(yōu)度檢驗用卡方檢驗。
由表1可看出,河南省2010年腎綜合征出血熱發(fā)病時間分布不服從Poisson分布(χ2=51.251 9,v=2,ν=0.05,P<0.05),而服從負二項分布(χ2=0.414 3,v=2,ν=0.05,P>0.05)。由此,可以認為河南省2010年腎綜合征出血熱病例在時間分布上不是隨機均勻分布的,而是表現(xiàn)出一定程度的聚集性。用圓形分布法對2010年河南省腎綜合征出血熱進行季節(jié)性分析后,平均角(雷氏檢驗P<0.05),所對應的高峰日期為11月14日。
表1 河南省2010年腎綜合征出血熱時間(日)分布與Poisson分布和負二項分布的擬合Tab.1 The fitting on temporal distribution of HFRS cases in Henan Province in 2010 by Poisson distribution and negative binomial distribution
2.3 空間(縣區(qū))分布與Poisson分布和負二項分布的擬合 按照X=0,1,2……9,將河南省167個縣區(qū)對應的實際頻數(shù)進行歸類計數(shù)(見表2)。根據(jù)式(1)計算X對應的Poisson分布概率,求出各組的理論頻數(shù)T X;負二項分布則先由矩法求出粗略的k=0.740 9,再由最大似然法求出精確的k=0.845 5,根據(jù)(4)求出各組的理論頻數(shù)T X。擬合優(yōu)度檢驗用卡方檢驗。
由表2可看出,河南省2010年腎綜合征出血熱發(fā)病空間分布不服從Poisson分布(χ2=67.121 3,v=3,ν=0.05,P<0.05),而服從負二項分布(χ2=7.254 3,v=3,α=0.05,P>0.05)。由此,可以認為河南省2010年腎綜合征出血熱病例在空間分布上不是隨機均勻分布的,而是表現(xiàn)出一定程度的聚集性。結合流行病學標點地圖,可以看出病例主要聚集性駐馬店市的正陽縣、平輿縣和汝南縣等地。
表2 河南省2010年腎綜合征出血熱空間(縣區(qū))分布與Poisson分布和負二項分布的擬合Tab.2 The fitting on spatial distribution of HFRS cases in Henan Province in 2010 by Poisson distribution and negative binomial distribution
Possion分布是一種稀有事件的隨機均勻分布,服從Possion分布的事件彼此間是相互獨立的,如某人是否患某種疾病與他人是否患該病無關等;換言之,若不服從Possion分布,則可認為某一疾病等事件具有空間聚集性、傳染性[5]。負二項分布是一種聚集性分布,在醫(yī)學中主要用于聚集性疾病及微生物、寄生蟲分布模型等的研究[3],具體地說,當個體間發(fā)病概率不相等即可以擬合負二項分布,如單位人數(shù)內某傳染病的發(fā)病人數(shù)等。腎綜合征出血熱是一種以鼠為宿主動物的自然疫源性疾病,其發(fā)病特點是自然散發(fā)。根據(jù)本研究結果,可認為2010年河南省腎綜合征出血熱病例在時間和空間分布上皆不服從Poisson分布,而皆服從負二項分布,這提示每個時間或空間單元內陽性個體的存在,受到了某些因素的影響,從而導致病例分布不再呈現(xiàn)隨機、均勻的特點,呈現(xiàn)一定程度的聚集性。
郭鳳蓮[6]等對山東省莒南縣1975-2004年的腎綜合征出血熱時空動態(tài)變化進行了研究,發(fā)現(xiàn)在腎綜合征出血熱流行初期,發(fā)病處于原始的自然散發(fā)狀態(tài),病例呈現(xiàn)Poisson分布。但是,隨著自然疫源狀態(tài)被破壞,腎綜合征出血熱病例分布開始服從負二項分布。導致這種變化的原因,薛付忠[7]等認為是在秋末冬初滅鼠的時候,由于只滅家鼠,不滅野鼠,破壞了家、野鼠之間的生態(tài)平衡,使得帶病毒野鼠廣泛向室內遷移,人群感染機會增大,形成秋末冬初峰。春天家鼠密度回升,與野鼠爭奪領地,病毒在家野鼠之間傳播,形成春末夏初峰。因此,對于服從負二項分布的疫源地,在制定滅鼠措施的時候要采取綜合滅鼠措施,盡可能維持家鼠和野鼠之間的平衡,才有可能消除疫源地。
[1]宋干.腎綜合征出血熱[J].預防醫(yī)學論壇,2005,11(4):508-512.
[2]李林紅,吳振溢,張彥平,等.河南省腎綜合征出血熱不同類型疫區(qū)監(jiān)測比較研究[J].中國媒介生物學及控制雜志,2002,13(2):127-130.
[3]孫振球.醫(yī)學統(tǒng)計學 [M].2版.北京:人民衛(wèi)生出版社,2007:124-131.
[4]查明.負二項分布參數(shù)K的四種估算方法[J].熱帶病與寄生蟲學,2000,(29)2:107-109.
[5]金丕煥.醫(yī)用統(tǒng)計方法 [M].2版.上海:復旦大學出版社,2008:197.
[6]郭鳳蓮,許桂春,李學剛,等.山東省莒南縣腎綜合征出血熱的空間分布及其時空動態(tài)變化[J].中國預防醫(yī)學雜志,2007,8(5):559-562.
[7]薛付忠,王潔貞,馬希蘭.疾病空間分布狀態(tài)的負二項分布概率生成模型的討論[J].中國衛(wèi)生統(tǒng)計,2000,17(6):366-368.