謝忠杭,歐劍鳴,張瑩珍,黃文龍,王靈嵐
戊型肝炎(戊肝)是由戊型肝炎病毒引起的一種人獸共患病,臨床癥狀類似于甲型肝炎,但病死率相對較高,主要經(jīng)糞-口途徑傳播,可經(jīng)水、食物等途徑傳播引起散發(fā)或暴發(fā)流行[1-2];目前該病尚缺乏特效的治療方法,也沒有特異性免疫制劑可供預(yù)防[1-2],因此監(jiān)測資料的分析與預(yù)警是及時(shí)控制并減少其危害的關(guān)鍵之一;自2004年啟動(dòng)《疾病監(jiān)測信息報(bào)告管理系統(tǒng)》至今,在全國范圍內(nèi)針對戊肝疫情做到了連續(xù)、系統(tǒng)、統(tǒng)一、高效、快速的收集,為其預(yù)測預(yù)警奠定了基礎(chǔ);故本文通過對福建省2004-2010年戊肝分月發(fā)病數(shù)的分析,根據(jù)其序列特點(diǎn)采用適當(dāng)?shù)腁RIMA(autoregressive integrated moving-average,求和自回歸移動(dòng)平均)模型擬合其流行趨勢,并對其進(jìn)行為期1年的預(yù)測,為及時(shí)發(fā)現(xiàn)異常疫情提供科學(xué)依據(jù)。
1.1 資料來源 《疾病監(jiān)測信息報(bào)告管理系統(tǒng)》收集的福建省2004-2010年以發(fā)病日期統(tǒng)計(jì)的戊肝分月發(fā)病數(shù)(僅分析臨床診斷和實(shí)驗(yàn)室診斷病例的已終審卡,但不包括刪除卡)。
1.2 研究方法 利用SAS 9.0軟件的 PROC ARIMA綜合軟件包進(jìn)行ARIMA模型的建模與分析[3]。
2.1 序列的預(yù)處理
2.1.1 判斷序列的平穩(wěn)性:福建省2004-2010年戊肝分月發(fā)病數(shù)見表1,其時(shí)序圖(圖1)顯示序列含有以年為周期的季節(jié)效應(yīng),雖表現(xiàn)出一定程度的上升趨勢但總體趨勢平穩(wěn);其自相關(guān)圖(圖2)呈現(xiàn)出明顯的正弦波動(dòng)規(guī)律,具有周期變化規(guī)律的非平穩(wěn)序列的典型特征。
表1 福建省2004-2010年戊肝分月發(fā)病情況(例)Table 1 The monthly cases of hepatitis E from 2004 to 2010 in Fujian province
表2 12步差分后序列的白噪聲檢驗(yàn)Table 2 White Noise Test of the cases series by taken the differences of lag12
2.1.2 對原序列進(jìn)行差分運(yùn)算 為提取原序列的季節(jié)效應(yīng),對原序列作12步差分,差分后序列的時(shí)序圖(圖3)和ADF檢驗(yàn)結(jié)果(圖4)示差分后序列平穩(wěn)。
2.1.3 判斷差分后序列的純隨機(jī)性 通過對差分后序列進(jìn)行白噪聲檢驗(yàn),考察其純隨機(jī)性,檢驗(yàn)結(jié)果(表2)顯示,該差分后序列為非白噪聲序列。
2.2 對差分后序列擬合ARMA模型 差分后序列的自相關(guān)圖(圖5)和偏自相關(guān)圖(圖6)均顯示:延遲12步自相關(guān)系數(shù)和偏自相關(guān)系數(shù)顯著大于2倍標(biāo)準(zhǔn)差范圍,其他幾乎95%的都落在2位標(biāo)準(zhǔn)差的范圍以內(nèi),說明差分后序列仍蘊(yùn)含著顯著的季節(jié)效應(yīng),即差分后序列仍存在季節(jié)相關(guān)性。故充分考慮各種可能,采用條件最小二乘法進(jìn)行參數(shù)估計(jì),并經(jīng)模型和參數(shù)的顯著性檢驗(yàn),擬合了2個(gè)顯著有效模型(表3),經(jīng)采用AIC準(zhǔn)則和BIC準(zhǔn)則評判其相對優(yōu)劣,結(jié)果顯示以 MA((12))模型為相對最優(yōu)模型[3],用于預(yù)測最為合適,綜合考慮前面的差分運(yùn)算,該模型實(shí)際為乘積季節(jié)模型 ARIMA(0,0,0)×(0,1,1)12,其數(shù)學(xué)表達(dá)式為:
式中Xt為福建省戊肝分月發(fā)病數(shù),B為延遲算子,εt為隨機(jī)干擾。
圖6 12步差分后序列偏自相關(guān)圖Fig.6 The pattern of the partial autocorrelation chart of the cases series by taking the differences of lag12
2.3 進(jìn)行序列預(yù)測 根據(jù)擬合的相對最優(yōu)模型ARIMA(0,0,0)×(0,1,1)12對未來12月戊肝發(fā)病數(shù)進(jìn)行預(yù)測,結(jié)果見表4。
通過將該序列實(shí)際值、擬合值及預(yù)測值、95%置信區(qū)間上限聯(lián)合作圖(見圖7),可以直觀地看出該模型對序列的擬合效果良好。
表3 顯著有效的2個(gè)備選模型參數(shù)估計(jì)比較Table 3 Parameter estimation of four ARIMA models
表4 預(yù)測2011年福建省戊肝分月發(fā)病數(shù)及其95%置信區(qū)間Table 4 Forecastings and limits of 95%UCL and LCL of Hepatitis E in Fujian province in 2011
圖7 福建省戊肝分月發(fā)病數(shù)序列實(shí)際值、擬合值及預(yù)測值圖Fig.7 The pattern of the actual cases and the fit cases of hepatitis ENote:Cases was showed on the Y axis with the date shown on X axis.The green lines with star marks showed the actual cases,the blue lines showed the fit curve(including forecasting values),the red lines with plus signs showed the line of 95%UCL,and the pink lines with circle signs showed the line of 95%LCL,respectively
從近年福建省戊肝分月發(fā)病數(shù)時(shí)序圖(圖1)中可以看出近年來福建省戊肝疫情平穩(wěn),無暴發(fā)或流行現(xiàn)象,控制效果良好。但因戊肝是一種急性人獸共患病,宿主多樣且與人群接觸密切[1-2];傳播途徑多樣,其中以糞-口途徑傳播為主,人群普遍易感,易引起食物或水源性流行爆發(fā)[1-2];2003年起戊肝已成為本省福州地區(qū)急性病毒性肝炎的主要原因[4];我省是乙肝高流行區(qū)[5],可因混合感染導(dǎo)致病情加重[6];普通人群戊肝病毒的感染率較高,提示亞臨床感染的存在[7],故其防控工作不可以掉以輕心,應(yīng)密切關(guān)注其流行態(tài)勢,并做好預(yù)測預(yù)警以嚴(yán)防暴發(fā)流行的出現(xiàn)。
ARIMA模型主要從序列自相關(guān)的角度揭示時(shí)間序列的發(fā)展規(guī)律[3],既吸取了回歸分析的優(yōu)點(diǎn)又發(fā)揮了移動(dòng)平均的長處,它根據(jù)數(shù)據(jù)序列的自相關(guān)系數(shù)、偏自相關(guān)系數(shù)建立起線性的數(shù)據(jù)間相互依賴的定量模型,既能解決數(shù)據(jù)自相關(guān)問題,又支持具有季節(jié)效果的數(shù)據(jù)建模,能較好地模擬歷史疫情,并得到較好的預(yù)測效果,國內(nèi)已有不少同行論證了該方法的適用性[8-13]。同時(shí),結(jié)合本文資料特征,使用ARIMA模型相對優(yōu)于其他預(yù)測模型:如需求序列值呈指數(shù)函數(shù)變化的灰色預(yù)測模型,對變量的分布有特殊要求、且要求變量獨(dú)立、無法考慮變量間自相關(guān)性的回歸模型或?qū)?shù)據(jù)要求較高的傳播動(dòng)力學(xué)模型等。
本文采用ARIMA模型建模,由圖7可見擬合的相對最優(yōu)模型 ARIMA(0,0,0)×(0,1,1)12對福建省近年戊肝發(fā)病數(shù)的擬合效果良好;該模型對未來12月內(nèi)的預(yù)測值在疫情態(tài)勢未發(fā)生顯著變更時(shí),能較好地預(yù)測疫情的未來走勢及發(fā)病數(shù);在疫情態(tài)勢發(fā)生顯著變更時(shí)(如暴發(fā)或流行時(shí)),則在疫情趨勢變更至顯著點(diǎn)(如超過95%的上限值)時(shí),即可直觀且客觀地判定出疫情態(tài)勢變更,并產(chǎn)出預(yù)警信息,為盡早介入并采取針對性防控措施提供有力的科學(xué)依據(jù)。
本文戊肝歷史發(fā)病數(shù)的時(shí)間序列資料,其統(tǒng)計(jì)規(guī)則在地域上是以省為單位、在時(shí)間上是以自然月為單位、在例數(shù)統(tǒng)計(jì)上是以發(fā)病日期進(jìn)行統(tǒng)計(jì),故其預(yù)測預(yù)警受到這些統(tǒng)計(jì)規(guī)則的限制。但在實(shí)際應(yīng)用中,可以根據(jù)需求適當(dāng)調(diào)整這些規(guī)則,并建立其相應(yīng)模型進(jìn)行預(yù)測預(yù)警,如在地域上以地市或縣區(qū)為單位,或時(shí)間上以周為單位,或在例數(shù)統(tǒng)計(jì)上包含疑似病例或以審核日期進(jìn)行統(tǒng)計(jì)等。
但是,時(shí)間序列數(shù)據(jù)通常只適合做短期預(yù)測,如MA(q)序列理論上只能預(yù)測q步之內(nèi)的序列走勢[3],故在實(shí)際應(yīng)用中,應(yīng)適時(shí)組織專家建立預(yù)警模型,如一年一度的疫情分析年會(huì)等;同時(shí),應(yīng)結(jié)合基于電腦的網(wǎng)絡(luò)直報(bào)系統(tǒng),增強(qiáng)其功能,方可在年度內(nèi)實(shí)現(xiàn)預(yù)測值的自動(dòng)修正預(yù)測功能以提高預(yù)測精度,并在疫情態(tài)勢發(fā)生顯著變更時(shí)及時(shí)、自動(dòng)地發(fā)布預(yù)警信息。
綜上所述,通過擬合戊肝發(fā)病數(shù)的相對最優(yōu)ARIMA模型進(jìn)行預(yù)測和預(yù)警,具有加強(qiáng)其防控工作的實(shí)際應(yīng)用價(jià)值。
[1]仇家軍,喻榮彬.戊型肝炎流行病學(xué)研究進(jìn)展[J].中華疾病控制雜志,2009,13(5):572-576.
[2]吳婷,江浪.戊型病毒性肝炎研究進(jìn)展[J].中國疫苗和免疫,2009,15(4):375-378.
[3]王燕,主編.應(yīng)用時(shí)間序列分析[M].2版.北京:中國人民大學(xué)出版社,2008:142-170.
[4]黃素欽,鄭秀奇,吳秋芳.2000-2006年福州市傳染病院急性病毒性肝炎流行病學(xué)分析[J].海峽預(yù)防醫(yī)學(xué)雜志,2007,13(6):39-40.
[5]陳彩粼,黃文龍,洪榮濤,等.福建省2000—2008年乙型肝炎流行特征分析[J].海峽預(yù)防醫(yī)學(xué)雜志,2010,16(1):46-48.
[6]張金良,高學(xué)武,辛克峰,等.散發(fā)性戊型肝炎的臨床和流行病學(xué)特征分析[J].實(shí)用肝臟病雜志,2008,11(3):182-183.
[7]王惠榕,嚴(yán)延生,蕭劍雄,等.福建省不同人群中戊型肝炎病毒感染的血清流行病學(xué)調(diào)查分析[J].中國人獸共患病學(xué)報(bào),2007,23(4):370-372.
[8]黃春萍,鄧晶,張磊,等.ARIMA模型在麻疹預(yù)警中的應(yīng)用[J].疾病監(jiān)測,2008,23(1):53-55.
[9]馮丹,韓曉娜,趙文娟,等.中國內(nèi)地法定報(bào)告?zhèn)魅静☆A(yù)測和監(jiān)測的 ARIMA模型[J].疾病控制雜志,2007,11(2):140-143.
[10]吳家兵,葉臨湘,尤爾科.時(shí)間序列模型在傳染病發(fā)病率預(yù)測中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計(jì),2006,23(3):276.
[11]鐘球,蔣莉,周琳,等.廣東省結(jié)核病發(fā)病趨勢的時(shí)間序列分析[J].中國防癆雜志,2010,32(9):515-519.
[12]張彥琦,唐貴立,王文昌,等.ARIMA模型及其在肺結(jié)核預(yù)測中的應(yīng)用[J].現(xiàn)代預(yù)防醫(yī)學(xué) ,2008,35(9):1608-1615.
[13]周水森,黃芳,沈毓祖.ARIMA模型在瘧疾發(fā)病預(yù)測中的應(yīng)用[J].中國病原生物學(xué)雜志,2007,2(4):284-286.