趙 敬,馮慧芬,王 芳,秦新華,趙保玲,易佳音,王 斌,黃 平
1) 鄭州大學(xué)第五附屬醫(yī)院消化內(nèi)科 鄭州450052 2) 鄭州大學(xué)第五附屬醫(yī)院感染科 鄭州450052 3) 鄭州大學(xué)附屬兒童醫(yī)院感染科 鄭州450051
手足口病(hand-foot-mouth disease,HFMD)是一種因腸道病毒感染而導(dǎo)致的兒童常見的急性傳染病。在國內(nèi),其主要致病種類為柯薩奇病毒A16型和腸道病毒71型[1]。HFMD具有傳染性強和播散速度快等特點,容易造成大范圍的暴發(fā)和流行[2]。HFMD重癥病例可以伴隨腦炎、心肌炎等嚴(yán)重并發(fā)癥,甚至發(fā)生死亡。根據(jù)國家疾病控制中心的監(jiān)測數(shù)據(jù),自2008年以來HFMD發(fā)病人數(shù)呈整體上升趨勢,其發(fā)病和病死率居丙類傳染病之首,雖然近年來疫情管控和疫苗方面的新進展一定程度上降低了病死率,但其對社會和家庭造成的醫(yī)療負擔(dān)卻相當(dāng)沉重。本研究利用2008至2017年鄭州市二七區(qū)HFMD疫情監(jiān)測資料,采用季節(jié)性求和自回歸滑動平均(seasonal auto regressive integrated moving average,SARIMA)模型建立HFMD發(fā)病預(yù)測模型,從而為HFMD方面的疫情監(jiān)測和管理提供決策依據(jù)。
1.1資料來源數(shù)據(jù)采集自鄭州市二七區(qū)疾病預(yù)防控制中心,收集2008年至2017年間HFMD疫情資料用于分析。
1.2SARIMA模型構(gòu)建采用了加入了季節(jié)變化因素后的SARIMA模型,其結(jié)構(gòu)為(p,d,q)×(P,D,Q)s,其中s為季節(jié)周期,p、q分別對應(yīng)自回歸和移動平均階數(shù),d、D分別為平穩(wěn)差分次數(shù)和季節(jié)性差分次數(shù),P、Q分別為季節(jié)性自回歸和移動階數(shù)[3-4]。結(jié)合Ljung-Box方法檢驗殘差白噪聲,選取BIC最小的模型作為最佳模型。
1.3統(tǒng)計方法選用R 3.4.4軟件繪制熱圖,描述年和周對應(yīng)的HFMD發(fā)病例數(shù)情況。應(yīng)用SPSS 23.0建模,其中時間序列分析時選用SARIMA模型,對所有病例個案數(shù)據(jù)匯總,統(tǒng)計月發(fā)病例數(shù)。該地區(qū)在2008年前2個月無發(fā)病患兒,因此選用2008年3月至2016年12月的發(fā)病數(shù)進行建模,而使用2017年1月至12月的數(shù)據(jù)對模型進行驗證。
2.1 2008至2017年鄭州市二七區(qū)發(fā)病概況根據(jù)國家疾病預(yù)防控制局的全國法定傳染病疫情概況報告(http://www.ntfpc.gov.cn/jkj/pqt/newlist.shtml),繪制2008至2017年全國HFMD發(fā)病例數(shù)和病死率圖,結(jié)果見圖1。同時繪制鄭州市二七區(qū)的HFMD周發(fā)病例數(shù)熱圖,結(jié)果見圖2。圖2顯示,2014年全國的HFMD發(fā)病例數(shù)超過了以往,其原因是在全國范圍內(nèi)的大流行引起所致。而在熱圖中可以看到二七區(qū)在2014至2016年,其高發(fā)時間段內(nèi)發(fā)病例數(shù)熱度最高,大致與同年期間全國總發(fā)病趨勢相符合。
圖1 全國2008至2017年月HFMD發(fā)病例數(shù)和病死率
圖2 鄭州市二七區(qū)2008至2017年月發(fā)病例數(shù)熱圖
2.2HFMD患者發(fā)病時間序列平穩(wěn)化處理結(jié)果見圖3。2008年3月至2016年12月HFMD時間序列存在明顯的周期性,每12個月出現(xiàn)1次明顯的發(fā)病高峰,序列方差前后波動較大。對其進行對數(shù)轉(zhuǎn)換、二階差分、二階季節(jié)差分,轉(zhuǎn)換后的時間序列趨勢和周期性不明顯,符合SARIMA模型的平穩(wěn)性要求(圖4)。
圖4 平穩(wěn)化處理后的HFMD發(fā)病時間序列圖
2.3模型識別和定階根據(jù)HFMD的流行特點建立模型SARIMA(p,d,p)× (P,D,Q)12,繪制差分后季節(jié)性序列的自相關(guān)函數(shù)圖(ACF)及部分自相關(guān)函數(shù)(PACF),結(jié)果見圖5。可確定非季節(jié)性模型是一個自回歸過程,因此p和q分別取1和0。根據(jù)差分結(jié)果可確定d、D分別取2和2。據(jù)有關(guān)文獻[5]敘述P和Q的取值很少有超過2的情況,故P和Q分別取0、1、2,并逐個代入模型。經(jīng)逐個試驗符合條件的SARIMA模型有9個,最終確定最佳模型為SARIMA(2,2,1)×(2,2,1)12。
2.4模型的參數(shù)檢驗該模型經(jīng)Ljung-Box 檢驗得到的統(tǒng)計量為4.553,P值為0. 951,BIC值為14.251,R2為0.624。殘差的ACF和PACF圖見圖6,殘差為白噪聲,且模型各參數(shù)均具有統(tǒng)計學(xué)意義(P<0.001)。
圖5 進行自然對數(shù)轉(zhuǎn)換、一階差分、一階季節(jié)差分后ACF和PACF圖
圖6 殘差的ACF和PACF圖
2.5模型的預(yù)測效果評價利用SARIMA(2,2,1)× (2,2,1)12模型,對2017年1月至12月鄭州市HFMD發(fā)病例數(shù)進行驗證,結(jié)果見圖7,可見擬合值與實測值較為接近,說明該模型擬合較好。3月和4月誤差較大,其他月份擬合值與實測值較為接近,說明該模型擬合較好。
圖7 應(yīng)用SARIMA模型對2017年HFMD發(fā)病情況的驗證結(jié)果
由于HFMD的發(fā)病和傳播特點,臨床尚無特效治療藥物,而目前的疫苗仍然處在研發(fā)結(jié)果,因此對該病的防治主要采取早期預(yù)防策略。但過度預(yù)防會導(dǎo)致相應(yīng)衛(wèi)生資源的分配不合理,甚至浪費,因此需要一定的指導(dǎo)依據(jù)。HFMD發(fā)病的模型預(yù)測有助于了解HFMD的發(fā)病趨勢,從而提早采取措施,有針對性地做好疫點、疫區(qū)的衛(wèi)生處理和傳染源管理工作,遏制疫情蔓延[6]。本研究采集了鄭州市疾控中心傳染病資料,數(shù)據(jù)資料可信度高,且收集了10 a的所有發(fā)病資料,樣本量較大,對其進行特征分析和預(yù)測研究具有較強的可操作性和現(xiàn)實意義。在所有時間序列模型中,由于SARIMA模型綜合考慮了時間序列中的周期和趨勢以及隨機干擾等因素,相較于其他模型較為符合流行病特征。作者利用2008年3月至2016年12月鄭州市HFMD發(fā)病數(shù)據(jù)構(gòu)建了SARIMA定量預(yù)測模型,并回代擬合了2017年1月至12月鄭州市HFMD發(fā)病例數(shù)情況,可見該模型預(yù)測效果較好,通過該模型的預(yù)測方法,可用于鄭州市手足口病發(fā)病的短期預(yù)測,在發(fā)病高峰期提醒疾病預(yù)防控制部門加強防控[7]。本研究應(yīng)用SARIMA模型對鄭州市HFMD發(fā)病例數(shù)進行分析和預(yù)測,顯示模型和參數(shù)都具有統(tǒng)計學(xué)意義,且預(yù)測的精度較高。預(yù)測結(jié)果顯示,2017年4至7月為鄭州市HFMD發(fā)病高峰,與既往發(fā)病高峰期一致,提示在該段時間內(nèi)應(yīng)加強鄭州市HFMD的防治工作。
SARIMA模型是目前應(yīng)用較多的時間序列預(yù)測方法之一,它綜合考慮到了疾病的季節(jié)性、周期性、隨機性等可能影響序列平穩(wěn)性的因素,提高了模型的擬合和預(yù)測效果,同時借助模型的參數(shù)進行量化表達,在傳染病預(yù)測中具有廣泛的適用性[8]。HFMD的發(fā)病原因較復(fù)雜,發(fā)病具有明顯的季節(jié)性、周期性特點,適合用SARIMA模型進行擬合[9-10]。但是SARIMA模型不足之處在于只能用于短期預(yù)測,對長期預(yù)測效果不佳。因此,在以后的預(yù)測中,需要實時加入最新的發(fā)病例數(shù)資料,不斷調(diào)整模型參數(shù),獲得更精準(zhǔn)的預(yù)測效果。本研究應(yīng)用SARIMA模型僅分析了時間因素,沒有考慮其他影響因素,如氣候和地區(qū)等因素,若能結(jié)合HFMD防治過程中可能收集到的疾病影響因素資料[4],利用多元統(tǒng)計方法或更好的統(tǒng)計算法,建立綜合性強的預(yù)測模型,可能會使預(yù)測結(jié)果更加接近疾病實際情況。
綜上所述,SARIMA模型在預(yù)測和評估HFMD流行趨勢和發(fā)病情況方面具有較大應(yīng)用價值。本研究建立的SARIMA模型可以較好地預(yù)測鄭州市二七區(qū)2017年HFMD月發(fā)病率的時間分布特征和發(fā)展趨勢,從而用于輔助該地區(qū)進行相應(yīng)疫情布控方面的決策。后續(xù)研究可根據(jù)新的數(shù)據(jù)資料不斷動態(tài)調(diào)整模型參數(shù),來實現(xiàn)更高的預(yù)測效果。