陸波 閔紅星 扈學(xué)琴 閔佳
ARIMA模型在流感發(fā)病預(yù)測中的應(yīng)用
陸波 閔紅星 扈學(xué)琴 閔佳
目的 探討時(shí)間序列模型在流感病例發(fā)病預(yù)測方面的可行性。方法 通過國家疾病報(bào)告管理系統(tǒng)收集本市醫(yī)療機(jī)構(gòu)2004~2012年的流感月發(fā)病數(shù)資料, 用Eviews軟件對流感月發(fā)病數(shù)據(jù)建模,用單位根檢驗(yàn)法對模型的適應(yīng)性進(jìn)行檢驗(yàn), 并回代的方法驗(yàn)證其有效。結(jié)果 流感月發(fā)病數(shù)時(shí)間序列的自相關(guān)分析圖顯示數(shù)據(jù)不平穩(wěn), 所以進(jìn)行一階差分, 并建模, 最終模型為ARIMA(0, 2, 0)(0, 2, 0)7, 所建模型差異有統(tǒng)計(jì)學(xué)意義。結(jié)論 ARIMA(0, 2, 0)模型可用于流感發(fā)病的預(yù)測。
時(shí)間序列模型;ARIMA;流感;預(yù)測
時(shí)間序列目的是用變量過去的觀測值來預(yù)測同一變量的未來值。已經(jīng)被廣泛應(yīng)用于人口、經(jīng)濟(jì)、環(huán)境衛(wèi)生等研究領(lǐng)域[1-3]。本文通過對銀川市各個(gè)醫(yī)療機(jī)構(gòu)2004~2012年的流感月發(fā)病數(shù)建立數(shù)學(xué)模型, 探討該方法的最佳適用范圍和適用條件, 為擴(kuò)大其在傳染病發(fā)病預(yù)測方面的應(yīng)用提供科學(xué)依據(jù)。
1. 1 一般資料 2004~2012年的流感月發(fā)病數(shù)通過國家疾病報(bào)告管理系統(tǒng)進(jìn)行收集, 建立預(yù)測模型, 用2012年各月發(fā)病數(shù)進(jìn)行組外回代和組內(nèi)回代, 預(yù)測2013年流感的發(fā)病情況。
1. 2 研究方法 用Eviews6.0進(jìn)行數(shù)據(jù)處理與分析。
2. 1 流感流行特征分析 流感月發(fā)病數(shù)呈現(xiàn)明顯波動, 均出現(xiàn)發(fā)病高峰月(每年12月或次年1月), 有相對固定的季節(jié)性或周期性波動。具體情況見圖1。
2. 2 建立預(yù)測模型
2. 2. 1 模型識別 該序列的自相關(guān)圖呈拖尾衰減, 偏相關(guān)圖呈兩步截尾, 說明序列為非平穩(wěn)序列P<0.05, 進(jìn)行一級差分處理結(jié)果, 通過單位根檢驗(yàn)說明該數(shù)據(jù)滿足平穩(wěn)條件。具體情況見圖2, 圖3。
2. 2. 2 參數(shù)估計(jì)和模型檢驗(yàn) 建立預(yù)測模型后, 需要對ARIMA(0,2,0)(0, 2, 0)7, 的適應(yīng)性進(jìn)行檢驗(yàn)。根據(jù)模型誤差序列的ACF圖, 自相關(guān)系數(shù)大部分都落入置信區(qū)間以內(nèi),可斷定模型包含原始時(shí)間序列的所有趨勢, 能用來預(yù)測, Eviews6.0統(tǒng)計(jì)結(jié)果顯示模型所有參數(shù)有統(tǒng)計(jì)學(xué)意義, 在大部分時(shí)滯上P值都>0.05;對殘差序列作自相關(guān)函數(shù)圖, 顯示殘差序列為白噪聲, 說明所選的ARIMA(0,2,0)(0, 2, 0)7, 模型是合適的, 可以用于預(yù)測。
2. 2. 3 預(yù)測應(yīng)用 從圖中看出實(shí)際值與預(yù)測值欠吻合, 可用于流感監(jiān)測信息的動態(tài)分析和短期預(yù)測, 見圖4。
圖1 2004~2012年流感月發(fā)病數(shù)時(shí)序圖
圖2 2004~2012年流感發(fā)病原始數(shù)據(jù)的自相關(guān)圖和偏自相關(guān)圖
圖3 2004~2012年流感發(fā)病一級差分后的自相關(guān)圖、偏相關(guān)圖及統(tǒng)計(jì)量
圖4 2004~2012年流感實(shí)際發(fā)病數(shù)與預(yù)測發(fā)病數(shù)
ARIMA模型是一種精度較高的短期預(yù)測模型[4]。本文應(yīng)用ARIMA模型法預(yù)測傳染病, 是用預(yù)測疾病的過去值和現(xiàn)在值, 預(yù)測未來值, 可參照預(yù)測數(shù)據(jù)有目的地開展傳染病的防控工作。
按時(shí)間序列排列的每一個(gè)時(shí)期的觀測值都是由許多因素影響, 認(rèn)為流感有季節(jié)性流行的特征, 發(fā)病存在較大的波動性。通過ARIMA模型對本市2004~2012年各月份的流感發(fā)病數(shù)的時(shí)序圖發(fā)現(xiàn):流感月發(fā)病數(shù)呈明顯波動, 每年12月或次年1月為發(fā)病高峰月, 有相對固定的季節(jié)性或周期性波動。但2006年12月和2007年1月流感樣病例數(shù)出現(xiàn)2次高峰,是由于這一時(shí)期銀川市發(fā)生兩起學(xué)校流感暴發(fā)疫情引起。對模型進(jìn)行一級差分處理和單位根檢驗(yàn), 使數(shù)據(jù)滿足平穩(wěn)條件,將模型優(yōu)化為ARIMA(0,2,0)模型建模, 并對ARIMA(0,2,0)(0, 2, 0)7, 的適應(yīng)性進(jìn)行檢驗(yàn), 發(fā)現(xiàn)模型誤差序列的自相關(guān)系數(shù)大部分都落入置信區(qū)間以內(nèi), 顯示殘差序列為白噪聲, 說明所選的ARIMA(0,2,0)(0, 2, 0)7, 模型是合適的, 可用來預(yù)測;用Eviews6.0擬合模型, 得到的九年預(yù)測效果的擬合優(yōu)度R2為0.297, 相關(guān)系數(shù)為0.545。因此, 所選的ARIMA(0,2,0)(0, 2, 0)7, 所建模型有統(tǒng)計(jì)學(xué)意義, 可用于流感發(fā)病預(yù)測。今后,本院試圖采用其它方法進(jìn)行預(yù)測, 如灰色模型、季節(jié)性結(jié)構(gòu)分量模型等以探討在流感預(yù)測中的最佳模型。
[1] Yu Xinrui,Hua Lisha. Influenza.Medical Science in Overseas: Social Medical Science, 2000,17(3):128-131.
[2] 譚毅,康寧,閉福銀,等. 廣西2004-2007年流感性感冒監(jiān)測分析.中國熱帶醫(yī)學(xué), 2009,9(5):906-908.
[3] WHO.International Health Regulations (2005) http://www.who.int/ ihr/Case Definitions_zh.pdf )
[4] 邢慧嫻,楊維中,王漢章.傳染病預(yù)測.預(yù)防醫(yī)學(xué)情報(bào)雜志,2006, 6(4):639-642.
寧夏自然科學(xué)基金項(xiàng)目(項(xiàng)目編號:2012Z1239)
750004 寧夏醫(yī)科大學(xué)總醫(yī)院
閔紅星 E-mail:lbmhx6661@163.com