侯文濤,李 磊
(運(yùn)城學(xué)院 數(shù)學(xué)與信息技術(shù)學(xué)院,山西 運(yùn)城 044000)
2019新型冠狀肺炎,即2019-nCoV,是目前新發(fā)現(xiàn)的又一種可以在人與人之間傳染的冠狀病毒,首次發(fā)現(xiàn)于2019年武漢病毒性肺炎病例中。新型冠狀病毒主要的傳播方式是呼吸道飛沫傳播和接觸。2019年12月,湖北省武漢市在展開(kāi)的流感及相干疾病監(jiān)測(cè)中,發(fā)現(xiàn)多起病例感染病毒性肺炎,現(xiàn)被證實(shí)為新型冠狀病毒感染,之后新冠肺炎感染者數(shù)量開(kāi)始在武漢市內(nèi)急劇上升,后確定該病毒具有人傳人風(fēng)險(xiǎn),隨之中國(guó)其他地區(qū)也出現(xiàn)感染者,同時(shí)全世界大多數(shù)國(guó)家都出現(xiàn)了感染病例,引發(fā)全球的重視。目前,新型冠狀肺炎是世界眾多學(xué)者關(guān)注和研究的重點(diǎn)問(wèn)題之一。顏銘江利用改進(jìn)的SEIR模型預(yù)測(cè)疫情的進(jìn)一步發(fā)展,計(jì)算每日有效再生數(shù)的變化,預(yù)測(cè)在2020年4月19日所有的患者將全部出院,累計(jì)確診患者為66487[2];蔡潔構(gòu)造SEIR模型模擬武漢市新冠肺炎的發(fā)展趨向,得出疫情的“拐點(diǎn)”將會(huì)出現(xiàn)在采取封城方法后的第35天,同時(shí)預(yù)測(cè)疫情在4月底將會(huì)根本得到控制[3];朱仁杰以SIR模型為基礎(chǔ),對(duì)7個(gè)國(guó)家疫情的發(fā)展情況進(jìn)行預(yù)測(cè),并剖析各國(guó)減少接觸率等防治措施對(duì)疫情發(fā)展的影響,揭示了各國(guó)的防疫現(xiàn)狀以及減少接觸率的措施的重要;王思遠(yuǎn)采用SEIR模型預(yù)測(cè)2019-nCOV疫情數(shù)據(jù),有效的預(yù)估了疫情發(fā)展趨勢(shì),并根據(jù)新的數(shù)據(jù)不斷自動(dòng)更新未來(lái)疫情發(fā)展[5];林挺葵結(jié)合Holt兩參數(shù)指數(shù)平滑模型預(yù)測(cè)疫情的未來(lái)發(fā)展趨勢(shì),結(jié)果表明在現(xiàn)有高效防控措施下,粵西地區(qū)及各地級(jí)市新冠肺炎疫情正在停止惡化,有望在2月底出現(xiàn)“拐點(diǎn)”[6]。本文在參考已有文獻(xiàn)的基礎(chǔ)上,結(jié)合所學(xué)統(tǒng)計(jì)預(yù)測(cè)方法[7],對(duì)收集的武漢新型冠狀疫情的日增長(zhǎng)數(shù)據(jù)構(gòu)建Holt雙參數(shù)指數(shù)平滑模型與求和自回歸移動(dòng)平均ARIMA模型,并選擇較優(yōu)模型預(yù)測(cè)武漢2月11日至13日新型冠狀疫情的新增感染人數(shù),對(duì)武漢新冠肺炎疫情的預(yù)防控制提供理論支持,為新冠疫情的研究提供新的參考。
指數(shù)平滑法的基本思想就是預(yù)測(cè)值是以前觀測(cè)值的加權(quán)和,并且對(duì)不同的數(shù)據(jù)賦予不同的權(quán)數(shù),越接近預(yù)測(cè)期的數(shù)據(jù)給予越大的權(quán)數(shù),越遠(yuǎn)離預(yù)測(cè)期的數(shù)據(jù)賦予越小的權(quán)數(shù);基本公式為
St=a*xt+(1-a)st-1
式中St為時(shí)間t的平滑值;xt為時(shí)間t的觀測(cè)值;St-1為時(shí)間t-1的平滑值;α為平滑參數(shù),其取值范圍為[0,1]。Holt雙參數(shù)線性指數(shù)平滑法[8]是將趨勢(shì)序列直接進(jìn)行平滑,對(duì)原序列進(jìn)行預(yù)測(cè)的,因此平滑公式為
St=axt+(1-α)(St-1+rt-1,
rt=β(St-St-1)+(1-β)rt-1,
式中{St}為修勻后的預(yù)測(cè)序列;xt為時(shí)間t的觀測(cè)值;α,β為平滑參數(shù),其取值范圍為[0,1]。{rt}為趨勢(shì)序列,需要注意的是趨勢(shì)序列{rt}也是一個(gè)隨機(jī)序列。預(yù)測(cè)公式為
Pt+l=St+l*rt
式中Pt+l為時(shí)間t向前l(fā)期的預(yù)測(cè)值;l為向前預(yù)測(cè)的期數(shù)[10]。
ARIMA模型[9],中文名稱為求和自回歸移動(dòng)平均模型。是由美國(guó)統(tǒng)計(jì)學(xué)家博克思(Box)和詹金斯(Jenkins)在20世紀(jì)70年代初提出的一種時(shí)間序列的預(yù)測(cè)方法。ARIMA(p,d,q)模型具有如下結(jié)構(gòu)
式中{εt}為零均值白噪聲序列。ARIMA建模流程圖如圖1所示。
在利用模型擬合數(shù)據(jù)時(shí)不可避免地會(huì)存在誤差,那么模型對(duì)實(shí)際值擬合的程度便稱為擬合優(yōu)度,擬合優(yōu)度的統(tǒng)計(jì)量稱為可決系數(shù)或者確定系數(shù)(R2),計(jì)算公式為
圖1 ARIMA建模流程圖
本文所使用的數(shù)據(jù)來(lái)源于2020年1月16日至2月16日中國(guó)衛(wèi)生健康委官方網(wǎng)站(http://www.nhc.gov.cn/xcs/yqtb/list_gzbd.shtml)[11]和中國(guó)湖北省衛(wèi)生健康委官方網(wǎng)站(http://wjw.hubei.gov.cn)[12]所公布的數(shù)據(jù)。
使用R軟件繪制2020年1月16日至2月10日武漢地區(qū)新型冠狀病毒的日增長(zhǎng)人數(shù)時(shí)序圖,該序列呈現(xiàn)出明顯的上升趨勢(shì),隨著時(shí)間天數(shù)的增加,日增感染人數(shù)保持正值,感染人數(shù)持續(xù)上升,詳見(jiàn)圖2。
圖2 武漢新冠肺炎每日新增感染人數(shù)時(shí)序圖
借助R語(yǔ)言3.6.2,將數(shù)據(jù)進(jìn)行簡(jiǎn)單處理之后讀入序列,建立Holt雙參數(shù)平滑模型,經(jīng)過(guò)反復(fù)實(shí)驗(yàn)得到Holt雙參數(shù)平滑系數(shù)α=0.57,β=0.06,詳見(jiàn)表1。說(shuō)明修勻后的預(yù)測(cè)序列{St}在未來(lái)預(yù)測(cè)中,近期數(shù)據(jù)對(duì)預(yù)測(cè)數(shù)據(jù)的影響比較大;趨勢(shì)序列{rt}在未來(lái)預(yù)測(cè)中,近期數(shù)據(jù)對(duì)預(yù)測(cè)數(shù)據(jù)的影響比較?。淮藭r(shí)模型的誤差平方和達(dá)到最小,擬合的指數(shù)平滑模型為
通過(guò)采取以上一系列技術(shù)和管理措施,解決了盾構(gòu)穿越高鐵橋梁樁基施工難題,確保了高鐵橋梁和車輛運(yùn)行安全和隧道工程實(shí)體質(zhì)量。本工程的施工經(jīng)驗(yàn),也應(yīng)用到了盾構(gòu)下穿鐵路站場(chǎng)路基施工中,對(duì)將來(lái)其他類似工程施工具有一定的參考借鑒作用。
St=0.57xt+0.43(St-1+rt-1)
rt=0.06(St-St-1)+0.94rt-1
預(yù)測(cè)模型為
Pt+l=1696.91+l*59.47
表1 Holt雙參數(shù)模型系數(shù)表
通過(guò)預(yù)測(cè)模型Pt+1=1696.91+l*59.47,計(jì)算1月16日至2月10日的估計(jì)值,并考慮該模型預(yù)測(cè)結(jié)果的滯后性,結(jié)果如表2。將真實(shí)值與估計(jì)值繪制在一張圖中,如圖3,圖中黑色實(shí)線表示真實(shí)值,紅色虛線表示估計(jì)值,可以看出兩條曲線在前期幾乎重合,動(dòng)態(tài)趨勢(shì)也基本吻合,Holt雙參數(shù)線性指數(shù)平滑模型對(duì)新增感染人數(shù)擬合效果很好。
表2 Holt雙參數(shù)線性指數(shù)平滑法計(jì)算結(jié)果表
圖3 Holt雙參數(shù)線性指數(shù)平滑模型擬合圖
2.2.1 序列平穩(wěn)化
由圖2可知,序列呈現(xiàn)曲線上升趨勢(shì),是非平穩(wěn)序列。對(duì)序列進(jìn)行二階差分,差分后的序列進(jìn)行單位根檢驗(yàn),其中P=0.02182,小于顯著性水平0.05,序列趨于平穩(wěn)。詳見(jiàn)表3。
表3 平穩(wěn)性檢驗(yàn)表
alternative hypothesis:stationary
將差分后的序列延遲6期、延遲12期、延遲18期分別進(jìn)行白噪聲檢驗(yàn),,結(jié)果如表4,其中P值均小于顯著性水平0.05,序列是非白噪聲序列。
表4 ARIMA模型白噪聲檢驗(yàn)表
建立ARIMA(p,2,q)模型,使用R軟件,將p、q的可能取值0、1、2進(jìn)行由低階向高階進(jìn)行測(cè)試,并依據(jù)AIC最小準(zhǔn)則,經(jīng)過(guò)反復(fù)實(shí)驗(yàn),得出當(dāng)p=1,q=1時(shí),AIC值最小,所以ARIMA(1,2,1)模型為最優(yōu)模型,故序列采用ARIMA(1,2,1)模型進(jìn)行擬合,詳見(jiàn)表5。
表5 ARIMA模型AIC值計(jì)算表
2.2.3 參數(shù)估計(jì)與模型檢驗(yàn)
利用ARIMA(1,2,1)模型對(duì)序列進(jìn)行擬合,并估計(jì)模型參數(shù),模型的口徑為:
Xt=-0.4759Xt-1+qt-qt-1;εt~N(0,87009
對(duì)模型的系數(shù)進(jìn)行檢驗(yàn),P值均小于顯著性水平0.05,表明模型ARIMA(1,2,1)中所有的系數(shù)都通過(guò)了t檢驗(yàn),建立具有統(tǒng)計(jì)學(xué)意義。詳見(jiàn)表6。
表6 ARIMA模型系數(shù)表
對(duì)ARIMA(1,2,1)模型的殘差進(jìn)行LB檢驗(yàn),結(jié)果顯示ARIMA(1,2,1)模型的殘差序列為白噪聲序列,說(shuō)明模型殘差部分是由隨機(jī)因素造成的,信息已充分提取,滿足ARIMA的前提假設(shè)。詳見(jiàn)表7。
表7 ARIMA(1,2,1)模型白噪聲檢驗(yàn)表
通過(guò)ARIMA(1,2,1)模型計(jì)算1月16日至2月10日的估計(jì)值,詳見(jiàn)表8。如圖4,將真實(shí)值與估計(jì)值繪制在一張圖中,圖中黑色實(shí)線表示實(shí)際值,紅色虛線表示估計(jì)值,可以看出兩條曲線在前期幾乎重合,動(dòng)態(tài)趨勢(shì)也基本吻合,ARIMA(1,2,1)模型對(duì)新增感染人數(shù)擬合效果也很好。
表8 ARIMA模型計(jì)算結(jié)果表
分別計(jì)算兩個(gè)模型的可決系數(shù)R2,Holt雙參數(shù)指數(shù)平滑模型的可決系數(shù)為0.968,ARIMA(1,2,1)模型的可決系數(shù)為0.834,Holt雙參數(shù)指數(shù)平滑模型的擬合程度更好。
圖4 ARIMA模型擬合圖
選用擬合度較好的Holt模型對(duì)武漢2月11日到2月13日新冠肺炎每日新增感染人數(shù)做出預(yù)測(cè),并結(jié)合實(shí)際值進(jìn)行對(duì)比。詳見(jiàn)表9,繪制真實(shí)值和預(yù)測(cè)值的折線圖,詳見(jiàn)圖5。因2月12日至2月13日的數(shù)據(jù)中含有臨床值感染人數(shù)數(shù)據(jù),本文除去了臨床值對(duì)研究的影響。模型預(yù)測(cè)值顯示,武漢2月11日至13日新型冠狀肺炎的日感染人數(shù)持續(xù)增加。但結(jié)合實(shí)際日感染人數(shù),實(shí)際值普遍低于預(yù)測(cè)值。由此可知,之前一段時(shí)間的疫情防治措施已經(jīng)初步取得成效,疫情爆發(fā)期已經(jīng)過(guò)去,開(kāi)始進(jìn)入穩(wěn)定期[13]。
從實(shí)際數(shù)據(jù)分析,武漢疫情的發(fā)病數(shù)據(jù)整體呈現(xiàn)先上升后下降的趨勢(shì),在2月13日達(dá)到最大值。1月16日到2月13日之前,日感染人數(shù)呈現(xiàn)上升趨勢(shì),2月13日之后,日感染人數(shù)呈現(xiàn)下降趨勢(shì)。直到3月18日之后,日感染人數(shù)接近于0。利用Holt模型對(duì)武漢日感染人數(shù)進(jìn)行預(yù)測(cè),并于實(shí)際值比較,分析得出武漢疫情的穩(wěn)定期已經(jīng)到來(lái),對(duì)于整體把握新型冠狀疫情的走勢(shì)具有重要意義。
表9 Holt雙參數(shù)指數(shù)平滑模型預(yù)測(cè)結(jié)果表
圖5 Holt雙參數(shù)指數(shù)平滑模型預(yù)測(cè)圖
新型冠狀病毒自今年爆發(fā)以來(lái),席卷多個(gè)國(guó)家,在全球范圍內(nèi)造成了不可估計(jì)的損失,是我國(guó)乃至世界面臨的最嚴(yán)重的流行疾病問(wèn)題之一。建立有效的統(tǒng)計(jì)預(yù)測(cè)模型預(yù)測(cè)新冠肺炎的發(fā)病情況,對(duì)新冠肺炎的預(yù)防和研究具有重要意義。本文利用2020年1月16日至2月13日國(guó)家衛(wèi)生健康委員會(huì)和湖北省衛(wèi)生健康委員會(huì)發(fā)布的新冠肺炎數(shù)據(jù),分別建立了Holt雙參數(shù)線性指數(shù)平滑模型和ARIMA(1,2,1)模型。其中,ARIMA模型的擬合系數(shù)為0.834,Holt雙參數(shù)線性指數(shù)平滑模型的擬合系數(shù)為0.968,Holt雙參數(shù)線性指數(shù)平滑模型的擬合效果較優(yōu)。最后,使用模型對(duì)2月11日至2月13日的新增感染人數(shù)做出預(yù)測(cè),實(shí)際值低于預(yù)測(cè)值,與武漢疫情發(fā)病數(shù)據(jù)先上升后下降的整體變化趨勢(shì)相吻合。研究表明在疫情爆發(fā)期前一段時(shí)間的疫情防治措施已經(jīng)初步取得成效,人們的防疫意識(shí)也明顯增強(qiáng)。證明之前的封城和居家隔離措施是正確有效的,接下來(lái)仍然需要努力,使得疫情的“拐點(diǎn)”早點(diǎn)到來(lái)。
運(yùn)城學(xué)院學(xué)報(bào)2020年3期