徐夢(mèng)茹 王學(xué)明
1(寧夏大學(xué)信息工程學(xué)院 寧夏 銀川 750001)2(寧夏大學(xué)網(wǎng)絡(luò)信息管理中心 寧夏 銀川 750001)
年降雨量與地區(qū)農(nóng)作物收成、交通出行等方面息息相關(guān)。降雨量的多少將直接影響地區(qū)經(jīng)濟(jì)發(fā)展,尤其是農(nóng)業(yè)方面的發(fā)展,降雨量太多或太少都會(huì)造成農(nóng)作物的歉收;降雨量的多少也會(huì)影響流域水資源的豐富程度。若能夠?qū)⒛杲涤炅繙?zhǔn)確預(yù)測(cè)出來(lái),這將對(duì)防洪抗洪、農(nóng)業(yè)生產(chǎn)工作起到非常大的積極作用。但因?yàn)榈乩砦恢玫牟町?,各個(gè)地方對(duì)于降雨量的預(yù)測(cè)需要因地而異。本文根據(jù)某地區(qū)從1949年到2017年的年降雨量歷史數(shù)據(jù)對(duì)2018年的年降雨量數(shù)值作出預(yù)測(cè),通過(guò)此次實(shí)驗(yàn)為準(zhǔn)確預(yù)報(bào)年降雨量提供合理的依據(jù)。降雨量預(yù)測(cè)流程如圖1所示。
圖1 降雨量預(yù)測(cè)流程
一般要預(yù)測(cè)事物發(fā)展的趨勢(shì),必須要知道此事物歷史情況與當(dāng)前情況,并加以綜合考慮,同時(shí)有相當(dāng)一部分的預(yù)測(cè)方法需要知道預(yù)測(cè)事物的歷史及當(dāng)下數(shù)據(jù),才能進(jìn)行建模,并應(yīng)用于實(shí)際生活中。但馬爾科夫模型則認(rèn)為只要知道當(dāng)前的狀態(tài),便可以預(yù)測(cè)未來(lái)的情況,不需要知道事物發(fā)展的歷史狀態(tài)。這種性質(zhì)稱(chēng)為馬爾科夫性[1-2]。馬爾科夫模型是根據(jù)系統(tǒng)狀態(tài)之間的轉(zhuǎn)移概率來(lái)預(yù)測(cè)系統(tǒng)的未來(lái)發(fā)展。
定義2將轉(zhuǎn)移頻數(shù)矩陣的第j列之和除以所有轉(zhuǎn)移頻數(shù)之和,所得值為邊際概率,記為P·j,即有:
(1)
當(dāng)n充分大時(shí),統(tǒng)計(jì)量服從自由度為(m-1)2的X2分布。其公式如下:
(2)
定義3數(shù)據(jù)序列是相依的隨機(jī)變量,采用自相關(guān)系數(shù)作為相依關(guān)系強(qiáng)弱的度量,第s步的自相關(guān)系數(shù)為:
(3)
(4)
式中:ωs為第s步的馬爾科夫權(quán)重;l為最大轉(zhuǎn)移步數(shù)。
ARIMA模型的基本思想是將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,用一定的數(shù)學(xué)模型來(lái)近似描述這個(gè)序列。它的具體形式可以表達(dá)成ARIMA(p,d,q),其中:p表示自回歸過(guò)程的階數(shù);d表示查分階數(shù);q表示移動(dòng)平均過(guò)程的階數(shù)[3-4]。ARIMA模型建模過(guò)程及具體步驟如圖2所示。
圖2 ARIMA模型預(yù)測(cè)流程
實(shí)驗(yàn)選取的原始數(shù)據(jù)為某地區(qū)1949年-2017年的年降雨量數(shù)據(jù)。其中,將1949年-2014年數(shù)據(jù)作為模型訓(xùn)練集,2015年-2017年數(shù)據(jù)作為模型測(cè)試集,所有預(yù)測(cè)過(guò)程均用MATLAB與R語(yǔ)言完成。
(1) 序列平穩(wěn)性判斷。根據(jù)降雨量數(shù)據(jù)做出時(shí)序圖,如圖3所示。
圖3 序列時(shí)序圖
根據(jù)時(shí)序圖可知原數(shù)據(jù)接近平穩(wěn),之后用ADF單位根檢驗(yàn)法來(lái)進(jìn)行檢驗(yàn),通過(guò)計(jì)算得出Dickey-Fuller=-6.662 674,概率P=0.000 0<0.05,說(shuō)明序列平穩(wěn),不用進(jìn)行差分平穩(wěn)化數(shù)據(jù),故ARIMA(p,d,q)中d=0。
(2) 模型識(shí)別。根據(jù)數(shù)據(jù)得出自相關(guān)圖與偏自相關(guān)圖,如圖4、圖5所示。
圖4 自相關(guān)圖
圖5 偏自相關(guān)圖
選取部分(p,q)來(lái)進(jìn)行AIC驗(yàn)證,得到各模型檢驗(yàn)結(jié)果,如表1所示。
表1 模型檢驗(yàn)結(jié)果
從表1中可知,當(dāng)(p,q)=(1,1)時(shí)AIC 的值最小,理應(yīng)選擇p=1、q=1,但經(jīng)過(guò)后期誤差分析可知,當(dāng)p=1、q=5時(shí)誤差最小,即預(yù)測(cè)最準(zhǔn)確,所以本實(shí)驗(yàn)中的ARIMA模型選用ARIMA(1,0,5)[5]。
(3) 模型預(yù)測(cè)。經(jīng)過(guò)預(yù)測(cè),得到2015年的降雨量預(yù)測(cè)值為565.894 8 mm,2016年的降雨量預(yù)測(cè)值為614.572 6 mm,2017年降雨量預(yù)測(cè)值為611.973 6 mm,平均相對(duì)誤差為3.94%,預(yù)測(cè)結(jié)果較好。并將其應(yīng)用于2018年降雨量預(yù)測(cè),得到預(yù)測(cè)值為579.165 1 mm。
(1) 馬氏性檢驗(yàn)。根據(jù)規(guī)定,一般情況下,當(dāng)年降雨量t小于平均降雨量的-25%為枯水年,小于-10%偏枯年,-10%~10%為平水年,大于10%為偏豐年,大于25%為豐水年[6]。由此可以將降雨量劃分為5個(gè)等級(jí),如表2所示。
表2 降雨量等級(jí)狀態(tài)劃分
由此得到:
各步轉(zhuǎn)移概率為:
表3 統(tǒng)計(jì)量計(jì)算表
(2) 預(yù)測(cè)過(guò)程:
① 計(jì)算各階自相關(guān)系數(shù)及權(quán)重。由式(3)求得序列各階自相關(guān)系數(shù)r=(0.186,0.049,0.171,0.208,0.228),再由式(4)得權(quán)重向量為ω=(0.206 2,0.054 3,0.189 6,0.230 6,0.252 8)。
② 根據(jù)1949年-2014年的歷史降雨量數(shù)據(jù)分別預(yù)測(cè)2015年-2017年降雨量數(shù)據(jù)。以2015年為例,如表4所示。
表4 2015年降水量預(yù)測(cè)狀態(tài)
由表4可知,將同一概率加權(quán)后的最大值為0.290 7,即2015年的預(yù)測(cè)狀態(tài)為1,同理可得2016年、2017年預(yù)測(cè)狀態(tài)分別為3和3,同時(shí)求得2015年到2017年的預(yù)測(cè)降雨量分別為499.33 mm、599.1 mm、599.1 mm。實(shí)際上2015年到2017年的降水狀態(tài)都為3,得出平均相對(duì)誤差為10.17%。
最后根據(jù)實(shí)際2013年到2017年降水量數(shù)據(jù),得到2018年預(yù)測(cè)的狀態(tài)為2,降水量預(yù)測(cè)為519.26 mm。
通常,ARIMA模型較為簡(jiǎn)單,只需要內(nèi)生變量而不需要借助其他外生變量,但是其本質(zhì)上只能用來(lái)預(yù)測(cè)線性關(guān)系,不能預(yù)測(cè)非線性關(guān)系[7]。馬爾可夫模型不適合用于系統(tǒng)中長(zhǎng)期數(shù)據(jù)的預(yù)測(cè),理論上只能用于預(yù)測(cè)短期內(nèi)的數(shù)據(jù)[8]?;趯?duì)以上兩種模型的分析,本文將ARIMA模型得到的預(yù)測(cè)結(jié)果與馬爾科夫模型的預(yù)測(cè)結(jié)果進(jìn)行求平均值的操作,見(jiàn)表5。
表5 預(yù)測(cè)模型誤差對(duì)比
在相對(duì)誤差相差不大的情況下,組合模型的均方誤差相較ARIMA模型和馬爾科夫模型的均方誤差明顯下降,說(shuō)明組合模型預(yù)測(cè)的穩(wěn)定性較高,此組合模型有較高的應(yīng)用價(jià)值。
本文通過(guò)將兩種模型組合對(duì)地區(qū)降雨量進(jìn)行預(yù)測(cè),所達(dá)到的預(yù)測(cè)結(jié)果較好?;谀壳敖涤炅款A(yù)測(cè)模型,本文所提出的組合模型還有一些地方需要進(jìn)一步改進(jìn),以提高預(yù)測(cè)準(zhǔn)確度和穩(wěn)定性。預(yù)測(cè)準(zhǔn)確度的提高將有利于相關(guān)部門(mén)制定相關(guān)的方案措施來(lái)應(yīng)對(duì)不同的降雨量帶來(lái)的后果,做到防患于未然。