程 敏,張耀文,姜紀(jì)沂*,任 杰,趙振宏
(1.防災(zāi)科技學(xué)院,北京101601;2.中國(guó)地質(zhì)調(diào)查局西安地質(zhì)調(diào)查中心,西安710054)
降雨量的短期變化,往往會(huì)造成嚴(yán)重的干旱澇、洪災(zāi)害,并對(duì)當(dāng)?shù)亟?jīng)濟(jì)發(fā)展等造成不同程度的影響。高精度的降雨量預(yù)測(cè)方法能及早地發(fā)現(xiàn)降雨量變化情況,提高應(yīng)對(duì)此類災(zāi)害的能力[1]。降雨量是衡量干旱程度的一個(gè)重要指標(biāo),直接反映了自然界的變化,降雨量的大小直接影響農(nóng)業(yè)生產(chǎn)[2]。如能對(duì)降雨量做出科學(xué)準(zhǔn)確預(yù)測(cè),農(nóng)業(yè)、水利等有關(guān)部門就可以及時(shí)采取防澇抗旱措施[3],降低不必要的損失,因此降雨量預(yù)測(cè)已成為當(dāng)前預(yù)測(cè)中的重要研究課題[4]。對(duì)于水資源短缺的北方來(lái)說(shuō),地下水是北方的主要用水來(lái)源,高精度的預(yù)測(cè)降雨量,能最大限度的利用水資源,將多余的水儲(chǔ)存起來(lái),以緩解水資源短缺問(wèn)題,降低因水資源短缺或極度缺少而帶來(lái)的經(jīng)濟(jì)損失。
基于這種情況,本文試圖運(yùn)用時(shí)間序列中的ARIMA模型對(duì)該地區(qū)的降雨量進(jìn)行預(yù)測(cè),進(jìn)而了解未來(lái)5年內(nèi)濟(jì)南市的降雨量變化情況。
濟(jì)南市坐落于魯西北沖積平原和魯中低山丘陵的接觸地帶,北部為黃河下游平原,南部為泰山山系,地勢(shì)北部低、南部高,平原稍微傾向東北,黃河沿西南—東北方向穿過(guò)濟(jì)南市所在的區(qū)域,黃河河床高出地面形成地上河,在黃兩岸發(fā)育有諸多的呈條帶狀的洼地。最高峰為南部西營(yíng)鎮(zhèn)梯子山,地面標(biāo)高975.8m,如圖1。
圖1 濟(jì)南市水系分布
某種統(tǒng)計(jì)指標(biāo)的數(shù)值按時(shí)間先后順序排列所形成的數(shù)列叫做時(shí)間序列[5]。時(shí)間序列模型主要分為兩類,一是ARMA(Auto Regression Moving Average)模型,即自回歸移動(dòng)平均模型[6];二是ARIMA(Auto Regressive Integrated Moving Average Model)模型,即自回歸積分滑動(dòng)平均模型[7]。其實(shí)兩類模型可以看做是兩類模型的組合再加上差分運(yùn)算,一類模型是AR; 一類模型是MA,ARMA模型可以看做是AR+MA;而ARIMA可以看做是AR+差分處理+MA。
在ARIMA(p,d,q)模型進(jìn)行預(yù)測(cè)時(shí),所用序列必須是平穩(wěn)的序列,如果是非平穩(wěn)化的序列,就需將其轉(zhuǎn)化為平穩(wěn)化的序列[8]。
以濟(jì)南市1959~2010年降雨量數(shù)據(jù)作為本次分析樣本,在SPSS的預(yù)測(cè)選項(xiàng)中創(chuàng)建ARIMA模型,并進(jìn)行向前預(yù)測(cè),使用2011~2015年降雨量數(shù)據(jù)檢驗(yàn)ARIMA模型的預(yù)測(cè)準(zhǔn)確度,如圖2。
圖2 1959~2010年降雨量序列
在SPSS軟件平臺(tái)進(jìn)行降雨量的輸入與定義日期,然后進(jìn)行數(shù)據(jù)序列圖的繪制[9],如圖3。
從圖3可看出,該時(shí)間序列在1967,1985,2003年具有較大波動(dòng),但總體具有一定的向下趨勢(shì),并不平穩(wěn)。需要對(duì)1959~2010年的降雨量數(shù)據(jù)進(jìn)行平穩(wěn)化處理。
圖3 降雨量平穩(wěn)化序列
在SPSS軟件中繪制的降雨量一階差分的自相關(guān)圖和偏自相關(guān)圖如圖4??梢钥闯觯浑A差分后數(shù)據(jù)序列的自相關(guān)系數(shù)在顯著不為0后趨于0,而一階差分后的偏自相關(guān)系數(shù)較接近0。判定數(shù)據(jù)序列基本平穩(wěn)。故ARIMA模型參數(shù)d取值為1。
圖4 自相關(guān)圖和偏自相關(guān)圖
根據(jù)自相關(guān)圖和偏自相關(guān)圖均表現(xiàn)為拖尾現(xiàn)象適用于ARMA模型,從偏自相關(guān)圖中可見(jiàn)在5%的顯著水平下,偏自相關(guān)系數(shù)顯著不為0的個(gè)數(shù)為3,之后趨于0,并呈現(xiàn)拖尾現(xiàn)象,故判斷p值取3或2(取2主要是因?yàn)樽詈笠粋€(gè)顯著超過(guò)0的階數(shù)是由于偶然出現(xiàn)的,確定p值時(shí)需要剔出); 從自相關(guān)圖中可看出在5%的顯著水平下,自相關(guān)系數(shù)顯著為零的個(gè)數(shù)為6,故判斷q值取6或5(取5主要是最后一個(gè)顯著超過(guò)0的系數(shù)是由于偶然出現(xiàn)的,確定p值時(shí)需要剔出)。利用SPSS建立ARIMA模型,經(jīng)過(guò)前期的預(yù)測(cè)對(duì)比分析,根據(jù)SPSS中輸出的模型統(tǒng)計(jì)量表格中的BlC值確定最佳模型。一般來(lái)講,選取BIC達(dá)到最小的模型為最佳模型。
經(jīng)過(guò)前期數(shù)據(jù)處理與分析,模型可初定為ARIMA (3,1,6)、ARIMA (3,1,5)、ARIMA (2,1,6)ARIMA(2,1,5)。用SPSS軟件作擬合圖比較4種模型擬合(如圖5),檢驗(yàn)選擇模型的準(zhǔn)確性。根據(jù)BIC定階準(zhǔn)則選出最優(yōu)模型,如表1??芍P虯RIMA(2,1,5)BIC值最小,其值為11.654。
圖5 4種模型擬合
表1 4種模型BIC比較
由于預(yù)測(cè)準(zhǔn)確度分析的年份為2011~2015年,ARIMA(2,1,5)的預(yù)測(cè)趨勢(shì)跟觀察值的走勢(shì)基本一致,而其他3個(gè)模型的預(yù)測(cè)趨勢(shì)都偏離了觀察值的走勢(shì),所以ARIMA (2,1,5)的擬合效果最好。同時(shí),ARIMA(2,1,5)模型的BIC值最小,可選取此模型作為最后的預(yù)測(cè)模型。
對(duì)殘差序列進(jìn)行白噪聲檢驗(yàn),根據(jù)SPSS中輸出的模型統(tǒng)計(jì)量表來(lái)看,ARIMA(2,l,5)模型的Ljung-Box統(tǒng)計(jì)量Q=7.734。p值為0.737顯著大于0.05的檢驗(yàn)水平,即接受Ljung-Box的原假設(shè):所有數(shù)據(jù)之間相互獨(dú)立,可認(rèn)為殘差序列為白噪聲序列[9]。
模型殘差序列的自相關(guān)系數(shù)與偏自相關(guān)系數(shù)的分布在以0為中心的范圍內(nèi),并且自相關(guān)系數(shù)與偏自相關(guān)系數(shù)的絕對(duì)值均小于0.3(如圖6),認(rèn)為此殘差序列之間是相互獨(dú)立的,意味著殘差序列是白噪聲的。模型涵蓋了所有的信息,說(shuō)明此模型效果較好。
圖6 殘差序列自相關(guān)和偏自相關(guān)
綜上,ARIMA(2,1,5)符合BIC準(zhǔn)則,通過(guò)了擬合度檢驗(yàn)與白噪聲檢驗(yàn),因此可以用ARIMA(2,1,5)對(duì)降雨量進(jìn)行預(yù)測(cè)。表明濟(jì)南市2010~2015年降雨量預(yù)測(cè)同樣適用ARIMA(2,1,5)預(yù)測(cè)。
本次選擇了ARIMA(2,1,5),利用濟(jì)南市1959~2010年的降雨量數(shù)據(jù),對(duì)該地區(qū)2011~2015年的降雨量進(jìn)行預(yù)測(cè),如表2、表3、表4。
表2 ARIMA預(yù)測(cè)值與實(shí)際值統(tǒng)計(jì) 單位:mm
表3 ARIMA預(yù)測(cè)值與實(shí)際值統(tǒng)計(jì) 單位:mm
表4 ARIMA的預(yù)測(cè)值與實(shí)際值統(tǒng)計(jì) 單位:mm
從表2、表3和表4看出,ARIMA模型預(yù)測(cè)年限為4年。表2中2011~2015年的平均相對(duì)誤差為5.74%,預(yù)測(cè)精度控制在10%以內(nèi);2014年以后,預(yù)測(cè)精度大于10%。表3中2010~2015年平均相對(duì)誤差4.9%,預(yù)測(cè)精度控制在10%以內(nèi);2015年預(yù)測(cè)精度大于10%。表4中2010~2013年平均相對(duì)誤差為2.2%,預(yù)測(cè)精度控制在10%以內(nèi),其中2010年和2013年的預(yù)測(cè)精度為1.0%,逼近實(shí)際觀測(cè)值,預(yù)報(bào)準(zhǔn)確。由此推測(cè),ARIMA模型對(duì)降雨量的預(yù)測(cè)在連續(xù)的4~5年內(nèi)對(duì)降雨量的預(yù)測(cè)非常準(zhǔn)確。
同樣方法,在SPSS軟件分析預(yù)測(cè)選項(xiàng)中對(duì)2016~2020年降雨量進(jìn)行預(yù)測(cè),如表5。
表5 2016~2020年降雨量預(yù)測(cè)值 單位:mm
2016~2020年濟(jì)南市的降雨量較平穩(wěn),波動(dòng)較小,大多分布在濟(jì)南市的平均降雨量672.8mm周圍。預(yù)測(cè)結(jié)果看出,濟(jì)南市2016~2020年不會(huì)發(fā)生較大洪水,但ARIMA模型預(yù)測(cè)降雨量不一定準(zhǔn)確,因降雨量受較多因素影響,僅憑時(shí)間序列是不能完全準(zhǔn)確的預(yù)測(cè)降雨量。
通過(guò)模型確定,綜合1959~2015年的降雨量數(shù)據(jù),時(shí)間序列,如圖7。從圖7可看出,1959~1991年30多年內(nèi),這段時(shí)期內(nèi)降雨量波動(dòng)較大,而1992~2015年,這段時(shí)期內(nèi)降雨量波動(dòng)較??;從大趨勢(shì)來(lái)看,濟(jì)南市降雨量逐漸減少。
2016~2020年降雨量進(jìn)行預(yù)測(cè),結(jié)果表明,這5年濟(jì)南市降雨量波動(dòng)較小,大多在650mm上下波動(dòng),預(yù)計(jì)接未來(lái)5年沒(méi)有大的旱災(zāi)和洪災(zāi)。
圖7 1959~2015年降雨量序列
從原理來(lái)看,ARIMA模型具有一定的數(shù)理統(tǒng)計(jì)意義,即ARIMA模型具有偶然性,且這種偶然性會(huì)隨著預(yù)測(cè)時(shí)間長(zhǎng)短變化而變化,可能會(huì)隨著時(shí)限增加而這種偶然性出現(xiàn)的頻率增加,同時(shí)也有可能隨著預(yù)測(cè)時(shí)限的縮短而增長(zhǎng)(預(yù)測(cè)時(shí)限越短,其預(yù)測(cè)準(zhǔn)確度會(huì)有一定提高)。
(1)用ARIMA模型對(duì)濟(jì)南市未來(lái)5年的年降雨量進(jìn)行預(yù)測(cè),其結(jié)果顯示未來(lái)5年的年平均降雨量為659.2mm,這 與1959~2015年的多年平均降雨量672.8mm較為接近,說(shuō)明濟(jì)南市未來(lái)5年出現(xiàn)干旱及洪澇災(zāi)害的可能性較小。
(2)濟(jì)南市降雨量的變化呈現(xiàn)出一個(gè)逐漸減小的趨勢(shì),說(shuō)明濟(jì)南市地下水的大氣降雨補(bǔ)給量將會(huì)出現(xiàn)下降趨勢(shì),需要更加合理地利用和分配水資源。
(3)由于影響一個(gè)地區(qū)降雨量的因素很多,諸如地區(qū)緯度的差異,氣溫變化、所處地理位置、生態(tài)環(huán)境的因素(植被的覆蓋率,流域的分布狀況)[10],以及人為影響因素等,所以只用時(shí)間序列分析方法來(lái)預(yù)測(cè)降雨量的效果較差,需考慮多方面的因素,綜合現(xiàn)有的預(yù)測(cè)模型,建立適合當(dāng)?shù)氐慕涤炅款A(yù)測(cè)模型,從而使得降雨量預(yù)測(cè)更為可靠。