屈曉陽
摘要:在分析過程中,首先利用SAS軟件繪制時序圖,從整體上把握數(shù)據(jù)信息。再進行數(shù)據(jù)的預(yù)處理,發(fā)現(xiàn)該化工原料價格序列具有非平穩(wěn)非白噪聲的屬性,說明該序列有值得提取的相關(guān)信息,同時考慮差分方法使序列平穩(wěn)。
然后分別采取1階差分和2階差分并將得到的結(jié)果進行對比,從中選出相對最優(yōu)模型為ARIMA(2,1,0)。接著對所選取的模型進行參數(shù)估計以及模型檢驗,發(fā)現(xiàn)ARIMA(2,1,0)模型對該化工原料價格序列建模成功。
最后根據(jù)建立的模型對該化工原料的價格進行未來五個月的預(yù)測以期得到有價值的信息。
關(guān)鍵詞:ARIMA模型;SAS軟件;差分平穩(wěn);序列預(yù)測
一、描繪時序圖
針對某種重要化工原料1990年至2004年的月度價格作出時序圖,從圖中可以發(fā)現(xiàn),該序列波動范圍較大,并不在某一個常數(shù)值附近波動,同時顯示出一定的趨勢性。
二、時序特征分析
(一)描述性統(tǒng)計
由SAS編程可得到化工原料月度價格序列描述性統(tǒng)計的值,其中均值為215.3616,標(biāo)準(zhǔn)差為60.29508,該序列共有177個觀察值。
(二)自相關(guān)圖檢驗
作出化工原料月度價格序列的自相關(guān)圖,其中橫軸表示自相關(guān)系數(shù),縱軸表示延遲時期數(shù),用水平方向的垂線表示自相關(guān)系數(shù)的大小??梢园l(fā)現(xiàn),序列的自相關(guān)系數(shù)遞的速度相當(dāng)緩慢,直至延遲24期自相關(guān)系數(shù)也未衰減到零。同時,自相關(guān)圖顯示序列自相關(guān)系數(shù)長期位于零軸的一邊,說明序列具有單調(diào)趨勢。由以上的分析可知該序列為非平穩(wěn)序列。
(三)純隨機性檢驗
由SAS可得到序列的純隨機性檢驗結(jié)果:
延遲階數(shù)LB統(tǒng)計量的值 P值
6554.08<.0001
12731.53<.0001
18783.1<.0001
24801.66<.0001
檢驗結(jié)果顯示,在各階延遲下LB檢驗統(tǒng)計量的P值都非常?。?0.0001),所以我們可以以很大的把握(置信水平>99.999%)認為該序列屬于非白噪聲序列。結(jié)合前面的平穩(wěn)性檢驗結(jié)果,說明該序列為非平穩(wěn)序列,同時還蘊含著值得提取的相關(guān)信息。
三、差分平穩(wěn)及模型確定
由于該化工原料月度數(shù)據(jù)表現(xiàn)出非平穩(wěn)性,為了進一步的分析,下面對序列進行差分處理。
(一)1階差分平穩(wěn)
1、1階差分平穩(wěn)序列分析
作圖可以看出,1階差分已經(jīng)達到了很好的效果。從時序圖可以發(fā)現(xiàn),序列不存在明顯的趨勢性或周期性,沒有顯著的非平穩(wěn)特征。
白噪聲檢驗結(jié)果顯示,在各階延遲下LB檢驗統(tǒng)計量的P值都很?。?0.02),所以我們可以以很大的把握(置信水平>98%)認為該序列屬于非白噪聲序列。再做出樣本自相關(guān)圖和樣本偏自相關(guān)圖,進一步確定模型平穩(wěn)性并給擬合模型定階。
從自相關(guān)圖也可以看出自相關(guān)系數(shù)很快地衰減到零,延遲1階后,自相關(guān)系數(shù)基本都在2倍標(biāo)準(zhǔn)差范圍之內(nèi),故進一步確定該序列具有短期相關(guān)性,1階差分序列平穩(wěn)。再進一步考察自相關(guān)系數(shù)衰減到零的過程,可以看到自相關(guān)系數(shù)衰減到零并不是一個突然的過程,而是有一個連續(xù)漸變的過程,故認為自相關(guān)系數(shù)拖尾。
最后考察偏自相關(guān)系數(shù)衰減到零的過程,除了1~2階偏自相關(guān)系數(shù)在2倍標(biāo)準(zhǔn)差范圍之外,其他階數(shù)的偏自相關(guān)系數(shù)都在2倍標(biāo)準(zhǔn)差范圍內(nèi),這是偏自相關(guān)系數(shù)2階截尾的典型特征。根據(jù)自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)2階截尾的屬性,初步確定擬合模型為AR(2)模型。
2、1階差分序列定階
(1)相對最優(yōu)定階??紤]人為定階的主觀性過強,利用SAS進行相對最優(yōu)定階,得到結(jié)果。最后一條信息顯示,在自相關(guān)延遲階數(shù)小于等于5,移動平均延遲階數(shù)也小于等于5的所有ARIMA(p,1,q)模型中,BIC信息量最小的是ARIMA(3,1,0)。
(2)參數(shù)檢驗。由檢驗結(jié)果可知,常數(shù)項和φ3項無法通過顯著性檢驗,去除常數(shù)項得到新的檢驗結(jié)果。
結(jié)果發(fā)現(xiàn),去除常數(shù)項后φ3項仍無法通過顯著性檢驗,而去除φ3后參數(shù)均通過顯著性檢驗,故認為此模型為ARIMA(2,1,0)。
(二)2階差分平穩(wěn)
未避免差分方法選擇不當(dāng)對模型建立造成的影響,下面對序列進行2階差分,并將得到的結(jié)果與1階差分的結(jié)果進行對比,從而篩選出較優(yōu)模型。
1、2階差分平穩(wěn)序列分析
對比1階差分時序圖,可以看到2階差分與1階差分得到的結(jié)果并沒有顯著的區(qū)別。從時序圖可以發(fā)現(xiàn),序列不存在明顯的趨勢性或周期性,沒有顯著的非平穩(wěn)特征。
白噪聲檢驗顯示,在各階延遲下LB檢驗統(tǒng)計量的P值都很?。?0.0001),所以我們可以以很大的把握(置信水平>99.999%)認為該序列屬于非白噪聲序列。再做出樣本自相關(guān)圖和樣本偏自相關(guān)圖,進一步確定模型平穩(wěn)性并給擬合模型定階。從自相關(guān)圖也可以看到,延遲3階后,自相關(guān)系數(shù)基本都在2倍標(biāo)準(zhǔn)差范圍之內(nèi),故進一步確定該序列具有短期相關(guān)性,2階差分序列平穩(wěn)。
再進一步考察自相關(guān)系數(shù)衰減到零的過程,可以看到自相關(guān)系數(shù)衰減到零并不是一個突然的過程,而是有一個連續(xù)漸變的過程,故認為自相關(guān)系數(shù)不截尾。
最后考察偏自相關(guān)系數(shù)衰減到零的過程,可以看到有明顯的正弦波動軌跡,這說明偏自相關(guān)系數(shù)衰減到零的過程也是一個連續(xù)漸變的過程,故認為偏自相關(guān)系數(shù)不截尾。根據(jù)自相關(guān)系數(shù)不截尾,偏自相關(guān)系數(shù)也不截尾的屬性,以及樣本自相關(guān)系數(shù)與偏自相關(guān)系數(shù)的特征,初步確定擬合模型為ARMA(1,2)模型。
2、2階差分序列定階
(1)相對最優(yōu)定階。相對最優(yōu)定階得到結(jié)果的最后一條信息顯示,在自相關(guān)延遲階數(shù)小于等于5,移動平均延遲階數(shù)也小于等于5的所有ARIMA(p,1,q)模型中,BIC信息量最小的是ARIMA(2,1,3)。
(2)參數(shù)檢驗。由檢驗結(jié)果可知,常數(shù)項、φ2以及θ3項無法通過顯著性檢驗,去除常數(shù)項得到新的檢驗結(jié)果。結(jié)果發(fā)現(xiàn),去除常數(shù)項后φ2和θ3項仍無法通過顯著性檢驗,下面進一步檢驗。在置信水平α=0.1下,參數(shù)全部通過顯著性檢驗,故認為此模型為ARIMA(1,2,2)。
(三)1階差分與2階差分模型比較
下面將1階差分和2階差分得到的結(jié)果進行對比,利用SAS得到結(jié)果。從得到的結(jié)果可以發(fā)現(xiàn),ARIMA(2,1,0)模型延遲各階的LB統(tǒng)計量的P值均顯著大于置信水平α=0.05,故該擬合模型顯著成立。而ARIMA(1,2,2)無法通過殘差白噪聲檢驗。同時,最小信息量檢驗顯示無論是使用AIC準(zhǔn)則還是使用SBC準(zhǔn)則,ARIMA(2,1,0)都要優(yōu)于ARIMA(1,2,2)模型,故對于該價格序列來說,ARIMA(2,1,0)模型是相對最優(yōu)模型。
綜合以上的分析,確定該序列的擬合模型為ARIMA(2,1,0)。
四、參數(shù)估計
使用條件最小二乘估計,確定該模型口徑為:
xt=εt1-0.34727B+0.23294B2Var(εt)=335.0896
或等價寫為:xt=1.34727xt-1-0.58021xt-2+0.23294xt-3+εt
Var(εt)=335.0896
五、模型檢驗
殘差白噪聲檢驗參數(shù)顯著性檢驗
延遲階數(shù)LB統(tǒng)計量P值待估參數(shù)t統(tǒng)計量P值
63.970.410514.69<.0001
127.780.65042-3.090.0023
1814.450.5654
2419.50.6142
3024.750.6413
顯然看出,擬合檢驗統(tǒng)計量的P值都顯著大于顯著性檢驗水平0.05,可以認為該殘差序列為白噪聲序列,即擬合模型顯著有效。系數(shù)顯著性檢驗顯示兩參數(shù)均顯著。這說明ARIMA(2,1,0)模型對該序列建模成功。
六、序列預(yù)測
由上面的分析確定最終的模型為:
xt=1.34727xt-1-0.58021xt-2+0.23294xt-3+εtVar(εt)=335.0896
其中φ1=1.34727,φ2=-0.58021,φ3=0.23294
序列預(yù)測的計算過程如下:
(一)預(yù)測值的計算
已知x177=411,x176=420,x175=374,故178=1.34727x177-0.58021x176+0.23294x175=397.1594
179=1.34727178-0.58021x177+0.23294x176=394.4493
180=1.34727179-0.58021178+0.23294x177=396.7322
181=1.34727180-0.58021179+0.23294178=398.1563
182=1.34727181-0.58021180+0.23294179=398.119
(二)預(yù)測方差的計算
首先,根據(jù)Green函數(shù)的遞推公式,算得
G0=1,G1=φ1G0=1.34727,G2=φ1G1+φ2G0=1.23493G3=φ1G2+φ2G1+φ3G0=1.11502,G4=φ1G3+φ2G2+φ3G1=1.09955
則
Var[e178]=G20σ2ε,Var[e179]=(G20+G21)σ2ε,Var[e180]=(G20+G21+G22)σ2εVar[e181]=(G20+G21+G22+G23)σ2εVar[e182]=(G20+G21+G22+G23+G24)σ2ε=2276.8551
(3)未來l步預(yù)測價格預(yù)測的95%置信區(qū)間為:
(177+l-1.96Var[e177+l],177+l+1.96Var[e177+l])
代入數(shù)值可得到計算結(jié)果如下:
序號 預(yù)測值標(biāo)準(zhǔn)差 95% 置信區(qū)間
178397.159418.3055361.2813433.0374
179394.449330.7136334.2517454.6469
180396.732238.1361321.9869471.4775
181398.156343.2548313.3785482.934
182398.11947.7086304.612491.6261
由SAS得到該序列擬合與預(yù)測圖可以較為直觀的看到模型擬合的結(jié)果,同時可以看到,隨著預(yù)測期數(shù)的增加,預(yù)測方差出現(xiàn)增大的趨勢。
七、模型評價
本文基于某種重要化工原料1990年至2004年的月度價格數(shù)據(jù),充分利用應(yīng)用時間序列分析的知識,成功建立ARIMA模型,并給出未來五個月價格的預(yù)測,希望能提取到盡可能準(zhǔn)確的信息并對該方面的研究提供一定的幫助。
經(jīng)過對比分析、各參數(shù)的顯著性檢驗及模型的顯著性檢驗,最后確定該化工原料1990年至2004年的月度價格序列為ARIMA(2,1,0)模型。該模型簡單,可操作性強,并且與實際的結(jié)果符合的很好,可以幫助我們研究該化工原料價格走向,對未來的預(yù)測有一定的實際意義。(作者單位:遼寧大學(xué))
參考文獻:
[1]王燕. 應(yīng)用時間序列分析[M]. 第三版. 北京:中國人民大學(xué)出版社, 2012.