李冬
[摘要]在自然科學和社會科學各研究領(lǐng)域中,大量決策問題都離不開預測,預測是決策的基礎。近年來,ARIMA模型得到了極大的發(fā)展,越來越多的應用在各個領(lǐng)域的分析中,本文我們對某公司2000年1月到2008年12月的8種商品的銷售總額的數(shù)據(jù)作為分析的樣本進行分析,建模,預測未來三期的值。為了驗證預測的準確性,我們?nèi)サ袅撕笕诘臄?shù)據(jù),作為預測目標,以便對真實值與預測值進行有效的對比,結(jié)果預測基本準確,最終我們得出預測五期的增量。
[關(guān)鍵詞]時間序列;ARIMA模型;預測
[DOI]1013939/jcnkizgsc201538095
1判斷序列的平穩(wěn)性
某企業(yè)商品的銷售總額數(shù)據(jù)(數(shù)據(jù)見附錄)的時序圖見圖1。
2對原序列進行差分運算
時序圖顯示該序列具有一個線性遞增趨勢。所以對原序列先做異步差分,提取線性遞增趨勢[2]。
xt=xt-xt-1
一步差分后的序列{xt}時序圖,見圖2:
時序圖顯示出差分后序列在均值附近比較穩(wěn)定的波動。為了進一步確定平穩(wěn)性,考察1階差分后序列的自相關(guān)[3],可以看到在短期內(nèi)1~5階的區(qū)間內(nèi)相關(guān)性急速增大,又急速減小,后期基本都小于二倍的方差,認為自相關(guān)圖顯示序列有短期的相關(guān)性,所以,可以初步認為一階差分后序列平穩(wěn)[4]。
3對平穩(wěn)的1階差分序列進行白噪聲檢驗
對1階差分后序列進行白噪聲檢驗,結(jié)果如下:
Autocorrelation Check for White Noise
ToChi-Pr >
LagSquareDFChiSqAutocorrelations
641496<00001-0031-0265-0323-020701720358
12915412<000010188-0095-0367-027600840405
181372418<000010255-0173-0345-014900030360
241712324<000010196-0079-0207-0234-00070332
在檢驗的顯著性水平取為005的條件下,所有的延遲階數(shù)對應的p值都小于005,所以該差分序列不能視為白噪聲序列。
4對平穩(wěn)非白噪聲差分序列擬合ARMA模型
從自相關(guān)圖與偏自相關(guān)圖來看,偏自相關(guān)值與自相關(guān)值都有一些值大于2倍的方差,所以認為序列相關(guān)圖顯示出不截尾性,考慮構(gòu)造ARMA(1,1)模型擬合1階差分后序列,但結(jié)果殘差自相關(guān)檢驗結(jié)果中,LB統(tǒng)計量的p值都小于005,所以說模型不顯著,還有可提取部分。
經(jīng)過篩選,ARMA(2,3)模型顯著,其參數(shù)估計如下:
Conditional Least Squares Estimation
StandardApprox
ParameterEstimateErrort ValuePr > |t|Lag
MA1,11557140106091468<000011
MA1,2-137403014833-926<000012
MA1,3036736010822339000103
AR1,11050350026254001<000011
AR1,2-100000002630-3803<000012
結(jié)果中顯示其參數(shù)估計的T統(tǒng)計量的p值都小于005,所以參數(shù)估計顯著。
5對殘差序列進行檢驗
殘差自相關(guān)檢驗結(jié)果如下:
Autocorrelation Check of Residuals
ToChi-Pr >
LagSquareDFChiSqAutocorrelations
6353100604-0041-00390111-0009-0070-0108
12904702499-00690062-0045-0143-00860093
18135313040810051-0107-00520075-01010058
2418621904816-0008004201450015-00350116
我們從結(jié)果中看到,所有的p值中都小于005,不能接受原假設,即殘差不存在相關(guān)性,所以認為該擬合模型顯著成立[5]。
6擬合模型的具體形式
模型擬合結(jié)果如下
ARIMA(2,1,3)模型為:
(1-105035B+1B2)(1-B)Xt=at(1-155714 B+137403B2-036736B3)
7ARIMA模型預測
FForecasts for variable sum
ObsForecastStd Error95% Confidence Limits
1052397799930254688-3532010083276097
1065606345433918242-10415079122541988
1072968000134254641-3745786196817863
從結(jié)果中我們可以,看到未來三期的預測值。
2008年10月銷售總額增量為23977999元;
2008年11月銷售總額增量為56063454元;
2008年12月銷售總額增量為29680001元。
擬合預測圖見圖3:
圖3中黑色帶星為真實值一階差分后的曲線,紅色線為擬合曲線,綠色為95%的預測區(qū)間。
8結(jié)論
在本文中,我們將某公司2000年1月到2008年12月的8種商品的銷售總額的數(shù)據(jù)作為分析的樣本。為了驗證預測的準確性,我們?nèi)サ袅撕笕诘臄?shù)據(jù),作為預測目標,以便對真實值與預測值進行有效的對比。首先,對數(shù)據(jù)進行序列圖的觀察。通過觀察,我們看到序列存在趨勢因素,然后我們通過差分,去除此因素。通過對差分后數(shù)據(jù)的觀察,以及相關(guān)系數(shù)圖的觀察確定為平穩(wěn)時間序列,以及對偏相關(guān)系數(shù)圖的觀察,序列的白噪聲檢驗,確認了序列符合建立ARMA模型的條件。然后,我們對數(shù)據(jù)行建模。通過t檢驗,以及殘差白噪聲檢驗,最終我們得出模型。最后,我們通過模型進行短期的預測。通過最后三期真實值與預測值的對比,相對誤差都小于5%,我們可以認為我們的預測是比較準確的。在此基礎之上,我們用全部數(shù)據(jù)進行分析,得出了未來五期的相對上一期的預測增量。
參考文獻:
[1]陳兆國時間序列及其譜分析[M].北京:科學出版社,1998
[2]王燕應用時間序列分析方法[M].北京:人民大學出版社,2012
[3]詹姆斯·D漢密爾頓時間序列分析[M].劉明志,譯.北京:中國社會科學出版社,1999
[4]Cleveland WP,Tiao GCDecomposition of Seasonal Time Series:A Model for the X-11 Program[J].Journal of the American Statistical Association,1986(71):581-587
[5]Maravall A,Planas CEstimation Error and the Specification of Unobserved Component Models[J].Bank of Spain—Service of Studios:92,325-353,199
[6]韓朝怡ARIMA模型和X-11過程在農(nóng)民人均現(xiàn)金收入預測中的應用研究[J].中國市場,2015(25)