羅 林, 李亞爽
(周口師范學院 數(shù)學與統(tǒng)計學院, 河南 周口 466001)
GDP(國內生產(chǎn)總值)反映一國國民經(jīng)濟生產(chǎn)規(guī)模及綜合實力總量指標,在經(jīng)濟研究中發(fā)揮著重要的作用.而一個國家的國內生產(chǎn)總值又是由各省生產(chǎn)總值所構成的.在經(jīng)濟快速發(fā)展,競爭日益激烈的當今社會,準確把握經(jīng)濟的未來走勢,合理的判斷經(jīng)濟情況,對于一個省乃至全國的經(jīng)濟發(fā)展至關重要.因此,研究各省生產(chǎn)總值對研究國內生產(chǎn)總值以及各省乃至全國經(jīng)濟都起著重要作用.本文對1975—2015年的河南省GDP時間序列進行分析討論,建立合適的ARIMA模型,預測未來5年河南省GDP,為河南省政府部門制定經(jīng)濟計劃提供依據(jù)和參考[1].
如果一個時間序列不管在什么時間測量,它的均值、方差以及各種滯后協(xié)方差都保持不變,就稱它是平穩(wěn)的.平穩(wěn)性檢驗是對時間序列進一步分析的基礎.本文主要采用時序圖檢驗和單位根檢驗相結合的方法來判定時間序列的平穩(wěn)性.
時序圖檢驗,通過繪制時序圖,觀察序列點是否圍繞其均值附近波動.如果是,則為平穩(wěn)序列;否則,為非平穩(wěn)序列.此判定具有一定的主觀性,只能做粗略的判定.
PP檢驗,是單位根檢驗的一種,具有一定的客觀性,是檢驗時間序列平穩(wěn)性的主流方法.原假設Η0:該時間序列存在單位根,即序列非平穩(wěn).備擇假設Η1:該時間序列無單位根,即序列平穩(wěn).若PP檢驗的τ統(tǒng)計量的值大于顯著水平α下的臨界值,該序列有單位根,接受原假設Η0,序列非平穩(wěn);否則拒絕原假設,接受備擇假設Η1,該序列無單位根,序列平穩(wěn).
平穩(wěn)時間序列ARMA(p,q)模型的分析方法非常成熟.但在自然界中絕大部分序列都是非平穩(wěn)的.非平穩(wěn)時間序列可以通過一次或多次差分轉化為平穩(wěn)序列.差分運算的實質是使用自回歸的方式提供確定性信息. 相距一期的兩個序列值之間的減法運算稱為1階差分運算[2].
(1)
對1階差分后序列再進行1階差分運算稱為2階差分.
(xt-1-xt-2)=(1-Β)2xt.
(2)
依此類推,p階差分為對p-1階差分再進行一次1階差分運算.
(3)
純隨機性序列值之間無任何相關關系,不能根據(jù)歷史數(shù)據(jù)對未來數(shù)據(jù)進行預測.白噪聲檢驗用來檢驗時間序列的純隨機性.在建立時間序列模型過程中,需要對待處理序列進行白噪聲檢驗.白噪聲檢驗一般方法有兩種:一種觀察自相關圖是否落在兩倍標準差之內,若全落在兩倍標準差內,則序列為白噪聲序列,反之不然.另一種是根據(jù)Bartlett定理,由統(tǒng)計量p值判斷序列是否為白噪聲序列.具體方法如下:
通過構造檢驗統(tǒng)計量檢驗序列的純隨機性,建立原假設和備擇假設:
H0:ρ1=ρ2=...=ρm,?m>0;
H1:至少存在某個ρκ不為零,?m>0,κm.在原假設條件下,建立統(tǒng)計量:
(4)
當Q統(tǒng)計量的p值小于給定的顯著性水平α時,拒絕原假設,認為序列為非白噪聲序列;當Q統(tǒng)計量的p值大于給定的顯著性水平α時,不能拒絕原假設,認為序列為白噪聲序列.
具有如下結構的模型稱為求和自回歸移動平均(autoregressive integrated moving average)模型,簡記為ARIMA(p,d,q)模型:
(5)
使用ARIMA(p,d,q)模型對觀察序列建模是一件比較簡單的事情,具體流程如下:
(1)獲得觀測值序列;
(2)平穩(wěn)性檢驗.若平穩(wěn),繼續(xù)下去;否則做差分運算,轉向步驟(2);
(3)白噪聲檢驗.若未通過檢驗,擬合ARMA(p,q)模型;若通過檢驗,分析結束.
1975—2015年河南省GDP的時間序列數(shù)據(jù)來自于河南省統(tǒng)計年鑒,利用R軟件[3]作河南省GDP時間序列時序圖(圖1).由圖1可知GDP序列呈持續(xù)增長的趨勢,為一非平穩(wěn)時間序列,需要對其進行差分運算.對原數(shù)據(jù)先后進行一階差分和二階差分,得時序圖如圖2和圖3. 由圖2可看出一階差分序列時序圖在前期仍有持續(xù)增長的趨勢,圖3的二階差分趨于平穩(wěn),基本上在某一值周圍波動.
圖1 1975—2015年河南省GDP序列(X)時序圖
圖2 1975—2015年
圖3 1975—2015年
時序圖只能粗略的估計序列的平穩(wěn)性,下面利用PP檢驗方法對序列進行平穩(wěn)性檢驗. 記原序列為X(t),一階差分序列為diff(X(t)),二階差分序列為Y(t),分別對其進行PP檢驗,結果如表1所示:
表1 一階差分序列與二階差分序列的單位根檢驗
PP檢驗結果顯示原時間序列P值為0.990,遠遠大于各個顯著性水平α,由此可判斷原時間序列為非平穩(wěn)序列;一階差分序列單位根檢驗P值為0.243,大于各個顯著性水平α,因此可判斷一階差分仍為非平穩(wěn)序列;二階差分序列單位根檢驗P值為0.010,如果令河南省GDP時間序列二階差分序列在顯著性水平為5%或10%,則此二階差分序列是平穩(wěn)的.在此基礎上建立合適的ARIMA(p,2,q)模型.
利用R軟件畫河南省GDP二階差分序列(Y)的自相關圖(圖4)和偏自相關圖(圖5), 粗略確定ARMA(p,q)模型中的p和q的值.
圖4 1975-2015年
圖5 1975-2015年
從圖4、圖5中可以看出,二階差分序列自相關圖和偏自相關圖均在區(qū)間范圍內波動,但自相關圖大約在15階左右才趨于0,偏自相關圖在區(qū)間內沒有趨于0的跡象,故可認為自相關圖和偏自相關圖均拖尾.根據(jù)自相關圖和偏自相關圖,對河南省GDP二階差分時間序列分別建立 ARIMA(2,2,2)模型、ARIMA(3,2,2)模型、ARIMA(3,2,0)模型、ARIMA(4,2,0)模型,利用AIC準則判斷最優(yōu)模型,模型建立結果如表2所示:
表2 河南省GDP二階差分序列ARIMA模型擬合結果
由上表2比較結果顯示,ARIMA(2,2,2)模型的AIC值最小,其次是ARIMA(3,2,0)模型,然后是ARIMA(3,2,2)模型,ARIMA(4,2,0)模型的AIC值最大,故只有當參數(shù)p=q=2時,模型擬合效果最好.ARIMA(2,2,2)模型殘差序列白噪聲檢驗的相伴概率(p-Box-Pierce)顯示(如表3):
表3 ARIMA(2,2,2)模型殘差的白噪聲檢驗
因P值顯著大于顯著性水平α,所以該序列不能拒絕純隨機的原假設[4].換言ARIMA(2,2,2)模型殘差序列的波動沒有任何規(guī)律可循,因此模型的殘差亦滿足方差齊性假設,可見原數(shù)據(jù)的相關信息已提取充分,即殘差序列為一純隨機性序列,該模型通過殘差序列白噪聲檢驗.
根據(jù)以上分析,最終得到ARIMA(2,2,2)模型,利用此模型對2016—2025年河南省GDP進行預測,最終預測結果如表4,結果表明河南省未來5年GDP仍將保持快速穩(wěn)定增長(如圖6).
表4 2016—2025河南省GDP預測值
同時圖6也表明河南省未來5年的宏觀經(jīng)濟穩(wěn)定增長,政策良好,社會經(jīng)濟生活秩序穩(wěn)定,但是在未來發(fā)展過程中依然需要積極響應國家地方政策,保證各項宏觀調控舉措的落實,增強經(jīng)濟增長韌性,確保經(jīng)濟回穩(wěn)因素持續(xù),努力促進全省經(jīng)濟步入快速發(fā)展的軌道,從而保證河南省更高的GDP增長率[5].
(橫坐標時間,縱坐標是GDP,陰影部分為GDP預測區(qū)間)
時域分析方法主要是從序列自相關的角度揭示時間序列的發(fā)展規(guī)律,它具有理論基礎扎實、操作步驟規(guī)范、分析結果易于解釋等優(yōu)勢.目前它已廣泛應用于自然科學和社會科學的各個領域,成為時間序列分析的主流方法.ARIMA模型先根據(jù)序列識別一個試用模型,再加以診斷,做出必要的優(yōu)化,根據(jù)所要解決的問題以及問題的特點等方面來綜合考慮并選擇相對最優(yōu)模型.此外,檢驗ARIMA模型殘差的純隨機性檢驗,提高模型精度.但
隨著預測時間的延長,預測誤差會越來越大.總體來說,在實際應用中,ARIMA模型成為GDP短期預測的最佳模型.
通過以上對1975至2015年河南省國內生產(chǎn)總值序列進行的分析和所建立的模型,說明對非平穩(wěn)時間序列作建模分析時,利用ARIMA模型具有較好的預測效果.本文所建立的ARIMA(2,2,2)模型,可用于對河南省國內生產(chǎn)總值作短期預測,為河南省制定經(jīng)濟發(fā)展目標提供決策參考.
參考文獻:
[1] 華鵬,趙學民.ARIMA模型在廣東省GDP預測中的應用[J].統(tǒng)計與決策,2010(12):168-169.
[2]王燕.應用時間序列分析[M].4版.北京:中國人民大學出版社,2015.
[3]李子奈.計量經(jīng)濟學[M].3版.北京:高等教育出版社,2000.
[4]宋海礁.ARIMA模型在上海市GDP預測中的應用[J].科教文匯,2008(08):208-209.
[5]徐耀東.ARIMA模型在安徽省GDP預測中的研究與應用[J].銅陵學院學報,2009(05):18-20.