杜 潔,高 珊,金欣雪
(阜陽師范大學數(shù)學與統(tǒng)計學院,安徽阜陽236037)
關(guān)鍵字:ARIMAX 模型;預測;時間序列分析
GDP 是衡量國家經(jīng)濟的指標之一[1]。自改革開放以來,我國的GDP 有逐年增長的變化趨勢。1978-2018 年,我國GDP 年增長率平均為9.52%,1984 年達到15.14%的高峰。2018 年我國的GDP總量更是達到了13.01 萬億美元,繼續(xù)穩(wěn)居世界第二大經(jīng)濟體[2]。
中國的GDP 增速控制在合理的范圍內(nèi),2019年中國經(jīng)濟開局良好,穩(wěn)中有進。中國經(jīng)濟的穩(wěn)定快速發(fā)展,為世界經(jīng)濟的復蘇貢獻了中國智慧和中國力量。因此,分析并預測我國GDP 的未來變化趨勢,在這個“非常時刻”,對中國經(jīng)濟乃至世界經(jīng)濟都具有十分重要的現(xiàn)實意義。
許多學者建立了對GDP 進行研究和預測的模型,包括多元線性回歸模型[3-4],ARIMA(autoregressive integrated moving average model)模型等[5-6]。Hsin 等[7]利用納什非線性灰色伯努利模型對金磚四國的GDP 進行了預測,證明模型是可行有效的。Schumacher 等[8]利用大因子模型對德國GDP 月、季數(shù)據(jù)進行了準確地實時預測。王紅超等[9]運用指數(shù)平滑法和回歸分析相結(jié)合的方法預測了2017 年我國GDP,得到滿意結(jié)果。王鑫等[10]利用干預模型和BP 神經(jīng)網(wǎng)絡集成模型對我國的GDP 進行預測,發(fā)現(xiàn)預測誤差較小。
眾多預測模型中,多元線性回歸模型沒有考慮殘差分布,ARIMA 等預測模型固然可以對GDP 進行研究,卻沒有考慮其它變量對它的影響?,F(xiàn)實中,全社會固定資產(chǎn)投資總額會對GDP產(chǎn)生一定的影響。如果考慮此因素對GDP 的影響,則可以提高模型的預測精度。基于此,本文建立全社會固定資產(chǎn)投資總額為輸入序列,GDP 為輸出序列的ARIMAX(ARIMA with external input)模型,對GDP 進行預測。
ARIMA 模型是對單變量進行分析和預測的經(jīng)典模型,如果不考慮其他變量對目標變量的影響,ARIMA 模型往往得不到滿意的結(jié)果。如果將其它序列也納入研究范圍,就涉及多元時間序列分析,其最典型的模型形式為ARIMAX,即動態(tài)回歸模型。對多元時間序列的分析始于1976 年,多元時間序列分析要求各變量是平穩(wěn)的,否則容易出現(xiàn)虛假回歸的情況[11]。當變量不平穩(wěn)時,1987 年恩格爾和格蘭杰給出了協(xié)整的定義,即雖然變量不平穩(wěn),但是回歸的殘差平穩(wěn),那么變量間就是協(xié)整的,此時不存在虛假回歸的問題。于是多元時間序列分析的方法開始盛行[12]。
(1)首先,對輸出變量序列{yt}和第i個輸入變量序列{xit}進行單位根檢驗;
(2)若{xit}非平穩(wěn),則建立ARIMA 模型擬合序列{xit},得到白噪聲{εxit}
(3)對{yt}實施同樣的變換,得到{εyit}:
其中:D為對yt進行的差分階數(shù)。
(4)研究{εxit} 與{εyit} 的互相關(guān)系數(shù),確定ARIMAX 模型形式[13],
其中:μ為常數(shù);Θ(B)=θ0-θ1B-θ2B2-…-θqBq為殘差序列{εt} 的q階移動平均系數(shù)多項式;Φ(B)=1-φ1B-φ2B2-…-φpBp為殘差序列{εt}的p階自回歸系數(shù)多項式;li為B的指數(shù);{at}為零均值白噪聲序列。
從《中國統(tǒng)計年鑒》(2018)獲取1980 到2018年我國GDP 和全社會固定資產(chǎn)投資總額(x)數(shù)據(jù),見表1。
表1 1980-2018 年我國GDP 和全社會固定資產(chǎn)投資總額(x)(部分)
3.2.1 檢驗x和GDP 及其對數(shù)和對數(shù)1 階差分的平穩(wěn)性
為滿足方差齊性的要求,本文對GDP 和x進行對數(shù)化處理[14],得到ln GDP 和lnx,對ln GDP和lnx分別做一階差分,得到?ln GDP 和?lnx。運用SAS9.4,分別畫出x和GDP,ln GDP 和lnx以及?ln GDP 和?lnx(dif ln GDP 和dif lnx)的時序圖見圖1。
由圖1(a)和(b),由于時序圖都存在上升的趨勢,容易得到GDP 和x以及l(fā)n GDP 和lnx都是非平穩(wěn)的。由圖1(c)可以看到時序圖沒有明顯的趨勢或者周期性變化??梢哉J為?ln GDP 和?lnx都是平穩(wěn)的[15-16]。
為了精確檢驗?ln GDP 和?lnx的平穩(wěn)性,對?ln GDP 和?lnx做ADF 檢驗。結(jié)果見表2~3。
圖1 時序圖
表2 序列?ln GDP 的單位根檢驗結(jié)果
表3 序列?ln x 的單位根檢驗結(jié)果
由表2 可以得到,?ln GDP 具有常數(shù)均值,且為平穩(wěn)序列,該序列具有1 階自相關(guān)。由表3 結(jié)果可以得到,?lnx具有常數(shù)均值,且為平穩(wěn)序列,該序列具有2 階自相關(guān)[17-19]。
3.2.2 對?lnx建立ARMA 模型
首先,?lnx的白噪聲檢驗通過,即?lnx在0.01 的顯著性水平下是非白噪聲,?lnx有信息可供提取,可以建立ARMA(autoregressive moving average model)模型。
其次,由AIC 及SBC 準則,最終得到疏系數(shù)模型AR(1,4)為條件最優(yōu)模型[20],并得到殘差{εi1}為白噪聲,因此模型顯著。常數(shù)μ及φ1,φ4的估計及{εi1}的白噪聲檢驗結(jié)果分別如表4 和5。
表4 對?ln x 建立ARMA 模型參數(shù)估計結(jié)果
表5 ?ln x 建立ARMA 模型殘差白噪聲檢驗結(jié)果
擬合模型為
其中,{εt1}為白噪聲序列。
對?ln GDP 實施同樣的變換,即
得到{εt2}。
3.2.3 建立ARIMAX 模型
考察{εt1} 和{εt2}之間的互相關(guān)系數(shù)。顯示?ln GDP 和?lnx在延遲0 階時最相關(guān)。因此將?ln GDP 和?lnx滯后0 期建模[21]。
圖2 {εt1}和{εt2}之間的互相關(guān)系數(shù)圖
經(jīng)試算,對?ln GDP 和?lnx建立的模型為
參數(shù)估計結(jié)果如表6 所示。ARIMAX 模型為:
模型參數(shù)顯著。
表6 ARIMAX 模型參數(shù)估計結(jié)果
at的白噪聲檢驗無法拒絕原假設[22],即模型已經(jīng)充分提取了序列的信息。且互相關(guān)檢驗結(jié)果顯示at和ln x 的互相關(guān)函數(shù)在顯著性水平為0.01時為0[23],說明模型有效。
利用ARIMAX 模型對ln GDP 進行向前2期,向后5 期預測結(jié)果如表7。換算成GDP 預測結(jié)果如表8。
表7 ARIMAX 模型預測結(jié)果
表8 取指GDP 預測結(jié)果
由2017 和2018 年的預測結(jié)果可見,GDP 預測相對誤差均不超過5%,預測較為準確[24]。
如果不考慮全社會固定資產(chǎn)投資總額對GDP的影響,選取ARIMA 模型對1980-2018 年GDP進行建模,并預測未來我國2019-2021 年的GDP的值,擬合的AR(5)模型為:
預測結(jié)果見表9
表9 ARIMA 模型預測結(jié)果
可見,ARIMAX 模型的預測MAPE(mean absolute percentage error)為1.995,ARIMA 模型的預測MAPE 為2.885。因此,ARIMAX 模型比ARIMA 模型預測更為準確。
為了更形象地觀看擬合效果,畫出擬合效果圖如圖3。圖3(a)為ln GDP 的擬合圖。星號代表實際值,中間虛線和兩邊實線分別代表擬合曲線和95%置信曲線。圖3(b)為GDP 的擬合圖,可見兩圖擬合效果都很好。
圖3 ARIMAX 模型擬合效果圖
因為GDP 和許多因素相關(guān),考慮到全社會固定資產(chǎn)投資總額和GDP 有較大的關(guān)聯(lián),因此把全社會固定資產(chǎn)投資總額作為變量引入到GDP 的預測模型當中,建立了ARIMAX 模型。結(jié)果顯示,2017 年和2018 年的預測相對誤差分別為0.07%和3.92%,均不超過5%,預測較為精確。將兩者的預測結(jié)果計算MAPE 發(fā)現(xiàn),ARIMAX 模型的預測結(jié)果較ARIMA 模型的預測結(jié)果更為精確。這也說明了全社會固定資產(chǎn)投資總額對我國GDP 具有一定的影響,將它加入預測模型中是合理的。