劉 翔
(上海交通大學(xué)安泰經(jīng)濟與管理學(xué)院, 上海 200052)
ARIMA模型全稱為差分自回歸移動平均模型(Autoregressive Integrated Moving Average Model,簡記ARIMA),是由博克思(Box)和詹金斯(Jenkins)于20世紀70年代初提出的著名時間序列預(yù)測方法,又被稱為Box-Jenkins模型或博克思-詹金斯法[1].其基本思想是:將預(yù)測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列,用一定的數(shù)學(xué)模型來近似描述這個序列,并認為該序列蘊含的規(guī)律還將持續(xù)遵循下去.這個模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值進行外推預(yù)測未來值.因此,ARIMA模型在實證研究中被廣泛運用于時間序列分析和模型預(yù)測領(lǐng)域.
ARIMA模型建模的對象是平穩(wěn)的時間序列,因此在對一個離散的單變量時間序列進行建模分析時,應(yīng)當首先考察其平穩(wěn)性,再分析和判斷數(shù)據(jù)序列的生成過程.
根據(jù)平穩(wěn)時間序列生成機制的不同,ARIMA模型實際包含3種類型的模型[2]:
(1)自回歸模型(簡稱AR模型): 模型為p階自回歸過程,簡記為AR(p),用公式表示為
yt=φ1yt-1+φ2yt-2+…+φpyt-p+at
其中,{at}是滿足0均值和常數(shù)方差的白噪聲序列,φi為模型的待估參數(shù).
(2)移動平均模型(簡稱MA模型):
模型為q階移動平均過程,簡記為MA(q),用公式表示為
yt=at-θ1at-1-θ2at-2-…-θqat-q
其中,θi為模型的待估參數(shù),其它字母含義同上.
(3)自回歸移動平均混合模型(簡稱ARMA模型)
模型為自回歸移動平均混合過程,簡記為ARMA(p,q),用公式表示為
yt=φ1yt-1+φ2yt-2+…+φpyt-p+at-θ1at-1-θ2at-2-…-θqat-q
其中,字母含義同上.可以看到,ARIMA模型為自回歸AR模型和移動平均MA模型的算數(shù)和,其中的I表示差分的逆運算.
對于一個時間序列{yt}而言,構(gòu)建ARIMA模型的一般步驟為:
首先進行單位根檢驗或游程檢驗其平穩(wěn)性,若非平穩(wěn)后通過d階差分作平穩(wěn)化處理;如果數(shù)據(jù)存在異方差,則需對數(shù)據(jù)進行技術(shù)處理,直到處理后的數(shù)據(jù)的自相關(guān)函數(shù)值和偏相關(guān)函數(shù)值無顯著地異于零.
之后通過時間序列模型的識別規(guī)則判斷序列所屬類型并建立模型.若平穩(wěn)序列的偏相關(guān)函數(shù)是截尾的,而自相關(guān)函數(shù)是拖尾的,適合AR模型;若平穩(wěn)序列的偏相關(guān)函數(shù)是拖尾的,而自相關(guān)函數(shù)是截尾的,適合MA模型;若平穩(wěn)序列的偏相關(guān)函數(shù)和自相關(guān)函數(shù)均是拖尾的,則序列適合ARMA模型[3].
然后對該平穩(wěn)時間序列建立相應(yīng)的ARMA(p,q)模型,確定后的差分自回歸移動平均模型整體表示為ARIMA(p,d,q),其中p為自回歸項,q為移動平均項數(shù),d為時間序列成為平穩(wěn)時所做的差分次數(shù).
最后對模型進行參數(shù)估計并檢驗參數(shù)是否具有統(tǒng)計意義,如有必要還需要進行假設(shè)檢驗,診斷殘差序列是否為白噪聲.
以上步驟進行完后,獲得與該時間序列匹配的ARIMA模型,并可以通過模型進行趨勢預(yù)測.
ARIMA模型在宏觀經(jīng)濟領(lǐng)域有很多重要的運用,通?;跉v史數(shù)據(jù)構(gòu)建模型,并在置信區(qū)間內(nèi)對所分析經(jīng)濟對象的趨勢進行判斷.本文將以中國服務(wù)貿(mào)易進出口規(guī)模為分析對象,探討ARIMA這一模型工具的適用性.
服務(wù)貿(mào)易作為一種新興的貿(mào)易形式,在一定程度上代表了國家的經(jīng)濟發(fā)展水平.通常情況下,發(fā)達國家服務(wù)貿(mào)易在該國國際貿(mào)易中比重較大.多年以來我國利用對外貿(mào)易帶動經(jīng)濟長期增長,貨物貿(mào)易起著主導(dǎo)作用,而與之相對應(yīng)的服務(wù)貿(mào)易卻始終為逆差狀態(tài).但不可否認服務(wù)貿(mào)易已經(jīng)成為我國經(jīng)濟新的增長點,從1982年到2010年,我國服務(wù)貿(mào)易規(guī)模的年均增長速度達到17%[4].目前我國面臨著產(chǎn)業(yè)結(jié)構(gòu)調(diào)整的轉(zhuǎn)型困難,而大力發(fā)展服務(wù)業(yè)及服務(wù)跨國貿(mào)易是扭轉(zhuǎn)這一局面、實現(xiàn)經(jīng)濟成功轉(zhuǎn)型的突破點之一.
圖1 我國服務(wù)貿(mào)易規(guī)模ARIMA模型預(yù)測的基本流程
雖然服務(wù)貿(mào)易逆差在逐步縮小,但是由于受到越來越多不可控的國際因素的影響,目前我國服務(wù)貿(mào)易的增長呈現(xiàn)較大的波動性.因此,全面把握我國服務(wù)貿(mào)易的發(fā)展規(guī)律和未來走勢對于我國采取有利措施、保證服務(wù)貿(mào)易的持續(xù)穩(wěn)定發(fā)展具有重要的意義.為此,本文采用時間序列分析方法,從數(shù)量建模的角度揭示我國服務(wù)貿(mào)易的發(fā)展規(guī)律,重點探討ARIMA模型對貿(mào)易規(guī)模預(yù)測的適用程度.
根據(jù)建立ARIMA(p,d,q)模型的要點,我國服務(wù)貿(mào)易規(guī)模預(yù)測的基本流程如圖1所示.
我國從1982年起正式將服務(wù)貿(mào)易納入商務(wù)和海關(guān)統(tǒng)計的范圍[5],本研究選取數(shù)據(jù)來源于國家統(tǒng)計局2011年出版的《中國統(tǒng)計年鑒(2010)》及中國商務(wù)部《中國服務(wù)貿(mào)易統(tǒng)計(2010)》提供的服務(wù)貿(mào)易數(shù)據(jù).為檢驗?zāi)P偷暮篁炐?,同時保證足夠的樣本數(shù)量范圍,本文選取中國1982~2008年的服務(wù)進出口數(shù)據(jù)作為建模樣本,將2009和2010年貿(mào)易數(shù)據(jù)作為后驗樣本來判斷模型估計的有效性.本文將我國服務(wù)貿(mào)易進口額時間序列簡記為M,出口額時間序列簡記為X,進出口總額時間序列簡記為MX.
從圖2的服務(wù)貿(mào)易總額MX時間路徑中可以看出,原數(shù)據(jù)序列MX有著明顯的指數(shù)增長趨勢(圖1a),為非平穩(wěn)序列.通過對數(shù)處理后,對數(shù)序列LMX表現(xiàn)為線性增長趨勢.為從統(tǒng)計意義上對序列的平穩(wěn)性進行識別,對數(shù)據(jù)序列進行單位根ADF檢驗.ADF檢驗顯示對數(shù)序列LMX的t統(tǒng)計量的顯著性概率P=0.988,遠大于α=0.05,接受零假設(shè),即序列顯著存在單位根.
圖2 服務(wù)貿(mào)易總額及其對數(shù)序列的時間路徑
為消除單位根的影響,對序列LMX進行差分運算,記為ΔLMX,再進行平穩(wěn)性ADF檢驗.檢驗結(jié)果表明LMX一階差分序列單位根仍存在,二階差分(序列記為Δ2LMX)后單位根不存在,時間序列為平穩(wěn)序列,即服務(wù)貿(mào)易總額對數(shù)序列LMX為二階單整序列.
在SAS統(tǒng)計軟件中對LMX的二次差分序列Δ2LMX進行自相關(guān)(ACF)和偏相關(guān)(PACF)分析,結(jié)果如圖3所示.從圖3中可以看出,Δ2LMX的自相關(guān)圖在一階處是截尾的,而其對應(yīng)的偏相關(guān)圖是拖尾的,依此初步判斷序列LMX遵循的模型為ARIMA(0,2,1),屬于MA模型類型.
圖3 Δ2LMX序列的自相關(guān)圖和偏相關(guān)圖
為進一步判斷模型類型,結(jié)合上述分析,本文分別嘗試用ARIMA(0,2,1)、ARIMA(0,2,1)、 ARIMA(1,2,1)、 ARIMA(1,2,2) 以及ARIMA(2,2,1)5個模型對序列LMX進行擬合檢驗.結(jié)果顯示,只有ARIMA(0,2,1)和ARIMA(0,2,1)2個模型通過了參數(shù)檢驗,其余模型都存在估計參數(shù)檢驗不顯著的情形,驗證了我們之前關(guān)于序列屬于MA類型的判斷.兩模型的AIC值(赤池信息準則Akaike Information Criterion)和SSR值(剩余平方和)如表1所示.
表1 模型估計的AIC值和SSR值
根據(jù)表1中模型估計的結(jié)果并考慮到建模的簡約原則,對貿(mào)易總額的對數(shù)序列LMX擬采用ARIMA(0,2,1)模型進行估計,其結(jié)果通過了模型的殘差平穩(wěn)性檢驗,表明該模型合理,模型估計結(jié)果為:
lnMXt=0.985 8at-1+at
(1)
t值 (-37.325)R2=0.5
為了更全面地對服務(wù)貿(mào)易規(guī)模進行擬合和預(yù)測,分析服務(wù)貿(mào)易進口和出口各自的變化規(guī)律,按照上述建模過程,分別對服務(wù)貿(mào)易進口額時間序列Mt和出口額時間序列Xt建立模型.我國服務(wù)貿(mào)易進口額Mt合理的ARIMA模型估計結(jié)果為:
ΔlnMt=0.195-0.564ΔlnMt-2+0.962at-2+at
(2)
t值 (4.707) (-4.740) (28.578)R2=0.451
同理,我國服務(wù)貿(mào)易出口額Xt合理的ARIMA模型估計結(jié)果為:
Δ2lnXt=-0.826Δ2lnXt-2+0.962at-2+at
(3)
t值 (-10.333) (-20.731)R2=0.545
利用上述建立的模型(1)、(2)和(3)式,分別對我國2009年和2010年服務(wù)貿(mào)易總額、進口額以及出口額進行外推預(yù)測,預(yù)測結(jié)果如表2所示.
表2 2009~2010年中國服務(wù)貿(mào)易規(guī)模預(yù)測(單位:億美元)
表2表明,2009年和2010年我國的服務(wù)貿(mào)易總額分別為3 638億美元和4 345億美元,年增長率均為19%,而歷史數(shù)據(jù)顯示由于服務(wù)貿(mào)易進口的快速增加,模型根據(jù)這一內(nèi)在規(guī)律預(yù)測2009年和2010年服務(wù)貿(mào)易進口增長速度將達到26%的水平.
我們結(jié)合2009年和2010年的實際數(shù)據(jù)做一對比(表3),可以發(fā)現(xiàn)數(shù)據(jù)出現(xiàn)了較大的高估,偏差范圍為20%~30%.通過數(shù)據(jù)回溯可以發(fā)現(xiàn),由于全球金融危機對實體經(jīng)濟造成的滯后影響,2009年服務(wù)貿(mào)易近10年來出現(xiàn)了較大的負增長,較2008年降低了5.8%,服務(wù)貿(mào)易出口額甚至降低了12.2%.
表3 2009~2010年中國服務(wù)貿(mào)易規(guī)模及預(yù)測偏差對比(單位:億美元)
表4 2010年中國服務(wù)貿(mào)易規(guī)模及重估預(yù)測偏差對比(單位:億美元)
我國服務(wù)貿(mào)易在國際市場上并不具備貨物貿(mào)易那樣的優(yōu)勢,當全球經(jīng)濟處于下滑階段時,作為幼稚產(chǎn)業(yè)并不具備抗擊風(fēng)險的能力,因此偏離模型根據(jù)歷史數(shù)據(jù)估計的趨勢.但區(qū)間估計彌補了點估計的不足,實際值基本上都在區(qū)間估計的范圍內(nèi),考慮到了突發(fā)變動對序列趨勢的影響.
同時我們也可以看到,隨著年份的推移,2010年預(yù)測數(shù)據(jù)的精度相對2009年出現(xiàn)了更大的波動.我們嘗試將2009年的數(shù)據(jù)作為樣本構(gòu)建新的模型,并以新模型來預(yù)測2010年的數(shù)據(jù),結(jié)果如表4所示.
由于考慮了2009年的突變因素,數(shù)據(jù)序列內(nèi)在邏輯的變動相應(yīng)改變了模型參數(shù)估計,2010年預(yù)測偏差大幅降低,模型的參考價值提高.
模型預(yù)測的主要目的是在考慮隨機波動的前提下對趨勢進行模擬和分析,其預(yù)測結(jié)果不是為精確到細節(jié),而是作為參考指標和判斷依據(jù).從上述構(gòu)建我國服務(wù)貿(mào)易進出口規(guī)模ARIMA模型并進行短期預(yù)測的過程中,模型從動態(tài)角度反映出服務(wù)貿(mào)易規(guī)模的變動趨勢和特點,我們可以看到ARIMA這個重要的時間序列建模方法適用于很多縱向經(jīng)濟現(xiàn)象的定量分析,特別是經(jīng)濟體規(guī)模的變動預(yù)測,能夠幫助理解和擬合數(shù)據(jù)內(nèi)部隱藏的規(guī)律性.模型對歷史數(shù)據(jù)中包含信息做了充分吸收,相對于簡單的增長率平均法更加科學(xué)和有效.同時區(qū)間預(yù)測與點預(yù)測相結(jié)合,使得模型預(yù)測結(jié)果更加客觀嚴謹.
但是從預(yù)測的理想程度上,本文也提出利用ARIMA模型進行經(jīng)濟預(yù)測時的局限性:
(1)突發(fā)事件對數(shù)據(jù)序列趨勢的影響. 應(yīng)該注意的是ARIMA模型基于的原理是假設(shè)序列保持不變的趨勢,置信區(qū)間雖然已經(jīng)包含了隨機波動的范圍,但當出現(xiàn)影響事件發(fā)展方向的“黑天鵝”事件時,其預(yù)測將偏離真實情況.
(2)區(qū)間估計范圍過大. 根據(jù)本文中的研究樣本,在置信度為95%的情況下,區(qū)間估計相對于點估計值的變動達到了±20%以上,最高的甚至達到±40%.對于宏觀經(jīng)濟變量來說,年增長率10%已經(jīng)屬于較大的變化,因此區(qū)間估計范圍過大會使預(yù)測喪失其意義.
針對以上兩個局限性,本文給出如下建議:
(1)時間序列模型應(yīng)對數(shù)據(jù)進行適時的動態(tài)更新和調(diào)整,以便更好地反映和模擬內(nèi)在規(guī)律.
(2)適當降低區(qū)間估計的范圍,以保證預(yù)測本身的價值.由于縮小置信區(qū)間會以降低置信水平為代價,因此在構(gòu)造模型時需要在兩者間做一權(quán)衡.同時,盡可能擴大樣本數(shù)量,以保證在置信水平不變的前提下置信區(qū)間相對變窄.
參考文獻
[1] 王煒炘,杜金觀,伍尤桂,等.應(yīng)用時間序列分析[M]. 桂林:廣西師范大學(xué)出版社,1999:102-183.
[2] George E. P. Box, Gwilym M.Jenkins. 時間序列分析-預(yù)測與控制[M]. 北京:中國統(tǒng)計出版社,1997:101-149.
[3] 張樹京,齊立心. 時間序列分析簡明教程[M]. 北京:北方交通大學(xué)出版社,2003:24-59.
[4]中國商務(wù)部. 中國服務(wù)貿(mào)易(2010)[M]. 北京:中國統(tǒng)計出版社,2011.
[5] 國家統(tǒng)計局. 中國服務(wù)貿(mào)易(2010)[M]. 北京:中國統(tǒng)計出版社,2011.
[6] 姜 弘. 居民消費價格指數(shù)的時間序列分析及預(yù)測[J]. 統(tǒng)計與決策,2009,4:26-33.
[7] 謝佳利,楊善朝,梁 鑫.我國CPI時間序列預(yù)測模型的比較及實證檢驗[J]. 統(tǒng)計與決策,2008,6:74-82.
[8] 王振龍. 時間序列分析[M]. 北京:中國統(tǒng)計出版社,2000.