耿 強
?
基于ARIMA的PPI時間序列分析
耿強
摘要:ARIMA模型是一類精度較高的時間序列短期預(yù)測模型,本文借助于計量經(jīng)濟學(xué)軟件Eviews對我國2010年5月到2012年7 月PPI時間序列數(shù)據(jù)建立了ARIMA(0,1,1)模型,并對未來我國PPI的走勢進行了預(yù)測分析。
關(guān)鍵詞:ARIMA模型;PPI;CPI;時間序列分析
PPI即生產(chǎn)者物價指數(shù),也稱作工業(yè)品出廠價格指數(shù),是統(tǒng)計部門收集整理的多個物價指數(shù)中的其中一個,通常用來衡量制造商出廠價的平均變化的指數(shù),對于市場的敏感度很高。當(dāng)生產(chǎn)物價指數(shù)比預(yù)期數(shù)值要高時,說明會有通貨膨脹的風(fēng)險。當(dāng)生產(chǎn)物價指數(shù)比預(yù)期數(shù)值低的時候,則說明有通貨緊縮的風(fēng)險。PPI主要目的是衡量商品在不同生產(chǎn)階段價格的變化情況。通常情況下,商品的生產(chǎn)可以分成三個階段:一是原始階段:商品沒有做任何的加工;二是中間階段:商品需要作進一步的加工;三是完成階段:商品不再有任何的加工手續(xù)。 PPI之所以重要,是因為PPI是反映某一時期生產(chǎn)領(lǐng)域的價格變動情況的重要經(jīng)濟指標,是衡量企業(yè)產(chǎn)品出廠價格變動程度和變動趨勢的指數(shù),并對制定國民經(jīng)濟核算和相關(guān)經(jīng)濟政策有重要影響。當(dāng)前,我國PPI的調(diào)查產(chǎn)品大概有4000多種(含規(guī)格品9500多種),覆蓋了39個工業(yè)行業(yè),涉及的調(diào)查種類有186個。
PPI不僅是一個指數(shù),還是一族指數(shù),代表生產(chǎn)中三個漸進過程的每一個階段的價格指數(shù):原材料、中間品和產(chǎn)成品。對金融市場最有影響的就是產(chǎn)成品的PPI。它代表著這些商品被運到批發(fā)商和零售商之前的最終狀態(tài)。
PPI的計算法則:計算代表規(guī)格品的價格指數(shù)采用幾何平均法,計算代表產(chǎn)品的價格指數(shù)采用簡單算術(shù)平均法,計算工業(yè)品出廠價格總指數(shù)則采用加權(quán)算術(shù)平均法。
CPI表示消費者物價指數(shù),它是用來反映居民家庭購買消費商品及服務(wù)的價格水平的變動情況,通常作為衡量通貨膨脹的重要指標。
根據(jù)價格傳導(dǎo)規(guī)律,PPI對CPI也有一定的影響。CPI反映消費環(huán)節(jié)的價格水平,PPI反映生產(chǎn)環(huán)節(jié)的價格水平。整體價格的波動首先出現(xiàn)在生產(chǎn)領(lǐng)域,然后通過產(chǎn)業(yè)鏈向下游產(chǎn)業(yè)擴散,最后會涉及消費品。產(chǎn)業(yè)鏈可以分為下面兩條:一是以工業(yè)品為原材料的生產(chǎn),即原材料→生產(chǎn)資料→生活資料的傳導(dǎo);二是以農(nóng)產(chǎn)品為原料的生產(chǎn),即農(nóng)業(yè)生產(chǎn)資料→農(nóng)產(chǎn)品→食品的傳導(dǎo)。
**.Correlation is significant at the 0.01 level(2-tailed).
以上從定性的角度說明CPI與PPI的關(guān)系,為了檢驗以上的結(jié)論,本文從定量的角度對數(shù)據(jù)進行分析。選取2008年1月——2012年7月的CPI和PPI數(shù)據(jù)進行比對。顯示CPI與PPI波動的狀況一致,而且對兩個獨立樣本做非參數(shù)與參數(shù)檢驗時的p值非常小,說明兩種存在相關(guān)關(guān)系。相關(guān)系數(shù)也相對較大,說明PPI與CPI的相關(guān)性也很強。
PPI與CPI作為宏觀經(jīng)濟的兩個重要指標,通常可以根據(jù)兩者的走勢了解宏觀經(jīng)濟狀況。當(dāng)CPI不斷上漲,而PPI仍然處于企穩(wěn)或者下跌的時候,經(jīng)濟就開始步入繁榮期,因為總需求不斷擴張的同時,供給相對充足,此時企業(yè)利潤將不斷向上攀升;當(dāng)CPI開始向下走,而PPI卻不斷向上攀升,此時,經(jīng)濟就開始步入衰退期,因為CPI的下降表示總需求開始收縮,而PPI的攀升則顯示經(jīng)濟規(guī)模的擴大已經(jīng)受到上游行業(yè)或者資源的約束。
2011年7月,我國的PPI同比增幅一直處于下降趨勢,我們從以下兩方面分析:
一是國外大宗商品價格下降;二是國內(nèi)通貨膨脹趨于緩和。
2010年開始,我國為了克服通脹,央行持續(xù)上調(diào)存款準備金,中國經(jīng)濟處于收縮狀態(tài)。并且國內(nèi)經(jīng)濟產(chǎn)能出現(xiàn)了嚴重過剩狀況,比如鋼鐵行業(yè)。以前中國的重化工業(yè)既有海外外需市場的推動,又有國內(nèi)固定資產(chǎn)投資高速增長的拉動,這樣巨大的需求可以說滿足了中國工業(yè)產(chǎn)品供應(yīng)。隨著金融危機和歐美主權(quán)債務(wù)危機對中國外需的壓制,中國對房地產(chǎn)進行了宏觀調(diào)控,固定資產(chǎn)增速大幅下滑,最終通過PPI的下降和工業(yè)增速下降體現(xiàn)出來了。目前來看,短時間內(nèi)還很難出現(xiàn)改變。
1.數(shù)據(jù)選取
2010年5月開始,PPI同比增幅呈現(xiàn)下降趨勢。由于采用同比的計算方式,可以忽視季節(jié)性的影響因素。
2.對非平穩(wěn)序列進行平穩(wěn)化處理
對于非平穩(wěn)序列,選擇差分法來對確定信息進行提取,是一種非常方便有效的方法。通常差分法的選擇,有以下規(guī)律:(1)序列呈現(xiàn)顯著的線性趨勢,通常我們使用一階差分;(2)序列呈現(xiàn)曲線趨勢,則使用低階(二階、三階)差分就能提取出曲線的趨勢;(3)呈現(xiàn)固定周期時,進行步長為周期長度的差分運算。
觀察PPI從2010年5月到2012年7月的時間序列值,可以發(fā)現(xiàn)呈現(xiàn)線性趨勢。為了得到平穩(wěn)的時序,我們對原數(shù)據(jù)采用一階差分法。差分后的數(shù)據(jù)dif(x),大致圍繞0.5上下波動,可以大致判斷該時序趨于平穩(wěn)。繼而再觀察dif(x)的自相關(guān)系數(shù),自相關(guān)系數(shù)ρ快速衰減向0。由于平穩(wěn)時序通常具有短期相關(guān)性,因此隨著延遲期數(shù)k的增加,平穩(wěn)序列自相關(guān)系數(shù)會快速衰減到0,由此可以認為一階差分后的時序是平穩(wěn)的。
3.純隨機性檢驗(a=0.05)
如果各序列值之間不存在任何的相關(guān)性,那就表明該序列是一個無記憶的序列,過去的行為對未來的走勢沒有任何影響,這種序列稱為純隨機性序列。序列的純隨機性檢驗,我們可以采用假設(shè)檢驗的方法。由于序列的相關(guān)性具有偶然性,則原假設(shè):延遲期數(shù)小于或等于m期的序列值,且相互獨立,即如下表述:
(1)假設(shè)條件
H0:p1=p2=…pm=0,m≥1;
H1:至少存在某個pk≠0,m≥1,k≤m
(2)檢驗統(tǒng)計量LB
根據(jù)LB統(tǒng)計量,它服從自由度為m的卡方分布(m為指定延遲階數(shù))。
檢驗結(jié)果顯示,在6階延遲下LB統(tǒng)計量的 p值為0.0076,遠小于a(a=0.05)。又因為平穩(wěn)序列通常具有短期相關(guān)性,所以有很大把握拒絕原假設(shè),此序列為非白噪聲序列。
4.擬合ARIMA(p,d,q)模型
模型根據(jù)平穩(wěn)時間序列的自相關(guān)階數(shù) p和移動平均階數(shù)q的截尾性和拖尾性,選擇適當(dāng)?shù)闹祦磉M行擬合。根據(jù)樣本自相關(guān)圖顯示,除了延遲一階的自相關(guān)系數(shù)在2倍的標準差范圍之外,其他階數(shù)的自相關(guān)系數(shù)都在2倍標準差之內(nèi)波動,可以認為該序列自相關(guān)系數(shù)一階截尾,可以用ARIMA(0,1,1)擬合模型。根據(jù)樣本的偏自相關(guān)圖顯示,除了延遲一階的偏自相關(guān)系數(shù)在2倍標準差范圍之外,其他階數(shù)的自相關(guān)系數(shù)都在2倍標準差之內(nèi)波動,可以認為該序列自相關(guān)系數(shù)一階截尾,可以用ARIMA(1,1,0)擬合模型。綜合樣本的自相關(guān)圖與偏自相關(guān)圖,也可以選擇ARIMA(1,1,1)。
5.參數(shù)估計與模型檢驗
對擬合好的模型進行參數(shù)估計,通常有三種方法(矩估計、極大似然估計、最小二乘估計),這里采用最小二乘估計法。在ARMA(p,q)模型場合下,計算殘差平方和達到最小的那組參數(shù)是模型參數(shù)估計值。再對估計的參數(shù)進行顯著性檢驗,檢驗參數(shù)所對應(yīng)的自變量對因變量的影響是否明顯。
(1)若p=1,擬合ARIMA(1,1,0)
參數(shù)的估計值Φ1=0.74260,檢驗未知參數(shù)顯著性的t檢驗統(tǒng)計量p 〈0.0001,說明該參數(shù)顯著非零。
(2)若q=1,擬合ARIMA(0,1,1)
參數(shù)的估計值θ1=0.75855,檢驗未知參數(shù)顯著性的t檢驗統(tǒng)計量p 〈0.0001,說明該參數(shù)顯著非零。
(3)若p=1,q=1,擬合ARIMA(1,1,1)
參數(shù)的估計值Φ1=0.61954,θ1=-0.27081,θ1的檢驗0.3091明顯大于0.05,所以參數(shù)檢驗不顯著,模型需舍棄。
6.模型的顯著性檢驗
如果模型擬合的殘差項中不再含有任何相關(guān)信息,即殘差序列為白噪聲序列,這樣的模型稱為顯著有效模型。與此同時,構(gòu)建LB統(tǒng)計量,原假設(shè)殘差序列為白噪聲序列,然后對LB統(tǒng)計量進行白噪聲檢驗。從檢驗的結(jié)果能夠得到模型LB統(tǒng)計量的p值均明顯大于0.05,所以兩個模型均顯著有效。
7.模型的最優(yōu)選擇
模型的選擇是預(yù)測工作的重要環(huán)節(jié),實證研究表明,同一個序列不僅僅只能構(gòu)造一個擬合模型,那么選擇哪個模型用于統(tǒng)計推斷呢?
為了解決這個問題,需引進SBC和AIC信息準則的概念。AIC認為一個擬合模型的好壞可從以下兩方面去考慮:一方面是擬合程度的似然函數(shù)值,另一方面是模型中未知參數(shù)的個數(shù)。似然函數(shù)值越大,說明擬合的效果越好;模型未知參數(shù)個數(shù)越多,說明模型中包含的自變量越多,模型擬合的準確度就越高,但單純的以比擬合精度來衡量模型的好壞,肯定會導(dǎo)致未知參數(shù)越來越多,自變量以及未知參數(shù)的增多就會導(dǎo)致較多的未知的風(fēng)險。這樣一來不僅增加了工作難度,而且估計的精度也會越來越差,所以一個好的擬合模型應(yīng)該是擬合精度和未知參數(shù)個數(shù)的綜合最優(yōu)配置。
就一個觀察序列而言,序列越長,相關(guān)信息就越分散,而且有時候時間序列的相關(guān)性衰減,會導(dǎo)致其只適合短息預(yù)測。那么要很充分地提取其中的有用信息,通常就需要多自變量復(fù)雜模型。以下分別是AIC和SBC準則:
AIC=-2In(模型的極大似然函數(shù)值)+2(模型中的未知參數(shù)的個數(shù))
中心化的ARMA模型的AIC函數(shù)為:
非中心化的為:
中心化的:
非中心化的:
通過比較可以發(fā)現(xiàn),在AIC準則中擬合誤差提供的信息要受到樣本容量的放大,但參數(shù)個數(shù)的懲罰因子卻和樣本沒有關(guān)系,它的權(quán)重始終是常數(shù)2,在樣本容量趨于無窮大時,它比真實模型所含的未知參數(shù)個數(shù)要多。SBC將懲罰權(quán)重改為樣本容量的對數(shù)函數(shù),理論上已經(jīng)證明SBC準則是最優(yōu)模型的真實階數(shù)的相合估計。
在盡可能全面的范圍里考察有限多個模型的AIC和SBC函數(shù)值,得出SBC模型是一個相對最優(yōu)模型。SBC準則的提出,可以有效地彌補根據(jù)自相關(guān)圖和偏自相關(guān)圖定階的主觀性,在有限的階數(shù)范圍內(nèi),找到最優(yōu)擬合模型。因為在自然科學(xué)內(nèi),規(guī)律確實是存在的,且關(guān)系是精確的,在相當(dāng)長的時間內(nèi),這些規(guī)律關(guān)系會保持不變,但在經(jīng)濟領(lǐng)域內(nèi)則完全是另一回事,經(jīng)濟模式或關(guān)系往往與隨機噪音交織在一起,改變經(jīng)濟現(xiàn)象的可預(yù)測性的因素太多,比如,人類行為的變化無常,某種重大事件的發(fā)生等等都會對經(jīng)濟現(xiàn)象有所影響,所以在很多時候,分析數(shù)據(jù)都依靠分析人員的經(jīng)驗,主觀因素非常大,而SBC恰好彌補了這一點,所以說對模型地優(yōu)化和選擇幫助非常大。
檢驗結(jié)果如表所示,檢驗表明,ARIMA(1,1,0)比ARIMA(0,1,1)相對更優(yōu)。
模型ARIMA(1,1,0)ARIMA(0,1,1)AIC 47.4163 BIC 48.6746 51.0183 52.27639
通過對模型的檢驗,得到最優(yōu)模型方程為:1.7426Xt-1-0.7426Xt-2+e=Xt。對模型進行預(yù)測得出:最新發(fā)布的數(shù)據(jù)。對比可以得出,8月份的預(yù)測精確到了小數(shù)點后兩位,這一點說明模型相對來說還是比較合適的;9、10月份的預(yù)測值則表現(xiàn)出了較大地不一致性,絕對誤差表現(xiàn)的很大,但通過相對誤差地比較,得出數(shù)據(jù)仍然在95%的置信區(qū)間,說明擬合還是有效的。
根據(jù)定性分析和定量分析,可以認識到PPI的下降還將持續(xù),這意味著我國的需求萎縮的狀況依然存在。因此,中國工業(yè)領(lǐng)域必然會經(jīng)歷一個去產(chǎn)能化的過程,也就是淘汰過剩的產(chǎn)能。所以當(dāng)PPI下降的時候,不能過度解讀為實體經(jīng)濟的收縮,應(yīng)稱之為一次中國工業(yè)領(lǐng)域的刮骨療傷。當(dāng)前中國工業(yè)的過剩產(chǎn)能需要通過低價格來進行市場壓縮,否則很難通過行政手段干預(yù)。因此,需要提高對經(jīng)濟下行,PPI下降的承受力,從而推動對中國工業(yè)產(chǎn)能的控制、產(chǎn)業(yè)升級以及結(jié)構(gòu)優(yōu)化。
1.模型的缺陷
ARIMA模型需要歷史數(shù)據(jù),一般要求不少于50個,然而實際情況是不一定能得到如此多的數(shù)據(jù),但是預(yù)測還是呈現(xiàn)出越來越準確的趨勢。在ARIMA模型中,序列變量的未來值被假定滿足變量過去觀察值和隨機誤差值的線性函數(shù)關(guān)系,可是現(xiàn)實中絕大多數(shù)的時間序列都包含非線性關(guān)系。
2.遇到的困難
經(jīng)濟指數(shù)很容易受各種影響,如果選取的時序樣本較長,且波動比較大的時候,很難建立ARIMA模型;同比指數(shù)能消除季節(jié)性的因素,相比環(huán)比數(shù)據(jù),建立ARIMA模型更簡單;運用較長、波動大的數(shù)據(jù)時,建立ARIMA的殘差序列很難實現(xiàn)非白噪聲序列,通常是由于模型對數(shù)據(jù)信息提取不充分;價格指數(shù)不可能永遠上漲,它必然是上下浮動的,所以很難進行長期預(yù)測。
參考文獻
[1]薛冬梅.ARIMA模型及其在時間序列分析中的應(yīng)用[J].吉林化工學(xué)院學(xué)報,2010-6(27).
[2]王燕.應(yīng)用時間序列分析[M].北京:中國人民大學(xué)出版社,2005:41-152.
[3]易丹輝.數(shù)據(jù)分析與Eviews應(yīng)用[M].北京:中國統(tǒng)計出版社,2003:106-132.
[4]劉薇.時間序列分析在吉林省GDP預(yù)測中的應(yīng)用[M].長春:東北師范大學(xué),2008.
[5]田錚譯.時間序列分析的理論與應(yīng)用[M].北京:高等教育出版社,2003:214-246.
(作者單位:上海理工大學(xué)管理學(xué)院)
DOI:10.16653/j.cnki.32-1034/f.2016.10.043