張洋洋 鄧 偉 宋長鈺
( 1) 西南財經(jīng)大學(xué)統(tǒng)計學(xué)院,611130,成都; 2) 山東建筑大學(xué)理學(xué)院,250101,濟南;3) 河北大學(xué)經(jīng)濟學(xué)院,071002,河北保定 )
CPI是反映居民家庭在一定時期購買的消費品和服務(wù)項目價格水平變動情況的宏觀經(jīng)濟指標,其變動率在一定程度上反映了通貨膨脹或緊縮的程度,準確預(yù)測短期CPI變動情況對于提高居民生活福利以及維護社會穩(wěn)定均具有重要意義.自英國統(tǒng)計學(xué)家Yule于1927年提出自回歸模型(AR)后,國內(nèi)外學(xué)者相繼提出移動平均模型(MA)、自回歸移動平均模型(ARMA)、求和自回歸移動平均模型(ARIMA)等,這些模型奠定了時間序列的基礎(chǔ),被稱為經(jīng)典時間序列分析方法[1].
近年來,國內(nèi)外學(xué)者又提出了許多預(yù)測CPI的模型,如:馬爾科夫鏈模型、灰色預(yù)測模型、神經(jīng)網(wǎng)絡(luò)模型、組合預(yù)測模型、統(tǒng)計回歸模型等,并根據(jù)實際問題對這些經(jīng)典預(yù)測模型不斷改進,取得了不錯的預(yù)測效果.然而,由于CPI受到經(jīng)濟、環(huán)境、社會等諸多不確定因素的影響,僅僅采用單一模型無法充分提取數(shù)據(jù)中蘊含的信息.因此,本文建立了不同的模型:時間序列模型、加權(quán)馬爾科夫鏈模型、改進的GM(1,1)模型、組合預(yù)測模型,從中尋找預(yù)測效果相對更優(yōu)的模型,為CPI等宏觀經(jīng)濟指標的預(yù)測提供參考.
2.1時間序列模型時間序列模型是從序列自相關(guān)的角度揭示數(shù)據(jù)的發(fā)展規(guī)律,該模型建模步驟包括:數(shù)據(jù)預(yù)處理、模型定階、模型求解、優(yōu)化、檢驗、預(yù)測.在建立時間序列模型前需要判斷數(shù)據(jù)是否具有平穩(wěn)性、純隨機性.根據(jù)數(shù)據(jù)性質(zhì)確定模型結(jié)構(gòu),再結(jié)合自相關(guān)和偏自相關(guān)系數(shù)的性質(zhì)確定模型階數(shù),由最小二乘法估計模型中未知參數(shù),確定模型最終形式,對模型進行顯著性檢驗,尋找相對最優(yōu)模型,最后依據(jù)線性最小方差法進行外推預(yù)測.
對于非平穩(wěn)的時間序列數(shù)據(jù)主要建立求和自回歸移動平均模型,通常簡記為ARIMA(p,d,q).該模型具有如下結(jié)構(gòu):
(1)
Φ(B)=1-φ1B-φ2B2-…-φpBp,
(2)
Θ(B)=1-θ1B-θ2B2-…-θqBq.
(3)
ARIMA(p,d,q)模型具有結(jié)構(gòu)簡單,只需要內(nèi)生變量而不需要其他外生變量就可以做出較好擬合結(jié)果的優(yōu)點,在預(yù)測國民經(jīng)濟指標上效果良好[2-4].
2.2加權(quán)馬爾科夫鏈模型馬爾科夫鏈模型是一種基于事件發(fā)生概率來分析時間序列變化規(guī)律并做出預(yù)測的方法.主要目的是根據(jù)變量現(xiàn)在的情況和變動趨勢來預(yù)測它在未來某段時期內(nèi)的變化,以此作為決策的依據(jù).而加權(quán)馬爾科夫鏈模型是在經(jīng)典馬爾科夫鏈模型的基礎(chǔ)上對各步的狀態(tài)轉(zhuǎn)移概率矩陣的預(yù)測值賦予不同權(quán)重,并將這些預(yù)測值的加權(quán)和作為最終預(yù)測值.該模型的建模步驟包括:劃分狀態(tài)、建立狀態(tài)轉(zhuǎn)移概率矩陣、馬氏性檢驗、確定各步預(yù)測值權(quán)重、加權(quán)求和.
馬爾科夫鏈的一步轉(zhuǎn)移概率表示隨機過程從狀態(tài)i經(jīng)一步轉(zhuǎn)移到狀態(tài)j的概率,由此可構(gòu)建一步轉(zhuǎn)移概率矩陣P[5]為
pij=p{Xn+1=j|Xn|=i}.
(4)
(5)
根據(jù)C-K方程,k步狀態(tài)轉(zhuǎn)移概率矩陣可由一步狀態(tài)轉(zhuǎn)移概率矩陣求得[5],即
(6)
計算各階的自相關(guān)系數(shù),歸一化處理后得到權(quán)重系數(shù)為
(7)
2.3改進的GM(1,1)模型灰色模型是利用離散隨機數(shù)經(jīng)過生成隨機性減弱而規(guī)律性增強的生成數(shù)而建立起的微分方程形式的模型.用灰色預(yù)測模型在數(shù)據(jù)量較少(6~15)時就可得到較高的預(yù)測結(jié)果.灰色模型的記號是GM(M,N),其中N表示變量的個數(shù),M表示常微分方程的階數(shù).一般情況下GM(1,1)模型應(yīng)用更為廣泛[8].改進的灰色預(yù)測模型在經(jīng)典GM(1,1)模型的基礎(chǔ)上改進了其原始數(shù)據(jù)、生成序列或者模型結(jié)構(gòu),克服了數(shù)據(jù)具有劇烈變化而不平滑導(dǎo)致模型預(yù)測精度下降的缺點.該模型的建模步驟主要包括:級比檢驗、生成序列、模型求解、模型檢驗和預(yù)測[9].
在建立灰色預(yù)測模型前,需先對原始數(shù)據(jù)進行級比檢驗,若級比落入級比范圍內(nèi)就可以建立GM(1,1)模型,級比的計算公式為
(8)
設(shè)有原始數(shù)列x(0)=(x(0)(1),x(0)(2),…x(0)(n)),對原始數(shù)據(jù)進行累加運算就可以獲得累加序列,累加序列中的每一項可由公式計算得到
(9)
定義白化的GM(1,1)灰微分方程為一階線性微分方程,其形式為
(10)
其中a和b是待識別的參數(shù),a為發(fā)展系數(shù),b為灰作用量,用最小二乘法估計模型中的未知參數(shù),得到模型的最終形式為
(11)
對模型進行檢驗的常用方法有:相對誤差Q檢驗、方差比C檢驗和小誤差概率P檢驗,可以根據(jù)統(tǒng)計量值的大小來劃分模型的精度等級.對模型計算得到的預(yù)測值是累加序列的預(yù)測結(jié)果,對其做累減還原可得到未來預(yù)測值[8-10].
2.4組合預(yù)測模型設(shè)時間序列模型和改進的灰色預(yù)測模型得到的第i個預(yù)測值為fi,i=1,2,…m,wi為第i個單項預(yù)測模型的權(quán)重.組合模型的任務(wù)是在權(quán)重和為1的前提下,使組合模型誤差的方差最小.線性組合預(yù)測模型的形式為[11]
(12)
記Si為第i種單項預(yù)測方法的標準差,則標準差法賦予單項預(yù)測模型不同的權(quán)重分別為[12]
(13)
3.1時間序列模型預(yù)測山東省CPI圖1為山東省1995年1月至2020年5月CPI時序圖.用SAS軟件對序列值進行預(yù)處理,步驟包括:平穩(wěn)性檢驗(表1)和純隨機性檢驗(表2).
由圖1可知,序列非平穩(wěn),故對序列進行一階差分運算,再對差分后的序列做ADF檢驗考察其平穩(wěn)性,由表1可知一階差分后序列平穩(wěn).對一階差分后序列做白噪聲檢驗,由表2可知一階差分后序列不是白噪聲序列,其中仍然含有大量相關(guān)信息待提取,應(yīng)當(dāng)繼續(xù)對該序列進行統(tǒng)計分析.
圖1 山東省CPI時序圖
表1 一階差分后平穩(wěn)性檢驗
表2 純隨機性檢驗
由上述分析可知一階差分后序列為方差齊性的平穩(wěn)非白噪聲序列,可以擬合ARIMA(p,d,q)模型.為獲得相對最優(yōu)的擬合模型,根據(jù)自相關(guān)系數(shù)和偏自相關(guān)系數(shù)確定不同階數(shù),嘗試建立不同的ARIMA(p,d,q)模型.引進AIC和SBC準則作為模型優(yōu)劣的評價指標,在所有通過檢驗的模型中尋找使AIC和SBC函數(shù)值最小的模型作為相對最優(yōu)模型,最終得到的模型是ARIMA(2,1,2),其形式為
xt=-1.395 4xt-1-0.673 0xt-2+εt+1.615 9εt-1+0.673 0εt-2.
(14)
模型擬合效果圖(圖2)中黑色為真實值,紅色為模型擬合值,綠色為上下95%置信區(qū)間,從圖2中可以看出,模型擬合值與真實值較為接近,模型擬合效果較好.由于預(yù)測方差僅與預(yù)測步長有關(guān),步長越大,預(yù)測的方差也越大,所以時間序列數(shù)據(jù)通常只適合做短期預(yù)測.采用ARIMA(2,1,2)模型預(yù)測未來五個月山東省CPI分別為102.712、102.912、102.760、102.838、102.831.
圖2 ARIMA(2,1,2)模型擬合效果圖
聚類結(jié)果表明,將誤差劃分為四類較為合適.處于狀態(tài)一的誤差范圍為[-2.9,-1.057),處于狀態(tài)二的誤差范圍為[-1.034,-0.108),處于狀態(tài)三的誤差范圍為[-0.058,0.674),處于狀態(tài)四的誤差范圍為[0.675,2.827].為保證數(shù)據(jù)的連續(xù)性和區(qū)間范圍的封閉性,將上一區(qū)間的最小值和下一區(qū)間的最大值的均值作為相鄰兩區(qū)間的間斷點.調(diào)整后的各狀態(tài)的誤差范圍分別為[-2.900,-1.504),[-1.504,-0.180),[-0.180,1.384),[1.384,2.827].根據(jù)狀態(tài)序列構(gòu)建一步轉(zhuǎn)移概率矩陣
在應(yīng)用馬爾科夫鏈模型分析時需要滿足三個假設(shè)條件:預(yù)測期系統(tǒng)狀態(tài)個數(shù)不變;系統(tǒng)狀態(tài)轉(zhuǎn)移概率矩陣不變;狀態(tài)轉(zhuǎn)移僅受前一狀態(tài)影響,從時刻t到時刻t+k的狀態(tài)轉(zhuǎn)移與t無關(guān),僅與k有關(guān).顯然最后一條假設(shè)也就是要求數(shù)據(jù)滿足馬氏性即無后效性,這表明過程將來的狀態(tài)僅僅與此刻的狀態(tài)有關(guān),而與之前的狀態(tài)無關(guān).一般在獲得數(shù)據(jù)后需要對數(shù)據(jù)進行馬氏檢驗,只有通過檢驗的數(shù)據(jù)才可以進一步應(yīng)用馬爾科夫鏈模型分析.
馬氏性檢驗統(tǒng)計量值χ2=70.401,查表可知數(shù)據(jù)序列通過馬氏檢驗,即可建立加權(quán)的馬爾科夫鏈模型.根據(jù)C-K方程,獲得2-4步狀態(tài)轉(zhuǎn)移概率矩陣如下:
計算得出k階的自相關(guān)系數(shù),數(shù)值越大就說明k步轉(zhuǎn)移概率矩陣預(yù)測結(jié)果越穩(wěn)定,應(yīng)對其賦予較大的權(quán)重[13,14].按照這一思想得到1~4階權(quán)重分別為0.011, 0.054,0.043,0.032.選取2020年2月至2020年5月這四期誤差數(shù)據(jù),先將權(quán)重乘預(yù)測狀態(tài)轉(zhuǎn)移概率矩陣對應(yīng)的各行,然后將預(yù)測狀態(tài)轉(zhuǎn)移概率矩陣各列元素相加,得到各狀態(tài)最終的概率值[15],最終計算出ARIMA模型預(yù)測的2020年6月山東省CPI誤差所屬的狀態(tài)概率分布,計算結(jié)果如表3所示.
表3 2020年6月誤差狀態(tài)概率分布
由最大隸屬原則可知,概率分布中的最大值所對應(yīng)的狀態(tài)就是該期誤差最可能的狀態(tài),由表3可知:2020年6月預(yù)測的誤差值最有可能處于狀態(tài)四,取狀態(tài)四對應(yīng)的誤差范圍區(qū)間端點的平均值1.751作為誤差的預(yù)測值.2020年6月CPI預(yù)測值為ARIMA(2,1,2)模型預(yù)測值與加權(quán)馬爾可夫鏈模型預(yù)測值之差,即100.961.
對于后續(xù)的預(yù)測有兩種做法:一種方法是將新的預(yù)測值計入觀察值序列,重新構(gòu)建馬爾科夫鏈模型,重復(fù)該過程進行逐期預(yù)測;另一種方法是將新的預(yù)測值代入觀測值序列后,刪除原始數(shù)據(jù)的第一個數(shù)據(jù),使樣本量始終不變,再構(gòu)建馬爾科夫鏈模型得到預(yù)測數(shù)據(jù)[16].經(jīng)實例驗證,第二種方法的預(yù)測精度更高.在本文中也將采用第二種方法.
將2020年6月的預(yù)測值代入原始數(shù)據(jù),去掉1995年1月數(shù)據(jù),重新建立加權(quán)馬爾可夫鏈模型,得到2020年7月誤差最可能處于狀態(tài)四,所以2020年7月山東省CPI預(yù)測值為101.161.同樣地,可以得到2020年8月至2020年10月山東省CPI預(yù)測值分別為101.008,101.086,101.080.
x(0)=(x(0)(1),x(0)(2),…x(0)(9))
=(106.200,105.979,105.700,105.311,104.800,104.209,103.600,103.123,102.900).
對所得到的生成序列進行級比檢驗,根據(jù)公式計算級比范圍為(0.717,1.396),計算改進的生成序列可知級比均落在該范圍內(nèi),因此可建立改進的GM(1,1)模型.對山東省CPI序列值進行一次累加后,CPI增長率呈現(xiàn)出線性增大的特點(普遍規(guī)律),而在局部出現(xiàn)了稍微的跳躍(特殊現(xiàn)象),建立滿足初始條件的白化模型,由最小二乘法估計未知參數(shù)值得到模型形式為
x(0)(k+1)=[x(0)(k)-23 230.960]e-0.005+23 230.960.
(15)
用建立好的灰色預(yù)測模型對原始數(shù)據(jù)進行擬合,計算方差比檢驗C統(tǒng)計量為0.009,對比灰色預(yù)測精度檢驗對照表,可知精度為Ⅰ級,可見模型預(yù)測效果良好.利用改進的GM(1,1)模型預(yù)測得到未來五個月山東省CPI分別為102.318,101.851,101.386,100.923,100.462.
3.4線性組合預(yù)測模型預(yù)測山東省CPI由于單項模型預(yù)測時只能從某個方面來提供有效信息,還受限于模型的設(shè)定形式,因此接下來考慮組合預(yù)測模型[17].本文將對時間序列模型和灰色預(yù)測模型賦予不同的權(quán)數(shù),得到相應(yīng)的組合預(yù)測模型.
由計算可得ARIMA(2,1,2)模型和改進的GM(1,1)模型的預(yù)測誤差均方誤差分別為0.714和0.102,可見ARIMA(2,1,2)模型預(yù)測方差較大,處理預(yù)測精度較低,應(yīng)在線性組合預(yù)測模型中被賦予較小權(quán)重.對這兩個單項預(yù)測模型的預(yù)測標準差進行歸一化處理,得到上述兩個模型在線性組合預(yù)測模型中所占權(quán)重分別為w1=0.125,w2=0.875.按照線性組合預(yù)測模型公式擬合原始數(shù)據(jù),可以預(yù)測得到未來五個月山東省CPI分別為102.367,101.983,101.557,101.162,100.758.
擬從兩個方面對上述四種模型預(yù)測結(jié)果進行分析:一是從統(tǒng)計學(xué)的角度對其預(yù)測結(jié)果的合理性進行比較分析,找出相對更合理的模型及其預(yù)測結(jié)果;二是從經(jīng)濟學(xué)的角度對得到的預(yù)測結(jié)果進行分析,即從經(jīng)濟解釋方面分析其合理性.
4.1預(yù)測結(jié)果及分析各模型的預(yù)測結(jié)果如表4所示.
表4 各模型預(yù)測結(jié)果
比較上述模型的預(yù)測結(jié)果可以發(fā)現(xiàn):
1) 加權(quán)馬爾科夫模型的預(yù)測結(jié)果小于時間序列模型,這是因為使用馬爾可夫模型對時間序列模型的預(yù)測誤差進行修正時,預(yù)測誤差都為正值,導(dǎo)致時間序列模型預(yù)測值與修正后的預(yù)測誤差之差小于時間序列模型預(yù)測值.計算該模型的均方誤差為2.063,這一均方誤差較大,表明預(yù)測效果并不理想,若對殘差序列使用其他聚類方法或更改聚類數(shù)可能提高預(yù)測精度.
2) 灰色預(yù)測模型預(yù)測結(jié)果略小于時間序列模型預(yù)測結(jié)果,這是由于灰色預(yù)測模型僅考慮了最近五個月的數(shù)據(jù),而這一階段山東省CPI有下降的趨勢,用這種方法可能會低估未來五個月山東省CPI的預(yù)測值.計算時間序列和灰色預(yù)測模型的均方誤差分別為0.624和0.016.由這兩個模型所組成的線性組合預(yù)測模型的均方誤差為0.009.組合預(yù)測模型的預(yù)測結(jié)果表明未來五個月山東省CPI將在101.5%左右.基于ARIMA(2,1,2)與改進的GM(1,1)模型所構(gòu)成的線性組合預(yù)測模型誤差均方誤差最小,在誤差可接受的范圍內(nèi)預(yù)測效果相對更好.該模型可作為今后預(yù)測山東省乃至全國CPI的參考模型.
3) 加權(quán)馬爾可夫模型對不同時期的數(shù)據(jù)采用不同的權(quán)重,充分運用原始信息,具有一定的實際應(yīng)用價值,是一種合理預(yù)測CPI的方法.時間序列模型結(jié)構(gòu)簡單,只需要內(nèi)生變量而不需要其他外生變量就可以做出較好的擬合結(jié)果,但該模型僅適用于有限次差分后平穩(wěn)的序列,本質(zhì)上只能捕捉線性關(guān)系,無法很好地刻畫非線性序列所蘊含的數(shù)據(jù)規(guī)律.改進的GM(1,1)模型適用于因素眾多、結(jié)構(gòu)復(fù)雜、綜合性強、涉及面廣的社會經(jīng)濟系統(tǒng),但這種模型僅僅基于指數(shù)率的預(yù)測,沒有考慮系統(tǒng)隨機性和序列值之間的相互影響.線性組合預(yù)測模型恰恰彌補了上述兩種預(yù)測模型的不足,可以深入挖掘數(shù)據(jù)蘊含的規(guī)律[17,18].
4.2經(jīng)濟解釋及建議同比來看,2019年6月-10月山東省CPI分別為102.8,103,102.5,103,104.3,高于2020年同期山東省CPI預(yù)測結(jié)果.就預(yù)測結(jié)果自身而言,未來5個月,山東省CPI增長率將在1.5%左右,消費價格水平相對比較平穩(wěn).究其原因如下:1) 2019年受“非洲豬瘟”疫情因素影響,國內(nèi)豬肉市場出現(xiàn)了一定程度的供不應(yīng)求情況,豬肉價格水平上漲明顯,從而帶動了牛羊肉、雞蛋等其它相關(guān)生活必需品價格的上漲,CPI值相應(yīng)偏高.2) 2020年受新冠肺炎疫情影響,國內(nèi)經(jīng)濟遭受一定程度的沖擊,就業(yè)壓力和經(jīng)濟下行壓力在一定時期內(nèi)仍然較大,居民消費疲軟,消費預(yù)期也不樂觀,再加上國際市場需求下滑,導(dǎo)致了國內(nèi)需求不足,在國家出臺了一系列保就業(yè)、穩(wěn)生產(chǎn)的政策后,CPI值相對穩(wěn)健.
總的來說,所選擇的模型預(yù)測結(jié)果比較符合山東省經(jīng)濟運行的實際情況,具有較高的可信水平.根據(jù)上述預(yù)測結(jié)果,提出如下建議:1) 在繼續(xù)穩(wěn)定物價的基礎(chǔ)上,采取價格補貼等方式,努力擴大居民消費.居民消費的增加不僅可以促進消費品需求的增加,還可以促進資本品需求的增加,從而既可以保障居民基本生活水平,還有利于增加生產(chǎn),帶動經(jīng)濟的持續(xù)穩(wěn)定增長.2) 針對消費預(yù)期不樂觀問題,建議在短期內(nèi)采取一系列積極的財政政策,保障居民收入,扭轉(zhuǎn)經(jīng)濟預(yù)期,提振消費信心.