侯鵬飛
[摘 要]本文采用理論分析與實(shí)證分析相結(jié)合的方法,探討了對(duì)同一個(gè)時(shí)間序列建立不同的模型,不同模型的預(yù)測(cè)效果有無(wú)差異,差異的原因。實(shí)證分析選取了全國(guó)鐵路貨運(yùn)量的月度數(shù)據(jù),分別建立殘差灰色模型和乘法季節(jié)模型,比較兩個(gè)模型的預(yù)測(cè)效果,并給出預(yù)測(cè)效果不同的原因分析及相應(yīng)建議。
[關(guān)鍵詞]殘差灰色模型;乘法季節(jié)模型;鐵路貨運(yùn)量;預(yù)測(cè)
[DOI]10.13939/j.cnki.zgsc.2015.39.033
1 引 言
預(yù)測(cè)是利用觀測(cè)事物過(guò)去以及現(xiàn)在的信息,在認(rèn)識(shí)把握客觀規(guī)律的基礎(chǔ)上,推測(cè)和判斷事物的未來(lái)趨勢(shì)和水平。觀測(cè)事物的數(shù)據(jù)信息往往是以時(shí)間序列的形式給出,針對(duì)時(shí)間序列預(yù)測(cè)建模的方法較多,有:ARIMA模型,ARCH模型,GARCH模型,灰色模型,乘法季節(jié)模型等,對(duì)同一個(gè)時(shí)間序列建模預(yù)測(cè),不同的模型預(yù)測(cè)效果如何,又是因何造成預(yù)測(cè)效果有好有壞。本文采用理論分析與實(shí)證分析相結(jié)合的方法,給出上述問(wèn)題的回答。實(shí)證分析選取全國(guó)鐵路貨運(yùn)量的月度數(shù)據(jù),分別建立殘差灰色模型和乘法季節(jié)模型進(jìn)行預(yù)測(cè),比較這兩個(gè)模型的預(yù)測(cè)效果,并給出相應(yīng)分析及建議。
實(shí)證分析選用全國(guó)鐵路貨運(yùn)量的月度數(shù)據(jù),是因?yàn)殍F路貨物運(yùn)輸是國(guó)民經(jīng)濟(jì)的重要支撐,鐵路運(yùn)輸與公路、水運(yùn)、航空、管道等運(yùn)輸方式構(gòu)成國(guó)家現(xiàn)代化的交通運(yùn)輸網(wǎng)。鐵路貨運(yùn)量與地方經(jīng)濟(jì)發(fā)展息息相關(guān),側(cè)面反映著地方經(jīng)濟(jì)的繁榮程度,是“克強(qiáng)指數(shù)”的構(gòu)成指標(biāo)之一。對(duì)鐵路貨運(yùn)量進(jìn)行定量分析并做出較為準(zhǔn)確的預(yù)測(cè),能夠?yàn)橄嚓P(guān)部門(mén)制定發(fā)展規(guī)劃、采取措施提供可靠的參考依據(jù),有助于提高運(yùn)輸效率,改善服務(wù)質(zhì)量。
本文選取2005年1月到2015年4月全國(guó)鐵路貨運(yùn)量的月度數(shù)據(jù),數(shù)據(jù)來(lái)源于中國(guó)國(guó)家統(tǒng)計(jì)局國(guó)家數(shù)據(jù)庫(kù),所建的殘差灰色模型與乘法季節(jié)模型均采用R語(yǔ)言軟件編程進(jìn)行擬合。
2 殘差灰色GM(1,1)模型
2.1 殘差灰色模型相關(guān)理論
殘差灰色模型屬于灰色模型范疇?;疑P鸵圆糠中畔⒁阎?,部分信息未知的小樣本、貧信息的不確定性系統(tǒng)作為研究對(duì)象,通過(guò)對(duì)數(shù)據(jù)進(jìn)行處理,即序列算子或灰色生成,減輕干擾的影響或削弱隨機(jī)性,挖掘潛在規(guī)律,通過(guò)建立灰色微分模型,進(jìn)一步可進(jìn)行較為科學(xué)準(zhǔn)確的預(yù)測(cè)。
殘差灰色模型是在灰色模型的基礎(chǔ)上,利用灰色模型的殘差序列,選取殘差序列的部分作為新的時(shí)間序列,對(duì)新序列再次建立灰色模型,修正基于原始序列所建灰色模型的參數(shù)值和擬合值,減小相對(duì)誤差,優(yōu)化模型的預(yù)測(cè)效果??紤]選用殘差灰色GM(1,1)模型對(duì)鐵路貨運(yùn)量建模預(yù)測(cè)。
2.2 殘差灰色模型建模過(guò)程與結(jié)果
選取2014年7月到2015年1月七個(gè)月的數(shù)據(jù),首先建立原始序列GM(1,1)模型,得到模型參數(shù)估計(jì)值及殘差序列。R語(yǔ)言程序運(yùn)行結(jié)果如下:
GM(1,1)模型參數(shù)估計(jì)值:發(fā)展系數(shù)-a=0.0081,灰色作用量u=32973.39。殘差序列為:(0,-688.62,-2013.99,-942.56,-2445.36,-3090.41,-3488.72)。
然后選取殘差序列的后五個(gè)殘差,對(duì)后五個(gè)殘差的數(shù)值取其絕對(duì)值得到新殘差序列也即(2013.99,942.56,2445.36,3090.41,3488.72),用此新殘差序列再建立GM(1,1)模型,基于新殘差序列建立的灰色模型對(duì)原始序列擬合值進(jìn)行修正。上述過(guò)程R語(yǔ)言程序運(yùn)行結(jié)果如下:
殘差GM(1,1)參數(shù)估計(jì)值:發(fā)展系數(shù)-a1=0.0081,灰色作用量u1=32973.39?;跉埐钚蛄薪⒌幕疑P蛯?duì)原始序列擬合值進(jìn)行修正的結(jié)果:(0.000,0.000,0.000,-22.544,-16.717,-12.396,-9.191)。
選取的是原始?xì)埐钚蛄械暮笪鍌€(gè)殘差數(shù)據(jù)進(jìn)行建模,可以對(duì)原始序列的后四項(xiàng)擬合值進(jìn)行修正。修正均減少了原始序列擬合值數(shù)值的大小,但減少的幅度并不大。
最后在所建立的殘差灰色模型基礎(chǔ)上進(jìn)行預(yù)測(cè),預(yù)測(cè)2015年2月到2015年5月四個(gè)月的數(shù)據(jù)。預(yù)測(cè)結(jié)果如下:(35031.11,35314.23,35600.13,35888.70)。
實(shí)際上,2015年2月到2015年4月的全國(guó)鐵路貨運(yùn)量是已知的,將預(yù)測(cè)數(shù)據(jù)與對(duì)應(yīng)的實(shí)際數(shù)據(jù)相比,誤差較大,預(yù)測(cè)結(jié)果并不理想。原因分析將在后文給出。
3 乘法季節(jié)模型
3.1 乘法季節(jié)模型相關(guān)理論
乘法季節(jié)模型是在ARIMA模型的基礎(chǔ)上,針對(duì)具有季節(jié)性變化也即周期性變化的時(shí)間序列進(jìn)行建模的方法。在周期內(nèi),它提取當(dāng)前時(shí)刻數(shù)據(jù)與前期數(shù)據(jù)的關(guān)聯(lián)特征;在周期間,它提取當(dāng)前時(shí)刻數(shù)據(jù)與前幾個(gè)周期相同時(shí)刻數(shù)據(jù)的關(guān)聯(lián)特征。將周期內(nèi)特征和周期間特征結(jié)合起來(lái),可以更加全面地描述時(shí)間序列的變化規(guī)律,因此,使用乘法季節(jié)ARIMA模型對(duì)季節(jié)性時(shí)間序列進(jìn)行擬合比常規(guī)的ARIMA模型更為準(zhǔn)確。
3.2 乘法季節(jié)模型實(shí)證過(guò)程與結(jié)果
繪制全國(guó)鐵路貨運(yùn)量的趨勢(shì)圖,觀察圖形可知,該時(shí)間序列隨著時(shí)間推移整體具有上升的趨勢(shì),而且具有季節(jié)性波動(dòng)的特征,考慮建立乘法季節(jié)模型進(jìn)行擬合。
數(shù)據(jù)平穩(wěn)性檢驗(yàn)與處理:繪制原始序列的自相關(guān)圖后,觀察圖形發(fā)現(xiàn),原始序列存在著多階自相關(guān),原始序列為非平穩(wěn)序列。
對(duì)原始數(shù)據(jù)一階差分后再進(jìn)行平穩(wěn)性檢驗(yàn),仍采用自相關(guān)檢驗(yàn)法,繪制自相關(guān)圖,圖形仍近似于周期性波動(dòng)變化,具有季節(jié)性特征,一階差分后的數(shù)據(jù)仍不平穩(wěn)。在對(duì)原始數(shù)據(jù)一階差分的基礎(chǔ)上,再進(jìn)行步長(zhǎng)為12的季節(jié)差分,得到的新序列通過(guò)平穩(wěn)性檢驗(yàn),為平穩(wěn)序列,可以建立乘法季節(jié)模型。
模型的識(shí)別與定階:繪制平穩(wěn)序列的自相關(guān)圖和偏自相關(guān)圖,圖形顯示,自相關(guān)圖和偏自相關(guān)圖均為拖尾,考慮建立ARMA模型進(jìn)行擬合。模型定階利用R語(yǔ)言的auto.arima()函數(shù)自動(dòng)定階,得出:乘法季節(jié)模型中除去季節(jié)影響的序列階數(shù)為ARIMA(2,1,3),季節(jié)序列階數(shù)為ARIMA(1,1,0)。
殘差白噪聲檢驗(yàn):對(duì)所建乘法季節(jié)模型進(jìn)行殘差白噪聲檢驗(yàn),以驗(yàn)證模型是否充分提取了原始序列的信息,是否有效。運(yùn)用R語(yǔ)言tsdiag()函數(shù)進(jìn)行檢驗(yàn),該函數(shù)給出Q檢驗(yàn)的結(jié)果:Q檢驗(yàn)的各滯后階數(shù)的相伴概率P值均大于0.05,接受原假設(shè),表明殘差序列為白噪聲序列。檢驗(yàn)獲得通過(guò),說(shuō)明所建模型是有效的,可以用來(lái)進(jìn)行預(yù)測(cè)。
所建模型的具體形式為ARIMA(2,1,3)×ARIMA(1,1,0)(12),模型擬合系數(shù)如表1所示。
模型估計(jì)的方差為505978,對(duì)數(shù)似然值為-888.67,AIC數(shù)值為1791.34,BIC數(shù)值為1810.31。
模型預(yù)測(cè):基于乘法季節(jié)模型,向后預(yù)測(cè)12個(gè)月的全國(guó)鐵路貨運(yùn)量,即預(yù)測(cè)2015年5月到2016年4月的鐵路貨運(yùn)量月度數(shù)據(jù)。預(yù)測(cè)結(jié)果如表2所示。
將12個(gè)月的預(yù)測(cè)值與原始時(shí)間序列畫(huà)在同一張圖中,并畫(huà)出預(yù)測(cè)值置信度為95%的置信區(qū)間的上限和下限,見(jiàn)下圖。
預(yù)測(cè)曲線
觀察圖形,預(yù)測(cè)曲線較好地?cái)M合了鐵路貨運(yùn)量的變化發(fā)展趨勢(shì),反映出客觀規(guī)律,預(yù)測(cè)效果較好??梢缘弥珖?guó)鐵路貨運(yùn)量在未來(lái)的12個(gè)月度內(nèi),仍然呈現(xiàn)季節(jié)性波動(dòng)的態(tài)勢(shì),具體表現(xiàn)為2015年后半年鐵路貨運(yùn)量整體回暖上升,但在2016年開(kāi)年的前幾個(gè)月存在一定的下行趨勢(shì)。
4 模型效果比較與討論
就全國(guó)鐵路貨運(yùn)量的數(shù)據(jù)而言,乘法季節(jié)模型預(yù)測(cè)效果優(yōu)于殘差灰色模型。盡管殘差灰色模型在殘差序列的基礎(chǔ)上,再次建立灰色模型,對(duì)基于原始序列建立的灰色模型進(jìn)行修正,但從修正的幅度來(lái)看,修正力度較小,修正效果不顯著,殘差灰色模型的誤差仍然較大,預(yù)測(cè)效果較差。造成這種現(xiàn)象的深層原因在于灰色GM(1,1)模型對(duì)建模的數(shù)據(jù)有一定要求,即要求原始數(shù)據(jù)具有較強(qiáng)的指數(shù)變化規(guī)律,且要求數(shù)據(jù)變化的過(guò)程單調(diào)。若對(duì)一些呈現(xiàn)擺動(dòng)趨勢(shì)的序列采用灰色GM(1,1)模型進(jìn)行建模預(yù)測(cè),相對(duì)誤差較大,預(yù)測(cè)效果較差。
乘法季節(jié)模型基于ARMA模型,并且有效考慮了季節(jié)性的影響,對(duì)具有季節(jié)性波動(dòng)特征的時(shí)間序列建模預(yù)測(cè)效果較好。對(duì)鐵路貨運(yùn)量月度數(shù)據(jù)的實(shí)證分析驗(yàn)證了此點(diǎn)。
本文以全國(guó)鐵路貨運(yùn)量月度數(shù)據(jù)為例,分別建立了殘差灰色模型和乘法季節(jié)模型,進(jìn)行實(shí)證分析,比較兩個(gè)模型預(yù)測(cè)的效果,效果具有顯著差異,說(shuō)明不同的模型適用的建模數(shù)據(jù)不同,某一模型預(yù)測(cè)方法并非是普遍適用的。這就啟示研究人員在進(jìn)行建模預(yù)測(cè)的時(shí)候,需要結(jié)合原始數(shù)據(jù)自身的特點(diǎn),選取適合的模型進(jìn)行擬合,以減少模型誤差,提高模型精度,優(yōu)化預(yù)測(cè)效果,為相關(guān)決策提供科學(xué)的參考依據(jù)。
參考文獻(xiàn):
[1]尹左斌.ARIMA模型在鐵路貨運(yùn)量預(yù)測(cè)中的應(yīng)用[J].鐵道貨運(yùn),2008(6).
[2]劉思峰.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2010.
[3]周鑫.基于乘積季節(jié)模型的GPRS小區(qū)流量預(yù)測(cè).[J].計(jì)算機(jī)工程,2010,9(18).
[4]Jonathan D Cryer,Kung-sik Chan.時(shí)間序列分析及應(yīng)用R語(yǔ)言[M].潘紅宇,等,譯.北京:機(jī)械工業(yè)出版社,2011.