馬 力 杭良文 中國(guó)鐵路上海局集團(tuán)有限公司南京東機(jī)輛段
在鐵路運(yùn)輸管理中,各級(jí)領(lǐng)導(dǎo)經(jīng)常會(huì)要求統(tǒng)計(jì)部門(mén)提供在未來(lái)一段時(shí)間內(nèi)運(yùn)輸指標(biāo)完成情況預(yù)測(cè),以便領(lǐng)導(dǎo)在調(diào)整運(yùn)力、技術(shù)改造、新線(xiàn)建設(shè)等決策時(shí)參考。影響鐵路運(yùn)輸指標(biāo)完成情況的因素較多,例如:宏觀經(jīng)濟(jì)政策、工業(yè)生產(chǎn)景氣程度、節(jié)假日、天氣變化、春運(yùn)、學(xué)生客流等,這些因素包含長(zhǎng)期趨勢(shì)影響、季節(jié)性變化、隨機(jī)性等變化特點(diǎn),數(shù)據(jù)變化復(fù)雜不能簡(jiǎn)單用公式描述。對(duì)于運(yùn)輸數(shù)據(jù)預(yù)測(cè)擬合,是數(shù)據(jù)分析的重要目的之一,也是運(yùn)輸數(shù)據(jù)發(fā)展趨勢(shì)預(yù)測(cè)的重要手段。傳統(tǒng)的時(shí)間序列數(shù)據(jù)分析模型較多,本文主要針對(duì)指數(shù)平滑法模型在擬合鐵路運(yùn)輸數(shù)據(jù)的作用效果進(jìn)行研究。
指數(shù)平滑法是分析數(shù)據(jù)的常用方法。主要分為單參數(shù)指數(shù)平滑法、雙參數(shù)指數(shù)平滑法等。本文分別使用兩種方法進(jìn)行分析。為了更好評(píng)價(jià)數(shù)據(jù)擬合結(jié)果的優(yōu)劣,定義評(píng)價(jià)指標(biāo)平均誤差比例、估計(jì)標(biāo)準(zhǔn)誤差。
單參數(shù)指數(shù)平滑法是將一段時(shí)期的預(yù)測(cè)值與實(shí)際值的線(xiàn)性組合作為i+1期的預(yù)測(cè)值,其預(yù)測(cè)模型為:
式中,yi表示第i期的實(shí)際值;表示第i期的一次指數(shù)平滑值(預(yù)測(cè)值);a表示平滑系數(shù)(0<a<1)。
雙參數(shù)指數(shù)平滑法又稱(chēng)Holt 方法,常見(jiàn)的雙參數(shù)指數(shù)平滑法有加法模型和乘法模型。乘法模型可以看成是在加法模型基礎(chǔ)上取對(duì)數(shù),所以乘法模型是加法模型的特殊形式。本文選用加法模型,得到雙參數(shù)指數(shù)平滑法計(jì)算公式為:
如圖1所示為南京東機(jī)務(wù)段2017年-2019年全段機(jī)車(chē)總走行數(shù)據(jù)變化。機(jī)車(chē)總走行是反映運(yùn)輸工作量的基本指標(biāo)之一,也是反應(yīng)各類(lèi)運(yùn)用機(jī)車(chē)本務(wù)走行公里與輔助走行公里之和的重要數(shù)據(jù)。從圖中可以看出,機(jī)車(chē)總走行數(shù)據(jù)主要有長(zhǎng)期趨勢(shì)變化、季節(jié)性周期波動(dòng)以及隨機(jī)性變化的特點(diǎn)。從長(zhǎng)期來(lái)看,南京東機(jī)務(wù)段機(jī)車(chē)總走行公里呈上升趨勢(shì),主要是因?yàn)殚L(zhǎng)三角地區(qū)人口居住密集、工業(yè)基礎(chǔ)較好、商品貿(mào)易發(fā)達(dá),受到地方經(jīng)濟(jì)輻射,市場(chǎng)需求較大,鐵路線(xiàn)路里程不斷增加,鐵路運(yùn)輸量不斷增加。運(yùn)輸數(shù)據(jù)季節(jié)性波動(dòng)主要體現(xiàn)在每年2 月(春運(yùn))、9 月(學(xué)生開(kāi)學(xué)季)以及10 月(國(guó)慶黃金周)會(huì)出現(xiàn)運(yùn)輸高峰,而在每年4月、6月、11月運(yùn)輸數(shù)據(jù)則相應(yīng)較低,進(jìn)入運(yùn)輸?shù)?。此外受到市?chǎng)經(jīng)濟(jì)波動(dòng)和國(guó)家政策調(diào)整的影響(例如:鋼鐵去產(chǎn)能、煤炭減產(chǎn)等),運(yùn)輸數(shù)據(jù)也存在一定隨機(jī)性變化。
圖1 2017年—2019年機(jī)車(chē)總走行數(shù)據(jù)變化
單參數(shù)指數(shù)平滑法是對(duì)時(shí)間序列數(shù)據(jù)由近及遠(yuǎn)采取具有逐步衰減性質(zhì)的加權(quán)處理。每一期預(yù)測(cè)值都是上一期實(shí)際值與預(yù)測(cè)值的加權(quán)平均。其權(quán)數(shù)由近及遠(yuǎn)按照幾何級(jí)數(shù)的衰減,特點(diǎn)是近期權(quán)數(shù)較大,遠(yuǎn)期權(quán)數(shù)較小。加權(quán)系數(shù)符合指數(shù)規(guī)律,又具有平滑數(shù)據(jù)的作用。但是不能區(qū)分長(zhǎng)期趨勢(shì)和季節(jié)變化,而是將長(zhǎng)期趨勢(shì)、季節(jié)變化 、隨機(jī)變化等因素都看成一個(gè)整體進(jìn)行處理。
使用指數(shù)平滑法時(shí)數(shù)據(jù)處理的關(guān)鍵是確定一個(gè)合適的平滑系數(shù),本文對(duì)平滑系數(shù)分別取0.2、0.5、0.8 工況下,分別擬合機(jī)車(chē)總走行數(shù)據(jù),得到結(jié)果如圖2 所示。從圖中可以看出不同指數(shù)平滑系數(shù)下,都能對(duì)機(jī)車(chē)總走行數(shù)據(jù)進(jìn)行擬合且與實(shí)際值間都存在一定誤差。同時(shí),隨著平滑系數(shù)增加,數(shù)據(jù)波動(dòng)性越弱,數(shù)據(jù)衰減較強(qiáng)。
圖2 不同平滑系數(shù)下單參數(shù)指數(shù)平滑預(yù)測(cè)值與實(shí)際值對(duì)比
為了具體分析不同平滑系數(shù)a情況下數(shù)據(jù)擬合的效果,對(duì)不同平滑系數(shù)a情況下實(shí)際值與預(yù)測(cè)值間的平均誤差比例、估計(jì)標(biāo)準(zhǔn)誤差進(jìn)行計(jì)算,將數(shù)據(jù)匯總得到表1。
表1 不同平滑系數(shù)a下的誤差情況
從表1 可以看出,當(dāng)平滑系數(shù)a=0.5 時(shí)估計(jì)標(biāo)準(zhǔn)誤差最小,當(dāng)平滑系數(shù)a=0.2 時(shí)平均誤差比例最小。考慮平均誤差比例是每一期誤差比例的平均數(shù),平均數(shù)易受到極值影響,不如估計(jì)標(biāo)準(zhǔn)誤差更具有統(tǒng)計(jì)學(xué)的穩(wěn)定性。所以認(rèn)為估計(jì)標(biāo)準(zhǔn)誤差小的平滑系數(shù)更佳。如果平滑系數(shù)取值接近1 時(shí),數(shù)據(jù)變化幅度較大適用于時(shí)間數(shù)列數(shù)據(jù)變化劇烈的情況,以便很快跟隨其變化。取值接近0 時(shí),則各期數(shù)據(jù)的作用緩慢減弱,呈比較平穩(wěn)的狀態(tài)。而運(yùn)輸數(shù)據(jù)的變化具有長(zhǎng)期趨勢(shì)增加、短期波動(dòng)較大的特點(diǎn),則不能反應(yīng)數(shù)據(jù)的波動(dòng)性。在實(shí)際應(yīng)用中擬合機(jī)車(chē)總走行數(shù)據(jù),平滑系數(shù)的取值需要反復(fù)比較確定,數(shù)值偏大或偏小都會(huì)增加估計(jì)標(biāo)準(zhǔn)誤差。
通過(guò)EXCEL規(guī)劃計(jì)算,當(dāng)平滑系數(shù)取值0.61時(shí)平均誤差比例和估計(jì)標(biāo)準(zhǔn)誤差分別為0.692%、934.7,此時(shí)計(jì)算得到的各期預(yù)測(cè)值與實(shí)際觀測(cè)值之間的誤差最小,效果最佳。平滑系數(shù)的取值直接影響過(guò)去各期數(shù)據(jù)對(duì)預(yù)測(cè)值的作用,當(dāng)使用單參數(shù)指數(shù)平滑法時(shí)近期數(shù)據(jù)作用最大,遠(yuǎn)期各數(shù)據(jù)的作用迅速衰減,所以單參數(shù)指數(shù)平滑法適合短期數(shù)據(jù)預(yù)測(cè),預(yù)測(cè)數(shù)據(jù)期數(shù)越多準(zhǔn)確性越低。
雙參數(shù)指數(shù)平滑法將數(shù)據(jù)的影響因素分解為“平滑值+趨勢(shì)值”,然后通過(guò)對(duì)數(shù)據(jù)的平滑值和趨勢(shì)值分別進(jìn)行加權(quán)處理。由于兩個(gè)參數(shù)加權(quán)作用,數(shù)據(jù)衰減程度不會(huì)較快遞減,避免了單參數(shù)指數(shù)平滑法中近期權(quán)數(shù)較大遠(yuǎn)期權(quán)數(shù)較小情況,強(qiáng)化了數(shù)據(jù)平滑的作用。
使用指數(shù)平滑的關(guān)鍵點(diǎn)是:①初始平滑值和趨勢(shì)值的確定,②確定兩個(gè)合適的平滑系數(shù)a、β。如果確定的平滑值和趨勢(shì)值不能很好的代表數(shù)據(jù)特點(diǎn),后期的數(shù)據(jù)發(fā)展趨勢(shì)會(huì)偏離實(shí)際值。平滑系數(shù)a、β代表后期數(shù)據(jù)的衰減和加權(quán)變化,其特點(diǎn)是反應(yīng)季節(jié)變化和趨勢(shì)變化的影響因子在數(shù)據(jù)發(fā)展中所占的加權(quán)比例。對(duì)于初始平滑值和趨勢(shì)值的處理,常規(guī)做法是運(yùn)用線(xiàn)性方程法確定數(shù)據(jù)的初始平滑值和趨勢(shì)值。因?yàn)榛貧w方程的特點(diǎn)就是利用最小二乘法對(duì)參數(shù)進(jìn)行估計(jì),擬合的平滑值和趨勢(shì)值保持偏導(dǎo)數(shù)為零的特點(diǎn)。本文也采用回歸方程法確定初始平滑值和趨勢(shì)值。而對(duì)于平滑系數(shù)a、β 處理,采用枚舉法確定。利用EXCEL 進(jìn)行規(guī)劃求解,以估計(jì)標(biāo)準(zhǔn)誤差最小為主要目標(biāo),查找分析最佳的平滑系數(shù)a、β 取值。通過(guò)計(jì)算發(fā)現(xiàn)當(dāng)a=0.082,β=0.013 時(shí),此時(shí)平均誤差比例和估計(jì)標(biāo)準(zhǔn)誤差分別為0.223%、735.89,估計(jì)標(biāo)準(zhǔn)誤差達(dá)到最小值。雙參數(shù)指數(shù)法預(yù)測(cè)值和實(shí)際值對(duì)比結(jié)果如圖3所示,預(yù)測(cè)值過(guò)濾了一定的隨機(jī)波動(dòng),使得數(shù)據(jù)結(jié)果更加平滑,同時(shí)也能反應(yīng)出數(shù)據(jù)的季節(jié)變化和長(zhǎng)期趨勢(shì)變化的特點(diǎn)。
圖3 雙參數(shù)指數(shù)平滑預(yù)測(cè)值與實(shí)際值對(duì)比
針對(duì)本文涉及的兩種指數(shù)平滑法,分別取估計(jì)標(biāo)準(zhǔn)誤差最小時(shí)的預(yù)測(cè)數(shù)據(jù),將主要評(píng)價(jià)指標(biāo)對(duì)比得到表2。
從表2可以看出雙參數(shù)指數(shù)平滑法預(yù)測(cè)結(jié)果比單參數(shù)指數(shù)平滑法預(yù)測(cè)結(jié)果的誤差更小。單參數(shù)指數(shù)平滑法通過(guò)擬合使得數(shù)據(jù)中短期偶然性因素的影響被削弱,從而顯示出數(shù)據(jù)在較長(zhǎng)時(shí)間的基本發(fā)展趨勢(shì)。對(duì)預(yù)測(cè)結(jié)果的準(zhǔn)確性會(huì)隨著期數(shù)增加逐級(jí)降低,使得觀察值離預(yù)測(cè)值時(shí)期越久遠(yuǎn)權(quán)數(shù)變得越小,雙參數(shù)指數(shù)平滑法其基本原理是把具有長(zhǎng)期趨勢(shì)、季節(jié)性變化的時(shí)間序列進(jìn)行分解,通過(guò)數(shù)據(jù)處理可以過(guò)濾掉隨機(jī)波動(dòng)的影響。雙參數(shù)指數(shù)平滑法克服了單參數(shù)指數(shù)平滑法不能區(qū)別長(zhǎng)期趨勢(shì)和循環(huán)變動(dòng)的缺點(diǎn),也解決了一個(gè)參數(shù)權(quán)數(shù)比重逐漸變小的問(wèn)題。所以從預(yù)測(cè)結(jié)果看雙參數(shù)指數(shù)平滑法比單參數(shù)指數(shù)平滑法更好,更適合鐵路運(yùn)輸指標(biāo)預(yù)測(cè)分析。
表2 單參數(shù)和雙參數(shù)指數(shù)平滑法的誤差情況對(duì)比
通過(guò)單參數(shù)和雙參數(shù)指數(shù)平滑法模型在預(yù)測(cè)鐵路運(yùn)輸數(shù)據(jù)的作用效果進(jìn)行研究分析,得到的結(jié)論有:
(1)指數(shù)平滑法可以過(guò)濾數(shù)據(jù)隨機(jī)性變化,使得預(yù)測(cè)數(shù)據(jù)能夠在一定誤差范圍內(nèi)反應(yīng)周期性(季節(jié)性)和長(zhǎng)期趨勢(shì)變化特點(diǎn)。
(2)單參數(shù)指數(shù)平滑法在預(yù)測(cè)數(shù)據(jù)時(shí),數(shù)據(jù)期數(shù)越多衰減越大準(zhǔn)確性降低,不適合長(zhǎng)期預(yù)測(cè)。
(3)雙參數(shù)指數(shù)平滑法在預(yù)測(cè)數(shù)據(jù)時(shí),可以分解平滑值和趨勢(shì)值,通過(guò)兩個(gè)參數(shù)加權(quán)作用使數(shù)據(jù)變化更加平滑,降低數(shù)據(jù)衰減帶來(lái)的誤差,更貼近實(shí)際值。
(4)通過(guò)兩種方法對(duì)鐵路運(yùn)輸數(shù)據(jù)的擬合,從誤差結(jié)果分析,雙參數(shù)指數(shù)平滑法更適合用于數(shù)據(jù)的預(yù)測(cè)分析。