楊銀花 金 雁 汪 敏* 張矢宇
(武漢理工大學船海與能源動力工程學院1) 武漢 430063) (武漢理工大學交通與物流工程學院2) 武漢 430063)
長江航運干散貨運價指數(shù)(Yangtze River bulk freight index,YBFI)是用來反映我國內(nèi)河干散貨運輸市場貨運水平變動情況的重要航運經(jīng)濟指標.由于內(nèi)河干散貨市場的動態(tài)性和不穩(wěn)定性都與沿海干散貨市場有較大差異,例如,內(nèi)河運價指數(shù)樣本數(shù)據(jù)點少、周期性不明顯且比沿海相關指數(shù)更容易受到外界因素的干擾等,沿海干散貨相關預測分析方法不適用.現(xiàn)階段對內(nèi)河航運干散貨運輸市場波動分析及預測的研究較少,國內(nèi)外學者主要對中國沿海散貨運輸市場的CBFI、國際(波羅的海)干散貨運輸市場的BDI和中國集裝箱市場變化趨勢的CCFI等進行了研究.主流的研究方法有:GARCH模型、小波分析理論、支持向量機(SVM)等.GARCH模型能夠衡量波動的非均衡性,但精度無法保證;小波分析理論缺乏適應性,容易受到基函數(shù)選擇的約束;SVM等機器學習方法容易出現(xiàn)過擬合導致預測失效[1-2].EMD是一種經(jīng)驗、直觀、自適應的數(shù)據(jù)處理方法,能很好地提取非線性和非平穩(wěn)性數(shù)據(jù)的時間尺度特征,結合傳統(tǒng)預測方法從而克服單一方法的不足.
文中選取2009年5月—2021年4月YBFI月度數(shù)據(jù)為樣本,結合“分解-預測-重構”分析思路,將EMD分解后的數(shù)據(jù)作為樣本,從而降低數(shù)據(jù)噪聲和網(wǎng)絡復雜性,再對分解序列進行預測,綜合得出最終預測值,從而提高YBFI預測分析的準確性.
YBFI時間序列具有含噪聲、非線性、非平穩(wěn)和多尺度性.現(xiàn)今對航運指數(shù)研究基本是單一算法預測或針對序列整體進行建模[3],少有學者對數(shù)據(jù)的內(nèi)在波動性出發(fā)進行預測研究.預測主要思想為“分解-預測-重構”[4].
采用EMD方法對YBFI序列進行降噪分解,得到不同頻率周期相對穩(wěn)定的YBFI本征模態(tài)分量(intrinsic model function,IMF)和趨勢項(residual);運用ARIMA模型或者Holt-Winters模型對子序列和趨勢項進行預測,將各個IMF的預測結果進行集成組合即得到最終的YBFI預測結果.YBFI預測模型構建流程見圖1.
圖1 YBFI預測模型構建流程圖
經(jīng)驗模態(tài)分解算法(empirical mode decomposition,EMD)是一種處理非線性、平穩(wěn)時間序列的前沿時頻分析處理方法[5].分解得到不同波動時間尺度的IMF需同時滿足2個條件:①各分量的極值點確定的包絡線均值為0;②各分量通過極值點的個數(shù)與通過零點的個數(shù)不多于一個.具體建模步驟見圖2.
圖2 EMD分解過程
ARIMA模型是將自回歸過程(AR)與移動平均過程(MA)相結合的時間序列組合模型.其識別流程圖見圖3.
圖3 ARIMA模型識別流程圖
該模型的一般表示方式為:ARIMA(p,d,q)×(P,D,Q)S.其中:S為周期步長;d為非季節(jié)部分提取趨勢信息所用的差分階數(shù);D為季節(jié)部分提取趨勢信息所用的差分階數(shù).乘法模型的實質(zhì)是通過差分將原始序列化為平穩(wěn)序列,再對其進行擬合,其模型結構為
式中:{εt}為白噪聲序列;Θ(B)為q階移動平均系數(shù)多項式;Φ(B)為p階自回歸系數(shù)多項式;▽為差分算子;B為滯后算子.在ARIMA建模過程中,建模的重點在于確定(p,d,q)、(P,D,Q)的值.建模的主要思路[6]為:分析數(shù)據(jù)特征,對數(shù)據(jù)進行相應變換,直到通過ADF檢驗獲得平穩(wěn)時間序列為止,這是ARIMA建模的前提條件;根據(jù)ACF/PACF圖形的峰值個數(shù)確定模型的參數(shù),根據(jù)參數(shù)建模預測并對預測結果進行評估.
根據(jù)統(tǒng)計學誤差分析規(guī)則,選擇下列7個指標作誤差評價,見表1.
表1 誤差評估指標
由于2008年1月—2009年4月數(shù)據(jù)振幅較大,初步預測結果與現(xiàn)實情況不符.為了準確預測長江航運干散貨2021—2030年的運價指數(shù)數(shù)據(jù),選取交通運輸部長江航務管理局官網(wǎng)公布的從2009年5月—2021年4月共144個樣本數(shù)據(jù).對數(shù)據(jù)進行初步調(diào)整并繪制時序圖,見圖4.
圖4 長江航運干散貨運價指數(shù)(YBFI)時序圖
由圖4可知:數(shù)據(jù)呈現(xiàn)出較明顯的季節(jié)性和波動性,具有明顯的非線性特征.在Eviews軟件中進行ADF非平穩(wěn)性檢驗,見表2.t統(tǒng)計量(-2.893 456)大于不同顯著水平下的臨界值,在10%置信水平下不拒絕存在單位根的假設,P值(0.167 8)大于0.05,故YBFI序列是非平穩(wěn)序列.
表2 ADF非平穩(wěn)性檢驗結果
EMD方法相比傳統(tǒng)的小波分析、傅里葉分解方法存在一定的優(yōu)勢,EMD脫離了預定好的基函數(shù)的約束,能夠最大程度保留時間序列自身的特性.YBFI序列經(jīng)EMD分解后得到三個IMF分量和一個趨勢項Residual,見圖5.
圖5 EMD分解結果
由圖5可知:IMF1的波動頻率最高,并依次遞減,平均振幅也從大到小變動,表現(xiàn)出YBFI序列的內(nèi)在多尺度波動特性.從周期性角度看,IMF1的周期最小,初步分析是市場基礎經(jīng)濟要素對YBFI序列的影響;IMF2、IMF3依次變大,初步分析IMF2是政府宏觀調(diào)控,定期出臺的政策規(guī)定對YBFI的影響,而IMF3則可能是航運市場重大事件影響,例如2008年金融危機、2020年新冠疫情等.趨勢項自2008年(根據(jù)官網(wǎng)數(shù)據(jù)可得)便呈現(xiàn)緩慢下降趨勢,到2014年末2015年初達到谷值,之后開始緩慢增長,查閱有關資料,航運市場中周期為10~15年[7],這與趨勢項展示的規(guī)律一致.
通過EMD分解將YBFI序列分解為相對平穩(wěn)的IMF分量,將三個IMF分量運用ARIMA模型或Holt-Winters指數(shù)平滑法進行比較、預測、分析,此類分析主要在SPSS和Eviews軟件中實現(xiàn).趨勢項Residual數(shù)列采用曲線擬合方法,根據(jù)其分布特征和干散貨運輸市場的周期波動特性,運用MATLAB 2018a實驗平臺進行擬合研究,通過訓練,發(fā)現(xiàn)三角函數(shù)對Residual數(shù)列的擬合效果較好.
1) IMF1擬合模型 通過擬合發(fā)現(xiàn)ARIMA(2,0,10)×(2,0,0)12能夠很好的反映IMF1序列的波動特性.其擬合優(yōu)度R2為0.483(接近0.5,擬合較好),均方根誤差RMSE僅為21.093;DW統(tǒng)計量為2.032;AIC值為9.034.
2) IMF2擬合模型 通過比較ARIMA模型、指數(shù)平滑模型以及專家建模結果,發(fā)現(xiàn)ARMA(4,7)能對IMF2的周期、波動特性進行很好的預測.其R2達到了一般線性擬合模型R2,為0.996,接近1;均方根誤差RMSE僅為1.257;平均絕對誤差MAE僅為0.803;DW值為1.672;AIC值為3.102.
3) IMF3擬合模型 通過比較擬合發(fā)現(xiàn)ARMA(6,1)能對IMF3的特征數(shù)列進行較好的擬合.在該模型擬合過程中,R2為0.998,幾乎等于1;均方根誤差RMSE與平均絕對誤差MAE均處于較低區(qū)間,DW值為1.912,說明擬合精度較優(yōu).
4) Residual擬合模型 趨勢項主要反映了YBFI序列在發(fā)展過程中的整體趨勢和變化周期.經(jīng)過在MATLAB實驗平臺中反復驗算,調(diào)參,最終確定該序列的較優(yōu)擬合、預測模型方程式為
Residual-PREt=778.2+14.49×
cos(t×0.027 86)-95.89×sin(t×0.027 86)+
24.64×cos(2×t×0.027 86)+
22.71×sin(2×t×0.027 86)-3.695×
cos(3×t×0.027 86)+0.497 1×
sin(3×t×0.027 86)
式中:Residual_PREt為第t期趨勢項Residual的預測值;t為時間序號,記2009年5月為t=1;依次往后t=2,3,…,n.
圖6為Residual的擬合預測模型效果和殘差分析圖.
圖6 Residual擬合與殘差分布
從殘差分布曲線,發(fā)現(xiàn)擬合效果較好,殘差基本在[-0.95,0.60]之間,且平均殘差僅為0.036 09,與0無明顯差異.
5) YBFI預測結果 由式(1),將上述經(jīng)驗模態(tài)分量和趨勢項求和即可得到相應年份YBFI預測結果,見圖7.
圖7 YBFI擬合效果圖
預測值略有滯后,但基本能夠反映樣本波動規(guī)律和變化趨勢.通過計算,得到殘差均值僅為0.312 8(與0無明顯差異),說明總體誤差水平較低;均方根誤差RMSE為20.317,若以基期1 000點算,均方根誤差僅為2%,說明高值部分預測效果較好;平均相對誤差絕對值MAPE為1.62%,在10%范圍內(nèi),表明平穩(wěn)部分預測效果較好;平均絕對誤差MAE=12.184;相對誤差RE中僅有五組數(shù)據(jù)超過5%,2組數(shù)據(jù)超過10%,占樣本總數(shù)的比例分別為0.034 7、0.013 9,可忽略不計,故可判斷整體誤差較低;R2為0.973 5,說明該模型對YBFI序列的預測效果較準確.
將EMD-ARIMA組合模型相關參數(shù)與傳統(tǒng)、單一的季節(jié)性預測方法[8]進行對比,見表3.
表3 EMD-ARIMA組合模型及其對比模型預測誤差比較
總體來看,相比ARIMA模型和簡單季節(jié)模型,EMD-ARIMA組合模型對YBFI序列的預測表現(xiàn)更優(yōu),說明EMD分解能有效提取含噪聲、非線性、非平穩(wěn)性數(shù)據(jù)的時間尺度特征,通過對本征模態(tài)變量IMF和趨勢項Residual的預測結果進行重新組合,可以得到準確的YBFI預測結果.
該模型對未來年份YBFI預測結果(部分)見表4.
表4 未來年份預測結果
由表4可知:2022—2023年,YBFI將達到一個較高水平,之后又緩慢下跌,在不考慮“通貨膨脹”等因素的情況下,預計2030年的YBFI將處于一個較低的水平.根據(jù)我國內(nèi)河運輸?shù)拈L期發(fā)展現(xiàn)狀來看,在未來很長一段時間內(nèi),若沒有較大的技術突破,干散貨航運市場將維持原來的周期波動規(guī)律,整體略有上漲趨勢.
1) EMD模型能有效分解YBFI序列,在保留數(shù)據(jù)自身的內(nèi)在波動特性的同時對不同波動頻率數(shù)據(jù)進行分解,為后續(xù)預測操作提供周期較穩(wěn)定的分解序列.
2) EMD-ARIMA組合模型的相對誤差RE中超過5%的樣本僅占樣本總數(shù)的0.0347,其整體誤差水平基本在5%內(nèi).
3) EMD-ARIMA組合模型預測效果和精度均優(yōu)于傳統(tǒng)單一的時間序列預測方法.在預測精度和擬合優(yōu)度方面提高了將近15%,平穩(wěn)部分和中高值預測效果均得到較大幅度提升,其RMSE、MAPE、MAE值(相比單一ARIMA模型)分別下降了31.83%、3.11%、1.69%.
本方法可利用有限數(shù)量樣本,較好模擬出長江干散貨運價指數(shù)周期性不明顯、非線性、非平穩(wěn)的波動特性,為長江干線散貨運輸市場發(fā)展態(tài)勢預測提供支持.