韓振鑫,溫旭麗,殷世松,武瑩瑩,張人杰
(1.南京理工大學(xué),江蘇 南京 210014;2.東南大學(xué)成賢學(xué)院,江蘇 南京 210088)
在“一帶一路”戰(zhàn)略背景下,大力發(fā)展多式聯(lián)運(yùn)是積極探索實(shí)現(xiàn)“交通強(qiáng)國”戰(zhàn)略的重要路徑[1]。貨運(yùn)量預(yù)測(cè)是未來多式聯(lián)運(yùn)發(fā)展的基礎(chǔ),可為研究多種運(yùn)輸方式之間運(yùn)輸量的合理分配和綜合運(yùn)輸網(wǎng)建設(shè),提供有效的數(shù)據(jù)支撐。目前國內(nèi)外對(duì)貨運(yùn)量的預(yù)測(cè)方法通常可以分為定性預(yù)測(cè)和定量預(yù)測(cè)[2]。隨著多式聯(lián)運(yùn)網(wǎng)絡(luò)的日益完善,其貨物運(yùn)輸量的隨機(jī)性、非線性及不確定性給這項(xiàng)工作帶來了巨大的挑戰(zhàn)。定性預(yù)測(cè)中大量的參數(shù)都是利用主觀因素判斷確定的,會(huì)使得復(fù)雜網(wǎng)絡(luò)條件下貨物運(yùn)輸流量預(yù)測(cè)的效率及精度嚴(yán)重下降。定量預(yù)測(cè)方法則能夠解決非線性、時(shí)效性強(qiáng)等問題,且預(yù)測(cè)性能良好,受到學(xué)術(shù)界的廣泛關(guān)注[3-7]。然而,大多數(shù)單一預(yù)測(cè)模型存在較大的局限性,導(dǎo)致模型不能持續(xù)在各個(gè)方面保持良好的性能。同時(shí),在傳統(tǒng)模型中,數(shù)據(jù)種類單一且數(shù)據(jù)體量較小,導(dǎo)致訓(xùn)練模型不能捕捉到最優(yōu)的時(shí)間特征關(guān)系,從而預(yù)測(cè)模型很難達(dá)到最優(yōu)值。集成學(xué)習(xí)(Ensemble Learning)是定量預(yù)測(cè)方法(機(jī)器學(xué)習(xí))中的一種,且被廣泛應(yīng)用于交通預(yù)測(cè)領(lǐng)域,是通過多個(gè)模型的組合形成一個(gè)精準(zhǔn)度更高的模型,具有效率高、訓(xùn)練快、魯棒性強(qiáng)等特點(diǎn)[8-9]。本文基于貨物運(yùn)輸量的時(shí)間特征規(guī)律,構(gòu)建了Bagging+BP集成學(xué)習(xí)網(wǎng)絡(luò)模型,并將原始數(shù)據(jù)構(gòu)造成一個(gè)前序時(shí)間序列因子數(shù)據(jù)集,采用南京市龍?zhí)陡鄣挠行?shù)據(jù)驗(yàn)證了Bagging+BP集成學(xué)習(xí)網(wǎng)絡(luò)模型的有效性。
基于多式聯(lián)運(yùn)貨物運(yùn)輸量的季節(jié)性、周期性特點(diǎn),結(jié)合物流流量的時(shí)間特征關(guān)系,構(gòu)建初始相關(guān)時(shí)間特征輸入集。假設(shè)在預(yù)測(cè)時(shí)間段t,某港口的貨物運(yùn)輸量預(yù)測(cè)值為,需構(gòu)造初始相關(guān)時(shí)間特征輸入集表示預(yù)測(cè)前序間隔,T表示預(yù)測(cè)最小周期間隔,N表示最大相鄰周期間隔,t+1 表示預(yù)測(cè)目標(biāo)時(shí)間段后一時(shí)間段,t-1 表示預(yù)測(cè)目標(biāo)時(shí)間段前一時(shí)間段。
多式聯(lián)運(yùn)貨物運(yùn)輸量具有復(fù)雜的時(shí)間特性,對(duì)原始數(shù)據(jù)進(jìn)行時(shí)間特征挖掘,是提高輸入因子質(zhì)量與降低BP 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練難度的關(guān)鍵環(huán)節(jié)。根據(jù)斯皮爾曼相關(guān)性系數(shù)法計(jì)算初始相關(guān)時(shí)間特征輸入集中各相關(guān)時(shí)間特征向量與目標(biāo)向量之間的相關(guān)性系數(shù)[11],并結(jié)合相關(guān)性標(biāo)準(zhǔn)法則與大量的實(shí)驗(yàn)結(jié)果,建立優(yōu)化初始相關(guān)時(shí)間特征輸入集的判斷標(biāo)準(zhǔn):若同目標(biāo)向量之間的相關(guān)性系數(shù)低于0.4,需刪除初始輸入集中不符合標(biāo)準(zhǔn)的相關(guān)時(shí)間特征向量,具體優(yōu)化過程如圖1所示。
1.3.1 BP 神經(jīng)網(wǎng)絡(luò)模型。BP 神經(jīng)預(yù)測(cè)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)[10],BP神經(jīng)預(yù)測(cè)網(wǎng)絡(luò)在處理非線性的擬合問題上具有更好的映射能力,能夠更好地挖掘類似港口貨運(yùn)吞吐量這種呈現(xiàn)出時(shí)間性和季節(jié)性的數(shù)據(jù)規(guī)律,模型結(jié)構(gòu)如圖2所示。
面向多式聯(lián)運(yùn)的Bagging+BP貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)中BP神經(jīng)網(wǎng)絡(luò)可以表達(dá)為:
圖1 初始相關(guān)時(shí)間特征輸入集預(yù)處理流程
式(1)中,Xi表示輸入層中的第i層,bi代表中間層中的第i層,V表示輸入層到隱含層之間的權(quán)值,Q1表示輸出層的多式聯(lián)運(yùn)貨物運(yùn)輸量輸出,W表示隱含層到輸出層之間的權(quán)值。
由于sigmoid函數(shù)作為激發(fā)函數(shù)能夠有效地分析函數(shù)的局部特性,所以本文采用sigmoid 函數(shù)作為網(wǎng)絡(luò)隱含層的激勵(lì)函數(shù),見式(2)。
圖2 傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
1.3.2 Bagging+BP貨運(yùn)量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)。傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型雖然解決了非線性、時(shí)變性等問題,但是在解決數(shù)據(jù)集小和輸入因子維度的不確定性大等問題時(shí),仍然不能保持原有模型良好的性能。基于上述分析,在Bootstrap 傳統(tǒng)抽樣的基礎(chǔ)上,結(jié)合各相關(guān)時(shí)間特征向量與目標(biāo)向量之間相關(guān)性系數(shù)的分布,建立Spearman+Bootstrap 抽樣法,用每次抽樣形成的數(shù)據(jù)集訓(xùn)練一個(gè)弱學(xué)習(xí)器模型,如果目標(biāo)函數(shù)(即模型的損失函數(shù))數(shù)值出現(xiàn)降低,則停止抽樣循環(huán)過程,通過加權(quán)獲取組合后BP神經(jīng)網(wǎng)絡(luò)中各分支向量的新權(quán)值,具體步驟如下:
(1)假設(shè)預(yù)處理后初始時(shí)間特征輸入集為S',利用斯皮爾曼系數(shù)法計(jì)算集合中各相關(guān)時(shí)間特征向量與目標(biāo)向量之間的相關(guān)性系數(shù);
(2)假設(shè)相關(guān)性系數(shù)分布在{i,j},結(jié)合相關(guān)性系數(shù)分布規(guī)律及相關(guān)性強(qiáng)弱系數(shù)劃分標(biāo)準(zhǔn)(0.8-1.0 表示極強(qiáng)相關(guān),0.6-0.8表示強(qiáng)相關(guān),0.4-0.6表示中等程度相關(guān)),將預(yù)處理后的時(shí)間相關(guān)性輸入向量重新構(gòu)造成三個(gè)子樣本集
(7)通過對(duì)所有子模型分支向量的權(quán)重進(jìn)行加權(quán),最終得到組合后BP神經(jīng)網(wǎng)絡(luò)
1.3.3 網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)置。Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)的超參數(shù)設(shè)置,決定了預(yù)測(cè)網(wǎng)絡(luò)的性能和效率。根據(jù)數(shù)據(jù)維數(shù),確定輸入層神經(jīng)元節(jié)點(diǎn)數(shù)量n,由預(yù)測(cè)的目標(biāo)貨物運(yùn)輸量確定輸出層神經(jīng)元節(jié)點(diǎn)數(shù)量m。按照如下步驟選擇每個(gè)Bagging+BP 貨物運(yùn)輸量訓(xùn)練模型的隱含層神經(jīng)元的節(jié)點(diǎn)數(shù):
(2)通過列舉法對(duì)比分析在不同隱含層神經(jīng)元節(jié)點(diǎn)數(shù)下的網(wǎng)絡(luò)模型訓(xùn)練效果,即比較損失函數(shù)(softmax交叉熵)值大??;
(3)從步驟(2)所列出的節(jié)點(diǎn)數(shù)中選擇損失函數(shù)值最小時(shí)對(duì)應(yīng)的節(jié)點(diǎn)數(shù),作為各個(gè)貨物運(yùn)輸量學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練模型的隱含層神經(jīng)元節(jié)點(diǎn)數(shù)。
本文模型驗(yàn)證所有數(shù)據(jù)均由南京市龍?zhí)陡厶峁?,所提供?shù)據(jù)的時(shí)間段為2010 年-2019 年(數(shù)據(jù)間隔為月),包括本港集裝箱數(shù)量、中轉(zhuǎn)集裝箱數(shù)量及本港總計(jì)集裝箱數(shù)量三種數(shù)據(jù)類型,數(shù)據(jù)總計(jì)120個(gè)月。在實(shí)驗(yàn)中,本文對(duì)龍?zhí)陡鄣募b箱總量(中轉(zhuǎn)箱與本港箱的總量)進(jìn)行預(yù)測(cè),并采用中折交叉驗(yàn)證法對(duì)模型的精性能進(jìn)行驗(yàn)證(即將80%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),20%的數(shù)據(jù)作為測(cè)試數(shù)據(jù))。
在上述三種方法中,各個(gè)模型都具有自己的優(yōu)勢(shì),為了能夠較好地評(píng)價(jià)三種多式聯(lián)運(yùn)貨物運(yùn)輸量預(yù)測(cè)模型的優(yōu)劣性,本文采用均方根誤差(MAP)與平均相對(duì)百分誤差法(MAPE)刻畫預(yù)測(cè)貨物運(yùn)輸量與實(shí)際貨物運(yùn)輸量間的擬合程度,即計(jì)算預(yù)測(cè)誤差,見式(3)與式(4)。
其中,N表示測(cè)試集樣本個(gè)數(shù),Qi表示測(cè)試集第i個(gè)實(shí)際貨運(yùn)流量值,則表示測(cè)試集第i個(gè)模型預(yù)測(cè)貨物運(yùn)輸量值。
為了更好地驗(yàn)證Bagging+BP貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)的優(yōu)越性,本文分別選取ARIMA、LSTM 神經(jīng)網(wǎng)絡(luò)、Bagging+BP 學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)對(duì)比分析。在實(shí)驗(yàn)過程中,為了更好的對(duì)模型進(jìn)行客觀分析,需要三個(gè)模型的數(shù)據(jù)集樣本量、超參數(shù)保持一致。最優(yōu)參數(shù)設(shè)置下,測(cè)試集中三個(gè)模型的實(shí)驗(yàn)結(jié)果如圖3所示,具體預(yù)測(cè)評(píng)價(jià)指標(biāo)見表1。
圖3 多網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果
表1 ARIMA、Bagging+BP、LSTM預(yù)測(cè)結(jié)果分析
從表1 和圖3 可以看出,相比于ARIMA 和LSTM模型,Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)的性能是最佳的。由于龍?zhí)陡厶峁┑亩嗍铰?lián)運(yùn)貨物運(yùn)輸量數(shù)據(jù)體量較少,數(shù)據(jù)類型較為單一,LSTM 模型本身參數(shù)結(jié)構(gòu)復(fù)雜且較為敏感,最終導(dǎo)致長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型過度擬合、預(yù)測(cè)效果較差。另外,由于近幾年來龍?zhí)陡郯l(fā)展較快,導(dǎo)致貨物運(yùn)輸量數(shù)據(jù)非線性強(qiáng),使得ARIMA模型預(yù)測(cè)效果較差。因此,在貨物運(yùn)輸量非線性、時(shí)變性強(qiáng)、數(shù)據(jù)多樣性缺失以及模型穩(wěn)定性差等問題中,Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)模型能夠有效提高預(yù)測(cè)的準(zhǔn)確性。同時(shí)從RMS 模型評(píng)判指標(biāo)可以看出,Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)的穩(wěn)定性相比其他兩個(gè)模型(ARIMA和LSTM)更高,說明通過集成學(xué)習(xí)可以減少數(shù)據(jù)量少帶來的過度擬合問題。
綜上,Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)在長(zhǎng)時(shí)間序列的貨物運(yùn)輸量預(yù)測(cè)時(shí)具有優(yōu)秀的表現(xiàn)力,且相比多參數(shù)動(dòng)態(tài)模型更適用于數(shù)據(jù)量少的預(yù)測(cè)場(chǎng)景。
基于港口貨物運(yùn)輸量的時(shí)間變化特征,構(gòu)建了一種基于集成學(xué)習(xí)的Bagging+BP貨物運(yùn)輸量預(yù)測(cè)模型,解決了傳統(tǒng)線性模型和單一神經(jīng)網(wǎng)絡(luò)模型不能在數(shù)據(jù)集較少、非線性強(qiáng)等問題中保持較高的模型性能的問題。以龍?zhí)陡蹫槔瑢?shí)驗(yàn)表明:Bagging+BP模型在貨物運(yùn)輸量預(yù)測(cè)中的準(zhǔn)確性高,在貨運(yùn)量預(yù)測(cè)領(lǐng)域中的適用性更強(qiáng)。在目前研究工作的基礎(chǔ)上,后續(xù)研究可進(jìn)一步擴(kuò)展模型的隱藏層層數(shù)和增加空間特征,建立更有效的多式聯(lián)運(yùn)貨物運(yùn)輸量預(yù)測(cè)模型,并運(yùn)用到不同地區(qū)、不同港口的各種貨物運(yùn)輸量預(yù)測(cè)中。