基于集成學(xué)習(xí)的多式聯(lián)運(yùn)貨運(yùn)量預(yù)測(cè)模型構(gòu)建

2021-03-12 11:04韓振鑫溫旭麗殷世松武瑩瑩張人杰

物流技術(shù) 2021年2期

關(guān)鍵詞：運(yùn)輸量貨物神經(jīng)網(wǎng)絡(luò)

韓振鑫，溫旭麗，殷世松，武瑩瑩，張人杰

（1.南京理工大學(xué)，江蘇南京 210014；2.東南大學(xué)成賢學(xué)院，江蘇南京 210088）

0 引言

在“一帶一路”戰(zhàn)略背景下，大力發(fā)展多式聯(lián)運(yùn)是積極探索實(shí)現(xiàn)“交通強(qiáng)國”戰(zhàn)略的重要路徑[1]。貨運(yùn)量預(yù)測(cè)是未來多式聯(lián)運(yùn)發(fā)展的基礎(chǔ)，可為研究多種運(yùn)輸方式之間運(yùn)輸量的合理分配和綜合運(yùn)輸網(wǎng)建設(shè)，提供有效的數(shù)據(jù)支撐。目前國內(nèi)外對(duì)貨運(yùn)量的預(yù)測(cè)方法通常可以分為定性預(yù)測(cè)和定量預(yù)測(cè)[2]。隨著多式聯(lián)運(yùn)網(wǎng)絡(luò)的日益完善，其貨物運(yùn)輸量的隨機(jī)性、非線性及不確定性給這項(xiàng)工作帶來了巨大的挑戰(zhàn)。定性預(yù)測(cè)中大量的參數(shù)都是利用主觀因素判斷確定的，會(huì)使得復(fù)雜網(wǎng)絡(luò)條件下貨物運(yùn)輸流量預(yù)測(cè)的效率及精度嚴(yán)重下降。定量預(yù)測(cè)方法則能夠解決非線性、時(shí)效性強(qiáng)等問題，且預(yù)測(cè)性能良好，受到學(xué)術(shù)界的廣泛關(guān)注[3-7]。然而，大多數(shù)單一預(yù)測(cè)模型存在較大的局限性，導(dǎo)致模型不能持續(xù)在各個(gè)方面保持良好的性能。同時(shí)，在傳統(tǒng)模型中，數(shù)據(jù)種類單一且數(shù)據(jù)體量較小，導(dǎo)致訓(xùn)練模型不能捕捉到最優(yōu)的時(shí)間特征關(guān)系，從而預(yù)測(cè)模型很難達(dá)到最優(yōu)值。集成學(xué)習(xí)（Ensemble Learning）是定量預(yù)測(cè)方法（機(jī)器學(xué)習(xí)）中的一種，且被廣泛應(yīng)用于交通預(yù)測(cè)領(lǐng)域，是通過多個(gè)模型的組合形成一個(gè)精準(zhǔn)度更高的模型，具有效率高、訓(xùn)練快、魯棒性強(qiáng)等特點(diǎn)[8-9]。本文基于貨物運(yùn)輸量的時(shí)間特征規(guī)律，構(gòu)建了Bagging+BP集成學(xué)習(xí)網(wǎng)絡(luò)模型，并將原始數(shù)據(jù)構(gòu)造成一個(gè)前序時(shí)間序列因子數(shù)據(jù)集，采用南京市龍?zhí)陡鄣挠行?shù)據(jù)驗(yàn)證了Bagging+BP集成學(xué)習(xí)網(wǎng)絡(luò)模型的有效性。

1 基于Bagging+BP的集成學(xué)習(xí)網(wǎng)絡(luò)

1.1 初始相關(guān)時(shí)間特征輸入集構(gòu)建

基于多式聯(lián)運(yùn)貨物運(yùn)輸量的季節(jié)性、周期性特點(diǎn)，結(jié)合物流流量的時(shí)間特征關(guān)系，構(gòu)建初始相關(guān)時(shí)間特征輸入集。假設(shè)在預(yù)測(cè)時(shí)間段t，某港口的貨物運(yùn)輸量預(yù)測(cè)值為，需構(gòu)造初始相關(guān)時(shí)間特征輸入集表示預(yù)測(cè)前序間隔，T表示預(yù)測(cè)最小周期間隔，N表示最大相鄰周期間隔，t+1 表示預(yù)測(cè)目標(biāo)時(shí)間段后一時(shí)間段，t-1 表示預(yù)測(cè)目標(biāo)時(shí)間段前一時(shí)間段。

1.2 初始相關(guān)時(shí)間特征輸入集預(yù)處理

多式聯(lián)運(yùn)貨物運(yùn)輸量具有復(fù)雜的時(shí)間特性，對(duì)原始數(shù)據(jù)進(jìn)行時(shí)間特征挖掘，是提高輸入因子質(zhì)量與降低BP 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練難度的關(guān)鍵環(huán)節(jié)。根據(jù)斯皮爾曼相關(guān)性系數(shù)法計(jì)算初始相關(guān)時(shí)間特征輸入集中各相關(guān)時(shí)間特征向量與目標(biāo)向量之間的相關(guān)性系數(shù)[11]，并結(jié)合相關(guān)性標(biāo)準(zhǔn)法則與大量的實(shí)驗(yàn)結(jié)果，建立優(yōu)化初始相關(guān)時(shí)間特征輸入集的判斷標(biāo)準(zhǔn)：若同目標(biāo)向量之間的相關(guān)性系數(shù)低于0.4，需刪除初始輸入集中不符合標(biāo)準(zhǔn)的相關(guān)時(shí)間特征向量，具體優(yōu)化過程如圖1所示。

1.3 基于Bagging+BP 的貨運(yùn)量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)構(gòu)建

1.3.1 BP 神經(jīng)網(wǎng)絡(luò)模型。BP 神經(jīng)預(yù)測(cè)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)[10]，BP神經(jīng)預(yù)測(cè)網(wǎng)絡(luò)在處理非線性的擬合問題上具有更好的映射能力，能夠更好地挖掘類似港口貨運(yùn)吞吐量這種呈現(xiàn)出時(shí)間性和季節(jié)性的數(shù)據(jù)規(guī)律，模型結(jié)構(gòu)如圖2所示。

面向多式聯(lián)運(yùn)的Bagging+BP貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)中BP神經(jīng)網(wǎng)絡(luò)可以表達(dá)為：

圖1 初始相關(guān)時(shí)間特征輸入集預(yù)處理流程

式（1）中，Xi表示輸入層中的第i層，bi代表中間層中的第i層，V表示輸入層到隱含層之間的權(quán)值，Q1表示輸出層的多式聯(lián)運(yùn)貨物運(yùn)輸量輸出，W表示隱含層到輸出層之間的權(quán)值。

由于sigmoid函數(shù)作為激發(fā)函數(shù)能夠有效地分析函數(shù)的局部特性，所以本文采用sigmoid 函數(shù)作為網(wǎng)絡(luò)隱含層的激勵(lì)函數(shù)，見式（2）。

圖2 傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

1.3.2 Bagging+BP貨運(yùn)量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)。傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型雖然解決了非線性、時(shí)變性等問題，但是在解決數(shù)據(jù)集小和輸入因子維度的不確定性大等問題時(shí)，仍然不能保持原有模型良好的性能。基于上述分析，在Bootstrap 傳統(tǒng)抽樣的基礎(chǔ)上，結(jié)合各相關(guān)時(shí)間特征向量與目標(biāo)向量之間相關(guān)性系數(shù)的分布，建立Spearman+Bootstrap 抽樣法，用每次抽樣形成的數(shù)據(jù)集訓(xùn)練一個(gè)弱學(xué)習(xí)器模型，如果目標(biāo)函數(shù)（即模型的損失函數(shù)）數(shù)值出現(xiàn)降低，則停止抽樣循環(huán)過程，通過加權(quán)獲取組合后BP神經(jīng)網(wǎng)絡(luò)中各分支向量的新權(quán)值，具體步驟如下：

（1）假設(shè)預(yù)處理后初始時(shí)間特征輸入集為S'，利用斯皮爾曼系數(shù)法計(jì)算集合中各相關(guān)時(shí)間特征向量與目標(biāo)向量之間的相關(guān)性系數(shù)；

（2）假設(shè)相關(guān)性系數(shù)分布在{i,j}，結(jié)合相關(guān)性系數(shù)分布規(guī)律及相關(guān)性強(qiáng)弱系數(shù)劃分標(biāo)準(zhǔn)（0.8-1.0 表示極強(qiáng)相關(guān)，0.6-0.8表示強(qiáng)相關(guān)，0.4-0.6表示中等程度相關(guān)），將預(yù)處理后的時(shí)間相關(guān)性輸入向量重新構(gòu)造成三個(gè)子樣本集

（7）通過對(duì)所有子模型分支向量的權(quán)重進(jìn)行加權(quán)，最終得到組合后BP神經(jīng)網(wǎng)絡(luò)

1.3.3 網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)置。Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)的超參數(shù)設(shè)置，決定了預(yù)測(cè)網(wǎng)絡(luò)的性能和效率。根據(jù)數(shù)據(jù)維數(shù)，確定輸入層神經(jīng)元節(jié)點(diǎn)數(shù)量n，由預(yù)測(cè)的目標(biāo)貨物運(yùn)輸量確定輸出層神經(jīng)元節(jié)點(diǎn)數(shù)量m。按照如下步驟選擇每個(gè)Bagging+BP 貨物運(yùn)輸量訓(xùn)練模型的隱含層神經(jīng)元的節(jié)點(diǎn)數(shù)：

（2）通過列舉法對(duì)比分析在不同隱含層神經(jīng)元節(jié)點(diǎn)數(shù)下的網(wǎng)絡(luò)模型訓(xùn)練效果，即比較損失函數(shù)（softmax交叉熵）值大??；

（3）從步驟（2）所列出的節(jié)點(diǎn)數(shù)中選擇損失函數(shù)值最小時(shí)對(duì)應(yīng)的節(jié)點(diǎn)數(shù)，作為各個(gè)貨物運(yùn)輸量學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練模型的隱含層神經(jīng)元節(jié)點(diǎn)數(shù)。

2 實(shí)驗(yàn)分析

2.1 數(shù)據(jù)描述

本文模型驗(yàn)證所有數(shù)據(jù)均由南京市龍?zhí)陡厶峁?，所提供?shù)據(jù)的時(shí)間段為2010 年-2019 年（數(shù)據(jù)間隔為月），包括本港集裝箱數(shù)量、中轉(zhuǎn)集裝箱數(shù)量及本港總計(jì)集裝箱數(shù)量三種數(shù)據(jù)類型，數(shù)據(jù)總計(jì)120個(gè)月。在實(shí)驗(yàn)中，本文對(duì)龍?zhí)陡鄣募b箱總量（中轉(zhuǎn)箱與本港箱的總量）進(jìn)行預(yù)測(cè)，并采用中折交叉驗(yàn)證法對(duì)模型的精性能進(jìn)行驗(yàn)證（即將80%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)，20%的數(shù)據(jù)作為測(cè)試數(shù)據(jù)）。

2.2 模型評(píng)估指標(biāo)

在上述三種方法中，各個(gè)模型都具有自己的優(yōu)勢(shì)，為了能夠較好地評(píng)價(jià)三種多式聯(lián)運(yùn)貨物運(yùn)輸量預(yù)測(cè)模型的優(yōu)劣性，本文采用均方根誤差（MAP）與平均相對(duì)百分誤差法（MAPE）刻畫預(yù)測(cè)貨物運(yùn)輸量與實(shí)際貨物運(yùn)輸量間的擬合程度，即計(jì)算預(yù)測(cè)誤差，見式（3）與式（4）。

其中，N表示測(cè)試集樣本個(gè)數(shù)，Qi表示測(cè)試集第i個(gè)實(shí)際貨運(yùn)流量值，則表示測(cè)試集第i個(gè)模型預(yù)測(cè)貨物運(yùn)輸量值。

2.3 模型對(duì)比分析

為了更好地驗(yàn)證Bagging+BP貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)的優(yōu)越性，本文分別選取ARIMA、LSTM 神經(jīng)網(wǎng)絡(luò)、Bagging+BP 學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn)對(duì)比分析。在實(shí)驗(yàn)過程中，為了更好的對(duì)模型進(jìn)行客觀分析，需要三個(gè)模型的數(shù)據(jù)集樣本量、超參數(shù)保持一致。最優(yōu)參數(shù)設(shè)置下，測(cè)試集中三個(gè)模型的實(shí)驗(yàn)結(jié)果如圖3所示，具體預(yù)測(cè)評(píng)價(jià)指標(biāo)見表1。

圖3 多網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果

表1 ARIMA、Bagging+BP、LSTM預(yù)測(cè)結(jié)果分析

從表1 和圖3 可以看出，相比于ARIMA 和LSTM模型，Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)的性能是最佳的。由于龍?zhí)陡厶峁┑亩嗍铰?lián)運(yùn)貨物運(yùn)輸量數(shù)據(jù)體量較少，數(shù)據(jù)類型較為單一，LSTM 模型本身參數(shù)結(jié)構(gòu)復(fù)雜且較為敏感，最終導(dǎo)致長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型過度擬合、預(yù)測(cè)效果較差。另外，由于近幾年來龍?zhí)陡郯l(fā)展較快，導(dǎo)致貨物運(yùn)輸量數(shù)據(jù)非線性強(qiáng)，使得ARIMA模型預(yù)測(cè)效果較差。因此，在貨物運(yùn)輸量非線性、時(shí)變性強(qiáng)、數(shù)據(jù)多樣性缺失以及模型穩(wěn)定性差等問題中，Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)模型能夠有效提高預(yù)測(cè)的準(zhǔn)確性。同時(shí)從RMS 模型評(píng)判指標(biāo)可以看出，Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)的穩(wěn)定性相比其他兩個(gè)模型（ARIMA和LSTM）更高，說明通過集成學(xué)習(xí)可以減少數(shù)據(jù)量少帶來的過度擬合問題。

綜上，Bagging+BP 貨物運(yùn)輸量預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)在長(zhǎng)時(shí)間序列的貨物運(yùn)輸量預(yù)測(cè)時(shí)具有優(yōu)秀的表現(xiàn)力，且相比多參數(shù)動(dòng)態(tài)模型更適用于數(shù)據(jù)量少的預(yù)測(cè)場(chǎng)景。

3 結(jié)語

基于港口貨物運(yùn)輸量的時(shí)間變化特征，構(gòu)建了一種基于集成學(xué)習(xí)的Bagging+BP貨物運(yùn)輸量預(yù)測(cè)模型，解決了傳統(tǒng)線性模型和單一神經(jīng)網(wǎng)絡(luò)模型不能在數(shù)據(jù)集較少、非線性強(qiáng)等問題中保持較高的模型性能的問題。以龍?zhí)陡蹫槔瑢?shí)驗(yàn)表明：Bagging+BP模型在貨物運(yùn)輸量預(yù)測(cè)中的準(zhǔn)確性高，在貨運(yùn)量預(yù)測(cè)領(lǐng)域中的適用性更強(qiáng)。在目前研究工作的基礎(chǔ)上，后續(xù)研究可進(jìn)一步擴(kuò)展模型的隱藏層層數(shù)和增加空間特征，建立更有效的多式聯(lián)運(yùn)貨物運(yùn)輸量預(yù)測(cè)模型，并運(yùn)用到不同地區(qū)、不同港口的各種貨物運(yùn)輸量預(yù)測(cè)中。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡