劉苗苗 蔣艷
摘? 要:精確的港口貨物吞吐量預(yù)測對于港口的發(fā)展至關(guān)重要。本文提出了改進粒子群優(yōu)化去尾均值多層感知機模型對上海港貨物吞吐量進行預(yù)測。選取了影響上海港貨物吞吐量的十個因素進行訓(xùn)練,實驗結(jié)果表明該預(yù)測模型的預(yù)測性能明顯優(yōu)于傳統(tǒng)MLP預(yù)測模型和基本的粒子群優(yōu)化多層感知機模型。對該預(yù)測模型的誤差分析和收斂性分析表明該預(yù)測模型可靠。
關(guān)鍵詞:粒子群算法;去尾均值;多層感知機;港口吞吐量預(yù)測
中圖分類號:TP183? ? ?文獻標(biāo)識碼:A
Abstract: Accurate port cargo throughput forecast is vital to port development. This paper proposes an improved particle swarm optimization model of multilayer perceptron (MLP) with trimmed mean to predict the cargo throughput of Shanghai Port. Ten factors that affect cargo throughput of Shanghai Port are selected for training. The experimental results show that prediction performance of the proposed prediction model is significantly better than traditional MLP prediction model and basic particle swarm optimization multi-layer perceptron model. Error and convergence analyses of the prediction model show that the prediction model is reliable.
Keywords: particle swarm algorithm; trimmed mean; multilayer perceptron; port throughput forecast
1? ?引言(Introduction)
隨著“21世紀(jì)海上絲綢之路”戰(zhàn)略的實施,對港口的管理提出了更高的要求:準(zhǔn)確地預(yù)測港口貨物吞吐量,為港口調(diào)度提供依據(jù),避免港口出現(xiàn)貨物船舶的滯留,縮短交貨周期,提高客戶滿意度,使港口運營更高效。因此,準(zhǔn)確地預(yù)測港口貨物吞吐量對港口發(fā)展至關(guān)重要。
目前,在港口貨物吞吐量預(yù)測方面,陳昌源等[1]通過優(yōu)化灰色分析法對上海港集裝箱吞吐量進行了預(yù)測;黃榮富等[2]通過建立三次指數(shù)平滑法對港口吞吐量進行了預(yù)測;高嵩等[3,4]分別結(jié)合不同預(yù)測模型,建立組合預(yù)測模型并分別應(yīng)用于天津港和寧波港的吞吐量預(yù)測;李廣儒等[5]將Elman神經(jīng)網(wǎng)絡(luò)應(yīng)用于寧波舟山港的貨物吞吐量預(yù)測;胡克滿等[6]運用灰色模型理論選取部分已知信息計算未知信息,結(jié)合人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)對模型進行優(yōu)化,給出了基于灰色神經(jīng)網(wǎng)絡(luò)的港口貨物吞吐量預(yù)測算法。
2? 吞吐量影響因素分析(Analysis of influencing factors of port throughput)
由于港口吞吐量受到政治、經(jīng)濟、文化、社會等因素的影響,各種因素相互作用導(dǎo)致上海港貨物吞吐量在時間維度上呈現(xiàn)非線性變化的特點,而人工神經(jīng)網(wǎng)絡(luò)能夠擬合非線性映射,具有較強的自適應(yīng)和自學(xué)習(xí)能力。但是人工神經(jīng)網(wǎng)絡(luò)存在一些不足之處,它的初始權(quán)值和閾值都是隨機生成的,并且在訓(xùn)練過程中容易陷入局部極小值,而用粒子群算法進行訓(xùn)練能夠很好地解決人工神經(jīng)網(wǎng)絡(luò)存在的這些問題。此外,人工神經(jīng)網(wǎng)絡(luò)模型的功能往往依賴于網(wǎng)絡(luò)權(quán)重的組合相加,容易受到離群值的負面影響[7],因此,本文采用一種改進粒子群(IPSO)優(yōu)化的去尾均值多層感知機模型(Tr-MLP)對上海港的貨物吞吐量進行預(yù)測研究。
本文的創(chuàng)新點在于在多層感知機模型中增加了去尾均值,減少離群值的負面影響,并且使用IPSO模型訓(xùn)練,使收斂速度更快,預(yù)測精度更高。
3? ?IPSO(Improved particle swarm optimization)
3.1? ?粒子群優(yōu)化算法(PSO)模型
粒子群優(yōu)化算法是通過模擬鳥群覓食行為而發(fā)展起來的一種基于群體協(xié)作的隨機搜索算法。該算法中每個粒子都可以看作搜索空間中的最優(yōu)解,在移動與飛行的過程中,利用適應(yīng)度函數(shù)求得適應(yīng)度值,用適應(yīng)度值評價當(dāng)前解的優(yōu)劣。每個粒子由位置、速度和適應(yīng)度值三項特征值進行表示。PSO初始化為一群隨機粒子(隨機解),然后通過迭代找到最優(yōu)解,在每一次迭代中,粒子通過跟蹤兩個“極值”來更新自己。第一個就是粒子本身所找到的最優(yōu)解,這個解叫作個體極值;另一個極值是整個種群找到的最優(yōu)解,這個極值是全局極值。不斷調(diào)整飛行的速度和位置,以搜索到全局最優(yōu)值。速度和位置更新公式如下[8]:
其中,m=1,2,…,M;j=1,2,…,N;vjm為第j個粒子在第m維的飛行速度;xjm為粒子的位置;和為非負的常數(shù),稱為加速度因子;為介于[0,1]的隨機變量;為個體粒子經(jīng)歷的自身最優(yōu)位置;為種群粒子集合中各個粒子進行比較后所經(jīng)歷的全局最優(yōu)位置。
3.2? ?改進PSO
基礎(chǔ)的PSO模型中,固定的慣性權(quán)重會減弱全局尋優(yōu)能力和減慢收斂速度,因此提出利用非線性變化慣性權(quán)重來提高PSO的性能。將進行如下優(yōu)化:
其中,和為的最大值和最小值,為當(dāng)前迭代值,為最大迭代次數(shù)。當(dāng)較小時,趨向,減小的速度較慢,以保證算法的全局搜索能力。隨著迭代次數(shù)的增加,迅速非線性遞減,以保證算法的局部搜索能力,因此改進的算法可以靈活調(diào)整全局搜索能力和局部搜索能力[9]。
4? ?去尾均值多層感知機模型(Tr-MLP model)
多層感知機模型(MLP)是一種人工神經(jīng)網(wǎng)絡(luò),它的一個重要特點就是有多個神經(jīng)元層,我們將第一層稱為輸入層,最后一層稱為輸出層,中間層稱為隱藏層。MLP模型如圖1所示,本文只涉及了一個隱藏層,輸入層有三個變量[x1,x2,x3]和一個偏置變量b,輸出層有三個神經(jīng)。
假設(shè)第一層為輸入層,輸入的信息為[x1,x2,x3]。對于層L,用L1表示該層的所有神經(jīng)元,其輸出為yl,其中第j個節(jié)點的輸出為yl(j),該節(jié)點的輸入為ul(j),連接第L層與第(L1)層的權(quán)重矩陣為,上一層(第L1層)的第i個節(jié)點到第L層第j個節(jié)點的權(quán)重為。
單個神經(jīng)元計算如下:
其中,xj表示輸入數(shù)據(jù),wkj表示連接權(quán)值,bk為閾值,f(x)為激活函數(shù),通常取sigmoid函數(shù)。
由以上兩個公式可知,神經(jīng)元的輸出結(jié)果受輸入數(shù)據(jù)線性權(quán)重相加的影響,因此,當(dāng)數(shù)據(jù)存在異常值的時候,對結(jié)果影響較大,根據(jù)文獻[7],將去尾均值的概念引入MLP,vk公式改寫如下:
5? ?實證研究(Empirical research)
5.1? ?關(guān)鍵因素選取
本人分析已有文獻對沿海港口貨物吞吐量影響因素的研究,以及利用SPSS相關(guān)分析工具對眾多影響因素與上海港貨物吞吐量進行相關(guān)性分析,選出了影響最大的前十個影響因素:國內(nèi)生產(chǎn)總值、第一產(chǎn)業(yè)增加值、第二產(chǎn)業(yè)增加值、第三產(chǎn)業(yè)增加值、年末總?cè)丝凇⒇浳镞\輸量、上海港口碼頭長度、上海港口泊位數(shù)、上海港口生產(chǎn)用萬噸級泊位數(shù)、社會商品零售總額。數(shù)據(jù)來源于國家統(tǒng)計局《中國統(tǒng)計年鑒》年度數(shù)據(jù)[10],如表1所示。
5.2? ?基于IPSO-Tr-MLP模型的上海港吞吐量預(yù)測
本文選取2000—2018年的前十個影響因素統(tǒng)計值作為多層感知機的輸入,將2000—2018年上海港貨物吞吐量作為輸出,分別利用傳統(tǒng)的多層感知機(MLP)、PSO-Tr-MLP模型和IPSO-Tr-MLP模型對其進行訓(xùn)練擬合。多層感知機的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置為:輸入層10個神經(jīng)元、隱藏層40個神經(jīng)元、輸出層1個神經(jīng)元,輸入權(quán)重學(xué)習(xí)率lrHL取0.1,輸出權(quán)重學(xué)習(xí)率lrOL取0.001,動力因子a取0.3,最大迭代次數(shù)取1,000 次。粒子群算法(PSO)參數(shù)設(shè)置為:群體粒子個數(shù)N為100,最大迭代次數(shù)Max_iteration取1,000 次,學(xué)習(xí)因子c1與學(xué)習(xí)因子c2均取1.5,慣性權(quán)重最大值wmax取0.8,慣性權(quán)重最小值wmin取0.4,位置最大值Xmax取5,位置最小值Xmin取-5,速度最大值vmax取1,速度最小值vmin取-1。使用matlab仿真實現(xiàn)傳統(tǒng)的多層感知機(MLP)訓(xùn)練、基于PSO訓(xùn)練的去尾均值多層感知機(Tr-MLP)模型和基于IPSO訓(xùn)練的Tr-MLP模型的上海港吞吐量預(yù)測結(jié)果如表2所示,預(yù)測效果如圖3所示。
6? ?結(jié)果分析(Result analysis)
6.1? ?誤差分析
誤差分析是通過分析預(yù)測模型的預(yù)測結(jié)果與實際值的貼近程度,進而反映出預(yù)測值與實際值之間存在的映射關(guān)系,是評價一個預(yù)測模型預(yù)測效果優(yōu)劣的重要指標(biāo)之一。其中,(代表預(yù)測值,T代表實際值)。根據(jù)表2獲得預(yù)測結(jié)果,分別對三個模型的相對誤差進行分析,得到如圖4所示的相對誤差分布圖。
通過圖4可以看出,三個模型的相對誤差分布圍繞error=0上下波動,通過計算兩個模型的平均絕對誤差(MAE)發(fā)現(xiàn),MLP模型的預(yù)測MAE為0.273889,PSO-Tr-MLP模型的預(yù)測MAE為0.1465,IPSO-Tr-MLP模型的預(yù)測MAE為0.109626,如表3所示。
6.2? ?收斂性分析
基于MLP的預(yù)測模型除了需要保證模型的預(yù)測精度,作為被廣泛應(yīng)用的神經(jīng)網(wǎng)絡(luò)模型之一,收斂性是衡量神經(jīng)網(wǎng)絡(luò)性能的重要指標(biāo)之一。由于MSE可以評價數(shù)據(jù)的變化程度,MSE的值越小,說明預(yù)測模型描述實驗數(shù)據(jù)具有更好的精確度,因此本文選取MSE作為收斂性分析目標(biāo),得到了兩個預(yù)測模型的MSE值隨迭代次數(shù)變化的收斂曲線圖,如圖5所示的MLP模型收斂曲線圖和如圖6所示的PSO-Tr-MLP模型收斂曲線圖,以及如圖7所示的IPSO-Tr-MLP模型收斂曲線圖。
顯然,圖5中MLP預(yù)測值的MSE值隨著迭代次數(shù)的增加總體趨勢是下降的,最終趨向0;而圖6和圖7的模型隨著迭代次數(shù)的增加,MSE值迅速收斂到一個極小值。經(jīng)過比較可以看出,IPOS-Tr-MLP模型得到更小的MSE值且更加快速地收斂到最小值,這證明改進的模型具有更好的全局搜索能力和更快的收斂速度。
7? ?結(jié)論(Conclusion)
為了解決港口貨物吞吐量預(yù)測過程中非線性問題,以及在訓(xùn)練過程中容易陷入局部最小值的問題,本文的創(chuàng)新點在于在多層感知機模型中增加了去尾均值,減少離群值的負面影響,并且用改進的粒子群算法進行訓(xùn)練,使用動態(tài)變化的慣性權(quán)重、IPSO算法取代MLP的初始尋優(yōu)過程,有效提高了收斂速度和預(yù)測精度;使用去尾均值多層感知機模型(Tr-MLP)有效避免了離群值的影響。通過對上海港貨物吞吐量的預(yù)測結(jié)果進行分析,表明該預(yù)測模型的預(yù)測性能明顯優(yōu)于傳統(tǒng)MLP預(yù)測模型和基本的粒子群優(yōu)化多層感知機模型,對該預(yù)測模型的誤差分析和收斂性分析表明該預(yù)測模型可靠。
參考文獻(References)
[1] 陳昌源,戴冉,楊婷婷,等.基于改進GM(1,1)模型的上海港集裝箱吞吐量預(yù)測[J].船海工程,2016,45(4):153-156.
[2] 黃榮富,綦化樂,蔡軍.三次指數(shù)平滑法在港口吞吐量預(yù)測中的應(yīng)用研究[J].水運工程,2007(6):38-40.
[3] 高嵩,肖青.基于組合模型的天津港吞吐量預(yù)測[J].水運工程,2011(4):54-57.
[4] 施澤軍,李凱.基于灰色模型和指數(shù)平滑法的集裝箱吞吐量預(yù)測[J].重慶交通大學(xué)學(xué)報(自然科學(xué)版),2008,27(2):302-304.
[5] 李廣儒,朱慶輝.基于Elman神經(jīng)網(wǎng)絡(luò)的港口貨物吞吐量預(yù)測[J].重慶交通大學(xué)學(xué)報(自然科學(xué)版),2020,39(06):8-12.
[6] 胡克滿,蔣勇,王順林,等.基于灰色神經(jīng)網(wǎng)絡(luò)的港口貨物吞吐量預(yù)測算法[J].物流技術(shù),2018,37(02):68-72.
[7] Yolcu U, Bas E, Egrioglu E, et al. A New Multilayer Feedforward Network Based on Trimmed Mean Neuron Model[J]. Neural Network World, 2015, 25(6):587-602.
[8] 王榮,白尚旺,黨偉超,等.粒子群退火算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J].計算機系統(tǒng)應(yīng)用,2020,29(01):244-249.
[9] 李萬,馮芬玲,蔣琦瑋.改進粒子群算法優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)的鐵路客運量預(yù)測[J].鐵道科學(xué)與工程學(xué)報,2018,15(12):3274-3280.
[10] 國家統(tǒng)計局.中國統(tǒng)計年鑒[DB/OL].[2000-2018].http://www.stats.gov.cn/tjsj/ndsj.
作者簡介:
劉苗苗(1993-),女,碩士,研究領(lǐng)域:決策分析.
蔣? ?艷(1974-),女,博士,副教授.研究領(lǐng)域:多目標(biāo)決策.