摘要:準確、有效的交通流預測為智能交通系統(tǒng)提供數(shù)據(jù)基礎(chǔ),是實現(xiàn)道路交通狀況預測和交通管控的重要技術(shù)之一。本文提出一種基于時空特性的經(jīng)驗模態(tài)分解(EMD)和長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)相結(jié)合的交通流預測模型。首先,對交通流序列進行EMD分解得到具有不同時間尺度的本征模態(tài)分量,然后,結(jié)合空間特性采用LSTM神經(jīng)網(wǎng)絡(luò)對交通流進行預測。通過仿真實驗可得:與傳統(tǒng)的LSTM神經(jīng)網(wǎng)絡(luò)相比,基于時空特性的EMD-LSTM預測模型的均方根誤差分別減少了3.81;平均絕對誤差分別減少了2.29。
關(guān)鍵詞:短時交通流預測;經(jīng)驗模態(tài)分解;時空特性;長短期記憶單元
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2020)18-0012-03
開放科學(資源服務(wù))標識碼(OSID):
隨著人工智能技術(shù)的發(fā)展,新一代智能交通系統(tǒng)提出了更加自主高效、安全智能的道路交通管理體系,短時交通流的預測就是其重要的研究方向之一[1]。準確、有效的道路短時交通流預測不僅能為新一代智能交通系統(tǒng)提供數(shù)據(jù)基礎(chǔ),還能夠幫助人們規(guī)劃出行路線,緩解交通壓力帶來的道路擁堵等問題。目前,國內(nèi)外學者對于短時交通流預測的研究主要分為四種預測模型,即基于統(tǒng)計分析的預測模型、非線性理論模型、智能預測模型和混合預測模型[2]。
第一類,基于統(tǒng)計分析的預測模型主要包括時間序列法、卡爾曼濾波分析法等。S.Vasantha Kumar和Lelitha Vanajakshi[3]提出一種改進的自回歸積分移動平均模型(Auto-Regressive In-tegrated Moving Average,ARIMA)根據(jù)不同季節(jié)的數(shù)據(jù)差異進行交通流預測,但是單一的ARIMA方法在處理非線性交通流數(shù)據(jù)時具有局限性。柳立春等學者[4]提出的卡爾曼濾波模型應(yīng)用于交通流預測取得了顯著效果,但缺點是只適用于實時數(shù)據(jù)預測。
第二類,非線性理論模型主要依據(jù)交通流數(shù)據(jù)非線性的特點進行預測研究,常用的非線性理論模型有混沌理論模型等。Attoor Sanju Nair等學者啪驗證了交通參數(shù)的混沌特性,將混沌理論引入了交通流預測的模型中。廖榮華、蘭時勇、劉正熙等學者[6]通過改進混沌時間序列局域法,分析預測了北京市的交通數(shù)據(jù),最終驗證了改進后的方法預測更加準確。
第三類,智能預測模型主要利用機器學習算法對道路交通流量進行預測。Osama Mohammed和Jalil Kianfar[7]通過比較深度神經(jīng)網(wǎng)絡(luò)、分布式隨機森林、梯度提升機、廣義線性模型四種算法對短時交通流的預測效果,得出深度神經(jīng)網(wǎng)絡(luò)預測效果更佳。晏臻,于重重,韓璐等[8]提出基于時空特性的CNN-LSTM模型預測交通流,CNN(Convolutional Neural Network.CNN)挖掘數(shù)據(jù)的空間相關(guān)性,LSTM挖掘數(shù)據(jù)的時序特性,驗證了考慮時空特性方法的有效性。
本文提出一種基于時空特性的經(jīng)驗模態(tài)分解和長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)合的混合模型對交通流進行預測,并驗證其預測效果。
1 基本原理
1.1 經(jīng)驗模態(tài)分解
經(jīng)驗模態(tài)分解( Empuical Mode Decomposition,EMD)[9]是一種自適應(yīng)的數(shù)據(jù)挖掘、時頻信號處理方法。該方法的主要思想是根據(jù)被分解信號自身的時間尺度特性進行信號分解和處理,最終將原始信號分解成若干個本征模函數(shù)(Intrinsic ModeFunction,IMF)和一個具有信號平均趨勢的殘余項。因此,理論上EMD算法適用于任何信號的分解,尤其在分解和處理非線性、非平穩(wěn)的信號時,比傳統(tǒng)的小波分解和傅里葉分解表現(xiàn)出明顯的優(yōu)勢。EMD算法的具體實現(xiàn)步驟如下:
(1)找到原始信號序列x(t)所有的局部極大值點和極小值點。根據(jù)三次樣條插值方法將所有的極大值點擬合成上包絡(luò)線U(t),所有的極小值點擬合成下包絡(luò)線/(t),并計算出上、下包絡(luò)線的平均值,用m,,表示:
m11=1/2[U(f)+L(f)]
(1)
將原始信號與均值包絡(luò)相減得到第一步分解的新信號,并用h11表示:
h1=x(t)一m1(t)(2)
(2)若h11(t)滿足平均包絡(luò)值為零、并且極值和零值的數(shù)量相差0或1,則h11(t)為一級IMF分量。否則,對h11(t)重復進行第(1)步運算,直至第k次分解之后的信號h1k (t)滿足成為IMF分量的條件。一級IMF分量可以記作c1(t)
1.2 LSTM神經(jīng)網(wǎng)絡(luò)
長短期記憶( Long Shofi-Term Memory,LSTM)結(jié)構(gòu)在原有的輸入門和輸出門的基礎(chǔ)上增加了遺忘門以后,使LSTM能很好地解決“梯度消失”和“梯度爆炸”[10]問題。LSTM不僅對輸人數(shù)據(jù)具有記憶性,而且學習當前網(wǎng)絡(luò)結(jié)構(gòu)的權(quán)重,對于長時間序列的處理具有較大的優(yōu)勢,被廣泛應(yīng)用于自然語言處理、。
如圖1所示,是一個LSTM網(wǎng)絡(luò)的展開結(jié)構(gòu)。由于LSTM結(jié)構(gòu)具有“記憶”,當前t時刻的單元狀態(tài)ct由t時刻的輸入xt和t一1時刻的單元狀態(tài)ct-1共同決定。ht是t時刻的隱藏層輸出。LSTM結(jié)構(gòu)由多個“記憶模塊”(memory cell)組成,每個cell包含三個門:輸入門、遺忘門和輸出門。遺忘門:這部分是決定從cell中遺棄哪部分信息。該門會讀取ht-1,和xt,使用sigmoid函數(shù)輸出一個在0到1之間的數(shù)值給每個在cell的上一時刻狀態(tài)ct-1。其中1表示“完全保留”,0表示“完全舍棄”。輸入門:這部分決定輸入多少信息加入cell中來。實現(xiàn)這部分需要兩步:第一步,“input gate layer”的sigmoid函數(shù)決定哪些信息需要更新;用tanh函數(shù)生成一個更新的內(nèi)容c,。第二步,對cell的狀態(tài)進行更新,將ct-1更新為ct。舊的單元狀態(tài)與ft相乘,再和i*ct相加,構(gòu)成新的候選值。候選值隨著每個狀態(tài)的更新程度而變化。輸出門:這部分運用一個sigmoid函數(shù)來決定cell中被輸出的信息。然后,把單元狀態(tài)通過tanh進行處理,得到一個在一1到1之間的值,再乘以sigmoid的輸出,決定最終輸出的那部分信息。公式7-12反映了“記憶模塊”內(nèi)部的算法流程。
1.3 基于時空特性的短時交通流預測模型
結(jié)合EMD算法對非線性、非平穩(wěn)時序信號分解處理的優(yōu)勢和LSTM神經(jīng)網(wǎng)絡(luò)對長時間序列學習和預測的優(yōu)勢,提出了基于時空相關(guān)性的EMD-LSTM模型對交通流數(shù)據(jù)進行預測。該算法既體現(xiàn)了單個檢測點交通流數(shù)據(jù)在時序上受自身歷史數(shù)據(jù)特性影響的時間相關(guān)性,又體現(xiàn)了不同檢測點之間交通流數(shù)據(jù)在空間上受道路上下游地理位置影響的空間相關(guān)性。
基于時空特性的EMD-LSTM算法原理如圖2所示,該算法先對多個檢測器的原始信號分別進行EMD方法分解,將不同檢測器的同一級IMF分量組合成新向量,該組合向量同時具有時間尺度和空間特性。將組合向量輸入到LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進行訓練,通過調(diào)整參數(shù)得出最佳訓練網(wǎng)絡(luò)結(jié)構(gòu)。然后對每一個組合向量進行預測,最終得到某一未來時間段內(nèi)不同檢測器同一級IMF分量的預測結(jié)果。再分別將同一檢測器的每級IMF分量相加,即可得到所有檢測器未來時間段內(nèi)的交通流預測結(jié)果。
2 仿真實驗
2.1 數(shù)據(jù)來源
本文以美國加利福尼亞運輸部的性能測量系統(tǒng)( Caltrans-Performance Measurement System,PeMs)數(shù)據(jù)庫的交通流作為數(shù)據(jù)來源。選取2018年6月1日到2018年6月30日標號為110-E的高速公路上9個連續(xù)檢測器(編號依次為VDS717367、VDS717369、VDS717373、VDS717376、VDS717379、VDS717381、VDS717383、VDS717387、VDS718130)的交通流量數(shù)據(jù)作為交通流預測研究的數(shù)據(jù)集。抽樣時間間隔為5min,共約77,760條連續(xù)性數(shù)。對30天的數(shù)據(jù)進行仿真實驗,取前18天的交通流數(shù)據(jù)作為訓練數(shù)據(jù),中間6天的交通流數(shù)據(jù)作為驗證數(shù)據(jù),后面6天的數(shù)據(jù)作為測試數(shù)據(jù)。
2.2 實驗環(huán)境
仿真實驗使用的軟硬件平臺如下表所示:
2.3 算法評價指標
為了客觀比較不同算法的準確性,本文采用均方根誤差( Root Mean Squared Error.RMSE)和平均絕對誤差(Mean Abso-lute Error.MAE)兩個指標來評價算法預測性能的優(yōu)劣。兩者數(shù)值越小說明預測誤差越小,算法的準確性越高。
3 結(jié)果分析
LSTM神經(jīng)網(wǎng)絡(luò)對第5個檢測器(編號:VDS717379)的交通流數(shù)據(jù)進行預測:網(wǎng)絡(luò)層數(shù)為1,隱含層的單元數(shù)為100,輸出層的單元數(shù)為l,三維輸入,對交通流的三個參數(shù)同時進行預測,初始學習速率為0.001,激活函數(shù)為relu、線性函數(shù)為linear,優(yōu)化算法為Adam,迭代次數(shù)為200。
經(jīng)過仿真實驗得到LSTM算法誤差性能指標值分別為:RMSE=21.568,MAE=15.678。交通流數(shù)據(jù)預測值與真實值的對比效果圖如圖3所示,圖中預測值曲線與實際值曲線的擬合效果較差,部分預測值比實際值偏大,局部極值點的預測偏差較大。
EMD分解得到8個IMF分量,所以,時空EMD-LSTM模型需要8個單層神經(jīng)網(wǎng)絡(luò);隱含層單元個數(shù)分別為[70,100,60,200,50,30,30,70],L2正則化方法的系數(shù)大小分別為[0.0001,0.00001,0.0,0.0,0.0,0.0001,0.0001,0.0001],輸出層的單元數(shù)為1,初始學習速率為0.001,激活函數(shù)為relu、線性函數(shù)為linear,優(yōu)化算法為Adam,迭代次數(shù)為200。為了提高訓練效率,設(shè)置了提前停止。經(jīng)過仿真實驗得到基于時空特性的EMD-LSTM模型預測9個檢測器數(shù)據(jù)的誤差指標如表2所示:
其中第5個檢測器(編號:VDS717379)的誤差指標為:RMSE=17.758.MAE=13.388,比LSTM算法分別減小了3.81和2.29。交通流數(shù)據(jù)預測值與真實值的對比效果圖如圖4所示。與圖3相比,圖4中預測曲線與實際曲線的擬合效果明顯得到了改善,局部極值點處的擬合效果更好,部分波動劇烈極值點的預測效果更好。
綜上所述,基于時空特性的EMD-LSTM模型能同時預測多個檢測器的交通流數(shù)據(jù),并且預測效果優(yōu)于傳統(tǒng)的LSTM算法。
4 結(jié)束語
本文提出的基于時空特性的EMD-LSTM組合模型對短時交通流具有良好的預測效果。與傳統(tǒng)的LSTM算法相比,誤差性能指標RMSE減少了3.81,MAE減少了2.29;并且該模型能同時預測多個檢測器的交通流數(shù)據(jù)。
參考文獻:
[1] Javed M A,Zeadally S,Hamida E B.Data analytics for coopera-tive intelligent transport systems[J].Vehicular Communications.2019.15:63-72.
[2]趙宏.翟冬梅,石朝輝.短時交通流預測模型綜述[J].都市快軌交通,2019,32(4):50-54.
[3] Kumar S V,Vanajakshi L.Short-term traffic flow prediction us-ing seasonal ARIMA model with limited input data[J].Europe-an Transport Research Review. 2015,7(3):21.
[4]柳立春.基于卡爾曼濾波的長江武漢大橋段交通流預報[D].大連:大連海事大學,2018.
[5] Nair A S,Liu J C,Rilett L.et aI.Non-linear analysis of trafficflow[C]//ITSC.lEEE Intelligent Transportation Systems.Proceed-ings (Cat. No. OITH8585), Oakland. CA. USA. IEEE. 2001:681-685.
[6]廖榮華,蘭時勇,劉正熙.基于混沌時間序列局域法的短時交通流預測[J].計算機技術(shù)與發(fā)展,2015,25(1):1-5.
[7] Mohammed O.Kianfar J.A machine learning approach to short-term traffic flow prediction:a case study of interstate 64 in Mis-souri[C]//2018 IEEE International Smart Cities Conference(lSC2),September 16-19. 2018. Kansas City, MO, USA. lEEE,2018: 1-25。
[8]晏臻,于重重,韓璐,等.基于CNN+LSTM的短時交通流量預測方法[J].計算機工程與設(shè)計,2019,40(9):2620-2624,2659.
[9]關(guān)瑩瑩.基于深度學習的ITS短時交通流量預測算法研究[D].哈爾濱:哈爾濱工業(yè)大學,2019.
[10]楊祎玥,伏潛,萬定生.基于深度循環(huán)神經(jīng)網(wǎng)絡(luò)的時間序列預測模型[J].計算機技術(shù)與發(fā)展,2017,27(3):35-38,43.
【通聯(lián)編輯:光文玲】
基金項目:河北省高等學??茖W技術(shù)研究重點項目( No.ZD2019010)
作者簡介:高小婷(1992-),女,碩士研究生,主要研究方向為智能信息處理。