賈現(xiàn)廣 馮超琴 蘇治文 錢正富 宋騰飛 劉歡 呂英英
doi:10.11835/j.issn.1000.582X.2023.09.013
收稿日期:2022-11-09
網(wǎng)絡出版日期:2023-07-06
基金項目:國家自然科學基金資助項目?(71961012)。
Foundation:Supported by National Natural Science Foundation of China(71961012).
作者簡介:賈現(xiàn)廣(1997—),男,副教授,主要從事智能交通與大數(shù)據(jù)方向研究,(E-mail)jxg@kust.edu.cn。
通信作者:呂英英,女,主要從事智能交通與大數(shù)據(jù)方向研究,(E-mail)20070102@kust.edu.cn。
摘要:為提升交通流預測精度,深層次地挖掘交通流數(shù)據(jù)的時空特征,提出一種基于雙向長短時記憶網(wǎng)絡(Bi-LSTM)的城市交通網(wǎng)格集群流量預測模型。將所獲得的網(wǎng)約車軌跡數(shù)據(jù)集網(wǎng)格化;考慮人為確定集群個數(shù)對結果的影響,用貝葉斯信息準則進行參數(shù)估計確定集群數(shù),利用高斯混合模型對交通狀況相似的網(wǎng)格進行聚類得到不同交通網(wǎng)格集群;利用集群內(nèi)部交通網(wǎng)格的輸入時間序列的相互影響設計多對多模型,構建Bi-LSTM模型預測不相交集群上的流量;以經(jīng)典多元線性回歸模型(MLRA)作為對照組進行實驗驗證,采用平均絕對誤差(MAE)、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和動態(tài)時間規(guī)整(DTW)這四類評價指標對預測結果進行綜合評價,驗證基于Bi-LSTM模型的城市交通網(wǎng)格集群流量預測的可行性。實驗結果表明:MLRA模型和Bi-LSTM模型對城市交通網(wǎng)格集群流量的預測值小于真實值,早高峰時段尤為明顯;各交通網(wǎng)格集群的交通狀態(tài)態(tài)勢相似,集群的簇內(nèi)相關性較強,兩類模型均可實現(xiàn)較好的流量預測效果,Bi-LSTM表現(xiàn)更優(yōu);?MLRA和Bi-LSTM預測模型的精度MAE、RMSE、MAPE分別為3.2011、4.4009、0.3187,3.0687、4.2943、0.3045,Bi-LSTM與MLRA相比,模型精度分別提高了4.14%、2.40%、4.46%,說明所構建的Bi-LSTM交通流網(wǎng)格集群流量預測精度高、誤差低,要優(yōu)于MLRA模型,表現(xiàn)出較好的泛化性能;?MLRA和Bi-LSTM的DTW結果分別為52938.6356、54815.1055,構建的Bi-LSTM模型較MLRA模型各自工作日和節(jié)假日時間序列相似性DTW結果提高3.42%,表現(xiàn)出更好的魯棒性。利用城市交通流量的特點和交通軌跡數(shù)據(jù)網(wǎng)格化的優(yōu)點,基于Bi-LSTM模型的城市交通網(wǎng)格集群流量預測與MLRA交通流量預測模型相比,具有精度高、誤差低的特點。同時,DTW指標方面,基于Bi-LSTM對城市交通網(wǎng)格集群流量模型與真實流量變化趨勢一致,表現(xiàn)出較好的魯棒性。
關鍵詞:城市交通;交通流量預測;Bi-LSTM;交通網(wǎng)格集群;時空單元劃分
中圖分類號:U491.2 ?????????文獻標志碼:A ?????文章編號:1000-582X(2023)09-130-12
Forecasting for urban traffic grid clusters based on Bi-LSTM
JIA Xianguanga, FENG Chaoqina, SU Zhiwena, QIAN Zhengfua, SONG Tengfeia, LIU Huana, LYU Yingyingb
(a. Faculty of Transportation Engineering;?b. Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, P. R. China)
Abstract: This study aims to improve the accuracy of traffic prediction and to explore the spatio-temporal characteristics of traffic data in urban areas by proposing a traffic flow prediction model based on Bi-LSTM (Bidirectional Long Short Term Memory) for urban traffic grid clusters. The trajectory dataset of ride-hailing vehicles was gridified, and the Bayesian information criterion was used for parameter estimation to determine the cluster number, with considering the influence of manually determining the number of clusters on the results. The Gaussian mixture model was then employed to cluster grids with similar traffic conditions, resulting in distinct traffic grid clusters. A Multi-to-Multi model was designed by considering the mutual influence of input time series of traffic grids within each cluster. The Bi-LSTM model was established to predict traffic flow in non-overlapping clusters. Experimental validation was conducted using the classical MLRA (multiple linear regression analysis) as a control group, and four performance metrics: MAE(mean absolute error), RMSE(mean squared root error), MAPE(mean absolute percentage error) and DTW (dynamic time warping) were used to comprehensively evaluate the prediction results, confirming the feasibility and superiority of the Bi-LSTM model for city traffic grid cluster flow prediction. The results showed that both MLRA and Bi-LSTM models predicted urban traffic grid cluster traffic values were generally smaller than the real value, with more pronounced discrepancies observed during morning peak hours. Increasing data volume improved the prediction performance of the models. ?Traffic state dynamics within each traffic grid cluster were similar, displaying strong intra-cluster correlation. Both models achieved better traffic prediction results, with Bi-LSTM outperforming MLRA. In terms of model accuracy, the Bi-LSTM model showed improved MAE, RMSE and MAPE(3.068?7, 4.294?3, 0.304?5, respectively) compared to MLRA(3.201?1, 4.400?9, 0.318?7, respectively), representing a 4.14%, 2.40% and 4.46% enhancement, respectively. The constructed Bi-LSTM model exhibited higher accuracy, lower error and better generalization performance. In terms of similarity result evaluation, the DTW results of MLRA and Bi-LSTM were 52?938.635?6 and 54?815.105?5 respectively. The Bi-LSTM model showed better robustness by 3.42% compared to the respective weekday and holiday time series similarity DTW results of the MLRA model. By considering the characteristics of urban traffic flow and leveraging the advantages of gridding traffic trajectory data, the Bi-LSTM-based model for urban traffic grid cluster traffic prediction exhibited high accuracy, low error and superior robustness compared to the MLRA traffic flow prediction model. Meanwhile, in terms of DTW metrics, the Bi-LSTM-based urban traffic grid cluster traffic model captured the real traffic variation trend and demonstrated excellent performance in traffic flow prediction for urban areas.
Keywords: urban transportation; traffic flow forecasting; Bi-LSTM; traffic grid clusters; spatiotemporal unit division
智能交通系統(tǒng)(intelligent transport system, ITS)是智慧城市的重要組成部分,可有效解決交通擁堵問題,城市交通流量預測是ITS的基石,精準高效的交通流量預測對緩解交通擁堵具有重要意義[1]。城市交通流量預測是城市交通管理不可或缺的重要手段,準確的交通流量預測可為智能城市規(guī)劃和交通管理提供可靠管理,為擁擠區(qū)域提供預警確保公共安全,為乘客提供建議方便日常通勤[2]。
早期交通流量預測是基于統(tǒng)計學模型的方法。Vythoulkas[3]采用卡爾曼濾波模型利用線性系統(tǒng)狀態(tài)方程對交通流量進行預測,Ahmed等[4]將流量預測轉換成時序預測提出ARIMA方法(Auto-Regressive integrated moving average)對高速路交通流量進行預測。但基于統(tǒng)計模型的預測方法大多為線性模型,隨著交通數(shù)據(jù)的非線性和不確定性增強,模型預測精度逐漸變差,學者開始利用機器學習對交通流量預測。Feng等[5]提出具有時空相關性的自適應多核SVM模型(support vector machine)用于短期交通流量預測,Lee等[6]提出基于天氣狀況的多元線性回歸分析模型(multiple linear regression analysis,MLRA)用于交通預測。隨著交通數(shù)據(jù)的數(shù)據(jù)量劇增,交通流量數(shù)據(jù)也呈現(xiàn)出多維度的趨勢,機器學習對于復雜龐大的連續(xù)數(shù)據(jù)深層次特征的提取日益困難,研究者開始運用深度學習進行交通流量預測。
Zhang等[7]對交通數(shù)據(jù)進行時空分析,引入CNN(convolutional neural network)進行交通流量預測,單一模型預測難免會使數(shù)據(jù)特征信息丟失,將神經(jīng)網(wǎng)絡拓展延伸形成組合預測方法,逐漸成為發(fā)展趨勢。Fu等[8]使用LSTM(long short term memory)-GRU(gate recurrent unit)組合模型對交通流量進行預測,Zheng等[9]將注意力機制引入圖神經(jīng)網(wǎng)絡用于交通流量預測?;谏窠?jīng)網(wǎng)絡創(chuàng)新取得較好預測效果,但模型復雜度增加且效率變低。為挖掘深層次特征,Wang等[10]構建動態(tài)感知系統(tǒng)收集數(shù)據(jù),對交通道路數(shù)據(jù)進行AP(affinity propagation)聚類,利用LSTM進行交通流量預測[11],Chiabaut等[12]對高速道路數(shù)據(jù)進行高斯混合模型(gaussian mixture model,GMM)聚類得到擁堵圖,運用共識學習技術進行交通預測。研究均是基于道路聚類,聚類前并未對道路數(shù)據(jù)進行其它處理以得到其隱含的時空特征。
針對交通流量數(shù)據(jù)的非線性和不確定性增加、復雜龐大的連續(xù)數(shù)據(jù)特征難以提取、交通軌跡數(shù)據(jù)的隱含特征提取不充分問題,筆者提出基于深度學習的交通流量預測方法,引入雙向長短時記憶網(wǎng)絡模型(bidirectional long short-term memory network, Bi-LSTM),貢獻如下:
1)網(wǎng)格化處理和交通網(wǎng)格集群建模:通過將交通軌跡數(shù)據(jù)進行網(wǎng)格化處理,將復雜龐大的連續(xù)數(shù)據(jù)轉化為網(wǎng)格化的交通網(wǎng)格集群。利用貝葉斯信息準則(bayesian information criterion, BIC)和GMM模型,將網(wǎng)格化的交通流量數(shù)據(jù)序列分解為若干個加速度、速度比率、平均停車次數(shù)等相似交通狀況的網(wǎng)格集群,有效提取交通網(wǎng)格集群的時空特征,深入挖掘路網(wǎng)的時空關聯(lián)性。
2)設計多對多模型進行序列預測:全面考慮交通網(wǎng)格之間的相互影響和時序關系,設計了多對多模型,將分解得到的交通網(wǎng)格集群作為Bi-LSTM的輸入,實現(xiàn)對網(wǎng)格集群交通流量的序列預測。
3)通過使用滴滴蓋亞數(shù)據(jù)開放計劃的數(shù)據(jù)集進行實驗,實驗結果表明,基于Bi-LSTM的城市交通網(wǎng)格集群流量預測具有良好的預測能力,且優(yōu)于基準模型。
1城市交通網(wǎng)格集群的Bi-LSTM流量預測模型
基于多對多模型設計思想,構建Bi-LSTM預測模型對城市交通流網(wǎng)格集群流量進行預測??紤]輸入的交通網(wǎng)格集群序列遵循正態(tài)分布,為便于計算,對各個集群進行標準化處理;交通網(wǎng)格集群可用的時序數(shù)據(jù)可確定2個網(wǎng)格之間的時間和空間相關性,使所輸入數(shù)據(jù)具有較強的時空關聯(lián),利用多對多模型設計將分解的若干個交通網(wǎng)格集群作為Bi-LSTM的輸入;根據(jù)預測精度調(diào)整Bi-LSTM模型相關參數(shù)權重,以此預測n時刻該交通網(wǎng)格集群每個網(wǎng)格未來的交通流量?;贐i-LSTM對城市交通網(wǎng)格集群流量模型預測框架如圖1所示。
1.1多對多模型設計
1.1.1 交通傳播
交通傳播模式是在一個道路網(wǎng)絡中特定路段的流量水平所擁有的時空關系[13],在空間上的周期性和時間上的相似性可從歷史數(shù)據(jù)中獲得有價值信息,進而挖掘深層次時空特征。交通流量在不同交通網(wǎng)格中的傳播隨時間和空間動態(tài)變化,圖2是某集群某日早高峰時段各空間網(wǎng)格的交通流量圖,橫縱坐標表示軌跡數(shù)據(jù)網(wǎng)格化后的空間索引值,從圖2可以看出交通網(wǎng)格(6,34)的交通流量大,周圍其他交通網(wǎng)格的流量越靠近這個網(wǎng)格流量影響越大,說明這個交通網(wǎng)格影響著周圍其它交通網(wǎng)格的流量大小。
1.1.2 多對對模型設計
交通網(wǎng)格可用的時序數(shù)據(jù)可確定2個網(wǎng)格之間的時空相關性,得到t時刻當前網(wǎng)格的交通流量對其它網(wǎng)格影響。考慮到多對多模型對整個交通網(wǎng)絡的交通流量預測效率更高[11],為挖掘集群內(nèi)各網(wǎng)格的時空特征,進行多對多模型設計。多對多模型設計思路圖如圖3所示,左圖表示將網(wǎng)格化的交通數(shù)據(jù)進行聚類后所得到的某集群,為充分利用每個網(wǎng)格的時序數(shù)據(jù)將某集群t = 1,2…n-1個時間序列數(shù)據(jù)作為Bi-LSTM模型的輸入,預測該集群的每個網(wǎng)格在t=n時刻的流量。多對多模型設計是在被網(wǎng)格化的交通網(wǎng)絡中,讀取網(wǎng)格的所有集群,將相似交通網(wǎng)格的聚類數(shù)據(jù)輸入Bi-LSTM,預測n時刻每個網(wǎng)格未來的交通流量。
1.2Bi-LSTM模型框架
交通流量當前狀態(tài)不僅與之前的狀態(tài)有關,還與未來的狀態(tài)有關。Bi-LSTM具有較強的序列建模能力,可以對交通數(shù)據(jù)的時間序列特征進行建模和預測,包括小時、天、周等不同時間尺度。Bi-LSTM其結構由上下堆疊的2個單向LSTM組成,輸入在2個方向流動[14],輸入包含預測時間前后的時間序列,可以同時考慮歷史時刻和未來時刻的信息,通過結合前后時刻的信息可更好地捕獲交通數(shù)據(jù)的動態(tài)變化,較好地預測流量。在交通流量預測中,其模型的結構如圖4所示。該網(wǎng)絡克服了RNN(recurrent neural network, RNN)衰退問題,利用了LSTM可長時間儲存記憶的優(yōu)點。
2數(shù)據(jù)說明
研究的數(shù)據(jù)集來源于滴滴出行設立的蓋亞數(shù)據(jù)開放計劃平臺,地理區(qū)域是四川省成都市二環(huán)內(nèi)局部范圍,原始數(shù)據(jù)大小約180 GB,軌跡點采集間隔為2-4 s,時間區(qū)間是某年11月1日-30日,軌跡數(shù)據(jù)與實際路段相對應。司機及乘客訂單的隱私信息進行了加密脫敏匿名化處理可保證用戶安全。為了使軌跡數(shù)據(jù)更加集中,便于提取時空特征,對大規(guī)模雜亂軌跡數(shù)據(jù)進行清洗、錯誤篩查、壓縮等處理,處理前后區(qū)域范圍如圖5所示,(a)表示處理前區(qū)域范圍,(b)表示處理后區(qū)域范圍。從圖看出處理后的區(qū)域范圍更加清晰,數(shù)據(jù)更加集中,便于進行時空網(wǎng)格劃分。
大規(guī)模軌跡數(shù)據(jù)時空相關性較強,其時間數(shù)據(jù)只有一維屬性且具有嚴格的序列性,空間數(shù)據(jù)具有多維屬性且空間相關性更復雜。網(wǎng)格劃分可高效地挖掘數(shù)據(jù)中隱含的時空特征,對不同類別的時空數(shù)據(jù)進行融合[15]。筆者利用網(wǎng)格劃分方法將研究區(qū)域劃分為棋盤狀的網(wǎng)格以便于提取深層次的交通特征,時空網(wǎng)格劃分如圖6所示,左圖中若干個黑色圓圈表示網(wǎng)約車軌跡數(shù)據(jù)點的分布情況,紅色箭頭表示將其歸類到各個空間網(wǎng)格的過程,右圖表示劃分時間網(wǎng)格。取空間網(wǎng)格大小為50,時間窗為600 s,將空間數(shù)據(jù)點映射到各個網(wǎng)格中,在對定位點進行映射的同時也將矢量的軌跡網(wǎng)格化為網(wǎng)格序列,實現(xiàn)將軌跡數(shù)據(jù)打散成點坐標轉化為張量,從而可直接或間接得到每個網(wǎng)格的索引值以及網(wǎng)格平均加速度、網(wǎng)格浮動車流量、網(wǎng)格平均停車次數(shù)等。
3交通網(wǎng)格集群模型構建
3.1確定最佳組分
基于Bi-LSTM的城市交通網(wǎng)格集群流量進行預測,確定交通網(wǎng)格的最佳集群數(shù)是進行GMM模型聚類的基礎。為避免人為確定最佳集群數(shù)對實驗結果產(chǎn)生影響,利用BIC進行參數(shù)估計確定交通網(wǎng)格最優(yōu)集群數(shù)k。
很多參數(shù)估計問題采用似然函數(shù)作為目標函數(shù),當訓練數(shù)據(jù)集足夠大時,該方法可不斷提高模型的精度,但也會隨著模型復雜度增加而出現(xiàn)過擬合問題[16]。在模型選擇上,在模型復雜度與模型對數(shù)據(jù)集描述能力之間尋求最佳平衡,Schwarz提出BIC[17]信息準則,避免樣本數(shù)量過多導致模型精度過高造成模型復雜度過高的問題。該準則如式(5)所示,通過在模型中加入與模型參數(shù)個數(shù)相關的懲罰項來避免模型的過擬合。
BIC傾向于選擇較小的值,而模型參數(shù)的個數(shù)k過大會導致模型出現(xiàn)過擬合[17]。依據(jù)樣本數(shù)據(jù),?GMM模型參數(shù)個數(shù)與BIC值關系如圖7所示。由圖7可知BIC的值在4出現(xiàn)了大轉折,7以后雖然BIC的值一直在下降,但下降變緩。同時,k值過大會使BIC值變化不明顯且極易導致模型出現(xiàn)過擬合現(xiàn)象,為使BIC值和k值都相對小,取k值為6。
3.2構建GMM模型
某種程度上GMM模型是改進型的K-means模型。K-means模型的作用是將數(shù)據(jù)收集到方差相等的組中,使組內(nèi)總和最小[18],與其他聚類相比收斂速度快,算法可解釋度較強,但K-means存在集群形狀缺乏靈活性和概率集群分配概念的問題,無法將2個聚類中心相同的類聚類。GMM模型是多個高斯概率密度函數(shù)的線性組合,其曲線由若干個單高斯函數(shù)疊加而成,任何一個復雜曲線都可用若干個高斯曲線無限逼近。GMM聚類方法重視數(shù)據(jù)點分布而不僅是數(shù)據(jù)點之間的距離,它是通過選擇成分最大化后驗概率來完成聚類,提供的聚類有不同的大小[19]。基于構成不同聚類的交通網(wǎng)格集群遵循正態(tài)分布,故此選擇GMM算法。GMM聚類模型如式(6)所示。
利用K-means迭代獲取最優(yōu)值后將聚類中心點作為GMM的初始值進行訓練,以避免GMM收斂到局部最優(yōu)解;在GMM聚類時,利用EM算法估算參數(shù)使每個分量都有自己的通用協(xié)方差矩陣。圖8為交通網(wǎng)格聚類的示意圖,網(wǎng)格id和時間id表示將交通數(shù)據(jù)網(wǎng)格化后所得到網(wǎng)格時空索引值,網(wǎng)格id和時間id構成時空網(wǎng)格,clusters表示集群的類別,其中(48,3),3,C2和(19,15),92,C2屬于同一集群,構成了交通網(wǎng)格集群。
4模型驗證
4.1模型訓練
使用1~24日的數(shù)據(jù)作為練數(shù)據(jù),25~30日的數(shù)據(jù)作為測試數(shù)據(jù),取訓練集的15%作為驗證集,利用過去1 h的交通流量數(shù)據(jù)(6個時間步長)來預測未來10 min(1個時間步長)的交通流量。采用Python語言進行編程,該程序使用Keras庫,在AMD Ryzen 7 5800H with Radeon Graphics處理器、16gb內(nèi)存、Window10操作系統(tǒng)和Tensorflow2.0深度學習框架上實現(xiàn)。經(jīng)過GMM聚類后所生成的交通網(wǎng)格集群利用多對多模型輸入Bi-LSTM模型進行訓練。Bi-LSTM設計有6個隱藏層,前兩層是bi-lstm層,各有64個神經(jīng)元;第三層有32個神經(jīng)元;第四層16個神經(jīng)元;第五層為dropout層,為防止模型過擬合,丟棄率設為0.2;最后一層為全連接層。LSTM模型學習率為0.001,損失函數(shù)使用MSE,反向傳播算法使用Adam優(yōu)化器,激活函數(shù)采用ReLU。由于不同集群的交通狀況不一致,故每批次所訓練的樣本數(shù)(batch sizes)、總迭代次數(shù)(epoches)和訓練時間(times)如表1所示。為對模型預測效果進行評價,使用經(jīng)典的多元線性回歸分析(MLRA)模型作為對照組,在同一實驗環(huán)境中進行對比實驗驗證。
4.2模型誤差分析
利用過去1 h的交通數(shù)據(jù)預測未來10 min的交通流量,圖9為某交通網(wǎng)格集群MLRA模型和Bi-LSTM各自相同工作日早高峰時段網(wǎng)格流量的預測結果圖,其中a為真實值,b為預測值,右下角為同一區(qū)域網(wǎng)格的放大圖。
從圖9可以看出:1)總體來看MLRA模型和Bi-LSTM模型預測結果均小于真實值,可能與早高峰時段的交通流量大、交通狀況復雜等因素有關,使2個模型的預測值都偏小;2)從局部放大網(wǎng)格圖直觀上發(fā)現(xiàn)每個網(wǎng)格流量趨勢大體相同,但MLRA模型的流量預測值較真實值波動大,不穩(wěn)定,Bi-LSTM模型的預測精度高于MLRA模型。
模型時間序列相似性結果:圖10、圖11表示的是某交通網(wǎng)格集群MLRA模型和Bi-LSTM模型在工作日和節(jié)假日早高峰和平峰時段時間序列相似性的結果,其中a為早高峰(7:00-9:00)、b為平峰(9:00-11:00),縱坐標表示流量,橫坐標表示時間步長,一個時間步長代表10 min,時間窗取600 s,42代表早上7:00,48為8:00,以此類推。
從圖10、圖11可以看出:1)整體來看,MLRA模型和Bi-LSTM模型對于工作日和節(jié)假日的時間序列相似性結果,預測值與實際交通流量值的流動形態(tài)非常接近,說明2個模型能夠進行較好預測。2個模型的預測值大多時間小于真實值,早高峰時段更為明顯,且2個模型對早高峰的預測沒有平峰的預測好,可能與早高峰時段流量大、交通狀況復雜等因素有關。2)在工作日早高峰時段,MLRA模型和Bi-LSTM模型流量預測值大多小于真實值。在7:00-7:30時間段和8:00-8:10時間段MLRA模型和Bi-LSTM模型預測值嚴重偏離真實值,但Bi-LSTM更加接近真實值,其它時間段2個模型的預測值直觀上與MLRA模型更為接近,預測效果好;3)在節(jié)假日7:10-7:30時間段,MLRA模型時間序列相似性結果的預測值和實際值流動狀態(tài)相差較大,隨著數(shù)據(jù)增加預測值和真實值逐漸接近,表現(xiàn)出較好預測效果。在多數(shù)時段Bi-LSTM模型優(yōu)于MLRA模型;4)對于平峰時段的預測,MLRA模型和Bi-LSTM模型流量預測值較為接近真實值,可能與平峰時段交通狀況穩(wěn)定有關。Bi-LSTM模型在工作日和節(jié)假日上午時段流量的預測值和真實值更加接近也更加穩(wěn)定,表現(xiàn)出更好的魯棒性。
為量化模型預測結果,采用經(jīng)典的誤差評價指標[20]平均絕對誤差(mean absolute error,MAE)、均方根誤差(mean squared root error,RMSE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)和動態(tài)時間規(guī)整(dynamic time warping,DTW)對模型結果進行評價。
1) MAE:用于評估交通流量預測值和真實值的接近程度,其值越小擬合效果越好,
2) RMSE:該指標計算的是交通流量預測結果和真實值對應樣本點誤差的平方根,其值越小說明預測速度值精度越高,
3)MAPE:用于測量測試集上平均流量測試值與實際測試值之間的相對誤差,范圍[0,+∞),MAPE為0%表示完美模型,MAPE大于100 %則表示劣質(zhì)模型,
4) DTW:用于測量交通流量預測值和真實值2個時間序列之間的相似性,所得到的距離越小,說明2個時間序列越相似。
不同模型和集群的評價結果如表2所示,整體來看,在每個交通網(wǎng)格集群中,MLRA模型、Bi-LSTM模型對交通流量的預測都取得了不錯效果,這與將網(wǎng)格化的交通流量數(shù)據(jù)通過GMM聚類所得到的一系列交通網(wǎng)格集群有關。因為每個交通網(wǎng)格集群內(nèi)部相關性較強,交通狀況極為相似,從而使2個模型的預測效果較好,但各自在模型精度以及時間序列相似性方面存在些許差異。為使MLRA模型、Bi-LSTM模型評價更直觀,利用不同交通網(wǎng)格集群所占整個交通網(wǎng)格的權重方法,使每個交通網(wǎng)格集群乘以各自的權重再進行疊加,得到如表3所示總的模型評價結果。
模型精度:模型的平均評價結果如表3所示,通過表3發(fā)現(xiàn),MLRA、Bi-LSTM的MAE、MSE、MAPE分別為3.201 1、4.400 9、0.318 7,3.068 7、4.294 3、0.304 5。
1)Bi-LSTM與MLRA相比,MAE降低0.1324,提高4.14%,Bi-LSTM的流量預測值較為接近真實值,擬合效果較好;
2)Bi-LSTM與MLRA相比,RMSE降低0.1066,提高2.42%,Bi-LSTM模型的交通流量預測結果和真實值對應樣本點的誤差平方根較小,預測精度比經(jīng)典MLRA模型流量預測高,預測效果較好;
3)Bi-LSTM與MLRA相比,MAPE降低0.0142,提高4.46%,Bi-LSTM模型的測試集上平均流量測試值與實際測試值之間的相對誤差小,說明Bi-LSTM模型優(yōu)于MLRA模型。
DTW結果:表3中MLRA模型、Bi-LSTM模型時間序列相似性結果DTW分別為52938.6356、54815.1055,Bi-LSTM模型較MLRA模型提高3.42%,說明Bi-LSTM的流量預測值更加接近真實值,Bi-LSTM優(yōu)于MLRA模型,表現(xiàn)出較好的魯棒性。
Bi-LSTM模型較經(jīng)典MLRA模型在對交通網(wǎng)格集群進行流量預測時表現(xiàn)出較好的泛化性和魯棒性,Bi-LSTM在交通流量集群預測方面比MLRA模型更有優(yōu)勢。
5結??語
在Tensorflow2.0深度學習的理論框架下,基于Python語言,利用貝葉斯信息準則和高斯混合模型,將網(wǎng)格化的交通流量數(shù)據(jù)序列分解為若干個相似交通狀況的網(wǎng)格集群,設計了多對多模型,根據(jù)交通網(wǎng)格可用的時間序列數(shù)據(jù),構建了基于Bi-LSTM交通流量時間序列預測框架,借助Keras完成逐層網(wǎng)絡構建和精細化調(diào)參,實現(xiàn)基于Bi-LSTM對城市交通網(wǎng)格集群的短時交通流預測。Bi-LSTM模型較MLRA模型在MAE、MSE、MAPE方面分別提高了4.14%、2.40%、4.46%,Bi-LSTM模型表現(xiàn)出更好的泛化性能。2個時間序列之間相似性表現(xiàn)出的DTW結果為Bi-LSTM組合預測模型較MLRA模型提高了3.42%,Bi-LSTM要優(yōu)于MLRA,表現(xiàn)出較好的魯棒性。說明基于Bi-LSTM對城市交通網(wǎng)格集群流量預測是可行的,具有應用于城市交通網(wǎng)格流量預測的潛力。
參考文獻
[1]??劉宜成, 李志鵬, 呂淳樸, 等. 基于動態(tài)時間調(diào)整的時空圖卷積路網(wǎng)交通流量預測[J]. 交通運輸系統(tǒng)工程與信息, 2022, 22(3): 147-157, 178.
Liu Y C, Li Z P, Lv C P, et al. Network-wide traffic flow prediction research based on DTW algorithm spatial-temporal graph convolution[J]. Journal of Transportation Systems Engineering and Information Technology, 2022, 22(3): 147-157, 178.(in Chinese)
[2]??Chen C L, Liu Y B, Chen L, et al. Bidirectional spatial-temporal adaptive transformer for urban traffic flow forecasting[J]. IEEE Transactions on Neural Networks and Learning Systems, 2022, PP(99): 1-13.
[3]??Vythoulkas P. Alternative approaches to short term traffic forecasting for use in driver information systems[J]. Transportation and Traffic Theory, 1993, 12: 485-506.
[4]??Ahmed M S. Analysis of freeway traffic time series data and their application to incident detection[M]. OKlahoma;The University of Oklahoma, 1979.
[5]??Feng X X, Ling X Y, Zheng H F, et al. Adaptive multi-kernel SVM with spatial–temporal correlation for short-term traffic flow prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(6): 2001-2013.
[6]??Lee J W, Hong B, Lee K, et al. A prediction model of traffic congestion using weather data[C]//2015 IEEE International Conference on Data Science and Data Intensive Systems. December 11-13, 2015. Sydney, NSW, Australia:IEEE, 2016: 81-88.
[7]??Zhang W B, Yu Y H, Qi Y, et al. Short-term traffic flow prediction based on spatio-temporal analysis and CNN deep learning[J]. Transportmetrica a Transport Science, 2019, 15(2): 1688-1711.
[8]??Fu R, Zhang Z, Li L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). November 11-13, 2016.Wuhan, China:IEEE, 2017: 324-328.
[9]??Zheng C P, Fan X L, Wang C, et al. GMAN: a graph multi-attention network for traffic prediction[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(1): 1234-1241.
[10]??Wang Z Y, Thulasiraman P, Thulasiram R. A dynamic traffic awareness system for urban driving[C]//2019 International Conference on Internet of Things (iThings), IEEE Green Computing and Communications (GreenCom), IEEE Cyber, Physical, Social Computing (CPSCom) and IEEE Smart Data (SmartData), July 14-17, 2019.Atlanta, GA, USA: IEEE, 2019: 945-952.
[11]??Wang Z Y, Thulasiraman P. Foreseeing congestion using LSTM on urban traffic flow clusters[C]//2019 6th International Conference on Systems and Informatics (ICSAI). November 2-4, 2019, Shanghai, China. IEEE, 2020: 768-774.
[12]??Chiabaut N, Faitout R. Traffic congestion and travel time prediction based on historical congestion maps and identification of consensual days[J]. Transportation Research Part C: Emerging Technologies, 2021, 124: 102920.
[13]??Long J C, Gao Z Y, Ren H L, et al. Urban traffic congestion propagation and bottleneck identification[J]. Science in China Series F: Information Sciences, 2008, 51(7): 948-964.
[14]??Chen K H, Jia J P. Network evasion detection with Bi-LSTM model[J]. Journal of Physics: Conference Series, 2019, 1168: 052009.
[15]??劉志遠, 張文波. 交通大數(shù)據(jù): 理論與方法[M]. 杭州: 浙江大學出版社, 2020.
Liu Z Y, Zhang W B. Traffic big data: theory and method[M]. Hangzhou: Zhejiang University Press, 2020.(in Chinese)
[16]??趙楊璐, 段丹丹, 胡饒敏, 等. 基于EM算法的混合模型中子總體個數(shù)的研究[J]. 數(shù)理統(tǒng)計與管理, 2020, 39(1): 35-50.
Zhao Y L, Duan D D, Hu R M, et al. On the number of components in mixture model based on EM algorithm[J]. Journal of Applied Statistics and Management, 2020, 39(1): 35-50.(in Chinese)
[17]??Schwarz G. Estimating the dimension of a model[J]. The Annals of Statistics, 1978,6(2): 461-464.
[18]??Likas A, Vlassis N, Verbeek J J. The global K-means clustering algorithm[J]. Pattern Recognition, 2003, 36(2): 451-461.
[19]??Reynolds D. Gaussian mixture models[M]. Boston, MA: Springer, 2009: 659-663.
[20]??王博文, 王景升, 王統(tǒng)一, 等. 基于長短時記憶網(wǎng)絡的Encoder-Decoder多步交通流預測模型[J]. 重慶大學學報, 2021, 44(11): 71-80.
Wang B W, Wang J S, Wang T Y, et al. An encoder-decoder multi-step traffic flow prediction model based on long short-time memory network[J]. Journal of Chongqing University, 2021, 44(11): 71-80.(in Chinese)
(編輯??侯湘)