吳澍
摘要:為改善交通擁堵情況,提升交通網絡效率,提出了基于前后文關聯(lián)的長短期記憶網絡模型Contextual LSTM。首先,針對長短期記憶網絡模型面對突發(fā)情況識別不及時的問題,將輸入和隱藏狀態(tài)建立關聯(lián)關系,提升前后時刻數據的關聯(lián),從而提升模型應對突發(fā)情況的能力。此外,采用英國的交通數據集對模型進行訓練與測試,并與傳統(tǒng)LSTM模型、GRU模型進行預測效果對比實驗。驗證結果表明,改進后的長短期記憶網絡模型在交通流數據的預測上更具優(yōu)勢。
關鍵詞:長短期記憶網絡;交通流預測;前后文關聯(lián)
一、前言
據公安部統(tǒng)計,我國2023年機動車保有量達4.35億輛。機動車數量的增長速度已高于基礎設施完善的速度,交通問題成為城市高質量發(fā)展的瓶頸[1]。為解決這一問題,各大城市紛紛采用機器學習、物聯(lián)網等科學技術研究更高效的智能交通系統(tǒng),從而提升城市運行效率[2]。實時準確的交通流數據和預測是智能交通系統(tǒng)的關鍵。交通規(guī)劃、管理部門可以基于實時準確的交通預測信息科學,靈活地設計道路、部署交通資源、引導交通流量等;出行者則可以選擇合適的出行時間和工具,避免擁堵的發(fā)生[3]。
交通流預測的模型可分為三類:統(tǒng)計方法模型、傳統(tǒng)機器學習模型和深度學習模型。相較前兩種模型,深度學習模型的優(yōu)點是可以自動提取特征、處理復雜非線性問題、綜合考慮交通流數據的歷史規(guī)律性和路網的空間相關性,精度較高,算法成熟。深度學習模型包括卷積神經網絡模型(CNN)、循環(huán)神經網絡模型(RNN)和長短期記憶網絡模型(LSTM)。這些模型通過模擬人腦神經元連接方式或處理序列數據的機制來進行預測。CNN特別適合處理圖像和序列數據,通過模擬人眼視覺神經的工作方式提取數據特征;RNN適用于處理序列數據,通過在時間維度上重復應用相同的計算過程來學習序列數據的內在模式;LSTM是RNN的一種變體,通過引入“記憶單元”來解決RNN處理長序列時的梯度消失問題,能夠更好地處理長時間序列的預測。LSTM模型的復雜性使得其可解釋性較差,且面對難以量化的外部因素影響,特別是突發(fā)情況時存在識別不及時問題,使得交通流預測受到限制。
本文選擇深度學習模型中的應用于預測領域的LSTM模型進行交通流預測的研究,針對LSTM模型面對突發(fā)情況識別不及時的問題,將模型輸入和隱藏狀態(tài)建立關聯(lián)關系,提升前后時刻數據的關聯(lián),提出Contextual LSTM模型并且通過實驗驗證該模型在交通流預測的優(yōu)勢。
二、LSTM模型的理論基礎
長短期記憶網絡模型(Long Short-term Memory, LSTM)是一種特殊的循環(huán)神經網絡(Recurrent Neural Network,RNN),通過門控狀態(tài)控制傳輸狀態(tài),記住重要的信息,忘記不重要的信息,解決了梯度消失和爆炸的問題,并且在長序列上有更好的表現(xiàn),更適用于交通流這種長時間的預測。
LSTM模型有兩個傳遞狀態(tài),一個細胞狀態(tài)Ct,一個隱藏狀態(tài)ht,通常細胞狀態(tài)變化比較緩慢,隱藏狀態(tài)傳遞的過程中變化比較快。xt和yt分別代表輸入和輸出。LSTM模型的數據傳遞見圖1。
LSTM模型的內部主要有三個階段:忘記階段、選擇性記憶階段以及輸出階段。對應門控電路為遺忘門、輸入門、輸出門。LSTM模型內部結構見圖2。
三、Contextual LSTM模型構建
經典的LSTM雖然處理時間序列預測的效果較好,但是對于前后文的關聯(lián)關系建立不足,例如,遺忘門、輸入門對上一時刻記憶細胞的狀態(tài)感知不足。針對這一問題,本文將前一時刻記憶細胞的狀態(tài)作為遺忘門、輸入門的輸入,從而提升前后文的關聯(lián),Contextual LSTM內部結構見圖3。
四、實驗結果與分析
(一)數據來源和實驗環(huán)境
本實驗的數據為英國交通網中的3組交通流數據,時間跨度分別為2019年4月1日至2019年4月20日、2019年4月21日至2019年5月10日、2019年5月11日至2019年5月31日,數據集中相鄰數據的時間間隔為5分鐘,3組數據集中的數據數目均為1600組。實驗將數據集的前600條數據作為訓練集,后1000條數據作為測試集。
實驗的筆記本電腦型號為Lenovo-G50,Windows 10,64位,CPU型號為Intel (R) Core(TM) i7,采用的IDE為pycharm,編程語言為python,python的版本為3.9.1。
(二)模型評價指標
為全方位評估本文提出的基于前后文關聯(lián)的長短期記憶網絡模型的效果,選用平均絕對誤差(MAE)、平均方根誤差(RMSE)、平均絕對百分誤差(MAPE)進行預測評估,三者數值越低代表模型預測精度越高、預測效果越好。
MAE、RMSE、MAPE側重點有所不同,可以從不同角度評估模型的效果。MAE和RMSE衡量的是真實值與預測值偏離的絕對大小情況,需要結合真實值的量綱才能判斷差異;MAPE衡量的是偏離的相對大小,即百分率,更容易理解和解讀。相對來說,MAE和MAPE不容易受極端值的影響,而RMSE采用誤差的平方,會放大預測誤差,所以對于離群數據更敏感,可以突出影響較大的誤差值[4-5]。三者表達式如下:
(三)預測結果與分析
本文采用Contextual LSTM模型對交通流數據集進行預測。針對三組數據集,分別用傳統(tǒng)LSTM模型、GRU模型,以及本文提出的Contextual LSTM模型對本文的交通流數據集進行了預測效果驗證。3組數據集的實驗結果見圖4、圖5、圖6。
從預測效果對比圖可以看出,Contextual LSTM模型的預測效果最佳,預測的結果最貼近于真實數據,其次是GRU模型,最后是LSTM模型。除預測效果對比圖,本文還對三種模型的MAE、RMSE、MAPE數值進行了對比,見表1。
為對比結果更直觀,本文還繪制了條形統(tǒng)計圖進行對比,見圖7。由圖7、表1,以及預測效果對比圖可見,Contextual LSTM模型相比于LSTM模型和GRU模型,其預測誤差最小,預測精度最高。相比于LSTM模型,Contextual LSTM模型的MAE、RMSE、MAPE 3種指標分別優(yōu)化了9.8×10-4、1.73×10-3、9.9×10-4;相比于GRU模型,Contextual LSTM模型的MAE、RMSE、MAPE 3種指標分別優(yōu)化了4.3×10-4、1.39×10-3、5.8×10-4。
五、結語
隨著交通擁堵的頻發(fā),交通數據的預測成為交通路網的研究重點。針對LSTM模型前后文關聯(lián)關系不強的問題,本文提出了基于前后文關聯(lián)的長短期記憶網絡模型Contextual LSTM,將上一時刻的記憶細胞的狀態(tài)反饋給遺忘門和輸入門,將輸入和隱藏狀態(tài)建立關聯(lián)關系,提升前后時刻數據的關聯(lián),從而提升模型應對突發(fā)情況的能力。本文首先對Contextual LSTM模型的原理進行了具體的分析,然后采用英國交通路網的3組數據集對模型進行了效果驗證,并和傳統(tǒng)LSTM模型以及GRU模型進行了預測效果對比,通過對比展示了Contextual LSTM模型良好的性能,為交通路網中交通流的預測提供了參考依據。
參考文獻
[1]李文龍,林思暢,陳翰林,等.一種智慧便捷停車系統(tǒng)設計[J]. 中國科技信息,2023(06):99-101.
[2]薛延明,李光輝,齊濤.融合圖小波和注意力機制的交通流預測方法[J].計算機科學與探索,2023,17(06):1405-1416.
[3]周邯.基于視頻分析的城市道路短時交通流預測[D].重慶:重慶大學,2023.
[4]于海波,王春雨,袁曉蕾,等.基于PCA-SVR的電能計量裝置誤差評估算法[J].電測與儀表,2020,57(19):140-145.
[5]趙鵬,馬克琪,李紅斌,等.計及一次電壓波動的電壓互感器誤差狀態(tài)在線評估方法[J].高電壓技術,2022,48(03):1042-1051.
責任編輯:張津平、尚丹