李斐軒
摘要:由于當前交通流預(yù)測中各參數(shù)之間的關(guān)聯(lián)性不能在模型中加以呈現(xiàn),因此提出了多因素融合的圖注意力交通流預(yù)測模型(MFI-GAT),將交通流量和交通平均速度兩個參數(shù)通過殘差網(wǎng)絡(luò)進行融合,并將交通流特征矩陣與天氣屬性矩陣結(jié)合起來,使用圖注意力網(wǎng)絡(luò)(GATs)來捕捉空間特征,并通過添加了注意力機制的門控循環(huán)單元(AGRUs)來捕捉時間特征,通過采用真實數(shù)據(jù)集進行試驗,證明該模型與現(xiàn)有部分模型相比準確率有所提升。
關(guān)鍵詞:深度學(xué)習;數(shù)據(jù)融合;短時交通流預(yù)測;圖神經(jīng)網(wǎng)絡(luò);注意力機制
一、前言
交通流分析是智能交通網(wǎng)絡(luò)系統(tǒng)的主要部分,其研究方法經(jīng)歷了多個不同的發(fā)展階段。當前,主要存在的技術(shù)類別:基于傳統(tǒng)理論的預(yù)測技術(shù)、基于單一智能模型的預(yù)測技術(shù)以及基于多種智能模型的預(yù)測技術(shù)。本文探討了一種基于混合智能模型的預(yù)測方法,它能夠充分利用交通流數(shù)據(jù)的時空特征和多種外部環(huán)境因素,從而提高預(yù)測的準確度?;旌现悄苣P褪侵敢环N利用兩種或兩種以上的模型進行短時交通流預(yù)測的模式,它可能包括兩種模式,一種是利用幾個不同的模型相互銜接的,一個模型的輸出結(jié)果可以作為另一個模型的輸入,并相互銜接以便得出最后的結(jié)論;而另一類則是利用多種模型一起進行的,最后可以通過對他們的檢測結(jié)果做出若干數(shù)學(xué)計算,以便得出最后的預(yù)測結(jié)論。在2016年,Wu等人[1]利用復(fù)雜的空間依賴性關(guān)系,將一維CNNs和二維LSTM技術(shù)有機地結(jié)合起來,構(gòu)建出一個新的特征融合框架,以更好地預(yù)測短時交通流。首先,他們利用一維CNNs技術(shù)探索交通流的空間依賴性,隨后,他們又利用二維LSTM技術(shù),深入探究交通流量的短期變化趨勢及其周期性。次年,Liu等人[2]在國際WCSP大會上,提出了一種新的短時交通流預(yù)測技術(shù),它將單ConvLSTM模型與雙向LSTM模型有機結(jié)合,以獲取時間特性、周期特性以及其他相關(guān)信息,而不需要對車輛行駛軌跡數(shù)據(jù)集進行任何預(yù)處理,從而實現(xiàn)了端到端的快速、準確的短時交通流預(yù)測。Yu和其他研究者[3]使用GCNs架構(gòu)來描述時間相互作用的過程,他們發(fā)明的時間空間圖卷積網(wǎng)絡(luò)(STGCN)被廣泛應(yīng)用于交通流的預(yù)報。STGCN的架構(gòu)由多個時間分割單元組成,其中一個時間分割單元擁有兩個時間門限,另一個時間分割單元擁有一個時間分割單元,它們能夠有效地抓住時間的本質(zhì),同時也能夠揭示其中的空間規(guī)律。Zhu和其他研究者[4]利用A3T-GCN(圖卷積)模擬,將注意力機制納入其中,使得整個時期的數(shù)據(jù)能夠被有效地整合,進一步大大提高了預(yù)測的精度。目前的研究方法主要是以交通流信息的時間特性作為研究重點的目標,只是少數(shù)時候顧及一些外界要素, 晏臻等人[5]提出了融合多因素的短時交通流預(yù)測模型(MFNN)的交通流預(yù)測模型,但其理論手段還僅僅把外界要素的全連接層直接整合在時間預(yù)報模型中,還不能很好地抓住其特點。
綜上所述,提出了多因素融合圖注意力網(wǎng)絡(luò)預(yù)測模型 (Multi Factor Integration-GAT, MFI-GAT),該模型注重數(shù)據(jù)融合將已有參數(shù)(交通流量和車速)融合為單一參數(shù)后將路網(wǎng)空間與天氣等因素變?yōu)槿诤暇仃囎鳛槟P洼斎?,以此進一步提高了模型的精度。
二、基礎(chǔ)模型
(一)交通流定義
交通流量:即指定時間間隔內(nèi)該路段通過的車流量與指定時間間隔的比值。其時間間隔一般為5分鐘所以稱之為短時交通流預(yù)測。由于交通流數(shù)據(jù)會受到時間空間等一些不確定因素的干擾,所以這里簡單介紹一下其具有的特征:
1.空間相關(guān)性。路網(wǎng)的拓撲結(jié)構(gòu)會對交通流產(chǎn)生很大影響,當路網(wǎng)結(jié)構(gòu)中路段的交通流發(fā)生變化時會對相鄰路段產(chǎn)生影響。
2.交通流的時間特征可以分為兩部分。一部分是有規(guī)律的,另一部分是無規(guī)律的。交通流數(shù)據(jù)因周期性會表現(xiàn)得十分相近,且會受到相鄰時間段交通流數(shù)據(jù)的影響。
3.不確定性。當發(fā)生暴雨,大雪等特殊天氣時會對交通產(chǎn)生影響,交通流也將產(chǎn)生明顯變化,遇到車禍等人為因素交通流也會受到影響。
(二)數(shù)據(jù)融合
當前,在短時間內(nèi)的交通流預(yù)測方面,有兩種主要的方法:一種是僅使用一個交通流參數(shù),另一種是將多個參數(shù)分別輸入到不同的模型中,并通過全連接層融合來得出結(jié)果。第一種方法可能會導(dǎo)致較大的預(yù)測誤差;第二種方法雖然能夠提取更多的交通流時空特征,但需要更多的模型,并且對硬件設(shè)備的要求也比較高。通過式1對數(shù)據(jù)進行了加權(quán)融合[6],以找到最佳的加權(quán)參數(shù),以達到最佳的結(jié)果。
式中:F為路段交通流量; 為路段交通平均速度; 為加權(quán)參數(shù),其取值為[0,1];X加權(quán)融合后新的交通流參數(shù)。
我們首先使用加權(quán)平均法來整理兩個關(guān)鍵因素(交通流量和平均速度)的信息,從而創(chuàng)建一個全面的,能夠反映真實情況的數(shù)據(jù)集。研究結(jié)果顯示,這種方法能夠很好地整合這兩個因素的時間和空間信息,從而對短時交通流預(yù)測進行更加精準的預(yù)測。
(三)GATs模型
傳統(tǒng)GCN模型存在兩大局限性,首先它無法完成inductive任務(wù),即處理動態(tài)問題。同時GCN模型還有處理有向圖的瓶頸,不容易實現(xiàn)分配不同的學(xué)習權(quán)重給不同的鄰居節(jié)點。而GAT模型完全不依賴于圖的結(jié)構(gòu),對于inductive任務(wù)無壓力。所以這里采用GAT模型進行實驗。
通過多層 AGRU 層的循環(huán),每一層的 AGRU 的輸入都考慮了上一層 AGRU的輸出,從而捕獲道路網(wǎng)絡(luò)的時間依賴關(guān)系。
三、MFI-GAT 預(yù)測模型
框架主要由數(shù)據(jù)預(yù)處理,時空建模和預(yù)測三部分組成。經(jīng)過大數(shù)據(jù)技術(shù)處理后,可以獲取路網(wǎng)拓撲結(jié)構(gòu)G、交通流特征矩陣X、天氣特征矩陣K,將矩陣X和K經(jīng)時序特征進行合并得到融合矩陣E,然后與路網(wǎng)拓撲結(jié)構(gòu)輸入到GATs模型去獲取其空間特征,然后用AGRUs去獲取時間特征,最后將時空特征作為輸出。預(yù)測部分使用已有數(shù)據(jù)集進行預(yù)測對比。
四、實驗與分析
(一)數(shù)據(jù)集
本文數(shù)據(jù)集主要使用了來自滴滴打車的開放數(shù)據(jù)其包含了實驗所需的特征,而通過查詢“天氣網(wǎng)”的數(shù)據(jù)獲取了車輛行駛過程的相關(guān)不確定因素。
1.車輛行駛軌跡數(shù)據(jù)集。收錄了2018年9月西安市局部地區(qū)滴滴打車的出租車軌跡信息,總?cè)萘窟_到71GB,并且對司機和訂單信息進行了嚴格的加密和脫敏處理,該軌跡數(shù)據(jù)集的經(jīng)緯度范圍分別[34.2049,34.2800]和[108.9218,109.0094]。表1為數(shù)據(jù)集中原始加密數(shù)據(jù),數(shù)據(jù)內(nèi)容為出租車ID行駛軌跡的經(jīng)緯度與時間。
2.天氣數(shù)據(jù)集。通過查閱“天氣網(wǎng)”和中國國家氣象局得到了2018年9月西安市的相關(guān)天氣數(shù)據(jù)包括了天氣,溫度,降水量,風速等多種天氣指標。
(二)實驗環(huán)境
見表2。
(三)評價指標
使用均方根誤差(RMSE)平均絕對誤差(MAE) 準確率(Accuracy)三種指標來評估模型的預(yù)測性能。
(四)實驗結(jié)果
1.數(shù)據(jù)特征分析
由于交通流數(shù)據(jù)會受到空間時間以及其他不確定因素的影響所以將從其空間相關(guān)性、時間相關(guān)性和不確定性這三種特征對其進行可視化分析。
空間相關(guān)性:圖1中選取了以25號路段為核心路段其他路段為其相鄰路段,時間為9月18日上午,天氣晴,以此進行探究。由圖中交通流趨勢變化我們可以看出25號路段會受到其相鄰路段(31,19,18,21,24號路段)交通流變化的影響,其影響因素包括因直行與左右轉(zhuǎn)彎而匯出或流出的交通流。以10:30這一時間點為例,在位于25號路段上游路段的18號31號以及24號路段的交通流減少時,25號路段的交通流也有所減少,而位于其下游的19號路段的交通流大幅提高。同理在11:30左右,25號路段因上游路段的交通流減少而減少,之后因上游路段交通流增長而增長,最后趨于穩(wěn)定。從這一點可以清楚地看出,一個路段的車流量會受到其他路段的限制,因此,車流量與道路網(wǎng)絡(luò)的空間布局之間存在著密切的聯(lián)系。
時間相關(guān)性:圖2選取了25號路段早高峰時間段(上午六點至九點),一周內(nèi)的交通流變化圖,其交通流變化大體相同,大約在每日的6:30左右達到低谷,之后開始上漲,8點左右交通流會達到峰值,并且在周末時的峰值數(shù)據(jù)一般會高于其他時間段。研究表明,休息日、節(jié)假日等因素會顯著改變交通流量,從而證實了交通流量與時間序列之間的密切聯(lián)系。
不確定性:圖3為25路段3日內(nèi)上午六點至下午五點的交通流趨勢圖,其天氣分別為大雨,晴天,多云。由圖中數(shù)據(jù)可明顯看出27日的交通流數(shù)據(jù)受天氣因素影響遠低于其他兩日。所以天氣,車禍等之類的不確定因素會對交通流數(shù)據(jù)產(chǎn)生很大影響。
2.實驗結(jié)果分析
為評估模型在交通流預(yù)測中的性能,將其與近五年來已有模型進行比較,結(jié)果如表3所示。
由表3可以看出,將模型T-GCN與傳統(tǒng)模型GRUs和GATs相比其RMSE分別降低了約19.22%和20.36%,其準確度也有一定提高;MFI-GAT模型在融入天氣要素以及進行了數(shù)據(jù)融合后,其精準度與T-GCN 模型相比提高了0.83%,RMSE 和 MAE 分別降低了1.7%和4%,其預(yù)測結(jié)果優(yōu)于模型T-GCN,可見MFI-GAT模型的可行性。
五、結(jié)語
本文提出了一種新的圖注意力交通流預(yù)測模型,它將多種因素,如天氣、時間、空間等,融合在一起,并利用滴滴打車“蓋亞”數(shù)據(jù)公開項目的數(shù)據(jù)集,開展性能評估,與GRUs、GATs和T-GCN等模型相比較。最終結(jié)果表明,本文模型相較于這三類模型有了一定的提升。
參考文獻
[1]Yuankai Wu and Huachun Tan. Short-term traffic flow forecasting with spatial-temporal correlation in a hybrid deep learning framework.[J].CoRR,2016,abs/1612.01022.
[2]Liu Y,Zheng H,F(xiàn)eng X,et al.Short-term traffic flow prediction with Conv-LSTM[C]//2017 9th International Conference on Wireless Communications and Signal Processing (WCSP). IEEE,2017:1-6.
[3]Yu B,Yin H,Zhu Z.Spatio-temporal graph convolutional networks:A deep learning framework for traffic forecasting[J].arXiv preprint arXiv:1709.04875, 2017.
[4]Bai J,Zhu J,Song Y,et al.A3t-gcn:Attention temporal graph convolutional network for traffic forecasting[J].ISPRS International Journal of Geo-Information,2021,10(7):485.
[5]晏臻,于重重,韓璐,等.基于CNN+LSTM的短時交通流量預(yù)測方法[J].計算機工程與設(shè)計,2019,40(09):2620-2624+2659.
[6]董真杰,鄭琛瑤,張國龍.不同精度數(shù)據(jù)融合的自適應(yīng)加權(quán)平均法研究[J].艦船電子工程,2014,34(10):31-33+126.