賴俊龍
(華南農業(yè)大學數(shù)學與信息學院,廣東 廣州 510642)
交通流預測是智能交通系統(tǒng)中的重要成分,準確、有效的預測能夠改善和緩解城市的交通問題。然而,由于交通路網拓撲結構的約束和交通流隨時間變化的規(guī)律,即:空間依賴性和時間依賴性,交通流預測成為一個有挑戰(zhàn)性的問題。
傳統(tǒng)的方法有ARIMA、卡爾曼濾波模型等,它們難以處理有較強不確定性的數(shù)據。因此,如K 近鄰模型、支持向量機模型等機器學習方法被提出,它們能夠對高維和非線性特征的數(shù)據進行建模,然而,這些模型在捕獲空間相關性上存在局限性。為此,Jiang 等將交通網絡視為圖像并用卷積神經網絡來捕獲空間特征;Cheng等將卷積神經網絡與循環(huán)神經網絡(Recurrent Neural Network,RNN)結合來學習時空相關性。但交通網絡并不像圖像那樣是規(guī)則的結構,于是,圖卷積神經網絡(Graph Convolutional Network,GCN)被提出并用于特征學習。Zhao 等將GCN 與RNN結合提出了T-GCN模型;Li等提出擴散卷積門控循環(huán)單元,并結合編碼器-解碼器結構提出了DCRNN模型,但這些模型的預測效果還有待提高。
為應對上述挑戰(zhàn)和問題,提出多分辨率時空注意力網絡(Multi-Resolution Spatio-Temporal Attention Network,MRSTAN),以便有效地利用時空特征,進而提高預測的精準度。
圖1為模型的框架,主要包括空間模塊、時間模塊和融合模塊三個組件。
圖1 多分辨率時空注意力網絡框架
傳統(tǒng)GCN 采用的圖結構是靜態(tài)的,不能正確的描述流量之間的依賴關系。如圖2 所示,道路1 發(fā)生交通事故后,隨時間演變會影響到道路2、3、4 處的交通情況。
圖2 交通流時空相關性
為了能自適應地學習空間結構,采用了Guo 等提出的空間注意力,具體公式為:
RNN 常用于序列數(shù)據,但其存在梯度消失和梯度爆炸等缺陷。其變體LSTM 和GRU 可以解決這些缺陷,其中LSTM 比GRU 結構更加復雜,訓練時間更長。因此,選擇GRU模型獲取時間依賴性,其具體公式如下:
交通流具有周期性,不同的分辨率下,它們之間的相似性有助于模型更好地學習到其中的規(guī)律。如圖3所示,2022年2月27日7:30-8:30為要預測的真實數(shù)據,其與昨天、上周同一時段的車流量具有相似的趨勢,例如都在第5個觀測點附近達到最低點,在接近第7個觀測點達到最高峰,都具有繼續(xù)上升的趨勢。
圖3 交通流時間周期性
實驗中,采用PeMS-04 和PeMS-08 高速公路數(shù)據集,對其進行歸一化并按照6:2:2 的比例隨機劃分成訓練集、驗證集和測試集。
為了評估模型的性能,將MRSTAN與以下基線方法進行了比較。
T-GCN:它在靜態(tài)圖上進行圖卷積,并結合循環(huán)神經網絡進行交通流預測。
Graph WaveNet:是一種使用自適應圖表示和擴張卷積的深度學習框架。
ASTGCN:它是基于注意力的時空圖卷積網絡,利用時空注意力機制分別對時空動態(tài)進行建模。
STSGCN:利用多個局部的時空子圖模塊直接同步捕獲局部時空相關性。
STGODE:一種基于神經微分方程的交通流預測框架,使用了連續(xù)的圖卷積和擴張卷積進行預測。
所有實驗均在Linux 服務器上進行(CPU:Intel(R)Xeon(R) Gold 5218,GPU:GeForce RTX 2080 Ti)。均采用60 分鐘作為歷史時間窗口,并預測未來60 分鐘的交通流狀況?;€方法都遵循其論文中報告的最佳參數(shù)和結果。對本模型而言,所有隱藏維度都設置為64,采用三階的切比雪夫多項式進行圖卷積,空間模塊層數(shù)為2,Adam 優(yōu)化器的學習率為0.001,采用L1 范數(shù)作為損失函數(shù),使用MAE、RMSE 和MAPE 作為性能指標,batchsize為32,訓練代數(shù)為250。
實驗結果如表1 所示,從中可知,在PeMS-04 上,本文方法各指標均優(yōu)于最佳基線方法STGODE,在PeMS-08數(shù)據集上,MAPE比STGODE略差0.23%,但MAE 和RMSE 分別獲得了2.63%和1.45%的改進,這些結果證明了模型的有效性。
表1 算法實驗結果
為了驗證本方法不同模塊的有效性,設計了兩個變體:①-A:沒有注意力機制;②-F:沒有融合機制。實驗結果見圖4,顯然,兩個變體誤差更大,表明模型的組件都是有效的。此外,沒有融合機制的模型表現(xiàn)最糟糕,表明本文提出的融合模塊的重要性。
圖4 總體誤差
針對交通流預測效果不佳的問題,提出多分辨率時空注意力網絡。先用注意力圖卷積操作獲取空間特征,再用GRU 獲取時間特征,最后融合不同時期的交通流進行預測。實驗表明,該模型優(yōu)于基線方法。未來可以將其應用于其他時空相關性預測問題上,如天氣預測、氣候變化預測等。