張安勤 秦添
摘 要:傳統(tǒng)的交通流量預(yù)測(cè)模型對(duì)歷史數(shù)據(jù)進(jìn)行時(shí)空建模,忽略了交通數(shù)據(jù)的時(shí)間周期性內(nèi)部潛在關(guān)系和交通路網(wǎng)間節(jié)點(diǎn)的距離特征和相似性空間特征。據(jù)此,提出面向交通流量預(yù)測(cè)的多通道時(shí)空編碼器模型MC-STGNN,用于提高交通流量預(yù)測(cè)的準(zhǔn)確率。首先將交通數(shù)據(jù)處理成三通道的周期性時(shí)間序列,并對(duì)整體的序列數(shù)據(jù)進(jìn)行時(shí)間位置編碼和自適應(yīng)的空間位置編碼,提取路網(wǎng)節(jié)點(diǎn)間的動(dòng)態(tài)相關(guān)性;其次引入具有卷積結(jié)構(gòu)的多頭自我注意力機(jī)制,更大程度地捕獲周期數(shù)據(jù)不同程度的時(shí)間相關(guān)性;最后提出一種圖生成器生成新的時(shí)空?qǐng)D,提取路網(wǎng)節(jié)點(diǎn)間的相似性和距離特征,并利用門控圖卷積網(wǎng)絡(luò)整合原始圖和新時(shí)空?qǐng)D的空間信息。在高速公路數(shù)據(jù)集PEMS03和PEMS08上進(jìn)行一小時(shí)的交通流量綜合預(yù)測(cè)實(shí)驗(yàn),結(jié)果表明,MC-STGNN模型與其他的基線模型相比,具有更佳的性能指標(biāo),說明MC-STGNN模型具有更優(yōu)的建模能力。
關(guān)鍵詞:交通流量預(yù)測(cè); 編碼器; 空間位置編碼; 注意力機(jī)制; 圖生成器
中圖分類號(hào):TP391?? 文獻(xiàn)標(biāo)志碼:A?? 文章編號(hào):1001-3695(2024)01-013-0083-05
doi:10.19734/j.issn.1001-3695.2023.06.0209
Traffic flow prediction model based on multi-channel spatial-temporal encoder
Abstract:Traditional traffic flow prediction models model historical data in terms of time and space, ignoring the internal potential temporal periodicity of traffic data and the distance characteristics and similarity spatial characteristics of nodes between traffic networks. Based on this, this paper proposed a multi-channel spatio-temporal encoder model MC-STGNN for traffic flow prediction to improve the accuracy of traffic flow prediction. Firstly, it processed the traffic data into a three channel periodic time series, and encoded the overall sequence data with temporal and adaptive spatial positions to extract dynamic correlations between road network nodes. Secondly, it introduced a multi-heads self-attention mechanism with convolutional structure to capture varying degrees of temporal correlation of periodic data to a greater extent. Finally, it proposed a graph generator to generate a new spatiotemporal map, extracting similarity and distance features between road network nodes, and integrating the spatial information of the original map and the new spatiotemporal map using a gated graph convolutional network. It conducted comprehensive traffic flow prediction experiments for an hour on the highway datasets PEMS03 and PEMS08. The experimental results show that the MC-STGNN model has better performance indicators compared to other baseline models, indicating that the MC-STGNN model has better modeling ability.
Key words:traffic flow prediction; encoder; spatial position coding; attention mechanism; graph generator
0 引言
近年來,全國(guó)汽車保有量持續(xù)增長(zhǎng)。2017—2022年,全國(guó)汽車保有量由2.17億輛增長(zhǎng)至3.15億輛,增長(zhǎng)率為45.16%。汽車給人們的出行帶來了極大的便利,同時(shí)也帶來了日趨嚴(yán)重的擁堵問題。對(duì)于高速公路這一場(chǎng)景而言,其特點(diǎn)為行車速度快、交通流量大、場(chǎng)景封閉性強(qiáng),一旦產(chǎn)生擁堵問題,會(huì)嚴(yán)重影響人們的出行效率。因此,實(shí)現(xiàn)實(shí)時(shí)、高效的交通流量預(yù)測(cè)尤為重要。現(xiàn)有的交通流預(yù)測(cè)方案主要有模型驅(qū)動(dòng)型、數(shù)據(jù)驅(qū)動(dòng)型和深度學(xué)習(xí)三種。模型驅(qū)動(dòng)型方法有差分自回歸移動(dòng)平均模型(autoregressive integrated moving average,ARIMA)[1]、卡爾曼濾波模型[2]等。這些傳統(tǒng)模型局限于預(yù)設(shè)的假定條件和固有的算法結(jié)構(gòu),適用于數(shù)據(jù)量小的預(yù)測(cè)方案,對(duì)于路況復(fù)雜的交通路網(wǎng),無法挖掘出交通流的潛在非線性特征,因此模型預(yù)測(cè)性能不佳。數(shù)據(jù)驅(qū)動(dòng)型方法,如支持向量機(jī)(support vector machine,SVM)[3]、貝葉斯網(wǎng)絡(luò)[4]、K近鄰[5]、梯度提升決策樹(gradient boosting decision tree,GBDT)[6]、VAR[7]等,這類機(jī)器學(xué)習(xí)模型以數(shù)學(xué)基礎(chǔ)作支撐,能夠很好地學(xué)習(xí)交通流數(shù)據(jù)與輸入?yún)?shù)間的非線性映射關(guān)系。然而Kamarianakis等人[7]通過實(shí)驗(yàn)表明,基于ARIMA和VAR的模型無法應(yīng)對(duì)復(fù)雜數(shù)據(jù)的可變性。Drucker等人[8]提出基于支持向量機(jī)的SVR模型,也同樣存在對(duì)高維數(shù)據(jù)處理能力欠佳的問題。此后,深度學(xué)習(xí)模型因其更好的非線性映射能力和高維映射數(shù)據(jù)的處理能力得到更多運(yùn)用。
起初,常見的深度學(xué)習(xí)模型將交通數(shù)據(jù)看作時(shí)序數(shù)據(jù),大多數(shù)研究工作都是基于LSTM(long short-term memory)[9]和GRU(gated recurrent unit)[10]展開的。王慶榮等人[11]采用LSTM捕捉時(shí)間序列的長(zhǎng)期依賴關(guān)系,利用注意力機(jī)制自適應(yīng)地選擇相應(yīng)的驅(qū)動(dòng)序列進(jìn)行建模。這類循環(huán)神經(jīng)網(wǎng)絡(luò)模型在捕獲時(shí)間序列的時(shí)間相關(guān)性方面擁有較好的能力,但它們無法處理交通數(shù)據(jù)空間維度的相關(guān)性。故此,部分學(xué)者嘗試引入圖卷積網(wǎng)絡(luò)(graph convolution network,GCN)[12]處理交通路網(wǎng)的空間特征。DCRNN[13]采用信息擴(kuò)散的GCN模型捕獲交通路網(wǎng)的空間依賴關(guān)系,STGCN[14]模型串聯(lián)一維卷積和 GCN 層分別獲取交通路網(wǎng)的時(shí)間和空間相關(guān)性。Song等人[15] 提出STSGCN模型構(gòu)造時(shí)空同步圖卷積模塊,堆疊多個(gè)GCN用于捕獲復(fù)雜的時(shí)空相關(guān)性和交通流量數(shù)據(jù)存在的時(shí)空異質(zhì)性。然而,數(shù)據(jù)集的預(yù)定義鄰接矩陣的時(shí)序圖結(jié)構(gòu)往往是復(fù)雜且不精確的。Guo等人[16]采用注意力機(jī)制來優(yōu)化模型,圖的動(dòng)態(tài)結(jié)構(gòu)在一定程度上得到完善。同時(shí),為了充分提取時(shí)間周期依賴性,它采用組件的思想來建模交通數(shù)據(jù)的鄰近時(shí)間、天周期和周周期特征。Li等人[17]提出STFGNN模型,通過構(gòu)造各種時(shí)空?qǐng)D學(xué)習(xí)隱藏的時(shí)空依賴關(guān)系。此后,周楚昊等人[18]提出在Transformer的編碼-解碼器網(wǎng)絡(luò)架構(gòu)中,利用通道注意力對(duì)歷史流入數(shù)據(jù)、歷史流出數(shù)據(jù)、混合數(shù)據(jù)進(jìn)行整合。Shin等人[19]提出PGCN模型,通過構(gòu)造適應(yīng)數(shù)據(jù)的漸進(jìn)圖,并結(jié)合擴(kuò)張因果卷積來模擬交通數(shù)據(jù)的時(shí)空相關(guān)性。Jiang等人[20]提出的PDFormer模型,通過不同的掩碼方式,將局部鄰接圖和全局鄰接圖嵌入到自我注意力機(jī)制中,以捕獲長(zhǎng)短距離的空間依賴。
雖然現(xiàn)有的研究已考慮到時(shí)空相關(guān)性,但仍然面臨以下挑戰(zhàn):在空間相關(guān)性的建模中,交通路網(wǎng)的每個(gè)傳感器節(jié)點(diǎn)周圍都有不同數(shù)量的鄰居節(jié)點(diǎn),GCN[12]被廣泛用于提取空間特性。然而GCN過于依賴交通路網(wǎng)的原始結(jié)構(gòu),僅能提取靜態(tài)空間特征,并且GCN的運(yùn)用使深度學(xué)習(xí)模型將附近鄰域的節(jié)點(diǎn)強(qiáng)制賦予相似的節(jié)點(diǎn)特征,忽略了交通路網(wǎng)節(jié)點(diǎn)間的距離特征和節(jié)點(diǎn)之間的相似性在不同時(shí)間周期下的動(dòng)態(tài)關(guān)系。例如,在上下班高峰期,相鄰的住宅區(qū)和辦公樓之間的關(guān)聯(lián)性加強(qiáng),同一道路的節(jié)點(diǎn)間呈現(xiàn)出更強(qiáng)的相似性,節(jié)點(diǎn)之間的距離特征在空間特征中的權(quán)重提高,而節(jié)假日住宅區(qū)與娛樂場(chǎng)所間的關(guān)聯(lián)性更強(qiáng)。針對(duì)該問題,本文采用構(gòu)造圖生成器的方式學(xué)習(xí)路網(wǎng)節(jié)點(diǎn)間的動(dòng)態(tài)距離特征和相似性特征,同時(shí),提出可訓(xùn)練位置編碼,動(dòng)態(tài)地調(diào)整節(jié)點(diǎn)之間的編碼順序。
在時(shí)間相關(guān)性建模中,采用GRU和LSTM模型進(jìn)行預(yù)測(cè),每一步都依賴于前序的預(yù)測(cè)結(jié)果,序列增長(zhǎng)時(shí)容易產(chǎn)生誤差累積問題,同時(shí)無法提取周期規(guī)律。因此,本文采用注意力機(jī)制建模時(shí)間相關(guān)性。同時(shí),以往的周期模型,如ASTGCN[16],分別對(duì)歷史各周期數(shù)據(jù)進(jìn)行建模,導(dǎo)致無法獲取時(shí)間周期性的內(nèi)在關(guān)聯(lián)。此外,在歷史周期序列的建模中,歷史數(shù)據(jù)會(huì)產(chǎn)生不同程度的冗余特征??紤]到上述亟待解決的問題,本文提出了多通道的時(shí)空編碼器模型(MC-STGNN),以期望在時(shí)空維度上構(gòu)建交通數(shù)據(jù)的時(shí)空相關(guān)性,提高高速路網(wǎng)的交通流預(yù)測(cè)精度。
本文主要工作如下:
a)提出了基于編碼器架構(gòu)的三通道時(shí)空預(yù)測(cè)模型(MC-STGNN),實(shí)現(xiàn)在同一架構(gòu)下建模交通路網(wǎng)的周、日、鄰近等關(guān)系的周期性內(nèi)部關(guān)系。同時(shí),針對(duì)不同周期,對(duì)多頭注意力機(jī)制應(yīng)用不同的卷積策略,以過濾并提取不同周期的時(shí)間依賴關(guān)系。
b)對(duì)三通道數(shù)據(jù)應(yīng)用時(shí)空位置編碼,提出了可訓(xùn)練的空間位置編碼,對(duì)空間維度的異質(zhì)性進(jìn)行建模,自適應(yīng)地調(diào)節(jié)節(jié)點(diǎn)間的動(dòng)態(tài)空間相關(guān)性。
c)提出了一種基于節(jié)點(diǎn)相似性和距離度量的圖生成器,捕獲不同周期條件下交通路網(wǎng)節(jié)點(diǎn)之間的交通模式特征,然后構(gòu)造門控圖卷積(G-GCN)來整合原始鄰接圖和構(gòu)造圖的空間信息。
1 MC-STGNN模型設(shè)計(jì)
1.1 問題定義
在智能交通系統(tǒng)中,交通數(shù)據(jù)中蘊(yùn)涵了非常多的信息可用于交通流量預(yù)測(cè)。在本文中,交通路網(wǎng)被描述為無向圖,其拓?fù)浣Y(jié)構(gòu)為G=(V,E),其中V表示為圖G的節(jié)點(diǎn)集合,包含N個(gè)節(jié)點(diǎn),E為反映節(jié)點(diǎn)連通性的邊集。由節(jié)點(diǎn)集V與邊集E所構(gòu)成的鄰接矩陣為A∈RApN×N。
圖G中N個(gè)節(jié)點(diǎn)在t時(shí)刻收集的數(shù)據(jù)表示為特征矩陣Xt∈RApN×C,其中C為節(jié)點(diǎn)的特征數(shù)量。給定歷史T時(shí)段的交通流量,預(yù)測(cè)未來P時(shí)段的交通流量,預(yù)測(cè)過程如式(1)所示。
{Yt+1,…,Yt+P}=f(Xt-T,…,Xt)(1)
其中:Yt+1表示t+1時(shí)刻的預(yù)測(cè)數(shù)據(jù);f(·)表示預(yù)測(cè)方法的映射函數(shù)。
1.2 MC-STGNN模型框架
MC-STGNN模型如圖1所示,采用基于卷積的多頭自我注意力機(jī)制(Conv-Attention)[21]和基于構(gòu)造圖的門控圖卷積G-GCN的編碼器模型架構(gòu)。首先將歷史交通流量數(shù)據(jù)處理成周周期(Xw)、天周期(Xd)、近期段(Xr)的三通道時(shí)空數(shù)據(jù),經(jīng)過時(shí)空位置編碼的加權(quán)編碼策略,為交通路網(wǎng)的各節(jié)點(diǎn)賦予隨時(shí)間步變化的動(dòng)態(tài)位置特征;其次,經(jīng)過多層編碼器模型迭代計(jì)算;最后,編碼器的輸出序列切片為周期性輸出序列,即周周期(Yw)、天周期(Yd)、近期段(Yr),將這三個(gè)切片序列加權(quán)并映射到一維進(jìn)行預(yù)測(cè)。為充分獲取周期數(shù)據(jù)的隱藏時(shí)空相關(guān)性并捕獲周期性數(shù)據(jù)的內(nèi)在關(guān)聯(lián),將周期數(shù)據(jù)作為整體輸入到編碼器模型,其中每個(gè)模塊之間采用殘差連接和層規(guī)范化,增強(qiáng)模型的泛化能力。注意力模塊在捕獲周期數(shù)據(jù)時(shí)間依賴性的前提下,對(duì)不同的周期通道應(yīng)用不同的一維卷積,有助于過濾歷史數(shù)據(jù)的冗余信息。門控圖卷積模塊G-GCN利用構(gòu)造的基于節(jié)點(diǎn)相似性和距離度量的圖生成器,實(shí)現(xiàn)對(duì)交通路網(wǎng)節(jié)點(diǎn)的空間特征關(guān)系提取,門控機(jī)制有助于整合原始圖的空間信息。
1.3 時(shí)間位置編碼
MC-STGNN模型是基于編碼器的架構(gòu)設(shè)計(jì)的,為確保輸入序列的順序性,對(duì)模型應(yīng)用位置編碼的策略,利用時(shí)間位置編碼建模時(shí)間特征,同時(shí)利用空間位置編碼策略來捕獲交通路網(wǎng)的空間異質(zhì)性。最終,應(yīng)用加權(quán)融合的方式聯(lián)合編碼位置信息。
利用式(2)將三通道的周期數(shù)據(jù)映射為編碼器結(jié)構(gòu)所在維度dmodel,t表示所在時(shí)間片,d為校驗(yàn)參數(shù),區(qū)分奇偶。
1.4 空間位置編碼
以往的位置編碼大多忽略了交通路網(wǎng)的空間特征,例如周楚昊等人[18]將交通流數(shù)據(jù)進(jìn)行獨(dú)熱(one-hot)編碼后拼接來進(jìn)行位置編碼,使得向量離散化,但容易產(chǎn)生編碼零頻問題,需要進(jìn)行平滑處理。因此本文提出可訓(xùn)練的空間位置編碼,在描述空間異質(zhì)性的基礎(chǔ)上,動(dòng)態(tài)調(diào)整各節(jié)點(diǎn)的編碼信息。做法如下:
MLP(X)=W3(W2(W1(X)+b1)+b2)+b3(3)
針對(duì)N個(gè)路網(wǎng)節(jié)點(diǎn)進(jìn)行0~N-1的順序編碼,采用多層感知機(jī)(MLP)網(wǎng)絡(luò)學(xué)習(xí)節(jié)點(diǎn)間的空間相關(guān)性,如式(3)所示,其預(yù)訓(xùn)練結(jié)果記為H(0)。其中,W1∈RApdmodel×2dmodel、W2∈RApdmodel×2dmodel、W3∈RApdmodel×2dmodel;b1、b2、b3均為偏置參數(shù)。為解決節(jié)點(diǎn)位置編碼的平滑問題,本文對(duì)預(yù)訓(xùn)練結(jié)果做如下操作:
H(i)=(1-α)H(0)+α(IN+D-12AD-12)H(i-1)(4)
本文設(shè)計(jì)了一種迭代器來實(shí)現(xiàn)平滑,同時(shí)使得節(jié)點(diǎn)的位置編碼強(qiáng)制靠近其鄰居節(jié)點(diǎn)。其中IN∈RApN×N為單位矩陣;D∈RApN×N為鄰接矩陣A的度矩陣;α為調(diào)控因子,取值為0~1。將歸一化鄰接矩陣與迭代器的上一次隱藏輸出狀態(tài)結(jié)合,使其聚合交通路網(wǎng)的鄰域信息,同時(shí)為每一個(gè)隱藏狀態(tài)添加原預(yù)訓(xùn)練結(jié)果。空間位置編碼的輸出結(jié)果H(i)記為SPE。最終,MC-STGNN的位置編碼如式(5)所示,H(i)為規(guī)范化矩陣激活函數(shù)。
PE=softmax(TPE+SPE)(5)
1.5 時(shí)間相關(guān)性模塊
注意力機(jī)制能夠有效提取時(shí)間依賴,王慶榮等人[11]將LSTM和注意力機(jī)制相融合進(jìn)行預(yù)測(cè),但并不能處理長(zhǎng)序列的時(shí)空數(shù)據(jù)。多頭自我注意力機(jī)制[21]對(duì)長(zhǎng)序列數(shù)據(jù)預(yù)測(cè)具有更佳的表現(xiàn)。本文采用多頭自我注意力機(jī)制建模目標(biāo)序列上下文的時(shí)間相關(guān)性,如圖2所示。
Conv-Attention的計(jì)算過程如下:
a)Conv-Attention的輸入Q(query)、K(key)、V(value)全部為三通道的輸入序列[Xw;Xd;Xr]。
{Q、K、V}=[Xw;Xd;Xr](6)
b)為了更好地挖掘交通路網(wǎng)的潛在時(shí)空相關(guān)性,同時(shí)過濾歷史周期數(shù)據(jù)的冗余特征,本文對(duì)Q、K、V進(jìn)行一維卷積操作。具體計(jì)算過程如下:
其中:表示卷積操作;Θd、Θc表示卷積核參數(shù);Θd表示一維因果卷積;Θc表示一維標(biāo)準(zhǔn)卷積;Concat表示拼接操作;ReLU為非線性激活函數(shù);dmodel為各通道的模型維度;softmax激活函數(shù)可規(guī)范化注意力系數(shù)。
如圖3所示,對(duì)PEMS數(shù)據(jù)集進(jìn)行隨機(jī)抽取可發(fā)現(xiàn),在天周期數(shù)據(jù)Xd中,周五和周三、周四的交通流量數(shù)據(jù)具有較大程度的差異性。為減少因時(shí)間間隔較遠(yuǎn)而產(chǎn)生的差異性,對(duì)來自周周期、天周期的數(shù)據(jù)Xw和Xd的Q值作一維因果卷積。由于近期段數(shù)據(jù)與待預(yù)測(cè)數(shù)據(jù)間具有更強(qiáng)的時(shí)空相似性,采用標(biāo)準(zhǔn)一維卷積可減少對(duì)強(qiáng)時(shí)空相似性的過濾。
1.6 圖生成器
為了更好地表示交通路網(wǎng)節(jié)點(diǎn)間的拓?fù)潢P(guān)系,設(shè)計(jì)了一種圖生成器來構(gòu)建新的鄰接矩陣Aw∈RApN×N,從時(shí)間序列中捕獲動(dòng)態(tài)的節(jié)點(diǎn)相似性和距離特征。首先計(jì)算在時(shí)間序列中節(jié)點(diǎn)間的成對(duì)余弦相似性Sij,用于描述節(jié)點(diǎn)隨時(shí)間動(dòng)態(tài)變化的相似性特征,如式(12)所示。
為了準(zhǔn)確反映節(jié)點(diǎn)間的相似性度量,構(gòu)造P∈RApN×N矩陣來學(xué)習(xí)節(jié)點(diǎn)的相似性。其中Wij∈RApN×N是訓(xùn)練的權(quán)重參數(shù),τ~為調(diào)控因子,初始值為0.5,AI∈RApN×N為單位矩陣。為過濾低階的節(jié)點(diǎn)相似性,對(duì)矩陣P中相似度值小于1的成對(duì)節(jié)點(diǎn)賦值為0。其計(jì)算結(jié)果如式(13)所示。
構(gòu)造矩陣Dij∈RApN×N,用于反映交通路網(wǎng)的距離特征,計(jì)算過程如式(14)所示。
Dij=ln(dist(vi,vj)2+Aone)(14)
其中:dist為節(jié)點(diǎn)vi和vj間的距離值;Aone∈RApN×N為全1矩陣。最終,圖生成器Aw如式(15)所示,k為相似性矩陣P的階數(shù),Wadj∈RApN×N為可訓(xùn)練參數(shù),學(xué)習(xí)節(jié)點(diǎn)間基于距離的拓?fù)涮卣?,使用ReLU激活函數(shù)消除矩陣間的弱連接。
1.7 門控圖卷積
空間圖卷積(GCN)的計(jì)算方式如式(16)所示。
其中:X為輸入的時(shí)間序列;IN為單位矩陣;D為度矩陣;W為投影矩陣。本文設(shè)計(jì)了門控圖卷積(G-GCN),G-GCN將構(gòu)造的圖生成器參與到空間圖卷積的運(yùn)算中。G-GCN的具體計(jì)算過程如式(17)所示。
其中:Aw為1.6節(jié)圖生成器的輸出矩陣;σ為非線性的激活函數(shù)sigmoid;W1、W2為投影矩陣,將模型投影到輸出維度dmodel。G-GCN在捕獲低階有效空間信息的基礎(chǔ)上,挖掘了交通流中潛在的節(jié)點(diǎn)關(guān)系,從相似性度量和距離度量角度提高卷積對(duì)路網(wǎng)鄰接關(guān)系的深度挖掘能力。
2 實(shí)驗(yàn)
為了驗(yàn)證MC-STGNN模型在周期性交通流量預(yù)測(cè)的有效性,同時(shí)驗(yàn)證圖生成器在不同路網(wǎng)規(guī)模的性能,本文選取了來自PEMS系統(tǒng)(http://pems.dot.ca.gov)的高速公路數(shù)據(jù)集PEMS03與PEMS08來開展實(shí)驗(yàn)。PEMS03數(shù)據(jù)集的時(shí)間為2018年9月1日~2018年11月30日,傳感器節(jié)點(diǎn)的個(gè)數(shù)為358個(gè);PEMS08數(shù)據(jù)集的時(shí)間為2016年7月1日~2016年8月31日,傳感器節(jié)點(diǎn)的個(gè)數(shù)為170個(gè)。
2.1 數(shù)據(jù)集預(yù)處理
PEMS03與PEMS08數(shù)據(jù)集以5 min為一個(gè)時(shí)間窗,交通路網(wǎng)中各傳感器24 h可收集288條交通流數(shù)據(jù),本文挑選交通流量特征進(jìn)行預(yù)測(cè)。如圖4所示,每個(gè)數(shù)據(jù)集均劃分為周周期Xw、天周期Xd、近期段Xr的三通道數(shù)據(jù)X(h)。將樣本的當(dāng)前時(shí)刻設(shè)為t,歷史時(shí)間步長(zhǎng)設(shè)為T,一天的時(shí)間步數(shù)為q。數(shù)據(jù)集的表現(xiàn)形式如下:
Xr=(Xt-T+1,Xt-T+2,…,Xt)(18)
Xd=(Xt-q+1,Xt-q+2,…,Xt-q+T)(19)
Xw=(Xt-7×q+1,Xt-7×q+2,…,Xt-7×q+T)(20)
X(h)=[Xw;Xd;Xr](21)
本文將劃分好的數(shù)據(jù)集分割為訓(xùn)練集、驗(yàn)證集、測(cè)試集,比例為6∶2∶2。為了規(guī)范化數(shù)據(jù),將數(shù)據(jù)集作min-max歸一化處理,其中,樣本最小值為min,最大值為max,具體操作如下:
2.2 評(píng)價(jià)指標(biāo)
為了評(píng)價(jià)MC-STTGNN模型的性能,分別采用平均絕對(duì)誤差(mean absolute error,MAE)、平均絕對(duì)百分比誤差(mean absolute percent error, MAPE)和均方根誤差(root mean square error,RMSE)對(duì)模型進(jìn)行評(píng)估。
2.3 實(shí)驗(yàn)設(shè)置
本文將MC-STGNN模型與傳統(tǒng)的統(tǒng)計(jì)學(xué)模型和機(jī)器學(xué)習(xí)模型(VAR[7]、SVR[8]),深度學(xué)習(xí)基線模型(LSTM[9]、DCRNN[13]、STGCN[14]、ASTGCN[16]、STSGCN[15]、STFGNN[17]、PGCN[19]、PDFormer[20])進(jìn)行對(duì)比實(shí)驗(yàn)。為了通過驗(yàn)證集測(cè)試出最優(yōu)的模型參數(shù),并用于測(cè)試集上得出模型的預(yù)測(cè)性能,將PEMS03和PEMS08數(shù)據(jù)集劃分為三部分,其用途和占比分別為訓(xùn)練集60%、驗(yàn)證集20%、測(cè)試集20%。所有實(shí)驗(yàn)均在Linux服務(wù)器(CPU為IntelCoreTM i7-10700 CPU@2.90 GHz,GPU為NVIDIA GeForce RTX 3070),PyTorch框架進(jìn)行編譯和測(cè)試。實(shí)驗(yàn)采用Adam優(yōu)化器對(duì)模型進(jìn)行訓(xùn)練,使用平均絕對(duì)誤差(MAE)作為損失函數(shù),其計(jì)算方式如式(23)所示。
為了公平比較,各方法的超參數(shù)設(shè)置和訓(xùn)練策略在PEMS03和PEMS08數(shù)據(jù)集上均保持一致。表1為MC-STGNN模型的超參數(shù)設(shè)置,其中,Layers表示編碼器的層數(shù),T表示各通道的歷史時(shí)間步長(zhǎng),Dmodel表示各通道的模型維度,Heads表示多頭自我注意力機(jī)制中的注意力的頭數(shù)。
2.4 實(shí)驗(yàn)結(jié)果
PEMS03數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表2所示。本文對(duì)比了未來一小時(shí)交通流量的預(yù)測(cè)性能,其中,最優(yōu)結(jié)果加粗表示,次優(yōu)結(jié)果用“*”號(hào)表示。可以看到,MC-STGNN的未來一小時(shí)綜合預(yù)測(cè)具有很好的表現(xiàn)。VAR、SVR模型不能很好地處理非線性高維數(shù)據(jù),預(yù)測(cè)誤差較大,而LSTM模型忽略了交通路網(wǎng)的空間相關(guān)性,因此性能表現(xiàn)不佳。在考慮時(shí)空相關(guān)性的深度學(xué)習(xí)模型DCRNN、STGCN、ASTGCN、STSGCN、STFGNN、PGCN、PDFormer上,模型預(yù)測(cè)效果有很大提升。MC-STGNN模型對(duì)比基線模型PDFormer在MAE、RMSE上的預(yù)測(cè)效果分別下降了0.01和0.03,在MAPE上對(duì)比STFGNN僅相差0.21%,同時(shí)優(yōu)于其他所有模型。
在PEMS08數(shù)據(jù)集上,對(duì)MC-STGNN疊加4層編碼器層,同時(shí)將模型映射到更高維度,如表3所示,MC-STGNN獲得了最佳的綜合性能表現(xiàn)。對(duì)比基線模型PDFormer,MC-STGNN在MAE和RMSE上分別下降了0.07%和0.02%,在MAPE上相差0.53%。
綜上,在PEMS03和PEMS08數(shù)據(jù)集上,對(duì)比一小時(shí)的綜合預(yù)測(cè)結(jié)果,MC-STGNN模型較其他模型有顯著提升。在長(zhǎng)時(shí)預(yù)測(cè)中具有低誤差優(yōu)勢(shì),對(duì)非線形和復(fù)雜的交通流量數(shù)據(jù)具有更好的建模能力。為了反映MC-STGNN模型在具體應(yīng)用中的直觀結(jié)果,在PEMS03和PEMS08數(shù)據(jù)集上與PDFormer模型進(jìn)行預(yù)測(cè)效果對(duì)比,如圖5所示。
圖5為同一節(jié)點(diǎn)上進(jìn)行未來一小時(shí)預(yù)測(cè)的可視化結(jié)果。對(duì)比于最新的基線模型PDFormer,可見MC-STGNN模型具有更好的擬合效果,預(yù)測(cè)結(jié)果更加接近真實(shí)值,因此在實(shí)際應(yīng)用中的預(yù)測(cè)效果更好。
2.5 消融研究
為了驗(yàn)證MC-STGNN模型各模塊的有效性,本文在PEMS08數(shù)據(jù)集上開展消融實(shí)驗(yàn),探究本文模型的位置編碼、Conv-Attention、G-GCN對(duì)預(yù)測(cè)性能的影響,結(jié)果如圖6~8所示。
如圖6~8所示,本文探求了不同模塊對(duì)未來一小時(shí)內(nèi)交通流量預(yù)測(cè)的作用。其中:圖6中MC-STGNN-noSE表示去除空間位置編碼,只對(duì)序列進(jìn)行時(shí)間位置編碼;圖7中MC-STGNN-noConv表示去除對(duì)多頭注意力機(jī)制的卷積操作,采用原始多頭注意力機(jī)制;圖8中MC-STGNN-noGGCN表示在門控圖卷積G-GCN中去除GGCN,只采用GCN捕獲空間相關(guān)性。實(shí)驗(yàn)結(jié)果表明,不同程度的消融均對(duì)預(yù)測(cè)結(jié)果產(chǎn)生了較大的影響。多頭注意力機(jī)制的卷積操作和基于圖生成器的圖卷積GGCN對(duì)模型預(yù)測(cè)效果有積極影響。
2.6 參數(shù)研究
為探究MC-STGNN模型中超參數(shù)對(duì)模型性能的影響,本文對(duì)自編碼器的層數(shù)Layers、多通道的模型維度Dmodel和注意力頭數(shù)Heads在PEMS03數(shù)據(jù)集上進(jìn)行對(duì)照實(shí)驗(yàn)。
如圖9~11所示,MC-STGNN在編碼器層數(shù)為4、模型維度為32、注意力頭數(shù)為8時(shí)具有最佳的綜合性能。
3 結(jié)束語(yǔ)
本文提出了多通道時(shí)空編碼器模型MC-STGNN,用于交通流量預(yù)測(cè)。MC-STGNN模型將輸入數(shù)據(jù)建模為多通道的周期性數(shù)據(jù),從整體相關(guān)性角度挖掘周周期、天周期、近期段數(shù)據(jù)間的內(nèi)在關(guān)聯(lián)性。通過時(shí)空位置編碼,學(xué)習(xí)節(jié)點(diǎn)的時(shí)空相關(guān)性和空間異質(zhì)性。然后,通過基于卷積結(jié)構(gòu)的多頭自我注意力機(jī)制進(jìn)一步捕獲時(shí)間依賴,并消除了對(duì)歷史周期數(shù)據(jù)的冗余關(guān)注。同時(shí),設(shè)計(jì)了基于相似性度量和距離度量的圖生成器構(gòu)造全新的鄰接矩陣,利用門控圖卷積聚合構(gòu)造圖和原始圖的空間特征。在公共真實(shí)數(shù)據(jù)集PEMS03和PEMS08上進(jìn)行實(shí)驗(yàn),結(jié)果表明,MC-STGNN模型的預(yù)測(cè)性能優(yōu)于其他的基線模型。下一步將繼續(xù)探究MC-STGNN模型對(duì)復(fù)雜城市交通路網(wǎng)的預(yù)測(cè)效果。
參考文獻(xiàn):
[1]唐毅,劉衛(wèi)寧,孫棣華,等.改進(jìn)時(shí)間序列模型在高速公路短時(shí)交通流量預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2015,32(1):146-149.(Tang Yi, Liu Weining, Sun Dihua, et al. Application of improved time series model in forecasting of short-term traffic flow for freeway[J].Application Research of Computers,2015,32(1):146-149.)
[2]Kumar S V. Traffic flow prediction using Kalman filtering technique[J].Procedia Engineering,2017,187:582-587.
[3]Feng Xinxin, Ling Xianyao, Zheng Haifeng, et al. Adaptive multi-kernel SVM with spatial-temporal correlation for short-term traffic flow prediction[J].IEEE Trans on Intelligent Transportation Systems,2019,20(6):2001-2013.
[4]王永恒,高慧,陳炫伶.采用變結(jié)構(gòu)動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的交通流量預(yù)測(cè)[J].計(jì)算機(jī)科學(xué)與探索,2017,11(4):528-538.(Wang Yong-heng, Gao Hui, Chen Xuanling. Traffic prediction method using structure varying dynamic Bayesian networks[J].Journal of Frontiers of Computer Science and Technology,2017,11(4):528-538.)
[5]祁朵,毛政元.基于自適應(yīng)時(shí)序剖分與KNN的短時(shí)交通流量預(yù)測(cè)[J].地球信息科學(xué)學(xué)報(bào),2022,24(2):339-351.(Qi Duo, Mao Zhengyuan. Short-term traffic flow prediction based on adaptive time slice and KNN[J].Journal of Geo-Information Science,2022,24(2):339-351.)
[6]鄧晶,張倩.交通流數(shù)據(jù)自適應(yīng)特征選擇算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2019,29(12):76-80.(Deng Jing, Zhang Qian. Adaptive feature selection algorithm for traffic flow data[J].Computer Techno-logy and Development,2019,29(12):76-80.)
[7]Kamarianakis Y, Vouton V. Forecasting traffic flow conditions in an urban network:comparison of multivariate and univariate approaches[J].Transportation Research Record Journal of the Transportation Research Board,2003,1857(1):74-84.
[8]Drucker H, Burges C J C, Kaufman L, et al. Support vector regression machines[C]//Proc of the 9th International Conference on Neural Information Processing Systems.La Jolla,CA:NIPS Press,1997:779-784.
[9]Ma Xiaolei, Tao Zhimin, Wang Yinhai, et al. Long short-term me-mory neural network for traffic speed prediction using remote microwave sensor data[J].Transportation Research Part C: Emerging Technologies,2015,54:187-197.
[10]Fu Rui, Zhang Zuo, Li Li. Using LSTM and GRU neural network methods for traffic flow prediction[C]//Proc of the 31st Youth Academic Annual Conference of Chinese Association of Automation.Piscataway,NJ:IEEE Press,2016:324-328.
[11]王慶榮,田可可,朱昌鋒,等.融合多因素的短時(shí)交通流預(yù)測(cè)研究[J].計(jì)算機(jī)工程與應(yīng)用,2022,58(21):309-316.(Wang Qing-rong, Tian Keke, Zhu Changfeng, et al. Short term traffic prediction based on multi-factors[J].Computer Engineering and Applications,2022,58(21):309-316.)
[12]Deferard M, Breson X, Vandergheynst P. Convolutional neural networks on graphs with fast localized spectral filtering[C]//Proc of the 30th International Conference on Neural Information Processing Systems.La Jolla,CA:NIPS Press,2016:3844-3852.
[13]Li Yaguang, Yu R, Shahabi C. Diffusion convolutional recurrent neural network:data-driven traffic forecasting[EB/OL].(2018)[2021-03-10].https://doi.org/10.48550/arXiv.1707.01926.
[14]Yu Bing, Yin Haoteng, Zhu Zhanxing. Spatio-temporal graph convolutional networks:a deep learning framework for traffic forecasting[EB/OL].(2018-07-12).https://doi.org/10.48550/arXiv.1709.04875.
[15]Song Chao, Lin Youfang, Guo Shengnan, et al. Spatial-temporal synchronous graph convolutional networks:a new framework for spatial-temporal network data forecasting[C]//Proc of the 34th AAAI Confe-rence on Artificial Intelligence.Palo Alto,CA:AAAI Press,2020:914-921.
[16]Guo Shengnan, Lin Youfang, Feng Ning, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]//Proc of the 33rd AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2019:922-929.
[17]Li Mengzhang, Zhu Zhanxing. Spatial-temporal fusion graph neural networks for traffic flow forecasting[C]//Proc of the 35th AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2021:4189-4196.
[18]周楚昊,林培群.基于多通道Transformer的交通量預(yù)測(cè)方法[J].計(jì)算機(jī)應(yīng)用研究,2023,40(2):435-439.(Zhou Chuhao, Lin Peiqun. Traffic flow prediction method based on multi-channel Transformer[J].Application Research of Computers,2023,40(2):435-439.)
[19]Shin Y, Yoon Y. PGCN: progressive graph convolutional networks for spatial-temporal traffic forecasting[EB/OL].(2022)[2022-02-18].https://doi.org/10.48550/arXiv.2202.08982.
[20]Jiang Jiawei, Han Chengkai, Zhao W X, et al. PDFormer: propagation delay-aware dynamic long-range transformer for traffic flow prediction[EB/OL].(2023)[2023-05-04].https://doi.org/10.48550/arXiv.2301.0794.
[21]Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[C]//Proc of the 31st International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2017:6000-6010.