王竟成,張 勇,胡永利,尹寶才
(1.北京工業(yè)大學(xué)信息學(xué)部,北京 100124;2.北京工業(yè)大學(xué)多媒體與智能軟件技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124)
隨著城市化進(jìn)程的加快以及交通數(shù)據(jù)的爆炸式增長(zhǎng),智慧交通的重要性日益顯著,而交通預(yù)測(cè)則是智慧交通發(fā)展的基石.精準(zhǔn)的交通預(yù)測(cè)對(duì)于許多實(shí)際交通應(yīng)用至關(guān)重要.例如:路面交通的車(chē)速及流量預(yù)測(cè)對(duì)于公眾出行路徑規(guī)劃以及交通指揮智能調(diào)控等需求具有重要意義;軌道交通客流預(yù)測(cè)對(duì)于站點(diǎn)客流壓力測(cè)試以及線(xiàn)路時(shí)刻安排同樣至關(guān)重要;對(duì)于網(wǎng)約車(chē)的用車(chē)需求預(yù)測(cè)則可以協(xié)助網(wǎng)約車(chē)公司動(dòng)態(tài)分配運(yùn)營(yíng)車(chē)輛,從而實(shí)現(xiàn)調(diào)度效率最大化.
交通預(yù)測(cè)問(wèn)題有多種分類(lèi)方式,針對(duì)不同的預(yù)測(cè)任務(wù),可概括為流量預(yù)測(cè)、速度預(yù)測(cè)、到達(dá)時(shí)間預(yù)測(cè)以及交通需求預(yù)測(cè)等.根據(jù)交通預(yù)測(cè)的實(shí)際場(chǎng)景可分類(lèi)為高峰期預(yù)測(cè)、平峰期預(yù)測(cè)以及異常狀況下的預(yù)測(cè)等.對(duì)于交通預(yù)測(cè)問(wèn)題的劃分同時(shí)側(cè)面反映了交通預(yù)測(cè)模型對(duì)于實(shí)時(shí)性、準(zhǔn)確性以及異常狀況下的可靠性要求.
不同于其他時(shí)序預(yù)測(cè)問(wèn)題,交通預(yù)測(cè)的主要挑戰(zhàn)在于包含路網(wǎng)結(jié)構(gòu)拓?fù)溥B接關(guān)系在內(nèi)的復(fù)雜耦合關(guān)聯(lián)關(guān)系及其不斷變化的時(shí)空特征.空間上,路網(wǎng)中相鄰節(jié)點(diǎn)存在著直接相互影響的強(qiáng)關(guān)聯(lián)關(guān)系,非相鄰節(jié)點(diǎn)在交通流模式上也存在著基于交通出行起止點(diǎn)(origin-destination,OD)的隱含空間關(guān)聯(lián).時(shí)間上,交通數(shù)據(jù)呈現(xiàn)出極強(qiáng)的時(shí)變性與周期性,例如早高峰與晚高峰、周中與周末等.
傳統(tǒng)的基于數(shù)理統(tǒng)計(jì)的方法以及經(jīng)典機(jī)器學(xué)習(xí)方法往往針對(duì)路網(wǎng)中某一觀測(cè)點(diǎn)的時(shí)序數(shù)據(jù)進(jìn)行建模分析以及預(yù)測(cè).較有代表性的方法有歷史平均值(historical average,HA)[1-2]、整合移動(dòng)平均自回歸(autoregressive integrated moving average,ARIMA)模型[3-5]、卡爾曼濾波模型(Kalman filtering model)[6]、非參數(shù)回歸模型(nonparametric regressive model)[7]以及動(dòng)態(tài)模式分解(dynamic mode decomposition)[8]等.后續(xù)隨著深度學(xué)習(xí)的發(fā)展,端到端的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[9]、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)[10]及其變體長(zhǎng)短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)[11]以及門(mén)控循環(huán)單元(gated recurrent units,GRU)[11]等網(wǎng)絡(luò)模型被廣泛用于時(shí)序預(yù)測(cè)問(wèn)題.
上述方法可以捕獲時(shí)序數(shù)據(jù)的非線(xiàn)性特征,但針對(duì)單個(gè)節(jié)點(diǎn)的時(shí)序預(yù)測(cè)難以描述節(jié)點(diǎn)之間的相互影響.依賴(lài)路網(wǎng)結(jié)構(gòu)的交通預(yù)測(cè)問(wèn)題顯然無(wú)法滿(mǎn)足對(duì)單節(jié)點(diǎn)的逐一分析.雖然部分傳統(tǒng)方法考慮了交通拓?fù)浣Y(jié)構(gòu)中觀測(cè)點(diǎn)之間的連接屬性,但并未進(jìn)行充分利用[12].路網(wǎng)作為一種離散化非規(guī)則排列且易受距離影響的結(jié)構(gòu),圖表示以及圖卷積網(wǎng)絡(luò)(graph convolutional network,GCN)[13]被自然地應(yīng)用于交通預(yù)測(cè)問(wèn)題且取得了優(yōu)異的結(jié)果.
在交通預(yù)測(cè)領(lǐng)域,由于交通數(shù)據(jù)特有的時(shí)序及空間特征,誕生了許多基于圖卷積的方法模型[14],實(shí)現(xiàn)了對(duì)交通數(shù)據(jù)時(shí)空特征的提取.本文針對(duì)基于GCN的交通流預(yù)測(cè)模型進(jìn)行歸納總結(jié).
首先給出本文以及相關(guān)文獻(xiàn)中常見(jiàn)通用的符號(hào)定義.
表1 符號(hào)定義Table 1 Symbol definition
一般地,G=(V;E;W)用于表示交通預(yù)測(cè)問(wèn)題中常用的無(wú)向帶權(quán)圖[15].A表示圖的鄰接矩陣(adjacency matrix),定義節(jié)點(diǎn)之間的相互連通關(guān)系.H為關(guān)聯(lián)矩陣(incidence matrix),用于定義圖中邊與節(jié)點(diǎn)之間的連接,其中元素的定義為
(1)
對(duì)于圖中的節(jié)點(diǎn),其度矩陣Dv中元素定義為連接到該節(jié)點(diǎn)所有邊的權(quán)重之和,即
(2)
相似地,De中元素定義為連接到該邊的節(jié)點(diǎn)數(shù)量之和,即
(3)
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)局限于對(duì)歐氏空間數(shù)據(jù)進(jìn)行建模,而圖卷積操作利用圖表示對(duì)非歐氏空間數(shù)據(jù)進(jìn)行處理,使卷積操作更加適用于交通數(shù)據(jù)結(jié)構(gòu).圖卷積操作主要包括基于空域以及頻域的圖卷積2類(lèi).空域圖卷積將圖卷積操作定義為圖中相鄰節(jié)點(diǎn)之間的特征信息的聚合,基于頻域的圖卷積則利用圖信號(hào)處理(graph signal processing),引入濾波器實(shí)現(xiàn)頻域圖卷積的推導(dǎo).
1.2.1 空域圖卷積
與深度學(xué)習(xí)中常用的例如圖像等歐氏空間的卷積相比,圖結(jié)構(gòu)中由于節(jié)點(diǎn)數(shù)量及連接關(guān)系的不確定性,難以通過(guò)固定大小可學(xué)習(xí)的卷積核對(duì)特征進(jìn)行提取.針對(duì)此問(wèn)題,空域圖卷積從節(jié)點(diǎn)域出發(fā),通過(guò)特征的聚集直接在圖上定義卷積操作以找到適用于圖的可學(xué)習(xí)圖卷積核.該過(guò)程將某中心節(jié)點(diǎn)與周?chē)従庸?jié)點(diǎn)的信息通過(guò)定義的聚合函數(shù)進(jìn)行聚合,實(shí)現(xiàn)中心節(jié)點(diǎn)的特征更新.空域圖卷積的通用聚合函數(shù)在消息傳遞神經(jīng)網(wǎng)絡(luò)(message passing neural network,MPNN)[16]中的定義被廣泛應(yīng)用.該網(wǎng)絡(luò)提出一種空域圖卷積的形式化框架,即空域卷積被分解為消息傳遞與狀態(tài)更新2個(gè)過(guò)程,分別表示為Ml(·)與Ul(·).該框架可表示為
(4)
式中:u和v均為圖中節(jié)點(diǎn);hl為圖卷積在第l層的特征,即該框架中各節(jié)點(diǎn)在第l層的信息通過(guò)Ml(·)函數(shù)聚合后通過(guò)Ul(·)函數(shù)實(shí)現(xiàn)第l+1層的特征更新.MPNN實(shí)現(xiàn)了對(duì)于整張圖進(jìn)行空域卷積操作,但面對(duì)龐大的圖時(shí)全圖卷積的方法需要占用過(guò)多計(jì)算資源.GraphSAGE[17]則針對(duì)此缺陷利用節(jié)點(diǎn)鄰居的特征信息通過(guò)采樣和聚集進(jìn)行學(xué)習(xí).該模型通過(guò)訓(xùn)練聚合器函數(shù)實(shí)現(xiàn)節(jié)點(diǎn)鄰域的信息聚合.來(lái)自給定節(jié)點(diǎn)的不同跳數(shù)的或深度的信息可通過(guò)聚合器進(jìn)行特征抽取并計(jì)算節(jié)點(diǎn)處的損失,實(shí)現(xiàn)節(jié)點(diǎn)特征的嵌入.GraphSAGE中提出了3種聚合器,分別為均值聚合器、LSTM聚合器以及池化聚合器.以L(fǎng)STM聚合器為例,其表達(dá)式為
(5)
該聚合器將節(jié)點(diǎn)的前一層表示與聚合的鄰居信息進(jìn)行級(jí)聯(lián).Liu等[18]則通過(guò)GraphSAGE模型的均值聚合器進(jìn)行了路面交通的短期車(chē)流速度預(yù)測(cè).其均值聚合器表示為
(6)
節(jié)點(diǎn)v是在節(jié)點(diǎn)u的周?chē)诠潭ㄩL(zhǎng)度上隨機(jī)游走的節(jié)點(diǎn).聚合器的權(quán)重矩陣由基于圖的損失函數(shù)通過(guò)隨機(jī)梯度下降進(jìn)行調(diào)整,最終實(shí)現(xiàn)使用GraphSAGE模型預(yù)測(cè)交通流速度.
Li等[19]針對(duì)路況的動(dòng)態(tài)變化,將交通流建模為有向圖上的擴(kuò)散過(guò)程,并提出了基于空域圖卷積的擴(kuò)散卷積神經(jīng)網(wǎng)絡(luò)(diffusion convolutional recurrent neural network,DCRNN),基于雙向隨機(jī)游走理論捕獲空間相關(guān)性,實(shí)現(xiàn)了大規(guī)模路網(wǎng)的交通流量預(yù)測(cè).Chen等[20]也同樣在卷積網(wǎng)絡(luò)中引入了擴(kuò)散圖卷積進(jìn)行空域上的圖卷積操作.因此,Chen等[20]為了捕獲交通網(wǎng)絡(luò)的連通性和全局性,提出了基于殘差遞歸架構(gòu)的網(wǎng)絡(luò)模型Res-RNN,實(shí)現(xiàn)路面交通流預(yù)測(cè).Song等[21]在圖的鄰接矩陣中增加了前后時(shí)刻的時(shí)空關(guān)聯(lián)關(guān)系,并利用空域圖卷積層與門(mén)控線(xiàn)性單元的多個(gè)組合網(wǎng)絡(luò)構(gòu)建其整體預(yù)測(cè)框架.Bruna等[22]則認(rèn)為顯式圖結(jié)構(gòu)難以表示真實(shí)的圖中節(jié)點(diǎn)關(guān)系,并提出了基于節(jié)點(diǎn)嵌入學(xué)習(xí)的圖神經(jīng)網(wǎng)絡(luò)架構(gòu)Graph WaveNet.該網(wǎng)絡(luò)架構(gòu)中圖卷積層即通過(guò)空域圖卷積提取節(jié)點(diǎn)間的結(jié)構(gòu)特征.
1.2.2 頻域圖卷積
空域圖卷積借鑒了歐氏空間的卷積,頻域圖卷積則從信號(hào)處理的角度利用圖信號(hào)的傅里葉變換實(shí)現(xiàn)卷積操作.頻域圖卷積最早由Bruna等[23]提出.對(duì)于圖G,其拉普拉斯矩陣可表示為L(zhǎng)=Dv-A.歸一化后拉普拉斯矩陣表示為
(7)
因拉普拉斯矩陣L為半正定的實(shí)對(duì)稱(chēng)矩陣,可將特征分解為L(zhǎng)=UΛUT.與歐氏空間的卷積操作相似,對(duì)于圖信號(hào)x及圖卷積核g的圖卷積可表示為
x*Gg=U(UTx°UTg)=U(UTg°UTx)
(8)
式中:°為哈達(dá)瑪乘積;*G特指圖卷積操作.將UTg作為可訓(xùn)練的圖卷積核gθ,圖卷積操作可簡(jiǎn)化為
x*Gg=UgθUTx
(9)
在訓(xùn)練頻域卷積神經(jīng)網(wǎng)絡(luò)的過(guò)程中,由于拉普拉斯矩陣的所有特征值以及特征向量的計(jì)算量過(guò)大,所以為加速特征矩陣的求解,切比雪夫網(wǎng)絡(luò)(ChebNet.)[24]以及一階切比雪夫網(wǎng)絡(luò)(1stChebNet.)[25]應(yīng)運(yùn)而生.
切比雪夫網(wǎng)絡(luò)首先通過(guò)切比雪夫多項(xiàng)式
(10)
(11)
(12)
式中θ0與θ1均為全圖共享的可學(xué)習(xí)參數(shù).在實(shí)際操作中,為了進(jìn)一步限制參數(shù)的數(shù)量以解決過(guò)擬合問(wèn)題,令θ=θ0=-θ1,圖卷積操作可進(jìn)一步簡(jiǎn)化為
(13)
(14)
GCN即利用空域圖卷積或頻域圖卷積構(gòu)建的深度網(wǎng)絡(luò)模型.Kipf等[13]所提圖卷積神網(wǎng)絡(luò)模型中輸入層與輸出層均為圖信號(hào)數(shù)據(jù),其中隱含層為圖卷積層,圖結(jié)構(gòu)在各層中共享,最終實(shí)現(xiàn)節(jié)點(diǎn)的聚類(lèi)或節(jié)點(diǎn)值的預(yù)測(cè)等輸出.
空域圖卷積網(wǎng)絡(luò)與頻域圖卷積網(wǎng)絡(luò)雖然均不是針對(duì)交通預(yù)測(cè)問(wèn)題而提出的,但由于交通數(shù)據(jù)的天然圖結(jié)構(gòu)屬性,令GCN在交通預(yù)測(cè)領(lǐng)域展現(xiàn)出優(yōu)于傳統(tǒng)方法的高效率與高準(zhǔn)確率.無(wú)論是空域圖卷積還是頻域圖卷積,本質(zhì)上都是對(duì)圖拓?fù)浣Y(jié)構(gòu)的建模利用,即空間特征的提取.例如Lee等[25]利用路面?zhèn)鞲衅鏖g的距離和位置等信息構(gòu)建非歐氏關(guān)系,并利用GCN提取空間特征進(jìn)行交通速度預(yù)測(cè).Geng等[32]則以相鄰街區(qū)以及相似功能區(qū)等為節(jié)點(diǎn),構(gòu)建多種基于圖結(jié)構(gòu)的表示,在此基礎(chǔ)上使用多組GCN進(jìn)行空間相關(guān)性建模,實(shí)現(xiàn)乘車(chē)需求預(yù)測(cè).
基于GCN的交通預(yù)測(cè)大都建立在頻域圖卷積或空域圖卷積的基礎(chǔ)之上,通過(guò)圖結(jié)構(gòu)約束節(jié)點(diǎn)間的數(shù)據(jù)關(guān)系,利用圖卷積對(duì)非歐氏空間數(shù)據(jù)進(jìn)行結(jié)構(gòu)化空間特征提取,實(shí)現(xiàn)交通預(yù)測(cè).
目前,GCN已成為交通預(yù)測(cè)研究的基礎(chǔ)模型以及實(shí)驗(yàn)的基準(zhǔn)方法.由于交通數(shù)據(jù)本身為時(shí)序數(shù)據(jù),如何挖掘時(shí)序特征且與空間特征融合預(yù)測(cè)成為用于交通預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)模型的改進(jìn)重點(diǎn).此外,圖注意力機(jī)制同樣被用于交通預(yù)測(cè)模型且能顯著提升模型性能.同時(shí),當(dāng)前研究已不滿(mǎn)足靜態(tài)圖、單圖的卷積網(wǎng)絡(luò),動(dòng)態(tài)圖卷積網(wǎng)絡(luò)、多圖卷積網(wǎng)絡(luò)以及多任務(wù)學(xué)習(xí)的框架不斷被提出.
交通數(shù)據(jù)是標(biāo)準(zhǔn)的時(shí)間序列數(shù)據(jù),如圖1所示,即同一數(shù)據(jù)集內(nèi)所有數(shù)據(jù)內(nèi)容依時(shí)間按照統(tǒng)一時(shí)間口徑進(jìn)行排列組織.其中:橙色虛線(xiàn)表示某節(jié)點(diǎn)延邊對(duì)鄰居節(jié)點(diǎn)產(chǎn)生影響;藍(lán)色虛直線(xiàn)表示某節(jié)點(diǎn)交通數(shù)據(jù)該時(shí)刻對(duì)下一時(shí)刻的影響;藍(lán)色虛曲線(xiàn)表示跨時(shí)刻的長(zhǎng)遠(yuǎn)影響.由于交通數(shù)據(jù)存在明顯的時(shí)序特征,許多時(shí)序預(yù)測(cè)模型便被應(yīng)用于交通預(yù)測(cè)問(wèn)題,例如最常用的傳統(tǒng)交通預(yù)測(cè)方法ARIMA[33].該方法基于單個(gè)交通節(jié)點(diǎn)的時(shí)序數(shù)據(jù)構(gòu)建統(tǒng)計(jì)模型,進(jìn)而分析數(shù)據(jù)實(shí)現(xiàn)預(yù)測(cè).傳統(tǒng)機(jī)器學(xué)習(xí)方法,例如支持向量回歸(support vector regression,SVR)[34],相較于基于統(tǒng)計(jì)的方法能更好地捕獲復(fù)雜的線(xiàn)性關(guān)系.上述方法大多用于單一時(shí)序數(shù)據(jù)的識(shí)別與預(yù)測(cè)問(wèn)題,難以對(duì)全局交通數(shù)據(jù)進(jìn)行端到端的統(tǒng)一整體化分析及預(yù)測(cè).
圖1 時(shí)序交通數(shù)據(jù)Fig.1 Time series traffic data
圖神經(jīng)網(wǎng)絡(luò)將空間特征提取蘊(yùn)于圖卷積操作之中,但當(dāng)提取空間特征與時(shí)序特征相結(jié)合的方法被用于交通預(yù)測(cè)問(wèn)題時(shí),人工智能在該領(lǐng)域的潛力才得以真正釋放.時(shí)序特征的提取方法主要有CNN以及RNN.
2.1.1 基于CNN的時(shí)序特征提取
在Gehring等[35]所提出的卷積Sequence-to-Sequence模型(convolutional sequence to sequence,ConvS2S)的基礎(chǔ)上,Yu等[29]代表性地利用其門(mén)控線(xiàn)性單元(gated liner units,GLU)組建時(shí)序卷積層并構(gòu)建時(shí)空?qǐng)D卷積網(wǎng)絡(luò),實(shí)現(xiàn)時(shí)序特征的提取.
STGCN的模型結(jié)構(gòu)見(jiàn)圖2,2層時(shí)序卷積層與1層圖卷積層組成了時(shí)空卷積模塊.其中時(shí)序卷積層將一維因果卷積作用于時(shí)間軸,該操作可表示為
圖2 時(shí)空?qǐng)D卷積網(wǎng)絡(luò)[29]Fig.2 Spatio-temporal graph convolutional networks[29]
(15)
在利用因果卷積提取交通數(shù)據(jù)的時(shí)序特征的基礎(chǔ)之上,Graph WaveNet[22]采用了擴(kuò)張因果卷積(dilated casual convolution),亦稱(chēng)作膨脹因果卷積或者空洞因果卷積.如圖3所示,擴(kuò)張因果卷積通過(guò)跳過(guò)一定的步長(zhǎng)在輸入序列上沿時(shí)間軸進(jìn)行滑動(dòng),從而增加時(shí)序卷積操作的感受野.隨著擴(kuò)張因果卷積層數(shù)量的增加,其捕獲的時(shí)序感受野的范圍呈指數(shù)級(jí)增加.該卷積操作可表示為
圖3 擴(kuò)張因果卷積[20]Fig.3 Dilated casual convolution[20]
(16)
Fang等[26]同樣在其所提框架GSTNet的時(shí)空卷積模塊中利用擴(kuò)張卷積構(gòu)建了多分辨率時(shí)序模塊,即多層因果卷積層的堆疊.Guo等[36]不僅用卷積提取時(shí)空特征,并在其所提深度時(shí)空3D卷積神經(jīng)網(wǎng)絡(luò)(deep spatial-temporal 3D convolutional neural networks,ST-3DNet)中引入了3D卷積,從而實(shí)現(xiàn)端到端的交通擁堵?tīng)顟B(tài)預(yù)測(cè)以及人群流量預(yù)測(cè).Yao等[37]針對(duì)不平衡空間分布的交通數(shù)據(jù),提出使用少量訓(xùn)練數(shù)據(jù)實(shí)現(xiàn)模型訓(xùn)練,并通過(guò)遷移學(xué)習(xí)實(shí)現(xiàn)不同城市的交通流預(yù)測(cè)問(wèn)題.在其提出的MetaST模型中將CNN與LSTM相結(jié)合,構(gòu)成其元學(xué)習(xí)網(wǎng)絡(luò)模型.
2.1.2 基于RNN的時(shí)序特征提取
同樣為了在深度圖卷積網(wǎng)絡(luò)中提取時(shí)序特征并用于交通預(yù)測(cè),Zhao等[38]較早地提出了時(shí)序圖卷積網(wǎng)絡(luò)T-GCN.他們認(rèn)為RNN作為處理序列數(shù)據(jù)的最廣泛使用的模型,其變體LSTM網(wǎng)絡(luò)與GRU能克服訓(xùn)練過(guò)程中梯度爆炸與消失的缺陷.LSTM模型與GRU模型均使用門(mén)控機(jī)制來(lái)“記憶”盡可能多的長(zhǎng)期信息.
T-GCN的網(wǎng)絡(luò)架構(gòu)如圖4所示,其以歷史交通數(shù)據(jù)作為模型的輸入,通過(guò)GCN以及門(mén)控循環(huán)單元后獲得預(yù)測(cè)結(jié)果.為了獲取交通數(shù)據(jù)的時(shí)序特征,T-GCN利用了參數(shù)較少并且訓(xùn)練更快的門(mén)控循環(huán)單元而非LSTM網(wǎng)絡(luò).其計(jì)算過(guò)程表示為
圖4 時(shí)序圖卷積網(wǎng)絡(luò)[38]Fig.4 Temporal graph convolutional networks[38]
ut=σ(Wu[f(A,Xt),ht-1]+bu
rt=σ(Wr[f(A,Xt),ht-1]+br
ct=tanh(Wc[f(A,Xt),(rt°ht-1)]+bc
ht=ut°ht-1+(1-ut)°ct
(17)
式中:ut和rt分別表示t時(shí)刻的更新門(mén)和復(fù)位門(mén);ht和ht-1分別表示t時(shí)刻和t-1時(shí)刻的輸出;σ(·)表示Sigmoid激活函數(shù);f(A,Xt)表示圖卷積操作;W和b則分別表示訓(xùn)練過(guò)程中的權(quán)重以及偏置項(xiàng).Chen等[20]在門(mén)控循環(huán)單元存儲(chǔ)長(zhǎng)期依賴(lài)關(guān)系的基礎(chǔ)上,利用跳躍鏈接(hop-links)的方案捕捉周期性的時(shí)間相關(guān)性.同時(shí)將殘差加入循環(huán)圖網(wǎng)絡(luò)中,從而改善深層網(wǎng)絡(luò)里長(zhǎng)期反向傳播(long-term back-propagation)的梯度爆炸和消失的問(wèn)題.Li等[39-40]則分別在其共享單車(chē)需求預(yù)測(cè)的模型以及出租車(chē)需求預(yù)測(cè)模型中使用了LSTM進(jìn)行時(shí)序建模.該建模過(guò)程可描述為
(18)
式中Wa、Ua、ba(a∈{i,f,o,g})均為可學(xué)習(xí)變量.Wang等[41]針對(duì)交通時(shí)間預(yù)測(cè),提出了2層LSTM堆疊的模型,并考慮道路交叉口以及交通信號(hào)燈對(duì)預(yù)測(cè)結(jié)果的影響以提升模型性能.
GRU與LSTM作為時(shí)序依賴(lài)的循環(huán)網(wǎng)絡(luò)建模方法,在車(chē)速預(yù)測(cè)[42-43]、道路占有率預(yù)測(cè)[44]、人群密度預(yù)測(cè)[45]、網(wǎng)約車(chē)需求預(yù)測(cè)[46]、出租車(chē)需求預(yù)測(cè)[47-48]、出租車(chē)OD預(yù)測(cè)[49]、公交到站時(shí)間預(yù)測(cè)[50-51]以及空氣質(zhì)量預(yù)測(cè)[52]等實(shí)際需求問(wèn)題上均取得了優(yōu)異的預(yù)測(cè)效果.
以交通數(shù)據(jù)等標(biāo)準(zhǔn)的序列化數(shù)據(jù)作為輸入,自編碼器(auto-encoder,AE)架構(gòu)在預(yù)測(cè)問(wèn)題上的效果更加穩(wěn)定且泛化效果更好[53].Li等[19]所提DCRNN模型中,在使用門(mén)控循環(huán)單元提取時(shí)序特征的基礎(chǔ)上利用了自編碼器的架構(gòu).其中編碼器和解碼器都是基于DCRNN的遞歸神經(jīng)網(wǎng)絡(luò).其模型的基本框架如圖5所示.
圖5 擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò)[19]Fig.5 Diffusion convolutional recurrent neural network[19]
在訓(xùn)練過(guò)程中,歷史交通數(shù)據(jù)序列首先被輸入編碼器,并使用其最終狀態(tài)初始化編碼器.在測(cè)試過(guò)程中,預(yù)測(cè)值被用于替換真實(shí)值.基于圖的自編碼器較早由Kipf等[54]提出,包括變分圖自編碼器(variational graph auto-encoders,VGAE)以及圖自編碼器(graph auto-encoders,GAE).VGAE將變分自編碼器遷移到了圖領(lǐng)域,以圖卷積作為編碼操作,用已知圖通過(guò)編碼學(xué)習(xí)節(jié)點(diǎn)向量化表示的分布對(duì)其采樣,從而得到節(jié)點(diǎn)的向量表示,通過(guò)解碼操作重新構(gòu)建圖以實(shí)現(xiàn)鏈路預(yù)測(cè)等任務(wù).GAE則包括2層GCN,解碼器計(jì)算連接2個(gè)節(jié)點(diǎn)邊的存在概率進(jìn)而重構(gòu)圖.Lv等[55]較早地利用自編碼器模塊化地構(gòu)建深層網(wǎng)絡(luò)模型并用于交通流預(yù)測(cè).其提出的堆疊式自編碼器(stacked auto-encoder,SAE)模型的輸入與輸出可分別表示為
y(x)=f(W1x+b1)
z(x)=g(W2y(x)+b2)
(19)
式中:x為訓(xùn)練樣本;y(x)為編碼器的隱藏表示,并于解碼器中得到z(x);W1和W2以及b1和b2分別為編碼器和解碼器的權(quán)重矩陣以及偏置向量.在此基礎(chǔ)上,Lv等[55]將多個(gè)自編碼器堆疊,在獲得第1個(gè)隱藏層后,將第k個(gè)隱藏層的輸出作為第k+1個(gè)隱藏層的輸入,最后通過(guò)輸出層實(shí)現(xiàn)回歸預(yù)測(cè).在此基礎(chǔ)上,Zhao等[56]設(shè)計(jì)并提出了一種分層遞歸自編碼器,使用3層堆疊式自編碼器架構(gòu)來(lái)獲取時(shí)序依賴(lài)并使用遞歸神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè).在Bai等[30]的工作中將捕捉長(zhǎng)期時(shí)序特征與捕捉短期時(shí)序特征的編解碼器分別同步進(jìn)行訓(xùn)練用以緩解基于RNN的解碼器模型固有的誤差積累問(wèn)題.Lin等[57]則利用基于自編碼器架構(gòu)的圖濾波器模型提取共享單車(chē)與出租車(chē)用車(chē)數(shù)據(jù)的時(shí)空特征,并預(yù)測(cè)共享單車(chē)的需求量.自編碼器的架構(gòu)靈活多變,可基于CNN[58],亦可基于LSTM[59-61].編碼器與解碼器在功能與架構(gòu)上相輔相成,在GEML[31]、Forecaster[62]、ST-GRAT[63]及ARU[64]等模型中均展現(xiàn)出優(yōu)異的效果.
注意力機(jī)制首先被提出用于自然語(yǔ)言處理[54],如今已被廣泛應(yīng)用到許多序列相關(guān)的任務(wù)之中.例如:Liang等[65]利用多級(jí)注意力的循環(huán)神經(jīng)網(wǎng)絡(luò)自適應(yīng)地調(diào)整多個(gè)地理傳感器采集到的時(shí)序數(shù)據(jù)間的相關(guān)性并用于空氣質(zhì)量等預(yù)測(cè).其優(yōu)點(diǎn)在于可以放大序列中重要部分的影響,將注意力機(jī)制引入圖神經(jīng)網(wǎng)絡(luò),其可同樣受益.GCN由于依靠拉普拉斯矩陣的特征值,使得卷積操作難以抽離于整體的靜態(tài)圖結(jié)構(gòu).在圖注意力網(wǎng)絡(luò)(graph attention networks,GAT)[66]中,不同節(jié)點(diǎn)被分配以不同權(quán)重,訓(xùn)練過(guò)程憑借成對(duì)的相鄰節(jié)點(diǎn),而非具體圖結(jié)構(gòu),即不依賴(lài)于整個(gè)圖的全部信息.在時(shí)空?qǐng)D卷積網(wǎng)絡(luò)的基礎(chǔ)上,注意力機(jī)制被引入并廣泛用于時(shí)空特征的提取.
在處理空間特征時(shí),以路面交通為例,某道路的交通狀態(tài)在一定程度上必然受到直接相鄰或間接相鄰道路的影響.此種影響的范圍以及程度隨位置、距離以及時(shí)間等因素不斷變化.在Guo等[67]提出基于注意力的時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(attention based spatial-temporal graph convolutional networks,ASTGCN)中,空間注意力矩陣可定義為
(20)
(21)
在進(jìn)行圖卷積操作的過(guò)程中,鄰接矩陣A與注意力矩陣S′將同時(shí)動(dòng)態(tài)地調(diào)整節(jié)點(diǎn)之間的權(quán)重關(guān)系以捕獲空間維度上節(jié)點(diǎn)之間的動(dòng)態(tài)相關(guān)性.Pan等[68]同樣認(rèn)為,兩節(jié)點(diǎn)之間的空間相關(guān)性與其地理信息相關(guān).在其所提模型中,提取空間特征的注意力機(jī)制與元學(xué)習(xí)(meta learning)相結(jié)合,使其注意力模塊的權(quán)重從元知識(shí)中學(xué)習(xí)而來(lái).在用于共享單車(chē)需求預(yù)測(cè)的STG2Vec[39]模型中同樣利用注意力機(jī)制對(duì)空間特征進(jìn)行提取.Chen等[69]則為雙分量圖卷積(bicomponent GCN)提出了多范圍注意力機(jī)制(multi-range attention mechanism).其模型首先分別構(gòu)建節(jié)點(diǎn)圖與邊緣圖,在通過(guò)雙分量圖卷積實(shí)現(xiàn)邊與節(jié)點(diǎn)交互的基礎(chǔ)上,利用多范圍注意力聚合鄰域的信息,從而動(dòng)態(tài)地了解不同聚合范圍的重要性.Zhang等[70]則在所提門(mén)控注意力網(wǎng)絡(luò)(gated attention networks,GaAN)中利用多頭注意力機(jī)制(multi-head attention mechanism)對(duì)節(jié)點(diǎn)及其鄰居的特征進(jìn)行聚合.與傳統(tǒng)多頭注意力機(jī)制不同,GaAN使用了卷積子網(wǎng)(convolutional sub-network)來(lái)控制每個(gè)注意力頭的重要性,并用以解決交通速度預(yù)測(cè)問(wèn)題.
與空間特征方法類(lèi)似,在處理時(shí)序特征時(shí),注意力機(jī)制被作用于時(shí)間維度以對(duì)長(zhǎng)期序列數(shù)據(jù)進(jìn)行建模.例如:Yao等[71]為解決動(dòng)態(tài)的空間依賴(lài)以及周期性的時(shí)間依賴(lài),設(shè)計(jì)了一種周期性轉(zhuǎn)移的注意力機(jī)制來(lái)處理長(zhǎng)期周期性時(shí)序偏移.在同一模型中將注意力機(jī)制同時(shí)用于空間特征以及時(shí)序特征的提取已被證明卓有成效[67,72-75].
注意力機(jī)制可被用于輔助時(shí)空特征的提取,也可以摒棄卷積操作,借鑒Transformer[76]架構(gòu)僅利用注意力機(jī)制完成交通預(yù)測(cè)任務(wù).在圖變換網(wǎng)絡(luò)(graph transformer networks,GTN)[77]相關(guān)工作中提出,傳統(tǒng)GCN的結(jié)構(gòu)固定,即其中鄰接矩陣為圖的固有屬性不隨模型訓(xùn)練過(guò)程而改變.GTN則能夠挑選有價(jià)值的多跳連接的元路徑(meta-path),從而實(shí)現(xiàn)基于可學(xué)習(xí)圖結(jié)構(gòu)的預(yù)測(cè).
GCN無(wú)論是引入注意力機(jī)制還是與Transformer架構(gòu)的結(jié)合[78],目的均是更有效地提取空間特征與時(shí)序特征.Li等[62]利用該框架提出了Forecaster模型.從學(xué)習(xí)圖結(jié)構(gòu)開(kāi)始,將學(xué)習(xí)到的結(jié)構(gòu)表示不同位置數(shù)據(jù)之間的空間依賴(lài),再基于圖拓?fù)鋵?duì)Transformer進(jìn)行稀疏處理以提升模型強(qiáng)度,從而實(shí)現(xiàn)精準(zhǔn)的出租車(chē)需求預(yù)測(cè).
鑒于大范圍跨時(shí)空交通數(shù)據(jù)采集的難度,高質(zhì)量的數(shù)據(jù)集對(duì)于交通預(yù)測(cè)問(wèn)題的研究至關(guān)重要.交通數(shù)據(jù)類(lèi)別豐富,包括但不限于交通運(yùn)輸數(shù)據(jù)、交通管理數(shù)據(jù)以及用于輔助的氣象數(shù)據(jù)和事件數(shù)據(jù)等.
其中交通運(yùn)輸數(shù)據(jù)主要采集于路面交通、軌道交通以及航運(yùn)交通的實(shí)際運(yùn)營(yíng)過(guò)程,例如路面車(chē)流量、路面車(chē)速、路面車(chē)道占有率、出租車(chē)需求量、網(wǎng)約車(chē)需求量、共享單車(chē)軌跡、公交車(chē)客流量、公交車(chē)到站時(shí)間、地鐵進(jìn)出站客流量以及地鐵換乘客流量等.交通管理數(shù)據(jù)則包括信號(hào)燈調(diào)度數(shù)據(jù)、潮汐車(chē)道數(shù)據(jù)以及私家車(chē)限號(hào)數(shù)據(jù)等.在此基礎(chǔ)上,氣象數(shù)據(jù)與交通數(shù)據(jù)密切相關(guān),主要源自氣象部門(mén)的信息化系統(tǒng),包括氣象衛(wèi)星以及地面氣象監(jiān)測(cè)站等獲取的數(shù)據(jù),其中重點(diǎn)關(guān)注雨、雪、霧、霾等各種惡劣天氣對(duì)交通情況的影響.事件數(shù)據(jù)則包括大型活動(dòng)數(shù)據(jù)以及交通事故數(shù)據(jù)等.本文將重點(diǎn)介紹數(shù)個(gè)目前應(yīng)用較多的全球公開(kāi)交通數(shù)據(jù)集.
1)PeMS
PeMS為加利福尼亞運(yùn)輸局的性能測(cè)量系統(tǒng)(performance measurement system)的縮寫(xiě).該數(shù)據(jù)集的內(nèi)容由39 000余個(gè)獨(dú)立傳感器以5 min為時(shí)間間隔實(shí)時(shí)收集,其范圍覆蓋了加利福尼亞州所有主要城市區(qū)域的高速公路系統(tǒng).該數(shù)據(jù)集可由其官方網(wǎng)站http:∥pems.dot.ca.gov/獲得.由于PeMS全部數(shù)據(jù)體量較大,目前衍生出數(shù)個(gè)常用子數(shù)據(jù)集,包括PeMS-03、PeMS-04、PeMS-07 、PeMS-08、PeMS-SF以及PeMS-BAY等.子數(shù)據(jù)集覆蓋了不同大小的區(qū)域,包含不同數(shù)量傳感器采集的不同時(shí)間跨度以及不同時(shí)間粒度的交通流信息.
2)METR-LA
該數(shù)據(jù)集采集自洛杉磯高速路的207個(gè)傳感器,每組數(shù)據(jù)的時(shí)間間隔為5 min,該數(shù)據(jù)由其官網(wǎng)https:∥www.metro.net/獲得,并用于DCRNN[19]模型的實(shí)驗(yàn)測(cè)試中首次使用.
3)LOOP[28]
該數(shù)據(jù)集由部署在華盛頓州西雅圖地區(qū)的4條相連的高速公路上的323 個(gè)地感線(xiàn)圈收集而來(lái).該數(shù)據(jù)集包含2015年全年的速度數(shù)據(jù),時(shí)間間隔為5 min.數(shù)據(jù)地址:https:∥github.com/zhiyongc/Seattle-Loop-Data.
4)NYC Taxi
該數(shù)據(jù)集由紐約出租車(chē)與轎車(chē)委員會(huì)(Taxi and Limousine Commission)提供,收集了紐約出租車(chē)的行程記錄,包括上下車(chē)的日期與時(shí)間、上下車(chē)的位置、行程距離、分項(xiàng)票價(jià)、費(fèi)率類(lèi)型、付款類(lèi)型以及乘客人數(shù)等信息.數(shù)據(jù)集所含數(shù)據(jù)的時(shí)間跨度為2009—2020年且仍在不斷更新之中.該數(shù)據(jù)集可通過(guò)網(wǎng)址https:∥www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page獲得.
隨著智慧交通以及深度學(xué)習(xí)的發(fā)展,近年交通預(yù)測(cè)領(lǐng)域已取得長(zhǎng)足的進(jìn)步,但目前仍存在許多富有研究?jī)r(jià)值與意義的問(wèn)題和挑戰(zhàn).本文將從應(yīng)用、模型以及多源數(shù)據(jù)的角度分類(lèi)討論未來(lái)研究的方向,以及目前富有價(jià)值與意義的嘗試.
近年來(lái),交通預(yù)測(cè)領(lǐng)域內(nèi)對(duì)圖卷積網(wǎng)絡(luò)的應(yīng)用已日漸豐富,包括但不限于道路車(chē)輛流量預(yù)測(cè)[58,79-83]、道路車(chē)輛平均速度預(yù)測(cè)[84-85]、道路車(chē)輛占有率預(yù)測(cè)[44]、道路交通狀態(tài)預(yù)測(cè)[28,72,86-87]、行人軌跡預(yù)測(cè)[88-89]、車(chē)輛軌跡預(yù)測(cè)[90]、通勤時(shí)間預(yù)測(cè)[91-92]、軌道交通客流預(yù)測(cè)[93-94]、物流時(shí)間預(yù)測(cè)[95]、出租車(chē)需求預(yù)測(cè)[31-32]以及共享單車(chē)需求預(yù)測(cè)[60,96]等.
然而,目前的交通預(yù)測(cè)成果大多集中于短時(shí)常態(tài)預(yù)測(cè),對(duì)于長(zhǎng)時(shí)以及非常態(tài)下的研究相對(duì)較少.
1)長(zhǎng)時(shí)交通預(yù)測(cè)
對(duì)于長(zhǎng)時(shí)交通預(yù)測(cè)而言,由于更復(fù)雜的時(shí)空依賴(lài)性和更多不確定性因素,長(zhǎng)時(shí)預(yù)測(cè)比中短時(shí)預(yù)測(cè)更加困難.Wang等[97]即利用LSTM網(wǎng)絡(luò)以及自編碼器架構(gòu)對(duì)數(shù)據(jù)的長(zhǎng)時(shí)特征進(jìn)行學(xué)習(xí),并在其自編碼器中提出了一種基于學(xué)習(xí)相似模式的硬注意力機(jī)制以增強(qiáng)神經(jīng)元的記憶并減少誤差在傳播過(guò)程中的累積.但上述模型均未以圖結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行建模表示且模型中利用CNN及RNN對(duì)單時(shí)序數(shù)據(jù)的時(shí)空特征進(jìn)行提取,忽略了時(shí)序數(shù)據(jù)之間的相互影響.因此,未來(lái)可針對(duì)此問(wèn)題在此基礎(chǔ)上通過(guò)圖結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行表示,并引入GCN以實(shí)現(xiàn)更加精準(zhǔn)的長(zhǎng)時(shí)交通預(yù)測(cè).
2)非常態(tài)交通預(yù)測(cè)
交通異常狀況即發(fā)生于交通營(yíng)運(yùn)過(guò)程之中,或發(fā)生于交通體系之外,但影響到交通正常運(yùn)行的情況及事件,例如突發(fā)交通事故,人群大規(guī)模聚集,惡劣天氣導(dǎo)致的路面結(jié)冰、積水等非常態(tài)情形.雖然非常態(tài)數(shù)據(jù)體量較小,但可借鑒小樣本學(xué)習(xí)以及遷移學(xué)習(xí)的思想.異常交通事件對(duì)于公共出行安全具有極大威脅,因此,該研究方向具有重要社會(huì)價(jià)值.交通異常事件往往具有突發(fā)性強(qiáng)以及連鎖影響范圍廣等特點(diǎn).Guo等[98]測(cè)試了KNN、RNN以及TDNN算法在異常狀況下交通預(yù)測(cè)的準(zhǔn)確率,并表示KNN效果較好.Li等[99]則發(fā)現(xiàn)當(dāng)同時(shí)使用來(lái)自多個(gè)傳感器的交通信息時(shí),可以在短期趨勢(shì)上提高預(yù)測(cè)準(zhǔn)確性.其研究表明,對(duì)于異常狀況下的交通流預(yù)測(cè),交通流序列之間的空間關(guān)系變得更加重要.因此,對(duì)于該問(wèn)題,將圖卷積網(wǎng)絡(luò)引入其中可作為未來(lái)重點(diǎn)研究方向之一.
GCN由于對(duì)圖結(jié)構(gòu)數(shù)據(jù)進(jìn)行卷積操作,所以,圖表示與圖卷積操作均具有深入研究?jī)r(jià)值.對(duì)于構(gòu)建圖,目前研究熱點(diǎn)包括但不局限于動(dòng)態(tài)圖卷積網(wǎng)絡(luò)、多圖卷積網(wǎng)絡(luò)以及深層圖卷積網(wǎng)絡(luò).
1)動(dòng)態(tài)圖建模
由于許多交通網(wǎng)絡(luò)本質(zhì)上均為圖拓?fù)浣Y(jié)構(gòu),為充分利用該拓?fù)湫畔?,交通?shù)據(jù)均依靠圖建模進(jìn)行表示.在構(gòu)建圖的過(guò)程中,鄰接矩陣承擔(dān)了空間信息的載體.大多數(shù)用于交通預(yù)測(cè)的GCN均采用了靜態(tài)鄰接矩陣,即假定節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系不隨時(shí)移而改變.該鄰接矩陣往往由研究人員根據(jù)實(shí)際交通情況手工設(shè)計(jì)而來(lái),最常見(jiàn)的即表示路面節(jié)點(diǎn)間連接關(guān)系的0-1矩陣以及表示節(jié)點(diǎn)之間實(shí)際地理距離的距離矩陣.
但目前有研究者認(rèn)為預(yù)定義的鄰接矩陣并不能很好地反映節(jié)點(diǎn)之間真正的相關(guān)性及其時(shí)空依賴(lài)[89],反而從數(shù)據(jù)中學(xué)得的動(dòng)態(tài)鄰接矩陣在相關(guān)交通預(yù)測(cè)問(wèn)題上表現(xiàn)出更加準(zhǔn)確的效果.例如:Guo等[100]在訓(xùn)練階段通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)優(yōu)化圖,從而從交通數(shù)據(jù)中揭示了路段之間的潛在關(guān)系.在圖卷積的過(guò)程中,拉普拉斯矩陣由鄰接矩陣計(jì)算而來(lái),Diao等[27]設(shè)計(jì)了動(dòng)態(tài)拉普拉斯矩陣估計(jì)器,給定一個(gè)代表交通網(wǎng)絡(luò)靜態(tài)結(jié)構(gòu)的全局拉普拉斯矩陣,同時(shí)利用短期交通流變化估計(jì)實(shí)時(shí)拉普拉斯矩陣,從而實(shí)現(xiàn)動(dòng)態(tài)建模.
GCN無(wú)疑依賴(lài)于良好定義的圖結(jié)構(gòu)信息[101].當(dāng)基于空間位置的鄰接矩陣不明確時(shí),對(duì)于交通數(shù)據(jù)這種多元時(shí)間序列可分析多元變量間的因果關(guān)系,并動(dòng)態(tài)地構(gòu)建鄰接矩陣.
此外,超圖[102]作為一種圖的表示方法,由于可以表示個(gè)體之間的高階關(guān)系,目前被廣泛應(yīng)用于社交網(wǎng)絡(luò)或通信網(wǎng)絡(luò)等領(lǐng)域之中.與普通圖相比,超邊可同時(shí)連接多個(gè)節(jié)點(diǎn),從而突破兩兩關(guān)系的限制.例如:Wang等[103]在軌道交通預(yù)測(cè)中利用靜態(tài)的超邊表示軌道交通的線(xiàn)路,在此基礎(chǔ)上對(duì)交通流OD進(jìn)行分析,挖掘不同時(shí)間跨度下的車(chē)流或客流的出行規(guī)律.以北京地鐵為例,天通苑站及周?chē)军c(diǎn)與中關(guān)村及其周?chē)军c(diǎn)在軌道網(wǎng)絡(luò)中并非直接相連,但由OD分析可發(fā)掘出兩者之間存在客流強(qiáng)關(guān)聯(lián)且該關(guān)聯(lián)隨時(shí)移呈現(xiàn)出不同模式.因此,可據(jù)此構(gòu)建動(dòng)態(tài)超邊,與靜態(tài)超邊同時(shí)納入超圖之中,并通過(guò)超圖時(shí)空卷積網(wǎng)絡(luò)實(shí)現(xiàn)交通預(yù)測(cè).
2)多圖卷積網(wǎng)絡(luò)
隨著GCN的發(fā)展,單圖所承載的信息越來(lái)越難以滿(mǎn)足交通預(yù)測(cè)的需求.研究者即通過(guò)多圖卷積網(wǎng)絡(luò),尤其是異質(zhì)圖卷積網(wǎng)絡(luò),對(duì)交通預(yù)測(cè)問(wèn)題進(jìn)行了更加精細(xì)化建模.
Lv等[104]認(rèn)為現(xiàn)有工作多數(shù)局限于利用時(shí)空模型進(jìn)行交通預(yù)測(cè),而道路之間的語(yǔ)義相關(guān)性(semantic correlation)同樣重要.在其所提時(shí)序多圖卷積網(wǎng)絡(luò)(temporal multi-graph convolutional network,T-MGCN)中利用道路之間的空間相關(guān)性以及語(yǔ)義相關(guān)性構(gòu)建多圖,對(duì)多圖分別進(jìn)行圖卷積后將結(jié)果融合,再通過(guò)GRU提取時(shí)序特征,實(shí)現(xiàn)交通流預(yù)測(cè).Chai等[105]則通過(guò)共享自行車(chē)站點(diǎn)之間的距離以及行駛記錄相關(guān)性等關(guān)聯(lián)關(guān)系構(gòu)造多圖.與Lv等[104]的方法不同的是,Chai等[105]在處理多圖卷積時(shí),先進(jìn)行圖融合操作,再對(duì)融合圖做圖卷積.類(lèi)似地,Ke等[106]也通過(guò)空間距離以及語(yǔ)義相關(guān)性為出租車(chē)的OD預(yù)測(cè)構(gòu)造多圖 .針對(duì)軌道交通,進(jìn)出站客流在不同時(shí)間跨度下的出行模式也可以通過(guò)多個(gè)超圖進(jìn)行建模[103].針對(duì)路面交通,Song等[21]針對(duì)時(shí)序特征,設(shè)計(jì)了不同時(shí)間段的多個(gè)模塊以有效地捕獲時(shí)空?qǐng)D中的異質(zhì)性.Zhang等[107]則通過(guò)路網(wǎng)節(jié)點(diǎn)之間的距離、方向以及位置關(guān)系構(gòu)建多圖神經(jīng)網(wǎng)絡(luò).在復(fù)雜多層次交通數(shù)據(jù)的建模上,多圖卷積網(wǎng)絡(luò)取得了良好的效果.如何挖掘更深層次的多圖表示,如何實(shí)現(xiàn)更高效的多圖卷積操作,仍是目前及未來(lái)的研究熱點(diǎn).
3)多任務(wù)圖網(wǎng)絡(luò)
與多圖卷積網(wǎng)絡(luò)不同,多任務(wù)圖網(wǎng)絡(luò)借鑒了多任務(wù)學(xué)習(xí)(multi-task learning)的架構(gòu).多任務(wù)學(xué)習(xí)的初衷在于僅關(guān)注單個(gè)任務(wù)可能會(huì)忽略相關(guān)任務(wù)中潛在但有益的信息.通過(guò)在一定程度上共享任務(wù)之間的參數(shù)或特征,可提升主要任務(wù)的表現(xiàn).通常,多任務(wù)可以分為同構(gòu)任務(wù)和異構(gòu)任務(wù).同構(gòu)任務(wù)可直接共享模型的參數(shù),從而降低訓(xùn)練中過(guò)擬合的風(fēng)險(xiǎn).異構(gòu)任務(wù)的模型不同,但通過(guò)在訓(xùn)練中共享中間層特征,從而相互提供額外信息[108].
在交通預(yù)測(cè)領(lǐng)域,Huang等[109]提出了一種基于多任務(wù)深度網(wǎng)絡(luò)架構(gòu),該架構(gòu)由底部的深度信念網(wǎng)絡(luò)(deep belief network)以及頂部的多任務(wù)回歸層組成.Zhang等[110]將地理位置劃分為交通單元,利用多任務(wù)學(xué)習(xí)對(duì)每個(gè)交通單元通過(guò)時(shí)間卷積實(shí)現(xiàn)乘客需求預(yù)測(cè).Gao等[111]則利用多任務(wù)學(xué)習(xí)融合了GPS軌跡、智能手機(jī)數(shù)據(jù)和道路網(wǎng)絡(luò)結(jié)構(gòu)以估計(jì)出租車(chē)乘客的出行時(shí)間.多任務(wù)學(xué)習(xí)為深度網(wǎng)絡(luò)模型提供了優(yōu)化并利用了多源數(shù)據(jù)的潛力,在交通預(yù)測(cè)領(lǐng)域基于GCN的多任務(wù)學(xué)習(xí)框架仍具有很高的研究?jī)r(jià)值.
4)圖卷積優(yōu)化
GCN可以使圖信號(hào)更加平滑,這是圖卷積的固有優(yōu)勢(shì).但是,在GCN的層數(shù)不斷加深時(shí),其訓(xùn)練結(jié)果極易出現(xiàn)過(guò)平滑的情況[14].由于圖卷積是特殊形式的拉普拉斯平滑,在圖卷積聚合鄰居節(jié)點(diǎn)特征的過(guò)程中,平滑操作使信號(hào)在特征層面更加一致,從而使信號(hào)失去其多樣性,導(dǎo)致相關(guān)預(yù)測(cè)任務(wù)的性能急劇下降,該現(xiàn)象在小數(shù)據(jù)集上更加明顯.因此,GCN不能像一般卷積模型那樣不斷深入地堆疊,但淺層神經(jīng)網(wǎng)絡(luò)又存在感受野和特征提取能力有限的問(wèn)題.
針對(duì)該問(wèn)題,一種解決思路是基于隨機(jī)游走(random walk)的協(xié)同訓(xùn)練(co-training)[112]方法.因?yàn)殡S機(jī)游走可以探索全局圖結(jié)構(gòu),彌補(bǔ)了圖卷積操作局部平滑的缺陷.另一種增大圖卷積感受野的思路是自訓(xùn)練(self-training)方法.該方法首先訓(xùn)練帶給定標(biāo)簽的GCN,隨后為每個(gè)類(lèi)別選擇最可靠的預(yù)測(cè)并將其添加到標(biāo)簽集中.在此基礎(chǔ)上,使用預(yù)先訓(xùn)練的GCN繼續(xù)使用擴(kuò)展標(biāo)簽后的數(shù)據(jù)集訓(xùn)練GCN.上述2種方法也可以同時(shí)進(jìn)行,其目的都是擴(kuò)展訓(xùn)練集.
在圖卷積操作過(guò)程中,由于中心節(jié)點(diǎn)的特征易于向鄰居節(jié)點(diǎn)傳播,而邊緣節(jié)點(diǎn)的特征則很難輻射至其余邊緣節(jié)點(diǎn).為克服此缺點(diǎn),可引入一種通用的自動(dòng)編碼器網(wǎng)絡(luò)架構(gòu),將數(shù)據(jù)內(nèi)容信息補(bǔ)充到GCN,實(shí)現(xiàn)類(lèi)似于殘差網(wǎng)絡(luò)的效果,或使用跳躍圖卷積網(wǎng)絡(luò)實(shí)現(xiàn)特征的有效傳遞.為了更好地捕獲數(shù)據(jù)樣本之間的高階關(guān)系,同時(shí)可以利用注意力融合機(jī)制對(duì)可判別信息進(jìn)行突出.基于上述思路,在深度堆疊的GCN中,每一層都用于捕獲數(shù)據(jù)的不同潛在特征.
近年來(lái)交通預(yù)測(cè)方法不斷由模型驅(qū)動(dòng)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng),即由數(shù)學(xué)模型推導(dǎo)演變?yōu)橥诰虿W(xué)習(xí)數(shù)據(jù)本身的特征.目前,基于單一數(shù)據(jù)源的學(xué)習(xí)已逐漸完備,但實(shí)際中交通數(shù)據(jù)多源異構(gòu)的特點(diǎn)決定了該領(lǐng)域研究必將從單源走向多源.同時(shí)空內(nèi),跨媒體交通數(shù)據(jù)類(lèi)型多樣并結(jié)構(gòu)復(fù)雜,但同時(shí)相互影響且互為補(bǔ)充.針對(duì)多源交通數(shù)據(jù)的挑戰(zhàn),本文將小樣本學(xué)習(xí)、跨媒體數(shù)據(jù)融合以及交通知識(shí)圖譜嵌入作為未來(lái)研究方向的參考.
1)小樣本學(xué)習(xí)
目前,大多數(shù)交通預(yù)測(cè)的解決方案均通過(guò)密集的歷史交通數(shù)據(jù)進(jìn)行訓(xùn)練,但由于交通數(shù)據(jù)采集等問(wèn)題,城市之間交通數(shù)據(jù)量級(jí)不同,部分城市交通數(shù)據(jù)量較小或質(zhì)量較差.同時(shí),用以輔助交通預(yù)測(cè)的極端天氣、交通事故、交通管制以及其他異常事件等發(fā)生頻率遠(yuǎn)低于交通數(shù)據(jù)采集頻率,使得學(xué)習(xí)過(guò)程異常困難.因此,交通預(yù)測(cè)領(lǐng)域的小樣本學(xué)習(xí)問(wèn)題同樣為未來(lái)研究方向之一.
元學(xué)習(xí)在監(jiān)督學(xué)習(xí)領(lǐng)域?yàn)樾颖緦W(xué)習(xí)提供了解決思路,Pan等[68]即提出了元-圖注意力模塊與元-循環(huán)神經(jīng)網(wǎng)絡(luò)模塊.其中注意力模塊的權(quán)重是通過(guò)地理屬性中提取的節(jié)點(diǎn)和邊的元知識(shí)生成的,因此,理論上可以對(duì)各種空間相關(guān)性進(jìn)行建模,而循環(huán)神經(jīng)網(wǎng)絡(luò)根據(jù)每個(gè)節(jié)點(diǎn)的元知識(shí)生成門(mén)控循環(huán)單元的所有權(quán)重,從而實(shí)現(xiàn)元學(xué)習(xí)的GCN模型.
解決此問(wèn)題的另一種思路是通過(guò)遷移學(xué)習(xí)來(lái)執(zhí)行跨城市的交通預(yù)測(cè)任務(wù).該思路旨在將交通知識(shí)從數(shù)據(jù)源豐富的城市轉(zhuǎn)移到數(shù)據(jù)稀缺的目標(biāo)城市.但目前該研究方向尚未進(jìn)行徹底的探究,例如如何設(shè)計(jì)一個(gè)高質(zhì)量泛用性強(qiáng)的用于交通預(yù)測(cè)的遷移學(xué)習(xí)框架,或者如何實(shí)現(xiàn)小樣本外部數(shù)據(jù)的嵌入學(xué)習(xí)等.
2)跨媒體數(shù)據(jù)融合
目前,交通領(lǐng)域已經(jīng)匯聚了監(jiān)控設(shè)備采集的視頻、圖像,線(xiàn)圈卡口采集的流量、速度、占有率以及車(chē)載設(shè)備采集的GPS等海量多源異構(gòu)的高維交通數(shù)據(jù),同時(shí)惡劣天氣、交通事故以及交通管制等輔助數(shù)據(jù)同樣對(duì)于交通預(yù)測(cè)具有不可忽視的價(jià)值.由于難以從單一數(shù)據(jù)源全面且精準(zhǔn)地捕獲交通特征,并且針對(duì)體量大、時(shí)空跨度廣以及結(jié)構(gòu)復(fù)雜等特點(diǎn),對(duì)多源交通數(shù)據(jù)進(jìn)行融合、協(xié)同分析已成為該領(lǐng)域未來(lái)研究方向之一.對(duì)于多源交通數(shù)據(jù)融合,本文認(rèn)為需研究跨媒體數(shù)據(jù)的有效表達(dá)方法及協(xié)同分析模型.
無(wú)論是圖時(shí)空網(wǎng)絡(luò)或圖注意力網(wǎng)絡(luò),其關(guān)注點(diǎn)均主要在于時(shí)空特征的提取.在此基礎(chǔ)上,若引入交通流數(shù)據(jù)之外有價(jià)值的信息,勢(shì)必對(duì)交通預(yù)測(cè)問(wèn)題有所提升.Ni等[113]通過(guò)研究社交媒體的動(dòng)態(tài)進(jìn)而感知交通事件的發(fā)生,并通過(guò)分析表明軌道交通的客流量與社交媒體的發(fā)帖率之間存在正相關(guān)關(guān)系.基于該發(fā)現(xiàn),Ni等[113]提出了基于標(biāo)簽的事件監(jiān)測(cè)算法并與SARIMA模型相結(jié)合,用于軌道交通的客流預(yù)測(cè).同樣針對(duì)軌道客流預(yù)測(cè)問(wèn)題,Chen等[114]則利用刷卡數(shù)據(jù)對(duì)異常事件進(jìn)行捕獲,并結(jié)合ARIMA模型實(shí)現(xiàn)預(yù)測(cè).社交媒體數(shù)據(jù)[115]、刷卡數(shù)據(jù)[116]、遙感數(shù)據(jù)[117]及天氣數(shù)據(jù)[118]均被用作提升預(yù)測(cè)精度的外源數(shù)據(jù).Zhang等[118]在其所提框架中將雨雪天氣等外部因素通過(guò)門(mén)控機(jī)制融合至預(yù)測(cè)模型之中.但目前上述方法均未考慮交通數(shù)據(jù)的圖表示及GCN,因此,在GCN的基礎(chǔ)上,通過(guò)多任務(wù)學(xué)習(xí)等方法融合多源異構(gòu)交通數(shù)據(jù)具有廣闊的研究前景.
3)交通知識(shí)圖譜嵌入
知識(shí)圖譜是對(duì)某領(lǐng)域的知識(shí)整合以及利用的重要工具,由大量知識(shí)實(shí)體及其之間的關(guān)系交織而成.交通運(yùn)輸領(lǐng)域的知識(shí)存在于海量多源異構(gòu)的交通數(shù)據(jù)之中.對(duì)于交通知識(shí)圖譜,未來(lái)主要研究圖譜構(gòu)建以及知識(shí)嵌入兩方面內(nèi)容.
知識(shí)圖譜構(gòu)建方面,早期主要為泛領(lǐng)域化的語(yǔ)義網(wǎng)絡(luò),強(qiáng)調(diào)廣義概念之間的關(guān)聯(lián)關(guān)系.近年來(lái)面向特定行業(yè)應(yīng)用領(lǐng)域的知識(shí)圖譜逐步涌現(xiàn),例如語(yǔ)義網(wǎng)絡(luò)知識(shí)圖譜[119]以及醫(yī)療知識(shí)圖譜[120]等.對(duì)于交通領(lǐng)域,則需要明確知識(shí)實(shí)體以及實(shí)體之間的多層次關(guān)聯(lián)關(guān)系,挖掘跨域全時(shí)交通數(shù)據(jù)之間的深度關(guān)聯(lián)與知識(shí)聚合,實(shí)現(xiàn)交通知識(shí)圖譜構(gòu)建.在構(gòu)建交通知識(shí)圖譜的基礎(chǔ)上,可研究知識(shí)的嵌入模型.目前,主流方法有基于TransE[121]及其擴(kuò)展和變體的平移距離模型以及基于Rescal[122]的擴(kuò)展和變體語(yǔ)義匹配模型等.交通知識(shí)的嵌入對(duì)于交通預(yù)測(cè)模型而言可提供無(wú)法由交通流數(shù)據(jù)中學(xué)得的額外信息.因此,如何對(duì)交通知識(shí)進(jìn)行抽取并構(gòu)建相關(guān)知識(shí)圖譜,如何將交通知識(shí)嵌入交通預(yù)測(cè)模型之中,如何將富有價(jià)值意義的交通知識(shí)應(yīng)用于實(shí)際交通預(yù)測(cè)問(wèn)題之中是未來(lái)交通預(yù)測(cè)領(lǐng)域的重點(diǎn)研究方向之一.
1)本文首先梳理了交通預(yù)測(cè)問(wèn)題以及圖卷積神經(jīng)網(wǎng)絡(luò)的基本定義.在此基礎(chǔ)上對(duì)不同類(lèi)型的基于GCN的交通預(yù)測(cè)模型進(jìn)行分類(lèi)介紹,包括圖時(shí)空網(wǎng)絡(luò)、圖自編碼器以及圖注意力網(wǎng)絡(luò)等.
2)針對(duì)交通預(yù)測(cè)實(shí)驗(yàn),本文介紹了目前全球范圍內(nèi)廣泛用于科學(xué)研究的部分公開(kāi)交通數(shù)據(jù)集,包括其數(shù)據(jù)來(lái)源、數(shù)據(jù)內(nèi)容以及數(shù)據(jù)獲取地址等信息.
3)討論了未來(lái)的幾點(diǎn)研究方向,包括應(yīng)用研究方向、模型研究方向以及多源數(shù)據(jù)研究方向.本文適合用于快速了解GCN在交通預(yù)測(cè)領(lǐng)域的模型及應(yīng)用.