唐進君 曾 捷 段一鑫
(中南大學交通運輸工程學院 長沙 410075)
交通流預測的對象包括流量、速度、占有率,以及行程時間等交通參數(shù).按照數(shù)據(jù)采樣間隔及預測時長來劃分,可分為長期預測與短時預測兩種類型.其中,短時交通流預測的數(shù)據(jù)采樣及預測步長主要為2,5,10 min等;而長期交通流預測普遍按照h、d、月及更長間隔等作為采樣間隔來統(tǒng)計交通流數(shù)據(jù),進而預測其未來變化情況.短時交通流預測是ITS中諸多實時應用的基礎,能夠在緩解交通擁堵、動態(tài)路徑規(guī)劃,以及信號配時優(yōu)化等方面發(fā)揮重要作用.
根據(jù)所預測的道路類型來進行分類,短時交通流預測可以分為高速公路交通流預測和城市道路交通流預測兩種類型.其中,相較于高速公路交通流預測而言,城市道路交通流所服務的出行者范圍更廣,路網中各路段之間的連通性更強,交通狀態(tài)檢測設備更為豐富,因此在交管部門的實時管理中具有廣闊的應用前景.同時,由于城市路網中存在著信號設備的固定控制,會對交通流產生周期性的間斷作用,導致其在短時內具有更為強烈的波動性,從而給準確的短時預測帶來了極大的挑戰(zhàn).
本文立足于大數(shù)據(jù)背景下的城市道路交通流預測,根據(jù)預測對象的空間維度將現(xiàn)有研究劃分為單節(jié)點交通流預測及路網級交通流預測,研究范圍涵蓋統(tǒng)計學模型、機器學習模型、傳統(tǒng)深度學習模型及新穎的圖神經網絡模型.基于現(xiàn)有預測方法及預測模式,總結了現(xiàn)有研究中存在的不足,并指出了未來的研究熱點及進展.
將路段、檢測器等交通流狀態(tài)采集地點定義為路網中的節(jié)點.單節(jié)點交通流預測是指基于單個節(jié)點(即路段或檢測器)或其周圍多個節(jié)點的歷史交通流信息來預測單個節(jié)點的未來交通狀態(tài).其中,又可以根據(jù)所使用到的周圍節(jié)點的數(shù)量來將這種預測模式進一步劃分為:考慮交通流時變特征的預測方法與考慮空間相關性的預測方法.前者僅使用到了目標節(jié)點的歷史交通流數(shù)據(jù),而后者則引入了與目標節(jié)點具有較強相關性(包括相關性系數(shù)以及上下游影響等)的節(jié)點的歷史交通數(shù)據(jù).
1.1.1考慮交通流時變特征的預測方法
交通狀態(tài)的時間關聯(lián)性是交通流預測中最為重要的影響因素之一.圖1以長沙市某交叉路口2019年7月期間交通流數(shù)據(jù)為例,進行交通流周期相似性分析.從時間維度來看,交通流的時間關聯(lián)性包括短時相關性、日相似性、周相似性等.為了充分挖掘交通流的時變特征,學者們廣泛應用統(tǒng)計學方法、機器學習方法及部分深度學習方法(主要為循環(huán)神經網絡及其變體)來探索交通流的時間相關性.
圖1 交通流時變特征分析
當僅考慮交通流時變特征時,預測模式可以概括為:假設xt={xt-p+1,xt-p+2,…,xt}為t時刻的輸入向量;xt為t時刻的交通流數(shù)據(jù),旨在從歷史數(shù)據(jù)庫中學習或計算得到一個映射函數(shù)F(·),從而能夠預測得到t+q時刻的交通流參數(shù).
(1)
1) 基于統(tǒng)計學的預測方法 統(tǒng)計學方法通常將單個節(jié)點的交通流數(shù)據(jù)視為序列數(shù)據(jù),從而使用時間序列分析方法進行預測.在所有的統(tǒng)計學方法,差分整合移動平均自回歸模型(autoregressive integrated moving average, ARIMA)及其變體是短時交通流預測領域中應用最為廣泛的時間序列分析方法.同時,其他的時間序列分析模型,如卡爾曼濾波(Kalman-filter)、廣義自回歸條件異方差模型(generalized autoregressive conditional heteroskedasticity model, GRACH)等,也都在這一領域中得到了廣泛的應用.韓超等[1]基于ARIMA模型提出了一種自適應預測算法,在仿真數(shù)據(jù)上的預測結果表明:該模型在不同的交通流狀態(tài)下均能取得較為準確的預測效果.李文勇等[2]提出了一種結合Box-Cox指數(shù)變換與ARIMA的改進模型,能夠有效解決由交通流的長期自相關所產生的異方差性.薛潔妮等[3]提出了一種基于混沌時間序列分析方法的短時交通流預測模型,通過相空間重構、局部多項式擬合等操作來實現(xiàn)準確預測.實驗結果表明:該方法既能夠保證一定的預測準確性,同時還能滿足實時應用的需求.Min等[4]將時空ARIMA模型與動態(tài)轉向率預測模型相結合,設計了一種名為動態(tài)時空ARIMA的預測框架,用于提升城市交叉口處交通流預測的準確性與預測效率.Li等[5]提出了一種基于偏最小二乘回歸(partial least square, PLS)的預測模型,該模型能夠有效兼顧預測準確性與運算效率,并且具有較強的可解釋性.
然而,雖然這些基于統(tǒng)計學方法的預測模型能夠給短時交通流預測任務帶來更強的可解釋性,但是往往在探索交通時序數(shù)據(jù)的復雜非線性關系中具有局限性,并且存在著計算復雜度高的缺點.在如今大數(shù)據(jù)時代的交通系統(tǒng)中,難以取得較好的預測效果.
2) 基于機器學習的預測方法 為了緩解這些基于統(tǒng)計學模型中所存在的不足,將機器學習模型用于短時交通流預測研究,模型包括人工神經網絡(artificial neural networks, ANN)、支持向量機(support vector machines, SVM)、決策樹(decision trees)及貝葉斯網絡(Bayesian networks)等.Tang等[6]在充分考慮交通流時間序列的周期性特征的基礎上,通過將無監(jiān)督學習與監(jiān)督學習相結合的方式,提出了一種改進的模糊神經網絡(fuzzy neural network, FNN)結構,用于城市道路短時速度預測.此后,考慮到交通流時間序列的波動性,Tang等[7]引入了一種數(shù)據(jù)降噪方法來緩解交通流的波動性,并將降噪結果輸入SVM模型來實現(xiàn)準確預測.同時,為了進一步提升機器學習模型的預測效果,避免模型參數(shù)在訓練過程中陷入局部最優(yōu)解,大量的學者引入了啟發(fā)式算法來優(yōu)化機器學習模型的有關參數(shù).姚智勝[8]提出了一種基于最小二乘支持向量機回歸算法的短時交通流預測模型,并將遺傳算法與回溯系數(shù)選擇過程相結合用于模型最佳參數(shù)選擇.李松等[9]在BP神經網絡的基礎上引入了一種改進粒子群算法,從而利用粒子群算法來對于神經網絡中的權重進行優(yōu)化,有助于提升模型的預測準確性.
在傳統(tǒng)的機器學習模型中,普遍缺乏能夠有效處理時間序列數(shù)據(jù)的模塊,從而導致其對時間序列特征的學習能力存在不足.同時,機器學習模型往往需要在數(shù)據(jù)預處理階段人為設定一系列特征工程,而非直接通過模型對于數(shù)據(jù)特征進行挖掘.因此,當面臨體量龐大且多源異構的交通流數(shù)據(jù)時,傳統(tǒng)的機器學習模型難以取得滿意的預測效果.
3) 基于深度學習的預測方法 應用于短時交通流時變特征挖掘及預測領域的深度學習模型主要為循環(huán)神經網絡(recurrent neural network, RNN)及其變體長短時記憶網絡(long short-term memory, LSTM)和門控循環(huán)單元(gated recurrent unit, GRU).LSTM是目前RNN及其變體中應用最為廣泛的模型,其模型結構見圖2.該模型的主要組成部分包括:輸入門(input gate)、遺忘門(forget gate)、輸出門(output gate)及記憶單元(memory cell).在模型的計算過程中,能夠利用輸入門來獲取當前時刻的交通狀態(tài),并且通過遺忘門來保留歷史交通信息,從而提升了模型處理時間序列的能力.
圖2 LSTM模型結構圖
Ma等[10]首次將LSTM應用于短時交通流預測領域,實驗結果證明了LSTM能夠取得明顯優(yōu)于傳統(tǒng)的機器學習模型以及統(tǒng)計學模型的預測效果.Ma等[11]提出了一種結合時間序列分析方法與LSTM-雙向LSTM的短時交通流預測方法.實驗結果表明:相較于基礎的LSTM模型及雙向LSTM模型而言,該組合模型能夠在預測穩(wěn)定性和準確性上均取得一定的提升.Gu等[12]利用貝葉斯方法設計了一種由GRU、ARIMA,以及徑向基網絡組成的預測框架,從而能夠在面臨不同交通狀態(tài)時使用更為合適的模型進行預測.Peng等[13]構建了一種結合注意力機制與LSTM的ALSTM模型結構,實驗結果表明:所使用到的注意力機制能夠有效提升LSTM對時間序列特征的學習能力.陸文琦等[14]在利用集成經驗模態(tài)分解(empirical mode decomposition, EMD)方法處理原始交通速度數(shù)據(jù)的基礎上,設計了一種結合雙向LSTM及注意力機制的混合深度學習模型,實現(xiàn)了車道級交通速度的準確預測.張煒健[15]立足于軌跡數(shù)據(jù)分析,利用EMD算法處理高頻噪聲數(shù)據(jù),并利用GRU模型實現(xiàn)交叉口處轉向流量預測.但是,在路網中行駛的車輛總是會在一定時間內連續(xù)通過若干個路段,因此會給路網中不同位置的交通狀態(tài)之間帶來空間關聯(lián)性.然而,在這些基于RNN及其變體的交通流預測模型中,往往忽略了不同空間位置的交通流之間的交互性.因此,其預測效果往往受到限制,并且容易在多步預測任務中產生較大的預測誤差.
1.1.2考慮空間相關性的預測方法
(2)
從預測原理上看,開展相關聯(lián)節(jié)點的有效識別是此類預測方法的關鍵.根據(jù)節(jié)點相關性度量的原理,可以將現(xiàn)有研究劃分為經驗定義方法以及數(shù)據(jù)驅動方法兩大類.
經驗定義方法可以總結為:根據(jù)各節(jié)點在路網中的上下游關系,來確定各節(jié)點之間的關聯(lián)性,該方法的示意圖見圖3.Yao等[16]提出了一種基于時間參數(shù)與空間參數(shù)的SVM模型,用于城市道路的短時速度預測研究.劉曉玲等[17]的研究表明,SVM模型在同時考慮目標路段及其下游路段的交通狀態(tài)時,能夠在短時交通流預測任務中取得更為準確的預測效果.韓衛(wèi)國等[18]在利用時空ARIMA模型進行短時交通流預測的過程中發(fā)現(xiàn),當同時引入目標交叉口以及其相鄰交叉口的交通流時間序列數(shù)據(jù)時,模型的預測準確性能夠取得大幅提升.王祥雪等[19]通過運用交通流時空關聯(lián)性開展了交通流時間序列重構,并提出了一種結合LSTM與RNN的深度學習模型,用于城市快速路短時交通流預測.楊春霞等[20]設計了一種融合上下游關系與LSTM的短時交通流預測模型,并提出了一種基于嶺回歸算法的權重計算方法,從而得到最終的預測值.
圖3 基于上、下游鄰接關系的相關聯(lián)交叉口識別示意圖
而數(shù)據(jù)驅動的方法的原理可以概括為:基于歷史交通流數(shù)據(jù)庫,利用相關系數(shù)等方法來定量刻畫節(jié)點之間的關聯(lián)性,進而為目標節(jié)點選取關聯(lián)性最強的若干個節(jié)點.Li等[21]設計了一種基于貝葉斯網絡的交通流預測框架,并選取了Graphical Lasso方法、空間鄰近準則以及相關系數(shù)方法來進行關聯(lián)路段選取.Gu等[22]在城市道路車道級速度預測中引入了灰色關聯(lián)分析來識別出與目標車道關聯(lián)性較強的車道,并設計了一種結合LSTM與GRU的堆疊模型開展短時速度預測.Tang等[23]通過融合交通流時間序列的統(tǒng)計學相關性以及路網交通特征,進行相關聯(lián)的交叉口進口道識別,并引入了一種結合遺傳算法與LSTM的GA-LSTM模型來開展進口道級短時流量預測.
大量研究表明:引入空間關聯(lián)性的模型能夠取得更為準確的預測效果.但是,由于其往往僅用于預測單個節(jié)點的未來交通狀態(tài),因此難以在短時內為交通網絡的實時應用管理提供足夠的有效信息.同時,考慮到此類預測模型需要針對于每個節(jié)點分別進行模型訓練,因此當路網規(guī)模擴大時,模型的訓練開銷與存儲開銷會呈現(xiàn)線性上升的趨勢,導致其實用性大幅下降.
1.2.1基于卷積神經網絡的預測方法
由于卷積神經網絡(convolutional neural network, CNN)能夠有效挖掘圖片中各像素點之間的關聯(lián)性,因此已有大量學者將其引入路網級交通流預測研究中.同時,一些特殊的CNN結構,如Conv1D、時間卷積網絡(temporal convolutional network, TCN)等,也能夠被直接用于單點交通流預測中.一般而言,基于CNN的交通流預測方法首先需要構建柵格結構的歷史交通流數(shù)據(jù),進而利用CNN來挖掘各柵格之間的時空關聯(lián)性.在現(xiàn)有短時交通流預測研究中,柵格構建方法可以分為三種類型.
1) 將柵格化處理以后的城區(qū)視為圖片,具體構建方法見圖4.蒲悅逸等[24]設計了一種基于端到端(End to End)框架的交通流預測模型,在對城市區(qū)域進行柵格化處理的基礎上,分別利用ResNet以及LSTM探索交通流的時空關聯(lián)性,并通過實例分析證明了該模型不僅能夠取得更為準確的預測效果,還能夠有效減少模型參數(shù).Zheng等[25]將廈門市進行規(guī)則網格劃分,并提出了一種名為DeepSTD的端到端學習框架來進行全市范圍內的交通流預測.Zhang等[26]在將城區(qū)進行網格劃分的基礎上,設計了一種名為ST-ResNet的預測模型,來對于各區(qū)域的進、出交通量進行預測.在此基礎上,Zhang等[27]進一步考慮了區(qū)域內部交通量與區(qū)域間OD交通量的協(xié)同性,構建了一個多任務深度學習模型來實現(xiàn)二者的協(xié)同預測.Liu等[28]基于ConvLSTM模型構建了一種名為Attentive Traffic Flow Machine的交通狀態(tài)預測模型,其中所使用到的ConvLSTM是一種結合CNN與LSTM運算機制的混合模型,能夠有效提取柵格化數(shù)據(jù)的時變特征.
圖4 基于柵格化處理的網格數(shù)據(jù)構建方法
2) 將路網中各節(jié)點按照一定的排列規(guī)律排列為二維空間矩陣形式,其構建示意圖參見圖5.Dai等[29]為了使用CNN在高速公路網絡上開展短時交通流預測,提出了一種檢測器排列算法,從而將高速公路網絡中的各檢測器按照一定的規(guī)律排列為二維矩陣形式,便于使用CNN進行預測.
圖5 檢測器網絡的二維空間矩陣轉化過程示意圖
3) 將由所有節(jié)點在同一時刻構成的交通流數(shù)據(jù)按照一定規(guī)則排列為向量,進而將各時刻的向量按照時間先后順序堆疊為二維矩陣形式.其中,該矩陣的行(或列)表征節(jié)點數(shù)量,矩陣另一維度表示先前時間步的長度.Ma等[30]構建了一種二維時空速度矩陣,并設計了一種CNN模型用于提取網絡級交通流數(shù)據(jù)中的時空關聯(lián)性.陳思曲等[31]利用時空關系將交通速度數(shù)據(jù)轉化為二維矩陣形式,并設計了深度CNN模型開展行程速度預測研究.此外,唐克雙等[32]在構建二維行程速度矩陣的基礎上,設計了一種基于Inception框架的CNN模型,用于城市快速路速度預測.
雖然基于CNN的預測方法已經吸引了大量學者的關注,但是這三種柵格化數(shù)據(jù)構建方法在實際應用的過程中也面臨著一些需要解決的問題.例如,對于第一種構建方法而言,在柵格劃分的過程中會面臨一大難題,即柵格的大小設置.如果柵格過大,則難以獲取得到精細化的城市交通狀態(tài);而一旦柵格尺寸過小,則可能產生大量的交通數(shù)據(jù)缺失的柵格,從而給準確預測帶來挑戰(zhàn).而對于第二、三種構建方法而言,則需要設計出一種合適的排列規(guī)則,用于將節(jié)點排列為合理的一維向量或二維矩陣形式.同時,在這些基于網格劃分的預測方法中,所使用到的CNN模型普遍難以處理非歐幾里得空間數(shù)據(jù),因此路網的拓撲結構往往遭到了忽視,導致難以深入地挖掘路網內部的空間關聯(lián)性.
1.2.2基于圖神經網絡的預測方法
由于城市路網具有天然的拓撲結構,因此近幾年來大量學者應用了圖神經網絡(graph neural network, GNN)來實現(xiàn)路網級預測.其中,使用最為廣泛的預測模型為圖卷積神經網絡(graph convolutional network, GCN),同時圖注意力網絡(graph attention network, GAT)以及GraphSAGE等模型也都得到了大量應用.基于GNN的預測模式可以概括為:假設Xt∈N×M(其中,N為路網中的節(jié)點數(shù)量,M為預測所使用到的先前時間步的長度),在給定拓撲網絡G=(V,E)的情況下(V為節(jié)點集;E為邊集),旨在從歷史數(shù)據(jù)庫中學習得到一個映射函數(shù)F(·),從而能夠預測得到t+q時刻的路網中所有節(jié)點的交通流參數(shù)N.
(3)
Zhao等[33]通過結合GCN與GRU,構建了一種名為T-GCN的圖神經網絡模型,能夠有效處理圖結構的時間序列數(shù)據(jù).Zhang等[34]為了解決交通流多步預測這一難題,提出了一種名為AGC-Seq2Seq的圖神經網絡預測模型,通過融合Seq2Seq、GCN以及注意力機制來深入挖掘路網交通流的復雜時空相關性.Liu等[35]提出了一種考慮時空關聯(lián)性的數(shù)據(jù)修復算法,用于填補路段上的缺失速度數(shù)據(jù),并利用GraphSAGE模型來開展網絡級交通速度預測.Tang等[36]設計了一種結合復雜網絡理論中的社團檢測算法與GCN的MC_STGCN模型,并將其應用于出租車出行需求預測,通過實驗證明了引入社團檢測算法的有效性.閆旭等[37]為提高城市交通態(tài)勢的預測精度,將自由流動可達矩陣(free-flow reachable matrix)引入時空圖卷積神經網絡中,構建了一種改進的網絡級交通流量預測模型.魏金澤[38]針對于交通數(shù)據(jù)樣本缺失的問題,設計了一種基于遷移學習機制的時空圖網絡模型,分別利用GRU以及GCN捕捉交通系統(tǒng)的時空關聯(lián)性,并利用注意力機制挖掘時空模態(tài)特征,實現(xiàn)了小樣本條件下短時交通流的準確預測.奚桂鍇[39]設計了一種名為時空語義圖神經網絡的時空預測模型,利用時序建模策略分別提取交通狀態(tài)的時空依賴性,并通過消融實驗證明了各模塊的有效性.潘衛(wèi)鵬等[40]設計了一種圖注意力卷積網絡,并通過真實數(shù)據(jù)集上的交通流預測實驗證明了該模型能夠準確提取路網交通流的時空關聯(lián)性.陳孟等[41]針對于實時多模態(tài)時空數(shù)據(jù)的變化特征,設計了一種結合時空圖卷積網絡與卡爾曼濾波的預測模型,并開展了有效性與可信度評估,證明了該模型的準確性與魯棒性.曾筠程等[42]設計了一種基于有向圖卷積神經網絡的交通預測模型,并在此基礎上提出了擁堵產生點識別方法及管控策略,從而有效阻斷交通擁堵在路網中的蔓延,提升道路網絡的通行效率.但是,在將圖神經網絡用于交通流預測的過程中,存在一個關鍵性的問題,即需要先構建一個或若干個合理的拓撲路網.在圖神經網絡中所使用到的拓撲網絡不僅會對預測結果產生較大的影響,同時其疏密程度還會直接影響深度學習模型的運行效率.在現(xiàn)有的高速公路的短時交通流預測研究中,學者們普遍采取了物理鄰接關系或者基于距離的網絡構建準則來進行拓撲網絡構建.但是,相較于高速公路網絡而言,城市路網具有更為稠密的網絡密度以及更大的連通性.以圖6所示的局部路網內的車道級流量預測為例,該區(qū)域共存在四個交叉口,16個進口道,64條車道.如果直接從車道之間的鄰接關系來提取得到拓撲網絡,則可能致使部分連接邊之間的關聯(lián)性較弱.此外,出于檢測設備安裝及運維成本的考慮,城市路網內部并非所有交叉口處均安裝了檢測設備,導致配備有檢測設備的交叉口在路網內部的空間分布情況較為稀疏.如何在稀疏條件下利用鄰接關系進行拓撲網絡構建,同樣也是一項艱巨的挑戰(zhàn).而如果直接采取基于距離的網絡構建方法,則會面臨著難以定義城市路網內部車道與車道之間的距離這一難題.
因此,如何在城市路網內部更加合理、有效地為圖神經網絡構建拓撲圖已成為網絡級短時交通流預測研究亟需解決的問題.在現(xiàn)階段,已有部分學者針對于這一問題展開嘗試.文獻[43]為了在分布稀疏的車牌識別設備(license plate recognition, LPR)所構成的路網下開展車道級以及進口道級短時交通流預測研究,提出了一種基于數(shù)據(jù)驅動的路網重構方法.該研究將車道或進口道視為網絡中的節(jié)點,先從LPR數(shù)據(jù)中提取得到了各節(jié)點之間的平均行程時間以及流量轉移關系,在此基礎上將各節(jié)點之間的平均行程時間視為節(jié)點之間的距離,引入了一種復雜網絡構建方法將路網轉化為有向圖,并在此基礎上利用流量轉移關系計算網絡中各條邊上的權重,從而將其構建為加權有向圖,最終輸入圖神經網絡中進行預測.通過多種圖神經網絡在路網鄰接網絡及所構建的加權有向圖上的預測結果對比,實驗結果表明:所選取的若干種圖神經網絡模型均能夠在所構建的加權有向圖上取得更為準確的預測效果.此外,在地鐵短時客流預測領域中,Liu等[44]分別利用地鐵拓撲網絡、站點間客流相似度,以及站間OD矩陣來進行拓撲圖構建,并提出了一種適合于多圖卷積的圖神經網絡模型來實現(xiàn)客流預測.這些基于數(shù)據(jù)驅動以及復雜網絡的研究方法為未來此領域的研究提供了一種可行的思路,即可以利用路網交通特征來進行網絡重構,而非直接使用路網內部的鄰接關系.通過這種方式,不僅能夠有效解決檢測設備分布稀疏這一問題,同時還能夠引入更為豐富的實際交通特征到拓撲網絡構建的過程中來,有助于提升模型的預測準確度.
圖6 局部路網車道級鄰接網絡構建
與此同時,有學者開始認為基于先驗知識及路網鄰接關系所構建得到的拓撲網絡可能難以充分體現(xiàn)出影響交通需求的內在屬性,例如,用地性質、街區(qū)基礎設施特征等.因此,基于可學習鄰接矩陣的交通流預測研究同樣也開始吸引學者們的關注,這種方法通過數(shù)據(jù)驅動的方式,利用深度學習模型從既有交通數(shù)據(jù)中學習得到一個鄰接矩陣,再將其用于交通流預測.Diao等[45]提出了一種動態(tài)拉普拉斯估計器,從而將所得到的動態(tài)圖結構輸入圖神經網絡中進行預測,并證明了所提出的空間相關性學習過程(即動態(tài)拉普拉斯估計器)的有效性.此外,考慮到交通網絡的動態(tài)變化特征,Li等[46]提出了一種結合圖神經網絡與循環(huán)神經網絡的模型結構,使得深度學習模型能夠在循環(huán)神經網絡的每一個步長下生成一個鄰接矩陣,從而反映出路網的時變特征.
近些年來,盡管眾多新穎的深度學習模型能夠在城市道路短時交通流預測任務上取得更為準確的預測效果,但是這些模型往往只關注于從數(shù)據(jù)驅動的角度來探索城市路網的復雜時空相關性,而忽略了城市路網這一交通系統(tǒng)內在的固有特征.例如,城市路網內部的各路段之間,其道路等級、路段長度,以及道路基礎設施等勢必存在著一定的差異性,而這些因素均會對交通狀態(tài)產生影響.對于未來的交通流預測研究而言,值得關注的交通特征包括:
1) 速度、流量等交通參數(shù)之間的關聯(lián)性 現(xiàn)有的研究大多僅關注于單一交通流狀態(tài)的短時預測,而忽略了多種參數(shù)之間的關聯(lián)性.Zou等[47]基于copula聯(lián)合分布函數(shù)的研究表明,微觀交通流參數(shù)之間存在依賴性.未來的研究可以在預測模型中深入探索各參數(shù)之間的內在關聯(lián)性,實現(xiàn)各交通參數(shù)未來狀態(tài)的協(xié)同預測.
2) 路段之間的異質性 當網絡級預測的節(jié)點為城市路網中的交叉口或斷面時,拓撲網絡中的邊即代表連接各節(jié)點的路段.由于各路段長度、車道數(shù)等交通基礎設施條件存在差異,則各相鄰節(jié)點對于中心節(jié)點應具有不同的重要性.此外,如果將路網中的各路段視為網絡中的節(jié)點,網絡中的邊則表征路段之間的相鄰關系.而由于各路段具有不同的長度,不僅會導致各節(jié)點在整個拓撲網絡中的重要性不同,同時也會導致長路段與短路段上所采集到的交通狀態(tài)的準確性存在差異性.
3) 信號配時方案 城市道路交通流的一個最主要的特征就在于會在交叉口處受到信號設備的控制,從而給交通流帶來間斷流特征,并且造成其在短時間間隔下具有較強的波動性.在未來的城市道路交通流預測研究中,可進一步將信號配時方案與交通流時間序列數(shù)據(jù)有效融合,從而提升預測模型對于強波動性交通流數(shù)據(jù)的應對能力.
現(xiàn)階段,城市路網內部的交通狀態(tài)檢測設備可以劃分為固定檢測設備與移動式檢測設備兩種類型.其中,固定檢測設備往往安裝在城市道路交叉口處,而移動式檢測設備主要為安裝在出租車等浮動車上的GPS設備.從二者的安裝位置及數(shù)據(jù)采集特點可以發(fā)現(xiàn),固定檢測設備能夠準確統(tǒng)計斷面交通信息,而移動監(jiān)測設備能夠反映出各路段上的交通狀態(tài).因此,可將二者采集得到的交通狀態(tài)分別視為點數(shù)據(jù)以及線數(shù)據(jù).前者能夠反映進出路段的車流狀態(tài),而后者能夠展現(xiàn)出路段內部的實際交通分布情況,而如果能夠將點數(shù)據(jù)與線數(shù)據(jù)有效融合,則能夠起到互為補充的作用,從而有助于進一步提升預測的準確性.
現(xiàn)階段的研究往往僅單獨考慮單一交通方式自身的出行需求預測,而忽略了各種交通方式之間的客流相似性與協(xié)同性.例如,城市公共交通系統(tǒng)大多面臨著“最后一公里”難題,而共享單車的出現(xiàn)則為乘客乘坐公共交通出行提供了便利,即乘客能夠搭乘共享單車前往就近的公交或地鐵站點,從而實現(xiàn)各種交通方式之間的換乘,進而在多種交通方式的客流之間產生了協(xié)同性.因此,未來的研究可以考慮將多種交通方式的短時出行需求預測任務相結合,通過多任務、多圖卷積等深度學習框架實現(xiàn)城市交通系統(tǒng)中各種交通方式的短時出行需求的協(xié)同預測.
但是,由于我國目前各種交通方式的運營數(shù)據(jù)均掌握在各自運營企業(yè)內部,而要達成以上目的,勢必會面臨數(shù)據(jù)壁壘的問題.出于數(shù)據(jù)安全與隱私保護的考慮,各種交通方式的運營數(shù)據(jù)之間難以實現(xiàn)數(shù)據(jù)共享.而要有效解決這一問題,未來的研究可以考慮引入聯(lián)邦學習(federated learning)機制,從而在保障數(shù)據(jù)安全與用戶隱私的前提下,使用機器學習或深度學習模型來進行短時出行需求預測.目前,聯(lián)邦學習已被Liu等[48]應用高速公路短時交通流預測.但是,該項研究僅考慮了高速公路單一數(shù)據(jù)集的交通流預測,未來的研究可進一步將聯(lián)邦學習機制拓展至城市交通系統(tǒng)中,從而深入挖掘各種交通方式客流之間的相似性與協(xié)同性.
現(xiàn)實世界中往往會存在著在城市新區(qū)新建路網的情況.當新城區(qū)的道路網絡投入運營時,由于缺乏歷史數(shù)據(jù)進行模型訓練,傳統(tǒng)的預測模型難以在此種情形下得到應用.在這種背景下,很容易想到一種解決思路:將在其他路網中完成訓練的模型引入此新建路網上進行交通流預測.雖然交通流預測領域已經歷了四十余年的發(fā)展,大量新穎的預測模型的出現(xiàn)使得預測準確性不斷提升,但是對于絕大多數(shù)預測方法而言,普遍在泛化能力上有所欠缺,難以滿足以上需求.歸納學習是一種從個別現(xiàn)象推廣至一般規(guī)律的深度學習模式,具有歸納學習能力的模型一般具有較強的泛化能力,能夠有效應對未曾在訓練集中出現(xiàn)過的實際數(shù)據(jù).從交通流預測的角度來看,歸納學習則可以視為將在其他路網上進行訓練的模型,在不經再次訓練的情況下,直接應用于另一路網進行預測.同時,隨著城市路網內部交通檢測設備的不斷完善,如果能夠直接運用既有的圖神經網絡模型,來實現(xiàn)嵌入新檢測器后的路網內部的交通流預測,則能夠大幅節(jié)省深度學習模型所帶來的開銷.因此,這種模式除了能夠解決上述提到的數(shù)據(jù)缺乏情況下的預測難題,同時還能夠以一種普適性的模型來對多個路網的交通狀態(tài)進行預測,從而大幅降低深度學習模型的訓練開銷與存儲成本.
在圖神經網絡領域,具有歸納學習能力的傳統(tǒng)圖神經網絡預測框架主要包括GAT以及GraphSAGE網絡等.文獻[43]在GAT模型的基礎上,融合了GRU、雙向LSTM以及殘差連接結構,提出了一種名為STGGAT模型的預測框架,實驗結果表明STGGAT模型與GAT模型均能在不加再次訓練的情況下,直接應用于另一拓撲結構的路網上進行預測,并取得可接受的預測準確率.從現(xiàn)實世界中的交通管理需求來看,具有歸納學習能力的交通流預測模型具有較強的工程應用價值,因此未來的研究可以關注于在訓練過程中引入子圖切割的訓練方式或者設計其他更為新穎的深度學習框架來提升模型在歸納學習任務上的預測效果.
現(xiàn)階段的路網級交通流預測研究普遍考慮將路網內的路段或檢測器所組成的網絡視為拓撲網絡.除這種空間網絡特性以外,已有利用復雜網絡理論將交通流時間序列轉化為復雜網絡,進而對交通流的時變特征展開深入挖掘.Tang等[49]利用時間序列相空間重構方法搭建了交通流量復雜網絡模型,并對復雜網絡中的關鍵參數(shù)的設定進行了討論分析.Yan等[50]利用復雜網絡理論對交通流多元時間序列數(shù)據(jù)進行建模,并進一步從復雜網絡角度對交通流特征展開分析.從網絡構建的對象來看,現(xiàn)有的短時交通流預測中所使用到的拓撲圖可以視為空間維度的復雜網絡,能夠反映出路網中不同位置的交通流狀態(tài)之間的交互作用;而文獻[49]的研究則代表時間維度的復雜網絡,能夠體現(xiàn)交通流的時間演化特征.從短時交通流預測領域的發(fā)展來看,充分探索交通流的空間關聯(lián)性與非線性時間依賴性始終是研究熱點,為了有效解決這一問題,包括LSTM、GRU以及注意力機制等在內的深度學習框架被廣泛應用于此領域中.而這些方法往往注重于依靠深度學習的“黑箱”模式來挖掘交通流的時間序列特征,但是卻缺乏可解釋性.因此,未來的研究可以考慮將交通流時間序列的復雜網絡特征與空間復雜網絡相結合,引入多元時間序列復雜網絡構建方法,來對于短時交通流的時空耦合特征進行建模,并與深度學習模型相結合進行預測,使預測方法更加貼合交通系統(tǒng)的真實演化規(guī)律.
在城市路網內部,出于檢測設備安裝成本與運營維護開銷的考慮,交管部門難以在所有的交叉口處均安裝檢測設備.如果能夠有效感知未覆蓋檢測設備的交叉口處的交通狀態(tài),則能夠為城市路網的實時交通管理提供更為豐富的決策依據(jù).同時,當交通狀態(tài)估計的準確率達到一定可接受范圍時,則能夠有助于減少城市內部的交通檢測器的數(shù)量,從而降低交管部門的運營成本.
而要解決以上問題,時空kriging任務便是一種可行的解決方案.交通流預測任務中的時空kriging任務可以概括為:利用路網中既有傳感器獲取到的交通流數(shù)據(jù),來估計同一時段下未覆蓋有傳感器處的交通流信息.文獻[51]提出了一種歸納圖神經網絡kriging模型,并設計了一種基于子圖隨機分割的訓練策略.在多個高速公路數(shù)據(jù)集上的實驗結果表明,所提出的預測框架能夠有效提升模型的歸納學習能力,使其滿足時空kriging任務的需求.與高速公路網絡相比,城市路網具有更高的網絡密度與連通性,如何充分利用城市路網內部的空間關聯(lián)性以及考慮各路段之間的異質性,是未來城市路網時空kriging研究所不能忽視的問題.此外,未來的研究還可考慮將時空kriging與短時交通流預測任務相結合,既實現(xiàn)未覆蓋檢測設備處的交通流狀態(tài)估計,同時還對其未來狀態(tài)進行預測.
由于交叉口處的城市道路交通流會受到信號設備的管控,因此導致交通流受到周期性間斷,這種間斷現(xiàn)象會對交通流時間序列數(shù)據(jù)在短時間間隔下造成嚴重的振蕩現(xiàn)象,從而給準確預測帶來嚴峻的挑戰(zhàn).目前,已有學者將小波理論、EMD等數(shù)據(jù)降噪算法引入短時交通流預測中,并通過實驗證明了該類方法的有效性.未來的研究可以考慮結合相位周期、交通事故、惡劣天氣等因素,從數(shù)據(jù)降噪的角度對交通流的短時波動特征進行挖掘,消除高頻噪聲數(shù)據(jù)的影響,還原交通流數(shù)據(jù)真實變化規(guī)律,提升模型的預測準確性.
近年來圖神經網絡逐漸成為了城市路網短時交通流預測領域中所使用到的一大重要工具.綜合前文中的介紹,現(xiàn)階段所應用的網絡構建方法可以概括為:基于鄰接關系的拓撲網絡、基于距離閾值的拓撲網絡、基于交通特征的拓撲網絡以及基于可學習鄰接矩陣的拓撲網絡.這些方法均在可解釋性、實際交通意義等方面具有各自特有的優(yōu)勢,導致現(xiàn)階段在基于GNN的短時交通流預測種尚且缺乏一種通用的拓撲圖構建范式.因此,深入探究哪種拓撲圖構建方法更適合于城市路網短時交通流預測任務,也是未來研究中潛在的不可避免的一個問題.
本文針對于城市道路短時交通流預測這一熱點問題,回顧了近年來的發(fā)展歷程與主要研究方法.根據(jù)預測對象的空間范圍,將現(xiàn)有研究按照單節(jié)點交通流預測與網絡級交通流預測進行分類,分析了現(xiàn)有研究中存在的不足,并指出了融合多維交通特征、開展多源數(shù)據(jù)時空特征協(xié)同預測、提升模型歸納學習能力、有效融合時間維度復雜網絡及空間維度復雜網絡、開展時空kriging研究、緩解交通流時間序列數(shù)據(jù)的短時強波動性以及設計GNN拓撲網絡構建范式等未來研究方向.