賀正冰,徐瑞康,謝東繁,宗芳,鐘任新
(1.北京工業(yè)大學(xué),交通工程北京重點實驗室,北京100124;2.北京交通大學(xué),交通系統(tǒng)科學(xué)與工程研究院,北京100044;3.吉林大學(xué),交通學(xué)院,長春130022;4.中山大學(xué),智能工程學(xué)院,廣州510006)
車輛跟馳模型刻畫了同一車道前后相鄰車輛間的相互作用關(guān)系以及行駛狀態(tài)變化趨勢,是最基本的微觀駕駛行為模型之一。跟馳模型是交通流理論的核心問題之一,吸引了來自交通工程學(xué)、心理學(xué)、車輛工程等諸多領(lǐng)域?qū)W者的廣泛關(guān)注,取得了豐碩的理論與實踐成果。
傳統(tǒng)跟馳模型通常運用動力學(xué)方法研究前車(引導(dǎo)車輛)運動狀態(tài)變化對后車(跟馳車輛)運動狀態(tài)的影響,通過定量分析車道上各個“引導(dǎo)車-跟馳車”的車輛對的動態(tài)特性認(rèn)識交通流運行特征,揭示交通擁堵、交通振蕩等交通現(xiàn)象的形成與演化機(jī)理。在以往的研究中,研究者大多借助車輛動力學(xué)、駕駛?cè)诵睦韺W(xué)以及數(shù)理統(tǒng)計和微積分等傳統(tǒng)數(shù)學(xué)、物理方法構(gòu)建具有實際物理意義的跟馳模型,這類跟馳模型被稱作模型驅(qū)動跟馳模型。對于這類跟馳模型,已有學(xué)者進(jìn)行了回顧。BRACKSTONE等[1]于1999年較早的發(fā)表了一篇關(guān)于跟馳模型的綜述文章,總結(jié)了經(jīng)典的Gazis-Herman-Rothery 模型[2]、安全距離(Safety Distance)模型[3]、線性(Linear)模型[4]、生理-心理(Psycho-Physical)模型[5]、基于模糊邏輯(Fuzzy Logic-based)模型[6]等的特征與適用性。HOOGENDOORN等[7],OLSTAM 等[8],PANWAI 等[9]以及TOLEDO[10]分別從微觀交通流建模,跟馳模型在仿真軟件中的應(yīng)用,駕駛?cè)说慕嵌瓤偨Y(jié)模型驅(qū)動跟馳模型的研究進(jìn)展。我國學(xué)者王殿海等[11]于2012年回顧了跟馳模型的發(fā)展歷程,將跟馳模型分為交通工程和統(tǒng)計物理兩類,從建模思想與理論體系、模型結(jié)構(gòu)、參數(shù)標(biāo)定等方面詳細(xì)闡述各類模型驅(qū)動跟馳模型,指出各類模型的不足之處,并討論了難點問題。
模型驅(qū)動跟馳模型定義嚴(yán)謹(jǐn)且具有嚴(yán)格的推導(dǎo)過程,大多參數(shù)具有明確的物理意義。然而,盡管近年相關(guān)研究充分考慮了駕駛?cè)笋{駛風(fēng)格、心理和非理性等因素,并取得了一定的成果,但是,由于駕駛行為涉及復(fù)雜的人的因素,且不同的車輛性能、道路條件、環(huán)境條件等均會顯著影響駕駛?cè)诵袨椤R虼?,將多樣化的因素融入?shù)學(xué)模型中,勢必會增加模型的復(fù)雜度,給模型參數(shù)標(biāo)定帶來極大的困難。同時,由于標(biāo)定模型所使用的數(shù)據(jù)源不盡相同,標(biāo)定方法與評價指標(biāo)也有差異,參數(shù)標(biāo)定的結(jié)果經(jīng)常存在較大誤差。
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)采集技術(shù)快速提升,研究者可以獲取高精度、大樣本、瞬時車輛運動數(shù)據(jù),數(shù)據(jù)驅(qū)動跟馳模型應(yīng)運而生。數(shù)據(jù)驅(qū)動跟馳模型,是以真實的車輛行駛數(shù)據(jù)為基礎(chǔ),利用數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)等理論和方法,通過樣本數(shù)據(jù)的訓(xùn)練、學(xué)習(xí)、迭代、進(jìn)化,挖掘跟馳行為的內(nèi)在規(guī)律。針對數(shù)據(jù)驅(qū)動跟馳模型,王殿海等[11]在跟馳模型研究進(jìn)展中總結(jié)為模糊邏輯和人工神經(jīng)網(wǎng)絡(luò)兩類跟馳模型。近年來,信息技術(shù)和數(shù)據(jù)技術(shù)迅猛發(fā)展,機(jī)器學(xué)習(xí)等相關(guān)領(lǐng)域取得了突破性成果,亟需對最新數(shù)據(jù)驅(qū)動跟馳模型成果進(jìn)行系統(tǒng)性梳理。另外,楊海龍等[12]在跟馳模型綜述中介紹了數(shù)據(jù)驅(qū)動跟馳模型進(jìn)展并展望未來發(fā)展趨勢,但由于只是跟馳模型綜述的一部分,對于數(shù)據(jù)驅(qū)動跟馳模型本身的系統(tǒng)性與深入性分析不足。本文聚焦數(shù)據(jù)驅(qū)動跟馳模型,并從數(shù)據(jù)來源、模型輸入與輸出、模型驗證3個對數(shù)據(jù)驅(qū)動跟馳模型最重要的方面深入梳理相關(guān)研究,評述研究現(xiàn)狀,展望發(fā)展趨勢。
近20年的兩項科技進(jìn)步極大推動了數(shù)據(jù)驅(qū)動跟馳模型的誕生與進(jìn)步。首先,顛覆世界科技的深度學(xué)習(xí)的誕生,解決了數(shù)據(jù)驅(qū)動模型的“工具”問題;其次,高精度、大樣本車輛軌跡數(shù)據(jù)的出現(xiàn),解決了數(shù)據(jù)驅(qū)動模型的“原料”問題。本文以深度學(xué)習(xí)的出現(xiàn)為界,分類綜述基于神經(jīng)網(wǎng)絡(luò)、支持向量回歸、K 近鄰這3 大傳統(tǒng)機(jī)器學(xué)習(xí)方法的數(shù)據(jù)驅(qū)動跟馳模型和基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動跟馳模型;介紹部分?jǐn)?shù)據(jù)與模型混合驅(qū)動跟馳模型;并滲透式總結(jié)車輛軌跡數(shù)據(jù)的應(yīng)用。
1.1.1 基于神經(jīng)網(wǎng)絡(luò)的跟馳模型
神經(jīng)網(wǎng)絡(luò)是一種仿照人類大腦結(jié)構(gòu)建立的網(wǎng)絡(luò)模型,將人腦神經(jīng)元抽象成不同的節(jié)點,并按照不同的連接方式組成不同的網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)起源于20 世紀(jì)40年代,興起于20 世紀(jì)80年代,是持續(xù)20 余年的人工智能領(lǐng)域研究熱點。隨著神經(jīng)網(wǎng)絡(luò)的興起,KEHTARNAVAZ 等[13]于1998年提出基于時延前反饋神經(jīng)網(wǎng)絡(luò)的跟馳模型,通過輸入人工駕駛車輛行駛數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),并通過實車實驗測試跟馳效果,很好地證實了神經(jīng)網(wǎng)絡(luò)應(yīng)用于車輛跟馳,尤其是自動駕駛車輛跟馳的可行性。隨后,我國學(xué)者賈洪飛等[14]、徐學(xué)明等[16]以及國外學(xué)者M(jìn)A[15]、PANWEI 等[17]分別從不同角度,例如,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、輸入輸出、數(shù)據(jù)源等開展研究,提出不同的基于神經(jīng)網(wǎng)絡(luò)的跟馳模型。文獻(xiàn)[13]給出實車實驗測試跟馳情景,如圖1所示。
圖1 搭載神經(jīng)網(wǎng)絡(luò)模型的自動駕駛車輛及其實車跟馳測試情景[13]Fig.1 Autonomous vehicle equipped with proposed neural network-based car-following model and its real-world car-following tests[13]
1.1.2 基于支持向量回歸的跟馳模型
支持向量回歸是在支持向量機(jī)基礎(chǔ)上考慮了回歸問題,理論上較人工神經(jīng)網(wǎng)絡(luò)有更強(qiáng)的數(shù)據(jù)學(xué)習(xí)能力和泛化能力。為研究車輛跟馳過程的非對稱性及其對交通流演化的影響,WEI等[18]提出一種基于支持向量回歸的跟馳模型,從微觀層面討論走停波的時滯現(xiàn)象,并在宏觀層面再現(xiàn)了不同的擁堵傳播模式。ZHANG等[19]將道路條件引入自動駕駛車輛的駕駛決策,以支持向量機(jī)回歸為基礎(chǔ),采用加權(quán)混合核函數(shù)和粒子群優(yōu)化算法,設(shè)計了適用于自動駕駛汽車的駕駛決策模型。文獻(xiàn)[18]給出基于支持向量機(jī)回歸的跟馳模型結(jié)構(gòu),如圖2 所示,圖中,K(??)為核函數(shù),X 和X′為樣本,ω 和b 為回歸模型參數(shù)。
圖2 基于支持向量回歸的跟馳模型[18]Fig.2 Framework of Support Vector Regression-based carfollowing model[18]
1.1.3 基于K近鄰的跟馳模型
作為最經(jīng)典的機(jī)器學(xué)習(xí)算法之一,K 近鄰有著簡單而強(qiáng)大的特點?;凇懊鎸ν瑯拥鸟{駛情景(或局勢),駕駛?cè)送憩F(xiàn)出相似的駕駛行為”的假設(shè),HE 等[20]通過搜索歷史車輛軌跡數(shù)據(jù)庫,匹配相似的K 個歷史駕駛場景,得到最可能的駕駛行為,作為模型輸出,得到基于K 近鄰的數(shù)據(jù)驅(qū)動跟馳模型。相較于結(jié)構(gòu)完全不透明的其他機(jī)器學(xué)習(xí)方法,基于K 近鄰的跟馳模型有著更貼近駕駛行為的建模假設(shè)和更加清晰易懂的建模思想。文獻(xiàn)[20]給出基于K 近鄰的跟馳模型建模思路,如圖3所示。
圖3 基于K近鄰的跟馳模型建模思路Fig.3 Modelling logic of K-Nearest Neighbor-based car-following model
典型的深度學(xué)習(xí)模型就是很深層的神經(jīng)網(wǎng)絡(luò)[32]。相較于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型,深度學(xué)習(xí)模型通常具有多個隱層(通常有5~6 層,甚至10 多層的隱層節(jié)點)以及相應(yīng)的數(shù)量巨大的神經(jīng)元連接權(quán)、閾值等參數(shù)。常見的深度學(xué)習(xí)方法有:卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)、深度信念神經(jīng)網(wǎng)絡(luò)(Deep Brief Neural Network)、遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)和長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory Neural Network)等。在近10年里,深度學(xué)習(xí)模型取得了巨大成功,甚至影響了整個世界科學(xué),因此,逐漸成為機(jī)器學(xué)習(xí)領(lǐng)域一個獨立分支。
同樣,深度學(xué)習(xí)的快速發(fā)展亦引起了交通流研究者的廣泛關(guān)注,各種基于深度學(xué)習(xí)的跟馳模型在過去5年集中出現(xiàn)。ZHOU 等[21]于2017年提出基于遞歸神經(jīng)網(wǎng)絡(luò)的車輛跟馳模型,遞歸神經(jīng)網(wǎng)絡(luò)內(nèi)置機(jī)制將連續(xù)歷史時間序列數(shù)據(jù)作為輸入,包含前車和后車的動態(tài)數(shù)據(jù)。遞歸神經(jīng)網(wǎng)絡(luò)通過預(yù)測數(shù)據(jù)序列,實現(xiàn)輸入序列長度調(diào)整。通過數(shù)據(jù)驗證,該模型在預(yù)測跟馳車輛的軌跡方面表現(xiàn)良好,能夠準(zhǔn)確捕捉和預(yù)測走停交通波現(xiàn)象。但是該模型最多僅考慮了近2 s 的歷史數(shù)據(jù),相較于之后的長短期記憶網(wǎng)絡(luò)模型是偏短的。
針對“淺層”神經(jīng)網(wǎng)絡(luò)較難處理連續(xù)時刻上的車輛速度、速度差和位置差等多元數(shù)據(jù)的問題,WANG等[22]利用長短期記憶網(wǎng)絡(luò)中參數(shù)少、更易訓(xùn)練和使用的門控循環(huán)單元模型,學(xué)習(xí)車輛跟馳行為,在輸入歷史時間序列數(shù)據(jù)后,直接輸出下一時刻速度預(yù)測值,并通過模型對比,說明模型的有效性。隨后,WANG 等[23]以走停波的時滯現(xiàn)象為目標(biāo),驗證車輛駕駛過程中駕駛?cè)碎L記憶效應(yīng)的重要性,說明長短期記憶網(wǎng)絡(luò)在車輛跟馳行為建模上的適用性。同時期,HUANG 等[24]基于長短期記憶網(wǎng)絡(luò)建立跟馳模型,重點捕獲駕駛?cè)嗽诳刂栖囕v加速與減速過程中所表現(xiàn)出來的非對稱性特征,研究與非對稱駕駛行為密切相關(guān)的時滯現(xiàn)象和駕駛?cè)说牟煌昝礼{駛行為等,說明了長記憶效應(yīng)的重要性。此后,LIN 等[25]從隊列生成角度分析傳統(tǒng)訓(xùn)練方法中導(dǎo)致時間誤差和空間誤差傳播的原因,提出改進(jìn)采樣機(jī)制和互聯(lián)的長短期記憶網(wǎng)絡(luò)結(jié)構(gòu),克服跟馳模型中時間誤差和空間誤差傳播問題,提高跟馳行為預(yù)測精度。最近,MA 等[26]考慮反應(yīng)延遲在駕駛過程中的重要作用,在長短期記憶網(wǎng)絡(luò)之上加入多序列層,構(gòu)成基于多序列對多序列(Sequence to Sequence)的跟馳模型。將連接向量傳遞到長短期記憶網(wǎng)絡(luò)單元,多步加速度。通過對比,該模型展現(xiàn)出比僅僅基于長短期記憶網(wǎng)絡(luò)的跟馳模型更好的跟馳行為預(yù)測效果。文獻(xiàn)[24]給出基于長短期記憶網(wǎng)絡(luò)的跟馳模型結(jié)構(gòu),如圖4 所示,圖中,t 為時間,v 為速度,Δx 為車間距,Δv 為速度差,Δx′和為輸出,h 代表LSTM結(jié)構(gòu)的輸出門。
圖4 基于長短期記憶網(wǎng)絡(luò)的跟馳模型結(jié)構(gòu)[24]Fig.4 Schematic structure of Long Short-Term Memory Neural Network-based car-following model[24]
除了長短期記憶網(wǎng)絡(luò),深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning)和生成對抗模仿網(wǎng)絡(luò)(Generative Adversarial Imitation Learning)等更新、更先進(jìn)的深度學(xué)習(xí)模型已應(yīng)用到跟馳模型中。例如,ZHU 等[27]將歷史駕駛數(shù)據(jù)輸入模擬環(huán)境,通過基于獎勵函數(shù)的試錯交互學(xué)習(xí),獲得最佳策略,即以和人類相似的方式從絕對速度、相對速度、車間距以及加速度中學(xué)習(xí)跟馳行為。測試表明,該模型的車間距誤差低于一些典型模型,包括智能駕駛?cè)四P?Intelligent Driver Model)、基于局部加權(quán)回歸模型、基于神經(jīng)網(wǎng)絡(luò)模型。
ZHOU 等[28]提出一種基于生成對抗模仿學(xué)習(xí)的跟車模型,該模型無需指定獎勵便可從實際駕駛?cè)笋{車行為中學(xué)習(xí)駕駛策略,通過將門控循環(huán)神經(jīng)網(wǎng)絡(luò)(Gated Recurrent Neural Network)整合到獎勵函數(shù),賦予模型挖掘歷史信息的能力。交叉驗證結(jié)果表明,與智能駕駛?cè)四P秃突谶f歸神經(jīng)網(wǎng)絡(luò)的跟馳模型相比,能夠更準(zhǔn)確地再現(xiàn)跟車軌跡和駕駛?cè)孙L(fēng)格。
受限于數(shù)據(jù)驅(qū)動方法本身的局限性,數(shù)據(jù)驅(qū)動跟馳模型往往存在泛化能力差(即對于數(shù)據(jù)庫中不存在狀態(tài),往往無法準(zhǔn)確估計)等問題。而受限于數(shù)學(xué)公式本身有限的表達(dá)能力,模型驅(qū)動跟馳模型通常無法準(zhǔn)確刻畫駕駛?cè)诵袨榈葟?fù)雜因素。為了取長補短,有學(xué)者將兩者融合,提出兼具兩者優(yōu)點的模型與數(shù)據(jù)混合驅(qū)動的跟馳模型。
基于線性組合預(yù)測理論,丁點點等[29]將Gipps模型和神經(jīng)網(wǎng)絡(luò)跟馳模型結(jié)合,建立兼具兩者優(yōu)點(Gipps模型的優(yōu)點為安全;神經(jīng)網(wǎng)絡(luò)模型的優(yōu)點是準(zhǔn)確)的模型與數(shù)據(jù)混合驅(qū)動的跟馳模型。通過控制神經(jīng)網(wǎng)絡(luò)和Gipps 模型的權(quán)重,實現(xiàn)控制預(yù)測速度的準(zhǔn)確性和安全性的目的。
式中:E 為綜合真實值(Ereal)和安全目標(biāo)值(Esafe)的組合目標(biāo)函數(shù)(速度);α 為權(quán)重參數(shù)。類似地,羅穎等[30]利用線性組合預(yù)測理論,建立基于智能駕駛?cè)四P团c徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Neural Network)的混合跟馳模型。
LI 等[31]通過自適應(yīng)卡爾曼濾波(Adaptive Kalman Fusion)融合標(biāo)定后的智能駕駛?cè)四P秃途哂辛己民{駛行為預(yù)測能力的長短期記憶網(wǎng)絡(luò),提出混合長短期記憶網(wǎng)絡(luò)與智能駕駛?cè)四P偷幕旌细Y模型。
綜合上述,數(shù)據(jù)驅(qū)動跟馳模型相關(guān)文獻(xiàn)、數(shù)據(jù)源、模型輸入輸出、模型評價與驗證如表1所示。
表1 續(xù)表
表1 數(shù)據(jù)驅(qū)動跟馳模型相關(guān)文獻(xiàn)、數(shù)據(jù)源、模型輸入輸出、模型評價與驗證Table 1 Summary of data-driven car-following models:literature,data source,input and output,evaluation and validation
從表1 可以看出,Next Generation Simulation(NGSIM)高精度車輛軌跡數(shù)據(jù)[33-34]的出現(xiàn)極大的改變了數(shù)據(jù)驅(qū)動跟馳模型的研究。在2006年NGSIM軌跡數(shù)據(jù)出現(xiàn)之前,受限于缺少大規(guī)模時空軌跡數(shù)據(jù),研究者通常使用在高處架設(shè)攝像機(jī)和人工視頻標(biāo)定的辦法[14],或使用車載設(shè)備實車上路[13,15-17]等手段獲取車輛運動數(shù)據(jù)。顯然,這些采集方式很難為數(shù)據(jù)驅(qū)動方法提供模型訓(xùn)練所需的大量微觀車輛行駛數(shù)據(jù)。
NGSIM 軌跡數(shù)據(jù)出現(xiàn)后,便成為各數(shù)據(jù)驅(qū)動跟馳模型的首選,使用率約占表1 中文獻(xiàn)的80%。從簡單的K 近鄰[20]、支持向量回歸[18]到各種深度學(xué)習(xí)跟馳模型[21-26,28],均通過NGSIM 軌跡數(shù)據(jù)實現(xiàn)了自身理想的模型訓(xùn)練與測試。
盡管NGSIM軌跡數(shù)據(jù)極大的滿足了各種模型的需要,但NGSIM 軌跡數(shù)據(jù)的代表性問題不容忽視。NGSIM軌跡數(shù)據(jù)僅來自于美國US-101和I-80兩條高速公路數(shù)百米路段的交通擁堵數(shù)據(jù),總持續(xù)時間約為2 h,這些數(shù)據(jù)在多大程度上可以代表其他路段上甚至是其他國家的駕駛行為,是值得探討的,也直接影響了數(shù)據(jù)驅(qū)動模型的泛化能力。關(guān)于泛化能力,由于數(shù)據(jù)的限制,目前的討論不多。NGSIM框架內(nèi)一個折中的辦法是使用一段路數(shù)據(jù)訓(xùn)練模型(例如,US-101 數(shù)據(jù)),使用另一段路的數(shù)據(jù)驗證模型(例如,I-80數(shù)據(jù))[20,35]。
隨著無人機(jī)的民用化和高精度視頻采集技術(shù)的出現(xiàn),近年出現(xiàn)了開源高精度車輛軌跡數(shù)據(jù),例如:德國的HighD數(shù)據(jù)庫(https://www.highd-dataset.com)包括了采集于德國高速公路長度為420 m的4個觀測路段的60 段軌跡數(shù)據(jù)。相比于NGSIM 數(shù)據(jù),其優(yōu)點是更大的樣本量、更高的數(shù)據(jù)準(zhǔn)確性等。但是,需要注意的是整個數(shù)據(jù)集包含較大比例的卡車并且處于擁堵狀態(tài)的軌跡較少。日本的ZenTraffic 數(shù)據(jù)庫(https://zen-traffic-data.net),包含了2 段空間長度為1.6 km 和2 km,時間長度約為10 h的大時空車輛軌跡數(shù)據(jù),并且包含較大量的擁堵狀態(tài)軌跡,是目前可用于交通流研究的理想數(shù)據(jù)集。此外,包含有多國多場景(高速公路、城市道路、環(huán)島等) 高精度軌跡數(shù)據(jù)和地圖的INTERACTION 數(shù)據(jù)庫(http://interaction-dataset.com)和我國東南大學(xué)的無人機(jī)視頻軌跡數(shù)據(jù)庫(http://seutraffic.com)等也是值得關(guān)注的新數(shù)據(jù)集。這些高精度軌跡數(shù)據(jù)的出現(xiàn),有助于解決NGSIM軌跡數(shù)據(jù)代表性的問題,同時,也對重新測試現(xiàn)有模型的泛化能力提出了新的機(jī)遇與挑戰(zhàn)。
傳統(tǒng)模型驅(qū)動的跟馳模型多以目標(biāo)車(i)及其前車(i-1)的瞬時車輛狀態(tài)(例如,瞬時位置和速度等)作為模型輸入(自變量),以目標(biāo)車輛的加速度或速度為模型輸出(因變量),即
說明了影響目標(biāo)車駕駛行為的最直接因素是目標(biāo)車與前車的瞬時狀態(tài);其中,A(?)和V(?)分別為加速度函數(shù)和速度函數(shù)。
從表1中可以發(fā)現(xiàn),絕大多數(shù)數(shù)據(jù)驅(qū)動跟馳模型并未突破這一框架,主要輸入是瞬時參數(shù),即車間距ΔS(t)、車間時距ΔT(t)、速度差Δv(t)、加速度a(t)、速度v(t)、位置x(t)等;主要輸出量為目標(biāo)車輛的瞬時加速度a(t)與速度v(t+τ)。欣喜的是,借助于深度學(xué)習(xí)更強(qiáng)大的變量處理能力(例如,長短期記憶神經(jīng)網(wǎng)絡(luò)對時間序列的考慮),部分?jǐn)?shù)據(jù)驅(qū)動跟馳模型考慮了車輛歷史駕駛行為[22,25-26,28]或道路條件參數(shù)[19],并且取得了理想的效果,充分展示了深度學(xué)習(xí)方法的優(yōu)越性。
盡管如此,仍存在3個問題值得思考:
第一,如何考慮更多駕駛行為相關(guān)變量。這里涉及到深度學(xué)習(xí)架構(gòu)設(shè)計和數(shù)據(jù)采集兩個因素。尤其是數(shù)據(jù)采集方面,如何進(jìn)一步挖掘高精度車輛軌跡數(shù)據(jù),將車輛橫向位置、車長等瑣碎信息引入模型訓(xùn)練,值得思考。此外,盡管高精度車輛軌跡數(shù)據(jù)不斷涌現(xiàn),但并非是真實駕駛過程中駕駛?cè)擞^察到的全部信息。因此,有必要探索新的數(shù)據(jù)源。自然駕駛數(shù)據(jù)[27]和自動駕駛車輛數(shù)據(jù)具有較大的潛力彌補這個不足。
第二,是否有必要考慮更多駕駛行為變量。盡管深度學(xué)習(xí)方法強(qiáng)大,無限引入所有變量并不是科學(xué)研究方式。因此,哪些是影響駕駛行為最關(guān)鍵的變量[36],如何構(gòu)造最小化模型[20],應(yīng)該是數(shù)據(jù)驅(qū)動跟馳模型需要認(rèn)真思考的問題。
第三,現(xiàn)有輸入輸出是否可替換。眾所周知,交通流宏觀、微觀變量間存在很強(qiáng)的關(guān)聯(lián)性[37]。那么,目前的數(shù)據(jù)驅(qū)動跟馳模型是否對與其關(guān)聯(lián)的其他輸入輸出有效?這一問題與模型的敏感性直接相關(guān),對輸入、輸出變量不敏感的機(jī)器學(xué)習(xí)方法意味著更好的模型性能。
從表1中發(fā)現(xiàn),目前數(shù)據(jù)驅(qū)動跟馳模型測試與驗證方法主要分為比較預(yù)測精度和測試交通特征還原能力兩類。前者通常使用均方誤差、平均絕對誤差、均方根百分比誤差等誤差計算指標(biāo),比較模型在速度、加速度、車間距等關(guān)鍵參數(shù)上的預(yù)測能力。后者以重要交通特征(例如,走停波速度、時滯現(xiàn)象、非對稱駕駛行為等)為目標(biāo),重點考察模型還原交通流特征方面的表現(xiàn)。
目前,數(shù)據(jù)驅(qū)動跟馳模型測試與驗證較為普遍的存在3個問題:
第一,測試不充分。有的研究僅僅通過一輛跟馳車的全局預(yù)測誤差評價模型好壞,例如,圖5(a),卻忽略了整個微觀跟馳軌跡中,不同位置對宏觀交通特征的影響是不同的。以圖6 中車輛經(jīng)歷的走停波為例,車輛減速、加速的時間與強(qiáng)度才是決定走停波性質(zhì)的關(guān)鍵點,相比之下,其他位置的精度對整個交通特征的影響較為有限。如果僅僅使用一個全局預(yù)測值,很可能將局部關(guān)鍵點的預(yù)測誤差掩蓋。此外,進(jìn)行車隊跟馳測試時,車隊長度不夠也會影響測試的充分性。例如,圖5(b)中只展示了前車后面十幾輛車的跟馳情況,之后走停波是收斂還是擴(kuò)散,很難判斷。較好的方式是應(yīng)用所提跟馳模型持續(xù)幾十分鐘、包括上千輛車的大規(guī)模交通演化測試,如圖5(c)所示,可以有效的檢驗?zāi)P驮诟鞣N場景下的預(yù)測能力。
圖5 現(xiàn)有文獻(xiàn)中的數(shù)據(jù)驅(qū)動跟馳模型驗證Fig.5 Validations of data-driven car-following models in existing literature
圖6 交通流演化關(guān)鍵區(qū)域Fig.6 Critical place for traffic evolution
第二,對比不完整。例如,研究提出AB組合方法,然而在模型測試階段,僅僅與獨立A 或B 的預(yù)測結(jié)果比較;或者,將所提的基于深度學(xué)習(xí)的跟馳模型與模型驅(qū)動跟馳模型(例如,智能駕駛?cè)四P?,或者與基于傳統(tǒng)機(jī)器學(xué)習(xí)的跟馳模型(例如,基于神經(jīng)網(wǎng)絡(luò)的跟馳模型)對比。不難想象,AB的組合方法,一般都會好于A或B的獨立方法(例如,多序列對多序列加長短期記憶神經(jīng)網(wǎng)絡(luò)會好于單獨的長短期記憶神經(jīng)網(wǎng)絡(luò));更新更先進(jìn)的機(jī)器學(xué)習(xí)方法通常會帶來更準(zhǔn)確的結(jié)果(例如,長短期記憶神經(jīng)網(wǎng)絡(luò)會比遞歸神經(jīng)網(wǎng)絡(luò)模型好)。因此,更有說服力的做法是將AB組合方法與另一種最新的同等級跟馳模型對比(例如,將多序列對多序列加長短期記憶神經(jīng)網(wǎng)絡(luò)與生成對抗模型或者深度強(qiáng)化學(xué)習(xí)模型對比),最好是最近兩年文獻(xiàn)中被充分檢驗過的模型進(jìn)行對比。
第三,缺少統(tǒng)一的測試集和測試標(biāo)準(zhǔn)。盡管NGSIM 數(shù)據(jù)的出現(xiàn)很好地解決了數(shù)據(jù)存在性問題,但仍然沒有一套統(tǒng)一的數(shù)據(jù)驅(qū)動跟馳模型測試方法和測試集。事實上,目前80%以上的數(shù)據(jù)驅(qū)動跟馳模型是通過NGSIM 數(shù)據(jù)來訓(xùn)練和驗證的,距離提出一套基于NGSIM數(shù)據(jù)的模型測試集和測試標(biāo)準(zhǔn)并不遙遠(yuǎn)。究其原因,可能并不在于理論或技術(shù),而是缺少影響整個學(xué)術(shù)圈的權(quán)威,即目前的研究還是百家爭鳴,缺少一錘定音的權(quán)威工作;并且提出測試集和測試標(biāo)準(zhǔn)工作本身瑣碎且缺少原創(chuàng)性,愿意深耕的學(xué)者不多。因此,呼吁有影響力的團(tuán)隊或機(jī)構(gòu)牽頭,組織學(xué)者開展更為細(xì)致的文獻(xiàn)梳理、方法再現(xiàn)與比較工作,確定一套全面、準(zhǔn)確的測試集和測試標(biāo)準(zhǔn)。
數(shù)據(jù)驅(qū)動跟馳模型的發(fā)展迄今經(jīng)歷了兩次高潮,伴隨著神經(jīng)網(wǎng)絡(luò)復(fù)蘇的基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)驅(qū)動跟馳模型(約在1998—2007年)以及深度學(xué)習(xí)熱潮推動下的基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動跟馳模型(約為2017年至今)。同時,高精度車輛軌跡數(shù)據(jù)集的出現(xiàn),也極大的推動了數(shù)據(jù)驅(qū)動跟馳模型的進(jìn)步。
不難發(fā)現(xiàn),兩次高潮均是機(jī)器學(xué)習(xí)領(lǐng)域快速發(fā)展的產(chǎn)物。但是,目前數(shù)據(jù)驅(qū)動跟馳模型研究多是“方法應(yīng)用”,對交通機(jī)理和現(xiàn)象解釋的“本質(zhì)挖掘”相對較少。關(guān)于應(yīng)用機(jī)器學(xué)習(xí)方法解決某領(lǐng)域內(nèi)問題的相關(guān)研究,一直存在著新穎性爭議,即直接采用現(xiàn)有的機(jī)器學(xué)習(xí)模型或組裝多個現(xiàn)有模型研究某領(lǐng)域(例如,交通領(lǐng)域)問題,是否具有新穎性。相較于計算機(jī)領(lǐng)域?qū)Ψ椒ǖ淖分?,交通領(lǐng)域更應(yīng)該關(guān)注交通的本質(zhì)問題與機(jī)理,才是交通專業(yè)價值與知識的體現(xiàn)。
從神經(jīng)網(wǎng)絡(luò)、K 近鄰到深度學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí),數(shù)據(jù)驅(qū)動跟馳模型的內(nèi)核越來越復(fù)雜。但是,對于跟馳行為本身,模型是否越復(fù)雜越好,不妨從跟馳模型的目的去思考這個問題[38]。如果跟馳模型是為交通流仿真服務(wù),實現(xiàn)交通推演與基本交通特征再現(xiàn),顯然,非常細(xì)微的駕駛?cè)诵袨椴粫兄匾绊?,因此,不必使用“功能?qiáng)大”的深度學(xué)習(xí)模型。相比之下,如果以服務(wù)自動駕駛、實現(xiàn)車輛上路運行為目的,應(yīng)用深度學(xué)習(xí)模型,必須充分考慮數(shù)量巨大且變化多樣的復(fù)雜因素。因此,提出數(shù)據(jù)驅(qū)動跟馳模型的目的對于方法的選擇尤為重要。
最后,根據(jù)要解釋的駕駛行為特征,選擇在這方面具有優(yōu)勢的機(jī)器學(xué)習(xí)模型或者通過建立混合模型實現(xiàn)優(yōu)勢互補,是數(shù)據(jù)驅(qū)動跟馳模型成功的關(guān)鍵。例如,長短期記憶神經(jīng)網(wǎng)絡(luò)可以有效捕獲駕駛行為中后續(xù)行為對前序行為的依賴性,從而成功地還原跟馳過程中駕駛?cè)瞬粚ΨQ的加速、減速過程以及走停波相應(yīng)的時滯現(xiàn)象。希望在未來,可以見到更多充滿交通智慧的數(shù)據(jù)驅(qū)動跟馳模型。