李林波,李瑞杰,鄒亞杰
(同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,上海201804)
跟馳模型的研究對交通安全及通行效率有很大意義。從建模方法角度劃分,跟馳模型可分為理論驅(qū)動與數(shù)據(jù)驅(qū)動兩類[1]。理論驅(qū)動類模型按照不同的建模機(jī)理,可以進(jìn)一步分為刺激反應(yīng)類[2]、安全距離類[3]、心理-生理類[4]、優(yōu)化速度類[5]、基于期望值的模型[6]等,其優(yōu)點(diǎn)是可以描述跟馳過程中的某幾個顯性因素,但對駕駛?cè)说鸟{駛經(jīng)驗(yàn)以及模糊感知特性,難以準(zhǔn)確刻畫?;诖耍琘u[7-8]先后將車頭間距、相對速度作為駕駛記憶,并改進(jìn)全速度差模型,得出考慮駕駛記憶可以提高駕駛穩(wěn)定性,并減少燃油消耗等;Sun[9]將一段時間內(nèi)本車與前車速度差作為駕駛記憶,用來改進(jìn)最優(yōu)速度模型,通過控制論方法提高了駕駛的穩(wěn)定性。Tang[10]基于最優(yōu)速度模型,通過設(shè)計(jì)權(quán)重考慮了兩個不同時刻的刺激,來模擬駕駛?cè)擞洃?。由于這些方法只能考慮很少的記憶時刻,同時僅考慮了一個影響因素作為駕駛記憶,當(dāng)公式變得復(fù)雜時,反而會失去理論模型的簡潔性。模糊控制類方法[11-12]需要根據(jù)人為經(jīng)驗(yàn)構(gòu)建模糊控制規(guī)則、選取隸屬度函數(shù)等,從而對數(shù)據(jù)造成了主觀干預(yù)。隨著大數(shù)據(jù)技術(shù)、人工智能及深度學(xué)習(xí)的迅速發(fā)展,從數(shù)據(jù)驅(qū)動的角度,基于人工神經(jīng)網(wǎng)絡(luò)方法,直接對數(shù)據(jù)樣本進(jìn)行學(xué)習(xí)并預(yù)測,被證明能夠更為準(zhǔn)確地模擬人的行為特性。Panwai[13]最先構(gòu)建了簡單的反向傳播神經(jīng)網(wǎng)絡(luò),基于車上傳感器采集的數(shù)據(jù)對模型進(jìn)行訓(xùn)練,仿真結(jié)果比基于Gipps的模型結(jié)果有更高精度,說明了基于神經(jīng)網(wǎng)絡(luò)方法在跟馳行為預(yù)測上的適用性。Wang等[14]較早驗(yàn)證循環(huán)神經(jīng)網(wǎng)絡(luò)方法比傳統(tǒng)跟馳模型建模方法能大幅提高模型精度。隨后不同學(xué)者通過神經(jīng)網(wǎng)絡(luò)類方法研究駕駛員各種特性,如捕捉駕駛員非對稱駕駛行為[15],駕駛記憶影響[16-17],駕駛員的反應(yīng)延遲現(xiàn)象[18]等。然而,基于數(shù)據(jù)驅(qū)動的跟馳模型在數(shù)據(jù)獲取方式和精度方面依然存在一定的不足,當(dāng)前用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的跟馳數(shù)據(jù)獲取方式主要分為:①在車上安裝各類傳感器,獲取前車與本車位置、速度以及間距等數(shù)據(jù);②通過駕駛模擬器獲取相應(yīng)數(shù)據(jù);③通過攝像機(jī)在高處對某路段進(jìn)行視頻錄制,并隨后通過視頻圖像處理技術(shù),提取視頻中車輛原始軌跡數(shù)據(jù)。
車載傳感器方式可能會對駕駛員以及道路周邊用戶行為造成影響,導(dǎo)致收集的數(shù)據(jù)無法準(zhǔn)確反映自然駕駛行為,而通過高空安裝攝像頭或無人機(jī)航拍獲取路段視頻數(shù)據(jù),并通過圖像處理技術(shù)得到路段監(jiān)控區(qū)域所有車輛軌跡信息可以避免對交通參與者的干擾,基于該方法使用最廣泛的數(shù)據(jù)為下一代仿真(next generation simulation,NGSIM)數(shù)據(jù)。為排除數(shù)據(jù)中固有誤差,許多文獻(xiàn)[19-20]進(jìn)行了各種預(yù)處理。然而NGSIM數(shù)據(jù)集存在許多相鄰軌跡間重合、速度-加速度矛盾,低分辨率帶來的車輛位置標(biāo)識誤差等問題,且無法嚴(yán)格清洗或插補(bǔ)數(shù)據(jù)[21]。由于基于深度學(xué)習(xí)類的人工智能算法,直接通過各種類型跟馳數(shù)據(jù)進(jìn)行學(xué)習(xí),因此,數(shù)據(jù)來源的缺陷必然會對預(yù)測結(jié)果產(chǎn)生不良影響。
由于人工駕駛常無法精準(zhǔn)感知當(dāng)前時段的本車速度、車頭時距等跟馳狀態(tài),在行駛過程中,需要依靠之前的駕駛記憶,并對即將出現(xiàn)的跟馳場景不斷進(jìn)行預(yù)估,從而進(jìn)行相應(yīng)操作,而預(yù)估的駕駛場景,通常都是不確定的,與實(shí)際有一定的差別。這一特性可解釋,即使相同的駕駛員,在相同的跟馳場景下,每次的操作都不會完全相同。因此,本文同時將本車速度、與前車車速差、車頭間距作為駕駛記憶,基于門控循環(huán)單元(gated recurrent units,GRU)/長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)循環(huán)神經(jīng)網(wǎng)絡(luò),提取highD數(shù)據(jù)集中的跟馳片段,采用端到端的方式訓(xùn)練模型,減少主觀因素干擾。在模型輸入端,設(shè)計(jì)了模糊感知時間窗,將模型計(jì)算出的部分預(yù)測值,與序列中的本車真實(shí)狀態(tài)值進(jìn)行替換,來模擬駕駛?cè)藢ΩY場景的模糊感知特性,對不同仿真場景以及不同模糊感知時間窗下跟馳場景進(jìn)行實(shí)驗(yàn),驗(yàn)證不同模糊感知時間窗下的不同跟馳行為。該方法可快速生成大量異質(zhì)跟馳行為,有利于進(jìn)一步仿真研究走走停停、震蕩、交通流失效、遲滯回環(huán)等現(xiàn)象的發(fā)生。
highD數(shù)據(jù)集是2017年9月份在德國公路上,通過高空無人機(jī)航拍后,并依次使用先進(jìn)的計(jì)算機(jī)視覺算法、神經(jīng)網(wǎng)絡(luò)及貝葉斯平滑算法提取出的自然駕駛軌跡數(shù)據(jù)集,提取出的軌跡數(shù)據(jù)每秒25幀,其定位誤差通常小于10 cm[22]。關(guān)于數(shù)據(jù)的具體描述見文獻(xiàn)[23],被提取出的數(shù)據(jù)集被分為60份,每份包含4個文件,分別為高速公路特定區(qū)域的高空照片,以及關(guān)于地點(diǎn)元數(shù)據(jù)、軌跡元數(shù)據(jù)、每車每幀軌跡的詳細(xì)信息。數(shù)據(jù)集中包含德國6處不同高速公路路段。本文基于路段2的車輛軌跡數(shù)據(jù)進(jìn)行跟馳行為研究,經(jīng)統(tǒng)計(jì),路段2軌跡數(shù)據(jù)包含2 400輛小汽車,674輛卡車。如圖1所示,車輛分布于4個車道,LaneID為車道標(biāo)識,圖中分別為2、3以及4、5車道。2、3車道的車輛向左行駛,4、5車道車輛向右行駛。需注意的是,由于highD數(shù)據(jù)集使用了全球坐標(biāo)系,且原點(diǎn)在圖像左上角,橫、縱坐標(biāo)軸左邊分別向右、向下。因此,原始軌跡數(shù)據(jù)中2、3車道行駛的車輛速度記錄為負(fù)值,加速度為負(fù)值代表加速。
圖1 路段2示意圖Fig.1 Diagram of road segment 2
highD數(shù)據(jù)集中包含小汽車以及卡車兩種類型軌跡數(shù)據(jù)。由于不同車型跟馳行為有很大差異,本文針對小汽車的跟馳行為進(jìn)行篩選。由于highD軌跡元數(shù)據(jù)中的numLaneChanges字段表示車輛換道次數(shù),因此,可通過該字段進(jìn)一步刪除存在換道行為的車輛軌跡數(shù)據(jù)。篩選跟馳片段持續(xù)15 s及以上的軌跡數(shù)據(jù),也即每個跟馳片段至少包含375幀。經(jīng)上述處理后,得到的數(shù)據(jù)集共94條跟馳片段,總時間為4 895 s。
跟馳片段數(shù)據(jù)集是較為典型的時序數(shù)據(jù)。目前,在跟馳行為預(yù)測上,廣泛使用的循環(huán)神經(jīng)網(wǎng)絡(luò)有兩種,分別為LSTM[7-8]及其一種結(jié)構(gòu)更為簡潔的變體GRU[6]。這兩種模型在跟馳行為預(yù)測上,均有不錯表現(xiàn),但筆者卻未發(fā)現(xiàn),兩種模型針對于同一數(shù)據(jù)集的對比分析,在此,不同單元結(jié)構(gòu)也當(dāng)作模型超參分析。LSTM的總體結(jié)構(gòu)[24]如圖2所示,xt為t時刻的輸入向量,ht為t時刻輸出向量,ht-1為t-1時刻輸出向量,ct-1為t-1時刻輸入的記憶單元,Ct為t時刻的輸出記憶,c?t為更新ct-1記憶單元的中間變量。LSTM通過遺忘門ft、輸入門it以及輸出門ot,將輸入數(shù)據(jù)xt、輸出數(shù)據(jù)ht、以及記憶單元ct結(jié)合起來,其中σ以及tan h分別代表sigmoid以及雙曲正切激活函數(shù),?代表向量間點(diǎn)積。
圖2 LSTM單元結(jié)構(gòu)Fig.2 Structure of LSTM unit
圖3 GRU單元結(jié)構(gòu)Fig.3 Structure of GRU unit
在本車初始狀態(tài)已知的情況下,在下一時刻,對于位移、速度、加速度三個狀態(tài)變量,模型只需預(yù)測其中一個,就可根據(jù)牛頓運(yùn)動定律,得出另外兩個。模型損失函數(shù)以及評價指標(biāo)常基于模型預(yù)測值進(jìn)行構(gòu)建。由于在穩(wěn)定跟馳狀態(tài)下,加速度接近于0,導(dǎo)致基于加速度構(gòu)建的評價指標(biāo)常常出現(xiàn)一些不必要麻煩,如無法加入權(quán)重、難以計(jì)算結(jié)果等。以評價指標(biāo)平均相對誤差絕對值為例,由于該指標(biāo)分母包含加速度,當(dāng)加速度趨于0,會導(dǎo)致式子趨于無窮大,無法準(zhǔn)確描述模型精度[26]。如圖4所示,基于GRU/LSTM的跟馳模型訓(xùn)練是將一段時間的特征序列作為輸入,從而計(jì)算下一時刻的跟馳行為,其中cn,1代表第一層網(wǎng)絡(luò)中第n個時刻的記憶單元,hn,1代表第一層網(wǎng)絡(luò)中第n個時刻的輸出,其他變量以此類推。本模型將連續(xù)n個時刻的:①本車速度vn;②本車與前車的相對速度Δvn;③本車與前車的車頭間距sn作為輸入特征,在經(jīng)過多層GRU/LSTM隱藏層之后,通過一層Dense全連接層,將最后一個時刻的單元輸出轉(zhuǎn)換為一維數(shù)據(jù),代表第n+1時刻的本車速度。與普通全連接層神經(jīng)網(wǎng)絡(luò)不同的是,由于LSTM/GRU塊對時序數(shù)據(jù)的處理是自循環(huán)方式,無論輸入的時間步長的長短,訓(xùn)練的模型參數(shù)都是固定的,因此,每一隱藏層的神經(jīng)元個數(shù),確切來說,是每層單個LSTM/GRU塊的輸出h的維度。
圖4 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of deep learning neural network
通常,駕駛沒有網(wǎng)聯(lián)或精準(zhǔn)環(huán)境感知功能的普通車輛的駕駛員無法精準(zhǔn)感知周圍場景,而是基于過往的駕駛記憶以及對場景一定程度的預(yù)測相結(jié)合,作為接下來采取行為的依據(jù)。如圖5所示,駕駛員在進(jìn)行跟馳決策時,需要不斷對周圍環(huán)境進(jìn)行感知,之后大腦進(jìn)行場景理解、跟馳決策,最后是跟馳行為執(zhí)行。在基于理論的跟馳模型中,從開始感知t0到跟馳行為執(zhí)行t1這一時間間隔,通常被稱為反應(yīng)時間τ,t1時刻的跟馳結(jié)果僅取決于t0時刻的跟馳狀態(tài)。而在實(shí)際中,駕駛員在時間τ內(nèi),對跟馳場景的認(rèn)知并不是真空狀態(tài),而是提前在心中對場景有一定的預(yù)期。本文將時間τ內(nèi)的跟馳場景預(yù)期通過更早時刻的深度學(xué)習(xí)模型預(yù)測來模擬。
圖6為具體的設(shè)計(jì)方案。其中,圖6a為以往深度學(xué)習(xí)模型的輸入輸出時序關(guān)系,其通常將連續(xù)n個時刻的真實(shí)跟馳狀態(tài)值作為輸入,預(yù)測n+1時刻的輸出。駕駛員過往的駕駛記憶通過輸入時序的長短n來表示。以往深度學(xué)習(xí)模型沒有對駕駛員反應(yīng)時間間隔τ內(nèi)的場景感知不確定進(jìn)行模擬,而是將整個時段的真實(shí)跟馳狀態(tài)值作為駕駛記憶,輸入模型計(jì)算。過往時刻的真實(shí)跟馳狀態(tài)值可以看作是駕駛員對跟馳場景的精確感知行為,這與駕駛員在反應(yīng)時間τ內(nèi)無法精準(zhǔn)感知當(dāng)前場景這一現(xiàn)象產(chǎn)生矛盾。同時,容易觀察到的是,在相同跟馳情形下,同一駕駛員也不會產(chǎn)生完全相同的跟馳行為,原因之一是駕駛員的駕駛決策不完全是基于精確的跟馳場景感知。針對駕駛員在過往的駕駛記憶中,無法精確感知真實(shí)跟馳狀態(tài),本模型設(shè)計(jì)了模糊感知時間窗,如圖6b所示,即在連續(xù)n個時間長度的真實(shí)跟馳狀態(tài)數(shù)據(jù)中,將其中連續(xù)m(m≤n)個真實(shí)狀態(tài)值通過對應(yīng)時刻的模型預(yù)測值來代替,作為駕駛員對實(shí)際場景的估計(jì),即模糊感知。模糊感知時間窗m的大小代表該時刻對場景感知不確定的程度。當(dāng)m為0時,說明,駕駛員該時刻可精準(zhǔn)感知過往駕駛狀態(tài),當(dāng)m=n時,說明駕駛員當(dāng)前時刻對過往場景的認(rèn)知程度十分不確定。m的具體取值可以根據(jù)實(shí)際情況取0到n之間的固定值或不同時刻隨機(jī)取范圍內(nèi)不同整數(shù)值。模型預(yù)測的最早輸出時刻同時受輸入時序長度以及模糊感知時間窗大小影響,當(dāng)模糊時間窗大小m取0時,最早可預(yù)測第n+1時刻本車跟馳行為,當(dāng)m=n時,最早可預(yù)測第2n+1時刻本車行為。
圖5 跟馳決策思維認(rèn)知模擬圖Fig.5 Cognitive simulation of car-following decision making
圖6 模糊感知時間窗設(shè)計(jì)圖Fig.6 Diagram of fuzzy perception time window
模型的訓(xùn)練流程主要包括數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和模型超參設(shè)計(jì)。
在路段2所提取出的符合要求的94條數(shù)據(jù)中集中,取前85條作為訓(xùn)練集,其中20%的訓(xùn)練集數(shù)據(jù)作為驗(yàn)證集,以防過擬合。文獻(xiàn)[8]得出駕駛員受1.0~3.5 s的記憶影響。因此,設(shè)計(jì)輸入時序長度為3 s,以0.2 s為一個時間單位,則每次輸入15個時刻的特征。
在模型訓(xùn)練中,損失函數(shù)f選取預(yù)測值與真實(shí)值的均方誤差(mean squared error,MSE):
其中:Ntra為訓(xùn)練的跟馳對個數(shù);T為每對跟馳對的訓(xùn)練次數(shù),其值取決于跟馳片段總長度與輸入時序長度之間的時間單元個數(shù)之差,本文跟馳片段總長度15 s,共75個時刻值,與初始輸入時序時刻數(shù)量之差為60;vsim,i,j以及vobs,i,j分別為每對跟馳對j每個時間步長i預(yù)測后的速度預(yù)測值以及對應(yīng)的真實(shí)值。優(yōu)化算法選擇Adam算法。設(shè)置訓(xùn)練迭代次數(shù)為500代,每一批次輸入訓(xùn)練數(shù)據(jù)32組。參數(shù)patience為10,即在連續(xù)10次訓(xùn)練中內(nèi),驗(yàn)證集損失函數(shù)均未提升的話,則自動停止訓(xùn)練。保留后9條跟馳對作為測試集,用于對模型評估。
模型單元結(jié)構(gòu)間權(quán)重及系數(shù)可以通過訓(xùn)練優(yōu)化,然而模型中還存在一些參數(shù),需要在訓(xùn)練前確定,這些參數(shù)被稱為超參,其取值對結(jié)果有著不同程度的影響。模型的網(wǎng)絡(luò)結(jié)構(gòu)超參是指模型中隱藏層層數(shù)以及每層中GRU/LSTM單元輸出維度,兩者數(shù)量越多,對數(shù)據(jù)的學(xué)習(xí)能力越強(qiáng),但網(wǎng)絡(luò)會更加復(fù)雜,訓(xùn)練時間將極大延長且容易出現(xiàn)過擬合。如表1所示,本文將通過對GRU、LSTM兩種循環(huán)神經(jīng)網(wǎng)絡(luò)分別設(shè)計(jì)1層、2層、3層隱藏層神經(jīng)網(wǎng)絡(luò),各層網(wǎng)絡(luò)中神經(jīng)元輸出維度從{16,32,64}中進(jìn)行選取,從而選出適用于本數(shù)據(jù)集的模型結(jié)構(gòu)。
表1 不同模型結(jié)構(gòu)Tab.1 Structure of different models
對表1中分別以LSTM以及GRU為單元的5種不同模型結(jié)構(gòu)進(jìn)行訓(xùn)練,以損失函數(shù)MSE以及平均絕對誤(mean absolute error,MAE)為模型預(yù)測結(jié)果評選指標(biāo),訓(xùn)練結(jié)果如圖7所示,
圖中橫坐標(biāo)模型序號與表1相對應(yīng),可看出,無論LSTM還是GRU,單層模型1-3均比多層模型指標(biāo)優(yōu)。經(jīng)多次實(shí)驗(yàn),發(fā)現(xiàn)1~2組的模型預(yù)測結(jié)果呈鋸齒狀,不夠平滑;部分多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練后,有時無法對測試集進(jìn)行有效預(yù)測,而單層32維輸出的LSTM以及GRU對結(jié)果的預(yù)測均有不錯表現(xiàn)。鑒于相同規(guī)模網(wǎng)絡(luò),GRU網(wǎng)絡(luò)參數(shù)個數(shù)約為LSTM網(wǎng)絡(luò)的3/4,故選擇以GRU為單元的網(wǎng)絡(luò)結(jié)構(gòu)3為最終網(wǎng)絡(luò)。該網(wǎng)絡(luò)經(jīng)過154次循環(huán)后自動停止計(jì)算,驗(yàn)證集損失函數(shù)為0.656 5,MAE為0.178 9。圖8是訓(xùn)練后的模型序號3、單元塊為GRU的模型,對9個測試片段本車速度值預(yù)測結(jié)果,用Ntrail的值來表示不同的測試片段。在每個測試片段中,兩條曲線分別為后車真實(shí)值以及預(yù)測值,圖8與圖9中每個測試片段的橫坐標(biāo)均為以0.2 s為單位的時間間隔,縱坐標(biāo)為速度。通過將本模型選取的三維時間序列數(shù)據(jù)用于模擬駕駛員駕駛記憶后,模型在各個跟馳場景上都可以很好地進(jìn)行預(yù)測。
圖7 模型性能比較Fig.7 Comparison of performance of models
為驗(yàn)證文中設(shè)計(jì)的駕駛員場景期望行為,設(shè)計(jì)0.2 s的模糊感知時間窗,對測試集中片段1~9的跟馳場景進(jìn)行計(jì)算,結(jié)果見圖9,三條曲線分別代表前車速度變化,后車精確感知下速度變化及后車在0.2 s模糊感知下的速度變化。結(jié)合圖8、圖9觀察,可知,在不同跟馳場景下,0.2 s模糊感知下的駕駛員行為曲線變化與本車真實(shí)速度值、精確感知下速度變化趨勢相似,但又有所不同,可作為駕駛行為異質(zhì)性的一種表現(xiàn),驗(yàn)證模糊感知下的深度學(xué)習(xí)模型對測試集也有較好的結(jié)果。
圖8 GRU模型擬合結(jié)果圖Fig.8 Diagram of model with GRU unit fitting results
圖9 不同場景下的模糊感知仿真結(jié)果Fig.9 Simulation results of fuzzy perception in different situation
為模擬駕駛員在同一場景不同模糊感知下的跟馳行為,將模糊感知時間窗從0.2 s依次遞增到3 s。以片段4跟馳場景為基準(zhǔn),前車在0~12 s期間以23.36 m·s-1小幅減速至23.07 m·s-1,后車在開始階段,車頭間距為33.65 m。真實(shí)場景中的后車行駛速度在23.25~24 m·s-1之間。所得結(jié)果如圖10所示,實(shí)線代表前車信息,虛線為不同模糊感知時間窗大小下的仿真結(jié)果,可代表同一駕駛員在相同場景可能產(chǎn)生的不同跟馳行為。同模糊時間窗下的模擬軌跡,從位移圖可以看出,在各模糊窗大小下,后車行為均與前車保持穩(wěn)定的跟馳狀態(tài)。從速度以及加速度曲線可以看出,在0.4~1 s的模糊時間窗內(nèi),得到的跟馳軌跡會較早地進(jìn)行較大幅度的減速,從而保持較大的安全距離;而其余模糊時間窗的跟馳速度在前車速度值附近波動,對應(yīng)的車頭間距也較小。對其他跟馳片段進(jìn)行同樣的操作,也會產(chǎn)生類似跟馳行為,驗(yàn)證模型可在同一場景下生成不同且安全的跟馳行為。通過模型分析及多次重復(fù)實(shí)驗(yàn)可知:模型訓(xùn)練結(jié)束后,內(nèi)部參數(shù)是固定的,調(diào)節(jié)不同的時間窗大小,會生成不同的異質(zhì)跟馳行為。對于相同的場景,不同實(shí)驗(yàn)組之間只要確保每步預(yù)測設(shè)定相同的時間窗,就可得出相同的實(shí)驗(yàn)結(jié)果。
圖10 多步模糊感知時間窗仿真Fig.10 Simulation results with different fuzzy perception windows
3.1~3.2節(jié)中的實(shí)驗(yàn)均為對highD中提取出的數(shù)據(jù)集進(jìn)行擬合及仿真,為進(jìn)一步測試模型可遷移性,即在未知場景中,驗(yàn)證模型是否可得出合理結(jié)果。設(shè)計(jì)如下跟馳場景,在單車道公路上,0~3 s時,前車以22 m·s-1速度行駛,隨后以2 m·s-2的減速度減速1 s,在4~9 s期間,以20 m·s-1速度勻速前行,在9~12 s期間,以1 m·s-2加速度加速至23 m·s-1,隨后以23 m·s-1勻速前行。初始時刻,后車與前車車頭間距45 s,后車在0~3 s期間,以22 m·s-1勻速前行,用來模擬初始階段的駕駛記憶。仿真結(jié)果如圖11所示。
圖11中,4個子圖分別代表兩車速度、車頭間距、位置以及加速度變化。對仿真的后車行為進(jìn)行分析:在0~3 s期間,前車速度大于后車,因此,車頭間距逐漸增大。為保持與前車的跟馳狀態(tài),后車以將近2 m·s-2的加速度加速行駛,因此,在3~10 s之間,車頭間距逐漸縮短。為保持一定安全距離,后車在5 s之后不斷小幅度減速。由于前車在9~12 s,以1 m·s-2加速度加速至23 m·s-1,車頭間距逐漸增大,因此,后車于12 s左右開始加速跟馳前車,在12 s之后,前車勻速行駛,后車逐漸保持速度平穩(wěn)跟馳。從上述分析中,仿真的跟馳行為具有合理的解釋性,且跟馳過程中不會與前車產(chǎn)生碰撞,因此可較好模擬駕駛員的跟馳行為。
圖11 設(shè)計(jì)場景仿真結(jié)果Fig.11 Simulation results of designated scenario
以往的深度學(xué)習(xí)跟馳模型輸出可看作是通過學(xué)習(xí)大量輸入數(shù)據(jù)規(guī)律,并平均后的預(yù)測結(jié)果。而真實(shí)場景中,即使同樣的駕駛員在相同場景下跟馳前車,由于駕駛記憶、感知不確定及其他潛在因素影響,其每次跟馳行為也會存在差異。
本文基于精度更高的highD數(shù)據(jù)集,通過提取符合條件的跟馳片段。設(shè)計(jì)了不同結(jié)構(gòu)的GRU/LSTM深度學(xué)習(xí)模型。經(jīng)訓(xùn)練,得出32個GRU或LSTM輸出單元的單層神經(jīng)網(wǎng)絡(luò),在精確的駕駛記憶條件下,可以很好地?cái)M合真實(shí)數(shù)據(jù)。由于相同規(guī)模下,GRU參數(shù)比LSTM少,意味著更少的計(jì)算量及時間消耗,因此選擇GRU模塊作為模型基本單元。為驗(yàn)證模型的模糊感知特性,分別設(shè)計(jì)不同場景以及同一場景不同程度的模糊感知下的仿真實(shí)驗(yàn),驗(yàn)證模型可適用于不同跟馳場景的模糊感知,且這些行為都具有一定穩(wěn)定性和可解釋性。無模糊感知時間窗的輸入輸出,更類似于精確感知場景下的智能網(wǎng)聯(lián)車輛行駛策略,而增加模糊感知時間窗的深度學(xué)習(xí)模型,使得深度學(xué)習(xí)模型可在同一場景下,快速產(chǎn)生大量異質(zhì)交通行為,有利于仿真研究異質(zhì)駕駛行為導(dǎo)致的交通現(xiàn)象。
從數(shù)據(jù)輸入的角度,本文處理后的跟馳片段較少,可能是導(dǎo)致多層LSTM及GRU模型結(jié)果不好的原因之一;由于提取出的跟馳片段,大多處于一定速度范圍的穩(wěn)定跟馳狀態(tài),沒有其他場景如:從靜止?fàn)顟B(tài)加速以及急減速等場景,因此,導(dǎo)致所訓(xùn)練的模型,僅可有效模擬一定場景下的跟馳行為。另一方面,限于篇幅,本文僅對駕駛員速度感知不確定下的跟馳行為進(jìn)行研究,下一步可同時將其他刺激變量如:速度差、車間距等進(jìn)行相應(yīng)處理,分析不同刺激變量模糊感知下的跟馳特性,從而更加全面地模擬駕駛員模糊感知及跟馳行為。
作者貢獻(xiàn)聲明:
李林波:相關(guān)概念及方案討論,論文語言組織;
李瑞杰:數(shù)據(jù)處理及分析,實(shí)驗(yàn)設(shè)計(jì)及初稿撰寫;
鄒亞杰:論文審閱,結(jié)果分析及建議。