李林波,李 楊,鄒亞杰
(同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,上海 201804)
換道行為是指車輛(當(dāng)前車輛)在行駛過程中由當(dāng)前車道換至目標(biāo)車道的行為,不僅涉及與前方車輛的交互影響,還受到目標(biāo)車道前后車的影響。在現(xiàn)實(shí)交通場景中,由換道行為導(dǎo)致的交通事故居高不下,探索車輛換道行為的影響機(jī)理和決策機(jī)制迫在眉睫[1-3]。目前關(guān)于換道行為的研究大致可以劃分為車輛換道決策過程建模[4]、車輛換道行為影響[4]、車輛換道軌跡規(guī)劃和追蹤建模[5-7]、車輛換道軌跡預(yù)測[8]以及換道時(shí)長影響因素[9-16]。換道時(shí)長描述了當(dāng)前車輛由當(dāng)前車道中心線駛至目標(biāo)車道中心線所需要花費(fèi)的時(shí)間。
對于換道時(shí)長的研究主要集中于換道時(shí)長分布以及換道時(shí)長影響因素。研究表明,換道時(shí)長普遍在1~16 s內(nèi),換道時(shí)長和時(shí)間段、道路類型、車流密度、車輛類型、換道方向、駕駛風(fēng)格以及當(dāng)前車輛與周圍車輛的交互影響有關(guān)。符鋅砂等[17]的研究表明,不同交通狀況下高速公路換道時(shí)長服從對數(shù)正態(tài)分布,換道時(shí)長與車輛換道影響區(qū)域內(nèi)的交通狀況存在顯著聯(lián)系。張穎達(dá)等[18]指出,強(qiáng)制換道的平均換道時(shí)長稍大于自由換道,影響2類換道行為換道時(shí)長的因素不同,各因素的影響程度也不同。Toledo等[9]采用多變量回歸模型對NGSIM(Next Generation Simulation)數(shù)據(jù)集中的換道時(shí)長進(jìn)行了回歸建模,車流密度、換道方向以及周邊車輛干擾會(huì)顯著影響換道時(shí)長的大小。Wu等[16]引入了半?yún)?shù)等比例風(fēng)險(xiǎn)回歸模型對換道時(shí)長進(jìn)行建模,不同時(shí)間段的換道時(shí)長存在顯著的差異性。Vlahogianni[10]采用全參數(shù)的加速失效模型對車輛超車時(shí)長進(jìn)行了建模,當(dāng)前車輛與當(dāng)前車道前車的速度差、當(dāng)前車輛與當(dāng)前車道前車的距離、目標(biāo)車道后車車速以及駕駛員性別等變量顯著影響換道時(shí)長。Yang等[11]采用多元回歸模型對換道時(shí)長進(jìn)行研究,獲得的結(jié)果與Toledo等[9]的結(jié)果基本一致。以上研究均依靠換道過程中某一時(shí)刻的狀態(tài)信息(如與周邊車輛的相對位置、相對速度、相對加速度等)來探究換道時(shí)長的影響因素,而未曾考慮這些狀態(tài)信息在換道過程中的動(dòng)態(tài)特征。因此,本研究中試圖將時(shí)依等比例風(fēng)險(xiǎn)回歸模型[19-21]引入對換道時(shí)長的建模中。作為生存分析類模型,該模型不僅可以研究影響因素與生存時(shí)間和結(jié)局的關(guān)系[10,22-23],還能融入換道過程中的動(dòng)態(tài)信息,從而完善對于換道時(shí)長機(jī)理的解析,以便更深入地把握車輛換道行為的內(nèi)在特性。相比于NGSIM數(shù)據(jù)集[24],本研究中將采用具有更多車流軌跡數(shù)據(jù)與更低測量誤差的HighD數(shù)據(jù)集[25]進(jìn)行分析,從而提供高質(zhì)量的數(shù)據(jù)支撐。
生存分析是對生存時(shí)間的分布特征進(jìn)行描述,并對影響生存時(shí)間的主要因素進(jìn)行分析的一種統(tǒng)計(jì)方法。將生存分析應(yīng)用到換道時(shí)長分析中,所對應(yīng)的起始時(shí)間為換道的起始時(shí)刻,即換道起點(diǎn)時(shí)刻;截止時(shí)間也可稱為失效時(shí)間,指換道結(jié)束時(shí)刻。廣義生存時(shí)間為換道時(shí)長,指換道起點(diǎn)時(shí)刻至結(jié)束時(shí)刻所經(jīng)歷的時(shí)長,與之對應(yīng)的基礎(chǔ)公式如下所示:
式中:P1(t,t+Δt)為車輛在(t,t+Δt)內(nèi)完成換道的概率;P2(t,t+Δt)為時(shí)間t后車輛在(t,t+Δt)內(nèi)完成換道的概率;f(t)為各時(shí)刻車輛完成換道的概率;F(t)為f(t)的分布函數(shù);S(t)為車輛換道時(shí)長大于t的概率;h(t)為時(shí)間t后車輛完成換道的概率;H(t)為累積危險(xiǎn)率函數(shù)。事實(shí)上,只要得知其中任意一個(gè)函數(shù),就可以推導(dǎo)出其余公式。
生存分析類函數(shù)大致可以劃分為非參數(shù)類模型、半?yún)?shù)類模型以及參數(shù)類模型[22]。非參數(shù)類模型在估計(jì)生存函數(shù)時(shí)對生存時(shí)間的分布沒有要求,根據(jù)樣本觀測值提供的信息,用公式計(jì)算出每一個(gè)時(shí)間點(diǎn)的生存函數(shù)、死亡函數(shù)、風(fēng)險(xiǎn)函數(shù)等。參數(shù)類模型根據(jù)樣本觀測值來估計(jì)假定的分布模型中的參數(shù),從而獲得生存函數(shù)、死亡函數(shù)、風(fēng)險(xiǎn)函數(shù)等,常用的分布有指數(shù)分布、Weibull分布、對數(shù)正態(tài)分布、對數(shù)Logistic分布以及Gamma分布等。半?yún)?shù)類模型不需要對生存時(shí)間的分布做出假定,但是卻可以通過一個(gè)模型來分析生存時(shí)間的分布規(guī)律以及危險(xiǎn)因素對生存時(shí)間的影響。在以上3類模型中,半?yún)?shù)類模型在學(xué)界得到普遍使用。由于參數(shù)類模型對于模型的假設(shè)有著較高的要求,因此當(dāng)假設(shè)不滿足時(shí)效果較差。非參數(shù)類模型未作任何假設(shè),因而難以解釋各自變量對于因變量的影響程度,模型的可解釋性較差。半?yún)?shù)類模型則結(jié)合了參數(shù)類模型以及非參數(shù)類模型的特點(diǎn),一方面放寬了對生存分布的假設(shè),另一方面又保留了具有可解釋的參數(shù)部分[22],因而有著更加穩(wěn)健的表現(xiàn)。
半?yún)?shù)類模型中最為著名的為比例風(fēng)險(xiǎn)回歸模型[20],該模型并非直接基于生存函數(shù)而是基于危險(xiǎn)率函數(shù)進(jìn)行建模,由基準(zhǔn)危險(xiǎn)率方程以及一個(gè)參數(shù)方程組成,如下所示:
式中:h0(t)為基本危險(xiǎn)率函數(shù);xi為自變量(影響換道時(shí)長的因素);bi為自變量對應(yīng)的偏回歸系數(shù)。
該模型中未對h0(t)作任何假定,是一個(gè)非參數(shù)部分的建模,回歸系數(shù)bi則是需要根據(jù)樣本進(jìn)行估計(jì)的參數(shù),是一個(gè)參數(shù)部分的建模。該模型中僅是以某一時(shí)刻的變量信息xi對因變量進(jìn)行建模,然而在對因變量進(jìn)行回歸分析的過程中,自變量有可能也隨著時(shí)間而變化,因此必須考慮自變量的時(shí)變特性。Fisher等[19]提出了考慮自變量時(shí)變特性的時(shí)依等比例風(fēng)險(xiǎn)回歸模型,表達(dá)式如下所示:
式中:S(t|xi(t))為生存函數(shù);xi(t)為隨時(shí)間變化的自變量。通過極大似然函數(shù)對以上參數(shù)進(jìn)行估計(jì),極大似然函數(shù)的表達(dá)式如下所示:
式中:δi(t)為二元變量,若車輛在t時(shí)刻完成換道,其值為1,反之為0;Ri為不同觀測時(shí)刻的風(fēng)險(xiǎn)集合,Ri(t)={t,x i(t),δi(t)}。不同于時(shí)不變等比例風(fēng)險(xiǎn)回歸模型,在每個(gè)風(fēng)險(xiǎn)集中,自變量的值均在變化。
HighD數(shù)據(jù)采集于2017年至2018年間,采集地點(diǎn)為德國高速公路,采集時(shí)長為16.5 h,采集路程為45 000 km,總計(jì)包含11萬輛車的信息。使用先進(jìn)的計(jì)算機(jī)視覺算法、神經(jīng)網(wǎng)絡(luò)及貝葉斯平滑算法提取出的軌跡數(shù)據(jù)為每秒40幀,數(shù)據(jù)集中每條軌跡的坐標(biāo)誤差不到10 cm,這主要得益于該數(shù)據(jù)集以4K(4 096×2 160)格式采集的緣故[25]。
為了探索更為復(fù)雜情形下的換道時(shí)長機(jī)理,對換道過程中同時(shí)包含5輛車的換道軌跡進(jìn)行提取與分析,如圖1所示。首先,僅保留小汽車的換道軌跡,剔除卡車的換道軌跡,剔除不同時(shí)含有周邊4輛車信息的小汽車換道軌跡;其次,以車輛在縱向方向上的速度為主要參考指標(biāo),同時(shí)結(jié)合車輛的加速度推斷車輛換道的起始點(diǎn)以及截止點(diǎn),如圖2所示;最后,進(jìn)行人工篩選以確定最終的每一條軌跡,確保同時(shí)包含5輛車的信息以及在目標(biāo)車道換道過程中周邊車輛的狀態(tài)信息無任何的缺失。
圖1 換道軌跡示意圖Fig.1 Schematic diagram of LC trajectory
總計(jì)提取560條有效換道軌跡,HighD數(shù)據(jù)集的每個(gè)tracks文件中所包含的有效換道次數(shù)以及該數(shù)據(jù)集換道時(shí)長整體分布如圖3所示。車輛的平均換道時(shí)長為5.69 s,中位數(shù)為5.55 s,標(biāo)準(zhǔn)差為1.35 s??梢园l(fā)現(xiàn),中位數(shù)要略低于平均值,這說明多數(shù)車輛的換道時(shí)長是低于中位數(shù)的,部分車輛過長的換道時(shí)長拉大了整體的平均值。圖4為換道軌跡集中的2條換道軌跡樣本。各變量定義如表1所示。
圖3 HighD數(shù)據(jù)集的每個(gè)tracks文件中有效換道次數(shù)和換道時(shí)長整體分布Fig.3 Effective LC counts for each track file in HighD dataset and overall distribution of LCD
圖4 HighD數(shù)據(jù)集中2條換道軌跡樣本Fig.4 Two examples of LC trajectories in High D dataset
表1 各變量定義Tab.1 Definition of variables
對換道時(shí)長進(jìn)行回歸建模,采用非參數(shù)方法KM(Kaplan-Meier)和NA(Nelson-Aalen)方法[26]對換道時(shí)長的整體部分進(jìn)行估計(jì),以獲得換道時(shí)長生存函數(shù)的一個(gè)初步分析。估計(jì)方法如下所示:
式中:d i為在時(shí)刻t完成換道的車輛數(shù);ni為在時(shí)刻t前完成換道的車輛數(shù)。
圖5為基于整體生存函數(shù)以及累積風(fēng)險(xiǎn)率函數(shù)的換道時(shí)長分布??梢园l(fā)現(xiàn),生存函數(shù)曲線在3 s至8 s之間時(shí)陡然下降,意味著大部分車輛在3 s至8 s之間完成換道。同時(shí),引入中位生存時(shí)間αMST,其定義為平均50%的換道時(shí)長失效的時(shí)間,這意味著每輛車都有50%的機(jī)會(huì)完成換道操作。采用KM方法所得的中位生存時(shí)間為4.975 s(置信區(qū)間下限為4.900 s,上限為5.050 s)。在3~8 s時(shí),生存曲線快速下降,而在8~12 s時(shí)曲線平緩下降。累積危險(xiǎn)率函數(shù)同樣也是如此,先在3~8 s時(shí)快速上升后在8~12 s時(shí)平緩上升。從表2可以得出,近15%的車輛于4 s內(nèi)完成換道,近79%的車輛于6 s內(nèi)完成換道,近96%的車輛于8 s內(nèi)完成換道,而換道時(shí)長大于8 s的車輛僅占4%。
表2 各換道時(shí)長下尚未完成換道操作車輛所占百分比Tab.2 Percentage of at-risk vehicles at different LCDs
圖5 基于整體生存函數(shù)和累積危險(xiǎn)率函數(shù)的換道時(shí)長分布(KM和NA方法)Fig.5 Distribution of LCD based on overall survival function and cumulative hazard function(KM and NA method)
由于HighD數(shù)據(jù)集的采集間隔為0.025 s,以0.100 s為間隔進(jìn)行重新集聚(取其平均值)。若每條軌跡換道時(shí)長為T,則每條軌跡共有觀測記錄T/0.100條。每條觀測記錄均包含當(dāng)前時(shí)間點(diǎn)周邊車輛的速度、加速度以及位置信息。圖6為時(shí)依等比例風(fēng)險(xiǎn)回歸模型的輸入數(shù)據(jù)格式。以0.100 s為時(shí)間間隔輸入各時(shí)刻周邊車輛的狀態(tài)信息,為防止模型出現(xiàn)過擬合以及提高模型的泛化性能,引入L1和L2正則化懲罰項(xiàng),并將不同軌跡的ID變量設(shè)置為聚類變量。
圖6 時(shí)依等比例風(fēng)險(xiǎn)回歸模型數(shù)據(jù)輸入格式Fig.6 Data input format of time-dependent proportional-hazards regression model
時(shí)依等比例風(fēng)險(xiǎn)回歸模型模擬結(jié)果如表3所示。取0.05的顯著水平,共有6個(gè)變量顯著影響換道時(shí)長,分別是
表3 時(shí)依等比例風(fēng)險(xiǎn)回歸模型模擬結(jié)果Tab.3 Simulation results of time-dependent proportional-hazards regresssion model
表4 比例風(fēng)險(xiǎn)檢驗(yàn)結(jié)果Tab.4 Schoenfeld test results
采用時(shí)依等比例風(fēng)險(xiǎn)回歸模型與HighD開源數(shù)據(jù)集,總計(jì)提取了560條完整的換道軌跡(換道時(shí)長平均值為5.69 s,中位數(shù)為5.55 s),對換道時(shí)長進(jìn)行深入分析。引入非參數(shù)方法對該數(shù)據(jù)集中的整體換道時(shí)長分布進(jìn)行估計(jì),發(fā)現(xiàn)大部分車輛在3 s至8 s內(nèi)完成了換道行為;引入時(shí)依等比例風(fēng)險(xiǎn)回歸模型對換道時(shí)長進(jìn)行建模,發(fā)現(xiàn)共有6個(gè)變量顯著影響換道時(shí)長,對換道時(shí)長影響最大的3個(gè)顯著變量分別為當(dāng)前車輛自身的車速、當(dāng)前車道前車加速度、當(dāng)前車道后車加速度,同時(shí)當(dāng)前車道前車以及目標(biāo)車道后車對當(dāng)前車輛換道時(shí)長的影響最為顯著。顯著影響換道時(shí)長的變量可作為換道決策的參考依據(jù),甚至可以作為換道軌跡預(yù)測算法中的輸入變量,同時(shí)換道時(shí)長的平均值、中位數(shù)、中位生存時(shí)間等指標(biāo)均可用以衡量不同換道軌跡集間換道行為的差異性。受限于數(shù)據(jù)集,僅依據(jù)周邊車輛的運(yùn)動(dòng)信息對當(dāng)前車輛換道時(shí)長的影響因素進(jìn)行建模,后續(xù)研究可以采集駕駛員特征、天氣狀況、不同道路類型等數(shù)據(jù)做進(jìn)一步的探索。
作者貢獻(xiàn)說明:
李林波:相關(guān)概念及方案討論,論文語言組織。
李 楊:數(shù)據(jù)處理及分析,實(shí)驗(yàn)設(shè)計(jì)及初稿撰寫。
鄒亞杰:論文審閱,結(jié)果分析及建議。