馬晨浩,宇仁德,胡婧暉,步玫
(山東理工大學 交通與車輛工程學院, 山東 淄博255049)
從交通運輸部發(fā)布的《2019年交通運輸行業(yè)發(fā)展統(tǒng)計公報》獲悉,截至2019年年底,全國公路總里程達到501.25萬km,高速公路總里程達14.96萬km[1],高速擴張的道路網(wǎng)絡使汽車出行方式成為首選,然而汽車事故的發(fā)生率和死亡人數(shù)依然居高不下。變道是駕駛員經(jīng)常執(zhí)行的機動操作,由于汽車車速較快且變道過程中周圍環(huán)境復雜多變,因此發(fā)生事故的概率比較高。根據(jù)美國道路交通事故的統(tǒng)計數(shù)據(jù),在美國,汽車變道所引起的道路交通事故占警方報告的撞車事故的5%、死亡人數(shù)的0.5%[2]。如何在復雜的交通環(huán)境下高效準確地預測汽車變道是否安全成為了一大難題,而其中越線時間的預測對于汽車變道安全至關重要。對越線時間的研究將為汽車變道安全問題提供一種新的思路和方法,也對輔助駕駛系統(tǒng)和無人駕駛系統(tǒng)的安全性預測有一定的參考價值。
近年來,對于汽車變道行為的研究主要在變道行為分析、變道影響因素、變道決策模型、變道執(zhí)行模型4個層面。伍淑莉等[3]基于循環(huán)神經(jīng)網(wǎng)絡(RNN)和長短時記憶網(wǎng)絡(LSTM)的理論研究,提出了一種基于LSTM 的智能車變道行為預測模型。張穎達[4]基于NGSIM軌跡數(shù)據(jù)建立多項式模型,選取多個誤差指標對不同階數(shù)下變道橫向移動軌跡擬合效果進行評價,并且分別利用時間對數(shù)模型和雙隱含層神經(jīng)網(wǎng)絡對變道時間進行預測。王暢等[5]以Jula提出的換道安全性模型為基礎,結合營運客車的換道行為特征,通過分析換道進程結束后客車需要與周圍車輛保持的安全距離,建立適合于營運客車的換道安全性識別模型,并利用真實數(shù)據(jù)對模型進行驗證,并且從換道軌跡具有相似性的特點出發(fā),建立換道越線時間預測模型。王雪松等[6]基于上海自然駕駛實驗采集的駕駛員行為以及車輛運行數(shù)據(jù),對比分析不同類型道路上駕駛員的變道特征。Wang等[7]提出了一種基于隱馬爾可夫模型(HMM)的兩階段換道模型。Xu等[8]提出了一種基于V2X的駕駛員輔助系統(tǒng)(HM4LCP)的混合式車道變更預測模型。Wang等[9]提出了一種新的基于變道行為的客車變道安全識別模型。Chen等[10]提出了一種基于車輛軌跡數(shù)據(jù)集的公路車輛變道行為關鍵特征選擇和風險預測的研究框架。綜上所述,目前對于汽車變道越線時間的預測研究相對較少,忽視了變道越線時間對于變道安全的影響,因此對于汽車變道越線時間的預測研究有一定的意義。
NGSIM(next generation simulation即美國聯(lián)邦高速公路管理局啟動的下一代交通仿真工程)數(shù)據(jù)是為交通微觀模擬研究和開發(fā)收集的比較詳細和準確的現(xiàn)場數(shù)據(jù),能夠為汽車變道行為的研究提供便利。本文選取I-80路段車輛軌跡數(shù)據(jù)集為研究數(shù)據(jù),監(jiān)測區(qū)域示意圖如圖1所示,7臺同步數(shù)碼攝像機安裝在高速公路旁一棟30層樓的樓頂上(圖2),記錄了通過監(jiān)測區(qū)域的車輛。
圖1 I-80監(jiān)測區(qū)域示意圖
(a)安裝在樓頂?shù)臄?shù)字攝像機 (b)7臺攝像機各自的覆蓋區(qū)域
為了消除變道微觀特性對于后續(xù)研究的影響,首先將處于6、7、8號車道內(nèi)的數(shù)據(jù)剔除;因為本文選取汽車作為研究對象,所以將摩托車和貨車的數(shù)據(jù)剔除;另外,考慮到汽車車型的影響,僅以中型汽車為標準篩選汽車車長為3.6~4.9 m的數(shù)據(jù),上述步驟只需通過Excel即可完成。下一步利用Python編程按照車道發(fā)生變換的原則篩選出變道汽車的ID。因為汽車每變換一次車道,程序輸出一次ID,且向右變道輸出為+1,向左變道輸出為-1,所以可篩選出向左且單次變道的汽車(同一輛車在不同時段發(fā)生變道只選擇一次)共435輛。
為了減弱采集到的原始數(shù)據(jù)中噪聲對于后續(xù)模型訓練的影響,提高數(shù)據(jù)繪成曲線的光滑度,采用Matlab中的smooth函數(shù)(yy=smooth(y,method))對軌跡數(shù)據(jù)進行平滑處理。通過對比smooth函數(shù)中各種方法的平滑效果,選擇移動平均法moving處理汽車的橫向坐標和速度數(shù)據(jù),選擇loess局部回歸法(加權線性最小二乘和一個二階多項式模型)處理汽車的加速度數(shù)據(jù),并根據(jù)汽車縱向間距與平滑后的橫向坐標數(shù)據(jù)修正每一幀(0.1 s)的車頭時距。以40號車為例,橫向坐標的平滑處理結果如圖3所示。
圖3 40號車橫向坐標的平滑處理圖
本研究以汽車變道過程中橫向位置發(fā)生單向連續(xù)改變所需的時間作為變道持續(xù)時間。對于向左變道的汽車,在圖3中可直觀看到有幾段橫向坐標連續(xù)減小的圖像,再根據(jù)車道線的位置可以很快判斷哪一段是所需的變道數(shù)據(jù)段。另外,通過觀察發(fā)現(xiàn),變道數(shù)據(jù)段是所有滿足條件的數(shù)據(jù)段中橫向坐標變化最大的一段。根據(jù)以上原則進行Matlab編程,提取每輛車變道數(shù)據(jù)的時間點。
以上述時間點為條件,將某輛車變道過程中的數(shù)據(jù)組提取出來,同時提取鄰近車輛的數(shù)據(jù),并進行相應的平滑處理,最終得到不同汽車的車組變道總數(shù)據(jù)。在每組車組變道總數(shù)據(jù)中按車道發(fā)生變換的時間點,將每輛變道車的越線時間作為因變量,選擇符合條件的前99組進行后續(xù)研究。
本研究將原車道橫向位移量X、汽車變道初始速度v、與原車道前車初始縱向間距ΔY0、與原車道前車初始速度差Δv0、與目標車道后車初始縱向間距ΔY1、與目標車道后車初始橫向間距ΔX1、與目標車道后車初始速度差Δv1、與目標車道前車初始縱向間距ΔY2、與目標車道前車初始橫向間距ΔX2、與目標車道前車初始速度差Δv2共10個自變量作為變道越線時間的潛在影響因素。統(tǒng)計所有車組變道總數(shù)據(jù)中以上10個自變量的值對應1.4中相應的越線時間。
本文嘗試分別利用多元線性回歸和多元非線性回歸的方法進行擬合并比較,選出一個效果最佳的函數(shù)表達式。
由于自變量的個數(shù)比較多,因此選擇利用Spss軟件中逐步回歸的方法篩選自變量,其工作原理為:對自變量進行逐個引入,每引入一個變量就對已經(jīng)引入的所有自變量進行顯著性檢驗;當之前引入的某個自變量不再顯著的時候就會對其進行剔除,直至沒有任何一個自變量引入或者剔除時為止[11]。得到的多元線性模型為
T=0.432X+0.132Δv0-0.016ΔY2-
0.166Δv2+4.743,
(1)
輸出結果見表1—表3。
表1 模型系數(shù)表
表2 模型摘要
表3 模型方差分析表
從逐步回歸分析輸出的表2中可以看出,模型的精度為 0.567,說明模型的擬合效果較差。但從表3中可以看出,顯著性為0.000,小于假設的顯著性水平0.05,表明模型的線性關系仍顯著,模型具有實際意義。從表1的模型系數(shù)表中可以發(fā)現(xiàn),各個系數(shù)的顯著性值均小于0.05,表明自變量的系數(shù)均顯著大于0,從而模型仍可用于對變道越線時間的預測。
鑒于多元線性模型的擬合優(yōu)度較低,從物理學角度分析發(fā)現(xiàn),逐步回歸模型剔除的某些自變量實際上可能對變道越線時間的影響較大,導致模型在預測上出現(xiàn)較大的偏差。例如,汽車變道初始速度v從實際經(jīng)驗上看對變道越線時間一定會產(chǎn)生較大的影響。為了對變道越線時間進行更精確的預測,下面通過灰色關聯(lián)度分析判斷各個自變量對因變量的影響程度,找出影響程度最高的自變量。
3.1.1 自變量的無量綱化
為了排除自變量之間單位不同對機理模型描述客觀規(guī)律的影響,使用標準化方法將原始數(shù)據(jù)組標準化為均值為0、方差為1且接近于正態(tài)分布的數(shù)據(jù)組。標準化方法的公式如下:
Xi′(k)=(Xi(k)-u)/δ
(i=1,…,11;k=1,…,99),
(2)
式中:i為數(shù)據(jù)列的列數(shù)(1是因變量,2~11為自變量,下同);k為每組數(shù)據(jù)列中的數(shù)據(jù)個數(shù);Xi(k)為因變量和自變量數(shù)據(jù)列的各個原始數(shù)據(jù);u為此變量數(shù)據(jù)列的平均值;δ為此變量的標準差;Xi′(k)為標準化后對應的數(shù)據(jù)[11]。
3.1.2 關聯(lián)度計算
將無量綱化后的越線時間數(shù)據(jù)列作為參考數(shù)據(jù)列,其余自變量的數(shù)據(jù)列分別作為比較數(shù)據(jù)列,利用下式計算參考數(shù)據(jù)列和各比較數(shù)據(jù)列曲線之間的差值大?。?/p>
Δi(k)=丨Xi′(k)-X1′(k)丨
(i=2,…,11;k=1,…,99)。
(3)
兩級最大差與最小差分別為:
Δ(max)= maximaxkΔi(k),
(4)
Δ(min)= miniminkΔi(k),
(5)
則可求得某車參考數(shù)據(jù)列與比較數(shù)據(jù)列之間的關聯(lián)系數(shù)為
γiy(k)=(Δ(min)+ρΔ(max))/
(Δi(k)+ρΔ((max))
(i=2,…,11;k=1,…,99),
(6)
式中ρ為分辨系數(shù),其意義在于避免Δi(k)過大而造成的數(shù)據(jù)失真,用來提高關聯(lián)系數(shù)之間的差異顯著性,ρ的取值范圍為 0~1,一般取ρ=0.5[11]。
為了對因變量和各自變量進行整體比較,對每列自變量關聯(lián)系數(shù)值求平均值,得到參考數(shù)據(jù)列與比較數(shù)據(jù)列之間的關聯(lián)度。
3.1.3 關聯(lián)度排序
根據(jù)以上步驟進行Matlab編程得到每個自變量與因變量之間的關聯(lián)度如下:
γ2y=0.725 7,γ3y=0.729 2,γ4y=0.772 8,
γ5y=0.786 9,γ6y=0.749 1,γ7y=0.728 9,
γ8y=0.662 3,γ9y=0.760 6,γ10y=0.752 2,
γ11y=0.765 4。
因此關聯(lián)度從高到低為:Δv0、ΔY0、Δv2、ΔY2、ΔX2、ΔY1、v、ΔX1、X。
在建立多元非線性模型之前,為了能夠篩選出具有相關關系的自變量,減少自變量的個數(shù),對10個自變量進行相關性分析,然后對相關關系較強的自變量進行兩兩之間的曲線擬合,判斷它們之間是否具有對應關系;若有即可通過剔除其中一個自變量,精簡自變量個數(shù)[11]。
基于所要研究的自變量均為連續(xù)型變量,選擇Spss中的Pearson相關性分析方法,輸出的相關性表見表4(篇幅有限,只截取一部分)。
表4每行中上邊的數(shù)字代表相關性系數(shù),下邊的數(shù)字代表顯著性系數(shù)。從表4發(fā)現(xiàn),ΔY0、Δv0這兩個自變量與其他自變量的相關性系數(shù)均低于0.4,屬于低度線性相關,因此將ΔY0和Δv0作為單獨自變量進行非線性回歸。另外,有些兩兩因素之間本就存在一定的關系,例如X0是求解ΔX1時的條件,雖然它們顯著性和相關性都比較強,但無需對它們進行曲線擬合(如表中紫色部分)。按照表4,將對v、ΔY2等兩兩一組的自變量(如表中紅色部分)進行曲線擬合。
表4 Pearson相關性分析表
本研究采用Matlab中的cftool工具箱來進行曲線擬合。通過不斷擬合觀察每組自變量之間的函數(shù)關系可知,擬合優(yōu)度R2均在0.5左右,達不到曲線擬合的要求。綜合考慮自變量關聯(lián)度的大小,在對越線時間進行擬合時,應該優(yōu)先考慮關聯(lián)度較高的自變量對越線時間的影響。
3.3.1 數(shù)據(jù)的處理和篩選
為降低極端數(shù)據(jù)對訓練數(shù)據(jù)效果的影響,保證訓練和測試數(shù)據(jù)的隨機性,將99組數(shù)據(jù)中越線時間、目標車道變道時間、總變道時間過大或過小的9組數(shù)據(jù)刪除,再將剩余數(shù)據(jù)按訓練數(shù)據(jù)∶測試數(shù)據(jù)=2∶1的比例劃分,其中測試數(shù)據(jù)選擇中間的30組數(shù)據(jù)。
3.3.2 確定回歸模型
Matlab中的beta=nlinfit(x,y,model,beta0)函數(shù)是進行多元非線性回歸常用的函數(shù),其中:x為自變量,可以是多個自變量;y為因變量,只能有一個;model是函數(shù)模型;beta0是模型系數(shù)的初值;beta是求得的模型系數(shù)。另外,對于model函數(shù)模型,直接使用內(nèi)聯(lián)函數(shù)model=inline(′y1′,′beta′,′x′)建立,y1是回歸模型的函數(shù)表達式。
由于沒有可供參考的回歸模型,只能根據(jù)典型的函數(shù)模型如冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等不斷嘗試。10個自變量都與橫向距離、縱向距離、速度這3種指標有關,而且在保證擬合效果的情況下,自變量越少,模型的運算速度也會越快;因此,先選擇上述3種指標中關聯(lián)度最高的ΔY0、Δv0、ΔX2作為擬合所用的自變量。經(jīng)過反復嘗試,得到以下3種函數(shù)模型表達式可用于數(shù)據(jù)擬合:
%model1=inline(′beta(1)+beta(2).*
exp(beta(3)./x(:,1))+beta(4).*x(:,2)+
beta(5).*x(:,3)′,′beta′,′x′),
(7)
%model2=inline(′beta(1)+beta(2).*
x(:,1)+beta(3).*x(:,2)+beta(4).*x(:,3)+
beta(5).*x(:,1).*x(:,3)+beta(6).*x(:,2).*x(:,3)′,′beta′,′x′),
(8)
%model3=inline(′beta(1)+beta(2).*
exp(beta(3)./x(:,1))+beta(4).*exp(beta(5)./
x(:,2))+beta(6).*exp(beta(7)./x(:,3))′,
′beta′,′x′),
(9)
對于擬合的效果,采用擬合度指標Rnew來表示,Rnew越接近1,表示擬合效果越好。Rnew的表達式如下:
(10)
式中:y1為擬合越線時間;y為真實越線時間。
求得利用上述3種模型擬合測試數(shù)據(jù)的Rnew值分別為0.938 2,0.932 2,0.934 4,擬合優(yōu)度值均接近1。但是通過計算每輛車越線時間擬合誤差(y1-y)的大小會發(fā)現(xiàn),這3種模型擬合30組測試數(shù)據(jù)的誤差在[-1,1]的均只在40%左右,在[-0.5,0.5]的更是低于30%。對于越線時間來說,擬合誤差在[-0.5,0.5]的擬合效果比較好,由于真實越線時間是從圖像中按照一定的規(guī)則提取出來的,所以在[-1,1]的擬合誤差也可以接受,而超出這一范圍的則會對汽車變道安全產(chǎn)生不利影響;因此,排除這3種模型并且重新采用自變量中關聯(lián)度最高的ΔY0、Δv0、ΔY2、ΔX2、Δv2來進行擬合。同樣地,經(jīng)過反復嘗試和測試,得到擬合效果最好且擬合誤差較小的函數(shù)模型表達式為
y1=6.3829-0.00504.*x(:,1)+0.1355.*x(:,2)-
0.0052.*x(:,3)-0.2668.*x(:,4)-0.1048.*
x(:,5)-0.0082.*x(:,1).*x(:,4)。
(11)
越線時間真實值與擬合值對比圖如圖4所示,越線時間真實值與擬合值誤差如圖5所示。(圖5中兩條綠色虛線是y=0.5和y=-0.5)。
圖4 越線時間真實值與擬合值對比圖
圖5 越線時間真實值與擬合值誤差圖
利用此模型擬合測試數(shù)據(jù)的Rnew值為0.981 4,接近于1。從圖5中可以看出,30組測試數(shù)據(jù)的誤差在[-1,1]的達到25組,占比83%,且其中絕大部分處于[-0.5,0.5],在誤差為0處上下浮動,擬合效果符合要求。因此,該模型通過了驗證,可用于對汽車變道越線時間的預測。
變道越線時間預測是汽車變道主動安全技術的一大關鍵,本文利用多元非線性回歸的方法,構建了一種越線時間預測模型,該模型能夠有效預測汽車變道越線時間,預測有效率達到83%。本研究仍有以下不足之處:越線時間是指定規(guī)則下提取出的,與實際相比會有誤差,影響后續(xù)擬合效果;未考慮到駕駛員以及車流量、路面狀態(tài)、天氣情況等因素對越線時間的影響,今后可以做進一步的研究;此外,預測有效率有待進一步提高,以提升模型的實用價值。