馮樹(shù)民,黃秋菊,張宇,趙琥
(1.哈爾濱工業(yè)大學(xué),交通科學(xué)與工程學(xué)院,哈爾濱150010;2.哈爾濱職業(yè)技術(shù)學(xué)院,汽車(chē)學(xué)院,哈爾濱150081)
近年來(lái)對(duì)于汽車(chē)主要操控者行為的描述、理解和深入研究已成為國(guó)內(nèi)外學(xué)者關(guān)注的重點(diǎn)[1]。已有研究表明,應(yīng)用數(shù)學(xué)模型對(duì)駕駛?cè)说鸟{駛操控行為過(guò)程進(jìn)行準(zhǔn)確模擬和刻畫(huà),并體現(xiàn)該過(guò)程中駕駛?cè)说慕?jīng)驗(yàn)和自身特征,是研發(fā)更先進(jìn)的智能化駕駛輔助系統(tǒng)和自動(dòng)駕駛技術(shù),推動(dòng)智能網(wǎng)聯(lián)交通發(fā)展的重要手段之一[2]。1981年,REDDY等[3]開(kāi)始駕駛?cè)诵袨榻Q芯?,并提出一種駕駛?cè)诵袨槟P汀=?jīng)過(guò)近40年的發(fā)展,對(duì)駕駛?cè)诵袨榈慕V饕獨(dú)w納為4種方法:基于傳遞函數(shù)的駕駛?cè)诵袨榻4],基于最優(yōu)控制的駕駛?cè)诵袨榻5],基于數(shù)據(jù)的駕駛?cè)诵袨榻6],基于模型預(yù)測(cè)控制的駕駛?cè)诵袨榻7]。
已有研究更多是從方向盤(pán)轉(zhuǎn)角、預(yù)瞄路徑等建立描述駕駛行為的模型,缺少對(duì)駕駛行為過(guò)程隨機(jī)性和動(dòng)態(tài)性的考慮。為此,本文采用隨機(jī)模型預(yù)測(cè)控制方法,基于HMM 提出駕駛?cè)恕案兄?決策-操控”行為模型,使模型預(yù)測(cè)更符合真實(shí)駕駛狀態(tài)。另外,已有研究大多采用間接計(jì)算獲得的車(chē)頭時(shí)距等確定模型參數(shù),本文利用直接觀測(cè)的自然駕駛數(shù)據(jù),實(shí)現(xiàn)對(duì)模型有效性和準(zhǔn)確性的驗(yàn)證。
隱馬爾可夫模型(Hidden Markov Model,HMM)是馬爾可夫理論模型中常見(jiàn)的一種,通常用模型中可觀測(cè)的參數(shù)計(jì)算并確定模型中未知和不容易觀測(cè)的參數(shù)。如圖1所示。
圖1 隱馬爾可夫模型圖示Fig.1 Diagram of hidden Markov model
圖1中,狀態(tài)xi為HMM 中不容易直接觀測(cè)到的隱含狀態(tài),但可以通過(guò)可觀測(cè)的輸出狀態(tài)yj確定,這些狀態(tài)之間滿足馬爾可夫性質(zhì);aij表示隱含狀態(tài)之間的轉(zhuǎn)移概率;bij表示隱含狀態(tài)與輸出狀態(tài)之間的轉(zhuǎn)移概率。
駕駛?cè)说母兄^(guò)程通常是不確定的、動(dòng)態(tài)的,且隨時(shí)間變化,說(shuō)明駕駛?cè)藳Q策過(guò)程和操縱過(guò)程具有隨機(jī)性。因此,用服從馬爾可夫鏈的隨機(jī)過(guò)程來(lái)描繪駕駛行為是科學(xué)有效的。雖然,駕駛員的感知過(guò)程、決策過(guò)程和操縱過(guò)程是不容易觀測(cè)的隱含狀態(tài),但是可以通過(guò)可觀測(cè)的輸出信息,例如車(chē)頭時(shí)距或車(chē)間時(shí)距等體現(xiàn)。如果通過(guò)計(jì)算間接獲得輸出信息,會(huì)影響模型的準(zhǔn)確性和精度。本文以車(chē)間距作為HMM中的可觀測(cè)輸出,采用雷達(dá)測(cè)距傳感器測(cè)量實(shí)時(shí)車(chē)間距,保證可觀測(cè)輸出層的準(zhǔn)確性,提高模型預(yù)測(cè)的準(zhǔn)確性。利用隱馬爾可夫理論,以最常見(jiàn)的跟車(chē)行駛為例,對(duì)駕駛?cè)笋{駛操控行為建模。前后兩車(chē)車(chē)間距離示意如圖2所示。
圖2 前后兩車(chē)車(chē)間距離示意Fig.2 Schematic diagram of workshop distance between front and rear cars
駕駛?cè)恕案兄?決策-操控”行為模型框架如圖3所示。
圖3 駕駛?cè)恕案兄?決策-操控”行為模型框架Fig.3 Driver perception-decision-manipulation behavior model framework
如圖3所示,在基于HMM 的駕駛?cè)恕案兄?決策-操控”行為建模框架中,基于HMM的駕駛?cè)笋{駛意愿模型模擬駕駛?cè)烁兄^(guò)程,即獲得期望的車(chē)間距;預(yù)測(cè)模塊模擬駕駛?cè)烁鶕?jù)交通環(huán)境和自身生理、心理狀態(tài)預(yù)測(cè)未來(lái)車(chē)輛行駛路徑,即決策過(guò)程;優(yōu)化模塊模擬駕駛?cè)藶閷?shí)現(xiàn)預(yù)測(cè)車(chē)間距對(duì)期望車(chē)間距的追蹤,而采取的措施和動(dòng)作,即操控車(chē)輛加速、減速等。3 個(gè)模塊的滾動(dòng)優(yōu)化過(guò)程實(shí)現(xiàn)對(duì)駕駛?cè)烁?chē)行為的模擬和描繪。
2.2.1 駕駛?cè)笋{駛意愿的數(shù)學(xué)描述
車(chē)輛行駛過(guò)程中,駕駛?cè)烁鶕?jù)感知到的信息產(chǎn)生駕駛意愿操縱車(chē)輛運(yùn)行,車(chē)速是駕駛意愿的主要直觀體現(xiàn),因此,可以用每秒鐘的速度變化量ΔV(ΔV >0,ΔV <0,ΔV=0)來(lái)描述駕駛?cè)说鸟{駛意愿,即加速、減速或勻速。假設(shè)車(chē)輛行駛過(guò)程中縱向速度變化所在區(qū)間為[ΔVmin,ΔVmax] ,將其平均分割成NX份,其中,ΔVmin和ΔVmax分別表示速度變化量最小值和最大值,X等于HMM中隱含狀態(tài)的個(gè)數(shù)。
2.2.2 駕駛?cè)笋{駛意愿模型構(gòu)建
如圖3所示,在駕駛過(guò)程中,駕駛?cè)说鸟{駛意愿具有較強(qiáng)的隨機(jī)性。因此,按照隨機(jī)過(guò)程的定義,駕駛?cè)说鸟{駛意愿可以用隨機(jī)過(guò)程{Xt,t∈[ 0 ,+∞)}來(lái)描述。假設(shè)其概率分布列Π=(pi)為
式中:pi表示隨機(jī)狀態(tài)的概率,p1+p2+…+pNX=1。于是,駕駛意愿即隨機(jī)過(guò)程{Xt,t∈[ 0 ,+∞)}具有馬爾可夫性質(zhì)。用概率轉(zhuǎn)移矩陣A表示駕駛意愿各狀態(tài)之間的轉(zhuǎn)移概率為
式中:aij=P(Xt+1=j|Xt=i),1 ≤i,j≤NX表示t時(shí) 刻ΔV位于第i個(gè)區(qū)間[ ΔVxi-1,ΔVxi),而在t+1 時(shí)刻ΔV位于第j個(gè)區(qū)間[ ΔVxj-1,ΔVxj)的概率為aij。
在駕駛操控行為過(guò)程中,駕駛意愿即HMM 中的隱含狀態(tài)可由兩車(chē)的車(chē)間距離來(lái)體現(xiàn)。試驗(yàn)中借助雷達(dá)模塊實(shí)時(shí)測(cè)量與前車(chē)的車(chē)間距。將車(chē)間距所在的區(qū)間[Smin,Smax] 分割為NY個(gè)子區(qū)間,這里Smin、Smax分別表示車(chē)間距最小值和最大值,NY個(gè)子區(qū)間數(shù)目即為HMM 中可觀測(cè)的輸出狀態(tài)數(shù)目。當(dāng)m時(shí)刻期望的車(chē)間距Sm位于第i個(gè)子區(qū)間[Smi-1,Smi)時(shí),即表示對(duì)應(yīng)的輸出狀態(tài)為Y=i。
根據(jù)圖3分析可知,駕駛操控行為的可觀測(cè)輸出狀態(tài),即車(chē)間距的取值主要取決于駕駛?cè)硕嗤ǖ栏兄畔⒑螽a(chǎn)生的駕駛意愿,因此,可以用條件概率bij=P(Yt=j|Xt=i),1 ≤i,j≤NY表示兩者之間的關(guān)系。該條件概率bij表示當(dāng)HMM的隱含狀態(tài),即駕駛?cè)说鸟{駛意愿位于第i個(gè)子區(qū)間[ΔVxi-1,ΔVxi)時(shí),可觀測(cè)輸出狀態(tài),即車(chē)間距位于第j個(gè)子區(qū)間[Smj-1,Smj)的概率為bij??捎^測(cè)輸出狀態(tài)概率轉(zhuǎn)移矩陣B為
于是,利用隱馬爾可夫模型λ=(A,B,Π)實(shí)現(xiàn)圖3中駕駛?cè)烁兄^(guò)程的模擬,即駕駛意愿模型為
式中:Xk為HMM 中的隱含狀態(tài),即車(chē)輛每秒縱向速度變化量ΔV;Yk為可觀測(cè)的輸出狀態(tài),即車(chē)間距S;k表示時(shí)刻。
在駕駛操縱過(guò)程中,駕駛?cè)嘶谧陨懋?dāng)時(shí)的生理、心理狀態(tài)及駕駛經(jīng)驗(yàn)和習(xí)慣,通過(guò)視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、空間運(yùn)動(dòng)感知等綜合感知車(chē)內(nèi)外的狀態(tài),將多通道獲得的多源信息進(jìn)行融合處理,獲得期望的車(chē)間距序列[Smj(k+1),Smj(k+2),…,Smj(k+Np)],其中,Np為駕駛?cè)烁兄陌踩?chē)間距的狀態(tài)數(shù),p表示個(gè)數(shù)。同時(shí),駕駛員根據(jù)當(dāng)前車(chē)輛狀態(tài),在不與他車(chē)駕駛意愿沖突的條件下,對(duì)下一時(shí)刻車(chē)輛狀態(tài)進(jìn)行預(yù)測(cè)。根據(jù)式(2)和車(chē)輛當(dāng)前狀態(tài),可以得到預(yù)測(cè)輸出序列為
式中:Ypk+i=BAiXk,i=1,2,…,Np。
駕駛?cè)送ㄟ^(guò)對(duì)車(chē)輛的操控,實(shí)現(xiàn)預(yù)測(cè)車(chē)間距對(duì)期望車(chē)間距的跟蹤,即獲得隱含狀態(tài)序列。在已建立的隱馬爾可夫模型λ=()A,B,Π情況下,借助MATLAB 采用維特比算法(Viterbi algorithm)實(shí)現(xiàn)駕駛?cè)笋{駛意愿序列的產(chǎn)生,即完成預(yù)測(cè)車(chē)間距對(duì)期望車(chē)間距的跟蹤。因此,駕駛?cè)恕案兄?決策-操縱”行為模型為
式中:X(k)為待優(yōu)化的駕駛?cè)艘庠感蛄?,即?chē)輛的控制輸入序列,X(k)=(Xk+1,Xk+2,…,Xk+Np)T;Yd(k)為期望的輸出序列。 為實(shí)現(xiàn)優(yōu)化,Yd(k)=(Ydk+1,Ydk+2,…,Ydk+Np)T。根據(jù)貝葉斯公式
在輸出序列Yd(k)已知情況下,條件概率P[X(k)|Yd(k)]的取值與P[Yd(k)]的取值無(wú)關(guān)。因此,條件概率P[X(k)|Yd(k)]的最大值,即如下函數(shù)的最大值。
具體優(yōu)化過(guò)程如下:
當(dāng)Np=1時(shí),
當(dāng)Np=2 時(shí),
以此類(lèi)推,當(dāng)Np=Np時(shí),
因此,
將上述遞推過(guò)程歸納為:
Step 1 將控制時(shí)域Np輸入,并輸入狀態(tài)概率分布列Π,隱含狀態(tài)概率轉(zhuǎn)移矩陣A和可觀測(cè)輸出概率轉(zhuǎn)移矩陣B。
Step 2 輸入期望的觀測(cè)序列Yd(k)=(Ydk+1,Ydk+2,…,Ydk+Np)T。
Step 3 初始化Vk=0。
Step 4 根據(jù)迭代公式Vk+i=P(Ydk+i|Xk+i)P(Xk+i|Xk+i-1)Vk+i-1,i=1,2,…,Np,計(jì)算待優(yōu)化函數(shù)值。
Step 5 計(jì)算控制輸入序列X(k)。
Step 6 將X(k)的第一個(gè)元素作用于系統(tǒng)。
Step 7 在k+1 時(shí),有可觀測(cè)序列Yd(k+1),令k=k+1,回到Step 2。
MATLAB 中具有實(shí)現(xiàn)維特比計(jì)算方法的求解功能,故借助MATLAB完成計(jì)算。
數(shù)據(jù)為項(xiàng)目研究人員于2019年5月-12月在哈爾濱市城市道路所收集的共5591 km、6840 min的自然駕駛數(shù)據(jù)。其中,2019年12月16日-23日,分別于早6:35-7:35,晚16:00-17:00,通過(guò)雷達(dá)測(cè)距,傳感器以0.1 s為步長(zhǎng)記錄10臺(tái)不同試驗(yàn)車(chē)輛與前車(chē)的車(chē)間距,并借助手機(jī)APP同步測(cè)量并記錄試驗(yàn)車(chē)輛的運(yùn)行數(shù)據(jù),包括:實(shí)時(shí)速度,縱向位移,最高速度,累計(jì)行駛公里數(shù)等信息。采用對(duì)稱(chēng)指數(shù)平均濾波算法對(duì)16 段時(shí)間所記錄的數(shù)據(jù)進(jìn)行選取,得到2178457+1853781=4032238組數(shù)據(jù)。
為獲得模擬駕駛?cè)恕案兄?決策-操控”行為過(guò)程的HMM模型,需要辨識(shí)模型中狀態(tài)概率分布列Π,狀態(tài)概率轉(zhuǎn)移矩陣A和輸出概率轉(zhuǎn)移矩陣B。對(duì)濾波后的車(chē)間距數(shù)據(jù)計(jì)算并統(tǒng)計(jì)。車(chē)間距小于1.5 m 和大于16.5 m 的數(shù)據(jù)量較少,僅占數(shù)據(jù)量的11.13%,不作為重點(diǎn)研究?jī)?nèi)容。為更好地體現(xiàn)數(shù)據(jù)的統(tǒng)計(jì)規(guī)律性,具體刻畫(huà)和描繪駕駛?cè)瞬煌煌鳡顟B(tài)下駕駛操控行為,按照車(chē)間距間隔6 m進(jìn)行分類(lèi),獲得[1 .5,7.5)m,[ 7.5,13.5)m,[1 3.5,19.5)m 這3 個(gè)車(chē)間距區(qū)間,各自對(duì)應(yīng)數(shù)據(jù)量如表1所示。
表1 按照車(chē)間距劃分后的統(tǒng)計(jì)數(shù)據(jù)Table 1 Statistical data table by vehicle spacing
為獲得HMM 模型中隱含狀態(tài)的概率分布列,即ΔV的概率分布列,先將車(chē)輛速度變化所在區(qū)間[ΔVmin,ΔVmax]劃分為NX個(gè)子區(qū)間,依據(jù)大樣本量情況下頻率近似概率思想,獲得車(chē)輛速度變化量位于每個(gè)區(qū)間的概率,即
式中:nΠi為車(chē)輛的速度變化量位于區(qū)間[ ΔVxi-1,ΔVxi)的樣本點(diǎn)的數(shù)量;nΠ為研究區(qū)間(車(chē)間距區(qū)間)內(nèi)樣本點(diǎn)的總數(shù);pi為車(chē)速變化量位于[ ΔVxi-1,ΔVxi)區(qū)間的頻率。取NX分別為8、10 和8,計(jì)算獲得車(chē)間距[1 .5,7.5)m ,[ 7 .5,13.5)m ,[1 3.5,19.5)m 這3 個(gè)區(qū)間上,車(chē)輛速度變化量的概率分布列,如表2所示。
表2 車(chē)輛速度變化量概率分布列ΠTable 2 Probability distribution of vehicle speed variation Π
同理,分別將車(chē)輛速度變化量區(qū)間[ΔVmin,ΔVmax]劃分為NX個(gè)子區(qū)間,將輸出車(chē)間距變化區(qū)間[Smin,Smax] 劃分為NY個(gè)子區(qū)間。采用大樣本量下頻率近似概率的方法,通過(guò)式(15)和式(16)計(jì)算獲得車(chē)輛速度變化的概率轉(zhuǎn)移矩陣A=[aij]及輸出概率轉(zhuǎn)移矩陣B=[bij]。
式中:nAij為車(chē)輛的速度變化量位于區(qū)間[ ΔVxi-1,ΔVxi)的樣本點(diǎn)的數(shù)量;nAi為研究區(qū)間內(nèi)樣本點(diǎn)的總數(shù);nBij為車(chē)輛的速度變化量位于區(qū)間[ ΔVxi-1,ΔVxi),車(chē)間距位于區(qū)間[Smj-1,Smj)的樣本點(diǎn)的數(shù)量;nBi為研究區(qū)間內(nèi)樣本點(diǎn)的總數(shù)。
取不同的NX和NY,計(jì)算獲得車(chē)間距[1 .5,7.5)m,[ 7 .5,13.5)m,[1 3.5,19.5)m 這3 個(gè)區(qū)間上車(chē)輛速度變化的概率轉(zhuǎn)移矩陣A=[aij]及輸出概率轉(zhuǎn)移矩陣B=[bij] 。以車(chē)間距[1 .5,7.5)m 為例,結(jié)果如表3和表4所示。
通過(guò)計(jì)算結(jié)果可以看出,表3和表4中的行最大值有7/10 位于對(duì)角線上;同理,發(fā)現(xiàn)另外兩個(gè)車(chē)間距區(qū)間下概率轉(zhuǎn)移矩陣計(jì)算表中的行最大值分別有8/10 和7/10 位于對(duì)角線上。這表明車(chē)輛速度變化量在下一時(shí)刻有73.3%向自身所在的區(qū)間轉(zhuǎn)移,即速度變化呈現(xiàn)平穩(wěn)狀態(tài)。通過(guò)計(jì)算還可以看出,每行的次最大值有82.14%向自身所在區(qū)間的相鄰區(qū)間進(jìn)行轉(zhuǎn)移。說(shuō)明駕駛?cè)嗽诙虝r(shí)間內(nèi)傾向于操控車(chē)輛平穩(wěn)運(yùn)行,沒(méi)有急加速或急減速的駕駛決策和行為。這與大多數(shù)駕駛?cè)说鸟{駛操控行為特性相吻合。說(shuō)明模型可以實(shí)現(xiàn)對(duì)駕駛?cè)恕案兄?決策-操控”行為過(guò)程的模擬和預(yù)測(cè)。
表3 車(chē)速變化量概率轉(zhuǎn)移矩陣ATable 3 Probability transfer matrix A of vehicle speed variation
表4 輸出車(chē)間距概率轉(zhuǎn)移矩陣BTable 4 Probability transfer matrix B of output vehicle spacing
重新選取編號(hào)為006號(hào)、008號(hào)和019號(hào)的3輛車(chē)作為研究算例,分別采集3輛車(chē)15 min的自然駕駛數(shù)據(jù),如表5所示。
表5 隱含狀態(tài)車(chē)輛速度變化量區(qū)間劃分Table 5 Interval division of vehicle speed variation in hidden state
通過(guò)辨識(shí)獲得Π、A和B,使用MATLAB 中HMM 工具箱中的命令multinomial-prob 和viterbipath實(shí)現(xiàn)維特比優(yōu)化方法,得到待優(yōu)化的駕駛?cè)藳Q策序列,如表6所示。
表6 輸出狀態(tài)車(chē)間距區(qū)間劃分Table 6 Interval division of output state
根據(jù)優(yōu)化算法得到3輛車(chē)的閉環(huán)響應(yīng)曲線,如圖4~圖6所示。可以看出:模型仿真與實(shí)際車(chē)間距的總體趨勢(shì)一致,整體近似效果較好;比較實(shí)際車(chē)間距和模型仿真后獲得車(chē)間距,模型預(yù)測(cè)的車(chē)間距平均誤差僅為1.47%;樣本量越大,隱含狀態(tài)和輸出狀態(tài)區(qū)間劃分越細(xì)致,仿真效果與實(shí)際數(shù)據(jù)一致性越好,模型的預(yù)測(cè)準(zhǔn)確性越高。表明:所建立的基于HMM駕駛?cè)恕案兄?決策-操控”行為模型,克服了傳統(tǒng)模型應(yīng)用時(shí)對(duì)交通場(chǎng)景的限定及缺乏對(duì)駕駛行為過(guò)程隨機(jī)性和動(dòng)態(tài)性考慮的問(wèn)題,可以更好地模擬和描述駕駛?cè)烁?chē)駕駛行為。
圖5 編號(hào)008車(chē)輛的模型仿真與實(shí)際車(chē)間距對(duì)比圖Fig.5 Comparison between model simulation and actual vehicle spacing of vehicle No.008
圖6 編號(hào)019車(chē)輛的模型仿真與實(shí)際車(chē)間距對(duì)比圖Fig.6 Comparison between model simulation and actual vehicle spacing of 019 vehicle
對(duì)于駕駛行為的準(zhǔn)確模擬是實(shí)現(xiàn)自動(dòng)駕駛技術(shù)的重要前提,而駕駛行為存在隨機(jī)性和不確定性,本文提出一種HMM結(jié)合隨機(jī)模型預(yù)測(cè)控制的駕駛?cè)烁?chē)行為建模方法。建立駕駛?cè)恕案兄?決策-操控”行為模型并應(yīng)用多源數(shù)據(jù)采集和融合方法,利用自然駕駛數(shù)據(jù)實(shí)現(xiàn)HMM參數(shù)的辨識(shí)。自然駕駛數(shù)據(jù)表明:模型預(yù)測(cè)的車(chē)間距平均誤差僅為1.47%。模型的建立為更好地滿足智能網(wǎng)聯(lián)環(huán)境下對(duì)于駕駛行為預(yù)測(cè)準(zhǔn)確性和精確性的要求,為自動(dòng)駕駛技術(shù)研發(fā)提供支持。
本文基于大樣本量情況下頻率近似概率的思想求解模型中狀態(tài)概率分布列,因此,模型更適用于大數(shù)據(jù)采集下的交通場(chǎng)景。由于模型是對(duì)跟車(chē)行為進(jìn)行模擬,模型應(yīng)用時(shí)需將轉(zhuǎn)向和換道行為車(chē)輛數(shù)據(jù)進(jìn)行濾波處理,確保模型應(yīng)用的準(zhǔn)確性。