李宇寂
(1.中國(guó)第一汽車股份有限公司 智能網(wǎng)聯(lián)開發(fā)院,長(zhǎng)春130013;2.汽車振動(dòng)噪聲與安全控制綜合技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)春130013)
主題詞:自動(dòng)駕駛 障礙車輛 行為預(yù)測(cè) 隱馬爾可夫模型
在復(fù)雜的交通環(huán)境中,車輛要想安全快速行駛,不只是要規(guī)劃好自身的路徑,更要根據(jù)周圍車輛的實(shí)時(shí)變化,動(dòng)態(tài)的規(guī)劃接下來(lái)的駕駛動(dòng)作,正是由于存在自身車輛與周圍障礙車輛的交互影響,如何準(zhǔn)確的預(yù)測(cè)周圍障礙車輛的駕駛行為變得尤其重要。有經(jīng)驗(yàn)的駕駛員會(huì)根據(jù)周圍車輛的一系列動(dòng)作準(zhǔn)確預(yù)測(cè)出其接下來(lái)的行為,比如直行、左換道、右換道、左轉(zhuǎn)彎和右轉(zhuǎn)彎等等。自動(dòng)駕駛應(yīng)用中,無(wú)人車也需要根據(jù)周圍車輛的駕駛行為來(lái)準(zhǔn)確規(guī)劃自身車輛接下來(lái)的動(dòng)作,無(wú)人車配有各類傳感器,比如視覺(jué)攝像頭、毫米波雷達(dá)和激光雷達(dá)等,這使得它們具備遠(yuǎn)超人類的檢測(cè)感知能力,并且可以做到不間斷,全方位地檢測(cè)周圍環(huán)境,進(jìn)而通過(guò)對(duì)障礙車輛信息數(shù)據(jù)的收集和處理,來(lái)判斷其接下來(lái)的行駛意圖,最終用于自身車輛行為決策和軌跡規(guī)劃的依據(jù)。蔡英鳳[1]運(yùn)用隱馬爾科夫模型,對(duì)帶有時(shí)間和空間信息的車輛軌跡進(jìn)行訓(xùn)練,獲得路徑劃分后對(duì)道路車輛軌跡進(jìn)行參數(shù)匹配,提取諸如超低(高)速行駛、違章停車、違規(guī)掉頭等異常行為。黃如林[2]利用高斯混合模型從車輛駕駛行為數(shù)據(jù)和道路結(jié)構(gòu)信息中學(xué)習(xí)駕駛行為模式,并用于檢測(cè)動(dòng)態(tài)車輛的駕駛行為意圖。耿新力[3]提出了一種基于本體論和馬爾科夫理論的行為決策方法,對(duì)其中的駕駛場(chǎng)景建模、他車運(yùn)動(dòng)狀態(tài)預(yù)測(cè)和駕駛動(dòng)作生成方法進(jìn)行了深入研究。
本文通過(guò)車輛周圍傳感器來(lái)感知障礙車輛的相對(duì)位置信息,并結(jié)合自身車輛的高精定位信息,獲得障礙車輛的精確位置,通過(guò)應(yīng)用隱馬爾可夫模型建立不同駕駛行為的預(yù)測(cè)模型,最終通過(guò)模型的預(yù)測(cè)來(lái)判斷障礙車輛的可能駕駛意圖,輔助自動(dòng)駕駛車輛進(jìn)行有效的駕駛決策,更好的規(guī)劃安全高效的行駛路線。
有經(jīng)驗(yàn)的駕駛員可以通過(guò)觀察周圍車輛的一系列軌跡來(lái)預(yù)估其未來(lái)的駕駛動(dòng)作。而無(wú)人駕駛車輛通過(guò)車身周圍布置的各種傳感器來(lái)感知障礙車輛的相對(duì)位置關(guān)系,同時(shí)通過(guò)GPS 和慣性測(cè)量單元(Inertial Measurement Unit,IMU)獲得自身車輛的定位信息,再經(jīng)過(guò)復(fù)雜的處理和精確的判斷后,也能夠預(yù)測(cè)障礙車輛的駕駛動(dòng)作。整個(gè)過(guò)程的結(jié)構(gòu)圖如圖1所示。
圖1 行為預(yù)測(cè)模塊架構(gòu)
在不同場(chǎng)景下,車輛會(huì)有不同可能的駕駛意圖。比如在高速場(chǎng)景下,可行的駕駛意圖通常分為3種:直行、左變道和右變道(圖2)。而在十字路口,可行的駕駛意圖除了以上列舉的3種,還包括左轉(zhuǎn)彎、右轉(zhuǎn)彎和直行通過(guò)路口(圖3)。所以,需要設(shè)計(jì)1種方法,使其能夠適用于不同場(chǎng)景的意圖預(yù)測(cè)。不僅如此,針對(duì)不同的交通場(chǎng)景進(jìn)行預(yù)測(cè)一方面能夠使預(yù)測(cè)過(guò)程有更好的針對(duì)性,另一方面還能夠簡(jiǎn)化預(yù)測(cè)過(guò)程,消除不必要的誤識(shí)別,比如在高速場(chǎng)景,障礙車輛不可能左右轉(zhuǎn)彎,因此輸出的預(yù)測(cè)結(jié)果就不需要考慮左右轉(zhuǎn)彎,從而大大減少程序的計(jì)算復(fù)雜度,并消除誤識(shí)別。
根據(jù)導(dǎo)航可以獲得自身車輛當(dāng)前所處的場(chǎng)景信息,比如高速場(chǎng)景,還是城市道路場(chǎng)景,進(jìn)一步可以將場(chǎng)景細(xì)化:高速場(chǎng)景分為普通道路場(chǎng)景和上下高速匝道場(chǎng)景;城市道路場(chǎng)景可以分為普通道路場(chǎng)景和路口場(chǎng)景(十字路口,丁字路口等)。當(dāng)車輛運(yùn)行到實(shí)際工況時(shí),可以根據(jù)具體細(xì)分場(chǎng)景將車輛可能的駕駛行為更詳細(xì)的確定,比如在高速公路上匝道場(chǎng)景,車輛只可能直行和左變道;下匝道場(chǎng)景,車輛只可能直行和右變道;對(duì)普通道路的路口場(chǎng)景,比如非十字路口(如丁字路口或禁止左轉(zhuǎn)路口),車輛可能的行駛方向只有直行和右轉(zhuǎn)彎。
圖2 高速場(chǎng)景
圖3 城市場(chǎng)景
自動(dòng)駕駛車輛根據(jù)各傳感器的檢測(cè),分別獲得周圍障礙車輛的位置信息,進(jìn)一步經(jīng)過(guò)感知融合模塊獲得更魯棒和精確的位置信息,最終得到障礙車輛與自身車輛的相對(duì)位置關(guān)系,再結(jié)合自身車輛的高精定位信息,可以確定障礙車輛的高精定位信息,最終獲得障礙車輛的絕對(duì)位置。
圖4給出了車輛相對(duì)位置關(guān)系示例圖?;谧陨碥囕v的定位信息,結(jié)合所述障礙車輛的相對(duì)位置信息,確定障礙車輛的準(zhǔn)確位置的方法包括:自身車輛通過(guò)高精定位信息可以獲得車輛在世界坐標(biāo)系下的絕對(duì)位置( Xω,Yω)和航向角( β ),通過(guò)傳感器可以獲得目標(biāo)車輛在本車車輛坐標(biāo)系下的相對(duì)位置( Xv,Yv),最終的目標(biāo)車輛在世界坐標(biāo)系下的絕對(duì)坐標(biāo)( Xf,Yf)可以通過(guò)如下公式獲得:
圖4 車輛相對(duì)位置關(guān)系示例
為了確定車輛未來(lái)的駕駛意圖,需要結(jié)合其一段時(shí)期的駕駛動(dòng)作,因此需要記錄障礙車輛的歷史軌跡序列(圖5)。
圖5 障礙車輛的歷史軌跡
圖5 給出了一種車輛運(yùn)動(dòng)軌跡示意圖。車輛的行駛在時(shí)間序列上是有延續(xù)性的,既通常情況下車輛會(huì)沿著既定的駕駛意圖行駛,短期內(nèi)不會(huì)處于雜亂無(wú)章的運(yùn)動(dòng),因此當(dāng)前時(shí)刻識(shí)別出車輛在一段歷史時(shí)期的駕駛動(dòng)作,即可預(yù)測(cè)車輛在未來(lái)一段時(shí)間內(nèi)的駕駛意圖。
車輛在不同的駕駛意圖下,會(huì)生成不同的歷史軌跡序列,可以通過(guò)對(duì)歷史軌跡的判斷來(lái)間接判斷車輛接下來(lái)可能的駕駛動(dòng)作,比如車輛在一段時(shí)間一直沿直線行駛,那么接下來(lái)繼續(xù)直行的概率會(huì)非常大,如果車輛在一段時(shí)間有向右移動(dòng)的趨勢(shì),那么其接下來(lái)右轉(zhuǎn)彎的概率非常大,并不一定需要車輛完全轉(zhuǎn)過(guò)來(lái)才確認(rèn)。不同的駕駛員對(duì)車輛的操控會(huì)有很大的不同,即使都是直行,有經(jīng)驗(yàn)的駕駛員會(huì)開的比較平穩(wěn)順滑,新的駕駛員會(huì)不斷的小幅修正方向盤,車輛的軌跡就會(huì)有小幅度的左右晃動(dòng);另一方面,不同的駕駛員轉(zhuǎn)彎的半徑也會(huì)千差萬(wàn)別。為了能夠消除由于不同的駕駛習(xí)慣導(dǎo)致的駕駛意圖判斷不準(zhǔn),這里引入HMM(隱馬爾可夫模型)來(lái)進(jìn)行統(tǒng)計(jì)化處理。
HMM 是一種用來(lái)描述隨機(jī)狀態(tài)序列的概率模型,通過(guò)HMM得到的是一個(gè)狀態(tài)序列發(fā)生的概率,這里通過(guò)對(duì)車輛在一段時(shí)間內(nèi)的歷史軌跡序列,判斷其可能的駕駛動(dòng)作發(fā)生的概率。應(yīng)用統(tǒng)計(jì)學(xué)的處理方法,可以將不同的駕駛習(xí)慣更好的進(jìn)行歸類,從而消除不同駕駛員的個(gè)體差異,比如可以將不同轉(zhuǎn)彎半徑的駕駛習(xí)慣都判斷為左轉(zhuǎn)彎或者右轉(zhuǎn)彎,從而使駕駛行為的預(yù)測(cè)有更好的泛化性和魯棒性。
應(yīng)用HMM模型來(lái)對(duì)不同駕駛動(dòng)作進(jìn)行統(tǒng)計(jì)學(xué)分析處理,需要首先獲得不同駕駛動(dòng)作的特征向量,進(jìn)而通過(guò)離線的模型訓(xùn)練來(lái)獲得不同駕駛動(dòng)作對(duì)應(yīng)的HMM模型以及閾值模型。實(shí)際車輛行駛過(guò)程中通過(guò)將障礙車輛一段時(shí)間產(chǎn)生的軌跡序列量化為特征向量,輸入到訓(xùn)練好的模型當(dāng)中,并通過(guò)設(shè)計(jì)好的算法判斷后,即可得到最終駕駛動(dòng)作的判斷結(jié)果。
車輛的行駛在時(shí)間序列上是有延續(xù)性的,既通常情況下車輛會(huì)沿著既定的駕駛意圖行駛,短期內(nèi)不會(huì)處于雜亂無(wú)章的運(yùn)動(dòng),因此當(dāng)前時(shí)刻識(shí)別出車輛在一段歷史時(shí)期的駕駛動(dòng)作,即可預(yù)測(cè)車輛在未來(lái)一段時(shí)間內(nèi)的駕駛意圖。應(yīng)用HMM模型進(jìn)行統(tǒng)計(jì)學(xué)的判斷方法,由于其計(jì)算不同可能駕駛動(dòng)作的概率,因此不需要車輛完全執(zhí)行完動(dòng)作,即可判斷其駕駛意圖,如車輛在轉(zhuǎn)彎的初期即可通過(guò)模型判斷出未來(lái)轉(zhuǎn)彎的概率遠(yuǎn)遠(yuǎn)大于繼續(xù)直行的概率。
設(shè)計(jì)HMM 模型λ=( )A,B,π 為經(jīng)典的左右結(jié)構(gòu),如圖6 所示。具體參數(shù)如下:狀態(tài)集數(shù)目為N(設(shè)定為3),觀測(cè)集數(shù)目M(設(shè)定為16),狀態(tài)轉(zhuǎn)移矩陣A 為N·N 的矩陣,輸出概率分布矩陣B 為N·M 的矩陣,初始化向量π為1·N 的向量(根據(jù)不同需要可以進(jìn)行調(diào)整)。為車輛不同的駕駛行為設(shè)計(jì)5 類不同的HMM模型,另外再設(shè)計(jì)一個(gè)閾值模型。其中5 類模型分別為:直行模型、左變道模型、右變道模型、左轉(zhuǎn)彎模型和右轉(zhuǎn)彎模型。閾值模型用于區(qū)分5 類駕駛動(dòng)作和隨機(jī)動(dòng)作(某些不規(guī)則隨機(jī)駕駛動(dòng)作可能引起誤識(shí)別)。
觀測(cè)值由車輛在一定時(shí)間間隔下的行駛方向產(chǎn)生,通過(guò)量化的編碼最終形成觀測(cè)值。車輛在一段時(shí)間內(nèi)從當(dāng)前時(shí)刻位置到前一時(shí)刻位置形成一個(gè)如圖7所示的方向向量,根據(jù)如圖8和圖9的編碼規(guī)則,可以將方向向量量化為1~16的編碼。車輛行駛一段時(shí)間后會(huì)形成一系列的方向編碼,從而組成如圖10所示的方向特征向量。不同的駕駛動(dòng)作會(huì)形成不同的車輛行駛軌跡,經(jīng)過(guò)量化編碼后會(huì)形成不同的方向特征向量,通過(guò)對(duì)方向特征向量的區(qū)分就可以最終得到駕駛動(dòng)作的區(qū)分。
圖6 HMM模型
圖7 方向向量
圖8 角度劃分規(guī)則圖
圖9 向量編碼規(guī)則圖
將不同的駕駛動(dòng)作形成的方向向量進(jìn)行采集和編碼,形成不同駕駛動(dòng)作的訓(xùn)練集,通過(guò)HMM模型訓(xùn)練后,形成5 類駕駛動(dòng)作的HMM 模型(直行HMM 模型、左變道HMM 模型、右變道HMM 模型、左轉(zhuǎn)彎HMM模型和右轉(zhuǎn)彎HMM模型)。本文設(shè)計(jì)了一個(gè)閾值模型用于區(qū)分5類駕駛動(dòng)作和隨機(jī)不規(guī)則的動(dòng)作。
圖10 直行方向特征向量示例
訓(xùn)練階段的具體過(guò)程為:將訓(xùn)練集中的每一個(gè)動(dòng)作序列形成對(duì)應(yīng)的方向特征向量,通過(guò)HMM 的B-W算法進(jìn)行訓(xùn)練得到對(duì)應(yīng)的模型,將所有模型進(jìn)行平均后得到最終此類動(dòng)作對(duì)應(yīng)的HMM模型(如直行HMM模型)。閾值模型通過(guò)結(jié)合5類駕駛動(dòng)作模型的共同信息而生成。單一駕駛動(dòng)作的HMM模型訓(xùn)練過(guò)程如圖11所示,閾值模型的生成過(guò)程如圖12所示。
圖11 單一駕駛動(dòng)作的HMM模型訓(xùn)練
圖12 閾值模型的生成
識(shí)別階段的具體過(guò)程為:通過(guò)讀取傳感器對(duì)障礙車輛的定位信息,一段時(shí)間間隔內(nèi)生成該車輛的軌跡序列,進(jìn)一步生成觀測(cè)值方向特征向量,帶入各個(gè)駕駛動(dòng)作HMM 模型和閾值模型后,選取最大的前向概率對(duì)應(yīng)的動(dòng)作模型,并與閾值模型進(jìn)行比較,最終確認(rèn)駕駛動(dòng)作是否符合5類駕駛動(dòng)作之一或者是不規(guī)則的隨機(jī)動(dòng)作。識(shí)別流程圖如圖13所示。
車輛的行駛在時(shí)間序列上是有延續(xù)性的,既通常情況下車輛會(huì)沿著既定的駕駛意圖行駛,短期內(nèi)不會(huì)處于雜亂無(wú)章的運(yùn)動(dòng),因此當(dāng)前時(shí)刻識(shí)別出車輛在一段歷史時(shí)期的駕駛動(dòng)作,即可預(yù)測(cè)車輛在未來(lái)一段時(shí)間內(nèi)的駕駛意圖。應(yīng)用HMM模型進(jìn)行統(tǒng)計(jì)學(xué)的判斷方法,由于其計(jì)算不同可能駕駛動(dòng)作的概率,因此不需要車輛完全執(zhí)行完動(dòng)作,即可判斷其駕駛意圖,如車輛在轉(zhuǎn)彎的初期即可通過(guò)模型判斷出未來(lái)轉(zhuǎn)彎的概率遠(yuǎn)遠(yuǎn)大于繼續(xù)直行的概率。
圖13 HMM模型的識(shí)別流程
本文提出的障礙物行為預(yù)測(cè)系統(tǒng),可以有效識(shí)別大部分城市道路場(chǎng)景下車輛的行駛意圖,為高級(jí)別自動(dòng)駕駛系統(tǒng)提供行為決策和路徑規(guī)劃的依據(jù),但由于交通環(huán)境的復(fù)雜性,在某些極端情況下,障礙車輛的行為可能會(huì)沒(méi)有常規(guī)的規(guī)律可循,因此用統(tǒng)計(jì)學(xué)的方法來(lái)進(jìn)行預(yù)測(cè)不會(huì)特別準(zhǔn)確,這就需要研究更復(fù)雜、適應(yīng)性更強(qiáng)的技術(shù)來(lái)處理,這也是自動(dòng)駕駛領(lǐng)域車輛行為預(yù)測(cè)的未來(lái)發(fā)展方向。