楊磊
摘 要:【目的】為了能準確識別出他車的切入意圖,同時解決由爆發(fā)性增長的無標簽行車數(shù)據(jù)所引起的識別模型落地難的問題?!痉椒ā勘狙芯刻岢鲆环N雙層無監(jiān)督的車輛切入意圖識別模型,該模型由聚類模塊及意圖識別模塊組成。聚類模塊采用高斯混合模型對基于NGSIM構(gòu)造的無標簽數(shù)據(jù)集進行聚類分析,并挖掘其內(nèi)在的數(shù)據(jù)關(guān)系,從而獲取切入時不同駕駛行為對應(yīng)的特征標簽。意圖識別模塊用于識別車輛切入意圖,該模塊是基于LSTM搭建的。該模塊先結(jié)合聚類模塊來獲取特征標簽及無標簽數(shù)據(jù)集,構(gòu)造新的有標簽訓(xùn)練集及測試集,然后將其輸入到神經(jīng)網(wǎng)絡(luò)中進行訓(xùn)練與測試?!窘Y(jié)果】該模型在基于真實路況的NGSIM數(shù)據(jù)集上表現(xiàn)較好,對駕駛意圖的識別準確率達到97%,精度較高。【結(jié)論】該模型在無標簽數(shù)據(jù)上具有較好的識別能力。
關(guān)鍵詞:自動駕駛;意圖識別;高斯混合模型;長短時記憶神經(jīng)網(wǎng)絡(luò)
中圖分類號:U463? ? ? ? ? ? ? ? ? ? ? 文獻標志碼:A? ? ? ? ? ? ? ? ?文章編號:1003-5168(2023)06-0028-05
DOI:10.19968/j.cnki.hnkj.1003-5168.2023.06.005
Research on Vehicle Entry Intent Recognition Based on GMM-LSTM
YANG Lei
(School of Mechatronics and Vehicle Engineering, Chongqing Jiaotong University,Chongqing 400074,China)
Abstract: [Purposes] In order to accurately identify the cut-in intention of other vehicles and solve the problem of difficult implementing of identification model caused by the explosive growth of unlabeled driving data. [Methods] This study proposes a two-layer unsupervised vehicle cut-in intention recognition model, which consists of a clustering module and an intention recognition module. The clustering module uses the Gaussian mixture model to cluster the unlabeled data set based on NGSIM, and excavates its internal data relationship to obtain the feature labels corresponding to different driving behaviors. The intention recognition module is used to identify the vehicle entry intention, which is based on LSTM. The module first combines the clustering module to obtain feature labels and unlabeled data sets, constructs new labeled training sets and test sets, and then inputs them into the neural network for training and testing. [Findings] The model performed well on the NGSIM dataset based on real road conditions, and the recognition accuracy of driving intention reached 97 %. [Conclusions] The model has good recognition ability on unlabeled data.
Keywords: automatic drive; intent identification; Gaussian mixture models; LSTM
0 引言
他車切入是一種常見的駕駛行為,其對自車的行駛狀態(tài)會產(chǎn)生影響,尤其是在人機混駕的場景中,自動駕駛汽車能否精準高效地識別出他車的切入意圖,是自動駕駛汽車能否實現(xiàn)安全行駛的關(guān)鍵,也是當前自動駕駛汽車研究的熱點之一[1]。
目前,國內(nèi)外對駕駛意圖的識別可大致分為兩類。第一類是通過建立運動學(xué)或動力學(xué)模型來對車輛的駕駛意圖進行識別[2-4]。該類模型對短時駕駛意圖的識別有較高的準確率,而車輛運動是復(fù)雜的非線性過程,高度簡化的運動學(xué)或動力學(xué)模型在識別長時駕駛意圖時,其準確率較低,精度較差。第二類是基于數(shù)據(jù)驅(qū)動的駕駛意圖識別,通常采用機器學(xué)習(xí)或深度學(xué)習(xí)算法來識別駕駛意圖。劉興亮等[5]提出一種基于支持向量機的駕駛意圖識別模型,其在高速公路場景中對目標車輛駕駛意圖識別的準確率較高。劉志強等[6]提出一種基于馬爾科夫及支持向量機的雙層識別模型,在相同場景中,其識別的準確率要優(yōu)于單層模型。張海倫等[7]提出一種基于雙層連續(xù)隱馬爾可夫模型及貝葉斯分類器的識別模型,能在他車切入的前期階段準確識別出其駕駛意圖。上述的傳統(tǒng)機器學(xué)習(xí)模型因其具有較高的準確率、較好的實時性,從而得到研究者的廣泛關(guān)注,但傳統(tǒng)的機器學(xué)習(xí)模型同樣存在高維度場景表現(xiàn)不佳、時序捕捉能力較差、訓(xùn)練參數(shù)難以確定等問題。為了解決上述問題,研究者將目光投向基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,如長短時記憶神經(jīng)網(wǎng)絡(luò)(LSTM)等。
車輛行駛是一連串行為的集合,通常表現(xiàn)為與時間相關(guān)的數(shù)據(jù)序列,而長短時記憶神經(jīng)網(wǎng)絡(luò)能很好地捕捉該類型數(shù)據(jù)內(nèi)部之間的復(fù)雜特征關(guān)系,能精確提取出連續(xù)駕駛行為的時間關(guān)系。因此,其在對他車駕駛意圖識別領(lǐng)域中得到較為廣泛的應(yīng)用。季學(xué)武等[8]、梁凡[9]、閆偉等[10]使用長短時記憶神經(jīng)網(wǎng)絡(luò)來識別其他車輛的駕駛意圖,在不同場景和條件下,對他車駕駛意圖有較高的識別準確率。同時,考慮到人工標注的困難及對數(shù)據(jù)錯標帶來的誤差,以聚類算法為代表的無監(jiān)督學(xué)習(xí)方法在駕駛意圖識別中的應(yīng)用得到重視[11-13]。因此,本研究結(jié)合無監(jiān)督學(xué)習(xí)的高斯混合模型(GMM)及長短記憶神經(jīng)網(wǎng)絡(luò)(LSTM),建立一種基于NGSIM數(shù)據(jù)集的無監(jiān)督駕駛意圖識模型,從而實現(xiàn)快速高效地識別出他車的切入意圖。
1 數(shù)據(jù)預(yù)處理及參數(shù)提取
車輛在直線道路上行駛時,通常有車道保持和車輛切入兩類行為,如圖1所示。在圖1中,R為自車,T為自車的左前車,S為自車的右前車。當車輛正常直線行駛時,其橫向運動只會發(fā)生較小的變化,沒有太大的行為波動。而在車輛切入他道的過程中,其橫向運動會出現(xiàn)較為明顯的變化趨勢。因此,為了區(qū)分車輛行為是直線行駛、左切入、右切入這三種行為的哪一種,用其橫向上的運動變化趨勢進行表征,可用其橫向運動變化的相關(guān)物理量的波動來表示駕駛行為的變化。
車輛的切入意圖是一連串駕駛行為的集合。一次完整的切入意圖是由大量的軌跡數(shù)據(jù)點構(gòu)成的,而選擇合理的數(shù)據(jù)點特征決定了模型的準確率??紤]到橫向物理量的多樣性,本研究選擇具有特征變化明顯的側(cè)向速度和側(cè)向位移作為對應(yīng)軌跡點的特征參數(shù)。因此,先從NGSIM數(shù)據(jù)集中提取以這兩種參數(shù)為特征參數(shù)構(gòu)成的軌跡簇。NGSIM數(shù)據(jù)集是由美國FHWA搜集的高速公路行車數(shù)據(jù),包含US101、I-80等道路上的所有車輛在一個時間段內(nèi)的車輛行駛狀況,其對應(yīng)的路段如圖2所示。
由于該數(shù)據(jù)集包含的數(shù)據(jù)量龐大、參數(shù)較多,因此要對數(shù)據(jù)進行預(yù)處理。先從數(shù)據(jù)集中的單條換道軌跡中提取出一條完整軌跡,由于一次完整的車輛切入行為通常是在5 s內(nèi)完成的,因此提取目標為車輛在20 s內(nèi)的完整行駛軌跡,然后利用滑動時窗將行駛軌跡切分成以5 s為基本單位的行為序列集合。
對數(shù)據(jù)集中的單條切入軌跡,要提取切入起始點及該時刻對應(yīng)的特征參數(shù)。為了避免車輛橫向位移的細微變化對切入起始點的干擾,以側(cè)向位移和行駛軌跡的曲率作為車輛是否切入的判斷標準。對單次完整的切入過程,其切入的起點、終點處的橫向位移和軌跡曲率的計算見式(1)。
式中:y(n)為車輛切入起點處的橫向位置;y(n+t)為車輛切入終點處的橫向位置,二者之差即為車輛在切入過程中的側(cè)向位移,結(jié)合真實的切入過程,本研究以側(cè)向位移等于車道寬作為切入結(jié)束的衡量標準之一;t為切入時間;L為車道寬度,在NGSIM數(shù)據(jù)集中,車道寬為3.75 m;w為補償值,考慮到測量誤差等多種因素的影響,可能出現(xiàn)軌跡曲率皆為0的情況,側(cè)向位移偏離車道寬的情況,進而影響數(shù)據(jù)的抓取,此時要對側(cè)向位移進行補償;θ(n)為車輛位于切入起點時車輛的行駛軌跡曲率;θ(n+t)為車輛位于切入終點時車輛的行駛軌跡曲率。當起點與終點的行駛軌跡曲率相等時,可認為車輛停止切入,并進入目標車道,開始直線行駛,二者是否都為0也是切入結(jié)束與否的衡量標準之一。
通過公式(1)可限制切入過程中起始點、終止點處的橫向位移和軌跡曲率,并根據(jù)限制對軌跡數(shù)據(jù)進行分類,左右切入序列的始末位置是根據(jù)橫向坐標來確定的。本研究從NGSIM數(shù)據(jù)集中共提取到左切入軌跡101條、右切入軌跡288條、直線行駛軌跡437條。
在獲取到行駛軌跡簇后,考慮到數(shù)據(jù)樣本序列過長會導(dǎo)致模型的訓(xùn)練難度加大,因此要對20 s的完整行駛軌跡進行切分,最終完成數(shù)據(jù)集的構(gòu)建,并按7:3的比例將數(shù)據(jù)集劃分成訓(xùn)練集及測試集,從而完成數(shù)據(jù)集的構(gòu)建準備工作,并開始下一步的模型搭建工作。
2 切入意圖識別模型
2.1 高斯混合模型的搭建
高斯混合模型是一種無監(jiān)督的聚類模型,其能很好地捕捉到數(shù)據(jù)隱藏的關(guān)聯(lián)性,可將無標簽的數(shù)據(jù)根據(jù)其內(nèi)在的相互關(guān)聯(lián)特征劃分為不同的類別簇。
由于行駛軌跡是由連續(xù)的軌跡點構(gòu)成的,因此高斯混合模型聚類的對象是行駛軌跡中的一系列軌跡點。在聚類前,先對數(shù)據(jù)集中的相關(guān)軌跡點進行可視化處理,如圖3所示。
由圖3可知,三種行駛軌跡存在軌跡點重疊的情況。采用高斯混合模型,一方面是為了給無監(jiān)督數(shù)據(jù)添加標簽,另一方面也是為了識別這些重疊的軌跡點屬于哪種行駛狀態(tài),從而降低人工標注的成本,提高數(shù)據(jù)的準確率。
在使用高斯混合模型對數(shù)據(jù)進行聚類前,先要選取高斯混合模型對應(yīng)的k值數(shù),即高斯模型的個數(shù),k的取值將直接影響最終的聚類效果。為了保證模型的精確性,本研究采用貝葉斯信息準則來確定k值的大小。
貝葉斯信息準則是統(tǒng)計學(xué)中常用的模型選擇方法,其能在有限的階數(shù)范圍內(nèi)找出相對最優(yōu)的擬合模型,貝葉斯信息判據(jù)值隨高斯混合數(shù)目的變化情況如圖4所示。由圖4可知,當k=3或4時,高斯混合模型的貝葉斯信息判據(jù)值處于兩個較為明顯的區(qū)分范圍。所以,本研究GMM的模型數(shù)初步選擇為3或4,而具體的模型選取數(shù)要根據(jù)實際的識別效果來確定。
先選取k=3,對數(shù)據(jù)進行聚類,效果如圖5所示。
由圖5可知,當k=3時,高斯混合模型能很好地將軌跡點聚類到各個數(shù)據(jù)簇中,聚類結(jié)果能很好地符合對數(shù)據(jù)集中三種行駛軌跡數(shù)據(jù)特性的認知。因此,本研究選取k=3作為高斯混合模型中高斯模型的個數(shù),其對應(yīng)的聚類結(jié)果作為下一步識別模型的標簽與數(shù)據(jù)集,一起輸入到有監(jiān)督學(xué)習(xí)的LSTM模型中,從而實現(xiàn)對切入意圖的識別。
2.2 LSTM參數(shù)的選取及訓(xùn)練
LSTM是一種處理時序數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),其能很好地捕捉數(shù)據(jù)在時間上的內(nèi)在關(guān)系,因此其在以時序數(shù)據(jù)為主的行駛軌跡數(shù)據(jù)中具有較好的特征捕捉能力,可用來識別他車的切入意圖,常見的LSTM模型如圖6所示。
在圖6中,xt為t時刻輸入模型的數(shù)據(jù)向量。LSTM模型在接收到該數(shù)據(jù)后,結(jié)合上一時刻的細胞狀態(tài)Ct-1及上一時刻的輸出ht-1,對神經(jīng)網(wǎng)絡(luò)參數(shù)進行更新,然后輸出當前時刻的細胞狀態(tài)Ct及當前網(wǎng)絡(luò)的輸出ht,該輸出通過激活函數(shù)可計算得到與xt對應(yīng)的輸出yt。而Ct、ht下一刻的輸入xt+1將被輸入到模型中,從而獲取下一時刻的參數(shù),以此類推,循環(huán)計算,從而完成對時序關(guān)系的捕捉。
在本研究所采用的LSTM網(wǎng)絡(luò)包含隱藏層、輸入層、輸出層,隱藏層單元數(shù)設(shè)置為100,丟失率設(shè)置為0.5,最大迭代次數(shù)為50,每次樣本輸入50批數(shù)據(jù),初始學(xué)習(xí)率設(shè)置為0.01。部分訓(xùn)練過程如圖7所示。
由圖7可知,LSTM模型在訓(xùn)練過程中的損失率在3%左右,準確率維持在97%上下,這說明LSTM模型在該訓(xùn)練集上的表現(xiàn)較好。而為了驗證LSTM模型能否對未見過的數(shù)據(jù)進行識別,可用訓(xùn)練好的模型去識別測試集中的數(shù)據(jù),識別結(jié)果的混淆矩陣如圖8所示。
由圖8可知,LSTM模型在測試集上的性能也較為優(yōu)異,在識別左切入(標簽1)時,能準確辨識出1 154組數(shù)據(jù),準確率達96.0%。在識別右切入(標簽2)時,能準確辨識出1 450組數(shù)據(jù),準確率達97.1%。在識別直線行駛(標簽3)時,能準確辨識出3 714組數(shù)據(jù),準確率達98.1%。在對測試集數(shù)據(jù)進行識別時,能準確識別出6 318組數(shù)據(jù)(總數(shù)組為6 480組),總體識別準確率為97.5%。這說明該模型的總體表現(xiàn)符合本研究的預(yù)期。
3 結(jié)論
為了能準確認別他車切入意圖,本研究提出高斯混合與長短時神經(jīng)網(wǎng)絡(luò)的雙層模型,其在基于真實路況的NGSIM數(shù)據(jù)集上具有較為優(yōu)秀的表現(xiàn),模型識別的準確率較高,能有效識別出他車的切入意圖,為自動駕駛汽車的行為決策提供參考。
參考文獻:
[1]WANG X S,YANG M M.Cut-in behavior analyses based on naturalistic driving data[J].Journal of Tongji University(Natural ence),2018(8):1057-1063.
[2]WISSING C,NATTERMANN T,GLANDER K H,et al.Lane change prediction by combining movement and situation based probabilities[J].Ifac Papersonline,2017(1):3554-3559.
[3]XIAO W,ZHANG L J,MENG D J.Vehicle Trajectory prediction based on motion model and maneuver model fusion with interactive multiple models[J].SAE International Journal of Advances and Current Practices in Mobility,2020(6):3060-3071.
[4]沈航先.車輛換道意圖識別和軌跡預(yù)測模型研究[D].哈爾濱:東北林業(yè)大學(xué),2021.
[5]劉興亮,朱西產(chǎn),李霖,等.基于支持向量機的駕駛意圖識別[C]//Infats Proceedings of the 12th International Forum of Automotive Traffic Safety,2015:157-163.
[6]劉志強,吳雪剛,倪捷,等.基于HMM和SVM級聯(lián)算法的駕駛意圖識別[J].汽車工程,2018(7):858-864.
[7]張海倫,付銳.高速場景相鄰前車駕駛行為識別及意圖預(yù)測[J].交通運輸系統(tǒng)工程與信息,2020(1):40-46.
[8]季學(xué)武, 費聰, 何祥坤,等.基于LSTM網(wǎng)絡(luò)的駕駛意圖識別及車輛軌跡預(yù)測[J].中國公路學(xué)報, 2019(6):34-42.
[9]梁凡.基于LSTM網(wǎng)絡(luò)的自動駕駛意圖識別研究[D].烏魯木齊:新疆大學(xué),2020.
[10]閆偉,胥凌志,李嘉頎,等.基于大數(shù)據(jù)的汽車駕駛員駕駛意圖識別分析[J].農(nóng)業(yè)裝備與車輛工程,2022(8):1-5.
[11]嚴利鑫,賀宜,糜子越,等.考慮生理特性的駕駛行為險態(tài)辨識研究[J].交通信息與安全,2019(3):12-19,27.
[12]劉思源,喻偉,劉潔瑩,等.考慮駕駛風(fēng)格的車輛換道行為及預(yù)測模型[J].長沙理工大學(xué)學(xué)報(自然科學(xué)版),2019(1):28-35.
[13]李儲巖.基于K-means算法的駕駛行為分析研究[D].哈爾濱:哈爾濱工程大學(xué),2020.