張 昆,浦同林,張倩兮,聶枝根
(昆明理工大學(xué)交通工程學(xué)院,昆明 650500)
行為決策模塊是智能網(wǎng)聯(lián)汽車在復(fù)雜、動態(tài)的交通環(huán)境中安全行駛的關(guān)鍵,能夠更安全、有效地實(shí)現(xiàn)駕駛意圖[1]。換道行為是車輛行駛過程中最為常見的行為,分為自由換道[2]、協(xié)同換道[3]和強(qiáng)制換道[4],相比于車道保持行為而言,具有更高的風(fēng)險(xiǎn)。智能網(wǎng)聯(lián)汽車根據(jù)交通規(guī)則和其他交通參與者的運(yùn)動狀態(tài)做出換道或保持車道的行為決策,如果在換道條件不滿足的情況下執(zhí)行換道,將嚴(yán)重影響交通安全,因此,準(zhǔn)確的換道決策對于交通安全至關(guān)重要。
目前,針對車輛換道決策的研究已有較多成果,Gipps等[5]最早對換道行為進(jìn)行建模,從換道必要、意向和安全三方面分析,提出了一種基于規(guī)則的換道決策方法,但難以確定模型的參數(shù)。隨著人工智能技術(shù)的進(jìn)步,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)被廣泛應(yīng)用于換道行為決策[6-10]。Motamedidehkordi等[11]提出傳統(tǒng)的規(guī)則模型不能精確地表示駕駛員在換道決策時(shí)考慮的諸多因素,提出了基于隨機(jī)森林(Random Forest,RF)的換道決策模型,其具有良好的預(yù)測精度。鄧建華等[12]分析了駕駛員換道決策的內(nèi)外因子,引入基于換道決策機(jī)理的多車道元胞自動機(jī)模型,其在不同的V/C條件下均具有良好的適應(yīng)性。徐兵等[13]分析了換道場景中各特征變量與換道決策之間的關(guān)系,提出了基于梯度提升決策樹(gradient boosting decision tree,GBDT)換道決策模型,引入新的特征變量,提高了決策模型的預(yù)測性能。賈寒冰等[14]針對智能車輛在道路上的換道決策問題,利用新增的特征變量增廣原訓(xùn)練集,提高了模型預(yù)測準(zhǔn)確率。Lopez等[15]提出了結(jié)合深度學(xué)習(xí)與博弈論的換道決策算法,設(shè)計(jì)了智能算法調(diào)整博弈參數(shù),可快速、可靠地進(jìn)行決策。Feng等[16]在給定相對位置和速度信息的情況下,通過綜合考慮時(shí)空分布、交通規(guī)則等因素,建立了基于時(shí)空間隙的換道決策模型。Feng等[17]針對不同的換道工況,從車輛的物理特性、交互感知和道路結(jié)構(gòu)三方面選取特征變量,以此建立換道決策模型。Peng等[18]采用雙層深度強(qiáng)化學(xué)習(xí)算法對狀態(tài)空間進(jìn)行處理,使用D3QN算法分析場景中潛在的換道價(jià)值并進(jìn)行決策。張羽翔等[19]通過強(qiáng)化學(xué)習(xí)來求解車道變換過程中的精確決策參數(shù),從而提高安全性能,并可在變道場景中模仿真實(shí)的駕駛行為。
目前,關(guān)于智能網(wǎng)聯(lián)汽車自由換道決策的研究較少,且預(yù)測精度較低,在復(fù)雜多變的交通環(huán)境下,如何安全、準(zhǔn)確地做出換道決策,還有待進(jìn)一步研究。因此,在上述研究的基礎(chǔ)上,引入一種基于換道場景與決策規(guī)則的智能網(wǎng)聯(lián)汽車換道決策模型,進(jìn)一步提升模型訓(xùn)練分類的準(zhǔn)確率。本文的主要工作如下:
1)對NGSIM數(shù)據(jù)集進(jìn)行濾波,提取了真實(shí)駕駛環(huán)境下的換道數(shù)據(jù),包括自車和周圍車輛的行駛狀態(tài)變量。
2)NGSIM數(shù)據(jù)集存在樣本數(shù)量過少、目標(biāo)數(shù)據(jù)提取繁瑣、數(shù)據(jù)質(zhì)量不佳等問題,根據(jù)NGSIM的狀態(tài)變量提取原則,建立了樣本容量更大、換道特征變量取值更為直觀準(zhǔn)確、符合真實(shí)駕駛場景的換道場景數(shù)據(jù)集,擴(kuò)充了NGSIM 換道場景數(shù)據(jù)集。
3)建立了基于決策規(guī)則的自由換道決策模型,從換道安全、換道收益、換道必要性3個(gè)方面分析了換道行為決策,將決策規(guī)則用于換道場景數(shù)據(jù)集,得出正負(fù)樣本。
4)將換道場景數(shù)據(jù)集與從NGSIM數(shù)據(jù)集中提取出的換道樣本融合,基于貝葉斯優(yōu)化核函數(shù)的支持向量機(jī)模型對數(shù)據(jù)集進(jìn)行訓(xùn)練分類,對不同樣本容量和不同機(jī)器學(xué)習(xí)模型的訓(xùn)練結(jié)果進(jìn)行了對比分析。
NGSIM US-101和I-80車輛軌跡數(shù)據(jù)被廣泛應(yīng)用于車輛換道行為研究[20]。該數(shù)據(jù)集通過視頻分析得到車輛的位置、速度、加速度等狀態(tài)信息,存在一定的噪聲,本文中使用滑動平均濾波方法[21]對原始數(shù)據(jù)進(jìn)行處理,之后對數(shù)據(jù)集中的自由換道數(shù)據(jù)進(jìn)行提取,根據(jù)文獻(xiàn)[7-9]對換道決策過程的分析提取規(guī)則。具體規(guī)則如下:
1)NGSIM數(shù)據(jù)集中包含多種車輛類型,包括摩托車、商用車、乘用車等,由于換道方式及動力學(xué)特性的差異和本文中的決策模型主要針對乘用車,因此僅保留乘用車數(shù)據(jù)。
2)數(shù)據(jù)集包含6條車道,第6車道為匯入匝道,本文中研究的內(nèi)容為自由換道,不考慮匝道匯入的強(qiáng)制換道行為,故不考慮第6車道的換道行為。
3)換道車輛換道意圖開始時(shí)刻前、后4 s內(nèi)車輛的狀態(tài)能夠較好地覆蓋整個(gè)換道過程[22],最終選?。踭0-4,t0+1]時(shí)間段內(nèi)的狀態(tài)信息,其中t0為換道初始時(shí)刻。
4)換道初始時(shí)刻t0的提取尤為重要,將橫向速度大于0.2 m/s的時(shí)刻作為t0[23],數(shù)據(jù)集中存在橫向速度波動但未進(jìn)行換道操作的數(shù)據(jù),采集[t0,t0+1]]時(shí)間段內(nèi)的數(shù)據(jù),提取橫向速度大于0.2 m/s且1 s后橫向位移大于0.3 m的數(shù)據(jù)作為換道數(shù)據(jù),同時(shí)剔除連續(xù)換道數(shù)據(jù)。
5)提取出的換道數(shù)據(jù)為正樣本,記為+1,未換道數(shù)據(jù)為負(fù)樣本,記為-1。
按照上述規(guī)則提取數(shù)據(jù)后,提取出529條換道數(shù)據(jù)和870條未換道數(shù)據(jù)。
車輛的自由換道行為涉及周圍車輛的運(yùn)動狀態(tài),換道決策需要考慮各種交通因素的影響,不考慮彎道換道行為,建立兩車道直道自由換道模型,道路分為初始車道和目標(biāo)車道,交通環(huán)境包含換道車輛SV,初始車道前車PV,目標(biāo)車道前車TP和目標(biāo)車道后車TF,如圖1所示。
圖1 換道場景示意圖
對能從NGSIM數(shù)據(jù)集中直接獲得的原始狀態(tài)變量(位置、速度、加速度等)進(jìn)行處理,得到反映各車相互關(guān)系的狀態(tài)變量,并進(jìn)行編號:
1)vSV:換道車輛的速度;
2)ΔvPV=vPV-vSV:初始車道前車與換道車輛速度差;
3)ΔvTP=vTP-vSV:目標(biāo)車道前車與換道車輛速度差;
4)ΔvTF=vSV-vTF:目標(biāo)車道后車與換道車輛速度差;
5)SPV:初始車道前車與換道車輛車距;
6)STP:目標(biāo)車道前車與換道車輛車距;
7)STF:目標(biāo)車道后車與換道車輛車距;
8)ΔaPV=aPV-aSV:初始車道前車與換道車輛加速度差;
9)ΔaTP=aTP-aSV:目標(biāo)車道前車與換道車輛加速度差;
10)ΔaTF=aSV-aTF:目標(biāo)車道后車與換道車輛加速度差。
這些特征變量反映了在換道初始時(shí)刻交通場景中各車輛的相互關(guān)系,忽略了換道之后的交通行駛狀況對自由換道決策的影響,引入新的特征變量:
11)vdesired:換道車輛的期望車速,在NGSIM數(shù)據(jù)集中的提取規(guī)則為換道車輛在[tf-2,tf+2]時(shí)間段內(nèi)的平均車速,tf為換道終止時(shí)刻;
12)ΔS=STP-SPV:換道前后換道車輛與前車的車距變化。
在提取出特征變量后,從互信息(mutual information,MI)的觀點(diǎn)出發(fā),在NGSIM數(shù)據(jù)集中研究各特征變量與換道決策之間的關(guān)系[24]。互信息表示為:
式中:p(a,b)為聯(lián)合分布,p(a)、p(b)為邊緣分布。
最大信息系數(shù)(maximal information coefficient,MIC)[25]是互信息在一定條件下的估值,利用互信息和網(wǎng)格劃分方法計(jì)算[26],用于衡量變量間相互依存的程度,能夠較好地表現(xiàn)特征變量間的線性和非線性關(guān)系,具有優(yōu)異的普適性。MIC計(jì)算公式如下:
式中:x、y為劃分網(wǎng)格的數(shù)量,B為網(wǎng)格劃分的上限值。
圖2展現(xiàn)了各特征變量與換道結(jié)果的MIC數(shù)值。
圖2 特征變量與換道結(jié)果的MIC值
換道車輛SV自身的行駛狀態(tài)及周圍車輛的行駛狀態(tài)都將影響SV是否換道,基于上文評估出的MIC值較高的特征變量,從換道安全、換道收益和換道必要性3個(gè)方面建立換道決策模型[27]。
車輛換道的前提是保證換道過程的安全性,不與其他車輛發(fā)生碰撞。換道車輛SV在換道過程中與PV、TP及TF皆存在碰撞風(fēng)險(xiǎn),換道安全性體現(xiàn)為換道車輛與環(huán)境中其他車輛的距離及速度差,因此引入碰撞時(shí)間(time to collision,TTC)來表示換道安全性。
安全換道的條件為換道車輛與環(huán)境中其他車輛的碰撞時(shí)間都大于最小換道時(shí)間,在車距較小且速度差較小的工況下,碰撞時(shí)間同樣大于閾值,此外,安全換道需要最小安全車距,由此建立安全模型。
車輛換道的目的在于獲得更高的行駛車速或與前后車更大的行駛車距,換道車輛在換道前后都與其所在車道的前車保持跟馳關(guān)系,換道車輛SV在初始車道所能達(dá)到的最大車速為vPV,在目標(biāo)車道所能達(dá)到的最大車速為vTP,由此建立換道收益函數(shù),速度收益表示為
式中:vdesired為換道車輛期望的行駛車速,vdesiredvPV為期望速度收益,vTP-vPV為實(shí)際速度收益。
目標(biāo)車道的更快的行駛車速和更大的行駛空間促使駕駛員產(chǎn)生換道動機(jī),空間收益表示為
由此,換道收益模型建立為
換道車輛與初始車道前車的行駛狀況決定了換道必要性,車距越小、速度差越小,換道必要性越大,此外,當(dāng)滿足了換道安全和收益條件,但車距相當(dāng)大時(shí),仍進(jìn)行換道操作會導(dǎo)致車輛頻繁換道,增加換道風(fēng)險(xiǎn),因此,引入車頭時(shí)距(time headway,THW)表示換道必要性:
蕭飛羽收回目光咽了一口唾沫,他緩緩?fù)苿愉摥h(huán)沉吟了好一會才道:“我如同懸崖走馬,稍微的變故都會草木皆兵,所以昨夜見你在門前徘徊我并沒有感知?dú)C(jī)也猝然出手?!彼p描淡寫地告訴柳含煙安和莊與黑旗會漢口分壇起爭端,因?yàn)樗幌胱屚馊酥獣裕植粌H僅有人知道她被囚禁在黑旗會漢口分壇,所以她指認(rèn)這里是安和莊就只有留下她。他歉疚地道:“昨天你要見我,我想不出是什么原因,可我實(shí)在不想見你,因?yàn)槌舜饝?yīng)你在后院可以像在家里一樣自由我不能答應(yīng)你任何要求。稍安勿躁,如果沒有意外,短則數(shù)月,長則一載就會還你自由?!?/p>
式中:tTHW為車頭時(shí)距。
NGSIM數(shù)據(jù)集采樣時(shí)間短,存在噪聲,不同的濾波方法對狀態(tài)信息的處理效果不同,不同的換道數(shù)據(jù)提取規(guī)則提取出的數(shù)據(jù)不同,且符合換道訓(xùn)練集標(biāo)準(zhǔn)的樣本量偏少,對于非換道樣本的目標(biāo)數(shù)據(jù)提取,從車道保持?jǐn)?shù)據(jù)中隨機(jī)選取時(shí)長為4 s的軌跡作為目標(biāo)數(shù)據(jù)[23],且正負(fù)樣本比例固定,這些因素都會影響模型的分類效果。
在已有換道決策研究的基礎(chǔ)上,建立換道場景數(shù)據(jù)集。建立數(shù)據(jù)集選取的特征變量應(yīng)是能從NGSIM數(shù)據(jù)集中可獲得的,訓(xùn)練集的建立原則為
1)在[t0-5,t0+1]時(shí)間段內(nèi),交通環(huán)境中同車道前后車無碰撞風(fēng)險(xiǎn)。
2)交通環(huán)境中的車輛前后車之間保持跟馳關(guān)系,但又存在隨機(jī)性。
3)假設(shè)周圍車輛PV、TP、TF保持直道行駛,不考慮其換道行為。
4)換道車輛在t0時(shí)刻的期望速度總是大于當(dāng)前速度。
換道場景選取的特征變量在t0-4時(shí)刻的取值范圍如表1所示。
在所設(shè)定的取值區(qū)間內(nèi)產(chǎn)生n個(gè)均勻分布的數(shù)據(jù),產(chǎn)生維度為[n×j]的矩陣,矩陣的一行即為一組隨機(jī)組合的換道場景數(shù)據(jù),以此模擬復(fù)雜多變的交通環(huán)境。將決策模型應(yīng)用到所建立的訓(xùn)練數(shù)據(jù)集中,得出[n×1]的列向量作為訓(xùn)練集的決策結(jié)果,+1為換道,-1為保持當(dāng)前車道,由此換道場景數(shù)據(jù)集建立完成。
智能網(wǎng)聯(lián)汽車的自由換道決策是一個(gè)典型的二分類問題,支持向量機(jī)(support vector machine,SVM)是一個(gè)經(jīng)典的二分類算法[28],其能找到的分割超平面具有更好的魯棒性,這個(gè)超平面可以將數(shù)據(jù)集分割為換道和不換道2個(gè)部分。
式中:D為數(shù)據(jù)集合;{(xi,yi)},i=1,2,3,…,n為訓(xùn)練樣本,其中xi為輸入特征變量,即換道決策模型中的特征參數(shù),n為樣本個(gè)數(shù);yi={+1,-1}為樣本類別,+1記為換道,-1記為不換道。分割數(shù)據(jù)集的超平面可表示為
式中:ωT為超平面的法向量,是可調(diào)的權(quán)值向量,決定了超平面的方向;b為偏置量,是超平面和坐標(biāo)原點(diǎn)間的距離;數(shù)據(jù)集D中每個(gè)樣本xi到分割超平面的距離γi為
間隔γ定義為2個(gè)異類的支持向量到超平面的距離之和:
支持向量機(jī)的目標(biāo)就是尋找一個(gè)超平面使得間隔γ最大,將式(13)改寫為凸優(yōu)化問題,故模型的求解轉(zhuǎn)化為
線性支持向量機(jī)難以處理車輛自由換道決策這樣的非線性問題,使用核函數(shù)將樣本從原始特征空間映射到更高維的空間,解決原始特征空間中的線性不可分問題。由于支持向量機(jī)的約束條件比較嚴(yán)格,為了容忍部分不滿足約束的樣本,引入松弛變量ξ,模型的求解轉(zhuǎn)化為
式中:常數(shù)C>0為超參數(shù),是用來控制間隔和松弛變量懲罰平衡的參數(shù)。使用拉格朗日乘數(shù)法,得到式(16)的對偶形式:
式中:λi為拉格朗日乘數(shù);κ(xi,yj)為核函數(shù),選取最為常用的高斯核函數(shù):
式中:σ為高斯核的帶寬,σ的數(shù)值越小,判別條件越嚴(yán)苛,這樣確保和高精度,但很容易導(dǎo)致過擬合,反之σ的數(shù)值越大,易導(dǎo)致欠擬合。
支持向量的分類性能很大程度上受到超參數(shù)C和帶寬σ的影響,需要對超參數(shù)進(jìn)行優(yōu)化以得到最優(yōu)的分類效果。常用的超參數(shù)優(yōu)化方法有貝葉斯優(yōu)化 (Bayesian optimization Algorithm,BOA)[29]、網(wǎng)格搜索[30]和隨機(jī)搜索[31]。網(wǎng)格搜索十分消耗計(jì)算資源,隨機(jī)搜索雖然搜索速度快,但容易忽略某些信息的影響,因此本文中使用BOA優(yōu)化超參數(shù),假設(shè)超參數(shù)優(yōu)化的函數(shù)f(x)=f(C,σ)服從高斯分布,作為代理模型:
以期望改善函數(shù)(expected improvement,EI)作為采集函數(shù)來決定輸出下一個(gè)采集點(diǎn):
式中:xnext為下次迭代的最佳采樣點(diǎn),xbest為當(dāng)前已有樣本中的最優(yōu)值。貝葉斯優(yōu)化算法的框架如表2所示。
表2 貝葉斯優(yōu)化算法
訓(xùn)練集中不同的特征變量有著不同的取值范圍和量綱,為了減小對模型訓(xùn)練過程產(chǎn)生的影響,使用Max-Abs歸一法對數(shù)據(jù)進(jìn)行歸一化處理,使特征變量的取值范圍變?yōu)椋郏?,1],數(shù)據(jù)歸一化公式為
式中:z′為歸一化處理后的特征變量,z為原始特征變量,max為數(shù)據(jù)集中該特征變量的最大值。將換道決策模型應(yīng)用到所建立的n條換道場景數(shù)據(jù)集中,得出結(jié)果1記為換道,-1記為保持當(dāng)前車道,與從NGSIM數(shù)據(jù)集中提取出的500條換道樣本一同組成樣本容量為n+500條樣本數(shù)據(jù),從樣本數(shù)據(jù)中隨機(jī)抽取75%作為機(jī)器學(xué)習(xí)模型的訓(xùn)練集,25%為驗(yàn)證集,本文中的方法框架如圖3所示。
圖3 研究方法框架示意圖
為了驗(yàn)證換道決策規(guī)則的有效性與換道場景數(shù)據(jù)集模擬真實(shí)駕駛環(huán)境的能力,對比換道場景數(shù)據(jù)集與NGSIM數(shù)據(jù)集的相似度[32]。將決策規(guī)則用于換道場景數(shù)據(jù)集中,隨機(jī)抽取529條換道數(shù)據(jù),換道場景數(shù)據(jù)集特征變量矩陣A∈Rp×q,NGSIM數(shù)據(jù)集特征變量矩陣B∈Rp×q:
式中:p=1∶529為樣本容量,q=1∶12為特征變量編號。
若存在矩陣C∈Rp×q和D∈Rp×q,使得B=CAD,則表明B包含于A中,同理,若存在矩陣E∈Rp×q和F∈Rp×q,使得A=EBF,則表明A包含于B中,但在實(shí)際情況中,不存在B完全包含于A或A完全包含于B的情況,通過在線性變換過程中的信息損失來衡量2個(gè)數(shù)據(jù)集的相似度,隨機(jī)初始化C、D、E、F,由此變?yōu)閮?yōu)化問題:
將結(jié)果映射到[0,1]中,得到2個(gè)數(shù)據(jù)集的相似度:
對于換道數(shù)據(jù),2個(gè)數(shù)據(jù)集的相似度為0.911 2,同理得出車道保持?jǐn)?shù)據(jù),相似度為0.905 5,表明決策規(guī)則符合駕駛?cè)说臎Q策習(xí)慣,具有擬人性,換道場景數(shù)據(jù)集能夠有效地模擬真實(shí)的換道駕駛場景。
換道場景數(shù)據(jù)集的樣本容量n過大會使各特征變量數(shù)值差距較小,同時(shí)也增加決策模型運(yùn)算量,將不同樣本容量的數(shù)據(jù)集得到的訓(xùn)練效果進(jìn)行對比,驗(yàn)證不同樣本容量對分類效果的影響。設(shè)置不同的換道場景數(shù)據(jù)集樣本容量,n=500、1 000、1 500、2 000,同一樣本容量下分別進(jìn)行10組試驗(yàn),表3為支持向量機(jī)訓(xùn)練結(jié)果,包括換道場景數(shù)據(jù)集的模型參數(shù)及加入NGSIM換道數(shù)據(jù)后的預(yù)測準(zhǔn)確率。可以看出,換道場景數(shù)據(jù)集不同的樣本容量的訓(xùn)練結(jié)果平均準(zhǔn)確率均高于90%,所建立的換道場景數(shù)據(jù)集能較好地模擬真實(shí)的換道場景,所提出的換道決策模型符合真實(shí)駕駛員的換道操作和行為決策特性,n=1 500,總樣本容量為2 000的數(shù)據(jù)集訓(xùn)練效果最佳。
表3 不同樣本容量訓(xùn)練分類結(jié)果
在不同樣本容量的10組試驗(yàn)中抽取1組,圖4為不同樣本容量數(shù)據(jù)集的迭代優(yōu)化結(jié)果,AUC為接受者操作特性曲線(receiver operating characteristic curve,ROC)的線下面積,i為迭代次數(shù)。可以看出,不同樣本容量的數(shù)據(jù)集在迭代后的AUC值均接近于1,最高值為0.99,總樣本容量為2 000的數(shù)據(jù)集訓(xùn)練效果最佳。
AUC值是評價(jià)二分類模型優(yōu)劣的評價(jià)指標(biāo)之一,還需從量化指標(biāo)方面進(jìn)一步評價(jià)機(jī)器學(xué)習(xí)模型的訓(xùn)練效果,采用正確率(accuracy,ACC),真正類率(true positive rate,TPR),真負(fù)類率(true negative rate,TNR)評估模型的訓(xùn)練效果。
式中:TP為實(shí)例是正類,被預(yù)測為正類的樣本數(shù);TN為實(shí)例是負(fù)類,被預(yù)測為負(fù)類的樣本數(shù);FP為實(shí)例為負(fù)類,被預(yù)測為正類的樣本數(shù);FN為實(shí)例為正類,被預(yù)測為負(fù)類的樣本。
正確率ACC是被分類正確的樣本數(shù)占總樣本數(shù)的比率,體現(xiàn)了模型對整個(gè)數(shù)據(jù)集的分類能力;真正類率TPR是將為正類的實(shí)例預(yù)測為正類的比率,即將換道預(yù)測為換道;真負(fù)類率TNR是將為負(fù)類的實(shí)例預(yù)測為負(fù)類的比率,即將保持當(dāng)前車道預(yù)測為保持當(dāng)前車道。換道行為決策受交通環(huán)境中其他車輛的影響,將保持當(dāng)前車道預(yù)測為換道相比于將換道預(yù)測為保持當(dāng)前車道存在更大的危險(xiǎn),因此,換道決策模型在具有較高的正確率的同時(shí)應(yīng)具有較高的真負(fù)類率。
利用換道規(guī)則模型對換道行為進(jìn)行決策,需要對比規(guī)則模型在換道場景數(shù)據(jù)集和NGSIM數(shù)據(jù)集上的訓(xùn)練效果,驗(yàn)證換道規(guī)則模型和新特征變量的影響。訓(xùn)練結(jié)果如表4所示。從表4可以看出,相比于原始變量77.80%的預(yù)測正確率,換道規(guī)則模型在NGSIM數(shù)據(jù)集上能取得較好的訓(xùn)練效果,正確率為92.60%,在換道場景數(shù)據(jù)集中獲得了最佳的分類效果,表明換道規(guī)則模型能夠大幅提高換道決策的準(zhǔn)確率,換道場景數(shù)據(jù)集能夠較好地模擬真實(shí)的駕駛環(huán)境。
表4 規(guī)則模型與原始變量訓(xùn)練結(jié)果
在上述數(shù)據(jù)集不同樣本容量的對比試驗(yàn)中得出的訓(xùn)練效果最優(yōu)的總樣本容量為2 000的基礎(chǔ)上,利用貝葉斯優(yōu)化算法對SVM、GBDT[13]、最鄰近算法[33](K-nearest neighbor,KNN)、樸素貝葉斯分類器[34](naive Bayes classifier,NBC)進(jìn)行參數(shù)優(yōu)化,在同一數(shù)據(jù)集下,對比不同機(jī)器學(xué)習(xí)模型的分類效果,優(yōu)化過程如圖5所示。
圖5 機(jī)器學(xué)習(xí)分類器參數(shù)優(yōu)化過程
圖6展示了同一數(shù)據(jù)集下,不同機(jī)器學(xué)習(xí)分類器的量化指標(biāo)。可以看出,相比于其他機(jī)器學(xué)習(xí)分類器,貝葉斯優(yōu)化高斯核的支持向量機(jī)模型具有最高的正確率和真負(fù)類率,分別達(dá)到了94.40%和95.48%,較高的真負(fù)類率使換道決策更加安全有效。此外,使用貝葉斯優(yōu)化的KNN、GBDT、NBC,同樣具有較高的分類正確率,具有良好的分類效果。
上述試驗(yàn)表明,所建立的換道場景數(shù)據(jù)集能與真實(shí)的NGSIM數(shù)據(jù)充分融合,能夠較好地模擬真實(shí)的換道場景,并為換道決策研究提供訓(xùn)練、驗(yàn)證,為智能網(wǎng)聯(lián)汽車換道軌跡規(guī)劃提供工況、場景。同時(shí)表明,所提換道決策算法能夠準(zhǔn)確預(yù)測自車的自由換道行為,符合真實(shí)駕駛環(huán)境下人為換道的決策特性。
針對智能網(wǎng)聯(lián)汽車的自由換道決策問題,提出了基于換道場景與決策規(guī)則的換道決策模型。
1)真實(shí)的NGSIM數(shù)據(jù)集對于換道樣本的提取較為繁瑣,符合訓(xùn)練集標(biāo)準(zhǔn)的樣本偏少,直道行駛樣本的數(shù)據(jù)提取具有隨機(jī)性,樣本容量較小,數(shù)據(jù)質(zhì)量不佳,影響模型的分類效果。換道場景數(shù)據(jù)集的建立使樣本容量選取自由,換道特征變量取值更為直觀準(zhǔn)確,省去大量的數(shù)據(jù)處理工作。
2)建立了基于決策規(guī)則的自由換道決策模型,從換道安全、換道收益、換道必要性3個(gè)方面分析了換道行為決策,將決策規(guī)則用于換道場景數(shù)據(jù)集得出正負(fù)樣本,在與NGSIM數(shù)據(jù)集換道樣本融合后用于機(jī)器學(xué)習(xí)分類器的訓(xùn)練分類。
3)貝葉斯優(yōu)化核函數(shù)的支持向量機(jī)以95.40%的預(yù)測正確率高于其他分類器,所提決策模型能夠準(zhǔn)確地預(yù)測自車的自由換道行為,融合后的數(shù)據(jù)集在不同的樣本容量和不同機(jī)器學(xué)習(xí)分類器的訓(xùn)練后均有較高的正確率,表明所建立的換道場景數(shù)據(jù)集能與NGSIM數(shù)據(jù)集融合,能夠較好地模擬真實(shí)的換道場景。