網(wǎng)聯(lián)自主車輛協(xié)作換道行為博弈特性及模型

2024-04-11 07:49:42姬利源曲大義戴守晨崔善檸李奧迪魏傳寶

廣西大學學報(自然科學版) 2024年1期

姬利源, 曲大義, 戴守晨, 崔善檸, 李奧迪, 魏傳寶

(青島理工大學機械與汽車工程學院, 青島 266520)

0 引言

車聯(lián)網(wǎng)系統(tǒng)多維度融合了人-車-路-環(huán)境各要素,車-車交互作用和車-路協(xié)作關(guān)系發(fā)生內(nèi)在的結(jié)構(gòu)性變化,網(wǎng)聯(lián)自主車輛(connected autonomous vehicle, CAV)和人工駕駛車輛(human-driven vehicle, HV)在網(wǎng)聯(lián)智能交通系統(tǒng)混行共存,稱之為網(wǎng)聯(lián)異質(zhì)車群。在異質(zhì)車群中,網(wǎng)聯(lián)自主駕駛車輛和人工駕駛車輛互相滲透,共同完成道路行駛?cè)蝿?wù)。

伴隨著智能網(wǎng)聯(lián)技術(shù)的發(fā)展,車輛換道相關(guān)理論和模型的發(fā)展也取得了很多研究成果。Gipps模型[1]是最早提出的一種基于微觀觀察描述決策過程和行為的換道模型。Prajwal等[2]把換道分為強迫(forced)換道、自由(free)換道和協(xié)作(cooperation)換道,對換道行為的機制和動力學原理進行了分析。王榮本等[3]使用最小安全距離作為安全換道的前提,為自動換道輔助系統(tǒng)提供了理論基礎(chǔ)。劉小明等[4]使用動態(tài)重復(fù)博弈原理建立了車輛模型。Yu等[5]通過全面考慮周圍的車輛以及相關(guān)的軌跡規(guī)劃模型來建立車道決策模型。曲大義等[6]通過研究分析分子相互作用勢與車輛交互關(guān)系,建立了車輛換道的分子動力學模型,展現(xiàn)了網(wǎng)聯(lián)自主車輛的換道行為特性。

分析比較近期國內(nèi)外研究結(jié)果可以看出,對車輛換道模型的研究主要著眼于換道軌跡和跟蹤算法,并未對車輛之間的動態(tài)交互博弈關(guān)系進行深入探究。在智能網(wǎng)聯(lián)交通環(huán)境下,車輛換道要同時考慮換道安全性和與周圍車輛的交互博弈作用。本研究基于博弈論,對車輛行駛過程中車輛換道危險等級進行量化,使用車輛之前的發(fā)生碰撞的時間(time-to-collision, TTC)作為參數(shù),通過對碰撞時間和設(shè)定閾值的比較來進行策略的選擇,在此基礎(chǔ)上結(jié)合車輛動力學建立了車輛換道的動態(tài)安全模型,瞄準決策后車輛的速度收益及目標車群的安全穩(wěn)定性,提出了網(wǎng)聯(lián)自主車輛協(xié)作換道動態(tài)博弈模型,使網(wǎng)聯(lián)自主車輛更加安全、穩(wěn)定地駕駛。

1 網(wǎng)聯(lián)自主車輛協(xié)作換道行為動態(tài)博弈特性

1.1 協(xié)作式換道行為分析

換道和跟馳是車輛駕駛時最基本的2種行為。車輛換道時,周邊的環(huán)境因素和駕駛者的心理因素等會對駕駛者換道行為決策產(chǎn)生影響。換道行為往往起源于駕駛者的意圖和目標。而在異質(zhì)車群中,智能網(wǎng)聯(lián)自主車輛通過準確感知和識別不同類型的車輛以及周圍的環(huán)境,為駕駛員換道的行為提供支持,從而成功換道。在智能網(wǎng)聯(lián)技術(shù)支持下,自主車輛的換道多呈現(xiàn)為協(xié)作換道的形式,即2輛或多輛車輛共同合作,以確保安全地變換車道。這種行為通常是在高速公路或多車道道路上進行的,以允許車輛在不妨礙其他交通流的情況下改變自己的車道。

1.2 博弈策略分析

智能網(wǎng)聯(lián)駕駛車輛在接收到周圍的環(huán)境信息之后,車載決策單元對周圍的狀態(tài)信息進行一系列處理分析之后,產(chǎn)生最終決策。需要換道且會互相影響的2輛車采取博弈論的策略進行協(xié)作換道。

博弈是指在決策中涉及多方參與者在特定規(guī)則下做出策略選擇,以追求自己的利益最大化或達成特定目標的過程。按照博弈者之間是否進行合作來分類,博弈可以劃分為合作性博弈和非合作性博弈。博弈者不通過合作來達到博弈目的,這個博弈被稱為非合作博弈。網(wǎng)聯(lián)車是通過收集到的周圍的信息來進行有利于自身的決策的,明顯可以看出是非合作博弈,博弈類型劃分見表1。

表1 博弈類型劃分Tab.1 Classification of game type

因為本研究的參與者為網(wǎng)聯(lián)自主車輛,在網(wǎng)聯(lián)環(huán)境下雙方選擇策略及之后所產(chǎn)生的收益是透明的,所以博弈首先是一個完全信息博弈。在換道決策博弈中,參與者是同時制定換道策略并采取行動的。綜上所述,本研究將建立一個完全信息靜態(tài)博弈模型。

1.3 協(xié)作換道動態(tài)博弈策略的納什均衡解

納什均衡是指在2個及其以上的參與者的非合作的博弈中,假設(shè)每個參與者互相知道對方的均衡策略的情況下,只有同時改變博弈策略才會使收益變化的一個均衡解。在博弈論中,如果每個參與者選擇自己的策略,且只有所有參與者同時改變策略時才能取得收益,那么當前的策略組合及其相應(yīng)的結(jié)果構(gòu)成了納什均衡。

對于雙人非合作靜態(tài)完全信息博弈,記協(xié)作換道的參與者集為N={1,2},每個參與者的策略集為A1={c1,c2}和A2={r1,r2},u1、u2分別為2個參與者采取不同策略時的收益函數(shù),u1(c1,r2)表示的是參與者1使用c1策略和參與者2使用r2策略時,參與者1產(chǎn)生的收益。2輛車協(xié)作換道博弈收益矩陣見表2[7]。

表2 協(xié)作換道博弈收益矩陣Tab.2 Cooperative lane change game payoff matrix

如果存在純策略(cn,rn)使下式成立,則視策略(cn,rn)為純策略的納什均衡。

如果非合作博弈不存在純策略納什均衡,那么它的混合策略納什均衡一定存在。混合策略納什均衡表示的是多次博弈達到收益最大化時,選擇各純策略的概率估計,即每個純策略對于博弈方的友好程度。非合作混合策略博弈收益矩陣見表3[8]。

表3 混合策略博弈收益矩陣Tab.3 Mixed strategy game payoff matrix

2個參與者的期望收益分別為

分別對p和q進行求導(dǎo)并使其導(dǎo)數(shù)為0,可得

由此可知,當純策略博弈的納什均衡不存在時,應(yīng)采取混合策略博弈,并找到其納什均衡。協(xié)作換道的納什均衡能夠使目標車輛相互合作協(xié)調(diào)來實現(xiàn)最優(yōu)交通效率,提高協(xié)作換道模型的速度收益和穩(wěn)定性。

2 協(xié)作換道博弈決策模型

在智能車聯(lián)網(wǎng)的環(huán)境下,對車輛的協(xié)作換道進行建模,在以下假設(shè)中進行:車-車之間通信都是即時的;車輛所獲信息包括自身與周邊車輛的位置、速度、加速度以及地理環(huán)境等信息;所有車輛都為標準一致的轎車,且都是網(wǎng)聯(lián)自主駕駛車輛,即不考慮差異性。

2.1 換道過程分析

在滿足上述假設(shè)的情況下,忽略存在強制換道的場景,對協(xié)作換道過程進行分析。網(wǎng)聯(lián)自主車輛協(xié)作換道示意圖如圖1所示,A、B、LA和LB分別代表目標車輛、目標車道后車、原車道的前車和目標車道的前車。

圖1 網(wǎng)聯(lián)自主車輛協(xié)作換道示意圖Fig.1 Cooperative lane change process of connected autonomous vehicles

在智能車聯(lián)網(wǎng)的環(huán)境下,目標車輛能獲得當前車道前車和目標車道前車的速度,對目標車輛的換道意圖進行簡單量化。設(shè)目標車輛當前車道前車的速度為va,目標車道前車速度為vb。

(1)

用K來表示目標車輛的換道意圖,通過原車道前車與目標車道前車的速度的比值,來判斷換道意圖。K>1時,目標車輛有速度增益,產(chǎn)生換道意圖。K≤1時,目標車輛得不到相應(yīng)的速度增益,無換道意圖,在當前車道繼續(xù)進行跟馳。

2.2 協(xié)作換道博弈模型

在產(chǎn)生換道意圖之后,若能保證換道安全,則進行換道;若不能,則保持現(xiàn)狀。碰撞時間 (TTC)是目標車輛與前車發(fā)生碰撞的時間,也是評價交通安全的重要指標之一。

在TTC模型中,整個換道行為被視為在二維平面中進行,車輛由在平面中用坐標表示的矩形代替。目標車輛與目標車道前車的矢量位置與速度關(guān)系如圖2所示,O1、O2分別為目標車輛1、目標車道前車2的質(zhì)心位置,質(zhì)心之間的距離為D1,2,C1、C2為最可能碰撞點(即兩車之間的最近點)的位置,最可能碰撞點之間的距離為d1,2。兩車的位置關(guān)系可表示為(O1,O2,C1,C2),速度表示為(v1,v2)。

圖2 目標車輛與目標車道前車的矢量位置與速度關(guān)系Fig.2 Relationship between vehicle position and velocity

如發(fā)生碰撞,碰撞點一般位于車輛的外緣,所以碰撞一般最先發(fā)生于兩車距離最近的側(cè)邊點C1和C2,兩點之間的距離為

(2)

可得

(3)

將式(3)兩邊同時微分,易得

d1,2d′1,2=(C1-C2)T(V1-V2),

(4)

由此可得出兩車之間的相對速度-d′1,2。

基于式(4),可得目標車輛1與目標車道前車2的間隔距離的一階導(dǎo)數(shù)為

(5)

由TTC的定義可知d1,2+d′1,2T=0(T為TTC的值),可得

(6)

把式(2)、(5)代入式(6)得

(7)

然后比較TTC閾值(T*)與TTC的關(guān)系,對車輛換道是否存在安全風險進行判斷,一般為4 s或6 s,從換道的安全性來看使用6 s來作為判斷換道是否存在風險的閾值。根據(jù)文獻[9]對TTC數(shù)值與換道風險等級的關(guān)系劃分,對TTC閾值不大于6 s的換道數(shù)據(jù)進行換道風險等級分析,得到換道時不同風險程度的風險閾值。

換道風險預(yù)警等級劃分如圖3所示。由圖3可知,當T*<0.4 s時,換道有高風險;當0.4 s6.0 s時,換道基本無風險。為了保證在車聯(lián)網(wǎng)情況下?lián)Q道的安全,本文所用換道博弈模型在T*>6.0 s時,才會進行換道。安全閾值T*與速度以及距離關(guān)系如圖4所示。

圖3 換道風險預(yù)警等級劃分Fig.3 Lane change risk warning level classification

圖4 安全閾值T*與速度以及距離關(guān)系Fig.4 Relationship among velocity, distance and T*

車聯(lián)網(wǎng)環(huán)境下的自動駕駛車輛在產(chǎn)生換道意圖后,獲取周圍車輛的速度和位置等相關(guān)信息。在確定換道車道后,明確博弈對象,開始進入博弈,將換道后的速度增益作為收益函數(shù),然后基于換道博弈的混合策略下的納什均衡來判斷換道之后的收益。之后對換道的安全性及可行性進行分析,即對目標車輛周圍的車輛的TTC進行分析,當TTC大于安全閾值6.0 s時,可得換道安全,進行換道;如果小于安全閾值6.0 s時,則相反。目標車輛協(xié)作換道的動態(tài)博弈過程如圖5所示。

圖5 目標車輛協(xié)作換道的動態(tài)博弈過程Fig.5 Lane change game process

在協(xié)作博弈換道行為的模型中,對博弈策略進行分析。目標車輛A的策略集為{t1(換道),t2(不換道)} ;目標車道后車B的策略集為{c1(讓道),c2(不讓道)}。目標車輛A采取t1策略的概率為p,采取t2策略的概率為1-p;目標車道后車B采取c1策略的概率為q,采取c2策略的概率為1-q。同時將目標車輛換道后所得的速度收益作為博弈所得的收益函數(shù)。具體的動態(tài)交互博弈矩陣見表4。

表4 動態(tài)交互博弈矩陣Tab.4 Dynamic game matrix

目標車輛在4種策略下的速度收益函數(shù)分別是uA(t1,c1)、uA(t1,c2)、uA(t2,c1)、uA(t2,c2)。博弈策略中概率變化的同時,速度收益函數(shù)也會隨之變化,速度收益與博弈策略選擇概率的關(guān)系如圖6所示,在這4種不同概率的策略選擇下自動駕駛換道車輛的速度收益分別為-5、-20、-6以及-6。

圖6 速度收益與博弈策略選擇概率的關(guān)系Fig.6 Dynamic relationship between speed gain and game strategies

當目標車輛A選擇“換道”時,目標車道后車B選擇“讓道”策略。目標車道后車B進行加速或減速使目標車輛A有足夠的空間進入目標車道,即換道成功。因相對車速的變化,兩車的TTC閾值也進行了相應(yīng)的變化。當此混合策略博弈的納什均衡為目標車輛A選擇“換道”時,若目標車道后車B選擇“不讓道”,為避免發(fā)生碰撞事故,博弈決策作廢,目標車輛調(diào)整相應(yīng)的速度和位置距離,尋求重新?lián)Q道的機會。

3 實驗結(jié)果與分析

3.1 仿真平臺

運用SUMO(simulation of urban mobility)軟件對協(xié)作換道博弈模型的合理性和穩(wěn)定性進行仿真驗證。SUMO是微觀和連續(xù)交通仿真模擬軟件包,可以針對單一目標車輛進行單獨的控制。其內(nèi)置的流量控制接口(traffic control interface, TraCI)可通過Python或者MATLAB軟件對其換道規(guī)則進行編寫。

3.2 仿真環(huán)境

為了避免受到目的地、行人以及其他外界環(huán)境的影響,本次仿真環(huán)境設(shè)定為無任何外界因素存在的單向行駛4 000 m三車道,限速為33.3 m/s(即120 km/h)。本次仿真分為1、2兩組,1組為使用SUMO內(nèi)置的換道模型LC2013的對照組,2組為使用本文所給出的協(xié)作博弈換道模型。本次仿真所使用的車輛特征參數(shù)見表5。

表5 仿真車輛特征參數(shù)Tab.5 Simulated vehicle parameters

3.3 仿真結(jié)果分析

仿真實驗以TTC、不同車流密度下車輛平均速度等來作為評價2組模型好壞的標準。為了對TTC進行具體的分析,對模型中的30輛目標車輛進行定義,使用SUMO的SSM device模塊得到目標車輛的TTC,具體數(shù)值分布及車輛數(shù)如圖7所示。根據(jù)本文上述所描述的TTC閾值與換道安全風險等級的關(guān)系,當T*>6.0 s時,車輛換道處于一個完全安全的狀態(tài)。在2組模型的對比中,不難看出使用CAV協(xié)作換道模型的車輛有更安全的TTC。

圖7 不同模型的TTC閾值對比Fig.7 Comparison of TTC Thresholds for Different Models

同時,通過對使用LC2013換道模型和CAV協(xié)作換道模型的車輛的一些參數(shù)對比來對2組模型的性能進行評估,不同車流密度下的平均速度如圖8所示。從圖8不難看出,在車流密度小于80 veh/km的情況下,使用CAV協(xié)作換道模型的車輛平均速度顯然大于使用LC2013換道模型的車輛。在車流密度接近80 veh/km時,2換道模型的車輛平均速度逐漸趨于一致,且都呈現(xiàn)減小的態(tài)勢。整體仿真效果表明,在不同車流密度下CAV協(xié)作換道模型的車輛的平均速度優(yōu)于LC2013換道模型,即CAV協(xié)作換道模型具有更好的工作效率。

圖8 不同車流密度下的平均速度Fig.8 Average velocity in different flow density

不同交通流密度下的車輛通過數(shù)如圖9所示,對600 s內(nèi)不同車流密度下的車輛通過數(shù)進行比較分析。由圖可以看出使用CAV協(xié)作換道模型的車流在規(guī)定時間內(nèi)的通過數(shù)一直多于使用LC2013換道模型的通過數(shù)。這種趨勢隨著車流密度的上升呈逐步上升的趨勢,表明在同一時間路段內(nèi)、相同車流密度下,本文所研究的CAV協(xié)作換道模型與LC2013換道模型相比較車輛通過數(shù)更多,即更高效的道路使用率,能夠使車輛更加高效的行駛。

圖9 不同交通流密度下的車輛通過數(shù)Fig.9 Vehicle count under different traffic flow densities

采取不同換道模型的車輛在相同車流量時發(fā)生的事故數(shù)如圖10所示。從圖10中可以看出,在車流密度小于40 veh/km時,LC2013換道模型與CAV協(xié)作換道模型都沒有事故發(fā)生;在車流密度逐漸增大之后,采用LC2013換道模型的車輛事故數(shù)開始增加,而采用CAV協(xié)作換道模型的車輛處于一個相對安全穩(wěn)定的狀態(tài)。綜上所述,CAV協(xié)作換道模型具有良好的穩(wěn)定性和安全性。

圖10 不同交通流發(fā)生的事故數(shù)Fig.10 Accident incidents occurring in different traffic flows

4 結(jié)語

本文中研究了車聯(lián)網(wǎng)環(huán)境下的異質(zhì)車群自主車輛動態(tài)博弈特性,建立了網(wǎng)聯(lián)自主車輛協(xié)作換道行為模型,運用SUMO和MATLAB軟件對其進行了聯(lián)合仿真及數(shù)值分析。研究結(jié)果表明,網(wǎng)聯(lián)異質(zhì)車群的自主車輛換道存在協(xié)作博弈動態(tài)關(guān)系?；诓┺恼摿炕治鲞@一協(xié)作動態(tài)關(guān)系,建立了CAV協(xié)作換道模型,根據(jù)網(wǎng)聯(lián)自動駕駛目標車輛(CAV)在道路中所處位置,獲得交互博弈時間TTC這一動態(tài)變量,保證CAV目標車輛的協(xié)作博弈行為和安全換道。數(shù)值仿真結(jié)果表明,CAV協(xié)作換道模型比傳統(tǒng)LC2013換道模型有更好的收益和穩(wěn)定性。后續(xù)將網(wǎng)聯(lián)自主車輛協(xié)作博弈換道行為,進一步延展人-車-路-環(huán)境多維多態(tài)的復(fù)雜交通場景,深度挖掘網(wǎng)聯(lián)異質(zhì)車群的復(fù)雜特性。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡