無(wú)信號(hào)控制交通場(chǎng)景的人車博弈行為分析及決策建模

2023-10-24 07:57:56李海洋曲大義楊子奕陳意成邵德棟

青島理工大學(xué)學(xué)報(bào) 2023年5期

李海洋,曲大義,*,楊子奕,陳意成,邵德棟

(青島理工大學(xué) a.機(jī)械與汽車工程學(xué)院;b.土木工程學(xué)院,青島 266525)

在發(fā)展中國(guó)家,行人交通在城市交通系統(tǒng)中占據(jù)主導(dǎo)地位[1]。資料顯示,我國(guó)城市交通出行中,超過(guò)1/5為行人交通[2]。行人交通雖然是所有交通方式開始和結(jié)束必不可少的組成部分[3],但因其存在易受傷害等自身特點(diǎn)與車流交通相比呈現(xiàn)弱勢(shì)[4-5]。數(shù)據(jù)顯示,全球每年約有百萬(wàn)人死于交通事故,其中約50%為行人和自行車騎行者[6],我國(guó)發(fā)生在無(wú)信號(hào)控制人行橫道區(qū)域的行人事故超過(guò)1/3,其中死亡事故占比超過(guò)37%[7]。無(wú)信號(hào)控制的路段和交叉口斑馬線處,由于缺乏交通信號(hào)燈和相應(yīng)的空間渠化措施,難以分離行人和車輛在時(shí)、空上的通行權(quán),因此易造成人車沖突,危及交通安全[8-9]。由此可見,無(wú)信號(hào)控制場(chǎng)景下,行人過(guò)街過(guò)程中存在人-車沖突,分析人-車沖突的決策過(guò)程和決策影響因素對(duì)于揭示人-車沖突機(jī)理,減少人-車沖突事故具有重要意義。

近年來(lái),針對(duì)人車沖突與博弈決策行為分析,國(guó)內(nèi)外學(xué)者做了部分研究,如YAN等研究了右轉(zhuǎn)車輛和過(guò)街行人之間的相互作用和博弈過(guò)程,建立了元胞自動(dòng)機(jī)模型[10];QIU等對(duì)路口交通參與者的交通行為進(jìn)行研究,構(gòu)建了交通行為博弈模型[11];周雪峰等針對(duì)無(wú)信號(hào)控制路段上行人與車輛存在搶行的問(wèn)題,建立了完全信息靜態(tài)和動(dòng)態(tài)兩種博弈模型[12];劉博通分別分析了車輛和過(guò)街行人對(duì)風(fēng)險(xiǎn)的感知情況及二者的決策行為,得到了二者感知風(fēng)險(xiǎn)的變化規(guī)律和影響決策行為的因素[13];劉麗娟等基于博弈論,對(duì)行人和車輛的決策行為過(guò)程進(jìn)行分析,建立了只考慮時(shí)間因素、同時(shí)考慮時(shí)間和風(fēng)險(xiǎn)因素的支付矩陣,并討論了Nash均衡[14];王璐等提出了基于臟臉博弈的模型,分析了車型、行人等待時(shí)間和個(gè)體認(rèn)知能力異質(zhì)性對(duì)人車沖突的影響[15];CHENG等使用不完全信息動(dòng)態(tài)博弈模型研究了人車通行的碰撞風(fēng)險(xiǎn),揭示了人車博弈中行人最佳決策與車輛運(yùn)行速度存在相關(guān)性[16];李新波建立了人車博弈模型,應(yīng)用累計(jì)前景理論選出博弈雙方的最佳策略[17];楊玉婷以時(shí)間和安全效用函數(shù)構(gòu)造博弈收益矩陣,建立了基于沖突的不完全信息靜態(tài)博弈模型[18];韓喜雙等將人車博弈分為行人先行和車輛先行兩類情景,利用擴(kuò)展式博弈模型,揭示了行人過(guò)街決策機(jī)理[19];魏麗英等建立了人車沖突演化動(dòng)力學(xué)模型[20];雷愛國(guó)等將過(guò)街行人心理分為3個(gè)階段,并構(gòu)建各階段的人車博弈矩陣,分析均衡點(diǎn)表明:行人和車輛演化博弈最終有2個(gè)穩(wěn)定狀態(tài)[21];鄺先驗(yàn)等將車輛分為禮讓與不禮讓2種類型,并考慮機(jī)動(dòng)車禮讓比例,在元胞自動(dòng)機(jī)模型的基礎(chǔ)上,引入動(dòng)態(tài)博弈更新規(guī)則,模擬無(wú)信號(hào)控制處的交通沖突[22]。

綜上所述,國(guó)內(nèi)外學(xué)者在對(duì)人車沖突進(jìn)行博弈解析的過(guò)程中,往往將行人和車輛的行動(dòng)簡(jiǎn)化為單純的合作博弈或非合作博弈模型,沒有對(duì)博弈的階段性變化和行人的主觀因素進(jìn)一步考慮,難以體現(xiàn)人車沖突時(shí),行人與車輛駕駛?cè)松?、心理的?dòng)態(tài)變化過(guò)程和決策的變化性。因此本文將利用靜態(tài)博弈模型、不完全信息動(dòng)態(tài)博弈模型對(duì)人車決策全過(guò)程進(jìn)行分析,同時(shí)考慮行人的生理、心理特性,進(jìn)一步解析無(wú)信號(hào)控制場(chǎng)景下的人車沖突。

1 人車沖突現(xiàn)象分析

在無(wú)信號(hào)控制的交叉口和路段斑馬線處,行人與車輛常產(chǎn)生路權(quán)沖突,常見的人車沖突場(chǎng)景包括:

1) 車輛距離斑馬線較遠(yuǎn)(滿足行人安全心理距離),行人能夠以正常速度通過(guò)。此時(shí),行人與車輛可達(dá)成共識(shí):行人安全通過(guò)后,車輛駛過(guò)斑馬線。

2) 車輛距離斑馬線很近(明顯小于停車視距),行人無(wú)法安全通過(guò)。此時(shí),行人與車輛可達(dá)成共識(shí):行人等待車輛通過(guò)斑馬線后再通過(guò)。

3) 車輛距離斑馬線位置較為“尷尬”(介于停車視距與安全心理距離之間),行人和車輛均可嘗試先行通過(guò)。此時(shí),行人與車輛常常難以達(dá)成共識(shí),會(huì)出現(xiàn)雙方相互打手勢(shì)、一方或雙方同時(shí)加速或減速、車輛摁喇叭等行為。

其中,場(chǎng)景1),2)情況都較為簡(jiǎn)單,行人與車輛能夠直接達(dá)成共識(shí)。而場(chǎng)景3)較為復(fù)雜,行人與車輛往往需要1輪至多輪博弈才能達(dá)成共識(shí)。

博弈雙方行人和車輛均有兩個(gè)策略可以選擇,即通過(guò)與不通過(guò)?？蓪⑿腥说牟呗院霞洖镾p={C,D},C表示穿越,D表示等待;將車輛的策略合集記為Sc={T,R},T表示通過(guò),R表示讓行。由于行人與車輛各有兩種策略,因此初始決策時(shí)會(huì)出現(xiàn)如表1所示的4種情況:

表1 純策略矩陣

情況①:行人選擇穿越,車輛選擇通過(guò)。此時(shí)對(duì)應(yīng)上述沖突場(chǎng)景3),說(shuō)明行人與車輛在第一階段的博弈中互不相讓,易產(chǎn)生交通事故。因此在這種情況下,行人與車輛接下來(lái)會(huì)進(jìn)行第二階段博弈,以達(dá)到安全通過(guò)的目的。

情況②:行人選擇穿越,車輛選擇讓行。此時(shí)對(duì)應(yīng)上述沖突場(chǎng)景1),行人能夠安全過(guò)街,同時(shí)車輛也能在行人過(guò)街后安全通過(guò)。

情況③:行人選擇等待,車輛選擇通過(guò)。此時(shí)對(duì)應(yīng)上述沖突場(chǎng)景2),行人無(wú)法安全過(guò)街,因此行人只能等待車輛通過(guò)后再過(guò)街。

情況④:行人選擇等待,車輛選擇讓行。此時(shí)對(duì)應(yīng)上述沖突場(chǎng)景3),說(shuō)明行人與車輛在第一階段的博弈中互相讓行,導(dǎo)致雙方均無(wú)法通行。此時(shí)行人與車輛會(huì)進(jìn)行第二階段博弈,以達(dá)到通行的目的。

通過(guò)上述分析不難發(fā)現(xiàn),行人與車輛在一開始就能達(dá)成一方讓行,另一方通過(guò)是最為高效的,即情況②③。但行人與車輛在第一階段博弈失敗,產(chǎn)生了互不相讓和互相讓行的情況也較為常見,即情況①④。對(duì)于情況①④,接下來(lái)就進(jìn)入到人車博弈的第二階段——序貫博弈的過(guò)程,即行人與車輛一方先決策,另一方后決策。

2 博弈影響要素分析

博弈主要由博弈參與者、策略以及策略對(duì)應(yīng)的收益構(gòu)成[23]。影響人車博弈過(guò)程的因素主要包括行人等待時(shí)間、策略選擇概率、行人緊張度、策略支付,同時(shí)也將延誤、風(fēng)險(xiǎn)度、行人風(fēng)格和車輛駕駛?cè)孙L(fēng)格等融合考慮。

2.1 行人等待時(shí)間

行人過(guò)街心理與行人等待時(shí)間相關(guān),行人等待時(shí)間越長(zhǎng),行人心理越容易變得急躁和不耐煩,進(jìn)而導(dǎo)致行人冒險(xiǎn)過(guò)街的概率增高。盧守峰等[24]研究發(fā)現(xiàn)行人過(guò)街最大等待時(shí)間約為40～50 s;馮樹民等[25]得出我國(guó)大部分行人過(guò)街可容忍的等待時(shí)間為50 s。

結(jié)合相關(guān)研究[15,24-27]和行人等待時(shí)間的規(guī)律特性能夠發(fā)現(xiàn),行人等待時(shí)間與冒險(xiǎn)穿越概率之間的關(guān)系與生物學(xué)中種群增長(zhǎng)的S型曲線模型[28]具有極高相似性,因此可對(duì)生物學(xué)中種群增長(zhǎng)模型進(jìn)行修正,構(gòu)造概率影響系數(shù),如式(1)所示,可反映行人等待時(shí)間對(duì)冒險(xiǎn)穿越概率的影響。

(1)

式中:ζ為概率影響系數(shù);k為行人心理忍耐極限,可在0～2之間取值,數(shù)值越大反映行人越接近心理忍耐極限;k0為行人初始心理感受;r為心理忍耐程度增長(zhǎng)率,與行人風(fēng)格相關(guān);t為行人等待時(shí)間。

當(dāng)行人心理忍耐極限k為2,行人初始心理感受k0為1,概率影響系數(shù)ζ隨心理忍耐程度增長(zhǎng)率r和行人等待時(shí)間t變化的函數(shù)圖像如圖1所示。從圖1可以看出,ζ隨著r和t的增大而增大,同時(shí)曲率也隨之增大。圖2為當(dāng)r=25%時(shí)概率影響系數(shù)ζ函數(shù)圖像。從圖2可以看出,冒險(xiǎn)概率隨行人等待時(shí)間的增加,分為3個(gè)明顯不同的階段:1)行人等待時(shí)間少于20 s時(shí),冒險(xiǎn)穿越概率較低;2)等待20～35 s后,冒險(xiǎn)穿越概率迅速增大;3)35 s后冒險(xiǎn)穿越概率接近最大。

圖1 概率影響系數(shù)ζ三維曲面

圖2 r=25%時(shí)概率影響系數(shù)ζ函數(shù)圖像

2.2 博弈策略選擇概率

由前文分析可知,行人與車輛在估計(jì)自身通行時(shí)間和對(duì)方通行時(shí)間后,通過(guò)比較彼此通行時(shí)間大小作出決策,因此行人和車輛的策略選擇概率可采用如下方法表示[15]:

(2)

(3)

則行人選擇等待的概率為1-Pp,車輛選擇讓行的概率為1-Pc。

由于上述策略選擇概率僅考慮了行人與車輛對(duì)彼此通行時(shí)間的判斷過(guò)程,無(wú)法體現(xiàn)行人等待時(shí)間的影響,因此需用Pp與ζ相乘,在博弈中代入修正的行人選擇穿越的概率P′p,即

(4)

2.3 行人緊張度

行人緊張度能反映行人在過(guò)街過(guò)程中,面對(duì)車輛時(shí)產(chǎn)生的焦慮情緒,主要表現(xiàn)為在過(guò)街過(guò)程中的加速、減速、轉(zhuǎn)向、停止等行為上。

一般情況下,行人緊張度與行人、車間的距離呈負(fù)相關(guān),與車輛速度呈正相關(guān),且不同風(fēng)格的行人面對(duì)同一情況下的心理壓力也不同,可通過(guò)行人心理壓力場(chǎng)進(jìn)行衡量,行人心理壓力場(chǎng)場(chǎng)強(qiáng)可表示為

(5)

式中:E為行人心理壓力場(chǎng)場(chǎng)強(qiáng);εp為風(fēng)格特性修正系數(shù);ve為速度修正項(xiàng);tc為車輛反應(yīng)時(shí)間;d為車輛與行人距離;Ls為行人過(guò)街安全心理距離;vi為第i車道車輛速度。

行人過(guò)街安全心理距離Ls可表示為[29]

Ls=vi(nLc/vp+tp)+Cs

(6)

式中:n為車道數(shù);Lc為車道寬度;vp為行人速度;tp為行人反應(yīng)時(shí)間;Cs為車輛距行人的安全距離。

行人過(guò)街時(shí),在其周圍會(huì)形成一個(gè)如圖3所示以行人為焦點(diǎn)的橢圓形心理壓力場(chǎng)[30],行人受到的心理壓力(反映行人緊張度)與車輛在心理壓力場(chǎng)中所處位置的場(chǎng)強(qiáng)大小、車輛與行人間距和速度以及角度密切相關(guān)。橢圓等勢(shì)線可表示為

圖3 心理壓力場(chǎng)等勢(shì)線

(7)

(8)

(9)

(10)

式中:r為等勢(shì)線上的點(diǎn)到行人距離;a為橢圓半長(zhǎng)軸;b為橢圓半短軸;c為橢圓半焦距;θ為等勢(shì)線上某點(diǎn)和行人連線與行人運(yùn)動(dòng)方向所在直線所成的角度;Δt為車輛運(yùn)動(dòng)時(shí)間。

聯(lián)立式(7)—(10)可得:

(11)

當(dāng)θ=90°,即車輛與行人處于同一車道時(shí),由式(11)可得

d=vi·Δt·(2r+1)

(12)

將式(6)(12)代入式(5)中可得:

(13)

2.4 策略與支付

支付效用函數(shù)可反映決策者的收益情況,主要包括延誤、風(fēng)險(xiǎn)、緊張支付,而且與行人風(fēng)格與車輛駕駛?cè)孙L(fēng)格相關(guān),同時(shí)還受行人等待時(shí)間的影響。設(shè)up為行人效用,uc為車輛效用,則二者的支付效用函數(shù)可表示為

(14)

(15)

(16)

為了較為直觀地體現(xiàn)不同風(fēng)格、不同階段下行人與車輛的策略選擇,可設(shè)定各類支付效用的初始值,見表2、表3。

表2 行人效用支付

表3 車輛效用支付

對(duì)支付效用初始值的設(shè)定,分析如下:

1) 根據(jù)前文分析,隨著等待時(shí)間的變長(zhǎng)(即從階段1到階段3),行人冒險(xiǎn)穿越概率會(huì)增大,因此行人的延誤支付、風(fēng)險(xiǎn)支付的絕對(duì)值均增大。由于不同風(fēng)格行人對(duì)延誤和風(fēng)險(xiǎn)的在意程度不同,因此數(shù)值設(shè)置也有差別。

行人穿越支付為正數(shù),表示獲得通行權(quán)的收益,均設(shè)定為 1?？衫斫鉃?在階段1,行人穿越而機(jī)動(dòng)車避讓的話,行人總的效用支付為:延誤支付+穿越支付,即 1-1=0,行人總支付效用為0,同理,車輛也沒有額外支付,與實(shí)際情況相符。

2) 對(duì)于車輛來(lái)說(shuō),車輛并不知道行人處于哪個(gè)階段,車輛的決策主要與自身相關(guān),因此根據(jù)車輛駕駛?cè)孙L(fēng)格不同,合理設(shè)定各項(xiàng)支付初始值。

3 博弈模型構(gòu)建

行人過(guò)街與車輛發(fā)生沖突后,雙方開始做出的決策往往沒有先后次序,幾乎同時(shí)作出決策,因此屬于同時(shí)博弈。若在初始階段的博弈達(dá)成共識(shí),則博弈結(jié)束;若第一階段的博弈無(wú)法達(dá)成共識(shí),即產(chǎn)生了人車互讓或互不相讓的情況,則會(huì)進(jìn)入下一階段博弈——序貫博弈,在這個(gè)階段,沖突雙方會(huì)盡可能在揣測(cè)對(duì)方的意圖后做出決策,并在接下來(lái)的行動(dòng)中進(jìn)一步修正,直到雙方達(dá)成通行共識(shí)。

3.1 博弈基本假設(shè)

由于行人過(guò)街存在諸多的干擾性、不確定性因素,因此在運(yùn)用博弈理論研究人車沖突問(wèn)題時(shí)需要對(duì)博弈雙方以及部分條件進(jìn)行合理化假設(shè):

1) 將過(guò)街行人與車輛視作博弈的雙方,且雙方均為理性人,即雙方的決策都是以實(shí)現(xiàn)自身效用最大為目標(biāo)。

2) 過(guò)街行人與車輛彼此互不了解、不清楚對(duì)方的行為風(fēng)格及傾向。

3) 假設(shè)過(guò)街行人與車輛是在道路、環(huán)境條件良好,視距良好的情況下進(jìn)行博弈。

3.2 混合策略博弈模型

混合策略博弈是指在給定信息情況下,能夠以某種概率選擇不同策略的博弈。行人與車輛博弈的混合策略收益矩陣見表4,行人與車輛選擇不同策略時(shí)產(chǎn)生的收益函數(shù)為up和uc,例up(C,T)為行人選擇穿越策略且車輛選擇通過(guò)策略時(shí)行人的收益函數(shù)。支付效用注釋見表5。

表4 行人與車輛博弈的混合策略收益矩陣

表5 支付效用注釋

表4中行人和車輛的期望收益可分別表示為

φp=up(C,T)P′pPc+up(C,R)P′p(1-Pc)+up(D,T)(1-P′p)Pc+up(D,R)(1-P′p)(1-Pc)

(17)

φc=uc(C,T)P′pPc+uc(C,R)P′p(1-Pc)+uc(D,T)(1-P′p)Pc+uc(D,R)(1-P′p)(1-Pc)

(18)

通過(guò)將式(17)中行人的收益函數(shù)φp對(duì)Pc求導(dǎo)并令其導(dǎo)數(shù)為0,可得P′p為

(19)

同理將車輛的收益函數(shù)φc對(duì)P′p求導(dǎo)并令其導(dǎo)數(shù)為0,可得Pc為

(20)

當(dāng)博弈中不存在純策略納什均衡,行人和車輛的策略選擇概率P′p和Pc必須滿足上述條件時(shí),才能得到混合策略博弈的納什均衡。

3.3 序貫博弈模型

序貫博弈是博弈雙方選擇策略有時(shí)間先后的博弈形式。當(dāng)行人與車輛在混合策略博弈階段沒有達(dá)成共識(shí)時(shí),此時(shí)進(jìn)入序貫博弈階段,在該階段分為行人先行和車輛先行兩種情況。

3.3.1 “行人先行”序貫博弈模型

當(dāng)行人先行動(dòng)時(shí),車輛會(huì)推測(cè)行人的行動(dòng),然后決定自己的行動(dòng),其博弈過(guò)程及支付效用,如圖4所示的博弈樹。

圖4 “行人先行”博弈樹O—博弈樹起點(diǎn);Z,Y,S,W—支配型、影響型、思考型、穩(wěn)健型行人;P′p1,P′p2,P′p3—處于行人等待階段1,2,3的概率;C,D—行人穿越和等待;J,P,B—激進(jìn)型、普通型、保守型車輛駕駛?cè)?T,R—車輛通過(guò)和讓行

在該博弈模型中,行人與車輛的博弈過(guò)程為:博弈開始時(shí),行人可分為支配型、影響型、思考型、穩(wěn)健型,4種類型的行人分別以概率P′p1,P′p2,P′p3處于不同等待階段,然后行人進(jìn)行決策,策略集為{穿越,等待},表示為Sp={C,D};接著3種類型(激進(jìn)型、普通型、保守型)的車輛駕駛?cè)诉M(jìn)行決策,策略集為{通過(guò),讓行},表示為Sc={T,R};最后博弈雙方得到的支付效用結(jié)果按照表5所示的函數(shù)表達(dá)進(jìn)行計(jì)算,結(jié)果標(biāo)注在博弈樹終止節(jié)點(diǎn)旁。

由圖4可以看出,Z型(支配型)行人的3個(gè)階段中,策略C與策略D帶來(lái)的收益相比,0>-1,0>-4,-6>-7;Y型(影響型)行人的3個(gè)階段策略C與策略D帶來(lái)的收益相比0>-1,-1>-3,-1>-5,因此支配型和影響型行人的策略C屬于占優(yōu)策略。同理,S型(思考型)行人的階段2和階段3中,策略C與策略D帶來(lái)的收益相比-1>-2,-2>-4,因此策略C也屬于占優(yōu)策略。

當(dāng)行人的策略確定后,車輛選擇策略T或R取決于車輛的支付效用。

若行人先行動(dòng)選擇策略C,則機(jī)動(dòng)車選擇策略T的期望收益為

dc=4(P′p1+P′p2+P′p3)Pc(1-3-7)=-36Pc

(21)

若行人先行動(dòng)選擇策略C,則機(jī)動(dòng)車選擇策略R的期望收益為

dc=4(P′p1+P′p2+P′p3)(1-Pc)(-5-3-1)=-36(1-Pc)

(22)

因此,當(dāng)Pc>0.5時(shí),若車輛期望收益dc>-36Pc,車輛則選擇策略T;若-36(1-Pc)-36(1-Pc),車輛將選擇策略R。

若行人先行動(dòng)選擇策略D,則機(jī)動(dòng)車選擇策略T的期望收益為

dc=4(P′p1+P′p2+P′p3)Pc(4+1-2)=12Pc

(23)

若行人先行動(dòng)選擇策略D,則機(jī)動(dòng)車選擇策略R的期望收益為

dc=4(P′p1+P′p2+P′p3)(1-Pc)(-5-3-1)=-36(1-Pc)

(24)

因此,若車輛期望收益dc>-12Pc,車輛則選擇策略T;若-36(1-Pc)

3.3.2 “車輛先行”序貫博弈模型

當(dāng)車輛先行動(dòng)時(shí),行人會(huì)推測(cè)車輛的行動(dòng),然后決定自己的行動(dòng),其博弈過(guò)程及支付效用,如圖5所示的博弈樹。

圖5 “車輛先行”博弈樹O—博弈樹起點(diǎn);Z,Y,S,W—支配型、影響型、思考型、穩(wěn)健型行人;P′p1,P′p2,P′p3—處于行人等待階段1,2,3的概率;C,D—行人穿越和等待;J,P,B—激進(jìn)型、普通型、保守型車輛駕駛?cè)?T,R—車輛通過(guò)和讓行

在該博弈模型中,行人與車輛的博弈過(guò)程為:博弈開始時(shí),車輛駕駛?cè)丝煞譃榧みM(jìn)型、保守型、普通型,3種類型的車輛駕駛?cè)诉M(jìn)行決策,策略集為{通過(guò),讓行},表示為Sc={T,R};然后4種類型(支配型、影響型、思考型、穩(wěn)健型)的行人分別以概率P′p1,P′p2,P′p3處于不同等待階段,行人進(jìn)行決策,策略集為{穿越,等待},表示為Sp={C,D};最后博弈雙方得到的支付效用結(jié)果按照表5所示的函數(shù)表達(dá)進(jìn)行計(jì)算,結(jié)果標(biāo)注在博弈樹終止節(jié)點(diǎn)旁。

由圖5可以看出,J型(激進(jìn)型)車輛駕駛?cè)诉x擇策略T和策略R帶來(lái)的收益相比,1和4均大于-5;P型(普通型)車輛駕駛?cè)诉x擇策略T和策略R帶來(lái)的收益相比,1>-3,因此激進(jìn)型和普通型車輛駕駛?cè)说牟呗訲屬于占優(yōu)策略。同理,B型(保守型)車輛駕駛?cè)诉x擇策略T和策略R帶來(lái)的收益相比,-2和-7均小于-1,因此策略R屬于占優(yōu)策略。

當(dāng)車輛的策略確定后,行人選擇策略C或D取決于行人的支付效用。

若車輛先行動(dòng)選擇策略T,則行人選擇策略C的期望收益為

dp=3[(-4-3-3-5)PcP′p1+(-6-4-6-8)PcP′p2+(-9-6-7-10)PcP′p3]

=-3Pc(15P′p1+24P′p2+32P′p3)

(25)

若車輛先行動(dòng)選擇策略T,則行人選擇策略D的期望收益為

dp=3[(-1-1-1-1)Pc(1-P′p1)+(-2-4-3-2)Pc(1-P′p2)

+(-4-7-5-3)Pc(1-P′p3)]=-3Pc[4(1-P′p1)+11(1-P′p2)+19(1-P′p3)]

(26)

因此,當(dāng)15P′p1+24P′p2+32P′p3>4(1-P′p1)+11(1-P′p2)+19(1-P′p3)時(shí),若行人期望收益dp>-3Pc[4(1-P′p1)+11(1-P′p2)+19(1-P′p3)],車輛則選擇策略D;若-3Pc(15P′p1+24P′p2+32P′p3)

當(dāng)15P′p1+24P′p2+32P′p3<4(1-P′p1)+11(1-P′p2)+19(1-P′p3)時(shí),若行人期望收益-3Pc[4(1-P′p1)+11(1-P′p2)+19(1-P′p3)]-3Pc(15P′p1+24P′p2+32P′p3),行人將選擇策略C。

若車輛先行動(dòng)選擇策略R,則行人選擇策略C的期望收益為

dp=3[(-1+0+0-1)(1-Pc)P′p1+(-1+0-1-2)(1-Pc)P′p2

+(-2-1-1-3)(1-Pc)P′p3]=-3(1-Pc)(2P′p1+4P′p2+7P′p3)

(27)

若車輛先行動(dòng)選擇策略R,則行人選擇策略D的期望收益為

dp=3[(-1-1-1-1)(1-Pc)(1-P′p1)+(-2-4-3-2)(1-Pc)(1-P′p2)

+(-4-7-5-3)(1-Pc)(1-P′p3)]=-3(1-Pc)[4(1-P′p1)+11(1-P′p2)+19(1-P′p3)]

(28)

因此,當(dāng)2P′p1+4P′p2+7P′p3>4(1-P′p1)+11(1-P′p2)+19(1-P′p3)時(shí),若行人期望收益dp>-3(1-Pc)[4(1-P′p1)+11(1-P′p2)+19(1-P′p3)],車輛則選擇策略D;若-3(1-Pc)(2P′p1+4P′p2+7P′p3)

當(dāng)2P′p1+4P′p2+7P′p3<4(1-P′p1)+11(1-P′p2)+19(1-P′p3)時(shí),若行人期望收益dp> -3(1-Pc)(2P′p1+4P′p2+7P′p3),車輛則選擇策略C;若-3(1-Pc)[4(1-P′p1)+11(1-P′p2)+19(1-P′p3)]

通過(guò)求解博弈模型均衡解的過(guò)程可以看出,博弈存在人車沖突的情形(行人選擇策略C,車輛選擇策略T),此種情況下容易造成安全事故和多次博弈。因此,可以通過(guò)管理手段和控制手段加以干預(yù),使得行人在選擇策略C(穿越)時(shí),車輛選擇策略T(通過(guò))的支付效用減少而選擇策略R(讓行)帶來(lái)的支付效用足夠大,促使車輛選擇策略R,即避讓行人。

同時(shí)也存在人車互讓的情形(行人選擇策略D,車輛選擇策略R),此種情況下會(huì)造成通行效率低下和多次博弈。因此,可以通過(guò)技術(shù)手段提高人-車-路的協(xié)同程度,在保證安全的情況下,提高通行效率。

4 結(jié)論

針對(duì)無(wú)信號(hào)控制場(chǎng)景下,行人過(guò)街過(guò)程中行人與車輛存在沖突的現(xiàn)狀,基于博弈論,分析了人車沖突過(guò)程中的決策行為。通過(guò)對(duì)行人過(guò)街過(guò)程進(jìn)行分析,能夠發(fā)現(xiàn)行人與車輛的博弈過(guò)程受多因素影響,包括行人等待時(shí)間、策略選擇概率、行人緊張度、策略支付,同時(shí)也將延誤、風(fēng)險(xiǎn)度、行人風(fēng)格和車輛駕駛?cè)孙L(fēng)格等融合考慮。通過(guò)將上述多因素進(jìn)行綜合分析,合理確定了支付效用函數(shù)以及支付效用初始值,并根據(jù)人車博弈過(guò)程構(gòu)建了3類博弈模型,即混合策略博弈模型、“行人先行”序貫博弈模型和“車輛先行”序貫博弈模型。

通過(guò)分析上述3類博弈模型的納什均衡解和不同情況下博弈雙方(行人和車輛)的收益,描述了行人過(guò)街和車輛之間的決策行為過(guò)程,得到了收益區(qū)間與策略選擇的關(guān)系,得出了行人和車輛在不同情況下的占優(yōu)策略和策略選擇情況。研究結(jié)果表明:不同風(fēng)格的行人和車輛駕駛?cè)?在不同階段、不同行動(dòng)順序下決策收益不同,占優(yōu)策略存在差異。分析人-車沖突的決策過(guò)程和決策影響因素對(duì)于揭示人-車沖突機(jī)理,減少人-車沖突事故具有重要意義。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡