国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于前景理論的換道決策模型研究

2022-06-24 13:07:00顧金剛蒲科辰朱自博
關(guān)鍵詞:效用前景車道

顧金剛,蒲科辰,楊 達,,呂 蒙,朱自博

(1. 公安部交通管理科學(xué)研究所 交通控制技術(shù)研究部 ,江蘇 無錫 214151; 2. 西南交通大學(xué) 交通運輸與物流學(xué)院, 四川 成都 610031)

0 引 言

車輛換道行為是常見的駕駛行為,換道行為往往會干擾其它車道車輛的運行,影響交通流的穩(wěn)定性,所以研究車輛換道行為十分重要。在換道決策階段,駕駛員以自身特性為基礎(chǔ),接受周圍車輛的速度、間隙、加速度等諸多因素的刺激,做出是否換道、車道選擇的決策。

現(xiàn)有的換道模型可分為4類:基于規(guī)則的模型、基于效用理論的模型、基于機器學(xué)習(xí)的模型和基于動機的模型[1]。基于規(guī)則的模型假設(shè)駕駛員服從若干規(guī)則來做出其車道改變的決策,例如優(yōu)選的目標(biāo)車道、改變車道的必要性、改變車道的可行性等,這一類別的代表性模型是Gipps換道模型[2]?;谝?guī)則的模型比較靈活,但沒有考慮駕駛員行為的變化?;谛в美碚摰哪P兔枋鲴{駛員通過比較車道之間效用的大小來決定是否換道以及換往哪一條車道的過程,這一類模型首先由K.I.AHMED[3]提出,D.SUN等[4]建立了多種換道情景下的效用選擇換道模型?;跈C器學(xué)習(xí)的換道模型通過訓(xùn)練大量的換道數(shù)據(jù),挖掘出影響駕駛員做換道決策的潛在因素,這一類模型一般具有更高的精度,但所需的數(shù)據(jù)量較大。常用的機器學(xué)習(xí)算法包括人工神經(jīng)網(wǎng)絡(luò)、模糊邏輯、決策樹、隨機森林等[5-7]?;趧訖C的換道模型中,駕駛員通過評估改變車道能否獲得更大的效益來決定是否換道,這類模型的代表是A.KESTING等[8]提出的MOBIL模型。

其中,基于效用理論的換道模型[9-10]從駕駛員的角度入手,分析駕駛員作為決策者產(chǎn)生換道意圖并選擇目標(biāo)車道的決策過程,可以較好的反映駕駛員的異質(zhì)性特征和決策機制。然而,以往的離散選擇換道模型以隨機效用理論為基礎(chǔ),并假設(shè)駕駛員是完全理性的,沒有考慮駕駛員在換道過程中的有限理性特征對換道決策的影響,模型與實際情況不符。前景理論最初由D.KAHNEMAN等[11]提出,K.V.KATSIKOPOULOS等[12]最先將前景理論應(yīng)用于交通領(lǐng)域的研究,證明了前景理論在不確定條件下出行選擇行為研究中的適用性。在前景理論框架下,駕駛員在做決策時,并不總是按照“概率法則”來估計未來不確定的事件,而是以一定時間內(nèi)的所有屬性值為基礎(chǔ),綜合考慮這些指標(biāo)的變化,從而對未來的速度或間距等做出預(yù)測。而且,同樣是分析不確定性因素對換道決策的影響,前景理論通過設(shè)立“參考點”劃分收益與損失,據(jù)此來計算價值函數(shù),并通過駕駛員的心理概率函數(shù)計算收益和損失的權(quán)重,最終得到每個方案的前景值。這個過程體現(xiàn)了駕駛員評價車道效用的有限理性,也體現(xiàn)了駕駛員在換道決策過程中潛在的非理性行為。所以,基于前景理論的換道決策模型更符合駕駛員的真實換道過程。

1 模 型

1.1 前景理論

前景理論將決策者的決策行為劃分為前后2個階段:編輯階段和評價階段。在編輯階段,決策者設(shè)定參照點,將選擇枝屬性的各種可能結(jié)果編輯為相對于參照點的收益和損失值,計算選擇枝相對于各屬性的價值,并根據(jù)結(jié)果發(fā)生的客觀概率計算主觀概率。在評價階段,決策者以上述資料為基礎(chǔ)計算各方案的前景值,選擇前景值最大的方案作為最終結(jié)果。

價值函數(shù)和決策權(quán)重函數(shù)的形式由D.KAHNEMAN等[11]提出,函數(shù)形式為:

(1)

(2)

(3)

筆者采取前景理論提出者A.TVERSKY等[13]的標(biāo)定值,根據(jù)其標(biāo)定結(jié)果,α與β取值0.88,表示風(fēng)險態(tài)度系數(shù),α與β越大表示駕駛員越傾向于冒險,α與β最大取1,此時為風(fēng)險中立。λ取值2.25,表示損失規(guī)避系數(shù),λ>1說明此時決策者對損失狀況更加的敏感。γ,δ的標(biāo)定值分別為0.61和0.69。綜合以上,計算方案i針對屬性j的前景值計算公式為:

(4)

前景理論是否適用,取決于它考慮的影響決策的因素是否為確定性的。在換道決策過程中,駕駛員需要考慮本車道以及相鄰車道的狀態(tài),在主動換道決策的情況下,只有某個車道的狀態(tài)讓駕駛員感到滿意,駕駛員才會選擇該車道。在感知范圍內(nèi),駕駛員評價車道狀態(tài)的指標(biāo)主要為在此車道上可以達到的行駛速度和可以享受到行駛空間,這些狀態(tài)都具有不確定性,速度和間距的變化受到前方諸多車輛以及交通環(huán)境的限制,前方車輛的狀態(tài)也在一定范圍內(nèi)波動。同時,前方車輛處于某個狀態(tài)的客觀概率未必存在,即使存在也難以得到。因此,可通過前景理論描述駕駛員利用有限信息進行推理選擇的真實過程。

1.2 模型構(gòu)建

1.2.1 模型框架

前景理論模型的編輯階段首先設(shè)定各評價指標(biāo)的參照點,并將車道的評價屬性分為收益和損失值兩類,利用實際的客觀概率獲取主觀概率。評價階段依據(jù)上一階段的結(jié)果,計算各車道的前景值并選其最大,建模流程如圖1。

圖1 模型框架Fig. 1 Model frame

1.2.2 編輯階段

主動換道決策過程是二項選擇情況下駕駛員的決策過程,駕駛員在感知并評價本車道和相鄰車道的相關(guān)屬性后,主動選擇更滿意的車道。設(shè)換道車開始產(chǎn)生橫向位移的時刻為t0,在t0時刻之前的時間段是換道決策和換道準(zhǔn)備的時間段。由于每位駕駛員具體的決策時間難以估量,為了研究方便,根據(jù)實際數(shù)據(jù)取t0時刻之前的一段時間,這段時間必定包含了駕駛員思考并做出決策的時間,換道場景如圖2。

圖2 換道場景示意Fig. 2 Schematic diagram of lane changing scene

換道決策過程中,駕駛員對目標(biāo)車道的某些指標(biāo)可能更加關(guān)注。但為了滿足用前景值來評價比選不同車道的要求,應(yīng)選取本車道和目標(biāo)車道同等的屬性作為評價指標(biāo)。這些屬性包括速度,速度差,車頭間距,加速度,是否有重型車輛等。如駕駛員會思考換道之后在目標(biāo)車道上,是否會擁有比原車道更大的速度和車頭間距。因為車輛在兩條車道上行駛的速度不同,每個速度值或者是速度區(qū)間出現(xiàn)的概率也不相同,所以這些評價指標(biāo)都是不確定性的指標(biāo)。更大的速度和車頭間距意味著更好的舒適性和更高的效率,這正是決策者所追求的東西,可能影響駕駛員做決策的評價指標(biāo)有:①本車道前車的速度Vcl,本車道后車的速度Vcf,主車與本車道前車的車頭間距Xs-cl,主車與后車的車頭間距Xs-cf;②目標(biāo)車道前車的速度Vtl,目標(biāo)車道后車的速度Vtf,主車與目標(biāo)車道前車的車頭間距Xs-tl,主車與后車的車頭間距Xs-tf。

因為在實際駕駛過程中,駕駛員的主要注意力放在前方車輛上,所以筆者先選取與前車有關(guān)的因素作為評價指標(biāo)。通過查閱大量有關(guān)換道決策過程的文獻,駕駛員主要關(guān)注前方車輛速度和間距兩個因素[14-15]。所研究的換道決策問題是一個風(fēng)險型雙屬性的決策問題,在決策時,駕駛員對這兩個因素的敏感性不同,因此為不同屬性設(shè)立權(quán)重。

確定了評價指標(biāo)后,需要確定不同指標(biāo)的參照點才能計算損益值。參照點選取是前景理論中的重要內(nèi)容。最初,前景理論運用于股票投資領(lǐng)域時,參照點設(shè)立為最初買入股票時的價格,之后的價格漲跌以此為基礎(chǔ)。而后,又有觀點認為參考點應(yīng)該是購買者對股票未來的預(yù)期價格。第3種觀點認為參考點應(yīng)該設(shè)立在初始價格和預(yù)期價格之間。目前,人們對參照點的形成機理并不清晰,參照點的選取往往是主觀設(shè)定。在換道領(lǐng)域,比較適合的做法是選取駕駛員在具體交通條件下期望的速度和間距作為參照點。速度指標(biāo)的參照點應(yīng)根據(jù)實際情況設(shè)立,也應(yīng)滿足道路限速條件的要求。城市道路和公路的速度參照點存在差異,在不同的交通情況下,比如擁堵和暢行兩種交通情況下,駕駛員心中期望的速度也明顯不同。所以,針對具體場景,選取正常條件下?lián)Q道車前車的平均車速作為參照點。間距指標(biāo)參照點的特性和速度指標(biāo)相似,所以選取實際交通條件下,駕駛員在換道決策時間段與前車的平均車頭間距作為參照點。相關(guān)變量的定義如表1。

表1 變量定義Table 1 Variable definition

Xij為車道i對屬性j的結(jié)果,代表Vcl、Xs-cl、Vtl、Xs-tl的值。目前所選取的評價指標(biāo)都是效益型指標(biāo),即駕駛員希望車速越高越好,車與車之間距越大越好。參考點Rj已經(jīng)確定,車道屬性值相對于參考點Rj的收益Gij和損失Lij的計算公式為:

(5)

(6)

將求得的收益和損失代入價值函數(shù)式(1)可求得價值。

收益Gij的價值為:

(7)

損失Lij的價值為:

(8)

計算出價值后,需要計算決策權(quán)重。根據(jù)前景理論中關(guān)于決策權(quán)重函數(shù)的定義,計算決策權(quán)重的基礎(chǔ)是方案出現(xiàn)各種狀態(tài)的客觀概率p。在換道問題上,概率p表示車道上的速度值和間距值出現(xiàn)各種狀態(tài)的客觀概率,由于前車速度變化的隨機性較大,這個客觀概率的獲取比較困難。為了研究方便,繪制決策時間段內(nèi)每間隔0.1 s時速度值和間距值的頻率分布直方圖,以某個速度或間距區(qū)間出現(xiàn)的頻率來評判該區(qū)間出現(xiàn)可能性的大小,并將該頻率值作為客觀概率代入式(2)和式(3)計算。同時,將該速度或間距區(qū)間集中為中間值,用中間值代表此區(qū)間,將連續(xù)的評價指標(biāo)離散化,更方便計算損益值。

直觀上來看,影響本車速度的主要原因包括前面若干車輛的速度,駕駛員會思考并預(yù)估下一時刻前車將出現(xiàn)怎樣的速度,預(yù)估的基礎(chǔ)就是決策時間段內(nèi)前車出現(xiàn)的各種速度狀態(tài),用速度頻率分布直方圖來描述各種速度值出現(xiàn)的可能性比較合理。在判斷該車道對于某個屬性的結(jié)果時,決策者為所有可能的出現(xiàn)結(jié)果概率賦予一個權(quán)重,從而將該結(jié)果發(fā)生的客觀概率轉(zhuǎn)變?yōu)闆Q策者的主觀概率,這就是決策權(quán)重函數(shù)的意義。

以上面的計算結(jié)果為基礎(chǔ),利用前景值計算式(4)可以計算出方案i針對屬性j的前景值。

1.2.3 評價階段

為消除不同物理量綱的影響,需要將前景值V規(guī)范化為V*,規(guī)范化公式為:

(9)

其中:

(10)

最終,每個方案的綜合前景值ui為:

(11)

Wj為評價指標(biāo)的權(quán)重,表示決策者對不同屬性的敏感程度。兩個車道的綜合前景值都計算出來后,比較實際數(shù)值的大小,決策者傾向于選取前景值更大的車道。

1.2.4 Logit模型

離散選擇模型是以建模者對不確定因素的抽象為基礎(chǔ)?;陔S機效用的離散選擇模型無法更加細致的描述決策者真實的決策過程,因此許多學(xué)者嘗試實現(xiàn)前景理論和離散選擇模型的結(jié)合。事實上,在影響車道前景值的很多因素中,有一些因素難以測量,比如車道的路面狀況、氣候、地形等等,這部分隨機變量也將影響車道的前景值。假設(shè)個人在每次選擇中總選擇前景值最大的車道,以此假設(shè)為基礎(chǔ)來推導(dǎo)基于前景理論的Logit模型。二項Logit模型中假定隨機變量ε1和ε2服從二重指數(shù)分布(Gumbel分布),推導(dǎo)出選擇(目標(biāo)車道)的概率為:

(12)

式中:u1、u2可以通過式(11)計算得到。將式(11)中的未知參數(shù)Wj和Gumbel分布中的參數(shù)b相乘,設(shè)為新的參數(shù)xj,采用極大似然估計法來標(biāo)定,并進行精度檢驗。

2 參數(shù)標(biāo)定和模型驗證

2.1 數(shù)據(jù)介紹

使用的數(shù)據(jù)是美國聯(lián)邦公路局NGSIM(next generation simulation)研究計劃所獲得的數(shù)據(jù)。該數(shù)據(jù)采用航測的方法,用高空照相機以每秒10幀的頻率對交通路況進行拍攝,獲得的車輛位置、車長、速度、加速度等信息,時間精確到0.1 s。從處理后的NGSIM中抽取換道和不換道2種情形下的速度和間距數(shù)據(jù),并對數(shù)據(jù)進行進一步篩選。

駕駛員在換道決策的時間段中關(guān)注的因素包括本車道前車的速度值和目標(biāo)車道前車速度值。駕駛員也會考慮換道動作是否能夠帶來速度值的收益,這就需要考量前車速度的變化趨勢。由于換道前后影響路段車速的因素太多,很難預(yù)測出前車速度將處于怎樣的狀態(tài),更難得到產(chǎn)生結(jié)果的客觀概率。事實上,駕駛員在做換道決策時,能接收的信息只是大約的速度分布情況,由此判斷兩車道的“好壞”。因此,采用決策時間段內(nèi)前車速度位于某個速度區(qū)間的頻數(shù)作為駕駛員決策的依據(jù),由此得出駕駛員的心理概率。駕駛員對速度的感知不會特別精確,比如速度值變化較小時,駕駛員難以察覺,在抽取的NGSIM數(shù)據(jù)中,換道決策階段車輛速度的波動性不會太大,所以將速度值分組繪制頻率分布直方圖,組距大部分在5 km/h以下。取速度值每組內(nèi)的中間值作為屬性值,通過這種方式將連續(xù)的速度值離散化,按同樣的思路對間距值進行處理。

從橫向位移產(chǎn)生時刻往前取20 s作為決策階段的數(shù)據(jù),足夠包含駕駛員的主動換道決策時間。分析20 s時間內(nèi)的速度和間距值頻率分布情況,以此作為研究車道上速度和間距變化趨勢的基礎(chǔ),并借助前景理論中的決策權(quán)重函數(shù)計算駕駛員的心理概率。從NGSIM的US-101數(shù)據(jù)庫中提取ID-1069號車的本車道前車速度,20 s內(nèi)的速度頻率分布直方圖,如圖3。

圖3 速度頻率分布直方圖Fig. 3 Histogram of velocity frequency distribution

將速度離散化為15.5、20.5、25.5 km/h等,對應(yīng)的頻率值為30%、20%、21%等。按照這種方式處理數(shù)據(jù),用于模型的運算。篩選數(shù)據(jù)后得到的結(jié)果用途見表2,從US-101中共提取向左換道數(shù)據(jù)148組,不換道數(shù)據(jù)410組。

表2 數(shù)據(jù)篩選結(jié)果Table 2 Data filtering results

2.2 標(biāo)定方法

利用python的statsmodels模塊進行Logit模型參數(shù)標(biāo)定。由于模塊中的Logit模型和Logit模型在形式上有一定的區(qū)別,所以轉(zhuǎn)化式(12),使之成為stats-models 模塊中標(biāo)準(zhǔn)的Logit形式以方便使用該模塊。

(13)

p1/p0是事件發(fā)生的概率和事件不發(fā)生的概率之比,稱之為Odds,對Odds取對數(shù)得到Logit模型,所以該二項選擇的具體Logit模型為:

(14)

將b與W1,W2結(jié)合成為新的參數(shù)x1,x2,以式(14)化簡為:

(15)

使用python3.0編程標(biāo)定未知參數(shù)x1和x2,該參數(shù)包含了Gumbel分布中的參數(shù)b和換道決策不同影響因素的權(quán)重參數(shù)Wj。

使用數(shù)據(jù)Ⅰ進行標(biāo)定,共279組數(shù)據(jù),參數(shù)估計結(jié)果如表3。

表3 前景理論Logit模型標(biāo)定結(jié)果Table 3 Calibration results of Logit model based on prospect theory

使用極大似然函數(shù)估計法進行參數(shù)標(biāo)定得到模型為:

(16)

2.3 標(biāo)定結(jié)果

為驗證模型的適用性,需要對模型的精度進行驗證。通過模型可以計算出p1/p0(Odds),從而得到駕駛員選擇目標(biāo)車道的概率p1。由于模型得出的是一個換道概率的結(jié)果,所以為駕駛員是否換道界定一個分界概率,當(dāng)預(yù)測的換道概率大于等于該值時,判定駕駛員換道,否則不換道。一般選取0.5作為分界值,即預(yù)測概率大于該分界值則駕駛員傾向于換道,否則保持原車道行駛。使用從US-101中提取的數(shù)據(jù)Ⅱ(279組)驗證模型,總的正確率達到67%,其中換道行為預(yù)測的正確率約為74.8%,不換道行為的預(yù)測率約為67.5%。

將1.2.2節(jié)中的所有評價指標(biāo)都考慮在內(nèi)(后車的相關(guān)指標(biāo)),即Xij包括本車道前車的速度Vcl,后車的速度Vcf;主車與本車道前車的車頭間距Xs-cl,與后車的車頭間距Xs-cf;目標(biāo)車道前車的速度Vtl,后車的速度Vtf;主車與目標(biāo)車道前車的車頭間距Xs-tl,與后車的車頭間距Xs-tf。同樣取平均值作為參照點,利用2.1節(jié)中相同的數(shù)據(jù)進行模型的標(biāo)定與驗證,得到的模型預(yù)測正確率約為72%。這表明駕駛員實際決策的過程中,容易忽略本車道后車與目標(biāo)車道后車的一些因素,駕駛員接收的信息有限,自身認知也有限。本車道后車和目標(biāo)車道后車對駕駛員主動換道決策的影響不大,僅選取前車速度和本車與前車車頭間距兩種屬性來計算前景值比較合理。

建立基于隨機效用理論的主動換道模型來比較兩種模型的精度,同樣采用前車速度和車頭間距作為評價車道的指標(biāo),隨機效用理論直接采用實際的車速和間距數(shù)據(jù)來表示車道效用,設(shè)本車道效用為V1,目標(biāo)車道效用為V2:

V1=a0+a1Vcl+a2Xs-cl

(17)

V2=a0+a1Vtl+a2Xs-tl

(18)

根據(jù)隨機效用理論,駕駛員選擇2條車道的決策是獨立的。車道的效用包括固定效用(V1,V2)和隨機效用兩項,假設(shè)隨機效用服從二重指數(shù)分布,可以得到基于隨機效用理論的二項Logit模型:

(19)

從2.1節(jié)的數(shù)據(jù)中抽取200組數(shù)據(jù)標(biāo)定基于隨機效用理論的換道模型,標(biāo)定結(jié)果如表4 。

表4 隨機效用理論Logit模型標(biāo)定結(jié)果Table 4 Calibration results of Logit model of stochastic utility theory

得到的結(jié)果為:

(X12-X22)+0.303 8

(20)

用原200組數(shù)據(jù)驗證以上隨機效用模型,正確率為62.5%。從2.1節(jié)的數(shù)據(jù)中抽取新的148組數(shù)據(jù)驗證模型,正確率為56.8%。其中換道行為預(yù)測的正確率為64.6%,不換道行為預(yù)測的正確率為53%?;趦煞N理論的模型準(zhǔn)確率結(jié)果如表5。

表5 模型準(zhǔn)確率Table 5 Model accuracy

由于采用的相同的數(shù)據(jù)和相同的評價指標(biāo),兩類模型的驗證結(jié)果具有可比性?;陔S機效用理論的主動換道模型對于換道行為的預(yù)測準(zhǔn)確率比基于前景理論的模型低約10%,對不換道行為的預(yù)測精度比前景理論模型少14.5%,預(yù)測不換道行為的失誤代表在隨機效用模型預(yù)測駕駛員本應(yīng)換道的時候,駕駛員并沒有做出更換車道的決策。經(jīng)由式(17)、式(18)計算出的車道效用值是車道的絕對屬性,并非駕駛員對車道的感知與評判,車道的前景值才是從駕駛員角度考慮的決策者對車道的滿意程度。在車道效用值足夠大時,駕駛員可能因為該車道前車速度或間距波動太大而放棄換道。可以看出換道動作實際上存在一定成本,對駕駛員來說,換道也意味著麻煩和一定的風(fēng)險性,在做主動換道決策時,駕駛員不會太過隨意的換道,前景理論相比較于隨機效用理論可以更好的描述這一決策過程。

3 結(jié) 論

基于效用理論的換道模型無法反映駕駛員的有限理性特征,無法表現(xiàn)出駕駛員面對風(fēng)險(收益和損失)的不同態(tài)度以及處理大小概率事件的不同態(tài)度,針對現(xiàn)有模型的不足,筆者將前景理論引入換道決策領(lǐng)域,以前景理論為基礎(chǔ)建立換道決策模型,并將一定時段內(nèi)速度和車頭間距分布作為評價指標(biāo)進行決策,更符合駕駛員真實的決策過程。得到以下結(jié)論:

1)相比較于效用理論換道模型,基于前景理論的換道模型預(yù)測精度更高,可以體現(xiàn)出換道動作存在一定成本,對不換道行為的預(yù)測也更準(zhǔn)確,能更好的描述和預(yù)測換道決策行為。

2)在評價指標(biāo)中,駕駛員對速度的敏感性更高,調(diào)整評價指標(biāo)的數(shù)量,增加考慮后車相關(guān)因素,模型的準(zhǔn)確度變化不大,可以看出駕駛員在主動換道決策中更加關(guān)注前車的相關(guān)因素。

猜你喜歡
效用前景車道
北斗+手機實現(xiàn)車道級導(dǎo)航應(yīng)用
避免跟車闖紅燈的地面車道線
我國旅游房地產(chǎn)開發(fā)前景的探討
淺談MTC車道改造
四種作物 北方種植有前景
小學(xué)美術(shù)課堂板書的四種效用
離岸央票:需求與前景
中國外匯(2019年11期)2019-08-27 02:06:32
量子糾纏的來歷及應(yīng)用前景
太空探索(2016年10期)2016-07-10 12:07:01
納米硫酸鋇及其對聚合物的改性效用
中國塑料(2016年9期)2016-06-13 03:18:48
低速ETC/MTC混合式收費車道的設(shè)計與實現(xiàn)
青海省| 青阳县| 四会市| 新平| 库尔勒市| 田东县| 阜平县| 余干县| 改则县| 象山县| 马山县| 汶川县| 张掖市| 福海县| 崇信县| 贵德县| 浪卡子县| 泸定县| 九龙县| 古丈县| 五常市| 武定县| 马山县| 绥滨县| 公主岭市| 呈贡县| 贵溪市| 故城县| 吉安市| 肇源县| 南宁市| 曲麻莱县| 石台县| 汝阳县| 神农架林区| 凌海市| 六枝特区| 大城县| 旬邑县| 东乡县| 铁力市|