国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹和BN的自動(dòng)駕駛車輛行為決策方法

2022-10-10 08:13:42劉延釗黃志球沈國華王金永
關(guān)鍵詞:結(jié)點(diǎn)決策樹人工

劉延釗,黃志球,沈國華,王金永,徐 恒

(1.南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 南京 211106;2.南京航空航天大學(xué)高安全系統(tǒng)的軟件開發(fā)與驗(yàn)證技術(shù)工業(yè)和信息化部重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 211106;3.軟件新技術(shù)與產(chǎn)業(yè)化協(xié)同創(chuàng)新中心,江蘇 南京 210093)

0 引 言

自動(dòng)駕駛車輛是包含感知、決策和控制三大功能模塊的智能體系統(tǒng)[1]。其中,行為決策模塊的功能是進(jìn)行自動(dòng)駕駛車輛駕駛行為決策,其決策結(jié)果關(guān)乎自動(dòng)駕駛車輛的行駛安全。因此,提高行為決策模塊的智能化水平是自動(dòng)駕駛領(lǐng)域的研究熱點(diǎn)和難點(diǎn)。21世紀(jì)初,美國成功舉辦自動(dòng)駕駛車輛公開賽,掀起了全球自動(dòng)駕駛技術(shù)研究的熱潮。近些年,我國自動(dòng)駕駛產(chǎn)業(yè)蓬勃發(fā)展,隨著科研技術(shù)的突破和成果的產(chǎn)出,自動(dòng)駕駛技術(shù)逐漸地改變了現(xiàn)代人類的生活方式。然而,隨著近些年自動(dòng)駕駛車輛事故的發(fā)生,在社會(huì)上也引起了民眾對(duì)于車輛安全方面的普遍擔(dān)憂。

城市交通中存在的不確定性因素給自動(dòng)駕駛車輛識(shí)別和判斷交通情況并做出合理駕駛行為造成極大的困難。這些不確定性主要體現(xiàn)在交通參與者行為難以預(yù)測(cè)。因此,在城市中進(jìn)行自動(dòng)駕駛是一個(gè)突出的挑戰(zhàn),特別是在許多激進(jìn)的、高速的交通參與者面前[2]。麻省理工學(xué)院的自動(dòng)駕駛車輛技術(shù)(Massachusetts Institute of Technologyautonomous vehicles technology,MIT-AVT)研究結(jié)論表明:由于人類行為在不同層面的差異,自動(dòng)駕駛系統(tǒng)在實(shí)際應(yīng)用過程中面臨巨大挑戰(zhàn),這些挑戰(zhàn)來自于人與環(huán)境交互過程中的不確定性[3]。主要包括以下幾類:①人類在參與交通過程中的行為具有不確定性,主要包含與其他車輛、行人等交通參與者之間信息交互時(shí)的不確定性。②人工駕駛員風(fēng)格、經(jīng)驗(yàn)和其他有助理解、判斷人工駕駛行為等因素的不確定性。③人類對(duì)駕駛環(huán)境的判斷和駕駛方式的差異性。④人類駕駛員駕駛車輛熟練度的差異性。⑤車輛發(fā)生故障時(shí),人類駕駛員故障排除能力的差異性。

自動(dòng)駕駛技術(shù)融入城市交通中,能夠改善交通環(huán)境,提高出行的安全性,減少交通事故的發(fā)生頻率。然而,距離自動(dòng)駕駛完全進(jìn)入現(xiàn)代交通流還要幾十年時(shí)間。在此期間,自動(dòng)駕駛車輛不可避免地要與其他車輛以及車輛內(nèi)部和外部的人進(jìn)行交互[4],因此人類駕駛員仍是最關(guān)鍵的決策者[5]。

當(dāng)前,由于對(duì)駕駛行為分類的研究并不完善,自動(dòng)駕駛領(lǐng)域內(nèi)并沒有形成共識(shí)以供參考來準(zhǔn)確地判斷不同的駕駛行為類別。現(xiàn)有研究對(duì)于分類標(biāo)準(zhǔn)的定義給出了不同的方式。例如Augustynowicz[6]考慮將駕駛行為規(guī)范為[-1,1]的離散值。Constantinescu等[7]采用主成分分析(principal component analysis,PCA)法篩選出5類駕駛行為。Miyajima等[8]利用高斯混合模型(Gaussian mixture model,GMM)來分類駕駛員的行為。Yurtsever等[9]使用詞袋(bag of words,BOW)和K均值聚類算法分類駕駛行為。Sama等[10]使用一個(gè)自編碼網(wǎng)絡(luò)來獲取基于道路類型的駕駛特征。Liu等[11]利用三通道RGB(red green blue)來描述不同的駕駛行為,并利用深度稀疏自編碼器分類不同的駕駛行為。

這些方法雖然在一定程度上對(duì)駕駛風(fēng)格進(jìn)行了定義,但目前的研究尚未形成共識(shí),主要原因在于這些方法對(duì)人工駕駛車輛行為相關(guān)知識(shí)獲取和表達(dá)的研究都限定在某個(gè)具體的交通場(chǎng)景中,且預(yù)測(cè)模型大多為黑盒模型,可解釋性差,若通過豐富場(chǎng)景進(jìn)行知識(shí)獲取,經(jīng)濟(jì)成本和時(shí)間消耗巨大,因此在應(yīng)對(duì)復(fù)雜多變的城市交通環(huán)境時(shí)存在明顯的局限性。在知識(shí)的獲取和表達(dá)方面,目前主要的研究方法有模糊理論、人工神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)。這些方法能夠?qū)χR(shí)進(jìn)行簡單有效地表達(dá),但缺點(diǎn)是無法對(duì)知識(shí)進(jìn)行自動(dòng)獲取,而且實(shí)時(shí)性和推理速度方面存在缺陷。人工神經(jīng)網(wǎng)絡(luò)雖然能解決知識(shí)獲取的問題,但在模型擬合上容易存在“過學(xué)習(xí)”和“欠學(xué)習(xí)”的問題,且模型靈活性較差,學(xué)習(xí)收斂速度慢[12]。

決策樹算法是支持決策過程可視化的白盒模型,在知識(shí)自動(dòng)獲取和準(zhǔn)確表達(dá)方面具有明顯優(yōu)勢(shì),便于引入專家經(jīng)驗(yàn)理解人工駕駛車輛行為和交通場(chǎng)景中多源異構(gòu)信息的關(guān)系,極大地降低了研究影響人工駕駛行為因素的時(shí)間和成本。另外,通過決策樹剪枝可以有效避免過擬合問題,因此在應(yīng)對(duì)駕駛行為的分類問題上具有明顯優(yōu)勢(shì)。

自動(dòng)駕駛車輛行為決策方法按照實(shí)現(xiàn)邏輯可以分為以下兩類:

(1)基于規(guī)則的行為決策方法:常用方法為有限狀態(tài)機(jī)。該方法的邏輯為根據(jù)駕駛經(jīng)驗(yàn)和交通法規(guī)等約束,提前建立規(guī)則匹配機(jī)制,在車輛駕駛過程中根據(jù)實(shí)際情況匹配具體的駕駛行為[13]。代表性的應(yīng)用包括國防科技大學(xué)的紅旗CA7460無人車[14]、美國福特集團(tuán)與卡內(nèi)基梅隆大學(xué)合作的BOSS無人車[15]、麻省理工大學(xué)的Talos無人車[16]、斯坦福大學(xué)與德國大眾公司合作的Junior無人車[17]等?;谝?guī)則的行為決策方法邏輯性強(qiáng),規(guī)劃推理能力強(qiáng),但規(guī)則設(shè)計(jì)復(fù)雜、成本高,對(duì)實(shí)際場(chǎng)景覆蓋率低,推理準(zhǔn)確率低。

(2)基于學(xué)習(xí)算法的行為決策方法:此類方法的邏輯為利用大量數(shù)據(jù)進(jìn)行模型訓(xùn)練來模擬真實(shí)的駕駛環(huán)境,通過模型完成駕駛行為選擇[18]?;趯W(xué)習(xí)算法的行為決策中常用的方法為:部分可觀測(cè)馬爾可夫決策過程[19](partially observable Markov decision process,POMDP)、卷積神經(jīng)網(wǎng)絡(luò)[20]、貝葉斯網(wǎng)絡(luò)(Bayesian network,BN)等。Ulbrich等[21]通過提出基于非線性動(dòng)態(tài)BN的場(chǎng)景建模方法,提高了自動(dòng)駕駛車輛換道的可靠性。Brechtel[22]在POMDP模型的基礎(chǔ)上嵌入BN,減小了行為決策過程中由于環(huán)境感知不確定帶來的風(fēng)險(xiǎn)。Liu等[23]利用深度強(qiáng)化學(xué)習(xí)算法解決高速公路上的水平?jīng)Q策問題,無碰撞地完成了導(dǎo)航任務(wù)。代表應(yīng)用有智能先鋒II號(hào)無人車[24]、英偉達(dá)端到端卷積神經(jīng)網(wǎng)絡(luò)決策系統(tǒng)[25]等。與基于規(guī)則的行為決策方法相比,基于學(xué)習(xí)算法的行為決策方法具有更高的推理準(zhǔn)確率和真實(shí)場(chǎng)景覆蓋率。同時(shí),也存在一些大數(shù)據(jù)領(lǐng)域的普遍問題,即數(shù)據(jù)依賴性強(qiáng)、模型可解釋性差[26]等問題。

針對(duì)當(dāng)前自動(dòng)駕駛車輛行為決策研究中存在的缺乏人工駕駛車輛行為相關(guān)知識(shí)的獲取與表達(dá)、對(duì)交通場(chǎng)景中不確定性因素考慮不充分等問題,本文提出利用決策樹算法進(jìn)行人工駕駛行為分類,并結(jié)合BN概率推理的自動(dòng)駕駛車輛行為決策模型。

1 人工駕駛車輛行為分類模型

1.1 決策樹的概念

決策樹是依據(jù)決策建立起來的、用來分類和決策的樹結(jié)構(gòu)。概括地說,決策樹算法的邏輯可以描述為if-then,根據(jù)樣本的特征屬性按照“某種順序”排列成樹形結(jié)構(gòu),將樣本的屬性取值按照if-then邏輯逐個(gè)自頂向下分類,最后歸結(jié)到某一個(gè)確定的類中?!澳撤N順序”是指決策樹的屬性選擇方法。以二叉決策樹為例,樹形結(jié)構(gòu)由結(jié)點(diǎn)和邊組成,決策樹的結(jié)點(diǎn)代表分類問題中樣本的某個(gè)屬性,邊的含義為是與否兩種情況,即樣本屬性取值是否符合當(dāng)前分類依據(jù)。

1.1.1 決策樹的屬性選擇方法

決策樹學(xué)習(xí)的關(guān)鍵在于選擇劃分屬性。屬性的選擇流程可簡略表述為:首先,計(jì)算訓(xùn)練樣本中每個(gè)屬性的“貢獻(xiàn)度”,選擇貢獻(xiàn)最高的屬性作為根結(jié)點(diǎn)。根結(jié)點(diǎn)下擴(kuò)展的分支將依據(jù)根結(jié)點(diǎn)所代表屬性的取值決定(例如根結(jié)點(diǎn)代表的屬性為性別,則分支為男和女)。然后,將已經(jīng)被選擇為結(jié)點(diǎn)的屬性從候選屬性集中剔除,接著不斷重復(fù)進(jìn)行候選屬性集合中剩余屬性的“貢獻(xiàn)度”的計(jì)算和選擇,直至達(dá)到預(yù)設(shè)的模型訓(xùn)練閾值(例如達(dá)到?jīng)Q策樹最大深度)。最后,得到一棵能較好地?cái)M合訓(xùn)練樣本分布的決策樹模型。

根據(jù)屬性選擇方法的不同,可以把決策樹的生成算法分為以下3種:

(1)ID3(iterative dichotomiser 3)算法:信息增益大的屬性優(yōu)先。首先,計(jì)算所有候選屬性的信息增益,選擇其中信息增益最大的屬性作為根結(jié)點(diǎn)。然后,按照根結(jié)點(diǎn)所代表屬性的取值決定分支情況。其次,將已選擇屬性從候選集中刪除,并計(jì)算剩余屬性的信息增益。最后,選擇信息增益最大的結(jié)點(diǎn)作為子結(jié)點(diǎn),直至所有屬性都已選擇。信息熵是用來衡量樣本純度指標(biāo)的,是計(jì)算信息增益的前提,定義為

式中:D為樣本集合;p k為D中第k類樣本所占的比例,其計(jì)算方式為

式中:Ck表示集合D中屬于第k類樣本的樣本子集。

假設(shè)D中某個(gè)具有V個(gè)取值的屬性為A,取值分別為{a1,a2,…,a V}。根據(jù)不同的取值將D中的樣本劃分為V個(gè)子集。其中,取值為av的樣本屬于第v個(gè)子集,記作D v。

根據(jù)式(1)可以計(jì)算出樣本D v的信息熵。通過增加各分支權(quán)重|D v|/|D|使樣本數(shù)量多的結(jié)點(diǎn)具有更大的“影響”[27]。首先,計(jì)算屬性A對(duì)于數(shù)據(jù)集D的條件熵Ent(D|A):

然后,計(jì)算用屬性a對(duì)樣本集合D進(jìn)行劃分所得的信息增益=信息熵-條件熵:

通過對(duì)所有屬性的信息增益進(jìn)行計(jì)算,選擇信息增益最大的屬性作為結(jié)點(diǎn)添加入樹,重復(fù)進(jìn)行屬性的信息增益計(jì)算和選擇過程,最終構(gòu)建出一棵分類決策樹。

(2)C4.5算法:信息增益率大于平均值的屬性優(yōu)先。信息增益率即為各屬性信息增益所占比例。因此,屬性取值的個(gè)數(shù)越少,信息增益率反而越高,這就導(dǎo)致信息增益率準(zhǔn)則更偏向于取值個(gè)數(shù)少的屬性。因此,在ID3算法中各屬性信息增益計(jì)算的基礎(chǔ)上,C4.5算法運(yùn)用了一個(gè)啟發(fā)式原則:首先,計(jì)算每個(gè)屬性的信息增益率,進(jìn)而計(jì)算所有屬性的平均信息增益率。然后,按照信息增益率與平均信息增益率的大小關(guān)系,將屬性分為兩類。最后,選擇信息增益率大于平均值,且數(shù)值最大的屬性。信息增益率的計(jì)算方式為

式中:H A(D)是與屬性A有關(guān)的定值。通常,取值為樣本集合D的信息熵:

(3)分類與決策樹(classification and regression tree,CART)算法:基尼指數(shù)小的屬性優(yōu)先。CART不再以信息增益為基礎(chǔ)進(jìn)行屬性的選擇,而是采用一種代表樣本不純度的指標(biāo)對(duì)屬性進(jìn)行度量,這種不純度指標(biāo)叫做基尼指數(shù)。基尼指數(shù)越小代表樣本的純度越高。基尼指數(shù)的定義為

1.1.2 決策樹算法選擇

決策樹依靠不同的屬性選擇方法生成樹結(jié)構(gòu),但如果不加干預(yù)地任其生長,可能導(dǎo)致生成的決策樹規(guī)模太過龐大,對(duì)訓(xùn)練數(shù)據(jù)學(xué)習(xí)的“過分好”,這類問題被稱為過擬合。剪枝策略常被用于減少過擬合風(fēng)險(xiǎn)。剪枝是指對(duì)決策樹的分支進(jìn)行修剪,防止決策樹規(guī)模過大的一類方法。按照對(duì)分支修剪時(shí)間的不同,可分成“預(yù)剪枝”和“后剪枝”策略。其中,預(yù)剪枝策略是指在未確定劃分結(jié)點(diǎn)前,判斷決策樹是否進(jìn)一步生長的。例如,該結(jié)點(diǎn)劃分并不能提高分類準(zhǔn)確率,則拒絕使用該結(jié)點(diǎn)進(jìn)行劃分。后剪枝是指在已經(jīng)生成決策樹的基礎(chǔ)上加以調(diào)整,得到更精簡的后剪枝決策樹的策略。但實(shí)際上修剪樹是為了縮小決策樹的規(guī)模,如果修剪過度,則會(huì)導(dǎo)致學(xué)習(xí)結(jié)果過于“簡單”,從而導(dǎo)致欠擬合問題。

ID3算法以信息增益為標(biāo)準(zhǔn)選擇屬性,缺點(diǎn)為:①?zèng)]有剪枝策略,容易導(dǎo)致過擬和問題。②屬性取值個(gè)數(shù)越多,信息增益越大。③只能用于處理離散分布的屬性。④沒有考慮缺失值。

對(duì)于ID3算法存在的缺點(diǎn),C4.5算法有了一定的改進(jìn)。C4.5通過剪枝策略可以有效降低過擬合風(fēng)險(xiǎn)。以信息增益率為標(biāo)準(zhǔn),克服了ID3對(duì)取值個(gè)數(shù)多的屬性的傾向問題。通過選擇相鄰樣本平均數(shù)作為劃分點(diǎn),來處理連續(xù)屬性。用沒有缺失值的樣本子集來填充,解決數(shù)據(jù)缺失的問題。但C4.5算法同樣存在一些不足:①剪枝策略可以再優(yōu)化。②C4.5使用多叉樹,效率不如二叉樹高。③C4.5只用于分類,不能用于回歸任務(wù)。④C4.5基于熵運(yùn)算,設(shè)計(jì)大量對(duì)數(shù)運(yùn)算,耗時(shí)較長。

CART算法在C4.5的基礎(chǔ)上進(jìn)行了改進(jìn)。CART算法基于“代價(jià)復(fù)雜度”,剪枝效率更高。CART是二叉樹結(jié)構(gòu),運(yùn)算效率高,且既可以用于分類,也可以用來回歸。CART算法通過計(jì)算基尼指數(shù)進(jìn)行結(jié)點(diǎn)劃分,避免了費(fèi)時(shí)的對(duì)數(shù)運(yùn)算。

基于以上不同算法的對(duì)比,并結(jié)合實(shí)際應(yīng)用中自動(dòng)駕駛車輛數(shù)據(jù)集龐大,對(duì)運(yùn)算速度要求高,需要對(duì)缺失值處理等原因,本文采用性能最好的CART算法作為構(gòu)建決策樹模型的方法。

1.2 預(yù)測(cè)模型

人工駕駛行為預(yù)測(cè)模型如圖1所示。

圖1 人工駕駛行為預(yù)測(cè)模型Fig.1 Prediction model of human-driving behaviors

1.2.1 線下訓(xùn)練

人工駕駛行為預(yù)測(cè)流程分為模型的構(gòu)建和行為預(yù)測(cè)兩部分。模型的構(gòu)建部分就是線下訓(xùn)練獲得最優(yōu)模型并導(dǎo)出的過程,該流程主要分為3個(gè)階段:

(1)數(shù)據(jù)預(yù)處理階段:該階段的目的是采集數(shù)據(jù)并提取數(shù)據(jù)特征形成訓(xùn)練模型的數(shù)據(jù)集。首先,利用輔助駕駛軟件PreScan搭建仿真場(chǎng)景并采集數(shù)據(jù),通過PCA降低數(shù)據(jù)的相關(guān)性,獲得了人工駕駛車輛速度、與人工駕駛車輛相對(duì)距離、剎車次數(shù)等數(shù)據(jù)主屬性。然后,計(jì)算得到與人工駕駛車輛相對(duì)速度等屬性具有一定相關(guān)性,且對(duì)分析人工駕駛行為具有重要意義的屬性。最后,對(duì)數(shù)據(jù)進(jìn)行篩選并進(jìn)入模型訓(xùn)練階段。

(2)模型訓(xùn)練階段:該階段的目的是根據(jù)訓(xùn)練數(shù)據(jù)對(duì)決策樹模型進(jìn)行學(xué)習(xí)。首先,計(jì)算每個(gè)屬性對(duì)于數(shù)據(jù)集的基尼指數(shù)?;嶂笖?shù)代表了有放回抽樣實(shí)驗(yàn)中,從一個(gè)樣本空間中選擇的兩個(gè)樣本不相同的概率。然后,選擇基尼指數(shù)最小的屬性作為劃分結(jié)點(diǎn),并產(chǎn)生分支。其中,每個(gè)分支代表的子樹部分的數(shù)據(jù)純度比父結(jié)點(diǎn)劃分前數(shù)據(jù)純度高,以此來代表對(duì)樣本進(jìn)行了進(jìn)一步的分類。最后,遞歸地執(zhí)行屬性的基尼指數(shù)計(jì)算。隨著結(jié)點(diǎn)的劃分,每個(gè)結(jié)點(diǎn)中的樣本純度逐漸增大,即更傾向于同一類別。為了防止決策樹的過擬合問題,在模型訓(xùn)練時(shí)可以預(yù)先設(shè)置訓(xùn)練閾值(如決策樹最大深度等)。當(dāng)結(jié)點(diǎn)的分裂過程中參數(shù)達(dá)到了訓(xùn)練閾值,就結(jié)束決策樹的生成過程,并通過后剪枝策略將生成的決策樹中那些對(duì)樣本分類“貢獻(xiàn)”低的分枝剪掉。剪枝策略能夠縮小決策樹的規(guī)模,有效地防止過擬合問題,從而提升訓(xùn)練模型的泛化能力。

(3)模型優(yōu)化階段:該階段的目的是對(duì)模型的最優(yōu)參數(shù)進(jìn)行選擇。由于搜索過程是一個(gè)遍歷模型候選參數(shù)的過程,若模型參數(shù)的取值過多,則遍歷過程復(fù)雜且耗時(shí)。因此,采用網(wǎng)格搜索的模型參數(shù)選擇方法。首先,通過設(shè)置每個(gè)參數(shù)的取值范圍和增量大小,降低遍歷過程的復(fù)雜度,從而獲得最優(yōu)模型參數(shù)。然后,導(dǎo)出最優(yōu)模型訓(xùn)練參數(shù)和模型文件,用于最優(yōu)模型的線下預(yù)測(cè)階段。

1.2.2 在線預(yù)測(cè)

人工駕駛行為預(yù)測(cè)模型的在線預(yù)測(cè)部分的功能是將自動(dòng)駕駛車輛傳感器獲得的時(shí)空數(shù)據(jù)輸入到最優(yōu)模型中,進(jìn)行人工駕駛行為在線預(yù)測(cè)。最優(yōu)模型的分類精度與行為預(yù)測(cè)結(jié)果將組合成標(biāo)簽 概率對(duì),作為自動(dòng)駕駛行為決策模型的一個(gè)輸入。

1.3 分類模型評(píng)價(jià)指標(biāo)

二分類問題中通常包括兩類結(jié)果,即正類和反類,根據(jù)分類模型對(duì)屬于不同類別的數(shù)據(jù)預(yù)測(cè)結(jié)果的不同,可以將結(jié)果分為以下4種情況:

(1)真正類TP:實(shí)際與預(yù)測(cè)結(jié)果均為正類。

(2)真反類TN:實(shí)際與預(yù)測(cè)結(jié)果均為反類。

(3)假反類FN:實(shí)際為正類,預(yù)測(cè)結(jié)果為反類。

(4)假正類FP:實(shí)際為反類,預(yù)測(cè)結(jié)果為正類。

根據(jù)以上4種分類結(jié)果,定義查準(zhǔn)率P和查全率R分別為

在實(shí)際的分類模型評(píng)價(jià)標(biāo)準(zhǔn)中,最常用的是F1度量,它是查準(zhǔn)率P和查全率R的調(diào)和平均。

由于人工駕駛行為分類模型的訓(xùn)練是一個(gè)多分類任務(wù),考慮F1度量的兩種計(jì)算方式,微觀F1(micro-F1)和宏觀F1(macro-F1),兩者的區(qū)別在于micro-F1是通過計(jì)算所有類別總的P和R,然后計(jì)算F1的值,而macro-F1是通過計(jì)算每個(gè)類別的P和R,然后計(jì)算F1,最后將每個(gè)類別的F1取平均得到。

由于本文人工駕駛行為分類模型訓(xùn)練所用數(shù)據(jù)較平衡,故采用macro-F1作為分類模型的評(píng)價(jià)指標(biāo)。

2 基于BN的行為決策模型

2.1 BN的相關(guān)概念

BN是一種以貝葉斯公式為基礎(chǔ)的概率圖模型,BN的結(jié)構(gòu)是一個(gè)有向無環(huán)圖(directed acyclic graph,DAG),圖中結(jié)點(diǎn)被稱為BN結(jié)點(diǎn),若結(jié)點(diǎn)之間存在依賴關(guān)系,則由一條有向邊連接,方向?yàn)楸灰蕾嚱Y(jié)點(diǎn)指向依賴結(jié)點(diǎn)[28]。BN的參數(shù)由結(jié)點(diǎn)的概率值和結(jié)點(diǎn)間的條件概率表(conditional probability table,CPT)組成,CPT用來描述屬性的聯(lián)合概率分布。具體來說,一個(gè)BN由結(jié)構(gòu)G和參數(shù)θ兩部分構(gòu)成,即BN=〈G,θ〉,網(wǎng)絡(luò)結(jié)構(gòu)G是一個(gè)DAG,每個(gè)結(jié)點(diǎn)對(duì)應(yīng)一個(gè)屬性,若兩個(gè)屬性有直接依賴關(guān)系,則二者由一條有向邊連接起來,由父結(jié)點(diǎn)指向子結(jié)點(diǎn);參數(shù)θ定量描述這種依賴關(guān)系,假設(shè)屬性x i在G中的父結(jié)點(diǎn)集合為πi,則θ包含了每個(gè)屬性的條件概率表

BN結(jié)構(gòu)表達(dá)屬性之間的條件獨(dú)立性,給定父結(jié)點(diǎn)集,BN假設(shè)每個(gè)屬性與其非后裔屬性獨(dú)立,即屬性x1,x2,…,x d的聯(lián)合概率分布定義為

2.2 BN的學(xué)習(xí)與推斷

2.2.1 BN學(xué)習(xí)

BN通過有向邊將網(wǎng)絡(luò)中各個(gè)結(jié)點(diǎn)連接起來,當(dāng)其中的某個(gè)結(jié)點(diǎn)狀態(tài)發(fā)生變化時(shí),與其直接或間接相連的結(jié)點(diǎn)也會(huì)隨之更新,這個(gè)過程稱為貝葉斯推理。推理的前提是構(gòu)建出符合問題需求的BN模型,為了充分利用BN概率推理的能力,學(xué)習(xí)得到一個(gè)好的DAG和CPT十分重要。

BN學(xué)習(xí)分為結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)兩部分[29]。

結(jié)構(gòu)學(xué)習(xí)是指構(gòu)建出符合問題需求的DAG結(jié)構(gòu),常用方法為基于采樣的馬爾可夫鏈蒙特卡羅(Markov chain Monte Carlo,MCMC)方法,該方法是基于馬爾可夫鏈實(shí)現(xiàn)的參數(shù)估計(jì)方法。通過構(gòu)造先驗(yàn)分布,來模擬待估計(jì)參數(shù)可能的分布情況。隨著狀態(tài)的變化,馬爾可夫鏈逐漸收斂,從收斂后的馬爾可夫鏈中按照一定的采樣標(biāo)準(zhǔn)進(jìn)行樣本采樣,用采樣的樣本逼近待估計(jì)參數(shù)的后驗(yàn)分布。

假設(shè),存在連續(xù)型變量x∈X,變量x的概率密度為p(x),根據(jù)連續(xù)性變量的概率定義可知,變量x在其定義域X內(nèi)的期望為

如果存在另外的函數(shù)f,滿足f(x)在定義域X內(nèi)均有定義,那么f(x)在定義域X上的期望為

則式(14)的無偏估計(jì)為

式中:x1,x2,…,x n是獨(dú)立同分布的隨機(jī)變量。

如果連續(xù)變量x的概率密度p(x)比較復(fù)雜,那么式(14)中的積分運(yùn)算將無法進(jìn)行。而MCMC方法通過采樣樣本來逼近真實(shí)分布的方式避免了困難的積分運(yùn)算問題。其中,采樣的樣本是有限個(gè)數(shù)的,并且服從真實(shí)分布情況的。

將馬爾可夫鏈狀態(tài)轉(zhuǎn)移的概率概率記作T(x′|x),t時(shí)刻的狀態(tài)分布記作p(x t)。如果滿足如下條件:

那么,稱p(x)為馬爾可夫鏈的平穩(wěn)分布。式(16)被稱為馬爾可夫鏈的細(xì)致平穩(wěn)條件。

MCMC的采樣方式中,具有代表性的算法為Metropolis-Hastings(MH)算法。通過“拒絕采樣”來近似得到平穩(wěn)分布,M H算法流程如下所示。

參數(shù)學(xué)習(xí)是指在已知貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的情況下,構(gòu)建當(dāng)前結(jié)構(gòu)各結(jié)點(diǎn)代表的屬性之間的CPT。目前最常用的參數(shù)學(xué)習(xí)方法為最大似然估計(jì)[30](maximum likelihood estimation,MLE),通過采樣數(shù)據(jù)進(jìn)行參數(shù)估計(jì)。假設(shè)數(shù)據(jù)集D c包含訓(xùn)練集D中所有屬于類別c的樣本,并且這些樣本滿足獨(dú)立同分布性質(zhì),那么,便可得到參數(shù)θc對(duì)于數(shù)據(jù)集D c的似然為

P(D c|θc)取最大值時(shí)的參數(shù)值便是θc進(jìn)行最大似然估計(jì)。求解過程如下:

由于似然函數(shù)為連乘形式,且概率P滿足P>0,所以對(duì)似然函數(shù)等號(hào)兩邊同時(shí)取對(duì)數(shù)得到對(duì)數(shù)似然(log-likelihood,LL):

2.2.2 貝葉斯推斷

BN訓(xùn)練好(即結(jié)構(gòu)和條件概率表確定)后,便可以用來進(jìn)行“查詢”即概率推理[31-32],通過一些屬性變量的觀測(cè)值來推測(cè)其他屬性變量的取值,這個(gè)過程被稱為貝葉斯推斷,屬性變量觀測(cè)值稱為“證據(jù)”。

貝葉斯推斷的過程就是貝葉斯公式計(jì)算的過程。貝葉斯公式為

式中:H表示待推斷假設(shè);E表示證據(jù);P(H)稱為先驗(yàn)概率,即證據(jù)E未被觀測(cè)前對(duì)于H基于現(xiàn)有知識(shí)的認(rèn)知;P(E)稱為歸一化常數(shù),或邊緣似然率,是一個(gè)定值;P(H|E)稱為后驗(yàn)概率,是推斷的結(jié)果;P(E|H)稱為似然,指在給定假設(shè)下,證據(jù)與假設(shè)的相容程度,是E的函數(shù)。

貝葉斯推斷的具體步驟如下:

步驟1確定BN結(jié)構(gòu)和CPT,并基于先驗(yàn)知識(shí),構(gòu)建初始的BN。

步驟2觀測(cè)到證據(jù)后,根據(jù)證據(jù)更新網(wǎng)絡(luò)。若證據(jù)是根結(jié)點(diǎn),則沿著邊緣正向傳播,若為子結(jié)點(diǎn),則沿著邊緣反向傳播。即根據(jù)貝葉斯規(guī)則,計(jì)算新的先驗(yàn)條件概率。

步驟3根據(jù)計(jì)算出的先驗(yàn)條件概率,沿著邊緣逐個(gè)更新各結(jié)點(diǎn)的后驗(yàn)概率。

步驟4當(dāng)有新的證據(jù)被觀測(cè)到時(shí),執(zhí)行步驟2和步驟3更新所有結(jié)點(diǎn)的后驗(yàn)概率。

2.3 BN決策結(jié)果的選擇依據(jù)

BN實(shí)際是由一些結(jié)點(diǎn)以條件概率的形式,直接或間接連接起來的,直觀上看,結(jié)點(diǎn)與結(jié)點(diǎn)之間靠有向邊連接,但實(shí)際是以概率的形式互相影響的,所以BN支持從原因到結(jié)果的正向推斷,也支持從結(jié)果到原因的反向推斷。同時(shí)BN支持流式數(shù)據(jù)的更新,觀測(cè)到證據(jù)后BN得到更新,而當(dāng)新數(shù)據(jù)到來時(shí),前期更新得到的后驗(yàn)概率又作為新證據(jù)的先驗(yàn)概率參與BN更新,不要求這些證據(jù)同時(shí)出現(xiàn),符合實(shí)際交通場(chǎng)景中不同行為的非同時(shí)性,這個(gè)過程叫做貝葉斯更新。最終的更新結(jié)果為各結(jié)點(diǎn)的后驗(yàn)概率,因此本文以后驗(yàn)概率最大為選擇依據(jù)。

2.4 BN決策模型

利用BN構(gòu)建自動(dòng)駕駛車輛行為決策模型。決策額框架如圖2所示。該框架分為BN學(xué)習(xí)階段和BN駕駛行為決策階段。首先,根據(jù)駕駛場(chǎng)景信息進(jìn)行BN學(xué)習(xí),結(jié)合先驗(yàn)知識(shí)進(jìn)行最優(yōu)結(jié)構(gòu)篩選。然后,將學(xué)習(xí)到的BN模型導(dǎo)出。最后,將傳感器實(shí)時(shí)數(shù)據(jù)和人工駕駛行為預(yù)測(cè)結(jié)果輸入到模型中,進(jìn)行BN概率推理,獲得最優(yōu)駕駛動(dòng)作。

圖2 自動(dòng)駕駛車輛行為決策框架Fig.2 Framework of behavioral decision-making of autonomous vehicles

3 案例分析

3.1 駕駛場(chǎng)景分析

在復(fù)雜且充滿不確定性的城市交通環(huán)境中,自動(dòng)駕駛車輛的行為決策系統(tǒng)能否充分考慮復(fù)雜的路況以及不確定性因素,直接影響著自動(dòng)駕駛車輛行駛的安全性?,F(xiàn)階段,自動(dòng)駕駛車輛的研究已經(jīng)取得了一些成果,但短時(shí)間內(nèi)完全取代人工駕駛車輛仍無法實(shí)現(xiàn),所以人工駕駛車輛與自動(dòng)駕駛車輛共存的交通環(huán)境仍是研究的主要方向。對(duì)于人工駕駛車輛來說,駕駛員的操作尤其重要,然而真實(shí)世界中,絕大部分的交通事故都是由于人類駕駛員的錯(cuò)誤操作引起的。2016年2月,谷歌自動(dòng)駕駛車輛與加州的一輛公交車相撞,據(jù)谷歌官方說法,當(dāng)時(shí)自動(dòng)駕駛車輛正在山景城菲利斯大道上向北行駛,一輛在國王大道上向西行駛的公交突然闖紅燈,最終導(dǎo)致兩車相撞。事故調(diào)查結(jié)果顯示,當(dāng)時(shí)谷歌自動(dòng)駕駛車輛試圖并道時(shí)與一輛行駛的公交車相撞,汽車中的工作人員表示自己當(dāng)時(shí)認(rèn)為公交車會(huì)放慢車速讓汽車通過,因此并未采取任何應(yīng)對(duì)措施,但實(shí)際上公交車非但沒減速,反而加速轉(zhuǎn)彎,這就是導(dǎo)致事故發(fā)生的主要原因。由此次事故可見,人工駕駛車輛的行為的確會(huì)影響自動(dòng)駕駛車輛的安全,在某些情況下,忽略這一因素甚至?xí)?dǎo)致嚴(yán)重的交通事故。另外,在城市交通中,不遵守交通規(guī)則的行為時(shí)有發(fā)生,例如行人無視紅綠燈橫穿馬路、車輛爭(zhēng)搶路口強(qiáng)行超車等行為。另外在車輛眾多、識(shí)別難度大的場(chǎng)景,例如停車場(chǎng)等,自動(dòng)駕駛車輛要能給出合理、高效的駕駛行為也顯得尤為重要。

根據(jù)以上情形設(shè)置駕駛場(chǎng)景,并針對(duì)各場(chǎng)景進(jìn)行行為決策分析以及仿真實(shí)驗(yàn)驗(yàn)證,重點(diǎn)針對(duì)場(chǎng)景一進(jìn)行詳細(xì)分析,其他場(chǎng)景的分析結(jié)果將在仿真實(shí)驗(yàn)中展示。

場(chǎng)景1還原谷歌2016年事故場(chǎng)景。在十字路口處,自動(dòng)駕駛車輛處在同向兩車道右側(cè)由南向北行駛,初速度為6 m/s,車道中心線為虛線(即允許在安全的情況下進(jìn)行換道操作),路口附近有一向西行駛的人工駕駛車輛企圖進(jìn)入右側(cè)車道繼續(xù)向北行駛,到達(dá)路口時(shí)速度為10 m/s,加速度為2 m/s2。

場(chǎng)景2在城市中一個(gè)雙向四車道前方有人行道的路況下,自動(dòng)駕駛車輛由西向東在最右側(cè)車道以10 m/s的速度行駛,左前方、左后方、前方同車道各有一輛人工駕駛車輛,人行道處有行人橫穿馬路。

場(chǎng)景3存在多車輛的停車場(chǎng),自動(dòng)駕駛車輛欲安全穩(wěn)步提速駛離停車場(chǎng),加速度為3 m/s2。

3.2 決策模型構(gòu)建

3.2.1 人工駕駛行為分類模型

在自動(dòng)駕駛車輛行駛的過程中,將傳感器獲得的自動(dòng)駕駛車輛周圍車輛的信息(如速度,是否正常使用轉(zhuǎn)向燈等),與周圍車輛關(guān)系信息(如相對(duì)距離,相對(duì)速度等)以及環(huán)境信息(如交通燈,人行道等)輸入訓(xùn)練好人工駕駛行為分類模型進(jìn)行在線預(yù)測(cè)獲得駕駛行為類別,并將該類別以及分類準(zhǔn)確率作為BN行為決策模型的一個(gè)輸入。

3.2.2 BN行為決策模型

BN的結(jié)點(diǎn)代表了交通環(huán)境中參與決策的要素,結(jié)點(diǎn)間的有向邊表示結(jié)點(diǎn)間的因果關(guān)系。結(jié)點(diǎn)中包含結(jié)點(diǎn)名稱、屬性,結(jié)點(diǎn)間通過條件概率相互關(guān)聯(lián)。

以場(chǎng)景1為例,行為決策模型中所應(yīng)用的BN結(jié)點(diǎn)的名稱及含義如表1所示。

表1 BN結(jié)點(diǎn)及其含義Table 1 Name and meaning of BN nodes

表1中僅列舉了場(chǎng)景1中涉及到參與決策的結(jié)點(diǎn),本文利用BN工具Netica實(shí)現(xiàn)BN結(jié)構(gòu)的創(chuàng)建,訓(xùn)練和概率推理,以最大后驗(yàn)概率準(zhǔn)則為依據(jù)選擇自動(dòng)駕駛車輛最優(yōu)駕駛行為。場(chǎng)景1的初始BN如圖3所示。

圖3 場(chǎng)景1的初始BNFig.3 Initial BN of scenario 1

圖3中描述了3類信息:

(1)道路信息(車道,車道線,交通燈,人行道,障礙物):用于自動(dòng)駕駛車輛識(shí)別周圍交通道路情況,以確定可能采取的駕駛行為,如車道線為虛線,則表示允許換道操作。

(2)其他交通參與者信息(行人,右前方車輛,駕駛行為類別):這類信息是自動(dòng)駕駛車輛需要及時(shí)應(yīng)對(duì)的交通環(huán)境中的不確定性因素,要想做出安全可靠的駕駛行為,需要對(duì)這些交通參與者的行為做出及時(shí)的應(yīng)對(duì),如行人橫穿馬路,車輛需減速避讓。

(3)自動(dòng)駕駛車輛信息(自動(dòng)駕駛車輛):根據(jù)道路信息確定的自動(dòng)駕駛車輛可能的駕駛行為。

3.3 駕駛行為決策

駕駛行為決策過程即BN概率推理過程,在訓(xùn)練好的BN基礎(chǔ)上,當(dāng)“證據(jù)”被觀測(cè)到(即傳感器獲取了當(dāng)前道路信息和其他交通參與者信息)時(shí),將BN中對(duì)應(yīng)結(jié)點(diǎn)的概率值依次更新,進(jìn)而依次更新其他各結(jié)點(diǎn)的后驗(yàn)概率,得到場(chǎng)景1更新后的BN如圖4所示。

圖4 場(chǎng)景1更新后的BNFig.4 Updated BN of scenario 1

圖4中除駕駛行為類別和自動(dòng)駕駛車輛結(jié)點(diǎn)外,其余結(jié)點(diǎn)的概率值均通過車輛傳感器實(shí)時(shí)獲取,其中駕駛行為類別結(jié)點(diǎn)的概率值由人工駕駛行為分類模型獲得,根據(jù)場(chǎng)景1仿真實(shí)驗(yàn)過程中監(jiān)測(cè)數(shù)據(jù),經(jīng)人工駕駛行為分類模型預(yù)測(cè)的結(jié)果為aggressive,模型分類精度為88%,以標(biāo)簽-概率對(duì)(aggressive,0.88)作為BN中駕駛行為類別結(jié)點(diǎn)的“證據(jù)”。BN行為決策的結(jié)果在自動(dòng)駕駛車輛結(jié)點(diǎn)中顯示,根據(jù)圖4中BN概率推理的結(jié)果,基于最大后驗(yàn)概率準(zhǔn)則,自動(dòng)駕駛車輛行為決策的結(jié)果為減速左轉(zhuǎn),即減速向左做出避讓行為。

3.4 對(duì)比實(shí)驗(yàn)

谷歌自動(dòng)駕駛車輛事故的主要原因是由于自動(dòng)駕駛車輛錯(cuò)誤預(yù)估了公交車的行為,本文通過構(gòu)造場(chǎng)景1情況下無人工駕駛行為分類模型的自動(dòng)駕駛車輛行為決策模型(以下稱為單一決策模型)來驗(yàn)證本文模型。

場(chǎng)景1中單一決策模型的初始BN如圖5所示。

圖5 單一決策模型的BNFig.5 BN of single decision-making model

依次更新各結(jié)點(diǎn)后驗(yàn)概率,得到更新后單一決策模型BN如圖6所示。

圖6 單一決策模型的更新后BNFig.6 Updated BN of single decision-making model

根據(jù)最大后驗(yàn)概率準(zhǔn)則,單一決策模型的決策結(jié)果為加速直行,與自動(dòng)駕駛車輛行為決策模型的結(jié)果不同,將在第4節(jié)仿真實(shí)驗(yàn)中驗(yàn)證行為決策結(jié)果的正確性。

4 仿真實(shí)驗(yàn)

4.1 仿真工具介紹

PreScan是一款西門子公司旗下的汽車駕駛仿真軟件,支持全球定位系統(tǒng)(global positioning system,GPS)、雷達(dá)等多種功能的開發(fā)應(yīng)用。該工具主要功能[33]分為4部分:駕駛場(chǎng)景建模、車載傳感器配置、車輛控制系統(tǒng)搭建和運(yùn)行結(jié)果可視化。PreScan能夠便捷地搭建交通場(chǎng)景,支持與Matlab/Simulink、CarSim等軟件進(jìn)行聯(lián)合仿真,場(chǎng)景模型搭建操作方便。同時(shí),支持真實(shí)地圖導(dǎo)入,能夠較好地吻合真實(shí)場(chǎng)景,適用于自動(dòng)駕駛、輔助駕駛等系統(tǒng)的開發(fā)與驗(yàn)證。智能駕駛系統(tǒng)在PreScan中的仿真實(shí)現(xiàn)過程如圖7所示。

圖7 PreScan仿真過程Fig.7 Simulation process of PreScan

4.2 場(chǎng)景與控制算法搭建

PreScan支持簡易界面操作和編程操作兩種方式進(jìn)行場(chǎng)景搭建,并且可以通過拖拽方式添加車輛、行人等交通參與者,同時(shí)提供多種傳感器設(shè)備可以實(shí)時(shí)收集車輛運(yùn)行數(shù)據(jù)和環(huán)境數(shù)據(jù)。根據(jù)駕駛場(chǎng)景1建模,其三維建模結(jié)果如圖8所示,其中黑色車輛代表自動(dòng)駕駛車輛,白色車輛代表人工駕駛車輛。

圖8 場(chǎng)景1的三維模型Fig.8 Three dimensional model of scenario 1

駕駛場(chǎng)景2的三維模型建模結(jié)果如圖9所示。其中,黑色車輛代表自動(dòng)駕駛車輛,其他顏色車輛代表人工駕駛車輛。

圖9 場(chǎng)景2的三維模型Fig.9 Three dimensional model of scenario 2

駕駛場(chǎng)景3的三維模型建模結(jié)果如圖10所示。其中,位于道路中間的黑色車輛代表自動(dòng)駕駛車輛,其他車輛表示在停車位中的人工駕駛車輛。

圖10 場(chǎng)景3的三維模型Fig.12 Three dimensional model of scenario 3

設(shè)置好駕駛場(chǎng)景和交通參與者后,通過PreScan中提供的Simulink模塊接口,設(shè)置車輛的動(dòng)力學(xué)模型和行為決策控制算法,從而完成對(duì)車輛的運(yùn)動(dòng)控制。以場(chǎng)景1為例,車輛的動(dòng)力學(xué)模型如圖11所示。

圖11 場(chǎng)景1中的車輛動(dòng)力學(xué)模型Fig.11 Dynamic model of autonomous vehicle in scenario 1

在simulink中搭建行為決策算法,其結(jié)果如圖12所示。

圖12 Simulink中搭建的行為決策算法Fig.12 Algorithm of behavioral decision-making in Simulink

4.3 實(shí)驗(yàn)分析

將場(chǎng)景1中車輛行駛數(shù)據(jù)導(dǎo)出,如圖13所示,其中圖13(a)為速度隨時(shí)間變化情況,圖13(b)為加速度隨時(shí)間變化情況。

圖13(a)的第3 s時(shí)右前方車輛開始加速準(zhǔn)備通過路口,這一信息被自動(dòng)駕駛車輛傳感器獲取,自動(dòng)駕駛車輛速度降低,5 s后速度逐漸恢復(fù)至6 m/s,圖13(b)的加速度變化情況也符合這一情況。通過PreScan中的三維Viewer模塊可視化仿真過程,路口處車輛行為如圖14所示。

圖13 場(chǎng)景1中車輛行駛數(shù)據(jù)Fig.13 Data of driving vehicles in scenario 1

圖14 路口處車輛行為Fig.14 Behavior of vehicle in intersection

由以上結(jié)果可知,自動(dòng)駕駛車輛做出了減速避讓的駕駛行為,成功地避免了類似谷歌自動(dòng)駕駛車輛事故的發(fā)生。然而單一決策模型的決策結(jié)果為減速直行,將會(huì)導(dǎo)致與人工駕駛車輛發(fā)生碰撞。

將場(chǎng)景2中的車輛行駛數(shù)據(jù)導(dǎo)出,如圖15所示。

圖15 場(chǎng)景2中車輛行駛數(shù)據(jù)Fig.15 Data of driving vehicles in scenario 2

由圖15(a)和圖15(b)可知,自動(dòng)駕駛車輛在行駛臨近人行道時(shí),行人橫穿馬路引得周圍車輛減速,自動(dòng)駕駛車輛的行為決策結(jié)果為逐漸減速避讓。

場(chǎng)景3中自動(dòng)駕駛車輛行駛路線如圖16所示。

圖16 場(chǎng)景3中自動(dòng)駕駛車輛行駛路線Fig.16 Route of autonomous vehicle in scenario 3

由行駛路線可知,自動(dòng)駕駛車輛成功駛離車輛眾多的停車場(chǎng)。

5 結(jié)束語

本文針對(duì)自動(dòng)駕駛車輛行為決策研究中缺乏人工駕駛車輛行為相關(guān)知識(shí)的獲取與表達(dá)、對(duì)交通場(chǎng)景中不確定性因素考慮不充分等問題進(jìn)行了深入研究,提出了以人工駕駛行為分類為基礎(chǔ),利用BN建模駕駛場(chǎng)景并進(jìn)行最優(yōu)駕駛動(dòng)作推理的自動(dòng)駕駛車輛行為決策方法。

本文的研究內(nèi)容如下:

(1)基于決策樹算法建立人工駕駛車輛行為分類模型,解決了影響自動(dòng)駕駛車輛行為決策的因素相關(guān)知識(shí)的獲取與表達(dá)方面的問題,設(shè)置對(duì)比實(shí)驗(yàn)驗(yàn)證了該模型的必要性,提高了行為決策模型在應(yīng)對(duì)交通環(huán)境中交通參與者行為復(fù)雜難以預(yù)測(cè)方面的魯棒性。

(2)基于BN算法建立自動(dòng)駕駛車輛行為決策模型,解決了交通場(chǎng)景中不確定性因素考慮不充分的問題。利用BN建模駕駛場(chǎng)景并進(jìn)行最優(yōu)駕駛動(dòng)作推理,提高了自動(dòng)駕駛車輛在城市交通環(huán)境中行為決策的安全性。

(3)基于自動(dòng)駕駛仿真工具PreScan設(shè)置駕駛場(chǎng)景仿真環(huán)境,并設(shè)置車輛控制算法等要素,以仿真方式驗(yàn)證了本文提出的自動(dòng)駕駛車輛行為決策方法的可靠性。

本文研究中仍存在不足之處,需要未來繼續(xù)深入研究:

(1)本文中人工駕駛行為分類模型的構(gòu)建基于仿真實(shí)驗(yàn)獲得的數(shù)據(jù)集,未來應(yīng)在更豐富的數(shù)據(jù)集上進(jìn)行訓(xùn)練。對(duì)于人工駕駛車輛行為分類所依賴的屬性以及類別的劃分仍需根據(jù)實(shí)際情況進(jìn)行調(diào)整,未來可根據(jù)更多的領(lǐng)域經(jīng)驗(yàn)進(jìn)行改進(jìn)。

(2)本文中只考慮了行為決策的安全性,而實(shí)際生活中還有更多需要考慮的因素,如舒適性、效率等。未來可在決策模型中增加效用結(jié)點(diǎn)以擴(kuò)展駕駛動(dòng)作的選擇標(biāo)準(zhǔn),使決策模型給出更安全,舒適的駕駛動(dòng)作。

(3)本文行為決策的目標(biāo)行為設(shè)計(jì)粒度較粗,未來可考慮基于橫縱向解耦的方法對(duì)決策行為進(jìn)一步細(xì)化,以達(dá)到更精準(zhǔn)的行為決策結(jié)果。

猜你喜歡
結(jié)點(diǎn)決策樹人工
人工3D脊髓能幫助癱瘓者重新行走?
軍事文摘(2022年8期)2022-11-03 14:22:01
人工,天然,合成
人工“美顏”
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點(diǎn)個(gè)數(shù)估計(jì)
新型多孔鉭人工種植牙
基于決策樹的出租車乘客出行目的識(shí)別
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
基于Raspberry PI為結(jié)點(diǎn)的天氣云測(cè)量網(wǎng)絡(luò)實(shí)現(xiàn)
柳河县| 化隆| 邵武市| 和政县| 洪湖市| 云安县| 神池县| 德昌县| 普兰县| 桐城市| 宁南县| 山东| 台安县| 孟津县| 贵州省| 宝兴县| 屯昌县| 济阳县| 龙游县| 琼中| 裕民县| 那坡县| 垦利县| 临漳县| 图木舒克市| 饶河县| 同德县| 溆浦县| 突泉县| 南丹县| 阜新市| 十堰市| 肃南| 万荣县| 太和县| 安义县| 卢氏县| 泸西县| 高邑县| 八宿县| 上饶市|