陳君毅 陳磊 蒙昊藍 熊璐
(同濟大學,上海 201804)
隨著自動駕駛技術的發(fā)展,自動駕駛汽車在現(xiàn)實道路上的滲透率將逐步提高[1]。為促進智能汽車技術的不斷進步,Meng[2]提出了基于行駛自治性、學習進化性和交通協(xié)調(diào)性的智能性評價框架,其中,交通協(xié)調(diào)性是指車輛對交互趨勢的預判能力以及對交互行為的實施能力,用來刻畫車輛社會合作能力。在智能系統(tǒng)社會行為方面,基于社會化行為的智能系統(tǒng)決策規(guī)劃算法也被廣泛地研究[3-5]。由此可見,車輛社會合作行為正在成為行業(yè)內(nèi)的研究熱點,影響著自動駕駛技術的社會接受度。因此,研究一種合適的評價方法來考察自動駕駛汽車交通協(xié)調(diào)性是非常重要的。
目前,國內(nèi)外針對自動駕駛汽車評價技術已開展了較多的研究。在評價空間尺度方面,現(xiàn)有研究多通過單車行駛行為評價車輛本身在一定外界條件下的某項或多項能力,如:Dong[6]針對自動駕駛U 型轉(zhuǎn)彎工況,考察自動駕駛汽車的智能性、合規(guī)性和感知能力;Sun等[7]針對避障和U 型轉(zhuǎn)彎等綜合行駛工況,考察車輛安全性、舒適性及軌跡平滑度。
在評價方法方面,現(xiàn)有研究多以主觀評價為主。王越超等[8]提出了蛛網(wǎng)模型,利用專家的知識、經(jīng)驗評價車輛智能性;Zhang[9]提出了一種基于層次分析的評價方法,通過專家對指標的權重評判和評分得到智能性的量化得分結(jié)果。也有學者采用基于層次分析的模糊綜合評價法,實現(xiàn)智能汽車綜合性能的量化評價[10-11]。為了降低主觀因素的影響,部分學者開始探索主、客觀映射評價方法。Du等[12]通過BP神經(jīng)網(wǎng)絡構(gòu)建了自動泊車系統(tǒng)主觀評價得分與客觀行駛數(shù)據(jù)之間的映射關系模型。
綜上所述:在評價空間尺度方面,現(xiàn)有評價方法都只針對單車行駛行為,缺乏考慮自動駕駛汽車與其他交通參與者的交互情況;在評價方法方面,多以主觀評價為主,由于每次評價的評判標準無法保證統(tǒng)一,導致評價結(jié)果不穩(wěn)定,且無法支持自動化評價,評價效率較低。
本文針對匝道匯入的兩車交互場景,以主觀評價結(jié)果作為輸出,選取客觀表征指標集作為輸入,并設計單一交互測試用例,進行仿真采集數(shù)據(jù),進而對基于神經(jīng)網(wǎng)絡的映射評價模型進行訓練和驗證。
BP 神經(jīng)網(wǎng)絡可以模擬人體大腦神經(jīng)系統(tǒng)的功能,從已知數(shù)據(jù)中自動地歸納規(guī)則,進而獲得這些數(shù)據(jù)的內(nèi)在規(guī)律,具有很強的非線性映射能力[13-14],能很好地應用于分類和回歸等問題。因此,本文通過BP 神經(jīng)網(wǎng)絡來構(gòu)建映射關系模型。
為確定模型輸入,本文以研究團隊的前序研究為基礎[15],根據(jù)自動駕駛汽車交通協(xié)調(diào)性內(nèi)涵,即交互質(zhì)量、交互效率和對車內(nèi)人員舒適度的影響[2],設計了與之對應的智能性、高效性和舒適性3項評價準則。在智能性方面,交互質(zhì)量是圖靈思想的重要體現(xiàn),在自車乘員視角和對手車駕駛員視角分別表現(xiàn)為自動駕駛汽車行為合理度和擬人度[16];在高效性方面,在自動駕駛汽車綜合性能評價研究中,其通常以任務完成效率來表示[6];在舒適性方面,相關研究表明,其受自動駕駛汽車行為控制和外部行駛環(huán)境等綜合影響,可分為體感舒適度和觀感舒適度[17]。因此,本文提出了描述交通協(xié)調(diào)性的5類子準則,如圖1所示。
根據(jù)交通協(xié)調(diào)性評價子準則含義,選取相對應的客觀表征指標。擬人度是指自動駕駛汽車行駛行為與人類的接近程度,低擬人度會導致對手車因不適應自車行為而受到影響,故以對手車速度變化δv反映自車行為擬人度。合理度通常用來度量自動駕駛汽車路徑規(guī)劃的質(zhì)量[6],對于本文匝道匯入場景而言,以自車合并距離D來反映自車匯入路徑合理度。任務完成效率通常以任務完成度和完成時間來衡量,本文采用自車變道時間t和成功變道率φ表征匯入任務完成效率。車內(nèi)人員體感舒適度和觀感舒適度分別受自車運動狀態(tài)和兩車相對運動狀態(tài)的影響[18],故以自車并線過程的最大縱向加速度ax、最大前輪轉(zhuǎn)角δ來反映縱向和側(cè)向體感舒適度,以自車并線過程的兩車最小車頭間距Dx、最小車頭時距tTHW和最小側(cè)向間距Dy、最大側(cè)向相對速度Δv反映縱向和側(cè)向上的觀感舒適度?;诖?,建立由上述指標構(gòu)成的客觀表征指標集。
圖1 交通協(xié)調(diào)性評價準則
為確定模型輸出,考慮到單個視角對交互過程的觀察有限,無法僅通過自車視角來理解和評估自車行為對對手車的影響,故提出了對手車駕駛員、自車乘員以及全局俯視視角3類視角。其中,對手車駕駛員視角用于評估自車行為對對手車的影響,自車視角及全局俯視視角用于評估自車在混合交通中的交互質(zhì)量和對乘員舒適性的影響。由多個專家組成的評價組通過該3 類視角對智能汽車交通協(xié)調(diào)性表現(xiàn)進行全方位評價,然后計算所有專家評價結(jié)果的平均值作為模型輸出。
BP 神經(jīng)網(wǎng)絡由輸入層、隱含層和輸出層3 個部分組成。輸入層的每個節(jié)點為每項客觀表征指標集的實測數(shù)據(jù);輸出層為對智能汽車交通協(xié)調(diào)性表現(xiàn)的主觀評價結(jié)果。
理論分析[19]證明,具有單隱含層的網(wǎng)絡可以映射所有的連續(xù)函數(shù),而增加隱含層數(shù)量雖然可以在一定程度上降低網(wǎng)絡誤差、提高精度,但會使網(wǎng)絡復雜化,且易出現(xiàn)過擬合現(xiàn)象。所以一般優(yōu)先考慮3 層BP 神經(jīng)網(wǎng)絡(即含有1個隱含層),如圖2所示。
隱含層神經(jīng)元數(shù)量L的選擇對網(wǎng)絡模型的訓練也非常重要,其與輸入和輸出的指標數(shù)量均相關[12,20],其大概范圍可由式(1)得到:
式中,m為輸入層神經(jīng)元數(shù)量;n為輸出層神經(jīng)元數(shù)量;α為0~10范圍內(nèi)的整數(shù)。
圖2 BP神經(jīng)網(wǎng)絡拓撲結(jié)構(gòu)
交通協(xié)調(diào)性評價模型的構(gòu)建需要不同交互類型樣本數(shù)據(jù)的支撐?;诮换y試樣本生成的目的,為滿足交互測試的高效性、數(shù)據(jù)采集的方便性,本文選擇在仿真環(huán)境下開展研究。
本文利用PreScan以G15沈海高速上海某段匝道匯入路口的車道尺寸數(shù)據(jù)為基礎,構(gòu)建兩車道高速公路匝道口匯入路段如圖3 所示,其中,A、B、C、D代表自車匯入行車道的大致位置,仿真環(huán)境如圖4 所示,匝道口匯入路段各部分的長度和功能如表1所示。
圖3 高速公路匝道口匯入場景示意
圖4 匝道匯入仿真環(huán)境
表1 高速公路匝道口匯入路段道路明細
為了獲取典型的匝道匯入單一交互測試用例,本文采用交互因素屬性組合的方式進行用例設計。結(jié)合場景要素的研究基礎[21],動態(tài)要素通常包括自車行為信息、對手車行為信息以及車間行為信息。故,本文設定6 種因素如表2 所示,然后對各因素的不同屬性進行正交排列組合,同時考慮屬性之間的相關性并篩除不合理的組合情況,最終得到30組不同類型的交互測試用例,所有測試用例在測試開始時的車速均為60 km/h。
表2 交互組合因素屬性
為了在仿真環(huán)境中進行單一交互測試用例仿真,并記錄自車和對手車的交互過程數(shù)據(jù),本文搭建了駕乘人員在環(huán)仿真平臺,平臺框架如圖5所示。
圖5 駕乘人員在環(huán)仿真平臺
在仿真過程中,測試人員通過PreScan 實時輸出的視景信息獲得道路交通情況,進而利用駕駛模擬器分別控制仿真環(huán)境中自車和對手車輛的油門、制動和轉(zhuǎn)向,模擬所設計的測試用例中不同駕駛風格、決策、車輛動力學控制方式、匯入位置和匯入相對位置。然后,車輛控制信號通過MATLAB 中的車輛動力學模型輸出仿真車輛運行狀態(tài)數(shù)據(jù),同時在仿真環(huán)境中實時更新并展示給測試人員,最終完成不同類型的交互測試。
該仿真平臺可記錄測試過程中的車輛行駛狀態(tài)數(shù)據(jù),并經(jīng)數(shù)據(jù)處理獲得最終的客觀表征指標集的實測數(shù)據(jù);同時,評價專家通過觀察對手車駕駛員視角、自車乘員視角及全局俯視視角視頻,采用差-、差、差+、較差-、較差、較差+、中-、中、中+、較好-、較好、較好+、好-、好和好+共15 個等級對每個測試用例中車輛交通協(xié)調(diào)性表現(xiàn)進行主觀評價,且分別用數(shù)字1~15 來量化評價等級,獲得主觀評價結(jié)果,用S表示。
30組試驗樣本實測數(shù)據(jù)如表3所示。其中:自車合并距離D指自車匯入點位置與加速車道起始端的距離;對手車速度變化δv指自車開始并線到進入目標車道過程中對手車受自車行為影響的車速變化量;自車變道時間t基于自車與匝道口虛線的相對位置定義,指自車車頭開始壓線到自車車尾過線所用時間;自車成功變道率φ以自車從駛?cè)爰铀佘嚨赖匠晒R入目標車道的過程中采取的變道行為次數(shù)的倒數(shù)表示;自車最大縱向加速度ax、自車最大前輪轉(zhuǎn)角δ和兩車最大側(cè)向相對速度Δv取從自車開始變道到進入目標車道的過程中側(cè)向相對速度的最大值;兩車最小側(cè)向間距Dy、兩車最小縱向間距Dx和兩車最小車頭時距tTHW取從自車開始變道到進入目標車道過程中指標數(shù)據(jù)的最小值,其中tTHW是兩車縱向間距與后車車速的比值。
為了刻畫客觀表征指標集中每個參數(shù)的范圍,本文針對測試樣本的客觀指標實測數(shù)據(jù)進行描述性統(tǒng)計,結(jié)果如表4所示。
表3 試驗樣本實測數(shù)據(jù)
表4 客觀指標數(shù)據(jù)描述性統(tǒng)計結(jié)果
為了分析客觀表征指標集中各指標與主觀評價結(jié)果的相關性,本文利用SPSS數(shù)據(jù)分析軟件對30組測試樣本數(shù)據(jù)進行皮爾遜(Pearson)相關性分析,統(tǒng)計分析結(jié)果如表5所示。
表5 客觀指標與主觀評價結(jié)果相關性分析
統(tǒng)計分析結(jié)果表明:自車合并距離和兩車最小車頭時距與主觀評價結(jié)果不存在顯著相關性(P>0.05);其他客觀指標與主觀評價結(jié)果存在顯著相關性(P≤0.05)。因此,本文最終選取除自車合并距離和兩車最小車頭時距之外的其他8項客觀指標作為客觀表征指標集,進而與主觀評價結(jié)果構(gòu)建映射關系模型。
在30 組樣本數(shù)據(jù)中,本文隨機選取了22 組作為訓練樣本,分別將歸一化處理后的客觀表征指標的實測數(shù)據(jù)和主觀評價結(jié)果作為映射模型的訓練輸入和期望輸出,然后使用MATLAB 神經(jīng)網(wǎng)絡工具箱進行訓練,從而獲得映射評價模型。利用其余的8 組經(jīng)歸一化處理后的樣本數(shù)據(jù)對評價模型的有效性進行驗證。
神經(jīng)網(wǎng)絡輸入、輸出數(shù)據(jù)的單位和數(shù)量級都不相同,數(shù)據(jù)數(shù)量級差別較大可能造成網(wǎng)絡預測誤差較大,并且對輸入和輸出數(shù)據(jù)進行一定的預處理,可以加快網(wǎng)絡的訓練速度。因此,對數(shù)據(jù)進行歸一化預處理:
式中,Ni為第i個數(shù)據(jù)的歸一化處理結(jié)果;xi為第i個數(shù)據(jù)的原始值;xmax、xmin分別為數(shù)據(jù)的理論最大值和最小值。
利用式(1)計算,并經(jīng)多次調(diào)試,最終選擇隱含層神經(jīng)元數(shù)量為6 個。神經(jīng)網(wǎng)絡模型性能優(yōu)劣除與選擇的隱含層數(shù)量、神經(jīng)元數(shù)量有關,還與傳遞函數(shù)、訓練函數(shù)以及神經(jīng)網(wǎng)絡模型的訓練參數(shù)有關。本文采用的訓練函數(shù)為Trainlm,傳遞函數(shù)分別為Logsig、Tansig 和Purelin,訓練參數(shù)如表6所示。
表6 神經(jīng)網(wǎng)絡參數(shù)設置
模型訓練的均方誤差如圖6所示,由圖6可知:隨著迭代次數(shù)的增加,均方誤差逐漸減小,最小為1.134×10-5,小于目標均方誤差;模型的輸出值與期望輸出值的線性回歸系數(shù)R=0.999 82,說明該模型的性能較好,能很好地實現(xiàn)客觀指標數(shù)據(jù)到主觀評價的映射。
圖6 訓練均方誤差曲線
模型訓練的擬合結(jié)果如圖7所示,映射模型歸一化評價得分與主觀評價得分很接近,平均誤差為0.002 3,最大誤差為0.009 2。
圖7 BP神經(jīng)網(wǎng)絡訓練擬合結(jié)果
通過輸入8 個驗證樣本的客觀指標數(shù)據(jù),獲得模型評價得分,并與主觀評價得分進行比較,結(jié)果如表7所示。
表7 映射評價模型驗證結(jié)果
本文采用各樣本數(shù)據(jù)評價精度的平均值作為模型精度,計算公式為:
式中,Ψ為映射評價模型精度;ri、pi分別為第i個驗證樣本的模型評價和主觀評價歸一化得分。
根據(jù)表8的驗證結(jié)果,計算可得映射評價模型的精度為92.8%,模型評價精度較高,能夠較為準確地通過客觀表征指標實測數(shù)據(jù)評價車輛交通協(xié)調(diào)性表現(xiàn)。
研究結(jié)果驗證了基于BP神經(jīng)網(wǎng)絡的映射評價方法的可行性和準確性,應用該模型,只需計算客觀指標數(shù)據(jù)即可得到符合專家主觀評價標準的得分,省去了繁瑣的專家主觀打分過程。由于用作評價模型輸入的所有數(shù)據(jù)的歸一化處理均由預先編寫的程序完成,評價模型可在較短時間內(nèi)獲得結(jié)果。該評價模型適用于自動化評價大批量交互樣本,評價效率較高。
本文以匝道匯入處的兩車交互場景為例,提出了基于BP 神經(jīng)網(wǎng)絡的交通協(xié)調(diào)性主、客觀映射評價方法。通過分析交通協(xié)調(diào)性評價準則,構(gòu)建了描述兩車交互行為的客觀表征指標集;設計了30組單一交互測試用例,并在駕乘人員在環(huán)仿真平臺上進行仿真采集數(shù)據(jù)。評價模型訓練和驗證結(jié)果表明,模型的評價得分與專家主觀評價得分相近,模型精度達到92.8%。
未來將對復雜交通流環(huán)境下的交通協(xié)調(diào)性評價方法進行研究。其一,由于復雜交通流將涉及多輛對手車,車輛之間的交互次數(shù)將增加;其二,多車之間的交互行為表現(xiàn)更為復雜和時變;其三,對多車形成的局部交通的觀察及評價的空間尺度將較兩車交互更大。因而需要針對這些特點,進一步研究主、客觀映射評價方法。