陳吉清 舒孝雄 蘭鳳崇? 王俊峰
(1.華南理工大學(xué) 機(jī)械與汽車工程學(xué)院,廣東 廣州510640; 2.廣東省汽車工程重點(diǎn)實(shí)驗(yàn)室,廣東 廣州510640)
道路交通安全問(wèn)題是世界性問(wèn)題,而自動(dòng)駕駛汽車無(wú)疑對(duì)減少交通事故的發(fā)生具有重要意義。隨著無(wú)人駕駛技術(shù)等級(jí)的提高,面向傳統(tǒng)汽車的測(cè)試工具與測(cè)試方法已不能滿足自動(dòng)駕駛汽車測(cè)試的需要,基于場(chǎng)景的自動(dòng)駕駛系統(tǒng)(ADSs)車輛測(cè)試及評(píng)估相關(guān)的仿真框架和標(biāo)準(zhǔn)已成為當(dāng)前的研究熱點(diǎn)[1- 2]。自動(dòng)駕駛汽車場(chǎng)景化測(cè)試的核心在于定向構(gòu)建高測(cè)試需求場(chǎng)景,而自動(dòng)駕駛汽車的駕駛場(chǎng)景主要來(lái)源有標(biāo)準(zhǔn)法規(guī)、自然駕駛數(shù)據(jù)、交通事故數(shù)據(jù)、模擬數(shù)據(jù)[2- 3]。自然駕駛數(shù)據(jù)場(chǎng)景不能充分驗(yàn)證自動(dòng)駕駛汽車在危險(xiǎn)場(chǎng)景下的安全性,而交通事故場(chǎng)景具有真實(shí)危險(xiǎn)場(chǎng)景的特征,能夠補(bǔ)充自動(dòng)駕駛汽車的高風(fēng)險(xiǎn)場(chǎng)景。
國(guó)外基于交通事故數(shù)據(jù)的自動(dòng)駕駛或高級(jí)駕駛輔助系統(tǒng)(ADAS)的測(cè)試場(chǎng)景研究較多[4- 6],而國(guó)內(nèi)在基于自然駕駛數(shù)據(jù)或交通事故數(shù)據(jù)構(gòu)建測(cè)試場(chǎng)景方面主要集中在研究汽車-兩輪車(TWS)場(chǎng)景、汽車-行人場(chǎng)景[7- 9],很少考慮道路路段類型的測(cè)試場(chǎng)景研究[10]。由于國(guó)情的差異,中國(guó)的交通環(huán)境具有獨(dú)特交通特征,有別于歐美等國(guó)家。有研究指出歐盟的車輛事故發(fā)生在交叉路口的事故數(shù)占1/3,在十字路口的致命傷害和嚴(yán)重傷害比例最高,約為43.9%和43.2%[11];而中國(guó)的車輛交通事故多發(fā)生在普通路段(包括無(wú)交叉路口的直路和曲率較小的彎道),死亡人數(shù)占總死亡人數(shù)的76.25%,其次是交叉路口(包括三枝分叉口、四枝分叉口、多分枝交叉口和環(huán)形交叉),占17.5%[12]。城市道路中,普通路段和交叉路口路段人流密集、交通工具多樣和交通環(huán)境復(fù)雜是事故發(fā)生的主要原因。在城市道路上,自動(dòng)駕駛汽車或智能網(wǎng)聯(lián)汽車主要應(yīng)用在物流、共享出行和公共交通等領(lǐng)域的應(yīng)用場(chǎng)景,而且目前針對(duì)行人的AEB測(cè)試場(chǎng)景研究和法規(guī)較為成熟[10,13],因此相比人-車事故的場(chǎng)景研究,更需要對(duì)城鎮(zhèn)道路上包含乘用車與駕乘交通工具的道路使用者的測(cè)試場(chǎng)景進(jìn)行研究。
文中基于641例涉及道路路段類型的真實(shí)事故數(shù)據(jù),選擇了合理的場(chǎng)景要素和聚類變量,通過(guò)對(duì)聚類變量的獨(dú)熱編碼和聚類分析,結(jié)合天氣、第1碰撞點(diǎn)位置、車輛速度和事故發(fā)生前車輛具體運(yùn)動(dòng)類型4個(gè)危險(xiǎn)事故特征構(gòu)建了自動(dòng)駕駛測(cè)試場(chǎng)景。
國(guó)家車輛事故深度調(diào)查體系(NAIS)數(shù)據(jù)庫(kù)是一個(gè)采集較為嚴(yán)重車輛交通事故的數(shù)據(jù)庫(kù),是中國(guó)起步最早、最詳細(xì)的交通事故數(shù)據(jù)庫(kù)之一。道路類型一般可分為公路和城市道路,公路可分為高速公路、一級(jí)公路等。在NAIS數(shù)據(jù)庫(kù)中,道路按路段信息可分為普通路段、三枝分叉口、四枝分叉口、多分枝交叉口、環(huán)形交叉、高架路段、匝道口、隧道和其他特殊路段等路段。
為了保證數(shù)據(jù)的代表性和典型性,對(duì)NAIS數(shù)據(jù)庫(kù)中1 909例事故數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析后,再確定場(chǎng)景數(shù)據(jù)。在數(shù)據(jù)中共有1 130例事故數(shù)據(jù)(在參與方總數(shù)為2的事故中占70.7%),包含了所有路段的數(shù)據(jù),如表1所示。根據(jù)表1的數(shù)據(jù)分布,最后將641例全部的普通路段和路口路段(包括T型路口和X型路口)事故案例作為場(chǎng)景數(shù)據(jù),其中經(jīng)過(guò)事故重建的事故數(shù)據(jù)有134例,占21%,滿足下一步分析危險(xiǎn)事故特征的需要。
表1 數(shù)據(jù)分布Table 1 Distribution of data
文中選擇采用漢明距離(Hamming Distance)和K-Medoids聚類算法中常見(jiàn)的PAM算法[9,11],并利用R語(yǔ)言進(jìn)行實(shí)現(xiàn)。為解決同一名義尺度變量多屬性取值的問(wèn)題,采取對(duì)名義變量進(jìn)行了獨(dú)熱編碼的數(shù)據(jù)前處理,這與國(guó)內(nèi)場(chǎng)景研究[7- 8,10]的解決方案相比更具有靈活處理非連續(xù)型數(shù)值特征的優(yōu)勢(shì),同時(shí)也在一定程度上進(jìn)行了特征擴(kuò)充。
(1)漢明距離
假設(shè){A1,A2,…,Am}是一個(gè)樣本的屬性特征序列,對(duì)象X和Y由唯一的{A1,A2,…,Am}描述,X由{x1,x2,…xm}描述,Y由{y1,y2,…,ym}描述,則定義d(X,Y)是向量X=(x1,x2,…,xm)與向量Y=(y1,y2,…,ym)之間對(duì)應(yīng)元素不相等的個(gè)數(shù)和[14]。
(1)
(2)
(2)獨(dú)熱編碼
獨(dú)熱編碼又稱一位有效編碼,其方法是使用N位狀態(tài)寄存器來(lái)對(duì)N個(gè)狀態(tài)進(jìn)行編碼,每個(gè)狀態(tài)都有獨(dú)立的寄存器位,并且在任意時(shí)候,其中只有一位有效[15]。
(3)PAM算法和聚類質(zhì)量評(píng)價(jià)
PAM算法適用于樣本數(shù)量較小的聚類分析,它分為構(gòu)建和交換兩個(gè)步驟[11]。對(duì)聚類質(zhì)量的評(píng)價(jià)和簇?cái)?shù)k的選擇上,選擇平均輪廓系數(shù)(ASW)為K-Medoids算法聚類質(zhì)量的評(píng)價(jià)指標(biāo)是合理的[11]。ASW比較均衡地體現(xiàn)了簇內(nèi)的聚合度和簇間的分離度,ASW值的取值范圍為[-1,1],一般來(lái)說(shuō)ASW值越高,聚類質(zhì)量越好。
自動(dòng)駕駛系統(tǒng)面臨的主要挑戰(zhàn)是復(fù)雜的城市環(huán)境、臨時(shí)工作區(qū)域和惡劣天氣條件下的能見(jiàn)度差,而路面特征、道路線形和照明被認(rèn)為是次要影響因素[11]。因此,針對(duì)復(fù)雜的城市環(huán)境這一影響要素,結(jié)合交通環(huán)境要素和測(cè)試車輛基礎(chǔ)信息兩大測(cè)試場(chǎng)景要素,以及對(duì)場(chǎng)景可量化、可復(fù)現(xiàn)和高保真的要求[2],進(jìn)行了場(chǎng)景要素的確定,并以此為基礎(chǔ)進(jìn)行聚類變量的選擇。目前對(duì)場(chǎng)景要素的種類和具體內(nèi)容還有待研究[2],所以將車輛速度和交互對(duì)象速度作為危險(xiǎn)事故特征來(lái)描述場(chǎng)景。進(jìn)一步結(jié)合事故數(shù)據(jù)分布選擇的場(chǎng)景要素如圖1所示。
圖1 場(chǎng)景要素
通過(guò)對(duì)1 130例事故數(shù)據(jù)的初步統(tǒng)計(jì)分析,將641例場(chǎng)景數(shù)據(jù)按照路口類型分為兩類分別進(jìn)行聚類分析比較合理:第1類是無(wú)路口的普通路段(376例),第2類是路口路段(265例)??紤]到車輛的駕駛動(dòng)作和相對(duì)運(yùn)動(dòng)可以較大程度地描述事故雙方的運(yùn)動(dòng)情況,結(jié)合事故雙方的碰撞部位和交通法規(guī)可以確定交互對(duì)象的駕駛動(dòng)作和起始方位,而且在實(shí)際交通環(huán)境中,交互對(duì)象駕駛動(dòng)作往往具有復(fù)雜性和多樣性,所以不將交互對(duì)象駕駛動(dòng)作作為聚類變量。綜上,選擇時(shí)間、路段類型、交互對(duì)象類型、車輛駕駛動(dòng)作和相對(duì)運(yùn)動(dòng)5個(gè)場(chǎng)景要素作為聚類變量。
使用Cramer’s V統(tǒng)計(jì)量來(lái)衡量?jī)蓚€(gè)分類變量對(duì)之間的關(guān)聯(lián)強(qiáng)度,接近1的值顯示強(qiáng)關(guān)聯(lián),接近0的值顯示弱關(guān)聯(lián)或無(wú)關(guān)聯(lián)[9]。
對(duì)第1類事故數(shù)據(jù)和第2類事故數(shù)據(jù)進(jìn)行相關(guān)性分析,以普通路段數(shù)據(jù)為例,相關(guān)分析結(jié)果如表2 所示。從表中可以看出,Cramer’s V接近于0,變量之間都為弱關(guān)聯(lián),總體上相關(guān)性對(duì)聚類結(jié)果無(wú)實(shí)質(zhì)影響。
一般來(lái)說(shuō),簇的數(shù)量越高,輪廓系數(shù)就越高,較高數(shù)量的簇可能是過(guò)擬合,較低數(shù)量的簇可能是欠擬合[11]。根據(jù)簇?cái)?shù)大小和簇有效性之間折衷的思想選擇最佳的族數(shù)(k),限于篇幅限制,文中以普通路段數(shù)據(jù)為例,對(duì)最佳簇?cái)?shù)做出選擇。
表2 普通路段數(shù)據(jù)相關(guān)性分析Table 2 Correlation analysis of common sections data
結(jié)合ASW值和不同簇?cái)?shù)的最小簇樣本數(shù)來(lái)確定最佳簇?cái)?shù)[9]。最佳簇?cái)?shù)確定規(guī)則:一是最小簇樣本數(shù)占總樣本的比例須大于等于某一比例,而該比例根據(jù)ASW值及其變化情況確定;二是在具有較高最小簇樣本數(shù)下選擇具有較高ASW值的簇?cái)?shù);三是具有較高ASW值時(shí),為減小錯(cuò)誤聚類的可能,選擇總體負(fù)輪廓系數(shù)較小的簇?cái)?shù)。
如圖2所示,對(duì)于9個(gè)或更多的簇?cái)?shù),每個(gè)簇中的最小樣本數(shù)減少到小于等于23個(gè)(占總樣本的6.1%),因樣本量過(guò)小且6到8個(gè)簇?cái)?shù)的ASW值較高(在0.4以上),所以不進(jìn)行選擇。圖2中6個(gè)簇?cái)?shù)、7個(gè)簇?cái)?shù)和8個(gè)簇?cái)?shù)具有較高的ASW值且有相同的最小簇樣本數(shù),其ASW值分別為0.415、0.442和0.464。對(duì)比6個(gè)簇?cái)?shù)輪廓系數(shù)圖(如圖3所示)、7個(gè)簇?cái)?shù)輪廓系數(shù)圖和8個(gè)簇?cái)?shù)輪廓系數(shù)圖可知,6個(gè)簇?cái)?shù)的輪廓系數(shù)圖出現(xiàn)負(fù)輪廓系數(shù)的樣本明顯較少,即被放置在錯(cuò)誤聚類中的樣本較少,所以選擇6為最佳簇?cái)?shù)。
圖2 普通路段不同簇?cái)?shù)ASW值和最小簇樣本數(shù)
對(duì)于普通路段數(shù)據(jù),選擇簇?cái)?shù)為6的情況下得到的聚類結(jié)果如表3所示,表中加粗的頻數(shù)代表了聚類中心點(diǎn)的聚類變量取值。定義各個(gè)簇中心點(diǎn)的聚類變量取值為每一個(gè)簇的典型場(chǎng)景的屬性,典型的車輛碰撞危險(xiǎn)場(chǎng)景為C1-C6,如場(chǎng)景C1描述為:在白天,普通路段,直行的乘用車碰撞垂直方向上行駛的動(dòng)力兩輪車。對(duì)于路口數(shù)據(jù),通過(guò)聚類分析,判斷確定最佳簇?cái)?shù)為9,并進(jìn)行相應(yīng)的場(chǎng)景分析。
圖3 普通路段6個(gè)簇?cái)?shù)的輪廓系數(shù)圖
表3 普通路段每簇聚類結(jié)果頻數(shù)表Table 3 Frequency of clustering variables in each cluster for common sections data
為進(jìn)一步描述和分析危險(xiǎn)場(chǎng)景并提取測(cè)試場(chǎng)景,對(duì)典型的車輛碰撞危險(xiǎn)場(chǎng)景中具體描述場(chǎng)景的危險(xiǎn)事故特征進(jìn)行研究。結(jié)合典型的車輛碰撞危險(xiǎn)場(chǎng)景定義如下8個(gè)因素為危險(xiǎn)事故特征:天氣、第1 碰撞點(diǎn)位置、車輛速度、交互對(duì)象速度、碰撞點(diǎn)相對(duì)于路口的距離、碰撞最終位置與碰撞點(diǎn)的方位距離、碰撞前平均減速度和事故發(fā)生前車輛具體運(yùn)動(dòng)類型。由于部分特征數(shù)據(jù)難以獲得或者丟失嚴(yán)重,所以只對(duì)天氣、第1碰撞點(diǎn)位置、車輛速度和事故發(fā)生前車輛具體運(yùn)動(dòng)類型4個(gè)特征進(jìn)行統(tǒng)計(jì)分析。
(1)天氣
考慮到自動(dòng)駕駛汽車主要是通過(guò)雷達(dá)、相機(jī)等傳感器來(lái)感知環(huán)境,且易受到惡劣天氣的影響,所以對(duì)天氣中晴、陰、雨和其他4個(gè)取值進(jìn)行統(tǒng)計(jì)分析,分析可得天氣特征在6個(gè)場(chǎng)景中分布基本一致,占比最大的是晴天(占60%以上)。
(2)第1碰撞點(diǎn)位置
如圖4所示,除C6場(chǎng)景外,車輛碰撞位置在前側(cè)的比例占75%以上。
圖4 普通路段車輛第1碰撞點(diǎn)位置的分布
如圖5所示,6個(gè)場(chǎng)景的交互對(duì)象的第1碰撞點(diǎn)位置分布不同。交互對(duì)象中,C2場(chǎng)景碰撞位置在后側(cè)最多(占58.7%),其次是前側(cè),可推測(cè)該場(chǎng)景為交互對(duì)象被乘用車追尾;C3場(chǎng)景交互對(duì)象碰撞位置在前側(cè)的占比最大,可推測(cè)C3場(chǎng)景中乘用車與交互對(duì)象正面碰撞;C4和C5場(chǎng)景交互對(duì)象碰撞位置在前側(cè)的占比大,且交互對(duì)象都為乘用車;C6場(chǎng)景的交互對(duì)象的碰撞位置在后側(cè)(占33.7%)和右側(cè)(占19.3%)相對(duì)其他類占比較大,這與C6場(chǎng)景中乘用車前側(cè)和左側(cè)占比大相對(duì)應(yīng),可以推測(cè)參與方在向右變道時(shí)與乘用車發(fā)生碰撞。
圖5 普通路段交互對(duì)象第1碰撞點(diǎn)位置分布
(3)事故發(fā)生前車輛具體運(yùn)動(dòng)類型
如圖6所示,全部場(chǎng)景中的車輛具體運(yùn)動(dòng)類型為勻速直行占比最大,右轉(zhuǎn)、向左變道和向右變道等具體車輛運(yùn)動(dòng)類型占比較小。
圖6 普通路段事故發(fā)生前車輛具體運(yùn)動(dòng)類型分布
(4)車輛速度
經(jīng)過(guò)事故重建的數(shù)據(jù)在各類典型車輛碰撞危險(xiǎn)場(chǎng)景數(shù)據(jù)中約占22%,所以車輛速度的置信度較高,較好地貼近了事故案列的真實(shí)速度分布。如表4 所示,C2、C3和C4場(chǎng)景碰撞前的車速較高,C5場(chǎng)景的平均車速最低,C2場(chǎng)景的平均車速最高。對(duì)車輛速度的統(tǒng)計(jì)分析可以為測(cè)試場(chǎng)景的測(cè)試車速提供依據(jù)。為便于測(cè)試場(chǎng)景進(jìn)行測(cè)試,根據(jù)50百分位車速確定測(cè)試車車速。如C1場(chǎng)景,以靠近50百分位車速和5的倍數(shù)確定基準(zhǔn)測(cè)試車速為40 km/h。
表4 普通路段乘用車速度分布Table 4 Velocity distribution of host vehicles in different core scenarios for common sections
通過(guò)聚類分析得到了15個(gè)典型車輛碰撞危險(xiǎn)場(chǎng)景,結(jié)合第1碰撞點(diǎn)位置特征,確定了交互對(duì)象的起始方位和駕駛動(dòng)作,進(jìn)一步結(jié)合其他危險(xiǎn)事故特征,以車輛為測(cè)試車,以交互對(duì)象為目標(biāo)車,構(gòu)建了15個(gè)自動(dòng)駕駛測(cè)試場(chǎng)景,包括6個(gè)普通路段的測(cè)試場(chǎng)景和9個(gè)路口路段的測(cè)試場(chǎng)景,測(cè)試場(chǎng)景描述和部分場(chǎng)景示意圖分別如表5和圖7所示。
對(duì)比表5中場(chǎng)景描述可知,車輛的第1碰撞點(diǎn)位置集中在車前側(cè),其次為左側(cè);在普通路段的場(chǎng)景車速普遍比路口場(chǎng)景的車速高;測(cè)試場(chǎng)景中目標(biāo)車40.0%涉及M1類乘用車;測(cè)試場(chǎng)景中關(guān)于PTW(包括摩托車和電動(dòng)助力車)的測(cè)試場(chǎng)景占15個(gè)測(cè)試場(chǎng)景的53.3%,占6個(gè)普通路段測(cè)試場(chǎng)景的66.6%。為了便于與相似的車輛測(cè)試場(chǎng)景研究[9- 10]進(jìn)行討論,將測(cè)試場(chǎng)景以目標(biāo)車類型分類,將典型車輛測(cè)試場(chǎng)景分為9個(gè)關(guān)于TWS的場(chǎng)景和6個(gè)關(guān)于乘用車的場(chǎng)景。
表5 自動(dòng)駕駛汽車測(cè)試場(chǎng)景Table 5 Test scenarios of autonomous vehicles
圖7 部分測(cè)試場(chǎng)景示意圖
關(guān)于TWS的測(cè)試場(chǎng)景中,場(chǎng)景C1、J3、J4和J9與文獻(xiàn)[9]的場(chǎng)景1描述基本一致,場(chǎng)景J6與文獻(xiàn)[9]的場(chǎng)景4描述基本一致。研究的場(chǎng)景得到了文獻(xiàn)[9]的驗(yàn)證,且具有更詳細(xì)的場(chǎng)景描述,如將文獻(xiàn)[9]的場(chǎng)景4具體到X型路口的J6場(chǎng)景??傮w來(lái)看,得到的關(guān)于TWS的測(cè)試場(chǎng)景與文獻(xiàn)[9]有一定差異,因?yàn)楸疚难芯康臄?shù)據(jù)是NAIS數(shù)據(jù)庫(kù),更傾向于嚴(yán)重程度較高的事故,而文獻(xiàn)[9]研究的數(shù)據(jù)是中國(guó)深度事故數(shù)據(jù)庫(kù)(CIDAS),具有更全面的事故類型。但相比文獻(xiàn)[9]的研究本文有3個(gè)優(yōu)勢(shì):一是場(chǎng)景描述更具體,特別是在較高比例事故重建的基礎(chǔ)上分析了碰撞車速的分布;二是考慮了路段類型,對(duì)場(chǎng)景的位置環(huán)境有更明確的描述;三是場(chǎng)景更具有事故嚴(yán)重性和危險(xiǎn)性。
文獻(xiàn)[10]使用不同年份的NAIS數(shù)據(jù)庫(kù),選取了499例路口事故數(shù)據(jù),研究得到了8個(gè)關(guān)于路口路段的場(chǎng)景。文獻(xiàn)[10]的場(chǎng)景3和文中場(chǎng)景J4描述基本一致,場(chǎng)景5和文中場(chǎng)景J8描述基本一致,且場(chǎng)景J8與Euro-NCAP最新發(fā)布的規(guī)程中推薦2020年引入的AEB十字路口場(chǎng)景基本描述相符[10]。本文與文獻(xiàn)[10]相比沒(méi)有區(qū)分事故案例中主動(dòng)碰撞方和被動(dòng)碰撞方,并沒(méi)有把天氣、信號(hào)燈類型和車速等作為聚類變量,所以提取到的場(chǎng)景與文獻(xiàn)[9]研究得到的測(cè)試場(chǎng)景有明顯的目標(biāo)車車型的差異。但本文的研究對(duì)象更具有針對(duì)性,其將目標(biāo)車類型具體為乘用車、貨車、PTW和自行車,并提出了危險(xiǎn)事故特征,描述了測(cè)試車和目標(biāo)車的第1碰撞點(diǎn)位置,采用更有優(yōu)勢(shì)的獨(dú)熱編碼進(jìn)行數(shù)據(jù)前處理。綜上,研究得到的測(cè)試場(chǎng)景是對(duì)事故數(shù)據(jù)另一角度的合理描述。
(1)針對(duì)中國(guó)交通事故較多發(fā)生在普通路段和路口路段的獨(dú)特交通環(huán)境特征,考慮了道路路段類型,對(duì)乘用車與駕乘交通工具的道路使用者的自動(dòng)駕駛汽車測(cè)試場(chǎng)景進(jìn)行了研究,得到了15個(gè)涉及道路路段類型的自動(dòng)駕駛汽車測(cè)試場(chǎng)景,測(cè)試場(chǎng)景包括6個(gè)關(guān)于普通路段的場(chǎng)景和9個(gè)關(guān)于路口路段的場(chǎng)景,其中9個(gè)是關(guān)于乘用車-TWS的場(chǎng)景,6個(gè)是關(guān)于乘用車-乘用車的場(chǎng)景。
(2)自動(dòng)駕駛汽車測(cè)試場(chǎng)景中測(cè)試車碰撞的目標(biāo)車是M1類乘用車、動(dòng)力兩輪車和自行車;測(cè)試場(chǎng)景中關(guān)于動(dòng)力兩輪車的測(cè)試場(chǎng)景占總測(cè)試場(chǎng)景的53.3%,占普通路段測(cè)試場(chǎng)景的66.6%,相比其他測(cè)試場(chǎng)景是最可能發(fā)生的測(cè)試場(chǎng)景。
(3)提出的天氣、第1碰撞點(diǎn)位置、車輛速度等危險(xiǎn)事故特征能夠更好地描述和明確測(cè)試場(chǎng)景;結(jié)合獨(dú)熱編碼的數(shù)據(jù)前處理方法具有靈活處理非連續(xù)型數(shù)值特征的優(yōu)勢(shì),同時(shí)在一定程度上進(jìn)行了特征擴(kuò)充。