柳本民,廖巖楓,涂輝招,管星宇
(同濟大學(xué)道路與交通工程教育部重點實驗室,上海201800)
道路線形是影響車輛行駛安全的重要因素之一,而圓曲線作為道路線形的主要組成部分,具有較大的風(fēng)險性,尤其是低等級公路小半徑曲線路段,更是駛離車道、護欄碰撞、翻車等事故的高發(fā)區(qū)域。國外相關(guān)研究表明,在其他條件相同的情況下,彎道發(fā)生事故的概率比直線路段高3~4倍[1],因此,對車輛過彎風(fēng)險的研究具有較大的現(xiàn)實意義。
車速是衡量車輛過彎風(fēng)險的一個重要指標(biāo),目前國內(nèi)外對于車輛過彎的相關(guān)研究大部分是基于車速展開的。許多過彎車速的相關(guān)研究主要是為了道路線形優(yōu)化服務(wù)的,有些研究者通過對過彎車速的預(yù)測來評價不同道路單元設(shè)計的連續(xù)性[2-3],也有一些研究致力于探尋過彎行駛車速與圓曲線設(shè)計參數(shù)之間的規(guī)律,其中被重點關(guān)注到的設(shè)計參數(shù)包括設(shè)計車速及圓曲線半徑[4-6]。隨著計算機技術(shù)的發(fā)展,近年來,過彎車速的相關(guān)研究越來越與自動駕駛輔助系統(tǒng)相關(guān)聯(lián),Serna 等人通過GPS 數(shù)據(jù)構(gòu)建了動態(tài)車速自適應(yīng)系統(tǒng),該系統(tǒng)在自動駕駛系統(tǒng)中有較好的應(yīng)用[7],Zhang等人通過不同的駕駛風(fēng)格構(gòu)建了彎道車速預(yù)測模型,并將該模型應(yīng)用到了自適應(yīng)巡航系統(tǒng)(ACC)中[8]。
除了車速以外,車輛過彎軌跡的相關(guān)研究也是過彎風(fēng)險的研究熱點之一,橫向偏移、方向盤轉(zhuǎn)角(轉(zhuǎn)速)、道路附著系數(shù)等與過彎軌跡相關(guān)性較大的參數(shù)常常是研究重點。彭其淵等通過曲中速度增量及軌跡半徑的增量來描述車輛過彎時的切彎行為,從而得到道路半徑、方向盤轉(zhuǎn)角等對切彎行為的影響規(guī)律[9],Hallmark 等通過對道路、周邊環(huán)境、駕駛?cè)颂匦砸蛩氐姆治?,基于邏輯回歸構(gòu)建了車道偏離概率模型[10]。王恒等基于不同的圓曲線半徑、超高值及路面附著系數(shù)值搭建了駕駛模擬實驗場景并進行了數(shù)據(jù)分析,結(jié)果表明附著系數(shù)對載重汽車彎道側(cè)滑影響顯著[11]。
而目前相關(guān)的車輛過彎風(fēng)險模型主要為車速預(yù)測模型,車速預(yù)測模型主要是從車速在彎道中的變化規(guī)律出發(fā),對平均車速或不同道路單元的車速進行預(yù)測[12-13],有時候還會考慮不同駕駛風(fēng)格或駕駛模式的影響[14]。相比于車速,軌跡的變化更為無序性,因此,彎道軌跡預(yù)測模型的研究較少,主要是從橫向偏移的規(guī)律性出發(fā)的[10]。除此以外,還有基于道路設(shè)計參數(shù)等客觀因素進行的彎道事故率計算模型[15],該類模型對道路設(shè)計具有較大的指導(dǎo)意義,但并未考慮不同駕駛員個體的差異性。
因此,在車輛過彎風(fēng)險的相關(guān)研究中,車速與軌跡是研究的重點,二者主要對應(yīng)車輛在行駛過程中的縱向風(fēng)險和橫向風(fēng)險,縱向風(fēng)險即可以用平行于車輛行駛方向的向量來表征的風(fēng)險,如與車速、加速度相關(guān)的超速、剎車失靈等風(fēng)險;橫向風(fēng)險即可以用垂直于車輛行駛方向的向量來表征的風(fēng)險,如與橫向偏移、方向盤操作相關(guān)的急轉(zhuǎn)彎、側(cè)滑等風(fēng)險。除了與車輛行駛相關(guān)的參數(shù)外,環(huán)境參數(shù)也是必不可少的一環(huán),包括道路半徑、路面附著系數(shù)、設(shè)計車速等。可以通過綜合考慮環(huán)境行駛參數(shù)及環(huán)境參數(shù)的影響,針對不同的駕駛員個體,對車輛過彎時可能遇到的風(fēng)險進行分類及識別,從而達到風(fēng)險防控的目的。
由于小半徑曲線路段,尤其是道路附著系數(shù)較低的工況下,行車具有一定的危險性,因此,采用駕駛模擬實驗的方式進行數(shù)據(jù)采集,主要依托儀器為同濟大學(xué)8 自由度駕駛模擬器,根據(jù)不同的環(huán)境參數(shù)設(shè)置了不同的駕駛模擬實驗場景,并對各個場景下采集到的行駛參數(shù)進行進一步的分析與提取。
實驗場景為四級公路,全長約6km,雙向兩車道。根據(jù)冰、雪、雨、晴四種天氣場景設(shè)置4 個子路段,每個子路段線型相同,但道路摩阻系數(shù)不同。為減小兩相鄰圓曲線之間駕駛行為的影響,直線長度與緩和曲線長度應(yīng)保證足夠的行駛時間,以供駕駛員調(diào)整車速及軌跡,同時直線長度取值過大又會顯著增加路段長度,導(dǎo)致模擬駕駛負荷的增高,因此綜合考慮以上兩點因素,直線長度的確定原則為:車輛在直線與兩側(cè)緩和曲線上的行駛時間之和稍許超過10s,以保證駕駛?cè)擞谐渥銜r間調(diào)整車速與行車路線。各子路段超高加寬如表1 所示。圖1 為子路段的平曲線要素設(shè)置,其中,R為圓曲線半徑;Ls1與Ls2為兩側(cè)緩和曲線長度;L為平曲線總長度;T1、T2為兩側(cè)切線長度;E為外距。
表1 子路段彎道設(shè)計參數(shù)Tab.1 The linear parameters of the sub-section road
實驗為單車實驗,根據(jù)相關(guān)研究,各路面附著系數(shù)的取值范圍大致如下:干燥路面0.65~0.75,濕潤路面0.35~0.55,積雪、輕度壓實雪路面0.25~0.35,冰膜0.15~0.30[16]。因此,取結(jié)冰路面場景的道路摩阻系數(shù)為0.2,積雪路面場景的道路摩阻系數(shù)為0.3,雨天濕滑路面場景的道路摩阻系數(shù)為0.5,正常干燥路面場景的道路摩阻系數(shù)為0.8,各子路段線型相同,隨機地以首尾相連,整體平面線形如圖2所示。在實際情況中,低等級公路的縱坡通常較大,平縱線型組合復(fù)雜多變,本研究主要針對彎道駕駛風(fēng)險,為了控制變量,減少縱坡對實驗的影響,豎曲線縱坡均為0。
實驗共采集了12 名專業(yè)司機的駕駛數(shù)據(jù)。采集的數(shù)據(jù)類別可分為四類:①是駕駛員操作數(shù)據(jù),包括方向盤扭矩、方向盤力反饋、方向盤轉(zhuǎn)角、方向盤受力、剎車踏板受力、油門踏板受力;②是車輛的力學(xué)反饋,包括輪胎剎車力、三軸加速度;③是車輛的運動學(xué)參數(shù),包括車輛的三向速度、行駛里程、車輛坐標(biāo)、及橫向偏移;④是環(huán)境參數(shù),包括道路附著系數(shù)、道路線形相關(guān)參數(shù)。前三類數(shù)據(jù)又可進一步概括為車輛的橫向數(shù)據(jù)及縱向數(shù)據(jù),橫向數(shù)據(jù)包括方向盤相關(guān)數(shù)據(jù)及橫向偏移,縱向數(shù)據(jù)包括車輛的速度與加速度相關(guān)數(shù)據(jù)。
為了較為全面地反映過彎時的橫向風(fēng)險與縱向風(fēng)險,提取了速度標(biāo)準差、橫向偏移量最大值、橫向偏移量標(biāo)準差、切向加速度標(biāo)準差、切向加速度均值、橫向加速度最大值、方向盤角速度均值、方向盤角速度標(biāo)準差共8個行駛統(tǒng)計參數(shù)作為主要的研究對象??紤]車輛在進入直緩點后,橫向受力即開始發(fā)生較為明顯的變化,選取直緩點至緩直點間的駕駛行為數(shù)據(jù)作為彎道數(shù)據(jù)進行分析。剔除無效數(shù)據(jù)后,共得到166組有效數(shù)據(jù),其中包含了不同的半徑及道路附著系數(shù)組合情況,具體過程如圖3所示。
為了便于進一步分析,通過主成分分析(PCA)對8個統(tǒng)計參數(shù)進行降維處理。在主成分分析中一般滿足n<p,其中n為最后篩選出的成分個數(shù),p為原始的成分個數(shù)。要求所取的n個主成分的方差累計貢獻率?最好超過80%,累計貢獻率代表的是對原始特征信息的反映程度,計算?如式1 所示,λi為第i個成分的方差貢獻率。
圖1 子路段線形Fig.1 The aligment of road sections
圖2 實驗道路整體平面線形Fig.2 The aligment of the whole experment road
方差貢獻率的計算結(jié)果如表2所示。
由表2 可知,方差貢獻率最大的三個主成分累積貢獻率接近80%,因此可提取三個主成分,各主成分的系數(shù)計算結(jié)果如表3的成分矩陣所示。
記第i個主成分為Xi,lij為第i個主成分中第j個原始成分對應(yīng)的系數(shù),則Xi的表達式如下:
定義行車風(fēng)險綜合評價指數(shù)F如下:
圖3 數(shù)據(jù)處理過程Fig.3 The processing of data analysis
表2 主成分分析方差貢獻率Tab.2 The variance contribution rate (PCA)
表3 成分矩陣Tab.3 Matrix of factors
第j個原始成分的系數(shù)絕對值之和記為Lj,則
可知,原始成分對應(yīng)的L越大,則該原始成分對綜合風(fēng)險評價指數(shù)F的影響越大,因此,降維可進一步簡化為尋找使L值最大的原始成分。根據(jù)計算,L值最大的三個原始成分為:速度標(biāo)準差、切向加速度標(biāo)準差及方向盤轉(zhuǎn)速均值(L值分別為1.435、1.412及1.365),即在原始的8 個統(tǒng)計參數(shù)中,速度標(biāo)準差、切向加速度標(biāo)準差及方向盤轉(zhuǎn)速對行車風(fēng)險的影響最大,可將這三個變量作為主成分進行后續(xù)分析。
由上文可知,提取的三個主成分為速度標(biāo)準差、切向加速度標(biāo)準差及方向盤轉(zhuǎn)速均值,這三個主成分能較好地反映車輛過彎時的速度、軌跡規(guī)律,可進一步用于車輛過彎風(fēng)險的分類中。運用k均值聚類的方法,以三個主成分為三個維度進行分類,可得到低等級公路車輛過彎時可能出現(xiàn)的風(fēng)險類別及相應(yīng)特征。
所謂k均值聚類,即給定一個樣本容量為n的集合X和類別個數(shù)k,k均值聚類法的任務(wù)是搜索對集合X的一個最優(yōu)k劃分,即分成k個組,使組內(nèi)離差平方和達到最小值,組內(nèi)離差平方和是指組內(nèi)樣本到組均值的累計距離平方。
在聚類前,需選定k值,即類別數(shù),可通過計算輪廓系數(shù),尋求使各類別區(qū)分度最大的k值。每個樣本點都可計算其輪廓系數(shù),第i個樣本點的輪廓系數(shù)計算式如下:
式中:ai為組內(nèi)不相似度,即第i個點與同類的其他點之間的平均距離;bi為組間不相似度,即第i個點與不同類的類內(nèi)各點之間的平均距離的最小值。而整個聚類結(jié)果的輪廓系數(shù)S為Si的均值,即
計算當(dāng)k=2~6時的輪廓系數(shù),結(jié)果見表4。
由表4 可知,當(dāng)k=2 時,輪廓系數(shù)最大,聚類效果最好,但此時類別較為單一,從實際意義出發(fā),并不能較好地反映車輛過彎時的風(fēng)險規(guī)律。通過嘗試,發(fā)現(xiàn)當(dāng)k=4時,各類別的速度、轉(zhuǎn)角變化規(guī)律特征最為明顯,因此,最終確定的k值為4。
表4 輪廓系數(shù)Tab.4 The silhouette coefficients
k均值聚類分析的質(zhì)心可以理解為每一個組的中心,即聚類中心,判別某個數(shù)據(jù)點歸屬于哪個組時,只需考察該點與各組質(zhì)心的相似度,并將該點歸入相似度最高的組。k均值聚類算法包含了多種類型的相似度度量方式,選取歐式距離進行相似度度量,則目標(biāo)函數(shù),即組內(nèi)離差平方和J如下:
式中:xi為第i個數(shù)據(jù)點;uk為第k個組的聚類中心。聚類的結(jié)果應(yīng)使J盡可能小。
選取166組有效數(shù)據(jù)進行k均值聚類,其中包含了各種5種道路半徑及4種道路附著系數(shù)的情況,聚類過程不單獨考慮各線形及道路附著系數(shù)的具體情況,僅從車輛的行駛狀態(tài)考慮車輛過彎的風(fēng)險,即以速度標(biāo)準差、切向加速度標(biāo)準差、方向盤轉(zhuǎn)速均值作為三個維度,最終聚類結(jié)果如圖4所示。各類別的聚類中心如表5所示。
圖4 過彎風(fēng)險聚類結(jié)果Fig.4 The result of risk clustering
表5 聚類中心Tab.5 The clustering center
由此,可以歸納出不同風(fēng)險類別的相應(yīng)特征,如表6所示。
表6 風(fēng)險說明Tab.6 Risk instructions
不同半徑下的風(fēng)險分布如圖5所示。根據(jù)圖5,Ⅰ類風(fēng)險在半徑為35m的彎道上,發(fā)生的頻率最大,甚至超過了半徑為15m 的彎道,可以解釋為駕駛員在面對極限最小半徑時,更為謹慎,能將風(fēng)險控制在一定范圍內(nèi),反而是半徑稍大時,駕駛員放松了對風(fēng)險的預(yù)判,造成Ⅰ類風(fēng)險急劇上升。Ⅱ、Ⅲ類風(fēng)險在各彎道上分布得較為平均,不難看出,半徑為15m的彎道較易發(fā)生急轉(zhuǎn)彎,而半徑為270m的彎道較易發(fā)生急剎車,且綜合道路附著系數(shù)可知,后者主要發(fā)生在道路附著系數(shù)較小的時候。
根據(jù)以上分析可提出如下工程建議:
(1)應(yīng)盡量避免使用小半徑曲線,條件較為苛刻時,也需做好視線誘導(dǎo)、警示標(biāo)語等措施,尤其是半徑為35m左右的彎道路段。
(2)冰雪區(qū)域的低等級公路路段,應(yīng)做好防雪防滑措施,尤其在半徑較大的路段,還應(yīng)通過警示標(biāo)語等形式提醒駕駛員謹慎駕駛,注意行車安全。
圖5 風(fēng)險分布Fig.5 The distribution of risk
過彎風(fēng)險預(yù)測主要需要實現(xiàn)以下過程:通過某個時段內(nèi)的行駛數(shù)據(jù),來預(yù)測車輛過彎時可能遇到哪一類風(fēng)險。此過程可以運用有監(jiān)督的機器學(xué)習(xí)方法來實現(xiàn),傳統(tǒng)的機器學(xué)習(xí)方法如神經(jīng)網(wǎng)絡(luò)、馬爾可夫鏈等,在此處均不太適用,主要是由于數(shù)據(jù)量過小且測試集的輸出變量過于規(guī)整。由于數(shù)據(jù)量的問題難以解決,所以考慮從選擇更適用于本文數(shù)據(jù)結(jié)構(gòu)的模型的角度來解決問題。k均值聚類所獲得的風(fēng)險類別主要是基于歐式距離進行劃分的,因此,可以選擇同樣是基于“距離”的概念來進行多分類的Fisher模型來進行過彎風(fēng)險的預(yù)測。
在交通運輸領(lǐng)域,F(xiàn)isher 常被用于駕駛模式的判別,如金輝等就運用了改進Fisher的方法,對不同駕駛風(fēng)格的起步工況進行了判別[17],其研究思路對本文也有較大的借鑒意義。
Fisher 的基本思想是通過高維映射到低維,尋求一條直線,使投影到其上的各類數(shù)據(jù)點之間的間隔最大。其分類邏輯是使類與類之間的距離最大化,和k均值聚類的邏輯類似,但Fisher 是有監(jiān)督學(xué)習(xí),因此可以實現(xiàn)識別的功能。其核心公式如下:
式中:JF是Fisher判別函數(shù);Sw是類內(nèi)離散度;Sb是類間離散度;w為表征一條直線的向量。使JF最大的w即為所求空間向量,將其定義為w*,即w*能使投影到其上的數(shù)據(jù)點間隔最大,因此
式中:m1與m2為兩類樣本的平均值向量。以上過程為二分類過程,若要實現(xiàn)多分類,則重復(fù)上述過程即可。
傳統(tǒng)的Fisher 可以實現(xiàn)模式的判別,但并不能進行預(yù)測。然而,對整段彎道的行駛數(shù)據(jù)進行風(fēng)險識別,并不能有效防控風(fēng)險,且實際意義并不大,必須盡可能在風(fēng)險發(fā)生前實現(xiàn)風(fēng)險的預(yù)測,才能及時對駕駛員發(fā)出預(yù)警,從而實現(xiàn)風(fēng)險的防控。因此,需要調(diào)整Fisher 模型的測試集與訓(xùn)練集構(gòu)成,可將整段彎道的行駛統(tǒng)計參數(shù)作為訓(xùn)練集,而測試集則選取車輛從直緩點開始駛?cè)霃澋赖膖時刻內(nèi)的行駛參數(shù)。
從實際意義出發(fā),t越小則越有助于風(fēng)險的及時預(yù)警,但理論上,t過小則會造成訓(xùn)練集與測試集相關(guān)性過小的問題。綜合考慮實際意義以及理論可行性,t值取1/4的過彎總時長。
對t時刻內(nèi)的速度標(biāo)準差、切向加速度標(biāo)準差及方向盤轉(zhuǎn)速均值進行計算,分別記為x1*,x2*,x3*,而整段圓曲線的的相應(yīng)統(tǒng)計參數(shù)記為x1,x2,x3,計算兩組數(shù)據(jù)的皮爾森相關(guān)性,結(jié)果如表7所示。
表7 測試集與訓(xùn)練集數(shù)據(jù)相關(guān)性Tab.7 Correlation between test set and training set data
因此,t時刻內(nèi)的行駛統(tǒng)計參數(shù)與總時長內(nèi)行駛統(tǒng)計參數(shù)相關(guān)性較大,可以將其視為同一種類的數(shù)據(jù),分別作為測試集與訓(xùn)練集進行Fisher建模,具體建模流程如圖6所示。
圖6 Fisher建模流程Fig.6 The processing of Fisher modeling
預(yù)測結(jié)果如表8 所示,其中正確預(yù)測個數(shù)為預(yù)測結(jié)果與原始結(jié)果一致的個數(shù),其總數(shù)應(yīng)不大于原始數(shù)據(jù)點個數(shù)。
將數(shù)據(jù)點進行編號,原始值與預(yù)測結(jié)果之間的誤差如圖7所示,其中,誤差為負則說明預(yù)測的風(fēng)險等級高于原始值,預(yù)測的結(jié)果是偏于安全的,誤差為正則說明預(yù)測的風(fēng)險等級低于原始值,即未能識別出潛在的風(fēng)險。結(jié)合表8 可知,預(yù)測模型對于最為危險的Ⅰ類風(fēng)險的預(yù)測精度最高,Ⅱ、Ⅲ類風(fēng)險較易相互混淆,結(jié)果整體是偏于安全的。
表8 Fisher預(yù)測結(jié)果Tab.8 The predicted results by Fisher model
圖7 預(yù)測誤差Fig.7 Prediction error
整體的預(yù)測精度為76.5%,預(yù)測效果較好。根據(jù)表8及圖2可知,風(fēng)險最大的Ⅰ級風(fēng)險的預(yù)測準確率最高,Ⅳ級風(fēng)險次之,而Ⅱ級及Ⅲ級風(fēng)險較易互相混淆。誤差總體向高風(fēng)險傾斜,即大多數(shù)誤報的案例為低風(fēng)險誤報為高風(fēng)險,在實際駕駛過程中,有助于提高駕駛員的風(fēng)險意識,具有較大的應(yīng)用價值。
通過模擬駕駛的實驗數(shù)據(jù),對低等級公路車輛過彎存在的風(fēng)險進行了分類識別,進一步明確了過彎風(fēng)險產(chǎn)生的原因及機理,并通過機器學(xué)習(xí)的方法,構(gòu)建了車輛過彎風(fēng)險預(yù)測模型,為車輛過彎風(fēng)險的可防可控創(chuàng)造了最基本的數(shù)學(xué)依據(jù)。主要研究成果如下:
(1)設(shè)計并進行了低等級公路車輛過彎的單車實驗,對駕駛數(shù)據(jù)進行了統(tǒng)計分析并篩選出了速度標(biāo)準差、切向加速度標(biāo)準差及方向盤轉(zhuǎn)速均值作為重點研究對象。
(2)進行三維k均值聚類,得到了車輛過彎時的四類典型風(fēng)險情形:剎車油門方向盤均失控、急轉(zhuǎn)彎、急剎車以及車輛總體把控良好。
(3)基于聚類結(jié)果,搭建了Fisher 模型,為了實現(xiàn)預(yù)測功能,模型的測試集與訓(xùn)練集分別選取了相關(guān)性較強的過彎前1/4時長內(nèi)的駕駛統(tǒng)計參數(shù)及過彎總時長內(nèi)的統(tǒng)計參數(shù)。模型的預(yù)測精度達到76.5%誤差總體向高風(fēng)險傾斜,具有較大的應(yīng)用價值。
除此以外,尚有一些值得進一步深入探討的問題:
(1)模型的訓(xùn)練集的時間窗口長度選取值得將進一步探討。
(2)樣本數(shù)據(jù)量值得進一步拓展,從而得到更具有典型性的預(yù)測結(jié)果及工程建議。