張道文 ,王朝健,蔣 駿,黎華惠
(1.西華大學(xué) 汽車與交通學(xué)院,成都 610039,中國;2.汽車測(cè)控與安全四川省重點(diǎn)實(shí)驗(yàn)室,成都 610039,中國;3.四川省新能源汽車智能控制與仿真測(cè)試技術(shù)工程研究中心,成都 610039,中國;4.成都工業(yè)職業(yè)技術(shù)學(xué)院,成都 610218,中國)
2020 年,中國大陸機(jī)動(dòng)車導(dǎo)致的交通事故數(shù)達(dá)21.1 萬起,造成5.6 萬人死亡、21.4 萬人受傷和12.28億元直接財(cái)產(chǎn)損失[1]。交通事故可以分為車與人事故、車與二輪車或三輪車事故以及單車事故(即本車事故)、車對(duì)車(V2V)事故(以下又稱雙車事故)、多車事故。V2V 事故嚴(yán)重程度不僅取決于己方駕駛員和車輛的特征,還取決于對(duì)方駕駛員和車輛的特征[2],且V2V 事故的占比高于其他事故類型[3]。因此研究雙車事故嚴(yán)重程度的關(guān)鍵因素,以及因素的交互作用對(duì)致死事故率的影響,對(duì)預(yù)防V2V 事故和降低駕乘人員的傷亡具有重要意義。
對(duì)V2V 事故的研究主要基于Logit 模型(Logit model)、Probit 模型(Probit model)等線性模型而限制了邏輯相關(guān)變量的引入。C.Duncan 等[4]采用有序Probit 模型(ordered Probit model),研究了V2V 事故中乘用車駕駛員損傷嚴(yán)重程度的影響因素。G.A.Torr?o 等[5]采用Logit 模型發(fā)現(xiàn)了V2V 事故中,對(duì)方汽車的發(fā)動(dòng)機(jī)排量是重要影響因素。賈雄文[3]利用二項(xiàng)有序Probit 模型(bivariate ordered Probit,BOP),研究了國內(nèi)V2V 事故受傷嚴(yán)重程度的關(guān)鍵影響因素。隨后賈雄文等[6]利用BOP 模型,研究了道路環(huán)境因素對(duì)V2V 事故嚴(yán)重程度的影響,發(fā)現(xiàn)道路等級(jí)的提升會(huì)降低駕駛員的受傷程度。蔣欣國等[7]利用廣義有序Logit模型(generalized ordered Logit),研究了雙方駕駛員的危險(xiǎn)行為對(duì)V2V 事故的影響,發(fā)現(xiàn)超速和其他行為同時(shí)存在時(shí)對(duì)事故后果有顯著影響。王健宇等[8]基于多項(xiàng)Logistic 回歸模型(multinomial Logistic regression,MNL),研究了V2V 事故嚴(yán)重程度的影響因素及機(jī)理,探索了在不同嚴(yán)重程度的交通事故中影響因素存在的差異性。一些學(xué)者研究V2V 事故時(shí),駕駛員因素一般僅考慮了受傷更嚴(yán)重的一方駕駛員;主要基于單因素分析,沒有考慮因素的交互作用,而交通事故是多風(fēng)險(xiǎn)因素對(duì)事故傷亡的綜合效應(yīng)。
針對(duì)因素交互作用對(duì)事故嚴(yán)重程度的研究,有學(xué)者利用Shapley 加和解釋(Shapley additive explanations,SHAP)結(jié)合XGBoost[9]、LightGBM[10]等模型,但這種方法只能分析2 個(gè)因素的交互效應(yīng)對(duì)事故后果的影響趨勢(shì),不能量化分析[9]。有學(xué)者提出利用N-K 模型量化多種因素的交互作用對(duì)事故后果的影響[11],但N-K模型只能解決因素之間的整體交互效應(yīng),不能分析因素具體狀態(tài)值的交互效應(yīng)。有學(xué)者利用故障樹[12]、關(guān)聯(lián)規(guī)則[16]提取具有強(qiáng)耦合度的規(guī)則,但這些方法也不能具體量化規(guī)則對(duì)事故后果的影響程度。
Bayes 網(wǎng)絡(luò)(Bayesian networks,BN)模型具有高解釋度的優(yōu)勢(shì),已應(yīng)用于交通安全的研究[14]。它能量化單因素以及多因素的交互作用對(duì)事故后果的影響,但多因素分析時(shí),會(huì)面臨因素組合過多、主觀定義的組合耦合度低甚至為不可能事件等問題,而關(guān)聯(lián)規(guī)則剛好能彌補(bǔ)這一缺陷。
本文運(yùn)用Bayes 網(wǎng)建立考慮風(fēng)險(xiǎn)因素交互作用的V2V 事故嚴(yán)重程度模型。定量分析關(guān)鍵影響因素、雙因素的交互作用對(duì)致死事故率的影響,結(jié)合關(guān)聯(lián)規(guī)則方法挖掘高頻率和強(qiáng)耦合度的規(guī)則,探究多因素交互作用下對(duì)致死事故率的影響,以期明確V2V 事故的預(yù)防重點(diǎn),從而實(shí)施精準(zhǔn)的防控策略。
Bayes 網(wǎng)絡(luò)(BN)是一種描述變量間不確定因果關(guān)系的網(wǎng)絡(luò)模型,能很好地捕捉變量之間的潛在影響關(guān)系,有結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)2 個(gè)部分。當(dāng)隨機(jī)變量有n個(gè)時(shí),變量之間的關(guān)系可以由一個(gè)聯(lián)合概率分布表示:
式中:X1、X2、…、Xn為隨機(jī)變量;parent(Xi)為隨機(jī)變 量Xi的全部父節(jié)點(diǎn)集合。當(dāng)(parent(Xi)=? 時(shí),parent[Xi|parent(Xi)]是邊緣分布P(Xi)。
結(jié)構(gòu)學(xué)習(xí)中,增強(qiáng)樸素Bayes(augmented naive Bayes,ANB)算法克服了傳統(tǒng)樸素Bayes 算法中因素局部獨(dú)立性的限制、應(yīng)用廣泛[15]。完整數(shù)據(jù)的參數(shù)學(xué)習(xí)通常利用最大似然估計(jì),定義如下:
P(|θ=θ0)表示參數(shù)θ的某個(gè)取值θ0與數(shù)據(jù)的擬合程度,取值越大說明θ0與數(shù)據(jù)的擬合程度越高。給定θ,數(shù)據(jù)的條件概率P(|θ)稱為θ的似然度:
令L(|θ)達(dá)到最大值時(shí)的取值θ*為參數(shù)θ的最大似然估計(jì)(maximum likelihood estimation,MLE):
關(guān)聯(lián)規(guī)則算法可以挖掘要素之間的內(nèi)在聯(lián)系,用X≥Y表示,X為前項(xiàng),Y為后項(xiàng)。一般有支持度和置信度2 個(gè)衡量指標(biāo)。
支持度指X和Y的同時(shí)出現(xiàn)的概率,用support(X≥Y)表示,置信度指出現(xiàn)后,出現(xiàn)的概率,用confidence(X≥Y)=P(Y|X)表示。支持度越高表示前項(xiàng)出現(xiàn)的概率越高,置信度越高代表前項(xiàng)發(fā)生,后項(xiàng)出現(xiàn)的概率越高[16]。
常用的驗(yàn)證方法有K折交叉驗(yàn)證、接受者操作特性曲線(receiver operator characteristic,ROC 曲線)和ROC 曲線下的面積(area under curve,AUC)。K折交叉驗(yàn)證將數(shù)據(jù)集劃分為K個(gè)大小相等的部分,K-1 部分用于訓(xùn)練,最后K個(gè)部分用于測(cè)試,這個(gè)過程重復(fù)K次[15]。留一法(leave one out,LOO)是K折交叉驗(yàn)證的極端情況,它將數(shù)據(jù)集的n-1 條數(shù)據(jù)用于訓(xùn)練,最后一條數(shù)據(jù)用于測(cè)試,這個(gè)過程重復(fù)n次,驗(yàn)證過程沒有隨機(jī)因素的影響,結(jié)果穩(wěn)定[17]。
(中國)國家車輛事故深度調(diào)查體系(national automobile accident in-depth investigation system,NAIS)由(中國)國家市場(chǎng)監(jiān)督管理總局缺陷產(chǎn)品管理中心聯(lián)合中國8 所高校、多家交通司法鑒定中心共同建立[18]。事故數(shù)據(jù)覆蓋了中國大陸7 個(gè)地域,已有學(xué)者利用該數(shù)據(jù)庫進(jìn)行了相關(guān)研究并取得了成果[19-21]。
對(duì)樣本進(jìn)行以下初步篩選:
1)剔除由于研究對(duì)象為V2V 事故,需涉及行人、機(jī)動(dòng)二三輪車、非機(jī)動(dòng)二三輪車、V2V 和多車的事故;
2)剔除與研究無關(guān)的字段,同時(shí)剔除剩余字段中不完整的數(shù)據(jù);
3)由于高速公路為封閉式道路管理,有別與其他道路,因此剔除涉及高速公路的案例[22];
4)刪除剩余事故中的特殊案例,例如靜止車輛由于制動(dòng)失效導(dǎo)致的事故、車輛自燃導(dǎo)致的事故。最終剩下583 例事故。
交通事故的影響因素眾多,總體可分為人、車、路和環(huán)境4 個(gè)方面。人的方面主要包括駕駛?cè)说男睦硪蛩睾蜕硪蛩?,例如駕駛?cè)说哪挲g、性別和狀態(tài)等因素會(huì)影響駕駛員的感知能力和反應(yīng)能力;車是人的載體,車輛的類型和安全技術(shù)狀況會(huì)間接影響事故后果,而駕駛?cè)藢?duì)車輛的控制會(huì)直接影響車輛的運(yùn)動(dòng)狀態(tài);道路是交通的載體,主要包括發(fā)生地點(diǎn)、行政等級(jí)和路面狀況等因素;環(huán)境通過影響人、車和路方面而間接影響事故的發(fā)生,一般指自然環(huán)境的因素,例如天氣狀況、事故發(fā)生的時(shí)段。
考慮以往研究的變量選取并結(jié)合NAIS 數(shù)據(jù)庫的字段特征,從人、車、路和環(huán)境4 個(gè)方面選取17 個(gè)變量(包括影響因素和事故嚴(yán)重程度)[3,6,11,27],分為過失方因素(L1-L5)、受害方因素(I1-I5)、道路因素(R1-R4)、環(huán)境因素(E1-E2)和事故嚴(yán)重程度(Sev),各變量取值及離散情況見表1。
表1 變量取值及離散情況
運(yùn)用GeNIe3.0 軟件進(jìn)行結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí),得到V2V 事故嚴(yán)重程度分析模型的Bayes 網(wǎng)絡(luò)結(jié)構(gòu)圖,一共包括17 個(gè)節(jié)點(diǎn)和29 條邊,如圖1 所示。其中:每一個(gè)節(jié)點(diǎn)代表一個(gè)變量,節(jié)點(diǎn)之間的連線代表變量之間具有直接依賴關(guān)系,如天氣狀況(E1)與路面狀況(R2)有直接依賴關(guān)系。
圖1 Bayes 網(wǎng)絡(luò)結(jié)構(gòu)圖
利用留一法進(jìn)行模型驗(yàn)證,模型的準(zhǔn)確率為81.3%,若準(zhǔn)確率達(dá)80%,代表預(yù)測(cè)效果較好[24]。ROC 曲線下的面積(AUC)為0.81,表明算法的魯棒性較好,因此V2V 事故嚴(yán)重程度分析模型較合理。接受者操作特性曲線(ROC 曲線)和AUC 如圖2 所示。
圖2 ROC 曲線和AUC
為探究事故嚴(yán)重程度的關(guān)鍵影響因素,基于Bayes網(wǎng)絡(luò)構(gòu)建的分析模型,輸入每個(gè)變量的各個(gè)取值狀態(tài)(對(duì)于每一個(gè)變量,其中一個(gè)取值的概率被設(shè)置為100%,同一變量的其他取值被設(shè)置為0%,例如過失方性別為男性,則女性的概率為0%),然后更新整個(gè)模型,觀察該變量的不同取值下致死事故率的變化。其中每個(gè)變量的不同取值狀態(tài)對(duì)致死事故率的最大影響幅度見表2。
表2 各因素對(duì)致死事故率的影響幅度
“↑”代表取值對(duì)致死事故率的最大增幅;“↓”代表取值對(duì)致死事故率的最大降幅。例如過失方車型(因素L5)對(duì)致死事故率的影響幅度為39.7%,其中大型汽車因素會(huì)提高32.6%致死事故率(后文涉及的提高與降低均是相較于致死事故率的先驗(yàn)概率),乘用車因素會(huì)降低7.1%致死事故率。
由表2 可知,L5、L3、I5、E2、R3、R4 等因素對(duì)致死事故率的影響幅度均超過20%,是引發(fā)致死事故的關(guān)鍵因素。過失方或受害方為大型汽車、過失方超速行駛會(huì)顯著提高致死事故率[7];調(diào)整模型發(fā)現(xiàn)夜間(4.5%)的致死事故率高于日間[25]。發(fā)生在晨昏的事故占比僅6%,但該時(shí)段一旦發(fā)生事故,致死事故率會(huì)提高23%,相反發(fā)生在日間的事故占比最高,但致死事故率會(huì)降低6.2%??赡苁浅炕柢嚵髁啃。{駛員警惕較低,導(dǎo)致行駛速度較快,而日間車流量大且行車視距較好,駕駛員更加謹(jǐn)慎[3];普通路段和十字路口的事故占比較高,但十字路口比普通路段的致死事故率低22.5%[23];設(shè)立信號(hào)燈能降低致死事故率,設(shè)立直行+轉(zhuǎn)向交通信號(hào)燈路段比無交通信號(hào)燈路段的致死事故率低20.8%,這是因?yàn)榻煌ㄐ盘?hào)燈對(duì)駕駛員有警示作用,能降低交通沖突程度[23]。
(36,45]歲的駕駛員會(huì)略微提高致死事故率,而(18,25]歲的駕駛員會(huì)降低致死事故率。Lee C[25]指出30 歲以下的年輕司機(jī)在碰撞中受傷程度會(huì)降低,并且(18,25]歲的青年駕駛員由于駕駛經(jīng)驗(yàn)不豐富,警惕性反而更高;過失方或受害方的轉(zhuǎn)向行為均會(huì)降低致死事故率,但過失方的轉(zhuǎn)向行為降低幅度更大,可能是因?yàn)檫^失方處于轉(zhuǎn)向時(shí),能更好的提前發(fā)現(xiàn)碰撞目標(biāo),實(shí)施主動(dòng)避險(xiǎn)行為;普通公路比城市路段的致死事故率高17.2%。男性駕駛員、惡劣天氣和較差的路面狀況等因素都會(huì)提升致死事故率,但影響程度較小。
為考察雙因素的聯(lián)合效應(yīng)對(duì)致死事故率的影響,以致死事故率的影響幅度中最大的因素L5 與其余關(guān)鍵因素進(jìn)行組合分析,觀察2 個(gè)變量的不同取值組合的致死事故率,各組合的聯(lián)合效應(yīng)見圖3。其中縱坐標(biāo)底部為過失方車型的變量取值,縱坐標(biāo)中部為其余關(guān)鍵因素的變量取值,橫坐標(biāo)為該組合的致死事故率。
由圖3 可知:因素交互作用下,因素的聯(lián)合效應(yīng)顯著。例如相較于過失方為乘用車,過失方為大型汽車與其余關(guān)鍵因素的交互作用更容易引發(fā)致死事故,尤其是駕駛員處于超速行駛或處于晨昏時(shí)段,因此建議大型汽車強(qiáng)制裝配超速報(bào)警裝置,并且駕駛員在晨昏等光線不好的環(huán)境要提高駕駛警惕;因素的聯(lián)合效應(yīng)影響高于各自邊際效應(yīng)之和。例如過失方為大型汽車且發(fā)生于普通路段時(shí),致死事故率提高的邊際效應(yīng)之和為42.1%,而聯(lián)合效應(yīng)之和為44.4%。
圖3 過失方車型和其余關(guān)鍵因素的聯(lián)合效應(yīng)
交通事故是多風(fēng)險(xiǎn)因素對(duì)事故傷亡的綜合效應(yīng),但面臨因素取值的組合過多、主觀定義的組合耦合度低甚至為不可能事件等問題。因此利用SPSS Modeler軟件的關(guān)聯(lián)規(guī)則挖掘關(guān)鍵因素中高頻率與強(qiáng)耦合度的規(guī)則,將關(guān)聯(lián)規(guī)則輸出的規(guī)則中各個(gè)變量的取值,作為Bayes 網(wǎng)絡(luò)分析模型中每個(gè)變量的輸入,計(jì)算各個(gè)規(guī)則的致死事故率的變化。為了挖掘高頻率和強(qiáng)耦合度的規(guī)則,設(shè)定最低支持度為20%和最低置信度為80%,剔除前后項(xiàng)內(nèi)容相同的規(guī)則后,最終得到10 條規(guī)則見表3。
表3 可知:規(guī)則1 的支持度最高,說明該組合出現(xiàn)的頻率較高,但此時(shí)致死事故率會(huì)下降18.3%。這和C.Lee[25]結(jié)論類似,小型車之間的碰撞增加了非致死事故率,并且車輛在通過交叉口時(shí)的車速較低,因此降低了致死事故率[26];規(guī)則2 出現(xiàn)的頻率較高,會(huì)小幅度提升致死事故率;與規(guī)則2 類似的是規(guī)則5,但規(guī)則5 發(fā)生時(shí)會(huì)增加42.6%的致死事故率,這是由于受害方為大型汽車時(shí),盡管會(huì)降低受害方駕駛員的致死率,但會(huì)顯著提高過失方駕駛員的致死率[23];規(guī)則7是唯一含夜間的高耦合規(guī)則,這種事故容易發(fā)生在無交通信號(hào)燈的普通路段,并會(huì)提高21.7%的致死事故率。這極大可能是因?yàn)橐归g車流量低、無交通信號(hào)燈的警示,并且普通路段的干擾小,此時(shí)汽車的行駛速度較快,加上夜間視野差,導(dǎo)致發(fā)生緊急情況時(shí)駕駛員的避撞時(shí)間不足。
表3 高頻率與高耦合規(guī)則集對(duì)致死事故率的影響
本文以NAIS 數(shù)據(jù)庫的雙車事故為樣本,利用Bayes 網(wǎng)絡(luò)和關(guān)聯(lián)規(guī)則方法,研究了V2V 事故嚴(yán)重程度的關(guān)鍵影響因素,以及關(guān)鍵因素的交互作用對(duì)致死事故率的影響。主要結(jié)論如下:
1)過失方車型、過失方狀態(tài)、受害方車型、發(fā)生時(shí)段、事故地點(diǎn)、交通信號(hào)燈等因素,是致死事故率的關(guān)鍵影響因素。
2)因素交互作用下,因素的聯(lián)合效應(yīng)顯著,并且影響高于各自邊際效應(yīng)和。過失方為大型汽車且處于超速行駛會(huì)提升55%的致死事故發(fā)生率,因此建議大型汽車強(qiáng)制裝配超速報(bào)警裝置;駕駛員在晨昏時(shí)段,要提高駕駛警惕。
3)在十字路口兩輛乘用車發(fā)生事故的頻率較高,但致死事故率相較于致死事故率的先驗(yàn)概率會(huì)降低18.4%;大型汽車在無交通信號(hào)燈的普通路段發(fā)生事故,會(huì)提高42.6%的致死事故率。
4)數(shù)據(jù)采集的困難導(dǎo)致數(shù)據(jù)和字段有限,沒有充分考慮到車流量、汽車安全狀況和管理方面等因素,可能會(huì)對(duì)研究結(jié)果產(chǎn)生一定影響,有待進(jìn)一步研究。