楊文臣,謝碧珊,,房銳*,秦雅琴
(1.云南省交通規(guī)劃設(shè)計(jì)研究院有限公司,陸地交通氣象災(zāi)害防治技術(shù)國(guó)家工程實(shí)驗(yàn)室,昆明650200;2.昆明理工大學(xué),交通工程學(xué)院,昆明650504)
具有集散功能的山區(qū)雙車道公路道路條件復(fù)雜、混合交通環(huán)境多變,交通違法行為突出,極易導(dǎo)致各種交通事故。當(dāng)前我國(guó)二級(jí)公路死亡人數(shù)絕對(duì)值最高[1],掌握不同類別機(jī)動(dòng)車碰撞事故嚴(yán)重度影響因素間復(fù)雜關(guān)聯(lián)關(guān)系,已成為交通安全風(fēng)險(xiǎn)管理亟待解決的問(wèn)題。
機(jī)動(dòng)車事故嚴(yán)重度的研究主要涉及事故形成機(jī)理、事故描述統(tǒng)計(jì)分布、事故嚴(yán)重度分析模型等方面。研究方法主要分為兩大類:計(jì)量經(jīng)濟(jì)學(xué)的統(tǒng)計(jì)分析方法[2]、人工智能的分類預(yù)測(cè)方法[3],也有學(xué)者將兩種方法組合使用[4]。常用的計(jì)量經(jīng)濟(jì)模型有二元Logistic模型、多項(xiàng)Logit模型、有序Logit模型及混合Logit 模型等,這些模型在影響機(jī)理的可解釋性和預(yù)測(cè)模型的穩(wěn)健性上具有優(yōu)勢(shì)。隨著交通安全數(shù)據(jù)質(zhì)量的提高,支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)(BP)、隨機(jī)森林(RF)等人工智能方法被廣泛應(yīng)用于事故發(fā)生概率建模與事故嚴(yán)重度的分類預(yù)測(cè),研究發(fā)現(xiàn),人工智能方法在預(yù)測(cè)精度上具有優(yōu)勢(shì),但模型的可解釋性和穩(wěn)健性不強(qiáng),需要較豐富的數(shù)據(jù)樣本及標(biāo)簽[5]。當(dāng)前研究仍存在以下不足:一是既有研究多以城市道路或高速公路為對(duì)象,對(duì)山區(qū)雙車道公路交通事故形成機(jī)理認(rèn)識(shí)不足;二是多數(shù)研究?jī)H分析事故數(shù)據(jù)的整體規(guī)律及特性,定量揭示不同類型事故間影響因素差異的比較研究較少,其顯著影響因素會(huì)被弱化或隱藏[6];再者,多分類的事故嚴(yán)重度分析是當(dāng)前研究的重要方向,一般假設(shè)事故嚴(yán)重度是有序變化的變量和采用有序離散模型,但已有研究發(fā)現(xiàn)事故數(shù)據(jù)并不嚴(yán)格滿足成比例假設(shè)[7]。
為明晰山區(qū)雙車道公路不同類別機(jī)動(dòng)車碰撞事故嚴(yán)重度的形成機(jī)理,以云南某山區(qū)二級(jí)公路的機(jī)動(dòng)車事故為研究對(duì)象,采用部分優(yōu)勢(shì)比模型分別建立3類機(jī)動(dòng)車碰撞事故嚴(yán)重度的分析模型,并與有序Logit 模型對(duì)比,重點(diǎn)研究不同事故等級(jí)下其顯著自變量的影響程度差異和預(yù)測(cè)準(zhǔn)確性。
研究數(shù)據(jù)源于云南省某典型山區(qū)雙車道二級(jí)公路,2011-2017年機(jī)動(dòng)車事故的案情描述數(shù)據(jù)(含涉事人員、涉事車輛、道路環(huán)境、日期、位置、事故傷亡及財(cái)產(chǎn)損失等信息),項(xiàng)目竣工圖設(shè)計(jì)資料(含道路線形及安全設(shè)施等信息),以及公路局交通調(diào)查站的日?qǐng)?bào)表數(shù)據(jù)(含日交通量信息)。根據(jù)涉事主體的交通方式,將1740 起事故數(shù)據(jù)劃分成機(jī)動(dòng)車與機(jī)動(dòng)車(機(jī)-機(jī))、機(jī)動(dòng)車與摩托車(機(jī)-摩)、機(jī)動(dòng)車與非機(jī)動(dòng)車(機(jī)-非)碰撞事故。采用2011-2016年事故數(shù)據(jù)樣本構(gòu)建嚴(yán)重度分析模型(1392 條),采用2017年數(shù)據(jù)(348條)進(jìn)行模型檢驗(yàn)。
常用的有序Logit等事故分析模型存在比例優(yōu)勢(shì)假定,其自變量系數(shù)不會(huì)隨事故等級(jí)的變化而不同。但交通事故的發(fā)生具有強(qiáng)隨機(jī)性和區(qū)域差異性,通常是部分自變量滿足比例優(yōu)勢(shì)假定,而其他自變量違反。分別采用有序Logit模型和部分優(yōu)勢(shì)比模型分析3類機(jī)動(dòng)車碰撞事故嚴(yán)重度。
(1)有序Logit模型
有序Logit模型的表達(dá)為
式中:Y為事故嚴(yán)重度等級(jí);X為自變量向量;P(Y≤j|X)為第j事故等級(jí)的累積概率;βk為第k個(gè)自變量的回歸系數(shù);K為自變量的總數(shù);αj為第j事故等級(jí)的常數(shù)項(xiàng);xk為第k個(gè)自變量,k=1,2,…,K。
無(wú)論模型中因變量分割點(diǎn)在什么位置,自變量回歸系數(shù)向量β保持不變,即存在比例優(yōu)勢(shì)假定(Proportional Odds Assumption)。
(2)部分優(yōu)勢(shì)比模型
部分優(yōu)勢(shì)比模型松弛了有序Logit模型的比例優(yōu)勢(shì)假定,部分自變量的系數(shù)隨事故等級(jí)的不同而變化,模型表達(dá)式為
式中:g(·)為第j事故等級(jí)的累積分布函數(shù);βj為第j事故等級(jí)的回歸系數(shù)向量;T為不滿足比例優(yōu)勢(shì)假設(shè)的自變量向量;γj為第j等級(jí)中不滿足比例優(yōu)勢(shì)假設(shè)的回歸系數(shù)向量。
部分優(yōu)勢(shì)比的概率模型表達(dá)式為
(3)自變量邊際效應(yīng)
邊際效應(yīng)是指當(dāng)其他變量取定值時(shí),該變量取值變化對(duì)因變量取值所產(chǎn)生的影響,可用于定量分析各顯著因素對(duì)事故嚴(yán)重度的影響大小與趨勢(shì),模型為
式中:ΔP(Y=j|xk)為與第j個(gè)事故等級(jí)的相關(guān)自變量xk的邊際效應(yīng);Yi為第i個(gè)事故嚴(yán)重度等級(jí)。對(duì)離散型變量,常用AME(Average Maginal Effects)法求解,即在其他變量取定值條件下,對(duì)顯著自變量的全部取值。當(dāng)自變量xk的取值狀態(tài)從b變化到a時(shí),嚴(yán)重度等級(jí)j的累積概率變化的平均值為
式中:m為自變量xk的離散取值總數(shù);αn+1、bn分別表征該自變量相鄰的第n+1 個(gè)和第n個(gè)離散值。
既有事故嚴(yán)重度研究使用頻率較高的影響因素包括駕駛?cè)诵詣e、年齡、車輛類型、路段線形、事故發(fā)生時(shí)間、日期、交通量和事故形態(tài)等。根據(jù)山區(qū)雙車道公路的事故數(shù)據(jù)條件及描述統(tǒng)計(jì)特征,研究以機(jī)動(dòng)車碰撞事故嚴(yán)重度為因變量,從人、車、路和環(huán)境等方面選取10 個(gè)候選自變量,如表1所示。道路條件考慮交叉口和彎坡組合,車輛類型考慮摩托車和非機(jī)動(dòng)車,事故形態(tài)考慮正面碰撞和側(cè)面碰撞(對(duì)向)等因素,盡可能準(zhǔn)確地表征山區(qū)雙車道公路的道路、交通及事故的基本特征。同時(shí),不同交通運(yùn)行條件直接影響駕駛?cè)私煌ㄐ袨榧败囕v行駛特性等,將日交通量Qi與年平均日交通量QAADT之比值定義為日交通量系數(shù)ci,以表征不同交通量水平對(duì)交通事故的影響。
表1 變量的分類與編碼Table 1 Classification and coding of variables
采用多重共線性進(jìn)行相關(guān)性分析,結(jié)果表明,自變量間不具相關(guān)性。采用Stata15.0 構(gòu)建3 類機(jī)動(dòng)車碰撞事故嚴(yán)重度的部分優(yōu)勢(shì)比分析模型和有序Logit 模型,顯著自變量的選取采用混合逐步選擇法,保留顯著性水平小于0.05 的自變量,兩種模型的參數(shù)估計(jì)結(jié)果如表2所示。
在部分優(yōu)勢(shì)比模型中:機(jī)-機(jī)事故嚴(yán)重度與涉事車輛車型、事故路段類型、季節(jié)、事故形態(tài)和肇事駕駛?cè)四挲g(不滿足比例優(yōu)勢(shì)假設(shè))顯著相關(guān);機(jī)-摩事故嚴(yán)重度受肇事駕駛?cè)四挲g、駕駛?cè)塑囆?、時(shí)間、日交通量系數(shù)和季節(jié)(不滿足比例優(yōu)勢(shì)假設(shè))顯著影響;機(jī)-非事故嚴(yán)重度則受肇事駕駛?cè)四挲g、時(shí)間、日期、事故形態(tài)和日交通量系數(shù)(不滿足比例優(yōu)勢(shì)假設(shè))的顯著影響。
相比有序Logit 分析模型,部分優(yōu)勢(shì)比模型增加了對(duì)不滿足比例優(yōu)勢(shì)假設(shè)的自變量定量刻畫,其考慮變量更多,解釋能力更強(qiáng)。在影響因素差異方面,機(jī)-機(jī)事故的顯著變量比部分優(yōu)勢(shì)比分析模型減少了不滿足成比例假設(shè)的肇事駕駛?cè)四挲g變量,機(jī)-摩事故則增加了事故形態(tài),減少了不滿足成比例假設(shè)的季節(jié),機(jī)-非事故僅與事故路段類型、日期和事故形態(tài)相關(guān)。
采用AIC信息準(zhǔn)則和偽R2檢驗(yàn)部分優(yōu)勢(shì)比模型和有序Logit模型的擬合有效性,AIC值越小、偽R2越大,模型的擬合效果越好,結(jié)果如表3所示,部分優(yōu)勢(shì)比分析模型的擬合效果總體更優(yōu)。
山區(qū)雙車道公路事故嚴(yán)重度的部分優(yōu)勢(shì)比模型和有序Logit模型的預(yù)測(cè)準(zhǔn)確率結(jié)果如表4所示。
表2 3類機(jī)動(dòng)車事故嚴(yán)重度分析模型的參數(shù)估計(jì)Table 2 Parameter estimation of severity prediction models for three types of motor vehicle crash
由表4可知:
(1)機(jī)-機(jī)、機(jī)-摩和機(jī)-非這3類機(jī)動(dòng)車碰撞事故中,部分優(yōu)勢(shì)比模型預(yù)測(cè)的平均準(zhǔn)確率比有序Logit模型分別提高了14.54%、5.65%和3.32%。
(2)對(duì)不同交通方式下3個(gè)等級(jí)的碰撞事故,兩種模型的最優(yōu)適用對(duì)象相同,分別對(duì)機(jī)-機(jī)的僅財(cái)產(chǎn)損失事故,機(jī)-摩的重傷或死亡事故,以及機(jī)-非的重傷或死亡事故的預(yù)測(cè)準(zhǔn)測(cè)率最好,但有序Logit模型的預(yù)測(cè)準(zhǔn)確性降低約10%。
表3 擬合優(yōu)度檢驗(yàn)Table 3 Test of goodness-of-fit
(3)部分優(yōu)勢(shì)比模型對(duì)機(jī)-機(jī)、機(jī)-摩和機(jī)-非這3 類碰撞事故嚴(yán)重度的預(yù)測(cè)準(zhǔn)確率基本在70%以上,具有一定的工程適用性,而有序Logit模型不適用于預(yù)測(cè)機(jī)-機(jī)碰撞事故的輕傷事故、重傷或死亡事故,機(jī)-摩碰撞事故的輕傷事故,以及機(jī)-非碰撞事故的僅財(cái)產(chǎn)損失事故,在相應(yīng)事故情景下其預(yù)測(cè)準(zhǔn)確率低于60%。
(4)相較于機(jī)-機(jī)事故和機(jī)-摩事故,機(jī)-非事故嚴(yán)重度的樣本量較少(占比7%),模型預(yù)測(cè)率低。
部分優(yōu)勢(shì)比模型顯著變量的邊際效應(yīng)值如表5所示。
表4 3類機(jī)動(dòng)車碰撞事故嚴(yán)重度分析模型的預(yù)測(cè)準(zhǔn)確率Table 4 Prediction accuracy of severity prediction models for three types of motor vehicle crash
表5 部分優(yōu)勢(shì)比模型的自變量邊際效應(yīng)值Table 5 Marginal effect value of significant variables in partial proportional odds model
由表5可知:
(1)在機(jī)-機(jī)事故中,季節(jié)和事故形態(tài)的影響最為顯著,由于高原山區(qū)公路夏季多雨,發(fā)生輕傷事故、重傷或死亡事故的概率分別增加6.3%和3.0%;當(dāng)發(fā)生追尾事故時(shí),輕傷、重傷或死亡的概率分別下降4.4%和2.1%,這表明追尾事故的嚴(yán)重度相對(duì)較低。
(2)在機(jī)-摩事故中,30~40 歲的肇事駕駛?cè)嗽斐芍貍蛩劳鍪鹿拾l(fā)生的概率增加16.0%,這是因?yàn)樵撃挲g段的駕駛?cè)藬?shù)量多且駕駛安全意識(shí)淡薄,存在超速行駛、違章超車等不良交通行為;白天比夜間發(fā)生重傷或死亡事故的概率增加5.7%,這是因?yàn)榘滋焐絽^(qū)雙車道公路車輛較多;日交通量系數(shù)對(duì)機(jī)-非事故嚴(yán)重度存在一定影響,隨著交通量的增加,重傷或死亡的機(jī)-摩事故概率增加4.2%。
(3)在機(jī)-非事故中,側(cè)翻導(dǎo)致輕傷、重傷或死亡事故的概率分別增大8.4%、1.4%,這說(shuō)明涉事非機(jī)動(dòng)車等弱勢(shì)群體更易發(fā)生嚴(yán)重的事故后果,工作日比非工作日更易發(fā)生僅財(cái)產(chǎn)損失事故,而在非工作日發(fā)生輕傷、重傷或死亡事故的概率增加,兩者的概率變化約為10%。
(1)相比有序Logit模型,部分優(yōu)勢(shì)比模型可準(zhǔn)確揭示不滿足比例優(yōu)勢(shì)假設(shè)的事故自變量。機(jī)-機(jī)事故嚴(yán)重度與肇事車輛車型、季節(jié)、路段類型、事故形態(tài)和肇事駕駛?cè)四挲g顯著相關(guān),而肇事駕駛?cè)四挲g不滿足比例優(yōu)勢(shì)假設(shè);機(jī)-摩事故嚴(yán)重度與肇事駕駛?cè)说哪挲g、車型、事故路段類型、發(fā)生時(shí)間、日交通量系數(shù)和季節(jié)顯著相關(guān),而季節(jié)不滿足比例優(yōu)勢(shì)假設(shè);機(jī)-非事故嚴(yán)重度受肇事駕駛?cè)四挲g、時(shí)間、日期、事故形態(tài)和日交通量系數(shù)顯著影響,而日交通量系數(shù)不滿足比例假設(shè)。
(2)有序Logit 分析模型不能刻畫不滿足成比例約束條件的特征變量,模型的預(yù)測(cè)準(zhǔn)確率和可移值性一般。部分優(yōu)勢(shì)比分析模型的平均預(yù)測(cè)率約75%,對(duì)比有序Logit模型,機(jī)-機(jī)事故、機(jī)-非事故、機(jī)-非事故的平均準(zhǔn)確率分別提高了14.54%、5.65%和3.32%,驗(yàn)證了事故分析模型中放寬成比例假設(shè)條件的有效性。
(3)交通事故數(shù)據(jù)具有異質(zhì)性,不同涉事交通方式下機(jī)動(dòng)車碰撞事故嚴(yán)重度影響因素及作用方向存在顯著差異,通過(guò)合理的事故分類可增強(qiáng)事故數(shù)據(jù)的同質(zhì)性,提高預(yù)測(cè)模型的精度。隨著數(shù)據(jù)類型豐富,可進(jìn)一步探究交通流特征參數(shù)與事故嚴(yán)重度的關(guān)系,分析事故模型的時(shí)空移值性。