陳喆, 巫立明, 楊恒旭, 溫惠英, 趙勝
(1.廣東聯(lián)合電子服務(wù)股份有限公司, 廣東 廣州 510075;2.華南理工大學(xué) 土木與交通學(xué)院, 廣東 廣州 510640)
高速公路由于車輛運(yùn)行速度快、交通流量大,存在較大的事故隱患和風(fēng)險(xiǎn)。相關(guān)研究顯示,高速公路的受傷率、死亡率及百公里事故率是普通公路的3倍以上[1]。高速公路交通事故在造成人民群眾生命財(cái)產(chǎn)損失的同時(shí),還會(huì)導(dǎo)致高速公路交通擁堵甚至路網(wǎng)癱瘓[2]。在高速公路交通事故中,常見的事故類型有追尾、翻車、撞擊護(hù)欄、貨物灑落、側(cè)面碰撞等,追尾作為發(fā)生頻率最高的高速公路事故類型之一,其處置時(shí)間過長(zhǎng),容易造成二次事故的發(fā)生,進(jìn)而導(dǎo)致更大的生命財(cái)產(chǎn)損失與通行能力下降。
交通事故發(fā)生后,第一時(shí)間對(duì)其持續(xù)時(shí)間進(jìn)行預(yù)測(cè)評(píng)估有利于后續(xù)相關(guān)救援疏散工作計(jì)劃制定。近年來,眾多學(xué)者開展了交通事故持續(xù)時(shí)間預(yù)測(cè)研究,形成了兩類主要方法,分別為基于人工智能的方法和基于統(tǒng)計(jì)的方法。在人工智能學(xué)習(xí)模型方面,姬楊蓓蓓等采用貝葉斯方法建立決策樹預(yù)測(cè)模型,對(duì)交通事故持續(xù)時(shí)間進(jìn)行了預(yù)測(cè)[3];何珂等基于山西省2 115起高速公路隧道交通事故數(shù)據(jù),使用主成分分析和隨機(jī)森林組合模型對(duì)隧道交通事故持續(xù)時(shí)間進(jìn)行了預(yù)測(cè)[4];紀(jì)柯柯等結(jié)合多種文本分類算法,構(gòu)建V-Fisher有序聚類模型,提升了對(duì)交通事故持續(xù)時(shí)間的預(yù)測(cè)效果[5];Tang J. J.等基于華盛頓事件系統(tǒng)中2 565起交通事故數(shù)據(jù),建立K-Means和XGBoost算法進(jìn)行了事故持續(xù)時(shí)間預(yù)測(cè)[6]。基于人工智能學(xué)習(xí)模型的事故持續(xù)時(shí)間預(yù)測(cè)具有較好的性能,但可解釋性較差,且對(duì)樣本量的要求較高,需要豐富的數(shù)據(jù)樣本及標(biāo)簽。基于統(tǒng)計(jì)方法的交通事故持續(xù)時(shí)間預(yù)測(cè)模型主要分為概率分布模型、線性回歸模型和基于風(fēng)險(xiǎn)的模型。Hou L.等建立非比例風(fēng)險(xiǎn)模型,基于西雅圖2 584起高速公路交通事故樣本,分析了事件、時(shí)間、地理、交通和運(yùn)營(yíng)對(duì)事件清除時(shí)間的時(shí)變影響,發(fā)現(xiàn)涉及重型卡車、夜間、周末等18個(gè)因素對(duì)清除時(shí)間有顯著影響[7];Ding C.等分別針對(duì)事故響應(yīng)時(shí)間、清除時(shí)間建立二元概率模型和切換回歸模型,分析了事故類型、時(shí)間、環(huán)境等因素的影響[8];夏正豐應(yīng)用多元回歸方法建立了高速公路交通事故持續(xù)時(shí)間預(yù)測(cè)模型[9];Zou Y. J.等利用分位數(shù)回歸方法和Copula模型分析了美國(guó)西雅圖高速公路交通事故持續(xù)時(shí)間的影響因素[10];Wali B.等對(duì)固定參數(shù)回歸、隨機(jī)參數(shù)回歸與基于分位數(shù)回歸的事故持續(xù)時(shí)間模型進(jìn)行對(duì)比,結(jié)果顯示隨機(jī)參數(shù)模型的預(yù)測(cè)結(jié)果更準(zhǔn)確[11]。以往的研究多是基于歷史事故數(shù)據(jù)對(duì)高速公路交通事故持續(xù)時(shí)間進(jìn)行分析,較少考慮不同事故類型的事故持續(xù)時(shí)間的差異,且受限于數(shù)據(jù)采集難度,未充分考慮事故發(fā)生前后短時(shí)交通流參數(shù)變化對(duì)高速公路追尾事故持續(xù)時(shí)間的影響。基于高速公路追尾事故持續(xù)時(shí)間的有序性,本文將追尾事故持續(xù)時(shí)間分為3個(gè)等級(jí),綜合考慮追尾事故信息與事故前后短時(shí)交通流運(yùn)行狀況,運(yùn)用有序Logit模型和邊際效應(yīng)分析高速公路追尾事故持續(xù)時(shí)間的影響因素,為高速公路交通管理部門制定追尾事故救援及事故后交通疏散方案提供依據(jù)。
研究數(shù)據(jù)來自廣東省高速公路主線ETC(電子不停車收費(fèi)系統(tǒng))門架數(shù)據(jù)及交警記錄的交通事故數(shù)據(jù),基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)完整、字段齊全,具有良好的精度。通過數(shù)據(jù)匹配與數(shù)據(jù)挖掘進(jìn)一步提取交通流數(shù)據(jù)與事故信息,其中交通流數(shù)據(jù)主要字段包括高速公路ETC門架監(jiān)測(cè)的交通流量、交通密度、區(qū)間速度等,交通事故數(shù)據(jù)主要字段包括事故類型、涉事車輛類型、涉事車輛數(shù)、事故持續(xù)時(shí)間、占據(jù)車道情況及事故發(fā)生地點(diǎn)車道數(shù)、上下游路段交通設(shè)施布局等。通過對(duì)上述交通流數(shù)據(jù)、事故數(shù)據(jù)及道路數(shù)據(jù)進(jìn)行匹配,得到925起高速公路追尾事故數(shù)據(jù)及發(fā)生前后短時(shí)交通流參數(shù),為高速公路追尾事故持續(xù)時(shí)間分析及預(yù)測(cè)提供數(shù)據(jù)基礎(chǔ)。
如表1所示,所選數(shù)據(jù)集中高速公路追尾事故持續(xù)時(shí)間最大值為721.00 min,最小值為14.00 min,平均值為88.25 min,均方根為107.37 min。其中事故持續(xù)時(shí)間為50~100 min的追尾事故數(shù)量最多,約占全部追尾事故的52%(見圖1)。
由于存在多個(gè)難以觀測(cè)的變量影響事故持續(xù)時(shí)間,準(zhǔn)確的追尾事故持續(xù)時(shí)間往往難以預(yù)測(cè)。高速公路交通管理部門在進(jìn)行事故救援及事故后交通疏散時(shí)并不需要獲知事故準(zhǔn)確的持續(xù)時(shí)間,而是需要根據(jù)預(yù)測(cè)的追尾事故持續(xù)時(shí)間長(zhǎng)短將事故進(jìn)行分級(jí),以制定不同的事故處置方案。鑒于此,區(qū)別以往按照傷亡人數(shù)、財(cái)產(chǎn)損失對(duì)交通事故的分類,依據(jù)采集的925起追尾事故持續(xù)時(shí)間的分布及追尾事故對(duì)道路交通的影響,將追尾事故分為輕微追尾事故(事故持續(xù)時(shí)間小于100 min)、一般追尾事故(事故持續(xù)時(shí)間為100~200 min)和嚴(yán)重追尾事故(事故持續(xù)時(shí)間大于200 min)。
表1 高速公路追尾事故持續(xù)時(shí)間統(tǒng)計(jì)
圖1 高速公路追尾事故持續(xù)時(shí)間頻數(shù)分布
高速公路追尾事故的持續(xù)時(shí)間與事故發(fā)生時(shí)間、涉事車輛類型、涉事車輛數(shù)、傷亡人數(shù)、占據(jù)車道情況及交通流狀況等密切相關(guān)[11]。因此,以追尾事故持續(xù)時(shí)間的3個(gè)等級(jí)為因變量,從事故發(fā)生時(shí)間、涉事車輛類型、傷亡情況、車道情況、事故發(fā)生前后交通流運(yùn)行狀況五方面選取12個(gè)自變量進(jìn)行分析,變量定義見表2。
表2 變量編碼及描述
續(xù)表2
由表2可知:因變量是三分類的有序變量,且持續(xù)時(shí)間逐漸遞增,而自變量中既有連續(xù)變量又有分類變量。其中二分類變量為事故發(fā)生日期、晝夜劃分、時(shí)段劃分及占據(jù)路肩情況,多分類變量是指多于2種選擇的變量,將涉事車輛類型劃分為僅小車、僅貨車、貨車與小車、有客車、有特種車五類。事故信息中,涉事車輛數(shù)、受傷人數(shù)及占據(jù)車道數(shù)為連續(xù)變量??紤]到事故發(fā)生前后交通流運(yùn)行狀況可能對(duì)事故清理造成影響,將事故發(fā)生前后10 min內(nèi)路段平均速度及到達(dá)上游門架的車輛數(shù)也作為自變量,探究其對(duì)追尾事故持續(xù)時(shí)間的影響。交通流影響因素中,追尾事故發(fā)生前后10 min內(nèi)路段平均速度及到達(dá)事故發(fā)生點(diǎn)上游門架的交通量均為連續(xù)變量。
多項(xiàng)Logit模型可視為二元Logit模型的拓展,二者的差異在于,二元Logit模型的被解釋變量只有0和1兩個(gè)取值,而多項(xiàng)Logit模型涉及被解釋變量有多個(gè)取值的情形。多項(xiàng)Logit模型基于效用理論擬合自變量與包含多個(gè)類別的分類變量間的內(nèi)在關(guān)系。假定事故影響因素相互獨(dú)立,且服從Gumbel分布(Ⅰ類廣義極值分布),對(duì)于任一交通事故i,事故持續(xù)時(shí)間等級(jí)的效用函數(shù)為:
Si,k=βkXi+εi,k(k=1,2,3)
(1)
式中:Xi為事故i對(duì)應(yīng)的影響因素觀測(cè)值組成的向量;βk為這些因素對(duì)應(yīng)事故持續(xù)時(shí)間等級(jí)k的回歸系數(shù)組成的向量(包括常數(shù)項(xiàng));εi,k為隨機(jī)項(xiàng)。
有序Logit模型主要用于處理因變量為有序變量的多分類結(jié)果,屬于多項(xiàng)Logit模型的拓展[11],在多分類的交通事故等級(jí)預(yù)測(cè)中表現(xiàn)出較好的性能。傳統(tǒng)有序Logit模型中,假定解釋變量的系數(shù)是固定的,高速公路追尾事故持續(xù)時(shí)間第j個(gè)等級(jí)的有序Logit模型為:
(2)
式中:Yi為第i起追尾事故的持續(xù)時(shí)間等級(jí);X為自變量向量;β為回歸系數(shù)向量;αj為第j追尾事故等級(jí)的截距;J為高速公路追尾事故持續(xù)時(shí)間劃分的等級(jí)數(shù)量。
本文將因變量(追尾事故持續(xù)時(shí)間)分為3個(gè)等級(jí),有序Logit模型為:
(3)
P(Y=2|X)=P(Y≤2|X)-P(Y≤1|X)
(4)
P(Y=3|X)=1-P(Y≤2|X)
(5)
式中:xk為第k個(gè)自變量,k=1,2,…,K;βk為第k個(gè)自變量的回歸系數(shù)。
邊際效應(yīng)可用于定量分析不同因素對(duì)因變量影響的強(qiáng)弱程度與變化趨勢(shì)[12],其表達(dá)式為:
(6)
以廣東省某高速公路2020—2022年925起追尾事故的持續(xù)時(shí)間為研究對(duì)象,考慮到事故持續(xù)時(shí)間劃分等級(jí)具有有序性,通過回歸分析建立追尾事故持續(xù)時(shí)間的有序Logit模型。采用統(tǒng)計(jì)分析軟件Stata16.0進(jìn)行求解,取顯著性水平為0.10,通過最大似然估計(jì)法估算得到有序Logit模型的參數(shù)結(jié)果(見表3)。
由表3可知:1) 受傷人數(shù)、占據(jù)車道數(shù)、追尾事故發(fā)生時(shí)間為工作日還是節(jié)假日、追尾事故發(fā)生時(shí)間為夜晚還是白天、事故發(fā)生后10 min內(nèi)路段平均速度及涉事車輛類型對(duì)高速公路追尾事故持續(xù)時(shí)間具有顯著影響。占據(jù)車道數(shù)、受傷人數(shù)越多及追尾事故發(fā)生于節(jié)假日和白天都會(huì)導(dǎo)致追尾影響交通的持續(xù)時(shí)間更長(zhǎng)。2) 占據(jù)車道數(shù)、受傷人數(shù)每增加一個(gè)單位,追尾事故持續(xù)時(shí)間等級(jí)上升的概率分別增加38%和46%,驗(yàn)證了前人的研究成果[13]。節(jié)假日發(fā)生的追尾事故持續(xù)時(shí)間等級(jí)更高的概率是工作日的1.321倍,白天發(fā)生的追尾事故持續(xù)時(shí)間等級(jí)更高的概率是夜晚的1.788倍。3) 相較于涉事車輛類型均為小車,涉事車輛中含有大客車、貨車及特種車往往會(huì)造成更長(zhǎng)的事故持續(xù)時(shí)間,這點(diǎn)與高速公路交通事故規(guī)律相吻合,即有大型車輛參與的交通事故往往伴隨著更大的事故影響范圍與事故嚴(yán)重程度。而隨著追尾事故發(fā)生后10 min內(nèi)路段平均速度的增加,追尾事故持續(xù)時(shí)間等級(jí)更有可能下降,這可能是由于事故發(fā)生后上游駕駛員提高行車速度在短時(shí)間內(nèi)駛離事故現(xiàn)場(chǎng),以減少對(duì)現(xiàn)場(chǎng)交通的影響,為事故現(xiàn)場(chǎng)清理及應(yīng)急救援提供良好條件。
表3 基于有序Logit模型的參數(shù)估計(jì)
表4為Pearson統(tǒng)計(jì)量和Deviance統(tǒng)計(jì)量擬合優(yōu)度檢驗(yàn)結(jié)果。Pearson和Deviance統(tǒng)計(jì)量的p值均大于0.1,表明在顯著性水平α=0.10的條件下模型的擬合效果較好。有序Logit模型平行性檢驗(yàn)結(jié)果原假設(shè)是各回歸方程互相平行,平行性檢驗(yàn)p=0.271>0.10,接受原假設(shè),模型通過平行性檢驗(yàn),可進(jìn)一步對(duì)高速公路追尾事故持續(xù)時(shí)間的影響因素進(jìn)行分析。
表4 有序Logit模型的擬合優(yōu)度檢驗(yàn)
分別計(jì)算有序多分類Logit模型和無序多分類Logit模型的赤池信息量(Akaike Information Criterion,AIC)和貝葉斯信息量(Bayesian Information criterion,BIC),結(jié)果見表5。有序多分類Logit模型的AIC與BIC均低于無序多分類Logit模型,表明有序Logit模型的擬合優(yōu)度更高。
表5 模型對(duì)比
結(jié)合邊際效應(yīng)對(duì)表3中顯著的自變量進(jìn)行參數(shù)解釋,結(jié)果見表6。
表6 邊際效應(yīng)分析
由表6可知:1) 在90%置信水平上,受傷人數(shù)每增加1人,追尾事故為一般事故、嚴(yán)重事故的概率分別增加4.8%、1.3%,而輕微追尾事故的概率降低6.1%;占據(jù)車道數(shù)每增加1條,一般追尾事故、嚴(yán)重追尾事故的概率分別增加5.6%、1.5%,輕微事故概率降低7.1%;事故發(fā)生后10 min內(nèi)路段平均速度每增加一個(gè)單位,一般追尾事故與重大追尾事故的概率分別降低0.2%、0.1%。2) 相較于工作日和夜晚,節(jié)假日與白天容易發(fā)生持續(xù)時(shí)間更長(zhǎng)、嚴(yán)重程度更大的追尾事故。節(jié)假日期間一般追尾事故、嚴(yán)重追尾事故的概率分別增加4.1%、1.1%,白天時(shí)段一般追尾事故、嚴(yán)重追尾事故的概率分別增加8.6%、2.3%。這是由于節(jié)假日和白天高速公路交通量更大,給事故清理與應(yīng)急救援帶來更大干擾,造成更長(zhǎng)的事故持續(xù)時(shí)間。3) 在涉事車輛類型方面,涉事車輛中含有大客車、貨車及特種車會(huì)增加追尾事故的持續(xù)時(shí)間。
(1) 以廣東省某高速公路2020—2022年925起追尾事故為研究對(duì)象,從事故發(fā)生時(shí)間、涉事車輛類型、傷亡情況、車道情況、事故發(fā)生前后交通流運(yùn)行狀況5個(gè)方面選取12個(gè)自變量,以事故持續(xù)時(shí)間為特征將追尾事故劃分為3個(gè)等級(jí),并將其作為因變量,分別構(gòu)建無序多分類Logit模型和有序多分類Logit模型。結(jié)果表明,相較于無序多分類Logit模型,有序多分類Logit模型對(duì)高速公路追尾事故持續(xù)時(shí)間的擬合效果更優(yōu)。
(2) 高速公路追尾事故占據(jù)車道數(shù)、受傷人數(shù)、事故發(fā)生時(shí)間、事故發(fā)生后10 min內(nèi)路段平均速度及涉事車輛類型對(duì)事故持續(xù)時(shí)間具有顯著影響。
(3) 占據(jù)車道數(shù)和受傷人數(shù)越多、追尾事故發(fā)生于節(jié)假日和白天及涉事車輛中含有大客車、貨車及特種車輛會(huì)增加追尾事故的持續(xù)時(shí)間。
(4) 追尾事故持續(xù)時(shí)間隨著事故發(fā)生后10 min內(nèi)路段平均速度的增大而減少,事故發(fā)生后10 min內(nèi)路段平均速度每增加一個(gè)單位,一般追尾事故與重大追尾事故的概率分別降低0.2%、0.1%。