宗芳 許洪國(guó) 張慧永
(吉林大學(xué)交通學(xué)院,吉林長(zhǎng)春130022)
隨著我國(guó)社會(huì)經(jīng)濟(jì)的發(fā)展,機(jī)動(dòng)化程度不斷提高,道路交通安全形勢(shì)日趨嚴(yán)峻,交通事故屢有發(fā)生.為了采取有效措施來迅速處理交通事故,減少人員傷亡和財(cái)產(chǎn)損失,有必要建立交通事故態(tài)勢(shì)分析模型,有效評(píng)估交通事故的嚴(yán)重程度和等級(jí),從而制定有針對(duì)性的交通事故快速響應(yīng)方案,盡可能降低交通事故的影響.
事故態(tài)勢(shì)分析是交通安全研究領(lǐng)域的主要研究方向之一.具體包括事故嚴(yán)重程度預(yù)測(cè)[1-6]、事故持續(xù)時(shí)間預(yù)測(cè)[7-13]和事故致因分析[14-15]等方面.其中,交通事故態(tài)勢(shì)預(yù)測(cè)主要應(yīng)用Logit模型、有序響應(yīng)模型等.例如,Sze等[1]以非機(jī)動(dòng)車屬性和道路屬性為主要影響因素,建立二項(xiàng)Logit模型,預(yù)測(cè)事故中是否有人員死亡.Kim等[2]將交通事故嚴(yán)重程度按死傷人數(shù)分為4個(gè)級(jí)別,建立多項(xiàng)Logit模型預(yù)測(cè)事故態(tài)勢(shì).Lee等[3]將交通事故嚴(yán)重程度按死傷人數(shù)分為5個(gè)級(jí)別,建立了有序響應(yīng)模型預(yù)測(cè)態(tài)勢(shì).國(guó)內(nèi)相關(guān)研究較少,馬壯林等[4-5]分別應(yīng)用神經(jīng)網(wǎng)絡(luò)模型和二項(xiàng)Logit模型預(yù)測(cè)公路隧道交通事故的嚴(yán)重程度,其中神經(jīng)網(wǎng)絡(luò)模型的因變量為事故嚴(yán)重程度(財(cái)產(chǎn)損失事故取0,受傷事故取0.5,死亡事故取1),Logit模型的因變量為是否有死亡.李世民等[6]應(yīng)用累計(jì)Logistic模型分析交叉口轉(zhuǎn)彎車輛比例、控制方式和土地開發(fā)強(qiáng)度對(duì)無信號(hào)三路交叉口的事故嚴(yán)重性的影響.
縱觀以上各模型預(yù)測(cè)結(jié)果的有效性和模型的適用性,交通事故態(tài)勢(shì)預(yù)測(cè)中如果因變量為二項(xiàng)變量,則較適合采用二項(xiàng)Logit模型;因變量為多項(xiàng)無序變量,適合采用改進(jìn)的Logit模型(因?yàn)長(zhǎng)ogit模型具有選擇枝獨(dú)立特性),而不適合采用多項(xiàng)Logit模型;因變量為有序變量(即因變量的取值具有等級(jí)關(guān)系),適合采用有序響應(yīng)模型.另外,在嚴(yán)重程度的預(yù)測(cè)中最好能夠?qū)λ劳鋈藬?shù)、受傷人數(shù)和財(cái)產(chǎn)損失3個(gè)參量進(jìn)行單獨(dú)建模和預(yù)測(cè),而且在因變量設(shè)置方面也要盡量細(xì)致到具體的財(cái)產(chǎn)損失額度、受傷人數(shù)和死亡人數(shù),從而為事故響應(yīng)提供更細(xì)致的決策依據(jù).同時(shí),在事故嚴(yán)重程度影響因素的選擇方面也要盡量全面.
表征交通事故態(tài)勢(shì)的參量主要包括死亡人數(shù)、受傷人數(shù)和財(cái)產(chǎn)損失量.其中死亡人數(shù)和受傷人數(shù)是決定事故快速響應(yīng)決策的主要參量,而事故中人員受傷的概率要遠(yuǎn)大于人員死亡的概率.因此,文中將主要以受傷人數(shù)為研究對(duì)象,建立交通事故態(tài)勢(shì)的預(yù)測(cè)模型.因變量將被細(xì)化到受傷人數(shù)數(shù)量,即設(shè)置多項(xiàng)的有序因變量.在模型方面則應(yīng)用有序響應(yīng)模型中常用的Ordered Probit模型進(jìn)行參量建模.目的是促進(jìn)Ordered Probit模型在事故態(tài)勢(shì)預(yù)測(cè)領(lǐng)域的應(yīng)用,同時(shí)為交通管理部門迅速準(zhǔn)確地判斷事故態(tài)勢(shì)及做出快速響應(yīng)提供決策支持.
建模樣本數(shù)據(jù)取自長(zhǎng)春市2008年的6075起事故.經(jīng)過初步的經(jīng)驗(yàn)判斷和數(shù)據(jù)相關(guān)性分析,篩選得到事故發(fā)生時(shí)間等17個(gè)變量(見表1).在原始數(shù)據(jù)中,除受傷人數(shù)和能見度為數(shù)量變量外,其它變量均為屬性變量.為了滿足建模要求,參照GA16.1—2003《道路交通事故信息代碼》,結(jié)合其它相關(guān)標(biāo)準(zhǔn)和建模經(jīng)驗(yàn),將屬性變量編碼處理為虛擬變量,將數(shù)量變量編碼處理為離散變量.各變量的取值及統(tǒng)計(jì)所得的均值和標(biāo)準(zhǔn)差見表1.
表1 事故嚴(yán)重程度的影響因素和變量設(shè)置Table 1 Factors and variables of accident severity
由于決策變量-受傷人數(shù)為多項(xiàng)有序的離散變量,因此采用有序響應(yīng)模型進(jìn)行預(yù)測(cè).有序響應(yīng)模型是處理有序離散變量的一類計(jì)量經(jīng)濟(jì)學(xué)模型.根據(jù)對(duì)殘差項(xiàng)條件概率分布做出不同的假定,有序響應(yīng)模型可分為不同類型,常用的有Ordered Probit模型和Ordered Logit模型.
Ordered Probit模型是進(jìn)行有序離散變量預(yù)測(cè)最常采用的模型之一.模型中被解釋變量(因變量)的觀測(cè)值y表示排序結(jié)果或分類結(jié)果,其取值為有序整數(shù),如 0,1,2,3,….解釋變量(自變量)是可能影響被解釋變量排序的各種因素,可以是多個(gè)解釋變量的集合.Ordered Probit模型的一般形式為:
式中:y為因變量;y*稱為潛變量或隱性變量;X為解釋變量組成的向量;β為X的系數(shù),是待估計(jì)參數(shù)組成的向量,表示各解釋變量對(duì)被解釋變量影響程度的大小;ε為隨機(jī)擾動(dòng)項(xiàng),代表被模型忽略、但對(duì)被解釋變量產(chǎn)生影響的其它因素的總和,ε對(duì)X的條件分布假設(shè)為標(biāo)準(zhǔn)正態(tài)分布,即
設(shè) α1、α2、α3為閾值,且 α1<α2<α3,并有:
那么,y對(duì)X的條件概率的計(jì)算方程組為
式中:φ()為標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù).
通常,可用極大似然方法對(duì)系數(shù)β和閾值α1、α2、α3進(jìn)行估計(jì).
由于Ordered Probit模型自身的特點(diǎn),變量的系數(shù)項(xiàng)β并不能直接說明解釋變量對(duì)被解釋變量的影響大小,甚至系數(shù)的符號(hào)也只能說明該變量對(duì)第一和最后一個(gè)選擇枝的影響方向,而不能說明對(duì)中間選擇枝的影響方向.因此,為了進(jìn)一步了解各變量對(duì)被解釋變量的影響程度和方向,需要計(jì)算各個(gè)變量的邊際貢獻(xiàn).某個(gè)變量的邊際貢獻(xiàn)指在其它變量取均值時(shí),該變量變動(dòng)1個(gè)單位對(duì)某項(xiàng)選擇的概率影響.計(jì)算式為
根據(jù)Ordered Probit理論,建立受傷人數(shù)預(yù)測(cè)模型.模型的選擇枝設(shè)定為:0表示無受傷人數(shù),1表示受傷人數(shù) =[1,3),2表示受傷人數(shù) =[3,+∞).在初始建模階段,假定表1中所有變量均為模型的解釋變量,在預(yù)測(cè)過程中根據(jù)檢驗(yàn)結(jié)果和經(jīng)驗(yàn)值進(jìn)行參數(shù)的進(jìn)一步篩選和重新標(biāo)定.應(yīng)用Stata軟件的Oprobit命令進(jìn)行模型的參數(shù)標(biāo)定,標(biāo)定結(jié)果如表2所列.
表2 受傷人數(shù)預(yù)測(cè)Ordered Probit模型參數(shù)標(biāo)定結(jié)果1)Table 2 Estimation results of Ordered Probit model of injury severity predicion
代入各參數(shù)的標(biāo)定值,得到受傷人數(shù)預(yù)測(cè)Ordered Probit模型:
統(tǒng)計(jì)分析各項(xiàng)參數(shù)的估計(jì)結(jié)果可知,經(jīng)變量篩選后,共有7個(gè)自變量對(duì)受傷人數(shù)產(chǎn)生影響.按影響從大到小的順序排列,分別為路表是否干燥、是否有中大型車輛、是否在交叉口、天氣、是否有摩托車、是否有信號(hào)或標(biāo)志標(biāo)線、是否在機(jī)動(dòng)車道.
為了進(jìn)一步明確各自變量對(duì)事故受傷人數(shù)中各選擇枝的影響方向和影響程度大小,由式(4)計(jì)算各變量的邊際貢獻(xiàn)值,結(jié)果見表2.根據(jù)計(jì)算結(jié)果,可以分析模型中各參數(shù)對(duì)3個(gè)選擇枝分別產(chǎn)生的影響.需要指出的是,由于城市中發(fā)生3人以上受傷事故的概率相對(duì)于無受傷和受傷為1-3人的概率小,因此在均勻抽樣的情況下,受傷人數(shù)為[3,+∞)的樣本量明顯較受傷人數(shù)為0或1-3時(shí)少,再經(jīng)過模型標(biāo)定時(shí)誤差的放大,導(dǎo)致對(duì)受傷人數(shù)為[3,+∞)的預(yù)測(cè)準(zhǔn)確性相對(duì)較差.此問題導(dǎo)致各參數(shù)對(duì)選擇枝3的影響并不太符合常規(guī)想法和經(jīng)驗(yàn)判斷.因此,主要通過各參數(shù)的邊際貢獻(xiàn)計(jì)量值考查各參數(shù)對(duì)選擇枝1和2的影響.各變量的分析如下:
(1)變量“天氣”對(duì)事故受傷人數(shù)的影響較大,邊際貢獻(xiàn)參數(shù)的符號(hào)與憑經(jīng)驗(yàn)判斷所得的預(yù)期影響方向一致.當(dāng)天氣晴好時(shí),發(fā)生受傷人數(shù)為 0、1-3和3人以上的概率比天氣不好時(shí)分別低20%、98%和23%.可見,天氣狀況不好時(shí)更容易發(fā)生中等受傷人數(shù)(1-3人受傷)的事故.天氣晴好時(shí)更容易發(fā)生無人員受傷的事故.
(2)變量“是否有信號(hào)或標(biāo)志標(biāo)線”對(duì)事故受傷人數(shù)有影響,但影響程度不大,邊際貢獻(xiàn)參數(shù)的符號(hào)基本與預(yù)期影響方向一致.結(jié)果表明,當(dāng)事故發(fā)生地點(diǎn)設(shè)有信號(hào)或標(biāo)志標(biāo)線等交通安全設(shè)施時(shí),發(fā)生受傷人數(shù)為0和3人以上的概率比沒有安全設(shè)施時(shí)分別高6%和7%.當(dāng)事故發(fā)生地點(diǎn)設(shè)有信號(hào)或標(biāo)志標(biāo)線等交通安全設(shè)施時(shí),發(fā)生受傷人數(shù)為1-3的概率比沒有安全設(shè)施時(shí)低95%.可見,有安全設(shè)施的情況下事故的嚴(yán)重程度比沒有安全設(shè)施時(shí)要低,沒有安全設(shè)施時(shí)較易導(dǎo)致事故中有人員受傷.
(3)變量“是否在機(jī)動(dòng)車道”對(duì)事故受傷人數(shù)有影響,但影響程度不大,邊際貢獻(xiàn)參數(shù)的符號(hào)基本與預(yù)期影響方向一致.結(jié)果表明,當(dāng)事故發(fā)生在機(jī)動(dòng)車道上時(shí),發(fā)生受傷人數(shù)為0和3人以上的概率比發(fā)生在其它車道上時(shí)分別高7%和8%;發(fā)生受傷人數(shù)為1-3的概率比發(fā)生在其它車道上時(shí)低95%.可見,與非機(jī)動(dòng)車道、人行道等相比,機(jī)動(dòng)車道不易發(fā)生人員受傷事故,而非機(jī)動(dòng)車道和人行道由于有非機(jī)動(dòng)車和行人,一旦發(fā)生事故容易導(dǎo)致人員傷亡.
(4)變量“是否在交叉口”對(duì)事故受傷人數(shù)的影響較大,邊際貢獻(xiàn)參數(shù)的符號(hào)基本與預(yù)期影響方向一致.結(jié)果表明,當(dāng)事故發(fā)生地點(diǎn)為交叉口時(shí),發(fā)生受傷人數(shù)為0、1-3和3人以上的概率比發(fā)生在路段等其它位置時(shí)分別低21%、98%和23%.可見,由于一般機(jī)動(dòng)車、非機(jī)動(dòng)車和行人到達(dá)交叉口時(shí)均會(huì)減速慢行、注意瞭望,從而使事故的受傷人數(shù)降低.反之發(fā)生在路段上的事故由于缺乏信號(hào)、標(biāo)志等的提醒,加之交通參與者的疏忽,更容易導(dǎo)致事故嚴(yán)重程度的增加.
(5)變量“是否有摩托車”和“是否有大中型車輛”對(duì)事故受傷人數(shù)均有一定影響,邊際貢獻(xiàn)參數(shù)的符號(hào)與預(yù)期影響方向不一致.當(dāng)事故中有摩托車時(shí),發(fā)生受傷人數(shù)為0和3人以上的概率比事故中沒有摩托車時(shí)分別高13%和14%;發(fā)生受傷人數(shù)為1-3的概率比事故中沒有摩托車時(shí)低94%.當(dāng)事故中有大中型車輛時(shí),發(fā)生受傷人數(shù)為0和3人以上的概率比事故中沒有大中型車輛時(shí)分別高27%和30%;發(fā)生受傷人數(shù)為1-3的概率比事故中沒有大中型車輛時(shí)低92%.在表征事故參與方的車輛類型數(shù)據(jù)中,除了摩托車和大中型車輛以外,主要為微型、小型和輕型車輛,如小型客車、輕型貨車等.結(jié)合是否有摩托車和是否有大中型車輛的分析可知,微型、小型和輕型車輛更容易造成1-3的人員死亡事故,與之相比,摩托車和大中型車輛參與的事故的嚴(yán)重程度有所降低.邊際貢獻(xiàn)參數(shù)的符號(hào)與預(yù)期影響方向不一致的原因主要是進(jìn)行預(yù)期影響方向判定時(shí)僅考慮了各項(xiàng)參數(shù)單獨(dú)對(duì)結(jié)果產(chǎn)生的影響,而沒有從所有車輛類型的角度進(jìn)行總體考慮.
(6)變量“路表是否干燥”對(duì)事故受傷人數(shù)的影響較大,邊際貢獻(xiàn)參數(shù)的符號(hào)基本與預(yù)期影響方向一致.結(jié)果表明,當(dāng)路表干燥時(shí),發(fā)生受傷人數(shù)為0和3人以上的概率比路表潮濕、泥濘等時(shí)分別高34%和38%;發(fā)生受傷人數(shù)為1-3的概率比路表不干燥時(shí)低92%.可見,路表濕滑容易導(dǎo)致事故受傷人數(shù)的增加,相反當(dāng)路表干燥時(shí)事故的嚴(yán)重程度將有所下降.
文中應(yīng)用Stata軟件對(duì)所建立的交通事故受傷人數(shù)預(yù)測(cè)Ordered Probit模型進(jìn)行了參數(shù)標(biāo)定和模型檢驗(yàn),計(jì)算了各影響因素的邊際貢獻(xiàn),分析了各因素對(duì)受傷人數(shù)的影響.結(jié)果表明,所建模型在進(jìn)行事故受傷人數(shù)預(yù)測(cè)的同時(shí),也可用于分析各因素對(duì)受傷人數(shù)的影響方向和影響程度.本研究可為交通管理部門迅速準(zhǔn)確地判斷事故態(tài)勢(shì),做出快速響應(yīng),提供決策支持.同時(shí),對(duì)于Ordered Probit模型在事故態(tài)勢(shì)預(yù)測(cè)領(lǐng)域的進(jìn)一步應(yīng)用以及死亡人數(shù)、財(cái)產(chǎn)損失等其它表征事故態(tài)勢(shì)參量的預(yù)測(cè)有一定借鑒作用.
需要說明的是,本研究存在以下缺陷:(1)未對(duì)死亡人數(shù)、財(cái)產(chǎn)損失等其它表征事故態(tài)勢(shì)的參量進(jìn)行預(yù)測(cè),但證明了Ordered Probit模型對(duì)于多項(xiàng)的有序離散變量的預(yù)測(cè)具有較高的預(yù)測(cè)精度,今后可根據(jù)參量的選擇枝個(gè)數(shù)和是否為有序變量,選擇Logit模型或Ordered Probit模型進(jìn)行預(yù)測(cè);(2)在數(shù)據(jù)方面,由于從樣本中無法獲取事故中人、車速、交通量等相關(guān)數(shù)據(jù),因此導(dǎo)致建模過程中無法考慮這些重要因素(如車速、肇事者性格特點(diǎn)等)對(duì)事故后果的影響.今后應(yīng)考慮增加相關(guān)數(shù)據(jù)項(xiàng)以完善模型.
[1]Sze N N,Wong S C.Diagnostic analysis of the logistic model for pedestrian injury severity in traffic crashes[J].Accident Analysis & Prevention,2007,39(6):1267-1278.
[2]Kim J K,Kim S,Ulfarsson G F,et al.Bicyclist injury severities in bicycle motor vehicle accidents[J].Accident Analysis & Prevention,2007,39(2):238-251.
[3]Lee C,Abdel-Aty M.Comprehensive analysis of vehicle pedestrian crashes at intersections in Florida[J].Accident Analysis and Prevention,2005,37(4):775-786.
[4]馬壯林,邵春福,李霞.高速公路隧道交通事故嚴(yán)重程度的影響因素分析[J].北京交通大學(xué)學(xué)報(bào),2009,33(6):52-55.Ma Zhuang-lin,Shao Chun-fu,Li Xia.Analysis of influence factors on severity for traffic accidents of expressway tunne[J].Journal of Beijing Jiaotong University,2009,33(6):52-55.
[5]馬壯林,邵春福,李霞.基于Logistic模型的公路隧道交通事故嚴(yán)重程度的影響因素[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2010,40(2):423-426.Ma Zhuang-lin,Shao Chun-fu,Li Xia.Analysis of factors affecting accident severity in highway tunnels based on Logistic mode[J].Journal of Jilin University:Engineering and Technology Edition,2010,40(2):423-426.
[6]李世民,孫明玲,關(guān)宏志.基于累積 Logistic模型的交通事故嚴(yán)重程度預(yù)測(cè)模型[J].交通標(biāo)準(zhǔn)化,2009,190/192(2/3):168-171.Li Shi-min,Sun Ming-ling,Guan Hong-zhi.Prediction model cumulative Logistic for severity of road traffic accident[J].Transport Standardization,2009,190/192(2/319):168-171.
[7]王發(fā)智.基于貝葉斯網(wǎng)絡(luò)的交通突發(fā)事件態(tài)勢(shì)評(píng)估技術(shù)[D].大連:大連理工大學(xué)計(jì)算機(jī)學(xué)院,2006.
[8]Golob T F,Wilfred W R,John D L.An analysis of the severity and accident duration of truck-involved freeway accidents[J].Accident Analysis & Prevention,1987,19(5):375-395.
[9]Jones B L,Janssen F M.Analysis of the frequency and duration of freeway accidents in Seattle[J].Accident A-nalysis & Prevention,1991,23(4):239-255.
[10]Wang M.Modeling freeway accident clearance time[D].Northwestern:Civil&Engineering Dept,Northwestern University,1991.
[11]姬楊蓓蓓.交通事件持續(xù)時(shí)間預(yù)測(cè)方法研究[D].上海:同濟(jì)大學(xué)交通運(yùn)輸工程學(xué)院,2008.
[12]Xu Hong-guo,Zhang Hui-yong,Zong Fang.Trafic incident duration analysis using hazard duration model[C]∥TMEE.Changchun:IEEE,2011.
[13]陳玲娟,劉海旭,蒲云.事故影響下走行時(shí)間及擇路概率的動(dòng)態(tài)分析[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2012,40(2):63-69.Chen Ling-juan,Liu Hai-xu,Pu Yun.Dynamic analyses of travel time and route choice probability of users in accidents[J].Journal of South China University of Technology:Natural Science Edition,2012,40(2):63-69.
[14]Xu Hong-guo,Zhang Hui-yong,Zong Fang.Bayesian network-based road traffic accident causality analysis[C]∥ICIE.Chengdu:IEEE,2010.
[15]Chong M,Abraham A.Traffic accident analysis using machine learning paradigms[J].Computational Intelligence in Data Mining,2005,29(5):89-98.