国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于AdaBoost分類器的實時交通事故預(yù)測

2017-04-17 05:13:30胡震波朱新山
計算機應(yīng)用 2017年1期
關(guān)鍵詞:交通流分類器交通事故

張 軍,胡震波,朱新山

(天津大學(xué) 電氣與自動化工程學(xué)院,天津 300072)

(*通信作者電子郵箱xszhu126@126.com)

基于AdaBoost分類器的實時交通事故預(yù)測

張 軍,胡震波,朱新山*

(天津大學(xué) 電氣與自動化工程學(xué)院,天津 300072)

(*通信作者電子郵箱xszhu126@126.com)

傳統(tǒng)的道路交通事故預(yù)測是對交通事故次數(shù)及其造成的損失的歷史趨勢進行預(yù)測,針對其不能反映交通事故與實時交通特性關(guān)系、不能有效地預(yù)防事故發(fā)生的問題,提出一種基于AdaBoost分類器的交通事故實時預(yù)測的方法。首先,將交通道路劃分為正常、危險兩種交通狀態(tài),利用實時采集的交通流數(shù)據(jù)作為特征變量對不同的狀態(tài)進行表征,將事故的實時預(yù)測問題轉(zhuǎn)化為分類問題;然后,采用Parzen窗非參數(shù)估計的方法對兩種狀態(tài)在不同時間尺度下候選交通流特征的概率密度函數(shù)(PDF)進行估計,利用基于概率分布的可分性判據(jù)分析估計的密度函數(shù),選擇合適的特征變量及時間尺度,確定樣本數(shù)據(jù);最后,根據(jù)樣本數(shù)據(jù)訓(xùn)練AdaBoost分類器對不同的交通狀態(tài)進行分類識別。實驗結(jié)果表明,采用交通流特性的標(biāo)準(zhǔn)差特征對測試樣本分類的正確率比平均值特征高7.9%,更能反映不同交通狀態(tài)的差別,獲得更好的分類結(jié)果。

智能交通;事故預(yù)測;分類器;交通流特性;Parzen窗;可分性判據(jù)

0 引言

隨著我國經(jīng)濟與社會的快速發(fā)展,交通道路不斷擴建,汽車保有量也在持續(xù)增長,導(dǎo)致道路交通事故發(fā)生頻率及傷亡情況也在增長。交通事故預(yù)測是道路交通安全研究的一項重要內(nèi)容,它能探究道路交通事故的發(fā)生規(guī)律,幫助控制交通安全,制定合理的交通安全對策。

國外已經(jīng)有很多學(xué)者在研究基于實時檢測數(shù)據(jù)的交通事故預(yù)測。文獻[1-3]最初采用了概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network, PNN)模型、分類樹等方法來計算發(fā)生事故的概率,近幾年他們又采用了貝葉斯理論、logistic回歸等方法來處理高速公路上實時交通數(shù)據(jù),以此來預(yù)測事故的發(fā)生。國外相關(guān)的研究還包括Hossain等[4]采用邏輯回歸模型以及貝葉斯網(wǎng)絡(luò)對高速路進行事故實時預(yù)測;Xu等[5-6]采用K-means聚類等方法對不同交通狀態(tài)特征變量進行研究等。

目前國內(nèi)的研究多是對交通事故未來的形勢,包括每年事故次數(shù)、傷亡人數(shù)等進行估計和推測,而針對交通事故實時預(yù)測的研究較少。林震等[7]用車速的標(biāo)準(zhǔn)差作為特征變量進行事故預(yù)測,建立了最小風(fēng)險貝葉斯預(yù)測模型。秦小虎等[8]提出基于貝葉斯法則的學(xué)習(xí)算法,通過計算條件概率來計算事故發(fā)生概率。Lv等[9-10]利用基于歐氏距離的特征選擇方法選擇特征變量,采用C-means和k近鄰法對事故進行實時預(yù)測。這些研究都由于國內(nèi)獲得交通流數(shù)據(jù)、事故數(shù)據(jù)的困難較大,采用仿真實驗去驗證方法的有效性,不能夠真實考慮到國內(nèi)實時采集的交通數(shù)據(jù)的特性,本文中采用北京2014年10月份的交通流數(shù)據(jù)以及交通事故數(shù)據(jù),從能夠?qū)崟r采集的交通流數(shù)據(jù)中提取合適特征,設(shè)計分類器識別危險交通狀態(tài),從而預(yù)測事故的發(fā)生。

1 道路交通事故實時預(yù)測原理

本文將交通狀態(tài)分為3種類型:危險狀態(tài)、正常狀態(tài)、過渡狀態(tài),如圖1所示。正常交通狀態(tài)(ω1)表示交通狀況穩(wěn)定,不會發(fā)生事故;危險交通狀態(tài)(ω2)表示交通狀況不穩(wěn)定,并且不穩(wěn)定的程度從T-α?xí)r刻開始逐漸增長,直到T時刻發(fā)生事故;過渡狀態(tài)(ω3)表示事故發(fā)生之后危險交通狀態(tài)恢復(fù)到正常交通狀態(tài)前的交通狀態(tài)。

圖1 交通狀態(tài)劃分

文獻[1-3]的研究已經(jīng)證明,不同的交通狀態(tài)可以采用一定時間段內(nèi)的交通數(shù)據(jù)進行表征,本文通過較為穩(wěn)定的道路信息以及能夠?qū)崟r采集的交通流數(shù)據(jù)對ω1以及ω2進行表征,不同交通狀態(tài)的特征向量記作:

xi={Ti,Li,Ci,Wi,Fi}T;i=1,2,…,N

(1)

其中:T表示樣本數(shù)據(jù)記錄時間;L表示樣本數(shù)據(jù)記錄地點,本文中采用該位置的經(jīng)緯度來表示;C表示記錄時間的平均氣溫;W表示記錄時間的天氣狀況,包括晴、雨、霧等;F表示實時采集的交通流特性,包括特定時間尺度Δt內(nèi)的速度(s)、占有率(o)、車流量(v),N為樣本數(shù)量。

這樣交通事故的實時預(yù)測轉(zhuǎn)化為對不同交通狀態(tài)的分類問題,通過分類器h(x)對某一時刻i的特征向量xi進行分類來實現(xiàn)對該時刻交通事故的實時預(yù)測:

(2)

當(dāng)判定x屬于ω2即危險交通狀態(tài)時,則可采取合理的措施預(yù)防事故的發(fā)生?;诜诸惼鞯慕煌ㄊ鹿蕦崟r預(yù)測過程如圖2所示。

圖2 實時交通事故預(yù)測過程

具體步驟為:1)采集交通事故數(shù)據(jù)以及相應(yīng)的交通流數(shù)據(jù),進行數(shù)據(jù)預(yù)處理;2)選擇合適的特征變量獲得樣本數(shù)據(jù)。3)根據(jù)樣本數(shù)據(jù)設(shè)計分類器,將分類器應(yīng)用到實際中,根據(jù)實時數(shù)據(jù)識別交通狀態(tài),從而預(yù)測事故。同時,在實際應(yīng)用當(dāng)中,隨著事故數(shù)據(jù)的增多,可以動態(tài)調(diào)整特征變量并且訓(xùn)練新的分類器以便提高預(yù)測的準(zhǔn)確性。

2 交通數(shù)據(jù)準(zhǔn)備及處理

對于交通狀態(tài)分類器的設(shè)計,收集的數(shù)據(jù)有兩類:一類是交通流數(shù)據(jù),為了能夠在實時預(yù)測中穩(wěn)定收集數(shù)據(jù),采用固定型檢測器采集的交通流數(shù)據(jù);一類是交通事故數(shù)據(jù)。這兩類數(shù)據(jù)在預(yù)測系統(tǒng)中,起著不同的作用。在設(shè)計分類器階段,兩類數(shù)據(jù)均要用到。在應(yīng)用分類器時,需要的是交通流數(shù)據(jù)。

2.1 數(shù)據(jù)采集及預(yù)處理

本文中采用北京二環(huán)路上2014年10月16日到10月26日的交通流數(shù)據(jù)以及該時間段內(nèi)交通事故數(shù)據(jù)進行分類器的設(shè)計。由于環(huán)境影響、檢測設(shè)備故障等原因,這些數(shù)據(jù)存在一些問題,例如記錄的數(shù)據(jù)丟失、數(shù)據(jù)時間點順序錯誤、數(shù)據(jù)精度產(chǎn)生偏差等。

在實際交通流數(shù)據(jù)的采集過程中,同樣會出現(xiàn)錯誤或異常,因此在應(yīng)用交通流數(shù)據(jù)之前,需要對這些數(shù)據(jù)進行預(yù)處理,以保證數(shù)據(jù)的準(zhǔn)確性,預(yù)處理主要包括如下。

1)設(shè)定參數(shù)的合理范圍以及精度,對不符合條件的數(shù)據(jù)進行修正。例如,平均速度的合理范圍一般在0和地點限制速度的1.3或1.5倍之間,時間占有率的合理范圍是0到100%。

2)檢驗每組交通流數(shù)據(jù)的記錄時間,正確數(shù)據(jù)應(yīng)當(dāng)從0到719,刪除重復(fù)數(shù)據(jù),對亂序數(shù)據(jù)重新排序修正。

3)對缺失數(shù)據(jù)以及其他異常數(shù)據(jù)進行填補,如果只有個別數(shù)據(jù)存在問題,則利用其相鄰數(shù)據(jù)平均值進行填充,如果一段時間內(nèi)存在問題,則利用同期的歷史數(shù)據(jù)平均值進行填充。

另外,由于天氣狀況數(shù)據(jù)不是數(shù)值型數(shù)據(jù),因此需要先將該數(shù)據(jù)進行數(shù)值化,對應(yīng)處理如表1所示。

表1 天氣狀況數(shù)值化

2.2 交通狀態(tài)特征選擇

特征變量對區(qū)分正常交通狀態(tài)和危險交通狀態(tài)有很大的影響。特征變量如果選取合適,就比較容易對兩種交通狀態(tài)進行分類,而且效果很好;如果選取不好,設(shè)計分類器將會很困難。時間及地點特征是確定包含的,特征選擇的重點在于交通流數(shù)據(jù)的選擇,綜合考慮已有數(shù)據(jù)及前人對交通流特性的研究,選取速度、占有率、車流量的平均值與標(biāo)準(zhǔn)差6個變量作為候選特征。另外,時間尺度Δt對于分類器設(shè)計也有影響,Δt的最優(yōu)值也應(yīng)當(dāng)使兩類交通狀態(tài)樣本差別最大。

2.2.1 特征選擇原理

首先要確定特征選擇的準(zhǔn)則,即特征的可分性判據(jù),從概念上是希望能夠最有利于區(qū)分兩種狀態(tài),因此利用分類器的錯誤率作為準(zhǔn)則是最直接的想法,對于交通狀態(tài)分類問題,分類器在分類時將決策區(qū)域分為正常交通狀態(tài)Φ1、危險交通狀態(tài)Φ2兩部分,一維特征情況下,如圖3所示,Φ1為(-∞,t),Φ2為(t,+∞)。

P(ω1)、P(ω2)為交通狀態(tài)的先驗概率,樣本在Φ1中屬于危險交通狀態(tài)的概率即第一類錯誤率為:

(3)

樣本在Φ2中屬于正常交通狀態(tài)的概率即第二類錯誤率為:

(4)

再考慮各自的分布就是平均錯誤率:

圖3 錯誤率

從錯誤率計算過程可知,該準(zhǔn)則在交通事故實時預(yù)測中不太可行,因為兩類交通狀態(tài)樣本的概率密度函數(shù)未知,計算錯誤率就非常困難,因此要采用一套與錯誤率有關(guān)系但又便于計算的準(zhǔn)則。

概率密度函數(shù)與錯誤率關(guān)系密切,因此可采用基于概率分布的可分性判據(jù),通過分析交通狀態(tài)特征分布密度的交疊程度來分析其可分性。聯(lián)合概率密度函數(shù)未知,不能夠計算出錯誤率,但可采用Parzen窗法對每一維候選特征的概率密度函數(shù)進行估計,然后通過分析不同類交通狀態(tài)同一特征的交疊程度來選擇特征,具體步驟如圖4所示。

圖4 特征選擇

2.2.2Parzen窗密度函數(shù)估計

由于對不同類交通狀態(tài)樣本的分布沒有充分的了解,無法事先給出密度函數(shù)的形式。為了能夠利用基于概率分布的可分性判據(jù),需要先采用非參數(shù)估計方法對不同類的交通狀態(tài)每一維特征的概率密度函數(shù)進行估計。Parzen窗法即核概率密度函數(shù)估計方法由于具有很好的效果而被廣泛使用,當(dāng)樣本數(shù)據(jù)N→∞時,該方法估計的概率密度函數(shù)收斂到真實的概率分布[11]。本文采用最常用的高斯窗,一維情況下高斯窗[12]表達式為:

(6)

利用高斯窗對不同交通狀態(tài)6個候選特征變量分別進行估計,則可得到不同特征的概率密度函數(shù)。另外,在不同Δt下對于候選特征值計算的結(jié)果是不同的,因此對不同Δt也要重新估計其概率密度函數(shù)。最終估計得到的概率密度函數(shù)為:

(7)

其中:zΔt代表不同Δt下速度、占有率、車流量的標(biāo)準(zhǔn)差或平均值特征。因為是按照正常交通狀態(tài)ω1和危險交通狀態(tài)ω2分別進行估計,最終得到的結(jié)果也可以表示為類條件密度p(z|ω1),p(z|ω2)。

2.2.3 基于概率分布的可分性判據(jù)

基于概率分布的可分性判據(jù)就是要根據(jù)正常交通狀態(tài)ω1和危險交通狀態(tài)ω2的概率分布之間的交疊程度來分析在某一特征下兩類交通狀態(tài)的可分程度。若所有使p(z|ω2)≠0的點都有p(z|ω1)=0,則兩類交通狀態(tài)完全可分;若對所有特征都有p(z|ω1)=p(z|ω2),則兩類完全不可分。

交疊程度可用p(z|ω1)、p(z|ω2)之間的距離來度量,任何距離函數(shù)如果滿足非負、兩類完全不交疊時取最大值和兩類分布密度相同時取零這幾個條件,都可以作為類分離性的概率距離度量。

概率概率密度函數(shù)的似然比對于分類是一個重要的度量,人們在似然比的基礎(chǔ)上定義了以下的散度[13]作為度量:

(8)

本文采用散度度量作為概率距離的度量,JD越大,則可分性越好。利用式(8)對不同Δt下6個特征的類條件密度分別進行計算,縱向?qū)Ρ瓤纱_定適合的時間尺度,橫向?qū)Ρ瓤纱_定哪些特征在選定Δt下更能反映不同交通狀態(tài)的差異。

3 AdaBoost分類器設(shè)計

特征變量選擇完成后,就確定了樣本數(shù)據(jù),就可以訓(xùn)練分類器對兩類交通狀態(tài)進行分類。將正常交通狀態(tài)標(biāo)記為0,危險交通狀態(tài)標(biāo)記為1,選擇AdaBoost分類器對交通狀態(tài)進行分類,該方法基本思想是針對不同的訓(xùn)練集訓(xùn)練多個弱分類器,然后將這些分類器組合起來,構(gòu)成一個最終的強分類器[14]。這種方法不需要精確了解樣本空間分布,能夠自適應(yīng)調(diào)整弱學(xué)習(xí)算法的錯誤率。

本文中采用的弱分類器是分類和回歸決策樹(ClassificationAndRegressionTree,CART),在訓(xùn)練弱分類器的過程中,在每次弱學(xué)習(xí)后都重新調(diào)整樣本空間分布,更新所有樣本的權(quán)重,把被正確分類的樣本權(quán)重降低,而增加被錯誤分類的樣本權(quán)重。最終分類的結(jié)果是弱分類器的加權(quán)組合,權(quán)值代表該弱分類器的性能[15]。具體流程如下。

1)初始化訓(xùn)練樣本的權(quán)重:

ωi=1/N;i=1,2,…,N

(9)

2)對第m次迭代,利用加權(quán)后的樣本構(gòu)造弱分類器fm(x),分類并計算分類錯誤率em,令

cm=lb ((1-em)/em)

(10)

3)更新樣本的權(quán)值,令

ωi=ωiexp[cml(yi≠fm(xi))]

(11)

歸一化使

(12)

其中:

(13)

4)重復(fù)執(zhí)行2)~3)步直到m達到最大迭代次數(shù)M。

5)由M組弱分類器組合得到強分類器h(x),對于待分類樣本x,分類器的輸出為:

(14)

訓(xùn)練好分類器之后就可以對實時的樣本數(shù)據(jù)進行分類,決策規(guī)則如式(2)所示,若某一時刻被決策為危險交通狀態(tài),則可采取合適的措施預(yù)防事故的發(fā)生。

在實際應(yīng)用中,隨著交通數(shù)據(jù)的累積,可以對最新采集的數(shù)據(jù)處理,更新分類器,實現(xiàn)動態(tài)調(diào)整,提高分類的準(zhǔn)確性。

4 實驗及結(jié)果

4.1 數(shù)據(jù)準(zhǔn)備

本文中采用的是北京二環(huán)路上2014年10月16日到10月26日的交通流數(shù)據(jù),有118個固定檢測器,每2min記錄一次;交通事故數(shù)據(jù)包括北京全市范圍內(nèi)事故發(fā)生時間及地點。

經(jīng)過數(shù)據(jù)預(yù)處理,地點匹配等處理后得到412組危險交通狀態(tài)數(shù)據(jù)及393組正常交通狀態(tài)數(shù)據(jù),每組數(shù)據(jù)包含事故時間、地點、平均氣溫、天氣情況及該地點駛?cè)腭偝?個方向的交通流數(shù)據(jù),危險交通狀態(tài)數(shù)據(jù)包括事故發(fā)生時及前20min內(nèi)(后文中確定具體的Δt)的交通流數(shù)據(jù),正常交通狀態(tài)數(shù)據(jù)是事故發(fā)生前50 min時(前人研究證明事故前50 min的交通狀態(tài)與事故關(guān)系很小)及前20 min內(nèi)的交通流數(shù)據(jù)。

在未進行特征選擇前,每組樣本包含時間,地點坐標(biāo)、平均氣溫、天氣狀況、事故地點四個方向上22 min內(nèi)的速度、占有率、車流量數(shù)據(jù),共137維特征。歸一化處理后,從兩類數(shù)據(jù)中分別挑選250組數(shù)據(jù)共500組數(shù)據(jù)作為訓(xùn)練樣本,剩余305組作為測試樣本。

4.2 特征選擇

采用Parzen窗估計方法對候選特征進行概率條件密度估計,然后通過對比不同類交通狀態(tài)特征類條件密度的散度距離來確定合適的時間尺度及特征。

候選的交通流特征中包含駛?cè)腭偝?個方向,每個方向上包含有6個變量,另外,預(yù)選的數(shù)據(jù)中包含從2 min到22 min共10個時間尺度,對兩類交通狀態(tài)分別進行估計,共進行480次,然后計算不同類交通狀態(tài)的散度距離,如表2所示。

表2 不同特征最大散度距離

通過對比得知速度、占有率、車流量的標(biāo)準(zhǔn)差特征的散度距離比平均值的更高,表明交通流數(shù)據(jù)平均值在不同交通狀態(tài)下差異性較小,并不能準(zhǔn)確反映不同交通狀態(tài)的特性,因此選擇標(biāo)準(zhǔn)差特征作為特征變量,標(biāo)準(zhǔn)差特征估計結(jié)果,如圖5所示。

通過圖5中趨勢可知,對于時間尺度,4個方向上速度、占有率、車流量的選擇并不相同:Δt1={2,2,2},Δt2={2,8,6},Δt3={2,2,4},Δt4={2,2,2}。

對訓(xùn)練樣本及測試樣本分別按照上述結(jié)果提取數(shù)據(jù),并計算標(biāo)準(zhǔn)差特征,使得樣本特征均為時間、經(jīng)緯度坐標(biāo)、平均氣溫、天氣狀況、4個方向上速度、占有率、車流量的標(biāo)準(zhǔn)差,共17維特征。

圖5 不同時間尺度標(biāo)準(zhǔn)差特征散度距離

4.3 分類結(jié)果

訓(xùn)練AdaBoost分類器,對測試樣本進行分類,測試樣本中ω1的樣本數(shù)量為143組,ω2樣本數(shù)量為162組,分類結(jié)果如表3所示。

表3 本文方法的分類結(jié)果

從表3中可知,隨著分類器最大迭代次數(shù)的變化,分類結(jié)果也不相同,對于平均值特征,當(dāng)?shù)螖?shù)為3 000時已經(jīng)收斂,而對于標(biāo)準(zhǔn)差特征,迭代到3 600時達到收斂,且分類結(jié)果較平均值特征要好一些,因此對于特征的選取是正確的。分類效果最好時,危險交通狀態(tài)的分類正確率為66%,而正常交通狀態(tài)的正確率為55.9%,總正確率比平均值特征的正確率高7.9%。

國內(nèi)的相關(guān)研究中文獻[9]中預(yù)測精度最高,準(zhǔn)確率為70%,利用文獻[9]中方法對本文數(shù)據(jù)進行處理,結(jié)果如表4所示。

對比表3和表4可知,本文方法的分類結(jié)果要優(yōu)于文獻[9]中的方法,且文獻[9]方法用于分類時出現(xiàn)了誤警率增加而漏報率下降的情況,說明該方法并沒有選取到合適的特征。

訓(xùn)練數(shù)據(jù)的增加,訓(xùn)練分類器時迭代次數(shù)的增加,都會引起訓(xùn)練時間的增加,但訓(xùn)練好分類器后,單個測試樣本分類結(jié)果的輸出時間很短,實驗中305個測試樣本的輸出時間平均為15.236s,單個樣本為49ms,因此在交通事故預(yù)測的實際應(yīng)用中,可提前利用可隨時更新的歷史數(shù)據(jù)訓(xùn)練分類器,預(yù)測時只需將計算后的實時采集的交通流等數(shù)據(jù)輸入到分類器中,就可以快速得到預(yù)測結(jié)果,從而實現(xiàn)事故的實時預(yù)測。

表4 文獻[9]方法分類結(jié)果

5 結(jié)語

本文通過對北京二環(huán)上實時采集的交通流數(shù)據(jù)以及相同時間段內(nèi)記錄的交通事故數(shù)據(jù)進行處理,利用分類的方法對實時的交通事故進行預(yù)測,重點分析了能夠表征不同交通狀態(tài)的交通流特性,結(jié)果表明在事故地點不同方向上不同時間尺度上的速度、占有率以及車流量特征對交通事故發(fā)生的影響不同,且標(biāo)準(zhǔn)差特征要比平均值特征更加能反映不同交通狀態(tài)的差異,分類的正確性也要更高。

從實驗結(jié)果可知,通過分類來預(yù)測事故的發(fā)生是可行的,并且特征變量的選擇至關(guān)重要,下一步將對交通狀態(tài)更多的影響因素進行分析,將更多的特征加入到交通狀態(tài)特征變量中,更好地提高分類預(yù)測的準(zhǔn)確性。

)

[1]WANGL,ABDEL-ATYM.Predictingcrashesonexpresswayrampswithreal-timetrafficandweatherdata[C]//TRB2015:ProceedingsoftheTransportationResearchBoard94thAnnualMeeting.Washington,DC:TransportationResearchBoardBusinessOffice, 2015: 32-38.

[2]WANGL,ABDEL-ATYM.Real-timecrashpredictionforexpresswayweavingsegments[J].TransportationResearchPartC, 2015, 61: 1-10.

[3]YUR,ABDEL-ATYM.Utilizingsupportvectormachineinreal-timecrashriskevaluation[J].AccidentAnalysisandPrevention, 2013, 51: 252-259.

[4]HOSSAINM,MUROMACHIY.ABayesiannetworkbasedframeworkforreal-timecrashpredictiononthebasicfreewaysegmentsofurbanexpressways[J].AccidentAnalysisandPrevention, 2012, 45(1): 373-381.

[5]XUC,LIUP,WANGW,etal.Evaluationoftheimpactsoftrafficstatesoncrashrisksonfreeways[J].AccidentAnalysisandPrevention, 2012, 47: 162-171.

[6]XUC,ANDREWPT,WANGW,etal.Predictingcrashlikelihoodandseverityonfreewayswithreal-timeloopdetectordata[J].AccidentAnalysisandPrevention, 2013, 57: 30-39.

[7] 林震,楊浩.基于車速的交通事故貝葉斯預(yù)測[J].中國安全科學(xué)學(xué)報,2003,13(2):34-36.(LINZ,YANGH.Bayesianpredictionoftrafficaccidentbasedonvehiclespeed[J].ChinaSafetyScienceJournal, 2003, 13(2): 34-36.)

[8] 秦小虎,劉利,張穎.一種基于貝葉斯網(wǎng)絡(luò)模型的交通事故預(yù)測方法[J].計算機仿真,2005,22(11):230-232.(QINXH,LIUL,ZHANGY.AtrafficaccidentpredictionmethodbasedonBayesiannetworkmodel[J].ComputerSimulation, 2005, 22(11): 230-232.)

[9]LVYS,TANGSM.Real-timehighwaytrafficaccidentpredictionbasedonthek-nearest neighbor method [C]// ICMTMA 2009: Proceedings of the 2009 International Conference on Measuring Technology and Mechatronics Automation.Piscataway, NJ: IEEE, 2009: 547-550.

[10] LV Y S, TANG S M.Real-time highway accident prediction based on support vector machines [C]// CCDC’09: Proceedings of the 2009 Chinese Control and Decision Conference.Piscataway, NJ: IEEE, 2009: 4403-4407.

[11] 賀鄧超,張宏軍,郝文寧.基于Parzen窗條件互信息計算的特征選擇方法[J].計算機應(yīng)用研究,2015,32(5):1387-1390.(HE D C, ZHANG H J, HAO W N.Feature selection based on conditional mutual information computation with Parzen window [J].Application Research of Computers, 2015, 32(5): 1387-1390.)

[12] 張宏稷,楊健,李延.基于條件熵和Parzen窗的極化SAR艦船檢測[J].清華大學(xué)學(xué)報(自然科學(xué)版),2012,52(12):1693-1697.(ZHANG H J, YANG J, LI Y.Ship detection in polarimetric SAR images based on the conditional entropy and Parzen windows [J].Journal of Tsinghua University (Science and Technology), 2012, 52(12): 1693-1697.)

[13] 張學(xué)工.模式識別[M].3版.北京:清華大學(xué)出版社,2010:146-150.(ZHANG X G.Pattern Recognition [M].3rd ed.Beijing: Tsinghua University Press, 2010: 146-150.)

[14] 曹瑩,苗啟廣,劉家辰.AdaBoost算法研究進展與展望[J].自動化學(xué)報,2013,39(6):745-758.(CAO Y, MIAO Q G, LIU J C.Advance and prospects of AdaBoost algorithm [J].Acta Automatica Sinica, 2013, 39(6): 745-758.)

[15] 賈潤瑩,李靜,王剛.基于AdaBoost和遺傳算法的硬盤故障預(yù)測模型優(yōu)化及選擇[J].計算機研究與發(fā)展,2014,51(增刊):148-154.(JIA R Y, LI J, WANG G.Optimization and choice of hard drive failure prediction models based on AdaBoost and genetic algorithm [J].Journal of Computer Research and Development, 2014, 51(Suppl.): 148-154.)

ZHANG Jun, born in 1964, M.S., associate professor.His research interests include intelligent transportation, image processing.

HU Zhenbo, born in 1992, M.S.candidate.His research interests include intelligent transportation, image processing.

ZHU Xinshan, born in 1977, Ph.D., associate professor, His research interests include machine learning.

Real-time traffic accident prediction based on AdaBoost classifier

ZHANG Jun, HU Zhenbo, ZHU Xinshan*

(SchoolofElectricalandAutomationEngineering,TianjinUniversity,Tianjin300072,China)

The traditional road traffic accident forecast mainly uses the historical data, including the number and the loss of traffic accidents, to predict the future trend, however, the traditional method can not reflect the relationship between the traffic accident and real-time traffic characteristics, and it also can not prevent accidents effectively.In order to solve the problems above, a real-time traffic accident prediction method based on AdaBoost classifier was proposed.Firstly, the road traffic states were divided into normal conditions and dangerous conditions, and the real-time collection of traffic flow data was used as the characteristic variable to characterize the different states, so the real-time prediction problem could be converted to a classification problem.Secondly, the Probability Density Function (PDF) of traffic flow characteristics under the two conditions in different time scales were estimated by Parzen window nonparametric estimation method, and the estimated density function was analyzed by the separability criterion based on probability distribution, then the sample data with appropriate characteristic variable and time scale could be determined.Finally, the AdaBoost classifier was trained to classify different traffic conditions.The experimental results show that the correct ratio by using standard deviation of traffic flow characteristics to classify test samples is 7.9% higher than that by using average value.The former can reflect the differences of different traffic states better, and also get better classification results.

intelligent transportation; accident prediction; classifier; traffic flow characteristic; Parzen window; separability criterion

2016-07-20;

2016-09-12。

張軍(1964—),男,天津人,副教授,碩士,主要研究方向:智能交通、圖像處理; 胡震波(1992—),男,山西忻州人,碩士研究生,主要研究方向:智能交通、圖像處理; 朱新山(1977—),男,遼寧新民人,副教授,博士,主要研究方向:機器學(xué)習(xí)。

1001-9081(2017)01-0284-05

10.11772/j.issn.1001-9081.2017.01.0284

TP391.4

A

猜你喜歡
交通流分類器交通事故
不同尋常的交通事故
預(yù)防交通事故
BP-GA光照分類器在車道線識別中的應(yīng)用
電子測試(2018年1期)2018-04-18 11:52:35
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
交通流隨機行為的研究進展
一起高速交通事故院前急救工作實踐與探討
路內(nèi)停車對交通流延誤影響的定量分析
具有負壓力的Aw-Rascle交通流的Riemann問題
基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
怀宁县| 全南县| 黔西| 山东| 德格县| 万州区| 陆河县| 喜德县| 广昌县| 介休市| 大石桥市| 涿州市| 平原县| 柳河县| 乃东县| 玛曲县| 泊头市| 双流县| 大兴区| 阳西县| 水城县| 宜君县| 静宁县| 南江县| 万山特区| 攀枝花市| 武穴市| 集安市| 收藏| 边坝县| 云龙县| 常德市| 白银市| 武冈市| 东丰县| 儋州市| 安徽省| 易门县| 蓬溪县| 鄯善县| 融水|