国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林—遞歸特征消除的道路交通事故成因分析

2018-07-12 09:37黃衛(wèi)衛(wèi)
電腦知識(shí)與技術(shù) 2018年14期
關(guān)鍵詞:隨機(jī)森林相關(guān)因素成因分析

黃衛(wèi)衛(wèi)

摘要:為研究道路交通事故的成因及其相關(guān)因素重要程度,收集了英國(guó)2015年的交通事故數(shù)據(jù),從中選出與交通事故嚴(yán)重程度相關(guān)的15個(gè)因素。利用隨機(jī)森林-遞歸特征消除模型對(duì)數(shù)據(jù)嚴(yán)重程度進(jìn)行預(yù)測(cè),并對(duì)相關(guān)因素的重要程度排序。結(jié)果表明隨機(jī)森林-遞歸特征消除模型比單一的隨機(jī)森林模型泛化能力更好,與交通事故嚴(yán)重程度最相關(guān)的三個(gè)因素分別是事故中車輛數(shù)量、限速和天氣條件。并針對(duì)交通事故相關(guān)因素提出道路建設(shè)的建議,為道路交通事故預(yù)防提供決策參考。

關(guān)鍵詞:交通事故;相關(guān)因素;隨機(jī)森林;遞歸特征選擇;成因分析

中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)14-0240-04

Abstract:In order to study the causes of road traffic accident and the importance of relevant factors, collect data of vehicle accident in Britain in 2015 and select 15 factors related to severity of traffic accident. Using random forest-recursive feature elimination model to predict the severity of the accident and prioritize the relevant factors. The results show that RF-RFE model is better than simple RF model, and the three most relevant factors to the severity of traffic accidents are the number of vehicles, the speed limit and the weather conditions. Based on these results, suggestions of road construction are put forward.

Key words:traffic accident; related factors;random forest;recursive feature elimination;cause analysis

世界衛(wèi)生組織2015年道路安全全球現(xiàn)狀報(bào)告指出,平均25秒便有1人死于車禍。[1]在我國(guó),根據(jù)國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù),2015年我國(guó)共發(fā)生交通事故187781起,事故共導(dǎo)致58022人死亡,199880人受傷,共計(jì)直接財(cái)產(chǎn)損失103692萬元。[2]隨著國(guó)民經(jīng)濟(jì)的發(fā)展,居民消費(fèi)水平不斷改善,我國(guó)汽車保有量也在不斷增加。然而交通事故依然是影響居民幸福的重要原因,交通事故的發(fā)生不僅會(huì)造成直接的經(jīng)濟(jì)損失,對(duì)于交通事故而導(dǎo)致人員傷亡的家庭來說,亦是極大的不幸。因此,分析交通事故產(chǎn)生的原因具有非常重要的意義。本文旨在從微觀角度分析交通事故的相關(guān)因素,并對(duì)相關(guān)因素重要程度進(jìn)行排序。

道路交通系統(tǒng)是由車、人、路和環(huán)境構(gòu)成的系統(tǒng)。車包括機(jī)動(dòng)車和非機(jī)動(dòng)車,人又包括駕駛?cè)?、行人和乘客,路指的是道路的類型、等?jí)、限速等,環(huán)境則包括光線條件、天氣條件等。在這些因素中,人是影響道路交通安全最重要的因素,人通過控制車輛因素來影響交通安全,而道路和環(huán)境等外部因素通過影響駕駛?cè)说呐袛鄟碛绊懙缆方煌ò踩?/p>

在交通事故成因分析中,多位學(xué)者利用灰色關(guān)聯(lián)分析[3]-[7]、神經(jīng)網(wǎng)絡(luò)[8][9]等方法,計(jì)算宏觀統(tǒng)計(jì)指標(biāo)與交通事故死亡人數(shù)、受傷人數(shù)和直接經(jīng)濟(jì)損失的灰色關(guān)聯(lián)度,并將灰色關(guān)聯(lián)度作為影響交通事故因素的重要程度,然而作者選取的因素均為宏觀統(tǒng)計(jì)指標(biāo),包括國(guó)內(nèi)生產(chǎn)總值、居民消費(fèi)水平、機(jī)動(dòng)車保有量等等,這些因素雖然與交通事故存在一定的關(guān)系,卻并不能直接影響交通事故,對(duì)道路交通建設(shè)沒有很大的意義。另一類研究采用了仿真學(xué)[10]的方法,由于我國(guó)道路交通事故數(shù)據(jù)難以獲取,作者用仿真軟件獲取道路交通實(shí)時(shí)數(shù)據(jù),選取特征變量并對(duì)事故進(jìn)行預(yù)測(cè)。徐鋮鋮[11]等重點(diǎn)研究了惡劣天氣環(huán)境對(duì)高速公路交通事故的影響,作者提取了美國(guó)加州一段高速公路上的實(shí)時(shí)交通流數(shù)據(jù)、事故數(shù)據(jù)和氣象數(shù)據(jù),并利用Logistic模型對(duì)事故風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),結(jié)果表明,天氣對(duì)事故風(fēng)險(xiǎn)有顯著影響。也有研究采用故障樹[12]-[14]的方法,分析交通事故成因,通過建立故障樹模型,并對(duì)故障樹模型的最小割集和結(jié)構(gòu)重要度的求解,了解不利因素的最小組合與不利因素的重要程度。

Chong M M[15]等收集了美國(guó)1995-2000年的交通事故數(shù)據(jù),分別用決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹與神經(jīng)網(wǎng)絡(luò)的組合模型對(duì)事故的嚴(yán)重程度進(jìn)行預(yù)測(cè),發(fā)現(xiàn)組合模型對(duì)無傷亡類別的預(yù)測(cè)準(zhǔn)確率較高,而決策樹則在有傷亡事故預(yù)測(cè)上去得了較好的效果,該文章側(cè)重于模型的對(duì)比,沒有深入分析影響交通事故嚴(yán)重程度的各個(gè)因素。

為從微觀角度對(duì)交通事故成因進(jìn)行分析,收集了英國(guó)2015年的道路交通事故數(shù)據(jù),研究了道路交通事故相關(guān)因素的重要程度。本文接下來的內(nèi)容安排如下:

第一節(jié)介紹了數(shù)據(jù)的來源和數(shù)據(jù)清洗;

第二節(jié)利用傳統(tǒng)的統(tǒng)計(jì)學(xué)方法,從單因素角度進(jìn)行分析,統(tǒng)計(jì)路面情況、限速、天氣條件等因素下各類交通事故的比例;

第三節(jié)利用隨機(jī)森林-遞歸特征消除模型對(duì)交通事故的嚴(yán)重程度進(jìn)行預(yù)測(cè),并將遞歸特征消除的順序作為相關(guān)因素的重要程度,對(duì)相關(guān)因素的重要程度進(jìn)行排序。

1數(shù)據(jù)描述

由于我國(guó)信息化發(fā)展較晚,道路交通事故數(shù)據(jù)不易獲取,公開數(shù)據(jù)均為宏觀統(tǒng)計(jì)數(shù)據(jù),事故現(xiàn)場(chǎng)調(diào)查數(shù)據(jù)多為交通管理部門內(nèi)部資料,且涉及駕駛員隱私,所以并未對(duì)公眾公開。因此本文選取英國(guó)2015年道路交通事故數(shù)據(jù)進(jìn)行研究,共計(jì)140056條事故數(shù)據(jù),由于數(shù)據(jù)量較大,故對(duì)于存在缺失數(shù)據(jù)的事故記錄采取直接刪除的方式進(jìn)行數(shù)據(jù)清洗,刪除包含缺失數(shù)據(jù)的數(shù)據(jù)項(xiàng)后剩余139615條事故數(shù)據(jù)。一般認(rèn)為導(dǎo)致交通事故的原因包括四個(gè)方面:車、人、路和環(huán)境,英國(guó)道路交通事故數(shù)據(jù)包括三張表格,事故表、事故車輛表和事故傷亡人員表,其中事故表中包括事故發(fā)生時(shí)的車輛數(shù)量、傷亡人數(shù)、道路條件、環(huán)境條件等于交通事故相關(guān)的因素。本文將根據(jù)事故數(shù)據(jù)表進(jìn)行分析,即重點(diǎn)考慮事故發(fā)生時(shí)的道路、環(huán)境因素。

猜你喜歡
隨機(jī)森林相關(guān)因素成因分析
拱壩變形監(jiān)測(cè)預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
道路橋梁結(jié)構(gòu)加固措施與方法分析
天祝| 全州县| 安岳县| 慈利县| 甘南县| 西贡区| 萍乡市| 北海市| 西青区| 芷江| 海城市| 嘉兴市| 文成县| 嘉定区| 齐齐哈尔市| 梁山县| 台前县| 山东省| 西平县| 滁州市| 陈巴尔虎旗| 肥西县| 彩票| 娄底市| 赤城县| 阆中市| 克什克腾旗| 叶城县| 江永县| 竹北市| 博兴县| 浦县| 绥江县| 准格尔旗| 当涂县| 鄱阳县| 宜城市| 冀州市| 霍林郭勒市| 唐山市| 林周县|