国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林的路面結(jié)冰預(yù)測研究

2020-12-21 03:44宋淑慧劉文江時(shí)浩婷
科學(xué)與信息化 2020年28期
關(guān)鍵詞:隨機(jī)森林交通安全

宋淑慧 劉文江 時(shí)浩婷

摘 要 冬季的北方城市,降雪、霜凍、結(jié)冰現(xiàn)象時(shí)有發(fā)生,已成為影響市內(nèi)交通安全、造成交通事故的一個(gè)重要因素。本論文基于傳感器采集到的冬季濟(jì)南某地區(qū)的路面、氣象等數(shù)據(jù),使用隨機(jī)森林對數(shù)據(jù)樣本進(jìn)行訓(xùn)練,構(gòu)建結(jié)冰狀態(tài)預(yù)測模型,并與svm模型做對比,使用準(zhǔn)確率、f1_score、ROC曲線等分類算法評估指標(biāo)對模型進(jìn)行評價(jià)以驗(yàn)證算法的有效性。結(jié)果表明,基于隨機(jī)森林訓(xùn)練得到的模型可以實(shí)現(xiàn)道路結(jié)冰狀態(tài)的有效預(yù)測。

關(guān)鍵詞 隨機(jī)森林;路面結(jié)冰預(yù)測;交通安全

前言

道路結(jié)冰是造成城市交通事故的一個(gè)重要原因之一。冬季發(fā)生降雪、結(jié)冰等氣象情況時(shí)容易造成車輛打滑、行人行走困難,路面結(jié)冰也會降低輪胎的摩擦系數(shù),容易對交通運(yùn)輸和人民安全造成危害[1]。因此,對道路的結(jié)冰情況進(jìn)行及時(shí)的監(jiān)測能夠減少交通事故的發(fā)生。顧婷婷[2]等根據(jù)杭州高速公路上的交通事故數(shù)據(jù)和氣象數(shù)據(jù),研究了杭州路面上的結(jié)冰情況并建立了結(jié)冰預(yù)測模型。劉小高[3]等分析氣象因子和其他影響因素,基于氣象相關(guān)數(shù)據(jù)建立了道路結(jié)冰預(yù)警模型,通過驗(yàn)證集的檢驗(yàn)證明了模型的有效性。鄭斌[4]通過研究影響路面結(jié)冰的因素,使用采集到的數(shù)據(jù)建立了神經(jīng)網(wǎng)絡(luò)結(jié)冰預(yù)測模型。

本文基于濟(jì)南某地區(qū)路面凝冰數(shù)據(jù)樣本,使用隨機(jī)森林對凝冰數(shù)據(jù)進(jìn)行訓(xùn)練得到結(jié)冰預(yù)測模型,最后使用算法評估指標(biāo)對模型進(jìn)行評價(jià),并與文獻(xiàn)[2]使用的svm方法做對比,證明本文算法的有效性。

1路面、氣象數(shù)據(jù)分析

道路結(jié)冰是多個(gè)因素共同影響所引起的,主要影響因素有路面水膜厚度、大氣溫度、路面溫度、路面冰點(diǎn)溫度、風(fēng)速等?;诖?,我們使用路面?zhèn)鞲衅鞑杉瘽?jì)南某地區(qū)12月份的水膜厚度、路面溫度、冰點(diǎn)溫度數(shù)據(jù)來對結(jié)冰狀態(tài)進(jìn)行預(yù)測。三參數(shù)數(shù)據(jù)樣本的散點(diǎn)圖如圖1所示。為了防止出現(xiàn)正負(fù)樣本不平衡以及過擬合問題,我們對數(shù)據(jù)進(jìn)行下采樣得到未結(jié)冰數(shù)據(jù)331條,并將其標(biāo)記為0;得到結(jié)冰數(shù)據(jù)263條,將其標(biāo)記為1。

從以上三幅圖可以看出,不同狀態(tài)時(shí)數(shù)據(jù)分布存在差異,結(jié)冰時(shí)水膜厚度明顯大于未結(jié)冰時(shí)水膜厚度,而冰點(diǎn)溫度和路面溫度受到外界因素的干擾,比如,路面溫度在零下3℃,但因?yàn)槿鳆},冰點(diǎn)可能在零下8℃,就不結(jié)冰,路面溫度和冰點(diǎn)溫度來共同影響路面的結(jié)冰狀態(tài)。本文使用路面溫度、冰點(diǎn)溫度、水膜厚度作為特征數(shù)據(jù)用于結(jié)冰預(yù)測模型的輸入,將結(jié)冰狀態(tài)作為標(biāo)簽數(shù)據(jù)用于結(jié)冰預(yù)測模型的輸出。用于模型訓(xùn)練的部分?jǐn)?shù)據(jù)樣本如圖2所示。

2隨機(jī)森林訓(xùn)練模型

隨機(jī)森林算法介紹:隨機(jī)森林是基于Bagging算法并將其改動之后演化過來的。它是以決策樹[5-6]為基學(xué)習(xí)器,多個(gè)決策樹結(jié)合起來的一種集成學(xué)習(xí)[7-8]算法,屬于有監(jiān)督的學(xué)習(xí)。對于分類問題,數(shù)據(jù)的抽樣方法選用bootstrap方式,對訓(xùn)練數(shù)據(jù)進(jìn)行隨機(jī)有放回的選擇,構(gòu)成隨機(jī)森林的每一個(gè)決策樹都是一個(gè)分類器,在進(jìn)行模型訓(xùn)練時(shí),每一個(gè)決策樹都要給出一個(gè)分類結(jié)果,隨機(jī)森林來集成所有決策樹的分類結(jié)果,對所有的分類結(jié)果取平均值,并將分類類別最多的結(jié)果作為模型的輸出值,有效防止了過擬合現(xiàn)象的出現(xiàn)。

隨機(jī)森林訓(xùn)練結(jié)冰預(yù)測模型的步驟為:①將數(shù)據(jù)集進(jìn)行劃分,70%的數(shù)據(jù)用于訓(xùn)練,30%的數(shù)據(jù)用于測試。②參數(shù)選擇。使用網(wǎng)絡(luò)搜索法選擇最優(yōu)參數(shù)為決策樹數(shù)目為40,決策樹最大深度為4,葉子結(jié)點(diǎn)中最少樣本數(shù)量為10。③將訓(xùn)練集送入模型進(jìn)行訓(xùn)練。④模型在測試集上測試效果,得到各個(gè)算法評估指標(biāo)值。

3模型評價(jià)

3.1 混淆矩陣

混淆矩陣又被稱為誤差矩陣,用來評價(jià)分類算法精度。通常以m行n列的矩陣來表示,每一列代表模型的預(yù)測值,每一行代表數(shù)據(jù)的真實(shí)類別,混淆矩陣的結(jié)構(gòu)如表1所示:

本文以道路結(jié)冰情況為研究對象,道路未結(jié)冰時(shí)標(biāo)記為0,道路結(jié)冰時(shí)標(biāo)記為1,因此,上表中的P代表結(jié)冰的類別“1”,N代表未結(jié)冰的類別“0”。其中,TP代表道路實(shí)際結(jié)冰被預(yù)測成結(jié)冰的樣本數(shù)量,F(xiàn)P代表道路實(shí)際結(jié)冰被預(yù)測成未結(jié)冰的樣本數(shù)量,F(xiàn)N代表道路實(shí)際未結(jié)冰并預(yù)測成結(jié)冰的樣本數(shù)量,TN代表道路實(shí)際未結(jié)冰并預(yù)測成未結(jié)冰的樣本數(shù)量。本文訓(xùn)練結(jié)冰預(yù)測模型時(shí),將數(shù)據(jù)集以7:3的比例劃分,測試集共179條數(shù)據(jù),程序輸出的混淆矩陣如表2表示:

從上表可看出,結(jié)冰數(shù)據(jù)共82條,模型預(yù)測正確的結(jié)冰數(shù)據(jù)共80條;未結(jié)冰數(shù)據(jù)共97條,模型預(yù)測正確的未結(jié)冰數(shù)據(jù)共96條,說明該模型預(yù)測效果良好。

3.2 f1_score與ROC曲線

f1_score是召回率和精確率的調(diào)和平均值,是兩者的綜合衡量,f1_score越高,說明模型越穩(wěn)健。其中,精確率直觀地反映模型對負(fù)樣本的區(qū)分能力,精確度越高,表明模型的區(qū)分能力越強(qiáng);召回率直觀地反映模型對正樣本的識別能力,召回率越高,表明模型對正樣本的識別能力越強(qiáng)。精確率、召回率以及f1_score的計(jì)算公式如表3所示。本文研究得到的f1_score=0.981,表明結(jié)冰預(yù)測模型較穩(wěn)健。

ROC曲線能反映模型在選取不同閾值的時(shí)候其敏感性和其精確性的趨勢走向,該評估指標(biāo)能降低不同測試集帶來的干擾,更加客觀的衡量模型本身的性能。AUC為ROC曲線下的面積,是衡量二分類模型優(yōu)劣的一個(gè)重要指標(biāo)。本文研究得到的ROC曲線及AUC值如圖3所示,從圖3可看出AUC=0.99,驗(yàn)證了結(jié)冰預(yù)測模型的有效性。

使用基于隨機(jī)森林訓(xùn)練得到的結(jié)冰預(yù)測模型對測試集進(jìn)行預(yù)測,測試集上準(zhǔn)確率為0.983,得到的結(jié)果如圖4所示(在文末)。

3.3 模型效果對比

本文研究得到的結(jié)冰預(yù)測模型與文獻(xiàn)[2]中所使用的svm方法進(jìn)行效果對比,對比結(jié)果如表4所示。從表4可以看出,本文得到的模型在各個(gè)評價(jià)指標(biāo)上都具有一定的優(yōu)勢,能夠?qū)崿F(xiàn)道路結(jié)冰狀態(tài)的有效預(yù)測。

4結(jié)束語

本文基于傳感器采集到的路面溫度、冰點(diǎn)溫度、水膜厚度數(shù)據(jù),使用隨機(jī)森林算法建立結(jié)冰預(yù)測模型,使用多種算法評估指標(biāo)對模型的精度和穩(wěn)健性進(jìn)行評估。最后實(shí)驗(yàn)結(jié)果表明,基于隨機(jī)森林訓(xùn)練得到的模型能夠進(jìn)行結(jié)冰狀態(tài)的有效預(yù)測,這將為道路結(jié)冰預(yù)測研究提供一個(gè)較好的方法思路,具有很好的應(yīng)用價(jià)值。

參考文獻(xiàn)

[1] 舒斯,熊守權(quán),陳英英,等.湖北省高速公路道路結(jié)冰預(yù)警模型[J].氣象,2019,45(11):1589-1599.

[2] 顧婷婷,駱月珍,梁卓然.杭州地區(qū)路面結(jié)冰天氣特征及其預(yù)測[J].科技通報(bào),2015,31(11):48-51.

[3] 劉小高,許書紅,潘凌峰,等.冰雪天氣高速公路行車安全預(yù)警等級標(biāo)定[J].黑龍江交通科技,2018,41(11):165-166,169.

[4] 鄭斌.路面結(jié)冰影響因素研究及預(yù)測模型的構(gòu)建[D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.

[5] Wang Y,Shen T,Yuan G,et al. Appearance-based gaze estimation using deep features and random forest regression[J]. Knowledge-Based Systems,2016(110):293-301.

[6] 劉承啟,黃學(xué)堅(jiān),徐健鋒,等.基于決策樹和粗糙集的高分辨率短時(shí)臨近雷電預(yù)報(bào)模型[J].南昌大學(xué)學(xué)報(bào)(理科版),2014,38(6):559-563,568.

[7] Lindner C,Bromiley P,Ionita M,et al. Robust and Accurate Shape Model Matching Using Random Forest Regression-Voting[J].IEEE transactions on pattern analysis and machine intelligence,2015,37(9):1862-1874.

[8] 王鑫,汪晉寬,劉志剛,等.基于隨機(jī)森林的認(rèn)知網(wǎng)絡(luò)頻譜感知算法[J].儀器儀表學(xué)報(bào),2013,34(11):2471-2477.

作者簡介

宋淑慧,現(xiàn)就讀學(xué)校:山東交通學(xué)院交通與物流工程學(xué)院,碩士研究生在讀,研究方向:智能交通。

劉文江,職稱:碩士生導(dǎo)師,現(xiàn)就職單位:山東交通學(xué)院道路安全應(yīng)急與減災(zāi)技術(shù)研究中心。

猜你喜歡
隨機(jī)森林交通安全
隨機(jī)森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
試論如何加強(qiáng)企業(yè)交通安全管理工作
拱壩變形監(jiān)測預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
探析道路因素對城市交通安全的影響
鄉(xiāng)鎮(zhèn)道路交通安全
農(nóng)村道路交通安全問題
基于交通安全的高速公路路線平縱組合設(shè)計(jì)
基于隨機(jī)森林算法的飛機(jī)發(fā)動機(jī)故障診斷方法的研究
基于隨機(jī)森林算法的B2B客戶分級系統(tǒng)的設(shè)計(jì)