趙登峰 高巖 劉朝輝 秦朝峰 高立杰
摘 要:駕駛?cè)苏`踩加速踏板導(dǎo)致的電動客車交通事故時有發(fā)生,影響因素復(fù)雜。為準(zhǔn)確識別誤踩加速踏板行為,提醒電動客車駕駛?cè)税踩{駛,基于電動客車車載終端采集的車輛運行狀態(tài)數(shù)據(jù),提取9項與誤踩加速踏板行為相關(guān)的駕駛特征,采用隨機森林算法模型對電動客車誤踩加速踏板狀態(tài)進行識別,結(jié)果表明整體的識別準(zhǔn)確率為99%,召回率為0.99,表明99%的誤踩加速踏板行為可被識別出來。實驗表明采用隨機森林算法進行誤踩加速踏板狀態(tài)識別具有較好的效果,且與邏輯回歸、Adaboost等識別算法相比,具有準(zhǔn)確率、召回率和精確率高等特點。該方法利用電動客車的運行數(shù)據(jù)進行分析,簡單高效成本低,具有一定的可行性和實用性。
關(guān)鍵詞:駕駛行為;交通事故;誤踩加速踏板識別;隨機森林;電動客車
中圖分類號:U471.3 文獻標(biāo)志碼:A
Step faultily on the accelerator state detection based on vehicle running data
ZHAO Dengfeng1,GAO Yan2,LIU Zhaohui1,QIN Chaofeng1,GAO Lijie1
(1. Zhengzhou Yutong Bus Company Ltd., Zhengzhou 450016,China; 2. Key Laboratory of Ministry of Public Security for Road Traffic Safety, Wuxi 214000,China)
Abstract: Fault stepping the Accelerator is one of the main causes of traffic accidents. It is of great importance to detect fault stepping precisely and remind drivers of electrical bus to concentrate on driving safely. Based on the vehicle running data collected by electrical bus data acquisition system, this paper extracts 9 features relevant to driving behaviors and uses random forest algorithm to identify fault stepping. The results show that the overall recognition accuracy is 99%, and the recall rate is 0.99 which means 99% of fault stepping conditions can be successfully identified. Experiments show that fault stepping detection based on vehicle running data with Random forests is the most effective. Compared with other fault stepping detection methods, the proposed method is simple and convenient, the cost is relatively low.
Keywords: Driving behavior; traffic accident; fault stepping accelerator pedal; random forests; electrical bus
駕駛?cè)苏`踩加速踏板是影響汽車安全行駛、導(dǎo)致交通事故的主要原因之一[1]。電動客車動力性好,速度提升快,當(dāng)駕駛?cè)苏`踩加速踏板時,在城市人流量大的交通環(huán)境中極易發(fā)生群死群傷的嚴(yán)重交通事故。因此,分析電動客車駕駛?cè)苏`踩加速踏板時的駕駛行為特征,構(gòu)建模型進行誤踩加速踏板行為識別,對日常改善駕駛?cè)说奈kU駕駛行為、保證電動客車安全行駛具有重要意義。
目前,識別誤踩加速踏板行為的主流技術(shù)主要分兩類:(1)被動型技術(shù),如加速踏板運動速度檢測技術(shù)[2]、加速踏板力量檢測技術(shù)[3]、前方障礙物探測技術(shù)[4]等;(2)主動型技術(shù),如駕駛?cè)擞夷_位置檢測技術(shù)[5]、駕駛?cè)瞬涣捡{駛行為識別技術(shù)[6-7]、大數(shù)據(jù)檢測[8-9]等。其中被動型技術(shù)主要通過分析駕駛?cè)藢囕v加速踏板的踩踏動作來進行識別,此類技術(shù)可以識別出一些誤操作行為,存在的問題是決策用的輸入信息相對單一,在一些特定場景下可能會識別錯誤。主動型技術(shù)通過傳感裝置提前識別駕駛?cè)擞夷_踩踏加速踏板的行為,進而規(guī)范駕駛?cè)瞬忍ぜ铀偬ぐ宓膭幼?,存在的問題是需要新增工業(yè)相機等信息采集與處理裝置而導(dǎo)致成本增加,且對傳感器和采集系統(tǒng)的可靠性要求較高。
本文基于電動客車車載終端采集的車輛運營數(shù)據(jù),提出一種可有效用于識別駕駛?cè)苏`踩加速踏板的識別方法。該方法通過綜合利用電動客車的運行數(shù)據(jù),提取與異常加速相關(guān)的駕駛特征,構(gòu)建誤踩加速踏板行為識別模型,分析誤踩加速踏板的數(shù)據(jù)規(guī)律模式,可用于指導(dǎo)駕駛?cè)苏`踩加速踏板行為改善。
1 車輛運行數(shù)據(jù)采集與誤踩加速踏板狀態(tài)識別
基于電動客車車載終端采集的車輛運行數(shù)據(jù),將運行數(shù)據(jù)切分處理為正常操作加速踏板樣本和誤踩加速踏板樣本,通過構(gòu)建識別誤踩加速踏板的模型,實現(xiàn)通過車輛運行數(shù)據(jù)準(zhǔn)確識別誤踩加速踏板行為的目的。工作流程如圖1。
1.1 車載運行數(shù)據(jù)采集
利用車載終端對電動客車的運行狀態(tài)數(shù)據(jù)進行采集,采集的數(shù)據(jù)均為電動客車自然駕駛狀態(tài)下產(chǎn)生。采集的數(shù)據(jù)包括正常駕駛數(shù)據(jù)和踏板誤操作駕駛數(shù)據(jù),通過人工分析篩選,獲取了電動客車CAN總線上的運行數(shù)據(jù)和車載監(jiān)控視頻數(shù)據(jù)。其中通過CAN總線采集的車輛運行數(shù)據(jù)包括車輛狀態(tài)、擋位以及車輛速度、加速度、乘客門開關(guān)信號、轉(zhuǎn)向燈信號、手剎信號、加速踏板開度、制動踏板開度、GPS經(jīng)緯度、日期和時間、駕駛?cè)薎D、車牌號等。車載監(jiān)控視頻數(shù)據(jù)包括駕駛區(qū)、乘客區(qū)、前視和駕駛?cè)薉MS等攝像頭數(shù)據(jù)。電動客車運行數(shù)據(jù)采集系統(tǒng)如圖2。
1.2 數(shù)據(jù)樣本切分處理
先在企業(yè)駕駛實驗場地進行駕駛?cè)颂ぐ逭`操作的實驗,在不同工況條件下模擬駕駛?cè)思铀偬ぐ逭`操作行為,以提取歸納駕駛?cè)说奶ぐ逭`操作特征規(guī)律,作為電動客車數(shù)據(jù)分析平臺自然駕駛數(shù)據(jù)中踏板誤操作的篩選準(zhǔn)則。模擬實驗設(shè)計方案如表1所示,實驗選擇在天氣良好條件下進行,實驗駕駛?cè)藶槟彻还抉{駛?cè)?,實驗前無飲酒、藥物等異常情況。
駕駛?cè)苏`操作實驗完成后,將實驗數(shù)據(jù)通過CAN總線及OBD接口導(dǎo)出。初步對實驗數(shù)據(jù)進行研究分析,提取駕駛?cè)颂ぐ逭`操作行為特征。通過對以上共19次實驗的數(shù)據(jù)進行基本分析,得到誤操作下加速踏板變化率指標(biāo)和滿踩加速踏板持續(xù)時間特征,如圖3所示,發(fā)現(xiàn)誤操作下最大加速踏板開度變化率一般在75%/s以上且滿踩加速踏板持續(xù)時間超過3s以上。
通常來說,公交車駕駛?cè)嗽谄鸩綍r很少猛踩加速踏板且持續(xù)較長時間,基于實驗得到的參數(shù)閾值,作為電動客車數(shù)據(jù)分析平臺踏板誤操作數(shù)據(jù)初步篩選準(zhǔn)則,從而對誤踩加速踏板數(shù)據(jù)樣本進行切分。結(jié)合上述實驗,對最大加速踏板變化率和滿踩加速踏板閾值進行適當(dāng)降低,以便篩選更多的異常駕駛數(shù)據(jù)。最終確定篩選準(zhǔn)則如下:車輛的加速度大于2m/s2、最大加速踏板開度變化率大于70%/s、加速踏板開度維持在95%以上的時間大于2.0s。
根據(jù)同步采集的車輛運行過程中視頻數(shù)據(jù),對駕駛?cè)耸欠裾`踩加速踏板進行判斷確認(rèn),若結(jié)果為駕駛?cè)隋e誤操作,則定義該時間段為誤踩加速踏板標(biāo)簽;若不是駕駛?cè)隋e誤操作,則定義該時間段為正常駕駛狀態(tài)標(biāo)簽。通過人工標(biāo)定的各時間段駕駛狀態(tài)標(biāo)簽,將車輛運行數(shù)據(jù)切分為誤踩加速踏板狀態(tài)數(shù)據(jù)和正常駕駛狀態(tài)數(shù)據(jù)。
1.3 誤踩加速踏板行為識別模型構(gòu)建
基于業(yè)務(wù)理解,利用誤踩加速踏板狀態(tài)樣本與正常駕駛狀態(tài)樣本,提取與誤踩加速踏板行為相關(guān)的駕駛特征,采用隨機森林分類算法,構(gòu)建誤踩加速踏板駕駛行為識別模型。
1.4 誤踩加速踏板行為識別與應(yīng)用
基于CAN總線采集的車輛運行數(shù)據(jù),對誤踩加速踏板行為進行識別,評估駕駛?cè)苏`踩加速踏板風(fēng)險,指導(dǎo)對高風(fēng)險駕駛?cè)诉M行危險駕駛行為改善,降低因誤踩加速踏板導(dǎo)致的事故率。
2 構(gòu)建誤踩加速踏板行s型
基于車輛運行數(shù)據(jù),構(gòu)建誤踩加速踏板駕駛行為識別模型,模型主要由四個部分組成:第一部分準(zhǔn)備數(shù)據(jù)樣本;第二部分從樣本數(shù)據(jù)中提取與車輛誤踩加速踏板相關(guān)的駕駛特征,如車速、加速踏板開度、制動踏板開度、轉(zhuǎn)向燈信號、門開關(guān)信號等參數(shù);第三部分,對提取的駕駛特征兩兩組合進行相關(guān)性分析,同時將各駕駛特征與誤踩加速踏板行為之間進行相關(guān)性分析;最后,采用隨機森林算法對誤踩加速踏板行為進行識別,為駕駛?cè)苏`踩加速踏板行為風(fēng)險評估與改善提供指導(dǎo)。構(gòu)建誤踩加速踏板狀態(tài)識別模型框架如圖4。
2.1 數(shù)據(jù)樣本準(zhǔn)備
數(shù)據(jù)來源于市場上曾發(fā)生誤踩加速踏板駕駛事件的電動客車運行數(shù)據(jù),共收集20組運行數(shù)據(jù)樣本514775個。其中誤踩加速踏板樣本9067個,占總樣本數(shù)量的比例為2%,具體見表2。
2.2 駕駛特征提取
駕駛?cè)苏`踩加速踏板狀態(tài)與正常駕駛狀態(tài)相比,車輛位置、車速、加速踏板開度、制動踏板開度等駕駛特征控制的穩(wěn)定性存在一定的差異。因此,可以將這些參數(shù)認(rèn)為是判斷駕駛?cè)颂幱谡`踩加速踏板狀態(tài)或正常駕駛行為的標(biāo)準(zhǔn),從而可以從這些數(shù)據(jù)信號中提取與誤踩加速踏板行為相關(guān)的駕駛特征。
基于現(xiàn)有的數(shù)理統(tǒng)計學(xué)知識和對于模型需求的理解,對采集到的駕駛行為數(shù)據(jù)特征進行提取,本文一共提取了9個與誤踩加速踏板駕駛行為相關(guān)的特征,具體特征見表3。
2.3 駕駛特征分析
通過分析前文所選定的駕駛特征參數(shù)與駕駛?cè)苏`踩加速踏板之間的相關(guān)性,從而獲取與誤踩加速踏板行為最相關(guān)的特征,為判斷是否誤踩加速踏板提供數(shù)據(jù)基礎(chǔ)。對所提取的9個駕駛特征,可采用皮爾森相關(guān)系數(shù)[11-12]來判斷它們之間的相關(guān)性以及與誤踩加速踏板的相關(guān)關(guān)系,皮爾森相關(guān)系數(shù)分布在[-1,1]區(qū)間范圍內(nèi),相關(guān)系數(shù)越靠近 1,說明兩個特征正相關(guān)性越強,越靠近-1則說明兩個特征負(fù)相關(guān)性越強[11-12]。具體如圖5所示。
從圖5可以看出,不同駕駛特征之間相關(guān)系數(shù)的離散性較大。
各駕駛特征與是否誤踩加速踏板的相關(guān)系數(shù)見表4。
從表4可以看出,加速踏板開度信號與誤踩加速踏板的相關(guān)系數(shù)最大,為0.91,其它特征與誤踩加速踏板的相關(guān)系數(shù)低于0.65,這與工程實際相符合。
2.4 誤踩加速踏板識別
本文采用隨機森林算法對誤踩加速踏板行為進行識別。隨機森林算法是一種基于分類樹的集成學(xué)習(xí)算法,其基本原理是通過隨機采樣特征和數(shù)據(jù)樣本,生成很多決策樹,每一顆決策樹均不相關(guān),將多棵決策樹組合在一起就形成森林,通過各決策樹進行投票決策,最終選擇多數(shù)投票的策略來決定最終結(jié)果[10,13]。隨機森林算法具有處理高維特征樣本數(shù)據(jù)時準(zhǔn)確率高、抗干擾能力強、抗過擬合能力強等特點,同時可對駕駛特征重要度進行排序,找出對誤踩加速踏板有主要影響的駕駛特征。
具體的算法步驟如下[10,13]:
(1)原始訓(xùn)練集中共有特征M個,樣本總數(shù)為N個。采用有放回的隨機Bootstrap抽樣技術(shù),從訓(xùn)練集中隨機抽取N個樣本形成訓(xùn)練子集;
(2)從M個特征中隨機選取m(m≤M)個特征作為特征子集,從這m個特征中選擇最優(yōu)的切分點再做節(jié)點分裂,直到節(jié)點的所有訓(xùn)練樣例都屬于同一類。節(jié)點按基尼指數(shù)、信息增益率、均方差等規(guī)則分裂,且在分裂過程中完全分裂不剪枝;
(3)重復(fù)(1)(2)步驟k次,即可得到由k棵決策樹構(gòu)建而成的隨機森林;
(4)利用新采集的運行數(shù)據(jù),使用隨機森林進行決策。決策公式如下:
式中:H-隨機森林模型;Y-是否誤踩加速踏板分類標(biāo)簽;x-測試樣本;k-決策樹數(shù)量;hi-單棵決策樹,其中i={1,...,k};I-指示性函數(shù)。
3 模擬計算與結(jié)果分析
本文集中于分析不同駕駛特征的差異性來識別誤踩加速踏板行為,將原有數(shù)據(jù)按照8:2的比例隨機分配,其中80%作為訓(xùn)練樣本集,20%為測試樣本集,利用隨機森林算法經(jīng)過剪枝和參數(shù)調(diào)優(yōu),對訓(xùn)練樣本集數(shù)據(jù)進行訓(xùn)練,得到的混淆矩陣如表5所示,其中各參數(shù)值分別為:M=9,N=127673,m=2,k=10。
根據(jù)表5實驗結(jié)果,可計算出準(zhǔn)確率為0.99,即準(zhǔn)確預(yù)測正常駕駛和準(zhǔn)確預(yù)測誤踩加速踏板的樣本數(shù)之和占樣本總數(shù)的比例。
考慮到本文所使用數(shù)據(jù)的樣本標(biāo)簽分布并不均勻,因此在評價實驗結(jié)果所采用的指標(biāo)中,除了判斷算法的準(zhǔn)確率以外,導(dǎo)入召回率、精確率等指標(biāo)來對有偏數(shù)據(jù)實驗結(jié)果進行進一步評價[10,14]。其中召回率是指預(yù)測為誤踩加速踏板實際也為誤踩的樣本數(shù)與總的實際誤踩加速踏板的樣本數(shù)的比值,精確率是指預(yù)測為誤踩實際也為誤踩的樣本數(shù)與總的預(yù)測為誤踩的樣本數(shù)的比值。
本次實驗得到召回率為0.99,表示誤踩加速踏板被正確檢測出來的概率達到99%。本次實驗得到精確率為0.97,表示正確預(yù)測出誤踩加速踏板的比例可到達97%。
為了研究不同算法對電動客車駕駛?cè)苏`踩加速踏板行為預(yù)測結(jié)果的影響,分別使用邏輯回歸算法和Adaboost算法[15]對標(biāo)簽數(shù)據(jù)進行分類識別,分類識別結(jié)果如表6所示。
如圖6所示,在對誤踩加速踏板行為識別中,隨機森林算法的準(zhǔn)確率、精確率和召回率均優(yōu)于邏輯回歸算法和Adaboost算法,即證明隨機森林算法更適用于電動客車誤踩加速踏板行為狀態(tài)的識別。
4 結(jié)論
(1)本文基于電動客車在運行過程中采集的車速、加速踏板開度、手剎狀態(tài)等數(shù)據(jù),提取與駕駛行為相關(guān)的 9 項特征,對駕駛?cè)说恼`踩加速踏板行為進行了分析和識別。本文選取了隨機森林、邏輯回歸和Adaboost三種算法分別對樣本數(shù)據(jù)進行訓(xùn)練并測試,結(jié)果表明隨機森林算法對誤踩加速踏板行為的識別效果最好,總體的準(zhǔn)確率為0.99,召回率為0.99,精確率為0.97,具有方法簡單、精度高、成本低等優(yōu)勢,對于檢測駕駛?cè)苏`踩加速踏板行為具有一定的可行性和實用性。
(2)本文基于車輛運行數(shù)據(jù)對駕駛?cè)苏`踩加速踏板行為的識別進行了有價值的探索,涉及更大規(guī)模樣本數(shù)據(jù),考慮車輛動力性能差異與駕駛?cè)藗€體差異,進一步提高誤踩加速踏板行為檢測準(zhǔn)確率與可信度的相關(guān)實驗與方法有待深入研究。
(3)在未來研究中將對駕駛?cè)苏`踩加速踏板的形成機理進行研究,提取駕駛?cè)苏`踩踏板的行為特征以便進一步提升算法的識別精度?;陔妱涌蛙嚁?shù)據(jù)分析平臺開發(fā)駕駛?cè)颂ぐ宀僮黠L(fēng)險評分系統(tǒng),利用本文算法智能識別駕駛?cè)藵撛诘奶ぐ逭`操作行為,并將結(jié)果反饋到公交運營公司,糾正不良踏板操作行為,最大限度的降低駕駛?cè)艘騻€人因素而造成的踏板誤操作事件,保障道路行車安全。
參考文獻
[1] 苑警支.基于多傳感器融合的誤踩油門輔助系統(tǒng)控制方法研究[D]. 長春:吉林大學(xué),2019.
[2] 胡振奇,朱昌吉等.汽車防誤踩加速踏板系統(tǒng)的研發(fā)[J]. 汽車工程,2011,33(08):713-715+176.
[3] 鄧彪,簡曉春.汽車誤踩油門智能保護系統(tǒng)的設(shè)計[J]. 交通科學(xué)與工程,2014,30(02):67- 71.
[4] 尹怡欣,徐令儀等.基于旋轉(zhuǎn)編碼器的汽車油門誤踩檢測[J]. 控制工程,2013,20(04):611-613+622.
[5] 張小恒.防范油門誤踩關(guān)鍵技術(shù)分析[J]. 科技資訊,2016,14(35):220+222.
[6] 朱曉艷.機動車駕駛?cè)瞬涣捡{駛行為研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2018.
[7] 高晨宵. 純電動汽車駕駛行為預(yù)測和駕駛模式識別[D].大連理工大學(xué),2017.
[8] 佘承其,張照生,劉鵬,孫逢春.大數(shù)據(jù)分析技術(shù)在新能源汽車行業(yè)的應(yīng)用綜述——基于新能源汽車運行大數(shù)據(jù)[J].機械工程學(xué)報,2019,55(20):3-16.
[9] 毛正濤,張金喜.基于新能源汽車遠(yuǎn)程監(jiān)控數(shù)據(jù)的駕駛行為識別建模與應(yīng)用[J].汽車與配件,2017(17):80-83.
[10] 蔡素賢,杜超坎,周思毅,王雅斐.基于車輛運行數(shù)據(jù)的疲勞駕駛狀態(tài)檢測[J].交通運輸系統(tǒng)工程與信息,2020,20(04):77-82.
[11] 徐維超.相關(guān)系數(shù)研究綜述[J]. 廣東工業(yè)大學(xué)學(xué)報,2012,29(3):12-17.
[12] 曹鑫. 江蘇全省設(shè)區(qū)市生態(tài)文明建設(shè)評價及路徑探究——基于耦合協(xié)調(diào)模型及Person系數(shù)和因子分析[D].南京大學(xué),2020.
[13] CUTLER A, CUTLER D R, STEVENS J R. Random forests[M]. Ensemble Machine Learning. Springer, Boston, MA, 2012: 157-175.
[14] RAND W M. Objective criteria for the evaluation of clustering methods [J]. Journal of the American Statistical Association[J], 1971, 66(336): 846-850.
[15] Archana R. Panhalkar, Dharmpal D. Doye. A novel approach to build accurate and diverse decision tree forest[J] ,Evolutionary Intelligence, Springer, Boston, MA,Jan.2021.