吳紫恒, 吳仲城, 張 俊, 陳 松, 陳 杰
1(中國科學(xué)院 合肥物質(zhì)科學(xué)研究院,強磁場中心,合肥 230031)
2(中國科學(xué)技術(shù)大學(xué),合肥 230031)
隨著社會的快速發(fā)展,汽車己經(jīng)是越來越多人首選交通工具,給人們出行帶來了非常大的便捷. 但另一方面汽車數(shù)量的快速増長,會給公路交通帶來一定的壓力,交通擁擠、交通事故等現(xiàn)象對人們的生活造成了不小的影響,同時也阻礙了交通運輸?shù)陌l(fā)展. 駕駛行為與道路交通安全有著緊密聯(lián)系[1]. 規(guī)范駕駛?cè)说鸟{駛行為是保障道路交通安全的重要舉措[2]. 近年來,有關(guān)駕駛行為與道路安全關(guān)系的研究備受關(guān)注,牛增良等以大量重特大交通事故數(shù)據(jù)為基礎(chǔ),通過聚類分析從危險駕駛行為角度研究外部影響因素與駕駛行為的關(guān)系[3]; 錢宇彬等以油門踏板行程與車速作為操作行為基本參數(shù),通過聚類分析實現(xiàn)基于駕駛行為特性的長途客車駕駛時間和換班管理方法[4]; 莊明科等人探討了風(fēng)險駕駛行為與駕駛經(jīng)驗、駕駛技術(shù)、駕駛態(tài)度以及駕駛員的人格之間的關(guān)系[5]; 孫偉等進行了疲勞駕駛行為的研究[6]; 任慧君等提出了基于GPS數(shù)據(jù)的駕駛行為特征提取方法,統(tǒng)計分析了GPS軌跡數(shù)據(jù),但缺乏深入挖掘數(shù)據(jù)背后的信息[7]; 白云等認(rèn)為危險駕駛行為可以是失誤性駕駛行為、錯誤性駕駛行為、非故意違規(guī)的駕駛行為和過激性駕駛行為[8]; Tseng通過對中國臺灣地區(qū)出租車的超速駕駛數(shù)據(jù)的研究發(fā)現(xiàn),駕駛員的行駛風(fēng)格、工作時長和日行駛距離與超速駕駛之間有著密切的聯(lián)系[9]; Herrera等搭建了基于GPS定位手機獲取交通數(shù)據(jù)的系統(tǒng)平臺,但未將其與駕駛行為關(guān)聯(lián)[10];Greaves等采用GPS技術(shù)獲取駕駛數(shù)據(jù)以其彌補問卷調(diào)查精度不高的問題,但其僅挖掘了駕駛?cè)顺亳{駛行為[11].
目前,對駕駛速度行為的評價一般是通過一系列的駕駛行為減分單元: 急加速減分單元、急減速減分單元、急轉(zhuǎn)彎減分單元等,根據(jù)急加/減速、急轉(zhuǎn)彎次數(shù)等數(shù)據(jù)進行減分,實現(xiàn)駕駛行為評級分?jǐn)?shù)計算[12]. 評價過程的主觀性較強,評價結(jié)果不夠科學(xué)、準(zhǔn)確. 當(dāng)前鮮有從數(shù)據(jù)挖掘的角度出發(fā)研究駕駛行為與道路安全的潛在關(guān)系. 本文從車聯(lián)網(wǎng)數(shù)據(jù)庫中查詢樣本車輛的行駛衛(wèi)星定位信號集合并提取駕駛行為特征參數(shù),以此為指標(biāo)通過模糊 C 均值聚類 (Fuzzy C-Means,FCM)聚類算法實現(xiàn)駕駛行為的科學(xué)聚類,得到駕駛行為特征參數(shù)的聚類結(jié)果; 根據(jù)FCM聚類結(jié)果,選取其中的典型樣本作為訓(xùn)練樣本,利用BP網(wǎng)絡(luò)進行學(xué)習(xí),利用訓(xùn)練后BP神經(jīng)網(wǎng)絡(luò)分類器對經(jīng)歸一化處理的待分類駕駛行為進行分類評價. 本文通過對車聯(lián)網(wǎng)數(shù)據(jù)進行聚類分析,提高了駕駛行為評價的準(zhǔn)確性和科學(xué)性,建立了車聯(lián)網(wǎng)數(shù)據(jù)、駕駛行為特征、道路安全三者的關(guān)聯(lián)機理.
本文所提出的基于模糊C均值和神經(jīng)網(wǎng)絡(luò)的駕駛行為評價算法流程圖如圖1所示,其步驟為: (1) 基于車聯(lián)網(wǎng)大數(shù)據(jù)選取樣本數(shù)據(jù),提取駕駛行為特征參數(shù);(2) 確定聚類個數(shù),運行FCM聚類算法得到基于車聯(lián)網(wǎng)大數(shù)據(jù)的駕駛行為聚類結(jié)果; (3) 根據(jù)FCM算法的聚類結(jié)果及隸屬度約束條件選取典型樣本; (4) 設(shè)計并創(chuàng)建BP網(wǎng)絡(luò),將典型樣本聚類結(jié)果歸一化作為訓(xùn)練樣本,訓(xùn)練BP網(wǎng)絡(luò); (5) 待評估的駕駛行為樣本歸一化,利用訓(xùn)練完畢的BP神經(jīng)網(wǎng)絡(luò)進行駕駛行為評價.
圖1 基于FCM聚類和BP神經(jīng)網(wǎng)絡(luò)的駕駛行為評價方法算法流程
車聯(lián)網(wǎng)數(shù)據(jù)來自某車輛監(jiān)控平臺,被監(jiān)控車輛已裝備車載終端設(shè)備,利用北斗衛(wèi)星導(dǎo)航系統(tǒng)測定車輛的地理位置,并實時報告車輛地理位置、瞬時速度和運行方位角等信息,k時刻每個采樣點的信息為,其中t為時間,v為速度,j為經(jīng)度,w為緯度,h為方向角.
根據(jù)任意連續(xù)采樣點的信息,可以計算車輛在k時刻的加速度值A(chǔ)k:
根據(jù)給定的急加速的加速度閾值和急減速的加速度閾值可以判斷車輛是否發(fā)生急加速和急減速. 根據(jù)給定的急轉(zhuǎn)彎的速度限值和行駛方向改變閾值,可以判斷車輛是否發(fā)生了急轉(zhuǎn)彎. 通過以上判斷獲得車輛的瞬時速度、急變速、急轉(zhuǎn)彎的時間和位置,并進行相關(guān)統(tǒng)計,可以獲得駕駛行為特征參數(shù): 速度80-120 km/h時間占比、速度>120 km/h時間占比、100 km平均急變速次數(shù)、100 km平均急轉(zhuǎn)彎次數(shù).
給定數(shù)據(jù)X,FCM算法[13]將X劃分成C類,其聚類中心為,分類結(jié)果用隸屬度表示,其中隸屬度集為U. FCM的目標(biāo)函數(shù)定義為:
其中U必須滿足:
由于很難直接求解此類目標(biāo)函數(shù)的最優(yōu)值,在實際應(yīng)用中一般采用交互優(yōu)化的求解方式即交替迭代,直至目標(biāo)函數(shù)收斂到指定精度內(nèi)的最優(yōu)值. 在迭代過程中,模糊隸屬度和聚類中心的更新式如式(4)和式(5):
針對FCM算法隨機選取初始聚類中心易使算法收斂到陷入局部最小的問題,本文引入了一種初始聚類中心的選取方法[14]對傳統(tǒng)FCM算法進行改進. 初始聚類中心選擇的步驟為:
步驟1. 計算任意兩個樣本間的距離,并生產(chǎn)距離矩陣D,將距離最近的兩個樣本定為一類,并取兩個樣本點的中點作為第一類聚類中心.
步驟2. 選定距離閾值a,利用距離矩陣D計算與第一類中的兩個樣本距離都大于a的所有樣本,并在這些樣本選擇距離最近的兩個點定為一類,取兩個樣本的中點作為第二類的聚類中心.
步驟3. 同理,在剩下的樣本中找到與已經(jīng)找到的樣本距離都大于a的樣本,并選擇這些樣本中的距離最近的兩個點定為一類,并取兩個樣本點的中點作為其聚類中心.
步驟4. 重復(fù)步驟3,直到找到C類聚類中心為止.
基于駕駛速度行為數(shù)據(jù)的FCM聚類算法流程圖如圖2所示.
圖2 基于駕駛行為特征數(shù)據(jù)的FCM聚類算法流程圖
FCM聚類作為非監(jiān)督聚類算法,可以根據(jù)預(yù)先設(shè)定的類別數(shù)自動聚類,并得到每個樣本隸屬于各個類別的隸屬度矩陣. 本文所說的典型樣本為僅對某個類別具有較高隸屬度而對其他類別隸屬度極低的樣本.本文根據(jù)FCM聚類結(jié)果隸屬度矩陣U自動挑選BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本Y(i),訓(xùn)練樣本需要滿足如下的約束條件:
式中U為利用FCM算法對駕駛行為數(shù)據(jù)聚類后得到的隸屬度矩陣;為樣本Y(i)的隸屬度矩陣中最大值和次大值;U*、U#為設(shè)置的用于挑選典型樣本的閾值. 本文U*設(shè)置為0.5,U#設(shè)置為0.2.
神經(jīng)網(wǎng)絡(luò)已經(jīng)被廣泛應(yīng)用于人工智能、機器學(xué)習(xí)等領(lǐng)域,其中,BP神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一,BP神經(jīng)網(wǎng)絡(luò)是一種按誤差逆向傳播算法進行訓(xùn)練的多層前饋網(wǎng)絡(luò). 已經(jīng)證明,具有sigmoid非線性函數(shù)的三層神經(jīng)網(wǎng)絡(luò)可以任意逼近任何連續(xù)函數(shù)[15],因此本文采用三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu). BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層組成. 其中輸入層作為神經(jīng)網(wǎng)絡(luò)的輸入對應(yīng)輸入特征向量,本文中駕駛行為特征參數(shù)為4維,即BP神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點為4個;隱含層由10個神經(jīng)元組成; 輸出層對應(yīng)分類的結(jié)果,本文輸出層節(jié)點數(shù)為1,數(shù)值為駕駛行為對應(yīng)的類別.將典型樣本聚類結(jié)果歸一化作為訓(xùn)練樣本,訓(xùn)練BP網(wǎng)絡(luò),利用訓(xùn)練完畢的BP神經(jīng)網(wǎng)絡(luò)進行駕駛行為分類評價.
車聯(lián)網(wǎng)數(shù)據(jù)來源于某車輛監(jiān)控平臺,共500輛車,一個月的駕駛行為特征提取后的數(shù)據(jù)如表1所示.
表1 駕駛行為特征參數(shù)數(shù)據(jù)(部分)
高速行駛往往會造成交通事故,研究表明,車速越高,發(fā)生事故的風(fēng)險越大,微小的車速變化會急劇提升發(fā)生事故的概率,在不同的道路環(huán)境中,最高安全行車速度是不同的; 車輛加速度急劇變化時,會給駕駛員不舒適的感覺,因而急加速或急減速都存在一定的安全隱患; 在車輛駕駛中,急轉(zhuǎn)彎不僅會給車輛帶來很大的磨損,而且很有可能會造成翻車等交通事故; 因此本文選取“速度80-120 km/h時間占比(%)”、“速度>120 km/h時間占比(%)”、“100 km平均急變速次數(shù)”、“100 km平均急轉(zhuǎn)彎次數(shù)”作為駕駛行為特征參數(shù).
設(shè)置聚類類別為4,采用FCM聚類分析,得到聚類中心如表2所示. 由表2可知,類別1無明顯超速傾向,急變速急轉(zhuǎn)彎次數(shù)較小,此類駕駛行為發(fā)生交通事故風(fēng)險最小; 類別2無明顯超速傾向,急變速急轉(zhuǎn)彎次數(shù)較大; 類別3有一定的超速傾向,急變速急轉(zhuǎn)彎次數(shù)較小; 類別4超速傾向嚴(yán)重,急變速急轉(zhuǎn)彎次數(shù)較大,此類駕駛行為風(fēng)險較高,發(fā)生交通事故的風(fēng)險很大,駕駛員應(yīng)該受到交通運輸企業(yè)或管理部門的重點監(jiān)控.
基于FCM聚類結(jié)果,根據(jù)本文所提出的自動挑選BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本的方法挑選典型樣本. 設(shè)計BP神經(jīng)網(wǎng)絡(luò),將典型樣本的駕駛行為特征數(shù)據(jù)歸一化作為BP神經(jīng)網(wǎng)絡(luò)的輸入,典型樣本的類別數(shù)值作為BP神經(jīng)網(wǎng)絡(luò)的輸出. BP網(wǎng)絡(luò)最大訓(xùn)練次數(shù)為5000,目標(biāo)誤差為0.001. 利用BP網(wǎng)絡(luò)進行學(xué)習(xí),可以得到對駕駛行為進行實時分類的BP神經(jīng)網(wǎng)絡(luò)分類器. 待分類的駕駛行為特征數(shù)據(jù)為[1.33 0.35 1.45 0.66],將待分類駕駛行為特征數(shù)據(jù)歸一化后作為BP神經(jīng)網(wǎng)絡(luò)分類器的輸入,輸出為1.09,即認(rèn)為此駕駛行為特征數(shù)據(jù)屬于類別1.
表2 FCM聚類得到的4個類別的聚類中心
本文根據(jù)車輛監(jiān)控平臺獲取的車聯(lián)網(wǎng)數(shù)據(jù),提取并量化了駕駛行為特征的參數(shù)指標(biāo),采用模糊聚類方法對駕駛行為特征數(shù)據(jù)進行聚類,基于FCM聚類結(jié)果,為了提高BP神經(jīng)網(wǎng)絡(luò)分類精度,提出了一種自動挑選訓(xùn)練樣本即典型樣本的方法,利用BP網(wǎng)絡(luò)進行學(xué)習(xí),最終用訓(xùn)練得到的BP神經(jīng)網(wǎng)絡(luò)分類器對駕駛行為進行實時分類. 本文通過駕駛行為安全等級分類,挖掘出駕駛行為習(xí)慣,建立了車聯(lián)網(wǎng)數(shù)據(jù)、駕駛行為特征、道路安全三者的關(guān)聯(lián)機理,為交通管理部門重點監(jiān)控較高風(fēng)險駕駛?cè)颂峁┝藚⒖家罁?jù),為UBI(Usage Based Insurance)駕駛行為評價提供一種新的方法.
1魯光泉,宋陽. 車路協(xié)同環(huán)境下駕駛行為特性與交通安全綜述. 交通信息與安全,2014,32(5): 13-19.
2陶瑞華,魏恒. 機動車道的非直接左轉(zhuǎn)交通措施對駕駛員行駛特性和安全的影響. 交通運輸系統(tǒng)工程與信息,2009,9(3): 55-63.
3牛增良,李海斌,王文峰,等. 基于聚類分析的營運駕駛?cè)宋kU駕駛行為研究. 山東交通學(xué)院學(xué)報,2014,22(1):19-23.
4錢宇彬,劉浩學(xué),吳長水,等. 夜間長途客車駕駛員操作行為差異性識別研究. 中國安全科學(xué)學(xué)報,2014,24(3): 9-15.
5莊明科,白海峰,謝曉非. 駕駛?cè)藛T風(fēng)險駕駛行為分析及相關(guān)因素研究. 北京大學(xué)學(xué)報(自然科學(xué)版),2008,44(3):475-482.
6孫偉,張為公,張小瑞,等. 疲勞駕駛檢測方法的研究進展.汽車技術(shù),2009,(2): 1-5,17.
7任慧君,許濤,李響. 利用車載GPS軌跡數(shù)據(jù)實現(xiàn)公交車駕駛安全性分析. 武漢大學(xué)學(xué)報(信息科學(xué)版),2014,39(6): 739-744.
8白云,石京. 北京市駕駛行為與影響因素分析. 交通信息與安全,2010,28(2): 114-119.
9Tseng CM. Operating styles,working time and daily driving distance in relation to a taxi driver’s speeding offenses in Taiwan. Accident Analysis & Prevention,2013,52: 1-8.
10Herrera JC,Work DB,Herring R,et al. Evaluation of traffic data obtained via GPS-enabled mobile phones: The mobile century field experiment. Transportation Research Part C:Emerging Technologies,2010,18(4): 568-583. [doi: 10.1016/j.trc.2009.10.006]
11Greaves SP,Ellison AB. Personality,risk aversion and speeding: An empirical investigation. Accident Analysis &Prevention,2011,43(5): 1828-1836.
12彭江琴,劉南杰,趙海濤,等. 智能UBI系統(tǒng)研究. 計算機技術(shù)與發(fā)展,2016,26(1): 142-146.
13Bezdek JC. Pattern Recognition with Fuzzy Objective Function Algorithms. New York: Plenum Press,1981.
14張慧哲,王堅. 基于初始聚類中心選取的改進FCM聚類算法. 計算機科學(xué),2009,36(6): 206-209.
15熊楨,鄭蘭芬,童慶禧. 分層神經(jīng)網(wǎng)絡(luò)分類算法. 測繪學(xué)報,2000,29(3): 229-234.