李開放,劉忠濤,柏興濤,張冰戰(zhàn)
(1. 合肥學院 先進制造工程學院,安徽 合肥 230601;2. 合肥工業(yè)大學 汽車與交通工程學院,安徽 合肥 230009;3. 中國重汽集團,山東 濟南 250000)
隨著社會的快速發(fā)展,人民的生活水平不斷提高,汽車已經(jīng)成為家家戶戶必備的交通工具,給人們的出行帶來了很大的便捷,但另一方面,汽車駕駛事故給人們的生命與財產(chǎn)安全造成了威脅[1]。超速行為是影響交通安全的一個重要因素,據(jù)統(tǒng)計,中國2016 年超速駕駛行為位居交通違法查處量首位[2]。超速駕駛行為與道路交通安全有著密切聯(lián)系,規(guī)范駕駛?cè)说鸟{駛行為是保障道路交通安全的重要舉措[3]。近年來,大量學者對駕駛行為與道路交通安全進行了研究。董軍[4]等基于北斗衛(wèi)星定位數(shù)據(jù)的車輛超速行為識別方法提出了一種新的基于可變時間距離閾值的超速行為識別算法,此算法提升了超速事件的快速辨別與響應(yīng)能力;Stephen[5]等通過在車上安裝GPS 來獲取駕駛員的駕駛行為,并且通過問卷調(diào)查進一步挖掘影響駕駛員超速駕駛的因素;李云強[6]等設(shè)計了智能手機端APP,通過藍牙連接超速報警系統(tǒng),當速度超過預設(shè)報警值時,報警系統(tǒng)會發(fā)出蜂鳴聲或真人語音提示駕駛員超速行駛;林一鳴[7]等設(shè)計了一套酒后駕駛與超速行駛監(jiān)測系統(tǒng),實現(xiàn)對駕駛員酒后駕車和超速行駛的實時監(jiān)測;劉應(yīng)吉[8]等提出了一種帶抗噪聲的違規(guī)駕駛行為辨識的方法,通過比較當前車輛實時行駛速度、當前路段限速值和違規(guī)閾值等參數(shù)判斷是否發(fā)生違規(guī)超速行為;Tseng[9]等通過研究出租車的超速行駛數(shù)據(jù)發(fā)現(xiàn)駕駛員的駕駛風格、工作時長和日行駛距離與超速駕駛行為之間有著密切的聯(lián)系;汪建良[10]基于卷積神經(jīng)網(wǎng)絡(luò)設(shè)計了危險駕駛行為檢測模型,并通過遷移學習對危險駕駛行為進行檢測,準確率高達98.60%。
在以往的超速駕駛行為識別方法中,由于條件的限制,采用設(shè)定單一固定值的方法對超速行為進行識別,但是由于路況的復雜,不同的路段設(shè)定的超速閾值不盡相同,單一超速閾值方法的識別結(jié)果不夠科學準確。本文選取20 種循環(huán)工況作為初始數(shù)據(jù)進行短工況片段劃分提取行駛工況特征參數(shù),以此采用主成分分析法對特征參數(shù)進行降維處理;得到降維結(jié)果后采用k-means 算法進行初次聚類;然后以k-means 聚類結(jié)果計算協(xié)方差矩陣、混合系數(shù)等輸入值,運用高斯混合聚類算法進行二次聚類;根據(jù)聚類結(jié)果選取訓練樣本,利用BP 神經(jīng)網(wǎng)絡(luò)進行學習得到訓練模型;利用訓練模型對工況進行實時識別得到不同行駛工況的超速閾值,從而對超速行為進行準確的識別。通過對行駛工況進行識別,進而得到不同行駛工況的超速閾值,提高了超速行為檢測的準確性和科學性。
本文提出的基于行駛工況識別的超速行為研究流程圖如圖1 所示,其步驟為:(1)選取20 種循環(huán)工況作為初始數(shù)據(jù)進行短工況片段劃分提取行駛工況特征參數(shù);(2)利用主成分分析法對特征參數(shù)進行降維處理;(3)采用k-means 算法進行初步聚類;(4)運用高斯混合聚類算法進行二次聚類;(5)設(shè)計創(chuàng)建BP 神經(jīng)網(wǎng)絡(luò),選取訓練樣本訓練;(6)利用訓練完畢的BP 神經(jīng)網(wǎng)絡(luò)模型進行工況識別,進而得到超速閾值;(7)設(shè)計創(chuàng)建超速行為識別模型,并將超速閾值代入其中進行超速識別。
圖1 基于行駛工況識別的超速行為研究流程圖
行駛工況主要是根據(jù)汽車的速度和加速度等參數(shù)體現(xiàn)出來的,考慮汽車在不同工況下的速度、加速度以及運行時間的不同[11-12],本研究選取的15 種行駛工況特征參數(shù)如表1 所示。
表1 行駛工況特征參數(shù)
本文選取20 種循環(huán)工況分別為:UDDS、NEDC、EUDC、SC03、NurembergR36、New York Bus、WVUSUB、WVUINTER、US06_HWY、INDIA_URBAN_SAMPLE、CBDTRUCK、HL07、NYCC、HWFET、_ARB02、ECE、IM240、WVUCITY、NYCTRUCK、LA92、ARTERIAL、 REP05。 采 用320 s 為時間間隔,將20 種循環(huán)工況進行等時間劃分,一共得到139 組數(shù)據(jù),利用特征參數(shù)計算公式獲取上述所需的特征參數(shù),短工況片段劃分方法如圖2 所示。
圖2 短工況片段劃分方法
本文選擇主成分分析(PCA)對行駛工況特征參數(shù)進行降維處理。此方法的降維步驟主要如下所示[13]:
(1)對初始數(shù)據(jù)進行標準化處理,公式如下:
(2)計算各個數(shù)據(jù)之間的相關(guān)系數(shù)矩陣R=(rij)m×n,計算公式如下:
(4)計算各個主成分的貢獻率,并將每個主成分貢獻率累積,計算累積貢獻率,依據(jù)上述計算結(jié)果選擇主成分。主成分貢獻率Zj與累積貢獻率Z的計算公式如下所示:
本文采用k-means 聚類算法對降維后的數(shù)據(jù)集進行初步聚類,行駛工況的分類為四種,所以k-means 聚類算法的最終類別個數(shù)k=4,將初步聚類的聚類中心作為高斯混合聚類的輸入進行二次聚類,來提升行駛工況分類的準確性。k-means 聚類算法的計算流程圖如圖3 所示。
圖3 k-means 聚類算法計算流程圖
高斯混合聚類模型計算每個點的高斯混合模型概率分布,依據(jù)每個類別生成其概率的大小將數(shù)據(jù)劃分到相應(yīng)的類別。高斯混合聚類模型的計算步驟如下:
(1)初步選定高斯混合聚類分布的模型參數(shù)αi,μi,∑i,其中αi表示混合系數(shù),μi表示一個n維的均值向量,∑i表示協(xié)方差矩陣。將經(jīng)過k-means聚類得出的聚類中心作為高斯混合分布初始模型參數(shù)中的均值向量,將每個類中間包含的數(shù)據(jù)點到各個聚類中心的距離,作為高斯混合聚類的方差計算數(shù)據(jù)。
(3)根據(jù)步驟(2)計算出的結(jié)果,依據(jù)下列公式重新得出高斯混合概率分布的模型參數(shù)。
(4)進行迭代運算,重復上面的計算步驟,直到運算達到程序設(shè)定的停止條件。
(5)比較上述計算過程的計算結(jié)果,將每個樣本數(shù)據(jù)劃分到產(chǎn)生其概率最大的類別中,完成聚類運算。
目前,神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)很成熟并廣泛應(yīng)用于人工智能、機器學習等領(lǐng)域,其中,BP 神經(jīng)網(wǎng)絡(luò)是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一[14]。本文采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):輸入層、中間層和輸出層,行駛工況的特征參數(shù)有15 個,所以BP 神經(jīng)網(wǎng)絡(luò)的初始輸入層神經(jīng)元個數(shù)為15 個,行駛工況分為4 個類別,故最終結(jié)果輸出層神經(jīng)元個數(shù)為4 個。選擇Sigmoid 函數(shù)作為BP 神經(jīng)網(wǎng)絡(luò)的激活函數(shù),設(shè)置BP 神經(jīng)網(wǎng)絡(luò)的最大迭代次數(shù)為5 000 次,權(quán)值學習效率為0.5,閾值學習效率為0.4。
駕駛員的超速行為識別主要判斷標準為汽車在行駛過程中的最高車速超過道路限定車速,并產(chǎn)生持續(xù)行為。本文依據(jù)《道路限速規(guī)定及超速處罰標準》對不同的行駛工況設(shè)定不同的超速識別閾值,在擁堵與城市工況中,汽車的最高行駛速度不能超過60 km/h,在郊區(qū)工況中汽車的最高行駛速度不能超過80 km/h,在高速工況中汽車的最高行駛速度不能超過120 km/h。
基于工況識別后得到道路超速閾值,令道路限定車速vl等于超速閾值進行超速行為識別。為了避免采集數(shù)據(jù)時出現(xiàn)的隨機數(shù)據(jù)點,將單次超速時間設(shè)置為2 s,超速時間大于2 s 后才對該次超速行為進行記錄。單次超速行為識別流程如圖4 所示。
圖4 單次超速行為識別圖
采用主成分分析法對139 組短工況特征參數(shù)做降維處理,其主成分累計貢獻率如圖5 所示。從圖中可以看出,選擇前四個主成分即可滿足累積貢獻率在85%以上的條件。
圖5 主成分累積貢獻率
本文將行駛工況類別分為高速工況、郊區(qū)工況、城市工況、擁堵工況4 種[15],所以聚類分析的最終類別為4 種。采用k-means 聚類對降維之后得的工況特征數(shù)據(jù)進行聚類,聚類中心如下表2 所示。
表2 工況數(shù)據(jù)k-means 聚類中心
在得到k-means 聚類中心后,再以初步聚類結(jié)果計算高斯混合聚類的輸入值,最后采用高斯混合聚類進行二次聚類分析,得出行駛工況最終聚類結(jié)果,四個類別的聚類中心如表3 所示。
表3 工況數(shù)據(jù)最終聚類中心
表中第四類最高車速為111.6 km/h,平均車速為95.5 km/h,并且在高速區(qū)間行駛的比例為96.4%,所以第四類為高速工況;第二類中最高車速為37.4 km/h,平均車速為8.9 km/h,處在高速區(qū)間的比例為0.48%,并且怠速所占的比例為47.6%,因而第二類屬于擁堵工況;第一類與第三類相比,其處于高速區(qū)間行駛的時間比例大,并且第一類的最高車速為91.1 km/h,平均車速為52.0 km/h,而第三類的最高車速為57.2 km/h,平均車速為25.6 km/h,符合城市限速60 km/h 的行駛要求,所以第一類的工況類別為郊區(qū)工況,第三類的工況類別為城市工況。
汽車行駛工況識別的過程中,將80%數(shù)據(jù)集作為算法訓練集,對BP 神經(jīng)網(wǎng)絡(luò)算法進行訓練,將剩余的20%數(shù)據(jù)集作為測試集,驗證BP 神經(jīng)網(wǎng)絡(luò)算法識別行駛工況的精確度。本研究對行駛工況識別的BP 神經(jīng)網(wǎng)絡(luò)算法進行了5 次測試驗證,測試驗證的結(jié)果如表4 所示。
表4 行駛工況算法識別結(jié)果
綜合測試結(jié)果,5 次測試正確率平均值為0.95,說明將BP 神經(jīng)網(wǎng)絡(luò)算法運用于行駛工況的識別精確性良好。
工況識別后將獲取的道路速度閾值用于超速行為識別,下圖6 為基于工況識別的超速行為識別與普通超速行為識別的結(jié)果對比,從圖中可以看出,在一段多次超速行駛的工況下,基于行駛工況的超速行為識別方法能夠更加準確地識別出超速行為與超速時間,相比普通的采用單一識別閾值的識別方法識別精度更高,識別結(jié)果更加準確。
圖6 超速行為識別對比
本文提出了一種基于工況識別的超速行為識別,提高了超速行為檢測的準確性和科學性。通過對選取的20 種循環(huán)工況進行短工況片段劃分提取行駛工況特征參數(shù),采用主成分分析法對特征參數(shù)進行降維處理,采用k-means 算法對降維結(jié)果進行初次聚類,為了提高行駛工況分類的準確性,運用高斯混合聚類算法進行二次聚類,從最終聚類結(jié)果中選取訓練樣本對BP 神經(jīng)網(wǎng)絡(luò)進行學習得到訓練模型,利用訓練模型對工況進行實時識別得到工況的超速閾值,從而對超速行為進行準確的識別。