姜冬陽 張建陽 楊瑞建 張震 王先勇 袁彥各
摘 要:針對現(xiàn)有的基于視頻進(jìn)行車輛自動識別的方法在隧道交通擁堵路段存在提取圖像特征困難、識別效果差等問題,本文提出了基于深度學(xué)習(xí)的隧道視頻車輛檢測的方法。(1)對視頻圖像進(jìn)行道路區(qū)域的界定,用人工勾勒出感興趣區(qū)域ROI作為待檢測區(qū)域,并基于形態(tài)學(xué)檢測方法將待檢測區(qū)域進(jìn)行子塊劃分;(2)對圖像子塊進(jìn)行公交車、小汽車和道路標(biāo)線分類,據(jù)此建立圖像基準(zhǔn)庫;(3)建立CaffeNet深度學(xué)習(xí)模型,利用圖像基準(zhǔn)庫對CaffeNet模型進(jìn)行訓(xùn)練測試。結(jié)果顯示,公交車和道路標(biāo)線識別準(zhǔn)確率為100%,小汽車識別準(zhǔn)確率為98.80%,表明本方法可準(zhǔn)確有效地識別隧道交通視頻中的車輛種類及道路標(biāo)線。
關(guān)鍵詞:智能交通;深度學(xué)習(xí);隧道視頻;車輛檢測
在現(xiàn)代交通系統(tǒng)中,基于視頻的交通信息檢測是一種重要交通信息采集技術(shù)。由于其具有可視化、安裝維護(hù)便捷、可獲取多種交通參數(shù)且不破壞路面結(jié)構(gòu)等優(yōu)勢,在交通監(jiān)控管理和交通研究等領(lǐng)域得到了廣泛的應(yīng)用。但現(xiàn)有的基于視頻進(jìn)行車輛自動識別的方法在交通擁堵路段存在提取圖像特征困難、識別效果差等問題。
近年來深度學(xué)習(xí)成為研究熱點,在車輛顏色[1]、無牌車檢測[2]、機(jī)動車檢測與分類[3]、目標(biāo)跟蹤[4]、車輛定位[5]等相關(guān)的技術(shù)方面也比較成熟。深度學(xué)習(xí)能夠很好地獲取較為穩(wěn)定的特征,搜索的相似目標(biāo)更精確,搜索準(zhǔn)確率在95%以上。目前深度學(xué)習(xí)在交通領(lǐng)域中的應(yīng)用還有車輛檢測與感知[6]、車輛身份特征識別[7]、交通視頻的分析應(yīng)用[8]等。
因此,本文提出了基于深度學(xué)習(xí)的隧道視頻車輛檢測方法,有效避免了圖像特征提取困難、識別效果差等問題。
1 方法簡介
本文基于方法步驟如下:
(1)視頻采集。
(2)圖像預(yù)處理。將采集的視頻轉(zhuǎn)化為圖像,并經(jīng)過一系列圖像預(yù)處理過程獲得原始數(shù)據(jù)庫。
(3)深度學(xué)習(xí)圖像基準(zhǔn)庫構(gòu)建。人工分類原始數(shù)據(jù)庫內(nèi)的圖像,構(gòu)建訓(xùn)練集、測試集與驗證集。
(4)CaffeNet模型訓(xùn)練測試。將訓(xùn)練集與測試集同CaffeNet模型結(jié)合進(jìn)行模型的訓(xùn)練與測試,并不斷調(diào)整優(yōu)化模型的參數(shù),直到滿足準(zhǔn)確率-損失值閾值條件。
(5)CaffeNet模型驗證與分析。利用訓(xùn)練好的CaffeNet模型分類驗證集的圖像,若準(zhǔn)確率太低則調(diào)整參數(shù)后重新進(jìn)行模型的訓(xùn)練與測試;若準(zhǔn)確率達(dá)到要求,則可以進(jìn)行車輛檢測。
2 深度學(xué)習(xí)圖像基準(zhǔn)庫構(gòu)建
將原始數(shù)據(jù)庫內(nèi)的圖像按類別歸類整理,本文將路面上的目標(biāo)分成3類,分別是bus(公交車)、car(小汽車)以及l(fā)anemarking(標(biāo)線)。各類別樣圖如圖1至圖3所示。
圖像基準(zhǔn)庫由四部分組成,包括basic_dataset(原始數(shù)據(jù)庫)、train_dataset(訓(xùn)練集)、test_dataset(測試集)以及predict_dataset(驗證集)。其中,原始數(shù)據(jù)庫是由原始視頻轉(zhuǎn)化成圖像后經(jīng)過人工截取檢測目標(biāo)后的原始圖像。圖像基準(zhǔn)庫各部分樣圖數(shù)量如表1所示。
3 CaffeNet模型訓(xùn)練測試
3.1 CaffeNet深度學(xué)習(xí)模型簡介
深度神經(jīng)網(wǎng)絡(luò)模型常見模型有LeNet、AlexNet、CaffeNet、GoogLeNet與Vgg_16,本文使用的模型是CaffeNet模型。CaffeNet模型除了輸入層和輸出層之外,由5個卷積層與3個全連接層組成,模型運(yùn)行圖如圖4所示。
3.2 CaffeNet深度學(xué)習(xí)模型訓(xùn)練測試
CaffeNet模型訓(xùn)練測試主要有準(zhǔn)備數(shù)據(jù)集、標(biāo)記數(shù)據(jù)、創(chuàng)建lmdb格式的數(shù)據(jù)庫文件、建立Caffenet網(wǎng)絡(luò)和訓(xùn)練參數(shù)、執(zhí)行訓(xùn)練五個步驟。本文CaffeNet模型基本訓(xùn)練參數(shù)如表2所示。
經(jīng)過訓(xùn)練與測試,得到結(jié)果圖分為Train loss、Test loss和Accuracy三個部分,當(dāng)Train loss和Test loss趨近于0時,Accuracy趨近于1時,訓(xùn)練測試結(jié)果越好。如圖5所示為CaffeNet模型的訓(xùn)練測試結(jié)果圖,可見模型的精確率較高,可進(jìn)行模型驗證步驟。
4 CaffeNet模型驗證與分析
模型驗證有準(zhǔn)備有關(guān)類名文件、準(zhǔn)備驗證圖像集、準(zhǔn)備網(wǎng)絡(luò)構(gòu)架說明文件、準(zhǔn)備分類器并執(zhí)行批處理文件幾個步驟。部分驗證概率值如表3所示。
根據(jù)統(tǒng)計得到,“bus”的驗證準(zhǔn)確率為100%,“car”的驗證準(zhǔn)確率為98.80%,“l(fā)anemarking”的驗證準(zhǔn)確率為100%。從表中可看出,Caffenet模型對車輛檢測的驗證準(zhǔn)確率很高,但是依然存在識別誤差,誤差主要集中在小轎車和公交車以及小轎車和標(biāo)線之間的識別。
5 隧道視頻車輛檢測
對于隧道視頻圖像中的任意子塊,如圖6所示,利用CaffeNet深度學(xué)習(xí)模型進(jìn)行公交車、小汽車、道路標(biāo)線的種類識別。然后,將識別結(jié)果在原始視頻圖像中進(jìn)行標(biāo)記,如圖7所示。
6 結(jié)論
本文設(shè)計的基于深度學(xué)習(xí)的隧道視頻車輛檢測方法,彌補(bǔ)了現(xiàn)有視頻車輛檢測方法的不足,有助于實時交通信息采集,在交通監(jiān)控管理和交通研究等領(lǐng)域拓展交通流理論研究范疇、推動交通流分析等相關(guān)研究,具有較廣闊的工程應(yīng)用價值和理論意義。
基于深度學(xué)習(xí)的隧道視頻車輛檢測,具有更直觀、穩(wěn)定可靠、識別效率高、易操作等優(yōu)勢,依靠神經(jīng)網(wǎng)絡(luò)訓(xùn)練時自動從低級特征到高級特征不斷學(xué)習(xí)提取圖像的特征,從而規(guī)避了人工提取圖像特征的復(fù)雜性、模糊性以及特征匹配時的不穩(wěn)定性。
但是,目前深度學(xué)習(xí)在交通領(lǐng)域的研究還不夠成熟,需要挖掘的地方還有很多。另外,模型訓(xùn)練樣本的構(gòu)建以及神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練都比較耗時,特別是參數(shù)的優(yōu)化。模型的準(zhǔn)確度將直接影響后面預(yù)測的可靠性,所以對于深度學(xué)習(xí)需要更全面的測試和長期深入的研究。
參考文獻(xiàn):
[1]張強(qiáng),李嘉鋒,卓力,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的監(jiān)控場景下車輛顏色識別[J].測控技術(shù), 2017(10):11-14.
[2]鄒剛,蔣濤,李鴻升.基于深度學(xué)習(xí)的車牌檢測方法,CN 106022232 A[P].2016.
[3]郭少博.基于深度學(xué)習(xí)的機(jī)動車檢測與屬性識別研究[D].中國科學(xué)技術(shù)大學(xué),2017.
[4]管皓,薛向陽,安志勇.融合視覺先驗與背景信息的視頻目標(biāo)跟蹤方法[J].小型微型計算機(jī)系統(tǒng),2016,37(9):2074-2078.
[5]張飛云.基于深度學(xué)習(xí)的車輛定位及車型識別研究[D]. 江蘇大學(xué),2016.
[6]陳惠珍.基于深度學(xué)習(xí)的無人車避障策略研究[D].湖南大學(xué),2016.
[7]王夢偉.基于深度學(xué)習(xí)的車輛特征識別系統(tǒng)研究與實現(xiàn)[D].電子科技大學(xué),2016.
[8]柴江武,王茜,魯斌.基于深度學(xué)習(xí)的道路交通態(tài)勢在線視頻判別系統(tǒng)[J].科研,2016(12):151.