楊力川
(四川大學(xué)計算機(jī)學(xué)院,成都610065)
隨著私人汽車保有量不斷上升,交通標(biāo)志的識別這一領(lǐng)域開始凸顯越來越大的影響力。交通標(biāo)志識別是智能交通系統(tǒng)的重要內(nèi)容,在無人駕駛和駕駛員輔助系統(tǒng)中具有重要的應(yīng)用以及發(fā)展前景,并且為自動或半自動駕駛車輛提供有用的道路信息。
交通標(biāo)志識別的內(nèi)容主要有交通標(biāo)志圖像檢測、特征的提取以及最后的分類。而在較為復(fù)雜的自然場景中,各種外部因素使得準(zhǔn)確又較快地完成交通標(biāo)志識變得有不小難度。
因此,在當(dāng)下智能交通發(fā)展的趨勢下,需要借助更為科學(xué)和先進(jìn)的工具來進(jìn)行交通標(biāo)志識別。交通標(biāo)志識別的傳統(tǒng)方法在精確度和速率已經(jīng)不足以達(dá)到當(dāng)前無人駕駛系統(tǒng)的需求。而依靠圖像的顏色和形狀特征來匹配的方法固然簡單方便而且速度快,但識別率和精確度難以達(dá)到實(shí)際的要求。而基于深度學(xué)習(xí)的交通標(biāo)志識別方法則不同,在識別目標(biāo)的同時進(jìn)行訓(xùn)練,雙管齊下有效地提高了識別精度并且減少了耗費(fèi)時間,能夠在復(fù)雜自然情況下較為有效地提高交通標(biāo)志的識別正確率,成為交通標(biāo)志識別的新興熱門領(lǐng)域。
交通標(biāo)志識別是實(shí)現(xiàn)智能駕駛的重要一環(huán)。所謂的標(biāo)志識別就是通過車內(nèi)的攝像設(shè)備捕獲到的圖像信息,來對這些標(biāo)志進(jìn)行設(shè)別,然后再把這些信息反饋給駕駛員,做到及時提醒,進(jìn)而保證行駛安全。例如,當(dāng)駕駛員勞累、注意力分散、情緒波動、走神、或受到霧霾等外在自然因素,此時駕駛員依靠自己的肉眼不能快速并且準(zhǔn)確獲得相關(guān)的交通標(biāo)志信息,高效準(zhǔn)確的交通標(biāo)志識別技術(shù)就變得相當(dāng)有必要。
隨著神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的發(fā)展,交通標(biāo)志識別也開始運(yùn)用相關(guān)的技術(shù)。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)的核心部分。CNN在檢測性能和準(zhǔn)確率方面都比傳統(tǒng)檢測識別有優(yōu)勢,尤其是遇到復(fù)雜情況下的交通標(biāo)志檢測,包括物體遮擋、拍攝角度、形狀改變、天氣因素之類的,在這些情況下進(jìn)行交通標(biāo)志識別仍然是目前研究的難點(diǎn)部分,還需要進(jìn)一步的發(fā)展。
早期的交通標(biāo)志識別方法基本大概由兩部分組成。一類是基于顏色、形狀視覺信息等進(jìn)行識別,另外一類是基于特征提取與機(jī)器學(xué)習(xí)進(jìn)行識別。
這類方法主要通過對目標(biāo)圖像相關(guān)特征進(jìn)行提取,進(jìn)而把圖像中的交通標(biāo)志志進(jìn)行圖像分離并且檢測出來,接著進(jìn)行分類,雖然這種方法的檢測速度比較快,但是正確率就相應(yīng)的偏低。這種算法的核心是對圖像的顏色空間進(jìn)行選擇,大部分顏色空間特征是RGB,當(dāng)亮度發(fā)生變化時,就不能單一的選擇RGB,解決的方法也有很多。包括調(diào)整通道的比值或者是對RGB值進(jìn)行處理,再或者將其轉(zhuǎn)至另外的顏色空間(HIS、HS等)中進(jìn)行處理。
朱雙東等人[1]把圖像從RGB模型轉(zhuǎn)化成HSI模型,然后再從H通道值中提取出紅色,隨后用模板LOG提取邊緣,最后用BP網(wǎng)絡(luò)來對圖像進(jìn)行處理。初秀平等人[2]將圖像從RGB顏色模型轉(zhuǎn)換到色度-飽和度-亮度的HSV顏色模型,并對圖像進(jìn)行分割,最后在進(jìn)行二值化處理。再例如Paclik等人[3]將目標(biāo)從RGB模型轉(zhuǎn)為HSI模型,通過選擇合適的閾值來獲得所需的顏色,進(jìn)而進(jìn)行識別檢測。C.Y.Fanga等人[4]提出了一種依據(jù)人類的眼球結(jié)構(gòu)的識別系統(tǒng),通過對圖像的紅黃藍(lán)信息的提取來檢測,黑色和白色信息來識別。朱國康等人[5]針對圖像中的標(biāo)志大小不一和位置不一定的情況,對目標(biāo)的多種特征進(jìn)行融合,他們先對樣本進(jìn)行相應(yīng)的預(yù)處理,再對圖像進(jìn)行裁剪,提取相應(yīng)區(qū)域的顏色,最后對顏色形狀等特征進(jìn)行分類檢測,完成標(biāo)志識別。這些根據(jù)顏色以及形狀特征的交通標(biāo)志識別方法盡管在準(zhǔn)確性方面進(jìn)行了不少的優(yōu)化,但是面對某些特殊情況,如標(biāo)志受到破壞時,再使用這類方法的效果就不是很好,識別所需時間較長,效率偏低。
此類算法核心內(nèi)容是抽取被訓(xùn)練圖像中目標(biāo)區(qū)域的特征,再對其進(jìn)行訓(xùn)練,將分類器進(jìn)行特征匹配,來完成交通標(biāo)志的識別工作。這種方法的難點(diǎn)在于找出那些最重要的特征,當(dāng)無法準(zhǔn)確判斷所需的特征是否滿足要求時,人們會偏向多取特征,甚至不做分析,將無用的測量值用作分類特征,造成的結(jié)果不僅是耗時,而且對結(jié)果造成巨大影響。這類方法需要先對測量值分析,獲得有效的特征識別,并且再保證一定分類精度下,減少特征的維數(shù),讓分類器的分類變得快速準(zhǔn)確且高效。
支持向量機(jī)(Support Vector Machine,SVM)是其中重要的一環(huán),它在速度和準(zhǔn)確率上都表現(xiàn)出令人滿意的一面,SVM分類器參與的檢測能夠滿足大部分基本的需求。張興敢等人[6]通過卷積變換獲得圖像的特征,其中輸入層采用滑動窗口計算卷積,接著把激活函數(shù)作為輸出,得到數(shù)個特征圖,單個特征圖也是由多個圖卷積得到的,這樣得到的實(shí)驗(yàn)結(jié)果的準(zhǔn)確率明顯提高。Creusen等人[7]通過有向梯度直方圖(HOG)算法針對大規(guī)模全景數(shù)據(jù)集上的交通標(biāo)志檢測,該算法在特征向量中加入顏色信息進(jìn)行擴(kuò)展。而這一舉措顯著提高了檢測性能,HOG算法性能很高,此外,他們也提出了一種新的迭代向量機(jī)訓(xùn)練模式處理圖片,優(yōu)點(diǎn)是能夠降低內(nèi)存消耗并且提高背景信息效率。
Huang等人[8]提出了一種由方向梯度變量直方圖(HOGv)和極值學(xué)習(xí)機(jī)(ELM)算法訓(xùn)練分類器的檢測方法。提取的HOGV的特征在冗余和特定細(xì)節(jié)間有良好的平衡關(guān)系,而基于ELM的分類器又在輸入層和隱藏層之間實(shí)現(xiàn)隨機(jī)特征映射,帶來的好處就是不需要逐層調(diào)整,所以可以滿足大部分特征提取的精度要求。這幾種方法要進(jìn)行分類識別需要分類器,效率并不是很高。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)的重要組成部分,在檢測識別領(lǐng)域獲得了許多成果,學(xué)者將其用于交通標(biāo)志識別領(lǐng)域,讓這個領(lǐng)域進(jìn)入一個新的里程碑。與上面兩種交通標(biāo)志識別方法不同的是,CNN可以在訓(xùn)練的同時提取特征,即一邊提取一邊訓(xùn)練,雙管齊下,有效提高檢測和訓(xùn)練效率,并且檢測性能上也不落后甚至更優(yōu)于傳統(tǒng)交通標(biāo)志識別。Schmidhuber等人[9]運(yùn)用CNN識別交通標(biāo)志,得到了非常高的正確率。其正確率達(dá)到99.46%。他們使用了一個快速的,完全參數(shù)化的GPU實(shí)現(xiàn)的深度神經(jīng)網(wǎng)絡(luò)。在監(jiān)督學(xué)習(xí)下,訓(xùn)練了不同組合而成的單個多列,再一次地提高了識別正確率,并且也降低了對光照以及對比對變化的敏感度。Jin等人[10]則通過一種鉸鏈損失隨機(jī)梯度下降(HLSGD)方法訓(xùn)卷積神經(jīng)網(wǎng)絡(luò)(CNN)。HLSGD經(jīng)過評估,具有更快和更穩(wěn)定的收斂性,最好的結(jié)果是有99.65%的識別率,具體是通過編寫一個圖形處理單元包來訓(xùn)練多個CNN并集成最終分類器。Ren等人[11]提出依賴候選區(qū)域算法(RPN)的檢測網(wǎng)絡(luò),共享完整的圖像卷積特征,從而實(shí)現(xiàn)了近乎無成本候選區(qū),并且把相關(guān)過程放在GPU上運(yùn)行,在目標(biāo)檢測領(lǐng)域達(dá)到了很高的檢測正確率和較快的速度。伍曉暉[12]則從小目標(biāo)交通標(biāo)志識別入手,在精度方面在已有的Tiny-YOLOv3交通標(biāo)志檢測算法上進(jìn)行了改進(jìn),加深特征金字塔圖層,具有比較好的魯棒性。并且增加網(wǎng)絡(luò)的寬度和深度,用批量歸一化處理樣本,再一次提高原網(wǎng)絡(luò)的精度。
雖然基于深度學(xué)習(xí)的目標(biāo)檢測方法在國內(nèi)外已經(jīng)取得不少的成果,但是將這類方法還沒有大規(guī)模使用,還有很大發(fā)展空間。
本文介紹了基于深度學(xué)習(xí)的交通標(biāo)志識別相關(guān)的研究和技術(shù),解釋了其技術(shù)的核心內(nèi)容,并舉出傳統(tǒng)交通識別的相關(guān)研究,對比分析,剖析其優(yōu)缺點(diǎn)。在深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)出現(xiàn)后,在目標(biāo)檢測和識別方面有巨大優(yōu)勢,交通標(biāo)志識別也因此向前邁進(jìn)了一大步。隨著越來越多的目光投向這個領(lǐng)域,基于深度學(xué)習(xí)的交通識別適用面也越來越廣,研究人員對其中神經(jīng)網(wǎng)絡(luò)的優(yōu)化工作也越來越重視,識別的準(zhǔn)確率也就越來越高。相信在不久之后,基于深度學(xué)習(xí)的交通標(biāo)志識別會廣泛應(yīng)用,無人駕駛和自動駕駛也就更進(jìn)一步了。