蔡俊,趙超,沈曉波,朱家兵
(1.淮南師范學院電子工程學院, 安徽 淮南 232038; 2.中國移動通信集團安徽有限公司, 安徽 合肥 230000)
隨著智慧城市建設(shè)的推進與發(fā)展,人們對交通設(shè)施信息化和智能化管理也提出新的需求.路標檢測與識別技術(shù)成為智能交通系統(tǒng)的一個重點研究方向,道路環(huán)境中交通標志的識別性能直接關(guān)系著道路交通安全,具有重要的現(xiàn)實意義.
近年來,國內(nèi)外大批科技工作者開始投入到路標識別的研究中,涌現(xiàn)出大量研究成果.張文熾[1]通過構(gòu)建AlexNet和VGG11特征融合網(wǎng)絡(luò)模型,提升了系統(tǒng)識別性能;張功國[2]提出將CNN-SVM算法用于道路標識的特征提取和分類,可有效提升系統(tǒng)實時性和識別率;薛之昕[3]基于多尺度卷積神經(jīng)網(wǎng)絡(luò)模型,采用ReLu激活函數(shù)和Softmax分類器有效降低了系統(tǒng)識別時間;Arpan Jain[4]利用改進遺傳算法優(yōu)化CNN模型參數(shù),提升了系統(tǒng)的魯棒性;周蘇[5]優(yōu)化了PVANet卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),改善了小目標交通標志的檢測效果;張淑芳[6]通過構(gòu)建殘差SSD模型以及多尺度分塊檢測,提升了系統(tǒng)的檢測能力;丁博[7]綜合AdaBoost-SVM和CNN算法優(yōu)勢,提出了一種新型的混合預(yù)測模型,有效提升了識別準確率,減少收斂時間.
上述系統(tǒng)均能有效識別道路環(huán)境中的交通標志,但是識別過程的中間環(huán)節(jié)缺乏直觀性的展示.本研究充分利用GUI界面的交互性和直觀性,設(shè)計基于SIFT算法和PyQt的停車位標志識別系統(tǒng).
1.1 系統(tǒng)模型本研究將SIFT算法應(yīng)用到停車位道路標識牌的識別技術(shù)中,系統(tǒng)模型如圖1所示,主要由道路環(huán)境圖像讀取、預(yù)處理、路標檢測、路標識別以及輸出結(jié)果等部分組成.
圖1 系統(tǒng)模型
系統(tǒng)模型中,對輸入的道路環(huán)境圖像進行預(yù)處理后,依據(jù)停車位交通標志特有的藍色特征定位路標區(qū)域,從而獲取路標圖像.再基于SIFT算法完成路標圖像的特征提取,通過與路標圖像標準庫特征的匹配,實現(xiàn)路標的分類,并輸出識別結(jié)果.
1.2 SIFT算法原理SIFT(scale-invariant feature transform),即尺度不變特征變換[8],對圖像旋轉(zhuǎn)、尺度縮放、亮度變化等具有不變特征,可以在一定程度上有效降低路標圖像因拍攝視角、距離以及光照等因素對識別結(jié)果的干擾.
在SIFT算法中,為獲取圖像中物體的多尺度特征,一般通過構(gòu)造DoG(difference of Gaussian)尺度空間獲取穩(wěn)定的特征點,采用高斯函數(shù)G(x,y,σ)與待處理圖像作卷積運算實現(xiàn)尺度變換[9].二維圖像I(x,y)的尺度空間L(x,y,σ)通常表示為:
L(x,y,σ)=G(x,y,σ)*I(x,y,σ)
(1)
式中,x,y分別表示二維圖像中像素點的行列坐標位置.σ為尺度參數(shù),決定了圖像高斯平滑濾波的程度,G(x,y,σ)又稱為高斯平滑核函數(shù),定義為:
(2)
SIFT算法常用于特征檢測,具體實現(xiàn)流程如圖2所示.
圖2 SIFT算法實現(xiàn)流程
1.3 PyQt簡介PyQt是基于Python語言環(huán)境,并融合了Qt庫模塊功能,而形成的用于開發(fā)圖形用戶界面(Graphical User Interface,簡稱GUI)交互程序的工具包.PyQt適用于多種主流操作系統(tǒng),如Windows、Linux、Unix及Mac OS等.
Qt庫集成了非常多的模塊,通常被分為基礎(chǔ)模塊和擴展模塊兩大類.其中,基礎(chǔ)模塊一般適用在所有平臺,包含Qt Core、Qt Gui、Qt Multimedia、Qt Network、Qt Qml及Qt Quick等,具體分類及功能如圖3所示.
圖3 Qt基礎(chǔ)模塊構(gòu)成
2.1 界面設(shè)計停車位標志識別系統(tǒng)主要包括道路圖像讀取、預(yù)處理、路標檢測、SIFT分類以及輸出結(jié)果五大部分.通過使用Python PyQt庫編寫GUI界面,實現(xiàn)停車位類道路標識牌識別系統(tǒng)的處理過程展示,包含預(yù)處理、開運算、定位、分割、標準化以及SITF分類等一系列中間環(huán)節(jié),最終識別結(jié)果會顯示在“識別結(jié)果”顯示欄.
系統(tǒng)界面如圖4所示,采用多個PushButton按鈕、Lable標簽以及textEdit等控件設(shè)計而成.當分別點擊“讀取”、“預(yù)處理”、“開運算”以及“定位”等功能按鈕后,處理結(jié)果會自動顯示到相應(yīng)窗口區(qū)域.
標準化是PLM系統(tǒng)實施和應(yīng)用的基礎(chǔ),在PLM實施過程中,企業(yè)通過兩套典型設(shè)備的技術(shù)資料上線準備工作,規(guī)范了術(shù)語,制定了企業(yè)編碼體系及圖樣和技術(shù)文件模板,建立了企業(yè)標準件和通用件數(shù)據(jù)庫,將標準化體系和質(zhì)量管理體系相融合,構(gòu)建涵蓋各種技術(shù)標準的知識庫,規(guī)范了產(chǎn)品開發(fā)和簽審流程等。
圖4 道路標識牌識別系統(tǒng)顯示界面
2.2 功能分析與介紹
1)道路圖像讀取.
點擊“讀取”按鈕,windows系統(tǒng)會彈出文件選擇對話框,從中選擇待處理的道路環(huán)境圖像.圖像選擇對話框效果如圖5所示.
圖5 文件選擇對話框
2)預(yù)處理.
停車位標志一般具有特定的顏色和形狀,文中以藍底白色圖識為樣例,如圖6所示.道路環(huán)境圖像多基于RGB模型,顏色值受光照強度影響顯著,不利于基于顏色特征的定位和識別.實踐中,一般將RGB圖像轉(zhuǎn)換至HSV顏色空間,再依據(jù)藍色分量的閾值范圍進行二值化分割進而實現(xiàn)標志區(qū)域的定位.其中,RGB至HSV空間的轉(zhuǎn)換公式[10]為:
圖6 停車位標志(部分)
V=max(R,G,B)
(3)
(4)
(5)
式(4)中,當H<0時,H=H+360.HSV空間顏色分量范圍如表1所示:
表1 HSV顏色空間顏色分量范圍
系統(tǒng)設(shè)計中,圖像預(yù)處理包含色調(diào)閾值二值化和濾波處理兩個操作.考慮到閾值分割后的二值圖像中可能存在噪點,需要進一步通過高斯低通濾波器進行濾波處理,以消除噪點對后期處理的干擾.預(yù)處理效果如圖7所示.
圖7 “預(yù)處理”過程
3)路標檢測.
“路標檢測”環(huán)節(jié)包含開運算、定位以及分割三個步驟.為方便檢測路標的具體位置,獲取路標區(qū)域的輪廓,需要對預(yù)處理后的二值圖像進行開運算操作.開運算是一種形態(tài)學處理方法,通過先腐蝕后膨脹達到分離物體、消除小區(qū)域的目的,從而得到封閉的目標區(qū)域.
經(jīng)開運算處理得到的二值圖像中,顏色值為白色的目標區(qū)域即為路標位置,通過調(diào)用cv2.findContours()函數(shù)進行二值圖像邊界拓撲分析,確定目標區(qū)域邊界位置.點擊“定位”按鈕,在原始圖像的定位區(qū)域中加入紅線標記輪廓.
經(jīng)定位處理后可獲取矩形目標區(qū)域的行列坐標值,據(jù)此可從道路環(huán)境圖像中較準確地裁剪出路標區(qū)域圖像,從而實現(xiàn)路標的分割.“路標檢測”過程效果如圖8所示.
圖8 “路標檢測”過程
4)路標識別.
“路標識別”環(huán)節(jié)包含標準化和SIFT分類兩個步驟.考慮到上一環(huán)節(jié)中分割后的圖像為矩形,且實際道路圖像中,往往因圖像分辨率、拍攝距離遠近、角度等原因,分割后的停車位標志圖像尺寸大小不一,甚至產(chǎn)生形變.為方便后續(xù)SIFT特征提取與匹配,需要進一步標準化處理.由于標準的停車位標志牌多為正方形,可采用resize()函數(shù)將分割后的標志圖像統(tǒng)一調(diào)整為固定大小(文中取經(jīng)驗值36×36像素)的正方形.
SIFT分類,即采用SITF算法,對標準化后的目標圖像進行特征檢測,獲得待識別圖像特征點集.再與停車位標準特征庫進行特征點匹配和統(tǒng)計,獲取最佳匹配結(jié)果,將特征點在圖像中進行標記,并畫出映射輔助線段.“路標識別”過程效果如圖9所示.
圖9 “路標識別”過程
5)識別結(jié)果輸出.
點擊“輸出結(jié)果”按鈕,通過查詢上一步驟SITF分類中特征數(shù)據(jù)文件,獲取對應(yīng)標準庫圖像的文件名稱,并在textEdit中顯示.“輸出結(jié)果”效果如圖10所示.
圖10 “輸出結(jié)果”效果圖
為驗證文中停車位標志識別系統(tǒng)的可靠性和有效性,選取大量不同拍攝視角、距離以及光照等條件下的道路環(huán)境圖像進行實驗,部分識別樣例如圖11所示.
圖11 檢測與識別過程樣例
圖11中分別展示了停車位標志在檢測與識別過程中的效果示意圖.實驗結(jié)果表明,本文中設(shè)計的停車位標志識別系統(tǒng)識別準確率高,具有較好的魯棒性.經(jīng)過大量實驗驗證,系統(tǒng)識別準確率基本能達到95%左右.
為了更加形象、直觀地展示道路停車位標識牌的識別過程和處理效果,本研究以SIFT算法及PyQt工具包為基礎(chǔ),設(shè)計停車位標志識別系統(tǒng).首先構(gòu)建系統(tǒng)模型,分析SIFT算法的實現(xiàn)原理,并基于PyQt庫編寫GUI應(yīng)用程序.系統(tǒng)可以實現(xiàn)對道路原始圖像的讀取、預(yù)處理、路標位置定位功能,并通過SIFT特征匹配識別當前停車位標志,進而以文本的形式輸出分類結(jié)果.實踐證明,對現(xiàn)有自然場景下的道路環(huán)境圖像,停車位交通標志的識別準確率基本能達到95%左右,且系統(tǒng)界面功能明確,簡單易用,交互性強,能夠為讀者提供較好的實際體驗.文中也存在不足之處:第一,文中主要研究了單個停車位標志的識別技術(shù),暫未考慮多個路標同時出現(xiàn)的情形;第二,關(guān)于某些惡劣天氣、低照明、形變嚴重以及障礙物遮擋等復雜情形下的停車位標志圖像識別暫未涉及,后續(xù)還需進一步深入學習和研究.