趙鐸
(陜西交通職業(yè)技術(shù)學(xué)院 信息工程系,陜西 西安710018)
基于層次輪廓計(jì)算機(jī)視覺的交通路標(biāo)識(shí)別
趙鐸
(陜西交通職業(yè)技術(shù)學(xué)院 信息工程系,陜西 西安710018)
針對(duì)現(xiàn)有計(jì)算機(jī)視覺對(duì)交通路標(biāo)識(shí)別的復(fù)雜性和不穩(wěn)定性的問題,通過運(yùn)用圖像輪廓識(shí)別技術(shù),提出了由全局特征到局部特征再到結(jié)構(gòu)特征的多層次輪廓識(shí)別,在交通路標(biāo)的識(shí)別過程中,分別構(gòu)造了圖像密度、形狀度量、光滑程度和輪廓熵值4個(gè)層次的圖像輪廓,同時(shí)結(jié)合Sobel算子和信息熵對(duì)交通路標(biāo)圖像進(jìn)行了提取與分塊處理。通過實(shí)驗(yàn)仿真結(jié)果表明:在圖像的提取過程中,交通路標(biāo)圖像隨著其DMOS值的增大,圖像的質(zhì)量越差,清晰度越低,其NRSS值越小;在圖像的識(shí)別過程中,低通濾波器的大小設(shè)置為7×7,原圖NRSS為0.7654,形狀度量為1.3和2.4時(shí),NRSS分別為0.3712和0.2667。這種層次化的輪廓分析在路標(biāo)的識(shí)別上具有較好的穩(wěn)健性。
交通圖標(biāo);圖像輪廓;計(jì)算機(jī)視覺;圖像分塊;圖像識(shí)別
隨著數(shù)字全息技術(shù)的不斷發(fā)展,計(jì)算機(jī)視覺應(yīng)用越來越廣泛,尤其在交通路標(biāo)的識(shí)別過程中具有出色的表現(xiàn)[1]。計(jì)算機(jī)視覺作為機(jī)器視覺的分支,在對(duì)交通路標(biāo)識(shí)別的過程中可依據(jù)路標(biāo)顏色空間進(jìn)行劃分,并結(jié)合不同的算法對(duì)尺度不變特征進(jìn)行提取,最終實(shí)現(xiàn)對(duì)交通路標(biāo)的有效識(shí)別[2-3]。在計(jì)算機(jī)視覺下,交通路標(biāo)圖像的采集、壓縮、儲(chǔ)存和傳輸過程中都有可能會(huì)對(duì)圖像的質(zhì)量產(chǎn)生影響,從而直接影響識(shí)別的有效判斷率[4]。同時(shí),用于成像的CCD圖像傳感器的分別率低、光的衍射、光路的選擇不當(dāng)?shù)仍驅(qū)е碌牟蓸拥慕煌窐?biāo)模糊導(dǎo)致的大量高頻分量丟失的問題[5],在計(jì)算機(jī)視覺記錄過程中不可避免受限于現(xiàn)實(shí)環(huán)境。因此,本研究針對(duì)交通路標(biāo)的計(jì)算機(jī)視覺,采用邊緣特征和輪廓信息對(duì)圖像進(jìn)行分塊處理,提出了一種數(shù)字圖像層次輪廓分析的圖像識(shí)別技術(shù)。
1.1 圖像的提取
由于交通路標(biāo)在大小與形狀上極為相似,機(jī)器視覺識(shí)別更加關(guān)注交通路標(biāo)的結(jié)構(gòu)信息,對(duì)于交通路標(biāo)圖像的信息提取由其輪廓和邊緣構(gòu)成[6]。對(duì)于交通路標(biāo)圖像中的某一像素點(diǎn)Pi,j,采用Sobel算子實(shí)現(xiàn)梯度變換來提取圖像的輪廓和邊緣信息[7]。則計(jì)算像素點(diǎn)的梯度信息為:
其中,|·|表示兩點(diǎn)之間的距離,dxi,j和 dyi,j分別為圖像的水平邊緣和垂直邊沿掩膜算法。
將獲得的交通路標(biāo)圖像按照素點(diǎn)的梯度信息進(jìn)行分塊處理:首先,找出交通路標(biāo)圖像中路標(biāo)輪廓和邊緣信息最為豐富的N個(gè)圖像塊;其次,設(shè)置塊間的距離步長(zhǎng)為4,將圖像分成12×12的路標(biāo)圖像小塊,即對(duì)稱的圖像塊進(jìn)行重疊整理,這樣做的目的是為了減少計(jì)算機(jī)讀取的重復(fù)信息,從而避免信息自動(dòng)分塊損失的細(xì)節(jié)[8];最后,通過計(jì)算每一個(gè)子圖像塊的方差來判斷高頻區(qū)域的細(xì)節(jié)信息,即方差愈大信息豐富度愈高。將方差按從大到小的順序排列,提取N個(gè)圖像子塊,舍去對(duì)稱重復(fù)子區(qū)域。將這些圖像子塊按照水平方式和垂直方式分別記為{xi,i=1,2…N}和{yi,i=1,2…N},其中 N 的取值對(duì)圖像的識(shí)別精度有顯著影響,N越大識(shí)別精度越高而算法運(yùn)行速度越小,因此,需要選取合適的圖像劃分?jǐn)?shù)量。通常情況下,運(yùn)用邊緣輪廓所占圖像的比例來進(jìn)行取值,即N的取值為2的整數(shù)次冪[9],即
1.2 圖像的識(shí)別
在圖像邊緣特征的提取與圖像分塊時(shí)可能出現(xiàn)厚邊或斷點(diǎn)等情形,導(dǎo)致輪廓圖像的精度不夠或是信息丟失,檢測(cè)出的輪廓像素點(diǎn)并不連續(xù)[10]。本研究對(duì)輪廓圖像的分層識(shí)別提出4個(gè)層次對(duì)圖像進(jìn)行識(shí)別和匹配。
1)圖像密度:計(jì)算機(jī)視覺識(shí)別物體全局特征時(shí),圖像子塊的輪廓長(zhǎng)度所包含對(duì)象面積的大小,圖像密度表達(dá)式如下[11]:
2)形狀度量:將輪廓上的點(diǎn)到輪廓中心的距離函數(shù)[12]:
其中,Ci只考慮其數(shù)值的大小而忽略其順序。若直接用該序列對(duì)交通路標(biāo)進(jìn)行匹配,除了要考慮圖像子塊起始點(diǎn)的位置,還要考慮圖像的形變以及子塊重疊區(qū)域等情況。結(jié)合標(biāo)準(zhǔn)差對(duì)輪廓的起伏變化程度進(jìn)行全局特征描述的衡量。計(jì)算方法如下:
3)光滑程度:在圖像輪廓匹配中,除了形狀等幾何特征易于識(shí)別外,輪廓的曲率也是圖像的重要特征。但由于數(shù)字圖像中輪廓以像素點(diǎn)的形式呈現(xiàn),表現(xiàn)出不光滑性,其曲率的計(jì)算存在一定難度[13]。對(duì)于交通路標(biāo)圖像中的某一像素點(diǎn)Pi,j的曲率計(jì)算為:
其中,|·|表示兩點(diǎn)之間的距離。
4)輪廓熵值:交通路標(biāo)圖像的全局與局部特征相比,全局的結(jié)構(gòu)特征描述的是輪廓中一種基本更為精確結(jié)構(gòu)單元特征,在描述圖像輪廓特征時(shí)具有較好的靈活性和更強(qiáng)的適應(yīng)性。局部的結(jié)構(gòu)特征描述的是待識(shí)別物體輪廓上各點(diǎn)的分布情況,用極窗來量化輪廓內(nèi)容,通過形狀像素點(diǎn)計(jì)算輪廓間的匹配度。而信息熵作為衡量了系統(tǒng)的復(fù)雜度,通過計(jì)算劃分隨機(jī)捕獲的圖像子塊出現(xiàn)的期望值,其信息量隨著信息熵的增大而增大[14]。計(jì)算輪廓信息熵值Q為:
其中,pi為輪廓上點(diǎn)落在第i個(gè)窗口中的概率。
為了實(shí)現(xiàn)計(jì)算機(jī)對(duì)交通圖標(biāo)的識(shí)別,采用層次輪廓識(shí)別算法過程中,首先對(duì)二值圖像進(jìn)行邊緣檢測(cè)或邊緣跟蹤得到更準(zhǔn)確輪廓圖像,獲得輪廓圖像和得到了連續(xù)的輪廓像素點(diǎn),以便于下面輪廓特征的描述。清晰的交通路標(biāo)由于包含大量的高頻信息經(jīng)過低通濾波得到的圖像損失了大量的高頻信息成分,濾波前后圖像差異較大,得到的結(jié)構(gòu)相似度的值較??;交通路標(biāo)的小分塊由于只丟失少量的高頻信息,經(jīng)過低通濾波器隨時(shí)的高頻成分相對(duì)較少,濾波前后的路標(biāo)差異較小,得到的結(jié)構(gòu)相似度較大。其中,層次輪廓的路標(biāo)圖像邊緣特征提取和圖像分塊流程,如圖1所示。
圖1 路標(biāo)圖像輪廓的提取與分塊的流程
對(duì)于交通路標(biāo)輪廓形狀度量的變化,運(yùn)用特征描述可以對(duì)交通圖標(biāo)的不同形狀具有很好的區(qū)分度,對(duì)于常見的路標(biāo)圖像可以按照?qǐng)A形、正方形和三角形進(jìn)行劃分,當(dāng)輪廓長(zhǎng)度相等時(shí),質(zhì)點(diǎn)距離的標(biāo)準(zhǔn)差分別為0、0.34和1[15]。交通路標(biāo)主要分類3大類:禁令、警告和指示。每個(gè)大類的交通路標(biāo)都有統(tǒng)一的輪廓類型,例如,禁令類的交通路標(biāo)為黑色三角形邊框的紅色背景的標(biāo)示,警告類的交通路標(biāo)為黑色正方形邊框的黃色背景的標(biāo)示,指示類的交通路標(biāo)為白色圓形邊框的藍(lán)色背景的標(biāo)示。這3大類邊框?qū)?yīng)圖2中3種不同形狀。不同形狀質(zhì)心距離標(biāo)準(zhǔn)差如圖2所示。
圖2 質(zhì)心距離標(biāo)準(zhǔn)差
針對(duì)計(jì)算機(jī)視覺下的交通路標(biāo)提出了能夠識(shí)別輪廓特征的4個(gè)層次劃分描述:具有全局特征的緊密度D和形狀度量σi,反應(yīng)局部特征的輪廓光滑程度K(i)以及顯示結(jié)構(gòu)特征的輪廓熵值Q。將這4個(gè)層次輪廓特征描述子組成一個(gè)結(jié)構(gòu)化的、綜合性很強(qiáng)的圖像輪廓特征 F={D,σi,K(i),Q},用其作為計(jì)算機(jī)視覺對(duì)交通路標(biāo)圖像的識(shí)別和匹配,展現(xiàn)出了較好的穩(wěn)健性和容錯(cuò)能力。
本研究實(shí)驗(yàn)的硬件環(huán)境為Intel i7-4850HQ處理器(4 核,單核主頻 3.5 GHz),物理內(nèi)存 4 GB,操作系統(tǒng)為64位Windows7,算法基于Matlab軟件進(jìn)行編程。數(shù)據(jù)共收集了300張交通路標(biāo)圖像進(jìn)行計(jì)算機(jī)視覺的算法訓(xùn)練,并且每張交通路標(biāo)的圖像采用JPG格式且為1280×800像素,同時(shí)考慮到交通道路上周圍環(huán)境可能造成的部分遮擋和光照強(qiáng)度的不同引起的交通圖標(biāo)的采集信息對(duì)識(shí)別的誤判,本實(shí)驗(yàn)對(duì)收集的交通路標(biāo)圖像進(jìn)行了仔細(xì)的刪選盡可能的減少樣本取樣誤差對(duì)計(jì)算機(jī)視覺識(shí)別結(jié)果的誤差。
為了驗(yàn)證本研究提出的層次輪廓計(jì)算機(jī)視覺對(duì)交通路標(biāo)識(shí)別分析的合理性,將通過兩個(gè)實(shí)驗(yàn)來驗(yàn)證:實(shí)驗(yàn)一,利用失真圖像的主觀差異評(píng)分DMOS(Difference Mean Opinion Scores)值[16]和無(wú)參考結(jié)構(gòu)清晰度 NRSS(No Reference Structure Scores)[17]來對(duì)圖像的提取失真差異進(jìn)行分析;實(shí)驗(yàn)二,利用層次輪廓計(jì)算機(jī)視覺對(duì)圖像進(jìn)行識(shí)別來判斷算法的有效性。
實(shí)驗(yàn)一:300張交通路標(biāo)圖像分為禁令、警告和指示每大類各100張,使用gblur子文件夾下的圖像進(jìn)行試驗(yàn),實(shí)驗(yàn)時(shí)選用同一張交通路標(biāo)圖像不同模糊程度的失真圖進(jìn)行對(duì)比,結(jié)果如表1所示。
表1 不同程度的模糊失真圖像對(duì)比
由表1可知,交通路標(biāo)圖像隨著其DMOS值的增大,圖像的質(zhì)量越差。質(zhì)量較差的圖像在低通濾波器在計(jì)算機(jī)視覺下的梯度變換圖像的結(jié)構(gòu)相似度值就越大,NRSS的值就會(huì)越小。同時(shí),隨著交通路標(biāo)圖像的清晰度越低,其NRSS值越小,即采用圖像邊緣輪廓提取的方式對(duì)交通路標(biāo)的識(shí)別具有可行性。
實(shí)驗(yàn)二:在實(shí)驗(yàn)一對(duì)所使用的交通路標(biāo)圖像清晰度提取的基礎(chǔ)上,利用本研究提出的層次輪廓計(jì)算機(jī)視覺識(shí)別技術(shù)對(duì)分塊處理后的圖像進(jìn)行識(shí)別。將兩幅計(jì)算機(jī)視覺下的圖像與失真圖像進(jìn)行對(duì)比:將高斯低通濾波器的大小設(shè)置為7×7,路標(biāo)圖像的形狀度量標(biāo)準(zhǔn)差分別設(shè)置為1.3和2.4。不同程度計(jì)算機(jī)視覺圖像的識(shí)別與對(duì)別,如圖3所示和表2所示。
圖3 不同程度計(jì)算機(jī)視覺圖像的識(shí)別
表2 不同程度計(jì)算機(jī)視覺圖像對(duì)別
如圖3所示,形狀度量值越大,交通路標(biāo)圖像越模糊,即越難以實(shí)現(xiàn)識(shí)別,如表2所示,交通路標(biāo)圖像越模糊,經(jīng)過層次輪廓計(jì)算機(jī)視覺得分越低。實(shí)驗(yàn)結(jié)果表明,本研究提出的層次輪廓計(jì)算機(jī)視覺識(shí)別能夠有效的識(shí)別交通圖標(biāo)信息。通過設(shè)置濾波器的大小來獲得不同清晰程度的交通路標(biāo)圖像作為識(shí)別的圖像。
本研究提出了一種基于層次輪廓計(jì)算機(jī)視覺的交通路標(biāo)識(shí)別,為了提取合適的識(shí)別的圖像,采用Sobel算子實(shí)現(xiàn)梯度變換來提取圖像的輪廓和邊緣信息,結(jié)合信息熵計(jì)算圖像信息豐富度并對(duì)交通路標(biāo)圖像進(jìn)行分塊處理,減少了對(duì)稱重疊區(qū)域的重復(fù)計(jì)算。在交通路標(biāo)的識(shí)別過程中,分別構(gòu)造了圖像密度、形狀度量、光滑程度和輪廓熵值4個(gè)層次的圖像輪廓識(shí)別。通過實(shí)驗(yàn)仿真表明,對(duì)模糊的計(jì)算機(jī)視覺圖像能夠通過條件濾波器的大小實(shí)現(xiàn)數(shù)字全息圖像,利用層次輪廓計(jì)算機(jī)視覺分析可以有效的篩選出全息圖像,提高全息圖像的質(zhì)量,有效的控制由于失真引起的識(shí)別誤判。
[1]劉金龍,薛名芷.機(jī)器視覺技術(shù)在交通路標(biāo)識(shí)別中的實(shí)現(xiàn)方法[J].硅谷,2014(5):46.
[2]吳錦晶,張仁杰,唐春暉.交通路標(biāo)圖像的分割與識(shí)別方法研究[J].光學(xué)儀器,2011,33(5):34-41.
[3]吳曉燕.路標(biāo)圖像識(shí)別的禁忌搜索遺傳算法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2014,35(6):2109-2113.
[4]劉義杰,張湘平,譚霜.基于視覺注意機(jī)制的交通路標(biāo)檢測(cè)方法 [J].計(jì)算機(jī)應(yīng)用研究,2012,29(10):3960-3963.
[5]楊杰,王直杰,董宗祥.復(fù)數(shù)Hopfield神經(jīng)網(wǎng)絡(luò)在路牌識(shí)別中的應(yīng)用 [J].微計(jì)算機(jī)信息,2010,26(22):161-163.
[6]楊佳,黃玉清,陳小寧.基于區(qū)域生長(zhǎng)的機(jī)器人路標(biāo)識(shí)別方法研究 [J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(13):3410-3412.
[7]趙文達(dá),續(xù)志軍,趙建,等.基于梯度直方圖變換增強(qiáng)紅外圖像的細(xì)節(jié)[J].光學(xué)精密工程,2014,22(7):1962-1968.
[8]程鵬,朱美琳,耿華.一種基于梯度Hough變換和SVM的圓檢測(cè)算法 [J].計(jì)算機(jī)與現(xiàn)代化,2013(2):22-26.
[9]毛若羽,陳相寧.改進(jìn)的HSI空間形態(tài)學(xué)有噪彩色圖像邊緣檢測(cè)[J].計(jì)算機(jī)應(yīng)用研究,2013,30(2):635-637.
[10]張桂梅,張松,儲(chǔ)珺.一種新的基于局部輪廓特征的目標(biāo)檢測(cè)方法 [J].自動(dòng)化學(xué)報(bào),2014,40(10):2346-2355.
[11]陳愷,何晨,陳運(yùn).等.基于小波變換和相調(diào)制圖像密度偽彩色編碼的圖像增強(qiáng)處理[J].天津理工大學(xué)學(xué)報(bào),2012,28(3):71-75.
[12]賈棋,劉宇,郭禾,等.以度量分段約束為特征的形狀匹配算法 [J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2014,26(1):65-71.
[13]伍濟(jì)鋼,賓鴻贊.用HOUGH變換改進(jìn)的曲率法識(shí)別平面輪廓圖元 [J].圖學(xué)學(xué)報(bào),2011,32(2):102-106.
[14]吳澤鵬,郭玲玲,朱明超,等.結(jié)合圖像信息熵和特征點(diǎn)的圖像配準(zhǔn)方法 [J].紅外與激光工程,2013,42(10):2846-2852.
[15]劉罡,李元香.分子動(dòng)理論的新型反向差分演化算法 [J].小型微型計(jì)算機(jī)系統(tǒng),2012,33(1):115-120.
[16]王阿紅,郁梅,彭宗舉,等.一種基于人眼視覺特性的立體圖像質(zhì)量客觀評(píng)價(jià)方法 [J].光電工程,2011,38(1):134-141.
[17]陳浩,陳健,葉輕,等.基于相鄰像素差與NRSS的自動(dòng)對(duì)焦算法[J].計(jì)算機(jī)工程,2015,41(9):261-265.
Traffic road sign recognition based on computer vision outline level
ZHAO Duo
(Departments of Information Engineering,Shanxi Vocational and Technical College,Xi'an 710018,China)
For the complexity of problems and instability existing computer vision,traffic signs recognition,through the use of image recognition technology outline presented by the global to the local feature characteristic feature of multi-level structure and then outline recognition,the recognition process of traffic signs the were constructed image density,shape measurement,smoothness and contour entropy four levels of image contours,combined with Sobel operator and traffic signs image information entropy were extracted and processed block.The simulation results show that:in the extraction process of an image,the image with the increasing traffic signs DMOS its value,the worse the image quality,the lower the resolution,the smaller the NRSS value; in the recognition process of the image,the low when the size of the set-pass filter is 7×7,picture NRSS to 0.7654,shape of metric is 1.3 and 2.4,NRSS 0.3712 and 0.2667 respectively.This level of profiling has better robustness in recognition of road signs.
traffic icon;image contours; computer vision; image block; image recognition
TN949.6
:A
:1674-6236(2017)14-0123-04
2016-05-07稿件編號(hào):201605063
趙 鐸(1983—),男,陜西西安人,講師。研究方向:計(jì)算機(jī)領(lǐng)域。