洪漢玉,王 澍,朱 浩,俞喆俊
(武漢工程大學(xué)圖像處理與智能控制實(shí)驗(yàn)室,湖北 武漢 430205)
鋼鐵行業(yè)的智能化發(fā)展日新月異.由于傳統(tǒng)的噴印型字符(見圖1(a))在運(yùn)輸與存放過程中容易因外界原因?qū)е聯(lián)p毀,造成字符識(shí)別工作中出現(xiàn)非算法原因的檢測錯(cuò)誤,嚴(yán)重影響了實(shí)際檢測的穩(wěn)定性,于是嵌入型鋼坯字符被提出運(yùn)用到實(shí)際生產(chǎn)中去.嵌入型鋼坯字符(見圖1(b))在鋼坯出爐階段由機(jī)器打印嵌入鋼坯母體,能夠長時(shí)間穩(wěn)定地保持字符特征,對(duì)鋼坯生產(chǎn)線的智能管理有著長遠(yuǎn)的意義.在新型生產(chǎn)線上,已實(shí)現(xiàn)對(duì)鋼坯端面的精準(zhǔn)定位,將圖像鎖定在端面范圍內(nèi),工作的重點(diǎn)是對(duì)鋼坯端面上字符信息的提取.由于嵌入型鋼坯字符區(qū)域?qū)Ρ榷群艿?,灰度值與端面背景基本一致,使得傳統(tǒng)的遞歸分割方法無法完成其字符信息的提取工作,因此對(duì)字符邊緣輪廓信息的提取是解決問題唯一的途徑.輪廓提取工作的主要困難是由嵌入型鋼坯號(hào)邊緣本身較低的對(duì)比度、打印時(shí)形成的無效邊緣及鋼坯端面過多的背景噪聲帶來.用于邊緣信息檢測的經(jīng)典方法有:Marr 和 Hildreth提出的LoG算子[1-3],John Canny提出的Canny算子[4]等.上述方法是基于實(shí)際邊緣的邊緣檢測算法,對(duì)有特定提取要求的圖像有很大的局限性,運(yùn)用于嵌入型鋼坯號(hào)輪廓提取的結(jié)果很不理想.
針對(duì)上述問題,利用基于輪廓測度的LoG算子獲得閉合的字符輪廓信息,將閉合區(qū)域填充后對(duì)提取出的候選區(qū)域建立定量篩選模型,根據(jù)字符與非字符區(qū)域形態(tài)學(xué)特征上的差異提取出目標(biāo)字符區(qū)域.研究結(jié)果表明,基于輪廓測度的LoG算子有著很好的穩(wěn)定性和準(zhǔn)確性,解決了低對(duì)比度條件下嵌入型鋼坯字符提取的關(guān)鍵技術(shù)問題.
圖1 噴印鋼坯字符與嵌入型鋼坯字符Fig.1 Printed billet characters and embedded billet characters
高斯型拉普拉斯算子(Laplacian of Gaussian)主要利用圖像二階導(dǎo)數(shù)的零交叉點(diǎn)來獲取圖像邊緣,檢測到的邊緣強(qiáng)度較好,但對(duì)有特定提取要求的圖像有較大的局限性.鋼坯字符主要由阿拉伯?dāng)?shù)字與英文字母組成,其信息主要分布在水平、豎直和傾斜的幾個(gè)大方向,對(duì)此提出了基于輪廓測度的LoG算子.
LoG算子的主要原理是把拉普拉斯算子與高斯平滑[5]濾波器結(jié)合起來進(jìn)行邊緣檢測.首先對(duì)圖像進(jìn)行高斯平滑濾波,再對(duì)濾波過后的圖像求二階導(dǎo)數(shù)的零交叉點(diǎn)來確定圖像的邊緣.二維高斯函數(shù)和它的二階偏導(dǎo)如式(1)所示:
輪廓的測度主要體現(xiàn)在圖像與濾波器作卷積的模版選取上.根據(jù)公式(4)對(duì)原圖f(x,y)取水平與豎直,傾斜45°與傾斜135°的卷積模版分別與h1(x)h2(y)+h2(x)h1(y)作卷積:
其中,i的取值為1與2兩個(gè)數(shù),則有:
圖2(a)為在方向D上一個(gè)理想的邊緣狀況的示意圖,在邊界點(diǎn)灰度值從a躍升到b.通過LoG算子進(jìn)行卷積處理后,求取到圖像的二階導(dǎo)數(shù),邊緣情況如圖2(b)所示.圖像邊緣情況表現(xiàn)為零交叉點(diǎn):低灰度值部分h(x,y)>0,高灰度值h(x,y)<0,相素的值分布在0上下較小的范圍內(nèi).
圖2 基于LoG算子的邊緣響應(yīng)示意圖Fig.2 Response of edges to LoG masks
基本的零交叉點(diǎn)檢測方法為如相鄰2個(gè)相素點(diǎn)的符號(hào)異同或者如當(dāng)前點(diǎn)像素值為0,并在其四領(lǐng)域中有兩個(gè)像素符號(hào)相反,則定義像素值絕對(duì)值最小的點(diǎn)為邊緣.本文采用基于Predicate的3×3鄰域謂詞模版[6],將其與定義好的4種中不同情形的模版相比較,如果匹配就在正確的相素位置上確定邊緣.
在對(duì)卷積圖像中零交叉點(diǎn)的檢測即是邊緣檢測.因此,通過以上的處理可獲得鋼坯字符的邊緣輪廓信息.目標(biāo)區(qū)域基本信息的完好表達(dá)與對(duì)背景噪聲的有效抑制是邊緣提取的基本要求.
通過對(duì)零交叉點(diǎn)的檢測,獲得閉合的邊界輪廓.通過極點(diǎn)判別法[7]對(duì)閉合的輪廓區(qū)域進(jìn)行填充,基本原理是經(jīng)輪廓跟蹤得到輪廓點(diǎn),利用輪廓點(diǎn)與其前后鄰點(diǎn)的位置關(guān)系將輪廓分為極點(diǎn)和非極點(diǎn),再對(duì)掃描線上的非極點(diǎn)進(jìn)行兩兩配對(duì)和填充.
由于端面圖像定位的關(guān)系,有時(shí)檢測出的圖像中會(huì)出現(xiàn)端面的邊界,并且鋼坯字符在打印時(shí)會(huì)形成一些無效的邊緣.所以待處理的噪聲主要可分為端面的邊界、端面上的離散噪聲和無效邊緣.按照文獻(xiàn)[8]中基于聯(lián)通域算法的區(qū)域測量思想,根據(jù)填充后噪聲區(qū)域與字符區(qū)域形態(tài)學(xué)特征上的區(qū)別提出了適用的去噪方法,基本原理如公式(6)所示:
其中C[k]為當(dāng)前聯(lián)通域的長寬比,L[k]為聯(lián)通域長度,W[k]為聯(lián)通域?qū)挾?,n[k]為聯(lián)通域中相素個(gè)數(shù).當(dāng)C[k]滿足給定條件時(shí),計(jì)算此聯(lián)通域的相素比重Ar[k],將Ar[k]與設(shè)定的閾值作比較,判斷其是否為噪聲,從而提取目標(biāo)字符區(qū)域.
通過上述步驟得到基本的字符信息后,通過基于智能多代理的字符切分處理方法[9]對(duì)字符進(jìn)行切分,然后通過形態(tài)學(xué)處理將切分后的字符變?yōu)闃?biāo)準(zhǔn)字符.根據(jù)標(biāo)準(zhǔn)字符模版的對(duì)應(yīng)信息即可獲得圖像中的字符信息.字符標(biāo)準(zhǔn)化的主要步驟為:1)從輸入的字符中心處將其等分為四分,取每部分的形心為基準(zhǔn)往周圍上下左右四個(gè)方向投影.2)根據(jù)投影的情況結(jié)合字符形態(tài)學(xué)規(guī)律進(jìn)行判斷,得到標(biāo)準(zhǔn)化字符.最后根據(jù)標(biāo)準(zhǔn)化字符對(duì)應(yīng)的數(shù)字模版完成識(shí)別工作[10].
上述算法在計(jì)算機(jī)(3.09GHz,3.2GB)上使用VC+ +6.0編程,利用灰度CCD相機(jī)(相機(jī)型號(hào):MVC900DAM-GE30-01Y23)采集圖像.為驗(yàn)證算法的性能進(jìn)行了噴印型鋼坯字符與嵌入型鋼坯字符的分割對(duì)比、嵌入型鋼坯字符的輪廓提取、目標(biāo)區(qū)域提取等實(shí)驗(yàn),并對(duì)算法的性能進(jìn)行了測試與分析.
實(shí)驗(yàn)一:字符分割對(duì)比試驗(yàn).在傳統(tǒng)的噴印型鋼坯字符檢測上,采用的是局部遞歸分割算法[11].圖3(a)為端面背景較為復(fù)雜的噴印型鋼坯字符,通過多級(jí)分割濾波處理鋼坯字符被完整的表達(dá)出來,結(jié)果如圖3(e)所示.圖4(a)為嵌入型鋼坯字符,從其遞歸分割的主要過程可以觀察到鋼坯字符區(qū)域始終沒有被有效地分割出來.實(shí)驗(yàn)結(jié)果表明此方法并不適用于嵌入型鋼坯號(hào).
實(shí)驗(yàn)二:字符輪廓信息的提取.圖5(a)是分辨率為1248×832的鋼坯端面灰度圖像,對(duì)其運(yùn)用Canny算子、LoG 算子、DoG 算子[12-13]及提出的方法進(jìn)行嵌入型鋼坯號(hào)輪廓提取實(shí)驗(yàn).圖5(b)為運(yùn)用了Canny算子對(duì)原圖進(jìn)行輪廓提取的結(jié)果,可以觀察到該算子對(duì)噪聲敏感度較高,信噪?yún)^(qū)分度過小.圖5(c)為運(yùn)用LoG算子進(jìn)行處理的結(jié)果,從圖5(c)中可以發(fā)現(xiàn)高斯平滑對(duì)噪聲具有較好的抑制效果,但同時(shí)也削弱了字符邊緣信息,關(guān)鍵區(qū)域的輪廓信息缺失嚴(yán)重.圖5(d)為使用DoG算子對(duì)原圖處理的結(jié)果,DoG算子的主要原理是對(duì)圖像求取兩個(gè)高斯函數(shù)的差值,從圖5中可以觀察到雖然字符邊緣輪廓信息提取得較好,但不能有效地將字符輪廓與噪聲邊緣分離.圖5(e)中運(yùn)用的是本文提出的基于輪廓測度的輪廓提取方法,可以觀察到字符輪廓的信息表達(dá)基本完整,與噪聲區(qū)分度大,能夠滿足后續(xù)對(duì)字符提取工作的要求.
圖3 噴印型鋼坯號(hào)遞歸分割示意圖Fig.3 Recursive segmentations of printed billet characters
圖4 嵌入型鋼坯號(hào)遞歸分割示意圖Fig.4 Recursive segmentations of embedded billet characters
圖5 輪廓提取比較Fig.5 Comparison of edge detection methods
實(shí)驗(yàn)三:區(qū)域填充與目標(biāo)提取.如圖5(d)所示,因?yàn)楦倪M(jìn)的LoG算子提取出的字符輪廓區(qū)域?yàn)殚]合輪廓區(qū)域,所以在此基礎(chǔ)上可對(duì)其進(jìn)行區(qū)域填充,圖6(a)為填充的結(jié)果.根據(jù)公式(6)計(jì)算每個(gè)聯(lián)通域的長、寬、長寬比、面積與面積比重,通過設(shè)定的對(duì)應(yīng)閾值將單個(gè)分離的噪聲聯(lián)通域消除,保留字符聯(lián)通域.圖6(b)為字符提取結(jié)果.表1為對(duì)待處理的聯(lián)通域的分類與形態(tài)學(xué)特征的統(tǒng)計(jì)與分析,通過對(duì)離散噪聲、端面邊緣、無效字符邊緣及目標(biāo)字符邊緣區(qū)域的數(shù)據(jù)分析:字符區(qū)域的提取閾值 C[k]應(yīng)取 0.15/3.0 或者5/7.5;Ar[k]應(yīng)取0.15/0.3或者0.5/0.8.
圖6 區(qū)域填充與去噪Fig.6 Region filling and extraction results
表1 聯(lián)通域域特征分析Table 1 Analysis of connected domain
實(shí)驗(yàn)四:字符的切分與標(biāo)準(zhǔn)化處理.得到基本的字符信息后,首先要對(duì)其進(jìn)行分割與切分獲取單個(gè)字符,其次分別對(duì)單個(gè)字符進(jìn)行標(biāo)準(zhǔn)化處理,最后對(duì)照標(biāo)準(zhǔn)化字符的模版完成識(shí)別工作.圖7(a)為字符的切分結(jié)果與標(biāo)準(zhǔn)化的效果,圖7(b)為軟件的識(shí)別結(jié)果.
實(shí)驗(yàn)五:算法性能測試.圖8(a)為試驗(yàn)中所采用的嵌入型鋼坯端面圖像;圖8(b)為運(yùn)用本文方法提取的結(jié)果.表2為對(duì)相機(jī)采集的隨機(jī)100張圖像進(jìn)行識(shí)別測試的結(jié)果.通過測試可知,在實(shí)際運(yùn)行中算法表現(xiàn)優(yōu)異,魯棒性強(qiáng),運(yùn)行時(shí)間能夠滿足實(shí)際工程需要(鋼坯生產(chǎn)線上的實(shí)際檢測周期為10s).
圖7 字符的標(biāo)準(zhǔn)化與識(shí)別Fig.7 Billet character extraction
圖8 典型的嵌入型鋼坯字符圖像的檢測結(jié)果Fig.8 Detection results of some typical images
表2 字符識(shí)別率測試Table 2 Character recognition test
以上針對(duì)嵌入型鋼坯字符對(duì)比度很低、邊緣干擾信息強(qiáng)的特點(diǎn),將基于輪廓測度的LoG算子運(yùn)用于嵌入型鋼坯字符圖像的輪廓信息檢測中.結(jié)合區(qū)域填充算法并通過區(qū)分度高的形態(tài)學(xué)特征進(jìn)行了字符信息的提取.實(shí)驗(yàn)結(jié)果表明,本文檢測方法識(shí)別效率高、參數(shù)較少、抗噪聲邊緣干擾性強(qiáng),可以準(zhǔn)確的提取出圖像中的字符信息,且對(duì)鏡頭焦距長短和傾斜角度要求較小.檢測結(jié)果保留了原有的字符特征,并擁有字符各自的位置和形態(tài)特性,解決了將嵌入型鋼坯字符應(yīng)用于實(shí)際生產(chǎn)線的關(guān)鍵技術(shù)難點(diǎn).
[1]Ulupinar,F(xiàn)aith.Refining edges detected by a LoG operator[J].Computer Vision Graphics Image Process,1990,51(3):275-298.
[2]Oie,Takhiro.Adaptive Laplacian-Gaussian filter method for edge detection and diameter estimation of coronary arteries on cineangiograms:Applications to phantom profiles[J].Stems and Computers in Japan,1992,23(12):55-65.
[3]賀強(qiáng),晏立.基于LOG和Canny算子的邊緣檢測算法[J].計(jì)算機(jī)工程,2011,37(3):210-212.
[4]Accame,Marco.Edge detection by point classification of Canny filtered images [J]. Signal Processing,1997,60(1):11-22.
[5]張?zhí)煨?成像自動(dòng)目標(biāo)識(shí)別[M].武漢:湖北科學(xué)技術(shù)出版社,2005.
[6]Andres Huertas,Gerard Medioni.Detection of intensity changes with subpixel accuracy using Laplacian-Gaussian Masks[J].IEEE Transaction Pattern Analysis and Machine Intelligence,1986,8(5):644-651.
[7]吳章文,楊代倫.區(qū)域填充極點(diǎn)判別算法[J].計(jì)算及輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(8):979-983.
[8]李儀芳,劉景琳.基于連通域算法的區(qū)域測量 [J].科學(xué)技術(shù)與工程,2008,9(8):2492-2494.
[9]洪漢玉,楊義軍.基于智能多代理的復(fù)雜場景鋼坯字符切分算法[J].光電工程,2012,39(5):91-100.
[10]楊義軍,洪漢玉,章秀華,等.重軌生產(chǎn)線鋼坯字符識(shí)別方法 [J].武漢工程大學(xué)學(xué)報(bào),2012,34(5):64-67.
[11]洪漢玉,俞喆俊,章秀華.復(fù)雜光照條件下鋼坯字符檢測方法[J].武漢工程大學(xué)學(xué)報(bào),2012,34(6):65-68.
[12]洪漢玉.現(xiàn)代圖像圖形處理與分析[M].武漢:中國地質(zhì)大學(xué)出版社,2011.
[13]VanVliet,LucasJ.Edge localization by MoG filters:multiple-of-Gaussians[J].Pattern Recognition Letters,1994,15(5):485-496.