董 春,孫 力,全慶霄
(1.江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無(wú)錫214122;2.江陰蘇陽(yáng)電子股份有限公司 江蘇 江陰214421)
一種改進(jìn)的激光打印圖像預(yù)處理方法
董 春1,孫 力1,全慶霄2
(1.江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無(wú)錫214122;2.江陰蘇陽(yáng)電子股份有限公司 江蘇 江陰214421)
針對(duì)激光打印圖像字符不夠鮮明、噪聲太多的特點(diǎn),提出了一種基于新型組合濾波算法與改進(jìn)的Niblack法結(jié)合的激光打印圖像預(yù)處理方法。傳統(tǒng)的Niblack法,較好地保留了字符特征,但是出現(xiàn)了過(guò)多噪音雜點(diǎn),效果不理想。該方法首先用Niblack法對(duì)圖像二值化,同時(shí)應(yīng)用自適應(yīng)中值濾波模糊噪聲和非噪聲點(diǎn)對(duì)應(yīng)的形態(tài)學(xué)濾波設(shè)計(jì)一種新型組合濾波器,建立恰當(dāng)濾波窗口,保護(hù)更多的圖像細(xì)節(jié),增強(qiáng)圖像邊緣。實(shí)驗(yàn)結(jié)果表明該方法可有效地過(guò)濾激光打印圖像中的噪聲,獲得了較好的二值化圖像,具有一定的實(shí)用價(jià)值。
預(yù)處理;Niblack法;自適應(yīng)中值濾波;形態(tài)學(xué)濾波
印記自動(dòng)識(shí)別系統(tǒng)是集成電路行業(yè)實(shí)現(xiàn)自動(dòng)化生產(chǎn)管理模式的重要環(huán)節(jié)之一。印記是高能激光束汽化塑封料表面形成的標(biāo)記,屬于激光打印圖像。由于印記形成環(huán)境復(fù)雜,以及在采集傳輸過(guò)程中會(huì)受到各種因素的影響,如系統(tǒng)噪聲、光照不均等。這些使激光打印圖像不可避免地受到不同程度的脈沖噪聲污染,嚴(yán)重影響了圖像的質(zhì)量。激光打印圖像預(yù)處理方法的優(yōu)劣直接影響到后期印記的識(shí)別。因此對(duì)激光打印圖像預(yù)處理方法的研究就顯得十分重要。
圖像的預(yù)處理包括圖像灰度化、圖像二值化以及圖像平滑去噪等過(guò)程,而激光打印圖像中含有多種不同程度的噪聲,這使得激光打印圖像的預(yù)處理工作增加了難度。特別是如何確定激光打印圖像二值化的閾值以及噪聲濾波器。近年來(lái),國(guó)內(nèi)外研究者對(duì)圖像預(yù)處理方法做了大量的研究工作,其中包括研究圖像的二值化[1-3]、噪聲濾除[4-6]以及圖像增強(qiáng)[7]等工作,但是仍沒(méi)有人研究出一種適用于激光打印圖像的預(yù)處理方法。
針對(duì)激光打印圖像的特殊性,需要尋找一種特殊的預(yù)處理方法,通過(guò)大量仿真實(shí)驗(yàn)及定量評(píng)價(jià)指標(biāo)對(duì)比,本文提出了一種基于新型組合濾波算法與Niblack法結(jié)合的激光打印圖像預(yù)處理方法。該方法通過(guò)設(shè)計(jì)一種新型組合濾波器與Niblack法相結(jié)合,以有效提高濾波器濾除噪聲和保留圖像細(xì)節(jié)信息的能力,預(yù)處理效果明顯。
到目前為止,還沒(méi)有一種專門針對(duì)激光打印圖像的二值化方法。尋找更好的激光打印圖像二值化方法,仍然是印記識(shí)別研究領(lǐng)域的目標(biāo)之一。二值化方法可分為全局閾值法和局部閾值法[8]。全局閾值法對(duì)于目標(biāo)和背景明顯分離、直方圖分布呈雙峰的圖像效果良好,但對(duì)光照不均勻、噪聲干擾較大的圖像,二值化效果明顯變差。典型的局部閾值法有均值分割法、Bernsen法、Niblack法等。局部閾值法較全局閾值法有更廣泛的應(yīng)用,但缺點(diǎn)也較為明顯,比如速度慢、容易出現(xiàn)偽影現(xiàn)象和筆畫斷裂現(xiàn)象。Niblack法容易產(chǎn)生大量背景噪聲的缺點(diǎn),但對(duì)于低對(duì)比度的印記圖像有更好的適應(yīng)性[9]。3種常用的二值化方法效果如圖1所示。
圖1 3種常用的二值化方法效果圖
激光打印圖像含有大量復(fù)雜的噪聲,通常在二值化之前需要進(jìn)行濾波處理。一般地,常用的濾波方法包括三類[10]:一類是經(jīng)典濾波算法及在此基礎(chǔ)上的改進(jìn)和提升算法,例如中值濾波、自適應(yīng)中值濾波、開關(guān)中值濾波等;另一類是以嚴(yán)密數(shù)學(xué)理論為基礎(chǔ)的濾波算法,如偏微分方程濾波、形態(tài)學(xué)濾波、小波去噪等;第三類是通過(guò)將現(xiàn)有的濾波算法進(jìn)行不同程度的組合,充分發(fā)揮各自的濾波優(yōu)勢(shì),實(shí)現(xiàn)對(duì)噪聲的多級(jí)濾除。針對(duì)激光打印圖像噪聲的降噪問(wèn)題,借鑒組合濾波算法基本思想,嘗試將改進(jìn)的自適應(yīng)中值濾波與形態(tài)學(xué)濾波相結(jié)合實(shí)現(xiàn)對(duì)印記圖像噪聲的逐級(jí)濾除。
自適應(yīng)中值濾波[11]是根據(jù)噪聲密度大小來(lái)確定濾波窗口尺寸,改善了去噪效果,但其細(xì)節(jié)保護(hù)能力較弱,容易造成圖像模糊。形態(tài)學(xué)濾波是一種非線性的濾波運(yùn)算,基本的形態(tài)學(xué)運(yùn)算是開運(yùn)算和閉運(yùn)算,是數(shù)學(xué)形態(tài)學(xué)腐蝕和膨脹基本運(yùn)算的二級(jí)運(yùn)算。因此,可根據(jù)需要選擇不同形式的濾波運(yùn)算來(lái)消除或者抑制噪聲。形態(tài)學(xué)運(yùn)算處理圖像的效果與結(jié)構(gòu)元素形狀、大小的選取有直接關(guān)系,這還需要根據(jù)目標(biāo)圖像的特征具體研究與分析[12]。特別是處理激光打印圖像時(shí),圖像中聚集了大量的噪聲點(diǎn),噪聲點(diǎn)周圍也往往全是噪聲點(diǎn)。這時(shí),對(duì)噪聲點(diǎn)進(jìn)行濾波處理,如果只采用一種濾波算法,濾噪效果不明顯,并且還會(huì)損失印記圖像細(xì)節(jié)。
在實(shí)際環(huán)境下,由于各種客觀原因,如采集時(shí)的光照、機(jī)器、塑封料的模糊等,都使得原始激光打印圖像需要經(jīng)過(guò)一系列的處理才能進(jìn)行下一步的印記識(shí)別。這些處理包括圖像的灰度變換、二值化、去噪、濾波、圖像增強(qiáng)等。文中采用灰度變換、自適應(yīng)中值濾波、二值化和形態(tài)學(xué)方法相結(jié)合的預(yù)處理方法,如圖2所示。由于激光打印圖像的種類較多,不利于圖像處理,因此文中首先將激光打印圖像轉(zhuǎn)換為灰度圖像;然后采用自適應(yīng)中值濾波對(duì)圖像進(jìn)行濾波處理,使圖像明暗更加清晰,減少邊緣模糊;再選用Niblack法對(duì)圖像進(jìn)行二值化處理,使圖像變?yōu)橹挥泻诎锥亩祱D像,把印記特征更加清晰地突顯出來(lái);最后選擇數(shù)學(xué)形態(tài)學(xué)方法對(duì)二值后的圖像進(jìn)一步處理,濾除散落的噪音雜點(diǎn)以及增強(qiáng)圖像邊緣。
圖2 本文預(yù)處理方法流程圖
3.1 極值法噪聲檢測(cè)
經(jīng)過(guò)灰度變換后的激光打印圖像,其對(duì)比度比較低,若直接對(duì)圖像用Niblack法二值化,二值化圖像模糊,印記邊緣不清晰。為了后面能更好地提取圖像特征,這里需要對(duì)灰度化圖像進(jìn)行噪聲濾除工作。首先對(duì)印記圖像進(jìn)行噪聲點(diǎn)檢測(cè),如果中心像素是信號(hào)則保留,如果中心像素為噪聲則需對(duì)圖像進(jìn)行濾波處理。一般印記圖像在顯示時(shí),噪聲點(diǎn)會(huì)隨機(jī)分布地表現(xiàn)為黑色或白色,而且出現(xiàn)的概率相等,其灰度值為極小值或極大值(0或255)。
設(shè)激光打印圖像G尺寸為N×N,其噪聲概率為p0,而g(i,j),f(i,j)分別為原始圖像和噪聲圖像的灰度值函數(shù)[13]。現(xiàn)依據(jù)激光打印圖像噪聲特點(diǎn),選取噪聲圖像的灰度值函數(shù)的數(shù)學(xué)模型為:
其中i,j=1,2,…,N,p(g(i,j))表示當(dāng)像素點(diǎn)(i,j)的灰度值為g(i,j)時(shí),該點(diǎn)受到噪聲污染的概率。
從上述模型明顯可以看出,圖像中共有N2×p0個(gè)噪聲點(diǎn),而且受污染的像素點(diǎn)(i,j)的灰度值f(i,j)與其相鄰像素點(diǎn)的灰度值互不影響。因此,基于這一思想,文中采用極值法檢測(cè)激光打印圖像的噪聲,即若某個(gè)像素點(diǎn)(i,j)的灰度值g(i,j)為0或255,則可認(rèn)為該像素點(diǎn)可能為噪聲,并對(duì)檢測(cè)出的噪聲點(diǎn)進(jìn)行濾除,而非噪聲點(diǎn)直接保留即可。
3.2 自適應(yīng)中值濾波
對(duì)于激光打印圖像高密度噪聲污染而言,噪聲濾除的效果受窗口大小影響,若采用較小鄰域作為濾波窗口,則可能窗口內(nèi)完全不存在非噪聲點(diǎn),還會(huì)將噪聲擴(kuò)散;若將濾波窗口擴(kuò)大,則在濾波窗口內(nèi)部會(huì)引入離中心像素較遠(yuǎn)的非噪聲點(diǎn),從而出現(xiàn)新的誤差,造成濾波圖像模糊不清。為避免上述一些缺陷,通常對(duì)極值法檢測(cè)出的每個(gè)噪聲點(diǎn)建立恰當(dāng)濾波窗口,以便在窗口內(nèi)找到非噪聲點(diǎn)的同時(shí),又不會(huì)引入新的偏差。
為了充分利用濾波窗口濾除噪聲,通過(guò)迭代擴(kuò)大窗口來(lái)選取恰當(dāng)濾波窗口尺寸,直到窗口中包含非噪聲點(diǎn)為止。一般地,在邊心距為1的3×3鄰域內(nèi),極值法檢測(cè)出的噪聲點(diǎn)個(gè)數(shù)為nun(i,j),根據(jù)nun(i,j)的值來(lái)確定濾波窗口大小。濾波窗口的大小K(i,j)根據(jù)nun(i,j)自適應(yīng)地確定,確定規(guī)則如下[14]:
在激光打印圖像G中為了更好的保留圖像細(xì)節(jié),文中采用極值法檢測(cè)噪聲,并對(duì)其建立恰當(dāng)濾波窗口,利用中值濾波思想設(shè)計(jì)了如下濾波器。首先采用極值法檢測(cè)激光打印圖像所受到的噪聲,并且將像素點(diǎn)分為噪聲點(diǎn)和非噪聲點(diǎn)。為了減少其算法的復(fù)雜程度,我們只對(duì)噪聲點(diǎn)進(jìn)行濾除,對(duì)非噪聲點(diǎn)直接保留其灰度值。其次,以每個(gè)噪聲點(diǎn)為中心建立邊心距為1的3×3濾波窗口,并在窗口內(nèi)檢測(cè)周圍的其他像素點(diǎn)中是否還存在非噪聲點(diǎn),若存在,則采用3×3濾波窗口;若不存在,則擴(kuò)大為邊心距為2的5×5濾波窗口,進(jìn)而繼續(xù)去檢測(cè)窗口內(nèi)的非噪聲點(diǎn),反復(fù)進(jìn)行直到找到窗口內(nèi)的所有非噪聲點(diǎn)為止。此時(shí),濾波窗口不再被擴(kuò)大,因此可對(duì)每個(gè)噪聲點(diǎn)創(chuàng)建恰當(dāng)?shù)臑V波窗口。
3.3 Niblack法二值化
下面對(duì)經(jīng)過(guò)自適應(yīng)中值濾波處理后的激光打印圖像,進(jìn)一步應(yīng)用圖像二值化處理技術(shù)將印記的特征與背景信息進(jìn)行分離,提取印記字符的幾何特性,以便后續(xù)進(jìn)行印記字符識(shí)別。為了可以在盡可能多地保留激光打印圖像印記信息的基礎(chǔ)上去除亢余信息,選擇一個(gè)合理的閾值就顯得至關(guān)重要。文中選用對(duì)低對(duì)比度的印記圖像有更好適應(yīng)性的Niblack法進(jìn)行二值化。Niblack法是一種常見且有效的局部閾值算法,它的基本思想是對(duì)圖像中的每一個(gè)點(diǎn),在它的R×R鄰域內(nèi),計(jì)算鄰域中像素點(diǎn)的均值和方差,然后用下面的公式計(jì)算閾值進(jìn)行二值化[15]:
式中:T(x,y)是像素點(diǎn)(x,y)處的閾值;n(x,y)是該點(diǎn)R× R鄰域內(nèi)所有像素點(diǎn)的均值;s(x,y)是該點(diǎn)R×R鄰域內(nèi)所有像素點(diǎn)的標(biāo)準(zhǔn)方差;k為修正系數(shù),確定選取多大的字符目標(biāo)邊界來(lái)作為給定目標(biāo)的一部分。當(dāng)K的取值不斷增大,噪聲幾乎完全消除,但是字符筆畫越來(lái)越細(xì),越來(lái)越模糊不清。
選取適當(dāng)?shù)泥徲虼笮『蚄值對(duì)算法的結(jié)果是至關(guān)重要的。在本文中鄰域的大小是根據(jù)上文自適應(yīng)濾波窗口的大小來(lái)選取,因此本文Niblack法鄰域大小的選取是基于激光打印圖像噪聲點(diǎn)分布情況決定的,也是自適應(yīng)的調(diào)整鄰域大小。而K值的選擇和激光打印圖像本身的灰度值有關(guān)。假設(shè)選取30×30這一固定鄰域的情況下,不同K值的二值化效果如圖3所示。由圖中可以看出:當(dāng)K=0時(shí),圖像有較多噪 值化效果已經(jīng)很好,K值的增加僅僅是使印記字符變細(xì)。因此在本文改進(jìn)的Niblack法中,采用K值為-0.2,保留了字符特征的同時(shí),盡量減少噪聲。
圖3 不同K值的二值化效果圖
3.4 形態(tài)學(xué)濾波
激光打印圖像用上述方法處理后,噪聲不均勻等現(xiàn)象有了很大的改善,如圖4(b)所示,該圖像含有一些干擾點(diǎn)和小區(qū)域,但是卻包含了原始激光打印圖像印記的絕大部分特征,表明改進(jìn)的Niblack法能成功對(duì)圖像二值化,為了改善圖像的視覺(jué)效果,得到清楚的二值化圖像,必須對(duì)圖像進(jìn)一步濾除雜點(diǎn),同時(shí)對(duì)部分?jǐn)嗔训淖址M(jìn)行圖像增強(qiáng),這就需要用到形態(tài)學(xué)濾波方法,它既能有效去除噪聲,又可增強(qiáng)圖像、保留圖像原有的細(xì)節(jié)信息。
由于文中二值化算法是基于Niblack法,根據(jù)Niblack法的特點(diǎn),二值化的圖像不僅存在散落的噪音雜點(diǎn)而且還會(huì)有部分印記字符斷裂。因此,還需對(duì)處理后的激光打印圖像進(jìn)行形態(tài)學(xué)運(yùn)算。形態(tài)學(xué)運(yùn)算是物體形狀集合與結(jié)構(gòu)元素之間的相互作用,能抑制噪聲和增強(qiáng)圖像。圖像增強(qiáng)是在原始圖像上增強(qiáng)圖像中的有用信息,將原來(lái)不清晰、斷裂的圖像變得清晰或者加強(qiáng)某些特征,擴(kuò)大圖像中不同物體特征之間的差別,從而改善圖像質(zhì)量、豐富圖像的信息量,加強(qiáng)圖像的識(shí)別效果。
文中形態(tài)學(xué)運(yùn)算包括開運(yùn)算和閉運(yùn)算,開運(yùn)算是用結(jié)構(gòu)元素B先對(duì)待處理的圖像A進(jìn)行腐蝕,然后進(jìn)行膨脹;閉運(yùn)算是用結(jié)構(gòu)元素B先對(duì)待處理的圖像A進(jìn)行膨脹,然后進(jìn)行腐蝕。如圖4所示,圖4(b)是待處理的圖像A,B選用十字型3×3結(jié)構(gòu)元素,首先用B對(duì)A先進(jìn)行開運(yùn)算,清除背景中得小結(jié)構(gòu),濾除孤立的噪聲雜點(diǎn);然后用B對(duì)A進(jìn)行閉運(yùn)算,實(shí)現(xiàn)對(duì)背景中不包含結(jié)構(gòu)元素的部分填充,連接斷裂的字符。圖4(a)是最大灰度值為255的源圖像。圖4(b)為經(jīng)過(guò)自適應(yīng)中值濾波后又用Niblack法二值化得到的圖像,圖4(c)為圖4(b)經(jīng)過(guò)形態(tài)學(xué)運(yùn)算后的圖像。
為了證實(shí)該預(yù)處理方法的有效性,隨機(jī)采集了3張不同的印記圖像,他們的亮度、對(duì)比度、噪聲程度等各不相同。本文預(yù)處理方法效果如圖5所示:克服了激光打印圖像容易受到噪聲污染,對(duì)比度低的缺點(diǎn),沒(méi)有出現(xiàn)印記字符斷裂和大量聚集噪音現(xiàn)象,預(yù)處理效果理想,為后續(xù)的印記分割、識(shí)別等工作做好了充分的準(zhǔn)備。
另外,文中采集了300張激光打印圖像,將每100張隨機(jī)作為一個(gè)實(shí)驗(yàn)樣本,經(jīng)過(guò)文中預(yù)處理方法處理后,統(tǒng)計(jì)分析其預(yù)處理效果,統(tǒng)計(jì)結(jié)果如表1所示。表1數(shù)據(jù)客觀地表明了文中預(yù)處理方法有很好的預(yù)處理性能,3個(gè)實(shí)驗(yàn)樣本預(yù)處理質(zhì)量均達(dá)到92%以上,其中預(yù)處理結(jié)果圖包含了原始印記圖像的絕大部分信息,噪聲濾除明顯,細(xì)節(jié)保留豐富,預(yù)處理效果好,用時(shí)少。
圖4 預(yù)處理過(guò)程中產(chǎn)生的圖像
圖5 本文預(yù)處理方法效果對(duì)比
表1 預(yù)處理結(jié)果統(tǒng)計(jì)表
文中在自適應(yīng)中值濾波的原理及算法的基礎(chǔ)上再結(jié)合形態(tài)學(xué),得到一種基于新型組合濾波算法與改進(jìn)的Niblack法結(jié)合的激光打印圖像預(yù)處理方法,該預(yù)處理方法有效克服了激光打印圖像質(zhì)量差的缺點(diǎn),改進(jìn)的Niblack法二值化效果要優(yōu)于Otsu等常用的二值化方法,優(yōu)化了二值化過(guò)程,減少了算法的計(jì)算量,成功實(shí)現(xiàn)了激光打印圖像的二值化效果,而且預(yù)處理后的圖像噪聲濾除明顯,印記細(xì)節(jié)信息保留豐富。在同類的集成電路封裝產(chǎn)品印記識(shí)別領(lǐng)域都有一定的應(yīng)用價(jià)值。實(shí)驗(yàn)結(jié)果表明,該方法在實(shí)際應(yīng)用中對(duì)印記自動(dòng)識(shí)別率是有用的,且優(yōu)于傳統(tǒng)預(yù)處理方法。
[1]童立靖,張艷,舒巍.幾種文本圖像二值化方法的對(duì)比分析[J].北方工業(yè)大學(xué)學(xué)報(bào),2011(1):25-33.
[2]申森,李艾華,姚良,等.基于小波包和Niblack法的槍號(hào)圖像二值化算法[J].光子學(xué)報(bào),2013,42(3):354-358.
[3]孫少林,馬志強(qiáng),湯偉.灰度圖像二值化算法研究[J].價(jià)值工程,2010,29(5):142-143.
[4]劉國(guó)宏,郭文明.改進(jìn)的中值濾波去噪算法應(yīng)用分析[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(10):187-189.
[5]Zhu Youlian,Huang Cheng.An improved median filtering algorithm for image noise reduction [J].Physics Procedia,2012,25:609-616.
[6]張成斌,王開福.基于形態(tài)開閉算子的高濃度椒鹽噪聲去除方法[J].計(jì)算機(jī)工程,2015,41(2):199-202.
[7]段先知,丁亞軍,錢盛友,等.改進(jìn)型快速ICA算法與數(shù)學(xué)形態(tài)學(xué)結(jié)合的圖像分割方法[J].微電子學(xué)與計(jì)算機(jī),2015,32(2):80-84.
[8]章毓晉.圖像工程(上冊(cè))-圖像處理[M].2版.北京:清華大學(xué)出版社,2006.
[9]Niblack W.An Introduction to Image Processing[M]. Prentice-Hall,Inc,1986:115-116.
[10]姚宏.一種基于椒鹽噪聲新型組合濾波算法仿真研究[J].電視技術(shù),2015,38(1):39-42.
[11]孫海英,李鋒,商慧亮.改進(jìn)的變分自適應(yīng)中值濾波算法[J].電子與信息學(xué)報(bào),2011,33(7):1743-1747.
[12]Soille P.形態(tài)學(xué)圖像分析原理與應(yīng)用[M].2版.王小鵬,譯.北京:清華大學(xué)出版社,2008.
[13]王貴君,楊永強(qiáng).基于高概率椒鹽噪聲的模糊濾波器在圖像恢復(fù)中的算法設(shè)計(jì)[J].電子學(xué)報(bào),2015(1):24-29.
[14]段群,吳粉俠,劉小豫.基于CUDA的椒鹽噪聲自適應(yīng)中值濾波算法[J].航空計(jì)算技術(shù),2013,43(2):60-63.
[15]卜飛宇.一種改進(jìn)的文本圖像二值化方法[J].電腦知識(shí)與技術(shù),2014,10(12):2822-2824.
An improved preprocessing method of laser printing image
DONG Chun1,SUN Li1,QUAN Qing-xiao2
(1.School of Internet of Things,Jiangnan University,Wuxi 214122,China;2.Jiangyin Sunny Crient Technology Co,Ltd,Jiangyin 214421,China)
Aiming at the characteristics of the laser printing image that characters are not bright enough and too much noise,a preprocessing method based on combination of the new combination filtering and the improved niblack algorithm is proposed. Traditional Niblack algorithm can be better to retain the characteristics of the characters,but appear too noisy miscellaneous points,the used result is not satisfactory.This method can establish appropriate filtering window,protect more image details,and enhance image edges,that the image is binarized for by Niblack algorithm,and designed a new type of composite filter by combining with the adaptive median filtering to fuzzy noise and the morphological filtering for the non noise points.The experimental results demonstate that this method can effectively filter the noise in the laser printing image,obtain the better binary image,and it has a certain practical value.
preprocessing;Niblack algorithm;the adaptive median filtering;the Morphological filtering
TN249
A
1674-6236(2016)24-0176-04
2016-01-11 稿件編號(hào):201601066
董 春(1990—),女,山東肥城人,碩士研究生。研究方向:圖像識(shí)別技術(shù)。