摘要:針對文本圖像中字符圖像分割問題,該文介紹了一種基于局部閾值分割的LLT算法,給出了相應(yīng)的數(shù)學(xué)模型,然后進(jìn)一步分析了算法的關(guān)鍵參數(shù)設(shè)置,并給出了相應(yīng)的改進(jìn)方法。實驗結(jié)果證明,該文方法不僅可以有效的降低背景噪聲的影響,還對具有不同字符寬度的文本圖像分割具有很強的適應(yīng)性。
關(guān)鍵詞:字符圖像;二值化;圖像分割
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2013)04-0844-02
An Improved Segmentation Method for Character Images
SUN Yang-guang
(College of Computer Science,South-Central University for Nationalities, Wuhan 430074, China)
Abstract: For characters segmentation problem in document images, this paper introduces the LLT algorithm based on local threshold and its mathematical model. By further analyzing the key parameters setting, an improved segmentation method for character images was proposed in this paper. Experimental results demonstrated the improved method not only decreases the influence of noise, but has the feasibility for document images with different character widths.
Key words:character image; binaryzation; image segmentation
圖像分割問題是圖像處理領(lǐng)域的關(guān)鍵問題之一,該問題也一直都受到相關(guān)領(lǐng)域?qū)<业纳钊胙芯俊=陙?,隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,文本字符圖像的分割問題受到了人們的廣泛關(guān)注。目前,已有多種圖像分割算法被提出去解決相關(guān)應(yīng)用問題,其中閾值分割法因其簡單高效的特點在不同的領(lǐng)域有著廣泛的應(yīng)用[1]。此類算法中閾值的選取至關(guān)重要,它直接決定了圖像分割的最終結(jié)果,因此如何獲取一個最為合適的閾值是此類方法應(yīng)用的關(guān)鍵點和難點。
根據(jù)閾值作用范圍的不同,閾值分割法可分為全局閾值分割法、局部閾值分割法和自適應(yīng)閾值分割法[2]。針對文本圖像中字符圖像分割問題,該文介紹了一種基于局部閾值分割的LLT算法,給出了相應(yīng)的數(shù)學(xué)模型,然后進(jìn)一步分析了算法的關(guān)鍵參數(shù)的設(shè)置,并給出了相應(yīng)的改進(jìn)算法。該文方法不僅可以有效的降低背景噪聲的影響,還對具有不同字符寬度的文本圖像分割具有很強的適應(yīng)性。
1 LLT算法
由于受光照條件影響和圖像保存的問題,實際圖像往往存在大量的噪聲、斑點和陰影。這不僅降低了目標(biāo)和背景的對比度,造成了圖像具有不同程度的復(fù)雜背景,也使得采用統(tǒng)一的單閾值進(jìn)行圖像分割勢將不能得到滿意的結(jié)果。因此,需要根據(jù)圖像中各局部的灰度分布情況,采用適合的閾值來進(jìn)行分割。
Logical Level Technique (LLT)算法作為一種局部閾值算法是通過在局部區(qū)域中通過設(shè)定的閾值來實現(xiàn)目標(biāo)圖像的分割[3]。通常對于同一幅文本圖像來說,其字符圖像往往具有相對固定在一定范圍內(nèi)變化的筆劃寬度。進(jìn)而以該字符圖像中筆劃的寬度來設(shè)置待處理的窗口大小,這樣既可以去除大塊的背景區(qū)域,同時也降低了噪聲對分割結(jié)果的影響。因此,對于復(fù)雜背景下字符筆劃寬度均勻一致的字符圖像分割,該算法取得了較好的應(yīng)用。
若筆劃寬度范圍的為[[0,w]],則局部窗口大小為[(2w+1)×(2w+1)]。對于圖像中一點[(x,y)]來說,[f(x,y)]為該點的灰度值。設(shè)P為局部窗口的中心點,其坐標(biāo)和灰度值分別為[(xP,yP)]和[g(x,y)],相鄰的八個鄰近像素分別為[Pi(i=0,1,2,…,7)],則其平均像素灰度值為:
[AVE(P)=-w≤i≤w-w≤j≤wf(xP-i,yP-j)(2w+1)2] (1)
LLT算法通過將局部區(qū)域的中心像素[P]與周圍八個鄰近像素的灰度平均值[AVE(P)]相比較,然后通過邏輯判斷值[b(x,y)]來確定該像素是否為字符圖像中的像素,即:
[L(P)=1,AVE(P)-g(x,y)>T0,AVE(P)-g(x,y)≤T] (2)
[b(x,y)=1,ifi=03[Pi)?L(P'i)?L(Pi+1)?L(P'i+1)?]istrue0,otherwise] (3)
其中,[P'i=P(i+4)mod8,(i=0,1,2,…,7)],[T]是預(yù)先給定的閾值。
2 改進(jìn)的LLT算法
由上述LLT算法可知,若當(dāng)前局部窗口的灰度平均值較低,則當(dāng)前局部窗口往往為低對比度區(qū)域。在該區(qū)域內(nèi)目標(biāo)和背景像素間的灰度差值比較低,這也表明該像素的局部閾值[T]在低對比度區(qū)域應(yīng)是一個較低的值。因此,我們可利用當(dāng)前局部窗口內(nèi)的像素最大值、最小值和局部均值來自適應(yīng)確定局部閾值。
設(shè)[fmax]和[fmin]分別為當(dāng)前像素局部窗口內(nèi)的最大和最小灰度值。[AVE(P)]是當(dāng)前窗口的局部灰度平均值,[T]是當(dāng)前取樣像素點的局部閾值,[α]是修正參數(shù)。這里,令[fAVEmax=|fmax-AVE(P)|]和[fAVEmin=|fmin-AVE(P)|],則:
[T=fmin+AVE(P)2?α,fAVEmax>fAVEminAVE(P)?α,fAVEmax=fAVEminAVE(P)+fmax2?α,fAVEmax 上式說明當(dāng)局部灰度均值靠近局部窗口最小值和最大值時,閾值就選取最小值和最大值分別與均值之間的中值。通過上述運算,可以確定當(dāng)前像素點的閾值[T],然后再根據(jù)LLT算法中字符像素判定方法,進(jìn)一步由式(2)和式(3)判定當(dāng)前像素點是否為字符像素。因此,這樣就可通過利用當(dāng)前像素和局部窗口內(nèi)多個灰度信息自適應(yīng)的獲得局部閾值。 如果在式(4)中沒有修正參數(shù)[α],不難看出當(dāng)像素點的灰度值和局部窗口的灰度平均值都很高時,局部閾值[T]本應(yīng)該是一個很低的值,但是在這種情況下,將會得到一個較高的局部閾值,這時獲得的閾值[T]是一個不合理的閾值。而若當(dāng)前像素點的灰度值和局部窗口的灰度平均值都比較低時,修正參數(shù)太小將會使算法得到一個更小的局部閾值,這樣的局部閾值并不能有效的分割出字符圖像。因此,通過設(shè)置動態(tài)參數(shù)[α]來對局部閾值[T]進(jìn)行修整,修正參數(shù)可依經(jīng)驗設(shè)定,一般情況下,其取值范圍是0.1到1之間。當(dāng)圖像的灰度值的變化范圍在[0,255]之間時,該文依據(jù)文本圖像特點做如下設(shè)定: [α=1ifAVE<850.4if85≤AVE≤1700.2ifAVE>170] (5) 這里通過把圖像灰度變化范圍等分,使得當(dāng)前像素點局部窗口的灰度平均值在不同的灰度變化范圍時,修正參數(shù)的值也隨著變化,從而獲得更適合的閾值。因此,修正參數(shù)的使用,可以減少上述沒有使用修正參數(shù)時對計算局部窗口閾值的影響,使得所獲得的局部閾值能夠適應(yīng)不同的具有復(fù)雜背景的字符圖像。 3 實驗結(jié)果與分析 本文將采用如圖1(a)所示具有不同字符筆劃寬度的文本圖像進(jìn)行實驗。實驗所用的文本圖像大小為660×612,字符寬度w設(shè)定為15。圖1(b)和(c)分別給出了運用LLT算法和本文算法所獲得實驗結(jié)果。從實驗結(jié)果可以看出,對于具有不同字符筆劃寬度的文本圖像,LLT算法可以將文本圖像中的字符圖像分割出來,但分割圖像中存在大量的噪聲點,影響字符圖像的分割效果。而本文的改進(jìn)算法則較好地分割出字符圖像,不僅準(zhǔn)確地分割出字符圖像,而且對噪聲點有很強的抑制作用,獲得了較好的字符分割效果。 4 結(jié)論 針對文本圖像中字符圖像分割問題,該文介紹了一種基于局部閾值分割的LLT算法,給出了相應(yīng)的數(shù)學(xué)模型,然后進(jìn)一步分析了算法的關(guān)鍵參數(shù)的設(shè)置,并給出了相應(yīng)的改進(jìn)方法。該文方法不僅可以有效的降低背景噪聲的影響,還對具有不同字符寬度的文本圖像分割具有很強的適應(yīng)性,對文本字符圖像分割具有一定的參考價值。 參考文獻(xiàn): [1] 章晉毓.圖象分割[M].北京: 科學(xué)出版社,2001. [2] 周鮮成.圖像分割方法及其應(yīng)用研究綜述[J].信息技術(shù), 2007, 12:11-14. [3] 胡建明,吳立德.一種改進(jìn)的文字/圖形圖像的快速分割算法[J].模式識別與人工智能, 2001,14(2): 201-205.