国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于漢字連通分量的印刷圖像版面分割方法

2015-04-11 14:05:30付蘆靜錢軍浩鐘云飛
關(guān)鍵詞:印刷分量漢字

付蘆靜,錢軍浩,鐘云飛

1 引言

文字具有較強(qiáng)的指示性同時(shí)也包含重要的語意信息,如書刊封面文字、報(bào)紙文字、產(chǎn)品包裝上的文字等等,這些文字對(duì)于包裝產(chǎn)品消費(fèi)者以及書刊、報(bào)紙閱讀者具有重要價(jià)值,如果存在文字印刷質(zhì)量缺陷,將對(duì)書刊、報(bào)紙以及包裝產(chǎn)品帶來不可估量的損失。然而,傳統(tǒng)印刷質(zhì)量檢測(cè)以色差作為最主要的檢測(cè)標(biāo)準(zhǔn),并沒有單獨(dú)對(duì)文字印刷質(zhì)量進(jìn)行檢測(cè)。而在印刷生產(chǎn)過程中,文字經(jīng)常出現(xiàn)筆畫殘缺、白點(diǎn)、斷筆、邊緣不清等缺陷,而色差標(biāo)準(zhǔn)并不能檢測(cè)出這些缺陷。因此,通過版面分割提取印刷圖像中的文字并對(duì)文字進(jìn)行印刷缺陷檢測(cè),對(duì)于提高和完善文字印刷質(zhì)量檢測(cè)以及實(shí)現(xiàn)印刷質(zhì)量在線檢測(cè)具有理論意義和實(shí)用價(jià)值。

文字定位方法可以分為基于紋理和基于區(qū)域兩大類。基于紋理[1-3]的方法將圖像中的文字視為一種特殊的紋理,利用Gabor濾波器、Adaboost分類器和小波等紋理分析工具實(shí)現(xiàn)文字定位,它受噪聲的干擾波動(dòng)小,具有較好的魯棒性。但是算法所需的定位時(shí)間長(zhǎng),對(duì)于大字符和文本較少的區(qū)域定位精度不高?;趨^(qū)域的方法又可以分為基于連通域[4-6]和基于邊緣[7]兩種?;谶B通域的方法是假設(shè)文字在同一區(qū)域內(nèi)的顏色和亮度相似,且與背景顏色差較大,通過分析、提取文字的連通分量實(shí)現(xiàn)文本定位,算法的定位精度優(yōu)于紋理方法。但是連通域方法容易將單個(gè)字符分割成多個(gè)連通分量,尤其是中文字符需要根據(jù)連通分量的排列屬性合并文本區(qū)域,增加了算法的復(fù)雜度。同時(shí)基于邊緣的方法易受噪聲干擾,當(dāng)背景與文本之間的對(duì)比度較低時(shí)很難實(shí)現(xiàn)文本定位。Chen等[8-9]提出一個(gè)知識(shí)型文本行提取系統(tǒng),實(shí)現(xiàn)了在文本/圖形的復(fù)合文檔圖像中提取文字。利用多層分割技術(shù),將文檔圖像劃分成不同的層,使同類對(duì)象處于相同層中,再運(yùn)用以知識(shí)為基礎(chǔ)的文本行提取方法在各層中獲取文本行特性,根據(jù)文本行的幾何和統(tǒng)計(jì)特性編碼知識(shí)庫實(shí)現(xiàn)文本行提取。閔華清等[10]和孫巧榆等[11]根據(jù)文本在圖像中局部區(qū)域具有的顯著性特點(diǎn),構(gòu)建一個(gè)視覺顯著性模型,并提出一個(gè)融合該模型與邊緣信息的文本檢測(cè)方法,但該方法只能對(duì)已確定候選文本區(qū)域的文本圖像進(jìn)行檢測(cè)。Jung等[12]針對(duì)邊緣、角點(diǎn)、紋理等方法不能魯棒的在視頻圖像中定位文本,提出利用筆畫算子濾波器對(duì)文本區(qū)域進(jìn)行定位。通過筆畫算子濾波器去除候選文本中具有較強(qiáng)邊緣的非文本區(qū)域,提高了文本定位算法的魯棒性。目前,所提出的大部分文字定位算法對(duì)文本的多樣性都具有一定的魯棒性,但都是在對(duì)文本大小、字體、顏色等特性在不同程度上進(jìn)行限定和假設(shè)取得的,仍沒有一個(gè)文本定位算法能夠不受文本的大小、排列方式、字體、顏色等變化影響。

根據(jù)漢字字符特征及其連通分量屬性,提出一種基于漢字連通分量的彩色印刷圖像版面分割方法。針對(duì)單個(gè)漢字存在多個(gè)連通分量特點(diǎn),根據(jù)漢字結(jié)構(gòu)特征和連通分量屬性,合并和重建單個(gè)漢字連通分量,提高單個(gè)漢字連通分量的完整性,克服連通分量文字分割方法不能準(zhǔn)確分割和提取漢字缺點(diǎn),提高了不同字體、字號(hào)、顏色漢字的分割準(zhǔn)確率。

2 漢字連通分量

2.1 連通分量屬性

在連通域文字分割方法中,主要根據(jù)文字連通分量特性篩選、去除非文字連通分量。因此,連通分量的相關(guān)特征屬性分析和判斷成為算法的關(guān)鍵。在各顏色層的圖像中,如果相鄰兩個(gè)像素的灰度值相同則它們便是連通的。根據(jù)八鄰域連通原則對(duì)連通分量進(jìn)行分析,利用連通分量所有邊緣點(diǎn)最小外接矩形作為其邊界,文字連通分量標(biāo)記圖如圖1所示。

圖1 連通分量矩形標(biāo)記圖

在每個(gè)連通分量中,它都具有一些基本特征和組合特征,連通分量的特征屬性[13]如表1所示。

表1 CCi特征屬性

在CCi特征屬性中,一些非字符CCi是不具備以上屬性的,可以依此對(duì)連通分量進(jìn)行篩選。在CCi基本特征中,CCi像素?cái)?shù)、面積屬性可以用來篩選太小或太大的非字符連通分量。而CCi占空比和長(zhǎng)寬比表明字符不可能占有整個(gè)連通分量外接矩形區(qū)域,依此判斷連通分量是否為字符。另外,如果輸入圖像出現(xiàn)傾斜偏移,由于傾斜會(huì)導(dǎo)致CCi屬性發(fā)生變化,因此需要對(duì)圖像進(jìn)行校正處理。

2.2 連通分量規(guī)則

根據(jù)文字連通分量的特性,單個(gè)漢字字符可能包含一個(gè)或多個(gè)連通分量,而英文字符(除i,j外)和數(shù)字則都是一個(gè)完整的連通分量,如圖1中所示。而在單個(gè)漢字包含的連通分量中,有些連通分量只是字符的一部分,其特性與非字符相似,容易將其作為非字符濾除,影響文字分割。同時(shí),連通分量過多會(huì)造成文字提取不完整,且影響分割速度和精度。因此,根據(jù)漢字結(jié)構(gòu)特性及其使用頻率,對(duì)漢字連通分量進(jìn)行合并重建,重建規(guī)則如表2所示。

表2 漢字連通分量合并重建規(guī)則

漢字連通分量合并的基本思想是通過判斷相鄰兩個(gè)連通分量外接矩形是否發(fā)生重疊,再根據(jù)重疊面積的大小并結(jié)合外接矩形的長(zhǎng)寬比例和矩形中心距離合并連通分量。overlap,detax,detay,rateWi,rateHi意義如下:

根據(jù)以上漢字連通分量重建規(guī)則,漢字連通分量重建結(jié)果如圖2所示。

圖2 連通分量重建后標(biāo)記圖

3 版面分割

印刷圖像版面分割過程如圖3所示。利用金字塔變換逆半調(diào)算法對(duì)圖像進(jìn)行預(yù)處理,去除圖像噪聲和半色調(diào)網(wǎng)點(diǎn)噪聲干擾。通過顏色采樣得到初步顏色聚類中心,對(duì)顏色中心采用有限起始點(diǎn)均值偏移算法進(jìn)行顏色分割,然后按八鄰域連通原則標(biāo)記像素得到連通分量,根據(jù)漢字結(jié)構(gòu)特征和連通分量屬性,分析、篩選、重建漢字連通分量。最后分析連通分量連接關(guān)系,確定文字排列方向,實(shí)現(xiàn)文字分割和提取。

3.1 逆半調(diào)預(yù)處理

圖像在獲取、傳輸過程中,會(huì)受到各種干擾產(chǎn)生噪聲。同時(shí)由于印刷圖像是由網(wǎng)點(diǎn)組成的半色調(diào)圖像,不能對(duì)其直接處理,需要進(jìn)行逆半調(diào)預(yù)處理,將其恢復(fù)成連續(xù)調(diào)圖像。金字塔變換結(jié)合中值濾波的逆半調(diào)算法對(duì)半色調(diào)網(wǎng)點(diǎn)噪聲具有很強(qiáng)的魯棒性,利用金字塔變換實(shí)現(xiàn)細(xì)節(jié)圖像和近似圖像分離,能夠在去除網(wǎng)點(diǎn)噪聲的同時(shí)最大程度保留圖像邊緣細(xì)節(jié)信息。金字塔變換逆半調(diào)算法[14]如圖4所示。

圖3 文字分割方法示意圖

圖4 逆半調(diào)算法示意圖

算法不會(huì)使近似圖像受到同等程度濾波處理而使得圖像模糊和邊緣損失,能夠最大程度地還原圖像,同時(shí)去除網(wǎng)點(diǎn)噪聲。

3.2 均值偏移顏色分割

根據(jù)彩色印刷圖像在色彩空間的特征維數(shù),利用均值偏移(mean shift)方法反復(fù)迭代搜索特征空間中樣本點(diǎn)最密集區(qū)域[15],實(shí)現(xiàn)圖像顏色分割。為了減少圖像顏色數(shù)量和保證被選取顏色為物體內(nèi)部像素顏色,同時(shí)加快mean shift的收斂速度,對(duì)圖像實(shí)施局部梯度最小顏色采樣。利用水平方向和垂直方向Sobel算子檢測(cè)彩色圖像邊緣強(qiáng)度,根據(jù)局部邊緣強(qiáng)度值確定候選顏色,形成初步顏色聚類中心。以候選顏色中心作為mean shift起點(diǎn),采用不同的帶寬核函數(shù)循環(huán)迭代,直到最終收斂[16]。

Mean shift的概率密度函數(shù)可以表示為:

其中,和表示色彩和空域窗口帶寬系數(shù),C為歸一化常數(shù)。本文選擇高斯核函數(shù)作為mean shift的核函數(shù),同時(shí)在帶寬矩陣計(jì)算中,選擇自適應(yīng)帶寬計(jì)算方法[17]確定均值偏移的帶寬。

3.3 漢字連通分量重建

顏色分割后,在各顏色層二值圖像中,根據(jù)八鄰域連通原則標(biāo)記像素點(diǎn)形成連通分量,以外接矩形作為連通分量的邊界。利用連通分量的屬性特征,對(duì)所有連通分量進(jìn)行分析、篩選,去除明顯的非字符連通分量。在保留下來的連通分量中,計(jì)算與其相鄰?fù)饨泳匦芜吙虻闹丿B值,根據(jù)表2漢字連通分量重建規(guī)則對(duì)連通分量進(jìn)行合并,進(jìn)一步減少連通分量數(shù)目和提升文字連通分量完整性,加快文字分割速度。

3.4 文字排列方向判定

漢字連通分量重建后,根據(jù)連通分量位置關(guān)系,判斷每個(gè)區(qū)域連通分量與相鄰其他連通分量的連接關(guān)系,計(jì)算連通分量在水平和垂直方向上的總疊加值,并依據(jù)疊加值確定連通分量的排列屬性。連通分量位置關(guān)系判斷式[13]如下:

如果HBD<0|VBD<0,則CCi在水平或垂直方向存在重疊。如果相鄰連通分量存在重疊,則連接相鄰兩個(gè)連通分量。而部分連通分量既在水平方向上有重疊,在垂直方向也有重疊。為了確定文字排列方向,根據(jù)式(11)對(duì)文字排列方向進(jìn)行分析判斷:

取T0=2.0,LinkLogcal=1表示文字為水平排列,LinkLogcal=2表示文字為垂直排列。

4 實(shí)驗(yàn)及結(jié)果分析

為了檢驗(yàn)本方法的性能,選擇彩色印刷圖像集和ICDAR2003數(shù)據(jù)集對(duì)算法進(jìn)行測(cè)試,彩色印刷圖像集為自選圖像,包含各種書刊封面和藥品包裝圖像。

4.1 均值偏移帶寬選擇

在均值偏移顏色分割中,需要確定兩個(gè)帶寬參數(shù)hs和hr。如果帶寬參數(shù)過小,則圖像分割效果不明顯,而如果參數(shù)過大,則會(huì)出現(xiàn)過分割現(xiàn)象,出現(xiàn)背景顏色覆蓋細(xì)小文字部分。不同帶寬參數(shù)的實(shí)驗(yàn)結(jié)果如表3所示。

表3 均值偏移實(shí)驗(yàn)結(jié)果

從實(shí)驗(yàn)結(jié)果可以知道,文字定位時(shí)間在很大程度上取決于帶寬的大小。因?yàn)椴噬∷D像的色彩十分豐富,如果選擇小帶寬,分割后顏色數(shù)量多,而文字定位需要在各顏色層中篩選、定位文字連通分量,導(dǎo)致算法時(shí)間消耗大。而如果帶寬過大,雖然加快了文字定位速度,但會(huì)出現(xiàn)過分割現(xiàn)象,導(dǎo)致細(xì)小文字區(qū)域丟失,文字定位不完整。因此,在綜合算法時(shí)間和定位精度后,取hs=32,hr=48。

4.2 判定文字區(qū)域

根據(jù)3.4節(jié)的文字連通分量連接判定規(guī)則,連接相鄰CCi確定文字排列方向,實(shí)驗(yàn)結(jié)果如圖5所示。

圖5 文字CCi連接圖

根據(jù)判定規(guī)則,在CCi的連接中,任何一個(gè)有效的CCi連接必須是雙向的,即相鄰的兩個(gè)CCi必須出現(xiàn)在對(duì)方的CCi連接中,所有的單向CCi連接都是無效連接,依次得到CCi排列方向,實(shí)現(xiàn)文字定位分割。

4.3 算法性能評(píng)價(jià)

在本文算法性能評(píng)價(jià)中,選擇在文本塊級(jí)別上進(jìn)行,因?yàn)榉指詈蟮奈谋静⒉挥糜谧R(shí)別。采用這樣評(píng)價(jià)方法對(duì)算法具有更大的寬容度,它允許算法檢測(cè)到部分的文本行,這對(duì)于文本檢測(cè)而言是可以接受的。評(píng)價(jià)指標(biāo)[3,11]如下所示:

其中,R為召回率,P為精確度,f為整體性能指標(biāo),MDR為漏檢率。ADB表示文檔真實(shí)文本塊,TDB表示檢測(cè)到文本塊,F(xiàn)DB表示檢測(cè)錯(cuò)誤文本塊,MDB表示不完整檢測(cè)文本塊。表4為彩色印刷圖像集對(duì)算法評(píng)價(jià)結(jié)果,表5為利用ICDAR2003數(shù)據(jù)集與文獻(xiàn)[3,11]對(duì)比評(píng)價(jià)結(jié)果。

表4 不同類型印刷圖像算法性能評(píng)價(jià)結(jié)果%

表5 ICDAR2003數(shù)據(jù)集性能對(duì)比%

從表4結(jié)果可以知道,經(jīng)過漢字連通分量重建后,文字定位效果得到明顯提升。同時(shí)對(duì)比中文和英文圖像的文字定位結(jié)果發(fā)現(xiàn),算法盡管在一定程度上彌補(bǔ)了漢字存在多個(gè)連通分量情況,但定位準(zhǔn)確率仍然不及英文,需進(jìn)一步提升漢字連通分量的完整性。另外,在算法性能方面,根據(jù)ICDAR 2003數(shù)據(jù)集測(cè)試結(jié)果與近年典型算法對(duì)比可知,算法在文字定位上的基本性能都基本接近,只是算法所需定位時(shí)間較長(zhǎng)。部分文字定位效果實(shí)驗(yàn)圖像如圖6所示。

圖6 實(shí)驗(yàn)圖像

通過實(shí)驗(yàn)圖像可以看出,算法實(shí)現(xiàn)圖像中大部分文字定位分割,克服了圖像中文字在字號(hào)、排列方向、字體和顏色上差異,保證了文字定位準(zhǔn)確性。但是,算法依然存在一定的缺陷,如文字定位的速度很大程度上依賴于圖像色彩數(shù)量,如果圖像色彩豐富則所需時(shí)間較長(zhǎng),實(shí)時(shí)性不強(qiáng)。同時(shí),算法易造成單獨(dú)文字、字距較大以及細(xì)小文字丟失,因?yàn)榕卸–Ci連接時(shí),字距較大和單獨(dú)文字作為無效連接去除,而細(xì)小文字容易在顏色分割時(shí)丟失,如圖6(a)、(b)中所示。

5 結(jié)論

本文提出一種基于漢字連通分量的彩色印刷圖像版面分割方法,通過對(duì)漢字連通分量進(jìn)行重建實(shí)現(xiàn)在復(fù)雜印刷圖像中準(zhǔn)確提取和分割文字,為印刷圖像質(zhì)量在線檢測(cè)中文字印刷質(zhì)量檢測(cè)奠定基礎(chǔ),使印刷質(zhì)量評(píng)價(jià)更加接近人眼視覺特性。由于本文只選擇了使用頻率較高的漢字結(jié)構(gòu)進(jìn)行連通分量合并,因此算法對(duì)于一些特殊字體、藝術(shù)字等字體不能實(shí)現(xiàn)很好的文字定位,同時(shí)算法的時(shí)間復(fù)雜度較高,還難以用于實(shí)時(shí)檢測(cè),下一步應(yīng)擴(kuò)大漢字連通分量重建范圍,優(yōu)化和完善算法性能。

[1]Yan J Q,Li J,Gao X B.Chinese text location under complex background using Gaborfilterand SVM[J].Neurocomputing,2011,74:2998-3008.

[2]Lee J J,Lee P H,Lee S W,et al.AdaBoost for text detection in natural scene[C]//Proceedings of the 11th International Conference on Document Analysis and Recognition,Beijing,China,2011:429-434.

[3]Shivakumara P,Phan T Q,Tan C L.A Laplacian approach to multi-oriented text detection in video[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(2):412-419.

[4]姚金良,翁璐斌,王小華.一種基于連通分量的文本區(qū)域定位方法[J].模式識(shí)別與人工智能,2012,25(2):325-331.

[5]Yi C,Tian Y L.Text string detection from natural scenes by structure-based partition and grouping[J].IEEE Transactions on Image Processing,2011,20(9):2594-2605.

[6]Papavassiliou V,Stafylakis T,Katsouros V,et al.Handwritten documentimage segmentation into textlines and words[J].Pattern Recognition,2010,43:369-377.

[7]Zhang X,Sun F C.Pulse coupled neural network edgebased algorithm for image text locating[J].Tsinghua Science and Technology,2011,16(1):22-30.

[8]Chen Y L,Hong Z W,Chuang C H.A knowledge-based system for extracting text-lines from mixed and overlapping text/graphics compound document images[J].Expert Systems with Applications,2012,39:494-507.

[9]Chen Y L,Wu B F.A multi-plane approach for text segmentation of complex document images[J].Pattern Recognition,2009,42:1419-1444.

[10]閔華清,鄭華強(qiáng),羅榮華.自然場(chǎng)景圖像中基于視覺顯著性的文本區(qū)域檢測(cè)[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2012,40(8):39-45.

[11]Sun Q Y,Lu Y.Text location in scene images using visual attention model[J].International Journal of Pattern Recognition and Artificial Intelligence,2012,26(4):1-19.

[12]Jung C,Liu Q F,Kim J.A stroke filter and its application to text localization[J].Pattern Recognition Letters,2009,30:114-122.

[13]Nikolaou N,Badekas E,Papamarkos N,et al.Text localization in color documents[C]//International Conference on Computer Vision Theory and Applications,Setúbal,Portugal,2006:181-188.

[14]Kong Y P,Zeng P,Wu Z L,et al.Inverse halftoning viamedian interpolating pyramid[C]//8th International Conference on Signal Processing,Beijing,China,2006,2:16-20.

[15]周芳芳,樊曉平,葉榛.均值漂移算法的研究與應(yīng)用[J].控制與決策,2007,22(8):841-847.

[16]湯楊,潘志庚,湯敏,等.基于分級(jí)mean shift的圖像分割算法[J].計(jì)算機(jī)研究與發(fā)展,2009,46(9):1421-1431.

[17]Comaniciu D,Ramesh V,Meer P.The variable bandwidth mean shift and data-driven scale selection[C]//Proceedings of the 8th IEEE International Conference on Computer Vision,Vancouver,Canada,2001:438-445.

猜你喜歡
印刷分量漢字
神奇“印刷”術(shù)
帽子的分量
印刷+智能=?
印刷智能化,下一站……
一物千斤
智族GQ(2019年9期)2019-10-28 08:16:21
論《哈姆雷特》中良心的分量
分量
漢字這樣記
漢字這樣記
把心交給印刷
出版與印刷(2014年1期)2014-12-19 13:07:32
康马县| 莎车县| 霍州市| 天气| 肇庆市| 泾源县| 驻马店市| 麻阳| 金湖县| 恩施市| 昭觉县| 新和县| 巨鹿县| 滕州市| 星子县| 石狮市| 泰州市| 建瓯市| 吉林省| 阜康市| 大足县| 高唐县| 塘沽区| 南溪县| 胶州市| 平乡县| 竹溪县| 大港区| 廉江市| 临潭县| 罗源县| 当雄县| 潞城市| 泰安市| 阳山县| 南郑县| 平遥县| 彩票| 哈密市| 温宿县| 广东省|