牟加俊,王 建,何宇清,龐彥偉
(天津大學(xué) 電子信息工程學(xué)院,天津 300072)
中國(guó)畫(簡(jiǎn)稱國(guó)畫)是中華民族傳統(tǒng)的繪畫,它歷經(jīng)數(shù)千年的文化積累和發(fā)展,已成為中華民族獨(dú)特的文化瑰寶之一。國(guó)畫是用毛筆、墨在宣紙、絹帛上作畫,它講究筆墨,著眼于用筆墨造型。國(guó)畫門類多樣、異彩紛呈,從繪畫種類上分為山水畫、花鳥畫和人物畫。在畫面的構(gòu)成上,中國(guó)畫講究詩(shī)、書、畫、印交相輝映。古代璽印有官印和私印之分,其中古畫中的印章以私印為主,用來(lái)表現(xiàn)書畫作者或者收藏者姓名及別號(hào)等信息。因此,從國(guó)畫圖像中自動(dòng)分割并識(shí)別印章信息,對(duì)于實(shí)現(xiàn)基于內(nèi)容的國(guó)畫圖像檢索與分析是非常必要的。
國(guó)內(nèi)外有關(guān)印章處理的工作主要集中在商業(yè)票據(jù)或公文身份有效憑證等。Fan和Tsai較早的開展了印章自動(dòng)識(shí)別技術(shù)的研究[1],他們根據(jù)筆畫拓?fù)浣Y(jié)構(gòu)的相對(duì)穩(wěn)定性提出基于筆劃骨架匹配的決策方法,先將印章圖像做細(xì)化和旋轉(zhuǎn)處理,然后利用距離權(quán)相關(guān)算法計(jì)算預(yù)留印章與待識(shí)別印章的相似度,這種方法缺點(diǎn)是要求印章的邊框必須是直線且沒(méi)有間隙,不能鑒別圓形印章。在前一種方法的基礎(chǔ)上,Chen和Tsai采取廣義霍夫變換(GHT)獲取印章配準(zhǔn)的參數(shù)[2],該方法可以處理任意形狀的印章,但GHT的計(jì)算量太大,其時(shí)間復(fù)雜度很高。Chen提出了一種基于坐標(biāo)變換的印章識(shí)別方法[3],將二值化后的印章圖像由外向內(nèi)進(jìn)行掃描,找到4個(gè)切點(diǎn),從而確定包含印章區(qū)域的最小圓,計(jì)算出印章圖像的中心點(diǎn)。再將直角坐標(biāo)空間變換到極坐標(biāo)空間,確定預(yù)留印章中的像素點(diǎn)與進(jìn)行旋轉(zhuǎn)θ角后的匹配程度。匹配后將印章圖像沿著θ軸分為K塊,通過(guò)每個(gè)塊中相匹配的像素點(diǎn)來(lái)計(jì)算其匹配值。這種方法同樣受圖像質(zhì)量影響較大,僅適用于方章和圓章,計(jì)算量也很大。Soria等提出了一種基于色調(diào)特征的彩色文檔圖像中提取官方印章的方法[4],作者綜合利用色度、飽和度和亮度等信息。基于對(duì)個(gè)人提交的稅務(wù)表格數(shù)據(jù)的印章處理結(jié)果,驗(yàn)證了所提方法的有效性。Wang等提出了基于顏色信息的銀行票據(jù)文檔的印章提取方法[5],他們首先使用K均值算法從背景中分離印章區(qū)域,然后使用最近鄰分類器去除印刷文字,并借助后處理過(guò)程改進(jìn)分割結(jié)果。除上述外文文獻(xiàn)之外,還有一些中文文獻(xiàn)也討論了印章檢測(cè)與識(shí)別問(wèn)題,如基于Fourier描述子的方法[6],基于極坐標(biāo)系和小波多尺度分解的方法[7],多特征支持向量機(jī)(SVM)[8],基于旋轉(zhuǎn)不變特性的方法[9],形態(tài)學(xué)top?hat變換[10]。
分析國(guó)內(nèi)外印章處理相關(guān)文獻(xiàn),總結(jié)出已有方法存在以下2個(gè)問(wèn)題:一是沒(méi)有專門針對(duì)國(guó)畫圖像(特別是古畫圖像)印章區(qū)域分割與提取方法;二是現(xiàn)有方法都假定印章區(qū)域顏色保持一致,形狀完整,沒(méi)有考慮單個(gè)印章顏色特征存在差別,印章筆劃斷裂等不良情況,而這兩種情況在古畫圖像的印章區(qū)域經(jīng)常出現(xiàn)。受國(guó)畫顏色退化、印章雕刻方式、印泥材質(zhì)等不同情況的影響,古畫圖像中的印章保存完好程度不盡相同。本文提出了一種針對(duì)古畫圖像的紅色印章自動(dòng)定位算法,目的是從視覺(jué)質(zhì)量下降的古畫圖像中定位方形或圓形紅色印章區(qū)域,為后續(xù)的印章分割和識(shí)別做好準(zhǔn)備。
通過(guò)觀察古畫圖像中的各類印章,總結(jié)出下述印章區(qū)域具有的三類特征:
顏色特征:古畫所用印泥以朱砂印泥為主,呈現(xiàn)為高飽和度的鮮紅色。
形狀特征:古畫中的印章以方形(包括正方形和長(zhǎng)方形)和圓形為主,少量的是特殊形狀(如葫蘆形等)。
邊緣特征:印章雕刻方法分為陽(yáng)刻和陰刻兩種情況,古畫中這兩類印章的附近區(qū)域都含有豐富的邊緣特征。
所提算法綜合使用上述三類特征用于印章分割。圖1所示為所提方法的框圖,它包括偏色校正、印章檢測(cè)和印章驗(yàn)證三個(gè)步驟。首先針對(duì)古畫圖像普遍存在的偏色情況,通過(guò)分析背景區(qū)域的主顏色,對(duì)古畫進(jìn)行偏色校正;接下來(lái)根據(jù)印章的顏色特征,提取紅色增強(qiáng)分量圖,檢測(cè)潛在的印章區(qū)域;最后利用印章的形狀區(qū)域和邊緣特征,準(zhǔn)確定位印章。所提算法的詳細(xì)實(shí)現(xiàn)過(guò)程在以下各子節(jié)中介紹。
圖1 所提古畫印章分割算法框圖
由于存放年代久遠(yuǎn),以及存放方式和環(huán)境的影響,古畫圖像普遍存在褪色、偏色等顏色退化情況。為了提高印章區(qū)域分割的性能,有必要對(duì)古畫圖像進(jìn)行偏色校正,盡量恢復(fù)印章區(qū)域原有的顏色特征。
所提方法在YCbCr顏色空間進(jìn)行偏色校正。首先使用下式將輸入圖像從RGB空間轉(zhuǎn)換到Y(jié)CbCr空間:
在YCbCr空間中,Y表示亮度分量,Cb和Cr分別代表藍(lán)色和紅色偏移量。通過(guò)觀察發(fā)現(xiàn),前景與背景區(qū)域的Y值差別明顯。所提算法使用Y分量將古畫圖像劃分為前景和背景區(qū)域。具體的做法是:計(jì)算Y分量的直方圖,用H(Y)表示;采用經(jīng)典的Otsu方法,計(jì)算閾值T1;將Y值大于T1的點(diǎn)劃歸為背景區(qū)域,并用W表示背景區(qū)域。接下來(lái),計(jì)算W內(nèi)各點(diǎn)Cb和Cr的平均值,分別用和表示,即有:
式中N表示W(wǎng)中像素?cái)?shù)的總數(shù)。
假定國(guó)畫背景區(qū)域是沒(méi)有顏色的,即滿足Cb=Cr=128。用(Cb′,Cr′)表示調(diào)整后的兩色度通道值,處理過(guò)程如下式所示:
圖2所示為背景偏色校正過(guò)程示例。其中,圖2(a)為宋徽宗趙佶所畫《鸜鵒圖》的局部彩色截圖,圖中含有18枚印章,其中方形印章13枚,圓形印章5枚,各印章的尺寸差別明顯。圖2(b)是(a)對(duì)應(yīng)的背景區(qū)域二值圖,其中黑色代表背景區(qū)域。圖2(c)是使用式(3)對(duì)圖2(a)進(jìn)行偏色調(diào)整的結(jié)果,其中Y分量保持不變。
圖2 背景偏色校正過(guò)程示例
所提算法使用顏色特征初步定位印章區(qū)域。首先,根據(jù)Cr和Cb分量,使用式(4)計(jì)算紅色分量增強(qiáng)圖像,用Er(x,y)表示,即有:
根據(jù)前面的分析,國(guó)畫中的印章筆劃呈現(xiàn)紅色,印章筆劃像素點(diǎn)的Cr取值較大,而Cb取值較小。根據(jù)式(4),印章像素點(diǎn)的Er值較大。所提方法采用無(wú)監(jiān)督K均值分類算法,使用Er作為特征量分為3類,將類心值最大的一類標(biāo)記為印章區(qū)域。圖3(a)所示為圖2(a)圖像對(duì)應(yīng)的印章區(qū)域初定位結(jié)果,其中白色區(qū)域?qū)?yīng)于印章區(qū)域。
受到印章顏色退化、圖像折痕等情況的影響,檢測(cè)到的印章筆畫可能存在斷裂或缺損情況,導(dǎo)致部分印章筆劃漏檢。另外,古畫中的紅色衣物或花瓣的顏色與印章顏色非常接近,這類對(duì)象常被誤檢為印章區(qū)域??紤]到古畫中的絕大部分印章區(qū)域是方形或者圓形,所提算法引入后處理過(guò)程,根據(jù)印章的邊緣和形狀特征,去除漏檢和誤檢,精確定位印章區(qū)域。
首先,所提算法使用形態(tài)學(xué)操作處理印章筆劃斷裂和缺損情況。具體的做法是:
(1)使用半徑為2的“diamond”算子對(duì)初定位結(jié)果進(jìn)行膨脹處理;
(2)填充膨脹結(jié)果中印章區(qū)域內(nèi)的空洞,處理結(jié)果用S表示。
接下來(lái),所提算法使用形狀特征去除誤檢區(qū)域。共使用4種結(jié)構(gòu)特征,即面積、寬高比、矩形率和圓形率。用Wi表示S中某個(gè)印章區(qū)域,下標(biāo)i表示該區(qū)域的序號(hào)。各種結(jié)構(gòu)特征定義為:
基本特征:Wi的面積定義為Wi內(nèi)像素點(diǎn)的總數(shù),用AREAi表示。用 TOPi和 BOTi表示 Wi的上、下邊界,它們定義為Wi內(nèi)各像素點(diǎn)水平方向坐標(biāo)值xi(n)的最小值和最大值;用LETi和RGTi表示W(wǎng)i的左、右邊界,它們定義為Wi內(nèi)各像素點(diǎn)垂直方向坐標(biāo)值yi(n)的最小值和最大值。Wi的外接矩形定義為其上、下、左、右四個(gè)邊界所圍成的矩形區(qū)域。Wi的寬度定義為WIDi=|RGTi-LETi|,高度定義為HETi=|BOTi-TOPi|。用MXi和MYi表示區(qū)域Wi內(nèi)各點(diǎn)坐標(biāo)值xi(n)和yi(n)的平均值,定義Wi的中心為Ci=(MXi,MYi)。計(jì)算Wi內(nèi)各點(diǎn)到Ci的街區(qū)距離,Wi的半徑等于最大距離。定義Wi的周長(zhǎng)Pi定義為其8連通約束下的外邊界所含的像素?cái)?shù)。
寬高比(Width and Height Ratio,WHR):Wi的寬高比定義為寬度和高度的比值,即WHRi=WIDiHETi。
矩形度(Rectangularity,RET)矩形度定義為區(qū)域的面積與其最小外接矩形面積的比值。矩形度反映了物體在最小外接矩形中的填充程度,矩形的矩形度為1,圓形的矩形度為p 4,三角形的矩形度為0.5。考慮到古畫圖像中印章區(qū)域都是按照垂直或者水平方向排列的,每個(gè)印章區(qū)域的最小外接矩形與其外接矩形相同。因此有RATi=AREAi/(HETiWIDi)圓形度(Circularity,縮寫為CIR)圓形度反映了物體接近于圓形的程度,它定義為4p倍的面積區(qū)域與周長(zhǎng)的平方之比,即有CIRi=4pAREAi/Pi。圓的圓形度為1,正方形的圓形度為p/4。
使用上述結(jié)構(gòu)特征,制定下面4個(gè)約束條件。
(1)條件 1:AREAi>T2;
(2)條件 2:T3<WHRi<T4;
(3)條件 3:RA Ti>T5;
(4)條件 4:CI Ri>T6。
條件1描述的是對(duì)印章區(qū)域面積的約束,用來(lái)去除面積過(guò)小的干擾區(qū)域,所提算法取T2=50。條件2描述了對(duì)Wi寬高比的約束。對(duì)于正方形和圓形情況的印章,其寬高比接近于1。但對(duì)于長(zhǎng)方形印章情況,其款高于可能大于或者小于1。因此應(yīng)適當(dāng)放寬對(duì)寬高比的約束,所提方法選取T3=0.33,T4=3。條件3和條件4用來(lái)區(qū)分方形印章和圓形印章。
根據(jù)矩形度(RET)和圓形度(CIR)的定義,方形印章(包括正方形和長(zhǎng)方形)的RET應(yīng)為1,圓形印章的CIR為1。但考慮到圖像掃描過(guò)程中產(chǎn)生的變形,圖像本身存在遮蔽或缺損等因素的影響,導(dǎo)致各印章區(qū)域RET或CIR小于1。為減少漏檢,閾值T5和T6的取值不能太大,所提方法取T5=T6=0.66。所提算法使用兩個(gè)步驟完成印章區(qū)域驗(yàn)證過(guò)程:(1)將不滿足條件1和條件2去除干擾區(qū)域;(2)將剩余的候選區(qū)域使用條件3和條件4進(jìn)一步進(jìn)行判別并區(qū)分印章類型,即如果滿足條件3,則判為方形印章;如果滿足條件4,則判為圓形印章。
圖3給出基于形狀特征的印章區(qū)域驗(yàn)證過(guò)程。其中,圖3(a)所示為圖2(a)所示圖像對(duì)應(yīng)的印章檢測(cè)區(qū)域二值圖。圖3(b)是形態(tài)學(xué)膨脹結(jié)果,圖3(c)所示為使用形狀特征進(jìn)行印章區(qū)域驗(yàn)證的結(jié)果,其中方形印章和圓形印章分別用“口”和“O”標(biāo)出。從實(shí)驗(yàn)結(jié)果來(lái)看,實(shí)驗(yàn)成功檢測(cè)并提取出了原圖像中不同尺寸18個(gè)印章中的17個(gè),而且能夠準(zhǔn)確區(qū)分方形印章和圓形印章。惟一一個(gè)沒(méi)有被正確檢測(cè)的是原圖中右下角的正方形印章。通過(guò)比對(duì)輸入圖像發(fā)現(xiàn),該印章的紅色特征退化情況嚴(yán)重,篆刻方式為陽(yáng)刻,印章區(qū)域內(nèi)部的筆劃稀疏,導(dǎo)致在印章區(qū)域驗(yàn)證過(guò)程中,條件3和條件4都不滿足,最終導(dǎo)致該印章區(qū)域被漏檢。
本實(shí)驗(yàn)選用30幅古畫圖像作為實(shí)驗(yàn)素材,全部圖像從網(wǎng)絡(luò)下載得到,其中絹質(zhì)圖像18幅,紙質(zhì)圖像12幅。采用人工方式從古畫圖像中提取印章區(qū)域,共得到212個(gè)印章區(qū)域,其中包括各種尺寸的方形印章168枚,圓形印章37枚,其他形狀印章7枚。在全部印章212個(gè)印章中,陽(yáng)刻印章133枚,陰刻印章79枚。采用所提算法檢測(cè)并分割各圖像中的印章,并與人工提取結(jié)果進(jìn)行比較,表1列出了檢測(cè)結(jié)果。
圖3 印章區(qū)域驗(yàn)證過(guò)程示例
表1 印章區(qū)域檢測(cè)結(jié)果
由表1可見(jiàn),所提算法的總查全率為93.4%,其中方形印章的查全率最高,約為95.8%,圓形印章的查全率約為91.9%,其他形狀印章查全率較低,只有42.8%。
通過(guò)分析實(shí)驗(yàn)結(jié)果,總結(jié)導(dǎo)致印章漏檢的三種情況,一是印章顏色退化嚴(yán)重,部分區(qū)域被背景顏色掩蓋;二是受到畫面折痕,以及畫面其他內(nèi)容的遮蔽等情況,導(dǎo)致本來(lái)連續(xù)的印章區(qū)域被劃分為多個(gè)小區(qū)域;三是特殊形狀的印章,如葫蘆形。
圖4給出部分印章正檢和漏檢實(shí)例。為顯示方便,截取部分圖像區(qū)域顯示,圖4(a)中正確檢測(cè)到的方形和圓形印章區(qū)域分別用“口”和“O”標(biāo)出,其中右圖右下方有圖像部分區(qū)域被誤檢為圓形印章區(qū)域。
圖4(b)左圖中紅色圖中最下方的兩個(gè)方形印章沒(méi)有正確檢出,其中左側(cè)漏檢的印章是因?yàn)橛∧囝伾粔蝓r艷,與背景顏色接近,右側(cè)漏檢的印章受到畫中水墨顏色的影響,導(dǎo)致部分印章筆劃存在斷裂。右圖中右下方的葫蘆形印章屬于特殊形狀情況,未被正確檢出。
表2分別列出不同雕刻類型印章,以及不同材質(zhì)古畫圖像印章的檢測(cè)結(jié)果。結(jié)果顯示,陰刻印章的查全率比陽(yáng)刻印章高出約5%,這是因?yàn)殛幙逃≌碌募t色區(qū)域占整個(gè)印章區(qū)域的比重更大,更不容易收斷裂、缺損等不良情況的影響。另外,所提算法對(duì)不同材質(zhì)古畫圖像的印章定位性能存在差別,紙質(zhì)材質(zhì)古畫的印章檢測(cè)結(jié)果略高于絹質(zhì)材質(zhì)古畫,這是因?yàn)榻佡|(zhì)古畫背景顏色偏色情況更嚴(yán)重,印章區(qū)域更容易和背景顏色混淆,導(dǎo)致更多的印章區(qū)域漏檢。
圖4 正確檢測(cè)和漏檢情況示例
表2 不同材質(zhì)古畫印章檢測(cè)結(jié)果
提出一種基于多特征的中國(guó)古畫印章定位算法。該方法綜合利用了印章的顏色、形狀和邊緣特征,包括背景偏色校正、基于顏色特征的印章區(qū)域初定位、以及基于邊緣和形狀特征的印章區(qū)域驗(yàn)證等,實(shí)驗(yàn)結(jié)果驗(yàn)證了所提算法的有效性。未來(lái)的工作集中在如何提高印章區(qū)域的檢測(cè)精度,以及特殊形狀印章定位方面。
[1]FAN T J,TSAI W H.Automatic Chinese seal identification[J].Computer Vision Graphics and Image Processing,1984,25(2):311?330.
[2]CHENC M,TSAI W H.Automatic identification of Chinese seal imprint with arbitrary or partial shapes[J].Computer Pro?cessing Chinese Oriental Languages,1986,22(6):216?233.
[3]CHEN Y S.Automatic identification for a Chinese seal image[J].Pattern Recognition,1996,29(11):1807?1820.
[4]SORIA?FRISCH A.Color seal extraction from documents:ro?bustness through soft data fusion[J].EURASIP Journal on Ap?plied Signal Processing,2005,13(8):2146?2152.
[5]WANG C Y,CHEN Y B.Seal extraction based on clustering and local thresholding techniques[J].Advanced Materials Re?search,2014,926/930:3467?3470.
[6]曾東武,劉重慶.Fourier描述符的印鑒識(shí)別方法[J].上海交通大學(xué)學(xué)報(bào),1998,32(9):43?45.
[7]王新年,梁德群.基于極坐標(biāo)和小波的印章配準(zhǔn)方法[J].計(jì)算機(jī)工程與應(yīng)用,2005,42(24):218?221.
[8]李晗,竇愛(ài)萍,解爭(zhēng)龍,等.基于多特征的支持向量機(jī)印鑒識(shí)別[J].航空計(jì)算技術(shù),2006,36(4):32?34.
[9]代紅維,馬社祥.基于旋轉(zhuǎn)不變特性的印鑒識(shí)別方法研究[J].天津理工大學(xué)學(xué)報(bào),2009,25(4):1?3.
[10]何瑾.金融印鑒真?zhèn)巫R(shí)別新方法研究[D].天津:天津大學(xué),2010.
[11]Sonka.圖像處理分析與機(jī)器視覺(jué)[M].3版.艾海舟,譯.北京:清華大學(xué)出版社,2011.