彭燁 李霆
(五邑大學(xué)信息工程學(xué)院)
隨著經(jīng)濟(jì)的快速發(fā)展,印鑒作為一種認(rèn)證手段已廣泛應(yīng)用于人們的日常生活中。傳統(tǒng)的印鑒識(shí)別是通過(guò)人工完成的,主要依靠的方法有重迭法、折角法、測(cè)量法、剪貼法等。這些人工鑒定的方法存在速度慢、精度低、過(guò)程復(fù)雜等缺點(diǎn),并且易受鑒定人員經(jīng)驗(yàn)、心情等因素的影響。隨著各種票據(jù)應(yīng)用的普及,對(duì)票據(jù)印鑒的識(shí)別和驗(yàn)證工作量越來(lái)越大,為提高工作效率,需要實(shí)現(xiàn)票據(jù)印鑒的自動(dòng)識(shí)別。印鑒自動(dòng)識(shí)別就是利用數(shù)字圖像處理和模式識(shí)別技術(shù)來(lái)對(duì)印鑒的真?zhèn)芜M(jìn)行自動(dòng)識(shí)別,既要求有正確識(shí)別假印鑒的能力,又要有容忍真印鑒間較大差異的適應(yīng)性。加蓋印鑒時(shí),由于用力不均、印泥質(zhì)量等因素的影響,會(huì)使得印鑒出現(xiàn)顏色深淺不均、圖像模糊等現(xiàn)象,再加上票據(jù)本身還有不同灰度、不同顏色底紋和文字,因此印鑒的預(yù)處理過(guò)程在印鑒識(shí)別系統(tǒng)中就變得尤為重要。
從20世紀(jì)80年代起,國(guó)內(nèi)外很多學(xué)者對(duì)印鑒識(shí)別系統(tǒng)進(jìn)行了深入的研究[1],而印鑒預(yù)處理作為印鑒識(shí)別系統(tǒng)中一個(gè)重要環(huán)節(jié),也是學(xué)者們重點(diǎn)研究的課題。印鑒預(yù)處理的目的是對(duì)印鑒進(jìn)行分割和噪聲去除,提取單純的印鑒圖像,并盡量多地保留印鑒本身的固有信息,其任務(wù)主要有3點(diǎn):1) 從票據(jù)中清晰、完整地分割出印鑒圖像,使印鑒和背景分離,得到分割后的二值圖像;2) 消除噪聲和票據(jù)上的其它圖像、文字干擾;3) 對(duì)印鑒的殘缺部分進(jìn)行必要修復(fù)。
基于RGB色度空間的印鑒提取算法采用了閾值法,利用彩色信息分割的思想實(shí)現(xiàn)印鑒和雜亂背景的分離。常用的彩色空間模型有RGB和HSI兩種[2],基于這兩種空間模型的印鑒提取方法有很多,例如文獻(xiàn)[3]采用RGB空間模型,文獻(xiàn)[1]、[4]采用HSI空間模型。
本文采用常用的RGB彩色模型,見(jiàn)圖1、圖2[2]。RGB彩色模型屬于線性表示系統(tǒng),在RGB彩色空間中,彩色圖像的每個(gè)像素都能用彩色立方體中的一個(gè)點(diǎn)來(lái)表示,比較簡(jiǎn)單直觀。它采用三維直角坐標(biāo)系,紅、綠、藍(lán)為原色,各個(gè)原色混合在一起可以產(chǎn)生復(fù)合色,如圖1所示。RGB顏色模型通常采用圖2所示的單位立方體來(lái)表示,在正方體的主對(duì)角線上,各原色的強(qiáng)度相等,產(chǎn)生由暗到明的白色,也就是不同的灰度值,其中(0,0,0)為黑色,(1,1,1)為白色,正方體的其它六個(gè)角點(diǎn)分別為紅、黃、綠、青、藍(lán)和品紅。
圖1 RGB三原色混合效果
圖2 RGB立方體圖
根據(jù)顏色信息,可以將印鑒圖像分為3個(gè)部分:第1部分為白色或灰色的背景區(qū)域;第2部分為紅色印鑒代表的目標(biāo)區(qū)域以及干擾噪聲;第3部分為黑色或者藍(lán)色的手寫簽名、印刷文字和底紋[5]。
設(shè)圖像中每點(diǎn)的紅色分量為r,綠色分量為g,藍(lán)色分量為b??紤]到票據(jù)圖像中紅色印鑒的r分量所占的比例要遠(yuǎn)大于印鑒文字、邊框和背景上的r分量比例,通過(guò)分析圖像紅色像素點(diǎn)的各分量,從統(tǒng)計(jì)中的數(shù)據(jù)可以發(fā)現(xiàn),圖像中紅色印鑒滿足條件(mod((r i, j)-g( i, j)),255 ) > n ( , n >0),利用這一點(diǎn),可得到提取紅色印鑒粗略圖像的算法其中, h(i, j)為圖像中(i, j)點(diǎn)的像素值,這里定義h( i, j)有0、1兩種取值,這樣轉(zhuǎn)化之后的圖像即為二值圖像; r( i, j)為圖像中(i, j)點(diǎn)對(duì)應(yīng)的紅色分量值; g(i, j)為(i, j)點(diǎn)對(duì)應(yīng)的綠色分量值;n是一個(gè)可調(diào)閾值,并不固定,一般n值可以隨機(jī)取一正數(shù),然后看提取圖像的效果來(lái)調(diào)整n值的大小,直到提取的圖像達(dá)到滿意的效果為止,這時(shí)的n值就是符合所提取圖像的閾值。一般來(lái)說(shuō),如果所選n值太小,滿足條件(mo d (r - g),255)> n的像素點(diǎn)會(huì)較多,也就是說(shuō)可以找到所有屬于印鑒的像素點(diǎn),但是也會(huì)找到較多不屬于印鑒的像素點(diǎn);如果所選n值太大,滿足條件(mo d (r - g),255)> n 的像素點(diǎn)會(huì)較少,只能找到部分屬于印鑒的像素點(diǎn),使得到的印鑒圖像會(huì)有所缺損。由此可知,n值的選擇會(huì)直接影響到印鑒圖像的提取效果,需要通過(guò)不斷試驗(yàn),觀察圖像的提取效果來(lái)確定最終的閾值n。
通過(guò)上面介紹的算法可以去掉印鑒圖像中的背景以及文字干擾,得到一個(gè)粗略的印鑒圖像,但印鑒的很多細(xì)節(jié)都不清晰,需要進(jìn)一步處理。有了印鑒的一個(gè)粗略圖像,只需要知道印鑒的具體輪廓,就可以將印鑒的具體輪廓圖像與印鑒的粗略圖像進(jìn)行“與”操作,得到印鑒的清晰圖像。本文通過(guò)將原始圖像二值化,和得到的印鑒粗略圖像進(jìn)行“與”操作,得到的圖像就是一個(gè)具有清晰細(xì)節(jié)的印鑒圖像。
應(yīng)用以上算法對(duì)整幅圖像進(jìn)行處理,得到的圖像為二值圖像,其中白色像素對(duì)應(yīng)于原始圖像的紅色印鑒。
采集彩色印鑒圖像如圖3所示,可以看出圖像分為灰色背景、紅色印章、黑色手寫體文字、藍(lán)色印刷文字和表格幾部分。
圖3 原始圖像
利用RGB彩色空間模型顏色信息的特點(diǎn),運(yùn)用算法(1)對(duì)圖3進(jìn)行處理?;綧ATLAB代碼如下:
image=imread('C:UsersdDesktop論文印章圖片stamp_1.bmp');
r=image(:,:,1);
g=image(:,:,2);
b=image(:,:,3);
exact_red=mod((r-g),255);
bw1=(exact_red>35);
圖4是經(jīng)過(guò)算法(1)處理后的二值圖像,其中白色像素對(duì)應(yīng)于印鑒圖像。由圖4可以看出,經(jīng)過(guò)處理后的印鑒圖像已從雜亂的背景中分離出來(lái),得到的是印鑒的一個(gè)粗略圖像,這是由于圖像受紙張、光照等因素的影響,在對(duì)印鑒圖像進(jìn)行分割時(shí),印鑒像素點(diǎn)與周圍一些非印鑒像素點(diǎn)之間并沒(méi)有一個(gè)精確的分離值,對(duì)于所選閾值n,一些非印鑒像素點(diǎn)也有可能滿足條件(mo d (r - g),255)> n,所以得到的印鑒圖像比實(shí)際印鑒圖像要大一些,并且很多細(xì)節(jié)都不清晰,圖像的視覺(jué)效果不好。
圖4 通過(guò)算法(1)提取的紅色印鑒
接下來(lái)需要對(duì)得到的粗略印鑒圖像進(jìn)行處理。將圖4與圖5進(jìn)行“與”操作,可以得到較好的具有清晰細(xì)節(jié)的印鑒圖像,見(jiàn)圖6。MATLAB代碼如下:
grayimage=rgb2gray(image);
bw2=im2bw(grayimage,0.6);
bw3=imcomplement(bw2);
multiply_bw=immultiply(bw1,bw3)。
比較圖4和圖6效果,可以知道,通過(guò)算法提取出的最終印鑒圖像的細(xì)節(jié)比較清晰,印鑒的視覺(jué)效果較好。
圖5 原始圖像的二值圖像
圖6 通過(guò)算法提取的最終圖像
大多數(shù)情況下,印鑒圖像易受隨機(jī)噪聲、印鑒色彩深度不均、印油量多少、蓋印力度大小等因素的影響。為了得到較好的印鑒提取效果,需要采取相應(yīng)的圖像處理方法來(lái)消除圖像中的噪點(diǎn)。
圖7是自適應(yīng)均值去噪后的圖像。通過(guò)算法提取出的最終印鑒圖像會(huì)存在一些噪點(diǎn),所以提取印鑒圖像后,還需要對(duì)圖像去噪,以得到較好的預(yù)處理結(jié)果。去噪的方法有很多,需要根據(jù)圖像中出現(xiàn)噪點(diǎn)的具體情況來(lái)確定去噪方法,文獻(xiàn)[2]詳細(xì)講解了多種去噪方法,這里就不再一一介紹。
由于受紙張、光照、印泥深淺的影響,得到的印鑒可能會(huì)出現(xiàn)殘缺現(xiàn)象,對(duì)于這種情況,需要對(duì)得到的印鑒進(jìn)行必要的修復(fù)。一般是采用形態(tài)學(xué)操作,但是該方法很容易造成欠填充或過(guò)填充,因此有學(xué)者提出了對(duì)稱分布填充算法和均勻分布二級(jí)填充算法。首先采用對(duì)稱分布填充算法填充小的空洞,然后采用均勻分布二級(jí)填充算法填充大的空洞,最后采用中值濾波來(lái)對(duì)印鑒進(jìn)行進(jìn)一步的修復(fù)和噪聲去除[1]。本文采用一般的形態(tài)學(xué)方法進(jìn)行印鑒的修復(fù),如圖8所示,可以看出圖8的視覺(jué)效果要優(yōu)于圖7。
圖7 自適應(yīng)均值去噪后的圖像
圖8 腐蝕后的圖像
印鑒圖像的自動(dòng)提取是票據(jù)自動(dòng)處理系統(tǒng)中的關(guān)鍵步驟,由于要把提取出的印鑒同預(yù)先保留的模板印鑒進(jìn)行比對(duì),通過(guò)求兩印鑒的相似性[6]來(lái)確定票據(jù)的真?zhèn)?,因此印鑒提取質(zhì)量的好壞直接影響票據(jù)的驗(yàn)證效果。印鑒提取效果好壞的關(guān)鍵在于所選閾值n的大小,這里并沒(méi)有一個(gè)確定的方法來(lái)確定閾值,只是根據(jù)個(gè)人經(jīng)驗(yàn),通過(guò)更改閾值,觀察不同閾值下的圖像提取效果,選取提取效果最理想的n值作為閾值。本文算法簡(jiǎn)單、計(jì)算速度較快,并且提取圖像的質(zhì)量較好,可為進(jìn)一步的印鑒識(shí)別提供保證。在接下來(lái)的工作中,需要研究如何以最快的速度來(lái)確定n值。
[1] 郭磊民.銀行驗(yàn)印系統(tǒng)中的印鑒自動(dòng)識(shí)別[D].重慶:重慶大學(xué),2005.
[2] (美)岡薩雷斯,伍茲.數(shù)字圖像處理[M].阮秋琦,阮宇智,譯.北京:電子工業(yè)出版社,2001.
[3] 馬麗霞,朱秋萍.圖像處理技術(shù)在印章識(shí)別預(yù)處理中的應(yīng)用[J].武漢大學(xué)學(xué)報(bào) 信息科學(xué)版,2004,29(8):691-693.
[4] Katsuhiko Ueda and Ken'ichi Matsuo. Automatic Seal Imprint Verification System for Bankcheck Processing[J]. Proceedings of the Third International Conference on Information Technology and Applications.IEEE,2005.
[5] 趙永濤,李志敏,王洪建,等.印章識(shí)別中的圖像預(yù)處理[J].儀器儀表學(xué)報(bào),2004,25(增2):401-403.
[6] 山海濤,郭建星,耿則勛.影像匹配中幾種相似性測(cè)度的分析[J].測(cè)繪信息與工程,2003,28(4):11-13.