阿布都熱衣木·熱西丁
(和田師專 新疆和田 848000)
基于Gabor小波的維吾爾文筆跡的特征提取方法研究
阿布都熱衣木·熱西丁
(和田師專 新疆和田 848000)
本文提出使用Gabor小濾提取維吾爾文筆跡的紋理特征方法。首先,通過(guò)預(yù)處理形成維吾爾文紋理圖像。按照維吾爾文筆跡的特點(diǎn),對(duì) Gabor濾波器進(jìn)行改進(jìn)。然后用一組Gabor濾波,過(guò)濾后獲得圖像的高維特征向量。最后,最鄰近分類器(NN)分類器對(duì)不同17名人的維吾爾文筆跡樣本進(jìn)行分類實(shí)驗(yàn),并獲得79.8%的鑒別率。
筆跡鑒別;維吾爾文筆跡;Gabor小波NN
長(zhǎng)期以來(lái),手寫體筆跡的識(shí)別是模式識(shí)別領(lǐng)域中的一個(gè)非?;钴S的研究課題。[1]作為一種身份鑒別的手段,它有許多優(yōu)點(diǎn)。手寫筆跡容易獲取,而且不同的人具有不同的筆跡。筆跡是書寫者的影子,書寫習(xí)慣的多樣性決定了一個(gè)人的筆跡是獨(dú)一無(wú)二的。另外,由于筆跡的本質(zhì)是自我的再現(xiàn),因此各類模仿、偽裝的最終結(jié)果都是徒勞的。因此,按照每個(gè)人的手寫體所包含的紋理特性,經(jīng)過(guò)一系列相關(guān)處理,便可以識(shí)別一份手寫體是否為某人所寫,這正是本文所要研究的。
筆跡鑒別是根據(jù)人的手寫筆跡判斷書寫人身份的一門科學(xué)與技術(shù)。[2]鑒別方法按照樣本的輸入方法分為兩大類:在線(on-line)和離線(off-line)筆跡鑒別。[2][3][4]前者用連在計(jì)算機(jī)的轉(zhuǎn)換設(shè)備,書寫的運(yùn)動(dòng)過(guò)程轉(zhuǎn)換成信號(hào)序列,然后把這些信息傳送到計(jì)算機(jī)。而后者往往把書寫樣本掃描成二維圖像后輸入計(jì)算機(jī)再處理。
近幾年來(lái),在筆跡鑒別領(lǐng)域已出現(xiàn)一些新方法。Said等[3][4]把筆跡鑒別工作對(duì)待為紋理分析問(wèn)題并使用多通道Gabor濾波器和灰度共生矩陣(Grey-scale co-occurrence matrix,GSCM)技術(shù)。Leedham等在文獻(xiàn)[5]表示容易被提取的一組11個(gè)特征用于文擋中的手寫數(shù)字的識(shí)別與驗(yàn)證。其他研究人員(Arora等,[6]Zuo等[7])對(duì)筆跡鑒別采用多種特征綜合的方法。Z. yu He等[8]提出基于小波的GGD方法來(lái)代替?zhèn)鹘y(tǒng)的二維Gabor濾波器。Najoua和Gazzahl[9]對(duì)文本依存的阿拉伯文的筆跡鑒別提出全局特征特征和機(jī)構(gòu)特征相結(jié)合的一種新方案。這些研究者都認(rèn)為筆跡是跟包含一些特殊紋理的圖像一樣。關(guān)于筆跡鑒別的這些文獻(xiàn)主要為基于拉丁文的、基于中文的,[7][8]甚至基于阿拉伯文的。但是,對(duì)維吾爾文筆跡鑒別[10][11]有關(guān)的只有兩個(gè)文獻(xiàn),其中文獻(xiàn)[10]研究預(yù)處理和用濾波Gabor特征提取。文獻(xiàn)[11]也就是我們以前的研究表明 Gabor濾波和遺傳算法(Genetic algorithm,GA)用于特征提取的初步研究結(jié)果,而且它的鑒別率需要提高。結(jié)合維吾爾文筆跡的特點(diǎn),實(shí)現(xiàn)現(xiàn)有的算法或開發(fā)新的、有效的算法和方法具有很大的研究空間。
本文用Gabor小波來(lái)提取維吾爾文筆跡圖像的特征,并用最鄰近分類器對(duì)紋理進(jìn)行分類的方法。首先,通過(guò)預(yù)處理,獲得維吾爾文紋理圖像。然后訓(xùn)練的樣本從紋理圖像中隨即選定,于是使用Gabor小波變換,提取特征。最終選用歐氏距離的最鄰近分類器來(lái)分組基于這些特征的試驗(yàn)圖像。
輸入到計(jì)算機(jī)的圖像包含大小不同的維吾爾文字符、文本行之間的空間甚至噪聲。因此,特征提取之前,原始圖像首先要被處理。通常,預(yù)處理的步驟如下:第一,消除筆跡圖像中的噪聲;第二,定位文本行和用投影方法分割每一個(gè)單詞;第三,每個(gè)字符的大小進(jìn)行歸一化;最后、文本的傾斜矯正并生成紋理圖像。對(duì)文本獨(dú)立的特征提取方法,我們?cè)O(shè)計(jì)能產(chǎn)生紋理圖像的預(yù)處理方法。由于有些論文討論預(yù)處理,[12][3]而且在本論文中預(yù)處理不是我們的重點(diǎn)問(wèn)題,因此在這里不能詳細(xì)地說(shuō)明我們的預(yù)處理方法。預(yù)處理的一個(gè)例子如圖1所示。
圖1 預(yù)處理用例之一
許多紋理分析技術(shù)應(yīng)用于特征提取比如,如基于行的頻譜分辨法(Line-based spectrum resolution,LBSR),通道分解法(Multi channel decomposition,MCD),多通道Gabor小波,[2][5]灰度共生矩陣法,PS法[4]等。其中多通道Gabor小波被普遍使用與紋理分析,并且成功地應(yīng)用在圖像處理的寬廣的范圍。[13]
3.1 Gabor小波。在文獻(xiàn)[1 3]、[13]中表達(dá)的二維Gabor濾波器數(shù)學(xué)公式為:
其中,f為中心頻率,θ為方向參數(shù),he(x,y)和 ho(x,y)分別表示偶、奇對(duì)成的Gabor濾波器。該二維Gabor濾波器的頻率形式為:
其中He(u,v)和Ho(u,v) 偶、奇對(duì)成的Gabor濾波器,為虛單位,且H1(u,v) 及 H2(u,v)為:
其中f,及σ分別表示Gabor濾波器的中心頻率、方向參數(shù)及空間常數(shù)。對(duì)給定的一個(gè)輸入圖像,Ho和He用不同的f,及σ值,提供并組合輸入圖像的不同通道的輸出。
紋理特征提取要求中心頻率和方向參數(shù)。文獻(xiàn)[14]指出,尺寸為N×N(N是2的正數(shù)次冪)的圖像的中心頻率為≤N/4。因此對(duì)于維文筆跡圖像N分別選取為64,因此、中心頻率f選為2、4、8及16周/度。每一個(gè)中心頻率f,方向參數(shù)θ選為0°、30°、60°、90°、120°及150°的濾波被完成,這樣可以輸出24個(gè)輸出圖像(每一種頻率的為6個(gè))。這些輸出圖像的均值和標(biāo)準(zhǔn)方差被選為紋理特征。這樣,從給定的圖像中提取48個(gè)特征。它們形成48維的特征向量。
3.2 歐氏距離。特征提取以后,筆跡鑒別的問(wèn)題就是一個(gè)典型的模式匹配和識(shí)別問(wèn)題。而這些問(wèn)題往往通過(guò)選用適當(dāng)?shù)姆诸惼鱽?lái)解決。分類器一般有其分類標(biāo)準(zhǔn)。
從相關(guān)文獻(xiàn)中了找了10個(gè)與距離相關(guān)的分類標(biāo)準(zhǔn),目的是通過(guò)實(shí)驗(yàn)從中找出適合于維文的分類器。這10個(gè)分類標(biāo)準(zhǔn)依次為歐氏距離、加權(quán)歐氏距離、普通距離、相似度、特征距離、向量間距離、Canberra距離、混合馬氏距離、Jacquard系數(shù)、Dice系數(shù)。[15]而本文所使用的歐氏距離是與距離相關(guān)的分類標(biāo)準(zhǔn)常用的一種,其數(shù)學(xué)表達(dá)式分別如式(5)所示:
式子(5)中,ui和vi分別為特征向量,i=1,2,…n。
3.3 最鄰近分類器。最近鄰分類器(Nearst Neighbour Classifier,NN)是通過(guò)決策規(guī)則來(lái)進(jìn)行筆跡的分類。對(duì)于最近鄰決策規(guī)則,假設(shè)有c個(gè)類別ω1,ω2,…,ωc 的模式識(shí)別問(wèn)題,每類又表明類別的樣本有Ni個(gè),i=1,2,…,c,可以規(guī)定類的判別函數(shù)為:
其中xik的角標(biāo) i 表示ωi類,k表示ωi類Ni個(gè)樣本中的第k個(gè)。按照上式?jīng)Q策規(guī)則可寫為,若[16]:
最近鄰決規(guī)則一般解釋是相當(dāng)簡(jiǎn)單的,就是說(shuō)對(duì)未知樣本 x,我們只要比較x與個(gè)已知樣本之間的歐式距離,并可以決策它最近的樣本同類。
最近鄰分類器本文由Matlab編程實(shí)現(xiàn),在具體應(yīng)用中圖像的平均值和方差兩組特征值變化幅度不一致,不同通道方差變化比平均值變化較大,因此在分類時(shí)對(duì)平均值放大近十倍。
考慮年齡、性別、文化程度等因素,選擇17名維吾爾族參與者,并要求每一個(gè)參與者用自己的自然書法抄寫兩份某一文本。這手寫的文檔用HP掃描儀以300dpi分辨率輸入計(jì)算機(jī)。后對(duì)這些文檔進(jìn)行預(yù)處理。每一位書寫者的一個(gè)樣本用于訓(xùn)練,另一個(gè)用于測(cè)試。
在我們的實(shí)驗(yàn)中,所有的手寫筆跡掃描輸入到計(jì)算機(jī)。選擇每一個(gè)筆跡圖像的尺寸為256×256像素。為了制作屬于同一類的小圖像,每一個(gè)256×256的圖像被劃分為不超過(guò)64×64的子圖像,這樣每個(gè)圖像形成16個(gè)子圖像(如圖1[b])。來(lái)自第一個(gè)樣本的 12個(gè)子圖像用于訓(xùn)練數(shù)據(jù),第二個(gè)樣本的8個(gè)子圖像用于測(cè)試數(shù)據(jù)。
從文本中提取的48個(gè)特征用NN分類器,在Gabor濾波提取的特征實(shí)驗(yàn)中獲得79.8%的鑒別率。
本文討論基于維吾爾文的離線、文本獨(dú)立的筆跡鑒別。使用Gabor小波方法提取48個(gè)特征,用NN分類器完成分類實(shí)驗(yàn)。實(shí)驗(yàn)表明Gabor小波的特征提取及選擇方法比已用其它特征選擇方法獲得更高的識(shí)別率。
讓實(shí)驗(yàn)結(jié)果有更強(qiáng)的說(shuō)服力,我們將嘗試使用其它特征提取及選擇方法。我們將計(jì)劃使用其它新的、更有效的分類器比如貝葉斯分類器(Bayesian classifier),線性判別分類器(Linear discriminate classifier,LDC),支持向量機(jī)(Support vector machine,SVM)分類器,加權(quán)歐氏距離分類器(Weightd euclidean distance,WED)等。除此之外還要增多實(shí)驗(yàn)中的樣本數(shù)。
[1]劉成林,戴汝為,劉迎建.簡(jiǎn)化的Wigner分布及其在筆跡鑒別中的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),1997(11),P1018-1023.
[2]R. Plamondon,G. Lorette,“Automatic signature verification and writer identification-the state of the art”. Pattern Recognition,vol. 22,1989,P107-131.
[3]H.E.S. Said,T.N. Tan,and K.D. Baker,“Personal identification based on handwriting”. Pattern Recognition,vol 33,No. 1,2000,P149-160.
[4]A.AL-Dmour,R. A. Zitar,“Arabic writer identification based on hybrid spectral-statistical measures”. Journal of Experimental & Theoretical Artificial Intelligence,vol. 19, No. 4,2007,P307-332.
[5]G. Leedham and S. Chachra, “Writer identification using innovative binarised features of handwritten numerals”,In Proc. of 7th Int. Conf. on Document Analysis and Recognition,2003,P413-417.
[6]H. Arora,S. Cha,S. Lee,S. N. Srihari,“Individuality of handwriting”,J. Forensic. Sci.47,2002,P1-17.
[7]L. Zuo,T. N. Tan,Y. Wang,“Personal identification based on PCA”. In Proceeding of International Conference on Image and Graphics,2002 .
[8]Z. Y. He,B. Fang,J. W. Du,Y. Y. Tang and X. You,“A novel method for Off-line handwriting-based writer identification”. In Proc. of 8th Int. Con. on Document Analysis and Recognition,2005.
[9]E.B.A. Najoua and S. Gazzahl,“Neural networks and support vector machines for writer identification using Arabic scripts”,presented at International Conference on Machine Intelligence,2005.
[10]李媛,卡米力·毛依丁.維吾爾筆跡鑒別研究[J].計(jì)算機(jī)科學(xué)與發(fā)展,2008(5).
[11]K. Ubul,A. Hamdulla,A. Aysa,A. Raxidin,and R. Mahmut,“Research on Uyghur off-line handwriting-based writer identification”,In proc. of 9th Int. conf. of signal processing(ICSP2008),2008,P1656-1659.
[12]G.S. Peake,T.N. Tan,“Script and language identification from document images”,In Proc. of British Machine Vision Conference,Vol. 2,1997,P169-184.
[13]A.K. Jain and F. Farrokhnia,“Unsupervised texture segmentation using Gabor filters”,Pattern Recognition,vol. 3,1992,P607-610.
[14]T.N. Tan,“Texture feature extraction via visual cortical channel modeling”,Proc. of the 11th Int. Conf. on Pattern Recognition,vol. 3,1992,P607-610.
[15]苗曉峰. 基于紋理的文本依存的離線筆跡鑒別[D]. 河北工業(yè)大學(xué),2006.
[16]Cover T. M.,Hart P. E. Nearest neighbour pattern classification. IEEE Trans. Information Theory,1967,P21-27.
This paper proposes a method for texture feature extraction by Gabor wavelet filters for Uyghur handwriting image. The texture image is firstly formed by pre-processing steps. Gabor filter improved according to the characteristics of Uyghur hand writing. Then higher dimensional feature vectors are constructed from the filtered texture images. Finally, experiments were performed using NN classifier to Uyghur handwriting samples from 17 different people and promising results of 79.8% correct identification rate were achieved.
writer identification; Uyghur handwriting; Gabor wavelet; NN
阿布都熱依木·熱西丁(1975-),男,維吾爾族,碩士,和田師專計(jì)算機(jī)專業(yè)講師,研究方向:軟件工程。
2010-08-16