肖春景 ,喬永衛(wèi) ,賀懷清 ,c
(中國民航大學 a.計算機科學與技術(shù)學院;b.工程技術(shù)訓練中心;c.天津市智能信號與圖像處理重點實驗室,天津 300300)
由于手寫體簽名在信用卡身份檢查、支票簽名及機場登機身份驗證等安全檢查方面的應用,使手寫體簽名自動識別已成為模式識別重要的研究領域。離線手寫體簽名識別已丟失書寫過程的動態(tài)信息,僅依靠簽名圖像的靜態(tài)信息,可用信息較少,識別難度較大。
目前的離線簽名識別有結(jié)構(gòu)和統(tǒng)計兩種方法。結(jié)構(gòu)方法中利用空間分布特征、筆段特征、輪廓檢測等方法提取字形結(jié)構(gòu)[1-2],對結(jié)構(gòu)特征較敏感,區(qū)分相似字的能力較強,但是結(jié)構(gòu)特征難以抽取,不穩(wěn)定;以自組織映射方法、神經(jīng)網(wǎng)絡、概率密度函數(shù)、支撐向量機等為主的統(tǒng)計方法[3-7],按一定的距離度量匹配準則,采用多維特征值累加的辦法,把局部噪聲和微小畸變淹沒在最后的累加和里,具有良好的魯棒性、較好的抗干擾抗噪聲的能力,但是可以用來區(qū)分“敏感部位”的差異也隨之消失。特征提取是這些方法中非常重要且必須的步驟,并且特征提取結(jié)果將影響分類器的設計和性能以及最后的識別結(jié)果?;诮y(tǒng)計的特征提取方法主要有灰度值、梯度、方向分布和灰度密度等方法,基于結(jié)構(gòu)的方法主要有簽名圖像寬高比、簽名點面積和圖像總面積比、連通域和網(wǎng)格個數(shù)等;基于偽動態(tài)特征的方法主要有筆鋒特征、簽名骨架方向的灰度特征、灰度面積等。這些特征提取方法基本都是基于復雜預處理和分割后二值圖像,并且提取過程不可逆。但是復雜數(shù)據(jù)預處理、較大計算量、復雜的過程、連筆現(xiàn)象導致的復雜分割都使特征提取變得非常困難。這些將直接影響識別系統(tǒng)的效率和結(jié)果。
為了解決復雜預處理、簽名分割和不可逆的特征提取等問題,本文提出了一種基于小波包的特征提取方法。首先,數(shù)據(jù)預處理過程只對簽名圖像進行了大小歸一化而沒有其他操作;其次,利用小波包對整個簽名進行分解并表示成二維空間上點的集合并利用這些點來進行手寫體簽名識別。其數(shù)據(jù)預處理簡單,不需要分割并且特征提取是完全可逆的,具有較好的抗噪性、魯棒性和適應性。
很多特征提取方法都是基于復雜數(shù)據(jù)預處理和圖像分割。數(shù)據(jù)預處理技術(shù)主要包括過濾、去噪、旋轉(zhuǎn)、變換、標準化、平滑、二值化等,這些導致計算量非常大或在書寫過程中要增加限制條件,并且因為連筆現(xiàn)象的存在使得圖像分割變得異常困難,這些都影響著算法的應用和識別效率。本文方法的數(shù)據(jù)預處理簡單,僅包含大小歸一化,沒有去噪、變換、旋轉(zhuǎn)和其他過程,這將保持原始簽名圖像的特征,增加其魯棒性和抗噪性,并且其特征提取是全局信息提取,不需復雜分割。因此,它可應用到含噪脫機手寫體簽名識別。本文共40類簽名,每類15個真簽名和10個偽簽名,每個簽名被歸一化為32×64大小。圖1和圖2列舉了40類簽名的實例。
圖1和圖2表明真實簽名和刻意模仿的偽簽名之間的差別非常小。這就要求識別系統(tǒng)的特征提取方法能夠提取它們之間的微小差別,以保證識別效果。
Coiffman等人提出的小波包理論將頻帶進行了多層次的劃分,對小波變換沒有細分的高頻部分進一步分解(如圖3所示),并能根據(jù)特征向量的特征自適應地選擇頻帶,克服了正交小波變換的不足,是一種更為精細的分析方法,現(xiàn)已被廣泛應用到了數(shù)字信號處理領域。
小波包分解算法為
從式(1)和圖3可以看出,在每一層被分解對象都被分解成4個子序列。第1個子序列是低頻部分描述被分解對象的主要特征,其他3個子序列是高頻部分描述被分解對象的細節(jié)部分。一個n×2n的高維信號經(jīng)過log2n層小波包分解可以表示成二維空間序列的形式。也即是高維空間的對象能夠表示成低維空間的形式,這起到了降維的作用。因此,可以把Rn空間轉(zhuǎn)換成多個二維空間的連接,也即是 Rn=R2?R2?…?R2,這里R?Q=({x,y)x∈R,y∈Q}。也就是說,2n 維空間上的點可分解成n個二維點。
小波包重構(gòu)公式為
式(2)表明利用此公式重構(gòu)4個子序列部分可以得到上一層的父節(jié)點,基于此方法經(jīng)過n層重構(gòu)可以得到最原始的信號。
簽名圖像可看成是高維空間的信號,經(jīng)過若干層的小波包分解后可被表示成二維空間的點,這些點即為簽名圖像的特征值。因此經(jīng)過n=log2m層小波包分解,m×2m大小的簽名圖像可以表示成m×m個二維空間的點的集合。原始簽名數(shù)據(jù)在二維空間上都有其相應的分量,利用小波包重構(gòu)算法對這些分量進行重構(gòu)可得到原始的簽名圖像。本文中簽名圖像已被歸一化成32×64,因此,這里m=32,n=5分解后的二維點的集合為?R2,i=1,2,…,L,k=1,2,…,Sf,其中 L 為樣本的類別40,Sf為第5層小波包分解的頻段數(shù)1024。圖4為第9類簽名“”分解后的二維點集合的例子。
圖4(a)為簽名圖像完整的特征提取圖。從圖4(a)可以看出簽名圖像的能量主要集中在兩部分,具有較大值的低頻部分和特征值集中在0附近的高頻部分。如果僅保留低頻部分而忽略高頻部分,簽名圖像的細節(jié)將丟失,這些細節(jié)對于識別結(jié)果將有至關(guān)重要的影響。圖4(b)是高頻部分的放大圖。從圖4(b)可以看出高頻部分存在著一定的聚集性。在建立識別模型的過程中可以利用其聚集性,這樣不但保留了高頻的特征又沒有過多的增加計算量,具體的應用過程可以參見文獻[6~7]。
通過特征提取的整個過程可以看出,如果對小波包分解得到的二維點進行重構(gòu)可以得到原始信號的完整圖片而沒有任何信息的丟失。但一般的特征提取是一個從Rn→(fx)Rm,n>m的降維過程并且該過程不可逆,即利用 (fx)把x1∈Rn映射成y1∈Rm后,幾乎所有特征提取方法卻不能利用(fx)-1把y1∈Rm完全映射到x1∈Rn,而利用小波包分解對簽名數(shù)據(jù)進行特征提取是完全且可逆的過程。把經(jīng)過小波包分解得到的二維向量集合進行小波包重構(gòu)即可得到原始的簽名圖像數(shù)據(jù),在整個分解與重構(gòu)的過程中沒有信息丟失,保證了對簽名進行充分的特征提取。
本文利用Matlab 7.0進行數(shù)據(jù)仿真,共采集到40人簽名,每人15個,其中10個作為訓練樣本、5個作為測試樣本。偽簽名共400個,每類10個,由6個人去模仿真實簽名得到。試驗過程中分別采用haar、db4、sym8、coif3、bior2.6 幾種不同的小波基對圖像進行了特征提取,試驗結(jié)果如表1所示。
表1 不同小波基的識別結(jié)果Tab.1 Results of different wavelets
由試驗結(jié)果可知,不同小波基對于識別結(jié)果影響很小,因而本文采用了最簡單的haar小波基,動態(tài)聚類的范圍NUM=2,并把本文方法與比較成熟的HMM方法進行了比較。HMM方法每個數(shù)據(jù)分成4段,每段3個狀態(tài),Viterbi算法估測最佳路徑,試驗結(jié)果如圖5和圖6所示。
由圖5和圖6可知,本文方法共識別184個測試樣本,誤識25個,識別率和誤識率分別為92%和6.25%,而隱馬爾可夫識別175個,誤識34個,識別率和誤識率分別為87.5%和8.5%,本文方法的識別率略高于HMM方法,誤識率稍低于HMM方法,得到了比較滿意的結(jié)果。本文方法數(shù)據(jù)預處理簡單,原始圖像的特征得到最大保留,這樣增加了其魯棒性和抗噪性;它能提取全局信息,避免了復雜分割;利用小波包特征提取是完全可逆的過程,而一般方法不但細節(jié)丟失而且不可逆。
本文提出了一種基于小波包的特征提取方法,其僅需簡單的數(shù)據(jù)預處理,提取全局信息,避免復雜分割,特征提取過程完整可逆。試驗結(jié)果表明:其識別率較高、誤識率較低,并且具有很好的抗噪性和魯棒性,是含噪脫機手寫體簽名識別的一種可行解決方案。
[1]PESSOA L F C,MARAGOS P.Neural networks with hybrid morphological/rank/Li-near nodes:a unifying framework with applications to handwritten character recognition[J].Pattern Recognition,2000,33:945-960.
[2]LV HAIRONG,WANG WENYUAN,WANG CHONG,et al.Offline Chinese signature verification based on support vectormachines[J].Pattern Recognition,2005,26:2390-2399.
[3]ALESSANDRO L KOERICH,ROBERT SABOURIN,CHING Y.Recognition and verification of unconstrained handwritten words[J].IEEE Transaction on Patten Analysis and Machine Intelligence,2005,27:1509-1522.
[4]MOHAMED M A,GADER P.Generalized hidden markov modelspartⅡ:application to handwritten word recognition[J].IEEE Trans Fuzzy Systems,2000,8(1):82-95.
[5]鄧穎娜.手寫體簽名真?zhèn)舞b別技術(shù)的研究[D].西安:西安理工大學,2006.
[6]肖春景,李春利,喬永衛(wèi),等.用于手寫體簽名識別的小波包混合高斯模型[J].計算機工程與應用,2009,45(36):161-164.
[7]肖春景,李春利,張 敏.脫機手寫體簽名識別的小波包隱馬爾可夫模型[J].計算機應用,2010,30(2):445-448.