吳坤帥,魏仲慧,何 昕,李佩君
(1. 中國科學(xué)院 長春光學(xué)精密機(jī)械與物理研究所,吉林 長春 130033;2. 中國科學(xué)院大學(xué), 北京 100049;3. 中國人民解放軍63850部隊,吉林 白城 137000)
簽名是一項方便快速的個人身份認(rèn)證方式,具有使用簡單方便和簽名特征穩(wěn)定可區(qū)分等優(yōu)點,應(yīng)用范圍廣泛。由于個人簽名容易被刻意偽造,因此簽名筆跡檢測科學(xué)也隨之誕生,而計算機(jī)技術(shù)的高速發(fā)展,筆跡識別科學(xué)逐步進(jìn)入與計算機(jī)技術(shù)緊密結(jié)合的新時代。使用計算機(jī)進(jìn)行簽名識別有著速度快和數(shù)據(jù)量大的優(yōu)點,適合于對大量簽名進(jìn)行初步的篩選,給出一份或者數(shù)份待選的正確結(jié)果,節(jié)省人力和物力。簽名識別技術(shù)一般包括圖像預(yù)處理,特征提取,特征分類3個組成部分。近年來,國內(nèi)外的學(xué)者進(jìn)行了大量理論研究和實際探索,提出了許多巧妙的識別方法,并取得了一定的成果。
Ferrer等在不同背景污染的情況下,提取簽名圖像的局部二值模式(Local Binary Pattern, LBP)特征用于識別[1]。Ferrer等的樣本大多是在書寫在發(fā)票及支票等常用書寫載體上,污染多為下劃線和水印等常見污染,此研究與現(xiàn)實應(yīng)用場景相近,有很高的應(yīng)用價值,但對熟練仿寫的簽名鑒別效果有限。Okawa使用視覺詞袋模型結(jié)合KAZE算法和VLAD(Vector of Locally Aggregated Descriptors)來研究簽名識別。Okawa結(jié)合了計算機(jī)視覺領(lǐng)域的兩個最新算法到簽名識別之中,大大提高了識別的正確率,對偽隨機(jī)簽名數(shù)據(jù)集的識別率達(dá)到最先進(jìn)的水平。但是其數(shù)據(jù)集包含了較多隨機(jī)簽名的原因,分辨難度低,應(yīng)用價值有限[2-3]。Cui等使用AlexNet進(jìn)行簽名識別,總正確率為87.5%。他直接使用神經(jīng)網(wǎng)絡(luò)提取并進(jìn)行分類,避免了人工選擇特征,但神經(jīng)網(wǎng)絡(luò)需要的簽名數(shù)據(jù)量較大,現(xiàn)實生活中很難滿足[4]。Maergner等使用圖編輯距離(Graph Edit Distance)度量兩個簽名的相似度,并使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,在公共數(shù)據(jù)集GPDS的隨機(jī)偽簽名集上取得了很高的識別正確率,但在熟練簽名集上的效果明顯差于隨機(jī)簽名集[5]。祖麗皮亞使用統(tǒng)計特征研究維吾爾簽名的識別,統(tǒng)計不同方向上的像素點的數(shù)目作為特征特征向量。統(tǒng)計特征提取簡單快速,實現(xiàn)方便,提高了識別的速度,但需要大量的訓(xùn)練數(shù)據(jù)才能達(dá)到良好的識別效果[6]。
雖然目前的研究取得了一定的成果,但依然存在一些問題:盡管使用了不同的數(shù)據(jù)集、特征、分類器以及正確率評判的標(biāo)準(zhǔn),國內(nèi)外大多數(shù)的簽名識別方案的識別成功率在85%~95%之間(錯誤率在5%~15%)[7-12],使用熟練簽名集的正確率要明顯低于使用偽隨機(jī)簽名集的正確率,要達(dá)到較高的識別正確率則需要大量的訓(xùn)練數(shù)據(jù)。而在現(xiàn)實生活中,需要我們識別的大多是熟練仿寫的簽名,許多情況下我們能獲取的簽名數(shù)據(jù)也是有限的。
在計算機(jī)簽名識別中,簽名識別的成功率不會無限地提升,它存在一個上限。計算機(jī)通過計算待識別樣本和真實簽名的特征相似程度,給出真?zhèn)闻袛?,而精心模仿的簽名與真實簽名的相似度甚至可能要高于兩個真實簽名之間的相似度。因此,只要研究真實簽名的書寫規(guī)律,仿寫人就能夠?qū)懗霰M可能與真實簽名相似的簽名。這也是熟練偽造數(shù)據(jù)集識別成功率低的原因。二維特征簽名識別都忽略了筆跡的三維信息,而這些信息是仿寫人難以模仿的。
國內(nèi)外的研究人員對筆劃的三維深度特征進(jìn)行過一定的研究,但目前還處于起步階段,大多還未使用深度特征直接進(jìn)行簽名識別。Furukawa[13-14]采集了大量橫豎撇捺筆劃,發(fā)現(xiàn)同一書寫者筆劃深度之間的差異明顯小于不同書寫者之間的差異,這為深度特征在簽名識別上的應(yīng)用提供了理論支持,但他還沒有使用完整的簽名進(jìn)行研究。申思[15]等研究了套摹簽名與原始簽名行筆過程中壓痕曲線變化,發(fā)現(xiàn)原始簽名在行筆過程中的極值點位置(反映了行筆筆力的變化)具有一定的穩(wěn)定性,而同一套摹人的套摹簽名之間的極值點位置變化較大。申思的研究證明,摹寫簽名之間的深度特征變化大于原始簽名,這是由個人書寫習(xí)慣所決定的。目前的研究已經(jīng)證明筆劃三維深度特征中蘊含了書寫者的個人特征,具有進(jìn)行簽名識別的理論基礎(chǔ)。
本文旨在研究簽名筆劃三維深度特征,對獲取的簽名筆劃進(jìn)行掃描和去噪處理,提取筆劃的深度信息,在熟練仿寫簽名數(shù)據(jù)集上進(jìn)行分類,證明三維深度特征在簽名識別上的有效性。
熟練偽造簽名與真實簽名的二維特征可以非常相似,而三維特征卻難以進(jìn)行模仿。中文漢字中,筆劃橫、豎、撇、捺的出現(xiàn)頻率很高,在書寫這4個筆劃的過程中,起筆、行筆以及收筆的力度大致是穩(wěn)定的,是由人的書寫習(xí)慣影響的,包含了個人的生物學(xué)特征。在其他書寫條件不變的情況下,書寫力度短期內(nèi)不會發(fā)生較大的改變,因此可以用來識別書寫者的身份。書寫時的力度信息屬于動態(tài)特征,在離線簽名識別中,無法獲取書寫者寫下簽名時的力度信息,但是可以用深度信息來代替力度信息。圖1為簽名識別系統(tǒng)原理圖,它由顯微鏡掃描系統(tǒng)、簽名預(yù)處理、特征提取以及分類器4個主要模塊組成。
圖1 簽名識別系統(tǒng)原理圖Fig.1 Block diagram of signature recognition system
(1)簽名筆劃的采集。簽名筆劃的深度信息需要專業(yè)的掃描設(shè)備,這里使用高精度的體式顯微鏡采集簽名筆劃的表面形態(tài)。顯微鏡的Z軸精度為0.1 μm,一般情況下,筆劃的深度為10~60 μm之間,因此,采集誤差在可接受范圍之內(nèi)。采集到的信息以矩陣的形式等間隔存儲筆劃的表面深度信息,點云相鄰點之間的距離均相等,因此只按順序存儲下點的深度信息,不存位置信息,矩陣的長和寬分別為筆劃的長和寬,值為該位置點的深度。筆劃的深度信息存儲方式與灰度圖像的存儲方式類似,因此可以將深度信息當(dāng)作圖像來處理,作為筆劃的深度圖像。
(2)噪聲去除。采集到的筆劃表面形態(tài)帶有噪聲,需要先進(jìn)行濾波。深度圖像中的噪聲主要來源于機(jī)器運轉(zhuǎn)時的微小振動,屬于隨機(jī)噪聲。我們參考圖像處理中圖像去噪的方法過濾深度圖像的隨機(jī)噪聲。高斯濾波是一種線性平滑濾波,對于濾去圖像中的高斯或近高斯噪聲有著非常好的效果。根據(jù)國際標(biāo)準(zhǔn)ISO11562規(guī)定,當(dāng)使用高斯濾波器作為建立表面輪廓基準(zhǔn)線的濾波器時,規(guī)定的權(quán)函數(shù)為:
(1)
(2)
其中:λc為截止波長,λ=λc時,濾波器的阻尼系數(shù)為0.5。二維的高斯卷積核由水平和垂直方向的卷積和直接卷積而來:
s2D(x,y)=sx(x)?sy(y),
(3)
在頻域上表現(xiàn)為:
S2D(X,Y)=Sx(X)·Sy(Y).
(4)
深度圖像與高斯濾波器進(jìn)行卷積,得到去除噪聲的圖像F(X,Y) 。
F(X,Y)=Fo(X,Y)·S2D(X,Y).
(5)
進(jìn)行深度圖像采集時發(fā)現(xiàn),除了噪聲外,紙面粗糙度也會對特征提取造成一定的影響。常見書寫紙一般表面不平整,還帶有一定的紙質(zhì)纖維和雜質(zhì)。這造成在未書寫的情況下,紙面的峰-谷可能會達(dá)到幾微米,這已經(jīng)與較輕的筆劃造成的深度相近了。通常情況下,這些粗糙點都是凸出紙面的,影響最高點的選取。因此我們在沿筆劃橫截面上,選擇橫截面平均值與最低值的差作為該截面的高度,并計算整個筆劃的深度,即:
(6)
通過式(6)可得到沿筆劃方向的深度矩陣,矩陣的長度為筆劃的長度。深度矩陣維數(shù)較大,不適合直接用作特征分類,還需要進(jìn)一步處理,選擇深度矩陣的統(tǒng)計特征作為筆劃的深度特征。常用的使用統(tǒng)計特性有平均值、標(biāo)準(zhǔn)差和矩陣的熵3種。筆劃深度的平均值反映了筆劃在行筆過程中的平均力度;沿筆劃方向的深度標(biāo)準(zhǔn)差反映了行筆過程中的力度變化;深度矩陣的熵是圖像處理和計算機(jī)視覺學(xué)科中度量圖像紋理隨性的一個常用特征,用來度量深度矩陣的隨機(jī)性。深度平均值一致的兩個筆劃,在行筆上也可能不同,這樣他們的熵值就有所區(qū)別。當(dāng)深度矩陣中的數(shù)值差異較大時,熵的值就會小,當(dāng)深度矩陣中所有值一致時,熵值取最大值[16]。以上3個特征分別由以下公式計算:
(7)
(8)
(9)
上式中,N為筆劃的采集行數(shù)。將一個簽名的所有筆劃提取的統(tǒng)計特征合在一起,作為簽名的完整深度特征。
傳統(tǒng)簽名識別中廣泛運用的分類方法有支持向量機(jī)(Support Vector Machine,SVM),K-近鄰分類(K-Nearest Neighbor, KNN)以及人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)等。由于不同的數(shù)據(jù)集在不同分類器上的效果各有優(yōu)劣,因此我們同時使用這3種分類器來進(jìn)行分類,尋找最適合我們樣本的分類器。
2.3.1 SVM
SVM 是一種成熟的特征分類算法。在本實驗中,它的目的是尋找一個超平面,將不同書寫者簽名的深度特征向量,以最大的間隔分類在超平面兩側(cè)。距離超平面最近的點稱為支持向量。最靠近超平面的數(shù)據(jù)點與超平面之間的距離越大,分類效果越好。
2.3.2 KNN
K-近鄰算法是機(jī)器學(xué)習(xí)中簡單有效的分類算法,它計算待測樣本特征向量與已知簽名庫特征向量之間的距離,并選舉出K個最相鄰的數(shù)據(jù),通過統(tǒng)計這些數(shù)據(jù)的標(biāo)簽,得到樣本的歸屬判斷。KNN參數(shù)較少,實現(xiàn)方便,適合在樣本較少的情況下使用。它的主要流程如下:
(1)計算待分類簽名特征向量與簽名庫簽名特征向量之間的距離,并按照遞增排序;
(2)選取K個最相鄰的數(shù)據(jù);
(3) 統(tǒng)計這K個數(shù)據(jù)的標(biāo)簽出現(xiàn)次數(shù),并得到出現(xiàn)頻次最高的數(shù)據(jù)樣本,即為待測樣本的預(yù)測分類。
2.3.3 ANN
人工神經(jīng)網(wǎng)絡(luò)是用來模擬人類大腦中神經(jīng)元的工作方式的人造模型。1986年,Rumelhar和Hinton等人提出了反向傳播(Backpropagation,BP)算法,它的主要特點是特征向量前向傳遞,而誤差反向傳播,通過不斷修改神經(jīng)網(wǎng)絡(luò)權(quán)重和偏置,使得網(wǎng)絡(luò)的最終輸出與期望輸出盡可能接近,以達(dá)到訓(xùn)練的目的。本實驗中,只使用神經(jīng)網(wǎng)絡(luò)作為分類器,輸入神經(jīng)網(wǎng)絡(luò)的特征是我們上一步提取到的深度特征。
簽名識別中常用的評判標(biāo)準(zhǔn)有錯誤拒絕率、錯誤接受率和錯誤率3種,這里我們使用前兩種。并引入總正確率作為兩個指標(biāo)的綜合評判標(biāo)準(zhǔn)。
錯誤拒絕率(False Rejection Rate, FRR),F(xiàn)RR是真實簽名當(dāng)作偽造簽名被系統(tǒng)拒絕的概率,即輸入識別系統(tǒng)的簽名為真實簽名,考察系統(tǒng)將簽名當(dāng)作是偽造簽名的概率。
(10)
錯誤接受率(False Acceptance Rate,F(xiàn)AR),是偽簽名當(dāng)作真實簽名被系統(tǒng)接受的概率,即輸入識別系統(tǒng)的簽名為偽造簽名,考察系統(tǒng)將簽名當(dāng)作真實簽名接受的概率。
(11)
再使用總正確率考察兩個指標(biāo)的綜合結(jié)果,總正確率以公式(12)求得:
(12)
為了使簽名的二維特征盡可能地相似,偽造簽名使用套摹的方式得到。仿寫人獲得真實簽名后,經(jīng)過一定的練習(xí),對真實簽名進(jìn)行摹寫。真實簽名與偽造簽名對比如圖2所示。選取簽名中的長豎筆劃進(jìn)行三維掃描,獲取深度矩陣,真實簽名與偽造簽名的對比如圖所示。我們可以看到,真實簽名與偽造簽名的二維特征難以用肉眼進(jìn)行區(qū)分,特征很相似,而筆劃的深度特征有明顯的區(qū)別,難以進(jìn)行模仿。
圖2 真實簽名與套摹簽名對比。(a)真實簽名與“帥”字長豎筆劃的深度走勢圖;(b)套摹簽名與長豎深度走勢圖。Fig2 Real signature versus forgery signature. (a)Real signature and depth chart of the vertical stroke of character “帥”; (b)Forgery signature and the depth chart of the corresponding stroke.
實驗中使用的簽名數(shù)據(jù)是書寫人在平和的條件下寫下的,排除環(huán)境因素對簽名深度的影響。采集真實簽名與其熟練仿寫簽名各10個,共計19組,即380個簽名。每個簽名圖像采集5~6個筆劃,每個筆劃提取3個特征(即平均深度,沿筆劃方向深度標(biāo)準(zhǔn)差和深度矩陣的熵),即每個簽名提取15~18個特征,真實簽名及其仿寫簽名采集的筆劃部位一致。
為了防止過擬合,使用數(shù)據(jù)增強(qiáng)增加數(shù)據(jù)集。常用的數(shù)據(jù)增強(qiáng)方法有:翻轉(zhuǎn)、旋轉(zhuǎn)、平移、縮放、裁剪以及增加噪聲。大量的實驗表明,數(shù)據(jù)增強(qiáng)能明顯增加識別系統(tǒng)的泛化能力和魯棒性,減少錯誤識別率。這里我們使用增加噪聲的方法進(jìn)行數(shù)據(jù)增強(qiáng),將數(shù)據(jù)集擴(kuò)展到原先的兩倍。具體增加數(shù)據(jù)集的方法為:首先使用隨機(jī)數(shù)生成器產(chǎn)生在[-10,10]之間的隨機(jī)矩陣,隨機(jī)矩陣的維數(shù)與簽名圖像的特征維數(shù)一致;將隨機(jī)矩陣乘以一個噪聲因子,此處設(shè)為0.01,并與原特征矩陣進(jìn)行點乘產(chǎn)生新的帶有噪聲的新的人工簽名特征。新的人工簽名的特征值與原特征值相差在10%以內(nèi)。
3.2.1 筆劃特征對比
如表1所示,是一組真實簽名-偽造簽名的單一筆劃特征的對比,包括該筆劃的平均深度(Stroke Mean)、沿筆劃方向深度標(biāo)準(zhǔn)差(Stroke Std.)和熵(Stroke Entropy)3項。表中顯示的了10個真實簽名(或偽造簽名)之間的均值和標(biāo)準(zhǔn)差??梢钥吹剑瑢τ诠P劃1,簽名人和其仿寫者之間,真實簽名和偽造簽名的3項特征的平均值有一定的差別,偽造簽名的平均深度大于真實簽名,且真實簽名的3項特征的標(biāo)準(zhǔn)差均小于偽造簽名,說明真實簽名的深度更加穩(wěn)定,行筆過程力度穩(wěn)定性好。而仿寫人由于刻意模仿筆劃的軌跡,行筆力度變化較大,因此簽名間的力度變化較大,深度差異大。筆劃2,是由另一個簽名人的簽名中的某一筆劃及其仿寫筆劃的特征??梢钥吹?,簽名人的筆劃深度小于仿寫人,且其特征的標(biāo)準(zhǔn)差也比較大,說明簽名人簽名力度較大,且力度變化范圍大,而仿寫人仿寫時下筆較輕且沉穩(wěn)。這兩個筆劃特征的對比中可以看出,簽名筆劃深度的特征值大小和穩(wěn)定度并不絕對與筆劃是正常情況下書寫或刻意仿寫相關(guān),而是簽名人和仿寫人的習(xí)慣相關(guān)。這與現(xiàn)實情況相吻合,不同人在簽名或者是仿寫時,下筆的力度都會下意識遵循自己的習(xí)慣,因而與他人有所區(qū)別。
表1 真實簽名與偽造簽名筆劃特征對比Tab.1 Contrast on stroke features of real and forgery signature
續(xù) 表
3.2.2 熟練簽名集分類
在原始熟練簽名數(shù)據(jù)集上進(jìn)行實驗,將數(shù)據(jù)集隨機(jī)分為訓(xùn)練集和測試集,訓(xùn)練集占總體實驗數(shù)據(jù)的比例(Training Rate, T_R)為0.5。提取到的特征分別使用支持向量機(jī)、K-近鄰分類器以及神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。實驗結(jié)果如表2所示。從表2中可以得到,SVM、KNN以及ANN3個分類器的識別正確率分別為91.686%、97.393%以及95.209%。3個結(jié)果均高于90%,其中KNN分類器的結(jié)果達(dá)到了97.393%,高于傳統(tǒng)二維簽名識別85%~95%的正確率。這說明了筆劃的深度特征對于熟練簽名的識別具有優(yōu)秀的效果。
表2 不同訓(xùn)練比例和分類器下的簽名分類結(jié)果
Tab.2 Recognition rates of signature with different classifier and training rate
T_R0.50.40.3SVMFRR13.4028.7729.023FAR3.2266.1408.271ORR91.68692.54491.353K-NNFRR2.2737.0189.023FAR2.9413.5094.511ORR97.39394.73693.233ANNFRR6.5228.77212.030FAR3.0612.6324.511ORR95.20994.29891.730
在現(xiàn)實的應(yīng)用中,進(jìn)行簽名識別時,我們能獲得簽名樣本一般都是有限的,需要保證在較少的訓(xùn)練樣本下也有不錯識別效果。降低訓(xùn)練比例至0.4和0.3并進(jìn)行重復(fù)試驗,從表2中可以看到,減少樣本訓(xùn)練數(shù)據(jù)量情況下,3個分類器的識別正確率依然保持在90%以上,可以認(rèn)為識別系統(tǒng)在較少的訓(xùn)練數(shù)據(jù)下依然能保持較高的識別正確率。此外,訓(xùn)練數(shù)據(jù)的量較少,也導(dǎo)致了SVM和ANN這類參數(shù)較多的分類器無法充分排除所有誤差,而KNN的參數(shù)較少,受到的影響相對小一些,因而,KNN的識別正確率要高于另外兩個分類器。
3.2.3 數(shù)據(jù)增強(qiáng)后的實驗結(jié)果
表3是原始簽名數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)后的實驗結(jié)果。表3顯示,數(shù)據(jù)增強(qiáng)可以有效提高系統(tǒng)的簽名識別正確率,SVM、KNN和ANN三分分類方式的最高分類結(jié)果分別為: 96.108%、98.690%和97.378%。3項正確率分別相對于未進(jìn)行數(shù)據(jù)增強(qiáng)前上升了3.564%、1.297%和2.169%。數(shù)據(jù)增強(qiáng)后分類正確率的增加,是因為數(shù)據(jù)集增加的同時,訓(xùn)練數(shù)據(jù)也增加了。由于一般手寫簽名數(shù)據(jù)集的個數(shù)有限,數(shù)據(jù)增強(qiáng)是一個簡單有效的增加實驗數(shù)據(jù),提升分類正確率的方法。
同時對比表2和表3可以發(fā)現(xiàn),隨著訓(xùn)練集比例的增加,分類總體正確率有上升的趨勢,這也說明了訓(xùn)練集越大,訓(xùn)練越充分,分類結(jié)果越高。
表3 數(shù)據(jù)增強(qiáng)后簽名分類結(jié)果
Tab.3 Recognition rates of signature after data augmentation
T_R0.50.40.3SVMFRR2.1746.2994.887FAR5.6104.8007.895ORR96.10894.45193.609K-NNFRR1.0750.8851.880FAR1.5463.0432.256ORR98.69098.03697.932ANNFRR0.4970.4412.226FAR7.8214.8035.263ORR95.84197.37896.256
3.2.4 與其他算法的對比
表4是本文算法與其他常用的簽名識別算法對比結(jié)果。從表中可以看出,本文提出的算法的FRR和FAR均比較小,性能優(yōu)于大多數(shù)的傳統(tǒng)算法,只略差于文獻(xiàn)[3]中的算法,表明了本文算法在簽名識別方面具有優(yōu)秀的性能。
表4 不同算法的分類結(jié)果對比Tab.2 Performance comparison on different algorithm
本文針對熟練偽造簽名識別正確率低的現(xiàn)狀,提出了基于筆劃三維深度特征的簽名識別方法,并收集了真實簽名和熟練偽造簽名數(shù)據(jù)集,偽造簽名通過套摹方式獲得,使用數(shù)據(jù)增強(qiáng)擴(kuò)充了數(shù)據(jù)集。簽名特征使用了筆劃深度的平均值、沿筆劃方向標(biāo)準(zhǔn)差和深度的熵3個統(tǒng)計量。實驗結(jié)果表明,筆劃三維深度特征能有效識別熟練偽造簽名,在KNN分類器上,簽名識別正確率最高達(dá)到了98.69%,F(xiàn)RR、FAR優(yōu)于大多數(shù)傳統(tǒng)算法,具有優(yōu)秀的識別性能。