張淑婧,麥合甫熱提,吾爾尼沙·買買提,朱亞俐,庫爾班·吾布力+
(1.新疆大學(xué) 信息科學(xué)與工程學(xué)院,新疆 烏魯木齊 830046; 2.新疆大學(xué) 教務(wù)處,新疆 烏魯木齊 830046)
手寫簽名鑒別通過不同的獲取方式分為兩種:在線手寫簽名鑒別和離線手寫簽名鑒別。離線手寫簽名中只存在簽名的靜態(tài)特征,鑒別難度較大。通過不斷的研究,常見語種的離線簽名鑒別已趨近完善,取得良好的實(shí)驗(yàn)結(jié)果,而針對(duì)維吾爾文簽名的研究仍處于發(fā)展階段。
Muhammad Sharif等[1]使用遺傳算法對(duì)簽名的特征進(jìn)行選擇,使用SVM分類器進(jìn)行分類鑒別,在CEDAR和GPDS拉丁文數(shù)據(jù)庫上得到最終AER分別為4.17%和5.42%。Elias N.Zois等[2]對(duì)網(wǎng)格特征編碼并進(jìn)行模板匹配,該方法在GPDS數(shù)據(jù)庫上可得到EER為9.42%。Guerbai等[3]使用單類SVM進(jìn)行不依賴于書寫者的簽名鑒別實(shí)驗(yàn),在CEDAR數(shù)據(jù)庫中結(jié)果AER為5.60%。Hafemann等[4]提出使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行簽名鑒別的方法,運(yùn)用支持向量機(jī)進(jìn)行分類鑒別,在CEDAR數(shù)據(jù)庫中得到約為4.63%的等錯(cuò)誤率。在維吾爾文簽名識(shí)別和鑒別的研究中,庫爾班·吾布力等[5-8]于2014-2018年通過對(duì)簽名圖像提取改進(jìn)的方向特征、灰度共生矩等特征,采用不同的分類算法進(jìn)行簽名識(shí)別和鑒別。吐爾遜姑麗·阿布都瓦依提[5]開始對(duì)維吾爾文離線手寫簽名鑒別進(jìn)行研究。在文獻(xiàn)[6]中采用密度特征和KNN分類器,得到識(shí)別準(zhǔn)確率達(dá)96%。
本文中采用多尺度塊局部二值模式以及改進(jìn)的分塊局部相位量化算法對(duì)簽名進(jìn)行特征提取,并使用隨機(jī)森林算法對(duì)維吾爾文簽名進(jìn)行分類鑒別,對(duì)得到的實(shí)驗(yàn)結(jié)果進(jìn)行分析。
離線手寫簽名鑒別問題的研究,是生物識(shí)別研究中的一個(gè)研究領(lǐng)域,也是模式識(shí)別領(lǐng)域的一個(gè)研究方向。作為模式識(shí)別中的一個(gè)研究方向,與大多數(shù)模式識(shí)別問題一樣,離線手寫前面分為4個(gè)步驟,分別為數(shù)據(jù)采集、預(yù)處理、特征提取、訓(xùn)練及測(cè)試。其流程如圖1所示。
圖1 離線手寫簽名鑒別流程
數(shù)據(jù)采集:本文使用維吾爾文離線簽名數(shù)據(jù)庫,此數(shù)據(jù)庫中采集了870個(gè)維吾爾族人的簽名。每人書寫21個(gè)真簽名,簡(jiǎn)單偽造簽名21個(gè),熟練偽造簽名21個(gè),共17 400個(gè)簽名樣本。從中選擇18人的真假簽名作為本實(shí)驗(yàn)的簽名樣本進(jìn)行實(shí)驗(yàn)。同時(shí),使用拉丁文簽名數(shù)據(jù)庫CEDAR進(jìn)行簽名鑒別實(shí)驗(yàn)。
預(yù)處理:為了更好保留簽名圖像的差異化信息,在對(duì)圖像進(jìn)行特征提取之前需要對(duì)其進(jìn)行處理。本文中首先對(duì)圖像進(jìn)行大小歸一化,將簽名圖像大小歸一為384×96像素。此后,使用加權(quán)平均法進(jìn)行灰度化處理,用OTSU算法對(duì)簽名圖像進(jìn)行二值化處理,并使用雙邊濾波對(duì)圖像進(jìn)行去噪。這樣能夠更好保存圖像的內(nèi)部信息以及邊緣信息。預(yù)處理圖像如圖2所示。
圖2 預(yù)處理簽名圖像
特征提?。禾卣魈崛∈呛灻b別過程中重要的一環(huán),只有從簽名中提取到能夠表示簽名者身份的特征才能繼續(xù)進(jìn)行鑒別。本文采用由Shengcai Lia等提出的多尺度塊局部二值算子與局部相位量化特征進(jìn)行串聯(lián)融合,形成本文用于實(shí)驗(yàn)的特征向量。
訓(xùn)練及測(cè)試:首先將訓(xùn)練簽名樣本從特征提出中所提取出的特征向量進(jìn)行訓(xùn)練,形成訓(xùn)練模型,再通過訓(xùn)練模型進(jìn)行分類測(cè)試,得出測(cè)試簽名是否為真簽名。本文中采用隨機(jī)森林算法對(duì)簽名進(jìn)行分類鑒別。
局部二值模式(local binary pattern,LBP)[9],是一種主要對(duì)圖像紋理特征進(jìn)行描述的特征算子,其具有灰度不變性及旋轉(zhuǎn)不變性等特性。通過多年來對(duì)該算子的不斷發(fā)展與改進(jìn),現(xiàn)已被廣泛應(yīng)用于圖像分類,圖像檢索等領(lǐng)域。
2.1.1 基本LBP算子
LBP算法以鄰域?yàn)榇翱?,提取圖像的局部紋理。選取鄰域大小為3×3的窗口,將窗口內(nèi)中心點(diǎn)gc的灰度值作為中心閾值,將其周圍8個(gè)點(diǎn)g0,…,g7的像素與其比較,若鄰域灰度值大于gc灰度值,則該點(diǎn)記為1,反之記為0。以該鄰域內(nèi)以左上角點(diǎn)為起點(diǎn),按順時(shí)針方向可得到一個(gè)八位二進(jìn)制數(shù),求取該二進(jìn)制數(shù)的十進(jìn)制表示方法,即為該點(diǎn)LBP值,求取方法如圖3所示。
圖3 基本LBP算子生成過程
2.1.2 多尺度塊局部二值模式
多尺度塊局部二值模式(multiscale block local binary pattern,MB-LBP)是由Shengcai Lia等提出的一種LBP的改進(jìn)算法[10]。該算法將進(jìn)行灰度值的比較時(shí),沒有采取原始LBP算法中的將像素灰度值進(jìn)行比較,而是將對(duì)圖像子區(qū)域內(nèi)像素的平均灰度值作為子區(qū)域灰度值進(jìn)行比較。如圖4所示。
圖4 MB-LBP算子生成過程
圖4為一個(gè)9×9的MB-LBP算子生成過程。9×9的圖像塊劃分為9個(gè)大小為3×3的小塊,求取每個(gè)3×3小塊的灰度平均值,得到3×3的灰度矩陣,其余提取MB-LBP算子與原始LBP算子過程一樣。當(dāng)采用3×3的MB-LBP算子時(shí),則相當(dāng)于一個(gè)基本3×3LBP算子。求取小區(qū)域平均灰度值時(shí),可以采取求和區(qū)域表或積分圖像的方法。本文采取積分圖像的方法,以方便快捷的計(jì)算灰度平均值標(biāo)量。因此,MB-LBP算子的提取速度同樣較快,僅稍慢于基本3×3算子提取速度。不同分塊規(guī)模時(shí)MB-LBP濾波圖像如圖5所示。
圖5 MB-LBP濾波后簽名圖像
由圖5可以看出,不同規(guī)模MB-LBP濾波的圖像有較大區(qū)別。隨意在進(jìn)行實(shí)驗(yàn)時(shí),應(yīng)選擇合適的規(guī)模。本文中選取9×9的MB-LBP算子進(jìn)行實(shí)驗(yàn)。提取MB-LBP算子的進(jìn)行訓(xùn)練鑒別時(shí),還需要提取其直方圖,形成MB-LBP直方圖特征。
局部相位量化(local phase quantization,LPQ)是由Ojansivu等[11]提出的一種局部描述符,在圖像的頻域空間處理空間模糊紋理特征,其具有良好的模糊不變性和灰度不變性。LPQ算法的提出者指出,該算法僅使用圖像的相位信息作為圖像特征,具有較強(qiáng)的魯棒性,該算法目前別廣泛應(yīng)用于人臉識(shí)別領(lǐng)域中。在數(shù)字圖像處理領(lǐng)域中,空間模糊圖像I(x) 是通過對(duì)圖像強(qiáng)度f(x) 和點(diǎn)擴(kuò)展函數(shù)h(x) 進(jìn)行卷積得到的,公式如下
I(x)=f(x)×h(x)
(1)
在圖像頻域內(nèi),上式可用式(2)
J(u)=F(u)×H(u)
(2)
該式為式(2)在頻域內(nèi)的乘積形式。其中,J(u)、F(u) 和H(u) 分別為I(x)、f(x) 和h(x) 的離散傅里葉變換。由于局部相位量化算法僅討論圖像相位,則考慮到J(u)、F(u) 和H(u) 的相位信息,則可有公式
∠J(u)=∠F(u)×∠H(u)
(3)
當(dāng)點(diǎn)擴(kuò)展函數(shù)h(x) 中心對(duì)稱時(shí),其傅里葉變換H(u) 一直為實(shí)數(shù)。當(dāng)H(u) 不小于0時(shí),相位信息∠H(u) 為0;當(dāng)H(u) 小于0時(shí), ∠H(u) 值為π。
在LPQ算法中,通過計(jì)算短時(shí)離散傅里葉變換,計(jì)算圖像中M×M大小的領(lǐng)域Nx內(nèi)每個(gè)像素位置的圖像f(x), 公式如下所示
F(u,x)=∑f(x-y)e-2πjuT
(4)
式中:u為頻率。圖像的行列的卷積計(jì)算可以分開進(jìn)行,在本算法中,以對(duì)圖像先行后列的方式做一維卷積計(jì)算。計(jì)算局部傅里葉系數(shù)時(shí),采用的4個(gè)頻率點(diǎn)如下所示
u1=[a,0]T,u2=[0,a]T,u3=[a,a]T,u4=[a,-a]T,
(5)
其中,a是足夠小的數(shù),且使H(u)>0。 則有
Fx=[F(u1,x),F(u2,x),F(u3,x),F(u4,x)]
(6)
為使LPQ算子方便表示和計(jì)算,需將它們進(jìn)行進(jìn)一步的量化。通過對(duì)Fx中每一分量的實(shí)部和虛部的符號(hào)對(duì)傅里葉系數(shù)的相位信息進(jìn)行標(biāo)記,公式如下
(7)
向量K(x)=[Re{F(x)},Im{F(x)}] 的第j個(gè)部分由kj表示。此時(shí)qj通過二進(jìn)制編碼的方法,被量化為L(zhǎng)PQ特征值,計(jì)算方法如下所示
(8)
LPQ算法提取特征過程如圖6所示。
圖6 LPQ提取特征過程
隨機(jī)森林(random forest,RF)算法由2001年被提出,該算法是一種基于決策樹的機(jī)器學(xué)習(xí)算法[12]。其利用對(duì)多個(gè)樹進(jìn)行訓(xùn)練并預(yù)測(cè)的分類算法,通過生成多個(gè)決策樹和投票的方法對(duì)多特征數(shù)據(jù)進(jìn)行分類,具有較高的計(jì)算效率和準(zhǔn)確率?,F(xiàn)階段,隨機(jī)森林別廣泛應(yīng)用于生態(tài)、經(jīng)濟(jì)、圖像識(shí)別中。
該算法的基本單元為決策樹,采用Bagging集成思想,隨機(jī)選取不同的訓(xùn)練特征子集構(gòu)建不同的決策樹,根據(jù)所有構(gòu)建出的決策樹的分類結(jié)果通過投票的方法確定最終分類。隨機(jī)森林具有樣本集的隨機(jī)性和特征的隨機(jī)性這兩個(gè)主要特性。所以,隨機(jī)森林算法具有良好的泛化能力,快速處理上千維的特征數(shù)據(jù),且不會(huì)產(chǎn)生過擬合現(xiàn)象。
隨機(jī)森林算法作為一種基于決策樹的分類算法,主要包括以下幾個(gè)步驟:
步驟1 從原始樣本集D中采用Bootstrap 重抽樣的方法有放回地形成k個(gè)樣本子集Dk;
步驟2 設(shè)原始樣本中包含a個(gè)屬性,從每一個(gè)樣本中選擇屬性a中的m個(gè)特征值,建立決策樹;
步驟3 重復(fù)上述過程,建立n個(gè)決策樹,并在每個(gè)節(jié)點(diǎn)位置將小于維度格式的維度向量作為該節(jié)點(diǎn)的分類標(biāo)準(zhǔn);
步驟4 對(duì)獲得的分類結(jié)果進(jìn)行誤差測(cè)試,采用多數(shù)投票確定最優(yōu)分類結(jié)果。
圖7為隨機(jī)森林算法的生成過程。
圖7 隨機(jī)森林分類流程
本文中數(shù)據(jù)庫采用由本地收集的維吾爾文簽名數(shù)據(jù)庫和國際公開的拉丁文手寫簽名數(shù)據(jù)庫CEDAR。維吾爾文簽名數(shù)據(jù)庫中,包含30人維吾爾文手寫簽名圖像,其中每人包括20個(gè)真簽名,20個(gè)簡(jiǎn)單偽造簽名,20個(gè)熟練偽造簽名,合計(jì)1800個(gè)簽名圖像。CEDAR數(shù)據(jù)庫中,包含55人拉丁文簽名,每人包括24個(gè)真實(shí)簽名圖像和24個(gè)偽造簽名圖像,共2640個(gè)簽名圖像。在進(jìn)行離線手寫簽名鑒別時(shí),從兩個(gè)數(shù)據(jù)庫中每人的真簽名和偽造簽名中分別選取12個(gè)簽名圖像進(jìn)行訓(xùn)練,總共每人選取24個(gè)簽名用于訓(xùn)練,其余簽名圖像用于測(cè)試。則對(duì)于維吾爾文手寫簽名鑒別實(shí)驗(yàn)而言,總共720個(gè)圖像用于訓(xùn)練,1080個(gè)圖像用于測(cè)試;對(duì)于CEDAR拉丁文數(shù)據(jù)庫而言,共1320個(gè)圖像用于訓(xùn)練,1320個(gè)圖像用于測(cè)試。本文中,對(duì)兩種不同數(shù)據(jù)庫隨機(jī)選取簽名圖像進(jìn)行10組實(shí)驗(yàn),求取實(shí)驗(yàn)結(jié)果平均值作為該組實(shí)驗(yàn)的結(jié)果。
本文中所有實(shí)驗(yàn)均在64位Windows7的環(huán)境下進(jìn)行,其CPU為i5 4460,3.20 Hz,內(nèi)存為4 GB,具體程序通過使用Visual Studio 2012與Matlab2016b混合編程調(diào)試。
本文在使用隨機(jī)森林算法中,單棵樹最大深度為10,節(jié)點(diǎn)分裂最小樣本數(shù)為2,決策樹最大棵數(shù)為3000棵樹,其中樹中每個(gè)節(jié)點(diǎn)隨機(jī)選取特征15個(gè),從而尋求最佳分裂。
在進(jìn)行離線維吾爾文手寫簽名鑒別時(shí),使用錯(cuò)誤拒絕率(false rejection rate,F(xiàn)RR)與錯(cuò)誤接受率(false accep-tance rate,F(xiàn)AR)對(duì)簽名鑒別的結(jié)果進(jìn)行評(píng)價(jià)。FRR代表在鑒別過程中將真簽名誤認(rèn)為偽造簽名的錯(cuò)誤率,而FAR代表將偽造簽名誤認(rèn)為真簽名時(shí)的錯(cuò)誤率。為了更好的對(duì)簽名鑒別結(jié)果的綜合能力進(jìn)行評(píng)價(jià),引入總正確率(ove-rall right rate,ORR)進(jìn)行評(píng)價(jià)。FRR、FAR、ORR這3種評(píng)價(jià)標(biāo)準(zhǔn)計(jì)算公式如下所示
(9)
(10)
(11)
本文在提取MB-LBP直方圖特征時(shí),采用分塊的方式,這樣的處理可以更好提取不同部位簽名特點(diǎn),并進(jìn)行比較。防止因?yàn)椴煌灻崛〉腗B-LBP濾波圖像相似而帶來的誤差。本文主要通過從圖像寬度進(jìn)行等分的方式對(duì)MB-LBP圖像進(jìn)行分塊,將每一個(gè)小圖像塊的MB-LBP直方圖進(jìn)行串聯(lián)融合,形成256×k維的特征向量。該分塊特征記為MB-LBPk,其中,k即為等分后圖像區(qū)域塊數(shù)。本文實(shí)驗(yàn)中,k取1,2,3,4,6,8等6個(gè)值(均可對(duì)圖像寬度384進(jìn)行整除)。實(shí)驗(yàn)結(jié)果見表1。
表1 基于MB-LBPk的維吾爾文簽名鑒別實(shí)驗(yàn)結(jié)果
表1中數(shù)據(jù)為使用MB-LBP算法提取特征,在維吾爾文簽名圖像數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)的結(jié)果。在不分塊的情況下,通過分類鑒別得到FRR為4.87%,F(xiàn)AR為7.71%的結(jié)果。當(dāng)切分塊數(shù)為4時(shí),可以得到本組實(shí)驗(yàn)中的最好結(jié)果,其FRR為3.54%,F(xiàn)AR為5.54%,ORR為95.46%,分別比未分塊時(shí)的鑒別結(jié)果提高了1.33%、2.71%和1.75%。使用MB-LBP算法提取的特征在CEDAR數(shù)據(jù)庫中的實(shí)驗(yàn)結(jié)果見表2。
表2中對(duì)CEDAR數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)的結(jié)果與表1中相似的是,當(dāng)圖像不進(jìn)行分塊特征提取時(shí),其鑒別結(jié)果低于分塊后的鑒別結(jié)果。當(dāng)k=1時(shí),ORR為95.67%。對(duì)圖像提取分塊MB-LBPk時(shí),在k=2的情況下,F(xiàn)RR、FAR、ORR分別為3.88%、3.65%、96.23%。
表2 基于MB-LBPk的CEDAR數(shù)據(jù)庫簽名鑒別實(shí)驗(yàn)結(jié)果
表1與表2中結(jié)果對(duì)比,CEDAR數(shù)據(jù)庫中總正確率低于維吾爾文簽名鑒別總正確率,且得到最佳結(jié)果的分塊特征MB-LBPk的k值也不相同。造成這種情況發(fā)生的主要原因是,不同語言的文字書寫結(jié)構(gòu)不同,因此造成鑒別結(jié)果的差異。從表1和表2中,可以看出采用對(duì)圖像分塊后提取特征的方法可以有效提高簽名的鑒別率。
與基于MB-LBP的簽名鑒別類似,基于局部相位量化的簽名鑒別實(shí)驗(yàn)中也加入了分塊的思想,該分塊后的LPQ算法記為L(zhǎng)PQk。分塊的塊數(shù)k=1,2,3,4,6,8, 與MB-LBPk相同。該算法實(shí)驗(yàn)結(jié)果見表3。
表3 基于LPQk的維吾爾文簽名鑒別實(shí)驗(yàn)結(jié)果
表3中為通過LPQk算法提取維吾爾文簽名特征后的鑒別實(shí)驗(yàn)結(jié)果。由表中結(jié)果可得知,分塊塊數(shù)k=4時(shí),有最佳結(jié)果。此時(shí),F(xiàn)RR為3.38%,F(xiàn)AR為5.29%,ORR為95.67%。未分塊k=1時(shí),實(shí)驗(yàn)結(jié)果FRR為5.08%,F(xiàn)AR為6.35%,ORR為94.29%??梢缘弥?,當(dāng)k=4時(shí)的實(shí)驗(yàn)結(jié)果FRR、FAR和ORR分別比未分塊時(shí)提高1.70%、1.06%、1.38%。表4為使用LPQk特征對(duì)CEDAR數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)的鑒別結(jié)果。
表4 基于LPQk的CEDAR數(shù)據(jù)庫簽名鑒別實(shí)驗(yàn)結(jié)果
使用LPQk算法提取CEDAR數(shù)據(jù)庫中簽名特征鑒別后的結(jié)果見表4。在k=1的情況下,得到的總正確率ORR為96.04%。當(dāng)k=4時(shí),該方法在CEDAR拉丁文數(shù)據(jù)庫上實(shí)驗(yàn)可以得到最佳結(jié)果,F(xiàn)RR為3.05%,F(xiàn)AR為3.85%,總正確率為96.55%。而在k=8,鑒別結(jié)果最差為95.98%,比實(shí)驗(yàn)所得到的最高總正確率低0.57%。
表3與表4中的數(shù)據(jù)相比,最差實(shí)驗(yàn)結(jié)果均不出現(xiàn)在未切分前的鑒別實(shí)驗(yàn)中。造成該結(jié)果的原因可能是由于維吾爾文、拉丁文的姓名間相似度較高,若不能將簽名圖像的特異部分進(jìn)行分塊,造成特征向量相似,則簽名鑒別結(jié)果較差。所以,在使用LPQk算法進(jìn)行簽名鑒別實(shí)驗(yàn)時(shí),分塊數(shù)k會(huì)極大影響簽名鑒別的總正確率。
在對(duì)提取MB-LBP和LPQ兩種特征的簽名分別進(jìn)行實(shí)驗(yàn)后,由表1~表4中數(shù)據(jù)可以看出,兩種方法在維吾爾文簽名數(shù)據(jù)庫和CEDAR簽名數(shù)據(jù)庫中均獲得良好實(shí)驗(yàn)結(jié)果。由此可以看出,兩種特征提取算法皆可以提取出有效的紋理特征。在兩種特征分別提取特征進(jìn)行實(shí)驗(yàn)的基礎(chǔ)上,對(duì)MB-LBPk和LPQk進(jìn)行并聯(lián)融合,形成256×k×2維的高維特征向量(融合時(shí),兩種算法k值取相同值)。采用隨機(jī)森林算法對(duì)高維特征向量進(jìn)行訓(xùn)練分類。實(shí)驗(yàn)結(jié)果見表5、表6。
表5 基于MB-LBPk和LPQk的維吾爾文 簽名鑒別實(shí)驗(yàn)結(jié)果
表6 基于MB-LBPk和LPQk的CEDAR數(shù)據(jù)庫 簽名鑒別實(shí)驗(yàn)結(jié)果
表5中數(shù)據(jù)即為MB-LBPk和LPQk融合特征提取算法在維吾爾文簽名數(shù)據(jù)庫中進(jìn)行實(shí)驗(yàn)的結(jié)果。當(dāng)k=4時(shí),簽名鑒別結(jié)果最好,總正確率為96.36%。比單獨(dú)使用MB-LBPk和LPQk算法提取特征時(shí)的總正確率提升0.89%和0.68%。對(duì)未分塊時(shí)融合后特征向量進(jìn)行鑒別時(shí)總正確率為94.75%,比k=4時(shí)ORR低1.60%。
表6為融合特征在CEDAR數(shù)據(jù)庫中的拉丁文手寫簽名上進(jìn)行實(shí)驗(yàn)的結(jié)果。與維吾爾文簽名鑒別實(shí)驗(yàn)結(jié)果不同的是該組實(shí)驗(yàn)的最優(yōu)結(jié)果是在k=2時(shí)。此時(shí),CEDAR數(shù)據(jù)庫離線手寫簽名鑒別的FRR為2.39%,F(xiàn)AR為4.14%,ORR為96.73%。比融合前MB-LBPk和LPQk特征的簽名鑒別總正確率分別提高0.50%和0.18%。較好提升了CEDAR中拉丁文簽名鑒別結(jié)果。當(dāng)k=1未分塊時(shí)的ORR為96.39%,比融合后的最佳結(jié)果低0.34%。
由表1~表6中數(shù)據(jù)可知,MB-LBP和LPQ的特征提取方法,能夠有效提取簽名圖像的特征信息,并通過隨機(jī)森林分類器可以得到良好的簽名鑒別結(jié)果。分塊后的MB-LBP和LPQ對(duì)圖像信息更加敏感,可以使維吾爾文簽名和拉丁文簽名的鑒別結(jié)果得到一定的提升。最后通過特征融合的方法,把MB-LBPk和LPQk串聯(lián)融合形成高維特征向量,在兩個(gè)不同文種簽名圖像庫中進(jìn)行鑒別實(shí)驗(yàn),得到的總正確率分別為96.35%和96.73%。
為了更好探究本文所提出的離線手寫簽名鑒別方法,將本文中所得到的實(shí)驗(yàn)結(jié)果與已有的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比。維吾爾文簽名數(shù)據(jù)庫結(jié)果對(duì)比和CEDAR數(shù)據(jù)庫結(jié)果對(duì)比見表7、表8。
表7 維吾爾文手寫簽名鑒別結(jié)果對(duì)比/%
表8 CEDAR數(shù)據(jù)庫手寫簽名鑒別結(jié)果對(duì)比/%
通過與已有的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,由表7可以看出,本文方法在對(duì)維吾爾文離線手寫簽名進(jìn)行鑒別時(shí),在擴(kuò)大了實(shí)驗(yàn)數(shù)據(jù)量的情況下,結(jié)果仍高于已有實(shí)驗(yàn)結(jié)果。本文方法比2018年提出的視覺詞袋模型特征(BoVW)和SVM分類器進(jìn)行鑒別的結(jié)果FRR、FAR、ORR分別提高了1.12%、3.96%、2.54%[14]??梢钥闯觯摲椒ū任墨I(xiàn)[14]中方法的FAR有大幅度提升,所以其總正確率也同樣提升。從表8中的數(shù)據(jù)看出,本文方法在CEDAR拉丁文數(shù)據(jù)庫中也有良好的實(shí)驗(yàn)結(jié)果,其結(jié)果高于文獻(xiàn)結(jié)果1%以上。說明本文提出方法在對(duì)于維吾爾文離線手寫簽名鑒別和拉丁文CEDAR數(shù)據(jù)簽名鑒別中是有效的。
本文中提出了基于MB-LBP和LPQ融合的維吾爾文離線手寫簽名鑒別,并且該方法中使用隨機(jī)森林進(jìn)行分類鑒別。該方法在包含30人簽名(20真簽名/每人,20簡(jiǎn)單偽造簽名/每人,20熟練偽造簽名/每人)的維吾爾文手寫簽名數(shù)據(jù)庫和包含55人(24真簽名/每人,24偽造簽名/每人)CEDAR拉丁文簽名數(shù)據(jù)庫中進(jìn)行實(shí)驗(yàn),得到的總正確率分別為96.35%和96.73%,均高于已有實(shí)驗(yàn)結(jié)果。因此,MB-LBP和LPQ可以有效提取簽名圖像特征,且隨機(jī)森林算法能夠高效的處理高維特征向量進(jìn)行分類鑒別。在今后的研究工作中,將本文中兩種算法繼續(xù)進(jìn)行網(wǎng)格化分塊實(shí)驗(yàn),并使用多種分類器進(jìn)行鑒別實(shí)驗(yàn)對(duì)比。嘗試使用深度學(xué)習(xí)算法對(duì)簽名圖像進(jìn)行訓(xùn)練測(cè)試,提高簽名的總正確率。
計(jì)算機(jī)工程與設(shè)計(jì)2020年3期