何殿源,馮 筠,楊曉萌
(西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710127)
?
·信息科學(xué)·
移動(dòng)互聯(lián)網(wǎng)金融下簽名認(rèn)證靜態(tài)特征提取技術(shù)
何殿源,馮 筠,楊曉萌
(西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710127)
在簽名圖像預(yù)處理研究的基礎(chǔ)上,提出了通過(guò)提取圖像形狀特征、不變距特征以及基于Gabor濾波紋理方向特征而得到簽名圖像靜態(tài)特征的方法,并通過(guò)基于稀疏表示的L1范數(shù)分類(lèi)方法在提取的特征樣本集上進(jìn)行簽名鑒別。實(shí)驗(yàn)結(jié)果表明,在相同10組樣本的特征集下,稀疏分類(lèi)最小殘差法的平均FRR和平均FAR分別為9.25%和4.63%,明顯低于經(jīng)典KNN法的12.15%和8.67%,也明顯低于經(jīng)典SVM法的13.31%和7.26%。該文的研究成果達(dá)到了移動(dòng)互聯(lián)網(wǎng)金融業(yè)務(wù)的性能要求。
互聯(lián)網(wǎng)金融;靜態(tài)特征;提取技術(shù);L1范數(shù);稀疏表示
為解決基于手機(jī)的移動(dòng)互聯(lián)網(wǎng)金融平臺(tái)下客戶登錄時(shí)遇到的“你是誰(shuí)”和系統(tǒng)交易時(shí)“你是你”的問(wèn)題,簽名鑒別技術(shù)研究得到了互聯(lián)網(wǎng)金融企業(yè)和相關(guān)科研機(jī)構(gòu)的高度關(guān)注。作為基于簽名鑒別技術(shù)的關(guān)鍵,簽名特征值的提取成為了移動(dòng)互聯(lián)網(wǎng)金融下身份識(shí)別技術(shù)重點(diǎn)研究的課題,并取得了廣泛的成果。Lü Hairong[1]等人利用筆段特征、空間分布特征、輪廓檢測(cè)等方法提取字形結(jié)構(gòu),該方法可有效區(qū)分相似字。但是,對(duì)結(jié)構(gòu)特征提取不理想。Alessandro[2]等人運(yùn)用統(tǒng)計(jì)方法、距離度量匹配準(zhǔn)則,采用多維特征值累加的辦法把噪聲最小化,具有良好的魯棒性。但是,無(wú)法很好地利用一些敏感特征。張大海[3]等人通過(guò)從簽名中直接提取的和通過(guò)派生得到的3級(jí)共188個(gè)特征,利用自定義的特征重要性函數(shù)進(jìn)行特征選擇,將用特征函數(shù)選擇的個(gè)性特征用SVM算法進(jìn)行訓(xùn)練和驗(yàn)證。王珂敏[4]改進(jìn)了傳統(tǒng)的動(dòng)態(tài)時(shí)間彎折算法結(jié)構(gòu),對(duì)最佳匹配路徑的動(dòng)態(tài)規(guī)劃方法進(jìn)行改進(jìn)并將其應(yīng)用于在線簽名鑒別系統(tǒng)。肖春景[5]等人提出了基于小波包的特征提取方法,解決了特征提取過(guò)程不可逆的問(wèn)題,并降低了特征提取的困難性。陳曉紅[6]等人利用計(jì)算機(jī)技術(shù)提取和分析紙上簽名的寬度、灰度和弧度等動(dòng)態(tài)特征數(shù)據(jù),研究其規(guī)律并創(chuàng)立了一種新型的定量化簽名筆跡鑒別技術(shù),但在基于移動(dòng)設(shè)備的互聯(lián)網(wǎng)金融應(yīng)用實(shí)驗(yàn)中,效果并不理想。從國(guó)內(nèi)外的研究現(xiàn)狀看,對(duì)從簽名樣本中提取能反映個(gè)人書(shū)寫(xiě)風(fēng)格的有效特征值的研究,目前還沒(méi)有可應(yīng)用的研究成果,文中給出了從通過(guò)濾波、歸一化、二值和灰度化等技術(shù)進(jìn)行預(yù)處理后的簽名筆跡中提取體現(xiàn)個(gè)人書(shū)寫(xiě)風(fēng)格的靜態(tài)特征的有效方法和技術(shù)。
簽名特征的分類(lèi)存在很多方法,例如Samuel將簽名的特征分為全局特征和局部特征兩大類(lèi)[7]; Blayvas等人將簽名特征劃分為全局、統(tǒng)計(jì)、幾何以及拓?fù)涮卣鞯榷喾N[8]。對(duì)于特征的分類(lèi)更多的是從實(shí)際需求來(lái)進(jìn)行考慮。對(duì)于漢字而言,可以將簽名筆劃的方向、字體的拉伸度、密度,傾斜度等反映個(gè)人書(shū)寫(xiě)習(xí)慣的信息作為有效的鑒別簽名的特征信息。實(shí)驗(yàn)證明,形狀特征、矩特征、以及紋理特征能夠全面地刻畫(huà)簽名的靜態(tài)特征[9]。
2.1 形狀特征
2.1.1 字體骨架的傾斜方向向量 中文簽名基本上都是由橫撇豎捺等筆劃構(gòu)成,因此對(duì)于同一個(gè)人的手寫(xiě)簽名,他的書(shū)寫(xiě)筆劃在方向上的變化基本是固定的。文中實(shí)驗(yàn)采用簽名的二值骨架提取筆劃的傾斜方向特征,該方法可以有效地反映筆劃在方向上的變化。記筆劃骨架上的某一點(diǎn)為P(x,y),定義P點(diǎn)3個(gè)傾斜方向的特征向量為v(d1,d2,d3),分別記為筆劃正傾斜方向d1,筆劃垂直傾斜方向d2,以及筆劃負(fù)傾斜方向d3,如圖1所示,d1,d2,d3取值為0或1。
圖1 垂直、正負(fù)傾斜方向Fig.1 Vertical, positive and negative tilt
骨架方向傾斜點(diǎn)定義:關(guān)于骨架上的某一點(diǎn)P(x,y),如果P′=P(x-1,y+1)非零,那么定義P′為負(fù)方向傾斜點(diǎn);如果P′=P(x,y+1)非零,那么定義P′為垂直方向傾斜點(diǎn);如果P′=P(x+1,y+1)非零,則定義P′為正方向傾斜點(diǎn),我們將這3類(lèi)點(diǎn)統(tǒng)稱(chēng)為骨架傾斜點(diǎn)。
最終,在簽名骨架上的點(diǎn)的3個(gè)傾斜方向上進(jìn)行累計(jì)求和,得3維向量V(D1,D2,D3),其中D1=∑d1,D2=∑d2,D3=∑d3,Vf=(D1,D2,D3)=(D1/D,D2/D,D3/D),其中D=D1+D2+D3。
2.1.2 簽名網(wǎng)孔數(shù)與連通域數(shù) 簽名網(wǎng)孔數(shù)和連通域的個(gè)數(shù)兩者都屬于漢字的局部幾何特征,同時(shí)具有大小、平移不變性等特點(diǎn),可以有效區(qū)分視覺(jué)上不能直觀鑒別的局部差異[10]。簽名網(wǎng)孔數(shù)指的是黑色筆跡所包圍的封閉空白區(qū)域個(gè)數(shù)。連通域個(gè)數(shù)指的是簽名筆劃中彼此連接在一起的部分區(qū)域的個(gè)數(shù)。針對(duì)同一個(gè)人的簽名來(lái)說(shuō),他的局部簽名網(wǎng)孔數(shù)與筆劃的連通性大體上是保持穩(wěn)定的。因此,我們可以將簽名網(wǎng)孔數(shù)與連通域個(gè)數(shù)作為一對(duì)局部有效特征。其原理示意圖分別如圖2所示。
圖2 簽名筆跡局部特征示例Fig.2 Local features of signatures example
本文采用圖像形態(tài)學(xué)算法中的漫水填充算法[11]以及二值輪廓簽名提取方法來(lái)統(tǒng)計(jì)簽名網(wǎng)孔數(shù)和連通域個(gè)數(shù),該算法思路如下:在二值化簽名圖像中,選取任意像素作為背景種子點(diǎn),進(jìn)而將近鄰區(qū)域所有相似點(diǎn)都填充上同樣顏色,得到填充操作的結(jié)果一般總是某個(gè)聯(lián)通的區(qū)域。最后,統(tǒng)計(jì)二值簽名圖像中沒(méi)有顏色變化的區(qū)域計(jì)數(shù),即為簽名網(wǎng)孔數(shù)。求取連通域數(shù)之前需要對(duì)于平滑簽名圖像的邊緣輪廓進(jìn)行提取,選取背景種子點(diǎn)之后再次利用上述漫水填充法填充背景。實(shí)驗(yàn)時(shí),多次選取種子點(diǎn)進(jìn)行填充,在字體筆劃內(nèi)部某些閉合區(qū)域處得到較好處理效果,圖3(a)給出了簽名圖像輪廓提取圖,圖3(b)為多次選取背景種子點(diǎn)填充之后的效果圖。掃描圖像中顏色沒(méi)有變化的區(qū)域計(jì)數(shù),得到簽名的連通域數(shù)。
圖3 漫水填充與輪廓提取連通域Fig.3 Connected domain of diffuse water filling and contour extraction
2.1.3 簽名交叉點(diǎn)和端點(diǎn)數(shù) 關(guān)于不同人書(shū)寫(xiě)的同一簽名,其筆劃交叉點(diǎn)以及端點(diǎn)的個(gè)數(shù)之間都會(huì)存在一定的差別。因此,我們可以用具有單像素寬度的簽名骨架上的端點(diǎn)和交叉點(diǎn)作為一組有效的局部特征。文中將交叉點(diǎn)分為3種,分別為二交叉點(diǎn)、三交叉點(diǎn),以及四交叉點(diǎn)。在以像素點(diǎn)(i,j)為中心的3×3鄰域進(jìn)行二值骨架的掃描和判斷,如圖4所示。在3×3像素鄰域圖中,我們定義了8組像素對(duì),分別是:A:{(i-1,j-1),(i,j)},B:{(i-1,j),(i,j)},C:{(i-1,j+1),(i,j)},D:{(i,j+1),(i,j)},E:{(i+1,j+1),(i,j)},F:{(i+1,j),(i,j)},G:{(i+1,j-1),(i,j)},H:{(i,j-1),(i,j)}。當(dāng)這些像素對(duì)之間滿足如下規(guī)則L1~L4時(shí),則判定其中心像素點(diǎn)(i,j)為相應(yīng)交叉點(diǎn)類(lèi)型。
端點(diǎn)與交叉點(diǎn)的定義:
L1:上述8組像素對(duì)中,若只有1對(duì)像素值為1,則判定中心像素點(diǎn)(i,j)為端點(diǎn)。
L2:上述定義的8組像素對(duì)中,除了一條直線上的像素對(duì)之外,例如A和E,B和F,C和G,D和H,剩余任意兩組像素對(duì)的值都為1時(shí),則判定中心像素點(diǎn)(i,j)為折點(diǎn)或者拐點(diǎn)。
L3:上述8組像素對(duì)中,若任意3組中像素值全為1時(shí),則判定像素點(diǎn)(i,j)為三叉交點(diǎn)。
L4:上述8組像素對(duì)中,若任意4組中像素值全為1時(shí),則判定像素點(diǎn)(i,j)為四叉交點(diǎn)。
(i-1,j-1)(i-1,j)(i-1,j+1)(i,j-1)(i,j)(i,j+1)(i+1,j-1)(i+1,j)(i+1,j+1)
圖4 像素鄰域分布示意圖
Fig.4 Pixel neighborhood maps
2.2 不變矩特征
矩特征的概念來(lái)源于物理力學(xué),以圖像像素為質(zhì)點(diǎn),以像素的坐標(biāo)為力臂,將物理力學(xué)的階矩借鑒過(guò)來(lái)以反映區(qū)域的形狀特征。不變矩特征于20世紀(jì)60年代被提出,之后廣泛用于字體識(shí)別中,具有平移、旋轉(zhuǎn),以及尺度縮放等不變性[12]。文中利用不變矩特征來(lái)反映物理意義明確的形狀幾何特征,例如字體相對(duì)重心,字形傾斜度,以及字形拉長(zhǎng)度,因?yàn)檫@些幾何特征可以從整體上有效地反映出書(shū)寫(xiě)者的運(yùn)筆風(fēng)格以及書(shū)寫(xiě)習(xí)慣。
首先定義一幅大小為M×N的簽名圖像f(x,y)的p+q階矩Apq為
(1)
(2)
(3)
(4)
定義簽名圖像f(x,y)的p+q階中心矩為
(5)
中心矩μpq表示簽名圖像區(qū)域相對(duì)于灰度重心的分布。二階中心距μ00表示圖像簽名中所有像素點(diǎn)的灰度值之和。二階中心矩μ20表示圖像簽名中沿x坐標(biāo)方向的方差,其物理意義上表征字符圖像在水平方向的伸展度。同理,μ02表征簽名圖像在垂直方向的伸展度。二階中心距μ11表征圖像簽名的傾斜程度,基函數(shù)代表圖像簽名把重心作為原點(diǎn)分布。若μ11<0,則簽名筆跡向右上方傾斜;若μ11>0,則簽名筆跡向左上方傾斜。
簽名字體傾斜度中,字符點(diǎn)陣協(xié)方差矩陣定義為
(6)
該字符點(diǎn)矩陣的正交軸就是協(xié)方差矩陣的特征向量,字符的伸展方向?yàn)樘卣髦递^大的主軸方向。因此,我們利用協(xié)方差矩陣可以計(jì)算主軸的方向角度θ,字形傾斜度f(wàn)fqx,以及字形拉長(zhǎng)度f(wàn)flc,如下式
(7)
(8)
式(7)中,
若ffqx>0,則簽名左傾斜;若ffqx<0,則簽名右傾斜。在式(8)中,
本研究對(duì)二階中心矩的字形傾斜度以及字形拉長(zhǎng)度兩個(gè)物理量進(jìn)行了提取,加上之前的相對(duì)重心量,共4維特征。
2.3 基于Gabor濾波的紋理方向特征
通過(guò)對(duì)大量樣本的觀察發(fā)現(xiàn),由于簽名書(shū)寫(xiě)的隨意性,真實(shí)簽名之間通常存在一定的差異性,同時(shí)模仿簽名之間也存在一定的相似特性。盡管如此,書(shū)寫(xiě)的習(xí)慣性導(dǎo)致同一個(gè)人簽名筆劃的方向特征還是相對(duì)較穩(wěn)定的。為了在頻域中找到能反映細(xì)微邊角差異的紋理特征量,可以利用多通道Gabor濾波器對(duì)圖像簽名進(jìn)行預(yù)處理[13]。很顯然,不同方向的頻域?yàn)V波在一定程度上能夠反映細(xì)微的簽名頻域特征。
2.3.1 Gabor函數(shù) 信號(hào)處理中存在著時(shí)域頻域測(cè)不準(zhǔn)關(guān)系的問(wèn)題,即時(shí)域上非常明確的信號(hào)特征,在頻域內(nèi)就會(huì)變得不確定,反之亦然。直到1964年,學(xué)者Gabor提出了可以滿足時(shí)域頻域測(cè)不準(zhǔn)關(guān)系下界的函數(shù)式,該函數(shù)式在頻域中通過(guò)對(duì)高斯函數(shù)的平移得到,
(9)
二維Gabor函數(shù)為一維Gabor函數(shù)在二維函數(shù)空間上的推廣,
g(x,y)=
(10)
其中二維Gabor函數(shù)的傅里葉變換為
(11)
二維高斯函數(shù)實(shí)際上屬于二維空間上的平滑函數(shù),然而二維Gabor函數(shù)則是二維空間上的帶通濾波器。和一維空間的情況一樣,二維Gabor函數(shù)也滿足時(shí)域頻域測(cè)不準(zhǔn)關(guān)系,也是唯一能達(dá)到不準(zhǔn)下界的函數(shù),因此利用二維Gabor濾波器的性質(zhì)可以實(shí)現(xiàn)不同紋理信號(hào)分割,其基本原理就是可以較好地通過(guò)一類(lèi)主頻紋理,同時(shí)過(guò)濾掉另一類(lèi)的主頻紋理。
2.3.2 Gabor濾波器 本文采用Gabor濾波器的空域表達(dá)式為
G(x,y,f,θ)=
(12)
x′=xsinθ+ycosθ,
(13)
y′=xcosθ-ysinθ。
(14)
其中,f表示在θ方向上的正弦波頻率,δx′,δy′分別表示沿著x′,y′方向的高斯方差,均為常量。
為了分辨各類(lèi)真?zhèn)螆D像簽名之間筆跡上的細(xì)微差異,我們構(gòu)造了M×M的Gabor濾波器,其頻率f為0.5,而x和y方向的δ方差分別為0.5和1,選取0,π/4,π/2,3π/4這4個(gè)不同的方向。
(15)
其中,ni代表子圖Si中像素的個(gè)數(shù),Piθ代表子圖Si中像素fiθ(x,y)的均值。至此,針對(duì)每幅圖像簽名都可以得到一組4×N維的特征向量。N取值為8,因此每幅圖像簽名提取到Gabor濾波筆劃的方向特征為32維。
最終,我們共提取到95維圖像簽名的靜態(tài)特征量。其中包括簽名形狀特征9組共63維,簽名紋理方向特征32維。
3.1 稀疏字典的設(shè)計(jì)
稀疏字典一般包括超完備字典和標(biāo)準(zhǔn)正交字典兩種[14],標(biāo)準(zhǔn)正交字典大多都是通過(guò)字典學(xué)習(xí)算法得到,此外字典學(xué)習(xí)算法中求解出的稀疏系數(shù)中含有太多非零項(xiàng),通常適合使用MOD算法,K-SVD算法,或者Online Dictionary Learning方法進(jìn)行分類(lèi),不適合通過(guò)求解L1范數(shù)的稀疏表示進(jìn)行分類(lèi)。相對(duì)而言,超完備字典通常是由訓(xùn)練樣本集的簡(jiǎn)單變換構(gòu)成,冗余性比較強(qiáng),能較好地稀疏表示測(cè)試樣本,因此,文中選用超完備字典。
假設(shè)同一書(shū)寫(xiě)人簽名的訓(xùn)練樣本集有C類(lèi),可以將第i類(lèi)的si個(gè)樣本裝備成矩陣Ai=[xi1,xi2,…,xisi],其中C∈{0,1},表示真假簽名,s表示同一人的簽名樣本總數(shù)。xij∈Rt表示第i類(lèi)的第j個(gè)樣本,t代表樣本特征維數(shù)。在簽名鑒別過(guò)程中,假設(shè)訓(xùn)練集D∈Rt×s,所以,訓(xùn)練樣本集可表示為
D=[A0,A1]=[x01,…,x0s0,x11,…,x1s1]。
(16)
測(cè)試樣本y可表示為訓(xùn)練樣本集的線性組合,
y=Dx0。
(17)
3.2 稀疏系數(shù)求解
L1范數(shù)問(wèn)題具有比L0范數(shù)更容易求解、比L2范數(shù)所求解更稀疏等優(yōu)點(diǎn),目前大部分稀疏系數(shù)求解問(wèn)題都是基于解決L1范數(shù)最小化問(wèn)題[15]。本文實(shí)驗(yàn)中的稀疏分類(lèi)也應(yīng)用L1范數(shù)問(wèn)題。求解公式為
(18)
其中,‖x‖0代表L0范數(shù),即非0元素的個(gè)數(shù)。然而,當(dāng)訓(xùn)練樣本集D為一超完備字典時(shí),式(18)的求解就變成了NP難問(wèn)題。數(shù)學(xué)上一般利用近似求解解決此類(lèi)問(wèn)題,通過(guò)求解L1范數(shù)稀疏系數(shù)來(lái)逼近L0范數(shù)的解,而L1范數(shù)求解是一個(gè)凸優(yōu)化問(wèn)題,屬于比較常見(jiàn)的優(yōu)化模型。因此,上述優(yōu)化問(wèn)題又變成式(19),
(19)
考慮到噪聲等因素的影響,還需為式(19)添加正則約束項(xiàng),得到新的優(yōu)化模型為
(20)
其中,ε代表噪聲誤差項(xiàng)。
3.3 稀疏分類(lèi)方法選擇
文中選擇稀疏分類(lèi)中經(jīng)典的最小殘差法和權(quán)重系數(shù)法對(duì)簽名訓(xùn)練樣本進(jìn)行鑒別分類(lèi)。
最小殘差法(Min-error)的原理是利用所測(cè)試樣本與它對(duì)應(yīng)的恢復(fù)樣本之間的殘差來(lái)確定所屬分類(lèi)。
(21)
1)給定同一人簽名訓(xùn)練集D=[A0,A1]=[x01,…,x0s0,x11,…,x1s1],已知測(cè)試樣本y∈Rk,噪聲誤差項(xiàng)ε。
2)歸一化訓(xùn)練樣本。
5)判定測(cè)試樣本y所屬分類(lèi)h,
(22)
其中,si代表第i類(lèi)的樣本個(gè)數(shù)。
4.1 實(shí)驗(yàn)樣本說(shuō)明
實(shí)驗(yàn)利用系統(tǒng)的采集模塊多次獲取,共收集了11人不同時(shí)間段的自然手寫(xiě)簽名。其中每個(gè)人的真實(shí)簽名數(shù)40個(gè),不同人書(shū)寫(xiě)的偽造簽名數(shù)在60到75個(gè)之間,真實(shí)簽名共計(jì)440個(gè),偽造簽名共計(jì)718個(gè)。偽造簽名包括隨機(jī)偽造和熟練模仿兩種,其中每個(gè)人的熟練偽造簽名30個(gè)。簽名樣本如圖5所示。
圖5 簽名樣本示意圖Fig.5 Schematic diagram of signature samples
在實(shí)驗(yàn)中選取每人的20個(gè)真實(shí)簽名和20個(gè)偽造簽名(其中,隨機(jī)模仿和熟練模仿各10個(gè))作為訓(xùn)練樣本,剩余的真假簽名作為測(cè)試樣本。因?yàn)楣灿?1組簽名,所以鑒別工作也分成11次,一次鑒別一個(gè)人的簽名測(cè)試集。最終取11組簽名的兩類(lèi)平均錯(cuò)誤率FRR和FAR來(lái)評(píng)價(jià)模式分類(lèi)方法的性能,其中 FRR表示錯(cuò)誤拒絕的真實(shí)簽名數(shù)與總體簽名數(shù)的比值,FAR表示錯(cuò)誤接納的偽造簽名數(shù)與總體簽名數(shù)比值。對(duì)于理想系統(tǒng),這兩類(lèi)錯(cuò)誤率都應(yīng)該可以忽略掉,但實(shí)際中,這兩個(gè)指標(biāo)是有相關(guān)性的:當(dāng)拒真率(FRR)比較低時(shí),納誤率(FAR)會(huì)比較高,反之亦然。
4.2 實(shí)驗(yàn)結(jié)果分析
在10組簽名測(cè)試集上對(duì)Min-error和WC兩種稀疏分類(lèi)方法的FRR和FAR進(jìn)行了實(shí)驗(yàn),結(jié)果如表1所示,從表1可以看出,最小殘差法的兩類(lèi)鑒別錯(cuò)誤率明顯低于權(quán)重系數(shù)法。
同時(shí),為了驗(yàn)證本文L1范數(shù)稀疏表示分類(lèi)的有效性,我們分別用經(jīng)典KNN和SVM算法,以及稀疏分類(lèi)的最小殘差法(Min-error)對(duì)簽名的靜態(tài)特征進(jìn)行分類(lèi)錯(cuò)誤率的實(shí)驗(yàn),具體實(shí)驗(yàn)結(jié)果如圖6和圖7兩個(gè)直觀的錯(cuò)誤率曲線圖所示。
從圖5和圖6可以看出,文中所使用的稀疏表示最小殘差法在FAR與FRR兩類(lèi)指標(biāo)下都優(yōu)于傳統(tǒng)經(jīng)典模式分類(lèi)方法。稀疏分類(lèi)最小殘差法在本文相同的特征集下10組數(shù)據(jù)上的平均FRR為9.25%,平均FAR為4.63%。而采用經(jīng)典KNN和SVM得到的平均FRR分別為12.15%和13.31%,平均FAR分別為8.67%和7.26%。結(jié)果表明,采用稀疏表示分類(lèi)方法更具加有效,較經(jīng)典方法提高了鑒別簽名的精準(zhǔn)度。
表1 最小殘差法和權(quán)重系數(shù)法錯(cuò)誤率實(shí)驗(yàn)結(jié)果
Tab.1 Experimental results on the error rate of Min-error method and WC method
簽名ID 最小殘差法Min-error 權(quán)重系數(shù)法WC FRRFAR平均FRRFAR平均10116700500008340133300667010002011290048400806014520048400968301290006450096801290006450096840076900769007690107700923010005004840016100323008060048400645601077004620077001077004620077070111100417007640138900556009738008330050000667010000066700834900676004050054100946006760081110007140028600500008570042900643
圖6 KNN,SVM和Min-error誤納率比較Fig.6 Comparison of KNN, SVM and Min-error FAR
圖7 KNN,SVM和Min-error拒真率比較Fig.7 FRR comparison of KNN, SVM and Min-error
文中在重點(diǎn)介紹了簽名圖像形狀特征、紋理特征,以及不變矩特征3大靜態(tài)特征的基礎(chǔ)上,提出了簽名圖像紋理特征、不變矩特征以及形狀特征中的字體骨架傾斜方向向量、簽名網(wǎng)孔數(shù)和連通域數(shù)、簽名交叉點(diǎn)及端點(diǎn)數(shù)等特征的提取方法和技術(shù),在此基礎(chǔ)上,利用基于L1范數(shù)的稀疏表示法對(duì)提取的圖像特征集進(jìn)行了簽名鑒別分類(lèi)。通過(guò)有效實(shí)驗(yàn)表明,利用文中所提出的形狀特征以及紋理特征而生成的訓(xùn)練集,明顯降低了簽名鑒別的納誤率FAR和拒真率FRR。
[1] Lü Hairong,WANG Wenyuan,WANG Chong,et al. Off-line Chinese signature verification based on support vectormachines[J].Pattern Recognition Letters,2005,26(15):2390-2399.
[2] KOERICH A L, SABOURIN R, SUEN C Y.Recognition and verification of unconstrained handwritten words [J].IEEE Transactions on Patten Analysis and Machine Intelligence,2005,27(10):1509-1522..
[3] 張大海,汪增福.用于在線簽名認(rèn)證的特征提取和個(gè)性化特征選擇方法[J]. 模式識(shí)別與人工智能,2009,22(4):619-623.
[4] 王珂敏.基于 DTW改進(jìn)算法的在線簽名鑒別方法[J].科技導(dǎo)報(bào),2010,28(13):101-104.
[5] 肖春景,喬永衛(wèi),賀懷清.基于小波包的手寫(xiě)體簽名特征提取方法[J].中國(guó)民航大學(xué)學(xué)報(bào), 2011,29(3):13-15.
[6] 陳曉紅,賈玉文,楊旭,等.紙上靜態(tài)簽名筆跡動(dòng)態(tài)特征的提取和分析[J].中國(guó)司法簽定,2012(4):28-36.
[7] DARAMOLA S A, IBIYEMI S. Novel feature extraction technique for off-line signature verification system[J]. International Journal of Engineering Science and Technology, 2010,2(7):3137-3143.
[8] BLAYVAS I,BRUCKSTEIN A,KIRNMEL R. Efficient computation of adaptive threshold surfaces for image binarization[J]. Pattern Recognition, 2006,39(1): 89-101.
[9] 陳睿. 一種新型的手寫(xiě)漢字筆跡鑒別方法[J].西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,36(1):137-145.
[10] 左敏,曾廣平. 基于等價(jià)對(duì)的圖像連通域標(biāo)記算法[J].計(jì)算機(jī)仿真,2011,28(1):14-16.
[11] 陳佳鑫,賈英民.一種基于滿水填充法的實(shí)時(shí)彩色目標(biāo)識(shí)別方法[J].計(jì)算機(jī)仿真,2012, 29(3):4-8.
[12] 張黎, 陳宇桐,李海偉. 一種基于不變矩的圖像分類(lèi)算法[J].大眾科技,2014,16(9): 12-15.
[13] ZUO W,QI M. A novel data fusion scheme for offline Chinese signature verification[C]∥International Conference on Natural Computation. Springer Berlin Heidelberg, 2005:51-54.
[14] 易學(xué)能.圖像的稀疏字典及其應(yīng)用[D].武漢:華中科技大學(xué),2011:2-11.
[15] 周崴.L1范數(shù)最小化算法及應(yīng)用[D].廣州:華南理工大學(xué),2013:51-56.
(編 輯 李 靜)
Static feature extraction technology of signature verification in mobile internet banking
HE Dianyuan, FENG Jun, YANG Xiaomeng
(School of Information Science and Technology, Northwest University, Xi′an 710127, China)
Based on the research on the preprocessing of signature image, a new research approach that the static characteristics of signature images are obtained by extracting the shape features of the image, the invariant moments features of the image and the features of texture direction based on the Gabor filter in the image is proposed. Signature verification is carried out on the set including 10 feature samples extracted by the L1 norm classification method based on sparse representation. The experimental results show that the average FRR and the average FAR of Min-error method for the sparse classification are 9.25% and 4.63%, respectively. They are significantly lower than 12.15% and 8.67%, respectively for classical KNN method, and 13.31% and 7.26%, respectively for classical SVM method. The research results can meet the performance requirements of mobile internet banking.
internet banking; static feature; extraction technology; L1 norm; sparse representation
2016-03-07
何殿源,男,內(nèi)蒙古呼和浩特人,博士生,從事模式識(shí)別及金融大數(shù)據(jù)研究。
TP391
A
10.16152/j.cnki.xdxbzr.2016-06-006