国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Gist和IPCA算法的多文種離線手寫簽名識(shí)別*

2022-11-17 11:56:10麥合甫熱提吾爾尼沙買買提朱亞俐庫(kù)爾班吾布力
關(guān)鍵詞:手寫離線特征提取

韓 輝,麥合甫熱提,吾爾尼沙·買買提,朱亞俐,庫(kù)爾班·吾布力,

(1.新疆大學(xué)信息科學(xué)與工程學(xué)院,新疆 烏魯木齊 830046;2.新疆多語種信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,新疆 烏魯木齊 830046;3.新疆大學(xué)教務(wù)處,新疆 烏魯木齊 830046)

1 引言

生物特征為人體所固有且不可復(fù)制、不會(huì)失竊和不會(huì)被遺忘,利用生物特征進(jìn)行身份識(shí)別安全、可靠、準(zhǔn)確。手寫簽名作為一種有效并且被法律認(rèn)可的生物行為特征,被廣泛應(yīng)用于金融、司法、銀行和保險(xiǎn)等各個(gè)領(lǐng)域[1]。手寫簽名根據(jù)數(shù)據(jù)獲取方式的不同分為在線手寫簽名和離線手寫簽名[1,2];根據(jù)數(shù)據(jù)組成和分類方法的不同可分為手寫簽名識(shí)別和手寫簽名鑒別[2]。手寫簽名自被提出可以用于進(jìn)行身份識(shí)別至今,針對(duì)世界主流語言文字的研究已經(jīng)取得了豐碩的成果,但是對(duì)于我國(guó)少數(shù)民族語言以及多文種混合的簽名識(shí)別研究仍處于發(fā)展階段。

Ubul等人[3]通過提取維吾爾文離線手寫簽名的多維改進(jìn)的網(wǎng)格信息特征,并采用歐氏距離ED(Euclidean Distance)、K近鄰KNN(K-Nearest Neighbor)和貝葉斯網(wǎng)絡(luò)3種分類器對(duì)維吾爾文離線手寫簽名進(jìn)行分類識(shí)別,最終得到了93.53%的平均準(zhǔn)確率。Pal等人[4]提出了一種基于前景和背景的雙語脫機(jī)簽名識(shí)別技術(shù),采用梯度直方圖HOG(Histogram of Oriented Gradient)和Zernike矩等特征,在支持向量機(jī)SVM(Support Vector Machine)分類器下得到了最高為97.70%的識(shí)別率,但是該工作只進(jìn)行了文種的識(shí)別,并沒有實(shí)現(xiàn)把簽名圖像分類到用戶個(gè)體。Serdouk等人[5]從CEDAR和GPDS-300這2個(gè)數(shù)據(jù)集中提取了圖像的梯度局部二值模式GLBP(Gradient Local Binary Patterns)并利用SVM分類器進(jìn)行簽名鑒別,最終在2個(gè)數(shù)據(jù)集上分別得到了9.58%和14.01%的平均錯(cuò)誤率。劉利利[6]采用形狀上下文特征在GPDS960和自建的離線手寫簽名鑒別數(shù)據(jù)庫(kù)上進(jìn)行了實(shí)驗(yàn),分別得到了誤拒率為9.75%、誤納率為12.89%和誤拒率為12.38%、誤納率為18.27%的效果。魏佳敏等人[7]通過提取圖像的靜態(tài)特征和偽動(dòng)態(tài)特征并進(jìn)行有效融合,在極限學(xué)習(xí)機(jī)和稀疏表示的兩階段分類中取得了95.53%的平均準(zhǔn)確率,但是該工作的缺點(diǎn)是分類數(shù)量少,文字形式單一。艾海提·伊敏等人[8]通過提取局部中心點(diǎn)和ETDT 2種特征并進(jìn)行有效融合,同時(shí)使用絕對(duì)距離、歐氏距離、卡方距離和cosine距離進(jìn)行分類識(shí)別,最終得到了最高為98.70%的平均準(zhǔn)確率。Mo等人[9]提出了一種基于離散曲波變換的多文種離線手寫簽名識(shí)別方法,在我國(guó)2種少數(shù)民族語言維吾爾語和柯爾克孜語中實(shí)現(xiàn)了較好的識(shí)別準(zhǔn)確率。

本文針對(duì)多文種混合模式的離線手寫簽名識(shí)別展開研究。由于離線手寫簽名圖像有效的筆畫部分普遍比較稀疏,存在大量的無效白色背景,但是目前現(xiàn)有的特征提取方法大多是對(duì)圖像整體表層內(nèi)容進(jìn)行描述,這樣會(huì)使得提取到的特征存在大量的冗余,不利于提高識(shí)別準(zhǔn)確率。而如果想要提高識(shí)別準(zhǔn)確率,則需要依賴大量的訓(xùn)練數(shù)據(jù)和提取多個(gè)特征并進(jìn)行有效融合,這樣又會(huì)造成提取的特征過多和特征維度過大,最終計(jì)算困難影響識(shí)別效率。為此,本文提出了一種基于Gist和增量主成分分析IPCA(Incremental Principal Component Analysis)算法的多文種離線手寫簽名識(shí)別方法,利用Gist特征對(duì)靜態(tài)圖像的宏觀全局意義上的特征進(jìn)行描述,使其在特征提取的過程中更多地聚焦到簽名圖像的整體布局和筆畫部分,而忽略圖像無效白色背景;同時(shí),利用IPCA算法的批處理方式,把提取的數(shù)據(jù)特征逐批加載到內(nèi)存中,遞增式更新特征的主成分,以達(dá)到在對(duì)識(shí)別效果影響很小的情況下大大提高運(yùn)行效率。本文使用漢語、英語和我國(guó)少數(shù)民族語言維吾爾語3個(gè)不同的數(shù)據(jù)集對(duì)本文方法進(jìn)行實(shí)驗(yàn)。由于這3種語言來自不同中文的語系(漢語:漢藏語系,英語:印歐語系,維語:阿爾泰語系),所以能有效證明本文所提方法的有效性,而且本文還混合3種數(shù)據(jù)后進(jìn)行了實(shí)驗(yàn),最后都使用SVM分類器進(jìn)行識(shí)別分類。實(shí)驗(yàn)結(jié)果表明,本文提出的方法即使使用少量的訓(xùn)練數(shù)據(jù),無論是在單文種還是在多文種混合的數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),其識(shí)別準(zhǔn)確率與之前相關(guān)研究相比都表現(xiàn)較優(yōu)。

2 離線手寫簽名識(shí)別

離線手寫簽名識(shí)別是模式識(shí)別研究領(lǐng)域的一個(gè)重要研究方向。類似于其他模式識(shí)別問題的實(shí)驗(yàn)流程,離線手寫簽名識(shí)別的基本步驟包括簽名圖像數(shù)據(jù)采集、圖像預(yù)處理、特征提取、分類決策4個(gè)步驟。本文方法的具體實(shí)驗(yàn)流程如圖1所示。

Figure 1 Experimental procedure of the proposed method圖1 本文方法實(shí)驗(yàn)流程

(1)簽名數(shù)據(jù)采集。在數(shù)據(jù)采集的過程中,首先要求每位簽名者將自己的名字書寫在已被等分成橫七豎三共21個(gè)矩形方框的一張A4紙上。之后,把每一份手寫簽名樣本通過掃描儀以300 dpi的分辨率掃描成電子圖像,并以“.jpg”格式保存在計(jì)算機(jī)中。然后,使用切圖工具將其處理成一個(gè)個(gè)單獨(dú)的簽名樣本圖像,并以“.bmp”格式24位圖像保存在數(shù)據(jù)集中。

(2)數(shù)據(jù)預(yù)處理。為了更好地保留簽名圖像類內(nèi)相似性和類間差異性,在對(duì)簽名圖像進(jìn)行特征提取之前需要先對(duì)其進(jìn)行預(yù)處理操作,以最大限度地保留簽名本身的信息。本文首先依次使用高斯濾波、全局平均閾值和Unger平滑算法[10]對(duì)圖像進(jìn)行去噪、二值化和平滑等預(yù)處理操作;然后去除簽名圖像無效邊緣背景,并使用最鄰近插值法進(jìn)行簽名圖像的尺寸歸一化(96*384)。預(yù)處理后的圖像如圖2所示。

Figure 2 Pre-processing renderings圖2 預(yù)處理效果圖

(3)特征提取。特征提取是簽名識(shí)別過程中最重要的一環(huán),提取的特征優(yōu)異與否,將直接影響分類識(shí)別的結(jié)果。本文針對(duì)離線手寫簽名有效特征稀疏難以提取的問題,提出了一種基于Gist和IPCA算法的多文種離線手寫簽名識(shí)別方法,且分別將特征維度k設(shè)置為60,80,100,120和140進(jìn)行對(duì)比實(shí)驗(yàn)。

(4)訓(xùn)練和測(cè)試。本文選取每位簽名者的前S(=5,8,11,14,17)個(gè)簽名用于訓(xùn)練,其余的用于測(cè)試,使用SVM分類器對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分類識(shí)別,并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行比較分析。

3 特征提取與降維

3.1 Gist特征提取

“Gist”最初源自于1979年Friedman的論文[11],用來對(duì)場(chǎng)景進(jìn)行抽象的描述。2001年被Oliva等人[12]借用來代指空間包絡(luò)特征,用于對(duì)經(jīng)過分塊的輸入圖像進(jìn)行離散傅里葉變換和窗口傅里葉變換,進(jìn)而提取其全局特征信息。隨后,在2003年由Torralba等人[13]繼續(xù)研究并進(jìn)行改進(jìn),用6個(gè)方向、4尺度的小波變換代替傅里葉變換進(jìn)行紋理特征提取。2004年,Renninger等人[14]又采用Gabor濾波對(duì)其進(jìn)行改進(jìn),用于提取靜態(tài)場(chǎng)景圖像的Gist特征。2007年,Siagian等人[15]基于生物的中央周圍濾波特征,將圖像分成方向、顏色和密度3種特征通道,共34個(gè)次通道,每幅圖像分割為4*4共16個(gè)小模塊,采用Gabor濾波算法提取圖像的Gist全局特征信息。

Gist特征是一種全局的特征描述方式,它能夠很好地捕捉到場(chǎng)景圖像的整體特征。對(duì)靜態(tài)場(chǎng)景圖像進(jìn)行識(shí)別時(shí),不需要對(duì)圖像進(jìn)行分割和局部特征提取就可以實(shí)現(xiàn)快速的靜態(tài)場(chǎng)景圖像的分類[16,17]。與以往的特征提取方法不同的是,Gist特征利用Gabor變換多尺度和多方向的特性,能很好地模擬人類視覺,以盡可能地關(guān)注到簽名圖像的筆畫和整體,并將變換后的多通道圖像分別分塊取平均,再將這些平均值進(jìn)行直方圖均衡化得到最終的特征數(shù)據(jù)。與其他單通道圖像特征提取方法相比,上述方法更加全面具體,有效解決了有效特征難以提取的問題。其計(jì)算公式如式(5)所示:

(1)

(2)

kv=2-(v+2)/2π

(3)

(4)

其中,σ為常數(shù),i為虛數(shù)單位,z表示圖像矩陣中元素的坐標(biāo)值。u和v分別表示對(duì)應(yīng)Gabor濾波器的方向和尺度。

將一副大小為h*w的輸入圖像分成n*n個(gè)圖像塊,每個(gè)圖像塊g(x,y)分別與u尺度、v方向的Gabor濾波器ψ(z)進(jìn)行卷積濾波,每個(gè)網(wǎng)格內(nèi)取平均值得到一個(gè)特征,并將這些特征進(jìn)行級(jí)聯(lián)拼接,得到圖像的Gist特征,其計(jì)算公式如式(5)所示:

Gψ,g(x,y,μ,υ)=g(x,y)?ψμ,υ(z)

(5)

其中?在此定義為卷積運(yùn)算符。這樣每幅輸入圖像就獲得了u*v*n*n維的Gist特征數(shù)據(jù)。

3.2 IPCA降維

增量主成分分析IPCA算法是主成分分析PCA(Principal Component Analysis)算法的一種改進(jìn),用于解決因樣本數(shù)量或特征維數(shù)大而造成的系統(tǒng)資源占用問題[18]。與深度學(xué)習(xí)在數(shù)據(jù)量過大時(shí)的加載方法一致,IPCA是將數(shù)據(jù)分成多個(gè)批次,然后每次都只從外存中取一個(gè)批次的數(shù)據(jù)輸入到內(nèi)存中,直接用新樣本對(duì)已有的主成分進(jìn)行增量式修正,進(jìn)而得到最終的樣本最優(yōu)降維。

λh=Ah

(6)

其中,λ是對(duì)應(yīng)的特征值。將A替換為樣本協(xié)方差矩陣,對(duì)于每一個(gè)時(shí)間步長(zhǎng)i,向量h替換為其在第m批樣本向量待求的第i個(gè)特征,記為hi(m),每個(gè)批次一個(gè)樣本數(shù)據(jù),即m=1,2,…,n。令v=λh,可以得到式(7):

(7)

其中,v(m)是對(duì)v的第m步的估計(jì)值??紤]到h=v/‖v‖,并且在一開始,設(shè)v(0)=h(1)作為數(shù)據(jù)擴(kuò)展的第一個(gè)方向,并令hi(m)=v(m-1)/‖v(m-1)‖,從而式(7)可以推出增量表達(dá)式及其遞歸形式,如式(8)所示:

(8)

其中,(m-1)/m是之前估計(jì)的權(quán)重,1/m是新數(shù)據(jù)的權(quán)重。

4 支持向量機(jī)

支持向量機(jī)SVM是一種有監(jiān)督學(xué)習(xí)的二元分類的廣義線性分類器[19],其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面。SVM通過核函數(shù)將輸入數(shù)據(jù)映射至高維空間,為了將輸入特征向量映射到高維特征空間,本文使用高斯徑向基核函數(shù),將問題轉(zhuǎn)換成線性可分問題進(jìn)行非線性分類,并使用其軟邊矩SVM分類方法對(duì)簽名數(shù)據(jù)進(jìn)行分類計(jì)算,具體實(shí)現(xiàn)公式如式(9)所示:

s.t.{yi(wTXi+b)≥1-ξi,ξi≥0

(9)

其中,ξi為松弛變量,用于把一些離群點(diǎn)向中心集中;C為懲罰因子,其值越大,對(duì)誤分類的懲罰越大,這樣對(duì)訓(xùn)練集測(cè)試時(shí)準(zhǔn)確率就高,但泛化能力弱,反之,泛化能力較強(qiáng);N表示樣本個(gè)數(shù),yi表示學(xué)習(xí)目標(biāo)。經(jīng)過實(shí)驗(yàn)對(duì)比,本文實(shí)驗(yàn)中設(shè)置C=1e3。

5 實(shí)驗(yàn)

5.1 實(shí)驗(yàn)數(shù)據(jù)

本文共采集和使用了3個(gè)完全不同語系的離線手寫簽名數(shù)據(jù)集,其中包括漢語、少數(shù)民族語言維吾爾語和西文英語。

(1)漢語離線手寫簽名數(shù)據(jù)集:漢語歸屬于漢藏語系,其特點(diǎn)是字與字之間有明顯的間隔,單個(gè)字體的書寫較為緊湊。該數(shù)據(jù)集包含160人的離線手寫簽名,每人21個(gè),共3 360幅離線手寫簽名圖像。

(2)維吾爾語離線手寫簽名數(shù)據(jù)集:維吾爾語歸屬于阿爾泰語系,其書寫特點(diǎn)是字母與字母之間連寫構(gòu)成一個(gè)音節(jié),幾個(gè)音節(jié)寫在一起構(gòu)成一個(gè)詞,詞與詞之間分開書寫。該數(shù)據(jù)集也包含160人的離線手寫簽名,每人21個(gè),共3 360幅離線手寫簽名圖像。

(3)西文英語離線手寫簽名數(shù)據(jù)集:英語歸屬于印歐語系,其書寫方式和維吾爾語大致相同,但兩者字母結(jié)構(gòu)完全不同。本文使用的是公開數(shù)據(jù)集GPDS Synthetic Off-Line Signature[20,21]中前160人的前21個(gè)真實(shí)簽名樣本圖像,共3 360幅離線手寫簽名圖像。

3個(gè)數(shù)據(jù)集共3*3360=10080幅離線手寫簽名圖像。圖3所示是本文實(shí)驗(yàn)數(shù)據(jù)樣本圖像。

Figure 3 Presentation of data samples圖3 數(shù)據(jù)樣本展示

在實(shí)驗(yàn)過程中,由于簽名圖像并沒有先后順序,所以本文使用每個(gè)數(shù)據(jù)集中每個(gè)人前S(=5,8,11,14,17)個(gè)簽名圖像作為訓(xùn)練數(shù)據(jù),其余圖像作為測(cè)試數(shù)據(jù)。

5.2 運(yùn)行環(huán)境和評(píng)價(jià)標(biāo)準(zhǔn)

本文所有實(shí)驗(yàn)均在64位Ubuntu 18.04.5 LTS的環(huán)境下進(jìn)行,其CPU為Intel i5-4200M,2.40 GHz,內(nèi)存為8 GB,具體程序通過基于PyCharm實(shí)現(xiàn)。

由于本文實(shí)驗(yàn)的是多分類任務(wù),所以只使用平均準(zhǔn)確率AAR(Average Accuracy Rate)作為評(píng)價(jià)指標(biāo),其計(jì)算公式如式(10)所示:

(10)

其中,T表示所有參與測(cè)試的數(shù)據(jù)量;CT表示參與預(yù)測(cè)的數(shù)據(jù)中得到正確結(jié)果的數(shù)據(jù)量;N=10,表示本文把每次實(shí)驗(yàn)進(jìn)行10次,并取平均值得到AAR。

5.3 結(jié)果分析

5.3.1 Gabor濾波器尺度和方向的選擇

首先,本文混合3個(gè)數(shù)據(jù)集的所有數(shù)據(jù),分別使用不同尺度u(=1,2,3,…,8)的Gabor濾波進(jìn)行Gist特征提取,得到對(duì)應(yīng)的8種d(=64,128,192,256,320,384,448,512)維Gist特征。其對(duì)應(yīng)的識(shí)別結(jié)果如圖4所示。

Figure 4 Experimental results of classification using Gist features with different scales圖4 使用不同尺度Gist特征的分類結(jié)果

一般情況下,提取的特征維度越小,特征數(shù)據(jù)就越難以完整表示原本的圖像數(shù)據(jù),進(jìn)而直接導(dǎo)致分類結(jié)果差。由圖4可以看出,當(dāng)使用1尺度4個(gè)方向的Gabor濾波器提取得到64維Gist特征時(shí),識(shí)別準(zhǔn)確率最高為76.26%;當(dāng)提取的特征維度為384維(6尺度4個(gè)方向)時(shí),即使訓(xùn)練數(shù)據(jù)個(gè)數(shù)S僅為5,識(shí)別準(zhǔn)確率也達(dá)到了90.54%。但是,隨著提取特征的維度不斷增大,識(shí)別準(zhǔn)確率增幅越來越小,而實(shí)驗(yàn)運(yùn)行時(shí)間復(fù)雜度的增幅也越來越大。

對(duì)于不同方向的Gabor濾波器,本文使用8尺度1個(gè)方向(0°)、8尺度2個(gè)方向(0°和90°)和8尺度4個(gè)方向(0°,45°,90°和135°)進(jìn)行對(duì)比,如圖5所示。不難看出,使用的方向越多,提取到的特征越詳細(xì),具體識(shí)別準(zhǔn)確率也就越高。

Figure 5 Experimental results of classification using different directional GIST features圖5 使用不同方向Gist特征的分類結(jié)果

圖6給出了當(dāng)每個(gè)人的訓(xùn)練數(shù)據(jù)個(gè)數(shù)S為11時(shí),不同方向的Gist特征在不進(jìn)行降維的情況下的識(shí)別準(zhǔn)確率與實(shí)驗(yàn)運(yùn)行時(shí)間對(duì)比。

Figure 6 Comparison of running effects when S=11圖6 S=11時(shí)運(yùn)行效果對(duì)比

所以,本文選用8尺度4個(gè)方向的Gabor濾波器進(jìn)行Gist特征提取,共得到d=512維的特征數(shù)據(jù)。

5.3.2 IPCA降維維度選擇

一般情況下,特征數(shù)據(jù)降維后,其表示能力也會(huì)相對(duì)降低,而實(shí)驗(yàn)運(yùn)行速度會(huì)相應(yīng)提高。本文使用不同降維算法:主成分分析法PCA、稀疏主成分分析法SPCA(Sparse Principal Component Analysis)和核主成分分析法KPCA(Kernel Principal Component Analysis),把特征維度約減到100維后進(jìn)行識(shí)別得到的實(shí)驗(yàn)結(jié)果如表1所示。

如表1所示,使用不同的降維算法的分類識(shí)別在識(shí)別準(zhǔn)確率上,IPCA算法相對(duì)最低,但是只比使用PCA算法的識(shí)別準(zhǔn)確率低了0.17%,而其實(shí)驗(yàn)運(yùn)行時(shí)間只有使用原始特征的1/50以下,只有核主成分分析算法KPCA的1/2。在保證識(shí)別準(zhǔn)確率變化不大的情況下,極大地提高了實(shí)驗(yàn)運(yùn)行效率,可見這種算法在實(shí)際應(yīng)用中是可行的。所以,本文使用IPCA算法進(jìn)行維度約減,并利用IPCA算法批處理的能力來提高運(yùn)行效率。

Table 1 Experimental results of classification using different dimensionality-reduction methods

除此之外,本文把提取得到的512維的Gist特征分別約減到k(=60,80,100,120,140)維,并進(jìn)行識(shí)別實(shí)驗(yàn)。圖7和圖8分別為使用不同維度的Gist特征的分類識(shí)別效果對(duì)比。

Figure 7 Recognition results of classification using different dimension features圖7 不同維度特征的分類識(shí)別結(jié)果

Figure 8 Running time of classification using different dimension features圖8 不同維度特征的實(shí)驗(yàn)運(yùn)行時(shí)間

與使用原始特征數(shù)據(jù)的識(shí)別結(jié)果相比,圖7中的實(shí)驗(yàn)結(jié)果表明,當(dāng)維度降到一定程度時(shí),識(shí)別準(zhǔn)確率會(huì)大大減小,但是與表1中使用原始低維特征數(shù)據(jù)的實(shí)驗(yàn)結(jié)果相比,即使維度約減到k=60維時(shí),識(shí)別準(zhǔn)確率依然比使用原始64維(1尺度4個(gè)方向)特征的平均高出10%以上。當(dāng)維度k=80時(shí),即使訓(xùn)練數(shù)據(jù)個(gè)數(shù)為5,其實(shí)驗(yàn)結(jié)果依然能達(dá)到90%以上。本文希望在不影響實(shí)驗(yàn)結(jié)果的情況下,盡可能地提高運(yùn)行效率,所以在接下來的工作中只展示了維度約減到k=100時(shí)的實(shí)驗(yàn)結(jié)果。

5.3.3 實(shí)驗(yàn)結(jié)果

上述實(shí)驗(yàn)結(jié)果展示了3個(gè)數(shù)據(jù)集混合情況下的識(shí)別結(jié)果,除此之外,本文還在單文種及兩兩混合的實(shí)驗(yàn)數(shù)據(jù)集上分別進(jìn)行了識(shí)別實(shí)驗(yàn)。表2和表3分別表示單文種和兩兩混合實(shí)驗(yàn)數(shù)據(jù)集上的簽名識(shí)別結(jié)果。

Table 2 Experimental results of classification on single-language dataset

Table 3 Experimental results of classification on mutil-language dataset

通過表2和表3可知,就單文種的離線手寫簽名識(shí)別結(jié)果而言,英語數(shù)據(jù)集上的識(shí)別結(jié)果相對(duì)較差。以往實(shí)驗(yàn)經(jīng)驗(yàn)和實(shí)驗(yàn)結(jié)果證實(shí),維吾爾語數(shù)據(jù)集上的識(shí)別準(zhǔn)確率會(huì)相對(duì)較高,但是本文提取的Gist特征在漢語的離線簽名數(shù)據(jù)集上的識(shí)別準(zhǔn)確率較好。這是因?yàn)橹暗膶?shí)驗(yàn)大部分提取的是局部特征,維吾爾語的離線手寫簽名筆畫較為稠密,有效的局部特征表示能力相對(duì)較強(qiáng);而在整體性方面漢語手寫簽名特征表示能力較強(qiáng);對(duì)于英語數(shù)據(jù)集中的簽名數(shù)據(jù),其筆畫相對(duì)稀疏,也不似中文漢字簽名那樣字與字之間具有整體性,且不同的2個(gè)簽名間的整體差異更大,所以其識(shí)別結(jié)果較差。對(duì)于兩兩語種混合的數(shù)據(jù)集,由于類別數(shù)翻倍,所以識(shí)別準(zhǔn)確率有所下降,但降低幅度不大,這樣正說明了本文算法的有效性和實(shí)用性。

5.4 對(duì)比分析

為了證明本文所提方法的有效性,本文使用了幾種常見的紋理特征提取方法:局部二值模式LBP(Local Binary Pattern)、局部方向模式LDP(Local Direction Pattern)和局部相位量化LPQ(Local Phase Quantization),并分別結(jié)合Gabor變換進(jìn)行特征提取,結(jié)果如表4所示。

Table 4 Experimental results of classification using different amount of training data

根據(jù)上述實(shí)驗(yàn)結(jié)果易知,本文提出的基于Gist特征的離線手寫簽名識(shí)別方法,無論是在單文種還是在3種不同語系的手寫簽名混合的數(shù)據(jù)集上,即使使用少量的訓(xùn)練數(shù)據(jù),也都具有較高的識(shí)別準(zhǔn)確率。同時(shí),為了提高實(shí)驗(yàn)的運(yùn)行效率,本文使用IPCA算法對(duì)提取的特征數(shù)據(jù)進(jìn)行特征降維,與使用原始特征的運(yùn)動(dòng)時(shí)間進(jìn)行對(duì)比,降維后的實(shí)驗(yàn)運(yùn)行效率得到了很大的提高。為了表明本文方法準(zhǔn)確有效,本文與之前相關(guān)方法的實(shí)驗(yàn)結(jié)果進(jìn)行了比較,如表5所示。

Table 5 Comparison between the proposed method and related methods表5 本文方法與相關(guān)方法的對(duì)比

通過實(shí)驗(yàn)對(duì)比,本文提出的基于Gist特征的多文種混合模式的離線手寫簽名識(shí)別方法有效地實(shí)現(xiàn)了多文種混合方式下的多文種離線手寫簽名識(shí)別,而且即使使用少量的訓(xùn)練數(shù)據(jù),依然有很好的識(shí)別結(jié)果。

6 結(jié)束語

針對(duì)多文種混合模式的離線手寫簽名識(shí)別,本文提出了一種基于Gist特征的方法:利用Gist特征對(duì)靜態(tài)圖像的宏觀表示能力,提取了具有較強(qiáng)表示能力的數(shù)據(jù)特征,提高了識(shí)別準(zhǔn)確率;同時(shí)使用IPCA算法進(jìn)行特征維度約減,提高了實(shí)驗(yàn)運(yùn)行效率。與之前的研究方法相比,本文方法在實(shí)驗(yàn)結(jié)果和實(shí)驗(yàn)效率上都相對(duì)較優(yōu)。本文方法是一種傳統(tǒng)的模式識(shí)別方法,與目前比較流行的深度學(xué)習(xí)方法相比,本文方法所需中間步驟較多,如預(yù)處理、特征提取和分類決策;相對(duì)而言,傳統(tǒng)方法的優(yōu)點(diǎn)在于所需訓(xùn)練數(shù)據(jù)較少、運(yùn)行效率較高、運(yùn)行環(huán)境要求較低等。所以,在接下來的工作中,將致力于實(shí)現(xiàn)更加高效的和實(shí)用的多文種離線手寫簽名識(shí)別方法。

猜你喜歡
手寫離線特征提取
手寫比敲鍵盤更有助于學(xué)習(xí)和記憶
我手寫我心
異步電機(jī)離線參數(shù)辨識(shí)方法
呼吸閥離線檢驗(yàn)工藝與評(píng)定探討
淺談ATC離線基礎(chǔ)數(shù)據(jù)的準(zhǔn)備
抓住身邊事吾手寫吾心
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
基于集成學(xué)習(xí)的MINIST手寫數(shù)字識(shí)別
電子制作(2018年18期)2018-11-14 01:48:08
離線富集-HPLC法同時(shí)測(cè)定氨咖黃敏膠囊中5種合成色素
中成藥(2018年2期)2018-05-09 07:20:09
Bagging RCSP腦電特征提取算法
万年县| 浏阳市| 武威市| 红桥区| 杂多县| 湖北省| 长兴县| 长治市| 改则县| 象山县| 蓝山县| 淳化县| 辉南县| 荆门市| 峨山| 潜江市| 那曲县| 玉门市| 邯郸市| 大厂| 桃园市| 聂拉木县| 西贡区| 安塞县| 沅江市| 济宁市| 邵阳市| 鞍山市| 新竹县| 株洲市| 宁武县| 瑞丽市| 黄冈市| 巴青县| 海伦市| 宜宾县| 哈巴河县| 安义县| 资溪县| 大邑县| 新郑市|