崔英杰 田根源
【摘要】在我們生活中有很多重要場合需要使用手寫簽名,這涉及到巨大的利益,而偽造簽名也層出不窮。因此,建立一種快速、有效、科學(xué)的簽名識別工具一直是一個現(xiàn)實而重要的問題。在現(xiàn)實生活中,收集專業(yè)偽造簽名識別難度很大。目前,深度學(xué)習(xí)在圖像處理中表現(xiàn)良好,而卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的一種重要算法,卷積神經(jīng)網(wǎng)絡(luò)可以通過自動搜索圖像中的特征并從中發(fā)現(xiàn)更多的抽象特征,在圖像識別中具有優(yōu)勢。因此,本文探索從深度學(xué)習(xí)中尋找離線中文簽名識別。
【關(guān)鍵詞】卷積神經(jīng)網(wǎng)絡(luò);特征抽取;特征分析;離線簽名;簽名識別
1.卷積神經(jīng)網(wǎng)絡(luò)
深度學(xué)習(xí)的迅速興起,首先從圖像識別領(lǐng)域,深度學(xué)習(xí)在計算機視覺領(lǐng)域取得了突破。深度學(xué)習(xí)可以自動學(xué)習(xí)特征,大大提高人臉識別、語音識別和目標檢測等各種任務(wù)的性能。表情識別是一個圖像分類問題。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)中的一個重要算法,與其它深度學(xué)習(xí)的結(jié)構(gòu)相比,CNN在圖像目標識別領(lǐng)域具有良好的性能。CNN是在多層神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展起來的針對影像分類和辨識而特別設(shè)計的一種深度學(xué)習(xí)架構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)是參照人腦視覺組織發(fā)展起來的一種網(wǎng)絡(luò)。其主要應(yīng)用于圖像的分類處理問題中。CNN屬于監(jiān)督式學(xué)習(xí)。通過梯度下降法對參數(shù)進行修正,使誤差函數(shù)最小化。它具有特征提取的能力。通過疊加卷積運算,產(chǎn)生抽象特征,使模型具有識別能力。卷積神經(jīng)網(wǎng)絡(luò)由一個或多個卷積層和池化層組成。它的功能是發(fā)現(xiàn)圖像中的局部特征。卷積層有一組過濾器,可以捕獲輸入數(shù)據(jù)的特征,而池化層可以壓縮和保留特征。經(jīng)過卷積和合并后,它將連接到完全連接的層,以合并所有的輸入特性。在分類方面,該層次化組織模型對模式識別結(jié)果有較好的效果。
2. 簽名識別意義
隨著科學(xué)技術(shù)的進步,我們生活中的許多事物都已電子化,簽名也逐漸走向電子化。盡管技術(shù)進步,但仍有許多場合需要使用傳統(tǒng)的紙和筆簽名。比如,政府簽公文和證件,民營企業(yè)和社會公眾簽住房、租車、各種銷售合同、信用卡支付、銀行開戶等,都是用傳統(tǒng)的紙和筆簽的。對于簽名,總是存在偽造的問題。到目前為止,因偽造簽名而引發(fā)的法律糾紛還很多。紙質(zhì)簽名的識別通常是由具有自己知識和經(jīng)驗的識別人員來完成的。鑒定過程大約需要一個月。沒有有效、可靠和快速的科學(xué)工具可供使用。離線簽名是指通過筆簽名在各種媒體資料上獲得的簽名。要識別只能依據(jù)媒體材料上簽名的圖像。離線簽名識別是一個巨大的挑戰(zhàn),CNN是用于圖像識別的最佳方法之一,在圖像的防偽識別中具有優(yōu)勢,因此研究卷積神經(jīng)網(wǎng)絡(luò)在中文離線簽名識別中具有重要意義。
3. 簽名識別流程
在簽名識別過程中,為了提高識別率和安全性,需要從原始數(shù)據(jù)中提取各種特征信息。但提取許多特征信息的同時,也造成了許多相同或冗余的特征信息。通常情況下,特征數(shù)目的多少實際上會影響簽名識別的速度和計算量。因此,在分類過程之前,利用特征分析可以提高特征的質(zhì)量和穩(wěn)定性,刪除相似度高的特征。如果不通過特征分析的過程,簽名識別系統(tǒng)的性能將不能發(fā)揮更好的作用。基于簽名識別系統(tǒng)的數(shù)據(jù)檢索方法,可分成在線與離線簽名識別兩種方式。在線與離線簽名識別系統(tǒng)的不同,在于書寫簽名時的動態(tài)信息,比如書寫的壓力、角度等動態(tài)信息資料,這些是離線簽名識別系統(tǒng)所無法取得的特征。離線簽名識別更加困難和復(fù)雜。卷積神經(jīng)網(wǎng)絡(luò)是一種新的圖像識別方法。因此,運用CNN可以更好地進行離線簽名識別。簽名識別系統(tǒng)包括簽名樣本的獲取。提取的簽名樣本含有噪聲和無用信息,影響識別效果。在特征提取之前,需要對其進行預(yù)處理,去除噪聲,減少計算量。預(yù)處理后進行特征提取,識別結(jié)果對特征選擇有很大的依賴性。然后,訓(xùn)練特征可以將訓(xùn)練結(jié)果保存到數(shù)據(jù)庫中。在辨識過程中,通過對收集的簽名樣本數(shù)據(jù)進行去噪等預(yù)處理,然后對預(yù)處理后的數(shù)據(jù)信息進行特征提取,并與之前訓(xùn)練中使用的特征進行匹配,根據(jù)匹配結(jié)果得到識別結(jié)果。簽名識別系統(tǒng)流程如圖1所示。
4. 數(shù)據(jù)集建立和圖像預(yù)處理
4.1 數(shù)據(jù)集建立
在離線簽名識別系統(tǒng)中,利用數(shù)碼相機或光學(xué)掃描儀器獲取簽名的數(shù)字圖像,將簽名圖像輸入計算機,對簽名圖像進行處理,獲得各種外部特征,但不包括壓力、角度等動態(tài)特征。光學(xué)掃描儀器無法獲取書寫時的動態(tài)信息。由于沒有動態(tài)簽名信息,簽名特征相對不穩(wěn)定,很難收集到有效的特征進行分類。
4.2 圖像預(yù)處理
數(shù)據(jù)集建立后,必須對數(shù)據(jù)集中的離線簽名數(shù)據(jù)圖像信息進行預(yù)處理,首先是平滑去噪,由于數(shù)據(jù)采集過程是手寫的,實驗的數(shù)據(jù)源是在A4打印紙上手寫簽名,如簽名時筆劃上的毛刺等噪聲干擾是不可避免的,另外由打印機掃描形成圖像庫。打印紙上不可避免地會出現(xiàn)雜質(zhì)。在掃描過程中,黑點可能出現(xiàn)在簽名圖像的邊緣或簽名上。所以平滑去噪是圖像預(yù)處理中不可缺少的一步,因為平滑處理的質(zhì)量直接影響實驗結(jié)果。選取中值濾波器方法進行平滑和去噪,它的主要目的是消除數(shù)據(jù)采集過程中形成的噪聲。其目的是在抑制圖像噪聲的同時,減少圖像上的噪聲點,保存所需的圖像細節(jié)。保證源數(shù)據(jù)的真實性,提高實驗結(jié)果的準確性。圖像要能被卷積神經(jīng)網(wǎng)絡(luò)來進行處理,就需要將數(shù)據(jù)集的彩色圖像大小統(tǒng)一。所以要把灰度圖像轉(zhuǎn)換成二值圖像,減少處理數(shù)據(jù)量,并進行大小歸一化。對所有的圖像都進行尺寸轉(zhuǎn)換和反轉(zhuǎn)。因為大多數(shù)中文簽名是水平書寫,所以基于長邊來將圖像等比縮放到224像素。等比縮放生成縮略圖后,需要將圖像反相處理,使得卷積類神經(jīng)網(wǎng)絡(luò)去關(guān)注簽名的部分,不關(guān)注空白的部分。規(guī)范化方法可以將所有簽名圖像的大小設(shè)置為一致。
4.3 離線手寫簽名的特征提取
在簽名識別流程中,需經(jīng)過特征抽取的步驟,從原始資料選取各種的特征信息。在簽名識別研究中,有許多特征被提出來改善辨識率與安全性,也造成有許多雷同或是多余特征產(chǎn)生。特征分析處理之后,可刪除性質(zhì)雷同的特征,使得在簽名識別速度上,可以明顯增加特征的高利用性與有效性。卷積神經(jīng)網(wǎng)絡(luò)具有能抽出簽名中特征與分類的能力并且能妥善分類。使用深度卷積生成對抗式網(wǎng)絡(luò)的鑒別器,利用其鑒別器對簽名樣本數(shù)據(jù)進行特征的提取。
5. 結(jié)語
生活有許多重要場合需要使用手寫簽名,當中牽涉龐大的利益,偽造簽名的問題也層出不窮。因此,建立快速、有效、科學(xué)化的簽名真?zhèn)伪孀R工具一直是個實際且重要的議題。依靠傳統(tǒng)的經(jīng)驗識別簽名真?zhèn)我呀?jīng)不能應(yīng)對現(xiàn)在的各種偽造技術(shù)。探索離線中文簽名識別的有效方法。將CNN應(yīng)用到離線中文簽名識別中去,用計算機來進行重要特征信息的提取,并對提取的特征信息進行比對,實現(xiàn)簽名真?zhèn)蔚淖R別,因此,利用卷積神經(jīng)網(wǎng)絡(luò),通過自動搜索圖像中的特征,從中發(fā)現(xiàn)更多的抽象特征并進行分類處理,在離線簽名圖像識別中具有優(yōu)勢。提高了簽名真?zhèn)伪孀R的準確性,CNN辨識系統(tǒng)在無法接受偽造簽名的簽名識別下具有優(yōu)勢,更具有安全保證。
參考文獻:
[1]陳潔萍.手寫簽名脫機識別圖像的預(yù)處理方法[J].輕工科技,2013(7):92-93.
[2]顏兵,王金鶴,趙靜.基于均值濾波和小波變換的圖像去噪技術(shù)研究[J].計算機技術(shù)與發(fā)展,2011,21(2):51-53.
[3]金浙良,覃娟.基于神經(jīng)網(wǎng)絡(luò)的手寫體簽名識別的研究[J].裝備制造技術(shù),2013(5):64-65.
[4]馬小晴,桑慶兵.基于LBP和深度學(xué)習(xí)的手寫簽名識別算法[J].量子電子學(xué)報,2017,34(01):23-31
[5]左文明,黎紹發(fā),曾憲貴.脫機手寫簽名紋理特征分析[J].微電子學(xué)與計算機,2005(02):154-157.
[6]歐陽星明,陳 杲,邱德紅.聯(lián)機手寫簽名動態(tài)信息的獲取[J].計算機應(yīng)用研究,2002(02):103-105
[7]崔英杰.云霧網(wǎng)絡(luò)架構(gòu)的大數(shù)據(jù)分析平臺研究[J].電子設(shè)計工程,2020(05):98-101
[8]吳冰,秦志遠.自動確定圖像二值化最佳閾值的新方法[J].測繪學(xué)院學(xué)報,2001,18(4):283-286
[9]崔英杰.淺析基于MOOCs平臺的自主學(xué)習(xí)模式構(gòu)建[J].現(xiàn)代信息科技, 2019(15):130-134
[10]張智威,孫子文,叢琳,等.基于Markov-BP神經(jīng)網(wǎng)絡(luò)的手寫簽名手機身份認證技術(shù)[J].信息網(wǎng)絡(luò)安全,2013 (9):64-67.
[11]李彥冬,郝宗波,雷航.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計算機應(yīng)用,2016,36(9):2508-2515.
[12]張新峰,沈蘭蓀.模式識別及其在圖像處理中的應(yīng)用[J].測控技術(shù),2004,23(5):28-32.
作者簡介崔英杰,河南駐馬店人,碩士,助教。研究方向:物聯(lián)網(wǎng)。田根源,河南駐馬店人,碩士,助教,研究方向:深度學(xué)習(xí)。