李 璨, 李 亮, 王 昕
(長(zhǎng)春工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 吉林 長(zhǎng)春 130012)
生物識(shí)別技術(shù)[1]就是利用人固有的生理特征(如指紋、臉部、虹膜等)和行為特征(如字跡、聲音、步姿等)來(lái)進(jìn)行個(gè)人身份的識(shí)別鑒定。但事實(shí)上這些技術(shù)存在還有許多亟待解決的問(wèn)題,例如在人臉識(shí)別方面,當(dāng)人剃了胡子、戴了眼鏡(或口罩)或者是胖了瘦了,這會(huì)使得人臉識(shí)別結(jié)果變得很不穩(wěn)定[2]。同樣,因?yàn)橹讣y是一種外在的生物特征,對(duì)于脫皮、有傷痕等低質(zhì)量指紋存在識(shí)別困難。而且有的人指紋特征少、難成像,更重要的是其很容易被仿制[3],這使得指紋識(shí)別多了幾分不安全因素。而指靜脈是一種內(nèi)在生物特征,具有唯一性,不會(huì)磨損且極難仿制和盜用,具有很高的安全性,且在短時(shí)間內(nèi)生物特征相對(duì)穩(wěn)定[4]。因此指靜脈是新一代生物識(shí)別技術(shù)的典型代表。DBN[5]作為一種典型的深度學(xué)習(xí)模型近年來(lái)被廣泛應(yīng)用,但由于其忽略了圖像的二維空間結(jié)構(gòu)信息,難以完全學(xué)習(xí)圖像的局部特征[6]。而LCP[7-8]模型不僅可以提取圖像的局部LBP[9]紋理信息,而且可以提取圖像鄰域像素間的結(jié)構(gòu)信息[10]。
綜上所述,文中提出了一種新的基于DBN與LCP相結(jié)合的深度指靜脈識(shí)別算法,該方法利用LCP算法提取指靜脈圖像的局部紋理特征信息和局部構(gòu)造信息,從而彌補(bǔ)了DBN模型易忽略圖像局部結(jié)構(gòu)信息的不足。同時(shí)由于LCP模型對(duì)圖像的旋轉(zhuǎn)和光照的影響具有較強(qiáng)的魯棒性,因此,以LCP特征作為DBN網(wǎng)絡(luò)的輸入使得整個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)更加穩(wěn)健,與傳統(tǒng)的BP[11]分類算法基于SVM[12]和KNN[13]的算法相比較,文中算法能實(shí)現(xiàn)對(duì)指靜脈更加精確的識(shí)別。
LCP模型所描述的圖像特征包含兩部分:傳統(tǒng)的LBP紋理特征和Microscopic Configuration Operator(MIC) 微觀構(gòu)造特征。兩種特征相輔相成,使得LCP模型對(duì)圖像特征信息的表達(dá)十分詳盡。LBP模型通過(guò)比較某一像素點(diǎn)與其鄰域點(diǎn)的像素值的差異來(lái)計(jì)算LBP特征,表達(dá)式如下:
(1)
式中:gP----鄰域像素點(diǎn)的灰度值;
gC----中心像素的灰度值;
P----鄰域點(diǎn)個(gè)數(shù);
R----鄰域半徑。
Mic算子能很好地表達(dá)圖像的局部微觀性質(zhì),定義如下:
定義一個(gè)P維的矢量
A=(a0,a1,…,aP-1)T
(3)
式中:gc,gi----分別表示中心點(diǎn)像素與鄰域點(diǎn)像素;
ai----gi的權(quán)重參數(shù)。
Gm=(gm,0,gm,1,…,gm,Om-1)T
如果用Vi,0,Vi,1,…,Vi,P-1(i=0,1,…,Om-1)表示以第i個(gè)具有m模式的像素為中心的鄰域點(diǎn)像素的灰度值,則圖像中所有模式近鄰像素的灰度值構(gòu)成矩陣Vm:
(4)
若用Am=(am0,am1,…,amP-1)T表示模式的參數(shù)矢量,則最優(yōu)參數(shù)矢量應(yīng)該滿足:
Gm=VmAm(5)
因式(5)是超定方程,采用最小二乘法可求其唯一解:
(6)
同時(shí)為了克服圖像旋轉(zhuǎn)引起Am的周期變化,引入傅里葉變換。用Fm表示Am的P點(diǎn)一維傅里葉變換。
(7)
式中:Fm(k)----Fm的第i個(gè)元素;
Am(i)----Am的第i個(gè)元素,且Fm具有旋轉(zhuǎn)不變性,取其幅度作為圖像的局部微觀構(gòu)造Mic特征,則Mic定義如下:
|Fm|=[|Fm(0)||Fm(1)|…|Fm(P-1)|]T(8)
最終將LBP特征與Mic特征進(jìn)行融合用于表示LCP特征:
LCP={[|F0|;O0];[|F1|;O1];…;[|FM-1|;OM-1]}(9)
式中: |Fi|----由式(8)計(jì)算而來(lái);
Oi----第i個(gè)相應(yīng)LBP模式出現(xiàn)的次數(shù);
M----LBP模式數(shù)量。
DBN[7]深度信念網(wǎng)絡(luò)是由Hinton與其學(xué)生在2006年提出的,其由一系列無(wú)監(jiān)督受限玻爾茲曼機(jī)(Restricted Boltzmann Machines,RBMS)[14]和輸出層的前饋反向傳播(Feed Forward Back Propagation,BP)[15]神經(jīng)網(wǎng)絡(luò)構(gòu)成。它本質(zhì)上就是一個(gè)包含多個(gè)隱藏層的概率模型。整體結(jié)構(gòu)如圖1所示。
圖1 DBN模型結(jié)構(gòu)圖
這一系列的RBMS通過(guò)層疊的關(guān)系將前一層RBM的輸出作為后一層RBM的輸入,從而構(gòu)成了深度RBMS網(wǎng)絡(luò)。在DBN網(wǎng)絡(luò)的最后一層采用有監(jiān)督的BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)整體網(wǎng)絡(luò)的參數(shù)進(jìn)行調(diào)整與分類。并且通常把一系列RBMS的無(wú)監(jiān)督訓(xùn)練稱之為預(yù)訓(xùn)練,而把深層RBMS訓(xùn)練得到的網(wǎng)絡(luò)參數(shù)作為整體網(wǎng)絡(luò)參數(shù)賦給BP的階段稱為微調(diào)。對(duì)于一個(gè)具有l(wèi)層隱藏層的DBN來(lái)說(shuō),可視單元與隱藏單元之間的聯(lián)合分布可表示為:
P(v,h(1),h(2),…,h(l))=P(v|h(1))p(h(2)|h(1))…
P(h(l-1)|h(l))(10)
式中:v----DBN的可視單元,v=h(0);
h(k)----第k層隱藏單元,k=1,2,…,l。
第k層與第k+1層的隱藏單元滿足:
(11)
σ(x)----激活函數(shù),在DBN網(wǎng)絡(luò)中將P(h(l-1),h(l))稱為一個(gè)RBM模型。
網(wǎng)絡(luò)訓(xùn)練的好壞決定了對(duì)LCP特征學(xué)習(xí)的準(zhǔn)確度。DBN的訓(xùn)練過(guò)程如下:
首先,以全局的LCP特征作為輸入,對(duì)第一層RBM進(jìn)行無(wú)監(jiān)督訓(xùn)練,得到第一層的最優(yōu)參數(shù)。
然后,以第一層RBM的輸出數(shù)據(jù)作為第二層的輸入進(jìn)行無(wú)監(jiān)督訓(xùn)練得到第二層RBM的參數(shù)值。以此類推,逐層訓(xùn)練得到每一層的參數(shù)值。
最后,通過(guò)全局訓(xùn)練對(duì)各層參數(shù)進(jìn)行微調(diào),從而實(shí)現(xiàn)DBN收斂并達(dá)到全局最優(yōu),并進(jìn)行回歸分類。該訓(xùn)練過(guò)程規(guī)避了目標(biāo)過(guò)擬合的現(xiàn)象。
此時(shí)深度DBN網(wǎng)絡(luò)的聯(lián)合分布表示如下:
P(H,h(1),h(2),…,h(l))=P(H|h(1))p(h(2)|h(1))…
P(h(l-1)|h(l))(14)
式中:H----LCP特征;
h(1),h(2),…,h(l)----DBN網(wǎng)絡(luò)對(duì)H特征學(xué)習(xí)到不同層次下的高級(jí)特征,其影響到DBN網(wǎng)絡(luò)學(xué)習(xí)的有效性。
因此LCP的紋理特征部分我們選擇統(tǒng)一模式的LBP,這樣做有兩大好處:
4.3 硫酸鹽含量在17.66%~26.39%范圍內(nèi)和溶液酸堿度存在線性關(guān)系,控制溶液的pH值可以控制硫酸鹽的含量。但考慮到此次樣本量比較小,樣品的含量及pH比較集中,未涉及藥典規(guī)定的邊緣pH值,后期將進(jìn)行更加嚴(yán)密的實(shí)驗(yàn)及論證,對(duì)擬合方程進(jìn)行進(jìn)一步的確認(rèn)和優(yōu)化,以求在符合質(zhì)量標(biāo)準(zhǔn)要求、確保準(zhǔn)確度的前提下,簡(jiǎn)化檢驗(yàn)操作的流程步驟。
1)非統(tǒng)一模式LBP具有2p種模式。而統(tǒng)一LBP只有(p(p-1)+3)種模式,即特征維數(shù)大大降低。而且雖然模式減少了很多,但其仍然包含了90%以上的LBP模式信息。
2)統(tǒng)一LBP對(duì)灰度平移變換具有不變性,且能更好描述局部紋理特征。
文中的整體實(shí)現(xiàn)步驟如下:
1)對(duì)指靜脈圖像進(jìn)行尺度歸一化處理為128*128,然后對(duì)圖像進(jìn)行4*4分塊;
2)提取各子塊的LCP特征;
3)將各子塊的LCP特征連接成全局的LCP特征;
4)對(duì)特征向量進(jìn)行歸一化處理并輸入到DBN網(wǎng)絡(luò);
5)對(duì)DBN網(wǎng)絡(luò)進(jìn)行逐層訓(xùn)練以獲得最優(yōu)網(wǎng)絡(luò)參數(shù);
6)利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行全局微調(diào);
7)在網(wǎng)絡(luò)頂層進(jìn)行回歸分類并計(jì)算識(shí)別率。
實(shí)驗(yàn)圖像數(shù)據(jù)庫(kù)包含64個(gè)手指共960幅圖像,每個(gè)手指有15幅圖像。所有圖像均已作了尺度歸一化處理。
經(jīng)過(guò)歸一化處理后的部分指靜脈圖像如圖2所示。
實(shí)驗(yàn)中隨機(jī)取每個(gè)手指的10幅圖像作為訓(xùn)練樣本,余下的5幅圖像作為測(cè)試樣本。實(shí)驗(yàn)平臺(tái)是Windows10專業(yè)版PC機(jī)處理器為intel(R)core(TM)i5-3470cpu@3.20 GHz,內(nèi)存是4 GB,軟件版本MATLAB2013a(64位)。
DBN網(wǎng)絡(luò)構(gòu)建完成后需要設(shè)定模型的最佳參數(shù),經(jīng)過(guò)反復(fù)驗(yàn)證,文中實(shí)驗(yàn)DBN的層數(shù)設(shè)置為4,學(xué)習(xí)率設(shè)置為0.001,每層迭代次數(shù)為30次。
隱含層節(jié)點(diǎn)數(shù)的學(xué)習(xí)曲線如圖3所示。
圖3 隱含層節(jié)點(diǎn)數(shù)的學(xué)習(xí)曲線
從圖3可以看出,當(dāng)隱藏層節(jié)點(diǎn)數(shù)大于90以后, DBN的訓(xùn)練集誤差趨于穩(wěn)定。因此,各層隱含節(jié)點(diǎn)的個(gè)數(shù)設(shè)置為100,為了進(jìn)一步確定整個(gè)DBN網(wǎng)絡(luò)的結(jié)構(gòu),進(jìn)行了RBM深度測(cè)試實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果見表1。
表1 不同RBM深度對(duì)識(shí)別率的影響 %
由表1的實(shí)驗(yàn)結(jié)果可以看出,當(dāng)DBN網(wǎng)絡(luò)的RBM深度為3時(shí),識(shí)別率達(dá)到最大94.68%。
所以本實(shí)驗(yàn)構(gòu)建的DBN結(jié)構(gòu)為m-100-100-100-64。其中,m表示輸入DBN的LCP特征向量的維數(shù)。文中取P=8,R=1,所以最終m=2 240。
為了驗(yàn)證文中提出的深度指靜脈識(shí)別算法的有效性,設(shè)置了兩組對(duì)比實(shí)驗(yàn)。分別選取有監(jiān)督的BP神經(jīng)網(wǎng)絡(luò)和SVM及KNN(K值取3)三種分類算法作為對(duì)比。實(shí)驗(yàn)中各組均采用相同的測(cè)試集和訓(xùn)練集,所用特征向量均為L(zhǎng)CP特征。實(shí)驗(yàn)結(jié)果見表2。
表2 不同分類算法識(shí)別率對(duì)比 %
由表2的實(shí)驗(yàn)結(jié)果可以看出,DBN 網(wǎng)絡(luò)明顯優(yōu)于傳統(tǒng)有監(jiān)督的分類學(xué)習(xí)模型,這是因?yàn)镈BN作為一種深度學(xué)習(xí)模型,能夠通過(guò)多層非線性結(jié)構(gòu)對(duì)輸入數(shù)據(jù)自主地提取具有分類能力的特征再分類學(xué)習(xí),從而提高了對(duì)指靜脈的識(shí)別。這正是淺層BP網(wǎng)絡(luò)、KNN分類算法及SVM所不具備的。而且,隨著圖像庫(kù)中指靜脈圖像數(shù)目的增加,文中算法的識(shí)別率將更高。
經(jīng)過(guò)多年研究努力,指靜脈識(shí)別的研究獲得了很大進(jìn)展,在門禁、考勤、圖書館、銀行、監(jiān)獄、汽車安全等領(lǐng)域得到了一定的應(yīng)用。文中所提出的深度指靜脈識(shí)別方法相較于傳統(tǒng)的有監(jiān)督分類算法有著明顯的優(yōu)勢(shì),LCP特征與DBN網(wǎng)絡(luò)相結(jié)合使得該模型能通過(guò)多層非線性結(jié)構(gòu)對(duì)輸入數(shù)據(jù)進(jìn)行自主的再分類學(xué)習(xí),從而對(duì)指靜脈的識(shí)別率更高。將文中算法與傳統(tǒng)的BP分類算法、SVM分類算法及KNN分類算法進(jìn)行了對(duì)比實(shí)驗(yàn),證明文中算法的優(yōu)越性。