尚 麗,孫占理
(1.蘇州市職業(yè)大學(xué) 電子信息工程學(xué)院,江蘇 蘇州 215104;2.安徽大學(xué) 電子工程與自動化學(xué)院,安徽 合肥 230039)
掌紋識別技術(shù)可以和其他生物識別技術(shù)相融合,易于實(shí)現(xiàn)一體化的識別,更大程度地保證特征識別的準(zhǔn)確性,因此成為生物特征識別技術(shù)中的一項(xiàng)重要研究內(nèi)容[1-3]。雖然目前已研究出很多掌紋特征識別方法,但是特征識別的快速性和精確度仍是研究者追求的目標(biāo)。特征識別結(jié)果的優(yōu)劣和提取的特征及采用的分類器密不可分,因此選擇有效的特征提取算法和分類器至關(guān)重要。
近年來,稀疏編碼(sparse coding,SC)算法已被證明是一種有效的圖像特征提取方法[4-6],且在此基礎(chǔ)上,一些改進(jìn)的SC算法也被提出并有效應(yīng)用于圖像處理領(lǐng)域[6-10],其中典型的是快速稀疏編碼(fast sparse coding,F(xiàn)SC)算法[8]。與標(biāo)準(zhǔn)稀疏編碼(sparse coding,SC)相比,F(xiàn)SC具有較快的收斂速度,能夠?qū)崿F(xiàn)完備基和過完備基字典的學(xué)習(xí),可以更靈活地提取圖像的特征。但是該算法沒有對稀疏系數(shù)的最大化和特征向量的最大化代表性進(jìn)行約束,所提取的特征用在模式識別中性能欠佳。針對這一問題,本文提出一種改進(jìn)的FSC(modified FSC,MFSC)算法,并采用香港理工大學(xué)提供的PolyU數(shù)據(jù)庫[11-12]進(jìn)行特征提取和識別測試,討論MFSC在圖像特征識別方面的性能。文中采用目前流行的極端學(xué)習(xí)機(jī)(extreme learning machine,ELM)分類器實(shí)現(xiàn)掌紋特征識別任務(wù)[13-15],同時與基于SC和FSC算法的掌紋圖像分類結(jié)果進(jìn)行實(shí)驗(yàn)對比,進(jìn)一步證明了所提出的MFSC算法在掌紋圖像特征識別中的有效性。
FSC算法最初由L.Honglak等[8]提出,其最小化目標(biāo)函數(shù)定義為
式(1)中:X=[x1,x2,…,xN]為L×N維觀測樣本,每一列為一個子圖像塊;A=[a1,a1,…,aM]為L×M維特征基矩陣,約束條件為為M×N維稀疏系數(shù)矩陣,β是一個常數(shù);函數(shù)f(·)為稀疏懲罰函數(shù),通常選擇為如下三種形式[8]:
在L.Honglak等提出的FSC算法中,稀疏懲罰函數(shù)選擇為L1正則化最小二乘形式當(dāng)固定稀疏系數(shù)矩陣S時,特征基矩陣A的學(xué)習(xí)可通過最小化函數(shù)實(shí)現(xiàn)??紤]約束條件和拉格朗日(Lagrange)對偶函數(shù)的優(yōu)勢,對應(yīng)的Lagrange函數(shù)形式為
式中λ>0是對偶變量,這樣特征基矩陣A的學(xué)習(xí)就轉(zhuǎn)化為求解式(3)中A的最小化問題,得到的更新公式為
固定矩陣A,對式(1)采用特征符號搜索法實(shí)現(xiàn)系數(shù)矩陣S的學(xué)習(xí),具體過程參見文獻(xiàn)[8]。這種FSC算法有效地解決了L1和L2范數(shù)的正則化及約束最小二乘法兩個凸優(yōu)化問題,計算過程大為簡化,具有較快的收斂速度。
為了更有效地提取圖像的特征以利于后續(xù)的圖像特征分類任務(wù),在FSC算法的基礎(chǔ)上,考慮最小化兩個約束條件,本文提出了一種MFSC算法,其目標(biāo)函數(shù)定義為
式(5)中:矩陣X,A和S與式(1)中的含義相同;約束條件為γ和β為正常數(shù);最小化是為了增強(qiáng)矩陣S的最大化稀疏性,而最大化(即最小化則是為了增強(qiáng)矩陣A的最大化代表性。
同SC和FSC算法一樣,MFSC算法仍采用輪流更新A和S的方法實(shí)現(xiàn)目標(biāo)函數(shù)式(5)的最小化[8]。當(dāng)固定S時,式(5)可以改寫為
式(6)即為具有二次約束的最小二乘法優(yōu)化問題,通常采用梯度優(yōu)化算法可實(shí)現(xiàn)目標(biāo)函數(shù)的最小化。為了得到更好的優(yōu)化效果,本文采用Lagrange對偶法求解。式(6)對應(yīng)的Lagrange函數(shù)形式為
式(7)對應(yīng)的Lagrange對偶函數(shù)形式為
利用共軛梯度法得到矩陣A迭代公式
固定矩陣A,式(5)的最小化問題則轉(zhuǎn)化為對每列向量s(k)j求解最小化問題
考慮稀疏向量的符號,式(10)的優(yōu)化問題簡化為求解下面的優(yōu)化問題
式(11)中:z表示輸出向量;y表示輸入向量。對式(11)進(jìn)行優(yōu)化時,在每個迭代步驟中首先采用梯度優(yōu)化算法對向量z進(jìn)行更新,得到的向量記為,則有
然后把當(dāng)前的z~值代入函數(shù)式,對該函數(shù)式借助特征符號搜索法[8]進(jìn)行z~的更新,其更新公式為
式(13)中:為矩陣A的子矩陣為θ中去掉零值后的符號矩陣的子向量利用
式(12)和式(13),經(jīng)過反復(fù)迭代后,最后得到最佳的系數(shù)向量,最終實(shí)現(xiàn)矩陣S的更新。
極端學(xué)習(xí)機(jī)(ELM)可以隨機(jī)地確定單隱層網(wǎng)絡(luò)的輸入權(quán)值和隱層節(jié)點(diǎn)參數(shù),通過簡單地計算可解析地獲得輸出權(quán)值,具有較快的學(xué)習(xí)速度和較好的泛化能力[13-15],目前已被廣泛應(yīng)用于模式分類任務(wù)中[16]。ELM被用作分類器時,其分類原理與支持向量機(jī)(support vector machines,SVM)一樣,也是基于兩類的分類問題[13]。設(shè)為N個訓(xùn)練樣本,其中xi=[xi1,xi2,…,xik,…,xin]T為第i個樣本向量,yi=[yi1,yi2,…,yik,…,yin]T是xi對應(yīng)的類別標(biāo)記向量,則定義判決函數(shù)的數(shù)學(xué)模型為
式(14)中:wi=[wi1,wi2,…,win]T是輸入節(jié)點(diǎn)與第i個隱層節(jié)點(diǎn)的輸入權(quán)值向量;βi=[βi1,βi2,…,βin]T是連接第i個隱層節(jié)點(diǎn)與輸出節(jié)點(diǎn)的輸出權(quán)值向量;bi是第i個隱藏神經(jīng)元的偏置;g(·)表示隱藏層的激活函數(shù),本文選取為Sigmoid函數(shù);wi.xi表示wi和xi的內(nèi)積;H(x)表示隱藏層輸出矩陣,定義為
用在模式分類問題中,所采用的ELM最小化目標(biāo)函數(shù)定義為
約束條件為yiβ.h(x)≥1-ξi,ξi≥0(i=1,2,…,N)。式(16)對應(yīng)的Lagrange函數(shù)形式為
式中μi和δi為Lagrange乘數(shù),均為負(fù)數(shù)。對β和ξ分別求偏導(dǎo)數(shù),即得到和λ=δi+μi,?i的對偶問題,則式(17)的最小化問題轉(zhuǎn)化為求解目標(biāo)函數(shù)
式中0≤δi≤λ(i=1,2,…,N)。根據(jù)Karush Kuhn Tucker條件[15],當(dāng)δi=0時,yiβ.h(x)>1;δi=λ時, yiβ.h(x)<1;0<δi<λ時,yiβ.h(x)=1。
測試中選用香港理工大學(xué)提供的PolyU掌紋數(shù)據(jù)庫,該數(shù)據(jù)庫包含100人的共600幅圖像,即每人有6幅掌紋圖像,每一幅圖像被處理為128×128像素。選用每人的前3幅掌紋圖像組成訓(xùn)練集合,后3幅掌紋圖像組成測試集合。為了減少計算量,對每一幅掌紋圖像采用小波變換進(jìn)行預(yù)處理,得到大小為64×64像素的圖像。因此,得到的訓(xùn)練集合Xtrain和測試集合Xtest大小均為4 096×300像素。進(jìn)一步采用主分量分析(principal component analysis,PCA)方法進(jìn)行降維處理,考慮不同的主分量個數(shù),同時采用距離分類器和ELM分類器對PCA特征進(jìn)行識別,以確定最佳的主分量個數(shù),從而減少后續(xù)MFSC特征識別的計算量。采用上述兩種分類器對PCA特征識別的結(jié)果,如表1所示。當(dāng)維數(shù)增大時,距離分類器識別效果增強(qiáng),但是ELM分類結(jié)果在主分量大于324時,識別效果相差并不很明顯。因此,在考慮計算量和特征識別效果時,本文選擇主分量的個數(shù)為324。則用于MFSC算法的訓(xùn)練集合大小Vk為300×324,每一行為一幅圖像。
在324個主分量特征空間內(nèi)進(jìn)行MFSC特征提取學(xué)習(xí),設(shè)訓(xùn)練得到的特征基矩陣為A,W=A-1,則稀疏特征系數(shù),則測試圖像的特征基為Utest=R(WWz)-1,其恢復(fù)結(jié)果可以由式得到。圖1給出了采用MFSC算法訓(xùn)練得到的部分基圖像,顯然,所得到的基圖像同稀疏編碼特征基一樣,具有局部性和方向性,模擬了人眼初級視覺系統(tǒng)的特性[4-5]。
進(jìn)一步采用ELM分類器對MFSC特征進(jìn)行識別,同時與FSC和SC特征識別結(jié)果進(jìn)行對比,所得到的識別結(jié)果如表2所示。觀察表2中數(shù)據(jù),在分類器選定時,基于MFSC特征的分類效果明顯優(yōu)于基于FSC和SC特征的識別結(jié)果,而基于SC特征識別的結(jié)果最差。在算法選定時,ELM分類器的性能明顯優(yōu)于距離分類器的性能。另外,在測試中采用ELM分類器時,在每一種算法下特征識別的時間相差不明顯,均為0.001 5 s左右;而采用距離分類器時,特征識別的時間明顯比ELM長。因此,根據(jù)實(shí)驗(yàn)結(jié)果,采用基于MFSC特征的ELM分類器可以快速、有效地實(shí)現(xiàn)掌紋圖像的識別。
圖1 基于MFSC算法的部分特征及圖像
表1 PCA特征識別結(jié)果
表2 不同算法下得到的識別結(jié)果
本研究提出了一種改進(jìn)的快速稀疏編碼算法,并有效地應(yīng)用于圖像特征識別。由于該算法考慮了圖像特征稀疏系數(shù)的最大化和特征基的最大表示性,有利于提高圖像特征分類的精度,在應(yīng)用于掌紋圖像特征識別時取得了較好的識別效果。與基于FSC和SC算法的掌紋圖像識別方法相比,測試結(jié)果表明本文提出的掌紋特征識別方法,具有較高的準(zhǔn)確度和快速性,具有一定的實(shí)用性和重要的理論研究意義;而且本研究提出的方法,可以擴(kuò)展應(yīng)用于其他模式識別領(lǐng)域,具有重要的借鑒意義。
參考文獻(xiàn):
[1]薛延學(xué),劉一杰,劉超,等.一種改進(jìn)的BDPCA掌紋識別方法[J].計算機(jī)工程與應(yīng)用,2014,50(15):150-152.
[2]陶筱嬌,王晅.基于SURF特征與模糊推理的掌紋識別[J].計算機(jī)工程與應(yīng)用,2016,52(1):185-189.
[3]MALVIYA R,KUMAR R,DANGI A,et al.Verification of palmprint using Log gabor filter and comparison with ICA[J].International Journal of Computer Applications in Engineering Sciences,2011(S):222-227.
[4]SHANG L,HUANG D S,DU J X,et al.Palmprint recognition using FastICA algorithm and radial basis probabilistic neural network[J].Neurocomputing,2006,69 (13/14/15):1782-1786.
[5]OLSHAUSEN B A,F(xiàn)IELD D J.Emergence of simple-cell receptive field properties by learning a sparse code for natural images[J].Nature,1996,381:607-609.
[6]黃宏圖,畢篤彥,查宇飛,等.基于笛卡爾乘積字典的稀疏編碼跟蹤算法[J].電子與信息學(xué)報,2015,37(3):516-521.
[7]SHANG L.Adaptive denoising using a modified sparse coding shrinkage method[J].Neural Processing Letters,2006,24(2):153-162.
[8]HONGLAK L,ALEXIS B,RAIAT R,et al.Efficient sparse coding algorithms:advance in neural information processing systems (NIPS2006),Vancouver,B.C.,Canada,December 4-7[C].USA:MIT Press,2007:801-808.
[9]LI Qingyong,LIN Dacheng,SHI Zhongzhi,et al.Task-oriented sparse coding model for pattern classification[C]//WANG L,CHEN K,ONG Y S,et al.Lecture Notes in Computer Science (LNCS):The 11th International Conference on Natural Computation (ICNC’05).Berlin Heidelberg:Springer-Verlag,2005:903-914.
[10]ZHANG K H,ZHANG L,YANG M H,et al.Fast compressive tracking[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2014,36(10): 2001-2015.
[11]尚麗,崔鳴,杜吉祥,等.應(yīng)用非負(fù)矩陣分解和RBPNN模型的掌紋識別方法[J].計算機(jī)工程與應(yīng)用,2012,48(4):199-203.
[12]郭金玉,劉玉芹.魯棒主元分析在掌紋識別中的應(yīng)用[J].計算機(jī)工程與應(yīng)用,2012,48(19):8-10.
[13]HUANG G B,CHEN L.Enhanced random search based incremental extreme learning machine[J].Neurocomputing,2008,71(16):3460-3468.
[14]陳鴻星.基于ELM-LSSVM的網(wǎng)絡(luò)流量預(yù)測[J].計算機(jī)工程與應(yīng)用,2015,51(24):73-77.
[15]張敏,曾新苗,馬長春,等.一種基于簇的極限學(xué)習(xí)機(jī)的在線學(xué)習(xí)算法[J].計算機(jī)工程與應(yīng)用,2014,50(11):188-191,266.
[16]王夢珍,劉立,王建,等.基于Kmean和ELM的乳腺腫塊檢測方法[J].計算機(jī)工程與應(yīng)用,2015,51(12):171-175.