于愛華,王洪安
(浙江科技學(xué)院 自動化與電氣工程學(xué)院,杭州 310023)
基于特征優(yōu)化與稀疏表示的3D掌紋分類
于愛華,王洪安
(浙江科技學(xué)院 自動化與電氣工程學(xué)院,杭州 310023)
針對大數(shù)據(jù)背景下3D掌紋技術(shù)存在的問題,提出一種基于優(yōu)化投影矩陣的3D掌紋稀疏表示識別技術(shù)架構(gòu)。系統(tǒng)首先提取3D掌紋表面類型特征,然后利用分塊方向梯度直方圖構(gòu)成訓(xùn)練樣本,通過優(yōu)化設(shè)計(jì)投影矩陣,使得同類掌紋投影特征互相關(guān)性變大,異類掌紋投影特征互相關(guān)性變??;最后利用投影后3D掌紋特征稀疏表示分類,并比較L0/L1/L2范數(shù)各種快速算法性能。通過投影優(yōu)化后的系統(tǒng),在識別率和實(shí)時(shí)性上都有所改善,仿真實(shí)驗(yàn)證實(shí)了研究工作的有效性。
3D掌紋識別;壓縮感知;投影矩陣優(yōu)化;稀疏表示
掌紋識別技術(shù)是近幾年提出的一種新興的生物識別技術(shù),以其豐富的信息量,穩(wěn)定而唯一的特征越來越受到學(xué)術(shù)界的關(guān)注[1-3]。與常見的生物識別技術(shù)(指紋、虹膜、人臉)相比,掌紋識別技術(shù)具有識別率高、普適性強(qiáng)、速度快、設(shè)備低廉、用戶接受性好等優(yōu)點(diǎn),因此在各種身份識別應(yīng)用中,如公共安全、出入控制、網(wǎng)絡(luò)支付等領(lǐng)域有著廣泛的應(yīng)用。2D掌紋圖像識別是當(dāng)前掌紋識別技術(shù)研究的主流,雖然2D掌紋識別通常能獲得較高的準(zhǔn)確率,但其存在一些內(nèi)在的缺陷:掌紋本身除了豐富的紋理特征以外,還包含豐富的深度和曲面信息,這在2D圖像中無法得以體現(xiàn);光照的影響會導(dǎo)致2D掌紋識別率顯著下降;2D掌紋圖像容易被偽造和復(fù)制,這就會導(dǎo)致其抗攻擊能力較弱。與2D掌紋相比較,3D掌紋能有效地克服上述困難,對光照和噪聲有更好的魯棒性[4]。同時(shí),3D掌紋在仿制難度上也遠(yuǎn)大于2D掌紋。掌紋識別主要包括兩個(gè)關(guān)鍵過程:特征提取和分類器構(gòu)建。隨著信息技術(shù)應(yīng)用的不斷深入,大數(shù)據(jù)背景下3D掌紋識別技術(shù)遇到的最大問題就是數(shù)據(jù)量太大,即“維數(shù)災(zāi)難”問題。研究表明,當(dāng)維數(shù)越來越高時(shí),分析和處理數(shù)據(jù)的復(fù)雜度及成本會快速增長。在分析高維數(shù)據(jù)時(shí),所需的空間也非常大,以致經(jīng)常制約算法的實(shí)現(xiàn)。于是高維海量數(shù)據(jù)的特征提取就成為迫切需要解決的問題和巨大的挑戰(zhàn),而特征提取算法優(yōu)劣是直接關(guān)系到識別性能的關(guān)鍵因素。目前廣泛應(yīng)用的特征降維方法有主成分分析(principle components analysis,PCA)[5]、線性判別式分析(linear discriminant analysis,LDA)[6-7]等,其優(yōu)點(diǎn)是實(shí)現(xiàn)簡單,降低數(shù)據(jù)冗余方便,運(yùn)算速度較快,同時(shí)具有一定的抗噪性;但缺點(diǎn)是容易破壞原始數(shù)據(jù)的相關(guān)性且難以統(tǒng)計(jì)圖像紋理特性等。
針對大數(shù)據(jù)背景下3D掌紋技術(shù)存在的問題,筆者借鑒壓縮感知理論(compressive sensing, CS)成果[8-9],將稀疏表示的分類器(sparse representation based classifier,SRC)引入模式識別[11-12],提出一種基于優(yōu)化特征投影的3D掌紋稀疏表示識別技術(shù)架構(gòu)。系統(tǒng)首先利用掌紋曲面的3D曲率信息提取掌紋表面類型特征,然后通過分塊方向梯度直方圖提取圖像特征構(gòu)成訓(xùn)練字典,通過優(yōu)化設(shè)計(jì)投影矩陣,即尋求一種壓縮變換,使得在某種意義下各類間相關(guān)性變小,同類間相關(guān)性變大。最后利用優(yōu)化的投影矩陣進(jìn)行3D掌紋分類,利用L0/L1/L2范數(shù)算法進(jìn)行稀疏表示分類比較,通過比較各個(gè)類別的稀疏表示殘差能量實(shí)現(xiàn)掌紋圖像分類識別。仿真實(shí)驗(yàn)表明,該方法相比于傳統(tǒng)方法L2范數(shù)算法,其抗干擾能力有所加強(qiáng),從而有效地降低了特征維數(shù),且運(yùn)算速度快識別性能良好。
對于一個(gè)x∈RN×1輸入信號,其線性投影y過程為:
y=Φx∈RM×1。
(1)
式(1)中:Φ∈RM×N稱為投影矩陣。CS基本內(nèi)容就是當(dāng)M?N時(shí),對于測量值y和測量矩陣Φ,如何恢復(fù)原始信號x。顯然,式(1)是一個(gè)欠定問題,在求解過程中要對x加以約束。
設(shè)信號x可由L個(gè)基向量{ψl}線性表示為:
(2)
式(2)中:Ψ∈RN×L為字典(矩陣);s為稀疏向量(大部分元素為0),若s中有K個(gè)非零元素,則x稱為在Ψ下K稀疏,在Klt;M這個(gè)條件下式(1)有解。
將式(2)代入式(1)得:
(3)
式(3)中:D∈RM×L稱為等效字典。
2.1 特征優(yōu)化稀疏表示分類器的結(jié)構(gòu)
特征優(yōu)化稀疏表示分類器的結(jié)構(gòu)如圖1所示。首先離線訓(xùn)練樣本獲得投影矩陣和等效字典,然后測試樣本經(jīng)過特征提取后再進(jìn)行投影壓縮,最后在等效字典下稀疏表示,根據(jù)稀疏表示的殘差確定識別結(jié)果。
圖1 基于特征優(yōu)化稀疏表示分類器的結(jié)構(gòu)Fig.1 Structure of sparse representation classifier based on optimized features
2.2 采用表面類型掌紋圖像特征提取
表1 基于表面類型特征(ST)的定義 Table 1 The definition of surface type feature
表面類型特征[13]是基于表面平均曲率KM和高斯曲率KG進(jìn)行定義的一種表面特征(surface type, ST),其定義如表1,它具有很高的鑒別特性。均值曲率和高斯曲率是曲面的幾何特征,曲面局部的固有形狀決定各點(diǎn)曲率值,具有位置不變性。因此,用表面類型特征來刻畫3D掌紋的曲面每個(gè)點(diǎn)的表面類型特征,具有一定的魯棒性和較高的識別精度。3D掌紋的曲面可以表示為γ(u,v)=S(u,v,f(u,v)),這里采用Besland等[14]提出的一種計(jì)算高斯曲率和均值曲率特征的方法。高斯曲率定義為:
(4)
均值曲率定義為:
(5)
圖2 3D掌紋及其表面類型特征Fig.2 3D palm print and surface pattern feature
式(4)~(5)中:fu、fv、fuu、fvv、fuv分別是f的一階、二階和混合偏導(dǎo)。高斯曲率和均值曲率僅依賴于曲面片本身,與空間中所處的位置無關(guān)。
因此,均值曲率和高斯曲率對3D掌紋的旋轉(zhuǎn)、平移、形變都具有一定的魯棒性。圖2(a)和(b)分別顯示3D掌紋圖像及其表面類型特征。
2.3 采用分塊方向梯度直方圖特征提取
圖3 掌紋特征分塊和HOG特征Fig.3 Block of palm print feature and HOG feature
方向梯度直方圖(histogram of oriented gradient, HOG)特征[15]是一種在機(jī)器視覺和圖像處理中用來進(jìn)行紋理特征描述的算子。它通過統(tǒng)計(jì)和計(jì)算圖像梯度方向分布直方圖來表征特征。為了緩解特征對齊問題對稀疏表示的影響,將特征進(jìn)行分塊處理,統(tǒng)計(jì)每個(gè)塊的梯度直方圖(不同梯度的個(gè)數(shù)),即可形成每個(gè)塊的描述算子,各個(gè)塊的梯度直方圖串聯(lián)起來便得到目標(biāo)的HOG特征描述算子。3D掌紋特征分塊圖和其中一塊的HOG特征如圖3(a)和(b)所示。這里的3D掌紋中心區(qū)域通過對感興趣區(qū)域裁剪獲取,該區(qū)域中信息用作特征提取和識別,該區(qū)域的選取具有較好的穩(wěn)定性,但不具有唯一性。
2.4 基于特征投影優(yōu)化的3D掌紋識別稀疏分類器的模型
若3D掌紋庫中有I類不同手掌的掌紋樣本,其中每類手掌的掌紋又有Q個(gè)不同的掌紋樣本,則每個(gè)樣本圖像按照上面方法提取表面特征形成一個(gè)列向量,設(shè)其維度為N×1,并歸一化處理后作為字典庫中的一個(gè)原子,這樣形成字典庫Ψ=[Ψ1,Ψ2,…,Ψi,…,ΨI]={ψl}∈RN×L。對任意的1≤i≤I,字典子塊Ψi∈RN×Q,是第i類手掌的掌紋樣本集合,易見L=IQ。對1≤l≤L,ψl∈RN×1且‖ψl‖2=1是字典的一個(gè)列向量,即原子。
對于任意輸入的測試掌紋樣本,按照同樣方法提取特征排列形成一個(gè)N×1的列向量x,并假設(shè)x可以在特征字典庫Ψ下表示為:
x=Ψs+ε。
(6)
式(6)中:ε∈RN×1為誤差。將測試樣本特征x進(jìn)行壓縮投影,得到投影信號y∈RM×1,過程為:
(7)
式(7)中:Φ∈RM×N為投影矩陣;D=ΦΨ∈RM×L為等效字典;e=Φε∈RM×1為投影誤差。3D掌紋識別系統(tǒng)的稀疏表示模型為:
這個(gè)問題是非凸優(yōu)化問題,難以求解。由于信號是K稀疏,在滿足有限等距性質(zhì)(restricted isometry property, RIP)條件下與如下問題等價(jià)。
這是一個(gè)凸優(yōu)化問題,可以有很多算法來解決[16],如同倫算法[17](homotopy, HT)、對偶增量拉格朗日乘子[18](dual augmented lagrangian multiplier, DALM)、快速迭代收縮閾值[19](fast iterative shrinkage thresholding, FIST),為了簡化算法,提高系統(tǒng)實(shí)時(shí)性能,文獻(xiàn)[20]采用L2范數(shù)來稀疏表示。
(8)
(9)
基于特征優(yōu)化與稀疏表示的3D掌紋分類算法流程如下:
1)對3D掌紋訓(xùn)練樣本提取表面類型特征,將表面類型特征利用分塊技術(shù)提取HOG特征,形成訓(xùn)練樣本。
2)對3D掌紋特征訓(xùn)練樣本歸一化處理,按一定要求排列,構(gòu)造字典庫Ψ=[Ψ1,…,Ψi,…,ΨI]。
3)將測試圖像x0按1)~2)預(yù)處理形成列向量x。
4)根據(jù)Ψ設(shè)計(jì)投影矩陣Φ。
字典子塊Ψi∈RN×Q,字典庫Ψ=[Ψ1,…,Ψi,…,ΨI]∈RN×L,等效字典為:
D=ΦΨ=[D1,…,Di,…,DI]∈RM×L。
(10)
式(10)中:投影矩陣Φ∈RM×N;Di=ΦΨi∈RM×Q。
目前測量矩陣優(yōu)化的研究已經(jīng)取得大量理論成果[21-23],這些成果可歸結(jié)為:
(11)
式(11)中:‖·‖F(xiàn)為弗羅貝尼烏斯范數(shù);G為D格拉姆(Gram)矩陣,對于字典Ψ,G僅僅與Φ有關(guān);Gt為目標(biāo)格拉姆矩陣。式(11)通過優(yōu)化Φ使得D對應(yīng)的格拉姆矩陣G逼近Gt。
字典庫Ψ由I類掌紋樣本集合組成。這里,一類指同一手掌的掌紋由于其光照、角度、位置等的變化而組成的集合,一般同一類子塊Ψi中的原子兩兩內(nèi)積較大,而不同的字典子塊之間一般較小。令
對目標(biāo)格拉姆矩陣做改進(jìn),即
Gt=ΨTΨ·Δ。
(12)
式(12)中:·表示點(diǎn)乘,修正矩陣Δ∈RL×L可表達(dá)為:
對任意1≤i≤I、1≤j≤I,Δij的尺寸均與Ψij相同;1≤m≤L、1≤n≤L,{δmn}為Δ中對應(yīng)位置的元素,且
(13)
式(13)中:ηgt;0為調(diào)整因子。式(12)構(gòu)造的Gt通過有鑒別地改變其相關(guān)性,為后面提高稀疏表示識別性能打下基礎(chǔ)。由此,形成投影矩陣設(shè)計(jì)問題
(14)
(15)
由此可見,整個(gè)算法只與修正常數(shù)η有關(guān),對于給定的Ψ及η,系統(tǒng)只要離線求得Φ一次,而且式(16)是解析解結(jié)果,計(jì)算代價(jià)不大。
采用香港理工大學(xué)3D掌紋數(shù)據(jù)庫,該數(shù)據(jù)庫是一個(gè)規(guī)模比較大的3D掌紋數(shù)據(jù)庫,包括200人(其中男性136人,女性64人)的8 000個(gè)掌紋,年齡跨度10~55歲。每個(gè)人的3D掌紋數(shù)據(jù)分2次采集,采集間隔為1個(gè)月。在每次采樣過程中,記錄每個(gè)手掌的10個(gè)3D掌紋數(shù)據(jù),因此共有400個(gè)類別,每個(gè)類別有20個(gè)3D掌紋。第一次采集的10個(gè)3D掌紋數(shù)據(jù)用于訓(xùn)練,第二次采集的數(shù)據(jù)用于測試。原始3D掌紋的分辨率為768×576像素,z方向上的精度為32位。原始3D掌紋數(shù)據(jù)存在大量噪聲,因此不適合用來做特征提取。在進(jìn)行特征提取前,必須先從原始3D掌紋數(shù)據(jù)中提取出比較穩(wěn)定的中心塊(region of interest,ROI),這樣既可以減少噪聲數(shù)據(jù)干擾,又可以使得提取到的中心塊位置相對統(tǒng)一。3D掌紋的中心區(qū)域(大小為128×128像素)通過對感興趣區(qū)域裁剪獲得,被用來進(jìn)行特征提取和識別,分成6×6塊,每塊5×5個(gè)特征,共900個(gè)特征。在此特征上開展壓縮方法比較及分類器2種類型的實(shí)驗(yàn)比較。實(shí)驗(yàn)中,平臺操作系統(tǒng)為Windows XP;CPU為3.4 GHz;內(nèi)存為4 GB。
4.1 參數(shù)η設(shè)置
針對測量矩陣優(yōu)化設(shè)計(jì)中的參數(shù)η,測試其對系統(tǒng)性能的影響。設(shè)定測量信號維度M=200,壓縮率為900/200,對η取不同的值,通過優(yōu)化設(shè)計(jì)Φ,選用計(jì)算速度較快的L2范數(shù)算法進(jìn)行測試。圖4顯示的是3D掌紋庫識別率隨η變化的曲線。從圖4可知,適當(dāng)提高η,3D掌紋庫識別率基本上呈上升趨勢??梢?,適當(dāng)選取的η確實(shí)提高了系統(tǒng)識別率。綜合考慮,在后續(xù)仿真中固定修正常數(shù)η=0.2,對這一3D掌紋庫而言均可取得較好的識別效果。
4.2 壓縮方法與M對識別性能的影響
將測試信號按照主成分分析(PCA)、隨機(jī)采樣(RDM)、投影矩陣優(yōu)化(PMO)3種壓縮方式稀疏表示分類識別。由CS理論分析可知,當(dāng)壓縮投影值M較大時(shí),系統(tǒng)識別精度也相對更高,對3D掌紋庫的識別率統(tǒng)計(jì)如圖5所示,但是相應(yīng)的計(jì)算時(shí)間也增加。從圖5可知,系統(tǒng)識別率基本上隨著壓縮投影值M增加。當(dāng)M=200時(shí),系統(tǒng)識別率穩(wěn)定在一個(gè)比較理想的位置,即壓縮率為900/200。圖5數(shù)據(jù)表明,投影矩陣優(yōu)化方法相對于隨機(jī)采樣及主成分分析在系統(tǒng)識別率上均達(dá)到最大值。
圖4 系統(tǒng)識別率隨η變化Fig.4 Change of system recognition rate with η
圖5 不同壓縮方法識別率隨M變化(L2范數(shù))Fig.5 Change of recognition rate of different gt;compression method with M(L2 norm)
4.3 分類器性能測試
將3D掌紋信號進(jìn)行投影壓縮,再對投影值進(jìn)行識別分類,分類方法分別采用L0/L1/L2范數(shù)求解,不同分類器識別率如表2所示,不同分類器識別時(shí)間如表3所示。
表2 不同分類器識別率比較(η=0.2)Table 2 Comparison of recognition rates of different classifiers (η=0.2) %
由表2可見,3D掌紋庫對于L1算法的識別率最高,其中DALM和FIST效果最佳,HT其次,下面就是L2范數(shù),OMP近似算法最差,這和稀疏表示解的可靠性基本吻合,同時(shí)通過特征優(yōu)化壓縮的識別率比沒有壓縮的效果有明顯提升。
由表3可見,L2算法的速度最快,其次是OMP和HT同倫算方法,后面是DALM和HT,最后是FIST。因此,從識別率和識別時(shí)間考慮,DALM和HT是比較好的算法;在實(shí)時(shí)要求高的地方,L2范數(shù)算法比較合適。通過投影壓縮,系統(tǒng)的識別率和實(shí)時(shí)性也有較大幅度的改善。
筆者以優(yōu)化壓縮感知矩陣為基礎(chǔ),提出一種基于壓縮感知的3D掌紋識別技術(shù)框架。通過稀疏表示對壓縮優(yōu)化的3D掌紋特征進(jìn)行分類。在3D掌紋庫的仿真實(shí)驗(yàn)結(jié)果顯示,基于L1范數(shù)的稀疏表示算法有更高的識別率,而L2范數(shù)的稀疏表示算法更適合應(yīng)用于實(shí)時(shí)要求高的場景中。
[1] 李春燕,盧光明,黎偉.基于曲面曲率和RLDA的3D掌紋識別方法[J].中國圖像圖形學(xué)報(bào),2011,16(5):807.
[2] 楊冰,王小華,楊鑫.基于局部紋理特征的三維掌紋識別研究[J].光電工程,2014,41(12):53.
[3] ZHANG L, SHEN Y, LI H Y, et al. 3D palmprint identification using block-wise features and collaborative representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2015,37(8):1730.
[4] LI W, ZHANG D, LU G, et al. A novel 3-D palmprint acquisition system[J]. IEEE Transactions Systems Man and Cybernetics,2012,42(2):443.
[5] TURK M, PENTLAND A. Eigen faces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71.
[6] YU H, YANG J. A direct LDA algorithm for high-dimensional data: with application to face recognition[J]. Pattern Recognition,2001,34(10):2067.
[7] SWETS D L, WENG J. Using discriminate eigen features for image retrieval[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(8):831.
[8] DONOHO D L. Compressed sensing[J]. IEEE Transactions on Information Theory,2006,52(4):1289.
[9] CANDES E J, WAKIN M B. An introduction to compressive sampling[J]. IEEE Signal Processing Magazine,2008,25(2):21.
[10] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210.
[11] YU A H, BAI H, JIANG Q R, et al. Multi-objects classification via optimized compressive sensing projection[C]//International Conference on Information, Communications and Signal Processing. Taibei: IEEE,2014:1.
[12] LI G, ZHU Z, YANG D. On projection matrix optimization for compressive sensing systems[J]. IEEE Transactions on Signal Processing,2013,61(11):2887.
[13] SNELICK R, ULUDAG U, MINK A, et al. Large-scale evaluation of multimodal biometric authentication using state-of-the-art systems[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(3):450.
[14] BESLAND P J, JAIN R C. Segmentation through variable-order surface fitting[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1988,10(2):167.
[15] FLUSSER J, ZITOVA B, SUK T. Moments and moment invariant in pattern recognition[M]. Hoboken, New Jersey: Wiley Publishing,2009.
[16] YANG A Y, SASTRY S S, GANESH A, et al. Fast L1-minimization algorithms and an application in robust face recognition: a review[C]//IEEE International Conference on Image Processing. Las Vegas: CSREA Press,2010:1849.
[17] ASIF M S,ROMBERG J. Sparse signal recovery of streaming signals using L1-homotopy[J]. IEEE Transactions on Signal Processing,2013,62(16):4209.
[18] YANG J, ZHANG Y. Alternating direction algorithms for L1-problems in compressive sensing[J]. SIAM Journal on Scientific Computing,2011,33(1):250.
[19] BECK A, TEBOULLE M. A fast iterative shrinkage thresholding algorithm for linear inverse problems[J]. SIAM Journal on Imaging Science,2009,2(1):183.
[20] ZHANG L, YANG M, FENG X. Sparse representation or collaborative representation: which helps face recognition[C]//International Conference on Computer Vision. Washington: IEEE Computer Society,2011:471.
[21] ZELNIK M L, ROSENBLUM K,ELDAR Y C. Sensing matrix optimization for block-sparse decoding[J]. IEEE Transactions on Signal Processing,2011,59(9):4300.
[22] CLEJU N. Optimized projections for compressed sensing via rank-constrained nearest correlation matrix[J]. Applied and Computational Harmonic Analysis,2014,36(3):495.
[23] YU A H, BAI H, SUN B B, et al. Face recognition based on optimized projections for distributed intelligent monitoring systems[J]. International Journal of Distributed Sensor Networks,2016,10(4):1155.
3Dpalm-printsparserepresentationclassificationbasedonoptimizedfeatures
YU Aihua, WANG Hongan
(School of Automation and Electrical Engineering, Zhejiang University of Science and Technology, Hangzhou 310023, Zhejiang, China)
In response to the 3D palm-print technical problems in the context of big data, this paper proposes a new 3D palm-print sparse representation classification technique based on optimized features. Firstly, the 3D palm-print surface pattern features are extracted from the training images. Secondly, the blocked histogram oriented gradient features are vectorized as the training samples. A projection matrix is optimized from the training features, which enhance the homogeneous coherence and reduces the heterogeneous one. Finally, the optimized features are used in the sparse representation classification system via L0/L1/L2norm representation algorithm through comparison. With these modifications, the new 3D palm-print recognition system can improve real-time performance and recognition rate greatly. Experiments results validate the proposed methods.
3D palm-print recognition; compressed sensing; projection matrix optimization; sparse representation
TP 391.41;TN911.7
A
1671-8798(2017)06-0450-07
10.3969/j.issn.1671-8798.2017.06.009
2017-05-09
浙江省教育廳科研計(jì)劃項(xiàng)目(Y201430687)
于愛華(1975— ),男,江蘇省海安人,工程師,博士研究生,主要從事數(shù)字信號處理研究。E-mail:yuaihua_seu@163.com。