楊玉平,向 華
(1.重慶電子工程職業(yè)學(xué)院,重慶 401331;2.重慶師范大學(xué),重慶401331)
對(duì)人臉識(shí)別特征數(shù)據(jù)降維算法的優(yōu)化
楊玉平1,向 華2
(1.重慶電子工程職業(yè)學(xué)院,重慶 401331;2.重慶師范大學(xué),重慶401331)
在模式識(shí)別領(lǐng)域,人臉特征數(shù)據(jù)相對(duì)龐大,為了提取人臉主要的特征數(shù)據(jù),提高識(shí)別系統(tǒng)的運(yùn)行效率,對(duì)特征數(shù)據(jù)的降維是必須的操作。針對(duì)現(xiàn)有降維算法對(duì)識(shí)別率有較大影響的問(wèn)題,本文總結(jié)了各類降維算法,提出了一種優(yōu)化的降維算法。
人臉識(shí)別;降維;人臉特征;人臉識(shí)別
隨著模式識(shí)別技術(shù)的發(fā)展,各種識(shí)別系統(tǒng)都有了很大的發(fā)展,例如:指紋識(shí)別、虹膜識(shí)別、人臉識(shí)別等。人臉識(shí)別以其不易察覺(jué)性、自然性等特點(diǎn)得到廣泛的應(yīng)用。相對(duì)于其他的識(shí)別方式,人臉識(shí)別的特征數(shù)據(jù)量較大,在提取特征數(shù)據(jù)之后要進(jìn)行降維,這樣可以在一定程度上減少數(shù)據(jù)量,提高識(shí)別系統(tǒng)的運(yùn)行效率。但如果降的維度過(guò)大,會(huì)造成一些主要特征數(shù)據(jù)丟失,使識(shí)別系統(tǒng)的識(shí)別率降低而達(dá)不到要求?,F(xiàn)在在降低維度的實(shí)驗(yàn)過(guò)程中,一般運(yùn)用多種維度降維,比如提取的特征數(shù)據(jù)的維度從幾十維到上百個(gè)維度不等?;蛘呔鸵詫?shí)驗(yàn)的方式來(lái)提取經(jīng)驗(yàn)數(shù)據(jù),往往在維度降到一定程度之后,如果繼續(xù)降維就會(huì)造成整個(gè)識(shí)別系統(tǒng)的識(shí)別率降低。
Karhunen-Loeve變換,簡(jiǎn)稱K-L變換,是一種傳統(tǒng)的數(shù)學(xué)領(lǐng)域常用的正交變換。簡(jiǎn)單來(lái)講就是將K維空間的數(shù)據(jù),通過(guò)降低數(shù)據(jù)維度,把數(shù)據(jù)變成L維空間的數(shù)據(jù)??梢杂孟旅娴臄?shù)學(xué)公式來(lái)表示:
假設(shè)有矩陣Xm×k,m個(gè)行向量表示樣本的個(gè)數(shù),k表示每個(gè)樣本數(shù)據(jù)的維數(shù)。有另一矩陣Rk×l,稱這個(gè)Rk×l為變換矩陣,將這兩個(gè)矩陣作如下運(yùn)算:
可見(jiàn)最終可將m個(gè)樣本的k維數(shù)據(jù),降低到l維數(shù)據(jù)了。Karhunen-Loeve變換的實(shí)質(zhì)就是將數(shù)據(jù)從一個(gè)坐標(biāo)系轉(zhuǎn)換到另一個(gè)坐標(biāo)系中,而前一個(gè)坐標(biāo)系的維度很大,且里面的數(shù)據(jù)帶有許多的冗余信息;而后一個(gè)坐標(biāo)系的維度相對(duì)來(lái)說(shuō)很小,只帶有數(shù)據(jù)的主要信息。
在眾多的特征臉?lè)椒ㄖ?,PCA、LDA、SIFT等特征提取過(guò)程中,都有降低特征數(shù)據(jù)維度的過(guò)程,其一般過(guò)程是:預(yù)處理人臉圖像;加載人臉庫(kù),提取特征數(shù)據(jù)形成特征空間;形成特征子空間;把樣本人臉圖像和待識(shí)別的人臉圖像投影到特征子空間上;選擇一定的距離參數(shù)進(jìn)行識(shí)別。如下圖1:
圖1 圖像處理過(guò)程
一張M×N的人臉圖像,在作預(yù)處理時(shí),可以看成是一個(gè)M×N的行向量或者列向量。例如一張64×64的人臉圖片可認(rèn)為是4 096維列向量,因此它就是一個(gè)4 096維空間中的一點(diǎn)。但一般人臉的都是比較相似的,所以這些人臉中就存在許多的冗余信息,當(dāng)提取了人臉圖像的特征數(shù)據(jù)后,就可以把這些特征數(shù)據(jù)降到一個(gè)低維的空間當(dāng)中,用一個(gè)相應(yīng)的低維子空間來(lái)表示除去冗余信息的主要的特征數(shù)據(jù)。設(shè)m是人臉圖像樣本的數(shù)目;xi表示第i幅人臉圖像構(gòu)成的人臉向量,則樣本的協(xié)方差矩陣為:
根據(jù)SVD定理,設(shè)li(i=1,2,……,k)為矩陣W的k個(gè)非零特征值,vi為W對(duì)應(yīng)于li的特征向量,則W的正交歸一特征向量ui為:
則特征臉子空間為:w=(u1,u2…… ur,)。其中A=
優(yōu)化的特征數(shù)據(jù)降維算法是建立在原有的特征數(shù)據(jù)降維算法的基礎(chǔ)上,通過(guò)在形成特征子空間時(shí)預(yù)設(shè)參數(shù),使降低的維度不至于過(guò)低,從而使主要的特征向量丟失,造成識(shí)別率下降;降低的維度過(guò)少,使過(guò)多的冗余信息存留,造成系統(tǒng)運(yùn)行效率降低。此優(yōu)化算法的流程圖如下圖2:
圖2 優(yōu)化算法流程
具體實(shí)現(xiàn)步驟:
(1)運(yùn)用imread()函數(shù)讀入訓(xùn)練樣本圖像,把每張樣本圖像的像素以行的方式連接起來(lái),構(gòu)成一個(gè)一維行向量。把每個(gè)行向量從上到下連接起來(lái),就構(gòu)成了一個(gè)訓(xùn)練人臉樣本矩陣。
(2)每一行就是一張圖像,把每一張圖像相對(duì)應(yīng)的像素點(diǎn)求得它們的平均值,最后得到一個(gè)平均圖像的行向量。
(3)把每一個(gè)行向量與平均圖像行向量作差運(yùn)算,得到一個(gè)差值矩陣A,運(yùn)用協(xié)方差公式:W=AAT進(jìn)行計(jì)算。并計(jì)算出W的特征值和特征向量。
(4)將特征向量按特征值大小以降序排列,設(shè)定優(yōu)化參數(shù)值R,此參數(shù)表示取所有特征值中的多少特征值來(lái)作為主要特征值,實(shí)驗(yàn)中,取R=0.9110(0 (6)在識(shí)別階段,將待識(shí)別的人臉圖像先作預(yù)處理,提取特征向量,再把其特征向量投影到新坐標(biāo)系所表示的空間中,最后與特征模板數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行比較,進(jìn)行識(shí)別。 本算法在實(shí)驗(yàn)中所用的人臉數(shù)據(jù)庫(kù)有ORL和AR。ORL人臉庫(kù)中有40個(gè)人的人臉圖像,每個(gè)人有10幅圖像。選取5人的人臉圖像作為訓(xùn)練樣本人臉圖像,剩余圖像作為識(shí)別時(shí)用,圖像大小為64×64,如圖3所示。 圖3 ORL人臉庫(kù) 表1 ORL庫(kù)識(shí)別率及運(yùn)行時(shí)間 本實(shí)驗(yàn)運(yùn)用Matlab 7.5,并且基于SIFT人臉特征數(shù)據(jù)提取算法。從表1中的數(shù)據(jù)可以看出,人臉特征數(shù)據(jù)從4 096維降到不同的維度特征空間,系統(tǒng)運(yùn)行的時(shí)間不一樣。一般來(lái)說(shuō),維數(shù)降得越低,處理的特征數(shù)據(jù)越少,系統(tǒng)運(yùn)行就越快,但因此所得到的識(shí)別率也有所降低。本實(shí)驗(yàn)中所用的優(yōu)化參數(shù)值R=0.9110,相應(yīng)所得到的降維維數(shù)是93維,識(shí)別率是0.9972,運(yùn)行時(shí)間是0.4580秒。與表1所得到的分析數(shù)據(jù)對(duì)比來(lái)看,充分說(shuō)明了參數(shù)優(yōu)化效果。 在人臉識(shí)別的眾多算法中,數(shù)據(jù)的降維是必不可少的操作。本文介紹了早期的K-L變換,總結(jié)了PCA、LDA、SIFT等算法中的降維方法,給出了一種優(yōu)化的特征數(shù)據(jù)降維算法。并運(yùn)用Matlab工具驗(yàn)證了此算法的可行性。此優(yōu)化降維算法將給以后降維操作帶來(lái)方便、快捷,并具有一定的指導(dǎo)意義。 [1]周玲麗,賴劍煌.生物特征數(shù)據(jù)安全保護(hù)技術(shù)的發(fā)展[J].計(jì)算機(jī)科學(xué),2008,35(10):33-38 [2]苑瑋琦,柯麗,白云.生物特征識(shí)別技術(shù)[M].北京:科學(xué)出版社,2009:164-165 [3]田印中,董志學(xué),黃建偉.基于PCA的人臉識(shí)別算法研究及實(shí)現(xiàn)[J].內(nèi)蒙古經(jīng)濟(jì)與科技,2010,(3). [4]羅昊,孟傳良.基于特征臉和LDA的人臉識(shí)別[J].貴州工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,(1). [5]H.K.Ekenel and R.Stiefelhagen.Why is facial occlusion a challengingproblem[C].IntemationalConferenceonAdvances in Biometrics,2009:299-308. [6]Roberts C.Biometric technologies-palm and hand[EB/OL].http://www.ccip.govt.nz/newsroom/information-notes/2006/biometrics-technologies-palmhand.pdf,2008-03-22. [7] H.Jia and A.M.Maninez,Support vector machines in face recognitionwithocclusions[C].IEEEConferenceonCompmer Vision and Pattem Recognition,2009:136-141. [8]Nagar A,Nandakumar K,Jain A K.Biometric Template Transformation:ASecureityAnalysis[C].Proc.of SPIE,Electronic Imaging,Media Forensics and Security XII.2010. [9]Feng Y C,Yuen P C,Jain A K.A Hybrid.Approach for Generating Secure and Discriminating Face Template[J].IEEE Transactions on Information Forensics and Security,2010,5(1):103-117. [10]Nagar A,Jain A K.On the Security of Non-invertible FingerprintTemplateTransforms[C].IEEEWorkshopon Information Forensics and Security(WIFS),2009. Optimization of Dimension Reduction Algorithm for Face Recognition Character Data YANG Yuping1,XIANG Hua2 In the field of pattern recognition,facial character data is relatively large,and therefore it is necessary to reduce the dimension of the character data in order to extract the primary facial main data and improve the efficiency of the recognition system.For the existing dimension reduction algorithm has some negative effect on the recognition rate,this article sums up various kinds of dimension reduction algorithms and brings forward a better algorithm. face recognition;dimension reduction;facial character TP39 A 1674-5787(2012)01-0162-03 2011-12-28 楊玉平(1984—),男,重慶市人,重慶電子工程職業(yè)學(xué)院,助教、重慶師范大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院計(jì)算機(jī)軟件與理論專業(yè)2010級(jí)碩士研究生,研究方向:數(shù)字圖像處理與模式識(shí)別;向華(1984—),女,重慶市人,重慶師范大學(xué)外國(guó)語(yǔ)學(xué)院學(xué)科教學(xué)(英語(yǔ))2010級(jí)專業(yè)碩士研究生。 責(zé)任編輯 王榮輝4 實(shí)驗(yàn)效果與分析
5 結(jié)語(yǔ)
(1.Chongqing College of Electronic Engineering Chongqing 401331,China;2.Chongqing Normal University,Chongqing 401331,China)