吳雪剛 趙爽文 蔣麗 魯銀芝
摘 要:人臉識別是模式識別中的重要研究領(lǐng)域之一。受到the Variation Energy Image(VEI)成功的啟發(fā),我們將VEI方法應用于對人臉特征進行有效的提取。使用此方法就可以從訓練樣本中找到一幅特征圖。而且這個特征就是差別最大的特征。于是,根據(jù)這個特征圖,我們?nèi)コ籼卣鲌D中相對應的像素。使得原來的訓練樣本,變得更加接近自己類的特征。待測試樣本,在進行比較時,也去掉特征圖的像素。最后使用Linear Discriminant Analysis(LDA)方法得到特征子空間,測試樣本投影到特征子空間上的一個最近的L2范數(shù)距離,作為分類的標準。提出的方法與傳統(tǒng)的LDA方法進行比較,得到了較好的實驗效果。
關(guān)鍵詞:人臉識別;LDA;VEI;Discriminant
現(xiàn)在的模式識別領(lǐng)域之中,生物特征識別已經(jīng)成為重要的研究領(lǐng)域。而且,很多研究成果已經(jīng)用于實際的使用,并取得了很好的效果。比如說,人臉識別、指紋識別、虹膜識別、手形識別、掌紋識別、簽名識別以及步態(tài)識別都取得了較好的進展。其中,人臉識別成為近幾年中國內(nèi)外學者爭相研究的一個熱門領(lǐng)域。
人臉的生理結(jié)構(gòu)[1]包括骨骼、肌肉和皮膚。人臉的總體結(jié)構(gòu)是由骨骼確定的。人的頭顱本身不能活動。頭骨的突起和凹陷,會形成頭部形體的變化,是表現(xiàn)造型特征的主要部位,尤其象隆起的骨點,是人臉表現(xiàn)的重要標志。人的下頜呈馬蹄形,上端與顳骨部分連接,通過咬合肌作用,可以上下活動。這樣,一個人的面部就相應的固定了。頭部的肌肉影響著表情的變化。顱骨處于相對固定的狀態(tài),而位于頭骨上的肌肉卻富有變化,會呈現(xiàn)各種形狀,牽動著人的頭部運動和臉部上表情的產(chǎn)生。面部肌肉分為運動肌和表情肌兩大類,運動肌主理下頜骨的活動,如咬肌、唇三角肌、下頜骨肌、顳肌等;表情肌主理面部的表情,如額肌、皺眉肌、眼輪匝肌、上唇方肌、口輪匝肌、下唇方肌等。這樣,由于人臉表情肌肉豐富,所以各種肌肉的相互配合會產(chǎn)生許多的表情。在這種情況下,研究對人臉識別的研究就具有很大的難度。通過上述的說明,我們了解到人臉識別具有長期性和研究的艱巨性。
現(xiàn)有的人臉識別方法主要是二維的人臉識別,通常把一幅人臉圖片拉成一個向量,然后把訓練樣本的這些向量排成一個矩陣。比較經(jīng)典的方法包括Principle Component Analysis(PCA)[2][5],Linear Discriminant Analysis(LDA)[3]。其中,PCA方法是通常所說的主成分分析方法,是找到一個正交投影的子空間,使得每個訓練樣本在其上的投影具有最大的方差。LDA方法是通過一個目標函數(shù),這個目標函數(shù)要找到一個子空間,使得屬于不同類的樣本在其上的投影滿足同類樣本具有較小的方差而異類樣本具有較大的方差。上面所述的方法通常被敘述為線性的判別方法,這些方法與核方法(kernel method)相結(jié)合就具備了非線性的特征。流形-作為一種非線性假設(shè),在人臉識別方法中也起到了較大的作用。我們從這些方法中可以得出結(jié)論,為了認知,人類以自己的認知方式或者使用簡單的認知方式用于人臉識別。從而有了線性和非線性的假說,并在此基礎(chǔ)上,形成了眾多的模式識別方法。無論怎樣,我們注意到屬性特征提取,是模式識別中的重要前提。受到近期的行為識別中VEI方法[4]成功的啟發(fā),我們將此方法用于人臉屬性特征的提取。然后,每一類形成自己的一幅特征圖,這個特征圖是以一個向量的形式存在。有待測試圖像過來的時候,我們求出待測試向量和每類特征向量的二范數(shù)距離,找到最小的距離進行分類。
1 LDA人臉識別方法
假設(shè)原來樣本空間的維度為n維,考慮有c類的情形。類間散步矩陣為Sb,類內(nèi)散布矩陣為sw,它們的定義如下:
這也是所有樣本的協(xié)方差矩陣。
LDA算法的目標函數(shù)為:
其中,W就是我們要求的最符合目標函數(shù)的子空間。
2 VEI行為識別方法
論文[1]提出了VEI方法提取行為識別中目標一個目標在一個周期的標準差。
最后的VEI模型定義為:
3 本文使用的方法
我們將VEI方法與LDA方法相結(jié)合應用于人臉識別。
其中,分別求出每個像素對應的均值與標準差,然后計算人臉圖像的VEI圖,如下,
其中,mi(x,y)對應于第i類的每個像素的均值,(x,y)為相應的位置坐標。Si(x,y)為第i類的每個像素的標準差,這是個統(tǒng)計量,每個樣本減去均值過后的平方最后在除以總數(shù)量減一,再開方得到的。圖1,是我們得到的VEI臉以及根據(jù)一定的閾值去除掉較大的VEI值留下的一幅訓練樣本的人臉。
這樣,我們就得到了新的經(jīng)過VEI處理過的 類樣本集。然后,我們使用LDA方法得到這些新樣本集的優(yōu)化子空間。最后,將測試樣本經(jīng)過VEI方法處理后,在映射到LDA優(yōu)化子空間進行分類。
4 方法分析
由于使用了VEI方法,我們?nèi)コ粼谕活愔蟹讲畋容^大的像素,并保留了具有穩(wěn)定判別力的樣本像素。這樣,就使得對人臉的分類更具有魯棒性。對一些離群點,進行了有效的處理。
5 實驗結(jié)果
本文使用了Yale人臉數(shù)據(jù)庫[6]進行試驗,本數(shù)據(jù)庫包括15個人,每人11張圖像。我們對其進行了處理,修剪成32×32像素大小。本方法與LDA方法進行了50次試驗進行的比較。
從上面的試驗,可以看出我們的方法要好于原來的LDA方法。上面括號外面的是平均識別率,括號里面的是做過50次試驗的方差。可以將本方法用于工程當中,這要好于傳統(tǒng)的方法,時間和空間上不會有太多的耗費。
參考文獻
[1]解剖學技術(shù)[M]. 人民衛(wèi)生出版社, 1997.
[2]Abdi H, Williams L J. Principal component analysis[J]. Wiley Interdisciplinary Reviews: Computational Statistics, 2010, 2(4): 433-459.
[3]Ye J, Janardan R, Li Q. Two-Dimensional Linear Discriminant Analysis[C]//NIPS. 2004, 4: 4.
[4]He W, Yow K C, Guo Y. Recognition of human activities using a multiclass relevance vector machine[J]. Optical Engineering, 2012, 51(1): 017202-1-017202-12.
[5]Yang J, Zhang D, Frangi A F, et al. Two-dimensional PCA: a new approach to appearance-based face representation and recognition[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2004, 26(1): 131-137.
[6]Yale face database: http://vision.ucsd.edu/datasets/yale_face_dataset_original/yalefaces.zip