李云彤 ,黃 山 ,徐海明
(1.四川大學(xué) 電氣信息學(xué)院,四川 成都 610065;2.四川大學(xué) 計(jì)算機(jī)學(xué)院,四川 成都 610065)
人臉識(shí)別是通過(guò)分析人的面部特征來(lái)自動(dòng)進(jìn)行身份鑒定的一種生物特種識(shí)別技術(shù)。相較于紅膜識(shí)別、DNA識(shí)別、指紋識(shí)別,人臉識(shí)別具有友好性強(qiáng)、全自動(dòng)化、設(shè)備成本低等優(yōu)點(diǎn),在安全驗(yàn)證系統(tǒng)、金融業(yè)務(wù)、罪犯調(diào)查、人機(jī)交互等領(lǐng)域都有著極其重要的作用和意義。人臉識(shí)別是一門綜合性較強(qiáng)的技術(shù),涵蓋了計(jì)算機(jī)視覺(jué)、圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)、心理認(rèn)知等眾多學(xué)科。以人臉為目標(biāo),也將推動(dòng)這些基礎(chǔ)研究的發(fā)展、融合和應(yīng)用[1]。20世紀(jì)90年代以來(lái),人臉識(shí)別已成為國(guó)內(nèi)外研究的熱點(diǎn)。在此基礎(chǔ)上,學(xué)者們發(fā)表了大量研究文章,同時(shí)催生了相關(guān)期刊和學(xué)術(shù)會(huì)議,也產(chǎn)生了一批人臉識(shí)別的商業(yè)系統(tǒng)。一個(gè)完整的人臉識(shí)別系統(tǒng)可以分為
以下幾個(gè)階段,如圖1所示。
圖1 人臉識(shí)別系統(tǒng)組成
當(dāng)前人臉識(shí)別方法主要包括基于幾何特征的人臉識(shí)別、神經(jīng)網(wǎng)絡(luò)方法、隱馬爾科夫模型等方法、支持向量機(jī)(SVM)、主成分分析法(PCA)等。基于幾何特征的方法[2]具有直接、計(jì)算快、存儲(chǔ)要求低等優(yōu)點(diǎn),但識(shí)別正確率較低,通常不單獨(dú)使用。神經(jīng)網(wǎng)絡(luò)用網(wǎng)絡(luò)的聯(lián)想能力重構(gòu)人臉[3],但需要較多樣本且計(jì)算復(fù)雜度高。隱馬爾科夫模型方法根據(jù)人臉特點(diǎn)建立馬爾科夫模型并進(jìn)行HMM訓(xùn)練[4],取得了較好的識(shí)別效果。支持向量機(jī)[5]作為有效的工具已經(jīng)廣泛應(yīng)用到了人臉識(shí)別領(lǐng)域的分類階段。Turk在1991年[6]提出PCA方法,主要通過(guò)將訓(xùn)練人臉圖片投影到特征子空間中產(chǎn)生若干特征臉,以達(dá)到降維的目的。雖然PCA方法簡(jiǎn)單有效,但傳統(tǒng)PCA需要將一個(gè)圖像矩陣轉(zhuǎn)化為一個(gè)高維[7],另外傳統(tǒng)PCA在特征提取過(guò)程中對(duì)圖像每個(gè)像素是平等對(duì)待的,未考慮人臉不同區(qū)域?qū)ψR(shí)別貢獻(xiàn)不同。Yang在2004年提出二維主成分分析法(2DPCA)[8],其直接利用圖像矩陣構(gòu)造散布陣,回避了維數(shù)災(zāi)難問(wèn)題,大幅降低了特征提取的計(jì)算量。在 2DPCA基礎(chǔ)上,ZHANG等[9]提出雙向PCA(BD-PCA)算法,將行和列上的 PCA組合在一起,避免了2DPCA存在的信息缺失現(xiàn)象。據(jù)此,本文提出加權(quán)的雙向PCA(BD-WPCA)算法,在圖像預(yù)處理階段,用雙中心羽化加權(quán)以加強(qiáng)人臉主要器官的權(quán)值;在特征提取時(shí)采用BD-PCA分別在行和列上進(jìn)行雙邊降維。在VS2010環(huán)境下的實(shí)驗(yàn)表明,提出的算法能在減小計(jì)算量的同時(shí)獲得更高的識(shí)別正確率。
由于傳統(tǒng)PCA在特征提取過(guò)程中對(duì)每個(gè)像素點(diǎn)是平等對(duì)待的,而在人臉識(shí)別中不同面部特征對(duì)識(shí)別的貢獻(xiàn)不同。根據(jù)經(jīng)驗(yàn),人眼、鼻子、嘴巴區(qū)域在人臉識(shí)別中處于主要地位,而額頭、下顎等平滑區(qū)域處于相對(duì)次要地位。因此,本文在圖像預(yù)處理時(shí)提出雙中心羽化加權(quán)方法,通過(guò)調(diào)節(jié)參數(shù),提高特征提取時(shí)人臉主要器官的權(quán)值。
對(duì)圖像加權(quán),最重要的是選擇恰當(dāng)?shù)募訖?quán)函數(shù)。羽化函數(shù)是一個(gè)高斯分布函數(shù),能對(duì)人臉的各維特征加權(quán),它的表達(dá)式為:
其中 (i,j)表示像素點(diǎn)的位置,(x1,y1)和(x2,y2)分別是兩個(gè)羽化中心的位置,σ1和σ2用來(lái)控制函數(shù)的形狀和大小,通過(guò)調(diào)節(jié)σ1和 σ2可以構(gòu)成類橢圓形以更好地?cái)M合人臉。
在 92×112 的圖片范圍內(nèi),取 (x1,y1)和 (x2,y2)分 別為(46,45)和(46,80),σ1=σ2=10 的羽化效果如圖2 所示,取 (x1,y1) 和 (x2,y2) 分 別 為 (46,45)和 (46,80),σ1=σ2=15的羽化效果如圖3所示。可見,雙中心羽化函數(shù)是一個(gè)雙高斯分布的函數(shù),呈現(xiàn)為中心高亮,外圍減暗的圓圈。在人臉圖像加權(quán)的實(shí)際應(yīng)用中,應(yīng)調(diào)節(jié)參數(shù)使加權(quán)中心在面部特征明顯的區(qū)域,并調(diào)節(jié)σ1和 σ2使函數(shù)形狀大小適宜,吻合臉部,以增加眼睛嘴巴三角區(qū)的權(quán)值。
圖2 (46,45),(46,80),σ1=σ2=10時(shí)的羽化效果
圖3 (46,45),(46,80),σ1=σ2=15時(shí)的羽化效果
在人臉識(shí)別中,本文將兩個(gè)加權(quán)點(diǎn)設(shè)置在眉心和嘴巴中心的位置(由人臉檢測(cè)階段測(cè)出),并設(shè) σ1=σ2=30。加權(quán)效果如圖4所示。
圖4 加權(quán)效果
可見,加權(quán)處理過(guò)后的人臉圖片,突出了眼睛、鼻子、嘴巴主要器官組成的三角區(qū)域,降低了額頭、下顎等處于次要地位特征的權(quán)值。
傳統(tǒng)的PCA算法是基于一維向量的,導(dǎo)致圖像的二維結(jié)構(gòu)遭到破壞且易造成維數(shù)災(zāi)難。因此,本文在圖像加權(quán)后采用BD-PCA算法,保留圖像二維結(jié)構(gòu)的同時(shí)降低了特征提取耗時(shí)。
設(shè)訓(xùn)練樣本中有 N個(gè) m×n的圖像樣本 X1,X2,X3,…XN,其中第i個(gè)樣本矩陣 Xi用m個(gè) 1×n的行向量表示,圖像行方向上的總體散度陣可如下計(jì)算:
其中,xij為樣本矩陣 Xi的第 j行為均值矩陣 X的第j行。行散度陣Str的前k個(gè)最大特征值對(duì)應(yīng)的特征向量組成的矩陣就是行映射陣:
其中,ωir表示 Str的第i個(gè)最大特征值對(duì)應(yīng)的特征向量。
同理可求出列方向上的總體散度陣以及列映射陣:
其中,xij為樣本矩陣Xi的第 j列為均值矩陣 X的第 j列。ωic表示Stc的第i個(gè)最大特征值對(duì)應(yīng)的特征向量。
求出Wr與Wc后,便可求出圖像X的特征矩陣:
基于BD-WPCA的人臉識(shí)別具體實(shí)現(xiàn)方法如下:
(1)對(duì)訓(xùn)練樣本和待測(cè)樣本進(jìn)行雙中心羽化加權(quán)處理。
(2)將訓(xùn)練樣本和待測(cè)樣本用式(2)、(3)求出行映射陣Wr。
(3)將訓(xùn)練樣本和待測(cè)樣本用式(4)、(5)求出列映射陣 Wc。
(4)根據(jù)式(6)求出每個(gè)樣本的特征矩陣 Y,并轉(zhuǎn)換為行向量y。
(5)求出待測(cè)樣本向量與訓(xùn)練樣本向量之間的歐氏距離并用K近鄰法[10]分類,實(shí)現(xiàn)人臉識(shí)別。
本文在VS2010環(huán)境下編寫原型系統(tǒng),在Intel Core i5-4200 2.5 GHz CPU、8 GB內(nèi)存的 Win8系統(tǒng)筆記本上,針對(duì)傳統(tǒng)PCA、雙中心羽化加權(quán) PCA、雙向 PCA和本文方法分別進(jìn)行實(shí)驗(yàn)。
實(shí)驗(yàn)樣本由自行采集的20個(gè)加ORL人臉庫(kù)中的40個(gè)人共60個(gè)人,600張人臉圖片構(gòu)成。采集樣本時(shí),先將RGB空間彩色圖轉(zhuǎn)換為灰度圖,再調(diào)用OpenCV庫(kù)中的函數(shù)cvResize()來(lái)實(shí)現(xiàn)雙線性插值縮放。每幅圖片歸一化為112×92,256級(jí)灰度圖。實(shí)驗(yàn)前,為補(bǔ)償光照影響,先將人臉灰度圖像進(jìn)行直方圖均衡化處理。部分樣本如圖5所示。
圖5 部分人臉庫(kù)樣本
實(shí)驗(yàn)時(shí),每次挑選一人進(jìn)行實(shí)驗(yàn),以識(shí)別率作為判定準(zhǔn)則,識(shí)別率設(shè)定為正確識(shí)別數(shù)除以總實(shí)驗(yàn)次數(shù)。對(duì)四種方法分別進(jìn)行實(shí)驗(yàn),K近鄰分類時(shí)取k=4,實(shí)驗(yàn)結(jié)果如表1所示。
表1 實(shí)驗(yàn)結(jié)果
可見,雙向PCA在一維PCA基礎(chǔ)上極大地提升了計(jì)算速度,傳統(tǒng)PCA耗時(shí)822.33 ms,而BD-PCA只需要95.04 ms,耗時(shí)縮短89%,這是因?yàn)樵谔卣魈崛r(shí),BD-PCA較于傳統(tǒng)PCA用圖像矩陣來(lái)計(jì)算協(xié)方差矩陣,維數(shù)遠(yuǎn)小于傳統(tǒng)PCA中由圖像轉(zhuǎn)化的一維矩陣。此外,BD-PCA綜合考慮了圖像的行和列,特征選取更為合理,所以識(shí)別率也有所提高。比較WPCA與傳統(tǒng)PCA可知,加權(quán)處理后將識(shí)別率從75.6%提升至83.0%,雖然對(duì)計(jì)算量影響甚微,但通過(guò)改變圖像不同像素點(diǎn)的權(quán)重,使特征選擇更利于分類。從表1可看出,本文所使用的BD-WPCA在傳統(tǒng)PCA基礎(chǔ)上,使識(shí)別率提高了18.7%,且耗時(shí)降低90%。提高識(shí)別精度的同時(shí)大大縮短計(jì)算耗時(shí),且比單獨(dú)使用BD-PCA或WPCA都有性能提高,這是因?yàn)锽D-WPCA在識(shí)別前通過(guò)雙中心羽化加權(quán)提高了人臉主要器官的權(quán)值,且根據(jù)二維圖像矩陣的雙向PCA降維,綜合了兩者優(yōu)勢(shì)。
針對(duì)傳統(tǒng)PCA方法在人臉識(shí)別應(yīng)用中的缺陷,本文提出了一種基于雙中心羽化加權(quán)和雙向PCA的人臉識(shí)別方法,該方法在識(shí)別前對(duì)圖像進(jìn)行雙中心羽化加權(quán)處理,識(shí)別時(shí)用雙向PCA降維。實(shí)驗(yàn)表明,與傳統(tǒng)PCA和其他方法相比,本文方法獲得了較高的識(shí)別率,且時(shí)間復(fù)雜度較小。但是,本算法對(duì)光照的魯棒性不強(qiáng),且在人臉細(xì)節(jié)出現(xiàn)變化如做表情、戴眼鏡等情況時(shí)會(huì)有誤差產(chǎn)生,這將是下一步研究工作的重點(diǎn)。
[1]唐亮.面向人臉識(shí)別的子空間分析和分類方法研究[D].杭州:浙江大學(xué),2009.
[2]BRUNELL R,POGGIO T.Face recognition:features versus templates[J].IEEE Transactions Pattern analysis and Machine Intelligence,1993,15(10):1042-1052.
[3]ROUDEY H A,BALUJA S,KANADE T.Neural networkbased face detection[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,1998,20(1):23-40.
[4]余龍華,王宏,鐘洪聲.基于隱馬爾科夫模型的人臉識(shí)別[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012,22(2):25-28.
[5]JAIN A K,DUIN R P W,MAO J.Statistical pattern recognition:a review[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(1):4-37.
[6]TURK M,PENTLAND A.Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[7]曾岳.人臉識(shí)別方法研究[D].西安:西安電子科技大學(xué),2011.
[8]Yang Jian,Zhang David,Yang Jingyu.Two-dimensional PCA:a new approach to appearance-based face representation and recognition [J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2004,26(1)131-137.
[9]Zuo Wangmeng,ZHANG David.Bidirectional PCA with assembled matrix distance metric for image recognition[J].IEEE Transaction on Machine Intelligence,2006,36 (4):863-872.
[10]邊肇棋,張學(xué)工.模式識(shí)別(第 2版)[M].北京:清華大學(xué)出版社,2000.
網(wǎng)絡(luò)安全與數(shù)據(jù)管理2015年17期