李新濤, 徐汀榮
(蘇州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇蘇州 215006)
人臉識(shí)別技術(shù)是依據(jù)人的臉部特征(如統(tǒng)計(jì)或幾何特征)自動(dòng)進(jìn)行身份鑒別的一種生物識(shí)別技術(shù)。該技術(shù)采用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉,進(jìn)而對(duì)檢測(cè)到的人臉進(jìn)行辨識(shí)。達(dá)到識(shí)別不同人身份的目的,其中涉及一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、預(yù)處理、人臉特征提取、記憶存儲(chǔ)和比對(duì)辨識(shí),人臉識(shí)別技術(shù)在現(xiàn)代生活中具有廣泛的應(yīng)用前景,可用于金融服務(wù)、電子商務(wù)、政府部門(mén)、公共管理、國(guó)家安全、信息安全、智能家居、人機(jī)交互等領(lǐng)域,人臉自動(dòng)識(shí)別近年來(lái)已成為模式識(shí)別和人工智能領(lǐng)域的研究熱點(diǎn)之一。
Gabor小波變換核函數(shù)具有與人類(lèi)大腦皮層簡(jiǎn)單細(xì)胞的二維反射區(qū)相同的特性,即能夠捕捉到對(duì)應(yīng)于空間頻率(尺度)、空間位置及方向選擇性的局部結(jié)構(gòu)信息,Gabor小波的這種特性使得其對(duì)于亮度和人臉表情的變化不敏感,被廣泛應(yīng)用于人臉特征提取。文獻(xiàn)[1]中提出的基于相似值的相似性判別在光照比較均勻、無(wú)遮擋、人臉局部變形不大的情況下取得了較好的識(shí)別率,但是在光照不太均勻如光照過(guò)強(qiáng)、有陰影、有遮擋或者有比較大的局部變形,如眼睛閉合等比較常見(jiàn)的情況下效果不很理想。究其原因就是在特定區(qū)域中的特征點(diǎn)與庫(kù)中的任何人臉模型上的對(duì)應(yīng)特征點(diǎn)都不相似,即特征失效。文獻(xiàn)[2]提出了基于投票的相似性函數(shù)方法,該方法通過(guò)對(duì)特征失效的特征進(jìn)行剔除,以降低失效特征對(duì)人臉識(shí)別效果的影響,該方法在環(huán)境較惡劣的條件下取得了較滿(mǎn)意的識(shí)別效果。然而,由于利用Gabor變換獲得的特征是圖像的局部特征,因而在圖像不同位置獲得特征的分類(lèi)能力并不相同。文獻(xiàn)[2]的方法不利于不同特征的分類(lèi)能力不同作為判據(jù)。因此,本文通過(guò)分析人臉不同部位特征點(diǎn)Gabor特征的識(shí)別能力,提出了一種結(jié)合加權(quán)相似值和相似性投票的視頻流人臉識(shí)別方法。
二維Gabor小波變換[3,4]能夠?qū)⑾噜弲^(qū)域的像素聯(lián)系起來(lái),可以從不同的頻率尺度和方向反映局部范圍內(nèi)圖像像素灰度值的變化,是目前主流的人臉描述方法之一。此外,Gabor小波變換系數(shù)作為人臉特征所完成的人臉識(shí)別具有良好的視覺(jué)特性和生物學(xué)背景,非常有利于人臉識(shí)別。Gabor小波核函數(shù)可用(1)式描述[5]:
其中,x為給定位置的圖像坐標(biāo);kj為濾波器的中心頻率,波矢量k j為:
上述的每個(gè)Gabor濾波器都可以對(duì)應(yīng)于一個(gè)初等視覺(jué)皮層簡(jiǎn)單細(xì)胞的空間感受野的信號(hào)處理過(guò)程,對(duì)圖像處理而言,Gabor濾波器函數(shù)[6]將在與其振蕩方向垂直的邊緣處產(chǎn)生強(qiáng)烈的響應(yīng),而邊緣對(duì)三維物體的識(shí)別是至關(guān)重要的。也就是說(shuō),Gabor濾波器可以看作一個(gè)對(duì)方向和尺度敏感的有方向性的顯微鏡,能夠表達(dá)圖像中一些具有相應(yīng)方向尺度信息的、局部的顯著特征,從而可以形成亮度圖像的局部特征圖譜,這些局部特征形成了原始輸入圖像的一種魯棒、緊湊的特征表示。
圖1 5個(gè)尺度、8個(gè)方向的Gabor濾波器的實(shí)部
圖2 5個(gè)尺度上Gabor核函數(shù)的幅值
二維Gabor小波變換描述了圖像I上給定一點(diǎn)x0附近區(qū)域的灰度特征,對(duì)圖像I的濾波過(guò)程可以通過(guò)Gabor函數(shù)與圖像的卷積來(lái)實(shí)現(xiàn),即
二維Gabor小波變換的優(yōu)點(diǎn)為:核函數(shù)中括號(hào)的第2項(xiàng)去除直流分量,使得Gabor特征對(duì)光強(qiáng)變化具有魯棒性;對(duì)比度的變化則由于小波進(jìn)行了規(guī)范化而具有魯棒性是高斯函數(shù),這實(shí)際上是通過(guò)加窗限制了振蕩函數(shù)的范圍,使其只在局部有效,這樣使得Gabor濾波可以容忍圖象有一定的扭曲情況。
圖3是ν=2、μ=2時(shí)人臉圖像的Gabor小波濾波結(jié)果圖。
圖3 人臉的Gabor小波濾波結(jié)果圖
對(duì)特征點(diǎn)的Gabor特征J:
特征間的相似度量函數(shù)有如下2種[7]:
(1)不考慮相位,只考慮幅值,比較2個(gè)特征的內(nèi)積,稱(chēng)為角度無(wú)關(guān)的相似函數(shù),定義如下:
(2)角度相關(guān)的相似函數(shù),定義如下:
其中
這里:
大量實(shí)驗(yàn)表明,角度相關(guān)的相似函數(shù)具有更好的性能。
實(shí)驗(yàn)[2]表明在采用Gabor特征的條件下,人臉存在能夠獲得良好分類(lèi)能力的局部區(qū)域,而Gabor特征在人臉不同位置的分類(lèi)能力則有較大差異。
此外分類(lèi)能力最大的區(qū)域在眉毛附近,而嘴、鼻子等位置并沒(méi)有顯示出突出的分類(lèi)能力。因此為了降低計(jì)算量,加快特征提取和識(shí)別速度,本文的特征點(diǎn)只選取在眉毛和眼睛部位,即在人臉的眉毛和眼睛部位,選取5×10的網(wǎng)格(共50個(gè)特征點(diǎn))作為候選特征區(qū)域,其中第2行第3列為右眉毛位置;第2行第8列為左眉毛位置;第3行第3列為右眼所在的位置;第3行第8列定為左眼所在的位置,然后在此基礎(chǔ)上均勻分布其它網(wǎng)格點(diǎn)。
最后形成的網(wǎng)格點(diǎn)如圖4所示。
圖4 人臉特征點(diǎn)提取
設(shè)有L個(gè)樣本圖像It,t=1,2,…,L,分別屬于C類(lèi),每幅圖像采樣N點(diǎn)(各點(diǎn)隸屬于圖像中物體的某個(gè)固定位置),各點(diǎn)的Gabor特征可以表示為w(i)tn={w(i)tn j,j=1,2,…,40},其中,i=1,2,…,C為樣本所屬類(lèi)別;t=1,2,…,L為樣本標(biāo)號(hào);n=1,2,…,N為特征點(diǎn)標(biāo)號(hào)。則樣本特征點(diǎn)的類(lèi)內(nèi)和類(lèi)間散布矩陣分別為:
根據(jù)文獻(xiàn)[2]中提出的圖像特征點(diǎn)的相似度投票函數(shù)和文獻(xiàn)[1]中定義的基于相似值的相似性函數(shù),定義新的相似性函數(shù)為:
其中,kn為第n個(gè)特征點(diǎn)的權(quán)重,即
從(12)式可以看出,對(duì)于圖像和人臉模型中比較相似的特征點(diǎn),設(shè)置其相似性權(quán)值為Rn,否則設(shè)置其權(quán)值為0,從而體現(xiàn)了不同特征點(diǎn)的分類(lèi)能力,而且去掉了失效的特征點(diǎn)對(duì)識(shí)別結(jié)果的影響。識(shí)別時(shí),取待測(cè)試視頻的每一幀計(jì)算相似度,然后對(duì)取得最大相似度值的人臉模型投一票,最后統(tǒng)計(jì)所有幀對(duì)人臉模型的投票,投票最多者為最后識(shí)別結(jié)果。
實(shí)驗(yàn)選取測(cè)試集為30人,每人2段視頻流,每段100幀,視頻幀均為320×240大小。視頻幀中人臉可以有光照變化、局部形變和遮擋。系統(tǒng)中每個(gè)人用從人臉庫(kù)的視頻流中手工選取的一張正面、光照均勻、無(wú)遮擋、局部形變小的人臉圖片作為人臉模型,并標(biāo)注特征點(diǎn)區(qū)域。在特征點(diǎn)提取階段,用Adaboost算法[8,9]提取人臉,然后對(duì)提取的人臉用積分投影方法[10]進(jìn)行人眼和眉毛區(qū)域定位,最后用本文方法進(jìn)行人臉相似性判決。
表1列出單采用基于相似值的相似性函數(shù)和基于投票的相似性函數(shù)以及本文方法的實(shí)驗(yàn)結(jié)果對(duì)比。從實(shí)驗(yàn)結(jié)果可以看出,本文采用的方法比單獨(dú)使用基于相似值的相似函數(shù)和基于投票的相似函數(shù)有更高的識(shí)別率,而且平均識(shí)別時(shí)間也大大降低。
表1 3種方法實(shí)驗(yàn)結(jié)果對(duì)比
本文在前人研究工作的基礎(chǔ)上,通過(guò)分析不同特征點(diǎn)Gabor特征的分類(lèi)能力,提出了一種結(jié)合加權(quán)相似值和相似性投票的視頻流人臉識(shí)別方法。通過(guò)設(shè)置權(quán)值為類(lèi)間和類(lèi)內(nèi)散布矩陣的比值,增加相似度大的特征點(diǎn)的比重,同時(shí)去除失效的特征點(diǎn)對(duì)分類(lèi)結(jié)果的影響,然后根據(jù)每一幀視頻的相似度對(duì)最終識(shí)別結(jié)果進(jìn)行投票。通過(guò)在視頻集上實(shí)驗(yàn),證明該方法提高了識(shí)別率,同時(shí)縮短了識(shí)別時(shí)間,具有可行性。
本文初稿首次刊登于《計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展?2010》
[1] Wiskott L.The role of topographical constraints in face recognition[J].Pattern Recognition Letters,1999,20(1): 89-96.
[2] 薛理立,艾海舟.基于彈性圖匹配的實(shí)時(shí)視頻流人臉識(shí)別[J].計(jì)算機(jī)科學(xué),2003,30(11):65-68.
[3] 葉敬福,詹永照.基于Gabor小波變換的人臉表情特征提取[J].計(jì)算機(jī)工程,2005,31(15):172-174.
[4] 姜 婷.基于提升技術(shù)的三維小波視頻時(shí)域?yàn)V波方案設(shè)計(jì)[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2009,32(5): 670-673.
[5] 馬小燕,楊國(guó)勝,范秋鳳,等.基于Gabor小波和二維主元分析的人臉識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2006,42(3): 55-57.
[6] Liu C,W echsles H.Independen t component analysisof Gabor features for face recognition[J].IEEE Transactions on Neu ral Netw orks,2003,14(4):919-928.
[7] 宗君斌.基于Gabor小波系數(shù)融合的人臉識(shí)別[D].杭州:浙江工業(yè)大學(xué)信息工程學(xué)院,2009.
[8] 錢(qián)志明,徐 丹.一種Adaboost快速訓(xùn)練算法[J].計(jì)算機(jī)工程,2009,35(20):187-191.
[9] Freund Y,Schapire R E.A decision-theo retic generalization of on-line learning and an application to boosting[J].Jou rnal of Com puter and Sy stem Scien ces,1997,55(1): 119-139.
[10] 章 玲,蔣建國(guó),齊美彬.一種微分與積分投影相結(jié)合的眼睛定位方法[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2006,29 (2):182-185.