翁冠碧 張志堅(jiān) 溫峻峰 李鑫
圖像中的人臉多姿態(tài)變化,導(dǎo)致人臉特征發(fā)生變化,影響人臉識(shí)別的準(zhǔn)確性,是人臉識(shí)別技術(shù)現(xiàn)實(shí)應(yīng)用過(guò)程中所面臨的主要問(wèn)題之一。本文提出了一種基于HOG和WCCN方法組合的多姿態(tài)人臉識(shí)別算法,采用HOG方法可提取更加豐富的人臉特征信息,有助于提高人臉識(shí)別的準(zhǔn)確性,使用WCCN方法進(jìn)行SVM分類(lèi)器,可以降低人臉姿態(tài)變化對(duì)人來(lái)識(shí)別的影響,進(jìn)而提高多姿態(tài)人臉識(shí)別的準(zhǔn)確性。
【關(guān)鍵詞】多姿態(tài) 人臉識(shí)別 HOG方法 WCCN方法
人臉識(shí)別是一種基于生物特征,進(jìn)行身份識(shí)別鑒定的技術(shù),是一種直觀、方便的識(shí)別技術(shù),當(dāng)前已經(jīng)在很多領(lǐng)域中廣泛應(yīng)用。人臉檢測(cè)系統(tǒng)一般可以分為人臉檢測(cè)與定位,和特征提取與識(shí)別兩個(gè)部分。首先,從圖像背景中確定人臉的位置,并通過(guò)人臉特征的提取和匹配,實(shí)現(xiàn)人臉識(shí)別。在人臉識(shí)別技術(shù)中,多姿態(tài)是由于圖像采集角度不同,導(dǎo)致待檢測(cè)的人臉圖像,與系統(tǒng)中已采集并作為匹配模板使用的人臉圖像難以匹配的問(wèn)題。多姿態(tài)人臉識(shí)別在人臉識(shí)別應(yīng)用中非常常見(jiàn),也是人臉識(shí)別的難點(diǎn)。本文也主要針對(duì)人臉識(shí)別技術(shù)應(yīng)用過(guò)程中的人臉多姿態(tài)問(wèn)題,通過(guò)人臉姿態(tài)估計(jì),以提高人臉識(shí)別系統(tǒng)的可靠性。
1 人臉姿態(tài)識(shí)別概述
由于人臉姿態(tài)的多樣性,為了實(shí)現(xiàn)人臉姿態(tài)的篩選和判斷,需要進(jìn)行人臉姿態(tài)的劃分,從而將人臉姿態(tài)識(shí)別問(wèn)題,轉(zhuǎn)換為一個(gè)多類(lèi)分類(lèi)問(wèn)題。同時(shí),人臉姿態(tài)估計(jì)問(wèn)題滿(mǎn)足模式識(shí)別問(wèn)題的基本構(gòu)成:獲取信息、預(yù)處理、提取特征、分類(lèi),因此,人臉姿態(tài)估計(jì)問(wèn)題也是一種模式識(shí)別問(wèn)題?;诖?,確定人臉姿態(tài)估計(jì)的基本流程如圖1所示。
如圖1所示,人臉姿態(tài)估計(jì)流程可分為訓(xùn)練和估計(jì)兩個(gè)部分。在訓(xùn)練過(guò)程中,對(duì)訓(xùn)練樣本圖片進(jìn)行剪裁和灰度化處理,并提取圖像特征作為訓(xùn)練特征數(shù)據(jù)集,使用分類(lèi)器實(shí)現(xiàn)訓(xùn)練特征數(shù)據(jù)集的分類(lèi)。人臉姿態(tài)估計(jì)流程與訓(xùn)練流程類(lèi)似,使用同樣的方法提取圖像特征后,根據(jù)訓(xùn)練好的分類(lèi)器對(duì)帶估計(jì)人臉圖像進(jìn)行分類(lèi),其分類(lèi)的結(jié)果即為人臉姿態(tài)評(píng)估結(jié)果。
人臉姿態(tài)估計(jì)問(wèn)題本質(zhì)上是一個(gè)姿態(tài)分類(lèi)問(wèn)題,當(dāng)前國(guó)內(nèi)外研究人員在這一問(wèn)題上所采用的方法主要有基于模板、基于特征或基于分類(lèi)的方法。
1.1 基于模板的方法
常見(jiàn)的人臉姿態(tài)模板有圓柱模板和橢圓模板兩種,根據(jù)先驗(yàn)知識(shí),建立形狀模板,然后通過(guò)人臉面部器官與模板的匹配,實(shí)現(xiàn)人臉姿態(tài)估計(jì),這種方法原理和實(shí)現(xiàn)都較簡(jiǎn)單,但是當(dāng)人臉姿態(tài)變化較大導(dǎo)致人臉器官自遮擋較嚴(yán)重時(shí),其準(zhǔn)確率會(huì)急劇下降
1.2 基于特征的方法
包括基于局部特征和基于全局特征的識(shí)別方法,基于特征點(diǎn)的相對(duì)位置和絕對(duì)位置實(shí)現(xiàn)人臉姿態(tài),這種方法的準(zhǔn)確性很大程度上,與所選取的特征是否合理有關(guān)。
1.3 基于分類(lèi)的方法
通過(guò)使用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)等分類(lèi)算法,通過(guò)挖掘人臉圖形的隱含姿態(tài)信息,實(shí)現(xiàn)人臉姿態(tài)估計(jì),由于人臉姿態(tài)及其圖像的特征,因此往往需要與其它方法結(jié)合起來(lái),以提高人臉姿態(tài)估計(jì)的準(zhǔn)確性。
如上所述,基于模板的人臉姿態(tài)估計(jì)方法,需要較全面的采集樣本不同姿態(tài)的信息作為模板進(jìn)行人臉姿態(tài)估計(jì),其實(shí)用性不強(qiáng)。為此,常見(jiàn)的人臉姿態(tài)估計(jì)方法為:首先提取人臉姿態(tài)特征,然后采用分類(lèi)器實(shí)現(xiàn)人臉姿態(tài)估計(jì)。
2 人臉識(shí)別算法研究
本文研究中,主要采用梯度方向直方圖(HOG)方法提取人臉圖像特征,并采用類(lèi)內(nèi)協(xié)方差規(guī)整( WCCN)方法對(duì)SVM分類(lèi)器的和空間特征進(jìn)行規(guī)整,以此實(shí)現(xiàn)人臉姿態(tài)估計(jì)和人臉識(shí)別。
2.1 HOG方法
HOG通過(guò)統(tǒng)計(jì)局部區(qū)域的梯度方向直方圖,對(duì)圖像中的物體輪廓進(jìn)行描述,是一種有效提取圖像幾何特征的方法。其實(shí)現(xiàn)步驟如圖2所示。
在HOG圖像中每一個(gè)像素點(diǎn)的HOG值a(x,y)的計(jì)算步驟如下所示:
(1)計(jì)算原始圖像中像素點(diǎn)(x,y)的水平方向和垂直方向的梯度。
其中,表示原始圖像像素點(diǎn)H(x,y)的像素值。
(2)計(jì)算每一個(gè)像素點(diǎn)的HOG值α(x,y)。
2.2 WCCN方法
WCCN是一個(gè)SVM核空間的特征數(shù)據(jù)規(guī)整處理方法,在SVM核空間中,實(shí)現(xiàn)任務(wù)無(wú)關(guān)噪聲和干擾信息的最小化,和任務(wù)相關(guān)信息的最大化。通過(guò)WCCN處理,可以降低人臉姿態(tài)信息對(duì)人臉識(shí)別的影響,以提高SVM分類(lèi)器的性能,提高人臉識(shí)別準(zhǔn)確性。
SVM實(shí)現(xiàn)的重要思想是找到一個(gè)具有最大間隔的特征空間超平面,將問(wèn)題轉(zhuǎn)換為超平面內(nèi)的凸二次規(guī)劃問(wèn)題。SVM有多重核函數(shù),本文以廣義線性核( OvA)為例,進(jìn)行WCCN設(shè)計(jì)。
OvA分類(lèi)器的決策函數(shù)如下所示:
其中,fi為第i類(lèi)決策函數(shù),bi為偏移量,vi為權(quán)值向量,若fi(x)>0,則表示樣本屬于第i類(lèi)。fi的分類(lèi)風(fēng)險(xiǎn)函數(shù)定義如下:
其中,p(f(x)>0|x?i)表示分類(lèi)器的誤檢率,p(fi(x)
針對(duì)上述問(wèn)題,引入WCCN的概念,將最小化風(fēng)險(xiǎn)函數(shù)上邊界的問(wèn)題,轉(zhuǎn)換為如式(6)所示的最優(yōu)化問(wèn)題。
2.3 人臉識(shí)別流程設(shè)計(jì)
本文所研究的基于HOG和WCCN的人臉識(shí)別流程設(shè)計(jì)如圖3所示。
(1)將人臉圖像庫(kù)中的圖像進(jìn)行統(tǒng)一圖像尺寸、光照歸一化、圖像灰度化等預(yù)處理;
(2)利用HOG方法提取人臉圖像特征,組成訓(xùn)練集合;
(3)對(duì)訓(xùn)練集中的人臉圖像進(jìn)行WCCN處理,以人臉姿態(tài)角度作為依據(jù)劃分訓(xùn)練結(jié)合;
(4)采用線性核SVM分類(lèi)器對(duì)處理后的人臉圖像進(jìn)行分類(lèi),以及根據(jù)分類(lèi)結(jié)果的反饋,對(duì)SVM分類(lèi)器進(jìn)行優(yōu)化;
(5)將測(cè)試樣本按照如上的流程,得到測(cè)試樣本的分類(lèi)預(yù)測(cè)結(jié)果。
3 人臉識(shí)別算法的實(shí)驗(yàn)
3.1 實(shí)驗(yàn)庫(kù)選擇
選擇美國(guó)卡內(nèi)基梅隆大學(xué)創(chuàng)建的CMU-PIE數(shù)據(jù)庫(kù)進(jìn)行本文所研究的人臉識(shí)別算法的實(shí)驗(yàn)驗(yàn)證。CMU-PIE中包含了非常豐富的不同姿態(tài)、表情和光照條件下的人臉圖像數(shù)據(jù)。在實(shí)驗(yàn)過(guò)程中,從數(shù)據(jù)庫(kù)中提取24個(gè)樣本的人臉圖像,每個(gè)人臉圖像包含如圖4所示的-90°至90°之間的9鐘姿態(tài)。
3.2 實(shí)驗(yàn)過(guò)程
本次實(shí)驗(yàn),根據(jù)如前所述的人臉識(shí)別過(guò)程,采用PCA和HOG人臉特征提取算法,和是否使用WCCN進(jìn)行優(yōu)化的SVM分類(lèi)器進(jìn)行兩兩聯(lián)合實(shí)驗(yàn)。
實(shí)驗(yàn)時(shí),分別選取10~15個(gè)樣本作為試驗(yàn)集,而剩余樣本作為訓(xùn)練集,總計(jì)進(jìn)行6次實(shí)驗(yàn),通過(guò)6次實(shí)驗(yàn)的平均值來(lái)對(duì)比不同算法組合的人臉識(shí)別準(zhǔn)確性。
實(shí)驗(yàn)過(guò)程中的各參數(shù)設(shè)置如下:
(1) SVM選擇線性核函數(shù),其它參數(shù)為L(zhǎng)ibSVM中,SVMtrain函數(shù)的默認(rèn)參數(shù);
(2) PCA的主成分比例設(shè)置為0.9;
(3)在WCCN分類(lèi)中,確定同一樣本不同姿態(tài)類(lèi)的先驗(yàn)概率為p(i)=l/9。
3.3 實(shí)驗(yàn)結(jié)果分析
3.3.1 特征提取對(duì)比
提取樣本的人臉特征是進(jìn)行人臉識(shí)別的第1步,本次實(shí)驗(yàn)過(guò)程中選擇了PCA和HOG兩種人臉特征提取方法。
其中,基于PCA技術(shù)的人臉特征提取思路為:通過(guò)Karhunen-Loeve變換,識(shí)別人臉圖像主要特征,將人臉圖像投影到特征人臉空間。其最終提取的人臉特征向量維數(shù)情況如表1所示。
如上所示,可以看出HOG方法提取的人臉特征更多,特征越多對(duì)人臉的描述也越詳細(xì),有助于提高人臉識(shí)別的準(zhǔn)確性。
3.3.2 分類(lèi)算法對(duì)比
PCA和HOG人臉特征提取算法,和是否使用WCCN進(jìn)行優(yōu)化的SVM分類(lèi)器,總計(jì)4中組合的測(cè)試人臉樣本的分類(lèi)準(zhǔn)確性如圖5所示。
如圖5所示,在6次實(shí)驗(yàn)中,使用HOG人臉特征提取方法和使用WCCN優(yōu)化后的SVM分類(lèi)器組合的人臉識(shí)別算法穩(wěn)定,而且準(zhǔn)確性較高,表明使用本文所研究的HOG+WCCN的人臉識(shí)別算法,可以有效的提高多姿態(tài)人臉識(shí)別的準(zhǔn)確性。
參考文獻(xiàn)
[1]G. Hilton,D.Mumford. Reducingthe dimensionality of datawithneuralnetworks [J].Science, 2006, 313 (5786): 504.
[2]F.Zhi Peng,Z. Yan Ning. Survey forDeep Learning in Face Recognition[C]. 2014 IEEE InternationalConference.2014, 5-8.
[3]J. Wright,A.Y.Yang,A. Gane sh. Robustface Recognition via SparseRepresenta tion
[J]. IEEE, Transactionson Pattern Analysis and Machine Intelligence. 2009, 31 (02): 210-227.