翟俊海,翟夢堯,王華超
(河北大學(xué)數(shù)學(xué)與計算機(jī)學(xué)院河北省機(jī)器學(xué)習(xí)與計算智能重點實驗室,河北保定 071002)
基于小波變換和2DPCA的人臉識別
翟俊海,翟夢堯,王華超
(河北大學(xué)數(shù)學(xué)與計算機(jī)學(xué)院河北省機(jī)器學(xué)習(xí)與計算智能重點實驗室,河北保定 071002)
主成分分析(p rincipal component analysis:PCA)已成功用于人臉識別,但基于主成分分析的人臉識別方法需要將圖像數(shù)據(jù)向量化,而向量化后的圖像樣本維數(shù)非常大,計算代價非常高.二維主成分分析(2 dimension p rincipal component analysis:2DPCA)直接處理圖像數(shù)據(jù),不需要向量化的過程,2DPCA降低了計算復(fù)雜度,但是2DPCA與PCA相比,需要存儲更多的系數(shù),即要占用更多的存儲空間.本文提出了一種基于小波變換和2DPCA的人臉識別方法,可以克服上述缺點,實驗結(jié)果證明了該方法的有效性.
小波變換;人臉識別;主成分分析;特征臉;特征提取
計算機(jī)自動人臉識別就是以計算機(jī)作為輔助工具,利用存儲在數(shù)據(jù)庫中的人臉圖像,從給定場景的靜止或視頻圖像中識別1個或多個人[1].人臉識別方法大致可分為基于模板的方法和基于特征的方法2大類.基于模板的人臉識別方法中,代表性的工作包括Turk等[2]提出的基于主成分分析的特征臉方法,Belhumeur等[3]提出的基于線性判別分析的費舍爾特征臉方法和Bartlett等[4]提出的基于獨立成分分析的人臉識別方法等.基于特征的方法中,代表性的工作包括Wiskott等[5]提出的圖匹配方法,Samaria等[6]提出的隱馬爾科夫模型方法和Law rence等[7]提出的卷積神經(jīng)網(wǎng)絡(luò)方法等.基于PCA的人臉識別方法,需要將圖像矩陣數(shù)據(jù)向量化,而向量化后的圖像樣本數(shù)據(jù)維數(shù)非常高,如一幅大小為256×256的圖像,向量化后的樣本維數(shù)為65 536,這么高維的數(shù)據(jù)學(xué)習(xí)容易產(chǎn)生小樣本問題,即樣本特征的維數(shù)比樣本數(shù)高很多,從而導(dǎo)致協(xié)方差矩陣的奇異性問題.另外,高維的數(shù)據(jù)學(xué)習(xí)所需的計算代價非常大.為了克服上述缺點,Yang等[8]提出了二維主成分分析(2DPCA),2DPCA直接處理圖像矩陣數(shù)據(jù),不需要圖像向量化的過程,降低了計算復(fù)雜度.但2DPCA與PCA相比,需要存儲更多的系數(shù),即要占用更多的存儲空間[9].例如,若圖像的分辨率為112× 92,則需要存儲112×d個系數(shù),其中,d是選擇的投影方向數(shù),一般要求d≥5.這對于髙維圖像,其計算復(fù)雜度依然很高.本文提出了一種基于小波變換和2DPCA的人臉識別方法,該方法充分利用小波變換具有降2采樣和快速計算的特點,該方法可以克服上述缺點,實驗結(jié)果證明了該方法的有效性.
本節(jié)簡要介紹將要用到的一些基本概念和定義,主要包括小波變換[10]和二維主成分分析.
1.1 小波變換
設(shè)f(x,y)是大小為M×N的圖像,則f(x,y)的離散小波變換可表示為
圖1 圖像的小波分解示意Fig.1 Flowchart of image wavelet decom position
f(x,y)的小波變換包括沿水平方向(x軸方向)和垂直方向(y軸方向)的濾波和降2采樣2步構(gòu)成.沿水平方向(x軸方向)的低通濾波是通過具有脈沖響應(yīng)l(n)的低通濾波器L實現(xiàn)的,而高通濾波是通過具有脈沖響應(yīng)h(n)的高通濾波器H實現(xiàn)的.沿垂直方向(y軸方向)的濾波和沿水平方向的濾波類似,如圖1所示.其中,fLL表示沿水平和垂直2個方向的低頻成分;fHL表示水平方向的高頻成分和垂直方向的低頻成分;
fLH表示水平方向的低頻成分和垂直方向的高頻成分;fHH表示沿水平和垂直2個方向的高頻成分.對1層小波分解得到的低頻子圖f(1)LL重復(fù)進(jìn)行小波變換可得2層小波分解.
1.2 二維主成分分析
2DPCA是經(jīng)典PCA的推廣,克服了PCA處理二維數(shù)據(jù)需要向量化的缺點.它直接從圖像數(shù)據(jù)構(gòu)造圖像協(xié)方差矩陣Gt,并計算d個最佳投影方向X1,X2,…,Xd,使得
可用2DPCA的d個投影方向X1,X2,…,Xd來提取圖像A的特征,令Yk=A Xk,k=1,2,…,d,則d個投影特征向量Y1,Y2,…,Yd構(gòu)成一個投影特征矩陣B={Y1,Y2,…,Yd}.
2.1 小波子段圖像的選取
圖2 4個小波子段圖像作為訓(xùn)練樣本的識別結(jié)果Fig.2 Resultsof face recognition with 4 different wavelet sub-band images
圖像小波變換是一個1變4的過程,這4個子段圖像,對于人臉識別任務(wù)來說,哪個子段圖像更具表示能力呢?目前,理論上還沒有統(tǒng)一的結(jié)論,筆者用實驗的方法進(jìn)行了分析.以O(shè)RL人臉圖像數(shù)據(jù)庫為例,對圖像數(shù)據(jù)庫中的每1幅人臉圖像,做1次小波分解,得到4個子段圖像f(1)LL,f(1)HL,f(1)LH,f(1)HH.然后,以每個子段圖像替代原圖像作為訓(xùn)練樣本,并用PCA方法進(jìn)行特征提取,用最近鄰分類器進(jìn)行人臉識別.結(jié)果如圖2所示.從實驗結(jié)果來看,對人臉識別來說,人臉的主要特征主要集中在低頻子圖,而高頻子圖對應(yīng)人臉的邊緣與輪廓.所以對人臉識別起主要作用的是低頻子圖,當(dāng)然,高頻子圖從某種程度上也能起到一定識別作用,但從實驗來看,和低頻子圖相比所起的作用要遜色得多.所以,筆者選擇某個尺度的低頻子圖來代替原人臉圖像作為訓(xùn)練樣本,并用2DPCA進(jìn)行圖像特征提取.
2.2 基于小波變換和2DPCA的人臉識別方法
基于小波變換和2DPCA的人臉識別方法大致分為2步:第1步,對人臉圖像數(shù)據(jù)庫中的圖像進(jìn)行小波變換,得到不同尺度的小波子段圖像.選擇合適的子段圖像代替原圖像作為訓(xùn)練圖像.第2步,對得到的訓(xùn)練圖像利用2DPCA進(jìn)行圖像特征提取.為了驗證提取出的圖像特征的表示能力,采用最近鄰分類器進(jìn)行圖像識別.下面給出相應(yīng)的算法.
算法:基于小波變換和2DPCA的人臉識別算法.
輸入:圖像數(shù)據(jù)庫.
輸出:分類規(guī)則.
算法步驟:
STEP1對圖像數(shù)據(jù)庫中每1幅大小為s×t的圖像fi(x,y)(i=1,2,…,N),利用BIOR3.1做J層小波變換(對不同的圖像數(shù)據(jù)庫,J取不同的值,J的取值根據(jù)圖像的大小確定),N是圖像數(shù)據(jù)庫中的圖像個數(shù).得到不同尺度的小波子段圖像序列{f(J)i,LL,{f(J)i,HL,f(J)i,LH,f(J)i,HH},…{f(I)i,HL,f(I)i,LH,f(I)i,HH}}(i=1,2,…,N).
STEP2根據(jù)對圖像數(shù)據(jù)庫中的每一幅圖像fi(x,y)(i=1,2,…N),選擇小波子段圖像序列{f(J)i,LL, {f(J)i,HL,f(J)i,LH,f(J)i,HH},…,{f(J)i,HL,f(J)i,LH,f(J)i,HH}}(i=1,2,…,N)中的低頻子圖f(J)i,LL作為訓(xùn)練樣本,設(shè)其大小為s′×t′.利用2DPCA方法,提取f(J)i,LL的二維主成分特征.
STEP3在保證一定識別率的前提下,用實驗的方法確定主投影方向數(shù)d.
STEP4構(gòu)造圖像特征庫.設(shè)d個主投影方向為x1,x2,…,xd,利用公式y(tǒng)k=Ai xk得到d個主投影特征向量y1,y2,…,yd,其中,A i=f(J)i,LL(i=1,2,…,N).用這d個投影特征向量構(gòu)造s′×d投影特征矩陣,Y=(y1,y2,…,yd),它是原圖像fi(x,y)經(jīng)W T+2DPCA后提取得到的s′×d的二維模式特征,N個二維模式特征構(gòu)成了圖像特征庫.
STEP5用基于矩陣距離的最近鄰分類器進(jìn)行人臉識別.
為了驗證本文方法的有效性,筆者用ORL,YALE和JAFFE 3個人臉數(shù)據(jù)庫作實驗比較.ORL人臉數(shù)據(jù)庫中包括40個人的人臉圖像.這些人臉圖像是在不同的時間、輕微的光線變化、不同的表情(如睜眼、閉眼,微笑、沒有微笑等)和不同的表情細(xì)節(jié)(如戴眼鏡和不戴眼鏡等)條件下拍攝的.YALE人臉數(shù)據(jù)庫中包括15個人的人臉圖像.這些人臉圖像是在不同的表情(如悲哀、吃驚、高興等),和光源在不同位置(如居中、光源在左和光源在右)的情況下拍攝的.JA FFE人臉數(shù)據(jù)庫中包括10個人的213幅不同表情的圖像(如高興、悲哀、吃驚等).因為3個人臉數(shù)據(jù)庫中每類樣本數(shù)都較少,如ORL人臉數(shù)據(jù)庫中,每個人只有10幅圖像,所以實驗采用二折交叉驗證方法,分類器采用最近鄰分類器.實驗環(huán)境是PC機(jī),雙核1.86GCPU,2G內(nèi)存,W indow s XP操作系統(tǒng),M atlab 7.1實驗平臺.實驗1,不用小波變換而直接應(yīng)用PCA和2DPCA方法,在3個數(shù)據(jù)庫上的實驗結(jié)果如圖3所示.實驗2,首先對人臉數(shù)據(jù)庫中的人臉圖像作一層小波變換,然后用低頻子圖代替原人臉圖像作為樣本參與學(xué)習(xí).所用小波為雙正交小波Bior3.1,在3個數(shù)據(jù)庫上的實驗結(jié)果如圖4所示.從實驗結(jié)果看,2種方法的識別率基本在同一個數(shù)量級,但所用維數(shù)后者比前者要低得多,所以基于小波變換和2DPCA的人臉識別方法的計算代價要低得多.
針對2DPCA人臉識別方法計算復(fù)雜度高、存儲系數(shù)多這一缺點,利用小波變換具有降2采樣和能快速計算的特點,提出了一種新的基于小波變換和2DPCA的人臉識別方法,該方法的識別率與2DPCA相比,大致相當(dāng),但可以克服2DPCA的上述缺點,實驗結(jié)果證明了該方法的有效性.
[1]ZHAO W,CHELLAPPA R,PH ILL IPSP J,et al.Face recognition:a literature survey[J].ACM Computing Surveys, 2003,35(4):399-458.
[2]TURK M,PENTLAND A.Eigen-faces for recognition[J].Journal of cognitive neuroscience,1991,3(1):71-86.
[3]BELHUM EUR P N,HESPANHA J P,KRIEGMAN D J.Eigenfaces vs.Fisherfaces:Recognition using class specific linear p rojection[J].IEEE Transactions on Pattern Analysis and M achine Intelligence,1997,19(7):711-720.
[4]BARTLETT M S,MOV ELLAN J R,SEJNOW SKI T J.Face recognition by independent com ponent analysis[J].IEEE Transactionson Neural Netwo rks,2002,13(6):1450-1464.
[5]W ISKOTT L,FELLOUSJM,MALSBURGC V.Face recognition by elastic bunch graphmatching[J].Transactionson Pattern Analysis and M achine Intelligence,1997,19(7):775-779.
[6]SAMARIA F,YOUNG S.HMM based architecture fo r face identification[J].Image Vision Computing,1994,12(8): 537-583.
[7]LAWRENCE S,GILESC L,TSO IA C,et al.Face recognition:A convo lutional neural-network app roach[J].IEEE Transactionson Neural Netwo rks,1997,8(1):98-113.
[8]YANGJian,ZHANGD.Two-dimensional PCA:A new app roach to appearance-based face rep resentation and recognition [J].IEEE Transactionson Pattern Analysis and Machine Intelligence,2004,26(1):131-137.
[9]ZHANG Daoqiang,ZHOU Zhihua.(2D)2PCA:Two-directional two-dimensional PCA fo r efficient face rep resentation and recognition[J].Neurocomputing,2005,69(1):224-231.
[10]MALLA T S G.A theory fo rmultiresolution signal decomposition:the w avelet rep resentation[J].IEEE Transactionson Pattern Analysis and M achine Intelligence,1989,11(1):674-693.
Face Recogn ition Based on Wavelet Transformsand 2DPCA
ZHAIJun-hai,ZHAIMeng-yao,WANGHua-chao
(College of Mathematics and Computer Science,Key laboratory of Machine Learning and Computational Intelligence,Hebei University,Baoding 071002,China)
Principal component analysis(PCA)has been successfully app lied to face recognition.However,image data must be converted into vecto r w ith high dimension for the PCA based face recognition methods,w hich requires too much time to extract the p rincipal components.Two dimension p rincipal component analysis(2DPCA)directly p rocess image data w ithout step of vecto rization.Compared w ith PCA based methods,2DPCA based app roaches can lower the computational complexity,but much more spaces are need to store the coefficients of 2DPCA.In this paper,based on wavelet transform s(W T)and 2DPCA,an app roach of face recognition was p roposed,w hich could overcome the d raw back mentioned above.The experim en tal results confirmed the effectiveness of the p roposed m ethod.
wavelet transform s;face recognition;p rincipal component analysis;eigenfaces;feature extraction
TP 181
A
1000-1565(2010)05-0574-06
2010-05-10
國家自然科學(xué)基金資助項目(60773062);河北省自然科學(xué)基金資助項目(F2010000323;F2008000635);河北省應(yīng)用基礎(chǔ)研究重點項目(08963522D)
翟俊海(1964—),男,河北易縣人,河北大學(xué)副教授,博士,主要從事機(jī)器學(xué)習(xí)與計算智能、模式識別和小波分析方向的研究.
(責(zé)任編輯:孟素蘭)