梅 廣,賈 年* ,徐鳳琴
(西華大學(xué) 無線電管理技術(shù)研究中心,成都 610039)
一種改進的基于小波變換的人臉光照歸一化方法
梅 廣,賈 年* ,徐鳳琴
(西華大學(xué) 無線電管理技術(shù)研究中心,成都 610039)
針對光照對人臉識別影響的問題,提出了一種改進的基于對數(shù)域多級小波分解的光照歸一化方法。首先將手工裁剪后的人臉圖片進行對數(shù)變換,然后將對數(shù)域圖像進行多級小波分解,將低頻系數(shù)置零,并將多個尺度上的高頻系數(shù)分別乘以不同的高頻增益,突出光照不變性分量。采用經(jīng)典的PCA人臉識別算法,在耶魯B與CMU PIE人臉數(shù)據(jù)庫的實驗結(jié)果表明,本文方法能有效地消除光照對人臉識別的影響,并有效提高識別率。
人臉識別;光照歸一化;小波變換;對數(shù)變換
人臉是人類最自然的身份鑒定和認證的生物特征,它所體現(xiàn)的視覺信息在人們的社會交流中占有重要地位。盡管大量的人臉識別算法被提出,但是仍然有一些有挑戰(zhàn)性的問題未被很好地解決。光照問題在機器視覺和圖像處理領(lǐng)域是一個經(jīng)典的問題,是人臉識別領(lǐng)域中具有挑戰(zhàn)性的問題之一。人臉識別系統(tǒng)很容易受到不良光照的影響,比如陰影、過度曝光和曝光不足等。
目前解決光照問題的方法主要有:1)光照條件標(biāo)準(zhǔn)化的方法;2)提取不變特征的方法;3)基于模型的方法。基于光照條件標(biāo)準(zhǔn)化的方法基本思想是在人臉圖像被識別前消除光照的影響。典型的方法如直方圖均衡、小波變換[1-2]、DCT 變換[3]、Retinex[4]算法等。Ren等[4]提出了一種基于 Retinex的方法,該方法使用TV-L2模型和維納濾波器來消除光照影響;Chen等[3]提出了一種基于DCT的光照去除算法,由于光照的變化主要在圖像的低頻部分,他們?nèi)コ艘恍〥CT系數(shù)來達到去除光照的效果。Wang等[5]受韋伯定律啟發(fā),提出了一種基于Weberface的新算法?;谔崛√卣鞑蛔兯惴ǖ闹饕枷胧翘崛∪四樦胁浑S光照變化或者對光照變化不敏感的特征,基于變換域特征提取也是一種不變特征提取方法。基于模型的方法試圖給光照造成的人臉變化建模,這種方法過于理想化,需要大量的訓(xùn)練圖像,而且獲取光照的模型很困難。
在小波去光照領(lǐng)域,Shan Du等[1]首先將圖像進行一級小波分解,對低頻分量進行直方圖均衡,高頻系數(shù)乘以固定的系數(shù),然后將處理后的低頻和高頻系數(shù)進行反變換。Y.Z.GoH等[2]提出了另一種基于小波分解的方法,他們首先將人臉圖像分解為低頻和高頻分量,將低頻部分置零,然后用處理后的小波系數(shù)反變換成待識別圖像,這種方法過于簡單,且不能突出對人臉識別至關(guān)重要的高頻分量。
本文擬探討一種改進型的基于對數(shù)域多級小波分解的人臉光照歸一化算法。
對數(shù)變換經(jīng)常用于擴展圖像中的黑暗像素的值,達到圖像增強的目的。朗伯凸表面模型假定在任意光照條件下人臉圖像I遵循下面的光照入射-反射模型[6]:
其中:I(x,y)為像素點(x,y)的灰度;R(x,y)和 E(x,y)分別表示像素點(x,y)的反射光和入射光。生理學(xué)和生物學(xué)研究揭示了人類的視覺系統(tǒng)和視網(wǎng)膜細胞對變化中的光照產(chǎn)生的反應(yīng)原理。在圖像中,這個原理可以表示成對像素進行對數(shù)運算,因此,對式(1)兩邊取對數(shù),得到:
由于光照大多數(shù)處在圖像的低頻部分,而與光照無關(guān)的細節(jié)部分主要存在于圖像的高頻部分,因此,在對數(shù)域中對圖像進行低通濾波,然后按照(3)式,從原圖像中減去低通濾波的結(jié)果,可以得到光照不變分量:
小波變換在圖像處理中十分受重視,應(yīng)用領(lǐng)域有圖像壓縮、去噪和紋理分析等。圖像識別的許多新方法如多分辨率分析、時頻分析、金字塔算法等,都是小波變換的范疇。構(gòu)造一對正交濾波器,通過小波函數(shù)和尺度函數(shù)可將一幅圖像分解為不同頻率的小波子帶圖像的集合。表述如下:
給定平方可積的二維離散信號{A0(m,n)}m,n∈Z∈l2,令Hr和Hc分別代表對行和列處理的尺度濾波器算子,Gr和Gc分別為對行和列處理的小波濾波器算子,則通過式(4)可將尺度為j的低頻圖像分解為尺度為j+1的低頻圖像Aj+1(m,n)和高頻圖像Hj+1(m,n)、Vj+1(m,n)、Dj+1(m,n):
上述入射-反射模型,必須在以下2個假設(shè)條件下才能成立[7]:1)入射光是圖像中的低頻成分,在空間上不會造成高頻成分;2)反射光成分代表圖像中的細節(jié)和邊緣等高頻成分。M.Parisa Beham等[8]指出了多尺度分解適合光照處理的理由,即多分辨率分解提供了一系列的不同頻率的通道來表示人臉的特征,所以在不同的子帶中,人臉的特征不同,并且這些特征只存在于少量的子帶小波中。
傳統(tǒng)中基于小波的算法沒有對高頻增益做出合適的處理,標(biāo)志不同人臉的紋理和輪廓特征不能很好地被放大和利用,因此,我們提出了一種多級小波分解人臉光照不變性提取和增強的算法。首先,將人臉圖像進行對數(shù)運算,將灰度圖像轉(zhuǎn)變?yōu)槿肷?反射模型中入射光和反射光之和的形式,然后對對數(shù)域圖像進行多級小波分解,以提取多分辨率的特性,去除各尺度之間的相關(guān)性,同時將低頻分量置零,高頻分量各乘以不同的增益,以突出人臉特征和減少噪聲。分解層數(shù)越多,將低頻成分置零后,越能去除光照影響;但是當(dāng)分解層數(shù)增加時,低頻分量的圖像尺寸過小,光照處理效果不明顯。由于采用4層分解得到的子帶分量能夠更完整地分析增益的影響,并且既能保證低頻的光照能夠有效去除,也不會損失高頻細節(jié),故本文使用4層小波分解。算法如下:
輸入:人臉圖像A
輸出:光照歸一化后的人臉圖像A'0。
1)將人臉圖像A變換到對數(shù)域,得到圖像A'。
2)對進行4級小波分解,分解公式為:
其中:A0=A'。
3)將第4級小波分解的近似A4分量置零,計算新的小波系數(shù):
4)用處理后的小波系數(shù)反變換成處理后的人臉圖像,計算公式為:
其中:A'0為光照處理后的人臉圖像。
圖1展示了本文算法的流程。
圖1 算法流程
為了驗證算法對去除光照和保留光照不變性的有效性,我們使用了耶魯B人臉數(shù)據(jù)庫和CMU PIE人臉數(shù)據(jù)庫,這2個數(shù)據(jù)庫提供了豐富的在不同光照影響下的人臉圖像。
3.1.1 耶魯人臉數(shù)據(jù)庫B
耶魯B人臉數(shù)據(jù)庫一共采集了10個人在9種姿態(tài)64種光照情況下總共5 760幅人臉圖像。每個人在相同的姿態(tài)下,包含根據(jù)不同光照情況分為的5個子集和1幅環(huán)境背景。由于本文處理的是光照情況,所以在選擇數(shù)據(jù)時,只選擇了攝像機正對人臉的圖像。表1所示的是每個子集劃分的原則,圖2展示了數(shù)據(jù)庫中某一人根據(jù)光照角度劃分后的各子集的部分圖像。本文采用處理后的子集1作為訓(xùn)練集,其他4個子集作為測試集。
表1 耶魯人臉數(shù)據(jù)庫人臉子集劃分方法
圖2 耶魯人臉數(shù)據(jù)庫按子集劃分的部分圖像
3.1.2 CMU PIE人臉數(shù)據(jù)庫
CMU PIE人臉數(shù)據(jù)庫由美國卡耐基梅隆大學(xué)創(chuàng)建,是人臉識別領(lǐng)域中一個重要的測試集合,包含68人在13種不同姿勢、43種不同光照和4種不同表情下總共41 368幅圖像,其中姿態(tài)和光照圖像在嚴格控制的條件下采集。圖3為CMU PIE人臉數(shù)據(jù)庫部分裁剪后的數(shù)據(jù),(a)部分作為訓(xùn)練集,(b)部分作為測試集。
圖3 CMU PIE人臉數(shù)據(jù)庫中正面人臉
為了確定最佳的分解層數(shù),下面我們做了幾組對比試驗。為了不使高頻分量收到增益的影響,先設(shè)各級高頻分量的增益都為1,選擇的小波基為bior6.8,圖4所示為耶魯B數(shù)據(jù)庫中不同分解層數(shù)識別率對比。
圖4 小波分解層數(shù)與識別率關(guān)系
從識別率上看,分解層數(shù)對識別率有很大的影響。當(dāng)分解層數(shù)較小,對光照去除效果明顯,但是也會損失細節(jié)分量,所以分解層數(shù)為1、2時識別率不如層數(shù)為3高。當(dāng)分解層數(shù)大于4時,識別率下降明顯,這是由于當(dāng)分解層數(shù)過大,低頻分量能量太小,對光照去除不明顯,故識別率低。如果不考慮細節(jié)分量的增益影響,當(dāng)對不同層數(shù)的小波高頻分量乘以不同的增益時,識別率會有很大的不同。
人臉去光照的最終目的是提高識別率,但是僅去除低頻分量,并不能增加高頻細節(jié),而這些高頻細節(jié)是人與人之間的重要不同點,因此,對不同分解層數(shù)的小波高頻系數(shù)乘以增益因子,會有效增加識別率。圖5展示了4級小波分解下高頻系數(shù)乘以不同增益反變換后的效果。
圖5中(a)為原圖,(b)G1=G2=G3=G4=100,(c)G1=1,G2=G3=G4=100 ,(d)G2=1,G1=G3=G4=100 ,(e)G3=1,G1=G2=G4=100 ,(f)G4=1,G1=G2=G3=100 ,(g)G1=1,G2=G3=100,G4=50 。A.Grossmann[5]證明,白噪聲的幅度和變化隨著分解層數(shù)的增加而減小,所以第一級增益G1不應(yīng)過大,圖6的對比試驗也可以驗證該結(jié)論。
圖6 不同G1下的識別率
小波分解的第2、3層細節(jié)分量主要是人臉光照的不變性部分,當(dāng)減少這2層系數(shù)的增益時,識別率會大幅下降,實驗表明,在選擇2個參數(shù)時,至少大于2倍的第1級增益。
如圖7所示,實驗結(jié)果表明,選擇第4級小波分解參數(shù)時,第4級增益G4的值選擇不應(yīng)過大,這一層增益的選擇,需結(jié)合實際識別率調(diào)整,實驗中選擇G1=1,G2=G3=100。圖8所示為在不同G4下,圖像處理后的效果。其中(a)為原圖,(b)G4=10,(c)G4=50,(d)G4=100,(e)G4=150,(f)G4=200,(g)G4=300。
圖7 不同G4下的識別率
圖8 不同G4下的處理效果
本文使用基于“Eigenfaces”的PCA人臉識別算法,采用歐氏距離衡量相似度,在CMU PIE數(shù)據(jù)庫上的實驗效果如表2所示,使用本文算法處理后的識別率比原始圖像提升了84.75%,比全局處理算法直方圖均衡(HE)和多尺度Retinex(MSR)分別提升了46.87%和73.19%,比DCT算法僅差1.39%。
表2 CMU PIE數(shù)據(jù)庫實驗對比 %
表3為耶魯B數(shù)據(jù)庫中的實驗結(jié)果,表明本文算法明顯優(yōu)于傳統(tǒng)的全局處理算法HE和MSR;由于對不同的分辨率下的子帶高頻信號進行了不同的增益處理,所以結(jié)果優(yōu)于傳統(tǒng)的基于小波的光照歸一化方法 Wavelet+HE[1]和 Wavelet[2]。
表3 耶魯B數(shù)據(jù)庫實驗對比
本文在入射-反射理論和光照主要存在于小波域低頻分量、人臉不變性分量主要存在于高頻分量的合理假設(shè)框架下,提出了在一種改進的基于多級小波分解的人臉光照歸一化的方法。我們在耶魯B和CMU PIE數(shù)據(jù)庫上對比了幾種不同的光照處理算法的效果,結(jié)果表明:本文算法簡單高效,能有效去除光照對識別率的影響,是歸一化光照的有效算法,不足之處在于各級增益不能自動優(yōu)化,后續(xù)工作將對其進行研究。
[1]DU S,WARD R W.Wavelet-based illumination normalization for face recognition[C]//IEEE International Conference on Image Processing.Piscataway:IEEE Press,2005,954-957.
[2]GOH Y Z,TEOH A B J,GOH K O M.Wavelet-based illumination invariant preprocessing in face recognition [J].Journal of Electronic Imaging,2008,8(2):421-425.
[3]CHEN W,JOO M,WU S.Illumination compensation and normalization for robust face recognition using discrete cosine transform in logarithm domain[J].IEEE Transactions on Systems,Man,and Cybernetics:Cybernetics,2006,36(2):458-466.
[4]REN D,F(xiàn)U Y,SONG C,et al.Illumination normalization for robust face recognition using edge-preserving filtering[C]// World Automation Congress(WAC),Piscataway:IEEE Press,2012:73-77.
[5]WANG B,LI W F,YANG W M,et al.Illumination normalization based on weber's Law with application to face recognition[J].Signal Processing Letters,IEEE:Biometrics Compendium,IEEE,2011,18(8):462-465.
[6]HORN B K P.Robot Vision[M].Cambridge:MIT Press,1986.
[7]MORENO H G,BASCON S M,F(xiàn)ERRERA F L,et al.Extracting illumination from images by using the wavelet transform[C]//8th IEEE International Conference on Image Processing.Piscataway:IEEE Press,2005:265-268.
[8]BEHAM M P,ROOMI S M M R,ALAGESHAN J.Wavelet based illuminant invariant face recognition-A review[C]//IEEE ICCIC 2013,Piscataway:IEEE Computer Society,2013:1-6.
[9]GROSSMANN.A Wavelet transform and edge detection[J].Strchastic Processing in Physics and Engineering:Mathematics and Its Applications,1988(42):149-157.
An Improved Wavelet-Based Illumination Normalization Algorithm for Face Recognition
MEI Guang,JIA Nian* ,XU Fengqing
(Center for Radio Administration and Technology Development,Xihua University,Chengdu 610039,China)
To counter the problem of lighting effect on face recognition,the authors proposed an improved wavelet-based illumination normalization algorithm.Firstly,cropped raw face image was transformed from spatial domain to logarithm domain using logarithm transform algorithm,and then multilevel wavelet decomposition was applied on logarithm domain image.The coefficients of low frequency subbands were set to zero and the coefficients of high frequency subbands were multiplied by different gains in different scales to emphasize illumination invariant.Well-known PCA-based face recognition method was used as classifier and the algorithm was tested in Yale B database and CMU PIE database.The experimental results showed that the proposed method could reduce the influence of illumination and improve recognition rate efficiently.
face recognition,illumination normalization,wavelet transform,logarithm transform
TP391.41
A
2095-5383(2014)02-0026-04
10.13542/j.cnki.51-1747/tn.2014.02.009
2014-04-11
四川省科技支撐計劃“全天候場景監(jiān)控中的多源圖像融合關(guān)鍵技術(shù)研究”(2012GZ0019);西華大學(xué)重點實驗室開放研究基金(szjj2012-031)
梅廣(1989-),男(漢族),安徽天長人,在讀碩士研究生,研究方向:數(shù)字圖像處理。
賈年(1973-),男(漢族),四川彭山人,副教授,碩士,研究方向:智能信息檢索、GPU計算、數(shù)字圖像處理,通信作者郵箱:jianian@163.com。