劉中華, 姚 楠, 劉文紅
(1. 上海電機學院 電子信息學院, 上海 200240; 2. 上海海事大學 信息工程學院, 上海 201306)
人臉識別是圖像處理領域的一個研究重點。通常,在人臉識別算法中,對人臉圖像特征的描述包含全局特征和局部特征兩大類[1-4],且多以向量的形式給出,稱為特征向量。其中,全局特征表示的特征向量包含了人臉圖像的全部,即整體信息[3-4];而局部特征僅包含了人臉圖像的一些局部,即細節(jié)信息[2-5]。常用的全局特征提取方法有主成分分析(Principal Component Analysis, PCA)等,局部特征提取方法有尺度不變特征轉換(Scale-invariant Feature Transform, SIFT)[6-7]、局部二值模式(Local Binary Patterns, LBP)[8-9]等。在常用的人臉識別算法中,由于受人的面部表情、裝飾物的變化以及環(huán)境因素等的影響,最重要的步驟就是如何描述和選取合適的人臉圖像特征,以提高人臉識別和檢索的精度。
目前,已經有很多學者研究了基于特征匹配的人臉識別算法,包括基于單一特征的人臉識別[8],以及基于特征聯(lián)合的人臉識別[2-4,10]。其中,基于單一特征的人臉識別算法具有計算速度快、實時性強的優(yōu)點;其缺點是很難克服光照、旋轉等的影響,在復雜背景下,識別率會降低。而基于特征聯(lián)合的人臉識別算法可以提高復雜背景下人臉識別的精度。在常用的基于特征聯(lián)合的人臉識別算法中,如基于全局和局部特征集成的人臉識別等算法中,不同的特征根據一定的規(guī)則融合在一起,每種特征均對識別率有貢獻。該方法最主要的優(yōu)點是有效信息全面;缺點是由于信息量相對較大,會導致識別算法實時性降低,常需要和降維算法結合使用,故提高了計算復雜度[2,10]。
為克服以上算法的缺點,一種有效的方法是針對不同情景下獲取的圖像,分別采用不同的特征表達方式,使識別算法能自適應地根據訓練圖像自身的特點,優(yōu)先選擇最具判別力的特征用于人臉的分類識別[11-13]。文獻[11-12]中分別提出了一種自適應特征選擇方法。該類方法建立在一定的自適應選取準則之上,如線性判別分析算法的類內、類間散度值等,利用鑒別能力分析等算法完成人臉圖像的識別過程。該類方法具有抗光照變化的優(yōu)點,缺點是自適應選取準則的量度值需要人為確定。此外,文獻[14]中采用Adaboost算法對樣本數據庫中每幅樣本圖像進行訓練,選擇出最能表示圖像的若干個特征,并結合支持向量機(Support Vector Machine, SVM)等機器學習方法,實現對未知人臉圖像的有效識別。該方法能降低特征的維數,提高分類識別的精度;缺點是對于樣本數據庫中的所有圖像,均使用相同的特征向量表達式,在樣本差異比較大的情況下(如樣本完全無遮擋以及樣本有部分遮擋),其識別率會降低。
受文獻[11-13]的啟發(fā),本文提出一種對待識別圖像自適應選擇合適特征的人臉識別算法。該算法對不同情景下(如光照、遮擋影響、面部表情發(fā)生變化等)的人臉圖像分別提取全局、局部等特征,根據距離最小化的選取準則,利用Adaboost算法[13-15]自適應地為待測圖像選擇能最優(yōu)表達該圖像的特征向量以及相應的分類器,能有效地提高人臉圖像的識別率。
AdaBoost樣本權重迭代更新算法是改進的Boosting算法。在圖像處理領域,其主要被用于對圖像特征進行選擇及對圖像的分類中。該算法可以靈活地運用不同的分類學習方法,以提高算法的性能。
AdaBoost算法實現的是分類器的功能。該分類器被稱為強分類器或提升分類器,是多個稱為弱分類器的子分類器的組合。AdaBoost算法根據訓練樣本數據庫進行多輪迭代計算,每一輪迭代運算均訓練出一個最佳的弱分類器[7-8]。
在人臉識別應用中,人臉圖像的特征與AdaBoost算法中的弱分類器相對應,即每一輪的迭代運算過程,既是訓練一個最佳弱分類器的過程,也是一個最佳圖像特征的選取過程。從另一個角度來說,AdaBoost算法可以選擇出能提高所建分類識別模型預測能力的最佳人臉特征。
對AdaBoost算法的具體計算步驟如下:
步驟1輸入。設訓練樣本數據庫X包含n個樣本{(x1,y1),(x2,y2),…,(xn,yn)},其中,xi為算法輸入的訓練樣本,其中,i∈[1,n];yi∈Y={1,2,…,k}表示k類樣本的標簽。每個樣本初始化服從均勻分布的權重,即D1(i)=1/n;整數T為迭代次數。
步驟2對每個弱分類器ht,t=1,2,…,T,其中,T為弱分類器的個數,進行以下迭代運算:
(1) 把權重歸一化為一個概率分布Dt;
(2) 返回一個弱分類器,即
ht:X→Y
(1)
(3) 計算弱分類器ht的誤差為
(2)
若εt>1/2,則設T=t-1,且終止循環(huán);
(4) 設弱分類器的權重為
(3)
(5) 更新樣本概率分布Dt,
(4)
式中,Zt為歸一化的常量。
步驟3所有被選出的最佳弱分類器組合成強分類器,為
(5)
本文提出一種新的為不同待測樣本自適應選擇合適的人臉特征的方法: 對訓練數據庫的每張圖像以及待測樣本圖像分別用M種特征提取方法提取M種特征;之后,針對上述M種特征,在訓練樣本數據庫上,用AdaBoost算法訓練一個強分類器。
對訓練樣本數據庫做以下設置: 訓練樣本數據庫設為Xt,包含C個子樣本數據庫X1,X2,…,Xi,…,XC,i∈[1,C],分別代表C類人臉圖像(如人臉正面圖像、受光照變化影響的圖像、受遮擋的圖像以及旋轉一定角度的圖像等),每個子數據庫又包含p個人的多幅圖像。
自適應特征選擇算法的計算步驟如下:
(1) 對數據庫Xt中的每幅圖像,均用M種特征提取方法分別提取M個特征向量,組成特征庫F。
(2) 對子數據庫Xi分別用Adaboost算法獲得一個強分類器Hi。該強分類器是M個弱分類器的組合,即
其中,aij為每個弱分類器的加權系數,且aij值最大的弱分類器對應于Xi數據庫中,對分類貢獻最大,即最優(yōu)的特征fmi(fmi∈F,m∈[1,M],i∈[1,C])所屬的類別,并設最大的aij值為ai max,i∈[1,C];F為特征庫。
(3) 對數據庫Xt的每個子數據庫均執(zhí)行上述運算,可得C個強分類器{Hi},i∈[1,C]。
(4) 分別計算待測樣本圖像的M個特征和特征庫F中同類特征之間的距離(如歐氏距離),并歸一化,找出歸一化距離最短的特征fo,并把歸一化距離作為特征選擇的準則。
(5) 根據ai max,i∈[1,C]值和不同類別特征之間的關系,搜索特征fo對分類貢獻最大的分類器Hc,運用該分類器完成對待測樣本圖像的識別。
該算法的結構圖如圖1所示。
圖1 基于自適應特征選擇的人臉識別算法Fig.1 Face recognition based on adaptive feature selection
本文實驗所用的數據來源于GATV數據庫,樣本數據庫包含以下4種類型的人臉圖像: 標準正面圖像、正面圖像帶表情變化、左側旋轉45°、有遮擋等,每類圖像有10個人的5幅圖像,故實驗所用數據庫共包含200幅圖像。每幅圖像分別用PCA方法提取其全局特征,用LBP和SIFT算法分別提取其局部特征,故每幅圖像共提取3種特征。
圖2為實驗所用數據庫包含的部分樣本圖像。
圖2 部分樣本圖像Fig.2 Part of image samples
(1) 在本文設置的樣本數據庫中,對于每類圖像,從每個人的5幅圖像中輪流選取一幅做測試圖像,剩余的4幅作為訓練圖像,故每個人可以做5次分類識別實驗,10個人5次實驗的平均識別率如圖3所示。同時,為驗證本文提出算法的有效性,圖3中還給出了采用PCA方法提取圖像的全局特征、用LBP和SIFT算法提取的局部特征的平均識別率。實驗結果表明,本文提出的算法較其他3種算法在絕大多數實驗樣本上具有相對較高的識別率。
圖3 基于不同特征的人臉識別算法平均識別率比較Fig.3 Comparison of average recognition rates of face recognition algorithms based on different features
(2) 在不同類型的人臉圖像子數據庫上,使用本文提出的算法和基于不同特征的識別算法分別進行比較,取不同人臉同一類型的分類識別率的平均值作為實驗結果,以驗證本文算法在環(huán)境等因素的影響下的有效性,實驗結果如圖4所示。
圖4 不同算法在不同類型的人臉圖像子數據庫上的平均識別率比較Fig.4 Comparison of average recognition rate with different face recognition algorithms on different kinds of sub-database of face images
圖4為柱狀圖,每對柱狀圖的左側代表的是本文提出的自適應特征選擇算法的平均識別率,右側為基于單一特征或組合特征的識別算法的平均分類識別率。在這些識別算法中分類器仍然采用AdaBoost算法。由圖可見,相比較單一的PCA、LBP、SIFT以及LBP+PCA人臉特征,在不同類型的人臉圖像數據庫上,本文算法均具有較高的識別率,尤其是對有遮擋的人臉圖像,本文提出的算法和傳統(tǒng)的SIFT算法相比較,具有較為明顯的優(yōu)勢,識別效果相對較好。
針對常用的基于特征的人臉識別算法,由于所選擇的特征是固定的,對于所有的測試樣本并不完全適用的缺點,本文提出了一種根據測試樣本圖像自適應地選擇合適特征的人臉識別算法。該算法利用AdaBoost算法,針對不同情景下的人臉圖像自適應地選擇合適的全局或局部特征,并通過實驗證明該算法可有效地克服如光照、遮擋、面部表情發(fā)生變化等的影響,擴展了算法的適用范圍,有效地提高了人臉圖像的識別率。
參考文獻:
[1] Song Mingli,Tao Dacheng,Liu Zicheng,et al.Image ratio features for facial expression recognition application[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B: Cybernetics,2010,40(3): 779-788.
[2] 蘇煜,山世光,陳熙霖,等.基于全局和局部特征集成的人臉識別[J].軟件學報,2010,21(8): 1849-1862.
[3] 徐效文,張荷萍.融合局部與全局特征提取的虹膜識別方法[J].計算機應用研究,2012,29(11): 4378-4380,4397.
[4] Shang Junjun,Ke Yongzhen.An image recognition method using multi-features[C]∥Proceedings of the 11th International Symposium on Distributed Computing and Applications to Business, Engineering & Science.Guilin: IEEE,2012: 419-423.
[5] 薛冰,郭曉松,蒲鵬程.人臉識別技術綜述[J].四川兵工學報,2010,31(7): 119-121.
[6] Zhou Qiangqiang,Zhao Zhenbing.Substation equipment image recognition based on SIFT feature matching[C]∥ Proceedings of 5th International Congress on Image and Signal Processing(CISP).Chongqing: IEEE,2012: 1344-1347.
[8] 袁寶華,王歡,任明武.基于完整LBP特征的人臉識別[J].計算機應用研究,2012,29(4): 1557-1559.
[9] Doshi N P,Schaefer G.Compact multi-dimensional LBP features for improved texture retrieval[C]∥Proceedings of the Second International Conference on Robot,Vision and Signal Processing.Washington,DC,USA: IEEE,2013: 51-55.
[10] 陳琦,郭順超,張世輝.基于特征聯(lián)合和支持向量機的人臉識別[J].燕山大學學報,2012,36(6): 519-525.
[11] 王美,梁久禎.自適應特征提取的光照魯棒性人臉識別[J].計算機工程與應用,2012,48(11): 164-169.
[12] 朱長仁,王潤生.人臉特征自適應選取技術[J].計算機輔助設計與圖形學學報,2002,14(1): 26-30.
[13] 潘崇,朱紅斌.基于自適應特征選擇和SVM的圖像分類的研究[J].計算機應用與軟件,2010,27(1): 244-246.
[14] 李巍,楊素錦,段曉華.Adaboost和隨機圖劃分的無監(jiān)督圖像分類[J].中國圖象圖形學報,2012,17(10): 1245-1251.
[15] 方晶晶,李振波,姜宇.人體膚色區(qū)域的自適應模型分割方法[J].計算機輔助設計與圖形學學報,2013,25(2): 229-234.