薛 紅,李 晗,王 瑜
(北京工商大學(xué) 計算機與信息工程學(xué)院,北京100048)
近年來,基于局部二值模式 (local binary pattern,LBP)的人臉識別算法以其具有很好的旋轉(zhuǎn)不變性和光照魯棒性,受到了廣大研究者的關(guān)注,取得了顯著的成果,并涌現(xiàn)出很多新的改進方法[1-3]。例如,He等[4]提出了多元結(jié)構(gòu)局部二值模式 (multi-structure LBP,MSLBP)的紋理分析方法,Zhang 等[5]提出了單基因局部二值模式(monogenic LBP,MLBP)的紋理分類方法,Guo等[6]提出了Fisher判 別 學(xué) 習(xí) 的 局 部 二 值 模 式 (FSC-based learning LBP,F(xiàn)BL-LBP)紋理分類方法等。但大多改進方法仍然只是對3×3局部鄰域的基本LBP算子進行強化,這樣會損失掉大鄰域的結(jié)構(gòu)信息,或采用均勻模式的LBP算子提取大尺度的圖像紋理信息,但在在很多情況下,這種均勻模式并不是最優(yōu)的,甚至是失效的。針對上述問題,本文提出一種融合LBP與K-Means的人臉識別算法,利用大尺度LBP算子提取圖像紋理特征,同時針對大鄰域出現(xiàn)的二值模式種類劇增的缺點,利用K-Means聚類算法對LBP特征進行降維,使其在減少模式種類的同時最大限度地保留具有代表性的模式。實驗結(jié)果表明,本文提出的方法具有更強的人臉圖像表達能力,能夠顯著提高人臉識別率。
LBP是Ojala在1996 年提出的一種局部紋理描述算子[2]。其基本思想是:以中心像素的灰度值為閾值,將其與鄰域像素灰度值相比較,若鄰域像素灰度值大于該閾值,則標記為1,否則為0,將得到的二進制碼轉(zhuǎn)換成十進制數(shù)值來取代中心像素。LBP算子的定義如下
式中:gc——中心像素點(xc,yc)的灰度值;P——近鄰點個數(shù),R——紋理基元的半徑;gp——近鄰點的灰度值。圖1為3種不同P 和R 所對應(yīng)的LBP算子。
圖1 幾種LBP算子
使用LBP紋理特征進行人臉識別時,利用LBP的統(tǒng)計直方圖來表達圖像信息,直方圖的計算公式如下
對于一個LBPP,R算子,會產(chǎn)生2P種模式,P 值越大,越能統(tǒng)計到更多的人臉圖像結(jié)構(gòu)信息,圖像損失越小,但同時,隨著近鄰點個數(shù)增加,二值模式的種類是呈指數(shù)急劇增加的。例如,若近鄰點為16,則二值模式的種類會增加到65,536 (=216)。相應(yīng)地,LBP 直方圖的維數(shù)也會驟增,這無論對于紋理的提取、識別,還是信息的存取,都是十分不利的。為了解決上述問題,Ojala提出了一種“均勻模式”的LBP 算子,它可以視作紋理的基本屬性,包含了大部分的紋理模式,并可將模式的數(shù)量從2P減少到P (P-1)+2種。雖然均勻模式可以有效地降低維數(shù),但鄰域采樣點范圍過大時,數(shù)據(jù)維數(shù)還是增長迅速。而且,當圖像發(fā)生較大光照或表情變化時,均勻模式所占的比率不到60%,甚至更低,這會嚴重丟失有價值的信息。
針對上述問題,本文引入K-Means聚類算法,對LBP直方圖進行降維,使之在數(shù)據(jù)減少的情況下更好的表達圖像信息,以達到提高人臉識別率的目標。
K-Means是一種快速的聚類方法,目標是將n個對象聚為K 類,使每個類內(nèi)差異漸小、類間差異漸大,從而得到一個較理想的聚類[7]。該算法首先隨機選取K 個對象作為初始的聚類中心,然后計算其余對象到聚類中心的距離,把每一對象分配到與之距離最近的類中,接下來計算調(diào)整新類的聚類中心,若相鄰兩次聚類中心未發(fā)生變化,則聚類完成。該算法框架如下:
(2) 計算每一數(shù)據(jù)對象到聚類中心的距離D (xi,zj(t) ), 如 果 滿 足 D (xi,zl(t) )=,則xi∈zl(t) ,其中i∈ {1 ,2,…,n} ,l∈ {1 ,2,…,K };
通過K-Means算法我們可以把大數(shù)據(jù)量的LBP二值模式進行聚類,使其在不損失主要信息的情況下,大大降低LBP 特征的維度,這樣LBP 直方圖就降維到K 維 (K2P),不僅增強了LBP直方圖的人臉鑒別能力,而且節(jié)省了計算和存儲成本。具體步驟請見第3節(jié)。
融合LBP 與K-Means的人臉識別算法過程如圖2 所示,具體步驟如下:
圖2 LBP與K-Means的人臉識別融合算法流程
(1)利用LBP16,2算子計算所有訓(xùn)練樣本的局部紋理特征值,統(tǒng)計所有LBP值出現(xiàn)的頻次,用K-Means聚類算法將其聚為K 類,這里我們僅考慮頻次大于10的情況,可以有效忽略掉異常值;然后把每個LBP值與其聚類中心聯(lián)系起來離線建立一個查找表。
(2)將測試人臉圖像進行分塊,同樣利用LBP16,2算子計算每塊人臉圖像的LBP值,然后將每塊中LBP值通過事先建立好的查找表映射到相應(yīng)的聚類中心,快速統(tǒng)計出子區(qū)域LBP直方圖,計算公式如下
(3)將所有人臉子塊的直方圖依次連接起來,建立完整的人臉特征直方圖。算法完整的特征提取過程如圖3所示。
圖3 特征提取流程
(4)最后采用最近鄰分類器分類識別。
本文選用AR 標準人臉庫[8]對算法進行比較和測試。AR 人臉庫包含126人,每人26幅不同時期、光照、表情及姿態(tài)條件下的正面圖像。實驗中,我們選取20名男性及20名女性,每人10幅圖像作為訓(xùn)練樣本,另外16幅圖像作為測試樣本,每幅圖像均裁剪成50×40大小。具體實驗結(jié)果如下。
本節(jié)首先討論參數(shù)對算法性能的影響。
(1)聚類中心數(shù)K 的選取
聚類中心個數(shù)的選取直接關(guān)系到LBP 直方圖特征維數(shù),從而影響人臉識別率。這里,我們選取半徑為2,鄰域點數(shù)為16的LBP算子,分塊數(shù)固定為3×3,聚類中心K分別選取50、100、150、200、250、300、350、400,實驗結(jié)果如圖4所示。
圖4 聚類中心數(shù)K 對人臉識別率的影響
從圖4可以看出,在其它參數(shù)固定的情況下,隨著聚類中心K 的增多,人臉識別率會先增加后降低,K 取150時識別效果最好。這是因為K 越小,直方圖的維數(shù)也會越小,過小的維數(shù)不易表達人臉局部特征的差異性;而K 越大,LBP特征直方圖的維數(shù)也會越大,直方圖過于稀疏不利于表征人臉,會嚴重影響人臉識別率。因此,本文算法中的聚類中心數(shù)K 取值為150。
(2)圖像分塊數(shù)的選取
對人臉圖像進行分塊可以有效地提取局部紋理特征,有助于提高識別的性能,不同的分塊大小對識別率會有一定的影響。我們將人臉圖像分別分成1×1、2×2、3×3、4×4、5×5的子塊,實驗結(jié)果如圖5所示。
從圖5可以清楚地看到,人臉圖像在分塊情況下的識別率要比不分塊時高,且在4×4分塊時識別率最好,隨著分塊數(shù)的增多,識別率又開始下降,這是因為:過多的分塊既無法提取到較大區(qū)域的局部特征,又會破壞全局特征,反而不利于識別。只有分塊適當,才能夠得到較好的識別效果。
(3)LBP算子尺度的選取
LBP算子可以描述出鄰域像素相對于中心像素的灰度值分布規(guī)律,所以LBP算子尺度的選取至關(guān)重要。我們通過選取不同的采樣點個數(shù)P 和半徑R 的值,來測試LBP尺度對人臉識別率的影響。實驗結(jié)果如圖6所示。
從圖6可以看到,隨著采樣點和半徑的逐漸增加,識別率同樣呈現(xiàn)一個先增后降的過程,采樣點和半徑取 (16,2)時要高,這是因為大鄰域范圍能描述更多的結(jié)構(gòu)信息,但如果尺度過大,就會丟失掉局部信息,反而降低識別率。
為了驗證提出算法的性能,本文選擇了一些經(jīng)典的人臉識別算法進行比較,包括PCA[9],2DPCA[10],Gabor[11]小波和LBP[2]算法。實驗分別對比了各算法在時間變化、表情變化和光照變化下的識別性能,對比結(jié)果如圖7所示。
圖7 不同算法的識別性能比較
從圖7可以看出,基于局部特征的人臉識別算法整體上要比基于全局特征的人臉識別算法好,這主要是因為基于局部特征的人臉識別算法更加注重人臉的細節(jié)變化,能更好地提取人臉的特征。在表情變化、時間變化和光照變化情況下,本文算法的識別效果都要明顯優(yōu)于其它算法,這是因為本文所用的大尺度LBP算子可以提取到更豐富的結(jié)構(gòu)信息,引入K-Means算法又可在數(shù)據(jù)量減少的情況下能更好地表達圖像信息。由于LBP算子本身具有較好的光照不變性,所以改進后算法的光照魯棒性也得到了顯著的增強。
本文提出了一種融合LBP和K-Means聚類的人臉識別算法。較傳統(tǒng)算法相比,本文算法利用大尺度的LBP 算子可以提取更加豐富,且更有利于后續(xù)分類識別的局部紋理特征,引入K-Means聚類算法則可以有效降低LBP直方圖的維數(shù),更好的表達人臉特征,減少數(shù)據(jù)存儲空間和計算時間。本文通過實驗詳細分析了各參數(shù)對識別結(jié)果的影響,并且對比了本文算法和現(xiàn)有算法在各種因素制約下的識別效果,實驗結(jié)果表明,本文提出的算法對時間、光照及表情變化等均具有很好的識別效果。
[1]WANG Jinyun,ZHOU Huijie,JI Zheng.Research on face recognition technology in complex background [J].Computer Engineering,2013,39 (8):42-26 (in Chinese). [王金云,周暉杰,紀政.復(fù)雜背景中的人臉識別技術(shù)研究 [J].計算機工程,2013,39 (8):42-26.]
[2]YUAN Baohua.Face recognition based on completed local binary pattern [J].Application Research of Computers,2012,29(4):99-102 (in Chinese).[袁寶華.基于完整LBP特征的人臉識別 [J].計算機應(yīng)用研究,2012,29 (4):99-102.]
[3]SONG Kechen.Research and perspective on local binary pattern [J].ACTA Automatica Sinica,2013,39 (6):730-744(in Chinese).[宋克臣.局部二值模式方法研究與展望 [J].自動化學(xué)報,2013,39 (6):730-744.]
[4]He Y G,Sang N,Gao C X.Pyramid-based multi-structure local binary pattern for texture classification [C]//Proceedings of the 10th Asian Conference on Computer Vision,2011:133-144.
[5]Zhang L,Zhang L,Guo Z H,et al.Monogenic-LBP:A new approach for rotation invariant texture classification [C]//Proceedings of the 17th International Conference on Image Processing,2010:2677-2680.
[6]Guo Y,Zhao G,Pietikainen M,et al.Descriptor learning based on Fisher separation criterion for texture classification[C]//Proceedings of the Asian Conference on Computer Vision,2011:185-198.
[7]FENG Junshuai.A method of optimizing ellipse images recognition by automatic clustering [J].Electronic Test,2013,5(9):104-106 (in Chinese). [馮軍帥.一種運用自聚類方法優(yōu)化橢圓圖像識別的方法 [J].電子測試,2013,5 (9):104-106.]
[8]HU Xiao.Face recognition based on complex integration of row and column features [J].Computer Engineering,2010,36(11):63-65 (in Chinese).[胡曉.基于行列特征復(fù)融合的人臉識別 [J].計算機工程,2010,36 (11):63-65.]
[9]ZHANG Yan,WU Yuqiang.New face recognition method based on improved modular PCA [J].Computer Engineering and Applications,2011,47 (26):216-218 (in Chinese).[張巖,武玉強.一種改進的模塊PCA 人臉識別新方法 [J].計算機工程與應(yīng)用,2011,47 (26):216-218.]
[10]HAN Xiaocui.Improved 2DPCA method for face recognition[J].Computer Engineering and Applications,2010,46(25):185-187 (in Chinese).[韓曉翠.一種改進的2DPCA人臉識別方法 [J].計算機工程與應(yīng)用,2010,46 (25):185-187.]
[11]LI Wenhui,GAO Lu.Feature selection fuzzy weighted multi-Gabor face recognition [J].Journal of Hunan University(Natural Sciences),2013,40 (4):87-93 (in Chinese).[李文輝,高璐.特征選擇模糊加權(quán)多通道Gabor人臉識別 [J].湖南大學(xué)學(xué)報 (自然科學(xué)報),2013,40 (4):87-93.]