楊 瑞, 張云偉, 茍 爽, 支艷利
(昆明理工大學 信息工程與自動化學院,云南 昆明 650504)
Gabor特征與深度信念網(wǎng)絡結合的人臉識別方法*
楊 瑞, 張云偉, 茍 爽, 支艷利
(昆明理工大學 信息工程與自動化學院,云南 昆明 650504)
提出了一種基于Gabor特征和深度信念網(wǎng)絡(DBN)的人臉識別方法,通過提取Gabor人臉圖像的不同尺度圖進行卷積融合,將融合后的特征圖作為DBN的輸入數(shù)據(jù),訓練多層來獲得更加抽象的特征表達,整個訓練的過程中采用交差熵來微調DBN,模型的最頂層結合Softmax回歸分類器對抽取后的特征進行分類。在AR人臉庫測試的實驗結果表明:將Gabor特征與DBN結合應用于人臉識別,其準確率可高達92.7%,與其他淺層學習模型相比,DBN學習了數(shù)據(jù)的高層特征的同時還降低了特征維數(shù),提高了分類器的分類精度,最終有效改善了人臉識別率。
Gabor特征; 深度學習; 受限玻爾茲曼機; 深度信念網(wǎng)絡; Softmax回歸分類器
人臉識別是模式識別和計算機視覺領域的研究熱點,作為一種重要生物識別技術,在信息安全領域有著很好的應用前景。
近年來,基于局部的人臉特征提取研究成果主要包括局部二值模式(local binary pattern,LBP)[1]、Gabor小波[2]以及方向梯度直方圖(histogram of oriented gradient,HOG)[3]方法等。Gabor小波對位置誤差、光線等因素具有強的魯棒性,可提供良好的方向選擇性和尺度選擇性,可以很好地描述圖像的紋理信息,這些優(yōu)點使其成為目前最使其主流的人臉特征提取方法。文獻[4] 有效地結合了Gabor小波的特征抽取能力和支持向量機(SVM)的分類能力進行人臉識別;文獻[5]采用Gabor小波與改進的BP神經網(wǎng)絡,但BP神經網(wǎng)絡容易陷入局部最優(yōu),使得人臉識別率并沒有明顯改善。這些學習方法都是淺層結構算法,其局限性在于有限樣本和計算單元情況下對復雜函數(shù)的表示能力有限,針對復雜分類問題其泛化能力受到一定制約。
區(qū)別于傳統(tǒng)的淺層學習,深度學習通過大數(shù)據(jù)來學習特征,逐層特征變換,能夠刻畫數(shù)據(jù)豐富的內在信息。文獻[6]提出基于深度信念網(wǎng)絡(deep belief network,DBN)的多通道人臉識別算法, 把局部人臉圖像塊與Gabor濾波器組卷積融合,通過受限玻茲曼機(RBM)進行數(shù)據(jù)擬合,提取圖像本質特征,用降維后的特征向量訓練DBN。文獻[7]采用了目前最熱的卷積神經網(wǎng)絡(convolutional neural network,CNN)人臉識別方法,特征檢測層訓練數(shù)據(jù)進行學習, 特征映射層上神經元權值相等,使得網(wǎng)絡可以并行學習,其布局更接近于實際的生物神經網(wǎng)絡,權值共享降低了網(wǎng)絡的復雜性,多維輸入向量的圖像可以直接輸入網(wǎng)絡,避免了特征提取和分類過程中數(shù)據(jù)重建的復雜度。
本文提出了一種基于Gabor特征和DBN的人臉識別方法,通過與淺層算法進行測試對比,實驗結果表明了本文所提出算法的有效性。
1.1 2D-Gabor小波變換
D.Gabor最早提出了Gabor小波變換, 其生物相關性以及計算特性,使Gabor小波被廣泛應用于圖像分析、模式識別等領域。2D-Gabor濾波器的表達式
(1)
式中 μ為Gabor核的方向;ν為Gabor的尺度;z(x,y)為圖像坐標;σ為與小波頻率帶寬有關的常數(shù);濾波器相應的中心頻率為kμ,ν;kν=kmax/fν 為采樣尺度;kmax為最大頻率;f為頻域中內核間隔因子;ν={0,1,2,…,n}為尺度標號;μ={0,1,2,…,m-1}為方向標號;濾波器的方向性由φμ=πμ/m體現(xiàn)出來。
1.2 Gabor人臉特征矢量的提取
對Gabor小波進行圖像特征的提取,可以通過式(2)來進行描述,即圖像與Gabor小波核的卷積,設輸入圖像對應的灰度值I(x,y),則輸入圖像I與Gabor小波核Ψμ,ν的卷積可以表示為
Ομ,ν(x,y)=I(x,y)*Ψμ,ν(x,y)
(2)
圖1 人臉圖像的Gabor特征
在實際應用時,可以根據(jù)檢測對象的方向趨勢,選擇合適的方向參數(shù)進行濾波,本文選擇4個方向尺度的人臉Gabor特征,取μ={0,2,4,6},φk=(0,π/4,π/2,3π/4), σ=1,Gabor濾波器的融合式
fi(x,y)=Οi(x,y)?I(x,y), i=0,1,2,3
(3)
式中 fi(x,y)為卷積后的特征圖,將不同尺度下的卷積融合后特征圖如圖2所示。
圖2 Gabor特征融合
2.1 DBN模型
DBN是一個概率生成模型,由一系列的限制RBM堆疊組成。RBM是由可視層和隱含層兩層神經元構成的,每層含有若干個節(jié)點,層內節(jié)點無連接,不同層之間的節(jié)點依靠權值系數(shù)矩陣來連接,可見層和隱含層的單元都是二進制:ν∈{0,1}D和h∈{0,1}K,D和K分別為可見層和隱藏層的單元序號。ν和h的聯(lián)合概率表示為
(4)
式中 Ζ為一個歸一化常數(shù),RBM為一種能量模型,Ε(ν,h)為一個能量方程表示為
(5)
式中 Wij為可視層節(jié)點νi與隱含層節(jié)點hj之間的連接權重值;ai,bj分別為隱藏層、可視層的偏置值。
在訓練DBN用CD(contrastivedivergence)算法遞歸地訓練每一層的RBM,構建完整的DBN。但是前一層的RBM的誤差會逐漸往后層的RBM傳遞,且得不到修正, 本文采用交叉熵采樣逼近最優(yōu)結果來微調DBN。
2.2DBN的人臉圖像分類
利用上述特征學習算法可以從像素層面自動學習到人臉數(shù)字圖像的特征,但是DBN雖具有較強的無監(jiān)督特征學習能力,但沒有分類能力,采用Softmax回歸對DBN學習到的特征進行分類并構建分類器。假設有標簽樣本集為(x′1,y′1),(x′2,y′2),…,(x′i,y′i),…,(x′m,y′m),1≤i≤m,Softmax回歸的類標簽屬于y′i∈{0,1,…,k},這里k指分類類別數(shù)量,本文采用的DBN結構如圖3所示,它由多個RBM相鄰兩層構成,首先逐層訓練參數(shù),初始化DBN。然后訓練第一層RBM的權值系數(shù)矩陣W1及類別標簽2 000,即多尺度表達一張人臉,通過最大似然估計訓練出第一層RBM的隱藏層向量h1,將h1作為第二層的可視層輸入數(shù)據(jù),單獨調整參數(shù)使得當前的RBM結構能量趨于平衡,遞歸地計算出每一層的隱藏層單元向量hi和權值系數(shù)矩陣Wi以及各類別標簽,將DBN的輸出層作為Softmax回歸分類器的激活函數(shù),最后一層輸出層輸出50個類別標簽的概率。
圖3 DBN結構
在AR人臉數(shù)據(jù)庫包含120個人,每人14張不同姿態(tài)和表情,本實驗選擇50人,隨機抽取每人8張圖像作為訓練樣本,剩余作為測試樣本,并進行裁剪到指定大小M×N,識別率取重復10次運行后所得的平均值。由圖4所示實驗結果可以看出:當圖像像素過低或過高時,其他3種算法識別效果比較差,低分辨率圖像可能本質信息缺失,但是本文算法不管是在低分辨率還是高分辨率上都取得了較好的效果。
圖4 4種算法在AR人臉庫識別率
為了得到訓練樣本個數(shù)對識別率的影響,在AR人臉庫中選擇50人,隨機抽取每人7,8,9,10,11張圖像作為訓練樣本,其余作為測試樣本,裁剪圖片為上述實驗證實的最適合像素24×32,識別率取重復10次運行后所得的平均值。由圖5可以看出,當訓練樣本不夠充足時,各算法的識別率并不高,隨著訓練樣本數(shù)的增加,多尺度特征以及特征融合使得識別率都有不同程度的提升,但是總體上本文算法識別率要高于其他幾種算法,說明了DBN具有較強的學習能力,能夠從高維的數(shù)據(jù)特征中抽取低維可區(qū)分的低維特征。
圖5 AR人臉庫上不同訓練樣本識別率
本文提出了一種基于Gabor特征和DBN的人臉識別方法,很好地利用了Gabor小波對位置誤差、光線等因素較好的魯棒性等優(yōu)點,結合無監(jiān)督學習算法DBN自動地學習融合后人臉圖像特征,并使用Softmax回歸分類器對學習的人臉特征進行分類。實驗結果也充分表明了本文算法人臉識別準確率可以達到92.7 %,因此,理論與實驗均表明DBN在人臉識別率上均高于淺層結構算法。但是深度學習算法也存在著缺點,對大規(guī)模的人臉樣本訓練時間相對較長。
[1]AhonenT,HadidA,Pietik?inenM.Facerecognitionwithlocalbinarypatterns[J].LectureNotesinComputerScience,2004,3021:469-481.
[2]TrucVitomir.PrincipalGaborfiltersforfacerecognition[C]∥Proceedingsofthe3rdIEEEInternationalConferenceonBiome-trics:Theory,ApplicationsandSystems,IEEE,2009:113-118.
[3] 程廣濤,陳 雪,郭照莊.基于HOG特征的行人視覺檢測方法[J].傳感器與微系統(tǒng),2011,30(7):68-70.
[4] 劉江華,陳佳品,程君實.基于Gabor小波特征抽取和支持向量機的人臉識別[J].計算機工程與應用,2003,39(8):81-83.
[5] 朱忠江.基于Gabor特征和神經網(wǎng)絡的人臉識別研究與實現(xiàn)[D].北京:北京建筑大學,2015.
[6] 柴瑞敏,曹振基.基于Gabor小波與深度信念網(wǎng)絡的人臉識別方法[J].計算機應用,2014,34(9):2590-2594.
[7]ZhangY,ZhaoD,SunJ,etal.AdaptiveconvolutionalneuralnetworkandIt'sapplicationinfacerecognition[J].NeuralProces-singLetters,2016,43(2):389-399.
Face recognition algorithm based on Gabor feature and DBN*
YANG Rui, ZHANG Yun-wei, GOU Shuang, ZHI Yan-li
(School of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650504,China)
A method for face recognition based on the Gabor feature and deep belief network(DBN)is proposed.By extracting different scales image of Gabor face images for convolution fusion and fused feature image is used as input data of DBN.Many layers are trained in order to get more abstract representation.In whole training process,cross entropy method is adopted to fine-tune DBN.The Softmax regression classifier is used for classification which is implemented at the top layer.The experimental result in AR face database shows that when Gabor feature extract combining with DBN are applied to face recognition,its accuracy reaches 92.7 %.Comparing with other shallow-layer learning models,DBN not only studies the high-level features of the data,but also reduces dimension and improves the precision of the classifier,which finally improves face recognition rate.
Gabor feature; deep learning; restricted Boltzmann machine(RBM); deep belief network(DBN); softmax regression classifier
10.13873/J.1000—9787(2017)05—0068—03
2016—05—23
國家自然科學基金資助項目(51365019)
TP 391
A
1000—9787(2017)05—0068—03
楊 瑞(1990-),女,碩士研究生,研究方向為軟件設計與開發(fā)。
張云偉(1972-),男,通訊作者,博士,教授,從事精密測控技術研究工作,E—mail:zhangyunwei72@qq.com。