曾軍英,趙曉曉,林作永,諶瑤,馮武林
?
曾軍英,趙曉曉,林作永,諶瑤,馮武林
(五邑大學(xué) 信息工程學(xué)院,廣東 江門(mén) 529020)
眾所周知,深度學(xué)習(xí)模型提取的特征可以較好地表達(dá)和描述人臉圖像. 本文通過(guò)深度學(xué)習(xí)模型提取特征,并利用提取的特征重構(gòu)圖像. 重構(gòu)圖像的深度網(wǎng)絡(luò)模型如圖1所示. 輸入圖像是任意姿態(tài)和光照的人臉圖像,深度網(wǎng)絡(luò)的特征提取層包括3個(gè)連接層和2個(gè)聚合層. 首先,輸入圖像通過(guò)特征提取層進(jìn)行編碼,其中有3個(gè)本地連接層和2個(gè)聚合層交替堆疊. 每層在不同的尺度上提取人臉特征,如圖1中,第1連接層輸出32個(gè)特征映射. 每張圖像在人臉區(qū)域外都有大量的強(qiáng)烈響應(yīng),主要捕獲人臉姿態(tài)、光照信息,而在人臉區(qū)域內(nèi)的一些強(qiáng)烈響應(yīng)用于捕捉人臉結(jié)構(gòu). 在輸出特征映射的第2局部連接層,強(qiáng)烈響應(yīng)的人臉區(qū)域已顯著減少,表明丟棄了人臉大部分差異而保持面部結(jié)構(gòu). 第3本地連接層輸出重構(gòu)特征,該特征是稀疏的并且保持身份特征,而且使用一個(gè)完全連接的重建層,重構(gòu)特征可以恢復(fù)標(biāo)準(zhǔn)視圖的人臉圖像.
圖1 圖像重構(gòu)模型
由于從式(5)得到的解還包含多類(lèi)人臉的系數(shù),故可將測(cè)試人臉樣本的類(lèi)別修正為式(7),即
實(shí)驗(yàn)平臺(tái)為主頻2GHz的中央處理器、4GB內(nèi)存,MATLAB7.6版本,Windows 7系統(tǒng).
圖2 FERET人臉數(shù)據(jù)庫(kù)部分人臉圖像
表1 不同方法對(duì)重構(gòu)圖像和原始圖像的識(shí)別率 %
表2 不同方法和不同維度值的識(shí)別時(shí)間 s
本文提出了基于圖像重構(gòu)和平滑0范數(shù)稀疏表示分類(lèi)的人臉識(shí)別算法. 基于FERET人臉數(shù)據(jù)庫(kù)的實(shí)驗(yàn)結(jié)果表明,利用標(biāo)準(zhǔn)重構(gòu)的圖像可提高傳統(tǒng)算法在人臉姿態(tài)變化大的情況下的識(shí)別性能;采用平滑0快速稀疏算法可減少識(shí)別時(shí)間. 相比于直接提取人臉特征或人臉Gabor特征算法,本算法識(shí)別率顯著提高,特別是在姿態(tài)變化較大或者光照復(fù)雜的情況下,仍能保持較高的人臉識(shí)別率和識(shí)別效率. 下一步將進(jìn)一步研究深度學(xué)習(xí)算法應(yīng)用到實(shí)際的視頻圖像和網(wǎng)絡(luò)圖像中.
[1] KRIZHEVSKY A, International Conference on HINTON G E, SUTSKEVER I. Imagenet classification with deep convolutional neural networks [C]// International Conference on Neural Information Processing Systems, 2012, 1097-1105.
[2] ZHU Zhenyao, LUO Ping, WANG Xiaogang, et al. Deep learning identity-preserving face space [C]//IEEE International Conference on Computer Vision. IEEE, 2013: 113-120.
[3] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2009, 31(2): 210-227.
[5] ETEMAD K, CHELLAPPA R. Discriminant analysis for recognition of human face images [J]. J Opt Soc Am A, 1997, 14(14): 125-142.
[6] BARTLETT M, MOVELLAN J, SEJNOWSKI T. Face recognition by independent component analysis [J]. IEEE Transactions on Neural Networks, 2002, 13(6): 1450-1464.
[7] YANG M, ZHANG L, ZHANG D, et al. Relaxed collaborative representation for pattern classification [J]. Computer Vision and Pattern Recognition, 2012, 157(10): 2224-2231.
[10] CHAI Zhenhua, SUN Zhenan, MENDEZ-VAZQUES H, et al. Gabor ordinal measures for face recognition [J]. IEEE Transactions on Information Forensics and Security, 2013, 9(1): 14-26.
[11] YANG M, ZHANG L. Gabor feature based sparse representation for face recognition with Gabor occlusion dictionary [C]//Computer Vision-ECCV 2010. Greece: European Conference on Computer Vision, 2010: 6316(7): 448-461.
[12] HUANG G B, LEE H, LEARNED-MILLER. Learning hierarchical representations for face verification with convolutional deep belief networks [C]//Computer Vision and Pattern Recognition. Rhode Island: IEEE, 2012: 2518-2525.
[責(zé)任編輯:熊玉濤]
ZENGJun-ying, ZHAOXiao-xiao, LINZuo-yong, SHENYao, FENGWu-lin
(School of Information Engineering, Wuyi University, Jiangmen 529020, China)
TP391.4
A
1006-7302(2018)02-0018-05
2017-11-27
廣東高等學(xué)校優(yōu)秀青年培養(yǎng)計(jì)劃項(xiàng)目(SYQ2014001);廣東省特色創(chuàng)新類(lèi)項(xiàng)目(2015KTSCX143);廣東省青年創(chuàng)新人才類(lèi)項(xiàng)目(2015KQNCX165,2015KQNCX172).
曾軍英(1977—),男,江西贛州人,副教授,博士,碩士生導(dǎo)師,研究方向?yàn)樯锾卣髯R(shí)別、深度學(xué)習(xí)和信息處理.