羅聰 劉斌 魏夢(mèng)然
摘要:人臉識(shí)別是計(jì)算機(jī)模式識(shí)別領(lǐng)域中一個(gè)研究熱點(diǎn)和難點(diǎn)。針對(duì)人臉識(shí)別中數(shù)據(jù)量大、高維度、非線性等問(wèn)題,提出基于局部特征約束的壓縮感知人臉識(shí)別方法.首先對(duì)人臉圖像進(jìn)行選擇性約束處理,利用SIFT算法提取人臉圖像中的局部特征,以此構(gòu)成壓縮感知算法中的測(cè)量矩陣,再利用壓縮感知的重構(gòu)算法計(jì)算特征的稀疏表示,在此基礎(chǔ)上進(jìn)行人臉識(shí)別。算法在AR人臉庫(kù)上進(jìn)行了抗干擾比對(duì)測(cè)試,實(shí)驗(yàn)結(jié)果驗(yàn)證了算法對(duì)光照、表情以及遮擋等干擾具有強(qiáng)的魯棒性,局部特征的約束大大降低了特征點(diǎn)的數(shù)量,有效提高了人臉識(shí)別的正確率。
關(guān)鍵詞: 壓縮感知; 人臉識(shí)別; 特征提??; 局部特征; SIFT算法
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)07-1500-05
1 概述
人臉識(shí)別憑借著直觀突出、安全可靠和智能交互等優(yōu)勢(shì)長(zhǎng)期備受研究者的關(guān)注。在過(guò)去的幾十年,人臉識(shí)別技術(shù)取得了較大的進(jìn)步,涌現(xiàn)出許多人臉識(shí)別方法。傳統(tǒng)的人臉識(shí)別方法有流行的主成分分析(Principal Component Analysis,PCA)【1】,線性判別分析(Linear Discriminant Analysis,LDA)【2】,幾何特征方法等。但是人臉識(shí)別仍然面臨著諸多亟待解決的問(wèn)題,比如數(shù)據(jù)量大、維數(shù)高、非線性等,尤其是在光照的復(fù)雜性、表情的隨機(jī)性以及遮擋等干擾因素存在下。
近年來(lái),壓縮感知(Compressive Sensing, CS)理論的興起,引起國(guó)內(nèi)外許多學(xué)者的研究。壓縮感知理論中最經(jīng)典的內(nèi)容就是稀疏表示理論。稀疏表示最早出現(xiàn)在信號(hào)領(lǐng)域,最初目的是為了用比香農(nóng)采樣定理更低的采樣率來(lái)表示和壓縮信號(hào),通過(guò)對(duì)重構(gòu)矩陣的設(shè)計(jì),構(gòu)建重構(gòu)空間,進(jìn)而再計(jì)算重構(gòu)空間上的最佳稀疏重構(gòu)系數(shù)【3-4】。Cand`es和Donoho在相關(guān)研究基礎(chǔ)上于2006年正式提出了壓縮傳感的概念【5】。
壓縮感知理論能夠很好的解決數(shù)據(jù)從高維到低維的轉(zhuǎn)換,給人臉識(shí)別領(lǐng)域開(kāi)辟一條新的途徑,引起眾多學(xué)者的研究和關(guān)注。比如,YiMa等人將壓縮感知理論和稀疏表示理論引入人臉識(shí)別領(lǐng)域,并驗(yàn)證其對(duì)光照、表情以及遮擋等情況下,人臉識(shí)別具有很好的魯棒性【6】,TanayaGuha等人通過(guò)學(xué)習(xí)過(guò)完備字典集,利用稀疏表示成功的識(shí)別了視頻中人物的物理動(dòng)作和人物的面部表情【7】,Ran He等人提出了二級(jí)非負(fù)稀疏表示算法完成了大規(guī)模的人臉識(shí)別【8】,Koji Inoue等人利用稀疏表示實(shí)現(xiàn)了在光照情況下的人臉識(shí)別,并且很好的證明了該算法的魯棒性【9】,Chih-HsuehDuan等人提出了局部稀疏表示的方法來(lái)進(jìn)行人臉識(shí)別并通過(guò)實(shí)驗(yàn)驗(yàn)證方法的有效性【10】。
2 基于局部特征約束的壓縮感知人臉識(shí)別算法構(gòu)建
2.1 壓縮感知理論介紹
2.2 特征提取
在人臉識(shí)別技術(shù)的中,特征提取是一個(gè)基本而又至關(guān)重要的環(huán)節(jié),如何提取出穩(wěn)定、有效、魯棒性的特征是人臉識(shí)別成敗的關(guān)鍵。一般來(lái)說(shuō),目前人臉的特征描述大致可以分為兩類(lèi):局部特征和全局特征。
全局特征是指其特征向量的每一維都包了人臉圖像上絕大部分的有效信息,因此反映的是人臉的整體輪廓屬性。在人臉識(shí)別中可以進(jìn)行粗匹配,但是效果不是非常顯著。而局部特征在刻畫(huà)人臉圖像方面比全局特征更加優(yōu)越,尤其是在刻畫(huà)細(xì)節(jié)方面。被認(rèn)為對(duì)光照、表情和遮擋等變化不敏感,因此近些年被廣泛的作為特征提取方法應(yīng)用在人臉識(shí)別技術(shù)中。
2.2.1 局部特征提取
局部特征反映的是人臉的細(xì)節(jié)變化,比如面部的一些器官的特點(diǎn),面部表情,邊緣輪廓,面部的奇異特征(比如傷疤,酒窩,痣等),可以進(jìn)行精細(xì)的篩選。
比較常用的局部特征包括局部二值模式(Local Binary Mode,LBP)、Gabor小波、局部非負(fù)矩陣分解(Local non-Negative Matrix Factorization,LNMF)等。就目前各人臉大數(shù)據(jù)庫(kù)測(cè)試的效果而言,Gabor小波變換被認(rèn)為是目前最有效的人臉表示方法之一。但值得一提的是在局部特征提取方法中,尺度不變特征變換(Scale Invariant Feature Transform,SIFT)特征提取算法成為了國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)和難點(diǎn)。其提取的局部特征對(duì)能對(duì)旋轉(zhuǎn)、尺度縮放、光照變化等圖像變化因素保持一定的不變性,而對(duì)遮擋、噪聲等因素也保持較好的可匹配性,從而可以實(shí)現(xiàn)差異較大的兩幅圖像之間特征的匹配。在1999年David Lowe教授總結(jié)了現(xiàn)有的基于不變量技術(shù)的特征檢測(cè)方法,并正式提出了一種局域尺度空間的、對(duì)圖像縮放、旋轉(zhuǎn)甚至仿射變換保持不變性的圖像局部特征描述算子SIFT,并在2004年完善總結(jié)【14】?;赟IFT算子的優(yōu)勢(shì),該文也采用SIFT算法進(jìn)行局部特征提取。
SIFT算法步驟如下【14】:
1)尺度空間極值點(diǎn)檢測(cè):為有效檢測(cè)尺度空間中穩(wěn)定的關(guān)鍵點(diǎn),Lowe提出一種計(jì)算差分高斯函數(shù)與圖像卷積得到圖像中極值點(diǎn)的方法。通過(guò)計(jì)算不同尺度下圖像各像素位置的相應(yīng)高斯差分函數(shù)值,并將其與相鄰像素相應(yīng)值進(jìn)行對(duì)比,若其為極值點(diǎn)(極大值或極小值),則這些像素所在位置即為有效的特征點(diǎn)。
2)精確定位穩(wěn)定的關(guān)鍵點(diǎn):通過(guò)擬和三維二次函數(shù)以精確確定關(guān)鍵點(diǎn)的位置和尺度,同時(shí)去除低對(duì)比度的關(guān)鍵點(diǎn)和不穩(wěn)定的邊緣響應(yīng)點(diǎn),以增強(qiáng)匹配穩(wěn)定性、提高抗噪聲能力。
3)關(guān)鍵點(diǎn)的方向匹配:利用關(guān)鍵點(diǎn)鄰域像素的梯度方向分布特性為每個(gè)關(guān)鍵點(diǎn)指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性。
4)生成特征點(diǎn)的描述子:為了有效地表征這些特征點(diǎn),Lowe提出先將原圖像轉(zhuǎn)化為梯度圖像,計(jì)算每個(gè)元素的梯度幅值和方向量;再將所檢測(cè)特征點(diǎn)的相應(yīng)位置映射于梯度圖像中,并設(shè)定一個(gè)有效的鄰域范圍,以區(qū)域內(nèi)元素的梯度變化幅值為權(quán)重,計(jì)算方向量的直方圖,以此作為相應(yīng)特征點(diǎn)的表征向量。
實(shí)際計(jì)算過(guò)程中,為了增強(qiáng)匹配的穩(wěn)健性,Lowe建議對(duì)每個(gè)關(guān)鍵點(diǎn)使用4×4共16個(gè)種子點(diǎn)來(lái)描述,再計(jì)算8個(gè)方向梯度,這樣即最終形成128維的SIFT特征向量。
2.2.2 局部特征約束
SIFT算法在提取人臉特征時(shí)需要搜索整個(gè)人臉圖像中的所有像素點(diǎn),并且每個(gè)搜索點(diǎn)都要計(jì)算與其對(duì)應(yīng)的高斯差分和梯度值,然后和周?chē)袼攸c(diǎn)進(jìn)行依次比較,最后用128維向量來(lái)對(duì)SIFT特征子進(jìn)行描述。這樣的計(jì)算復(fù)雜度是相當(dāng)可觀的,而且并不是所有最后計(jì)算出來(lái)的特征子對(duì)最后的人臉識(shí)別是有貢獻(xiàn)的或者說(shuō)有效的。因此為了更夠有效的減少特征提取的數(shù)量,降低計(jì)算復(fù)雜度,提取更加穩(wěn)定、更具判別性的局部特征,該文對(duì)人臉圖像的特征提取做了進(jìn)一步的約束。
1)人臉子區(qū)域分割
一般來(lái)說(shuō),一張人臉圖像中具有良好區(qū)分性的特征主要分布在人的五官,比如眼睛、鼻子、嘴巴和耳朵等,而臉頰、額頭等部位不具有明顯的區(qū)分度。因此,為了降低計(jì)算復(fù)雜度,以及特征子的數(shù)量。人臉左眼、右眼、嘴巴三個(gè)區(qū)域在人臉識(shí)別中起著重要的作用,可以說(shuō)這三個(gè)區(qū)域是人臉重要的“特征區(qū)”,因此算法中約束性的選擇人臉圖像上這三個(gè)比較具有區(qū)分度的區(qū)域進(jìn)行SIFT特征提取。該文在對(duì)人臉圖像進(jìn)行歸一化預(yù)處理之后,在每張圖像上手動(dòng)圈定了3個(gè)矩形區(qū)域,這3個(gè)區(qū)域分別包含了左眼、右眼和嘴巴。
2)人臉邊緣檢測(cè)
邊緣檢測(cè)在圖像處理和計(jì)算機(jī)視覺(jué)中是被經(jīng)常使用的一種手段,其目的就是尋找出圖像中亮度變化比較明顯的點(diǎn),在特征提取領(lǐng)域應(yīng)用尤其廣泛。圖像邊緣保留了原始圖像中相當(dāng)重要的部分信息,而又使得總的數(shù)據(jù)量減小了很多。并且剔除了可以認(rèn)為不相關(guān)的信息,保留了圖像重要的結(jié)構(gòu)屬性?;谝陨线@點(diǎn),該文試圖將邊緣檢測(cè)作為一種約束,在SIFT特征提取之前先對(duì)人臉圖像做邊緣檢測(cè),將邊緣檢測(cè)出來(lái)的點(diǎn)再做SIFT特征提取。這種約束可以有效的降低特征數(shù)據(jù)量和計(jì)算復(fù)雜度,可以大大提高人臉識(shí)別的效率。
本改進(jìn)中采用了Canny邊緣檢測(cè)算法,Canny算法是1986年提出的一個(gè)優(yōu)良的多級(jí)邊緣檢測(cè)算法,在圖像處理領(lǐng)域被廣泛的使用[15-16]。下圖是人臉圖像在采用Canny邊緣檢測(cè)前后的效果對(duì)比。
4 結(jié)論
本文在壓縮傳感理論研究的基礎(chǔ)上,深入研究了人臉局部特征提取,提出了基于局部特征約束的壓縮感知人臉識(shí)別算法。算法對(duì)局部特征進(jìn)行了針對(duì)性的約束選擇,有效的降低了特征提取的數(shù)量,提高了計(jì)算的效率。最后通過(guò)實(shí)驗(yàn)對(duì)比分析驗(yàn)證了本文算法的有效性、魯棒性。雖然本文算法比傳統(tǒng)的人臉識(shí)別算法具有較大的優(yōu)勢(shì),但離人臉識(shí)別在實(shí)際中的應(yīng)用要求還比較遠(yuǎn)。在接下來(lái)的工作中,將主要通過(guò)對(duì)特征提取的優(yōu)化選擇及改進(jìn)來(lái)進(jìn)一步的提高識(shí)別率。
參考文獻(xiàn):
[1] TURK M,PENTLAND A. Face recognition using eigenfaces[C].Proceeding of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington D C:IEEEComputer Society Press,1991:586-591.
[2] Belhumeur P,Hespanha J,KriegmanD. Eigenfaces VS. Fisherfaces: Recognition using class specific linear projection[C].IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7): 711-720.
[3] CandeE. Compressive Sampling[C] Proc. Intl Congress of Mathematicians.2006
[4] Donoho D L. For most large underdetermined systems of linear equations, the minimal l1-norm solution is also the sparsest solution. Communications on Pure and Applied Mathematics, 2006, 59(6): 797?829
[5] Donoho.Compressed sensing[J]. IEEE Trans Inform Theory,2006,52(4):1289-1306.
[6] John Wright,Allen Y. Yang,ArvindGanesh,S. Shankar Sastry, YiMa. Robust Face Recognition via Sparse Representation [J].IEEE Transactions on pattern analysis and machine intelligence, 2009,31(2):210-227
[7] TanayaGuha, Rabab Kreidieh Ward. Learning Sparse Representations for Human Action Recognition[J].IEEE Transactions on pattern analysis and machine intelligence, 2012, 34 (8): 1576-1588
[8] Ran He,Wei-Shi Zheng,Bao-Gang Hu, Xiang-Wei Kong. Two-Stage on negative Sparse Representation for Large-Scale Face Recognition[J].IEEE Transactions on neural networks and learning systems, 2013, 24(1) :35-46
[9] Koji Inoue, Yoshimitsu Kuroki. Illumination-Robust Face Recognition via Sparse Representation[C].IEEE conference of Visual Communications and Image Processing, 2011, 1-4
[10]Chih-Hsueh Duan, Chen-Kuo Chiang, Shang-Hong Lai. Face Verification With Local Sparse Representation[J].IEEE signal processing letters,2013,20(2):177-180
[11]Cand`es E, Romberg J, Tao T. Robust uncertainty principles: exact signal reconstruction from highly incomplete frequency information. IEEE Transactions on Information Theory, 2006, 52(2): 489-509
[12] Tropp J, AGilbert. Signal recovery from random measurement s via orthogonal matching pursuit[J].IEEE Trans. Inform. Theory,2007,53(12):4655-4666.
[13] Carlin,M.; Rocca,P.:Oliveri,G.;Massa,A. Multi-task Bayesian compressive sensing for direction-of-arrival estimation[C]. IEEE International Conference on,2012:1-4
[14] Lowe D G. Distinctive image features from scale-invariant key points. International Journal of Computer Vision, 2004,60(2):91-110.
[15] 周曉明,馬秋禾,肖蓉,等.一種改進(jìn)的Canny算子邊緣檢測(cè)算法[J].測(cè)繪工程, 2008,17(2):28-31
[16] 王娜,李霞.一種新的改進(jìn)Canny邊緣檢測(cè)算法[J].深圳大學(xué)學(xué)報(bào),2005,4(2):149-152.