焦淑紅,孫志帥
(哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱 150001)
?
基于GPCA的KNNY與SVM融合的人臉識(shí)別方法
焦淑紅,孫志帥
(哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱150001)
摘要針對(duì)K近鄰和支持向量機(jī)人臉識(shí)別率較低的問(wèn)題,采用一種KNN和SVM融合的識(shí)別方法。提出了一種Gabor小波和主成分分析進(jìn)行人臉特征提取,KNN-SVM進(jìn)行分類(lèi)的人臉識(shí)別方法。基于ORL和YALE人臉庫(kù)中進(jìn)行實(shí)驗(yàn),結(jié)果表明該算法較KNN和SVM中任何一個(gè)的識(shí)別率都要高,且識(shí)別率最高可達(dá)到98.89%。
關(guān)鍵詞K近鄰;支持向量機(jī);Gabor小波;PCA;人臉識(shí)別
人臉識(shí)別是通過(guò)計(jì)算機(jī)對(duì)人臉進(jìn)行學(xué)習(xí)然后利用特征進(jìn)行識(shí)別,作為生物識(shí)別的重要分支,其具有諸多優(yōu)點(diǎn),并在出入控制、公共安全、刑偵破案和人機(jī)交互等方面具有重要的應(yīng)用[1]。
利用Gabor小波進(jìn)行特征提取時(shí),能克服光照、角度、尺度等全局干擾對(duì)識(shí)別結(jié)果的影響[2],但是會(huì)造成維數(shù)災(zāi)難,即使維數(shù)大幅度提高,增加計(jì)算量,可通過(guò)均勻采樣和主成分分析(Principal Component Analysis,PCA)進(jìn)行降維,降低計(jì)算量。
K近鄰(K Nearest Neighbors,KNN)和支持向量機(jī)(Support Vector Machine,SVM)是人臉識(shí)別過(guò)程中常用的識(shí)別分類(lèi)方法,其具有自身的特點(diǎn),通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)對(duì)于相同的樣本,同樣的識(shí)別目標(biāo),采用不同的分類(lèi)方法識(shí)別率是不同的,識(shí)別出來(lái)的目標(biāo)也不完全相同的,有交叉的部分,也有不同的部分。進(jìn)而提出了一種KNN和SVM相互融合的分類(lèi)方法,使得兼有兩者的識(shí)別優(yōu)勢(shì),提高了識(shí)別率,實(shí)驗(yàn)結(jié)果證明了其算法的有效性。
1Gabor小波、KNN和SVM分類(lèi)器簡(jiǎn)介
1.1Gabor小波算法
Gabor小波以其圖像處理上的獨(dú)特的優(yōu)勢(shì),近年來(lái)得到了廣泛應(yīng)用。其擁有多尺度和多方向特點(diǎn)的同時(shí),也容易造成維數(shù)大幅度增加。2D-Gabor小波和核函數(shù)定義為
(1)
將人臉圖像和Gabor小波核函數(shù)進(jìn)行卷積,則每幅圖便可等到40幅Gabor紋理圖像,這樣圖像的維數(shù)大幅增加,進(jìn)而計(jì)算量大幅增加,需要進(jìn)行降維。降維方法一般是均勻采樣和主成分分析。采樣因子的數(shù)量影響最終的識(shí)別率,PCA降維過(guò)程特征向量的數(shù)量同樣也影響最終的識(shí)別率,最優(yōu)的結(jié)果均可通過(guò)實(shí)驗(yàn)獲得,但這個(gè)數(shù)字具有一定局限性,針對(duì)不同的人臉庫(kù),取值也不同。
1.2KNN算法
K近鄰(KNN)是模式識(shí)別方法中常用和簡(jiǎn)單的方法之一,是Cover和Hart于1968年提出[4]。K近鄰是1NN的推廣,識(shí)別的基本過(guò)程是選取待識(shí)別目標(biāo)和訓(xùn)練目標(biāo)之間的距離最小的若干個(gè),根據(jù)訓(xùn)練目標(biāo)的類(lèi)別對(duì)待識(shí)別目標(biāo)進(jìn)行分類(lèi)。KNN算法如下
(2)
其中,f′(zr)是對(duì)f(zr)的估計(jì),其是距離zr最近的m個(gè)訓(xùn)練樣本的f值
(3)
其中,z是n維空間中的點(diǎn);f(zr)表示zr的所屬類(lèi)別;γ(a,b)是類(lèi)別判別函數(shù)。
1.3SVM算法
支持向量機(jī)是CorinnaCortes和Vapnik于1995年首先提出的,其在解決小樣本、非線性和高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì)[5]。其是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和機(jī)結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上,根據(jù)有限樣本信息在模模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,以獲得最佳的推廣能力。簡(jiǎn)而言之,就是將樣本通過(guò)某種非線性函數(shù)映射到一個(gè)線性可分的空間,且尋求這一線性可分空間的最優(yōu)線性可分超平面[6]。其判別函數(shù)為
(4)
其中,h(zi,zj)是核函數(shù),核函數(shù)需滿(mǎn)足的條件φ(zi)·φ(zi)=h(zi,zj),φ(z)為任意函數(shù)。
2GPCA的KNN和SVM融合人臉識(shí)別算法
K近鄰識(shí)別算法是最簡(jiǎn)單的算法之一,其具有良好的定位性能,但識(shí)別率較低[7]。SVM算法具有較好的識(shí)別率,尤其在解決小樣本問(wèn)題上具有特別的優(yōu)勢(shì),但識(shí)別分類(lèi)時(shí)間較長(zhǎng),用KNN進(jìn)行范圍定位,然后用SVM進(jìn)行精確識(shí)別,達(dá)到優(yōu)勢(shì)的互補(bǔ),同時(shí)也提高了識(shí)別率[8]。具體流程如下:(1)利用Gabor小波對(duì)人臉進(jìn)行特征提取;(2)對(duì)Gabor特征進(jìn)行采樣降維;(3)對(duì)采樣降維后的特征進(jìn)行PCA再次降維;(4)將得到的特征矩陣進(jìn)行KNN范圍定位,選出最小的K個(gè)訓(xùn)練樣本;(5)利用SVM將待識(shí)別目標(biāo)和定位出的K個(gè)訓(xùn)練樣本進(jìn)行分類(lèi)識(shí)別。
3實(shí)驗(yàn)結(jié)果分析
在ORL和YALE人臉庫(kù)中,在不同的特征向量的個(gè)數(shù)的情況下分別進(jìn)行6次樣本實(shí)驗(yàn),每次訓(xùn)練樣本都選5個(gè),6次實(shí)驗(yàn)求平均值,進(jìn)行對(duì)此。
首先通過(guò)兩組實(shí)驗(yàn),選出最優(yōu)的K值,實(shí)驗(yàn)結(jié)果如下。
表1 ORL庫(kù)中K值對(duì)識(shí)別率的影響
表2 YALE庫(kù)中K值對(duì)識(shí)別率的影響
這兩組實(shí)驗(yàn)結(jié)果分別在ORL和YALE人臉庫(kù)中得到,特征向量的個(gè)數(shù)都為前95%,即0.95×199個(gè),通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),K取2為最佳。
然后分別在ORL和YALE人臉庫(kù)中進(jìn)行6次實(shí)驗(yàn)求取識(shí)別率的平均值,6次實(shí)驗(yàn)的訓(xùn)練樣本不相同,但是訓(xùn)練樣本個(gè)數(shù)定位5。Gabor濾波采用5尺度,8方向。在ORL人臉庫(kù)中,共40人,每人5幅進(jìn)行訓(xùn)練,剩余5幅進(jìn)行識(shí)別,均勻采樣因子為8×4,采樣后的維數(shù)是322;在YALE人臉庫(kù)中,共15人,每人5幅進(jìn)行訓(xùn)練,剩余6幅進(jìn)行識(shí)別,均勻采樣因子為5×10,采樣后的維數(shù)是200;SVM選取高斯核,設(shè)定標(biāo)準(zhǔn)差θ=0.007 8,懲罰因子ξ=128,實(shí)驗(yàn)結(jié)果如下。
圖1和圖2中的特征值前百分比表示的是特征向量的個(gè)數(shù),即特征值降序排列,取前百分之多少,在ORL人臉庫(kù)中轉(zhuǎn)換為特征向量的個(gè)數(shù)為:百分比×199;在YALE人臉庫(kù)中轉(zhuǎn)換為特征向量的個(gè)數(shù)為:百分比×75。通過(guò)實(shí)驗(yàn)對(duì)比,發(fā)現(xiàn)KNN和SVM融合的識(shí)別算法確實(shí)比其中任意一個(gè)識(shí)別算法的識(shí)別率高,且識(shí)別率較穩(wěn)定,不會(huì)出現(xiàn)較大的折點(diǎn),使兩種分類(lèi)識(shí)別算法進(jìn)行了優(yōu)勢(shì)互補(bǔ),在人臉識(shí)別方面表現(xiàn)了其良好的性能。
圖1 基于GPCA在ORL庫(kù)中3種識(shí)別算法平均識(shí)別率對(duì)比
圖2 基于GPCA在YALE庫(kù)中3種識(shí)別算法平均識(shí)別率對(duì)比
表3和表4為在兩個(gè)人臉庫(kù)中分別6次實(shí)驗(yàn)結(jié)果的最大識(shí)別率對(duì)比。
表3 ORL庫(kù)中不同方法的識(shí)別率對(duì)比
表4 YALE庫(kù)中不同方法的識(shí)別率對(duì)比
通過(guò)在ORL和YALE人臉庫(kù)中實(shí)驗(yàn)結(jié)果數(shù)據(jù)對(duì)比發(fā)現(xiàn),本文的人臉識(shí)別算法比較穩(wěn)定,而且最高識(shí)別率也有優(yōu)勢(shì)。
4結(jié)束語(yǔ)
本文研究了基于Gabor+PCA人臉特征提取進(jìn)行KNN
和SVM融合的識(shí)別方法,利用KNN進(jìn)行范圍定位,然后通過(guò)SVM精確分類(lèi)識(shí)別,達(dá)到優(yōu)勢(shì)的互補(bǔ),提高了識(shí)別率[9-10]。通過(guò)實(shí)驗(yàn)結(jié)果表明,KNN進(jìn)行范圍定位時(shí),K值取2最佳,核函數(shù)取高斯函數(shù),設(shè)定標(biāo)準(zhǔn)差θ=0.007 8,懲罰因子ξ=128。在ORL人臉庫(kù)中均勻采樣因子為8×4,最高識(shí)別率可達(dá)98%;在YALE人臉庫(kù)中均勻采樣因子為5×10,最高識(shí)別率可達(dá)98.89%,其識(shí)別優(yōu)勢(shì)明顯。
參考文獻(xiàn)
[1]方文俊.基于Gabor小波變換的熱紅外人臉識(shí)別研究[D].合肥:安徽大學(xué),2014.
[2]王憲,陸友桃,宋書(shū)林,等.基于Gabor小波變化與分塊PCA的人臉識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(3):176-179.
[3]葉超.基于Gabor小波和SVM的人臉識(shí)別算法研究[D].太原:中北大學(xué),2014.
[4]Vapnik.The nature of statistical learning theory[M].Berlin:Springer Verlag,1999.
[5]Vapnik V N.Estimation of dependencies based on empirical data[R].Berlin:Springer Verlag,1982.
[6]曾夢(mèng)璐,王晅,石林楓.基于Contourlet-NMF和SVM的近紅外人臉識(shí)別方法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(12):229-232.
[7]陳麗,陳靜.基于支持向量機(jī)和k-近鄰分類(lèi)器的多特征融合方法[J].計(jì)算機(jī)應(yīng)用,2009,29(3):833-835.
[8]張建明,楊忠,李巍.改進(jìn)KNN-SVM的性別識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(4):177-179.
[9]侯玉婷.基于SVM-KNN的特征自適應(yīng)加權(quán)自然圖像分類(lèi)研究[D].西安:西北大學(xué),2014.
[10]穆新亮.基于混合核函數(shù)的快速KPCA人臉識(shí)別算法[J].電子科技,2015,28(2):46-50
《電子科技》歡迎投稿
《電子科技》雜志(月刊),設(shè)置欄目有:電子·電路、協(xié)議·算法及仿真、圖像·編碼與軟件、保密及網(wǎng)絡(luò)安全、光電·材料、專(zhuān)題綜述等。歡迎業(yè)界專(zhuān)家、教授、學(xué)者及工程技術(shù)人員、教師、學(xué)生投稿。來(lái)稿應(yīng)以反映當(dāng)前國(guó)內(nèi)外電子科學(xué)技術(shù)領(lǐng)域中的先進(jìn)理論、創(chuàng)新成果及發(fā)展趨勢(shì),并有實(shí)際的應(yīng)用背景,以及相應(yīng)的實(shí)驗(yàn)結(jié)果。
投稿請(qǐng)登錄:www.dianzikeji.org聯(lián)系電話:029-88202440
Face Recognition Based GPCA of KNN and SVM Fusion
JIAO Shuhong,SUN Zhishuai
(School of Information and Communications Engineering,Harbin Engineering University,Harbin 150001,China)
AbstractIn view of the poor face recognition rate of the K Nearest neighbor and support vector machine (SVM),a KNN and SVM fusion recognition method is proposed with a Gabor wavelet and principal component analysis (PCA) for face feature extraction and KNN-SVM classification method for face recognition.Experiments based on ORL and YALE face database show that the proposed algorithm offers a recognition rate up to 98.89%,higher than both KNN and SVM.
KeywordsKNN;SVM;Gabor wavelet;PCA;face recognition
中圖分類(lèi)號(hào)TP391.41
文獻(xiàn)標(biāo)識(shí)碼A
文章編號(hào)1007-7820(2016)02-074-03
doi:10.16180/j.cnki.issn1007-7820.2016.02.019
作者簡(jiǎn)介:焦淑紅(1966—),女,教授,博士生導(dǎo)師。研究方向:寬帶信號(hào)檢測(cè)等。孫志帥(1988—),男,碩士研究生。研究方向:人臉識(shí)別。
收稿日期:2015- 07- 03