摘 要:為了提高傳統(tǒng)的核主元分析的識(shí)別率,論文提出了一種基于再生核的KPCA(Kernel Principal Component Analysis,KPCA)提取人臉特征.使用ORL人臉數(shù)據(jù)庫(kù)進(jìn)行實(shí)驗(yàn),并且與傳統(tǒng)的KPCA在識(shí)別率上進(jìn)行了比較.實(shí)驗(yàn)數(shù)據(jù)表明,改進(jìn)的KPCA不僅能夠抽取非線性數(shù)據(jù)而且有著比傳統(tǒng)的KPCA有更好的識(shí)別效果.
關(guān)鍵詞:主元分析;特征臉;人臉識(shí)別
DOI:10.16640/j.cnki.37-1222/t.2015.21.204
0 引言
Scholkopf等人首先提出了核主元分析,由于KPCA采用了非線性特征量,所以識(shí)別效果會(huì)比PCA更好.但單一使用的核函數(shù)會(huì)使得特征提取的數(shù)據(jù)有一定的缺陷和不足.因此,文章對(duì)單一核函數(shù)進(jìn)行改進(jìn)提出了一種再生核KPCA的人臉識(shí)別。
1 核主元分析方法
核主元分析方法的基本思路是通過(guò)一個(gè)非線性映射函數(shù),將輸入數(shù)據(jù) xk(k=1,...,l)(l為輸入數(shù)據(jù)的個(gè)數(shù)) 映射到一個(gè)高維特征空間F ,再在F空間上進(jìn)行線性主元分析.
輸入數(shù)據(jù)被映射為xk(k=1,...,L),假設(shè)
(7)
由于消掉一個(gè)常數(shù)對(duì)于求特征向量沒(méi)有影響,因此只要算出k的特征值和特征向量就可以算出(5)式的解。
設(shè)k的特征值為,相應(yīng)的特征向量為,并設(shè)是第一個(gè)不為零的特征值。由于F中的特征向量需要規(guī)范化,即
(8)
因此根據(jù)(7)和(8)式得
主元提取的目的就是計(jì)算測(cè)試樣本在特征向量上的映射。設(shè)x是一個(gè)測(cè)試樣本點(diǎn),在F中的映射為,則
(11)
傳統(tǒng)PCA提取主元的個(gè)數(shù)最多為輸入向量的維數(shù),但是在KPCA中,如果采樣數(shù)超過(guò)輸入維數(shù)時(shí),主元提取的個(gè)數(shù)可以比輸入維數(shù)多。 如果(3)式不成立時(shí),需要對(duì)映射進(jìn)行調(diào)整,設(shè)
2 再生核函數(shù)
2.1 再生核定義
設(shè)X是一個(gè)抽象集,H是定義在X上的實(shí)值或復(fù)值函數(shù)f的Hilbert空間.X*X在域上的函數(shù)K(x,y)稱(chēng)為再生核, K(x,y)滿(mǎn)足以下2個(gè)特性:
如果H是一個(gè)具有再生核的可分的Hilbert函數(shù)空間,并且H中的正交基為,那么H中的再生核為:
(15)
文章介紹了一種采用δ函數(shù)在H1(R)和H2(R)的2種空間上計(jì)算再生核的技術(shù)。
令K1(X)是算子的基本解,滿(mǎn)足內(nèi)積定義,
的H1(R)的再生核是K1(x-y).令K2(X)
是算子的基本解,滿(mǎn)足內(nèi)積定義,
的H2(R)上再生核是K2(x-y)。
2.2 Hn(R)核函數(shù)設(shè)計(jì)
3 實(shí)驗(yàn)結(jié)果及分析
(1)數(shù)據(jù)庫(kù)描述。實(shí)驗(yàn)環(huán)境:WindowsXP+Matlab7.0,計(jì)算機(jī)的CPU:Dual Core Processor2.4 GHz,1.87GB內(nèi)存.在實(shí)驗(yàn)中使用的是ORL人臉庫(kù),該數(shù)據(jù)庫(kù)包含了40個(gè)人,每人采集10張分辨率為112×92的黑白照片,一共400張灰度圖像。該數(shù)據(jù)庫(kù)能夠充分地反應(yīng)了同一個(gè)人不同人臉圖像的差別。
(2)分類(lèi)效果的比較與分析。為了比較分類(lèi)效果,本實(shí)驗(yàn)取ORL數(shù)據(jù)庫(kù)中的每人任意5幅圖像作為訓(xùn)練樣本,其他5幅圖像作為測(cè)試樣本.然后對(duì)傳統(tǒng)的KPCA和使用再生核改進(jìn)的KPCA分別抽取每個(gè)樣本的前兩個(gè)最佳鑒別特征進(jìn)行分析比較。從圖1可看出傳統(tǒng)KPCA只能較好識(shí)別同一人圖片的差異,而對(duì)不同人之間的差異識(shí)別效果較差.從圖2可看出使用再生核改進(jìn)的KPCA不但具有很好的類(lèi)內(nèi)可分性,類(lèi)間散度也很好。
4 結(jié)論
利用H'(R)核函數(shù)和卷積算子可以設(shè)計(jì)出Hn(R)再生核函數(shù).實(shí)驗(yàn)結(jié)果表明:再生核函數(shù)其分類(lèi)效果比傳統(tǒng)的KPCA要好,識(shí)別率較穩(wěn)定,且時(shí)間復(fù)雜度大幅降低.由于,在采用核函數(shù)方法進(jìn)行人臉識(shí)別時(shí),使用預(yù)先選定的某種核函數(shù) ,往往不是最佳的.因此,通過(guò)設(shè)計(jì)再生核函數(shù),結(jié)合具體的工程實(shí)際應(yīng)用,可以選出較為合適的核函數(shù)用于人臉識(shí)別.
參考文獻(xiàn):
[1]Daoqiang Zhang,Zhi-Hua Zhou,and Songcan Chen, Diagonal principal component analysis for facerecognition[J].PatternRecognition,2006,39(1):140-142.
[2]Congde Lu,Taiyi Zhang,Xingzhong Du et al, “A Robust Kernel PCA Algorithm”[N], Proceedings of the Third International Conference on Machine Learning and Cybernetics,2004.
[3]A.D.Back,and A.S.Weigend,A first application of independent component analysis to extracting strueture from stock returns[J].International Journal on Neural Systems,1998,8(4):473-484.
[4]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2000:450-490.
作者簡(jiǎn)介:吳林(1983-),男,福建莆田人,碩士,講師,研究方向:模式識(shí)別。endprint