王有剛
摘要:該文試探一種加權(quán)融合流形學(xué)習(xí)的方法進(jìn)行人臉識(shí)別,該算法通過(guò)Haar小波和局部線性嵌入(LLE)加權(quán)融合的方式來(lái)進(jìn)行人臉識(shí)別。首先通過(guò)Haar小波變換對(duì)人臉圖像進(jìn)行一級(jí)分解,得到四個(gè)子圖;然后利用LLE算法對(duì)四個(gè)子圖降維處理,并加權(quán)融合;最后利用支持向量機(jī)(SVM)進(jìn)行分類判決。通過(guò)在ORL庫(kù)中進(jìn)行實(shí)驗(yàn),結(jié)果表明,該文提出的Haar+ LLE識(shí)別效率比單獨(dú)使用主成分分析(PCA)和LLE更高效。
關(guān)鍵詞:人臉識(shí)別;流行學(xué)習(xí);局部線性嵌入算法;Haar小波;降維
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)16-3881-03
Abstract: A novel algorithm based on manifold learning is explored for face recogni- tion.The algorithm used method of Haar wavelet and Locally Linear Embedding(LLE) of weighted fusion for face recogni- tion.Firstly,the face graph is gone to be one level decomposition by Haar wavelet transform and become four subgraphs;Secondly,the four subgraphs of dimensionality are reduced by method of LLE;Finally,the features are classifyed and recognized by SVM.Experimental results on the ORL face database show that the new algorithm has a recognition ability than the algorithm of PCA and LLE.
Key words: face recognition; manifold learning; Locally Linear Embedding; Haar wavelet; algorithm; reduction dimensionlity
隨著現(xiàn)代網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,人臉識(shí)別技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用,且有好的應(yīng)用前景,特別是在身份識(shí)別和偵查或追蹤方面[1]。
但人臉識(shí)別技術(shù)發(fā)展的同時(shí),人臉圖像數(shù)據(jù)維數(shù)高和數(shù)據(jù)的非線性問(wèn)題伴隨的出現(xiàn),單一的用某一個(gè)經(jīng)典算法不能更好的解決這個(gè)問(wèn)題。該文探索了一種算法結(jié)合的方法。首先,對(duì)人臉圖像作Haar小波變換,就得到同一人臉圖像四個(gè)子圖;其次,分別用LLE算法對(duì)這四個(gè)子圖進(jìn)行人臉數(shù)據(jù)降維[2];然后,把這四部分特征按照信息量加權(quán)融合;最后,利用支持向量機(jī)(SVM)進(jìn)行分類識(shí)別[3]。
1基礎(chǔ)理論
1.1 Haar小波變換
在一般正交函數(shù)里,Haar小波函數(shù)有其優(yōu)點(diǎn)[4],表達(dá)式是最簡(jiǎn)易的正交表達(dá)式之一,有對(duì)應(yīng)的特定濾波器,且該濾波器具有不是非線性相位性、運(yùn)算快速和架構(gòu)簡(jiǎn)單等特質(zhì)。因此,對(duì)于Haar小波函數(shù)的研究,有關(guān)人員的研究越來(lái)越多且深入,而且和實(shí)際相結(jié)合應(yīng)用到生活中[5]。
對(duì)任意一幅人臉圖像進(jìn)行一層Haar小波變換,得到4個(gè)子圖像。以下具體以Lena圖來(lái)闡述,其一層分解和分解子圖分別如圖1和圖2所示。
在圖1中,四個(gè)分量所針對(duì)的側(cè)重點(diǎn)不一樣,因此所含人臉圖像數(shù)據(jù)來(lái)源和數(shù)據(jù)量都不同。LL地方分量為低頻量,包蘊(yùn)原來(lái)人臉圖像的核心信息,也就是原來(lái)人臉圖像的靠近圖;HL為垂直方向地方的分量,包蘊(yùn)人臉圖像的器官中耳朵、鼻子,還有外框輪廓等消息;LH 為水平方向的,包蘊(yùn)人臉的眼睛等面部靠人臉圖像中間部位的器官信息;HH為對(duì)角線方向的,所含信息微不足道。具體通過(guò)Lena圖說(shuō)明,其一級(jí)分化圖如圖2所示。
1.2 局部線性嵌入
局部線性嵌入(LLE)算法是2000年提出解決非線性數(shù)據(jù)經(jīng)典算法之一,其算法如下。
在LLE算法中,假如觀測(cè)數(shù)據(jù)是由N個(gè)D維實(shí)數(shù)據(jù)[Xii=1,…,N∈RD]組成,則LLE算法的具體過(guò)程如下:
① 計(jì)算K近鄰。
② 運(yùn)算再次構(gòu)建的權(quán)重系數(shù)。針對(duì)每一個(gè)觀察數(shù)據(jù)[xi],利用該數(shù)據(jù)的K個(gè)近鄰對(duì)其進(jìn)行重建,其中誤差代價(jià)函數(shù)為:
1.3 支持向量機(jī)
支持向量機(jī)(SVM)是分類識(shí)別的一種技術(shù)[6],起源于統(tǒng)計(jì)學(xué)習(xí)理論,在處理不是線性、高維數(shù)和小樣本等問(wèn)題時(shí),有很大優(yōu)勢(shì)。在用SVM進(jìn)行分類識(shí)別時(shí),重要之一就是選擇合適的支持向量機(jī)參數(shù)。根據(jù)參數(shù),提取人臉特征數(shù)據(jù),把提取的人臉特征數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,用訓(xùn)練樣本訓(xùn)練并得到支持向量機(jī)模型,即訓(xùn)練集;再把測(cè)試樣本提供給支持向量機(jī),由訓(xùn)練好的支持向量機(jī)模型給出識(shí)別結(jié)果。
2 算法實(shí)現(xiàn)
傳統(tǒng)的方法是,小波變換和局部線性嵌入提取特征的方法都是在小波分解后直接去掉高頻分量,只在分解后的低頻分量上利用LLE 算法提取人臉特征[7]。這種直接去掉高頻信息只利用低頻部分進(jìn)行分類識(shí)別的方法存在不足,這是由于小波分解后的高頻分量中包含著對(duì)識(shí)別有利的邊緣信息。在圖2中,可以從分解后的水平分量LH 和垂直分量HL 中看出明顯的邊緣信息。于是,為了獲取高效的辨認(rèn)效益,必須全面使用Haar小波分解后的有效消息。從以上所述可得,在Haar小波分解后,進(jìn)行LLE 降低維數(shù)處理時(shí)候[8],探索用一種特定的加權(quán)融合的方式進(jìn)行人臉識(shí)別的后續(xù)工作,其流程圖如圖3所示。
通過(guò)圖3可看出,該算法是將經(jīng)過(guò)一層Haar小波分解后的4個(gè)分量LL、LH、HL和HH分別進(jìn)行LLE處理,其結(jié)果是:endprint
令4個(gè)權(quán)重之和為:[η1]+[η2]+[η3]+[η4]=1。分配權(quán)重時(shí),由于低頻分量[LL']具有原圖像大部分信息,賦予大的值;[HH']具有的是對(duì)角線有關(guān)的信息,信息量最少,因此系數(shù)值賦值比其它的都??;[LH']具有眼睛等重要器官水平方向信息,同時(shí)[HL']具有耳朵等外邊緣輪廓數(shù)值方向的信息,相比較,信息量適中,由此權(quán)重值設(shè)置比[LH']小的值。
具體算法實(shí)現(xiàn)步驟是:
① 按照表達(dá)式(1),用Haar小波,對(duì)處理后待識(shí)別的圖像進(jìn)行一層分解;
② 對(duì)步驟①產(chǎn)生的分量LL、LH、HL和HH,用式(6)進(jìn)行LLE降維轉(zhuǎn)化,轉(zhuǎn)化完后,獲得四個(gè)新的分量:[LL']、[LH']、[HL']和[HH'];
③ 按照特定原則,給(8)式中系數(shù)設(shè)置值,且四個(gè)系數(shù)之后為1,用(8)式對(duì)四個(gè)分量加權(quán)融合,然后用Haar小波重構(gòu),獲得人臉數(shù)據(jù)信息Y;
④ 將Y看做原來(lái)圖的特性值,給定恰當(dāng)SVM算法的參數(shù),建立一個(gè)訓(xùn)練集模型,并把測(cè)試集放入測(cè)試,由SVM給出測(cè)試結(jié)果。
3 實(shí)驗(yàn)結(jié)果
本實(shí)驗(yàn)選用的是ORL人臉數(shù)據(jù)庫(kù),對(duì)于ORL人臉庫(kù),該庫(kù)由Olivetti實(shí)驗(yàn)室完成,拍攝的是一系列人臉圖像,整體有40個(gè)不一樣性別和不一樣歲數(shù)及不一樣種族的人臉圖象,每一人10幅圖象,總計(jì)是400幅圖象,每一個(gè)人臉圖像面部表情和局部細(xì)節(jié)各不相同,人臉姿勢(shì)也是有變化的。在進(jìn)行試驗(yàn)里,肯定ORL庫(kù)里二十個(gè)人,并每一個(gè)人臉圖象里隨便得到幅作鍛煉集,5幅作試驗(yàn)集,試驗(yàn)集和鍛煉集各有100幅人臉圖象。
為了便于比較,該文對(duì)LLE算法、PCA算法和Haar小波+LLE算法(本文算法:Haar小波提取人臉特征后再使用LLE算法進(jìn)行變換,然后用加權(quán)融合)同時(shí)進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)如表1所示。每組數(shù)據(jù)隨機(jī)重復(fù)300次后得到的平均值。
其中,d=50表示應(yīng)用LLE、PCA和Haa+LLE算法降維后數(shù)據(jù)維數(shù)為50。
從表1實(shí)驗(yàn)結(jié)果可以看出,當(dāng)數(shù)據(jù)維數(shù)降為50時(shí),該文提出的Haa +LLE算法與PCA、LLE算法相比,識(shí)率分別提高了:4.44%和5.25%。
以上是維數(shù)降到d=50的情況,圖4是維數(shù)降到10到100維的情況。
從表1和圖4可以看出,在一樣的試驗(yàn)環(huán)境里,該文探索的LLE+Haar方法的識(shí)率有區(qū)別的高于LLE和PCA方法的辨認(rèn)率,同時(shí)標(biāo)準(zhǔn)差值小,說(shuō)明識(shí)別效果好,算法穩(wěn)定性更好。以上進(jìn)步說(shuō)明,該文探究的LLE+Haar算法的比其它兩種算法辨認(rèn)更高效。
4 結(jié)束語(yǔ)
本文Haar+LLE算法是一種Haar小波算法和LLE算法相結(jié)合的一種人臉識(shí)別算法。該算法將人臉圖像經(jīng)過(guò)Haar小波變換后得到多個(gè)分解子圖像,把每個(gè)子圖均看成獨(dú)立的樣本,相當(dāng)于把一個(gè)樣本變成了多個(gè)樣本;然后利用局部嵌入(LLE )算法進(jìn)行約簡(jiǎn)降維處理,加權(quán)融合一個(gè)新的樣本;最后,利用支持向量機(jī)(SVM)進(jìn)行識(shí)別。
實(shí)驗(yàn)中, 在ORL人臉庫(kù)上對(duì)本文提出的Haar+LLE算法和LLE算法、PCA算法進(jìn)行了比較,結(jié)果表明,該文算法性能更優(yōu)。
參考文獻(xiàn):
[1] 鄧偉洪.高精度人臉識(shí)別算法研究[D].北京:北京郵電大學(xué),2009.
[2] Liu C.Capitalize on dimensionality increasing techniques for improving face recognition grand challenge performance [J].IEEE Trans Pattern Analysis and Machine Intelligence,2006, 28(5): 725-737.
[3] Cristianini N,Taylor J S.An introduction to support vector machine[M].Carnridge: Carnridge University Press,2000.
[4] 甘玲,朱江.擴(kuò)展Haar特征檢測(cè)人眼的方法[J].電子科技大學(xué)學(xué)報(bào),2010,39(2):247-250.
[5] 劉貴忠,邸雙亮.小波分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社,1997.
[6] Scholkopf B,Smole Alearning with kernels:support vector machines,regularization, optimaza tion and beyond[M][SI]:MIT Press,2002.
[7] 李華勝,楊樺,袁保中.人臉識(shí)別中的特征提取[J].北方交通大學(xué)學(xué)報(bào),2001,25(2):18-21.
[8] 李勇周,羅大勇.人臉識(shí)別中基于流行學(xué)習(xí)的子空間特征提取方法研究[D].長(zhǎng)沙:中南大學(xué),2009.endprint
令4個(gè)權(quán)重之和為:[η1]+[η2]+[η3]+[η4]=1。分配權(quán)重時(shí),由于低頻分量[LL']具有原圖像大部分信息,賦予大的值;[HH']具有的是對(duì)角線有關(guān)的信息,信息量最少,因此系數(shù)值賦值比其它的都??;[LH']具有眼睛等重要器官水平方向信息,同時(shí)[HL']具有耳朵等外邊緣輪廓數(shù)值方向的信息,相比較,信息量適中,由此權(quán)重值設(shè)置比[LH']小的值。
具體算法實(shí)現(xiàn)步驟是:
① 按照表達(dá)式(1),用Haar小波,對(duì)處理后待識(shí)別的圖像進(jìn)行一層分解;
② 對(duì)步驟①產(chǎn)生的分量LL、LH、HL和HH,用式(6)進(jìn)行LLE降維轉(zhuǎn)化,轉(zhuǎn)化完后,獲得四個(gè)新的分量:[LL']、[LH']、[HL']和[HH'];
③ 按照特定原則,給(8)式中系數(shù)設(shè)置值,且四個(gè)系數(shù)之后為1,用(8)式對(duì)四個(gè)分量加權(quán)融合,然后用Haar小波重構(gòu),獲得人臉數(shù)據(jù)信息Y;
④ 將Y看做原來(lái)圖的特性值,給定恰當(dāng)SVM算法的參數(shù),建立一個(gè)訓(xùn)練集模型,并把測(cè)試集放入測(cè)試,由SVM給出測(cè)試結(jié)果。
3 實(shí)驗(yàn)結(jié)果
本實(shí)驗(yàn)選用的是ORL人臉數(shù)據(jù)庫(kù),對(duì)于ORL人臉庫(kù),該庫(kù)由Olivetti實(shí)驗(yàn)室完成,拍攝的是一系列人臉圖像,整體有40個(gè)不一樣性別和不一樣歲數(shù)及不一樣種族的人臉圖象,每一人10幅圖象,總計(jì)是400幅圖象,每一個(gè)人臉圖像面部表情和局部細(xì)節(jié)各不相同,人臉姿勢(shì)也是有變化的。在進(jìn)行試驗(yàn)里,肯定ORL庫(kù)里二十個(gè)人,并每一個(gè)人臉圖象里隨便得到幅作鍛煉集,5幅作試驗(yàn)集,試驗(yàn)集和鍛煉集各有100幅人臉圖象。
為了便于比較,該文對(duì)LLE算法、PCA算法和Haar小波+LLE算法(本文算法:Haar小波提取人臉特征后再使用LLE算法進(jìn)行變換,然后用加權(quán)融合)同時(shí)進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)如表1所示。每組數(shù)據(jù)隨機(jī)重復(fù)300次后得到的平均值。
其中,d=50表示應(yīng)用LLE、PCA和Haa+LLE算法降維后數(shù)據(jù)維數(shù)為50。
從表1實(shí)驗(yàn)結(jié)果可以看出,當(dāng)數(shù)據(jù)維數(shù)降為50時(shí),該文提出的Haa +LLE算法與PCA、LLE算法相比,識(shí)率分別提高了:4.44%和5.25%。
以上是維數(shù)降到d=50的情況,圖4是維數(shù)降到10到100維的情況。
從表1和圖4可以看出,在一樣的試驗(yàn)環(huán)境里,該文探索的LLE+Haar方法的識(shí)率有區(qū)別的高于LLE和PCA方法的辨認(rèn)率,同時(shí)標(biāo)準(zhǔn)差值小,說(shuō)明識(shí)別效果好,算法穩(wěn)定性更好。以上進(jìn)步說(shuō)明,該文探究的LLE+Haar算法的比其它兩種算法辨認(rèn)更高效。
4 結(jié)束語(yǔ)
本文Haar+LLE算法是一種Haar小波算法和LLE算法相結(jié)合的一種人臉識(shí)別算法。該算法將人臉圖像經(jīng)過(guò)Haar小波變換后得到多個(gè)分解子圖像,把每個(gè)子圖均看成獨(dú)立的樣本,相當(dāng)于把一個(gè)樣本變成了多個(gè)樣本;然后利用局部嵌入(LLE )算法進(jìn)行約簡(jiǎn)降維處理,加權(quán)融合一個(gè)新的樣本;最后,利用支持向量機(jī)(SVM)進(jìn)行識(shí)別。
實(shí)驗(yàn)中, 在ORL人臉庫(kù)上對(duì)本文提出的Haar+LLE算法和LLE算法、PCA算法進(jìn)行了比較,結(jié)果表明,該文算法性能更優(yōu)。
參考文獻(xiàn):
[1] 鄧偉洪.高精度人臉識(shí)別算法研究[D].北京:北京郵電大學(xué),2009.
[2] Liu C.Capitalize on dimensionality increasing techniques for improving face recognition grand challenge performance [J].IEEE Trans Pattern Analysis and Machine Intelligence,2006, 28(5): 725-737.
[3] Cristianini N,Taylor J S.An introduction to support vector machine[M].Carnridge: Carnridge University Press,2000.
[4] 甘玲,朱江.擴(kuò)展Haar特征檢測(cè)人眼的方法[J].電子科技大學(xué)學(xué)報(bào),2010,39(2):247-250.
[5] 劉貴忠,邸雙亮.小波分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社,1997.
[6] Scholkopf B,Smole Alearning with kernels:support vector machines,regularization, optimaza tion and beyond[M][SI]:MIT Press,2002.
[7] 李華勝,楊樺,袁保中.人臉識(shí)別中的特征提取[J].北方交通大學(xué)學(xué)報(bào),2001,25(2):18-21.
[8] 李勇周,羅大勇.人臉識(shí)別中基于流行學(xué)習(xí)的子空間特征提取方法研究[D].長(zhǎng)沙:中南大學(xué),2009.endprint
令4個(gè)權(quán)重之和為:[η1]+[η2]+[η3]+[η4]=1。分配權(quán)重時(shí),由于低頻分量[LL']具有原圖像大部分信息,賦予大的值;[HH']具有的是對(duì)角線有關(guān)的信息,信息量最少,因此系數(shù)值賦值比其它的都小;[LH']具有眼睛等重要器官水平方向信息,同時(shí)[HL']具有耳朵等外邊緣輪廓數(shù)值方向的信息,相比較,信息量適中,由此權(quán)重值設(shè)置比[LH']小的值。
具體算法實(shí)現(xiàn)步驟是:
① 按照表達(dá)式(1),用Haar小波,對(duì)處理后待識(shí)別的圖像進(jìn)行一層分解;
② 對(duì)步驟①產(chǎn)生的分量LL、LH、HL和HH,用式(6)進(jìn)行LLE降維轉(zhuǎn)化,轉(zhuǎn)化完后,獲得四個(gè)新的分量:[LL']、[LH']、[HL']和[HH'];
③ 按照特定原則,給(8)式中系數(shù)設(shè)置值,且四個(gè)系數(shù)之后為1,用(8)式對(duì)四個(gè)分量加權(quán)融合,然后用Haar小波重構(gòu),獲得人臉數(shù)據(jù)信息Y;
④ 將Y看做原來(lái)圖的特性值,給定恰當(dāng)SVM算法的參數(shù),建立一個(gè)訓(xùn)練集模型,并把測(cè)試集放入測(cè)試,由SVM給出測(cè)試結(jié)果。
3 實(shí)驗(yàn)結(jié)果
本實(shí)驗(yàn)選用的是ORL人臉數(shù)據(jù)庫(kù),對(duì)于ORL人臉庫(kù),該庫(kù)由Olivetti實(shí)驗(yàn)室完成,拍攝的是一系列人臉圖像,整體有40個(gè)不一樣性別和不一樣歲數(shù)及不一樣種族的人臉圖象,每一人10幅圖象,總計(jì)是400幅圖象,每一個(gè)人臉圖像面部表情和局部細(xì)節(jié)各不相同,人臉姿勢(shì)也是有變化的。在進(jìn)行試驗(yàn)里,肯定ORL庫(kù)里二十個(gè)人,并每一個(gè)人臉圖象里隨便得到幅作鍛煉集,5幅作試驗(yàn)集,試驗(yàn)集和鍛煉集各有100幅人臉圖象。
為了便于比較,該文對(duì)LLE算法、PCA算法和Haar小波+LLE算法(本文算法:Haar小波提取人臉特征后再使用LLE算法進(jìn)行變換,然后用加權(quán)融合)同時(shí)進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)如表1所示。每組數(shù)據(jù)隨機(jī)重復(fù)300次后得到的平均值。
其中,d=50表示應(yīng)用LLE、PCA和Haa+LLE算法降維后數(shù)據(jù)維數(shù)為50。
從表1實(shí)驗(yàn)結(jié)果可以看出,當(dāng)數(shù)據(jù)維數(shù)降為50時(shí),該文提出的Haa +LLE算法與PCA、LLE算法相比,識(shí)率分別提高了:4.44%和5.25%。
以上是維數(shù)降到d=50的情況,圖4是維數(shù)降到10到100維的情況。
從表1和圖4可以看出,在一樣的試驗(yàn)環(huán)境里,該文探索的LLE+Haar方法的識(shí)率有區(qū)別的高于LLE和PCA方法的辨認(rèn)率,同時(shí)標(biāo)準(zhǔn)差值小,說(shuō)明識(shí)別效果好,算法穩(wěn)定性更好。以上進(jìn)步說(shuō)明,該文探究的LLE+Haar算法的比其它兩種算法辨認(rèn)更高效。
4 結(jié)束語(yǔ)
本文Haar+LLE算法是一種Haar小波算法和LLE算法相結(jié)合的一種人臉識(shí)別算法。該算法將人臉圖像經(jīng)過(guò)Haar小波變換后得到多個(gè)分解子圖像,把每個(gè)子圖均看成獨(dú)立的樣本,相當(dāng)于把一個(gè)樣本變成了多個(gè)樣本;然后利用局部嵌入(LLE )算法進(jìn)行約簡(jiǎn)降維處理,加權(quán)融合一個(gè)新的樣本;最后,利用支持向量機(jī)(SVM)進(jìn)行識(shí)別。
實(shí)驗(yàn)中, 在ORL人臉庫(kù)上對(duì)本文提出的Haar+LLE算法和LLE算法、PCA算法進(jìn)行了比較,結(jié)果表明,該文算法性能更優(yōu)。
參考文獻(xiàn):
[1] 鄧偉洪.高精度人臉識(shí)別算法研究[D].北京:北京郵電大學(xué),2009.
[2] Liu C.Capitalize on dimensionality increasing techniques for improving face recognition grand challenge performance [J].IEEE Trans Pattern Analysis and Machine Intelligence,2006, 28(5): 725-737.
[3] Cristianini N,Taylor J S.An introduction to support vector machine[M].Carnridge: Carnridge University Press,2000.
[4] 甘玲,朱江.擴(kuò)展Haar特征檢測(cè)人眼的方法[J].電子科技大學(xué)學(xué)報(bào),2010,39(2):247-250.
[5] 劉貴忠,邸雙亮.小波分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社,1997.
[6] Scholkopf B,Smole Alearning with kernels:support vector machines,regularization, optimaza tion and beyond[M][SI]:MIT Press,2002.
[7] 李華勝,楊樺,袁保中.人臉識(shí)別中的特征提取[J].北方交通大學(xué)學(xué)報(bào),2001,25(2):18-21.
[8] 李勇周,羅大勇.人臉識(shí)別中基于流行學(xué)習(xí)的子空間特征提取方法研究[D].長(zhǎng)沙:中南大學(xué),2009.endprint