国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

PCA算法在人臉識別中的應(yīng)用研究

2016-03-30 12:59:53王志楊劉金龍唐子賢
科技視界 2016年1期
關(guān)鍵詞:主成分分析特征向量人臉識別

王志楊 劉金龍 唐子賢

【摘 要】特征臉方法是從主成分分析導(dǎo)出的一種人臉識別技術(shù)。本文首先介紹K-L變換和PCA的原理,然后描述特征臉的方法的流程及分類判別方法,最后介紹了提高PCA算法效率的分組PCA算法。這些算法為結(jié)合支持向量機(jī)進(jìn)行人臉識別提供了依據(jù)。

【關(guān)鍵詞】人臉識別;特征臉;特征向量;主成分分析;K-L變換

【Abstract】The method of eigen face is a face recognition technology derived from principal component analysis. This paper first introduces K-L transform and the principle of PCA, then describes the flow of the method of eigen face and the method of classification and discrimination, finally introduces the packet PCA algorithm to improve efficiency of PCA algorithm. The algorithms provide evidence for face recognition combined with support vector machine.

【Key words】Face Recognition; Eigen Face; Eigenvector; Principal Component Analysis; K-L Transform

0 引言

主成分分析PCA(Principal Component Analysis)實(shí)質(zhì)上是K-L展開的網(wǎng)絡(luò)遞推實(shí)現(xiàn)。K-L變換用于人臉識別的思想:高維圖像空間經(jīng)過K-L變換后,成為低維線性空間,計(jì)算后得到一組新的正交基,通過保留部分正交基得到正交K-L基底,再將子空間對應(yīng)特征值較大的基底按照圖像整列排列,最后由這些正交基的線性組合呈現(xiàn)出人臉的形狀,因此這些正交基也稱為特征臉。當(dāng)PCA應(yīng)用在人臉識別領(lǐng)域時,稱為特征臉方法[1-2]。本課題擬采用特征臉方法進(jìn)行人臉識別。

1 K-L變換

K-L變換是圖像壓縮技術(shù)中的一種最優(yōu)正交變換,用于統(tǒng)計(jì)特征提取,是空間法模式識別的基礎(chǔ)。K-L變換實(shí)質(zhì)是建立了一個新的坐標(biāo)系,將一個物體主軸沿特征矢量對齊的旋轉(zhuǎn)變換,這個變換解除了原有數(shù)據(jù)向量的各個分量之間相關(guān)性,從而有可能去掉那些帶有較少信息的坐標(biāo)系以達(dá)到降低維數(shù)的目的[3]。

1.1 正交變換

變換是一種工具,它是用來描述事物,特別是描述信號。描述事物的基本方法之一是將復(fù)雜的事物化成簡單事物的組合,或?qū)ζ溥M(jìn)行分解,分析其組成的成分。

設(shè)V是n維歐式空間,A是V內(nèi)一個線性變換。如果對任意?琢,?茁∈V都有(A?琢,A?茁)=(?琢,?茁),則稱A是V內(nèi)的一個正交變換。

用變換對信號進(jìn)行分析,所使用的數(shù)學(xué)工具是點(diǎn)積。點(diǎn)積的實(shí)質(zhì)就是兩個信號中相同成分之間乘積之總和。對于兩個隨時間連續(xù)變化的信號F(t),G(t),它們之間的點(diǎn)積運(yùn)算定義為:

點(diǎn)積運(yùn)算的結(jié)果是一個數(shù)值,或大于零,小于零或等于零,等于零的情況在兩個向量夾角為90°的情況下出現(xiàn),此種情況就稱為相互正交。由此作為一種變換,如果這種變換中的每一種成分與其它成分都正交時,它們之間的關(guān)系就相互獨(dú)立了,每一種成分的作用是其它成分所不能代替的[4]。

綜合以上分析,可以將對這種變換的定義歸納為:

1.2 K-L分解概述

K-L變換的復(fù)雜之處在于需要求解信號相關(guān)矩陣的特征向量,而這樣的相關(guān)矩陣往往維數(shù)很高,導(dǎo)致運(yùn)算量很大。Castrillon-Candas和Amaratunga注意到對于較光滑信號,小波分解的系數(shù)具有稀疏性,于是通過選取數(shù)目較少的正交小波基進(jìn)行K-L分解的估算,從而降低了相關(guān)矩陣的維數(shù),減少了運(yùn)算量。

K-L分解目的是查找信息分布的數(shù)據(jù)集合的主分量,使原始數(shù)據(jù)集變換到分量空間時,單一數(shù)據(jù)樣本的相關(guān)性降低到最低。這樣只需提取出少數(shù)幾個與樣本數(shù)據(jù)相關(guān)性最好的分量,就可以很好地表達(dá)原來任一樣本數(shù)據(jù)。所以K-L變換是圖像分析與模式識別中的重要工具,用來特征抽取及降低特征數(shù)據(jù)的維數(shù)[5]。

如果樣本為圖像這樣的二維數(shù)據(jù),可以對其進(jìn)行二維小波變換。二維小波函數(shù)和尺度函數(shù)是通過一維小波函數(shù)和尺度函數(shù)經(jīng)過張量積變換得到,二維小波分解把尺度為j的低頻部分分解四個部分:尺度j+1的低頻部分和三個方向(水平,垂直,對角)的高頻部分[6]。

為了可以降低矩陣的維數(shù),就需要減少所選擇保留的正交基的個數(shù)。而為了減小K-L分解的估算誤差,則希望信號盡可能準(zhǔn)確地由所選擇的正交基所表示。所以希望小波分解系數(shù)能足夠稀疏,當(dāng)選擇少數(shù)較大規(guī)模的系數(shù)對應(yīng)的正交基,就可以獲得較好的準(zhǔn)確度。

2 基于PCA的人臉識別

將主成分分析法用于人臉識別,其實(shí)是假設(shè)所有的人臉都處于一個低維線性空間,而且不同的人臉在這個空間中具有可分性[7]。

2.1 PCA算法流程

(1)首先應(yīng)將圖像庫讀入系統(tǒng),在讀入過程中的同時將二維的圖片降維到一維的向量。每一幅圖像都要選擇一定數(shù)量的圖像構(gòu)成訓(xùn)練集,其余的構(gòu)成測試集。假設(shè)圖像的大小w×h(w和h分別為圖像的寬度和高度),整個人臉庫中圖像個數(shù)是n,用于訓(xùn)練的人臉個數(shù)是n1,測試圖像的人臉個數(shù)是n2,令m=w×h,則訓(xùn)練集是一個m×n1的矩陣,測試集是m×n2的矩陣。第i幅人臉可以表示為:

(3)計(jì)算生成矩陣∑的特征值和特征向量,構(gòu)造子空間。首先把特征值從大到小進(jìn)行排序,同時其對應(yīng)的特征向量的順序也作相應(yīng)的調(diào)整。然后選擇其中的一部分構(gòu)造特征子空間。

(4)把訓(xùn)練圖像和測試圖像投影到特征空間中。每一幅人臉圖像投影到子空間以后,就對應(yīng)于子空間中的一個點(diǎn)。同樣,子空間中的任一點(diǎn)也對應(yīng)于一幅圖像。

(5)把投影到子空間中的所有測試圖像和訓(xùn)練圖像進(jìn)行比較,確定待識別樣本所屬的類別。這里可以采用多種不同的分類器進(jìn)行分類:如曼哈頓距離、最近鄰分類器、最小距離分類器、貝葉斯分類器等。

2.2 特征向量的選取

由于圖像是由特征向量和特征系數(shù)的線性組合表示的,所以特征向量的選取非常關(guān)鍵,通過計(jì)算由K-L變換得到矩陣的特征值和特征向量,選取特征值大的前N個特征向量作為主向量并將它們保留,以達(dá)到節(jié)省時間的目的。

有幾種不同的特征值選擇方法:

(1)丟棄最后40%的特征向量:因?yàn)樘卣飨蛄渴前凑仗卣髦到敌騺砼帕械?,該方法丟棄了反映最少的40%圖像間差異的特征向量[8]。

(2)保持前面的C-1個特征向量:將特征值按照降序排列,同時只保留最前面的C-1個特征向量。其中C為訓(xùn)練圖像的類別數(shù)。

(3)按照計(jì)算信息量來確定維數(shù):該方法采用保證剩余的特征向量包含的信息與總的信息量相比大于一定的閾值e,e的值通常取為0.85。

(4)丟棄最前面的三個特征向量:同樣將特征值按照降序排列,經(jīng)查閱資料知對應(yīng)于最大三個特征值的特征向量有可能反映了圖像間由于光線不同而造成的差異,丟棄前面的三個特征向量會提高識別率。

2.3 距離函數(shù)的選取

一旦圖像被投影到特征空間中,得出其特征系數(shù),剩下的任務(wù)就是如何判別這些圖像的相似性。通常有兩種方法來判別圖像間的相似性:一種是計(jì)算在N維空間中圖像間的距離,另一種方式是測量圖像間的相似性。當(dāng)測量距離時,我們希望距離盡可能的小,一般選擇距離測試圖像最近的訓(xùn)練圖像作為它所屬的類別。而測量相似性的時候,我們則希望圖像盡可能地相似,也就是說具有最大相似性地訓(xùn)練圖像類別被認(rèn)為是測試圖像所屬的類別[9]。

有許多種計(jì)算方法:

L1范式:L1范式也稱為和范式,它將像素間的絕對值的差值相加。L1范式距離公式為:

L2范式(最近鄰法):L2范式也稱歐幾里德距離或者是歐幾里德距離的平方根。它將像素的平方差異相加。L2范式距離公式為:

最小距離式:首先計(jì)算各類訓(xùn)練樣本的平均值,接下來的距離比較和上面L2范式完全相同。這樣分類時每類只需比較一次,減少了計(jì)算量。樣本x與第i類的距離定義如下:

角度:角度測量也就是協(xié)方差,它計(jì)算兩個規(guī)一化以后的向量間的角度。角度測量屬于相似性測量,通過求反,可以看成是距離測量[10]。

3 提高PCA的效率

PCA是用于人臉識別的基本算法,它的效率直接影響整個系統(tǒng)的性能。雖然它已經(jīng)得到了很大的發(fā)展,但是仍然存在一些問題:

(1)由于人臉空間分布近似高斯分布,普通的人臉位于均值附近,而特殊人臉位于分布的邊緣,特征臉法易造成不同類人臉之間較大的混疊,不利于人臉的分類。

(2)計(jì)算量很大。

為了克服以上問題,提出了分組PCA算法。

3.1 分組PCA算法

在傳統(tǒng)的特征臉方法的基礎(chǔ)上,人們注意到特征值最大的特征向量(即特征臉)并不一定是分類性能最好的方向,而且對K-L變換而言,外在因素帶來的圖像差異和人臉本身帶來的差異是無法區(qū)分的。特征臉在很大程度上反映了光照等差異。同時當(dāng)原始圖像數(shù)目較多時,則需要花費(fèi)較多的時間,當(dāng)系統(tǒng)增加人臉圖像時,則需要重新訓(xùn)練所有的樣本。同時研究表明,特征臉方法隨著光線、角度和人臉尺寸等因素的引入,識別率急劇下降,因此特征臉方法用于人臉識別還存在理論的缺陷。近年來,據(jù)此發(fā)展了許多對特征臉的改進(jìn)方法?;诳s小訓(xùn)練圖像的數(shù)目和次數(shù)的思想,可以采用將人臉模式分組的方法,這樣在有新人臉模式需要增加時,已經(jīng)訓(xùn)練完畢的分組無須重新訓(xùn)練,只需訓(xùn)練較少的分組,并且各個分組的訓(xùn)練可以分布并行計(jì)算,極大地縮短訓(xùn)練時間[11]。模式分組同時減小了特征臉法中協(xié)方差矩陣的大小,避免了求大尺寸矩陣的特征值和特征向量,減小了計(jì)算量?;诜纸M思想的改進(jìn)的特征臉?biāo)惴ㄈ缦滤荆?/p>

(1)分組結(jié)合方法較為直觀的一種是將原始人臉模式分為互不相交的m組,對各個分組分別用特征臉方法進(jìn)行訓(xùn)練,在對各個分組用特征臉法訓(xùn)練后,m組參數(shù)對未知圖像得到距離。

(2)分組結(jié)合方法的另一種表示形式是將人臉模式分為部分相交的m組。對各個分組分別用特征臉法進(jìn)行訓(xùn)練,在用特征臉法對各個分組訓(xùn)練完后,m組參數(shù)對未知圖像得到距離,用距離來估計(jì)后驗(yàn)概率,再采用基于貝葉斯理論和結(jié)合規(guī)則處理相交部分[12]。

4 結(jié)論

本文分析了PCA算法的原理及流程,介紹了由其推廣出的特征臉方法。針對特征臉方法存在的問題,給出了改進(jìn)的思路。以上研究結(jié)論對于課題下一階段的進(jìn)行有指導(dǎo)意義,課題下一階段將在以上各種方案的基礎(chǔ)上選擇最佳的算法結(jié)合支持向量機(jī)進(jìn)行人臉識別。

【參考文獻(xiàn)】

[1]劉青山,盧漢清,馬頌德.綜述人臉識別中的子空間方法[J].自動化學(xué)報(bào),2006, 29(6):900-911.

[2]周杰,盧春雨,等.人臉自動識別方法綜述[J].電子學(xué)報(bào),2000,28(4):102-106.

[3]Grudin M.A. On internal representations in face recognition systems[J].Pattern Recognition,2011,33:1161-1177.

[4]Daugman J. Face and gesture recognition: overview[J].IEEE PAMI,2007,19(7): 675-676.

[5]陶亮,莊鎮(zhèn)泉.一種基于個人身份認(rèn)證的正面人臉識別算法[J].中國圖像圖形學(xué)報(bào):A輯,2003,8(8):860-865.

[6]楊穎嫻.基于PCA算法和小波包變換的人臉識別技術(shù)[J].微電子學(xué)和計(jì)算機(jī),2011,24(1):52-54.

[7]Li Dihua, Podolak I T, Lee S W. Facial component extraction and face recognition with support vector machines[J].Proceedings of Automatic Face and Gesture Recognition, 2012,30: 76-81.

[8]范燕,吳小俊,惠長坤,劉同明.人臉圖像特征抽取與識別的一種混合方法研究[J].華東船舶工業(yè)學(xué)院學(xué)報(bào),2008,17(2):50-53.

[9]鄭嵐.支持向量機(jī)在人臉識別中的應(yīng)用研究[J].計(jì)算機(jī)仿真,2010,35(12):62-65.

[10]邊肇祺,張學(xué)工,等.模式識別(第二版)[M].北京:清華大學(xué)出版社,2000, 15-60.

[11]王宏漫,歐宗瑛.采用PCA/ICA特征和SVM分類的人臉識別[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)報(bào),2013,15(4):416-420.

[12]蘇中,張宏江,馬少平.基于貝葉斯分類器的圖像檢索反饋算法[J].軟件學(xué)報(bào),2011,12(3):6.

[責(zé)任編輯:王楠]

猜你喜歡
主成分分析特征向量人臉識別
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
人臉識別 等
克羅內(nèi)克積的特征向量
揭開人臉識別的神秘面紗
一類特殊矩陣特征向量的求法
EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
主成分分析法在大學(xué)英語寫作評價(jià)中的應(yīng)用
江蘇省客源市場影響因素研究
SPSS在環(huán)境地球化學(xué)中的應(yīng)用
考試周刊(2016年84期)2016-11-11 23:57:34
長沙建設(shè)國家中心城市的瓶頸及其解決路徑
东辽县| 定兴县| 疏勒县| 安平县| 隆尧县| 日土县| 和顺县| 东港市| 商丘市| 福安市| 吉安县| 深州市| 曲水县| 正镶白旗| 浏阳市| 拉萨市| 蒙城县| 张家港市| 垫江县| 桃江县| 苍梧县| 玛沁县| 伊宁市| 乌拉特前旗| 威海市| 衡阳市| 横峰县| 嘉善县| 浑源县| 宁远县| 宜兰市| 甘孜| 赫章县| 金华市| 大埔区| 云南省| 高碑店市| 嘉定区| 洞头县| 扎鲁特旗| 四子王旗|