顧理琴
摘要:特征提取部分是要從人臉圖像中提取可以區(qū)分不同類別人臉的特征信息(有效識別信息)。將圖像預(yù)處理、二維PCA特征提取和神經(jīng)網(wǎng)絡(luò)分類器結(jié)合提出了一種改進(jìn)的圖像識別方法,和其他方法進(jìn)行了比較,在Matlab環(huán)境中的仿真結(jié)果表明,該算法降低了系統(tǒng)的運(yùn)算復(fù)雜度,提高了人臉識別率。
關(guān)鍵詞:人臉識別 pca 2dpca 神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP391.4 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2012)10(b)-0235-01
人臉識別是神經(jīng)網(wǎng)絡(luò)應(yīng)用的一個重要研究方向。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)需要大量的樣本,圖像維數(shù)通常很高。理論上神經(jīng)網(wǎng)絡(luò)可以直接進(jìn)行識別,但實際操作時,其時間的消耗是無法接受的,也降低了該項技術(shù)的實用性。二維PCA是近年來提出的一種有效特征提取方法,已經(jīng)在人臉識別中獲得了成功的應(yīng)用。二維PCA在保留主要識別信息的前提下,實現(xiàn)了人臉特征的提取和圖像的降維。和傳統(tǒng)特征提取方法相比,二維PCA在圖像特征提取上更加簡單和直觀,特征提取速度也得到提高。
1 人臉識別流程
本文的實驗是在英國劍橋大學(xué)提供的ORL人臉庫上進(jìn)行的,庫中共有400幅人臉圖像,包括40個人,每人10幅,分辨率為92112。ORL圖庫比較規(guī)范,大多數(shù)圖像的光照方向和強(qiáng)度都差不多。但有少許表情,姿態(tài),伸縮的變化,尺度差異在10%左右。實驗環(huán)境為Matlab7.0。采用小波工具箱和神經(jīng)網(wǎng)絡(luò)工具箱對人臉識別進(jìn)行了仿真實驗。
2 人臉特征提取
特征提取是人臉識別的重要組成部分。特征提取的內(nèi)容包括兩方面。
首先是特征選擇,從原始特征向量中確定能充分完整且穩(wěn)定的表示人臉信息的低維非零特征向量。然后是特征提取。對獲得的低維特征向量進(jìn)行最優(yōu)變換,獲取最能反映模式分類本質(zhì)的特征向量。
目前可以用于人臉識別的特征主要有以下幾種。
(1)幾何特征。如人臉的五官尺寸和相對位置。這些特征的維數(shù)較低。但光照等外界條件對其影響較大,例如:拍攝角度造成的人臉尺寸差異。因此,難以獲得滿意的識別效果。
(2)灰度統(tǒng)計特征。用于識別的人臉圖像多為灰度圖像因此,人臉的特征也可以用直方圖和主分量等特征來表示。這些特征能在保留有效分類信息的前提,降低人臉特征的維數(shù)。
(3)變換系數(shù)特征。如,傅立葉變化等,這些變換可以對人臉圖像進(jìn)行數(shù)學(xué)變換,以變換的系數(shù)作為人臉特征。雖然其計算較方便,但是去相關(guān)性較差。得到的特征維數(shù)仍然很大。
(4)代數(shù)特征。人臉圖像可以表示為矩陣或數(shù)組的形式。矩陣的特征向量反映了矩陣的代數(shù)屬性。奇異值分解是典型的利用代數(shù)特征進(jìn)行人臉特征提取的方法。
本文采用二維PCA進(jìn)行人臉的特征提取。二維PCA直接利用人臉圖像表示的二維數(shù)據(jù)作為分析對象,構(gòu)建協(xié)方差矩陣,進(jìn)行特征提取,特別適宜于圖像(或者矩陣)數(shù)據(jù)的處理,在小樣本數(shù)據(jù)測試(如:人臉識別)中,表現(xiàn)出了很好的識別能力。
特征提取算法描述:
令訓(xùn)練樣本集,為訓(xùn)練樣本集的樣本總數(shù),為訓(xùn)練樣本集中的任一樣本圖像,可以表示為維的圖像矩陣。
平均樣本。圖像協(xié)方差矩陣:
根據(jù)協(xié)方差矩陣進(jìn)行特征提取的推導(dǎo)過程如下。
(1)獲取最優(yōu)投影軸。令(維)為給定的一個人臉圖像樣本,為維列向量,為樣本圖像。則在方向上投影后的特征向量:。
為獲取最優(yōu)投影方向,定義最優(yōu)化準(zhǔn)則函數(shù):
其中:為的協(xié)方差矩陣;為的跡。求準(zhǔn)則函數(shù)的最大值即可得到最優(yōu)投影方向。
樣本圖象的協(xié)方差矩陣為:
可知為非負(fù)定的矩陣,由公式(1)(2)(4)(5)可得:
其中是一維列向量,取最大值時對應(yīng)的是最大特征值對應(yīng)的特征向量,稱為最優(yōu)投影軸。由此得到滿足條件:(1)…,(2)…。前個較大特征值對應(yīng)的的特征向量…。
(2)特征提取。對于給定樣本圖像可得:…,相應(yīng)的,…,即為樣本圖像的主成分向量,組成了樣本圖像的特征矩陣,完成了樣本圖像的特征提取。
本文實驗中所使用的圖像取自O(shè)RL人臉庫中的圖像。原始圖像尺寸為112×92,圖像歸一化階段經(jīng)過剪切尺寸降為60×60維,小波變換后樣本圖像降為15×15維。取小波變換后的樣本圖像作為特征提取的對象。原始圖像在特征提取中獲得的協(xié)方差矩陣為92×92,而按本文的方法得到的協(xié)方差矩陣為15×15維,將有效的降低數(shù)據(jù)運(yùn)算量。
3 BP神經(jīng)網(wǎng)絡(luò)分類器設(shè)計
BP神經(jīng)網(wǎng)絡(luò)分類的設(shè)計主要包括:輸入層和輸出層的設(shè)計、中間層(隱層)的設(shè)計、傳遞函數(shù)的設(shè)計。
3.1輸入層和輸出層設(shè)計
BP神經(jīng)網(wǎng)絡(luò)用作人臉識別分類器時,其輸入層的節(jié)點應(yīng)該和提取的人臉特征維數(shù)相對應(yīng),即二維PCA特征提取后得到的人臉特征向量維數(shù)即為本文設(shè)計的BP神經(jīng)網(wǎng)絡(luò)分類器的輸入層節(jié)點數(shù)。
BP神經(jīng)網(wǎng)絡(luò)分類器輸出層節(jié)點數(shù)應(yīng)為用于識別的人臉的類別數(shù)。神經(jīng)網(wǎng)絡(luò)輸出層的節(jié)點數(shù)需要根據(jù)該網(wǎng)絡(luò)設(shè)計該網(wǎng)絡(luò)的用途來設(shè)計。設(shè)樣本圖像為人臉圖像的第類,則目標(biāo)輸出為[0,0,…,1,0,…0],即當(dāng)其成功被識別后,第個輸出節(jié)點的輸出值為1。
3.2隱層節(jié)點數(shù)的設(shè)定
關(guān)于中間層,即隱層的層數(shù)和各隱層節(jié)點的個數(shù),目前的研究結(jié)果還難以給出網(wǎng)絡(luò)類型和規(guī)模之間的函數(shù)關(guān)系。增加隱層層數(shù)和節(jié)點數(shù)不一定能提高網(wǎng)絡(luò)的精度和分類能力,因此,本文采用標(biāo)準(zhǔn)的三層BP網(wǎng)絡(luò)作為人臉識別分類器。
通??梢愿鶕?jù)經(jīng)驗公式來進(jìn)行隱層節(jié)點數(shù)的確定:
或 (8)
式中:為隱層節(jié)點個數(shù),為輸入層節(jié)點個數(shù),為輸出層節(jié)點個數(shù)。為110之間的常數(shù)。
或根據(jù)網(wǎng)絡(luò)收斂程度來調(diào)整:選擇較少的隱層節(jié)點,如果網(wǎng)絡(luò)沒有達(dá)到滿意的收斂效果,確認(rèn)網(wǎng)絡(luò)缺少分化數(shù)據(jù)的能力,可以增加隱層的大小,重復(fù)上述實驗,知道獲得滿意的網(wǎng)絡(luò)收斂。
4 結(jié)語
人臉識別是一種基于信息處理的模式識別技術(shù)。廣泛的應(yīng)用前景使得人臉識別作為一個極富潛力的研究課題在許多領(lǐng)域得到發(fā)展。目前人臉識別的研究仍處于探索階段。信息的發(fā)展使人臉識別在身份認(rèn)證,安全監(jiān)控等方面成為關(guān)鍵技術(shù)。