馬帥旗
(陜西理工大學 電氣工程學院, 陜西 漢中 723000)
本文結合PCA與LDA算法的優(yōu)勢與不足,提出PCA子空間與LDA子空間的融合算法,利用PCA將高維空間的樣本投影到低維空間,以保證樣本類內(nèi)離散度矩陣非奇異,再利用LDA算法進行特征提取,實現(xiàn)兩種特征子空間融合,再將人臉測試集投影至融合的特征空間,依據(jù)最近鄰分類準則進行分類,從而整體上提高識別系統(tǒng)的魯棒性和識別效率。
由于識別的圖像易受外部光照強度、拍攝角度、焦距等因素影響,因而需要對輸入圖像進行預處理。圖像的預處理主要涉及輸入圖像的幾何位置規(guī)范化[4]和圖像灰度歸一化。幾何位置規(guī)范化是對原始輸入圖像進行旋轉、縮放和裁剪等操作[5],灰度歸一化用于消除噪聲對輸入圖像灰度分布的影響,從而使預處理后的圖像的尺度、方向和灰度分布基本相似。
若(x1,y1)和(x2,y2)分別表示旋轉前、后點的坐標,則圖像中的像素點旋轉變換關系可表示為
(1)
(2)
為了使預處理后的人臉圖像的寬度width=130,高度height=150,左眼睛距圖像的左邊界距離和右眼睛距圖像的右邊界距離為30,雙目的對稱中心與圖像的上邊界和下邊界的距離分別為50和100,需要對圖像進行平移和裁剪處理。若(xl,yl)和(xr,yr)分別為圖像平移前的左眼、右眼中心縱橫坐標,Δx和Δy分別表示水平偏移量和垂直偏移量,則水平和垂直方向的平移距離為Δx=width/2-(xl+xr)/2、Δy=height/3-(yl+yr)/2。若像素點(x3,y3)和(x4,y4)分別表示平移前后圖像像素點的坐標,則圖像中像素點的平移變換可以表示為
(3)
圖1為經(jīng)過上述旋轉、縮放和平移預處理后的人臉圖像,像素(x,y)經(jīng)預處理后的坐標(x′,y′)可以表示為
(4)
(a) 原始圖像 (b) 旋轉、縮放并剪切后的圖像圖1 人臉圖像的幾何歸一化
在人臉圖像預處理時,可以選擇雙眼、雙眉、鼻尖與嘴巴中線作為特征點進行歸一化處理。如在雙眼部分或全部被遮擋的情況下,選擇兩眉毛中點進行歸一化處理。為了使預處理后的人臉圖像的寬度width=130,高度height=150,左眉毛中點距圖像的左邊界距離和右眉毛中點距圖像的右邊界距離為30,雙眉毛的對稱中心與圖像的上邊界和下邊界的距離分別為30和120。同理,若雙眼、雙眉都被遮擋時,選擇鼻尖和嘴巴中線為特征點進行歸一化,鼻尖距離上邊界距離為110,嘴巴中線距離下邊界為20,鼻尖距離左右邊界75。
PCA與LDA特征融合與識別步驟如下:
步驟2 計算特征差值的協(xié)方差矩陣
(5)
步驟3 求取差值協(xié)方差矩陣Ф的非零特征值λ=(λ1,λ2,…,λN),進而求取對應特征向量V=(v1,v2,…,vN),并對特征向量按照特征值降序方式進行排列:
Ф·V=λ·V。
(6)
步驟5 將輸入圖像x、每類平均圖像μj和總體平均圖像μ投影到PCA子空間[5]:
(7)
(8)
(9)
步驟6 分別計算LDA算法中的每個類內(nèi)散布矩陣Sj、總體類內(nèi)散布矩陣SW及類間散布矩陣SB:
(10)
(11)
(12)
步驟7 根據(jù)Fisher準則,使樣本在LDA投影空間內(nèi)的類間離散度SB最大和類內(nèi)離散度SW最小,可知最佳投影子空間W滿足
(13)
步驟8 依據(jù)拉格朗日乘數(shù)法可得
(14)
步驟9 將PCA和LDA的特征空間進行融合[2]:
(15)
對于任意一圖像列向量x,在融合特征空間的投影關系可表示為
(16)
將訓練圖像及測試圖像分別投影至融合的特征空間,若y和Yi分別表示測試樣本x和訓練樣本類Xi投影后特征,則定義在融合投影空間中測試樣本x到訓練樣本類Xi的距離為
D(x,Xi)=‖y,Yi‖,
(17)
采用英國劍橋大學Olivetti實驗室的ORL人臉庫進行實驗,該人臉庫包含400幅人臉圖像,分為40類不同年齡、不同性別和不同種族的人臉,而每類人臉又包含10幅不同方向、光照、面部表情和面部遮擋物的圖像。對40類人臉庫中每類人的前5幅圖像進行訓練,后5幅圖像進行測試。表1給出了PCA和PCA-LDA融合算法的識別率與投影特征維數(shù)之間的關系。
表1 識別率與特征維數(shù)關系
從表1可知,當特征空間維數(shù)小于25時,雖然PCA和PCA-LDA融合算法的識別率都較低,但隨著特征維數(shù)的增加,二者的識別正確率增長較快;當融合特征空間維數(shù)繼續(xù)增加且小于65時,識別率逐漸增加并趨于穩(wěn)定,PCA算法正確識別率的極值點為93%,PCA-LDA算法的正確識別率的極值點為96%;若融合特征空間的維數(shù)繼續(xù)增加時,融合特征空間的維數(shù)過多,所有的特征向量并不都代表有效的投影方向,部分特征向量可能表征與人臉特征無關的噪聲、背景等投影方向,正確識別率也不會超過極值點,反而隨著維數(shù)增加而逐漸減小。
ORL人臉庫中共計40類人,每類人共10幅圖像,其中i幅用于訓練,則10-i幅圖像用于實驗測試。設定PCA算法的累計貢獻率為0.9,表2給出了不同算法下識別率與訓練樣本個數(shù)之間的關系。
表2 不同算法下識別率比較
由表2可以看出,當訓練樣本為1時,LDA的識別率僅為61.11%,受LDA算法影響,PCA-LDA融合算法識別率相對于PCA略大;當訓練的人臉圖像小于3,PCA、LDA和PCA-LDA算法的識別率都相對較低,PCA-LDA最高不超過89%;訓練的樣本數(shù)增加時,PCA、LDA和PCA-LDA的識別率逐漸增加,且PCA-LDA的增長率高于PCA和LDA;當訓練樣本數(shù)為8時,PCA-LDA的識別率達到100%。表3給出了不同的訓練樣本下,LDA的最佳投影維數(shù)與識別率之間關系。
表3 不同訓練樣本下的PCA-LDA識別率
另外在實驗中發(fā)現(xiàn),PCA算法側重于提取圖像數(shù)據(jù)原始特征,LDA算法側重于提取同類之間及不同類之間的差別,當每類樣本較少時,樣本類別信息不足,LDA識別效果較差;當訓練的樣本數(shù)增加時,同類及不同類的特征信息增加,識別率有顯著提高。PCA-LDA算法能夠結合PCA及LDA算法的優(yōu)勢,對樣本類別具有較好的魯棒性,能獲得較好的正確識別率。
本文首先將原始圖像投影至PCA特征空間,實現(xiàn)數(shù)據(jù)降維;然后用LDA的類別標簽信息,獲得類內(nèi)樣本特征及類間樣本特征;進而實現(xiàn)PCA與LDA特征融合,獲得一個有效的分類器。實驗結果表明,該PCA-LDA融合算法能夠結合二者優(yōu)勢,有效解決小樣本問題,對光照不均勻、表情變化及拍攝方向具有一定魯棒性,其識別率高于傳統(tǒng)的PCA算法,具有一定的應用價值。