王超,王洋
(長春理工大學(xué),長春 130022)
面部識別技術(shù)是使用計算機對人的面部圖像進行分析,通過圖像處理顯示出有效的面部特征信息,進而對人的身份進行辨認(rèn)的一種技術(shù)。人的面部識別技術(shù)是近年來圖像和模式識別處理領(lǐng)域的一個研究熱點,很多研究機構(gòu)及學(xué)者已經(jīng)在此項技術(shù)上取得了顯著的成果,并應(yīng)用在許多領(lǐng)域[1]。由于學(xué)生管理工作是高校事務(wù)中的重中之重,由于群體特點及課堂時間的限制,采用傳統(tǒng)的點名方式或者簽到方式都會存在各種弊端,若采用面部識別技術(shù),則可提高管理能力和效率。但由于人面部特征復(fù)雜,計算機對面部特征提取受環(huán)境影響大等因素,識別率仍有待提高[2,6]。本文設(shè)計一種結(jié)合PCA與局部二值模式的面部識別學(xué)生考勤方法,融合了主部與局部的特征,可以有效提高面部識別算法的識別率。
在面部識別技術(shù)領(lǐng)域中,最主要的提取主部特征信息的方法就是主成分分析法(Principal Component Analysis,PCA)。其廣泛應(yīng)用于面部的輪廓信息提取。PCA是最早的一種多變量分析技術(shù),起源于通信理論中的K-L變換。早在1901年,Pearson就提出了此方法,此后,Karhunan Loève等學(xué)者對該方法進行了多次修改。PCA的主要技術(shù)路線就是代表原始數(shù)據(jù)的基礎(chǔ)上,通過線性變換將高維面部樣本取樣數(shù)據(jù)投影到低維數(shù)據(jù)中,使它們在低維數(shù)據(jù)中的分散程度最大化,從而更容易對面部圖像進行分類顯示[2]。
對于n維空間中的N個樣本X1,X2,…,XN,其中Xi=(x1,x2,…,xn)可以看成N個隨機變量中的第i個n維隨機變量,用矩陣的形式可表示為:
對矩陣X中所有的列取平均向量,由于樣本的總數(shù)為N,則可以得到所有樣本的平均向量M:
進一步得出樣本集X對應(yīng)的總體散布矩陣,即協(xié)方差矩陣為:
根據(jù)奇異值分解定理可以求出其特征值λi及對應(yīng)的特征向量由奇異值定理可知,St的正交歸一化特征向量為:
其中,i=1,2,…,n。λ1,λ2,…,λn是其特征值,且滿足λ1≥λ2≥…≥λn,則其對應(yīng)的特征向量為,在主成分分析中,αi可被稱為這組樣本的主成分,W即為這組樣本的主成分矩陣。
對一個n維向量X,通過先行變換公式Y(jié)=WTX可以得到一個新的n維變量Y,即一簇投影特征向量Y1,Y2,…,Yn。這個PCA變換過程就是將變量X向W所對應(yīng)的一組基進行投影,得到一組投影系數(shù)Y。在這個過程中,PCA起到了明顯的降維作用。Y就稱為X在這組數(shù)據(jù)下經(jīng)過PCA變換后的結(jié)果[3]。
已知投影系數(shù)Y,可以通過W重構(gòu)原始數(shù)據(jù):
圖1 通過PCA提取后的重構(gòu)圖像
圖1列出了部分通過PCA提取后的重構(gòu)圖像,從圖像分析可以看出,重構(gòu)出的面部圖像細(xì)節(jié)部分比較模糊,但是面部圖像的全局輪廓信息非常清楚。因此PCA主要提取的是人臉的全局信息。
局部二值模式(Local Binary Pattern,LBP)是一種具有旋轉(zhuǎn)不變性和灰度不變性等優(yōu)點的高效局部紋理圖像描述算子[4]。在近幾年的研究內(nèi),LBP算子得到不斷的變化和發(fā)展,并廣泛地應(yīng)用于紋理圖像分類、紋理處理分割、面部圖像分析、目標(biāo)識別等領(lǐng)域。
紋理分析是圖像處理分析中常用的技術(shù),它是由物體表面物理特性不同所引起的能夠表示某個特定表面特征的灰度或者顏色信息。可以認(rèn)為紋理圖像是由很多相似的像素構(gòu)成,所以直觀來說紋理圖像描述可提供特定圖像區(qū)域的平滑、稀疏、規(guī)律性等特性。反映在圖像上,紋理圖像表現(xiàn)為顏色、亮度的周期性變化[3]。幾乎所有的圖像都包含了紋理信息。與其它圖像特征相比,圖像紋理信息反映了圖像灰度模式的空間分布,也區(qū)分了圖像的低頻信息與高頻信息,并包含了圖像的表面信息及其與周圍環(huán)境的聯(lián)系,更好地兼顧了圖像的微觀結(jié)構(gòu)信息與宏觀信息,因此在圖像分析中的紋理分析受到格外關(guān)注。
局部二值模式是一種灰度范圍內(nèi)的紋理描述方式[5]。通過圖像點C與在其鄰域內(nèi)采樣的n個點的差值來描述:
基本的LBP算子由于覆蓋了一個特定半徑范圍內(nèi)的較小區(qū)域,在應(yīng)用到不同大小和頻率紋理圖像時受到限制,這成了LBP的最大缺點。為了適應(yīng)不同大小的紋理圖像特征,并保持灰度和旋轉(zhuǎn)不變性的要求,Ojala[5]等對LBP算子進行了修改和改進,將最初的3×3鄰域擴展到任意鄰域,并用圓形鄰域代替了正方形鄰域,改進后的LBP算子允許在半徑為R的圓形鄰域內(nèi)有任意多個像素點。
圖2 Ojala提出的改進LBP算子
但是隨著鄰域的擴展及像素點的增加,描述子的維數(shù)也隨之增加,算法的復(fù)雜度也明顯加大。
LBP的工作原理是通過將每一維以零為閾值進行二值化來實現(xiàn)二進制編碼的。它把描述子向量空間劃分為不同象限,同一象限內(nèi)的描述子具有相同的編碼。描述子空間的坐標(biāo)可表示為:
其中,C為圖像塊中心像素點,Ci為C的鄰域像素點,是由鄰域點和圖像點的值組成的原始描述子向量,E是描述矩陣,是圖像點的最終描述子向量。但是LBP的描述矩陣的列向量不正交,這會導(dǎo)致LBP的編碼出現(xiàn)分布不均勻的情況,因此可對描述子進行變換:
其中,W是變換矩陣。對描述子進行變換其實就是對描述矩陣進行變換:
對變換后的描述子進行閾值化得到的二進制向量為:
結(jié)合PCA變換可以保證描述子的各維間不相關(guān),且描述子每一維的方差足夠大,以確保LBP編碼分布均勻。
設(shè)LBP差值描述子的協(xié)方差矩陣為:
選取k個最大特征值對應(yīng)的特征向量,作為變換矩陣其中k為變換后描述子所需維數(shù)。采用此變換矩陣對差值描述子進行變換,并對變換后的描述子進行LBP編碼就完成了LBP的特征提取。
在LBP編碼過程中增加了PCA變換,通過PCA變換,將描述子的各維間變換為不相關(guān),也即由描述子得到的二進制碼在每個比特間不相關(guān)。PCA變換在整個去相關(guān)過程中,使描述子每一維的方差最大化,即每一維在均值零附近盡量均勻分布。PCA變換能使編碼值在圖像總體上呈現(xiàn)均勻分布。另外,PCA變換還具有降維的作用。因為在LBP編碼中,描述子的維數(shù)決定了編碼值的數(shù)目,以及直方圖特征的維數(shù)。描述子的維數(shù)越大,采樣點數(shù)就越多,能利用的信息就更多,但帶來的影響就是系統(tǒng)的復(fù)雜度也越高。PCA變換的降維作用剛好可以解決這個問題,能夠簡化計算,有利于更好地描述圖像點。最后,PCA變換后的描述子是原差值描述子的線性組合,會大大増強編碼的魯棒性。
實驗過程中,分別將提出的算法在ORL人臉庫、YALE和FERET圖像庫進行驗證。在ORL人臉庫的訓(xùn)練集上隨機選出250張訓(xùn)練圖像,其中50張圖像用于進行PCA變換學(xué)習(xí),其余的200張圖像分別進行常規(guī)LBP及結(jié)合PCA變換的LBP編碼實驗。使用400張YALE和FERET圖像庫的圖像進行圖像識別。
實驗過程中,在編碼的分布均勻性方面,結(jié)合PCA變換的LBP編碼要明顯優(yōu)于常規(guī)LBP,這說明對描述子進行PCA變換具有明顯效果。表1給出了對不同算法在三種權(quán)威的人臉圖像庫中圖像識別率的統(tǒng)計情況,結(jié)果顯示,本文提出的算法識別率均超出了PCA、LBP和CS-LBP+WPCA算法。這說明PCA變換的主部特征提取結(jié)合LBP局部二值模式起到了明顯作用,主要歸功于LBP和PCA的降低特征向量的維度處理,即去除了特征向量冗余部分,進而使算法的計算效率得到提高。
表1 各種算法識別率比較
本文針對高效課堂考勤方式存在的弊端,提出了一種基于LBP與PCA變換結(jié)合的面部識別技術(shù),在LBP二值模式提取人臉局部特征的基礎(chǔ)上,再用PCA變換對其進行降維,通過增加LBP維數(shù)增加有效信息的獲取,再通過PCA降維處理來減小算法復(fù)雜度。結(jié)合后的特征能夠降低特征數(shù)據(jù)間的冗余,保證有效決策信息的保留。LBP和PCA算法的結(jié)合實現(xiàn)面部識別技術(shù)的有效互補。本算法在三種權(quán)威人臉圖像庫中進行測試,均體現(xiàn)了較好的識別性能,也表明本算法在面部識別上具有較好的魯棒性。
在大數(shù)據(jù)時代的背景下,PCA與LBP的學(xué)生面部識別考勤算法體現(xiàn)了大數(shù)據(jù)的思維,結(jié)合智能識別技術(shù)、計算機技術(shù)和網(wǎng)絡(luò)技術(shù),逐漸改變傳統(tǒng)點名方式,科學(xué)、高效的解決課堂點名的各類問題,極大的提高了課堂效率及教學(xué)質(zhì)量,促進高校學(xué)生管理系統(tǒng)良性發(fā)展。本課題的研究可為高校管理的智能化提供一定的借鑒和參考。
[1]王竹君.基于人臉檢測的移動點名系統(tǒng)研究與實現(xiàn)[D].云南:云南大學(xué),2014.
[2]黃金鈺,張會林.LBP直方圖與PCA的歐式距離的人臉識別[J].計算機系統(tǒng)應(yīng)用,2012,21(6):202-204.
[3]李德福,黃新.基于二維PCA和SVM算法的人臉識別系統(tǒng)[J].桂林電子科技大學(xué)學(xué)報,2017,37(5):391-395.
[4]趙玉丹.基于LBP的圖像文理特征的提取及應(yīng)用[D].西安:西安郵電大學(xué),2015.
[5]Ojala T,Pietik?inen M,M?enp?? T.Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[C].European Conference on Computer Vision,2000,24(7):404-420.
[6]利嘉頔,陳振學(xué),劉成云.分塊CS-LBP和加權(quán)PCA的低分辨率人臉識別[J].光電子激光,2016,27(2):210-216.