国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種非限制性條件下人臉識別的方法

2018-07-13 03:23林椹尠李相宇惠小強
西安郵電大學(xué)學(xué)報 2018年2期
關(guān)鍵詞:原始數(shù)據(jù)人臉特征提取

林椹尠,李相宇,惠小強

(1.西安郵電大學(xué) 理學(xué)院, 陜西 西安 710121; 2.西安郵電大學(xué) 通信與信息工程學(xué)院,陜西 西安 710121;3.西安郵電大學(xué) 物聯(lián)網(wǎng)與兩化融合研究院, 陜西 西安 710061)

人臉識別作為生物特征識別領(lǐng)域的重要方法之一,因其具有非接觸性和不易竊取性的特點,已經(jīng)被廣泛的應(yīng)用于安全監(jiān)控、人機交互、人工智能以及電子商務(wù)安全中。人臉識別受到數(shù)據(jù)中面部姿態(tài)、圖片顏色、圖像大小、背景環(huán)境等條件的影響,通??蓪⑷四樧R別分為限制性條件下和非限制性條件下的兩種識別類型。在限制性條件下,人臉數(shù)據(jù)多為單一背景下,正面姿態(tài)的單人灰度頭像的識別。在非限制性條件下,人臉數(shù)據(jù)大多是從真實環(huán)境中采集,并綜合了臉部的姿態(tài)、光照、表情、背景等多種影響因素,更具有實際應(yīng)用價值[1-3]。

基于支持向量機(Support Vector Machine,SVM)算法[4-5],基于主成份分析法[6-7](Principal Component Analysis,PCA)和基于方向梯度直方圖(Histogram of Oriented Gradient,HOG)算法[8-9],是較為常用的人臉識別算法。SVM算法通過對核函數(shù)的優(yōu)化和分類算法的改進來進行人臉識別,由于其提取圖像的全部特征,計算量較大,故不適用于大數(shù)據(jù)的快速識別;PCA是對全局進行特征提取,降低了特征的維度,但識別準確率受光照的影響較大;基于HOG特征提取的方法,不受光照和幾何形變的影響,其計算量依然較大。在限制性條件下,如同一背景下的人臉識別和單一表情下的人臉識別,上述3種算法均具有較高的識別準確率。在非限制條件下的人臉識別問題,由于數(shù)據(jù)中保留較多的冗余信息,使得算法的計算量較大,尤其是在樣本量較少的情況下,這三種算法的識別準確率不高。

針對非限制性條件下人臉識別算法計算量大及識別準確率較低的問題,本文將Haar特征分類器[10]引入到原始數(shù)據(jù)的預(yù)處理過程中,結(jié)合HOG特征提取、快速PCA降維處理和SVM分類算法,構(gòu)建了一種針對非限制性條件下的人臉識別方法。

1 原始數(shù)據(jù)預(yù)處理

圖1是在非限制性條件下獲取的部分人臉圖像數(shù)據(jù)。從中可見部分人臉數(shù)據(jù)的背景、人臉的偏轉(zhuǎn)角度、面容姿態(tài)和表情等都存在著較大的差別,并且存在數(shù)據(jù)成像效果較差或人臉不完整的情況,這些數(shù)據(jù)均不能用做人臉識別中分類模型的訓(xùn)練樣本。

圖1 非限制性條件下的人臉圖像

為了減小圖像中存在的噪聲對人臉識別準確率的影響,使得特征提取和人臉識別具有較高的魯棒性,在訓(xùn)練樣本進行特征提取之前,需要對原始數(shù)據(jù)先進行預(yù)處理。原始數(shù)據(jù)的預(yù)處理包括從人臉數(shù)據(jù)庫中讀取原始數(shù)據(jù)和人臉區(qū)域的檢測與提取兩個部分,其流程如圖2所示。

圖2 原始數(shù)據(jù)預(yù)處理流程

1.1 讀取原始數(shù)據(jù)

非限制性條件下,原始數(shù)據(jù)因其采集方式不同,部分人臉圖像無法用于分類模型的訓(xùn)練,在讀取數(shù)據(jù)之前,需要將這部分數(shù)據(jù)舍棄??紤]到人臉數(shù)據(jù)庫中樣本命名方式不同,為了實現(xiàn)樣本數(shù)據(jù)的大批量的讀取以及有序化保存,本文采用OpenCV跨平臺計算機視覺庫,通過C++編程實現(xiàn)原始數(shù)據(jù)的批量讀取與有序化保存[11]。經(jīng)過有序化保存后的樣本數(shù)據(jù)方便于人臉的檢測與提取快速實現(xiàn)。

1.2 人臉的檢測與提取

考慮到在非限制性條件下,人臉識別中原始的樣本數(shù)據(jù)存在著大量的冗余信息和干擾信息。為了優(yōu)化實驗樣本,在原始數(shù)據(jù)預(yù)處理階段引入Haar特征分類器,去除人臉區(qū)域外冗余信息和干擾信息,并對讀取的數(shù)據(jù)進行人臉的檢測和人臉區(qū)域的提取。在提取過程中,考慮到原始數(shù)據(jù)為彩色圖像,直接讀取將得到較大的數(shù)據(jù)量并且容易出現(xiàn)誤檢或漏檢的情況。首先,為了降低圖像的數(shù)據(jù)量,對原始數(shù)據(jù)進行灰度化處理。然后,為了弱化光照的影響,增強圖像的對比度,對灰度化處理后的圖像進行直方圖均衡化處理[12],其效果如圖3所示。再利用Haar特征分類器,對處理后的數(shù)據(jù)進行人臉的檢測與提取,圖4為人臉檢測和人臉區(qū)域的提取結(jié)果。

經(jīng)過預(yù)處理后的數(shù)據(jù)統(tǒng)一保存為64×128像素,每一類樣本均以從小到大的序列命名并存儲。這樣就得到了用于特征提取的樣本圖像數(shù)據(jù)。

圖3 灰度化及直方圖均衡化的圖像

圖4 人臉區(qū)域的檢測與提取

2 特征提取與降維處理

2.1 HOG特征提取

方向梯度直方圖(HOG)是由Dalal等在2005年提出,用于對行人進行檢測[13]。HOG特征具有較強的魯棒性,其對光照變化和幾何變化都不敏感,并且HOG特征的計算量較少。因此,采用方向梯度直方圖對樣本圖像數(shù)據(jù)進行特征提取。

假設(shè)I(x,y)表示樣本圖像像素點的位置;Gx(x,y)和Gy(x,y)分別表示像素點梯度向量在水平和垂直方向上的分量;G(x,y)表示梯度向量的大小;θ(x,y)表示梯度向量的與水平方向的夾角,像素點梯度向量在水平和垂直方向上的分量梯度分量定義[13]為

Gx(x,y)=I(x+1,y)-I(x-1,y),

(1)

Gy(x,y)=I(x,y+1)-I(x,y-1).

(2)

(3)

(4)

式(1)(2)可分別計算出各像素點(x,y)在水平及垂直方向上的梯度分量,式(3)(4)分別計算出各像素點的梯度幅值及梯度方向。

根據(jù)實驗樣本的像素大小,在HOG特征提取的過程中,選用8×8像素的單元對64×128像素的窗口進行劃分,共形成了128個單元,其中相鄰的單元不重疊。然后,把4個單元組成16×16像素的塊,共組成105個塊,其中塊的步進大小為8個像素,水平方向的塊數(shù)為7,垂直方向的塊數(shù)為15。最后,對每個單元統(tǒng)計方向梯度直方圖,將所有梯度方向劃分為9個角度區(qū)間,作為直方圖的橫軸,角度范圍所對應(yīng)的梯度值累加值作為直方圖縱軸,每個角度區(qū)間劃分如圖5。這樣,一個塊就具有36個特征值,然后,將105個塊的特征值串聯(lián)起來,得到了一個樣本的3780維HOG特征。

圖5 角度區(qū)間劃分

2.2 快速PCA降維處理

對于人臉識別問題,其樣本特征維度往往遠高于樣本數(shù)。本文的樣本數(shù)據(jù)為8192(64×128)維,即使是所提取的HOG特征,也達到3780維。對于PCA算法中協(xié)方差矩陣的求解,其計算數(shù)據(jù)量為3780×3780維,這將導(dǎo)致運算數(shù)據(jù)量很大,程序運行時間較長[7]。為了快速有效地降低樣本維度,使用快速PCA的方法[14]來求解樣本HOG特征矩陣的特征值及特征向量。

設(shè)Z為樣本HOG特征矩陣,ZT為樣本特征矩陣的轉(zhuǎn)置,構(gòu)造矩陣T=Z×ZT。設(shè)T的前k個特征值D和特征向量W,其中k為樣本數(shù)。對非正定矩陣P,若

P-1×(Z×ZT)×Z=S,

則等價于

P-1×(ZT)-1×ZT×Z×ZT×P=S,

所以,

(ZT×P)-1×ZT×Z×(ZT×P)=S,

可以看出,ZT×Z的特征向量為ZT×P,而Z×ZT的特征向量矩陣為P,即W=P。由ZT×Z和Z×ZT的特征向量相同可得,快速PCA算法中協(xié)方差矩陣的特征向量[14]為V=ZT×W,其中V表示協(xié)方差矩陣的特征向量。

對提取的HOG特征進行快速PCA降維處理之前,需要先對數(shù)據(jù)進行零均值歸一化預(yù)處理[14]。再利用快速PCA降維算法求出樣本矩陣的特征值及特征向量。為了使特征向量V作為低維空間的基向量,則需要特征向量V進行歸一化處理,使特征向量V′滿足正交化和歸一化條件。由樣本矩陣Z和低維空間基向量V′得到樣本的PCA最終值為Zpca=Z×V′,其中Zpca表示最終的樣本矩陣。

可以看出,經(jīng)過PCA降維處理后的數(shù)據(jù)維度,由3780維減少到了k維,即維數(shù)與樣本數(shù)相等。這樣,就有效地減少了數(shù)據(jù)量,能加快運行速度。

3 人臉識別

3.1 數(shù)據(jù)歸一化處理

經(jīng)HOG特征提取和PCA降維處理后得到特征數(shù)據(jù),但同一樣本中不同特征分量的數(shù)值大小存在著較大的差異性。為了更方便地應(yīng)用支持向量機(SVM)分類識別,使數(shù)據(jù)具有可比較性,在進行分類和識別之前,對數(shù)據(jù)再進行歸一化處理。

采用中值歸一化方法[15]把同一樣本的數(shù)據(jù)歸一化到[-1,1]之間,即

其中,Xfinal為歸一化處理后的數(shù)據(jù),X為原始數(shù)據(jù),Xmax為原始數(shù)據(jù)中的最大值,Xmin為原始數(shù)據(jù)中的最小值。經(jīng)中值歸一化處理后的樣本數(shù)據(jù),將用于人臉識別的最終數(shù)據(jù),但是樣本數(shù)據(jù)特征量較多,且樣本數(shù)量不多。

3.2 基于SVM的人臉識別

根據(jù)SVM算法對小樣本、高維度的數(shù)據(jù)具有強大的分類能力特點,在人臉識別階段選用SVM算法對樣本進行分類并識別。

SVM算法通過尋找不同樣本間的最優(yōu)超平面,將不同的類別區(qū)分而進行分類。最優(yōu)超平面可以表示[16]為

其中,sign為符號函數(shù),αi為Lagrange乘子,yi為分類標志,φ(x)為x的高維映射函數(shù)。通過核函數(shù)k(x·xi)代替φ(x)·φ(xi),上式變?yōu)?/p>

最終得到最優(yōu)分類超平面。

基于SVM的人臉識別包括模型的訓(xùn)練和樣本的測試兩個部分。本文采用線性核函數(shù),對訓(xùn)練樣本進行訓(xùn)練并對SVM算法中的參數(shù)進行優(yōu)化,得到最終的訓(xùn)練模型。然后,用訓(xùn)練好的模型對測試樣本進行測試,得到人臉識別的準確率和測試時間。

4 實驗與結(jié)果分析

4.1 實驗環(huán)境

實驗環(huán)境分別為硬件環(huán)境和軟件平臺兩個部分。硬件環(huán)境包括一臺PC機,Windows 7_64位操作系統(tǒng),處理器為Intel(R) Core(TM) i5-2450M CPU @ 2.50GHz,內(nèi)存為4.0G等;軟件平臺為Visual Studio 2015,OpenCV 3.2.0,MATLAB R2015b等。

在MATLAB平臺中使用libsvm工具包,是由臺灣大學(xué)林智仁(Lin Chih-Jen)教授等開發(fā)所設(shè)計的SVM模式識別與回歸的軟件包[17]。

4.2 實驗數(shù)據(jù)庫

實驗數(shù)據(jù)選用非限制性條件下的LFW人臉庫。LFW人臉庫中包含5749人,共13233幅圖像,圖像像素為250×250。實驗過程中以數(shù)據(jù)量大于40張的人臉圖像作為實驗樣本,共選出14個實驗樣本,如圖6所示。

圖6 實驗樣本

通過以下4種方式進行模型的訓(xùn)練和樣本的測試:

(1)選擇各類中的10張作為實驗樣本,其中,5張作為訓(xùn)練樣本,5張作為測試樣本;

(2)選擇各類中的20張作為實驗樣本,其中,10張作為訓(xùn)練樣本,10張作為測試樣本;

(3)選擇各類中的30張作為實驗樣本,其中,15張作為訓(xùn)練樣本,15張作為測試樣本;

(4)選擇各類中的40張作為實驗樣本,其中,20張作為訓(xùn)練樣本,20張作為測試樣本。

4.3 實驗過程

實驗仿真包括實驗樣本的預(yù)處理和分類識別兩個階段。首先,在OpenCV搭建的實驗平臺上完成原始數(shù)據(jù)的灰度化和直方圖均衡化處理、人臉特征區(qū)域的提取和數(shù)據(jù)的有序化保存,預(yù)處理后的數(shù)據(jù)如圖7所示。然后,在MATLAB平臺上,對分類提取的4種不同數(shù)量的實驗樣本進行HOG特征提取、快速PCA降維處理、數(shù)據(jù)歸一化和SVM分類等過程,記錄下4種不同數(shù)量的樣本的識別準確率,同時,記錄5次測試階段的識別時間并取平均值作為最終的識別時間。

在預(yù)處理階段的數(shù)據(jù)有序化保存時,對64×64像素和64×128像素兩種格式的識別準確率進行對比。測試結(jié)果顯示,64×64像素的識別準確率為89.28%,低于64×128像素的93.57%,所以,把預(yù)處理后的數(shù)據(jù)全部保存為64×128像素。

圖7預(yù)處理后的部分樣本

4.4 實驗結(jié)果對比分析

為了驗證本文方法的有效性,采用比較的方法,分別把本文方法與SVM算法、PCA+SVM算法、HOG+SVM算法在相同實驗條件下人臉識別的效果進行了對比。分別取4種算法在4種不同數(shù)量實驗樣本情況下的人臉識別率,實驗結(jié)果如表1所示,測試識別時間對比結(jié)果如圖8所示。

由表1可見,4種算法的識別準確率都隨著訓(xùn)練樣本數(shù)的增加有明顯的提高。在相同數(shù)量的訓(xùn)練樣本和測試樣本的情況下,直接對原始數(shù)據(jù)使用SVM算法的識別準確率最低,PCA+SVM算法和HOG+SVM算法的識別率雖然有所提高,但是其識別率依然較低。本文方法在實驗樣本數(shù)較多和較少的情況下,其識別準確率均優(yōu)于其他3種算法,在最大樣本量的識別準確率可以達到93.57%。從圖8中可知,本文方法不僅提升了識別準確率,而且其識別用時較小,提高了識別的速度。SVM算法在測試階段的識別時間隨著實驗樣本數(shù)的增加而增大,雖然,HOG+SVM算法識別時間有所減少,但是,其識別時間仍受到實驗樣本數(shù)的影響。本文方法和PCA+SVM算法的用時基本相同,而且受實驗樣本數(shù)的影響不大。

表1 不同算法的識別準確率

圖8測試識別時間對比

5 結(jié)束語

為了改善非限制性條件下的人臉識別準確率較低的問題,提出了一種結(jié)合Haar特征分類器、HOG特征提取和快速PCA降維處理的人臉識別改進方法。通過與SVM算法、PCA算法以及HOG算法的對比實驗表明,該方法相較于其他3種算法具有較高的識別率,較短測試識別時間,且在較少樣本下情況下,識別率相對較高。但是,在有遮擋物和偏轉(zhuǎn)角度較大情況下,本文算法的人臉識別率不理想,算法還需做進一步的改進。

猜你喜歡
原始數(shù)據(jù)人臉特征提取
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
有特點的人臉
一起學(xué)畫人臉
受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
基于Daubechies(dbN)的飛行器音頻特征提取
三國漫——人臉解鎖
全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實時傳感技術(shù)實現(xiàn)5 級自動駕駛
Bagging RCSP腦電特征提取算法
基于MED和循環(huán)域解調(diào)的多故障特征提取