葉學(xué)義,錢丁煒,應(yīng)娜,王濤
(杭州電子科技大學(xué)模式識(shí)別與信息安全實(shí)驗(yàn)室,浙江 杭州 310018)
人臉識(shí)別因其廣泛的應(yīng)用領(lǐng)域、非侵入式且便利的采集方式[1],一直是被深入研究但又亟待突破的研究熱點(diǎn)。實(shí)際應(yīng)用中廣泛存在的,諸如光照、遮擋、姿態(tài)、表情等因素,依然是造成識(shí)別性能劇烈變化的主要原因,這些因素嚴(yán)重影響了人臉特征提取和表征的穩(wěn)定性。因此,尋求解決該問題的關(guān)鍵在于如何穩(wěn)定、有效地提取并表征人臉特征,提高人臉識(shí)別算法的穩(wěn)健性。其中,有效性是描述特征提取效果好壞的重要指標(biāo)之一,體現(xiàn)了提取的特征信息對(duì)于分類的作用大小,最直觀的表現(xiàn)為識(shí)別率的高低。
人臉特征提取的研究主要分為全局特征提取和局部特征[2]提取兩大類。全局特征提取著眼于人臉圖像的整體屬性,雖然具有較高的計(jì)算效率,但忽視了人臉細(xì)節(jié)的刻畫,對(duì)局部邊緣特征提取不充分。典型的方法有主成分分析(principal component analysis,PCA)[3]、線性判別分析(linear discriminant analysis,LDA)[4]等;局部特征提取專注于刻畫人臉的局部或者微紋理結(jié)構(gòu),對(duì)原始圖像進(jìn)行特定模式編碼,獲得對(duì)應(yīng)的特征圖,對(duì)于光照、表情、姿態(tài)等干擾的穩(wěn)健性較好。經(jīng)典方法有局部二值模式(local binary pattern,LBP)[5]、局部方向模式(local directional pattern,LDP)[6]等。這類方法識(shí)別速度非常快,能在速度與精度上取得一個(gè)有效平衡,得到了廣泛的研究。Ojala等[5]提出了局部特征提取經(jīng)典的LBP方法,該方法側(cè)重于利用中心像素與鄰域像素的灰度值差異,很好地刻畫了圖像紋理。由于僅利用灰度域二元像素點(diǎn)之間的大小關(guān)系編碼,梯度信息缺失,對(duì)光照、噪聲敏感。為了解決LBP存在的問題,Jabid等[6]提出了一種基于圖像邊緣響應(yīng)之間大小關(guān)系的局部方向模式,通過將圖像塊與Kirsch模板算子卷積,得到邊緣響應(yīng),記錄邊緣響應(yīng)最大的幾個(gè)位置并進(jìn)行編碼。該方法有效利用了一階梯度信息,對(duì)光照和噪聲的穩(wěn)健性有所提高,但識(shí)別時(shí)間較長(zhǎng),識(shí)別效果一般。為了使LDP編碼更加緊湊,Rivera等[7]提出了一種局部方向數(shù)(local directional number,LDN)模式,通過抓取最大和最小的邊緣響應(yīng)信息進(jìn)行編碼,減少了編碼位數(shù),提升了識(shí)別速度,編碼效率更高。但由于該方法只選取兩個(gè)極端邊緣響應(yīng)位置,特征不穩(wěn)定。在光照情況下,一階梯度信息對(duì)識(shí)別效果的提升不明顯。為了提取更深層次的梯度信息,李照奎等[8]提出了差值局部方向模式(difference local directional pattern,DLDP)算法,楊恢先等[9]提出了一種基于中心對(duì)稱局部方向模式(center- symmetric local directional pattern,CSLDP)的算法。其中,DLDP對(duì)鄰域內(nèi)邊緣響應(yīng)相鄰作差,找出最大的幾個(gè)邊緣響應(yīng)差值對(duì)應(yīng)的位置進(jìn)行編碼,利用了二階梯度信息,但編碼較復(fù)雜,僅考慮了近鄰邊緣響應(yīng)之間的強(qiáng)度變化,導(dǎo)致識(shí)別時(shí)間較長(zhǎng),識(shí)別效果不佳。CSLDP比較鄰域內(nèi)中心對(duì)稱邊緣響應(yīng)之間的強(qiáng)度關(guān)系,提升了識(shí)別速度,但特征信息太少,編碼穩(wěn)定性一般。王曉華等[10]提出了梯度中心對(duì)稱局部模式(gradient center symmetric local directional pattern,GCSLDP),同時(shí)利用了相鄰邊緣響應(yīng)差值信息與中心對(duì)稱邊緣響應(yīng)強(qiáng)度信息,識(shí)別率有所提升,但存在信息提取不完全和穩(wěn)定性較差的缺點(diǎn)?;谏疃葘W(xué)習(xí)的人臉識(shí)別方法在大規(guī)模的數(shù)據(jù)庫(kù)中達(dá)到了很高的識(shí)別精度,但這類方法需要大量的訓(xùn)練成本(包括時(shí)間成本和算力成本),對(duì)于數(shù)據(jù)庫(kù)的樣本數(shù)量要求也很高,適用于樣本數(shù)量充足、硬件算力強(qiáng)大的場(chǎng)景。而手工描述符方法屬于相對(duì)靈活的輕量級(jí)方法,對(duì)樣本數(shù)目和算力基本沒有要求,識(shí)別的實(shí)時(shí)性也很高,適用于大多數(shù)樣本數(shù)量不多、硬件算力一般的場(chǎng)景。
LBP、LDP、LDN等方法均利用一階灰度或梯度信息進(jìn)行編碼,對(duì)姿態(tài)、表情的穩(wěn)健性較高,但特征提取有效性有所欠缺。二階梯度帶來深層次信息的同時(shí),也增大了噪聲的影響。DLDP、CSLDP、GCSLDP等利用二階梯度編碼的方法,編碼穩(wěn)定性不足,對(duì)隨機(jī)噪聲、表情、姿態(tài)敏感。為了提升上述算法的穩(wěn)定性,Khadiri等[11]提出了基于排斥吸引模式的局部二階梯度輪廓(repulsive- and-attractive local binary gradient contours,RALBGC)算法,采用吸引模式局部微結(jié)構(gòu)編碼,使穩(wěn)定性得到了很大的提升,在抗干擾能力方面表現(xiàn)出優(yōu)異的性能,但人臉識(shí)別的有效性有所欠缺??紤]LBP、LDP、LDN等方法對(duì)干擾的穩(wěn)健性較高,但特征提取有效性不足[8]。DLDP、CSLDP、GCSLDP等方法提升了特征提取的有效性,但明顯降低了對(duì)干擾的穩(wěn)健性[12]。
吸引局部二階梯度輪廓(attractive local second gradient contours,ALSGC)模式引入二階梯度信息提升方法的有效性、提升方法對(duì)干擾的穩(wěn)健性,同時(shí)滿足有效性和對(duì)干擾的穩(wěn)健性要求。首先,將人臉圖像3×3鄰域與Kirsch模板算子卷積,得到對(duì)應(yīng)的邊緣響應(yīng)圖,再分別對(duì)邊緣響應(yīng)圖進(jìn)行吸引模式編碼,結(jié)合局部平均灰度值、鄰域中心灰度值和全局平均灰度值的吸引模式編碼,生成ALSGC碼。遍歷整個(gè)人臉圖像,最終將其轉(zhuǎn)化為與原圖大小一致的ALSGC人臉圖。然后,對(duì)ALSGC人臉圖進(jìn)行分塊,統(tǒng)計(jì)每個(gè)分塊中不同模式數(shù)的個(gè)數(shù),形成多個(gè)統(tǒng)計(jì)直方圖。最后,將統(tǒng)計(jì)直方圖中所有子塊的模式數(shù)級(jí)聯(lián),生成人臉圖像對(duì)應(yīng)的特征向量,用支持向量機(jī)分類器進(jìn)行分類識(shí)別。
排斥和吸引模式描述了像素的局部微結(jié)構(gòu),通過比較相鄰3個(gè)元素組成的三元組之間的大小關(guān)系,對(duì)圖像進(jìn)行吸引和排斥模式編碼,如圖1所示。一位二進(jìn)制編碼包含3個(gè)元素之間的細(xì)節(jié)信息,提取的信息更豐富,特征提取有效性更高;結(jié)合局部均值和全局均值,在紋理識(shí)別領(lǐng)域取得了不錯(cuò)的效果,初步證實(shí)了吸引排斥模式的理論可行性[11]。
圖1 吸引和排斥的微結(jié)構(gòu)(模式編碼)
圖1中,Ic表示局部鄰域中心像素的灰度值,Ik表示3×3局部鄰域的灰度值(k∈{0,1,…,7})。排斥和吸引算子分別將3×3局部鄰域中圍繞中心像素Ic的所有相鄰三元組劃分為兩類,即排斥與非排斥模式、吸引與非吸引模式。圖1舉例說明了兩個(gè)分別代表排斥和吸引模式的三元組,在圖1(a)中,由于I6像素點(diǎn)的灰度值比I5和I7的灰度值都大,三元組[I5,I6,I7]被定義為吸引模式。相反,在圖1(b)中,由于I7像素點(diǎn)的灰度值比I0和I6都小,三元組[I0,I7,I6]被定義為排斥模式。
基于上述排斥和吸引模式的概念,定義排斥和吸引模式的二進(jìn)制閾值函數(shù)v(?)和υ(?),具體定義如式(1)、式(2)所示。
吸引二元閾值函數(shù)(attractive binary thresholding function,ABTF)υ(?):
排斥二元閾值函數(shù)(the repulsive binary thresholding function,RBTF)v(?):
傳統(tǒng)的LDP特征提取算法對(duì)于特征提取的有效性以及對(duì)遮擋、表情、光照等干擾的穩(wěn)健性不能取得一個(gè)較好的平衡效果[12],基于這兩個(gè)方面,提出了ALSGC算法。
(1)對(duì)于特征提取的有效性:將人臉灰度圖轉(zhuǎn)變?yōu)檫吘夗憫?yīng)圖,對(duì)邊緣響應(yīng)圖進(jìn)行吸引模式編碼,得到吸引局部二階梯度輪廓特征圖,充分利用二階梯度空間的圖像細(xì)節(jié)信息,同時(shí)考慮中心像素灰度值、局部平均灰度值以及全局平均灰度值之間的關(guān)系,有效提取并表征圖像特征。
(2)對(duì)于干擾的穩(wěn)健性:該方法編碼有著較強(qiáng)的穩(wěn)定性。首先,一位編碼由3個(gè)邊緣響應(yīng)點(diǎn)決定,隨機(jī)噪聲與光照較難對(duì)編碼造成影響。其次,對(duì)相鄰邊緣響應(yīng)采用不對(duì)稱編碼,突出吸引模式編碼,在較大面積遮擋的情況下,該方法編碼受到的影響明顯小于其他對(duì)比方法。該方法對(duì)遮擋、光照、隨機(jī)噪聲等干擾的穩(wěn)健性明顯高于其他對(duì)比方法。
由于吸引排斥模式[11]對(duì)于局部微結(jié)構(gòu)的表征非常穩(wěn)定,抗干擾能力很強(qiáng),本文選擇吸引模式,在梯度域借鑒RALBGC在紋理識(shí)別中的編碼方式,以提取更深層次且穩(wěn)定的梯度判別特征,改進(jìn)同樣在梯度域編碼的LDP類人臉識(shí)別方法。
ALSGC編碼具體步驟如下。
首先,將人臉圖像3×3鄰域塊I與Kirsch算子[13]卷積Ma(a=0,1,2,3,4,5,6,7),對(duì)得到的8個(gè)方向的邊緣響應(yīng)取絕對(duì)值,得到ma(a=0,1,2,3,4, 5,6,7)。Kirsch算子如圖2所示。再引入吸引模式對(duì)ma進(jìn)行編碼,沿著中心點(diǎn)mc找出所有相鄰的邊緣響應(yīng)三元組,對(duì)其進(jìn)行吸引模式編碼,得到一串二進(jìn)制編碼,描述了二階梯度輪廓信息,提升了特征提取的有效性。為了提升對(duì)噪聲和單調(diào)灰度變化的穩(wěn)健性,引入局部平均灰度值μ:
圖2 Kirsch算子
其中,S表示以Ic為中心的3×3鄰域像素點(diǎn)數(shù),s表示對(duì)應(yīng)的像素序號(hào),Is表示對(duì)應(yīng)序號(hào)像素值。P表示分塊內(nèi)橫向像素點(diǎn)的個(gè)數(shù),Q表示分塊內(nèi)縱向像素點(diǎn)的個(gè)數(shù),I(p,q)表示以分塊左下角像素點(diǎn)為坐標(biāo)原點(diǎn),坐標(biāo)為p和q的像素點(diǎn)灰度值。
其次,結(jié)合局部平均灰度值μ、鄰域中心灰度值Ic和全局平均灰度值組成的吸引模式三元組,得到最終的二進(jìn)制編碼:
最后,將二進(jìn)制編碼gALSGC轉(zhuǎn)化為十進(jìn)制數(shù),即中心像素點(diǎn)x的ALSGC編碼值:
其中,ω9定義為:
如圖3所示,舉例展示了ALSGC的編碼過程。
圖3 ALSGC編碼過程
對(duì)應(yīng)排斥的局部二階梯度輪廓描述(repulsive local second gradient contour,RLSGC)算法的編碼過程將ALSGC的吸引模式編碼改為排斥模式編碼,其他與ALSGC算法相同。
根據(jù)上述編碼過程可知,三元組之間的大小關(guān)系一共有6種情況,兩種屬于排斥模式,兩種屬于吸引模式,兩種既不屬于排斥模式又不屬于吸引模式。既不屬于排斥又不屬于吸引的兩種情況,在ALSGC和RLSGC兩種編碼的情況下都為0。因此,在樣本較大的情況下,同一張圖片對(duì)應(yīng)ALSGC的編碼必然存在長(zhǎng)度為編碼總長(zhǎng)度1/3的編碼為0的子編碼段,RLSGC的編碼也是如此,前后這兩段子編碼數(shù)值均為0,位置完全重合;而ALSGC編碼中剩余的長(zhǎng)度為編碼總長(zhǎng)度2/3的子編碼段,在零一取反后,則成為了RLSGC對(duì)應(yīng)位置的編碼段,兩種編碼方式之間信息高度冗余。
對(duì)于同類的不同樣本,結(jié)合ALSGC和RLSGC的編碼方式,相對(duì)于ALSGC或RLSGC單一的編碼方式,增加了同類的不同樣本之間的差異,增加了類間距離,降低了識(shí)別效果。對(duì)于不同類的不同樣本,不一定能增加類間距離。綜合來看,結(jié)合ALSGC和RLSGC的編碼方法在人臉特征提取中無法獲得比單獨(dú)使用兩種編碼方法更好的識(shí)別效果。
ALSGC吸引模式占比為1/3,編碼為1,非吸引模式占比為2/3,編碼為0,隨機(jī)噪聲可能會(huì)使三元組在不同的非吸引模式間變化,相對(duì)于其他對(duì)比方法,不易導(dǎo)致ALSGC編碼發(fā)生變化。
在黑塊極限遮擋情況下,白塊同理,人臉圖像前后對(duì)比如圖4所示。
圖4 人臉圖像在黑塊極限遮擋情況下對(duì)比
為客觀描述不同編碼方法受遮擋影響程度的大小,定義編碼信息損失函數(shù)如下:
其中,M和N分別表示遮擋塊的縱向像素點(diǎn)數(shù)和橫向像素點(diǎn)數(shù);m、n分別表示在遮擋塊內(nèi),以遮擋塊左上角像素點(diǎn)為原點(diǎn),豎直方向與原點(diǎn)相隔的距離和水平方向與原點(diǎn)相隔的距離;L表示當(dāng)前方法每個(gè)像素點(diǎn)編碼串的長(zhǎng)度;l表示編碼串中每個(gè)編碼的位置;δ(m,n,l)表示坐標(biāo)為(m,n)的像素點(diǎn)中第l位編碼在遮擋前后的變化情況,具體計(jì)算式為:
其中,Code(m,n,l)和Code'(m,n,l)分別表示遮擋前后坐標(biāo)為(m,n)的像素點(diǎn)中第l位編碼的值。
LBP算法是根據(jù)中心像素點(diǎn)灰度值和3×3鄰域像素點(diǎn)灰度值之間的大小關(guān)系進(jìn)行編碼,在極限遮擋和樣本足夠大的情況下,LBP編碼從0、1各占一半的情況變?yōu)槿?或全1,ΔCLBP=1/2。LDP、LDN、DLDP、CSLDP、GCSLDP等算法根據(jù)3×3鄰域邊緣響應(yīng)之間的二元組大小關(guān)系進(jìn)行編碼,在極限遮擋的情況下,依靠相鄰邊緣響應(yīng)或?qū)ΨQ邊緣響應(yīng)二元組大小關(guān)系的編碼幾乎遭到了完全破壞,趨于隨機(jī)分布,ΔC≈1在不考慮第一位均值編碼的情況下,ASLGC算法由于不對(duì)稱編碼的特性,約1/3的編碼為1,2/3的編碼為0;在遮擋前后,改變的編碼位數(shù)只占編碼總長(zhǎng)度的1/3,即ΔC≈1/3。因此,ALSGC編碼與其他對(duì)比方法相比,對(duì)于較大面積的遮擋有著較強(qiáng)的穩(wěn)定性。
通過圖5例子來驗(yàn)證ALSGC的穩(wěn)定性。圖5中,將原始圖像塊隨機(jī)增減一個(gè)數(shù)表示噪聲,將第3行像素值都增加5表示光照變化,將第1行和第1列設(shè)置為近似相等的像素值表示遮擋1和遮擋2。
由圖5可知,與原始圖像塊中各種算法的編碼進(jìn)行對(duì)比,在添加噪聲情況下,LDP、LDN、DLDP、CSLDP、GCSLDP編碼值發(fā)生了變化;在光照變化情況下,LBP編碼值發(fā)生了變化;在遮擋1情況下,LBP、LDP、LDN、DLDP、CSLDP、GCSLDP編碼值都發(fā)生了變化;在遮擋2情況下,CSLDP編碼值發(fā)生變化。在所有情況下,只有ALSGC編碼值不發(fā)生變化,穩(wěn)定性較強(qiáng),體現(xiàn)了ALSGC對(duì)遮擋、光照、隨機(jī)突變?cè)肼暤姆€(wěn)健性。
圖5 算法編碼穩(wěn)定性
人臉識(shí)別流程如圖6所示,具體流程如下。
圖6 人臉識(shí)別流程
(1)使用Kirsch算子對(duì)人臉圖像進(jìn)行邊緣檢測(cè)并通過ALSGC編碼對(duì)得到的邊緣響應(yīng)進(jìn)行特征提取,獲得對(duì)應(yīng)的特征圖。
(2)對(duì)特征圖進(jìn)行不重疊分塊處理,并對(duì)每個(gè)分塊逐一統(tǒng)計(jì)分塊內(nèi)不同模式編碼的個(gè)數(shù),形成對(duì)應(yīng)子塊的統(tǒng)計(jì)直方圖(統(tǒng)計(jì)直方圖的橫坐標(biāo)為不同的模式編碼值,縱坐標(biāo)為不同模式編碼值在子塊中的出現(xiàn)次數(shù))。
(3)將統(tǒng)計(jì)直方圖中所有子塊的模式數(shù)進(jìn)行級(jí)聯(lián),作為該幅人臉圖像的特征向量。
(4)利用支持向量機(jī)分類器進(jìn)行分類,完成識(shí)別。
為了驗(yàn)證本算法的性能,本研究選擇在CAS-PEAL[14]、ORL[15]、GT[16]人臉數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn),這些數(shù)據(jù)庫(kù)分別包含了表情、遮擋、光照、姿態(tài)、突變?cè)肼暤雀蓴_。為客觀比較本文算法和其他算法,本實(shí)驗(yàn)均采用10×10的分塊(即將待編碼圖像分為100幅子圖,每幅子圖大小為待編碼圖像大小的1/100)。為驗(yàn)證算法有效性,本文選擇與LBP、LDP、LDN、DLDP、CSLDP、GCSLDP等進(jìn)行比較。實(shí)驗(yàn)所用硬件設(shè)備為AMD Ryzen 5 4600U,RAM為16 GB,仿真環(huán)境為MATLAB R2018b。
CAS-PEAL人臉庫(kù)包含了1 040名中國(guó)人共99 450幅頭肩部圖像,包含了姿態(tài)、表情、背景、飾物、光照、距離、時(shí)間7個(gè)子庫(kù)??紤]實(shí)際應(yīng)用中對(duì)人臉識(shí)別性能影響最明顯的干擾因素,本文選取其中的表情、飾物、光照子庫(kù)進(jìn)行實(shí)驗(yàn),其中表情子庫(kù)包含376人共1 880幅圖像,飾物子庫(kù)包含433人共2 598幅圖像,光照子庫(kù)包含232人共2 088幅圖像,部分樣本如圖7所示。
圖7 CAS-PEAL人臉庫(kù)部分樣本
為保證實(shí)驗(yàn)的準(zhǔn)確性,在每類人臉樣本中隨機(jī)選取k張圖片作為訓(xùn)練樣本,剩下的圖片作為測(cè)試樣本,取重復(fù)計(jì)算50次的均值作為最終識(shí)別率。實(shí)驗(yàn)結(jié)果見表1~表3。
表1 在CAS-PEAL表情子庫(kù)上的識(shí)別率
表3 在CAS-PEAL光照子庫(kù)上的識(shí)別率
由表1可知,在表情子庫(kù)下,大部分算法識(shí)別效果較好,但本文算法有著明顯的優(yōu)勢(shì)。LDP、LDN等方法通過比較邊緣響應(yīng)的大小進(jìn)行編碼,受到的影響較小,識(shí)別效果普遍較高,DLDP、CSLDP、GCSLDP等方法通過對(duì)邊緣響應(yīng)計(jì)算差值后進(jìn)行編碼,容易受到表情、隨機(jī)噪聲的影響,編碼不穩(wěn)定,識(shí)別效果一般。本文方法依靠三元組不對(duì)稱編碼,編碼穩(wěn)定,對(duì)表情與隨機(jī)噪聲穩(wěn)健性好。
在飾物子庫(kù)下,人臉的一些部位被遮擋了,對(duì)識(shí)別效果造成了不小的影響。此時(shí),降低遮擋對(duì)于算法編碼的影響就尤為重要。對(duì)于大部分對(duì)比算法,遮擋區(qū)域的編碼與該區(qū)域無遮擋時(shí)的編碼相差很大,對(duì)于分類識(shí)別的貢獻(xiàn)大大降低,但對(duì)于依靠吸引模式三元組進(jìn)行不對(duì)稱編碼的ALSGC算法,遮擋區(qū)域的編碼與該區(qū)域無遮擋時(shí)的編碼相差較小。ALSGC編碼受遮擋的影響更小,與未遮擋時(shí)的編碼更接近,因此識(shí)別效果更好。由表2可知,在隨機(jī)選取2張人臉圖像作為訓(xùn)練樣本的情況下,ALSGC算法相比LBP、LDP、LDN、DLDP、CSLDP、GCSLDP分別提高了8.7%、8.79%、7.35%、7.01%、7.6%、6.68%。
表2 在CAS-PEAL飾物子庫(kù)上的識(shí)別率
在光照子庫(kù)下,人臉圖像會(huì)受到來自不同方向、不同程度的光照影響。LBP在灰度域進(jìn)行編碼,主要利用圖像灰度值差異,刻畫圖像紋理,側(cè)重于描述局部圖像整體信息,表現(xiàn)欠佳。LDP主要利用局部圖像的邊緣響應(yīng),抓住邊緣響應(yīng)絕對(duì)值最大的幾個(gè)方向進(jìn)行編碼,效果有所提升,但無法精確定位最主要的紋理方向。LDN在LDP的基礎(chǔ)上,抓住最大和最小的邊緣響應(yīng)值,相比之下,編碼不容易受到影響。但在人臉圖像的平滑區(qū)域?qū)υ肼暠容^敏感,會(huì)對(duì)識(shí)別效果產(chǎn)生負(fù)面影響。DLDP方法通過對(duì)相鄰邊緣響應(yīng)計(jì)算差值進(jìn)行編碼,提取了更深層次的梯度特征。CSLDP通過對(duì)中心對(duì)稱方向上的邊緣響應(yīng)計(jì)算差值進(jìn)行編碼,可以體現(xiàn)邊緣的大致紋理方向,但是由于編碼信息太少,難以大幅提升識(shí)別效果。GCSLDP則結(jié)合了CSLDP提取的中心對(duì)稱差值信息和DLDP提取的相鄰差值信息,提升了識(shí)別率。本文算法對(duì)相鄰邊緣響應(yīng)采用了吸引模式三元組不對(duì)稱編碼,結(jié)合全局均值、中心灰度值與局部均值的三元組編碼,不僅有效利用了梯度信息,還極大提升了編碼的穩(wěn)定性。由表3可知,在隨機(jī)選取4張人臉圖像作為訓(xùn)練樣本的情況下,ALSGC算法相比LBP、LDP、LDN、DLDP、CSLDP、GCSLDP分別提高了39.58%、36.13%、23.58%、23.75%、7.9%、2.3%。
綜合表1、表2、表3可以發(fā)現(xiàn),在CAS-PEAL表情、飾物、光照3個(gè)人臉子庫(kù)上,隨著訓(xùn)練樣本與測(cè)試樣本比例的增加,所有算法的識(shí)別率均不斷增加,但ALSGC算法相對(duì)于其他算法,由于特征提取有效性最高,特征編碼最為穩(wěn)定,識(shí)別率始終處于領(lǐng)先地位,尤其是在飾物子庫(kù)、光照子庫(kù),本文算法的優(yōu)勢(shì)更加明顯。實(shí)驗(yàn)數(shù)據(jù)也驗(yàn)證了第1.3節(jié)中編碼穩(wěn)定性分析,只有ALSGC在噪聲、光照、遮擋1、遮擋2的情況下編碼保持穩(wěn)定不變,體現(xiàn)了ALSGC對(duì)于光照和遮擋的穩(wěn)健性。
ORL人臉庫(kù)由英國(guó)劍橋大學(xué)的Olivetti實(shí)驗(yàn)室創(chuàng)建,包含40名志愿者的400張人臉樣本,主要包含姿態(tài)和表情變化,分辨率為112 dpi×92 dpi,實(shí)驗(yàn)中選擇歸一化到100 dpi×100 dpi分辨率下,部分樣本如圖8所示。
圖8 ORL人臉庫(kù)部分樣本
為保證實(shí)驗(yàn)的準(zhǔn)確性,在每類人臉樣本中隨機(jī)選取k張圖片作為訓(xùn)練樣本,剩下的10?k張圖片作為測(cè)試樣本,取重復(fù)計(jì)算50次的均值作為最終識(shí)別率。實(shí)驗(yàn)結(jié)果見表4。
表4 各種算法在ORL人臉庫(kù)上的識(shí)別率
ORL人臉庫(kù)中,表情和姿態(tài)的變化考驗(yàn)算法對(duì)于紋理變化的穩(wěn)健性。由表4可以發(fā)現(xiàn),DLDP、CSLDP、GCSLDP通過對(duì)邊緣響應(yīng)計(jì)算差值后進(jìn)行編碼,相當(dāng)于再次計(jì)算了一次梯度,雖然能提取更深層次的信息,但是也放大了噪聲變化帶來的影響。LDP、LDN等方法通過比較邊緣響應(yīng)的大小進(jìn)行編碼,受到的影響較小。本文算法利用吸引模式進(jìn)行編碼,同時(shí)利用中心像素的灰度信息,引入局部二階梯度輪廓信息,相較對(duì)比方法,可以更好地抓住紋理信息,特征提取更有效,穩(wěn)定性更高,性能更好。在訓(xùn)練樣本與測(cè)試樣本比例為1:1時(shí),本文算法相比LBP、LDP、LDN、DLDP、CSLDP、GCSLDP分別提高了2.83%、3.66%、2.24%、3.53%、4.45%、6.44%。
為進(jìn)一步驗(yàn)證ALSGC算法對(duì)噪聲的穩(wěn)健性,在GT人臉庫(kù)進(jìn)行了噪聲實(shí)驗(yàn),GT人臉庫(kù)包含50個(gè)人的750張不同角度、不同表情的正面照片,部分樣本如圖9所示。
圖9 GT人臉庫(kù)部分樣本
本文在每類人的15張樣本中隨機(jī)選取5張作為訓(xùn)練樣本,剩余10張作為測(cè)試樣本。隨后對(duì)每幅圖像添加椒鹽噪聲,添加噪聲的比例為0~40%。不同百分比噪聲情況下的樣本圖像如圖10所示。
圖10 不同百分比噪聲下的圖像
同時(shí)為了客觀描述不同算法識(shí)別效果受噪聲影響的程度,定義識(shí)別率下降速度函數(shù)[17],計(jì)算式為:
其中,r表示未加噪聲的識(shí)別率,f表示受到噪聲影響后的識(shí)別率,δ表示識(shí)別率的下降速度,δ越高表示算法抗噪聲能力越差。各種算法在不同百分比噪聲下的識(shí)別率見表5。
表5 GT人臉庫(kù)噪聲實(shí)驗(yàn)結(jié)果
為了提升人臉特征提取的有效性與特征編碼的穩(wěn)定性,進(jìn)一步提高人臉識(shí)別性能,本文提出了一種基于吸引二階梯度局部輪廓模式(ALSGC)的人臉識(shí)別算法。該算法通過吸引模式編碼,更加深入、有效地提取二階梯度輪廓信息,克服了LDP、LDN等算法提取一階梯度信息導(dǎo)致的特征提取有效性不足的缺點(diǎn),同時(shí)ALSGC采用三元組編碼,提升了編碼的穩(wěn)定性,避免了DLDP、CSLDP、GCSLDP等算法由于引入二階梯度帶來的噪聲敏感問題。而且由于ALSGC編碼不對(duì)稱性,對(duì)遮擋尤其是大面積遮擋,編碼受遮擋的影響程度是上述算法中最小的。實(shí)驗(yàn)數(shù)據(jù)也表明,ALSGC算法既保證了特征提取的有效性,又對(duì)干擾有較強(qiáng)的穩(wěn)健性。在光照、隨機(jī)噪聲、表情、遮擋、姿態(tài)等變化下,本文算法能夠達(dá)到更高的識(shí)別率,證明了算法的紋理特征描述能力與穩(wěn)健性。但是三元組編碼帶來穩(wěn)定性的同時(shí),提高了計(jì)算復(fù)雜度,后續(xù)將針對(duì)該問題進(jìn)行研究。