張波 武高雨
摘要:人臉表情的主要信息集中在人的眉毛、眼睛、嘴巴等特征中。但是,人臉中還存在影響表情描述的干擾信息,并且特征向量會受這些信息的影響。為了盡可能減少這種干擾信息的含量,提出一種權(quán)值優(yōu)化LGC特征直方圖的方法。首先,提取基于LGC算子的特征直方圖,其次,使用權(quán)值對特征直方圖進(jìn)行優(yōu)化,最后,使用支持向量機(jī)對提取的特征進(jìn)行分類。實(shí)驗(yàn)證明,該方法可以有效地提高面部表情的識別率。
關(guān)鍵詞:表情識別;權(quán)值優(yōu)化;LCC特征直方圖;支持向量機(jī)
中圖分類號:TP3-05 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)34-0192-02
1 概述
人與機(jī)器之間的高級智能交互是研究表情識別的重要目標(biāo)之一,而面部表情識別(Facial expression recognition,F(xiàn)ER)是實(shí)現(xiàn)這一目標(biāo)的必經(jīng)階段。表情識別的內(nèi)容主要包括:1)圖像預(yù)處理;2)人臉檢測;3)表情特征提取;4)表情分類。
在整個(gè)面部表情識別過程中,最重要的是表情特征提取。相較于其他特征提取方法,局部特征的方法對姿態(tài)變化、遮擋以及光照等因素的影響具有較強(qiáng)魯棒性,其中局部二進(jìn)制模式[1](LBP)和Gabo[2]小波變換是最具有代表性的兩種方法。Ga-bor小波變換能夠檢測出多尺度、多方向紋理的變化,但是它的特征尺度巨大并且耗時(shí)相對較長。
和Gabor小波變換相比,LBP算法可以快速提取面部表情特征,并且具有強(qiáng)大的紋理識別能力。傳統(tǒng)的LBP算法是通過對中心像素與周圍的八個(gè)像素進(jìn)行比較獲得局部紋理特征,缺點(diǎn)是無法準(zhǔn)確地描述面部肌肉、皺紋以及其他局部形變的紋理信息的分布趨勢。針對這些問題,2014年,Ying Tongc3]等人提出了LGC算法,但這種方法仍然避免不了干擾信息。因此,本文提出了一種權(quán)值優(yōu)化LGC (WLGC)特征直方圖的方法,減少干擾信息的含量。
2 LBP和LCC方法原理
傳統(tǒng)的LBP算子是中心像素與周圍八個(gè)相鄰像素的灰度值比較,如果比中心像素灰度值大的則為l,否則為0,從左上方順時(shí)針讀值,先讀的值為二進(jìn)制的低位,最后得到一個(gè)八位的二進(jìn)制數(shù),再轉(zhuǎn)化為十進(jìn),即得到該中心像素的LBP算子。LBP算子的定義如公式(1)所示。
然而,傳統(tǒng)的LBP算法僅考慮了中心像素與相鄰像素,忽略相鄰像素之間的灰度級關(guān)系。LGCc3]算子是針對八個(gè)相鄰像素,分別對橫向、縱向和對角線方向上的灰度值進(jìn)行比較得到一個(gè)八位的二進(jìn)制數(shù)。其公式定義如(2)所示。這種編碼方式與人的眼睛,嘴巴,額頭等特征點(diǎn)的變化趨勢保持一致,并充分考慮了紋理變化對表情分類的影響。例如,圖1中的兩個(gè)示例經(jīng)過改進(jìn)后的LGC編碼分別為(0000000012和f0001111112。
3 本文方法
特征提取階段在任何模式識別系統(tǒng)中都是一個(gè)被關(guān)注的焦點(diǎn)。在本文中,提出了WLGC方法,該方法通過對LGC[3]做進(jìn)一步的優(yōu)化,來達(dá)到提高識別率的目的,整個(gè)方法的結(jié)構(gòu)框架如上圖2所示。
在人臉圖像中,統(tǒng)計(jì)相同像素值得到對應(yīng)直方塊,鏈接不同像素的直方塊得到特征直方圖。同一像素塊中的像素可能來自不同的部位,然而,這些信息并不確定能夠描述表情特征,這就會使特征直方圖中包含干擾信息進(jìn)而影響表情分類。如圖5所示,同一直方塊中的灰度值可能來自眼睛,也可能來自頭發(fā),而頭發(fā)并不能描述表情信息,即便將圖像進(jìn)行分塊,這種情況也無法避免。針對這一問題,提出WLGC方法。該方法的主要思想是通過權(quán)值C減少一部分干擾信息在特征向量中的相對含量,同時(shí)也增加有用信息所占的比例,以此來達(dá)到優(yōu)化已獲取的LGC特征向量的目的,WLGC算法的公式定義如下:
FWLGC(X) =f LGC(X)xC (3)
特征提取步驟:1)將人臉圖像處理成塊;2)用LGC算子提取出每個(gè)子塊的局部梯度差異的值[3],并對其進(jìn)行直方圖統(tǒng)計(jì),鏈接所有子塊的LGC直方圖,并構(gòu)建整個(gè)圖像的識別特征fLGC( X);3)定義C的范圍以及具體的權(quán)值,枚舉(0,1)的范圍內(nèi)具有代表性的數(shù)值并對C進(jìn)行賦值,取不同值分別對LGC特征直方圖進(jìn)行優(yōu)化,得出優(yōu)化的特征向量F1VLGC(X)。
4 表情分類方法
5 實(shí)驗(yàn)結(jié)果及分析
實(shí)驗(yàn)采用Cohn-Kanad[5]表情庫,該表情庫在當(dāng)前的面部表情研究領(lǐng)域中是最全面的數(shù)據(jù)庫之一。從表情庫中一共選取540圖像,這些人臉圖像涵蓋六種表情,即生氣、厭惡、恐懼、高興、悲傷和驚訝,每種表情90張,從每一類中任意選取30張圖像作為訓(xùn)練樣本,其余圖像作為測試樣本。
實(shí)驗(yàn)中,權(quán)值和分塊是影響識別率的重要因素,適當(dāng)?shù)呐渲每梢蕴岣弑砬樽R別率,當(dāng)圖像被分割成4x4塊時(shí),識別率達(dá)到最高。一般情況下,干擾信息存在于各個(gè)直方塊中,因此,將權(quán)值區(qū)間定在(0,1)之間并進(jìn)行實(shí)驗(yàn),權(quán)值為0.9時(shí),識別率與原來相比有所提高并且分類時(shí)間并無明顯差別。為了證明該方法的優(yōu)越性,同其他的方法進(jìn)行比較的結(jié)果如表1所示。
6 結(jié)束語
針對特征直方圖中存在干擾信息并影響表情識別率的問題,提出了一種權(quán)值優(yōu)化LGC特征直方圖的方法。實(shí)驗(yàn)結(jié)果表明,該方法可以有效地減少無用信息在特征向量中的含量,突出有用信息在向量中所占的比例,突破算法本身的局限性,提高表情識別率,并且使分類時(shí)間保持穩(wěn)定。但是,由于圖像個(gè)體原因,例如,圖像剪裁、旋轉(zhuǎn)、人臉型大小等因素的影響,權(quán)值無法唯一確定,希望未來能夠進(jìn)一步研究該方法,在保證高識別率的條件下,使表情識別能夠自適應(yīng)于不同的條件。
參考文獻(xiàn):
[1]T.Ojala,M.Pietikainen. D.A. Harwood, Comparative study oftexture measures with classification Based on feature distribu-tions. Pattern Recogn,1996,29(1):5 1-59.
[2]J.G.Daugman, Uncertainty relation for resolution in space,spatial frequency,and orientation optimized by two-dimension-al visual cortical filters,J.Opt. Soc. Am, (1985,2 (7): 1160-1169.
[3]Y.Tong,R.Chen,Y.Cheng. Facial expression recognition al-gorithm using LGC Based on horizontal and diagonal priorprinciple[J]. Optik - International Journal for Light and Elec-tron Optics,2014.
[4] C.C Lai,C.H Ko,F(xiàn)acial expression recognition Based on two-stage features extraction[J].Optik- Optik - International Jour-nal for Light and Electron Optics,2014.
[5]T.Kanade,J.Cohn,Y.Tian, Comprehensive database for fa-cial expression analysis, in: Fourth lEEE International Confer-ence on Automatic Face and Gesture Recognition, 2000:46-53.
[通聯(lián)編輯:李雅琪]
收稿日期:2019-08-11
作者簡介:張波(1978-),中國聯(lián)合網(wǎng)絡(luò)通信有限公司河南省分公司,工程師。