宋小雙
摘要:由于缺乏有效的面部表情識(shí)別技術(shù),面部表情識(shí)別在日常生活中的潛在應(yīng)用沒有得到重視。隨著計(jì)算機(jī)化的盛行,運(yùn)用計(jì)算機(jī)的面部識(shí)別也逐漸開始盛行。該文以MATLAB為開發(fā)工具,對(duì)面部表情進(jìn)行研究。該文選擇亞采樣和歸一化對(duì)表情圖像原圖進(jìn)行預(yù)處理,找到面部特征的位置。然后再使用Gabor小波對(duì)預(yù)處理圖像進(jìn)行濾波,接著對(duì)濾波后的圖像算歐式距離,最后使用最近鄰方法找出最近的類,識(shí)別出表情圖像所對(duì)應(yīng)的情緒類型。
關(guān)鍵詞: 面部表情識(shí)別系統(tǒng);MATLAB;Gabor濾波器;歐式距離;最近鄰方法
中圖分類號(hào):TP393.08 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)03-0199-02
1 概述
一直以來,表情是人類引以為傲的東西,這是我們和機(jī)器的一種本質(zhì)上的區(qū)別。隨著計(jì)算機(jī)的發(fā)展,我們更期盼人機(jī)之間的溝通交流,尤其是一種帶有感情的溝通交流。在物聯(lián)網(wǎng)技術(shù)發(fā)展的今天,面部識(shí)別已經(jīng)不是什么太大的技術(shù)性問題,而對(duì)于人類表情識(shí)別來說,仍舊是一片空白。
實(shí)驗(yàn)表明[1],人臉部不同部位具有不同的表情作用。例如,表達(dá)憂傷眼睛最重要,表達(dá)快樂與厭惡口部最重要,而前額部分能提供驚奇的信號(hào),眼睛、嘴巴和前額對(duì)表達(dá)憤怒情緒相當(dāng)重要。還有實(shí)驗(yàn)數(shù)據(jù)表明:表達(dá)怨恨、喜悅等口部肌肉比眼部肌肉重要;而表達(dá)憂愁、驚駭?shù)惹榫w眼部肌肉比口部肌肉重要。面部表情識(shí)別技術(shù)[2-3]是計(jì)算機(jī)科學(xué)研究的內(nèi)容之一,是心理學(xué)、生理學(xué)、模式識(shí)別、圖像處理和機(jī)器視覺等領(lǐng)域的一個(gè)極具挑戰(zhàn)性的交叉性課題。
2 系統(tǒng)分析與設(shè)計(jì)
2.1 表情分析
情緒隨著面部表情的變化,一些變化是極其微小的。據(jù)估計(jì),人的臉上有80塊肌肉,可以復(fù)合產(chǎn)生7000多種不同的表情。湯姆金斯假定存在8種基本的情緒:歡樂、興趣、痛苦、驚訝、恐懼、憤怒、羞愧、輕蔑。一個(gè)實(shí)際的面部表情識(shí)別系統(tǒng)如下圖1所展示的。這個(gè)識(shí)別過程開始于用一個(gè)類似于攝像頭的圖像采集設(shè)備采集圖像,然后被采集的圖像需要進(jìn)行預(yù)處理,使不同圖像里的環(huán)境和其他變量最小化。
2.2 面部表情圖像預(yù)處理
由于各種原因例如光照、光線等不均勻會(huì)造成圖像灰度過于集中,因此,圖片的像素質(zhì)量會(huì)下降,好一點(diǎn)的會(huì)出現(xiàn)圖像不清晰,很難看出細(xì)節(jié)等問題;差一點(diǎn)的就會(huì)表現(xiàn)出圖像嚴(yán)重模糊不清,連大概的圖片原貌都不看不出來。所以在進(jìn)行圖像處理之前就非常有必要對(duì)圖形質(zhì)量進(jìn)行改善進(jìn)行預(yù)處理。預(yù)處理過程一般有數(shù)字化,幾何變換,歸一化,平滑,復(fù)原和增強(qiáng)等步驟。圖2為進(jìn)行預(yù)處理后的各表情圖。
2.3 Gabor小波
Gabor小波[4]就相當(dāng)于人的視覺機(jī)制中的簡(jiǎn)單細(xì)胞響應(yīng)。它在處理目標(biāo)的局部空間和頻率域方面具有良好的特性。在圖像邊緣敏感的這個(gè)問題上,Gabor小波能夠表現(xiàn)出對(duì)光照變化的良好適應(yīng)性,對(duì)光照不敏感,而且還能提供良好的尺度選擇特性以及良好的方向選擇特性?;谏厦娴奶匦?,Gabor小波在視覺空間信息方面應(yīng)用很廣。圖3為經(jīng)過Gabor濾波器濾波后的圖像展示。
2.4 歐氏距離圖與最近鄰方法
歐式距離[5]是一種易于理解的距離算法,源自空間兩點(diǎn)距離公式。二維平面上兩點(diǎn)a(x1,x2)和b(y1,y2)間的歐式距離為:[d1,2=(x1-x2)2+(y1-y2)2]。對(duì)于n維空間點(diǎn)a(x1,x2,x3,...,xn)和b(y1,y2,y3,...,yn)兩點(diǎn)之間的歐式距為:[d=k=1n(xk-yk)2]。
最近鄰方法是一種經(jīng)典的機(jī)器學(xué)習(xí)方法,主要用來解決分類問題[6-8]。1-NN和k-NN是最近鄰方法常見的兩種形式。k-NN又稱k-means算法,分類流程如下:首先,在包含了n個(gè)數(shù)據(jù)集的集合中,隨機(jī)選擇k個(gè)對(duì)象,每個(gè)對(duì)象表示一個(gè)簇的最初的均值,也就是簇的形心。對(duì)其余的每個(gè)對(duì)象,分別計(jì)算它們到這k個(gè)對(duì)象的歐式距離,將它們分配到距離最近的那個(gè)形心代表的簇中。然后,重新計(jì)算每個(gè)簇內(nèi)對(duì)象的均值,產(chǎn)生簇新的形心。利用新生成的簇的形心,重新分配數(shù)據(jù)集中的對(duì)象。重復(fù)這個(gè)過程,直到不再發(fā)生變化,即新一輪的簇的形心和前一輪的相同為止。
3 實(shí)驗(yàn)結(jié)果分析
本文實(shí)驗(yàn)所使用的圖像是由國(guó)外10名志愿者的7*6*10,6種表情,每種表情7種不同的程度共420張圖片,其中每個(gè)表情均是由中性情緒即正常開始逐漸加重程度。每位實(shí)驗(yàn)者臉部的頭發(fā)等軍被處理掉以便更好的識(shí)別。
從表1中可以很直觀的看出來,最近鄰方法對(duì)中性表情的分辨識(shí)別率最高,相對(duì)應(yīng)的對(duì)恐懼和悲傷著兩類表情分辨正確率相對(duì)較低。對(duì)另外的生氣、厭惡、高興等的識(shí)別率也取得了相對(duì)不錯(cuò)的結(jié)果。之所以會(huì)呈現(xiàn)這樣的結(jié)果主要是因?yàn)?,中性表情與其他表情的差異比較大,而恐懼和悲傷的分類正確率地是因?yàn)檫@兩類表情與其他類型的面部表情差異較小,而且面部表情本身特征不明顯。
4 結(jié)論
本文基于Gabor濾波器給出了面部表情識(shí)別方法?;贕abor濾波器的面部表情識(shí)別系統(tǒng)預(yù)先將表情圖像的面部以外的其他物體都處理掉,例如頭發(fā)耳朵等,只露出能夠透露面部表情特征的五官。再進(jìn)行歐式距離的計(jì)算,并基于最近鄰方法進(jìn)行分類。對(duì)于本系統(tǒng)最后運(yùn)行的最后實(shí)驗(yàn)結(jié)果,中性表情由于和其他表情特征差距大而識(shí)別正確率大,相對(duì)的恐懼和悲傷由于和其他表情的差異比較小而識(shí)別率比較低,識(shí)別率有待進(jìn)一步提高。在今后的工作中還需要對(duì)最近鄰算法進(jìn)行改進(jìn),以便對(duì)面部特征相似的表情進(jìn)行更準(zhǔn)確的識(shí)別,提高整體識(shí)別率。
參考文獻(xiàn):
[1] Ekman P, Friesen W V, Hager J C. Facial Action Coding System.Research Nexus, a subsidiary of Network Information Research Corporation,Made in the United States of America, 2002.
[2] Wang Y, Ai H, Wu B. Real time facial expression recognition with Adaboost[C]. ICPR 2004, Proceedings of the 17th International Conference on Pattern Recognition,2004, 3: 926-929.
[3] Zhou X, Zheng W, Zou C. Facial expression recognition based on fuzzy-LDA/CCA[J]. Journal of Southeast University, 2008,24(4):428-432.
[4] Daugman JG. Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters[J]. J. Optical Soc. Amer., 1985, 2 (7): 1160-1169.
[5] Bajcsy R, Lovacic S. Multiresolution elastic mathing[J]. Computer Vision,Graphics,and Image Processing, 1989, 46: 1-21.
[6] Na S, Xumin L, Yong G. Research on k-means clustering algorithm: An improved k-means clustering algorithm//Intelligent Information Technology and Security Informatics (IITSI)[C]. 2010 Third International Symposium on. IEEE, 2010:63-67.
[7] Birant D, Kut A. ST-DBSCAN: An algorithm for clustering spatial–temporal data[J]. Data & Knowledge Engineering, 2007, 60(1): 208-221
[8] Celebi M E, Kingravi H A, Vela P A. A comparative study of efficient initialization methods for the k-means clustering algorithm[J]. Expert Systems with Applications, 2013, 40(1): 200-210