張 劍,李 坤,王潤(rùn)明
(湖南科技大學(xué) 信息與電氣工程學(xué)院,湖南 湘潭 411100)
人臉檢測(cè)技術(shù)就是對(duì)所輸入的圖像進(jìn)行檢測(cè),判斷出圖像是否存在人臉,如果存在,則返回人臉在圖像中的確切位置和范圍的技術(shù)[1]。人臉檢測(cè)是人臉識(shí)別系統(tǒng)中的關(guān)鍵的第一步,這一步所獲得的精度與速度直接影響整個(gè)系統(tǒng)的性能[2]。此外,人臉檢測(cè)技術(shù)在人臉追蹤、視頻會(huì)議、基于內(nèi)容的圖像檢索和人類情感研究系統(tǒng)中都有廣泛的應(yīng)用,而且具有重要的學(xué)術(shù)價(jià)值。人臉的自動(dòng)檢測(cè)具有一定的挑戰(zhàn)性,主要有以下難點(diǎn):(1)由于人臉是一類高度非剛性的目標(biāo),存在相貌、表情、膚色、姿態(tài)等差異;(2)人臉上很可能存在一些附屬物,如眼鏡、胡須、裝飾品等;(3)人臉的姿態(tài)千變?nèi)f化,并且可能存在遮擋物;(4)待檢測(cè)的圖像其性質(zhì)的差異,如圖像的分辨率、攝錄器材的質(zhì)量等;(5)光源的種類、強(qiáng)弱和角度的不同,其作用在人臉上所產(chǎn)生的性質(zhì)不同的反射,造成不同區(qū)域的陰影。因此,人臉檢測(cè)成為計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域內(nèi)的一個(gè)研究熱點(diǎn)[3]。目前比較常用的人臉檢測(cè)方式可以概括為基于知識(shí)、基于結(jié)構(gòu)特征、基于模板匹配及基于統(tǒng)計(jì)模型的方法[4]。本文將Walsh特征用于人臉檢測(cè)是基于結(jié)構(gòu)特征的一種方法。本文通過(guò)構(gòu)造Walsh變換矩陣,得到相互正交且形狀豐富的Walsh特征算子,在相同情況下將Walsh特征與傳統(tǒng)的Haar特征用于快速人臉檢測(cè),通過(guò)對(duì)比其各自的特點(diǎn)得出Walsh特征用于人臉檢測(cè)的優(yōu)越性。
Haar特征是VIOLA等提出的一種簡(jiǎn)單矩形特征,因類似于Haar小波而得名[5]。Haar特征的定義是黑色矩形和白色矩形在圖像子窗口中對(duì)應(yīng)區(qū)域的灰度級(jí)總和之差,可見(jiàn),它反映了圖像局部的灰度變化。VIOLA等用到的Haar特征共有三類,圖1顯示了部分在圖像子窗口起點(diǎn)位置處的Haar特征,其中第一、二行屬于二矩形特征,第三行屬于三矩形特征,第四行屬于四矩形特征[6]。在實(shí)際使用時(shí),必須將每一特征在圖像子窗口中進(jìn)行滑動(dòng)計(jì)算,從而獲得各個(gè)位置的多個(gè)Haar特征。如果選用的訓(xùn)練圖像分辨率為24×24,每個(gè)圖像得到用于訓(xùn)練的Haar特征超過(guò)18萬(wàn)個(gè)[7],但是實(shí)際上不一定需要,因?yàn)檫^(guò)多的特征會(huì)大大加大訓(xùn)練過(guò)程的時(shí)間和空間復(fù)雜度,實(shí)際上過(guò)細(xì)的特征中也會(huì)引起過(guò)多的冗余,所以在選擇特征時(shí)可適當(dāng)放粗一些。
在實(shí)際檢測(cè)過(guò)程中,為了加快Haar特征的計(jì)算,VIOLA等提出了積分圖像的定義,灰度圖像F的積分圖像 I定義為[8]:
圖1 Haar部分特征算法
使用積分圖像,只是使用少量的加減法運(yùn)算就可以計(jì)算出Haar特征,如圖2所示。
圖2 使用積分圖進(jìn)行特征提取
圖2(b)是積分圖,要計(jì)算圖2(a)中某個(gè)位置的某種特征,只需要采用積分圖中的相應(yīng)點(diǎn)的值進(jìn)行加減法運(yùn)算,圖 2(b)特征數(shù)值 d=P4+P1-P2-P3-(P6+P3-P4-P5),這樣可以大大節(jié)省計(jì)算時(shí)間[9]。
通過(guò)對(duì)上述Haar特征的用于人臉檢測(cè)的理論深入研究可以發(fā)現(xiàn),從理論上來(lái)說(shuō),Haar特征用于人臉檢測(cè),訓(xùn)練樣本時(shí)間長(zhǎng),檢測(cè)精度低,缺點(diǎn)明顯。
離散Walsh變換(Discrete Walsh Transform)是數(shù)字信號(hào)處理方面經(jīng)常采用的一種正交變換,并且該變換同離散傅里葉變換一樣,可以很好地反映數(shù)字信號(hào)的頻率變化情況,而且變換矩陣只是由1和-1組成,可以較大程度減少計(jì)算量[10]。Walsh特征構(gòu)造方法如下:
(1)設(shè) Walsh特征算子的高度、寬度分別為 m、n(必須是2的整數(shù)次方);
(2)分別構(gòu)造 m×m、n×n 維的 Walsh 變換矩陣 Hm、Hn;
(3)得到Walsh特征算子:
其中,(Hk)t表示 Hk第 t行向量,Walsh變換矩陣 Hk=(hi,j)可以按照式(3)來(lái)構(gòu)造:
其中,R(t+1,j)是拉德梅克函數(shù),g(i)t是 i的格雷碼的第t位數(shù)字。為了在檢測(cè)過(guò)程能夠使用積分圖計(jì)算方法進(jìn)行加速,一般選用左上角的中低頻特征。實(shí)驗(yàn)采用如圖3所示的黑線框以內(nèi)的10個(gè)形態(tài)(黑白位置分布),其中有幾種特征形態(tài)和Haar-Like特征相似或一樣。
由于所有m×n維的Walsh特征算子都是相互正交,這意味著它對(duì)圖像某個(gè)局部特征的提取不產(chǎn)生冗余,并且特征算子的形狀比Haar特征算子的形狀要豐富。另外,m、n都要求是2的整數(shù)次方,所以對(duì)一幅訓(xùn)練圖像而言,它的全部Walsh特征數(shù)是有限的,即Walsh特征的數(shù)量小于Haar特征的數(shù)量。在實(shí)際的Haar特征提取過(guò)程中,很多特征都非常相近,冗余很大,采用Walsh特征來(lái)代替Haar特征可以大大降低特征之間的冗余。
圖3 一組Walsh特征
為了證明使用較少的Walsh特征也具備很好的分類特性,這里采用了5 785個(gè)Walsh特征和14 091個(gè)Haar-Like進(jìn)行了對(duì)比實(shí)驗(yàn),分類器學(xué)習(xí)算法Real AdaBoost,每個(gè)弱分類器按照其對(duì)應(yīng)特征的數(shù)值被劃分為40個(gè)區(qū)間。實(shí)驗(yàn)在MIT-CBCL庫(kù)上進(jìn)行,其訓(xùn)練庫(kù)包含2 429個(gè)分辨率為19×19的配準(zhǔn)人臉樣本,覆蓋各種膚色、遮擋、姿態(tài)、光照等情況;也包含4 548個(gè)分辨率為19×19非人臉樣本,部分樣本如 4圖所示,其中圖4(a)是人臉樣本,圖4(b)是非人臉樣本。使用MIT-CBCL訓(xùn)練庫(kù)進(jìn)行實(shí)驗(yàn)的原因是其中的人臉和非人臉圖像具有一定的代表性,并且在實(shí)驗(yàn)中可以將訓(xùn)練庫(kù)中的人臉和非人臉樣本一分為二,使得訓(xùn)練樣本和測(cè)試樣本具有一定的相似性。另外,使用該庫(kù)可以保證所有算法在同樣的訓(xùn)練樣本和測(cè)試樣本下進(jìn)行實(shí)驗(yàn),以保證實(shí)驗(yàn)結(jié)果的可比性。
圖4 MIT-CBCL庫(kù)中的部分樣本
在實(shí)驗(yàn)中,將所有樣本分辨率放大到20×20并作標(biāo)準(zhǔn)化處理 (每個(gè)樣本中的所有元素的均值為0,方差為1),實(shí)驗(yàn)中使用了3種樣本選擇模式得到訓(xùn)練樣本集和測(cè)試樣本集:偶數(shù)編號(hào)訓(xùn)練、奇數(shù)編號(hào)測(cè)試(s1);奇數(shù)編號(hào)訓(xùn)練,偶數(shù)編號(hào)測(cè)試 (s2);5次隨機(jī)選擇50%樣本訓(xùn)練,剩余樣本測(cè)試,將5次結(jié)果疊加取平均(s3)。實(shí)驗(yàn)環(huán)境為:Matlab7、P4 2.8 GHz CPU、1 GB 內(nèi)存。在 MIT-CBCL庫(kù)上的實(shí)驗(yàn)結(jié)果如表1所示。從表1可以看出,兩種特征訓(xùn)練得到的弱分類器數(shù)目相似,但是使用Haar特征時(shí)訓(xùn)練花費(fèi)的時(shí)間卻大大高于Walsh特征,且每種樣本模式下的測(cè)試精度也比Walsh特征稍低??梢?jiàn)使用Walsh特征不僅可以加速訓(xùn)練過(guò)程,而且檢測(cè)性能并沒(méi)有下降。
表1 MIT-CBCL庫(kù)上的實(shí)驗(yàn)結(jié)果
以上的實(shí)驗(yàn)結(jié)果證明,Walsh特征不僅沒(méi)有降低檢測(cè)精度,而且加快了訓(xùn)練速度,說(shuō)明Walsh特征用于人臉檢測(cè)比Harr特征用于人臉檢測(cè)更加優(yōu)越。本文基本達(dá)到了預(yù)期的目標(biāo)。
[1]蘇景龍,林天威,王科俊,等.視頻流下的人臉檢測(cè)與跟蹤[J].應(yīng)用科技,2011(03):2-6.
[2]李偉生,張勤.基于局部線性嵌入和 Haar小波的人臉識(shí)別方法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(4):181-184.
[3]梁路宏,艾海舟,何克忠.基于多模板匹配的單人臉檢測(cè)[J].中國(guó)圖象圖形學(xué)報(bào),1999,4(10):823-830.
[4]周激流,張曄,郭晶,等.基于先驗(yàn)?zāi)0宓娜四樏娌刻卣魈崛〉难芯?[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2000,12(5):337-339.
[5]姜軍,張桂林.一種基于知識(shí)的快速人臉檢測(cè)方法[J].中國(guó)圖象圖形學(xué)報(bào),2002,7(1):6-10.
[6]DAI Y,NAKANO Y.Face-texture model based on SGLD and its application in face detection in a color scene[J].Pattern Recognition, 1996,29(6):1007-1017.
[7]YOW K C, CIPOLLA R.Feature-basedhumanface detection [J].Image and Vision Computing,1997,15(9):713-735.
[8]JENG S H, LIAO H Y M, HAN C C.Facial feature detection using geometrical face model: an efficient approach[J].Pattern Recognition, 1998, 31(3): 273~282.
[9]KONDO T, YAN H.Automatic human Face Detection and Recognition undernon-uniform illumination [J].Pattern Recognition, 1999,32:1707-1718.
[10]HAN C C, LIAO H Y, YU G J, et al.Fast face detection via morphology-based pre-processing[J].Pattern Recognition, 2000,33(10):1701-1712.