国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進(jìn)的MSF-VQ人臉特征提取方法①

2018-04-21 01:38:43魏陸奇廉東本
關(guān)鍵詞:直方圖人臉識(shí)別人臉

魏陸奇, 廉東本

1(中國(guó)科學(xué)院大學(xué),北京 100049)

2(中國(guó)科學(xué)院 沈陽(yáng)計(jì)算技術(shù)研究所,沈陽(yáng) 110168)

1 引言

人臉識(shí)別是指通過分析比較人臉視覺特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù). 它是一種重要的生物特征識(shí)別技術(shù),具有安全、交互自然等特點(diǎn),吸引了學(xué)術(shù)界與工業(yè)界廣泛的關(guān)注. 目前人臉識(shí)別的主要算法大致可以分為兩類: 基于幾何模型的方法和基于統(tǒng)計(jì)模型的方法. 本文討論的MSF-VQ方法是基于統(tǒng)計(jì)模型的方法之一.

基于統(tǒng)計(jì)模型的方法中最關(guān)鍵的步驟是提取人臉中比較具有個(gè)體差異性的特征. 向量量化(Vector Quantization,VQ)直方圖被驗(yàn)證是一種有效的人臉特征[1],但是向量量化直方圖存在一個(gè)明顯的缺點(diǎn)是無(wú)法反映人臉圖像中的空間位置信息. MSF-VQ特征通過馬爾科夫穩(wěn)態(tài)特征(Markov stationary feature,MSF)對(duì)VQ方法進(jìn)行了改進(jìn)[2],使得提取的特征中能夠反映人臉圖像中的空間位置信息并有效地提高了人臉識(shí)別準(zhǔn)確率. 但是MSF-VQ特征仍然存在一些不足之處,比如無(wú)法很好的反映人臉的局部特征,碼書確定不夠合理,反映的圖像空間位置信息有限等. 針對(duì)局部特征反映不足的缺點(diǎn),SR-MSF-VQ方法對(duì)其進(jìn)行了改進(jìn)[3]. 而本文提出的方法則主要對(duì)其碼書不合理、空間位置信息不足的缺點(diǎn)進(jìn)行了改進(jìn).

本文的主要內(nèi)容安排如下: 第2節(jié)對(duì)MSF-VQ特征提取方法進(jìn)行介紹; 第3節(jié)介紹提出的對(duì)MSFVQ特征提取的改進(jìn)方法; 第4節(jié)通過實(shí)驗(yàn)對(duì)改進(jìn)前和改進(jìn)后的方法進(jìn)行對(duì)比; 第5節(jié)得出結(jié)論.

2 MSF-VQ特征提取方法

2.1 向量量化直方圖

向量量化是一種圖像壓縮編碼技術(shù),利用這種方法可以提取到圖像的向量量化直方圖作為人臉識(shí)別的特征. 向量量化直方圖特征提取過程[1]如下:

(1) 使用滑動(dòng)平均濾波器對(duì)人臉(灰度)圖像進(jìn)行低通濾波預(yù)處理. 消除圖像中的高頻噪聲,保留對(duì)人臉識(shí)別更有用的低頻成分信息.

(2) 將經(jīng)過預(yù)處理后的圖像使用滑動(dòng)窗口的方式按照15/16的重疊率分成4×4大小的像素塊,假定原圖像的大小為m×n,則得到(m-3)×(n-3)個(gè)分塊. 然后將每個(gè)像素塊中的每個(gè)像素的灰度值減去該像素塊中灰度最小的像素的灰度值作為本像素新的灰度值.

(3) 將像素塊轉(zhuǎn)換為向量,與事先確定的碼書(codebook)中的各向量分別計(jì)算曼哈頓距離,將距離最小的碼書向量作為該向量塊的匹配向量. 這里的碼書是一個(gè)包含33個(gè)16維矢量的集合,其中32個(gè)矢量代表的是在8個(gè)方向上4種不同大小的灰度梯度變化的像素塊,另外1個(gè)反映的是無(wú)梯度變化的像素塊.

(4) 經(jīng)過前述步驟的處理,所有的像素塊都被量化到了33個(gè)組別(向量)上. 統(tǒng)計(jì)各組別像素塊的數(shù)量,得到向量量化直方圖.

2.2 馬爾科夫穩(wěn)態(tài)特征

MSF可以提高直方圖對(duì)圖像的區(qū)分能力. 直方圖分析被廣泛的應(yīng)用在圖像分析處理領(lǐng)域,根據(jù)直方圖分析方法對(duì)圖像的區(qū)別能力由弱至強(qiáng)分為I級(jí)~I(xiàn)V級(jí)4個(gè)等級(jí)[4]. 傳統(tǒng)的直方圖例如顏色直方圖因?yàn)椴话魏蔚目臻g位置信息,其分辨能力只能達(dá)到Ⅰ級(jí),而MSF理論上可以達(dá)到Ⅲ級(jí)的區(qū)別能力.

MSF特征的提取過程[4]如下. 首先計(jì)算圖片的空間共生矩陣[5]C=(cij)K×K,圖1展示了空間共生矩陣的計(jì)算過程. 空間共生矩陣中的每個(gè)元素計(jì)算方式如下:

其中,pk表示圖片中的任一像素,ck表示直方圖中的第k組,d表示像素p1與p2之間的切比雪夫距離,#運(yùn)算表示滿足某一條件的情況的數(shù)量,公式最后的除以2運(yùn)算是為了避免疊加計(jì)算.

求得空間共生矩陣C=(cij)K×K后,再通過以下公式計(jì)算馬爾科夫轉(zhuǎn)移矩陣P=(pij)K×K:

繼而可以計(jì)算出初始分布π(0)和平穩(wěn)分布π:

其中,ai是A的行向量,實(shí)際計(jì)算中可根據(jù)需求指定n的值求得π的近似值.

至此,就得到了MSF特征:

圖1 空間共生矩陣的計(jì)算方法

2.3 MSF-VQ特征

MSF-VQ方法則是在VQ直方圖的基礎(chǔ)上使用MSF特征進(jìn)行擴(kuò)展,從而在特征中包含空間位置信息.MSF-VQ特征提取算法的具體步驟如下:

(1) 同VQ方法中的(1)、(2)、(3);

(2) 將各像素塊的組別按照像素塊的相對(duì)位置進(jìn)行排列重新組成一個(gè)(m-3)×(n-3)圖片(矩陣);

(3) 給定距離d,求得上述(m-3)×(n-3)矩陣的空間共生矩陣,然后按照MSF特征提取方法的步驟計(jì)算得出MSF特征,即為原圖像的MSF-VQ特征.

文獻(xiàn)[2]進(jìn)行了對(duì)比實(shí)驗(yàn),結(jié)果表明MSF-VQ特征比VQ特征在人臉識(shí)別中表現(xiàn)出更高的識(shí)別率.

3 改進(jìn)的MSF-VQ特征提取方法

3.1 根據(jù)數(shù)據(jù)集確定碼書

MSF-VQ特征提取中向量量化所使用的碼書是預(yù)先指定的. 這種方法的缺點(diǎn)是,對(duì)任何人臉數(shù)據(jù)集都使用同樣的碼書,不能保證在各種人臉數(shù)據(jù)集上都有理想的識(shí)別準(zhǔn)確率. 本文對(duì)此提出的改進(jìn)方法是根據(jù)數(shù)據(jù)集計(jì)算得到碼書. 具體步驟如下:

(1) 同VQ算法中的(1)、(2).

(2) 將所得的像素塊轉(zhuǎn)換為向量,向量可以看作是高維空間中的點(diǎn),初始狀態(tài)下,每個(gè)點(diǎn)都屬于一個(gè)單獨(dú)的集合,如果有重合的點(diǎn),則將重合的點(diǎn)所在的各個(gè)集合合并成一個(gè)新的集合. 并計(jì)算集合的重心,重心計(jì)算公式如下:

其中,n表示集合中點(diǎn)的數(shù)量,pi表示集合中的第i個(gè)點(diǎn).

(3) 選取包含點(diǎn)數(shù)量最少的一個(gè)集合(如果存在多個(gè)集合可選取重心坐標(biāo)較小的一個(gè)),找到距離該集合的距離(兩集合重心的距離)最小的K個(gè)集合,分別計(jì)算區(qū)分度變化,與該集合區(qū)分度變化值最大的集合合并,并重新計(jì)算新集合的重心. 區(qū)分度變化計(jì)算公式如下:

其中,m表示數(shù)據(jù)集中不同人臉的數(shù)量,ai表示第一個(gè)集合中采集自第i個(gè)人的人臉的點(diǎn)的個(gè)數(shù),bi表示第二個(gè)集合中采集自第i個(gè)人的人臉的點(diǎn)的個(gè)數(shù).

(4) 重復(fù)步驟(3)直到集合個(gè)數(shù)減少到M個(gè).

(5) 計(jì)算所有點(diǎn)到各集合重心的距離,并將點(diǎn)歸到距離它最近的重心所在的集合中,從而完成所有集合的重新劃分.

(6) 重新計(jì)算各集合的重心,并按照步驟(5)的方法重新計(jì)算一個(gè)集合劃分預(yù)方案.

(7) 計(jì)算對(duì)應(yīng)集合在預(yù)方案與舊方案間的區(qū)分度變化,如果變化值小于1,則新方案中的重心與舊方案的重心相同; 如果變化值大于p0,則新方案中的重心與預(yù)方案的重心相同; 如果變化值在1到p0之間,則新方案中的重心有p概率與預(yù)方案相同. 區(qū)分度變化與p計(jì)算公式如下:

其中,m表示數(shù)據(jù)集中不同人臉的數(shù)量,ai表示舊方案集合中采集自第i個(gè)人的人臉的點(diǎn)的個(gè)數(shù),bi表示預(yù)方案集合中采集自第i個(gè)人的人臉的點(diǎn)的個(gè)數(shù).

(8) 重復(fù)步驟(5)、(6)、(7),直到集合重心n次未改變.

改進(jìn)算法借鑒了層次聚類[6]和LBG算法[7]的思想,對(duì)不同的人臉數(shù)據(jù)集計(jì)算得到一個(gè)對(duì)應(yīng)的碼書方案,計(jì)算過程中盡量使每個(gè)碼書向量附近分布的各人臉數(shù)據(jù)點(diǎn)的數(shù)量有較大差別,從而使提取到的各人臉VQ直方圖特征能夠有較大差別. 最終使提取的VQ直方圖特征具有更強(qiáng)的區(qū)分能力.

需要指出的是,算法中有3個(gè)參數(shù)可根據(jù)實(shí)際需求進(jìn)行調(diào)整,分別是可選合并集合數(shù)K,區(qū)分度變化上限值p0和預(yù)期VQ直方圖組別數(shù)M.K值過小可能會(huì)使區(qū)分度下降,K值過大則可能使集合中各點(diǎn)分布過于分散,使得在步驟(5)后區(qū)分度發(fā)生較大變化.p0的選取則會(huì)影響最后一步的收斂速度.M值則影響到VQ特征的維數(shù). 應(yīng)該注意的是M并不是VQ特征的維數(shù),實(shí)驗(yàn)中發(fā)現(xiàn),最終生成的點(diǎn)集中往往會(huì)有一些空集,這些空集應(yīng)該被剔除.

3.2 結(jié)合多個(gè)方向采樣的MSF特征

MSF可以將空間位置信息附加到直方圖特征中,但是MSF算法是在所有方向上取樣然后求和統(tǒng)計(jì)空間位置信息,求和計(jì)算會(huì)丟失大量的空間位置信息,這樣可以反映的空間位置信息就比較有限. 例如圖2的兩張圖片,就不可以通過MSF區(qū)別開來(lái). 本文提出的改進(jìn)方法是分別在各個(gè)方向上取樣計(jì)算共生矩陣和MSF特征然后加權(quán)結(jié)合. 最終得到形如下式的特征向量:

通過改進(jìn)的MSF特征可以區(qū)分圖2中的兩張圖片.

圖2 兩張MSF特征不能分辨的圖片

4 實(shí)驗(yàn)分析

實(shí)驗(yàn)使用ORL人臉數(shù)據(jù)庫(kù),ORL人臉數(shù)據(jù)庫(kù)包括40個(gè)人,每個(gè)人10張,共400張的pgm格式的人臉灰度圖片. 這40個(gè)人來(lái)自不同年齡、性別和種族,同一個(gè)人的人臉也有不同的尺寸、角度和表情. 圖片尺寸均為92×112.

實(shí)驗(yàn)用10折交叉驗(yàn)證的方式. 對(duì)比分別使用4種特征的人臉識(shí)別算法在不同核大小的低通濾波處理后的人臉識(shí)別準(zhǔn)確率. 四種特征分別是原始的MSFVQ特征,只改進(jìn)碼書計(jì)算方法提取的MSF-VQ特征(改進(jìn)特征1),只結(jié)合多方向采樣的MSF-VQ特征(改進(jìn)特征2)和兩處均改進(jìn)的MSF-VQ方法. 獲取到人臉特征后使用支持向量機(jī)對(duì)特征進(jìn)行訓(xùn)練,得到分類模型,并在測(cè)試集上進(jìn)行人臉識(shí)別測(cè)試.

使用改進(jìn)的碼書計(jì)算方法計(jì)算碼書,所使用的參數(shù)分別為K=3,p0=1.3,M=45. 最終計(jì)算得到包含30個(gè)向量的碼書如圖3所示. 圖中碼書向量梯度方向大致相同的被放在同一列,并按照梯度由大到小自下而上進(jìn)行排列. 因?yàn)閷?shí)際計(jì)算得到的灰度值相差較小,為了可以明顯看出灰度的變化,圖中所示的碼書灰度值為實(shí)際計(jì)算所得碼書灰度值的五倍. 與文獻(xiàn)[1]中的碼書相比,可以看出向量所代表的灰度梯度變化的大小和方向有較大的不同.

圖3 改進(jìn)的碼書計(jì)算方法計(jì)算得到的碼書

在改進(jìn)的MSF特征向量計(jì)算中取d=1,n=10,在0°(水平向右)和270°(垂直向下)兩個(gè)方向上分別采樣計(jì)算MSF特征并結(jié)合得到MSFP特征,由于文獻(xiàn)[2]中實(shí)驗(yàn)結(jié)果驗(yàn)證了在ORL數(shù)據(jù)庫(kù)中取樣的方向并不會(huì)對(duì)MSF-VQ方法在人臉識(shí)別中的效果產(chǎn)生較大影響.因此設(shè)置兩個(gè)方向上分量的權(quán)重均為1.

圖4 四種特征的人臉識(shí)別準(zhǔn)確率對(duì)比

圖4展示4種方法在不同核大小的低通濾波處理后的人臉識(shí)別準(zhǔn)確率. 從圖表可以看出,各方法均在濾波核為13×13的處理下達(dá)到最高的識(shí)別準(zhǔn)確率. 改進(jìn)的MSF-VQ(方法3)識(shí)別準(zhǔn)確率達(dá)到97.25%,明顯高于原始的MSF-VQ方法. 整體來(lái)看3種有所改進(jìn)的MSF-VQ方法都比原始的MSF-VQ方法在識(shí)別準(zhǔn)確率上有所提高. 對(duì)比方法1與方法2可以看出,方法1的識(shí)別準(zhǔn)確率整體高于方法2. 這說明碼書計(jì)算方法的改進(jìn)比結(jié)合多方向采樣的MSF的改進(jìn)對(duì)原始算法識(shí)別準(zhǔn)確率的提升作用更大. 另外,由于改進(jìn)的碼書計(jì)算方法不能靈活的確定最終碼書中的向量數(shù)量,因此本實(shí)驗(yàn)中使用了改進(jìn)的碼書計(jì)算方法的方法1和方法3所使用的碼書只有30個(gè)向量,比原始的MSF-VQ特征提取方法所用的碼書少3個(gè)向量,即向量量化直方圖特征少3維. 但是識(shí)別正確率卻更高,這說明改進(jìn)的碼書計(jì)算方法計(jì)算得到的碼書具有更高的區(qū)分能力.

5 結(jié)論與展望

本文提出的改進(jìn)的MSF-VQ人臉特征提取方法與原來(lái)的MSF-VQ特征提取方法相比,一方面,根據(jù)特定的人臉數(shù)據(jù)集計(jì)算適合的碼書,另一方面,在特征中加入更多的空間位置信息,增強(qiáng)了直方圖特征的表示能力. 通過實(shí)驗(yàn),對(duì)比了兩處改進(jìn)對(duì)人臉識(shí)別率的作用,驗(yàn)證了改進(jìn)的MSF-VQ方法具有比原始的MSF-VQ方法更高的人臉識(shí)別率. 文獻(xiàn)[3]也對(duì)MSF-VQ方法進(jìn)行了改進(jìn),取得了較好的識(shí)別率,但著眼點(diǎn)與本文不同. 如果結(jié)合兩種改進(jìn),識(shí)別正確率可能會(huì)進(jìn)一步提高.

1Kotani K,Qiu C,Ohmi T. Face recognition using vector quantization histogram method. Proceedings of International Conference on Image Processing. Rochester,NY,USA. 2002,2. II-105-II-108.

2Yan Y,Chen Q,Lee F. Face recognition using extended vector quantization histogram features. Proceedings of IEEE International Conference on Signal and Image Processing.Beijing,China. 2016. 90-95.

3Yan Y. Improved Face recognition algorithm using extended vector quantization histogram features. Proceedings of 2016

IEEE International Conference on Signal Processing. Beijing,China. 2016. 1046-1050.

4Li JG,Wu WX,Wang T,et al. One step beyond histograms:Image representation using Markov stationary features.Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Anchorage,AK,USA. 2008. 1-8.

5Haralick RM,Shanmugam K,Dinstein IK. Textural features for image classification. IEEE Transactions on Systems,Man,and Cybernetics,1973,SMC-3(6): 610-621. [doi: 10.1109/TSMC.1973.4309314]

6段明秀. 層次聚類算法的研究及應(yīng)用[碩士學(xué)位論文]. 長(zhǎng)沙:中南大學(xué),2009.

7Huang B,Xie LB. An improved LBG algorithm for image vector quantization. Proceedings of the 3rd IEEE International Conference on Computer Science and Information Technology. Chengdu,China. 2010. 467-471.

猜你喜歡
直方圖人臉識(shí)別人臉
統(tǒng)計(jì)頻率分布直方圖的備考全攻略
符合差分隱私的流數(shù)據(jù)統(tǒng)計(jì)直方圖發(fā)布
人臉識(shí)別 等
有特點(diǎn)的人臉
揭開人臉識(shí)別的神秘面紗
用直方圖控制畫面影調(diào)
三國(guó)漫——人臉解鎖
基于直方圖平移和互補(bǔ)嵌入的可逆水印方案
基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
馬面部與人臉相似度驚人
岚皋县| 卢龙县| 汝南县| 道孚县| 雅江县| 永顺县| 虎林市| 富阳市| 河北省| 宜春市| 黄大仙区| 景洪市| 虎林市| 嘉禾县| 博客| 响水县| 孝感市| 江油市| 林周县| 乡城县| 蒲江县| 德安县| 鄂伦春自治旗| 汕尾市| 古丈县| 福清市| 乌兰察布市| 科尔| 祁阳县| 鄢陵县| 芜湖县| 方正县| 舟曲县| 武夷山市| 高碑店市| 盐亭县| 盐池县| 阿巴嘎旗| 定南县| 青川县| 天柱县|