茹志鵑
(正德職業(yè)技術(shù)學(xué)院,211106)
基于動(dòng)態(tài)視頻的人臉識(shí)別技術(shù)研究
茹志鵑
(正德職業(yè)技術(shù)學(xué)院,211106)
隨著高科技的發(fā)展,人臉識(shí)別技術(shù)也在不斷發(fā)展。如今市場(chǎng)上已經(jīng)出現(xiàn)多種人臉識(shí)別技術(shù)。人臉識(shí)別技術(shù)作為一種生物特征識(shí)別的典型應(yīng)用被應(yīng)用到各個(gè)領(lǐng)域,如國(guó)防、司法、金融等,受到了社會(huì)的關(guān)注與認(rèn)可。
動(dòng)態(tài)視頻;人臉識(shí)別;原像比對(duì)
人臉識(shí)別技術(shù)的起源時(shí)間為1888年到1910年之間。如今隨著社會(huì)的發(fā)展,人臉識(shí)別技術(shù)已經(jīng)發(fā)展成為鑒別人物身份的一項(xiàng)重要手段,尤其是在公共安全領(lǐng)域以及商業(yè)領(lǐng)域有著廣闊的發(fā)展前景。
動(dòng)態(tài)人臉識(shí)別的主要組成模塊包括人臉的監(jiān)測(cè)、人臉的跟蹤、人臉的特征提取以及人臉的識(shí)別。具體可參照下圖。
跟傳統(tǒng)靜態(tài)圖像的人臉識(shí)別的方法不同的是,動(dòng)態(tài)人臉識(shí)別方法將視頻流以及視屏圖像作為研究的對(duì)象,除了對(duì)圖像幀的內(nèi)在信息進(jìn)行關(guān)注之外,還需要對(duì)幀的前后關(guān)系進(jìn)行具體分析,發(fā)現(xiàn)其中的關(guān)聯(lián)。因此,動(dòng)態(tài)人臉識(shí)別技術(shù)相對(duì)于傳統(tǒng)的靜態(tài)人臉識(shí)別技術(shù)來(lái)說(shuō)更具難點(diǎn),也更先進(jìn)。具體體現(xiàn)在以下幾方面:
(1)視頻的圖像序列中包含著大量的多余信息,動(dòng)態(tài)視頻人臉識(shí)別技術(shù)對(duì)信息的篩選能夠提升靜態(tài)人臉識(shí)別的效果。
(2)視頻中的動(dòng)態(tài)信息為識(shí)別系統(tǒng)提供了人臉的靜態(tài)圖像,通過(guò)靜態(tài)圖像構(gòu)建的人臉模型還能夠隨著時(shí)間的變化而變化,提升識(shí)別的質(zhì)量。
(3)從視頻的有序人臉集出發(fā)能夠得到更加精準(zhǔn)的人臉表達(dá)效果,如超分辨技術(shù)的采用能夠得到更高的識(shí)別效果,但是因?yàn)閯?dòng)態(tài)視頻的獲取中有很多不可控因素的存在,如環(huán)境的變化,人與攝像機(jī)未知的變化都可能造成圖像的模糊,識(shí)別困難。因此面向視頻的動(dòng)態(tài)人臉識(shí)別問(wèn)題還有很多難題需要人們的克服。
2.1關(guān)鍵幀方法
顧名思義關(guān)鍵幀的方法指的是在視頻序列中參照以前已經(jīng)確定好的規(guī)則選擇其中的關(guān)鍵幀作為原始的輸入,視頻的人臉識(shí)別問(wèn)題則轉(zhuǎn)化為關(guān)鍵幀的人臉圖像以及模板庫(kù)人臉圖像的靜態(tài)人臉圖像的匹配問(wèn)題。但是因?yàn)椴捎眠@種方法參照標(biāo)準(zhǔn)具有很大的主觀性,沒(méi)有客觀的參照標(biāo)準(zhǔn),因此需要進(jìn)行質(zhì)量的篩選,從視頻序列中選擇質(zhì)量最優(yōu)的圖像進(jìn)行比對(duì)。這種方法的運(yùn)用的優(yōu)點(diǎn)在于比對(duì)的次數(shù)較少,處理的速度快。但是因?yàn)闆](méi)有統(tǒng)一的標(biāo)準(zhǔn),因此很難被人們所接受。除了選擇關(guān)鍵幀進(jìn)行比對(duì)的方法之外,還有對(duì)同一對(duì)象的多張關(guān)鍵幀進(jìn)行比對(duì),隨后進(jìn)行匯總,這種方法中最簡(jiǎn)單的做法是,從設(shè)備跟蹤到人臉視頻中選擇幾種關(guān)鍵幀,對(duì)每一幀進(jìn)行圖像比對(duì),最后根據(jù)關(guān)鍵幀識(shí)別結(jié)果的融合得出結(jié)論。這種做法利用的視頻人像的多樣性,其存在的缺點(diǎn)為識(shí)別結(jié)果的質(zhì)量取決于融合的規(guī)則,目前還沒(méi)有統(tǒng)一的規(guī)則,因此在最終的結(jié)果比對(duì)上顯得過(guò)于隨機(jī)。
2.2圖像集方法
視頻是多種圖像的結(jié)合,因此對(duì)視頻的處理能夠歸結(jié)為對(duì)圖像集的操作,動(dòng)態(tài)視頻人臉識(shí)別技術(shù)的關(guān)鍵步驟就是對(duì)圖像集的人臉識(shí)別。根據(jù)設(shè)備所跟蹤到人臉圖像,采用超分辨技術(shù)、建模技術(shù)以及統(tǒng)計(jì)分析等技術(shù)對(duì)人臉的動(dòng)態(tài)信息進(jìn)行整合,概括下來(lái)可分為下面幾種。
2.2.1圖像超分辨技術(shù)
人臉識(shí)別技術(shù)質(zhì)量會(huì)隨著圖像分辨率的下降而下降,因此圖像超分辨技術(shù)被應(yīng)用到了動(dòng)態(tài)視頻的人臉識(shí)別技術(shù)。圖像超分辨技術(shù)通過(guò)對(duì)多張分辨率的整合對(duì)人像進(jìn)行重構(gòu),重新識(shí)別,這種方法的運(yùn)用彌補(bǔ)了因?yàn)閳D像的分辨率過(guò)低而造成的識(shí)別技術(shù)的偏差。然而圖像超分辨技術(shù)對(duì)于圖像集的對(duì)齊方式比較敏感,圖像集的對(duì)齊問(wèn)題成為其需要攻克的難關(guān)。
2.2.2統(tǒng)計(jì)模型的方法
視頻人臉圖像是對(duì)人的某一個(gè)階段的表象描述。如果將被監(jiān)測(cè)人的每張圖像當(dāng)做一個(gè)觀測(cè)樣本,這種的圖樣樣本可以滿(mǎn)足一定的統(tǒng)計(jì)特性。這種情況下可以采用PCA刻畫(huà)的方式對(duì)每個(gè)人的子空間信息進(jìn)行刻畫(huà),也或者采用利用模型描摹出每個(gè)人的臉。集合間的相關(guān)性也被用在集合間的度量,因此得到不同人臉之間的相似度,并進(jìn)一步判斷出分類(lèi)的特征。為了避免因?yàn)槿四樀淖藙?shì)造成的識(shí)別影響,因此采用GMM用來(lái)對(duì)人臉的細(xì)節(jié)進(jìn)行描述,并以此為基礎(chǔ)提出概率彈性局部模型。因?yàn)槿四樤诓煌墓庹?,不同的姿?shì),不同的表情變化時(shí)呈現(xiàn)出非線(xiàn)性分布,并通過(guò)核方法可將原空間映射到高維非線(xiàn)性空間,在此基礎(chǔ)上使用核主成分的夾角作為相似度度量能對(duì)人臉圖像集進(jìn)行識(shí)別。而在其他的文獻(xiàn)中還提到了主成分零子空間辦法,這種方法能夠有效處理非均勻樣本分布和非白噪聲的情況。
2.2.23D重構(gòu)的方法
人臉姿勢(shì)的問(wèn)題也是動(dòng)態(tài)視頻人臉識(shí)別技術(shù)一項(xiàng)需要攻克的難關(guān)。3D重構(gòu)的方法是根據(jù)人臉的結(jié)構(gòu),對(duì)人臉進(jìn)行合成,這種方法的運(yùn)用能夠有效減少因?yàn)槿四樀慕嵌鹊膯?wèn)題出現(xiàn)的偏差。根據(jù)重構(gòu)對(duì)象的不同,利用重構(gòu)能夠?qū)崿F(xiàn)對(duì)人臉的3D復(fù)原,進(jìn)行監(jiān)測(cè)對(duì)象臉部3D建模。通過(guò)對(duì)人臉姿勢(shì)以光照問(wèn)題的預(yù)測(cè),可使用在庫(kù)人員的3D臉模型,對(duì)不同庫(kù)人員的2D人臉圖像進(jìn)行比對(duì),識(shí)別。這種方法減少了因?yàn)樽藙?shì)的差異帶來(lái)的識(shí)別困難,但是因?yàn)槠溥\(yùn)算成本較大,因此使用并不廣泛。
2.2.4流行的方法
流行是一種刻畫(huà)樣本集的工具?;プ涌臻g的方法的度量為集合之間主成分的夾角相似度量,對(duì)線(xiàn)性子空間與線(xiàn)性子空間的距離。在此基礎(chǔ)上可以將流行看作是不同線(xiàn)性結(jié)構(gòu)快的結(jié)合,流行與流行之間的距離定義為兩個(gè)線(xiàn)性結(jié)構(gòu)快之間的距離,而對(duì)流行的線(xiàn)性逼近則稱(chēng)之為最大的線(xiàn)性結(jié)構(gòu)快。使用流行距離的方法,動(dòng)態(tài)視頻人臉識(shí)別技術(shù)的正確識(shí)別效果達(dá)到了96%。若在流行方法的基礎(chǔ)之上在計(jì)入鑒別學(xué)習(xí)機(jī)制,則能進(jìn)一步提升識(shí)別效果。另外,概率靜觀流行的方法與局部線(xiàn)性嵌入的方法也被廣泛應(yīng)用到視頻人臉識(shí)別之中。
圖1 面向視頻的動(dòng)態(tài)人臉識(shí)別流程圖
本文主要對(duì)目前流行的動(dòng)態(tài)視頻人臉識(shí)別技術(shù)方法進(jìn)行了分析,總結(jié)其優(yōu)勢(shì)以及存在的不足。雖然動(dòng)態(tài)人臉識(shí)別技術(shù)經(jīng)過(guò)若干年的發(fā)展已經(jīng)有了小部分的成就,但是在非可控、復(fù)雜的情況下依然很難得到較好的識(shí)別效果。如在車(chē)站,或者是在重點(diǎn)的要求較高的監(jiān)控場(chǎng)所,因?yàn)槭艿饺四樧藙?shì)以及光照等的影響,很難得到良好的識(shí)別效果,這也成為之后的動(dòng)態(tài)視頻人臉識(shí)別技術(shù)的難點(diǎn)。
[1] Phillips PJ,Scruggs WT,O’Toole AJ,F(xiàn)lynn PJ,Bowyer KW,Schott CL,and Sharpe M.FRVT 2006 andICE 2006 Large-Scale Experimental Results[J]. IEEETransactions on Pattern Analysis and MachineIntelligen ce,2(5):831-846,2010.
[2] Galton F.Personal identification and description[J]. Nature,173-177,1888.
[3] 梁路宏,艾海舟, 何克忠.基于多模板匹配的單人臉檢測(cè)[J].中國(guó)圖像圖形學(xué)報(bào), 1999
茹志鵑(1980.12-),女,河南澠池人,正德職業(yè)技術(shù)學(xué)院講師,研究方向:計(jì)算機(jī)應(yīng)用專(zhuān)業(yè)
The research on Face recognition technologybased on dynamic video
Ru Zhijuan
(zhengde polytechnic,211106)
With the development of high-tech,face recognition technology is also in constant development. Now It has appeared on the market a variety of facial recognition technology.Facial recognition technology,as a typical application of biometrics has been applied to various fields,such as national defen se,justice,finance,etc.,has
the attention and recognition.
dynamic video;Face recognition;The original like than