龐珊珊 熊建設(shè)
摘要:人臉識別是人工智能領(lǐng)域的一個研究熱點,是一種基于信息處理的模式識別。這篇論文簡要介紹了人臉識別技術(shù)的特點、研究背景和識別系統(tǒng)的構(gòu)成,重點介紹了幾種在人臉識別中常用的算法及其評價??偨Y(jié)了現(xiàn)存的研究困難,對人臉識別技術(shù)未來的發(fā)展和應(yīng)用做出了展望。
關(guān)鍵字:人臉識別;特征提??;特征臉;神經(jīng)網(wǎng)絡(luò)
1 引言
生物特征鑒別技術(shù)是利用人體生物特征進(jìn)行身份認(rèn)證的一種技術(shù),具有安全可靠、特征唯一、不易偽造、不可竊取等優(yōu)點。在不同的生物識別方法中,人臉識別有其自身特殊的優(yōu)勢,例如,非侵?jǐn)_性;采集設(shè)備簡單,使用快捷;通過人臉識別身份符合人類的習(xí)慣,正是由于這些良好的特性,人臉識別的相關(guān)研究越來越受到人們的重視,并取得了很好的成果。隨著人臉識別技術(shù)的飛速發(fā)展,它被越來越多的應(yīng)用于海關(guān)監(jiān)控、企業(yè)安全與管理、刑偵等領(lǐng)域。
人臉識別按照信息的來源可以分為兩類:基于靜態(tài)人臉識別和基于動態(tài)的信息識別。對于動態(tài)識別研究的相關(guān)技術(shù)還比較欠缺,本文只對靜態(tài)人臉識別的相關(guān)算法進(jìn)行闡述。
靜態(tài)人臉識別系統(tǒng)主要有三個步驟:人臉的檢測和定位、人臉的特征提取和人臉識別,在這些步驟之前還應(yīng)有預(yù)處理這一步,即對采集到的圖像先進(jìn)行預(yù)處理,以達(dá)到位置校準(zhǔn)和灰度歸一的目的,然后尋找人臉,如果有則確定人臉的位置并提取人臉,然后提取人臉特征,最后根據(jù)提取的特征進(jìn)行識別。下面對人臉識別中的常用算法進(jìn)行介紹。
2 幾種常用的算法
2.1 基于幾何特征的人臉識別算法
這類識別方法將人臉用一個幾何特征矢量來表示,用模式識別中的層次聚類的思想設(shè)計分類器達(dá)到識別目的,常采用的幾何特征有眼睛、鼻子、眉毛、嘴等重要的局部特征,臉型特征及五官在臉上分布的幾何特征。識別所用的幾何特征是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量通常包括人臉指定兩點間的歐式距離、曲率、角度等等。在這種基于幾何特征的識別中,不同特征的相似性度量主要依賴于特征矢量的匹配情況進(jìn)行判決,例如,基于歐氏距離的判決。
基于幾何特征的識別方法的優(yōu)點有:符合人類的習(xí)慣,易于理解;對光照變化不是很敏感,具有一定的抗干擾能力。存在的問題:從圖像中抽取穩(wěn)定的特征比較困難,當(dāng)有遮擋時會出現(xiàn)誤提?。划?dāng)面部表情變化很大,或者姿態(tài)變化很大時,魯棒性較差;幾何特征模型的準(zhǔn)則過于簡單,一般的幾何特征只描述了器官的基本形狀與結(jié)構(gòu)關(guān)系,忽略了細(xì)節(jié)特征,會使部分信息丟失。
2.2 基于特征子空間(特征臉)的人臉識別算法
特征臉方法是人臉識別技術(shù)中的一種典型方法,又稱為主成分分析法(PCA)。SIROV ICH和KIRBY 首先采用PCA算法來表示人臉。它根據(jù)一組人臉訓(xùn)練樣本構(gòu)造主特征向量空間,即特征子空間(特征臉),這些特征向量是由圖像的生成矩陣的主特征值所對應(yīng)的特征向量組成,這些主特征向量所占的能量是總能量的90%(一般取這個數(shù))以上,其余的小能量向量被剔除。生成矩陣可以是圖像的協(xié)方差矩陣、總類內(nèi)離散度矩陣等等。這個子空間是降維的,維數(shù)比原數(shù)據(jù)空間要小得多,任何一幅待識別人臉圖像都可以向此特征空間投影并獲得一組坐標(biāo)系數(shù),這組系數(shù)表明了該圖像在子空間中的位置,從而可以作為人臉識別的依據(jù)。任何一幅人臉圖像都可以表示為這組特征向量的線性組合,其加權(quán)系數(shù)(圖像向空間投影得到的系數(shù))稱為該圖像的代數(shù)特征。識別的時候,將待識別的圖像投影到這個特征子空間,將得到的投影系數(shù)與各個已知人臉圖像的系數(shù)進(jìn)行比較,通過一定的準(zhǔn)則,例如k-近鄰法,取未知樣本的k個近鄰,看這k個近鄰中多數(shù)屬于哪一類,就把待識別的圖像歸入哪一類。特征臉方法比較簡單易懂,得到了廣泛的使用,但單獨使用的計算量較大,所以PCA經(jīng)常與其它方法配合使用,例如小波變換與PCA的結(jié)合 ,使PCA的降維效果得到改善。
2.3 基于模板匹配的人臉識別算法
模板匹配有靜態(tài)匹配和彈性匹配兩種,首先介紹一下靜態(tài)匹配。靜態(tài)模板匹配方法:設(shè)計一個庫,其中存儲了已知人臉的若干模板,這些模板可以是整張人臉的灰度圖像,可以是各生理特征區(qū)域的灰度圖像,還可以是經(jīng)某種變換的人臉圖像。待識別的圖像經(jīng)過相同的變換后,還要進(jìn)行尺度歸一化和灰度歸一化的處理,得到與庫中的圖像大小、取向和光照條件均相同的圖像。然后計算待識別圖像和庫中圖像的匹配度,與哪一類的匹配度最好,就將待識別圖像判為哪一類。靜態(tài)模板匹配存在的問題:因為庫是固定的,如果人臉表情變化較大,或者有新的模式出現(xiàn),那么這個模板就不適用了,也就是說靜態(tài)模板匹配方法不靈活??紤]這個問題,下面提出彈性模板匹配。
彈性模板匹配是根據(jù)待測人臉特征的先驗知識,定義一個特征參數(shù)模型,這些參數(shù)反映相對應(yīng)特征形狀的可變部分,為了得到這組參數(shù),根據(jù)圖像的邊緣、峰值、谷值和強(qiáng)度信息及特征形狀的先驗知識設(shè)計合適的能量函數(shù)。我們要求的參數(shù)就是使能量函數(shù)取極小值時的參數(shù)。這種算法的優(yōu)點是顯然的,它比靜態(tài)模板匹配法要靈活,魯棒性要強(qiáng)一些,但是也有缺點:對參數(shù)的初值依賴度高,容易陷入局部最??;計算時間長。
2.4 基于神經(jīng)網(wǎng)絡(luò)的人臉識別算法
人工神經(jīng)網(wǎng)絡(luò)是在生物神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展起來的,心理學(xué)家McCulloch和數(shù)學(xué)家Pitts 合作提出了形式神經(jīng)元的數(shù)學(xué)模型,成為人工神經(jīng)網(wǎng)絡(luò)的開端。神經(jīng)網(wǎng)絡(luò)方法在人臉識別上比其他類型的方法有其獨特的優(yōu)勢,它避免了復(fù)雜的特征提取工作,可以通過學(xué)習(xí)獲得其它方法難以得到的關(guān)于人臉識別的規(guī)律和規(guī)則的隱性表達(dá)。
神經(jīng)網(wǎng)絡(luò)是以并行方式處理信息,存儲方式是分布式的,如果能用硬件實現(xiàn),那么將能顯著提高速度。神經(jīng)網(wǎng)絡(luò)把模型的統(tǒng)計特征隱含在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)中,對于人臉這類復(fù)雜的、難以顯示描述的模型,基于神經(jīng)網(wǎng)絡(luò)的方法具有獨特優(yōu)勢。神經(jīng)網(wǎng)絡(luò)的魯棒性比較好,但是訓(xùn)練慢,并可能陷入局部最優(yōu)。
2.5 基于隱馬爾科夫模型的人臉識別算法
隱馬爾科夫模型是一種參數(shù)表示的、用于描述隨機(jī)過程統(tǒng)計特性的概率模型。最早由Samaria 提出了關(guān)于人臉的隱馬爾科夫模型。隱馬爾科夫過程是一個雙重的隨機(jī)過程:一個潛在的過程稱為“狀態(tài)”過程,另一個可觀測過程稱為“觀測序列”,觀測序列是由隱含的狀態(tài)過程決定的。
用HMM進(jìn)行人臉識別,既考慮了各器官的不同特征,又考慮了相互關(guān)聯(lián),該模型的參數(shù)能較好的表征具體的人臉模型。HMM方法的魯棒性較好,對表情、姿態(tài)變化不太敏感。
以上介紹了5中人臉識別中的常用算法,除此之外,還有其他的一些算法,比如,基于彈性圖匹配的算法,基于SVM的人臉識別算法,遺傳算法等等。
3 總結(jié)與展望
以上介紹了幾種常用的人臉識別算法,從分析中可以看出,每種方法都有其優(yōu)缺點,因此根據(jù)這些方法的特點,將這些方法結(jié)合起來使用,例如Nefian提出了基于2D-DCT的HMM方法。但是由于人臉識別是一項跨學(xué)科的研究課題,在研究過程中面臨著相當(dāng)程度的難度,由于人臉易受表情、光線和附著物等的影響,在研究過程中有一些的困難,具有一定的挑戰(zhàn)性。前面介紹的算法只是在一定程度上解決了一些問題,應(yīng)用方面還有待進(jìn)一步提高。
盡管如此,人臉識別技術(shù)在經(jīng)過這么多年的發(fā)展后,取得的成績是不可抹殺的,人們提出了很多新的方法,Paul和Michael J.Jones提出基于haar特征的算法 ,采用級聯(lián)的boosted分類器進(jìn)行分類,速度較以往的分類器提高了15倍,識別分類效果很好。
近年來,由于反恐、國土安全和社會安全的需要,世界上各個國家都對安防領(lǐng)域加大了投入。而身份驗證是安防的一個核心領(lǐng)域,在這種大環(huán)境下,生物特征識別將迎來一個快速發(fā)展的時期,從而人臉識別技術(shù)的應(yīng)用會得到快速發(fā)展。
參考文獻(xiàn)
[1]尹飛,馮大政.基于PCA算法的人臉識別[J].計算機(jī)技術(shù)與發(fā)展,2008,18(10):31-33.
[2]楊紹華.一種基于小波變換和PCA的人臉識別改進(jìn)方法[J].吉林工程技術(shù)師范學(xué)院學(xué)報,2008,24(9):62-65.
[3]邊肇祺,張學(xué)工.模式識別[M].北京:清華大學(xué)出版社,2000.
[4]Samaria F.Yong S.HHM based architecture for face identification[J].Image and Computer Vision,1994(12):537-583.
[5]Paul Viola, Michael J.Jones. Pobust Peal-time Object Detection[J].Cambridge Research Laboratory, 2001.
作者簡介:龐珊珊(1984-),女,碩士研究生,研究方向:模式識別,圖像處理;熊建設(shè),副教授,研究生導(dǎo)師。