費(fèi)訓(xùn)等
摘要:人臉識(shí)別是圖像識(shí)別中受人關(guān)注較多的領(lǐng)域之一,人們希望計(jì)算機(jī)能有像人類一樣有強(qiáng)大的視覺能力。人臉識(shí)別屬于生物特征是識(shí)別一種,雖然準(zhǔn)確性不如虹膜、指紋的識(shí)別,但由于它的簡(jiǎn)單、直觀、易于采集特征且對(duì)用戶無害,使它成為容易被用戶接受的一種生物特征識(shí)別。該文介紹了基于隱馬爾科夫模型進(jìn)行人臉識(shí)別的算法和具體系統(tǒng)的實(shí)現(xiàn)。首先介紹識(shí)別所需的圖像特征提取算法“二維離散余弦變換”和匹配算法“高斯混合模型和隱馬爾可夫模型”,其次介紹依據(jù)算法實(shí)現(xiàn)系統(tǒng)的過程。
關(guān)鍵詞:人臉識(shí)別;隱馬爾可夫模型
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)08-1781-02
The Research and Implement of Face Recognition Base on the Hidden Markov Model
FEI Xun, ZHUANG Ji-jun, CHEN Wei,CHU Zheng-yang
(Department of Computer Science and Technology, Hefei University, Hefei 230601,China)
Abstract: Face recognition is one of the image areas of concern more people want to have a computer as powerful as the human visual capabilities. Biometric face recognition is to identify a part, though not as good as the accuracy of iris, fingerprint recognition, but because it is simple, intuitive, easy-to-capture features and user-friendly, making it easy to accept a biometric user identified. This thesis focus on the way base on Hidden Markov Model. At first Thesis introduces the core algorithms required for recognition, including image feature extraction algorithm "Two-dimensional discrete cosine transform"; matching algorithm "Gaussian mixture model and Hidden Markov models". Then the tell the how to use the algorithm develop a face recognition system.
Key words: face recognition; hidden markov model
計(jì)算機(jī)圖像處理在現(xiàn)代的計(jì)算機(jī)圖形學(xué)中仍然是一個(gè)富有挑戰(zhàn)的研究方向,一個(gè)圖像中所能傳達(dá)的信息,往往是無法用文字表達(dá)的。人的眼睛表現(xiàn)出的圖像識(shí)別能力是令人震驚的。如果能讓計(jì)算機(jī)像人的眼睛[1]一樣能識(shí)別出不同的人物和物體,這將會(huì)帶來很多的快捷,而且讓計(jì)算機(jī)能夠更智能的工作。
人臉是人體的一項(xiàng)重要生物特征,對(duì)人臉識(shí)別屬于圖像處理領(lǐng)域的一種,在很多行業(yè)都有應(yīng)用的價(jià)值。人臉識(shí)別如果有很好的魯棒性[2],達(dá)到很好的識(shí)別效果,相當(dāng)于給機(jī)器裝上了眼睛,將會(huì)推動(dòng)信息智能化更進(jìn)一步的發(fā)展,給人們的生活帶來很多的便利。
1 人臉識(shí)別的工作原理
人臉包含著一個(gè)人的很多信息,很大程度上從一個(gè)人的人臉圖像就能判斷一個(gè)人。簡(jiǎn)單、直觀、易于采集特征且對(duì)用戶無害,使它成為容易被用戶接受的一種生物特征識(shí)別。人臉的圖像信息屬于數(shù)字信號(hào)信息,整個(gè)對(duì)人臉圖像的處理屬于數(shù)字信號(hào)處理領(lǐng)域,其重要的功能是實(shí)現(xiàn)人臉數(shù)據(jù)庫的建立(即訓(xùn)練過程)和人臉鑒別過程。這些過程屬于模型識(shí)別領(lǐng)域內(nèi)容,根據(jù)前期調(diào)查評(píng)估,隱馬爾可夫模型和混合高斯模型配合使用能達(dá)到理想的識(shí)別效果。
人臉定位屬于一個(gè)很大的領(lǐng)域,為了保證系統(tǒng)方向的專一性,系統(tǒng)默認(rèn)送入引擎的就是純?nèi)四様?shù)據(jù)。因此,還應(yīng)考慮人臉位置定位、特征提取、核心匹配算法三個(gè)重要因素。
2 核心算法與關(guān)鍵技術(shù)
2.1 隱馬爾可夫模型
2.1.1隱馬爾可夫模型簡(jiǎn)介
對(duì)于一種已知系統(tǒng),知道當(dāng)前時(shí)刻所處的狀態(tài),而之后的時(shí)刻和之前的時(shí)刻無關(guān),這種過程稱為無記憶的單隨機(jī)過程。如果這種隨機(jī)過程的狀態(tài)是離散的,可以將它稱作無記憶的離散隨機(jī)過程。
假設(shè)一個(gè)系統(tǒng),它所處的狀態(tài)是有限的,某一個(gè)時(shí)刻會(huì)對(duì)應(yīng)其中的一個(gè)狀態(tài);如果將這些狀態(tài)均勻的分布在時(shí)間軸上,則會(huì)有一組停留在原狀態(tài),跳轉(zhuǎn)到另一狀態(tài)的概率。如果狀態(tài)可以通過一個(gè)事件表現(xiàn)出來,能夠被觀測(cè)到則成為可觀測(cè)的隱馬爾科夫過程。如果狀態(tài)為不可測(cè)的,需要通過另一組隨機(jī)過程產(chǎn)生觀測(cè)序列,這種雙隨機(jī)過程成為隱馬爾科夫模型。
2.1.2隱馬爾可夫模型的參數(shù)
1) N—模型的狀態(tài)數(shù)
狀態(tài)的集合表示[S=S1,S2,...SN] (1)
2) M—觀測(cè)符號(hào)數(shù)。
每個(gè)狀態(tài)可能輸出的觀測(cè)符號(hào)的數(shù)。
觀測(cè)符號(hào)集合[O=O1,O2,...OM] (2)
3) A—狀態(tài)轉(zhuǎn)移概率。
狀態(tài)轉(zhuǎn)移概率構(gòu)成的矩陣為
[A=aij,aij=P[qt+1=Sj|qt=Si],1≤i,j≤N] (3)
4) B—狀態(tài)的觀測(cè)符號(hào)概率分布。
(4)
5) π—初始狀態(tài)分布。
[π={πi},πi=P[q1=Si],1≤i≤N] (5)
要完整地描述一個(gè)隱馬爾可夫模型,需要有確定的狀態(tài)數(shù)N,觀測(cè)符號(hào)數(shù)M,以及狀態(tài)轉(zhuǎn)移概率,觀測(cè)符號(hào)表現(xiàn)概率,初始分布概率。為了方便,常用[λ=(A,B,π)]來簡(jiǎn)記。
2.1.3隱馬爾可夫模型的三個(gè)基本問題
實(shí)際應(yīng)用中,確定HMM形式后,根據(jù)不同的場(chǎng)景需要解決不同的問題,關(guān)鍵有三類:
1) 已知觀測(cè)序列[O=O1,O2,...OT]和模型[λ=(A,B,π)],如何有效的計(jì)算在給定模型條件下產(chǎn)生觀測(cè)序列O的概率[POλ],即是計(jì)算一個(gè)觀察序列和模型的匹配程度。
2) 已知觀測(cè)序列[O={O1,O2,...OT}]和模型[λ=(A,B,π)],找出最佳的狀態(tài)序列,即是通過觀測(cè)到的量,來找出最優(yōu)的隱含序列。
3)觀測(cè)序列已知的情況下,如何調(diào)整HMM的參數(shù)[(A,B,π)] 使條件概率[POλ]最大 ,即是模型的訓(xùn)練問題。
2.1.4 實(shí)現(xiàn)方法
對(duì)于一個(gè)人臉圖像來說,人的額頭、眼睛、鼻子、嘴和下巴,可以對(duì)應(yīng)為不同的狀態(tài)。不同狀態(tài)間的轉(zhuǎn)換概率即構(gòu)成了轉(zhuǎn)換矩陣A,通過每個(gè)狀態(tài)的樣本數(shù)可以構(gòu)造每個(gè)狀態(tài)的高斯混合模型;根據(jù)高斯混合模型可以實(shí)時(shí)算出一個(gè)特征序列的表現(xiàn)概率及B矩陣,由于默認(rèn)從第一個(gè)狀態(tài)開始,則初始概率也固定。這樣系統(tǒng)要解決的問題即變?yōu)镠MM的可以解決的問題,而HMM的這三個(gè)問題都已有對(duì)應(yīng)的算法來解決,系統(tǒng)只需按照算法流程來實(shí)現(xiàn)即可。
3 基于隱馬爾可夫模型的系統(tǒng)設(shè)計(jì)
3.1.1 特征提取
系統(tǒng)使用二維離散余弦(2D-DCT)變換完成圖像的特征提取。離散余弦變換(Discrete Cosine Transform)是與傅里葉變換相關(guān)的一種變換,它類似于離散傅里葉變換(Discrete Fourier Transform),但是只使用實(shí)數(shù)。離散余弦變換相當(dāng)于一個(gè)長度大概是它兩倍的離散傅里葉變換,這個(gè)離散傅里葉變換是對(duì)一個(gè)實(shí)偶函數(shù)進(jìn)行的(因?yàn)橐粋€(gè)實(shí)偶函數(shù)的傅里葉變換仍然是一個(gè)實(shí)偶函數(shù))。將人臉圖像的灰度值及其坐標(biāo)關(guān)系作為人臉描述及識(shí)別的依據(jù),對(duì)于灰度人臉圖像,采用圖像灰度值與圖像空間距離相結(jié)合用于表征人臉圖像[4],具有很好的分類效果。
對(duì)于一個(gè)樣品來說,必須確定一些與識(shí)別相關(guān)的因素作為研究根據(jù),每一個(gè)因素稱為一個(gè)特征。模式就是樣品所具有的特征描述。模式的特征集由處于同一個(gè)特征空間的特征向量表示,特征向量的每個(gè)元素成為特征,該向量也因此稱為特征向量[5]。
而DCT變換獲取頻域信息后,對(duì)信息進(jìn)行了壓縮,通過提取特征向量,可以得到更豐富的人臉特征。
3.1.2 后端
后端利用HMM和GMM來實(shí)現(xiàn)人臉模型的建立和模型的匹配。隱馬爾可夫模型(Hidden Markov models,HMM)是馬爾可夫鏈的一種,當(dāng)前所處的狀態(tài)不能直接觀察到,就像在一幅圖片中,計(jì)算機(jī)不能直接知道當(dāng)前區(qū)域是人臉的那部分;但觀測(cè)向量(即圖像特征數(shù)據(jù))計(jì)算機(jī)已知的;狀態(tài)轉(zhuǎn)移矩陣有人臉圖像的結(jié)構(gòu)可以計(jì)算出來;觀測(cè)向量和狀態(tài)之間的關(guān)系,通過GMM來計(jì)算得到,HMM的每個(gè)狀態(tài)由高斯混合模型(Gauss Mix Model)構(gòu)成,即由多個(gè)高斯分布構(gòu)成,高斯分布是由方差和均值兩個(gè)要素決定,在知道方差和均值的情況下即固定了一個(gè)狀態(tài),即可通過觀測(cè)向量算出當(dāng)前出現(xiàn)在每個(gè)狀態(tài)的概率。
通過給定圖像通過提取到的特征確定HMM的轉(zhuǎn)換矩陣、表現(xiàn)矩陣和高斯分布的方差、均值的過程即時(shí)模型建立的過程。
一個(gè)人臉圖像在給定模型的情況下,可以通過高斯分布算出一個(gè)狀態(tài)的表現(xiàn)概率,利用viterbi解碼可以算圖像在對(duì)應(yīng)模型下的得分情況。
4 結(jié)束語
通過對(duì)算法進(jìn)行一定優(yōu)化和調(diào)整,以C語言工具完成了在系統(tǒng)的設(shè)計(jì)和開發(fā);系統(tǒng)測(cè)試和訓(xùn)練集合采用,orl人臉數(shù)據(jù)庫(由劍橋大學(xué)AT&T實(shí)驗(yàn)室創(chuàng)建,包含40人共400張面部圖像),初步測(cè)試結(jié)果隱馬爾可夫模型在人臉識(shí)別領(lǐng)域表現(xiàn)出較強(qiáng)的魯棒性。
參考文獻(xiàn):
[1] 張錚,王艷平,薛桂香. 數(shù)字圖像處理與機(jī)器視覺[M]. 北京:人民郵電出版社,2010.
[2] 岡薩雷斯,伍茲,阮秋琦,等. 數(shù)字圖像處理 [M]. 3版.北京:電子工業(yè)出版社,2010.
[3] 陳勝勇,劉盛.基于OpenCv的計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)[M]. 北京:科學(xué)出版社,2008.
[4] 戴歡,吳小俊.基于圖像歐氏距離的人臉描述和識(shí)別方法[J].江南大學(xué)學(xué)報(bào),2009,8(1)20-23.
[5] 許鳳.基于嵌入式隱馬爾可夫模型(EHMM)的人臉表情識(shí)別[D].大連:大連理工大學(xué),2006.