楚展奇
【摘 要】人臉識(shí)別是模式識(shí)別和人工智能領(lǐng)域內(nèi)的一個(gè)研究熱點(diǎn),在生物識(shí)別方法中有很特殊的優(yōu)勢(shì),廣泛地應(yīng)用在安全、民用等方面。論文介紹了人臉識(shí)別系統(tǒng)的設(shè)計(jì)流程和流行應(yīng)用算法。
【Abstract】The face recognition is a research focus in the field of pattern recognition and artificial intelligence. It has a special advantage in the field of biometric recognition, and be widely used in the field of safety and civilian use. This paper introduces the system of the face recognition
design process and popular application algorithm.
【關(guān)鍵詞】人臉識(shí)別;模式識(shí)別;設(shè)計(jì)流程;應(yīng)用算法
【Keywords】face recognition; pattern recognition; design flow; application algorithm
【中圖分類(lèi)號(hào)】TB472 【文獻(xiàn)標(biāo)志碼】A 【文章編號(hào)】1673-1069(2017)03-0099-02
1 引言
人臉識(shí)別技術(shù)是一種非接觸式、友好的生物識(shí)別方式,它是當(dāng)前模式識(shí)別和人工智能領(lǐng)域的一個(gè)研究熱點(diǎn),其開(kāi)始于20世紀(jì)60年代,到20世紀(jì)90年代隨著圖像處理、模式識(shí)別、認(rèn)知科學(xué)等理論的發(fā)展取得了突破性進(jìn)展,廣泛地應(yīng)用在自動(dòng)身份認(rèn)證與識(shí)別、民用、安檢等方面。
2 技術(shù)流程
人臉識(shí)別系統(tǒng)主要包括四個(gè)組成部分,分別為:人臉圖像采集及檢測(cè)、圖像預(yù)處理、特征提取以及匹配與識(shí)別。
2.1 圖像采集及檢測(cè)
人臉檢測(cè)是人臉識(shí)別過(guò)程中的關(guān)鍵技術(shù)。對(duì)任意給定的一個(gè)或一組圖像進(jìn)行識(shí)別,人臉檢測(cè)的目的在于判斷圖像中是否存在人臉,并準(zhǔn)確標(biāo)定出人臉的位置、大小和姿態(tài)的過(guò)程。具體算法有以下幾種類(lèi)型:
2.1.1 基于直方圖粗分割和奇異值特征的人臉檢測(cè)
這種方法是用平滑的直方圖對(duì)圖像進(jìn)行粗分割,再根據(jù)一定的灰度區(qū)間對(duì)人眼進(jìn)行定位,進(jìn)而確定出人臉區(qū)域。這種算法檢測(cè)率較高,但耗時(shí)較長(zhǎng),而且當(dāng)臉部光照變化較大或臉部有較大陰影時(shí),圖像很難被檢測(cè)到。
2.1.2 基于二進(jìn)制小波變換的人臉檢測(cè)
給定一幅原圖像,在垂直方向上應(yīng)用低通分析濾波器得到垂直方向的低頻分量和水平方向上的高頻分量,水平方向應(yīng)用高通分析濾波器得到水平方向的低頻分量與垂直方向的高頻分量,再經(jīng)過(guò)一系列的變換,得到角度相似函數(shù)和自由參數(shù),這樣選擇人臉部位的任意一點(diǎn)(n,m),學(xué)習(xí)得到自由參數(shù),應(yīng)用這些不等長(zhǎng)的參數(shù),可以有效地獲取人臉部位的特征。
但該方法對(duì)原始圖像的要求較高,當(dāng)圖像的背景相對(duì)復(fù)雜,比如從側(cè)面拍攝人臉時(shí),水平方向和垂直方向的高低頻分量很難獲取,這將直接影響到自由參數(shù)的準(zhǔn)確性,從而很大程度上影響人臉檢測(cè)的檢準(zhǔn)率。
2.1.3 基于AdaBoost算法的人臉檢測(cè)
2010年Viola和 Jones引入積分圖概念,提出了基于Harr-like特征、級(jí)聯(lián)結(jié)構(gòu)的AdaBoost算法,成功應(yīng)用于模式識(shí)別領(lǐng)域,實(shí)現(xiàn)了實(shí)時(shí)人臉檢測(cè),使人臉檢測(cè)技術(shù)取得了突破性進(jìn)展。該算法是挑選出一些最能代表人臉的矩形特征(弱分類(lèi)器),按照加權(quán)投票的方式將弱分類(lèi)器構(gòu)造為一個(gè)強(qiáng)分類(lèi)器,再將訓(xùn)練得到的若干強(qiáng)分類(lèi)器串聯(lián)組成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的層疊分類(lèi)器,有效地提高分類(lèi)器的檢測(cè)速度。
2.2 人臉圖像預(yù)處理
預(yù)處理是人臉識(shí)別過(guò)程中的一個(gè)重要環(huán)節(jié)。輸入圖像在采集、傳輸、變換過(guò)程中,由于多種原因,往往會(huì)造成圖像與原始人物之間產(chǎn)生某些差異。這些質(zhì)量的退化會(huì)對(duì)下一步的特征提取造成很大的影響,因此有必要對(duì)分割出來(lái)的圖像進(jìn)行適當(dāng)?shù)奶幚?,使其有利于?jì)算機(jī)的運(yùn)算,這種處理就是圖像的預(yù)處理[1]。
通常圖像的預(yù)處理有濾波法、基于數(shù)學(xué)形態(tài)的預(yù)處理方法等。濾波法常用基于空間域的均值濾波、高斯濾波、中值濾波、邊緣保持濾波和基于頻率域?yàn)V波的低通、高通、帶阻濾波等[2];基于數(shù)學(xué)形態(tài)的預(yù)處理方法有灰度腐蝕、灰度膨脹、灰度開(kāi)運(yùn)算、灰度閉運(yùn)算等方法。論文簡(jiǎn)單介紹了濾波法的計(jì)算原理。
均值濾波是用像素鄰域內(nèi)的各像素灰度平均值代表原來(lái)的灰度值,此法能有效地去除噪聲,但容易使邊緣模糊。
高斯平滑濾波器是根據(jù)高斯函數(shù)的形狀來(lái)選擇權(quán)值的線性平滑濾波器。高斯平滑濾波器對(duì)去除服從正態(tài)分布的噪聲是很有效的,在邊緣檢測(cè)之前要對(duì)圖像進(jìn)行平滑濾波,往往采用高斯濾波器。
中值濾波是用局部的中值代替局部均值。在灰度圖像 f 中以像素(x,y)為中心的 N×N 屏蔽窗口(N= 3, 5, 7, …)內(nèi), 首先把這 N×N 個(gè)像素點(diǎn)的灰度值按大小進(jìn)行排序,然后選取值的大小處于中間位置的灰度值α, 使 f ( x , y)α。這樣 , 把被處理點(diǎn)的某一鄰域中像素灰度中值作為該點(diǎn)灰度的估計(jì)。
2.3 人臉識(shí)別常用算法
2.3.1 基于主成分分析的人臉識(shí)別算法
主成分分析法(Principal Component Analysis,PCA)是最早、研究最廣泛的人臉識(shí)別方法。該方法識(shí)別人臉時(shí),將單張人臉圖像投影到此低維空間,用所得投影坐標(biāo)系數(shù)與目標(biāo)樣本集中的投影系數(shù)進(jìn)行比對(duì),以確定最佳特征臉。其步驟如下:
①利用濾波或膨脹、腐蝕等方法對(duì)人臉圖像進(jìn)行預(yù)處理。
②讀入特定人臉數(shù)據(jù)庫(kù),形成人臉樣本的特征空間。
③將訓(xùn)練樣本圖像和測(cè)試人臉圖像進(jìn)行正交變換、投影等。
④選擇合適分類(lèi)方法判斷訓(xùn)練樣本和測(cè)試人臉是否同類(lèi)。
2.3.2 基于神經(jīng)網(wǎng)絡(luò)的識(shí)別方法
心理學(xué)家McCulloch和數(shù)學(xué)家Pitts 合作提出了形式神經(jīng)元的數(shù)學(xué)模型, 成為人工神經(jīng)網(wǎng)絡(luò)的開(kāi)端。神經(jīng)網(wǎng)絡(luò)把模型的統(tǒng)計(jì)特征隱含在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)中,對(duì)于人臉這類(lèi)復(fù)雜的、難以顯示描述的模型,基于神經(jīng)網(wǎng)絡(luò)的方法具有獨(dú)特優(yōu)勢(shì)。神經(jīng)網(wǎng)絡(luò)的魯棒性比較好,但是訓(xùn)練慢,并可能陷入局部最優(yōu)。
2.3.3 基于隱馬爾科夫模型的人臉識(shí)別算法
隱馬爾可夫模型(HMM)的基本理論發(fā)起于20世紀(jì)六七十年代,Samaria等人最早提出關(guān)于人臉的隱馬爾可夫模型,使用人臉圖像中的額頭、眼睛、鼻子、嘴巴和下巴5個(gè)特征參數(shù),隱含5個(gè)形態(tài),將人臉用矩形從上到下分成若干區(qū)域,將窗口內(nèi)的像素點(diǎn)數(shù)據(jù)排成列向量,用每個(gè)區(qū)塊的像素值作為觀察序列來(lái)進(jìn)行人臉識(shí)別。
除以上方法外,還有很多不同的算法,如基于三維的人臉識(shí)別、基于主動(dòng)近紅外圖像的多光源人臉識(shí)別技術(shù)、基于皮膚特征的人臉識(shí)別都取得了很好的應(yīng)用效果。
3 系統(tǒng)的構(gòu)建
MATLAB是一種用于算法開(kāi)發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計(jì)算的高級(jí)技術(shù)計(jì)算語(yǔ)言和交互式環(huán)境,利用其對(duì)待識(shí)別人臉圖像的預(yù)處理、判斷待識(shí)別圖像是否在人臉庫(kù)中、對(duì)選取不同訓(xùn)練樣本個(gè)數(shù)下識(shí)別效率進(jìn)行比較。
3.1 ORL人臉庫(kù)
英國(guó)劍橋大學(xué)的ORL人臉庫(kù)包含40個(gè)人,每人10幅圖像,每幅圖像大小為92×112,圖像是在不同時(shí)間、光線輕微變化的條件下攝制的,其中包括姿態(tài)、光照和表情的差別。
3.2 圖像預(yù)處理
通過(guò)幾何歸一化對(duì)輸入的圖像加工,使其與人臉庫(kù)的圖像一致,然后將彩色圖像轉(zhuǎn)換為灰度圖像,通過(guò)灰度拉伸,直方圖均衡化等方法完成對(duì)圖像的處理。
3.3 人臉識(shí)別
根據(jù)具體情況選擇不同的核心算法,以HMM算法為例,對(duì)人臉庫(kù)中的圖像進(jìn)行訓(xùn)練,得出人臉庫(kù)的HMM值。
在建立完人臉庫(kù)后,用與訓(xùn)練相同的方法提取待識(shí)別人臉的HMM值,并與原人臉庫(kù)中存在的HMM值進(jìn)行比較,求出各項(xiàng)的相似概率,對(duì)這些概率進(jìn)行排序,輸出相似概率最大項(xiàng)。
【參考文獻(xiàn)】
【1】劉新業(yè).基于人臉識(shí)別的人臉圖像預(yù)處理研究[J].電子測(cè)試,2008 (2) :27-30.
【2】賈云得.機(jī)器視覺(jué)[M].北京:科學(xué)出版社,2000.