張 偉
中圖分類(lèi)號(hào):TP2文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2009)0810052-01
隨著科技的飛速發(fā)展,傳統(tǒng)身份識(shí)別(如口令、身份卡等)容易遺失、易被破解等問(wèn)題逐漸暴露,已不能滿(mǎn)足各種安全需要。人們期望有一種更加可靠的技術(shù)來(lái)進(jìn)行身份鑒別。生物特征識(shí)別技術(shù)給這一切帶來(lái)了可能。由于人的面部特征難以復(fù)制和假冒,從而被應(yīng)用到最現(xiàn)代化的小區(qū)門(mén)禁管理系統(tǒng)中。人臉識(shí)別門(mén)禁技術(shù)是利用計(jì)算機(jī)分析人臉,從中提取出有效識(shí)別信息,通過(guò)與數(shù)據(jù)庫(kù)的人臉進(jìn)行比較來(lái)管理和控制門(mén)禁的技術(shù),與以往的身份識(shí)別系統(tǒng)相比提高了安全防范的可靠性。
在國(guó)外,人臉識(shí)別技術(shù)發(fā)展很快,許多國(guó)家都開(kāi)展了人臉檢測(cè)識(shí)別的研究,人臉識(shí)別也已由最初的靜態(tài)圖片識(shí)別發(fā)展到基于視頻流的識(shí)別,由最初的正面人臉識(shí)別發(fā)展到最先進(jìn)的三維立體的識(shí)別。本文是對(duì)基于matlab人臉識(shí)別電子門(mén)禁的研究,提出了膚色模型的人臉檢測(cè)與KL變換人臉識(shí)別相結(jié)合的技術(shù)方法。人臉檢測(cè)主要是在圖像中判斷是否存在面部,找出可能的人臉區(qū)域;人臉識(shí)別則是對(duì)被檢測(cè)到的人臉區(qū)域進(jìn)行身份確認(rèn)或在面部數(shù)據(jù)庫(kù)中進(jìn)行目標(biāo)搜索,進(jìn)而得到正確的結(jié)論。具體各個(gè)實(shí)現(xiàn)環(huán)節(jié)相互銜接,相互配合,才能形成一個(gè)復(fù)雜的面部識(shí)別系統(tǒng)。
人臉檢測(cè)和識(shí)別流程附圖如下:
一、基于膚色模型的人臉檢測(cè)
對(duì)于一個(gè)成功的人臉識(shí)別系統(tǒng),人臉檢測(cè)是極其重要和關(guān)鍵的一步,它直接影響人臉特征的提取,識(shí)別等后續(xù)工作。膚色模型是指依據(jù)面部膚色在色彩空間中分布相對(duì)集中的規(guī)律來(lái)進(jìn)行檢測(cè),在大多數(shù)的情況下,圖像信息是以RGB顏色空間保存,但是由于RGB顏色空間三個(gè)顏色分量不僅代表顏色還包含亮度信息,需要把顏色表達(dá)式中的色度信息與亮度信息分開(kāi),皮膚顏色在Ycbcr色度空間的分布范圍為:100 為了對(duì)圖像做進(jìn)一步處理時(shí)變得簡(jiǎn)單,不再涉及像素的多級(jí)值,而且讓處理和壓縮的數(shù)據(jù)量盡量變小,一般利用YCbCr的閾值生成二值化圖像,將彩色圖像轉(zhuǎn)換為灰度圖像。假設(shè)YCrCb圖像為f(x,y),經(jīng)過(guò)二值化后的圖像為g(x,y),則f,g中每一點(diǎn)均滿(mǎn)足對(duì)應(yīng)的映射關(guān)系: 二值化轉(zhuǎn)換后不可避免出現(xiàn)了噪聲,因此,我們?cè)俨捎瞄_(kāi)、閉運(yùn)算對(duì)圖像進(jìn)行處理。消除不必要的雜散點(diǎn),平滑其邊界。到此,人臉的大體輪廓已基本成型,最后我們利用邊緣檢測(cè),檢測(cè)出人臉的邊界,利用得到的邊緣,對(duì)原圖像進(jìn)行處理,加以適當(dāng)?shù)呐袛嗉纯傻玫秸嬲娜四槄^(qū)域。 有些色彩類(lèi)似于人臉,也被誤判為人臉,為解決這個(gè)問(wèn)題,我們定義人臉的判斷規(guī)則,即:(1)根據(jù)現(xiàn)實(shí)中人臉長(zhǎng)寬的大致分布,若目標(biāo)高寬比小于0.9而大于2.0,則認(rèn)為不是人臉區(qū)域。而在此范圍之外,則認(rèn)為不是人臉。此條件排除了一些顏色類(lèi)似皮膚但長(zhǎng)寬不符合要求的區(qū)域。(2)區(qū)域面積過(guò)大或過(guò)小,也認(rèn)為不是人臉區(qū)。 規(guī)則判定代碼描述: [L,num]=bwlabeln(image,8); for i=1:num; [r,c]=find(L==i); r_temp=max(r)-min(r); c_temp=max(c)-min(c); area_sq=r_temp*c_temp; area=size(find(L==i),1); ratio=area/area_sq; if(r_temp/c_temp<1)|(r_temp/c_temp>2.2)|ratio<0.5 %利用臉部寬長(zhǎng)比的大概上下限來(lái)確定一個(gè)模板范圍;矩形面積area_sq=目標(biāo)區(qū)長(zhǎng)度*寬度,目標(biāo)區(qū)面積為area,若area/area_sq<0.5,認(rèn)為不是人臉區(qū),刪除之。 for j=1:temp; L(r(j),c(j))=0; end else continue; end end 二、基于KL變換的人臉識(shí)別 基于KL變換的人臉識(shí)別,是國(guó)外最新的靜態(tài)圖像識(shí)別方法,它相比國(guó)內(nèi)的一些傳統(tǒng)的檢測(cè)方法具有實(shí)時(shí)性好,識(shí)別率高等優(yōu)點(diǎn)。KL變換是目前圖像壓縮中的一種最優(yōu)的正交變換。KL變換若用于人臉識(shí)別,則需要假設(shè)人臉處于低維線型空間,且不同人臉具有可分性。其目的是推導(dǎo)出新的變量,這些新變量是原始變量的線性組合而且互不相關(guān)。當(dāng)使用這些新變量去重建原始變量時(shí),使得均方誤差最小。具體方法是把檢測(cè)到的人臉區(qū)域通過(guò)計(jì)算得到它們的幾何特征量,這些特征量形成一描述該面部的特征向量,計(jì)算數(shù)據(jù)庫(kù)中圖像協(xié)方差矩陣及其特征值和特征向量,比較數(shù)據(jù)樣本的互相關(guān)性,通過(guò)判定輸入圖像與數(shù)據(jù)庫(kù)中人臉的相互關(guān)聯(lián)程度,從而得到正確的輸入人臉圖像。 KL變換的原理: 根據(jù)kl變換的公式:F=A×(Fmx),F-facey,F是輸入的圖像 ↓ 特征臉Facey=A×facex=核矩陣×均差 ↓ A=協(xié)方差矩陣特征向量的轉(zhuǎn)置 ↓ 均值mx 根據(jù)上面的原理,得識(shí)別程序如下: mx=mean(facecol); %均值 for i=1:L %均差 facex(:,i)=facecol(:,i)-mx; end Cf=facex*facex'/L;%協(xié)方差 [V D]=eig(Cf);%特征向量 A=V'; %得到核矩陣 facey=A*facex;%特征臉 識(shí)別: f=A*(f-mx); %KL變換 L=50; for i=1:L d(i)=norm(f-facey(:,i)); end 三、電子門(mén)禁仿真系統(tǒng)的實(shí)現(xiàn) 本文是對(duì)人臉識(shí)別門(mén)禁仿真的初步探討,若對(duì)此加以硬件改進(jìn)即可得到電子門(mén)禁管理系統(tǒng),可以實(shí)時(shí)的監(jiān)控所在門(mén)區(qū)的工作狀態(tài),如門(mén)的開(kāi)關(guān),人員的進(jìn)出等。一旦出現(xiàn)強(qiáng)行開(kāi)門(mén)的現(xiàn)象,小區(qū)管理人員可以在最短的時(shí)間內(nèi)進(jìn)行處理,最大限度地降低用戶(hù)的損失。考慮到小區(qū)人員隨時(shí)有變化調(diào)整的可能,因此本系統(tǒng)的數(shù)據(jù)庫(kù)采用開(kāi)放式圖像數(shù)據(jù)庫(kù),可以隨時(shí)對(duì)數(shù)據(jù)庫(kù)人員進(jìn)行添加和刪除。 本文提出的算法,具有簡(jiǎn)單易懂,計(jì)算量小,速度快,實(shí)時(shí)性好的優(yōu)點(diǎn),但是本系統(tǒng)也存在一定的不足,例如:非正面的檢測(cè)圖像不能識(shí)別;背景過(guò)于復(fù)雜的圖像不能處理;光照亮度不足時(shí)識(shí)別率差等。這些都將是我們繼續(xù)研究的課題,也是對(duì)人臉識(shí)別技術(shù)提出了更大的挑戰(zhàn)。 參考文獻(xiàn): [1]鄭剛、閆勝業(yè)、張宏明,人臉檢測(cè)技術(shù)報(bào)告[R].廣州船舶學(xué)院,2002. [2]徐立中、李士進(jìn)等,數(shù)字圖像智能信息處理(第二版)[M].北京:國(guó)防工業(yè)大學(xué),2007. [3]唐偉,靜態(tài)灰度圖像中的人臉檢測(cè)方法綜述[J].南京大學(xué),2006. 作者簡(jiǎn)介: 張偉(1979-),女,漢族,天津人,研究方向:數(shù)字圖像處理。