孫豐亮 朱亞俐 孟 強 薛 友
(新疆大學,新疆 烏魯木齊 830002)
人臉識別技術(shù)在當今社會生活中扮演著相當重要的角色,如視頻監(jiān)控,人機交互,人臉識別,人臉數(shù)據(jù)庫分類管理等業(yè)務,用到了人臉識別這個關(guān)鍵技術(shù)。人臉的檢測和識別技術(shù)是模式識別,計算機視覺和圖像理解系統(tǒng)的研究熱點之一,它綜合了圖像理解,計算機視覺,數(shù)據(jù)庫和人工智能等多方面多學科的知識,應用前景廣闊,受到了越來越廣泛的重視,并得到了迅速的發(fā)展,取得了很多有價值的研究成果。
隨著科學技術(shù)的發(fā)展以及計算機技術(shù)的普及,人臉識別技術(shù)發(fā)展異常迅速,對于社會中的種種需求,人臉識別技術(shù)的研究與發(fā)展刻不容緩。人臉識別技術(shù)在身份鑒定方面,多媒體信息檢索方面,智能監(jiān)控方面,人機交互方面等都有重要的應用。在上述幾個方面,人臉的辨認,定位以及追蹤都與人臉識別技術(shù)有著密不可分的關(guān)系。
任何一個人臉圖像處理系統(tǒng)的第一步是人臉在圖像中的位置。然而,從單張圖片中識別出人臉是一項具有挑戰(zhàn)性的工作,認為人臉在大小,位置,方向,姿勢方面是可變的。人臉表情,牙齒相接觸的放視,光照也會改變?nèi)四樀恼w外觀。
高斯膚色模型就是用高斯概率密度函數(shù)精確地量化事物,將一個事物分解為若干的基于高斯概率密度函數(shù)形成的模型。圖像處理目標檢測中通常需要跟貝葉斯理論相結(jié)合,比如膚色檢測,就需要建立某種膚色的概率模型X,然后建立非膚色顏色的出現(xiàn)概率模型Y,對要檢測的圖像提取某個像素點的特征值,如某種顏色值。然后求種種顏色在X和Y的概率值,得到的值如果大于或小于一定的閾值則認為是膚色,否則是非膚色。對于過于復雜的圖像,尤其是醫(yī)學圖像,通過將直方圖的多峰特性看作是多個高斯分布的疊加,可以解決圖像的分割問題。
YCbCr色彩空間相對于HSV色彩空間具有以下優(yōu)點[1]:1)構(gòu)成原理上,人類視覺感知過程相與之有類似的原理。2)YCbCr,色彩空間是離散的,采用YCbCr,空間易于實現(xiàn)聚類算法。3)膚色在YCbCr,色彩空間的聚類性較好。4)YCbCr顏色模型是由許多視頻壓縮編碼。
1)引言。膚色模型可以用來描述膚色特征。色度空間的(chrominance space)選擇決定某種方式的膚色模型的使用,因此它們之間具有密切關(guān)系。色度空間的考察主要從以下兩個方面:(1)在這樣的色度空間之中,描述“膚色”的區(qū)域布是否可以使用一定模型;(2)色度空間中“膚色”和“非膚色”區(qū)域有些重疊的區(qū)域有多少[2]。一般色度空間之中[3],人臉檢測所使用的模型主要包括:RGB,HSI、NTSC制的光亮度和色度模型的YI,YUV以及Ycbcr等。
2)YCbCr高斯膚色模型理論。在多媒體技術(shù)中,一般情況下圖象是以RGB形式存放的,但是RGB表示方法不適合于皮膚模型。在RGB空間,三基色(r,g,b)不僅代表了顏色,還表示了亮度。由于你周圍環(huán)境光照的改變,亮度可能是人臉的識別變得更加復雜,在皮膚的分割過程中是不可靠的。為了利用和膚色在色度空間的據(jù)類型,需要把顏色表達式中的色度信息與亮度信息分開。將RGB轉(zhuǎn)換為色度與亮度分開的色彩表達空間就可以達到這個目的,在實驗中選用YCbCr高斯膚色模型進行膚色區(qū)域檢驗。
1)引言。數(shù)學形態(tài)學是一門建立在格論和拓撲學基礎(chǔ)之上的圖像分析學科[4],是數(shù)學形態(tài)學圖像處理的基本理論。其基本的運算包括:腐蝕和膨脹、開運算和閉運算、骨架抽取、極限腐蝕、擊中擊不中變換、形態(tài)學梯度、Top-hat變換、顆粒分析、流域變換等。本文主要研究數(shù)學形態(tài)學的腐蝕與膨脹。
2)腐蝕與膨脹基本原理。腐蝕與膨脹是在二值形態(tài)學運算中最具基本的兩個形象化運算,形態(tài)學中腐蝕運算的原理是對數(shù)據(jù)集中的每個元素在自定義的結(jié)構(gòu)元素(窗口)內(nèi)尋求最小值來替代中心元素的值。腐蝕運算的物理意義是具有腐蝕數(shù)據(jù)集合邊緣的功能并迫使集合向內(nèi)收縮,如果窗口足夠的大,就能移除那些面積較小、作用不大的物體。
膨脹運算與腐蝕運算的原理相反,它是對數(shù)據(jù)集合中的每個元素在自定義的結(jié)構(gòu)元素內(nèi)尋找最大值來代替中心元素的值。膨脹運算的物理意義為擴展數(shù)據(jù)集合的大小并使其向集合外膨脹,適宜的窗口大小可以填充集合內(nèi)部的孔洞,使集合更加完整。
通過以上的定義與物理意義我們可以看出來,數(shù)學形態(tài)學在數(shù)字圖像濾波上有重要作用,通俗地講,腐蝕的作用說白了就是讓暗的區(qū)域變大,而膨脹的作用就是讓亮的區(qū)域變大。
其中,將圖片先進行腐蝕,再進行膨脹的運算稱之為開運算;反之,先將圖片進行膨脹,再進行腐蝕稱之為閉運算。對于經(jīng)過形態(tài)學開閉運算及去除了背景小區(qū)域處理以后的圖像再進行填充孔洞處理,很好地表示出膚色區(qū)域,這個操作能夠?qū)⒈黄つw區(qū)域包含的非皮膚區(qū)域保留為皮膚區(qū)域。
本文在基于YCbCr高斯膚色模型上主要介紹了形態(tài)學檢測方法并此方法上進行實驗驗證。首先我在第一章里面講課題的研究背景及意義,介紹匹配算法的研究現(xiàn)狀,電子信息處理領(lǐng)域中仍存在的主要問題。其次我在第二章講到了基于YCbCr高斯膚色模型的人臉檢測技術(shù)的理論基礎(chǔ),深入研究了YCbCr高斯膚色模型的相關(guān)理論,總結(jié)了YCbCr高斯膚色模型用于人臉檢測的優(yōu)缺點,研究其數(shù)學方面的相關(guān)知識并列出具體計算方法。最后在第三章里大致介紹了數(shù)學形態(tài)學的概念以及本文所主要用到的數(shù)學形態(tài)學中的腐蝕與膨脹的概念并列出其相關(guān)計算公式。
本次課程設(shè)計中我學到了對于圖片在基于YCbCr高斯膚色模型理論基礎(chǔ)上運用形態(tài)學的腐蝕與膨脹將人臉檢測出來。在已有的理論和方法基礎(chǔ)上,進行了設(shè)計和實驗,在實驗驗證出此課題上研究算法的準確性。本次實驗結(jié)果雖然差強人意,但還是有很多不足。但我從本次實驗卻收獲頗豐。不僅獨立完成此次實驗,還學會了相關(guān)知識,熟悉并掌握了運用Matlab進行實驗仿真,以后我將會繼續(xù)進行對Matlab的深入學習。