張倩雯 林涵
摘 要:為解決人臉定位過程中人臉圖像處理困難、定位結(jié)果不準(zhǔn)確以及人臉易受環(huán)境影響的問題,本文提出了利用圖像信息熵對人臉進(jìn)行定位的方法。首先引入了圖像信息熵對圖像進(jìn)行色彩空間轉(zhuǎn)化,采用MATLAB進(jìn)行人臉閾值分割;然后根據(jù)人臉膚色與人身體膚色不同對人臉進(jìn)行處理;最后利用人臉的眼、嘴等像素點(diǎn)信息熵值的比較對人臉進(jìn)行定位。實(shí)驗(yàn)結(jié)果表明:可以利用圖像信息熵進(jìn)行人臉定位,方法簡單,適應(yīng)性強(qiáng),定位結(jié)果不受客觀因素的影響,識別結(jié)果準(zhǔn)確。
關(guān)鍵詞:圖像信息熵;像素;人臉定位;MATLAB
中圖分類號:TP391.4
目前,生物識別技術(shù)的便捷性優(yōu)勢得到彰顯,相比于傳統(tǒng)人工密碼認(rèn)證而言發(fā)展更加迅速。尤其是在人工智能領(lǐng)域的人臉定位,是一個典型的圖像模式分析、理解和分類問題,涉及數(shù)字圖像處理、模式識別、人工神經(jīng)網(wǎng)絡(luò)等多學(xué)科領(lǐng)域,目前已有研究人員在人臉定位問題上提出了創(chuàng)新,取得了非常矚目的成績。圖像信息熵在各個方面的應(yīng)用愈來愈廣泛,本文提出了一種基于信息熵的人臉定位[1]方法。具體過程如下:將人臉圖像轉(zhuǎn)化為像素點(diǎn),并利用人臉不同部位的像素點(diǎn)如眼、嘴等部位在整個圖像中的像素比,將像素點(diǎn)用信息熵的概率大小表示,對圖像進(jìn)行腐蝕膨脹處理之后,可由MATLAB編程實(shí)現(xiàn)對人臉圖像的定位。
1 圖像信息熵
圖像信息熵[2]主要是描述圖像含有信息量大小的一個客觀評價指標(biāo),圖像的信息熵定義為:
EN(H)=-∑m1ZilogZi
其中Zi表示圖像的灰度分布,表示灰度圖像中像素分布的概率,m表示灰度等級,該指標(biāo)反映圖像的灰度值分布。
圖像信息熵能夠有效表達(dá)圖像所攜帶的信息量大小,也可以表達(dá)圖像紋理的豐富程度。人臉不同部位對整體的貢獻(xiàn)程度不同。當(dāng)圖像被分成眼、嘴等多個子塊時,可從各子塊圖像的局部信息熵得出各子塊所包含的信息熵,通過局部信息熵可得各子塊圖像直方圖的加權(quán)值,可反映每塊圖像占據(jù)人臉的比重。
2 人臉定位
(1)人臉膚色分割。膚色區(qū)域模型[3]可以將人臉與背景分開,并且通過MATLAB編程可得到不同子塊的圖像像素,計(jì)算單個像素的膚色相似性從而得到一個灰度圖,通過灰色區(qū)域的分布,大致可對人臉劃分。通過膚色圖像分割后,從灰度圖中可提取像素數(shù)據(jù),通過這些數(shù)據(jù)可計(jì)算出信息熵值。由于不同閾值在經(jīng)過閾值[4]劃分之后得到的灰度圖不同,因此每張圖像都以設(shè)置的閾值基準(zhǔn),進(jìn)行膚色閾值分割,得到統(tǒng)一標(biāo)準(zhǔn)下的灰度圖,從灰度圖中提取圖像像素,區(qū)分膚色與非膚色,為人臉定位做準(zhǔn)備。
(2)圖像RGB像素轉(zhuǎn)化。色彩空間[5]又名色域,是各種顏色的集合。色彩空間取決于色彩的種類以及色彩的數(shù)量,兩者所能表示的范圍即為色域的范圍。對于某一固定顏色,在計(jì)算機(jī)網(wǎng)絡(luò)中可用不同的代碼表示,所以對一副圖像會有不同的表示方式,也就會產(chǎn)生可能完全不同的色彩空間。
(3)人臉定位。將圖像進(jìn)行膨脹和腐蝕,[6]膨脹運(yùn)算可弱化圖像的背景,有利于分割時檢測錯誤點(diǎn),腐蝕運(yùn)算可消除物體邊界點(diǎn),即消除在分割過程中可能誤判的非皮膚點(diǎn)。在人臉面部分割圖像中,根據(jù)眼睛以及嘴巴較為明顯的特征可對人臉定位,[7]以眼睛和嘴巴為三個頂點(diǎn),構(gòu)成一個三角形,在此基礎(chǔ)上進(jìn)行人臉識別會更加快捷。
眼睛映射,[8]依據(jù)色度和亮度映射,經(jīng)過腐蝕之后的圖像可確定對應(yīng)的兩個頂點(diǎn),由此可確定人眼的位置,嘴巴經(jīng)過腐蝕之后,去掉一些離散點(diǎn),可得嘴巴的中心位置,以此中心位置作為另一個頂點(diǎn)。由三個頂點(diǎn)可確定人臉的三角形的定位圖像,可識別出人臉的大致位置,并用矩形框標(biāo)定出來,人臉矩形特征點(diǎn)坐為圖1所示:
3 實(shí)驗(yàn)結(jié)果分析
在信息熵的理論基礎(chǔ)下,對于圖像經(jīng)過膨脹腐蝕處理之后可以得到同一副圖像在經(jīng)過人臉閾值分割、色彩空間轉(zhuǎn)化、腐蝕膨脹之后的圖像處理結(jié)果如圖2所示:
由上圖可知,將圖像二值化處理之后,利用人臉的眼、嘴各自的信息熵在腐蝕膨脹之后的熵值不同,通過MATLAB編程很容易將人臉將每個人臉部不同的像素差距識別出來表示出來,因此利用此種方法來對人臉進(jìn)行定位是可取的。
4 結(jié)語
本文提出了一種基于信息熵的人臉定位方法:采用MATLAB軟件,對人臉圖像進(jìn)行閾值分割、色彩空間轉(zhuǎn)化,利用信息熵值,將轉(zhuǎn)化后的圖像進(jìn)行膨脹腐蝕操作,編程實(shí)現(xiàn)人臉定位。
參考文獻(xiàn):
[1]華聚良.人臉圖像特征抽取與分類方法研究[D].南京理工大學(xué),2017.
[2]吳澤鵬,郭玲玲,朱明超,賈宏光,宣明.結(jié)合圖像信息熵和特征點(diǎn)的圖像配準(zhǔn)方法[J].紅外與激光工程,2013(10):2846-2852.
[3]張弛,王慶.一種基于降維的膚色特征提取和膚色檢測方法[J].計(jì)算機(jī)工程與科學(xué),2009,31(02):34-36+49.
[4]曹德忠,李清晨,莊緒財,任承,張素恒,宋新兵.Ghost images reconstructed from fractional-order moments with thermal light[J].Chinese Physics B.2018 (12).
[5]董艷,梁久禎.基于多種色彩空間的像素覆蓋分割方法[J].小型微型計(jì)算機(jī)系統(tǒng),2015(08):1886-1890.
[6]鄧仕超,黃寅.二值圖像膨脹腐蝕的快速算法[J].計(jì)算機(jī)工程與應(yīng)用,2017(05):207-211.
[7]劉新永,蔡鳳麗,王志楊.基于MATLAB的人臉檢測定位算法研究[J].通化師范學(xué)院學(xué)報,2015,36(12):11-13.
[8]田全,王蘊(yùn)哲.基于圖像灰度特征的人眼定位及狀態(tài)識別[J].電腦知識與技術(shù),2018(03):170-172.