許昌學院電氣信息工程學院 李躍磊
?
積分投影曲線的面部特征提取方法
許昌學院電氣信息工程學院 李躍磊
【摘要】在人臉精確定位的基礎上,利用垂直積分投影曲線定位面部特征器官的橫坐標,利用水平積分投影曲線定位面部特征器官的縱坐標,最后將面部特征器官嘴巴和眼睛從精確定位后輸出的臉部圖像中提取出來。實驗結果表明,該方法有較高的定位精度,并且該方法不僅能定位標準正面人臉,而且也適用于有輕微偏轉的人臉圖像。
【關鍵詞】垂直積分;灰度;積分投影
從某種意義上講,面部關鍵特征點(Landmark)的定位,是人臉識別中最核心的問題之一。錯誤的特征定位會導致提取的面部特征器官的嚴重變形,因此,即使是不精確定位也會帶來識別性能的快速下降。在這方面進行了很多努力,以期能夠準確快速的提取面部的關鍵特征點。邊緣提取法是首先進行對人臉圖像進行邊緣提取,然后用霍夫變換,檢測眼球,構造一個包括眼睛、眼瞼的眼部模板,用一系列函數(shù)從能量角度找出眼瞼[1]。本文在人臉精確定位的基礎上,利用垂直積分投影曲線定位面部特征器官的橫坐標,利用水平積分投影曲線定位面部特征器官的縱坐標,最后將面部特征器官嘴巴和眼睛從精確定位后輸出的臉部圖像中提取出來。
根據(jù)垂直積分投影曲線確定人臉的左右邊界,并把邊界內的人臉提取出來以便消除頭發(fā)等背景因素對積分投影算法結果的影響,求出人臉面部特征點的位置,由特征點的位置確定面部特征在人臉圖像中的實際坐標并將人臉的面部特征器官提取出來。
2.1面部特征點位置的確定與面部特征器官的提取
人臉特征點的選擇不僅要反映人臉識別中最重要的特征,特征點的個數(shù)要包含足夠的信息,但又不能太多,以免增加運算量。本文選取人臉識別的7個特征點,分別為4個臉角點、鼻尖和兩個嘴角點,如下圖1所示。這些特征點的分布具有角度不變性的特點,同時,與其它采用測量特征點的系統(tǒng)相比,這7個特征點比較容易從圖像中提取出來并加以測量。
由于特征點所在區(qū)域的灰度特征與人臉部其它部位有明顯的不同,采用積分投影很容易得到特征點的位置。面部的特征點對應于積分投影方式產(chǎn)生出的波峰或波谷,所以在進行人臉定位之后,本文用積分投影進行特征定位。這種方法不需要對圖像進行過多的處理,算法簡單,準確率高,速度快。積分投影可以直接對灰度圖像,也可以先將圖像二值化,然后對二值圖像進行積分投影。二值圖像是只有兩個灰度級的圖像,即只有0和1兩級灰度:
T為閾值,g(x,y)為二值化后的圖像。
圖1 人臉基本結構示意圖
本文對ORL圖像庫中的圖像采用的是對灰度圖像進行投影,對駕駛室內實際采集的人臉圖像是對邊緣檢測后圖像的二值圖像進行投影,因為實際采集的人臉圖像存在大量的噪聲特別是光照不均勻所帶來的光照噪聲,使得直接對灰度圖像進行積分投影的投影曲線毫無規(guī)律,不能用于人臉面部特征坐標的確定。
在圖1中,x1,x3代表眼的中心點;x2代表鼻子的中心點;y1→y5分別代表眉、眼、鼻、嘴、下巴,它們之間一般滿足如下的比例關系:
人臉輪廓確定后,就可以大致確定出人臉各特征點的位置關系,即可由上到下區(qū)分出臉、鼻、嘴等特征的區(qū)域,在這些局部區(qū)域內再運用積分投影法,就可精確定位出面部特征器官。
2.2垂直投影與水平投影算法原理
假設圖像的大小為M×N,積分投影法是根據(jù)圖像在某些方向上的投影分布特征來進行檢測的,這種方法在本質上是一種統(tǒng)計方法,主要有水平積分投影和垂直積分投影[2,3]:
在式7中,(x,y)表示像素所處的位置,I(x,y)表示該像素點的灰度值,N表示一行所有的像素點數(shù),可見水平投影就是將一行所有的像素點的灰度值進行累加后再顯示。在式7中,(x,y)表示像素所處的位置,I(x,y)表示該像素點的灰度值,M表示一列所有的像素點數(shù),可見垂直積分投影就是將一列所有的像素點的灰度值進行累加后再顯示[4]。
3.1 眼睛與嘴部的提取算法驗證
在ORL標準人臉圖像庫中選取一幅圖像進行垂直積分投影,對上述的面部特征提取算法進行驗證。定位面部特征的積分投影算法在MATLAB平臺采用M語言編程實現(xiàn)。實驗研究的原始圖像為100幅,50幅取自ORL(Olivetti Research Laboratory)人臉圖像數(shù)據(jù)庫,其余的50幅取自由駕駛室內實際采集的人臉圖像組成的小型彩色人臉圖像庫。其實驗結果如圖2所示:
圖2 垂直積分投影曲線圖
圖2(b)中人臉所在區(qū)域對應的垂直灰度投影曲線是具有一定寬度的凸峰,這個凸峰的左右邊界大致就是人臉的左右邊界。因為人臉區(qū)域的灰度與周圍不同,在人臉左右邊界處,亮度值的總和迅速減小,從而使整個投影曲線形成一個明顯的凸峰。因此,只需確定垂直灰度投影曲線中主要凸峰的左右邊界,即可得到人臉的左右邊界,將邊界內的人臉圖像提取出來得到的圖像如圖3(a)所示。
圖3 邊界之內的圖像和其水平投影曲線
當?shù)玫阶笥疫吔缰?,提取左右邊界內的人臉圖像并對圖像進行水平積分投影,可以減少人臉兩側頭發(fā)等背景因素的干擾,使得下一步投影的波峰和波谷更明顯,從而更容易判斷眼睛和嘴巴所在區(qū)域。假設左右邊界之間的圖像大小為n,那么此時的圖像大小就變?yōu)镸×n,使用的水平投影函數(shù)公式7。其中,H(y)稱為水平灰度投影曲線,如圖3(b)所示。
正常情況下,由于眉毛眼睛等五官的灰度值比較小,所以在臉的左右輪廓范圍內對圖像做水平投影的話,特征(五官)所在行的投影值就會比較小,而在投影圖中就對應著極小值。在圖3(b)中,看到的水平灰度投影曲線的前段谷區(qū)域對應于人的頭頂部分,因為頭發(fā)的低灰度產(chǎn)生了水平投影曲線的低谷;而曲線的最大值點和次最大值點分別對應人的額頭部位和人的鼻中部。并且可以很明顯得看出將要提取的特征點的五個縱坐標y1→y5正好就是水平投影曲線的五個谷點[5]。
上述臉部特征定位試驗所得數(shù)據(jù)y1→y5的值如表1。最終提取出的面部特征眼睛和嘴巴如圖4所示:
表1 實驗所得數(shù)據(jù)y1→y5的值
圖4 實驗最終提取的面部特征眼睛和嘴巴
圖5 實際采集人臉圖像在左右邊界內的面部圖像及其水平投影曲線
3.2駕駛室內實際采集人臉圖像面部特征提取的試驗結果
駕駛室內實際采集的人臉圖像的積分投影曲線及面部特征的提?。?/p>
由于實際采集的圖像含有大量的噪聲,不能像上面那樣直接對標準圖像庫中的人臉圖像的灰度圖像進行積分投影,因為直接對灰度圖像進行積分投影的投影曲線毫無規(guī)律,不能用于人臉面部特征坐標的確定,如圖5(h)所示。
為了排除噪聲的干擾,應該對人臉精確定位后所提取的人臉圖像的二值化圖像進行垂直積分投影和水平積分投影,以消除駕駛室內噪聲的影響,特別是光照噪聲的影響。圖6(a)就是圖像6(b)是對應的二值圖像。
圖6 人臉精確定位后的圖像及其對應的二值圖像
下面對圖像進行處理時執(zhí)行和上節(jié)中的對ORL標準人臉圖像進行處理時相同的處理步驟。
第一步:首先進行垂直積分投影,獲取臉部的左右邊界,然后把邊界內的人臉提取出來,如圖7所示。
第二步:對上步提取出的左右邊界內的人臉圖像進行水平積分投影,以減少人臉兩側頭發(fā)背景等因素的干擾,并確定y1→y5的值,圖8為邊界內人臉圖像的水平積分投影曲線,由于是對邊緣檢測圖像的二值圖像進行投影,所以和上節(jié)直接對標準圖像的灰度圖像的水平投影不同,此時特征點的縱坐標為波峰的值。
第三步:根據(jù)上步確定的縱坐標y1→y5的值,由上到下區(qū)分出眼睛和嘴巴所在的局部區(qū)域,然后將眼睛和嘴巴所在的局部區(qū)域分別提取出來,對這兩個局部區(qū)域分別進行垂直積分投影,求取眼睛和嘴巴的橫坐標,結合第二步中縱坐標y1→y5的值實現(xiàn)眼睛和嘴巴的定位。下圖9(a)為眼睛所在的局部區(qū)域,9(b)為其垂直積分投影曲線,(b)圖中兩個對稱的凸起所在的位置分別對應人臉的左右眼。圖9(c)為嘴巴所在的局部區(qū)域,9(d)為其對應的垂直積分投影曲線,其中第一個凸起的第一個波峰和最后一個波峰之間的區(qū)域對應嘴巴所在的位置。
圖7 二值圖像的垂直投影曲線及在左右邊界內的人臉圖像
圖8 左右邊界內人臉圖像的水平積分投影曲線
圖9 眼睛和嘴巴所在的局部區(qū)域和對應的垂直積分投影曲線
表2為上面的步驟得出的y1→y5,x1→x3的值。
表2 y1→y5,x1→x3的值
第四步:提取出人的眼睛,嘴巴等特征,作為最終輸出,如圖10所示:
圖10 最終輸出的面部特征眼睛和嘴巴
本章提出了一種利用積分投影曲線定位面部特征的方法,用ORL人臉圖像庫中的標準人臉圖像驗證了方法的有效性,針對駕駛室內實際采集的人臉圖像光照噪聲干擾嚴重,不能直接對灰度圖像進行積分投影的現(xiàn)狀,提出對面部邊緣檢測后圖像的二值圖像進行積分投影的方法,很好地消除了噪聲的影響,實現(xiàn)了面部特征的定位,最后將眼睛和嘴巴提取出來。實驗結果表明,該方法有較高的定位精度,并且該方法不僅能定位標準正面人臉,而且也適用于有輕微偏轉的人臉圖像。
參考文獻
[1]馮慧揚,王申康,王宏偉.人臉定位算法的研究[J].計算機工程與應用,2003,30(3):101-119.
[2]邢藏菊,曲延鋒,王守覺.靜態(tài)灰度圖像中的人臉快速檢測[J].計算機輔助設計與圖形學學報,2002.41(5):401~403.
[3]盛敬,楊軍平,劉國滿.基于機器視覺的駕駛員疲勞監(jiān)控系統(tǒng)中的嘴唇定位算法[J].南昌工程學院學報,2007,26(1):54~58.
[4]沈潔,杜宇人,高浩軍.圖像邊緣檢測技術研究[J].信息技術,2005.
[5]童兵亮.基于嘴部狀態(tài)的疲勞駕駛和精神分散狀態(tài)監(jiān)測方法研究[D].吉林大學碩士學位論文,2004,5.
作者簡介:李躍磊(1984-),男,河南許昌人,助理實驗師,研究方向:信號處理。
基金項目:河南省高等學校重點科研項目,15A470020。