陳葛 方楊
摘? 要:人眼檢測是計(jì)算機(jī)視覺領(lǐng)域的重要研究對(duì)象,也是人臉檢測、虹膜分割以及人眼跟蹤技術(shù)等技術(shù)的關(guān)鍵前提條件,廣泛應(yīng)用于各種場景之中。利用投影函數(shù)能分析圖像特征,提取出圖像的關(guān)鍵點(diǎn),大量的研究表明利用投影函數(shù)能有效地檢測人眼。文章詳細(xì)介紹了各類基于投影函數(shù)的人眼檢測方法原理,分析了其特點(diǎn),希望能為相關(guān)研究人員提供參考。
關(guān)鍵詞:計(jì)算機(jī)視覺;投影函數(shù);人眼檢測;人眼定位
中圖分類號(hào):TP391.4 ? 文獻(xiàn)編制碼:A ? 文章編號(hào):2096-4706(2021)05-0001-07
A Survey of Eye Detection Methods Based on Projection Function
CHEN Ge1,2,F(xiàn)ANG Yang2
(1.School of Physics,University of Electronic Science and Technology of China,Chengdu? 611731,China;
2.College of Physics and Electronic Engineering,Chongqing Normal University,Chongqing? 401331,China)
Abstract:Eye detection is an important research object in the field of computer vision,and it is also the key precondition of face detection,iris segmentation and eye tracking technology,which is widely used in various scenes. The projection function can be used to analyze image features and extract the pivotal points of image. Abundant studies indicate that the projection function can effectively detect eyes. This paper introduces the principle of various methods for eye detection based on projection function and analyzes their characteristics in detail,hoping to provide reference for related researchers.
Keywords:computer vision;projection function;eye detection;eye location
0? 引? 言
隨著計(jì)算機(jī)軟硬件性能的不斷提高以及互聯(lián)網(wǎng)的快速普及,計(jì)算機(jī)視覺領(lǐng)域得到了飛速的發(fā)展,計(jì)算機(jī)視覺的相關(guān)研究也成為近年來熱門的研究領(lǐng)域。生物信息識(shí)別技術(shù)作為計(jì)算機(jī)視覺應(yīng)用的熱點(diǎn)方向之一,其研究成果廣泛地應(yīng)用到我們生活、學(xué)習(xí)以及工作中,如手機(jī)以不同人體信息的各種解鎖方式,人臉門禁系統(tǒng)以及疲勞駕駛檢測等,各種人體信息識(shí)別技術(shù)的創(chuàng)新與應(yīng)用為人們帶來了便捷與保障。人臉是個(gè)體間差異最大、最具有特點(diǎn)的人體信息,基于這種具有穩(wěn)定差異和特點(diǎn)的形式,人臉檢測成為人體信息識(shí)別技術(shù)中重點(diǎn)研究的對(duì)象。臉部區(qū)域中,人眼作為人臉中最為“靈動(dòng)”的部分,個(gè)體不僅能通過人眼獲取外界各種圖像信息,而且通過個(gè)體人眼也能向外界反映這個(gè)個(gè)體的喜怒哀樂,身份特征等信息,相比人臉中的其他五官,人眼是人臉中特點(diǎn)最顯著的部分,因此人眼的檢測對(duì)人臉信息的獲取有重要意義。同時(shí)人眼檢測也是其他視覺應(yīng)用技術(shù)的前提,如虹膜識(shí)別、人眼跟蹤等技術(shù),人眼檢測是否準(zhǔn)確以及快速將直接影響這些技術(shù)的表現(xiàn)[1]。
利用計(jì)算機(jī)視覺進(jìn)行人眼檢測,就是通過計(jì)算機(jī)程序?qū)Λ@取的圖像分析處理后,在圖像中找出人眼位置。人眼檢測的方法眾多,大體上分為基于形狀的、基于表現(xiàn)的以及混合方法三類[2]。對(duì)灰度圖像使用投影函數(shù)來檢測人眼的方法是一種基于形狀的方法,具有計(jì)算量小、快速以及具有一定的抗噪聲能力等優(yōu)點(diǎn),基于投影函數(shù)的人眼檢測方法得到了大量的研究與不斷的改進(jìn)。
1? 投影函數(shù)檢測人眼方法
投影是分析和提取圖像特征的有效方法,將圖像經(jīng)過一系列的預(yù)處理后,再將二維灰度圖像轉(zhuǎn)換成相互正交的兩組一維投影函數(shù)來的處理與分析。降低維數(shù),進(jìn)而降低計(jì)算量,方便快速地檢測人眼。根據(jù)人們對(duì)眼睛特征的先驗(yàn)知識(shí),在人臉灰度圖像中,人眼區(qū)域既有灰度值較低的瞳孔和虹膜,也有灰度值較高的鞏膜和皮膚,因此相比人臉其他區(qū)域,人眼區(qū)域具有灰度值變化大以及低灰度值的特征,所以利用投影的方法檢測人眼是一種可行的方法。用于檢測人眼的投影方法中常用有積分投影函數(shù)方法、方差投影函數(shù)方法、混合投影函數(shù)方法、區(qū)域投影函數(shù)方法、梯度投影函數(shù)方法等。利用投影函數(shù)檢測人眼不僅能粗略獲取人眼區(qū)域,而且能精確定位人眼中心。
1.1? 積分投影函數(shù)
積分投影函數(shù)(Integral Projection Function,IPF)是投影函數(shù)方法中計(jì)算量最小,最為快速,以及最早應(yīng)用于提取圖像特征的投影函數(shù)方法[3],后來的研究中,WU和ZHOU等人[4]根據(jù)眼睛區(qū)域較臉部其他區(qū)域顏色較深的特點(diǎn),利用積分投影函數(shù)的方法得出圖像中有眼睛區(qū)域特點(diǎn)的片段,再基于灰度對(duì)比不斷排除干擾片段以及篩選出有效片段,從而定位眼睛。積分投影就是計(jì)算一段累加值,在灰度圖像中把每一行的各個(gè)像素點(diǎn)的灰度值相加求和,也把每一列的各個(gè)像素的灰度值相加求和,即在灰度圖像的水平方向和垂直方向求像素點(diǎn)灰度累加值。設(shè)p(x,y)為圖像位于(x,y)位置的像素點(diǎn)的灰度值,水平投影積分函數(shù)為IPFh(y)和垂直投影積分函數(shù)為IPFv(x)分別定義為[5]:
,? ? (1)
式中:x在區(qū)間[x1,x2],y在區(qū)間[y1,y2];由于圖像中像素點(diǎn)是離散排列,因此式(1)可以表示為:
,? ?(2)
在灰度圖像中一般有灰度值不同的區(qū)域,當(dāng)對(duì)灰度圖像做積分投影后,積分投影函數(shù)值在不同的灰度值區(qū)域邊界就會(huì)發(fā)生突變,且某些灰度值區(qū)域與其相鄰兩邊的灰度值區(qū)域灰度值相差較大時(shí),積分投影函數(shù)值就會(huì)產(chǎn)出極值。因此,將灰度圖像的IPFh(y)和IPFv(x)繪制成曲線,找到曲線中的突變點(diǎn),即可獲取圖像中的信息,如圖1所示[6],圖中有三列像素,每列有三個(gè)像素點(diǎn),累加每列所有像素點(diǎn)的灰度值,即計(jì)算此圖中的垂直投影積分函數(shù),從而得出在圖像的中間列垂直積分投影值與其左右列垂直積分投影值發(fā)生了明顯變化。由于人眼瞳孔一般是人臉中灰度值最低的區(qū)域,那么人臉灰度圖像的積分投影函數(shù)值在瞳孔區(qū)域產(chǎn)生極小值,在水平投影函數(shù)曲線和垂直投影函數(shù)曲線得出兩個(gè)極小值點(diǎn),即可得到瞳孔位置的坐標(biāo),因此可以利用積分投影函數(shù)來檢測人眼。
在實(shí)際操作中并不是直接將灰度圖像做積分投影來定位眼睛位置,一般還要對(duì)人臉圖像進(jìn)行一系列的預(yù)處理。馮建強(qiáng)等人[7]利用灰度投影積分來定位眼睛時(shí),首先對(duì)人臉圖像,如圖2所示[7]。
進(jìn)行預(yù)處理,使用非線性灰度變換技術(shù)來實(shí)現(xiàn)圖像灰度化,灰度圖像變換公式為[7]:
(3)
式中:g(x,y)為灰度圖像變換后的像素灰度值,f(x,y)為原始圖像的像素灰度值,a、b、c為調(diào)參數(shù)。接著利用中值濾波,去除圖像中一些噪聲的影響,同時(shí)也能較好地保留圖像的邊緣。圖像預(yù)處理后的結(jié)果如圖3所示[7]。
再將圖像進(jìn)行二值處理,其中選取二值化閾值是圖像二值化的關(guān)鍵因素,二值化后的灰度圖像像素點(diǎn)的灰度值只有0或者255,對(duì)于某些灰度值較低且較接近瞳孔或者鞏膜灰度值的像素點(diǎn)二值化后期灰度值轉(zhuǎn)換為255,這樣能將圖像中所需的特征區(qū)域有效地分割出來。這里采用的是最大類間方差閾值分割法求出二值化閾值[8],得到的二值化圖像如圖4所示[7],可以看出圖像能較好地分割出眼睛區(qū)域,方便后續(xù)的人眼檢測。
計(jì)算二值化圖像的水平積分投影函數(shù)并繪制曲線,如圖5所示[7],分析二值化圖像,眼睛的虹膜和瞳孔組成的區(qū)域趨于圓的形狀,且在此區(qū)域中像素點(diǎn)灰度值為0,那么在此區(qū)域的中心水平位置的灰度值為0的像素點(diǎn)比其上下水平位置的灰度值為0的像素點(diǎn)的數(shù)量多,則這個(gè)區(qū)域的中心水平位置的IPFh(y)值將會(huì)是一極小值點(diǎn);但是頭發(fā)灰度值較低的區(qū)域,將會(huì)對(duì)眼睛定位造成干擾,根據(jù)曲線可以得出頭發(fā)區(qū)域不會(huì)出現(xiàn)明顯的極值點(diǎn)且距離眼睛較遠(yuǎn),能夠直接排除其干擾;眉毛區(qū)域不僅灰度值低且距離眼睛近,但是眉毛區(qū)域的上下有灰度值較高的皮膚區(qū)域,則反應(yīng)在水平積分投影曲線上,眉毛區(qū)域處會(huì)有一個(gè)極小值點(diǎn)。所以眉毛和眼睛是圖像IPFh(y)的兩個(gè)距離很近的極小值點(diǎn),且眼睛的中心水平位置為第二個(gè)極小值點(diǎn),從而獲取眼睛的垂直坐標(biāo)位置。由于已獲取眼睛的垂直坐標(biāo)位置y,則在二值化圖像上以y為中心向上下取σ寬度的區(qū)域,如σ=10,組成一條形區(qū)域,這樣可以排除頭發(fā)、眉毛等灰度值較低圖像區(qū)域的干擾。
然后對(duì)此條形區(qū)域作垂直積分投影,并繪制曲線,如圖6所示[7]。在此條形區(qū)域中,瞳孔趨于區(qū)域圓的形狀,且沒有其他灰度值低的區(qū)域干擾,因此垂直積分投影函數(shù)的值在瞳孔中心處為最小值。由于左右眼睛位于人臉中心對(duì)稱軸的兩側(cè)區(qū)域,則在曲線中心兩側(cè)將出現(xiàn)兩個(gè)最小值點(diǎn),從而獲取左眼和右眼中心的水平坐標(biāo)。
由于圖像中頭發(fā)、眉毛、眼瞼等顏色較深區(qū)域以及圖像噪聲或者人臉背景的影響,傳統(tǒng)的灰度積分投影函數(shù)往往不能精確檢測人眼,在后來的研究中,積分投影方法一般要與其他方法相結(jié)合來檢測人眼。如:荔小虎等人[9]先利用YCbCr顏色空間[10]對(duì)膚色區(qū)域與背景區(qū)域進(jìn)行分割[11],獲取人臉圖像,進(jìn)一步縮小檢測的區(qū)域,然后對(duì)此區(qū)域進(jìn)行預(yù)處理后,再進(jìn)行灰度積分投影來獲取人眼坐標(biāo)。崔慶華等人[12]利用Adaboost算法[13]獲取ROI區(qū)域,在此區(qū)域中利用灰度積分投影函數(shù)和三庭五眼[14]單獨(dú)劃定眉眼區(qū)域,最后對(duì)此區(qū)域進(jìn)行形態(tài)學(xué)處理后再利用連通區(qū)域算法[15]定位眼睛。CHENG等人[16]為了獲取眼睛輪廓,先將圖像進(jìn)行直方圖均衡化、中值濾波、OTSU二值化等預(yù)處理操作,再計(jì)算預(yù)處理后圖像的水平積分投影,得出眼部條形區(qū)域,從而縮小檢測眼睛輪廓的范圍。
1.2? 方差投影函數(shù)
積分投影函數(shù)能反映出不同行和不同列的灰度值總和的差別,即能表現(xiàn)出每行和每列均值的差異,設(shè)水平積分投影均值為MIPFh(y),垂直積分投影均值為MIPFv(x),則:
,
(4)
因此在利用積分投影函數(shù)時(shí),出現(xiàn)均值相同的情況,積分投影函數(shù)的方法就無法反映出圖像的特征。為避免積分投影函數(shù)的不足,F(xiàn)eng等人[17]在積分投影函數(shù)的基礎(chǔ)上提出方差投影函數(shù)(Variance Projection Function,VPF),水平方差投影函數(shù)VPFh(y)和垂直方差投影函數(shù)VPFv(x)分別表示為:
(5)
(6)
因此,灰度圖像中行列間的均值相同時(shí)可以利用方差投影函數(shù)來獲取圖像中的信息,如圖7所示[6],分別計(jì)算圖像的垂直積分投影和垂直方差投影,左右兩列為兩個(gè)灰色像素點(diǎn),而中間列的像素點(diǎn)分別為黑色和白色,所以此圖像中三列像素灰度值總和的均值是相同的,導(dǎo)致了垂直積分投影無法反應(yīng)出此圖像中列與列之間差異,此時(shí)圖中的垂直積分投影函數(shù)曲線的斜率為0。但是在但是方差投影函數(shù)能在圖像均值相同的條件下,根據(jù)圖7每列中像素灰度值的變化來反映出此圖中列與列之間的差異,此時(shí)圖中垂直方差投影曲線有明顯的突變。進(jìn)一步可以得出,灰度圖像中每列和每行中灰度值不同的像素點(diǎn)越多,如眼睛區(qū)域較臉部其他區(qū)域像素點(diǎn)灰度值差異的數(shù)量更多,那么方差投影函數(shù)的值就越大,從而可以利用方差投影函數(shù)來檢測人眼。
此外,F(xiàn)ENG等人還驗(yàn)證了VPF對(duì)隨機(jī)噪聲不敏感,設(shè)X為灰度圖像中的隨機(jī)變量,X值的大小為像素點(diǎn)灰度值,且數(shù)學(xué)期望為E(X),方差為σ2(X)。再設(shè)n為灰度圖像中獨(dú)立的隨機(jī)噪聲,滿足期望為0和方差為σ2(n)的正態(tài)分布,則隨機(jī)變量X在有隨機(jī)噪聲影響下的方差為[17]:
σ2(X+n)=E(X+n-E(x))2=E(X-E(X))2+E(n2)
=σ2(X)+σ2(n)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (7)
相關(guān)研究表明隨機(jī)噪聲方差遠(yuǎn)遠(yuǎn)小于隨機(jī)變量的方差,因此有:
σ2(X+n)≈σ2(X)? ? ? ? ? ? ? ? ? ? ? ?(8)
基于方差投影函數(shù)的優(yōu)勢,路玉峰[18]等人利用方差投影函數(shù)在不同的光照條件下來識(shí)別眼睛睜閉狀態(tài),首先定位眼睛區(qū)域[19],如圖8所示[18],通常情況下左右眼睛的睜閉狀態(tài)是相同的,則識(shí)別左眼狀態(tài)即可;接著將左眼區(qū)域圖像旋轉(zhuǎn)90度,眼睛的兩個(gè)狀態(tài)如圖9所示,計(jì)算其方差投影函數(shù),且利用式(9)[18]將投影值做歸一化處理;以投影函數(shù)值大于或等于0.7的點(diǎn)視為方差投影函數(shù)的“波峰”,那么睜眼時(shí)的波峰寬度將大于閉眼時(shí)的波峰寬度,再設(shè)定一個(gè)標(biāo)準(zhǔn)波峰寬度,根據(jù)人眼不同狀態(tài)的水平方差投影函數(shù)的波峰寬度與這個(gè)標(biāo)準(zhǔn)波峰寬度的比值來判定眼睛的睜閉狀態(tài)。
(9)
1.3? 混合投影函數(shù)
積分投影函數(shù)能反映出灰度圖像各行各列均值的變化,方差投影函數(shù)能反映出各行各列方差的變化,若出現(xiàn)均值相同的情況,如圖7所示,IPF會(huì)失效,而VPF曲線有明顯突變;但是并不是說明VPF的效果就一定優(yōu)于IPF的效果,如圖10所示[6],分別得出圖中的垂直積分投影函數(shù)和垂直方差投影函數(shù),從圖中的曲線反映出IPF有突變而VPF曲線為水平曲線,在此圖像中垂直方差投影值相等,其曲線斜率為0,因此在這種情況下VPF失效。
圖10? IPF優(yōu)于VPF的例子
基于積分投影和方差投影的優(yōu)勢和特點(diǎn),兩者具有一定的互補(bǔ)性,耿新等人[20]提出了混合投影函數(shù)。首先將取均值后的積分投影函數(shù)和方差投影函數(shù)的值規(guī)范化到[0,1]區(qū)間,如式(10)和式(11)[20]所示:
,
(10)
,
(11)
利用式(10)和式(11)將垂直混合投影函數(shù)HPFv(x)和水平混合投影函數(shù)HPFh(y)分別定義為[20]:
,
(12)
分別計(jì)算圖11和圖12的IPF、VPF和HPF并繪制曲線[20],可以得出HPF在IPF或VPF失效的情況下也能反映出圖像的特征。
利用HPF來定位人眼中心,首先分析標(biāo)準(zhǔn)人眼模型HPF的曲線,如圖13所示[20],可以得出在水平混合投影曲線上y1和y2是曲線變化率最大的位置,并且y1和y2分別是上下眼瞼的y軸坐標(biāo);同樣的,垂直混合投影曲線上x1和x2是曲線變化率最大的位置,并且x1和x2分別是左右眼角的x軸坐標(biāo),令人眼中心坐標(biāo)為(x0,y0),則:
(13)
因此可以根據(jù)HPF變化率的曲線,在此曲線中得到峰值位置來檢測人眼中心。如圖14和圖15所示[20],兩圖中黑色曲線圖像為HPF曲線,灰色曲線為HPF變化率曲線,白色直線為變化率曲線的峰值位置,根據(jù)四個(gè)峰值得到上下眼瞼坐標(biāo)為y1和y2,左右眼角坐標(biāo)為x1和x2,進(jìn)而檢測眼睛中心。
同時(shí),ZHOU等人[21]提出了廣義投影函數(shù)(Generalized projection function,GPF),垂直廣義投影函數(shù)GPFv(x)和水平廣義投影函數(shù)GPFh(y)分別定義為:
GPFv(x)=(1-α)·MIPFv(x)+α·VPFv(x)? ?(14)
GPFh(y)=(1-α)·MIPFh(y)+α·VPFh(y)? ?(15)
式中:α∈[0,1],則α能控制IPF和VPF在GPF中所占的權(quán)重,且ZHOU等人通過大量的實(shí)驗(yàn)證明當(dāng)α取值為0.6時(shí),定位眼睛中心的效果最好,同時(shí)也驗(yàn)證了將α取值為0.6時(shí)的GPF用于人眼檢測的成功率都高于單獨(dú)使用IPF或VPF用于人眼檢測的成功率。
1.4? 非傳統(tǒng)投影函數(shù)
上文介紹的三種投影函數(shù)都是傳統(tǒng)的投影函數(shù)方法,都能通過尋找投影函數(shù)曲線或者其變化率曲線的波峰或者波谷位置來定位人眼,但是由于人臉圖像中頭發(fā)、眉毛、睫毛等灰度值較低區(qū)域會(huì)給投影函數(shù)曲線帶來多個(gè)波峰和波谷位置的影響,從而會(huì)大大地干擾人眼檢測的結(jié)果。為了不斷減少傳統(tǒng)投影函數(shù)的缺點(diǎn),相關(guān)研究人員不斷地在傳統(tǒng)投影函數(shù)方法的基礎(chǔ)上改進(jìn)灰度投影算法。
王文成等人[22]提出了一種基于區(qū)域投影(RPF)的算法來檢測人眼。首先把眼睛窗口在水平方向和垂直方向上分別等份分成m個(gè)和n個(gè),分割后水平方向的每個(gè)區(qū)域?qū)挒棣兀怪狈较虻拿總€(gè)區(qū)域的長為L,然后計(jì)算這些區(qū)域內(nèi)的投影值總和,設(shè)第i個(gè)水平方向區(qū)域的投影值為(Rh)i,第j個(gè)垂直方向區(qū)域投影值為(Rv)j,(Rh)i和(Rv)j的值分別表示為[22]:
(Rh)i=,1≤i≤m? ? ? ? (16)
(Rv)j=,1≤j≤n? ? ? ? ?(17)
式中:Pv(x)為第x列的垂直投影,Ph(y)為第y行的水平投影,根據(jù)眼睛區(qū)域眼白與瞳孔之間的灰度變化率較大的特點(diǎn),這里的投影方式可以采用VPF的方式,從而通過RPF獲取的區(qū)域?yàn)椋?/p>
R(I,J)=P{min[(Rh)i],min[(Rv)j]}? ? ? (18)
式中:i=1,2,…,m;j=1,2,…,n。區(qū)域投影的方法通過式(18)[22]獲取水平方向上水平方差投影灰度最小值區(qū)域和垂直方向上垂直方差投影灰度最小值區(qū)域的交集R(I,J)區(qū)域,所得到的交集區(qū)域中就含有人眼中心,大大縮小定位人眼中心的范圍,提高精確人眼檢測的成功率。圖16[22]為區(qū)域投影獲取交集區(qū)域過程示例,(a)為標(biāo)準(zhǔn)人眼模型,(b)和(c)分別表示基于標(biāo)準(zhǔn)人眼模型的水平區(qū)域投影和垂直區(qū)域投影過程,(d)表示獲取人眼中心所在交集區(qū)域R(I,J)。
若使用傳統(tǒng)灰度投影函數(shù)方法來定位人眼中心,需要其他方法或規(guī)則來粗略獲取人眼區(qū)域,但是這些區(qū)域往往包含了眉毛區(qū)域,會(huì)對(duì)最終人眼檢測造成影響。為了解決這一不足,根據(jù)眼部區(qū)域灰度值變化最為突出的特點(diǎn),如眼部區(qū)域的皮膚與鞏膜、鞏膜與虹膜等,這些局部區(qū)域灰度值差異大,有明顯的邊界,孟春寧等人[23]提出了梯度積分投影(GIPF)來分割人眼區(qū)域。首先使用一個(gè)長度為7的一維行梯度算子H來計(jì)算人臉灰度圖像的行梯度模值GR(x,y),行梯度算子H如圖17所示[23]。
GR(x,y)計(jì)算公式為:
GR(x,y)=|H*I(x,y)|? ? ? ? ? ? ? ? ? (19)
式中:I(x,y)為人臉灰度圖像。行梯度投影函數(shù)GIPFR(y)定義為:
GIPFR(y)=GR(x,y)? ? ? ? ? ? ? (20)
接著將GIPFR(y)的值做歸一化處理,找到其最大值位置所在的水平直線,并以這條線為中心,分別向上以及向下搜尋上下方向的第一個(gè)二分之一最大值位置,以搜尋到的這兩個(gè)位置所在的水平直線為邊界得到人眼區(qū)域,如圖18所示[23],可以得出這種方法能有效地從水平方向上把眼睛與眉毛等干擾區(qū)域分離。圖19[6]表明了梯度積分投影函數(shù)比其他投影函數(shù)方法更能反映灰度圖像水平方向上的特征。
一些人臉圖像中人臉發(fā)生偏轉(zhuǎn)時(shí),使用傳統(tǒng)投影方法來檢測人眼就會(huì)出現(xiàn)較大誤差,甚至失效[24],針對(duì)這一不足,候春波等人[25]提出了基于邊緣強(qiáng)度信息積分投影方法來定位人眼。該方法使用Kirsch算子求出人臉區(qū)域的基于邊緣強(qiáng)度的灰度圖像,邊緣化后的圖像能有效地反映出人眼處的輪廓和灰度特點(diǎn);在此區(qū)域中建立極坐標(biāo)系,將積分投影的坐標(biāo)系從傳統(tǒng)的正交坐標(biāo)系轉(zhuǎn)換為極坐標(biāo)系,以人臉區(qū)域中心為極點(diǎn),計(jì)算不同極角方向的積分投影,獲取人眼角度方向,然后計(jì)算此角度方向上的邊緣強(qiáng)度微分累加值進(jìn)而確定人眼的極徑,這樣在人臉發(fā)生一定角度旋轉(zhuǎn)的人臉圖像中,這種方法也能有效地定位人眼。
候丹陽等人[26]認(rèn)為利用Adaboost算法[27]和“三庭五眼”[14]方法粗略劃定的眼睛區(qū)域往往包含眉毛,在這個(gè)區(qū)域中使用積分投影的方法會(huì)出現(xiàn)眉毛處的投影值小于眼睛處的情況,特別是在定位人眼中心水平方向的坐標(biāo)時(shí)易出現(xiàn)這種情況,從而出現(xiàn)定位人眼中心位置不準(zhǔn)確的情況,因此候丹陽等人提出了差分投影和積分投影聯(lián)合定位人眼水平中心的方法。此方法根據(jù)人眼在水平方向上灰度變化較豐富,而眉毛區(qū)域在水平方向上灰度分布較均勻,灰度變化率較低,對(duì)灰度變化處進(jìn)行差分,人眼處將產(chǎn)生較大的值;再考慮到人眼區(qū)域的灰度變化率與灰度分布,利用積分投影和差分投影結(jié)合來定位眼睛區(qū)域的人眼中心水平坐標(biāo),可以排除眉毛區(qū)域?qū)θ搜鄱ㄎ坏母蓴_。
2? 人眼檢測技術(shù)的應(yīng)用
人眼在人臉五官中特點(diǎn)最為顯著,能很好地體現(xiàn)個(gè)體之間的差異,通過檢測人眼能獲取到各種信息,因此人眼檢測技術(shù)廣泛應(yīng)用于各個(gè)領(lǐng)域。
心理學(xué):眼睛能反映人類的情緒變化甚至心理活動(dòng)[27],通過測試人體眼睛的活動(dòng),如眼球轉(zhuǎn)動(dòng),瞳孔變化等,與此時(shí)的心理活動(dòng)對(duì)比分析來反映此時(shí)這個(gè)人的心理感受。如人在說謊時(shí),瞳孔會(huì)不受控制的放大,因此可以通過瞳孔直徑的大小的變化來輔助鑒定測試者是否說謊[28],公安人員常常采用這種方法來輔助案件偵破;眼睛活動(dòng)軌跡可以反映觀察者的觀看習(xí)慣,如設(shè)計(jì)廣告時(shí),可以統(tǒng)計(jì)消費(fèi)者的眼睛活動(dòng)軌跡來合理排布圖案、文字和標(biāo)題[29]。
醫(yī)學(xué):阿爾茨海默病直接導(dǎo)致進(jìn)行性認(rèn)知功能障礙,越來越多的文獻(xiàn)表明了阿爾茨海默病與的人體眼球運(yùn)動(dòng)變化有關(guān)[30]。眼球運(yùn)動(dòng)與認(rèn)知功能密切相關(guān),利用跟蹤技術(shù)檢測眼睛運(yùn)動(dòng),研究眼球運(yùn)動(dòng)異常和認(rèn)知功能障礙之間的相關(guān)性,且各種眼球運(yùn)動(dòng)指標(biāo)有望成為阿爾茨海默病患者早期篩查和嚴(yán)重程度分級(jí)診斷的主要生物標(biāo)志物[31]。
疲勞駕駛檢測:隨著社會(huì)經(jīng)濟(jì)的發(fā)展,私家車的數(shù)量和駕駛?cè)藬?shù)不斷增加,導(dǎo)致了交通事故的數(shù)量也在不斷上升。據(jù)統(tǒng)計(jì),在所有交通事故的成因中,由疲勞駕駛造成的交通事故占總交通事故20%左右,占特大交通事故40%以上[32]。人在疲勞時(shí)眼睛會(huì)出現(xiàn)在單位時(shí)間內(nèi)眨眼次數(shù)下降以及眼瞼開合變小等癥狀,因此在汽車中配備汽車輔助駕駛系統(tǒng)來檢測眼睛活動(dòng),測試出人眼是否出現(xiàn)疲勞的癥狀,對(duì)司機(jī)能否正常駕駛汽車做出判斷,從而減少事故的發(fā)生[33,34]。這種檢測方式簡單且不會(huì)影響司機(jī)的駕駛[35]。
公共安全:生物特征是比密碼更可靠的可測量身份特征,其中虹膜識(shí)別技術(shù)相比于其他生物特征識(shí)別技術(shù)具有較高的個(gè)體唯一性、終生不變性以及非侵入等優(yōu)點(diǎn),使得虹膜識(shí)別技術(shù)成為人體生物識(shí)別技術(shù)中最優(yōu)的選擇[36,37]。因此,以人眼檢測為前提的虹膜識(shí)別技術(shù)為電子支付,安全通信,大型活動(dòng)安保等公共安全場景提供了可靠的保障。
綜上所述,虹膜識(shí)別技術(shù),眼睛運(yùn)動(dòng)跟蹤技術(shù),各種人眼分析等已廣泛應(yīng)用于心理學(xué)、醫(yī)學(xué)、公共安全等領(lǐng)域,而人眼檢測是這些技術(shù)應(yīng)用的前提條件。因此,快速、精確、魯棒性高以及適用于多種場景的人眼檢測方法依然是相關(guān)研究中的重點(diǎn)。
3? 結(jié)? 論
大量研究表明利用投影函數(shù)方法能有效檢測人眼,本文查閱了利用投影函數(shù)檢測人眼的文獻(xiàn),介紹了傳統(tǒng)投影函數(shù)以及近年提出的投影函數(shù)檢測人眼的原理,分析了各個(gè)方法的特點(diǎn),希望能為相關(guān)研究人員提供參考。
參考文獻(xiàn):
[1] ABHISHEK D,MANUEL G,LAURENT E S,et al. Impact of eye detection error on face recognition performance [J].IET Biometrics,2015,4(3):137-150.
[2] HANSEN D W,JI Q. In the eye of the beholder:a survey of models for eyes and gaze [J].IEEE transactions on pattern analysis and machine intelligence,2010,32(3):478-500.
[3] KANADE T. Picture Processing by Computer Complex and Recognition of Human Faces [D].Kyoto:Kyoto University,1973.
[4] WU J,ZHOU Z H. Efficient face candidates selector for face detection [J].Pattern recognition,2003,36(5):1175-1186.
[5] FUHL W,K?BLER T,SIPPEL K,et al. Excuse:Robust pupil detection in real-world scenarios [C]//International conference on computer analysis of images and patterns.Cham:Springer,2015:39-51.
[6] 常勝江,孟春寧,韓建民,等.人眼檢測技術(shù)研究進(jìn)展 [J].數(shù)據(jù)采集與處理,2015,30(6):1131-1146.
[7] 馮建強(qiáng),劉文波,于盛林.基于灰度積分投影的人眼定位 [J].計(jì)算機(jī)仿真,2005(4):75-76+104.
[8] 夏良正.數(shù)字圖像處理 [M].南京:東南大學(xué)出版社,1999.
[9] 荔小虎,唐晶磊.基于膚色匹配和積分投影結(jié)合的人眼定位方法研究 [J].自動(dòng)化應(yīng)用,2018(12):59-61.
[10] 萬靜,袁澤,張雪超.復(fù)雜背景下基于人臉的自適應(yīng)膚色檢測 [J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(11):148-152.
[11] 葛其睿,張榮國,胡靜,等.改進(jìn)的先驗(yàn)形狀模型構(gòu)造及其人臉圖像分割 [J].太原科技大學(xué)學(xué)報(bào),2014,35(3):161-165.
[12] 崔慶華,程科,李肇基.積分投影與連通域法結(jié)合的人眼定位 [J].計(jì)算機(jī)與數(shù)字工程,2019,47(4):949-953.
[13] YOAV F,ROBERT E S. A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting [J].Journal of Computer and System Sciences,1997,55(1):119-139.
[14] 陳啟泉,邱文宇,陳維斌.標(biāo)準(zhǔn)正面人臉圖象的特征提取 [J].華僑大學(xué)學(xué)報(bào)(自然科學(xué)版),2000(4):413-418.
[15] 羅志灶,周贏武,鄭忠楷.二值圖像連通域標(biāo)記優(yōu)化算法 [J].安慶師范學(xué)院學(xué)報(bào) (自然科學(xué)版),2010,16(4):34-39.
[16] CHENG X,ZHAO X,ZHOU J,et al. Eye localization method based on contour detection and D–S evidence theory [J].Signal,Image and Video Processing,2018,12(4):599-606.
[17] FENG G C,YUEN P C. Variance projection function and its application to eye detection for human face recognition [J].Pattern Recognition Letters,1998,19(9):899-906.
[18] 路玉峰,李春玲,楊秀建.基于方差投影函數(shù)的人眼狀態(tài)識(shí)別 [J].山東輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版),2009,23(4):74-77.
[19] 高永萍,秦華標(biāo).駕駛員疲勞檢測系統(tǒng) [J].儀表技術(shù)與傳感器,2007(1):60-62.
[20] 耿新,周志華,陳世福.基于混合投影函數(shù)的眼睛定位 [J].軟件學(xué)報(bào),2003(8):1394-1400.
[21] ZHOU Z H,GENG X. Projection functions for eye detection [J].Pattern Recognition,2003,37(5):1049-1056.
[22] 王文成,常發(fā)亮.一種基于區(qū)域投影的人眼精確定位方法 [J].光電子.激光,2011,22(4):618-622.
[23] 孟春寧,白晉軍,張?zhí)珜?,?基于梯度積分投影和最大期望算法的人眼定位 [J].光電子.激光,2012,23(10):1971-1976.
[24] 徐來,周德龍.人眼檢測技術(shù)的方法研究 [J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010,19(6):226-232+139
[25] 修春波,任曉,成怡.人眼定位的邊緣強(qiáng)度信息積分投影方法 [J].計(jì)算機(jī)科學(xué)與探索,2015,9(5):621-628.
[26] 侯向丹,趙丹,劉洪普,等.基于積分投影和差分投影的人眼定位 [J].計(jì)算機(jī)工程與科學(xué),2017,39(3):534-539.
[27] SARAH U,STEVE J. The eyes know what you are thinking:Eye movements as an objective measure of mind wandering [J].Consciousness and Cognition,2011,20(4):1882-1886.
[28] 鐘少玲,李奇光,周建松,等.眼動(dòng)技術(shù)在測謊中的應(yīng)用 [J].中國臨床心理學(xué)雜志,2018,26(4):698-700.
[29] BUSCHER G,DUMAIS S T,CUTRELL E. The good,the bad,and the random:an eye-tracking study of ad quality in web search [C]//SIGIR10:Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval.New York:Association for Computing Machinery,2010:42-49.
[30] MOLITOR R J,KO P C,ALLY B A. Eye movements in Alzheimers disease [J].Journal of Alzheimers disease:JAD,2015,44(1):1-12.
[31] 鄔涵韻,張黎.眼科檢查在阿爾茨海默病診斷中的研究進(jìn)展 [J].國際眼科雜志,2020,20(6):1007-1010.
[32] 劉文玲,錢曉飛,裴軍.基于關(guān)聯(lián)規(guī)則的公交事故受傷情況預(yù)測研究 [J].控制工程,2016,23(9):1448-1453.
[33] 李銳,蔡兵,劉琳,等.基于模型的駕駛員眼睛狀態(tài)識(shí)別 [J].儀器儀表學(xué)報(bào),2016,37(1):184-191.
[34] 杜永昂,楊耀權(quán),金玥佟.基于疲勞駕駛的人眼定位方法研究 [J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(6):19-23+30.
[35] 夏阿南.基于人眼動(dòng)態(tài)特性的駕駛疲勞檢測方法研究 [D].大連:大連海事大學(xué),2014.
[36] 申志華,俞飛.虹膜識(shí)別技術(shù)的優(yōu)越性及其在身份鑒別中的應(yīng)用 [J].保密科學(xué)技術(shù),2014(6):66-69.
[37] SHEELA S V,VIJAYA P A. Iris Recognition Methods-Survey [J].International Journal of Computer Applications,2010,3(5):19.
作者簡介:陳葛(1996—),男,漢族,四川眉山人,碩士研究生在讀,研究方向:圖像處理;方楊(1996—),女,漢族,重慶人,碩士研究生在讀,研究方向:光學(xué)成像與圖像處理。