文/梁銘炬
眼動特征及人眼注視方向映射模型是視線跟蹤技術(shù)的關(guān)鍵問題,目前這方面已經(jīng)開展了一些有意義的研究,例如Morimoto等利用二次多項式方程來關(guān)聯(lián)瞳孔移動矢量和眼睛注視點,此方法只適合于佩戴式設(shè)備。A.sugioka結(jié)合普爾欽斑點法并考慮頭動影響以解決視線方向的映射難題,難以應(yīng)用于實際;T.ohno提出頭部自由的人眼注視方向識別算法,用三個攝像機來獲得眼睛的三維坐標,算法復(fù)雜耗時。
本文提出基于2D-DCT 及EHMM的眼動狀態(tài)識別方法。首先利用2D-DCT變換提取眼睛的低頻信號組成觀察序列,采用EHMM模型訓(xùn)練眼動狀態(tài)觀察序列,得到判別眼動狀態(tài)的分類器,最后利用該分類器對眼睛實時狀態(tài)進行檢驗和分析就可以得到視線方向。
嵌入式隱馬爾科夫模型(EHMM)是多維HMM(Hidden Markov Model)模型,EHMM包含一個主狀態(tài)序列,每個主序列包含一組嵌入狀態(tài)序列,主序列用于建模二維數(shù)據(jù),而嵌入狀態(tài)序列則用于建模一維數(shù)據(jù),因此EHMM是二維的HMM模型,訓(xùn)練及識別的效率更高,其初始模型參數(shù)估計值更準確。
EHMM在圖像處理的應(yīng)用上存在一定的缺陷,假如一幅眼睛灰度圖片為90x60的像素大小,按照其原理(X=3,Y=4)所對應(yīng)的子HMM觀察序列大小約為22x15,對應(yīng)的觀察序列就有256330種不同序列,無論是在訓(xùn)練模型以及應(yīng)用模型,都會產(chǎn)生天文級的計算量,因此本文利用2D-DCT對眼睛灰度圖片進行像素壓縮,提取其低頻特征序列作為觀察序列,以減少EHMM模型的復(fù)雜度和計算量。
通過EHMM模型訓(xùn)練確定眼動狀態(tài)對應(yīng)的EHMM模型序列,每組序列參數(shù)用多幅不同使用者的不同亮度、不同姿態(tài)的圖片,按照以下步驟進行訓(xùn)練:
表1:準確率實驗結(jié)果列表
圖1:不同方向視線的人眼圖像的2D-DCT變換圖像
(1)對圖像進行灰度歸一化預(yù)處理。
(2)對圖像進行2D-DCT變換,構(gòu)建其低頻觀察序列。
(3)設(shè)定EHMM的主狀態(tài)序列為3和其子嵌入狀態(tài)序列為4,通過Viterbi算法,對人眼圖像進行分割。
(4)以Baum-welch算法進行模型參數(shù)重估訓(xùn)練,重復(fù)多次此步驟得到收斂的EHMM模型。
進行視線方向識別的時候,首先通過2D-DCT變換獲取眼動圖像的低頻觀察序列,通過各個訓(xùn)練模型獲取眼動狀態(tài)的似然值,對應(yīng)的眼動狀態(tài)具有最大似然值,公式(1)表示如下:
根據(jù)設(shè)計的EHMM模型構(gòu)造(3個主狀態(tài)序列,4個子嵌入狀態(tài)序列,(4,4,4)共12個隱馬爾可夫模型狀態(tài))進行人眼圖像2D-DCT變化及劃分為圖像塊,形成觀察向量序列如圖1所示。
本實驗采集20人在不同姿態(tài)和不同的光照下的2000多幅圖片進行2D-DCT變換數(shù)據(jù)提取及EHMM訓(xùn)練。對2D-DCT變換的數(shù)據(jù)進行分析,然后對另外采集圖像進行實驗驗證。本論文采用多種方法驗證對視線方向識別的可行性,如HMM算法、普爾欽斑點法,從結(jié)果(表1所示)可以看出EHMM具有更高準確率。
本文創(chuàng)新地提出將EHMM的模式識別方法應(yīng)用于視線跟蹤技術(shù),在準確率上有理想效果,通過處理人眼的圖像,尋找不同視線方向的人眼圖像的2D-DCT特征,通過訓(xùn)練得到基于EHMM的人眼注視方向分類器,來檢測和判斷出人眼視線注視方向。通過對各種外界情況下拍攝的眼動圖片進行視線方向識別的準確率來看,本方法檢測眼睛注視方向的精度高、穩(wěn)定性好、魯棒性強,同時無需任何標定過程及設(shè)計個體使用者的參數(shù),經(jīng)簡單訓(xùn)練過程,得到的視線方向識模型別即可用于普通人群,適用于實際應(yīng)用領(lǐng)域。