張海珊,劉笑楠,張文云
(沈陽工業(yè)大學(xué)信息科學(xué)與工程學(xué)院, 沈陽110870)
虹膜因其識別精度高而成為最突出的生物特征之一,應(yīng)用于身份驗證和身份識別。傳統(tǒng)的虹膜識別技術(shù)在紅外光源下進(jìn)行圖像采集,雖然采集到的圖像干擾較少,但會傷害人眼[1]。隨著智能移動終端性能的不斷增強(qiáng),可見光移動端虹膜識別發(fā)展迅速。在可見光條件下,所得圖像中的虹膜區(qū)域包含更多的紋理細(xì)節(jié)[2],然而這種弱約束的采集環(huán)境也令圖像中的虹膜區(qū)域容易被陰影、眼瞼、睫毛、鏡面反射所干擾,從而導(dǎo)致可用于識別的虹膜紋理特征減少,降低了系統(tǒng)的識別精度[3]。Daugman 等人[4]最先提出了虹膜圖像質(zhì)量評價的概念,將虹膜區(qū)域的特征信息作為評價依據(jù),對圖像所反映的虹膜紋理信息進(jìn)行評判,衡量圖像信息對身份識別的適用性。該問題的解決方法可分為單一指標(biāo)評價和多測度融合評價兩類。在可見光移動端虹膜識別領(lǐng)域,由于干擾因素的多樣性,單一評價指標(biāo)不能滿足圖像質(zhì)量評價的需求,虹膜圖像質(zhì)量必然是多測度融合的結(jié)果。羅曉慶等人[5]以虹膜圖像的灰度分布特征為基礎(chǔ),提出虹膜完整性、虹膜可見度和虹膜清晰度三個單測度結(jié)合的虹膜圖像質(zhì)量評價模型。藺勇等人[6]設(shè)計了可用虹膜區(qū)、虹膜大小、清晰度、擴(kuò)張度等八個評價因子, 將評價因子融合形成虹膜圖像質(zhì)量評價值。郭慧杰[7]通過量化單幀圖像感興趣區(qū)域的清晰度、可用度和對比度等質(zhì)量指標(biāo),計算序列圖像的聯(lián)合加權(quán)質(zhì)量得分,對虹膜圖像序列的可用性進(jìn)行評價。上述方法針對紅外虹膜圖像進(jìn)行質(zhì)量評價,對于可見光移動端虹膜識別所獲取虹膜圖像而言,其可能存在的干擾因素更多,受干擾的程度更甚,還需進(jìn)行進(jìn)一步有針對性的研究。
虹膜定位指虹膜內(nèi)外邊緣的定位,它是虹膜識別系統(tǒng)中的重要環(huán)節(jié),其準(zhǔn)確性直接關(guān)系到特征提取效率以及特征匹配正確率[8]。針對可見光移動端虹膜圖像的虹膜定位問題,Tan 等人[9]利用鞏膜和虹膜特征訓(xùn)練支持向量機(jī)進(jìn)行分類,根據(jù)虹膜灰度信息實(shí)現(xiàn)虹膜分割。劉帥等人[10]提出一種基于分塊搜索的虹膜定位算法。穆珺等人[11]提出基于霍夫變換的可見光虹膜圖像定位算法。文獻(xiàn)[12]在此基礎(chǔ)上,將霍夫變換與最小二乘法相結(jié)合實(shí)現(xiàn)虹膜定位。滕童等人[13]為快速淘汰干擾信息以準(zhǔn)確定位虹膜區(qū)域,提出了基于卷積神經(jīng)網(wǎng)絡(luò)的區(qū)域和關(guān)鍵點(diǎn)回歸多任務(wù)虹膜快速定位方法。孫正[14]提出了基于單位扇環(huán)灰度的虹膜定位算法。此外還包括主動輪廓法[15]、圓形Gabor 濾波器法[16]以及基于分水嶺原理并依據(jù)鞏膜和虹膜邊緣信息的定位方法[17]。上述方法只適用于眼睛周圍小范圍區(qū)域且圖像所受干擾較弱的虹膜圖像的虹膜定位問題,無法實(shí)現(xiàn)干擾問題較多且面積較大的虹膜圖像的虹膜定位。在光照不均、鏡面反射造成虹膜邊緣不明顯的虹膜圖像中,其定位效果并不理想。
綜上所述,智能移動終端所獲得的可見光虹膜圖像因受光照及人眼眨動等影響普遍存在不同程度的干擾,而目前已有的虹膜定位方法無法實(shí)現(xiàn)嚴(yán)重干擾虹膜圖像的準(zhǔn)確定位。為此,利用智能移動終端的視頻采集功能,在虹膜識別系統(tǒng)中采集多幀虹膜序列圖像,在虹膜定位過程中植入圖像質(zhì)量評價,淘汰非理想虹膜圖像,擇優(yōu)進(jìn)行虹膜初定位;再針對虹膜區(qū)域紋理進(jìn)行質(zhì)量評價,選取可滿足識別要求的虹膜圖像進(jìn)行后續(xù)特征提取與匹配操作,在提高虹膜定位準(zhǔn)確率的同時降低設(shè)備的運(yùn)算負(fù)擔(dān)。以此設(shè)計新的融合圖像質(zhì)量評價與虹膜定位的多層級聯(lián)式虹膜圖像預(yù)處理算法,該方法能夠?qū)崿F(xiàn)以圖像質(zhì)量為依據(jù)的虹膜序列圖像的圖像選取與獲選圖像的虹膜區(qū)域定位。
在此提出一種包括兩級質(zhì)量評價和兩級虹膜定位的多層級聯(lián)式虹膜圖像預(yù)處理算法。其算法流程如圖1 所示,首先對智能移動終端采集所得的九幀序列圖像依次進(jìn)行圖像增強(qiáng)并通過拉格朗日插值法消除光斑。通過Tenegrad 聚焦評價函數(shù)對圖像進(jìn)行第一級質(zhì)量評價,若圖像所得評價函數(shù)高于設(shè)定值,則進(jìn)入虹膜初定位,否則淘汰圖像。然后利用基于HOG-SVM 的分類模型實(shí)現(xiàn)虹膜初定位,若虹膜定位成功,則進(jìn)入第二級虹膜質(zhì)量評價,否則淘汰圖像;第二級虹膜圖像質(zhì)量評價以小波系數(shù)作為特征值,利用BP 神經(jīng)網(wǎng)絡(luò)對圖像進(jìn)行質(zhì)量評價,若圖像紋理滿足識別要求,則進(jìn)入虹膜細(xì)定位,否則淘汰圖像;最后利用圓擬合法及混合測地線演化法完成虹膜內(nèi)外邊緣定位。
圖1 算法流程圖
可見光虹膜圖像在采集過程中易受光照明暗度影響,虹膜紋理過暗或存在光斑,因此需要進(jìn)行圖像增強(qiáng)與光斑消除,減少光照對虹膜定位與質(zhì)量評價準(zhǔn)確性的影響。Retinex 算法可以在動態(tài)范圍壓縮、邊緣增強(qiáng)和顏色恒常三個方面達(dá)到平衡,因此選擇此算法對虹膜圖像進(jìn)行增強(qiáng)。其原理如下式所示:
其中S(x,y)表示獲取的原始圖像,L(x,y)表示自然光照分量,R(x,y)表示物體對入射光的反射分量。為簡化運(yùn)算,對式(1)兩邊進(jìn)行取對數(shù)計算,這樣就可以得到包含豐富信息的物體反射分量,如下式:
將此式運(yùn)用到虹膜中,其中S(x,y)表示原始虹膜圖像;按照Retinex 理論,此處的L(x,y)表示將原始虹膜圖像高斯模糊后圖像,R(x,y)則表示增強(qiáng)后的圖像。
針對虹膜區(qū)域內(nèi)由于可見光鏡面反射所引起的光斑去除問題,根據(jù)光斑亮度高,連通區(qū)域面積小的屬性,采用灰度值和區(qū)域面積確定光斑位置。首先,利用閾值法將灰度圖像二值化,經(jīng)過多次實(shí)驗分析,將分割閾值設(shè)定為204。然后對二值圖像進(jìn)行開運(yùn)算,通過統(tǒng)計分析,將8 連通區(qū)域面積小于800 個像素的區(qū)域判定為光斑。最后得到光斑位置坐標(biāo)后,采用拉格朗日插值法消除光斑。
經(jīng)實(shí)驗分析,采用四次插值多項式修復(fù)。設(shè)光斑區(qū)域邊緣處一點(diǎn)在圖像中列坐標(biāo)為p0,其位于光斑外的四個鄰域點(diǎn)在圖像中的列坐標(biāo)為x0、x1、x2、x3,則:
其中L(x)為光斑恢復(fù)后灰度值,gi為光斑外四點(diǎn)灰度值。
第一級圖像質(zhì)量評價針對圖像失焦問題。選擇Tenegrad 清晰評價函數(shù),該方法使用Sobel 算子提取水平和垂直方向的梯度值,圖像梯度值F 的計算方法如下式所示:
由于對焦良好的圖像有尖銳的邊緣,因此F 越大,圖像越清晰,如圖2 所示。統(tǒng)計圖庫中360 幅圖像的梯度值F,前180 張為清晰圖像,后180 張為非清晰圖像,統(tǒng)計結(jié)果如圖3 所示。可見閾值T 設(shè)置為5.80 時,能更好判別出圖像質(zhì)量清晰程度。
圖2 不同F(xiàn) 值下的虹膜圖像對比
圖3 虹膜圖像F 值分布圖
清晰的虹膜圖像將進(jìn)行虹膜初定位。為減少面部、眉毛等干擾因素對虹膜邊緣的影響,使用HOG+SVM 分類器進(jìn)行虹膜初定位。依據(jù)HOG 特征的計算原理,在此利用圖庫中的虹膜圖像構(gòu)建SVM 樣本集,將包含完整人眼結(jié)構(gòu)的圖像塊作為正樣本,其他區(qū)域圖像塊作為負(fù)樣本,如圖4 所示。為獲取樣本HOG 特征值,將截取正負(fù)樣本歸一化,然后計算梯度,分割每一個cell,并為每個單元格構(gòu)建HOG,將cell 組合為大block;塊內(nèi)歸一化成梯度直方圖,并把block 向量的特征向量串聯(lián)成最終的HOG 特征。在獲取HOG 特征時,采用合適的滑動窗格和block尺寸可以降低HOG 特征維數(shù)并有效地描述虹膜結(jié)構(gòu)。通過對圖庫中圖像的實(shí)驗分析,該圖庫中虹膜區(qū)域的HOG 特征維度為20736 維,設(shè)置步長為25 個像素單位。訓(xùn)練后SVM 分類器準(zhǔn)確率可達(dá)92%。
圖4 訓(xùn)練樣本示例圖(人眼完整度)
初定位后可獲得準(zhǔn)確的眼球區(qū)域,但其中的虹膜紋理信息還可能不滿足后續(xù)的識別要求,因此須對初定位所得區(qū)域采用小波變換與BP 神經(jīng)網(wǎng)絡(luò)結(jié)合的方式進(jìn)行二級質(zhì)量評價。在實(shí)際仿真過程中發(fā)現(xiàn),使用db2 小波基與三次小波分解時所提取的特征系數(shù)效果最佳。低頻子圖因其包含的原圖信息量多且豐富被選用為最佳子圖。所設(shè)計算法的學(xué)習(xí)規(guī)則為梯度下降法雙層BP 神經(jīng)網(wǎng)絡(luò),選擇第一層傳遞函數(shù)為logsig,第二層傳遞函數(shù)為purelin。將虹膜紋理清晰且完整的圖像標(biāo)記為正樣本,虹膜紋理不清晰或不完整的圖像標(biāo)記為負(fù)樣本,如圖5 所示。正負(fù)樣本各選取300 張,分別作為訓(xùn)練集與測試集,將樣本低頻子圖的小波系數(shù)作為BP 神經(jīng)網(wǎng)絡(luò)的輸入,樣本標(biāo)簽作為BP 神經(jīng)網(wǎng)絡(luò)輸出進(jìn)行訓(xùn)練。訓(xùn)練完成后,選用測試集中的樣本進(jìn)行測試。訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)分類正確率為96%。
圖5 訓(xùn)練樣本示例圖(虹膜清晰度)
虹膜的內(nèi)邊緣就是瞳孔的外邊緣,由于瞳孔內(nèi)區(qū)域的整體灰度值比虹膜其他區(qū)域低,因此采用與瞳孔直徑大小接近的30×30 方形模板在整個虹膜區(qū)域圖像中滑動卷積求和,找出灰度值最小的區(qū)域中心點(diǎn),然后以該中心點(diǎn)作為初始點(diǎn),利用圓擬合方法圈出瞳孔。
混合測地線區(qū)域曲線演化法由Lankton 等人提出,它是一種混合了局部測地線活動輪廓和全局區(qū)域活動輪廓優(yōu)點(diǎn)以確定目標(biāo)邊緣的方法[18]。其演化計算的公式如下式所示:
式中r,s∈[0,L(C)],L(C)表示曲線C 的長度,參數(shù)r用來更新不斷變化的曲線C 上的點(diǎn),k 代表線上的高斯曲率,N 代表曲線對應(yīng)某點(diǎn)的法線,x 用來更新曲線C(s)附近的點(diǎn)的函數(shù)。
經(jīng)過多次曲線演化后,曲線周圍局部范圍內(nèi)能量最小,此時曲線為目標(biāo)邊緣。該算法可以在低頻噪聲和部分光干擾的情況下,找出虹膜圖像中的虹膜外邊緣,達(dá)到虹膜定位的目的。
在此采用UBIRIS.v2 虹膜數(shù)據(jù)庫模擬視頻采集到的虹膜序列圖像進(jìn)行算法評估。此圖庫圖像為可見光圖像,包括受成像距離、主題視角和光照條件等干擾因素所致的各種非理想圖像。圖庫圖像大小為400×300 像素,受試人數(shù)為261 人。為構(gòu)建所提算法適用的虹膜序列圖像的實(shí)驗仿真環(huán)境,選取圖庫的100 人作為實(shí)驗對象。這些對象每人均可選出9 幀虹膜圖像構(gòu)成序列,并且序列中僅存在1 幀質(zhì)量優(yōu)良的虹膜圖像。另外,所選圖像包含實(shí)際采集過程中可能產(chǎn)生的各類干擾,受試人性別均衡、年齡層分布符合社會群體中虹膜識別需求。其中一人的9 幀圖像示例如圖6 所示。
圖6 同一人的9 幀圖像
如表1、圖7 所示為本算法各步驟的實(shí)驗結(jié)果。再進(jìn)行第一級質(zhì)量評價之后,圖6 中(b)、(d)、(f)圖像因失焦被淘汰掉;在初定位階段,圖(a)、(c)圖像因虹膜結(jié)構(gòu)不滿足識別需求被淘汰掉;在第二級質(zhì)量評價階段,圖6 中(e)、(g)、(h)圖像因紋理不理想被淘汰掉;在細(xì)定位階段,僅保留圖6 中(i)圖像。圖7 表明經(jīng)本方法淘汰質(zhì)量受干擾的虹膜圖像后,所保留下來的虹膜圖像(i)可準(zhǔn)確獲得虹膜的邊緣。
表1 各步驟實(shí)驗結(jié)果
圖7 各步實(shí)驗效果圖
以上實(shí)驗仿真環(huán)境為Windows 10 系統(tǒng),配置為第7 代i5 處理器,主頻2.5GHz,8G 內(nèi)存;實(shí)驗平臺為MATLAB 2017。
利用基于Tenegrad 方法的粗評價算法與小波變換及BP 神經(jīng)網(wǎng)絡(luò)相結(jié)合的細(xì)評價算法對圖庫中900 張圖像進(jìn)行分類,其分類結(jié)果與主觀評價結(jié)果對比如表2 所示。
表2 各兩級質(zhì)量評價的分類結(jié)果單位:幅
為衡量所提粗評價方法的性能,計算質(zhì)量評價算法的真正類率(TPR, True Position Rate)、真負(fù)類率(TNR,true negative rate)和正確率(Accuracy),采用如下各式計算:
其中TP 表示將正樣本判定為正樣本,TN 表示將負(fù)樣本判定為負(fù)樣本,F(xiàn)P 表示將負(fù)樣本判定為正樣本,F(xiàn)N 表示將正樣本判定為負(fù)樣本。
粗細(xì)評價方法的性能比較如表3 所示??梢?,兩級質(zhì)量評價算法均取得良好的分類效果,說明本算法對虹膜圖像質(zhì)量評價的正確率能夠滿足篩選優(yōu)質(zhì)虹膜圖像進(jìn)行定位與身份識別的要求。
表3 粗細(xì)評價方法性能分析
為驗證本方法中質(zhì)量評價對虹膜定位算法準(zhǔn)確性及運(yùn)行效率的提升,對圖庫中的圖像分別進(jìn)行無質(zhì)量評價環(huán)節(jié)的虹膜定位和此處提出的級聯(lián)方法進(jìn)行對比,對比情況如圖8 和表4 所示。
圖8 定位算法對比圖
表4 定位準(zhǔn)確率與運(yùn)行時間對比
未經(jīng)質(zhì)量評價的虹膜圖庫中存在大量紋理不清晰或可見光鏡面反射等問題。由圖8 所示的實(shí)驗結(jié)果可見,如果不通過圖像質(zhì)量評價環(huán)節(jié),圖8(b)和圖8(c)中的非優(yōu)質(zhì)的圖像無法獲得準(zhǔn)確的虹膜區(qū)域定位結(jié)果,即便定位成功,其虹膜紋理也不足以滿足身份識別的要求,100 人的900 幅圖像定位準(zhǔn)確率僅為87%。所提方法通過圖像質(zhì)量評價可以獲得每人最高質(zhì)量的虹膜圖像,使得虹膜定位結(jié)果更加準(zhǔn)確,且可以獲得更加可靠的虹膜紋理信息,排除各種干擾,100 人定位準(zhǔn)確率可達(dá)到94%。如圖8(a)中的居中一幅圖像所示為定位不準(zhǔn)確的情況,這里雖然排除了干擾對定位精度的影響,卻沒能排除與虹膜區(qū)域類似的睫毛的影響,該問題還需在今后的研究工作中做進(jìn)一步改進(jìn)。同時,若不通過質(zhì)量評價環(huán)節(jié),100 人的全部9 張虹膜序列均完成定位,平均每人的定位時間為127s,加入質(zhì)量評價后,平均每人的定位時間為57s,運(yùn)行時間提高55%。
為驗證本算法在實(shí)際應(yīng)用場合中的適用性,使用iPhone 8 后置攝像頭拍攝一段視頻,截取9 幀圖像如圖9 所示。
圖9 視頻截取的9 幀圖像
第一級質(zhì)量評價之后,圖9 中(a)、(d)圖像因失焦嚴(yán)重被淘汰掉;在虹膜初定位階段,(b)、(e)圖像因虹膜結(jié)構(gòu)不完整被淘汰掉;在第二級質(zhì)量評價階段,圖9 中(c)、(f)、(g)、(h)圖像因紋理不理想被淘汰掉;在細(xì)定位階段,僅保留圖9 中(i)圖像。如圖10 所示為本方法在移動端拍攝的視頻中淘汰質(zhì)量受到光照干擾的虹膜圖像的流程。可見, 所保留下來的虹膜圖像(i)可準(zhǔn)確獲得虹膜的邊緣域定位。
圖10 手機(jī)拍攝實(shí)驗各步驟效果圖
為嘗試解決移動端可見光條件下虹膜圖像因存在光照不均、鏡面反射等干擾因素而難以準(zhǔn)確定位的問題,利用智能移動終端的視頻采集功能采集多幀虹膜序列圖像,設(shè)計一個同時完成兩級質(zhì)量評價與虹膜定位的級聯(lián)型方法。測試結(jié)果表明該方法能夠在移動端虹膜識別系統(tǒng)中在完成圖像質(zhì)量評價的同時對篩選出的優(yōu)質(zhì)圖像進(jìn)行虹膜定位。與傳統(tǒng)虹膜定位方法相比,本方法通過淘汰不滿足識別要求的虹膜圖像,提高了虹膜定位準(zhǔn)確率,也同時提高了系統(tǒng)運(yùn)行速度與運(yùn)行效率,具有一定的應(yīng)用價值。