李文潔 德秀麗 任福云 張文弘 公安部第一研究所
虹膜是位于人眼表面黑色瞳孔和白色鞏膜之間的圓環(huán)狀薄膜,虹膜在紅外光的照射下,呈現(xiàn)出豐富的視覺特征,如斑點、條紋、細絲、冠狀、隱窩等,這便構成了虹膜的紋理結構信息。虹膜具有唯一性、穩(wěn)定性、非侵犯性和天然防偽性的特點。
虹膜識別的方法最早由美國的眼科醫(yī)生Leonard Flom 和Arin Safir在1987年提出,英國劍橋大學Daugman博士在1993年提出的虹膜識別理論框架中將虹膜識別分為四個部分:虹膜定位、圖像歸一化、特征提取和匹配。在后續(xù)的研究工作中,大部分工作都是針對已有理論框架的各部分提出了改進性方法。在發(fā)展過程中產生了多個識別體系,如Wildes系統(tǒng)、Daugman系統(tǒng)、Boles系統(tǒng)、中科院虹膜系統(tǒng),在計算方法里最具代表性的兩種方法分別為Daugman 提出的積分微分算子法和Wildes提出的Hough變換法。近些年,隨著深度學習的興起,虹膜識別算法中加入了深度學習技術,與傳統(tǒng)采用數(shù)字圖像處理技術完成的虹膜識別相比,識別結果各有優(yōu)劣。
根據虹膜識別距離的不同,虹膜識別設備可分為近距離虹膜識別設備和中遠距離虹膜識別設備,根據虹膜識別系統(tǒng)中各模塊所處位置可分為一體式虹膜識別設備和分體式虹膜設備。
近距離虹膜識別設備的外形一般如圖2所示,這種虹膜識別設備也可稱為望遠鏡式虹膜識別設備,一般屬于分體式虹膜識別設備,即采集模塊位于望遠鏡式鏡筒部分,識別模塊的主要部分一般運行在與它相連的計算機上,它的特點是采用手持或支架方式固定,設備邊框與臉部貼合,內置補光燈進行補光。由于設備貼近人臉,在虹膜注冊和虹膜識別時采集攝像頭與人眼之間相對靜止,采集和識別距離相對固定,因此該類虹膜識別設備比較容易完成虹膜圖像的聚焦,一般較少出現(xiàn)離焦模糊和運動模糊問題,采集的虹膜圖像質量較高。
中遠距離虹膜識別設備的外形一般如圖3所示,一般采用變焦鏡頭,選配紅外體溫檢測模塊、身份證識讀模塊等,由紅外燈、白光燈進行補光。這類虹膜識別設備可以是一體式虹膜識別設備,也可以是分體式虹膜識別設備,即識別模塊可以運行在前端也可以運行在與它相連的計算機上,它的特點是識別距離較遠,識別時由于人眼距離采集模塊較遠,即使在被采集人高度配合的情況下,也可能會出現(xiàn)輕微晃動,造成采集虹膜圖像清晰度不高,因此為了在虹膜采集平面上聚焦清晰可能會配有測距模塊。目前,虹膜識別研究在逐步從“高配合、嚴篩選”(需要用戶高度配合、嚴格篩選圖像質量)向“低配合、高通量”(低用戶配合度、高通量識別)轉變。要實現(xiàn)這個轉變,除了從硬件設備著手提高硬件成像能力,還有一個重要途徑,就是降低識別系統(tǒng)對虹膜圖像質量的要求,增強處理“低質量”圖像(如低分辨率、模糊、遮擋、形變和光照不均勻等)的能力[1],低圖像質量下的虹膜識別成為學者們的研究課題[2]之一,全球著名科學出版集團Elsevier和葡萄牙Beira Interior大學曾發(fā)起并組織了低質量虹膜圖像處理算法國際競賽(Nosiy IrisChallenge Evaluation,NICE)。
不同的虹膜采集設備具有不同的傳感器、紅外模組、聚焦方法和虹膜質量分析算法,因此不同的虹膜采集設備采集到的虹膜圖像清晰度具有較大差異,這使得跨設備進行虹膜識別難度較大,這些來源廣泛、質量各異的虹膜圖像的識別問題就是多源異質虹膜圖像識別問題,虹膜圖像采集的質量將直接影響識別過程中特征提取與識別算法的準確性。因此為了保證虹膜圖像的質量,應在現(xiàn)有的國家標準和行業(yè)標準(詳見表1至表4)指導下對虹膜設備的產品質量及所采集的虹膜圖像的質量[3,4]把關。
?
?
?
?
從對虹膜識別技術評測標準的梳理可以看到,虹膜圖像質量評測在整個標準體系中的地位舉足輕重。其中,GB/T 26237.6-2014和GA/T 1286-2015規(guī)定了虹膜圖像數(shù)據格式,GB/T 33767.6-2018和GA/T 1429-2017規(guī)定了虹膜圖像質量,GB/T 33767.6-2018在6.2中規(guī)定的由單個圖像計算得到的要求性虹膜圖像質量指標共10項,包括可用虹膜區(qū)域、虹膜-鞏膜對比度、虹膜-瞳孔對比度等;GA/T 1429-2017標準中規(guī)定的需要量化的圖像質量指標共9項,包括灰度等級、灰度等級利用率、邊界裕量等。在這兩個標準中有7項指標盡管名稱略有差異但檢測對象相同,見表5,在檢測結果方面國家標準GB/T 33767.6-2018中在涉及到百分比計算時,均將小數(shù)乘以100%后的結果作為最終檢測值,結果不書寫百分號。這7項指標是在評價虹膜圖像質量時較常用的檢測指標,而GB/T 33767.6-2018在6.3中定義的正面注視-仰角、正面注視-方位角、運動模糊三項作為由單個圖像計算得到的推薦性虹膜圖像質量指標,在標準中并未給出明確計算方法,尚不適合作為虹膜圖像質量的檢測指標。
?
為了測試虹膜圖像質量,筆者在分析了現(xiàn)有的技術后完成了圖像質量分析軟件的架構設計,如圖4所示。
從圖中可以看到圖像質量測試軟件分為三個部分:
(1)OpenCV函數(shù)庫,該函數(shù)庫提供了豐富的圖像、矩陣處理函數(shù),可以方便地完成圖像的讀取和顯示、直方圖計算、線性和非線性濾波、膨脹、腐蝕等,為虹膜圖像的定位和虹膜圖像質量評測指標的計算提供了豐富的函數(shù)工具。
(2)算法模塊采用C++語言編寫,基于OpenCV函數(shù)庫,完成了虹膜的定位、分割、虹膜掩圖的計算,如圖5所示,并在此基礎上完成對虹膜圖像灰度等級、灰度等級利用率、虹膜半徑、虹膜采樣分辨率、瞳孔伸縮率、虹膜與鞏膜對比度、虹膜與瞳孔對比度、虹膜有效區(qū)域占比、邊界裕量的計算。該模塊最終編譯生成動態(tài)鏈接庫,向虹膜圖像質量軟件測試界面模塊提供接口函數(shù)。
(3)虹膜圖像虹膜圖像質量軟件測試界面模塊采用了C#語言,借助于WinForm框架類庫完成界面的編寫,并調用第二層算法模塊提供的動態(tài)鏈接庫接口函數(shù),展示虹膜圖像質量計算結果。
該軟件主要用于評測圖像質量,能夠給出虹膜-鞏膜對比度、虹膜-瞳孔對比度、灰度利用率、虹膜半徑、瞳孔擴張、邊緣預留度指標的檢測結果。
盡管近距離虹膜采集和識別設備具有采集圖像質量高、識別迅速的特點,但由于對被采集人的配合度要求高,不適于日常使用,而中遠距離虹膜識別設備在“低配合、高通量”的市場需求下,將會大量涌現(xiàn)。
疫情以來,帶口罩和無接觸需求進一步加速了虹膜識別的落地。但是虹膜識別技術在大規(guī)模應用前,仍然需要注意以下兩個問題:
雖然虹膜識別技術具有識別率高的特點,但為了能夠完成虹膜的準確識別,應在虹膜數(shù)據通過應用服務接口進行對接上傳時,注意去除重復虹膜圖像數(shù)據、去除圖像質量不高的虹膜數(shù)據以及存在疑問的虹膜數(shù)據,同時也需要配備工作人員進行必要的人工審核和管控。
2009年,印度政府開始建設包含所有國民生物特征信息的國家身份證項目,簡稱Aadhaar,該項目采集了每個公民的十指指紋、人像照片和雙眼虹膜等生物特征信息。該項目出現(xiàn)了嚴重的信息泄露,據報道稱,已有超過210家政府網站都曝光了Aadhaar 中公民的詳細信息;超過1億人的銀行賬戶和Aadhaar細節(jié)信息被泄露;政府的電子醫(yī)院數(shù)據庫也遭到入侵。所以盡管虹膜紋理信息具有天然防偽性,但在大規(guī)模使用前,應從數(shù)據采集、傳輸、存儲和使用等多方面加強虹膜圖像數(shù)據的信息安全。
從人配合機器到機器主動適應人是技術發(fā)展的必然趨勢,中遠距離虹膜識別設備在“低配合、高通量”的市場需求下將會大量涌現(xiàn),虹膜圖像分割和虹膜質量評判作為虹膜識別核心算法的重要組成部分,也必將隨著技術的更新不斷進步。