李 瑾, 李勝廣,3, 周千里
(1.公安部第一研究所, 北京 100048; 2.北京市公安局, 北京 100740;3.警務(wù)物聯(lián)網(wǎng)應(yīng)用技術(shù)公安部重點實驗室, 北京 100048)
當前,公安機關(guān)在反恐維穩(wěn)、群體性事件處置、涉訪處置、刑事犯罪嫌疑人辨識、旅客盤查等業(yè)務(wù)進行過程中,被檢查人身份信息的快速識別與核實一直是公安機關(guān)的重點工作。公安機關(guān)依靠居民身份證、指紋、人臉可解決大部分人員身份核查問題。但依然有部分人員為逃避檢查不帶身份證,或者人臉難以區(qū)分身份等問題,DNA核查需要更嚴格的應(yīng)用條件,公安機關(guān)急需一種人員快速、精準識別的方法,基于此需求,虹膜成為繼指紋、人臉后第三種可見的生物特征,成為識別應(yīng)用研究的熱點。
人的眼睛外觀由鞏膜、虹膜和瞳孔3部分構(gòu)成,見圖1。虹膜是位于鞏膜和瞳孔之間的環(huán)形區(qū)域,約占眼睛總面積的65%,包括凹點、放射紋、色素點和其他斑點等豐富的紋理信息。并且自8個月年齡開始,虹膜信息趨于穩(wěn)定,終身不再變化。
圖1 虹膜區(qū)域示意圖
虹膜識別技術(shù)最早在1987年由眼科專家FLOM和SAFIR提出并申請了相關(guān)核心專利,2005年FLOM和SAFIR的專利到期后,國內(nèi)外虹膜識別技術(shù)迅速發(fā)展起來。目前國內(nèi)虹膜識別設(shè)備主要在近紅外光(波長約為850 nm)下采集虹膜圖像,應(yīng)用距離多在60 cm以內(nèi),景深可達5~15 cm,對用戶配合度要求較低;也有應(yīng)用距離在60~150 cm范圍的虹膜識別設(shè)備,但對用戶配合度要求較高,成本也較高;應(yīng)用距離在150 cm以上的虹膜識別設(shè)備尚處于實驗室研究階段??梢哉f目前的采集識別技術(shù)和設(shè)備都已經(jīng)非常成熟,為公安虹膜識別規(guī)模化應(yīng)用奠定了堅實的技術(shù)基礎(chǔ)和設(shè)備基礎(chǔ)。
但目前虹膜識別僅僅在部分警種進行著局部應(yīng)用,難以實現(xiàn)如同指紋、人臉一樣的規(guī)?;瘧?yīng)用,主要原因有:
(1)目前沒有虹膜識別的統(tǒng)一服務(wù)平臺;
(2)目前沒有全國統(tǒng)一的虹膜原始圖像庫;
(3)大規(guī)模應(yīng)用還缺少相關(guān)的建庫、安全等標準。
虹膜規(guī)模化應(yīng)用架構(gòu)圖見圖2,包括分布到各應(yīng)用的前端采集設(shè)備、虹膜識別統(tǒng)一服務(wù)平臺、虹膜數(shù)據(jù)庫和各種具體落地應(yīng)用。
圖2 虹膜規(guī)模化應(yīng)用架構(gòu)圖
虹膜規(guī)?;瘧?yīng)用的步驟:首先,建設(shè)虹膜識別統(tǒng)一服務(wù)云平臺,并支持多種識別算法引擎,為全警種提供服務(wù)。其次,建立全國統(tǒng)一的虹膜原始圖像數(shù)據(jù)庫,依據(jù)圖像質(zhì)量標準各地采集到圖像經(jīng)檢查合格后入庫。最后,在重點場所建立試點,加快面向公共安全應(yīng)用的產(chǎn)品定制和應(yīng)用推廣,結(jié)合公安部門的應(yīng)用需求,及時開展規(guī)模化應(yīng)用,為反恐和社會治安發(fā)揮重要作用。
虹膜統(tǒng)一服務(wù)平臺定位為運行在公安信息網(wǎng)內(nèi)的高性能身份鑒別平臺,以虹膜識別技術(shù)為核心,以公安內(nèi)部網(wǎng)絡(luò)和Internet網(wǎng)絡(luò)為信息交換平臺,中心數(shù)據(jù)倉庫和分布式數(shù)據(jù)庫相結(jié)合,實現(xiàn)身份認證。架構(gòu)如圖3所示,分成服務(wù)器端、Client端和瀏覽器端3部分功能模塊。
服務(wù)器端完成的工作:前端上傳的虹膜圖像入庫;虹膜特征點提取并生成模板數(shù)據(jù);提供各數(shù)據(jù)庫之間、數(shù)據(jù)庫與便攜式虹膜識別設(shè)備之間的數(shù)據(jù)傳輸、交換協(xié)議;虹膜設(shè)備、用戶的身份授權(quán)等。
Client端完成虹膜檢測、分割、歸一化和虹膜特征提取等處理工作。虹膜檢測是指檢測當前輸入圖像中是否含有虹膜,以及虹膜在圖像中的位置和大小。虹膜圖像分割是指定位虹膜的內(nèi)外邊界并檢測可能的遮擋物,排除瞳孔、鞏膜、眼皮、睫毛、光斑等非虹膜紋理圖像區(qū)域?qū)缒ぬ卣魈崛〉挠绊?。虹膜圖像歸一化則是指將不同的虹膜圖像從直角坐標系映射到極坐標系下固定大小的矩形中,消除虹膜大小和形變對識別性能的影響。從歸一化后的虹膜圖像中抽取魯棒的個性化信息,并且用計算機能夠存儲和讀取的格式進行編碼形成虹膜模板。
瀏覽器端主要用于人機界面,完成數(shù)據(jù)展示、維護管理、超級用戶管理等功能。
虹膜建庫是公安虹膜識別規(guī)?;瘧?yīng)用的堅實基礎(chǔ),目標是為各級公安機關(guān)提供虹膜身份核驗的統(tǒng)一出入口。前端采集到各類人員的虹膜數(shù)據(jù)按照標準圖像格式存儲入庫,并附加虹膜算法廠商標識和虹膜特征模板,這樣既兼顧不同識別設(shè)備的互用性,也兼顧到虹膜識別應(yīng)用的效率。統(tǒng)一服務(wù)為后續(xù)各類規(guī)?;瘧?yīng)用提供統(tǒng)一出口。虹膜建庫包括以下幾個環(huán)節(jié)。
圖3 虹膜統(tǒng)一服務(wù)平臺系統(tǒng)架構(gòu)圖
(1)重點人員虹膜數(shù)據(jù)庫:建立全國的中心虹膜數(shù)據(jù)庫,在中心庫中按照各地市單位可以建立二級庫。并按照個人的身份信息對虹膜數(shù)據(jù)進行有效的分類管理。分類包括個人基本信息以及個人歷史紀錄等各種信息。同時,考慮到虹膜識別與人臉識別的互補性與緊密關(guān)聯(lián)性。在虹膜識別庫建庫時預(yù)留下人臉建庫的接口與空間。數(shù)據(jù)庫建成后,在全國范圍內(nèi)形成有效的犯罪嫌疑人檢索、查詢系統(tǒng),有效杜絕嫌疑人假冒身份的現(xiàn)象。
(2)數(shù)據(jù)庫采集范圍:各地公安局、分局、派出所、監(jiān)獄等公安特殊區(qū)域的犯罪嫌疑人。
(3)虹膜采集:采用固定式/便攜式虹膜識別設(shè)備固定場所或者現(xiàn)場采集。并通過虹膜圖像質(zhì)量評估模塊,對不同采集設(shè)備捕獲的靜態(tài)虹膜圖像質(zhì)量進行把關(guān),保證入庫圖像的質(zhì)量。
(4)傳輸方式:通過公安信息網(wǎng)/互聯(lián)網(wǎng)絡(luò)/便攜式存儲媒介,按照安全模式,傳輸、傳送圖像特征到中心數(shù)據(jù)庫。
虹膜圖像質(zhì)量評價技術(shù)和系統(tǒng)在整個虹膜識別應(yīng)用系統(tǒng)中是入庫虹膜圖像質(zhì)量的重要把控點,但虹膜圖像質(zhì)量的最終提高和應(yīng)用系統(tǒng)性能的提高不僅僅與質(zhì)量評價相關(guān),還與虹膜圖像的采集過程及數(shù)據(jù)庫的建設(shè)密切相關(guān)。建庫用虹膜圖像質(zhì)量評價算法與傳統(tǒng)的虹膜圖像質(zhì)量算法不同。通常,虹膜采集設(shè)備中的質(zhì)量評價算法面向一個虹膜圖像序列,并且與自身的識別算法密切相關(guān)。而建庫用虹膜圖像質(zhì)量評價算法旨在保障入庫虹膜圖像的質(zhì)量,面向不同的虹膜采集設(shè)備獲得的靜態(tài)虹膜圖像,并且數(shù)據(jù)量巨大。
虹膜圖像質(zhì)量與虹膜識別性能密切相關(guān),NIST組織的IQCE測試表明,應(yīng)用圖像質(zhì)量在前15%的虹膜圖像進行識別比圖像質(zhì)量在后15%的虹膜圖像,識別性能能夠高出10倍。因而,在建立虹膜圖像數(shù)據(jù)庫時,保證入庫圖像的質(zhì)量,對于后續(xù)的識別應(yīng)用具有非常關(guān)鍵的作用。見圖4。
影響虹膜識別性能的質(zhì)量因素有多種,包括虹膜圖像分辨率、瞳孔面積、眼瞼遮擋、散焦模糊、運動模糊、光照、光斑等。如何檢測這些質(zhì)量因素,并根據(jù)各分量因素建立統(tǒng)一的質(zhì)量分數(shù)是本課題需要重點攻關(guān)的一項研究內(nèi)容。
依據(jù)《GAT1429—2017安防虹膜識別應(yīng)用圖像技術(shù)要求》中規(guī)定的全部虹膜圖像量化指標及其限制計算所得。其中,全部虹膜圖像量化指標共10個,包括圖像格式、灰度等級、灰度等級利用率、虹膜半徑、虹膜采樣分辨率、瞳孔伸縮率、虹膜與鞏膜對比度、虹膜與瞳膜對比度、有效區(qū)域占比和邊界裕量。
這10個量化指標具體描述如圖5所示。
圖5 虹膜圖像量化指標
①圖像格式:虹膜圖像格式應(yīng)為RAW、BMP、JPEG、JPEG2000和PNG中的任意一種。
②灰度等級:虹膜圖像應(yīng)為灰度圖像,0表示純黑。每個像素點位深度應(yīng)不小于8位,即圖像中每個像素點灰度量化級應(yīng)不小于256級。
③灰度等級利用率:使用圖像灰度直方圖的信息熵來衡量灰度等級利用率,單位為比特。虹膜圖像的灰度等級利用率應(yīng)不小于6比特,圖像灰度直方圖分布越均勻,圖像富含的信息量越高,灰度等級利用率越高。按公式(1)計算灰度等級利用率:
(1)
公式(1)中:gu為灰度等級利用率;pi為圖像中灰度為i的像素點個數(shù)除以圖像總的像素點個數(shù)。
④虹膜半徑:虹膜半徑應(yīng)不小于80個像素。
⑤虹膜采樣分辨率:虹膜采樣分辨率應(yīng)不小于16 pixel/mm。
⑥瞳孔伸縮率:瞳孔伸縮率應(yīng)大于20%且小于70%。瞳孔半徑和虹膜半徑標注見圖6。按公式(2)計算瞳孔伸縮率:
(2)
其中:Rpi為瞳孔伸縮率;rp為瞳孔半徑;ri為虹膜半徑。
圖6 瞳孔伸縮率和虹膜有效占比
⑦虹膜有效區(qū)域占比:虹膜外邊界的擬合圓到圖像上邊界、下邊界、左邊界和右邊界的距離應(yīng)分別大于0.2ri、0.2ri、0.6ri和0.6ri。
⑧虹膜與鞏膜對比度:虹膜與鞏膜對比度應(yīng)不小于5。
圖7中所標識的區(qū)域為:區(qū)域A是以虹膜中心為圓心、內(nèi)圓半徑等于1.1ri、外圓半徑等于1.2ri的環(huán)形區(qū)域。區(qū)域B是以虹膜中心為圓心、內(nèi)圓半徑等于(ri+rp)/2、外圓半徑等于0.9ri的環(huán)形區(qū)域。所標識的區(qū)域為:區(qū)域C是以瞳孔中心為圓心、半徑等于0.8rp的圓形區(qū)域。區(qū)域D是以瞳孔中心為圓心、內(nèi)圓半徑等于1.1rp、外圓半徑等于(ri+rp)/2的環(huán)形區(qū)域。
圖7 虹膜與鞏膜對比度
按公式(3)計算虹膜與鞏膜對比度:
(3)
式中:ctis為虹膜與鞏膜對比度;vs為區(qū)域A內(nèi)未被眼皮、睫毛和光斑等非虹膜物體遮擋的像素點灰度中值;via為區(qū)域B內(nèi)未被眼皮、睫毛和光斑等非虹膜物體遮擋的像素點灰度中值;vp為區(qū)域C內(nèi)未被眼皮、睫毛和光斑等非虹膜物體遮擋的像素點灰度中值。
⑨虹膜與瞳孔對比度:應(yīng)不小于30。按照下面公式計算虹膜與瞳孔對比度:
(4)
式中:ctip為虹膜與瞳孔對比度;vp為區(qū)域C 內(nèi)未被眼皮、睫毛和光斑等非虹膜物體遮擋的像素點灰度中值。vib為區(qū)域D內(nèi)未被眼皮、睫毛和光斑等非虹膜物體遮擋的像素點灰度中值。
⑩虹膜有效區(qū)域占比:應(yīng)大于50%。按公式(5)計算虹膜有效區(qū)域占比:
(5)
公式(5)中:Au為有效虹膜區(qū)域占比;Niris為虹膜環(huán)形區(qū)域的像素點個數(shù),虹膜環(huán)形區(qū)域由虹膜內(nèi)邊界擬合圓和外邊界擬合圓確定。Nvalid為虹膜環(huán)形區(qū)域中,未被眼皮、睫毛和光斑遮擋的有效虹膜像素個數(shù)。
安全可信的身份識別認證需求急速增長,但對生物特征圖像和特征模板本身安全性的重視還遠遠不夠。包括虹膜特征在內(nèi)的生物特征具有終身不變的特性,這就預(yù)示著其一旦丟失,就意味著永久地失去,沒有辦法重新修改或者發(fā)布模板來彌補損失。這些安全性威脅的存在,正在嚴重制約著基于生物特征識別身份認證技術(shù)的進一步發(fā)展。
目前虹膜應(yīng)用過程中,安全隱患主要表現(xiàn)為虹膜原始圖像的泄露和虹膜特征模板的圖像復原,具體如下。
(1)虹膜原始圖像的泄露:公安領(lǐng)域虹膜應(yīng)用過程中的采集、傳輸、入庫、比對等各個環(huán)節(jié),虹膜原始圖像是個人隱私數(shù)據(jù)的集中體現(xiàn),存在隱私泄露的風險。當發(fā)生大面積泄露時,則會造成嚴重的社會影響,印度虹膜身份證項目中就出現(xiàn)過大量公民虹膜數(shù)據(jù)泄露事件。
(2)虹膜特征模板的圖像復原:虹膜特征模板通過某些算法,恢復成可供其他應(yīng)用的虹膜圖像,雖然這個復原后的圖像與原始圖像不完全相同,但同樣可以用于虹膜識別或者其他虹膜算法。
對于提到的虹膜應(yīng)用安全隱患,必須研究強有力基于密碼學的原始圖像和特征模板保護方案對虹膜數(shù)據(jù)進行安全性保護,以滿足用戶在身份采集、存儲和認證過程中對隱私保護的安全性需求。虹膜特征的終身不變性和系統(tǒng)虹膜圖像和特征數(shù)據(jù)庫中的海量數(shù)據(jù)都對該技術(shù)的研究提出了極大挑戰(zhàn),尤其是在認證技術(shù)諸如正確匹配率、錯誤拒絕率、認證速度等安全性目標的苛刻要求下,更是對該技術(shù)是否能實現(xiàn)進一步發(fā)展的嚴峻考驗。
對于生物特征安全,國內(nèi)外研究機構(gòu)主要分為數(shù)據(jù)加密和數(shù)據(jù)混淆兩大技術(shù)流派:基于數(shù)據(jù)加密的方法是將密鑰和圖像/特征信息相綁定,生成密文進行傳輸,起到隱私數(shù)據(jù)保護的目的,但涉及到對稱密鑰分發(fā)的問題。數(shù)據(jù)混淆主要表現(xiàn)為基于模板形變技術(shù)、隨機數(shù)會話多因子混淆技術(shù)、數(shù)字水印、生物特征數(shù)據(jù)鑲嵌等。兩種方法皆對虹膜采集、傳輸、比對的效率造成一定的損失。
通過已經(jīng)建好的虹膜數(shù)據(jù)庫,對虹膜識別率、拒識率(FRR)、誤識別率(FAR)和正確拒識率進行測試。從虹膜統(tǒng)一服務(wù)平臺選取測試圖像18 941幅,分成兩個目錄:A目錄10 506,B目錄8 435(B目錄作為比對目錄,圖像質(zhì)量比A目錄差)。首先將BMP圖像處理成8位RAW圖像,然后將RAW圖像生成模板,存儲到文件中。全部模板生成后,將A、B兩目錄的模板兩兩比對,得到比對相似度原始記錄文件,共產(chǎn)生比對記錄8千多萬條,通過對比對結(jié)果進行統(tǒng)計,得出ROC原始結(jié)果統(tǒng)計文件,通過對原始記錄數(shù)量進行百分數(shù)處理,得到ROC百分比文件,進一步可以將ROC百分比文件中的數(shù)據(jù)繪制成圖顯示。百分比統(tǒng)計結(jié)果如圖8所示,其中橫軸為相似度閾值,從0~100,縱軸為各統(tǒng)計數(shù)據(jù)的百分比。由圖8可知,在誤識別率為0.000 09%時,識別率為99.573 2%。其中綠色為識別率的百分數(shù),紫色為誤識別(FAR)的百分數(shù),紅色是拒識率(FRR)的百分數(shù)。
圖8 虹膜ROC百分比
公安領(lǐng)域應(yīng)用中,結(jié)合作者項目組的實踐經(jīng)驗,虹膜采集應(yīng)采用雙眼虹膜采集設(shè)備,同時對被采集人員兩只眼睛的虹膜圖像進行采集。采集過程中應(yīng)針對采集到的虹膜圖像進行質(zhì)量檢測,確保入庫的虹膜圖像質(zhì)量能夠滿足后續(xù)一比一確認和一比多辨認等應(yīng)用場景的需要。對滿足質(zhì)量要求的虹膜圖像,根據(jù)相關(guān)標準進行圖像的裁剪和壓縮,然后所有需要存儲的圖像再經(jīng)過安全手段加密后通過公安網(wǎng)上傳至數(shù)據(jù)庫中進行存儲。
虹膜圖像質(zhì)量應(yīng)依次通過3種手段進行保障:
(1)采集設(shè)備質(zhì)量自檢;
(2)利用第三方統(tǒng)一的虹膜質(zhì)量評測軟件進行自動檢測,并顯示檢測結(jié)果;
(3)現(xiàn)場采集人員根據(jù)虹膜采集指引進行最終的圖像質(zhì)量評判,經(jīng)過現(xiàn)場采集人員確認的虹膜圖像才能夠入庫存儲。
虹膜信息采集時會面臨以下技術(shù)問題。
(1)患有眼疾等特殊人群的虹膜采集:絕大部分人的虹膜圖像質(zhì)量能夠符合特征提取要求,少部分人因患有嚴重眼疾等原因?qū)е潞缒D像質(zhì)量差,不符合特征提取要求,或者無法采集虹膜。
(2)技術(shù)標準的確定和測試方法:不同虹膜識別算法,對于外界環(huán)境、配合程度、圖像格式和質(zhì)量等多方面都有不同的要求,故必須通過算法評測標準進行約束,對不同算法、采集設(shè)備需通過第三方的檢測,才能入圍公安應(yīng)用。
(3)虹膜數(shù)據(jù)的互用性:因為虹膜識別算法的不同,虹膜采集設(shè)備采集到的虹膜特征模板不能互用,虹膜數(shù)據(jù)庫以原始圖像+虹膜算法廠家標識+虹膜特征模板的方式,支撐不同采集設(shè)備的互用性。
虹膜識別技術(shù)是生物特征識別領(lǐng)域的新興技術(shù),被廣泛認為是21世紀最具有發(fā)展前途的生物識別技術(shù)。經(jīng)過十余年的技術(shù)積累和小規(guī)模應(yīng)用示范,虹膜識別技術(shù)已經(jīng)處于大規(guī)模應(yīng)用前的最后沖刺階段。這更需要虹膜領(lǐng)域相關(guān)產(chǎn)、學、研、用機構(gòu)更加努力,更加團結(jié),發(fā)揮各自的優(yōu)勢,將整個虹膜產(chǎn)業(yè)做大做強,真正實現(xiàn)公安領(lǐng)域的落地應(yīng)用。