丁增喜 王旭 祁衛(wèi)煒
1.證件防偽公安部重點實驗室 2.公安部第一研究所
在各種人體生物特征中,指紋識別由于其具有唯一性、穩(wěn)定性、識別率高等特點,在目前使用的各種生物特征識別技術(shù)中成為最為成熟、最為廣泛的生物特征識別技術(shù)[1]。
指紋識別技術(shù)有兩種應(yīng)用模式:一是1:1的認(rèn)證,二是1:N的辨識。目前最多的應(yīng)用場景是1:N辨識,尤其是在刑偵領(lǐng)域中,1:N辨識功能對于案件的偵破有著很大的幫助。對于指紋識別技術(shù)來說,無論1:1認(rèn)證還是1:N辨識都是圍繞如何提高識別準(zhǔn)確性和識別的速度來進(jìn)行的,其研究內(nèi)容包括指紋圖像增強、指紋特征提取、指紋特征匹配以及指紋分類等算法。而這些指紋識別算法無論是警用還是民用,都需要基于一定容量的指紋庫進(jìn)行性能測試,指紋庫中數(shù)據(jù)組織的分布規(guī)則以及數(shù)據(jù)庫容量的大小都對指紋識別算法的性能產(chǎn)生一定的影響。此外,隨著指紋識別技術(shù)的大規(guī)模應(yīng)用,國內(nèi)外市場上指紋識別類產(chǎn)品種類越來越多,其性能指標(biāo)、技術(shù)參數(shù)參差不齊,各種產(chǎn)品的宣傳往往偏重商業(yè)目的,這些問題為公安行業(yè)以及其他指紋識別技術(shù)應(yīng)用部門在產(chǎn)品的選擇上造成了困難,迫切需要相關(guān)部門建立評價體系對指紋識別類產(chǎn)品進(jìn)行客觀的性能評測,為應(yīng)用部門提供科學(xué)合理的選擇依據(jù)。而指紋測試樣本庫是評測指紋識別算法性能的重要依據(jù),只有基于大規(guī)模指紋測試樣本數(shù)據(jù)才能真實有效的完成指紋識別算法核心性能指標(biāo)的評測[2]。如何合理、高效、快捷地完成指紋測試樣本的采集將是指紋測試評測首先面臨的重要問題,而完成這項工作需要解決測試庫建庫規(guī)則、采集設(shè)備接口、采集模式設(shè)計、系統(tǒng)架構(gòu)方式等多個技術(shù)難題。
首先,需要確立測試樣本庫的建庫規(guī)則。我國幅員遼闊、人口眾多,是一個多民族聚居的地區(qū)。居民在聚居區(qū)域、民族、性別、年齡以及職業(yè)等多個方面具有一定的分布特點,這些因素對指紋的質(zhì)量均具有一定程度的影響。因此在測試樣本庫建庫之前就要制定一套規(guī)則,使測試樣本庫中指紋的分布符合我國現(xiàn)有國情。
其次,近年來我國指紋生物特征技術(shù)發(fā)展迅速。市場上的采集設(shè)備品種繁多,接口類型千差萬別。各個廠家設(shè)備應(yīng)用領(lǐng)域各不相同,應(yīng)用方式千差萬別,采集設(shè)備的接口和采集的輸出結(jié)果也沒有得到統(tǒng)一。因此在采集前如果不能很好的統(tǒng)一接口和輸出結(jié)果,會為采集工作增添很多困難,也會為進(jìn)一步影響指紋識別算法的評測工作。此外,由于采集系統(tǒng)需要同時掛接多款采集設(shè)備,在系統(tǒng)設(shè)計時還要確保多款采集設(shè)備在實時調(diào)用時互不影響。
最后,一般情況下指紋采集工作需在多個采集地點同時進(jìn)行,因此在系統(tǒng)設(shè)計和采集方式選擇上如何讓工作人員能夠方便操作,實現(xiàn)快速、準(zhǔn)確、高效地采集到符合要求的指紋樣本也是需要解決的問題。
從測試樣本庫建庫角度出發(fā),為了建立一套客觀、科學(xué)、完整的指紋應(yīng)用技術(shù)評價體系,需要針對指紋應(yīng)用人群分布特點采集特定人群的指紋樣本。以居民身份證指紋測試樣本庫建庫為例,該項工作目標(biāo)為選出全國范圍應(yīng)用的指紋識別算法,因此測試庫設(shè)計時,參考我國第六次全國人口普查數(shù)、《2009年度人力資源和社會保障事業(yè)發(fā)展統(tǒng)計公報》等文獻(xiàn)資料,編制建庫規(guī)則(如圖1所示)。測試庫建庫規(guī)則按照性別、產(chǎn)業(yè)、民族以及地域/環(huán)境等五個方面進(jìn)行屬性劃分,其中年齡按照小于15歲、15-59歲以及大于等于60歲三個年齡段進(jìn)行劃分。在職業(yè)上按照第一產(chǎn)業(yè)、第二產(chǎn)業(yè)以及第三產(chǎn)業(yè)三部分進(jìn)行分類,這樣就很好地涵蓋了我國當(dāng)前多種職業(yè),具有很好的代表性[3]。建庫樣本規(guī)則的確定為指紋測試樣本采集工作奠定了基礎(chǔ)。
針對指紋采集設(shè)備品種多、可選范圍大等情況,需參考市場占有率及設(shè)備試用情況,從各類指紋采集設(shè)備中選擇了最有代表性的產(chǎn)品用于樣本采集。為了統(tǒng)一指紋采集設(shè)備接口,便于將來系統(tǒng)調(diào)用,系統(tǒng)設(shè)計時需參考已得到廣泛應(yīng)用的行業(yè)標(biāo)準(zhǔn),例如《活體指紋圖像應(yīng)用程序接口規(guī)范第1部分:采集設(shè)備》[4,5]、《指紋采集器接口規(guī)范》等,以用于指導(dǎo)和規(guī)范參與指紋測試樣本采集的采集設(shè)備動態(tài)庫接口,只有符合了該接口規(guī)范的采集設(shè)備才能夠接入采集系統(tǒng);通過這種方式能很好地解決采集設(shè)備接口不統(tǒng)一的問題。
在指紋測試樣本采集系統(tǒng)設(shè)計時,對指紋采集器廠家提供的接口文件格式,均要求以Windows動態(tài)庫格式提供。Windows動態(tài)庫格式是微軟提出的一種標(biāo)準(zhǔn)函數(shù)調(diào)用格式,它可以將共享的程序代碼編譯成獨立模塊以供調(diào)用,庫函數(shù)的任何修改都不對應(yīng)用程序產(chǎn)生影響。通過對動態(tài)庫的動態(tài)調(diào)用,操作人員可以決定在何時加載和釋放指紋采集設(shè)備,使各個設(shè)備之間的加載和釋放不存在任何影響。在設(shè)計開發(fā)的時候,系統(tǒng)列出廠家設(shè)備名稱,通過選擇某個廠家,系統(tǒng)自動調(diào)用該廠家對應(yīng)采集動態(tài)庫,激活設(shè)備進(jìn)行指紋采集。而調(diào)用該動態(tài)庫時候,會自動釋放上次調(diào)用的動態(tài)庫,使多個設(shè)備在調(diào)用過程中互不影響。對采集設(shè)備按照統(tǒng)一的規(guī)則進(jìn)行編號和命名,如圖2所示。
為了滿足指紋測試樣本的采集數(shù)量大、次數(shù)多、速度快、隨機性高等特點,在采集系統(tǒng)中設(shè)計了自動采集模式。廠家要根據(jù)自動采集函數(shù)接口要求,提供設(shè)備采集動態(tài)庫。系統(tǒng)對質(zhì)量滿足基本要求的指紋圖像自動采集入庫保存。此外,為了防止在采集過程中有些指紋圖像由于傷病、磨損、脫皮等情況而導(dǎo)致無法自動采集的情況下,系統(tǒng)又提供了人工采集模式,可以實現(xiàn)人工手動實時采集指紋圖像并入庫保存。系統(tǒng)啟動成功并選取設(shè)備之后會自動進(jìn)入自動采集模式,在規(guī)定的時間內(nèi)自動采集按壓的手指指紋圖像,在系統(tǒng)連續(xù)采集規(guī)定數(shù)量的指紋圖像后由操作人員核驗采集圖像質(zhì)量然后提交保存,采集界面如圖3所示。采集后在未提交前如果發(fā)現(xiàn)某一幅指紋圖像質(zhì)量不符合基本要求,則實時選取該幅指紋圖像進(jìn)行再次采集,而不用影響其他幾幅圖像。在采集過程中如果有些手指指紋圖像質(zhì)量較差,指紋采集設(shè)備無法自動成功采集,可以選擇人工采集模式進(jìn)行手動采集。通過人工采集模式可以強制采集一幅指紋圖像,從而確保了采集到的指紋測試樣本的真實性。
指紋測試樣本的采集可以采取多種系統(tǒng)架構(gòu)方式,既可以聯(lián)網(wǎng)集中采集,也可以脫機移動采集。聯(lián)網(wǎng)集中采集將采集機器集中聯(lián)網(wǎng),采集數(shù)據(jù)集中統(tǒng)一入庫。這種方式采集效率高、速度快,采集的指紋數(shù)據(jù)記錄編號連續(xù),便于后期處理。每次采集的指紋數(shù)據(jù)自動進(jìn)入統(tǒng)一的數(shù)據(jù)庫,不需要后期的數(shù)據(jù)歸納整理。此外,每臺機器也可以不必掛接所有指紋采集設(shè)備,系統(tǒng)負(fù)荷壓力小,但是這種架構(gòu)方式只適合采集地點固定、采集時間相對集中的情況。
而脫機移動采集方式卻可以在多個地點同時進(jìn)行指紋測試樣本的采集。通過對采集設(shè)備的接口以及對設(shè)備采集庫提供方式進(jìn)行統(tǒng)一,每臺采集系統(tǒng)均可以掛接所有指紋采集設(shè)備,并可以在采集設(shè)備間實時切換進(jìn)行樣本采集。這樣每臺采集系統(tǒng)都可以成為一臺采集服務(wù)器,可以實現(xiàn)多臺采集系統(tǒng)在多個采集點進(jìn)行集中采集,多臺采集系統(tǒng)之間互為冗余。這種采集方式存在的問題是要在采集前根據(jù)預(yù)先規(guī)定的采集人數(shù)需要事先為每個采集地區(qū)的分配采集編號范圍。在采集結(jié)束后需要對每臺機器中采集的數(shù)據(jù)進(jìn)行整理集中。脫機移動采集方式如圖4所示。
此外,在采集質(zhì)量上控制上,通過培訓(xùn)講解和實際操作等方式,使操作人員快速掌握指紋測試樣本采集系統(tǒng)的使用,避免由于主觀因素而導(dǎo)致采集指紋測試樣本圖像下降的問題。圖5給出了幾種不合格指紋圖像的情況,如采集指紋圖像面積過小、圖像太暗或太淺、手指按壓方向錯誤以及采集部位錯誤等。這樣盡可能確保指紋測試樣本的質(zhì)量,減少不必要干擾因素對測試樣本庫圖像質(zhì)量的影響。
指紋測試樣本的采集是一項復(fù)雜工作,本文從指紋測試樣本采集的背景和目的出發(fā),對指紋測試樣本采集所面臨的問題以及需要解決的幾項關(guān)鍵技術(shù)進(jìn)行詳細(xì)介紹。通過筆者及同事多年多地的采集實踐證明,按本文設(shè)計的指紋測試樣本采集系統(tǒng)在應(yīng)用上是成功高效的,無論是刑偵用大面積滾動指紋測試樣本采集,還是證件用平面指紋測試樣本的采集,都可以順利完成。這不僅為指紋識別算法的測試工作提供強有力的支持,同時也為相關(guān)類似項目的設(shè)計和開發(fā)提供了有益的參考。
[1] 田捷,楊鑫, 等.生物特征識別理論與應(yīng)用[M].北京:清華大學(xué)出版社,2009.
[2] GA/T 894.6-2010, 安防指紋識別應(yīng)用系統(tǒng) 第6部分:指紋識別算法評測方法.
[3] GA 1012-2012, 居民身份證指紋采集和比對技術(shù)規(guī)范.
[4] GA/T 893-2010, 安防生物特征識別應(yīng)用術(shù)語.
[5] GA/T 626.1-2010, 活體指紋圖像應(yīng)用程序接口規(guī)范 第1部分:采集設(shè)備.