朱海榮
摘 要 活體檢測(cè)是一種驗(yàn)證對(duì)象真實(shí)生理特征的技術(shù),隨著人臉識(shí)別技術(shù)在支付、門禁、移動(dòng)設(shè)備等的廣泛應(yīng)用,人們對(duì)人臉識(shí)別的安全性也提出了更高的要求,活體檢測(cè)技術(shù)也越來(lái)越被重視,其可有效抵御屏幕錄制的照片、視頻、打印的照片、立體假面等攻擊手段,甄別欺詐行為,保障用戶利益。本文通過(guò)深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)(CNN)的分類網(wǎng)絡(luò),提供一種簡(jiǎn)單高效、識(shí)別率高、可擴(kuò)展行強(qiáng)的靜默活體檢測(cè)方法。并提出了一種小區(qū)域特征對(duì)齊圖像提高活體檢測(cè)準(zhǔn)確度和魯棒性的方法。
關(guān)鍵詞 活體檢測(cè);深度學(xué)習(xí);靜默;特征對(duì)齊
活體檢測(cè)技術(shù)早期采用配合式檢測(cè)方法,需要檢測(cè)體按照提示配合眨眼、張嘴、搖頭、點(diǎn)頭等組合動(dòng)作,使用人臉關(guān)鍵點(diǎn)定位技術(shù)判斷動(dòng)作的正確性來(lái)決定是否為活體操作,進(jìn)一步?jīng)Q定終止或繼續(xù)人臉識(shí)別過(guò)程。此方式的缺點(diǎn):檢測(cè)時(shí)間長(zhǎng),對(duì)檢測(cè)體要求高,不適應(yīng)門禁、閘機(jī)等要求快速完成檢測(cè)的場(chǎng)景。靜默活體檢測(cè)不需要煩瑣的臉部動(dòng)作配合,根據(jù)真實(shí)人臉成像和照片、屏幕、面具成像的差別判斷是否活體。照片、屏幕成像會(huì)出現(xiàn)摩爾紋,并且紋理和光線反射率和真實(shí)人臉差異較大,通過(guò)讓機(jī)器捕捉學(xué)習(xí)這個(gè)特性準(zhǔn)確完成活體檢測(cè),并且每幀圖像都可檢測(cè)得到結(jié)果,檢測(cè)過(guò)程短、實(shí)時(shí)性強(qiáng)。
1設(shè)計(jì)思路
為了讓機(jī)器學(xué)習(xí)到偽造圖像和真實(shí)活體圖像的區(qū)別,而不受人臉個(gè)體差異的影響,提高魯棒性,需要把學(xué)習(xí)和檢測(cè)的圖像特征對(duì)齊、減少干擾內(nèi)容、有較多的可用特征、減小圖像區(qū)域。
1.1 圖像特征對(duì)齊
活體檢測(cè)圖像位置一致,獲取人臉相同區(qū)域圖像,使機(jī)器學(xué)習(xí)的特征單一,學(xué)習(xí)收斂速度快,特征提取準(zhǔn)確。獲取高度為雙眼中較高眼睛的中心位置到嘴巴中心、寬度為左眼中心到右眼中心的圖像作為訓(xùn)練和檢測(cè)圖像。
1.2 減少干擾內(nèi)容
活體檢測(cè)圖像減少人臉干擾圖像內(nèi)容,減少因個(gè)體差異而影響檢測(cè)結(jié)果,盡量減少眼、鼻、嘴等個(gè)體差異圖像內(nèi)容,保留皮膚紋理等個(gè)體差異小的圖像特征。
1.3 有較多的可用特征
活體檢測(cè)圖像要保留較多的可用特征,比如摩爾紋、反光、紋理等可用作檢測(cè)判斷的特征盡量保留,提高機(jī)器學(xué)習(xí)準(zhǔn)確度[1]。
1.4 小區(qū)域圖像
小區(qū)域圖像在經(jīng)過(guò)預(yù)處理縮小圖像和后期的池化層后保留較完整的可用特征。
2訓(xùn)練過(guò)程
2.1 模型設(shè)計(jì)
模型輸入為3層24寬24高的RGB圖片輸入,歸一化到[-1,1]之間,進(jìn)過(guò)4個(gè)卷積層加兩個(gè)全連接層,輸出一個(gè)代表活體和非活體的二分類張量。使用Softmax loss作為損失估算函數(shù),增加Accuracy進(jìn)行準(zhǔn)確率測(cè)試。
2.2 素材采集
將視頻或者圖片通過(guò)人臉檢測(cè)獲取人臉和關(guān)鍵點(diǎn)位置,使用雙眼位置和嘴的中心位置,獲取高度為雙眼中較高眼睛的中心位置到嘴巴中心、寬度為左眼中心到右眼中心的圖像作為訓(xùn)練和檢測(cè)圖像。按照真實(shí)人臉和偽造人臉?lè)诸惐4娌杉膱D像。
2.3 預(yù)處理
將采集的圖像縮放(Resize)處理到3x24x24,并歸一化數(shù)據(jù)到[-1,1]之間,保存到各自的分類目錄中。
2.4 訓(xùn)練
將分類保存的數(shù)據(jù)集按照7:3的比例分成訓(xùn)練集和測(cè)試集,使用較為流行的深度學(xué)習(xí)訓(xùn)練工具Caffe、TensorFlow或者Pytorch訓(xùn)練。訓(xùn)練中可以發(fā)現(xiàn)在迭代5000次后損失值快速減小收斂,并且準(zhǔn)確率可達(dá)到99%以上[2]。
2.5 結(jié)果
進(jìn)過(guò)10萬(wàn)次迭代的訓(xùn)練,發(fā)現(xiàn)損失基本穩(wěn)定在0.0001±0.0005,準(zhǔn)確率達(dá)到0.999±0.0005。結(jié)束訓(xùn)練。
2.6 應(yīng)用
由于模型深度淺,輸入圖像小,推理速度在Arm A53 CPU上達(dá)到15fps,在帶有NPU的Rk1808上達(dá)到150fps。
3優(yōu)缺點(diǎn)對(duì)比
3.1 優(yōu)點(diǎn)
訓(xùn)練圖像和推理圖像特征對(duì)齊,干擾較少,訓(xùn)練收斂速度快,準(zhǔn)確率高;模型小,推理速度快,可在移動(dòng)設(shè)備上部署,正常運(yùn)行;靜默檢測(cè),無(wú)須檢測(cè)體配合動(dòng)作,檢測(cè)時(shí)間短,檢測(cè)速度快;推理圖像只保留相關(guān)的可用特征,減少了干擾特征,魯棒性高,泛化能力強(qiáng),無(wú)須不同人員的大量素材訓(xùn)練。
3.2 缺點(diǎn)
由于依靠人臉檢測(cè)技術(shù)的關(guān)鍵點(diǎn)進(jìn)行特征對(duì)齊,在關(guān)鍵點(diǎn)不準(zhǔn)確的某些場(chǎng)景下,活體檢測(cè)能力有所下降;在強(qiáng)光下由于圖像過(guò)曝,圖像特征缺失,或者弱光場(chǎng)景下噪點(diǎn)干擾,活體檢測(cè)能力有所下降,可通過(guò)改用近紅外攝像頭改進(jìn)對(duì)環(huán)境光的影響[3]。
4結(jié)束語(yǔ)
綜上所述,本文提供的基于深度學(xué)習(xí)的小區(qū)域特征對(duì)齊的活體檢測(cè)方法,檢測(cè)速度理想、魯棒性高,可在各種移動(dòng)設(shè)備上部署,并為人臉識(shí)別的安全性和體驗(yàn)性提供了保障。
參考文獻(xiàn)
[1] 李新豆.基于圖像擴(kuò)散速度模型和紋理信息的人臉活體檢測(cè)[J].計(jì)算機(jī)科學(xué),2020(2):112-117.
[2] 黃海新.基于深度學(xué)習(xí)的人臉活體檢測(cè)算法[J].電子技術(shù)應(yīng)用,2019(8):44-47.
[3] 宛根訓(xùn).人臉識(shí)別應(yīng)用活體檢測(cè)技術(shù)研究[J].中國(guó)安全防范技術(shù)與應(yīng)用,2019(6):58-62.