■ 賽迪智庫
隨著互聯(lián)網(wǎng)+時代的到來,移動支付、共享出行、智慧安防、醫(yī)療等場景對身份驗證、保障安全提出了更高要求。2018年,北京地鐵有望在年內(nèi)啟動人臉識別乘車試點,安檢系統(tǒng)也將引入刷臉技術(shù),提高乘客通行速度。2018年4至5月,警方利用AI人臉識別技術(shù)在三場演唱會上逮捕了多名犯罪嫌疑人。
傳統(tǒng)的人臉識別算法通常采用淺層機器學(xué)習(xí)模型,它需要根據(jù)各類任務(wù)來設(shè)計不同的系統(tǒng),并采用人工來設(shè)計特征,如人臉識別采用LBP特征、人臉檢測采用Haar-like特征、行人檢測采用HOG特征。傳統(tǒng)方法在非約束環(huán)境的效果較差,主要的原因是非約束環(huán)境下人們姿勢呈現(xiàn)多樣化,且光照條件千差萬別,難以利用LBP特征、Haar特征獲取人臉顯著信息,這進一步表明人工設(shè)計特征往往難以滿足現(xiàn)實中的復(fù)雜任務(wù)需求。新一代的人臉識別算法主要基于深度學(xué)習(xí)CNN(卷積神經(jīng)網(wǎng)絡(luò)),它通過構(gòu)建具有多個隱層的神經(jīng)網(wǎng)絡(luò)模型,利用海量數(shù)據(jù)來學(xué)習(xí)更有用的特征。相對于傳統(tǒng)特征工程,新算法能夠自動學(xué)習(xí)特征,降低了人工選擇特征對預(yù)測效果的影響。相對于淺層模型,深度模型能夠重復(fù)利用中間層的計算單元,進而減少網(wǎng)絡(luò)中的自由參數(shù)。
指紋識別技術(shù)是利用傳感器、圖象處理、模式識別的技術(shù)來匹配指紋之間是否一致。指紋識別涵蓋圖像采集、特征提取和匹配等環(huán)節(jié)。傳統(tǒng)的指紋圖像采集有油墨采集、光學(xué)全反射、電容傳感器、超聲波等方法,提取的特征主要包括指紋的方向場、脊線的密集程度、脊線端點和分叉點等。然而,傳統(tǒng)指紋識別技術(shù)面臨著以下問題:一是在1對N的情形下,隨著人數(shù)不斷增加,識別準(zhǔn)確率將明顯降低;二是指紋防偽方面仍有欠缺,如利用指紋膜、照片等方法可能破解指紋驗證。為解決人數(shù)增加導(dǎo)致準(zhǔn)確率下降的問題,新的方法是利用深度學(xué)習(xí)技術(shù),它能夠隨著數(shù)據(jù)量增大逐漸提升指紋識別精度。利用高質(zhì)量指紋訓(xùn)練字典,處理低質(zhì)量指紋時通過字典來選擇候選方向場,然后對比連續(xù)性來選出質(zhì)量較好的方向場。為增強指紋識別的防偽能力,可利用光學(xué)斷層掃描技術(shù)對指紋更為精密的數(shù)據(jù)進行提取。
虹膜識別技術(shù)是基于眼睛中的虹膜進行身份識別,虹膜體積雖然小(直徑大約1厘米),但包含大量的信息(虹膜中有許多相互交錯的斑點、細絲、冠狀、條紋、隱窩等特征),且虹膜在發(fā)育到一定階段后較為穩(wěn)定,這些特征決定了虹膜對于身份識別具有較強的唯一性。虹膜識別過程可分為虹膜圖像采集、數(shù)據(jù)預(yù)處理及分析對比等環(huán)節(jié)。虹膜圖像采集需要用到CCD、CMOS及人機交互、視覺反饋模塊等。然后通過數(shù)字圖像處理技術(shù)、模式識別和人工智能技術(shù)對采集到的虹膜圖像進行處理、存儲、比對,實現(xiàn)對人員身份的認(rèn)證和識別。
與人臉、指紋、虹膜的人體生理特征不同,聲紋屬于人體行為特征。聲紋識別是一項提取說話人聲音特征和說話內(nèi)容信息,自動核驗說話人身份的技術(shù)。聲紋識別技術(shù)可分為兩類:說話人確認(rèn)技術(shù)、說話人辨認(rèn)技術(shù)。說話人確認(rèn)技術(shù)是用于判斷未知說話人是否為某個指定人,主要應(yīng)用于證券交易、銀行交易、公安取證、電腦聲控鎖、汽車聲控鎖、身份證、信用卡等身份識別領(lǐng)域。說話人辨認(rèn)技術(shù)是用于在已經(jīng)記錄的說話人中辨認(rèn)出未知說話人的身份,主要應(yīng)用于刑偵破案、罪犯跟蹤、國防監(jiān)聽、個性化應(yīng)用等領(lǐng)域。當(dāng)前聲紋識別技術(shù)可分為靜態(tài)檢測技術(shù)與動態(tài)監(jiān)測技術(shù)。靜態(tài)檢測技術(shù)是抽取說話人聲音的基音頻譜及包絡(luò)、基音幀的能量、基音共振峰的出現(xiàn)頻率及其軌跡等參數(shù)表征,之后運用模式識別等匹配算法進行聲紋識別。動態(tài)檢測方面,利用VAD技術(shù)進行降噪、去除混響,動態(tài)時間規(guī)整、矢量量化、支持向量機等方法進行特征提取,主要采用隱馬爾可夫模型和高斯混合模型進行預(yù)測,深度學(xué)習(xí)模型目前也有一定應(yīng)用。
隨著深度學(xué)習(xí)等人工智能技術(shù)不斷成熟,生物識別技術(shù)準(zhǔn)確率大幅上升,極大地拓展了其商業(yè)應(yīng)用范圍。目前,以深度學(xué)習(xí)算法為代表的人工智能技術(shù)發(fā)展,為生物識別提供了計算和分析支撐,海量的高質(zhì)量生物特征數(shù)據(jù)也為訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)提供了資源。相比傳統(tǒng)算法,深度學(xué)習(xí)是在圖像、語音領(lǐng)域大大提升了識別率。如在語音識別領(lǐng)域,傳統(tǒng)使用混合高斯模型,其在真實復(fù)雜環(huán)境中的效果欠佳,深度學(xué)習(xí)算法的應(yīng)用使得識別錯誤率下降30%左右。生物識別的準(zhǔn)確率得到大幅提升,這促使了生物識別技術(shù)大大拓展了應(yīng)用范圍,如向移動APP、刷臉支付、新零售、新出行等領(lǐng)域拓展。
隨著3D成像和傳感模組開發(fā),人臉識別、虹膜識別功能將成為智能終端的標(biāo)準(zhǔn)配置。2017年,高通推出了前置iris生物識別模組及高端計算機視覺攝像頭模組。Iris生物識別模組主要用于虹膜識別,具有40ms的低延時,并能夠支持活體檢測。高端計算機視覺攝像頭模組通過紅外發(fā)光器發(fā)射出光束,IR攝像頭讀取該光斑圖案,對點狀圖在物體上發(fā)生的扭曲、以及點與點之間的距離進行計算,進而與RGB圖像進行復(fù)合,最后構(gòu)成3D模型。這意味著搭載高通下一代處理器的智能手機能夠?qū)崿F(xiàn)3D人臉識別、虹膜識別功能。
基于生物識別技術(shù)的數(shù)字身份將成為未來主流的身份識別方式。當(dāng)前主流身份識別方法仍是主要由身份標(biāo)識物品(鑰匙、證件、銀行卡等)和身份標(biāo)識知識(用戶名、密碼)等承擔(dān)。相比主流身份識別方式,采用生物識別技術(shù)的數(shù)字身份更具安全性和便捷性。圍繞數(shù)字身份,Microsoft、Blockstack已開始布局,在移動設(shè)備、云存儲供應(yīng)商及桌面NAS驅(qū)動器中推廣個人云存儲,將區(qū)塊鏈應(yīng)用于數(shù)字證書和服務(wù)提供商之間的信任服務(wù)。N