李國(guó)鑫
摘 要 人臉識(shí)別技術(shù),是一項(xiàng)新型的生物識(shí)別技術(shù),伴隨著近些年來計(jì)算機(jī)技術(shù)和光學(xué)成像技術(shù)的突飛猛進(jìn),該技術(shù)已經(jīng)逐步成熟應(yīng)用于多種場(chǎng)合,例如身份識(shí)別、安保支付等。人臉識(shí)別技術(shù)也是人工智能領(lǐng)域在計(jì)算機(jī)視覺領(lǐng)域的一項(xiàng)重要應(yīng)用,通過對(duì)其展開深入的研究具有很大的積極意義。文章詳細(xì)介紹了目前人臉識(shí)別技術(shù)在國(guó)內(nèi)外的發(fā)展情況,并對(duì)人臉識(shí)別技術(shù)實(shí)現(xiàn)的3個(gè)基本過程——特征提取、建立模型、模型測(cè)試進(jìn)行說明,最后又簡(jiǎn)述了人臉識(shí)別技術(shù)在現(xiàn)實(shí)場(chǎng)景中的實(shí)際應(yīng)用情況。
關(guān)鍵詞 人臉識(shí)別;特征提取;模型;人臉檢索
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)220-0102-02
人臉識(shí)別技術(shù)作為生物特征識(shí)別領(lǐng)域中一種基于生理特征的識(shí)別,是通過計(jì)算機(jī)提取人臉特征,并根據(jù)這些特征進(jìn)行身份驗(yàn)證的一種技術(shù)[ 1 ]。近期,依靠人臉識(shí)別進(jìn)行支付驗(yàn)證的手段已漸漸從實(shí)驗(yàn)階段進(jìn)入人們的生活,新一代的支付方式伴隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,受到越來越多用戶的關(guān)注。早期,生物的識(shí)別方法多以指紋識(shí)別,虹膜識(shí)別為主,但伴隨著各種技術(shù)的發(fā)展,人臉識(shí)別技術(shù)已憑借其特有的優(yōu)勢(shì)取代其他技術(shù)。
同時(shí),更加值得關(guān)注的是,人臉識(shí)別是人工智能在圖像領(lǐng)域的一項(xiàng)重要應(yīng)用,人工智能技術(shù)的發(fā)展不斷優(yōu)化著人臉識(shí)別的表現(xiàn),相反,人臉識(shí)別的進(jìn)步也為人工智能的發(fā)展帶來更多的啟發(fā)。隨著計(jì)算機(jī)和模式識(shí)別技術(shù)的發(fā)展,人臉識(shí)別技術(shù)以它應(yīng)用范圍廣的特點(diǎn)再次受到人們的重視,成為計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域的一個(gè)熱門領(lǐng)域[2]。
1 人臉識(shí)別技術(shù)的發(fā)展
1.1 國(guó)內(nèi)人臉識(shí)別技術(shù)的發(fā)展
我國(guó)人臉識(shí)別技術(shù)的發(fā)展起步較晚,最早只是一些研究所和高校會(huì)參與到人臉識(shí)別的研究中,相應(yīng)的,在實(shí)際應(yīng)用方面,真正參與的企業(yè)也很少。但是,伴隨著近些年來,市場(chǎng)對(duì)于人臉識(shí)別的迫切需求以及國(guó)家各個(gè)方面對(duì)該產(chǎn)業(yè)的支持,最重要的是人臉識(shí)別在軟件硬件方面的不斷進(jìn)步發(fā)展,都促使該技術(shù)不論在研究還是實(shí)際應(yīng)用中都有了很大的發(fā)展。
同時(shí),我國(guó)在人臉識(shí)別領(lǐng)域公開的專利數(shù)量也由2011年的270件增加至2015年的1 398件,并且近幾年內(nèi),這一數(shù)字還是飛速增加,無論是專利數(shù)量還是成果轉(zhuǎn)化情況,我國(guó)都穩(wěn)居全球第一,由此可見,在未來的一段時(shí)間內(nèi),我國(guó)人臉識(shí)別技術(shù)將會(huì)由設(shè)計(jì)到實(shí)用的有效轉(zhuǎn)變。
2008年,我國(guó)將完全自主研發(fā)的一套人臉識(shí)別系統(tǒng)用于北京奧運(yùn)會(huì)上,這套系統(tǒng)將人臉識(shí)別算法和RFID射頻技術(shù)結(jié)合,在當(dāng)時(shí)就可以實(shí)現(xiàn)人臉的快速準(zhǔn)確檢測(cè)。在學(xué)術(shù)研究領(lǐng)域,我國(guó)提出的GaussianFace人臉識(shí)別算法也已經(jīng)可以將人臉對(duì)比的準(zhǔn)確度提升到97%以上。在實(shí)業(yè)領(lǐng)域,科大訊飛憑借其在語音識(shí)別方面的優(yōu)勢(shì),將人臉識(shí)別與語音識(shí)別相結(jié)合更是大幅度提升了人員身份識(shí)別的準(zhǔn)確性。
1.2 國(guó)外人臉識(shí)別技術(shù)的發(fā)展
國(guó)外在人臉識(shí)別方面的發(fā)展要早于國(guó)內(nèi),早在20世紀(jì)80年代中后期,人臉識(shí)別技術(shù)的雛形就已經(jīng)形成,短短幾年后,人臉識(shí)別技術(shù)就真正運(yùn)用于實(shí)際情況。美國(guó)是在該領(lǐng)域技術(shù)最先起步的國(guó)家,同時(shí)也是最早將其應(yīng)用在實(shí)際場(chǎng)景中的國(guó)家,現(xiàn)階段美國(guó)的多個(gè)州都制定了相關(guān)制度,通過采集個(gè)人人臉信息的方法來對(duì)可疑人員進(jìn)行監(jiān)管。
另外,日本人臉識(shí)別技術(shù)的發(fā)展情況也值得關(guān)注,將大量識(shí)別技術(shù)與其自身強(qiáng)項(xiàng)——機(jī)器人相結(jié)合,真正的實(shí)現(xiàn)可以“看得懂”的智能機(jī)器人。據(jù)相關(guān)報(bào)道指出,2014年全球人臉識(shí)別市場(chǎng)價(jià)值為1 307億美元,預(yù)計(jì)全球市場(chǎng)會(huì)在2015年以9.5%的復(fù)合年增長(zhǎng)率快速增長(zhǎng)到2022年[3]。
2 人臉識(shí)別的實(shí)現(xiàn)過程
2.1 特征提取
特征提取是人臉識(shí)別的首要步驟,選擇一類適合的特征提取方法對(duì)后期人臉識(shí)別實(shí)現(xiàn)的快速性和準(zhǔn)確性都有很大的影響。特征提取是將人體面部的信息轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別的數(shù)字信息,轉(zhuǎn)化后的大量數(shù)字信息可以通過機(jī)器學(xué)習(xí)的方法進(jìn)行分類或者回歸,以得出最終的人臉結(jié)果。
早期的人臉識(shí)別方法都是基于人臉的面部特征提取直觀的幾何特征,即面部器官的幾何位置。這一類特征相對(duì)簡(jiǎn)單,并且計(jì)算量較小,運(yùn)行速度快,但是會(huì)導(dǎo)致最終識(shí)別結(jié)果的準(zhǔn)確率較低。
目前,在人臉識(shí)別的研究過程中,廣泛用于提取全局特征的方法有PCA、獨(dú)立成分分析、線性判別分析方法等[4]。這些方法和最原始的幾何特征方法相比較,具備更高的數(shù)據(jù)維度,可以更加準(zhǔn)確地描述人的面部信息,但是在處理這些特征時(shí)就需要進(jìn)行更多的運(yùn)算,這就需要對(duì)設(shè)備硬件和算法有很大的提升才能應(yīng)用于具體的使用中。
2.2 建立模型
將收集到的特征數(shù)據(jù)整合好后,具體成一個(gè)具有一般規(guī)律的模型,即當(dāng)不同的數(shù)據(jù)輸入時(shí),都可以通過該模型進(jìn)行科學(xué)的預(yù)測(cè)。在人臉識(shí)別的過程中,模型的輸入量一般是人臉部分的特征所構(gòu)成的集合,該集合的數(shù)據(jù)量往往會(huì)很大,達(dá)到上萬的數(shù)量級(jí)。
需要指出的是,在輸入的人臉特征中應(yīng)具有多樣性的特點(diǎn),以得到一個(gè)具備泛化能力強(qiáng)的模型。該模型的輸出則是經(jīng)過算法分析后得到的確定人物身份。在建立模型時(shí),可以直接調(diào)用很多機(jī)器學(xué)習(xí)的成熟算法,例如隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等方法,這些方法目前都發(fā)展成熟,易于調(diào)試。
2.3 模型測(cè)試
當(dāng)提取完特征以及建立好模型后,需要對(duì)模型進(jìn)行測(cè)試,因?yàn)榻⒑玫哪P鸵话阒荒艿玫匠醪降男Ч?,但是?duì)于快速性或者準(zhǔn)確性的要求還具有一定的差距。當(dāng)模型的快速性存在問題時(shí),可以考慮通過硬件加速或者簡(jiǎn)化特征提取數(shù)量來縮短模型反應(yīng)時(shí)間;當(dāng)準(zhǔn)確性存在問題時(shí),則又可以通過改變特征的選擇方式來提升準(zhǔn)確性。但在具體測(cè)試時(shí),也會(huì)遇到人臉面部被遮擋,人臉模糊,場(chǎng)景內(nèi)人臉數(shù)量過多等情況,這些都為實(shí)際應(yīng)用帶來了很大的挑戰(zhàn),所以模型在測(cè)試時(shí),往往需要通過大量反復(fù)的調(diào)試才可以得到一個(gè)良好的效果。
3 人臉識(shí)別技術(shù)的應(yīng)用
3.1 人臉追蹤
人臉追蹤多用于攝像頭中對(duì)特定人員的連續(xù)追蹤,例如走失的兒童,和可疑的嫌疑人等。人臉追蹤需要以人臉識(shí)別為基礎(chǔ),在識(shí)別出特定對(duì)象后,一般會(huì)在該對(duì)象面部輪廓周圍生成一個(gè)矩形框,矩形框會(huì)伴隨著對(duì)象的移動(dòng)而不斷移動(dòng)。并且在一般情況下,人臉識(shí)別具備并發(fā)性的特點(diǎn),即可以在任一時(shí)間點(diǎn)內(nèi)檢測(cè)出圖像上或者視頻流中的所有人臉,當(dāng)應(yīng)用人臉追蹤技術(shù)時(shí),也就可以同時(shí)追蹤多個(gè)人臉。
3.2 人臉檢索
人臉檢索即通過人臉信息進(jìn)行人物身份的識(shí)別,是生活中人臉識(shí)別技使用最多的一項(xiàng)應(yīng)用,大量的應(yīng)用于電子支付領(lǐng)域和安防領(lǐng)域。例如,在一些特定支付模式下,可以通過人臉檢索的方式進(jìn)行“刷臉”支付,或者對(duì)于一些電子設(shè)備的解鎖等。人臉檢索往往是將被測(cè)對(duì)象的面部信息提取出來,隨后與包含大量人臉的數(shù)據(jù)庫(kù)進(jìn)行檢索對(duì)比,給出是否存在于數(shù)據(jù)庫(kù)中以及匹配于哪一條信息的結(jié)果。
目前,人臉識(shí)別技術(shù)的準(zhǔn)確性已經(jīng)可以確保其應(yīng)用于以上場(chǎng)景,另外使用的快速性也可以伴隨著算法和硬件的提升遠(yuǎn)遠(yuǎn)超過其他識(shí)別方式。但是,人臉檢索還面臨著許多挑戰(zhàn),當(dāng)被測(cè)對(duì)象的面部受到遮擋或者面部信息被他人冒用時(shí),就很容易遭到財(cái)產(chǎn)的損失和安全性的降低。
3.3 人臉驗(yàn)證
與人臉檢索類似的,人臉驗(yàn)證也是人臉識(shí)別技術(shù)的一項(xiàng)重要應(yīng)用,不同于人臉檢索需要與數(shù)據(jù)庫(kù)中的大量信息進(jìn)行對(duì)比,人臉驗(yàn)證只需要判斷被測(cè)對(duì)象是否和先前準(zhǔn)備好的人臉具備統(tǒng)一性。例如,在很多人流量較大的場(chǎng)所,機(jī)場(chǎng)車站等地,都需要將乘客本人與身份證上的信息進(jìn)行核對(duì)。
4 結(jié)論
人臉識(shí)別技術(shù)的應(yīng)用相對(duì)廣泛,并且技術(shù)也越來越成熟,但同樣不能忽視人臉識(shí)別所帶來的一些問題,例如個(gè)人隱私是否能有足夠的保障,數(shù)據(jù)的安全性會(huì)不會(huì)受到挑戰(zhàn)等。這就需要在發(fā)展人臉識(shí)別的同時(shí),還要不斷地完善法律法規(guī)的制定,以保證科技的合理應(yīng)用。科技的力量將不斷優(yōu)化人們的生活,人工智能技術(shù)更是可能會(huì)顛覆當(dāng)前的狀態(tài)。當(dāng)我們自己的視覺受到很多局限時(shí),那么就應(yīng)該將重心轉(zhuǎn)移到計(jì)算機(jī)視覺上,讓計(jì)算機(jī)來代替我們看這個(gè)世界。
參考文獻(xiàn)
[1]梁文莉.基于獨(dú)立成分分析的人臉識(shí)別算法研究[D].西安:西安科技大學(xué),2012.
[2]葛春苑.人臉識(shí)別技術(shù)的發(fā)展與展望[J].中國(guó)安防,2015(21):62-65.
[3]中關(guān)村在線.技術(shù)促人臉識(shí)別普及,未來市場(chǎng)或超千億[DB/ OL].[2016-05-10].http ://tech.hexun.com/2015-12-01/180904461.html.
[4]BARTLETTMS,MOVELLANJ R,SEJNOWSKI T J.Face recognition by independent component analysis[J].IEEE Transactions on Neural Networks,2002,13(6):1450-1464.