胡鈺軒 陳晨 凌家豪
【摘 要】在計(jì)算機(jī)和信息技術(shù)快速發(fā)展的今天,傳統(tǒng)的身份鑒別技術(shù)存在著重要的安全隱患。因此,人臉識(shí)別作為生物特征識(shí)別技術(shù)中最為直觀的一種方法,已經(jīng)逐步滲透到人們的日常生活中。本文研究的Visual ID人臉識(shí)別門(mén)禁系統(tǒng),主要包括人臉識(shí)別終端、后臺(tái)管理系統(tǒng)、人臉識(shí)別系統(tǒng)幾大塊;結(jié)合了區(qū)塊鏈技術(shù),有效地為用戶信息的存儲(chǔ)提供一個(gè)去中心化平臺(tái),極大提高安全性;同時(shí),采用了迭代發(fā)卡模型——螺旋模型,通過(guò)深度神經(jīng)網(wǎng)絡(luò)優(yōu)化Faster RCNN算法,并結(jié)合OpenPose開(kāi)源框架和dlib表情識(shí)別開(kāi)發(fā)技術(shù),打造新型人臉識(shí)別系統(tǒng),提升信息安全。
【關(guān)鍵詞】新型人臉識(shí)別技術(shù);區(qū)塊鏈;OpenPose開(kāi)源框架;人工智能
從20年前的網(wǎng)上聊天,到20年后的網(wǎng)上購(gòu)物,再到現(xiàn)今的共享經(jīng)濟(jì),計(jì)算機(jī)和信息技術(shù)正快速地融入人類(lèi)的日常生活。如何準(zhǔn)確、有效的識(shí)別用戶身份,提升信息安全已成為一項(xiàng)重要的研究課題。
傳統(tǒng)的身份鑒別技術(shù)主要依靠外物(身份證、鑰匙等)或者自身記憶(密碼、用戶名等)。然而不管是借助于外物還是自身記憶,都存在著嚴(yán)重的安全隱患。若證明自己身份的表示物品被盜或者遺忘,不僅很難重新獲得原始的身份標(biāo)識(shí)物品,而且身份信息也易被他人獲取,從而導(dǎo)致身份被他人冒充,造成嚴(yán)重后果。傳統(tǒng)的門(mén)禁系統(tǒng)是利用指紋、智能IC卡、鍵盤(pán)按鍵來(lái)進(jìn)行門(mén)禁控制的,而這些傳統(tǒng)門(mén)禁系統(tǒng)的安全性能也都不高,人們急需要一種更加安全和可靠的技術(shù)應(yīng)用在門(mén)禁系統(tǒng)中。
由此,生物識(shí)別技術(shù)因其獨(dú)特的優(yōu)勢(shì),受到了各企業(yè)和研究所的重視,在很多領(lǐng)域成功取代了傳統(tǒng)識(shí)別技術(shù),而且隨著計(jì)算機(jī)和人工智能的快速發(fā)展,生物識(shí)別技術(shù)很容易配合計(jì)算機(jī)、網(wǎng)絡(luò),實(shí)現(xiàn)自動(dòng)化管理,正在快速融入人們?nèi)粘5纳?。而人臉識(shí)別,是通過(guò)提取人臉部特征信息進(jìn)行其信息識(shí)別的一種生物特征。是一種先通過(guò)在一定的環(huán)境中檢測(cè)出人臉,然后通過(guò)計(jì)算機(jī)提取出與人臉有關(guān)的信息特征并進(jìn)行分析處理,最后利用處理后的特征與人臉數(shù)據(jù)庫(kù)中的特征進(jìn)行比對(duì),以此來(lái)確認(rèn)人身份的技術(shù)。作為生物特征識(shí)別技術(shù)中最為直觀的一種方法,具有主動(dòng)性、非侵犯性、友好性、簡(jiǎn)便性、準(zhǔn)確性等優(yōu)勢(shì)。因此,多年來(lái)它一直受到不同領(lǐng)域研究者的青睞。隨著國(guó)內(nèi)平安城市、智慧城市項(xiàng)目的深入發(fā)展,城市監(jiān)控進(jìn)一步高清化,使得人臉識(shí)別數(shù)據(jù)采集不再成為最大阻礙,提升了其應(yīng)用領(lǐng)域。如今,人臉識(shí)別廣泛應(yīng)用于公安部門(mén)、支付驗(yàn)證、安全系統(tǒng)、檔案管理等方面,成為人工智能領(lǐng)域的一大潮流。
某大學(xué)一棟女生宿舍上線了“人臉識(shí)別系統(tǒng)”,盡管目前機(jī)器處在調(diào)試狀態(tài),但校方肯定這一系統(tǒng)對(duì)于保障宿舍安全的有效性;某地肯德基已經(jīng)將“微笑支付”變?yōu)楝F(xiàn)實(shí);在金融領(lǐng)域,招商銀行、建設(shè)銀行、中國(guó)農(nóng)業(yè)銀行已經(jīng)上線了ATM“刷臉取款”;北京天壇公園安裝了“人臉識(shí)別廁紙機(jī)”,它可以自動(dòng)放出長(zhǎng)度約60厘米的紙,目的是為了節(jié)省廁紙;而近期發(fā)布的iPhone X將Face ID引入了現(xiàn)代人生活中無(wú)法逃離的手機(jī),并試圖借此技術(shù)來(lái)鞏固自身的科技實(shí)力??梢?jiàn),“臉”正在成為個(gè)人身份的憑據(jù)。萊布尼茲曾說(shuō):“世界上沒(méi)有兩片相同的樹(shù)葉”。對(duì)人工智能而言,它正在以強(qiáng)大的學(xué)習(xí)能力和精妙的算法來(lái)給予每個(gè)個(gè)體獨(dú)一無(wú)二身份屬性的確認(rèn)。據(jù)統(tǒng)計(jì)數(shù)據(jù)顯示,未來(lái)三年內(nèi)國(guó)內(nèi)有望形成年銷(xiāo)售額過(guò)百億元的市場(chǎng)規(guī)模,并在未來(lái)十年內(nèi)有望形成年銷(xiāo)售額過(guò)千億元的市場(chǎng)規(guī)模。分析人士表示,人臉識(shí)別應(yīng)用范圍的擴(kuò)大疊加政府采購(gòu)的強(qiáng)力推進(jìn),將促使人臉識(shí)別子行業(yè)延續(xù)高景氣度,值得關(guān)注。同時(shí),政府也一直積極提供政策支持。2015年以來(lái),國(guó)家密集出臺(tái)了《關(guān)于銀行業(yè)金融機(jī)構(gòu)遠(yuǎn)程開(kāi)立人民幣賬戶的指導(dǎo)意見(jiàn)(征求意見(jiàn)稿)》、《安全防范視頻監(jiān)控人臉識(shí)別系統(tǒng)技術(shù)要求》、《信息安全技術(shù)網(wǎng)絡(luò)人臉識(shí)別認(rèn)證系統(tǒng)安全技術(shù)要求》等法律法規(guī),為人臉識(shí)別在金融、安防、醫(yī)療等領(lǐng)域的普及打下了堅(jiān)實(shí)的基礎(chǔ),掃清了政策障礙。同時(shí),2017年人工智能首次寫(xiě)入國(guó)家政府報(bào)告,作為人工智能的重要細(xì)分領(lǐng)域,可以預(yù)計(jì)人臉識(shí)別相關(guān)政策支持力度將不斷增強(qiáng)。
Visual ID人臉識(shí)別門(mén)禁系統(tǒng)以“人臉識(shí)別門(mén)禁系統(tǒng)”為核心業(yè)務(wù),貫穿小區(qū)安全管理服務(wù)及物業(yè)服務(wù)等服務(wù),為使產(chǎn)品更加契合用戶需求,采用了迭代發(fā)卡模型——螺旋模型,通過(guò)深度神經(jīng)網(wǎng)絡(luò)優(yōu)化Faster RCNN算法,并結(jié)合OpenPose開(kāi)源框架和dlib表情識(shí)別開(kāi)發(fā)技術(shù),提高在人面識(shí)別的精度。本項(xiàng)目平臺(tái)采用的算法是卡內(nèi)基梅隆大學(xué)全新的OpenPose——基于骨架模型運(yùn)動(dòng)識(shí)別算法。OpenPose可以實(shí)現(xiàn)人的面部表情、軀干和四肢甚至手指的跟蹤,不僅適用于單人也適用于多人,同時(shí)具有較好的魯棒性?;蛟S會(huì)是人機(jī)交互上的一個(gè)里程碑,為機(jī)器理解人提供了一個(gè)高質(zhì)量的信息維度。另外本平臺(tái)還融入了區(qū)塊鏈技術(shù),實(shí)現(xiàn)平臺(tái)的高效性以及安全性,建立平臺(tái)與客戶之間的信任度。采用這一算法能夠使識(shí)別更加精確,滿足更多用戶的需求。
Visual ID 人臉識(shí)別門(mén)禁硬件系統(tǒng)主要有主控模塊、觸發(fā)模塊、拍照模塊、驅(qū)動(dòng)模塊及電源模塊等。當(dāng)觸發(fā)模塊的光電開(kāi)關(guān)檢測(cè)有物體后,通過(guò)算法判斷人臉信息,若比對(duì)成功,則系統(tǒng)操作樹(shù)莓派 GPIO,通過(guò)與人臉識(shí)別電源模塊連接的繼電器控制通斷,從而實(shí)現(xiàn)開(kāi)關(guān)門(mén)。
Visual ID 人臉識(shí)別門(mén)禁軟件系統(tǒng)主要包括人臉識(shí)別終端、后臺(tái)管理系統(tǒng)、人臉識(shí)別系統(tǒng)這幾大塊。對(duì)于后臺(tái)管理系統(tǒng)采用MFC構(gòu)建管理界面,采用Socket與終端模塊通信,用戶數(shù)據(jù)保存在 MySQL 數(shù)據(jù)庫(kù)中。MFC是微軟公司提供的一個(gè)類(lèi)庫(kù),以C++類(lèi)的形式封裝了Windows API,并且包含一個(gè)應(yīng)用程序框架,以減少應(yīng)用程序開(kāi)發(fā)人員的工作量。其中包含大量Windows句柄封裝類(lèi)和很多Windows的內(nèi)建控件和組件的封裝類(lèi)。對(duì)于人臉識(shí)別的實(shí)現(xiàn)在實(shí)驗(yàn)過(guò)程中圖像來(lái)源于電腦攝像頭,需要使用 OpenCV 完成對(duì)攝像頭的控制等操作。OpenCV是一個(gè)基于C/C++語(yǔ)言的開(kāi)源圖像處理函數(shù)庫(kù)。其代碼都經(jīng)過(guò)優(yōu)化,可用于實(shí)時(shí)處理圖像,具有良好的可移植性??梢赃M(jìn)行圖像/視頻載入、保存和采集的常規(guī)操作,具有低級(jí)和高級(jí)的應(yīng)用程序接口(API),提供了面向 Intel IPP 高效多媒體函數(shù)庫(kù)的接口,可針對(duì)使用的 Intel CPU 優(yōu)化代碼,提高程序性能。
首先,人臉識(shí)別采用先進(jìn)的深度網(wǎng)絡(luò)技術(shù),卷積深度神經(jīng)網(wǎng)絡(luò)改進(jìn)算法是基于Haar特征AdaBoost算法的改進(jìn)算法,通過(guò)直接使用已訓(xùn)練的模型對(duì)原始數(shù)據(jù)進(jìn)行特征提取分析,將特征所提取信息放在一個(gè)模型內(nèi)解決,從而優(yōu)化算法。提取人臉特征向量時(shí),CNN的前幾個(gè)卷積層重點(diǎn)刻畫(huà)人臉的局部邊緣和紋理特征;中間層通過(guò)對(duì)局部進(jìn)行組合刻畫(huà)了臉部的五官;更高層表現(xiàn)了人臉的全局特征。通過(guò)層層遞進(jìn),模仿了人類(lèi)視覺(jué)系統(tǒng)信息分層處理機(jī)制,更好地挖掘訓(xùn)練數(shù)據(jù)中的關(guān)聯(lián)特性。其次,通過(guò)歐拉距離、線性判別分析、聯(lián)合貝葉斯進(jìn)行相關(guān)相似度判斷,便可進(jìn)行判斷。然后RPN負(fù)責(zé)找到可能的目標(biāo)窗口進(jìn)行初步人脈檢測(cè),R-CNN負(fù)責(zé)進(jìn)一步判斷。
系統(tǒng)的整體結(jié)構(gòu)則采用樹(shù)莓派等相關(guān)平臺(tái)技術(shù),針對(duì)小區(qū)的情況定制專(zhuān)屬小區(qū)門(mén)禁情況的信息與服務(wù)手機(jī)應(yīng)用程序,通過(guò)WiFi模塊的捆綁和免費(fèi)的云端服務(wù)器全方位的覆蓋市場(chǎng)。系統(tǒng)實(shí)現(xiàn)過(guò)程中,移動(dòng)端平臺(tái)可以在Android與iOS上實(shí)現(xiàn),Android開(kāi)發(fā)使用Java語(yǔ)言,iOS開(kāi)發(fā)使用Objective-C語(yǔ)言。數(shù)據(jù)庫(kù)采用MySQL,采用Ubuntu 16.04 LTS 作為服務(wù)器系統(tǒng)。其中MySQL是一個(gè)關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),由瑞典 MySQL AB 公司開(kāi)發(fā)。MySQL 是最流行的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)之一,在 WEB 應(yīng)用方面,MySQL 是最好的RDBMS(關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng))應(yīng)用軟件。 MySQL關(guān)系數(shù)據(jù)庫(kù)將數(shù)據(jù)保存在不同的表中,而不是將所有數(shù)據(jù)放在一個(gè)大倉(cāng)庫(kù)內(nèi),這樣就增加了速度并提高了靈活性。由于其體積小、速度快、總體擁有成本低,尤其是開(kāi)放源碼這一特點(diǎn),一般中小型網(wǎng)站的開(kāi)發(fā)都選擇 MySQL 作為網(wǎng)站數(shù)據(jù)庫(kù)。PC終端平臺(tái)通過(guò)C++語(yǔ)言在Visual Studio上實(shí)現(xiàn)。Visual Studio 是微軟公司推出的基于Windows 平臺(tái)的應(yīng)用程序開(kāi)發(fā)環(huán)境,Visual Studio 2015 包含了更多強(qiáng)大的新特性。人臉識(shí)別的代碼通過(guò)python語(yǔ)言實(shí)現(xiàn),版本為Python2.7。Python是最受歡迎的程序設(shè)計(jì)語(yǔ)言之一。Python 2于2000年10月16 日發(fā)布,穩(wěn)定版本是Python 2.7。 眾多開(kāi)源的科學(xué)計(jì)算軟件包都提供了Python的調(diào)用接口,例如著名的計(jì)算機(jī)視覺(jué)庫(kù)OpenCV、三維可視化庫(kù)VTK、醫(yī)學(xué)圖像處理庫(kù)ITK。 移動(dòng)端后臺(tái)服務(wù)器交由企業(yè)打理,PC端服務(wù)器則由小區(qū)物業(yè)管理。企業(yè)服務(wù)器采用Tomcat,在該環(huán)境下,運(yùn)行JSP文件。通過(guò)Java語(yǔ)言,將用戶信息傳遞至物業(yè)服務(wù)器數(shù)據(jù)庫(kù)中;圖片通過(guò)Python語(yǔ)言寫(xiě)的Server,運(yùn)用Socket 網(wǎng)絡(luò)編程傳遞到物業(yè)服務(wù)器中。物業(yè)服務(wù)器采用MySQL+PythonServer+Shell調(diào)用Linux C++的SDK識(shí)別,返回人臉識(shí)別結(jié)果。此外,網(wǎng)絡(luò)上大量開(kāi)源框架的出現(xiàn)給我們提供了人臉檢測(cè)和識(shí)別的API,所有的SDK均提供了全平臺(tái)支持,只需獲取ArcFace引擎應(yīng)用開(kāi)發(fā)包,便可導(dǎo)入到應(yīng)用中。因此,人臉識(shí)別成功率大大提升。中后期對(duì)小區(qū)用戶數(shù)據(jù)進(jìn)行深度挖掘,將其打造成一個(gè)物業(yè)綜合服務(wù)平臺(tái)。
具有創(chuàng)新的是,Visual ID人臉識(shí)別門(mén)禁系統(tǒng)結(jié)合了區(qū)塊鏈技術(shù)。比以往的識(shí)別技術(shù)極大地提高了安全性和易操作性。
1、區(qū)塊鏈支付。在項(xiàng)目的商城購(gòu)買(mǎi)支付中運(yùn)用了區(qū)塊鏈技術(shù),實(shí)現(xiàn)購(gòu)買(mǎi)的高效性以及安全性。分布式網(wǎng)絡(luò)技術(shù)的匯款可以在去中心化的機(jī)制下使用戶以更低的費(fèi)用和更快的速度完成轉(zhuǎn)賬支付,使得支付行為具有去中心化、方便快捷、高安全性、記賬速度快、成本較低、互相監(jiān)察驗(yàn)證等優(yōu)點(diǎn)。另外由于“區(qū)塊鏈”是一串使用密碼學(xué)方法相關(guān)聯(lián)產(chǎn)生的數(shù)據(jù)塊,每一個(gè)數(shù)據(jù)塊中包含了過(guò)去十分鐘內(nèi)所有網(wǎng)絡(luò)交易的信息,用于驗(yàn)證其信息的有效性(防偽)和生成下一個(gè)區(qū)塊,每筆交易筆筆可挖,防止欺詐交易的發(fā)生,為消費(fèi)者的購(gòu)買(mǎi)提供更高層次的安全保障。
2、區(qū)塊鏈物流平臺(tái)。本項(xiàng)目通過(guò)區(qū)塊鏈技術(shù),使得平臺(tái)物流以及消費(fèi)者各獲得一個(gè)透明可靠的統(tǒng)一信息平臺(tái),消費(fèi)者可以實(shí)時(shí)查看狀態(tài),降低物流成本,追溯物品的生產(chǎn)和運(yùn)送整個(gè)過(guò)程,從而提高本平臺(tái)供應(yīng)鏈管理的效率。當(dāng)發(fā)生糾紛時(shí),舉證和追查也變得更加清晰和容易。
3、管理員身份驗(yàn)證。將系統(tǒng)管理員的各類(lèi)身份證明錄入數(shù)據(jù)庫(kù),利用區(qū)塊鏈技術(shù)實(shí)現(xiàn)對(duì)管理員的正確、高效識(shí)別,防止不法人員冒充替代。另外還能實(shí)時(shí)監(jiān)督管理員的工作情況,是否按時(shí)上班,有無(wú)出現(xiàn)晚到早退現(xiàn)象,改進(jìn)了部分管理流程,提高了一定的管理效率。
4、用戶存在性證明。將區(qū)塊鏈技術(shù)運(yùn)用在用戶存在性證明方面,能有效的為用戶信息的存儲(chǔ)提供一個(gè)去中心化平臺(tái),構(gòu)建用戶與平臺(tái)之間的信任度,存儲(chǔ)和認(rèn)證用戶身份,防止外來(lái)不明人員的進(jìn)入。本項(xiàng)目將區(qū)塊鏈系統(tǒng)運(yùn)用到用戶信息儲(chǔ)存的數(shù)據(jù)庫(kù)中,不僅提高了對(duì)已知存在用戶完成人臉識(shí)別時(shí)的速度,還能保證已知存在用戶的人身安全,防止不法分子的進(jìn)入。實(shí)現(xiàn)數(shù)據(jù)傳遞的高效性與安全性。
5、歷史數(shù)據(jù)存儲(chǔ)。運(yùn)用區(qū)塊鏈數(shù)據(jù)層對(duì)各已知存在用戶的歷史交易數(shù)據(jù)或者行為數(shù)據(jù)進(jìn)行存儲(chǔ),保證用戶歷史交易以及行為的安全性,且運(yùn)用區(qū)塊鏈加密技術(shù)防止此類(lèi)歷史數(shù)據(jù)外泄,保證用戶信息及各類(lèi)歷史數(shù)據(jù)只能自己查看,構(gòu)建自我與平臺(tái)之間的信任度,吸引用戶的使用。
綜上,基于區(qū)塊鏈和OpenPose的新型人臉識(shí)別系統(tǒng)Visual ID作為一個(gè)對(duì)傳統(tǒng)人臉識(shí)別系統(tǒng)的改進(jìn),具有廣闊的發(fā)展前景。與其他傳統(tǒng)的人臉識(shí)別系統(tǒng)相比,該項(xiàng)目具有以下明顯的優(yōu)勢(shì):
1、先進(jìn)性:采用DCNN和haar-like獨(dú)特的混合人臉識(shí)別算法,識(shí)別精度更高,識(shí)別速度更快。
2、多樣化:支持?jǐn)?shù)據(jù)來(lái)源的多樣化,動(dòng)態(tài)人臉捕抓、手機(jī)拍攝、攝像機(jī)抓取,照片掃描等多種方式;支持現(xiàn)場(chǎng)捕捉照片與數(shù)據(jù)庫(kù)中照片自動(dòng)匹配檢索。
3、高效低成本化:合理配置和選取合適的產(chǎn)品軟硬件型號(hào),使整個(gè)系統(tǒng)穩(wěn)定、高效、可靠、低成本運(yùn)行。
4、快速化:普通照片中提取人臉特征值,極大地降低了數(shù)據(jù)存儲(chǔ)空間。
5、實(shí)用性:適合于各國(guó)人種,不受種族膚色及性別的影響,不受面部表情,胡須和發(fā)型等變化的影響。
6、方便性:完善的照片比對(duì)功能,比對(duì)方式多,比對(duì)準(zhǔn)確率高,比對(duì)速度快,支持全局人臉識(shí)別和分部識(shí)別部件的人臉識(shí)別。
7、安全性:區(qū)塊鏈技術(shù)的引入,使得系統(tǒng)從用戶登陸、管理員身份驗(yàn)證到系統(tǒng)人臉數(shù)據(jù)庫(kù)的分布式存儲(chǔ)在安全性上都領(lǐng)先于其他系統(tǒng)。
除了維持核心業(yè)務(wù),VISUAL ID還致力于不斷開(kāi)發(fā)新產(chǎn)品。基于AI技術(shù)生物識(shí)別和區(qū)塊鏈技術(shù)產(chǎn)品的開(kāi)發(fā)有利于充分發(fā)掘企業(yè)的資源和生產(chǎn)能力,提高經(jīng)濟(jì)效益,同時(shí)有利于新市場(chǎng)的開(kāi)拓,提高企業(yè)的聲譽(yù),擴(kuò)大銷(xiāo)售量,提高競(jìng)爭(zhēng)能力,從而既可滿足市場(chǎng)需求,又增加了企業(yè)的盈利。為此,VISUAL ID將會(huì)面對(duì)市場(chǎng)需求的多樣化,提高創(chuàng)新能力,加大技術(shù)開(kāi)發(fā)。
我國(guó)人臉識(shí)別市場(chǎng)規(guī)模從2012年的16.7億元,上升至2015年的75億元。根據(jù)測(cè)算,人臉識(shí)別主要應(yīng)用領(lǐng)域市場(chǎng)規(guī)模,公安領(lǐng)域16億以上、交通領(lǐng)域50億以上、金融領(lǐng)域百億級(jí)別、教育領(lǐng)域百億級(jí)別,在不考慮大安防硬件存量市場(chǎng)的前提下,整體市場(chǎng)規(guī)模就達(dá)到數(shù)百億。人臉識(shí)別作為人工智能模式識(shí)別中應(yīng)用領(lǐng)域最為廣泛的細(xì)分行業(yè),伴隨安防、交通等新增市場(chǎng)的打開(kāi),預(yù)計(jì)整體市場(chǎng)規(guī)模有望呈現(xiàn)爆發(fā)式增長(zhǎng)。