国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)分析

2022-05-09 02:40:47張寧仙
電腦知識(shí)與技術(shù) 2022年7期
關(guān)鍵詞:人臉識(shí)別技術(shù)人臉檢測(cè)深度學(xué)習(xí)

摘要:作為重要的人工智能研究方向,人臉識(shí)別研究近年來(lái)大量涌現(xiàn),相關(guān)產(chǎn)品也在各領(lǐng)域廣泛應(yīng)用?;诖?,文章將圍繞一種基于深度學(xué)習(xí)提升人臉識(shí)別技術(shù)準(zhǔn)確率的算法開(kāi)展研究,在計(jì)算框架加速化和網(wǎng)絡(luò)結(jié)構(gòu)小型化支持下,實(shí)時(shí)化人臉識(shí)別得以實(shí)現(xiàn),由此設(shè)計(jì)的人臉識(shí)別系統(tǒng)可用于物聯(lián)網(wǎng)設(shè)備。

關(guān)鍵詞:深度學(xué)習(xí);人臉識(shí)別技術(shù);人臉檢測(cè);物聯(lián)網(wǎng)設(shè)備

中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2022)07-0089-03

開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):<H:\飛翔打包文件\電腦2022年第七期打包文件1\8.05xs202207\Image\image88.png>

相較于虹膜識(shí)別、指紋識(shí)別、密碼、密鑰等局限性較大的身份驗(yàn)證手段,人臉識(shí)別技術(shù)已成為現(xiàn)階段公認(rèn)的最佳身份驗(yàn)證手段。隨著人臉識(shí)別技術(shù)的快速發(fā)展和廣泛應(yīng)用,人們的生活逐漸發(fā)生變化,火車(chē)站的人臉識(shí)別閘機(jī)、人臉識(shí)別自動(dòng)售賣(mài)機(jī)等均屬于這種變化的載體。

1 人臉識(shí)別算法設(shè)計(jì)

1.1 人臉檢測(cè)算法

為實(shí)現(xiàn)人臉識(shí)別算法效果和性能的平衡,需基于MTCNN框架開(kāi)展人臉檢測(cè)網(wǎng)絡(luò)設(shè)計(jì),具體算法流程可概括為:“圖像金字塔→[Pnet]檢測(cè)→[Rnet]檢測(cè)→[Onet]檢測(cè)”。圖像金字塔可通過(guò)放大和縮放圖像獲取,進(jìn)入[Pnet]網(wǎng)絡(luò)的圖像金字塔負(fù)責(zé)生成人臉候選區(qū)域,人臉區(qū)域多重復(fù)冗余通過(guò)非極大值抑制開(kāi)展去重處理,在[Rnet]網(wǎng)絡(luò)中進(jìn)一步提取特征并進(jìn)行邊框回歸,進(jìn)一步去重處理,[Onet]網(wǎng)絡(luò)繼續(xù)進(jìn)行提取特征和邊框回歸,人臉?biāo)趨^(qū)域能夠最終獲取,人臉關(guān)鍵點(diǎn)的預(yù)測(cè)5個(gè)位置也能夠同時(shí)獲得。為降低學(xué)習(xí)參數(shù),部分傳統(tǒng)卷積層通過(guò)可分離卷積結(jié)構(gòu)替代,完成人臉檢測(cè)網(wǎng)絡(luò)的深度可分離卷積設(shè)計(jì),最終得到[Pnet]、[Rnet]、[Onet]網(wǎng)絡(luò)結(jié)構(gòu)[1]。

為驗(yàn)證算法有效性,開(kāi)展算法模型訓(xùn)練,并結(jié)合人臉檢測(cè)測(cè)試庫(kù)對(duì)檢測(cè)速度和效果進(jìn)行測(cè)試,具體選擇[wide face]數(shù)據(jù)集,數(shù)據(jù)集中的人臉照片、人臉I(yè)D數(shù)量 分別為 393703張、32203個(gè),從中隨機(jī)選取40%的每個(gè)事件類人臉照片。同時(shí)將自建的亞洲數(shù)據(jù)集作為其中的事件場(chǎng)景照片,數(shù)據(jù)集的人臉照片、人臉I(yè)D數(shù)量分別為20000張、10000個(gè)。人臉關(guān)鍵點(diǎn)訓(xùn)練集選擇[Celeb A]數(shù)據(jù)集,數(shù)據(jù)集包含屬性標(biāo)記、人臉特征點(diǎn)數(shù)量分別為40個(gè)、5個(gè),[Onet]網(wǎng)絡(luò)基于關(guān)鍵點(diǎn)坐標(biāo)進(jìn)行訓(xùn)練。完成數(shù)據(jù)預(yù)處理后,形成各個(gè)網(wǎng)絡(luò),對(duì)比原版[MTCNN]可以發(fā)現(xiàn),訓(xùn)練時(shí)精度在每個(gè)階段網(wǎng)絡(luò)與原版網(wǎng)絡(luò)差異明顯,但這種差異逐漸在測(cè)試集上縮小,模型計(jì)算量降低得以在算法效果保證的前提下實(shí)現(xiàn),在設(shè)備計(jì)算能力相同時(shí),能夠得到大幅降低的一次正向傳播時(shí)間,網(wǎng)絡(luò)設(shè)計(jì)有效性得到證明[2]。

1.2 人臉識(shí)別算法

在人臉識(shí)別算法設(shè)計(jì)中,研究選擇的人臉識(shí)別損失函數(shù)為[insightface loss ],該函數(shù)能夠在優(yōu)化和約束間尋求平衡,在訓(xùn)練收斂、訓(xùn)練數(shù)據(jù)集包容性方面表現(xiàn)出色。損失函數(shù)、網(wǎng)絡(luò)、數(shù)據(jù)三種因素均會(huì)影響模型效果,對(duì)于學(xué)習(xí)導(dǎo)向不準(zhǔn)確的損失函數(shù),大規(guī)模的高質(zhì)量數(shù)據(jù)集具備一定補(bǔ)償作用,深度CNN模型可基于大數(shù)據(jù)實(shí)現(xiàn)性能提升,而考慮到大型數(shù)據(jù)集注釋過(guò)程較為復(fù)雜,且人臉識(shí)別存在開(kāi)放性特點(diǎn),訓(xùn)練時(shí)分類模型會(huì)遇到很多新的身份,因此本文設(shè)計(jì)一種能夠?qū)ξ礃?biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練的損失函數(shù)。設(shè)網(wǎng)絡(luò)模型、樣本分別為M、X,送入網(wǎng)絡(luò)后樣本最后一個(gè)全連接層輸出[(x1,x2,x3,x4,x5,…,xn)],其中n、[x1,x2,x3,x4,x5,…,xn]分別代表類別數(shù)、不同身份中心與樣本的距離,如預(yù)測(cè)正確,存在為k的分類結(jié)果,條件[k=argmaxxk]滿足。在訓(xùn)練集中未出現(xiàn)樣本的影響下,其屬于新的類別,因此所有[x1,x2,x3,x4,x5,…,xn]在理想情況下需盡可能小,具體樣本過(guò)濾可選擇設(shè)定閾值方式,且[x1,x2,x3,x4,x5,…,xn]需要保證概率和為1的所有類別,滿足[x1+x2+x3+x4+x5+…+xn=1],具體可表示為:

結(jié)合式(1)進(jìn)行分析可以發(fā)現(xiàn),不存在單一的解決方案,屬于典型的多目標(biāo)約束最小化問(wèn)題,因此需要保證存在偏向任何身份中心的[x1,x2,x3,x4,x5,…,xn]概率分布,可獲得問(wèn)題解決方案:

考慮到損失函數(shù)無(wú)法采用最大化目標(biāo),基于最小化形式開(kāi)展目標(biāo)轉(zhuǎn)換,進(jìn)行未知身份排斥損失函數(shù)的針對(duì)性構(gòu)造,具體為:

基于上式進(jìn)行組合,最終得到新的損失函數(shù),具體為:

上式中的[ε]表示為超參數(shù),算法在其數(shù)值為0.15時(shí)存在最好效果。在歸一化權(quán)重和特征后,存在n維輸入向量的全連接層輸出,樣本特征空間可以此代表。同一類樣本映射在特征空間中的特征點(diǎn)需要在對(duì)應(yīng)聚類中心旁圍繞,身份類集群相同的特征中心可通過(guò)某一行向量表示,該向量原因權(quán)重矩陣存在于全連接層中,即[wk],通過(guò)將不同身份重心進(jìn)行稀疏分布,模型具備更好的判別能力,對(duì)于任何樣本,訓(xùn)練好的模型均能夠保證得到逼近中心的特征向量。

開(kāi)展具體實(shí)驗(yàn),按照兩個(gè)階段進(jìn)行訓(xùn)練,采用的實(shí)驗(yàn)環(huán)境與人臉檢測(cè)算法實(shí)驗(yàn)相同。在第一個(gè)階段,模型訓(xùn)練采用完全監(jiān)督方式,這一過(guò)程中的主干網(wǎng)絡(luò)、損失函數(shù)分別為[mobilefacene]、[insightface loss(l1)],直到模型收斂。在第二個(gè)階段,一起部署兩種損失函數(shù),訓(xùn)練通過(guò)半監(jiān)督方式進(jìn)行,這一過(guò)程存在不變的整體批次大小,減少1/4標(biāo)記圖像在單個(gè)批次中的數(shù)量,其余1/4通過(guò)未標(biāo)記數(shù)據(jù)開(kāi)展補(bǔ)充,分別開(kāi)展損失計(jì)算。對(duì)比本文設(shè)計(jì)損失函數(shù)和[insightface loss]損失函數(shù)可以發(fā)現(xiàn),各個(gè)數(shù)據(jù)集上損失函數(shù)在改進(jìn)后均有所提升,這種提升在跨角度數(shù)據(jù)集最為顯著,各個(gè)數(shù)據(jù)上損失函數(shù)[insightface loss(l1)]的表現(xiàn)優(yōu)異,原有損失函數(shù)受[TAR@FAR]標(biāo)準(zhǔn)提升存在正常的結(jié)果下降,但本文設(shè)計(jì)的損失函數(shù)未出現(xiàn)大幅度下降且擁有更高的準(zhǔn)確率[3]。

2 人臉識(shí)別系統(tǒng)設(shè)計(jì)

2.1 總體設(shè)計(jì)

本文研究的人臉識(shí)別系統(tǒng)設(shè)計(jì)從工業(yè)角度展開(kāi),選擇[Windows]系統(tǒng)進(jìn)行搭建,系統(tǒng)編譯語(yǔ)言選擇C#和C++,前者用于界面顯示和邏輯業(yè)務(wù)處理,后者用于密集計(jì)算模塊,具體開(kāi)發(fā)軟件選擇[Visual Studio 2015]。

通過(guò)分析可以發(fā)現(xiàn),整個(gè)系統(tǒng)由六個(gè)模塊組成。密集計(jì)算模塊屬于底層模塊,負(fù)責(zé)承載人臉識(shí)別算法和人臉檢測(cè)算法,可視作正向傳播框架,能夠滿足網(wǎng)絡(luò)模型加載需要,為正向網(wǎng)絡(luò)傳播提供支持;讀卡器模塊負(fù)責(zé)身份證讀卡器API的調(diào)用,提取身份證照片并對(duì)比現(xiàn)場(chǎng)照片;實(shí)時(shí)人臉檢測(cè)模塊負(fù)責(zé)人臉檢測(cè),需基于實(shí)時(shí)[rtsp]碼進(jìn)行檢測(cè),屬于人臉檢測(cè)算法應(yīng)用層,能夠按照112*112規(guī)格對(duì)齊人臉區(qū)域裁剪圖;人臉識(shí)別模塊存在刷卡、刷臉兩種模式,屬于人臉識(shí)別算法應(yīng)用層,負(fù)責(zé)人臉特征提取,證件照片可在刷卡模式中完成人臉特征提取,比對(duì)相似度?,F(xiàn)場(chǎng)人臉特征可在刷臉模式下與圖片特征庫(kù)比較相似度;數(shù)據(jù)管理模塊負(fù)責(zé)記錄行人來(lái)往數(shù)據(jù),需轉(zhuǎn)化為本地特征庫(kù),程序運(yùn)行內(nèi)存中需要由該模塊加入本地特征庫(kù);界面顯示模塊的顯示形式采用視頻流動(dòng)態(tài),模擬身份證為讀卡器數(shù)據(jù)呈現(xiàn)形式,圖標(biāo)形式負(fù)責(zé)人臉識(shí)別結(jié)果表現(xiàn)。

管理員在辦公室場(chǎng)景中可基于數(shù)據(jù)管理模塊轉(zhuǎn)換生活照片為人臉特征,二進(jìn)制特征庫(kù)在軟件本地形成。刷臉模式屬于常規(guī)系統(tǒng)工作模式,對(duì)于進(jìn)入一定區(qū)域的人員,每一幀圖像的人臉能夠由人臉檢測(cè)模塊進(jìn)行實(shí)時(shí)監(jiān)測(cè),如檢測(cè)到面積超過(guò)一定閾值的人臉后,系統(tǒng)人臉識(shí)別功能自動(dòng)開(kāi)啟,當(dāng)前被檢測(cè)人臉通過(guò)本地特征庫(kù)實(shí)現(xiàn)身份信息自動(dòng)匹配,訪客數(shù)據(jù)庫(kù)負(fù)責(zé)存儲(chǔ)來(lái)訪的身份信息,輔以其他智能系統(tǒng),智能化管理可依托訪客數(shù)據(jù)庫(kù)實(shí)現(xiàn)。如本地?cái)?shù)據(jù)庫(kù)中不存在來(lái)訪人員信息,身份校驗(yàn)可基于身份證實(shí)現(xiàn)。

對(duì)于圖像特征庫(kù)未注冊(cè)用戶,刷臉模式對(duì)外來(lái)人員按照兩個(gè)階段進(jìn)行人臉識(shí)別,第一階段需要依托讀卡器讀取的身份證信息,獲取用戶信息和身份證照片,之后通過(guò)字符串?dāng)?shù)據(jù)包將信息傳送給人臉識(shí)別模塊和界面模塊,實(shí)現(xiàn)信息顯示,同時(shí)攝像頭當(dāng)前視頻幀需要由人臉識(shí)別模塊讀取。完成人臉定位和人臉區(qū)域裁剪處理后,通過(guò)對(duì)特征提取接口調(diào)用,歸一化圖片編碼為特征向量,開(kāi)展向量差異計(jì)算,最終完成比對(duì),界面模塊能夠直觀顯示比對(duì)結(jié)果,結(jié)果需同時(shí)在數(shù)據(jù)庫(kù)中保存。

2.2 具體實(shí)現(xiàn)

研究采用C++語(yǔ)言設(shè)計(jì)密集計(jì)算模塊,網(wǎng)絡(luò)構(gòu)建框架選擇開(kāi)源項(xiàng)目[ZQCNN],按照動(dòng)態(tài)鏈接庫(kù)進(jìn)行人臉識(shí)別及人臉檢測(cè)功能封裝?;诳蚣芫?jiǎn)特性,對(duì)于對(duì)數(shù)函數(shù)、指數(shù)、計(jì)算正弦,擴(kuò)展基于單指令多數(shù)據(jù)流技術(shù)實(shí)現(xiàn),開(kāi)源的[Open Blas]負(fù)責(zé)基礎(chǔ)線性代數(shù)。采用類似于[caffe]框架的框架設(shè)計(jì),基于[Tensor4D]、[layers]類、[nets]類分別進(jìn)行數(shù)據(jù)基本儲(chǔ)存單位、神經(jīng)網(wǎng)絡(luò)層、多個(gè)網(wǎng)絡(luò)層建立。基于[python]轉(zhuǎn)化算法為C++,并將初始化模型、結(jié)果獲取等步驟在[Face Extract.dll]和[Face Detect.dll]中封裝,圖3為密集計(jì)算庫(kù)示意圖。

人臉檢測(cè)模塊模型需要對(duì)人臉檢測(cè)庫(kù)進(jìn)行調(diào)用,保證人臉檢測(cè)圍繞每一幀圖片開(kāi)展,系統(tǒng)開(kāi)啟攝像頭類型基于配置文件決定,可對(duì)檢測(cè)感興趣區(qū)域和圖像幀分辨率進(jìn)行設(shè)定。每一幀獲取需要得到[EMGU]開(kāi)源庫(kù)支持,向人臉檢測(cè)接口傳遞每一幀圖像數(shù)據(jù),當(dāng)前檢測(cè)圖像幀中需要渲染檢測(cè)結(jié)果,效果展示最終在UI界面開(kāi)展,人臉檢測(cè)接口設(shè)計(jì)中[detect]為核心API,[Face Infor Array]結(jié)構(gòu)體負(fù)責(zé)檢測(cè)結(jié)果返回,具體參數(shù)設(shè)置通過(guò)構(gòu)造函數(shù)完成。人臉識(shí)別模塊以兩種工作模式和對(duì)人臉特征庫(kù)調(diào)用為核心,特征提取接口將人臉區(qū)域照片輸入,依托浮點(diǎn)型數(shù)組輸入,相似度可通過(guò)對(duì)[Calculate Similarity]調(diào)用獲取,是否為同一人通過(guò)比較判斷閾值實(shí)現(xiàn)。

3 結(jié)論

綜上所述,基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)存在較高推廣價(jià)值。在此基礎(chǔ)上,本文涉及的人臉檢測(cè)算法、人臉識(shí)別算法等內(nèi)容,則直觀展示了人臉識(shí)別技術(shù)應(yīng)用路徑。為更好發(fā)揮人臉識(shí)別技術(shù)優(yōu)勢(shì),還需要關(guān)注技術(shù)在物聯(lián)網(wǎng)設(shè)備上的應(yīng)用,這種應(yīng)用需得到專用人工智能芯片的支持,圍繞這類芯片開(kāi)展的研究將成為筆者下一步研究方向。

參考文獻(xiàn):

[1] 裴慶慶.基于深度學(xué)習(xí)算法的人臉識(shí)別方法研究[J].電子技術(shù)與軟件工程,2021(6):114-115.

[2] 沈繼云.試析基于神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法的人臉識(shí)別技術(shù)[J].信息技術(shù)與信息化,2020(5):228-230.

[3] 崔慶華.基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)分析[J].計(jì)算機(jī)產(chǎn)品與流通,2020(5):136.

【通聯(lián)編輯:光文玲】

收稿日期:2021-06-15

基金項(xiàng)目:基于深度學(xué)習(xí)面向物端實(shí)時(shí)人臉識(shí)別技術(shù)研究(項(xiàng)目編號(hào):WAYS202102)

作者簡(jiǎn)介:張寧仙(1986—),女,陜西澄城人,碩士,講師,主要研究方向?yàn)閳D像處理、模式識(shí)別。

猜你喜歡
人臉識(shí)別技術(shù)人臉檢測(cè)深度學(xué)習(xí)
人臉識(shí)別在高校公寓管理中的應(yīng)用研究
東方教育(2016年15期)2017-01-16 11:59:07
基于人臉特征定位的SNS網(wǎng)站應(yīng)用組件研究與設(shè)計(jì)
基于Android平臺(tái)的人臉識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
人臉識(shí)別技術(shù)在公共安防視頻監(jiān)控領(lǐng)域的應(yīng)用
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于Matlab的人臉檢測(cè)實(shí)驗(yàn)設(shè)計(jì)
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
基于PCA和Fisher線性判別技術(shù)的人臉識(shí)別算法
将乐县| 施甸县| 仪陇县| 阳城县| 遵义市| 宜川县| 廉江市| 冷水江市| 平原县| 娱乐| 钟祥市| 于田县| 什邡市| 青浦区| 湖口县| 胶南市| 长武县| 嘉善县| 福建省| 唐河县| 襄樊市| 鄢陵县| 齐齐哈尔市| 庐江县| 基隆市| 毕节市| 南澳县| 文安县| 郸城县| 昌图县| 瓮安县| 南部县| 大兴区| 伊吾县| 正镶白旗| 从化市| 自治县| 乌拉特后旗| 武夷山市| 平度市| 巴彦淖尔市|