国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

LSTM—RBM—NMS模型下的視頻人臉檢測方法研究

2019-05-24 14:11田桂謝凱
電腦知識與技術(shù) 2019年4期

田桂 謝凱

摘要:為提高視頻人臉檢測的準(zhǔn)確性,我們提出了LSTM-RBM-NMS模型下的視頻人臉檢測方法。該模型首先利用公開的視頻人臉數(shù)據(jù)集輸入長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)網(wǎng)絡(luò)中,在 LSTM網(wǎng)絡(luò)中加入批量歸一化(Batch Normalization, BN)算法,在預(yù)訓(xùn)練的模型中,采用受限玻爾茲曼機(jī)代替全連接層。然后將預(yù)訓(xùn)練好的模型去除softmax分類器,使用支持向量機(jī)(Support Vector Machine, SVM)分類器進(jìn)行代替,最后采用非極大值抑制算法消除多余的窗口,最后得到視頻人臉檢測結(jié)果。實(shí)驗(yàn)結(jié)果表明,通過使用本文提出的LSTM-RBM-NMS模型,與傳統(tǒng)的視頻人臉檢測方法OpenCV和Viola Jones(VJ)相比,在相同閾值的情況下,視頻人臉檢測準(zhǔn)確率提高了3.3%~10.4%。

關(guān)鍵詞:視頻人臉檢測;長短期記憶網(wǎng)絡(luò);批量歸一化算法;受限玻爾茲曼機(jī);非最大抑制算法

中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2019)04-0176-02

目前用戶進(jìn)行身份驗(yàn)證的方法主要是基于PIN模式的,這只在初始登錄期間提供身份驗(yàn)證。用戶在注冊時設(shè)定的密碼,很容易被網(wǎng)絡(luò)攔截,進(jìn)而被黑客破解,因此使用密碼進(jìn)行用戶身份認(rèn)證是極其不安全的。近年來,使用生物特征進(jìn)行用戶認(rèn)證已經(jīng)成為主流,例如基于觸摸手勢的系統(tǒng)、基于人臉的系統(tǒng)[1]和基于語音系統(tǒng)。近年來,隨著硬件設(shè)備更新地越來越快,對機(jī)器學(xué)習(xí)領(lǐng)域中的深度學(xué)習(xí)的探討已經(jīng)成了一種潮流。目前圖像處理最好的算法就是深度學(xué)習(xí)。與之相比,深度學(xué)習(xí)則能自動地對特征進(jìn)行提取和表示,而且一個高效的神經(jīng)網(wǎng)絡(luò)框架可以對抽象物體進(jìn)行解釋和分析。近十年來,許多學(xué)者對深度學(xué)習(xí)[2]的算法性能進(jìn)行了優(yōu)化,設(shè)計了卷積神經(jīng)網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)框架。例如,Matthew Zeiler和Rob Fergus在神經(jīng)網(wǎng)絡(luò)中加入了批量歸一化算法[3],它是一種非常有效的深度學(xué)習(xí)技術(shù),極大地加快網(wǎng)絡(luò)收斂的速度。然而,近年來一些研究學(xué)者逐漸從圖像處理領(lǐng)域研究到視頻處理領(lǐng)域,與靜態(tài)圖像人臉檢測相比,視頻中的人臉具有更多的空間信息,包括無約束的姿態(tài)變化、光照變化、對象遮擋等。一些傳統(tǒng)的視頻處理方法可以在受限場景下工作,但無法處理各種變化的復(fù)雜場景。視頻人臉的處理非常復(fù)雜。而長短期記憶網(wǎng)絡(luò)[4]是針對視頻處理提出的。根據(jù)以往的研究證明,深度學(xué)習(xí)在語音識別、人臉識別、圖像分類、目標(biāo)檢測[5]等領(lǐng)域取得了重大進(jìn)步。

1 本文模型

針對視頻中的人臉檢測,本文采用長短期記憶網(wǎng)絡(luò)進(jìn)行特征提取,本文的模型如圖1所示。

我們將公開視頻數(shù)據(jù)集分為訓(xùn)練集和測試集,采用訓(xùn)練集進(jìn)行訓(xùn)練LSTM網(wǎng)絡(luò),在訓(xùn)練的過程中,加入歸一化層,加快訓(xùn)網(wǎng)絡(luò)的收斂速度,同時使用隨機(jī)池化層進(jìn)行降維。我們采用RBM代替全連接層,進(jìn)一步對提取的特征向量進(jìn)行降維,這樣就可以減少計算代價。我們將預(yù)訓(xùn)練好的模型,移除softmax分類器用于視頻人臉的測試集上進(jìn)行提取人臉的深度特征,將這些特征采用SVM分類器進(jìn)行分類,SVM分類器泛化能力強(qiáng),精度高。最后采用非最大抑制算法去除交叉重復(fù),最后得到視頻人臉檢測的結(jié)果。

2 實(shí)驗(yàn)結(jié)果和分析

本文采用兩個公開的數(shù)據(jù)集,即YouTube視頻人臉數(shù)據(jù)集和IJB-A視頻人臉數(shù)據(jù)集。我們知道人臉檢測,閾值的選擇是非常重要的。因?yàn)殚撝档拇笮绊懭四槞z測的準(zhǔn)確性,所以分別選擇不同的閾值來進(jìn)行實(shí)驗(yàn)。根據(jù)圖2,我們可以看出,準(zhǔn)確率與人臉檢測閾值成反比,即隨著人臉檢測閾值的增大,準(zhǔn)確率反而呈現(xiàn)下降趨勢。

從圖中可以看出,值得注意的是閾值在0.1處時,人臉檢測的準(zhǔn)確率最高,而在0.3到0.5之間,可以看出準(zhǔn)確率下降的最快。在相同的閾值條件下,本文方法比其他方法具有更高的準(zhǔn)確性。

3 結(jié)論

本文提出的LSTM-RBM-NMS模型下的視頻人臉檢測方法,我們采用公開的兩個數(shù)據(jù)集預(yù)訓(xùn)練的LSTM網(wǎng)絡(luò),同時加入歸一化算法,加快了網(wǎng)絡(luò)的收斂速度,采用RBM替換全連接層,降低了特征維度,即減少了計算代價,將預(yù)訓(xùn)練好的模型去除softmax分類器,采用SVM分類器替代用于檢測的視頻人臉幀上,,采用非最大抑制算法,獲得最好的人臉檢測區(qū)域,與傳統(tǒng)的方法相比,該模型極大地減少了網(wǎng)絡(luò)參數(shù),加快了視頻人臉檢測的速度,同時提高了視頻人臉檢測的準(zhǔn)確率。

參考文獻(xiàn):

[1] 廖延娜,馬超.基于稀疏表示的人臉識別系統(tǒng)設(shè)計與實(shí)現(xiàn)[J].電子設(shè)計工程,2016,24(17):153-155.

[2] 丁冬兵.TL-CNN-GAP模型下的小樣本聲紋識別方法研究[J].電腦知識與技術(shù),2018(24).

[3] 張杰,陳懷新.基于歸一化詞頻貝葉斯模型的文本分類方法[J].計算機(jī)工程與設(shè)計,2016, 37(3):799-802.

[4] 陳斌,周勇,劉兵.基于卷積長短期記憶網(wǎng)絡(luò)的事件觸發(fā)詞抽取方法[J].計算機(jī)工程,2018(9).

[5] 李旭冬,葉茂,李濤.基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測研究綜述[J].計算機(jī)應(yīng)用研究,2017, 34(10):2881-2886.

【通聯(lián)編輯:唐一東】