国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)與二維離散小波分解特征相融合的adaboost人臉識(shí)別模型

2020-03-23 05:56黃健
軟件工程 2020年2期
關(guān)鍵詞:小波變換人臉識(shí)別

黃健

摘 ?要:為了提高人臉識(shí)別的效率,本文提出了一種將小波分析、深度學(xué)習(xí)和adaboost分類器相結(jié)合的人臉識(shí)別方法。傳統(tǒng)的基于小波變換的人臉識(shí)別算法僅僅提取了小波分解的低頻分量用于分類圖像的特征,為了更有效地提取人臉圖像特征,提出了一種將傳統(tǒng)特征和深度特征相融合的人臉識(shí)別算法。首先,通過二維離散小波變換函數(shù)對(duì)人臉圖像進(jìn)行二維離散小波變換,提取出人臉圖像的低頻部分作為特征值,接著通過深度殘差網(wǎng)絡(luò)提取人臉深度特征,最后將融合后的特征應(yīng)用adaboost分類器進(jìn)行分類識(shí)別。通過在ORL人臉庫實(shí)驗(yàn)證明,融合后的方法能有效地提高分類識(shí)別率。

關(guān)鍵詞:小波變換;人臉識(shí)別;殘差網(wǎng)絡(luò);Adaboost分類

中圖分類號(hào):TP393 ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

1 ? 引言(Introduction)

人臉圖像的特征提取是進(jìn)行人臉識(shí)別的首要前提[1]。目前的一些識(shí)別方法大多數(shù)是基于K均值、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和線性鑒別的方法[2-4]。文獻(xiàn)[5]設(shè)計(jì)了三種基于BP神經(jīng)網(wǎng)絡(luò)的人臉分類識(shí)別方法,即通過最大分量值辨別法、門限閾值歸類法和中心區(qū)域分類法對(duì)待辨識(shí)數(shù)據(jù)進(jìn)行特征歸類和人臉識(shí)別。Chien等人[6]最早提出了應(yīng)用二維離散小波變換對(duì)人臉圖像進(jìn)行特征提取,通過對(duì)圖像進(jìn)行多尺度分解,將提取到的低頻分量作為圖像特征,然后進(jìn)行分類識(shí)別。在2015年,He K M等人[7]提出的新的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),改變了深度學(xué)習(xí)的發(fā)展方向,其中包含的殘差單元有效地解決了網(wǎng)絡(luò)由于過深而出現(xiàn)的退化問題。

本文分別用二維離散小波變換提取人臉圖像的低頻特征和深度殘差網(wǎng)絡(luò)提取出的深度特征作為輸入,將提取的人臉特征分別放入adaboost分類器中進(jìn)行特征分類。由于傳統(tǒng)特征的每個(gè)區(qū)域會(huì)有獨(dú)立的特征表達(dá),而深度特征只有唯一的一個(gè)針對(duì)整體區(qū)域的特征,這樣會(huì)造成特征在數(shù)量上和維度上都存在很大差異。同時(shí)為了能夠使傳統(tǒng)特征完整地實(shí)現(xiàn)有效區(qū)域判斷操作,該算法最終將深度特征和傳統(tǒng)特征進(jìn)行融合操作。

2 ?人臉圖像的特征提?。‵eature extraction of face image)

2.1 ? 二維離散小波提取特征

小波可以簡單地描述為一種函數(shù),這種函數(shù)在有限時(shí)間范圍內(nèi)變化,并且平均值為0。同時(shí),小波變換還具有變化的頻率,持續(xù)時(shí)間也是有限的,同時(shí)具備多分辨率和多尺度分析的優(yōu)點(diǎn)。

二維圖像小波分解,就是豎直和水平的高通和低通算子先后作用于圖像的行和列的過程。假設(shè)給定平方可和二維離散圖像,令,。

則二維圖像小波分解遞推公式1為:

其中,是圖像的低頻成分,而D1、D2、D3是圖像在LH、HL、HH三個(gè)方向上的高頻成分。我們采用多尺度二維小波變換來提取面部特征。使用二維小波變換,我們通過相對(duì)于列向量和陣列像素的行向量的高通和低通濾波將圖像數(shù)據(jù)分解為四個(gè)子圖像。它是一維小波變換的擴(kuò)展技術(shù),其中沿垂直方向進(jìn)行分解,然后是水平方向。圖1中展示了二維小波分解的基本元素,其中G和H分別代表高通和低通濾波器,↓2表示為子采樣。

在一個(gè)2D濾波器組中,我們在原始圖像陣列的列向量中采用一維小波變換,圖像被分解成對(duì)應(yīng)于高通頻帶和低通頻帶的子圖像。假設(shè)原始圖像是由像素組成的矩陣,得到的子圖像和變?yōu)榈木仃?。在第二階段,我們沿行向量方向分解圖像和,又將上一層的高頻、低頻子帶生成、、子帶,所有的子圖像都變成像素大小的矩陣。如圖2所示,為我們展示一層分解后的各分量和二層分解后的圖像。我們將經(jīng)過二次小波分解后的低頻分量作為最終的人臉特征向量。

2.2 ? 改進(jìn)后的深度殘差網(wǎng)絡(luò)

越深的網(wǎng)絡(luò)效果越好,但是隨著網(wǎng)絡(luò)層數(shù)的增加,存在的問題也隨之而來:首先是梯度的消失和發(fā)散,導(dǎo)致了訓(xùn)練難以收斂。

我們在研究過程中同樣構(gòu)建了ResNet深度殘差網(wǎng)絡(luò)并在其基礎(chǔ)上進(jìn)行了改進(jìn),與傳統(tǒng)的深度網(wǎng)絡(luò)相比,通過深度殘差網(wǎng)絡(luò)結(jié)構(gòu),如圖3所示,并加入了y=x(恒等映射層),這樣可以使得隨著網(wǎng)絡(luò)層數(shù)的加深并不會(huì)出現(xiàn)梯度消失的現(xiàn)象,同時(shí)具有良好的收斂效果。由于我們所選用的樣本數(shù)量較小,較深的網(wǎng)絡(luò)層次,反而會(huì)導(dǎo)致精度下降,因此我們通過疊加14個(gè)卷積層,構(gòu)建一個(gè)ResNet-14網(wǎng)絡(luò)模型。

首先在第一層卷積選取上,我們使用大小為5×5的卷積核,設(shè)置其步長為1,Padding的大小同樣也為1,這樣可使得卷積的輸入與輸出能夠具有相同的特征圖,接著再進(jìn)行平均池化。為了減小特征圖的大小,簡化網(wǎng)絡(luò)計(jì)算復(fù)雜度,選擇2×2的濾波器,步長為2,輸入第一個(gè)殘差單元。

我們提出的深度殘差網(wǎng)絡(luò)模型包含6個(gè)殘差單元,并且每個(gè)殘差單元使用相同的結(jié)構(gòu),也不改變每個(gè)殘差單元輸入與輸出的尺寸大小。首先使用BN算法對(duì)每次輸出的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,這樣可使有效參數(shù)穩(wěn)定網(wǎng)絡(luò)收斂,防止深度網(wǎng)絡(luò)過擬合。為了增加神經(jīng)網(wǎng)絡(luò)各層次之間的非線性關(guān)系,我們使用Relu激活函數(shù)對(duì)經(jīng)過BN算法處理后的數(shù)據(jù)進(jìn)行激活,通過Relu實(shí)現(xiàn)稀疏后的模型能夠更好地挖掘數(shù)據(jù)特征,擬合訓(xùn)練數(shù)據(jù)。接著再將激活后的數(shù)據(jù)輸入到下一個(gè)卷積層中,為確保具有相同的輸入輸出,我們只改變卷積核的大小為3×3,步長和Padding仍為1;同上,繼續(xù)使用BN算法和Relu函數(shù)對(duì)數(shù)據(jù)進(jìn)行操作,輸入到第二個(gè)卷積層,相關(guān)參數(shù)不改變;最后將第二個(gè)卷積的輸出與殘差元的輸入通過矩陣相加運(yùn)算作為下一個(gè)殘差單元的輸入,最終實(shí)現(xiàn)深度殘差網(wǎng)絡(luò)中核心思想,將需要學(xué)習(xí)的特征映射轉(zhuǎn)換為F(x)+x。

在通過六個(gè)殘差單元后,緊接著連接一個(gè)均值下采樣層,最后再連接一個(gè)全連接層作為輸出。其中各層次的參數(shù)如表1所示,通過各層次濾波器的不同組合,對(duì)輸入的人臉圖像進(jìn)行特征學(xué)習(xí),最終輸出人臉深度特征。

2.3 ? Adaboost分類器原理

Adaboost算法[8]是一種分類器算法,其基本思想是通過一定的方法將大量分類能力一般的簡單分類器疊加起來,經(jīng)過層層疊加得到一個(gè)分類能力很強(qiáng)的強(qiáng)分類器。理論研究表明,當(dāng)每個(gè)簡單分類器的分類能力比隨機(jī)猜測要好時(shí),只要簡單分類器個(gè)數(shù)趨于無窮時(shí),那么強(qiáng)分類器的錯(cuò)誤率將趨于零。算法流程圖如圖4所示,一個(gè)弱分類器由特征、閾值,以及偏置位(指明了不等式方向的量)組成,將一個(gè)個(gè)弱分類器經(jīng)過T次迭代獲得T個(gè)最佳分類器再組合成一個(gè)強(qiáng)分類器,最后將預(yù)測函數(shù)做為最后的分類函數(shù)來判斷是否是同一人的人臉圖像。

3 ? 算法實(shí)現(xiàn)(Algorithm implementation)

在利用傳統(tǒng)二維離散小波進(jìn)行特征提取時(shí),我們只選取了二維分解后的低頻子圖作為最后的特征,而舍棄了高頻子圖、和。又因?yàn)閭鹘y(tǒng)特征的每個(gè)區(qū)域都有其獨(dú)立的特征表達(dá),所以這種直接舍棄高頻子圖,只選取低頻子圖的分類識(shí)別方法存在明顯不足。考慮到深度特征具有唯一的一個(gè)針對(duì)整體區(qū)域的特征,但是其容易造成數(shù)量和維度上的差異。基于此,我們想到將這兩種特征進(jìn)行分類識(shí)別后進(jìn)行信息融合。本算法的流程圖可大致如圖5所示。

算法的具體實(shí)現(xiàn)步驟如下:

(1)根據(jù)公式(1)對(duì)處理后(人臉庫)的人臉圖像進(jìn)行二維離散小波變換。

(2)提取步驟(1)小波分解后的四個(gè)分量并只選取低頻分量拉平輸出。

(3)利用改進(jìn)后的深度殘差模型進(jìn)行深度特征提取。

(4)將提取到的傳統(tǒng)特征和深度特征作為人臉圖像的特征并將所有樣本分為訓(xùn)練集和測試集,選擇合適的分類參數(shù),訓(xùn)練得到adaboos分類模型。再把測試樣本提供給分類器,由adaboost給出最終識(shí)別結(jié)果。

(5)由于傳統(tǒng)方法和深度學(xué)習(xí)方法有各自的優(yōu)缺點(diǎn),我們再進(jìn)行決策層的融合,通過加權(quán)平均的方法如公式(2)所示,對(duì)分類后的一列概率進(jìn)行取均,這樣可以取長補(bǔ)短,有些預(yù)測錯(cuò)誤的分類進(jìn)行取均后可以被判斷正確,預(yù)測出概率最大的一列向量作為我們最后的實(shí)驗(yàn)結(jié)果。

4 ?實(shí)驗(yàn)結(jié)果與分析(Experimental results and analysis)

本次實(shí)驗(yàn)采用的是ORL人臉數(shù)據(jù)庫,該人臉庫中共有40個(gè)不同年齡、不同性別和種族的人,并且每人各十幅角度、表情各不相同的人臉圖像,每幅圖像的大小為112*92,共計(jì)400幅灰度圖像,部分人臉圖像如圖6所示。我們選取每個(gè)人的前n張圖像作為測試集,剩余的10-n張圖像作為訓(xùn)練集,則最終的測試集由40*n張圖像構(gòu)成,訓(xùn)練集圖像則為40*(10-n)張。

因此,我們要設(shè)計(jì)出9組比較實(shí)驗(yàn),分別記錄下測試集為n時(shí),所對(duì)應(yīng)的分類識(shí)別率,另外我們還設(shè)置了隨機(jī)參數(shù)i,對(duì)輸入的圖片進(jìn)行隨機(jī)分割,以選擇出最佳的分割效果,提升準(zhǔn)確率。經(jīng)過多次實(shí)驗(yàn)比較,可取到一個(gè)合適的參數(shù)i來提升實(shí)驗(yàn)的準(zhǔn)確率。為驗(yàn)證該算法分類模型的可行性,分別在不同的分類器下進(jìn)行分類識(shí)別實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖7所示。

可以清晰地看到在Adaboost分類模型下,將基模型的決策樹模型換成邏輯回歸具有較好的識(shí)別率。

在方法可行性上,本實(shí)驗(yàn)通過與文獻(xiàn)[9]基于改進(jìn)的深度卷積網(wǎng)絡(luò)算法相比,在精確度上有所提高;與文獻(xiàn)[10]同樣在二維離散小波基礎(chǔ)上進(jìn)行改進(jìn)的方法相比,在準(zhǔn)確率上略有增長。最終實(shí)驗(yàn)結(jié)果如表2所示。

由表2可以看出,隨著測試樣本的增多,訓(xùn)練樣本的減少,準(zhǔn)確率也在逐漸地下降。由于我們所選取的人臉樣本集相對(duì)來說比較小,深度學(xué)習(xí)的方法體現(xiàn)不出其強(qiáng)大的優(yōu)勢,但同傳統(tǒng)方法相融合,在分類識(shí)別上還是能有效提高準(zhǔn)確率。

5 ? 結(jié)論(Conclusion)

現(xiàn)如今基于傳統(tǒng)方法的人臉識(shí)別在準(zhǔn)確率上已經(jīng)很難繼續(xù)提升,越來越多的學(xué)者將研究方向轉(zhuǎn)移到深度學(xué)習(xí)上,本文將傳統(tǒng)方法和深度學(xué)習(xí)方法相融合,取最后的加權(quán)平均后的結(jié)果作為最終的結(jié)果,實(shí)驗(yàn)證明該方法具有識(shí)別率高的優(yōu)點(diǎn),該方法只在靜態(tài)的人臉上進(jìn)行了實(shí)驗(yàn),如何在動(dòng)態(tài)人臉或者增加樣本數(shù)量以進(jìn)行有效識(shí)別,是今后研究的方向。

參考文獻(xiàn)(References)

[1] LI W,LIU L,GONG W.Multi-object uniform design as a SVM model selection tool for face recognition[J].Expert Systems with Application,2011,38(6):6689-6695.

[2] 姜文濤,劉萬軍,袁妲.一種基于曲量場空間的人臉識(shí)別算法[J].計(jì)算機(jī)學(xué)報(bào),2012,8(35):1740-1750.

[3] FU L,LIN Z,ZHONG J.Face recognition using discriminant locality preserving projections based on maximum margin criterion[J].Pattern Recognition,2010,43(14):3572-3579.

[4] 胡峰松,張茂軍,鄒北驥,等.基于 HMM 的單樣本可變光照、姿態(tài)人臉識(shí)別[J].計(jì)算機(jī)學(xué)報(bào),2009,7(32):1424-1433.

[5] 溫洲,邵曉巍,龔德仁.基于BP神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別后續(xù)分類算法[J].計(jì)算機(jī)應(yīng)用,2011,31(2):133-136.

[6] Chien J T,Wu C C.Discriminant ?waveletfaces and nearest feature classifiers for face recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(12):1644-1649.

[7] He K,Zhang X,Ren S,et al. Deep Residual Learning for Image Recognition[C].The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2016:770-778.

[8] Viola P,Jones M.Fast and Robust Classification using Asymmetric AdaBoost and a Detector Cascade[J].Advances in neural information processing systems,2002(14):1311-1318.

[9] 龍海強(qiáng),譚臺(tái)哲.基于深度卷積網(wǎng)絡(luò)算法的人臉識(shí)別方法研究[J].計(jì)算機(jī)仿真,2017,34(1):322-325.

[10] 陳霖,蔣念平.基于離散小波變換和主成分的人臉識(shí)別[J].信息技術(shù),2017,37(6):155-158.

作者簡介:

黃 ? ?。?996-),男,碩士,工程師.研究領(lǐng)域:圖形圖像處理,機(jī)器學(xué)習(xí).

猜你喜歡
小波變換人臉識(shí)別
人臉識(shí)別 等
揭開人臉識(shí)別的神秘面紗
基于(2D)2PCA-LBP 的人臉識(shí)別方法的研究
人臉識(shí)別在高校安全防范中的應(yīng)用
MATLAB在《數(shù)字圖像處理》課程中的輔助教學(xué)
基于互信息和小波變換的圖像配準(zhǔn)的研究
心電信號(hào)壓縮方法研究
基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
基于K-L變換和平均近鄰法的人臉識(shí)別
杂多县| 海安县| 宜黄县| 铁岭县| 太康县| 同德县| 庆云县| 阜康市| 湘阴县| 乌审旗| 谷城县| 仪陇县| 日喀则市| 唐山市| 芜湖市| 铜鼓县| 安阳市| 邵阳县| 松阳县| 嫩江县| 印江| 罗定市| 凤台县| 景宁| 连云港市| 林甸县| 晋宁县| 璧山县| 营口市| 竹北市| 建瓯市| 城口县| 西盟| 清苑县| 五莲县| 蒲江县| 裕民县| 天镇县| 苏尼特左旗| 泰和县| 方正县|