国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

適用于彩色圖像人臉識別的字典學(xué)習(xí)算法*

2016-11-01 03:27施靜蘭張智勇覃團(tuán)發(fā)
電訊技術(shù) 2016年4期
關(guān)鍵詞:彩色圖像識別率字典

施靜蘭,常 侃**,2,3,張智勇,覃團(tuán)發(fā),2,3

(1.廣西大學(xué)計算機(jī)與電子信息學(xué)院,南寧 530004;2.廣西高校多媒體通信與信息處理重點實驗室(廣西大學(xué)),南寧 530004;3.廣西多媒體通信與網(wǎng)絡(luò)技術(shù)重點實驗室培育基地(廣西大學(xué)),南寧 530004)

適用于彩色圖像人臉識別的字典學(xué)習(xí)算法*

施靜蘭1,常 侃**1,2,3,張智勇1,覃團(tuán)發(fā)1,2,3

(1.廣西大學(xué)計算機(jī)與電子信息學(xué)院,南寧530004;2.廣西高校多媒體通信與信息處理重點實驗室(廣西大學(xué)),南寧530004;3.廣西多媒體通信與網(wǎng)絡(luò)技術(shù)重點實驗室培育基地(廣西大學(xué)),南寧530004)

現(xiàn)有的基于稀疏表示的人臉識別算法在識別前需要將彩色人臉圖像轉(zhuǎn)換成灰度人臉圖像,這樣雖然提高了運算速度,但忽視了不同色彩通道數(shù)據(jù)本身所包含的信息及它們之間的相關(guān)性。為了利用不同通道間相關(guān)性,基于標(biāo)簽一致的K奇異值分解(LC-KSVD)字典學(xué)習(xí)算法,提出了一種適用于彩色圖像人臉識別的字典學(xué)習(xí)算法。該算法將RGB通道數(shù)據(jù)順序排列成列向量,并在稀疏編碼的環(huán)節(jié)中,對正交匹配追蹤(OMP)算法的內(nèi)積計算準(zhǔn)則進(jìn)行修正,以此提高字典原子的色彩表達(dá)能力。在彩色人臉數(shù)據(jù)庫上進(jìn)行實驗,結(jié)果表明:所提出的字典學(xué)習(xí)算法能夠有效地提高識別率。

彩色圖像;人臉識別;稀疏表示;字典學(xué)習(xí);稀疏編碼

1 引言

人臉識別的研究始于20世紀(jì)60年代,是一項具有挑戰(zhàn)性的任務(wù)[1]。隨著圖像處理、計算機(jī)視覺和模式識別等領(lǐng)域理論與技術(shù)的成熟,與之相關(guān)的人臉識別技術(shù)經(jīng)過半個多世紀(jì)的發(fā)展,也得到了廣泛應(yīng)用。

近年來,稀疏編碼已經(jīng)成功地應(yīng)用于計算機(jī)視覺、機(jī)器學(xué)習(xí)和圖像分析領(lǐng)域,包括圖像去噪[2]、圖像修復(fù)[3]、圖像壓縮[4]和圖像分類[5]等。文獻(xiàn)[6]中提出了基于稀疏表示的分類算法(Sparse Representation-based Classification,SRC),并應(yīng)用于人臉識別。該方法直接使用整個訓(xùn)練圖像集來構(gòu)成字典,對于一張測試人臉圖像,通過計算其在該字典上的稀疏編碼系數(shù)來對其進(jìn)行分類。與傳統(tǒng)的人臉識別方法不同的是,SRC人臉識別方法不需要像Eigenface[7]和Fisherface[8]方法一樣進(jìn)行明確的特征提取,而且對光照變化、表情變化和局部遮擋等問題魯棒性高,這些優(yōu)點使其成為了一個新興的研究熱點。

雖然基于SRC的人臉識別算法取得了一定成功,但是,文獻(xiàn)[6]利用整個訓(xùn)練樣本集作為字典進(jìn)行稀疏編碼,字典的維度高且不能有效表征訓(xùn)練樣本,因此進(jìn)行分類時復(fù)雜度高且識別率也有待進(jìn)一步提升。直接有效的改進(jìn)方法是采用精簡的、由自適應(yīng)學(xué)習(xí)得到的字典。著名的字典學(xué)習(xí)算法包括最優(yōu)方向字典學(xué)習(xí)算法[9]和K奇異值分解(K-Singular Value Decomposition,K-SVD)字典學(xué)習(xí)算法[10]等,其中,K-SVD算法循環(huán)進(jìn)行稀疏編碼和字典更新,字典學(xué)習(xí)的效率很高。但是,K-SVD算法本身并沒有考慮字典的區(qū)分能力,因此由該算法學(xué)習(xí)而得的字典不能直接應(yīng)用于人臉分類。文獻(xiàn)[11]通過根據(jù)輸出的線性預(yù)測分類器進(jìn)一步迭代更新由K -SVD算法訓(xùn)練出的字典,由此獲得一個除了具有表示能力外還同時有利于分類的字典。文獻(xiàn)[12]提出了區(qū)分性的K-SVD(Discriminative K-SVD,DKSVD)算法,通過在原始K-SVD算法的目標(biāo)函數(shù)上加入?yún)^(qū)分項,保證學(xué)習(xí)出的冗余字典同時具有表示能力和區(qū)分能力,使字典和分類器的學(xué)習(xí)過程統(tǒng)一起來。文獻(xiàn)[13]提出一種監(jiān)督性算法——標(biāo)簽一致的K-SVD(Label Consistent K-SVD,LC-KSVD)算法來學(xué)習(xí)出一個精簡的和具有區(qū)分性的字典用于稀疏編碼,通過在目標(biāo)函數(shù)中加入“區(qū)分性”稀疏編碼誤差準(zhǔn)則和“最佳”分類性能準(zhǔn)則,并利用K -SVD算法進(jìn)行優(yōu)化求解,同時學(xué)習(xí)出具有區(qū)分性的字典和線性分類器。除了以D-KSVD和LC-KSVD為代表的改進(jìn)的K-SVD算法外,還涌現(xiàn)了一些其他的字典學(xué)習(xí)算法,例如:香港理工大學(xué)的Yang和Zhang等人陸續(xù)提出了Metaface字典學(xué)習(xí)(Metaface Learning,MFL)算法[14]、Fisher判別準(zhǔn)則字典學(xué)習(xí)算法[15]等適用于人臉識別的字典學(xué)習(xí)算法。

雖然上述基于K-SVD的各類人臉識別算法均取得了較好的識別效果,但是現(xiàn)有的基于字典學(xué)習(xí)的人臉識別方法均是直接將彩色人臉圖像轉(zhuǎn)成灰度人臉圖像后再進(jìn)行人臉識別,這樣在識別的過程中就僅應(yīng)用了灰度圖像的紋理信息。較少文獻(xiàn)對彩色人臉圖像進(jìn)行處理的主要原因在于:首先,相比于灰度人臉圖像,單純通過增高數(shù)據(jù)維度帶來的識別率提升有限;其次,數(shù)據(jù)維度增高會引入過高的復(fù)雜度,不利于算法的實際應(yīng)用。但是,一方面,隨著處理器計算能力的不斷增強(qiáng),高維度數(shù)據(jù)的處理難度在不斷降低;另一方面,可以通過引入并行計算技術(shù),例如圖像處理單元(Graphics Processing Unit,GPU)等,進(jìn)一步降低所需的計算時間。因此,與其他文獻(xiàn)不同,本文討論高維度的彩色人臉圖像識別問題,希望通過探索不同色彩通道之間的相關(guān)性達(dá)到理想的識別率。

最為直接的彩色圖像人臉識別方法是將每張彩色人臉圖像的R、G、B 3個通道數(shù)據(jù)按順序排列為一個列向量代替灰度圖像向量進(jìn)行人臉識別。以LC-KSVD算法[13]為例,可以應(yīng)用此思想進(jìn)行直接擴(kuò)展,對應(yīng)的方法在本文中稱為CE1-LC-KSVD(Color-Extension 1 of LC-KSVD)。但是,此方法是簡單地直接增高數(shù)據(jù)維度,各色彩通道之間的相關(guān)性是完全被忽略的。為了合理利用色彩通道之間的相關(guān)性,從而進(jìn)一步提升算法識別率,本文提出一種適用于彩色圖像人臉識別的字典學(xué)習(xí)算法——CE2 -LC-KSVD(Color-Extension 2 of LC-KSVD)。與CE1-LC-KSVD算法不同,在稀疏編碼階段,CE2-LC-KSVD算法通過修正正交匹配追蹤(Orthogonal Matching Pursuit,OMP)算法中的內(nèi)積計算準(zhǔn)則,對各個通道之間的相關(guān)性加以利用。這樣使得學(xué)習(xí)出的字典能夠體現(xiàn)通道間相關(guān)性,從而減少重構(gòu)圖像和原始圖像之間的誤差,最終提高識別率。

2 LC-KSVD字典學(xué)習(xí)算法[13]

LC-KSVD是一種監(jiān)督字典學(xué)習(xí)算法,它旨在利用輸入信號的監(jiān)督信息(例如標(biāo)簽)來學(xué)習(xí)出一個具有重建能力和區(qū)分性的字典。為了利用訓(xùn)練樣本的類別標(biāo)簽信息,將標(biāo)簽信息與每一個字典原子關(guān)聯(lián)起來,加入一種新的標(biāo)簽一致的約束,并且結(jié)合重建誤差和分類誤差以構(gòu)建最優(yōu)化問題。文獻(xiàn)[13]提出了兩類LC-KSVD算法,分別記為LC-KSVD1和LC-KSVD2。

2.1LC-KSVD1

令Y表示一組維度為n的N個輸入信號,即Y=[y1,y2,…,yN]∈Rn×N,D=[d1,d2,…,dK]∈Rn×K為學(xué)習(xí)字典(其中,K>n以保證字典為冗余字典),X=[x1,x2,…,xN]∈RK×N為輸入信號Y的稀疏編碼。線性分類器的性能決定于輸入的稀疏編碼X的區(qū)分性。為了利用學(xué)習(xí)得到的字典D獲得具有區(qū)分性的稀疏編碼X,定義如下字典構(gòu)造的目標(biāo)函數(shù):

式中:α是權(quán)重參數(shù);T為稀疏度;xi為第i個測試樣本yi在字典D上的稀疏編碼系數(shù);‖Y-DX‖22為重建誤差;Q=[q1,q2,…,qN]∈RK×N為輸入信號Y的具有區(qū)分性的稀疏編碼,如果qi中的非零值位于輸入信號yi和字典原子dk具有相同類別標(biāo)簽的地方,那么稱qi=[q1i,q2i,…,qKi]T=[0…1,1,…0]T∈RK為與輸入信號yi相應(yīng)的“區(qū)分性”稀疏編碼;A是一個線性變換矩陣,定義一個線性變換g(x,A)=Ax,它將原始的稀疏編碼x轉(zhuǎn)換成在稀疏特征空間RK中最具區(qū)分性;‖Q-AX‖22項表示具有區(qū)分性的稀疏編碼誤差,它強(qiáng)制了稀疏編碼X近似為具有區(qū)分性的稀疏編碼Q,使得來自同一個類別的信號具有非常相似的稀疏表示(例如:令稀疏編碼結(jié)果中標(biāo)簽一致),這樣一來,即使使用一個簡單的線性分類器也能獲得好的分類結(jié)果。

2.2LC-KSVD2

為了使得在分類中字典最優(yōu)化,在字典學(xué)習(xí)的目標(biāo)函數(shù)中加入分類誤差項。在LC-KSVD2中,使用一個線性預(yù)測分類器f(x,W)=Wx。一個同時具有重建能力和區(qū)分能力的字典D的學(xué)習(xí)目標(biāo)函數(shù)定義如下:

式中:‖H-WX‖22項表示分類誤差;W為分類器參數(shù);H=[h1,h2,…,hN]∈Rm×N為輸入信號Y的類別標(biāo)簽;hi=[0,0,…,1,…,0,0]T∈Rm為與輸入信號yi相對應(yīng)的標(biāo)簽向量,其中非零值的位置表明yi的類別;α和β為權(quán)重參數(shù)。

假設(shè)具有區(qū)分性的稀疏編碼X'=AX和A∈RK×K是可逆的,則D'=D A-1,W'=W A-1。式(2)的目標(biāo)函數(shù)可以重新寫為

式中:第一項表示重建誤差;第二項表示具有區(qū)分性的稀疏編誤差能夠使各個類別之間的稀疏編碼具有區(qū)分性;第三項表示分類誤差,通過‖H-W'X'‖22使學(xué)習(xí)得到的分類器最優(yōu)。

3 彩色圖像的稀疏表示人臉識別

3.1彩色圖像LC-KSVD字典學(xué)習(xí)算法

在人臉識別中,可獲取的樣本數(shù)量通常遠(yuǎn)小于人臉圖像樣本的維數(shù),因此由訓(xùn)練樣本組成的字典原子色彩表示能力不高。已有的LC-KSVD字典學(xué)習(xí)算法[13]僅應(yīng)用于灰色圖像,而忽略了原始彩色圖像中的大量信息。本文希望在LC-KSVD算法的基礎(chǔ)上,有效地利用不同色彩通道數(shù)據(jù)之間的相關(guān)性(而不僅是簡單地通過數(shù)據(jù)維度的增加),提高字典原子色彩表示能力,從而最終提高識別率。

傳統(tǒng)的K-SVD算法包括稀疏編碼和字典更新兩個步驟。因為OMP算法高速有效,所以其被應(yīng)用于K-SVD算法的稀疏編碼階段。文獻(xiàn)[3]指出,將灰度圖像的K-SVD字典訓(xùn)練擴(kuò)展到彩色圖像的一個簡單方法是將RGB色彩空間3個通道的值順序連接成一個列向量后再進(jìn)行訓(xùn)練。但是,由于原始的OMP算法在重構(gòu)過程中缺少一定的約束,并不能保證重建圖像會包含原始圖像的平均色,因此訓(xùn)練過程會產(chǎn)生偽色彩和假象,這是彩色圖像處理中會遇到的典型問題。為了利用不同色彩通道數(shù)據(jù)之間的相關(guān)性提高字典原子的色彩表達(dá)能力,可以對OMP的內(nèi)積計算準(zhǔn)則進(jìn)行適當(dāng)?shù)男拚?,使其適應(yīng)于彩色圖像的稀疏編碼。

假設(shè)x和y是兩張不同的彩色人臉圖像,表示為x=[xTR,xTG,xTB]T,y=[yTR,yTG,yTB]T,其中xR、xG、xB和yR、yG、yB分別為圖像x和圖像y的R、G、B通道值列向量,維度為n。定義一種新的OMP內(nèi)積形式如下:

式中:γ是權(quán)重參數(shù);

式中:Jn是一個n×n的矩陣,其元素全部為1。等式第一項為原始的Euclidean內(nèi)積,它能夠保證獲得當(dāng)前最好的結(jié)果。包含矩陣K的第二項計算每一個通道中的E(y)和E(x)的估計量并將它們相乘,因此強(qiáng)制選擇的原子考慮平均色。為了方便求解,令γ=2a+a2,則

因此,一個簡單的實現(xiàn)方法是,將每一張人臉圖像和字典中的每一個原子都乘以I+a/nK,并將其進(jìn)行歸一化,這樣便可以實現(xiàn)新的內(nèi)積準(zhǔn)則。

由于只有訓(xùn)練圖像和字典原子中存在3個色彩通道之間的相關(guān)性,因此,在彩色圖像LC-KSVD字典學(xué)習(xí)算法中,采用OMP算法時,將訓(xùn)練圖像和字典原子的RGB通道值順序聯(lián)結(jié)成一個列向量,然后分別乘以I+a/nK,并采用新的OMP內(nèi)積準(zhǔn)則求解稀疏編碼系數(shù)。

由此可見,彩色圖像的LC-KSVD算法與原始LC-KSVD算法形式相同,僅在OMP步驟采用新的內(nèi)積計算準(zhǔn)則來處理偽色彩和假象問題。

3.2彩色圖像LC-KSVD字典學(xué)習(xí)算法的優(yōu)化

本文同時考慮LC-KSVD1算法與LC-KSVD2算法的彩色圖像擴(kuò)展算法。由于兩者的優(yōu)化過程相同,接下來僅以彩色圖像的LC-KSVD2算法為例描述優(yōu)化過程。

為了求解式(8),將其重新寫為

引入兩個新的變量如下:

式中:Dnew為l2范數(shù)列歸一化矩陣。則式(9)的最優(yōu)化等價于求解如下問題:

上述問題與傳統(tǒng)K-SVD的目標(biāo)函數(shù)形式相同,因此可以直接通過K-SVD算法求解。

3.3分類方法

通過上述學(xué)習(xí)過程最終得到字典Dnew后,便可利用其對待測人臉圖像進(jìn)行分類。從Dnew中獲得wK}。由于、A和W共同進(jìn)行過l2范數(shù)歸一化,因此還不能直接使用它們進(jìn)行分類。分類操作所需的、變換參量和分類器參量計算方法如下:

對于測試圖像yi,首先通過求解以下優(yōu)化問題計算它的稀疏表示系數(shù)xi:

然后簡單地使用線性預(yù)測分類器~W來判斷圖像yi的標(biāo)簽j:

式中:l∈Rm為類別標(biāo)簽向量。

4 實驗結(jié)果與分析

在實驗部分,將提出的彩色圖像LC-KSVD字典學(xué)習(xí)算法稱為CE2-LC-KSVD。為了全面分析算法性能,與灰度圖下的LC-KSVD算法[13]進(jìn)行比較(需注意,灰度圖下有LC-KSVD1和LC-KSVD2,因此在彩色人臉圖像下對應(yīng)的改進(jìn)算法分別為CE2-LC-KSVD1和CE2-LC-KSVD2)。此外,將R、G、B通道數(shù)據(jù)排列成列向量,直接代替原有灰度圖像進(jìn)行字典學(xué)習(xí)的方法稱為CE1-LC-KSVD。

由于許多主流的人臉圖像庫為灰度圖像,本文僅選擇AR和CMU_PIE兩個彩色人臉圖像庫進(jìn)行實驗。其中,AR人臉庫下包含與人臉色彩差距鮮明的遮擋物,CMU_PIE包含更為復(fù)雜的光照情況。

實驗中,α和β與文獻(xiàn)[13]中取相同值,分別為16和4,OMP新內(nèi)積計算準(zhǔn)則中的a取0.001。實驗中使用的是臺式計算機(jī),Intel(R)Core(TM)2 Duo CPU,主頻3 GHz,4 GB內(nèi)存。

4.1AR人臉庫實驗結(jié)果

AR人臉庫[16]包含來自126個人超過4 000張的正面人臉圖像,每張圖像尺寸為120 pixel×165 pixel。每類有26張圖像,選取兩個不同時期,分別在不同光照、表情以及面部遮擋條件下拍攝。遮擋包括墨鏡遮擋和圍巾遮擋。AR人臉庫中部分人臉圖像如圖1所示。實驗中,我們選擇一組包含50個男性對象和50個女性對象的人臉子集,并將人臉圖像縮小為40 pixel×55 pixel。實驗分以下兩部分進(jìn)行:

(1)對于每個對象,隨機(jī)選擇N1張人臉圖像作為訓(xùn)練樣本,其余作為測試樣本,字典維度為500;

(2)對于每個對象,選擇第一時期和第二時期拍攝的只有表情變化和光照變化無遮擋的14張人臉圖像,從中隨機(jī)選擇N2張作為訓(xùn)練樣本,其余作為測試樣本,字典維度為100。

圖1 AR人臉庫部分人臉圖像Fig.1 Part of AR Database

實驗1的結(jié)果列于表1。從表1可以觀察到:與LC-KSVD算法相比,CE1-LC-KSVD算法的識別率有大幅提升,說明通過增加數(shù)據(jù)維度,能夠獲得更高的識別率;與CE1-LC-KSVD算法的識別率相比,CE2-LC-KSVD有1.7%~2.8%的提升,說明新的OMP內(nèi)積計算準(zhǔn)則能夠有效地利用不同色彩通道數(shù)據(jù)之間的相關(guān)性信息來提高字典原子的色彩表達(dá)能力。此外,還可以觀察到:與CE1-LC-KSVD算法相比,CE2-LC-KSVD的字典學(xué)習(xí)時間并沒有明顯增加,也進(jìn)一步說明了本文算法的優(yōu)勢。

表1 AR人臉庫中各算法識別率與字典學(xué)習(xí)時間(實驗1)Tab.1 Recognition rates and associated dictionary learning times by different methods on the AR Database(Experiment 1)

實驗2的結(jié)果列于表2。與表1的結(jié)果類似,CE1-LC-KSVD算法和CE2-LC-KSVD算法均能夠取得比LC-KSVD算法更高的識別率,但是識別率提升幅度低于表1的結(jié)果。原因在于AR人臉庫中的部分人臉圖像具有遮擋,而遮擋物與人臉膚色差距較大,這些色彩信息在字典學(xué)習(xí)中發(fā)揮了重要的作用。實驗1的樣本中包含具有遮擋物的人臉圖像,而實驗2的樣本中去除了此類圖像,因此可利用的色彩信息較少。另外,從字典學(xué)習(xí)時間上看,CE2 -LC-KSVD算法的速度明顯快于CE1-LC-KSVD算法,說明在訓(xùn)練樣本色彩接近的情況下,本文修正的OMP內(nèi)積方法有利于字典學(xué)習(xí)過程的快速收斂。

表2 AR人臉庫中各算法識別率與字典學(xué)習(xí)時間(實驗2)Tab.2 Recognition rates and associated dictionary learning times by different methods on the AR Database(Experiment 2)

4.2CMU_PIE人臉庫實驗結(jié)果

CMU_PIE人臉庫[17]包含68個人的超過4 000張人臉圖像,每張圖像尺寸為140 pixel×200 pixel。每個人有13種姿勢、43種不同的光照條件和4種不同表情,包括“illumination”和“l(fā)ight”兩個子集:“illumination”子集背景光關(guān)閉,僅有不同方向的閃光燈照亮,每個類有21幅圖像;“l(fā)ight”子集同時包含背景光和閃光燈,每個類有22幅圖像,其中第一張圖像只有背景光。“illumination”子集部分人臉圖像如圖2所示,“l(fā)ight”子集部分人臉圖像如圖3所示。

圖2 CMU_PIE人臉庫“illumination”子集部分人臉圖像Fig.2 Part of CMU-PIE Database“illumination”subset

圖3 CMU_PIE人臉庫“l(fā)ight”子集部分人臉圖像Fig.3 Part of CMU-PIE Database“l(fā)ight”subset

實驗選擇CMU_PIE人臉庫中的“illumination”子集和“l(fā)ight”子集,將每張圖像縮小為35 pixel×50 pixel。對于每個對象,隨機(jī)選擇N3張人臉圖像作為訓(xùn)練樣本,其余作為測試樣本,字典維度為340。

CMU_PIE的實驗結(jié)果列于表3。從表3中可以看出:與表1和表2中的結(jié)果類似,CE2-LC-KSVD算法的識別率最高,CE1-LC-KSVD算法次之,LCKSVD算法最低,從而驗證了彩色圖像人臉識別的有效性。需要注意的是:首先,彩色圖像下識別率的提升幅度低于AR人臉庫實驗1(詳見表1),原因在于CMU_PIE兩個子集中的人臉圖像沒有出現(xiàn)色差很大的遮擋物,因此色彩信息少于AR人臉庫實驗1;其次,彩色圖像下識別率的提升幅度高于AR人臉庫實驗2(詳見表2),原因在于CMU_PIE兩個子集中的光照情況較為復(fù)雜,因此色彩信息相對AR人臉庫實驗2而言更豐富。

表3 CMU_PIE人臉庫中各算法識別率與字典學(xué)習(xí)時間Tab.3 Recognition rates and associated dictionary learning times by different methods on the CMU_PIE Database

4.3綜合討論與分析

CE1-LC-KSVD算法同時利用了R、G、B 3個色彩通道的數(shù)據(jù)值,導(dǎo)致數(shù)據(jù)維度大大增加,所以其識別效果會比灰度圖像的LC-KSVD算法更好。但是,CE1-LC-KSVD算法僅通過單純的數(shù)據(jù)維度的增加來獲取更高的識別率,并沒有考慮不同色彩通道之間的相關(guān)性。因此,這種高維度數(shù)據(jù)的應(yīng)用方法效率不高,算法識別率也還有進(jìn)一步提升的空間。而CE2-LC-KSVD算法采用了新的OMP內(nèi)積計算準(zhǔn)則,在稀疏編碼中考慮原子的平均色,有效地解決了訓(xùn)練過程中產(chǎn)生的偽色彩和假象等問題,所以提高了字典原子的色彩多樣性。因此,CE2-LC-KSVD算法能夠有效地利用3個色彩通道之間的相關(guān)性,進(jìn)一步提高識別率。

另一方面,因為兩種彩色圖像下的字典學(xué)習(xí)算法CE1-LC-KSVD和CE2-LC-KSVD將3個色彩通道的數(shù)據(jù)排列成列向量處理,所以每個訓(xùn)練樣本以及字典原子的維度是灰度圖像情況下的3倍,導(dǎo)致字典學(xué)習(xí)時間明顯增加。為了解決此問題,一種較為有效的方法是應(yīng)用并行計算技術(shù),例如GPU等降低運算時間。需要注意的是,CE2-LC-KSVD算法在稀疏編碼步驟中采用了新的內(nèi)積計算準(zhǔn)則,僅通過將每一張人臉圖像和字典中的每一個原子同時乘以I+a/nK來實現(xiàn)。因此,在大部分情況下,CE2-LC-KSVD算法學(xué)習(xí)時間僅比CE1-LC-KSVD算法略長。根據(jù)AR人臉庫實驗2的結(jié)果可知,在訓(xùn)練樣本間色彩接近的情況下,所采用的修正的OMP內(nèi)積方法有利于字典學(xué)習(xí)過程的快速收斂,因此該情況下所提出的CE2-LC-KSVD算法優(yōu)勢更為明顯。

最后需要提出的是,在實際應(yīng)用中,不可避免地會存在人臉圖像顏色不正的問題。為了解決上述問題,可以增大訓(xùn)練集,讓訓(xùn)練集涵蓋盡可能多的光照、遮擋等情況,從而最大程度地保證彩色圖像字典的魯棒性。

5 結(jié)束語

為了利用R、G、B色彩通道的信息及不同通道之間的相關(guān)性,以提高字典原子的色彩表示能力,本文將3個色彩通道的數(shù)據(jù)排列成列向量,并在OMP

稀疏編碼中采用新的內(nèi)積計算準(zhǔn)則。在AR和CMU _PIE兩個彩色人臉庫上進(jìn)行實驗,并與灰度圖像下的LC-KSVD算法以及直接將其擴(kuò)展到彩色圖像下的CE1-LC-KSVD算法進(jìn)行比較。實驗結(jié)果表明本文算法能有效提高識別率。但是本文算法同時應(yīng)用了3個色彩通道的數(shù)據(jù),提高了算法對內(nèi)存的需求,

字典訓(xùn)練時間也有明顯增加。在未來的工作中,研究重點之一是通過并行化技術(shù),例如GPU等降低字典學(xué)習(xí)時間,以提高算法的實用性。此外,也將探索

Lab色彩空間下的人臉識別算法性能。與RGB色彩空間不同,Lab色彩模型是均勻的??梢試L試將彩色圖像轉(zhuǎn)換到Lab空間,再根據(jù)需要采用灰度圖像(僅L通道)或彩色圖像(L、a、b通道)的字典學(xué)習(xí)方法。

[1]ZHAO W,CHELLAPPA R,PHILLIPS P J,et al.Face recognition:a literature survey[J].ACM Computing Surveys,2003,35(4):399-458.

[2]ELAD M,AHARON M.Image denoising via sparse and redundant representations over learned dictionaries[J]. IEEE Transactions on Image Processing,2006,15(12):3736-3745.

[3]MARIAL J,ELAD M,SAPIRO G,et al.Sparse represen-tation for color image restoration[J].IEEE Transactions on Image Processing,2008,17(1):53-69.

[4]BRYT O,ELAD M.Compression of facial images using the K-SVD algorithm[J].Journal of Visual Communication and Image Representation,2008,19(4):270-282.

[5]YANG J C,YU K,GONG Y H,et al.Linear spatial pyramid matching using sparse coding for image classification[C]//Proceedings of 2009 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Miami,F(xiàn)L:IEEE,2009:1794-1801.

[6]WRIGHT J,YANG A Y,GANESH A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210-227.

[7]TURK M,PENTLAND A.Eigenfaces for recognition[J]. Journal of Cognitive Neuroscience,1991,3(1):71-86.

[8]BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J. Eigenfaces vs.Fisherfaces:recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.

[9]ENGAN K,AASE S O,HUSOY J H.Frame based signal compression using method of optimal directions(MOD)[C]//Proceedings of the IEEE International Symposium on Circuits and Systems(ISCAS).Orlando,F(xiàn)L:IEEE,1999:1-4.

[10]AHARON M,ELAD M,BRUCKSTEIN A.K-SVD:an algorithm for designing overcomplete dictionaries for sparse representation[J].IEEE Transactions on Signal Processing,2006,54(11):4311-4322.

[11]PHAM D S,VENKATESH S.Joint learning and dictionary construction for pattern recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Anchorage,AK:IEEE,2008:1-8.

[12]ZHANG Q,LI B X.Discriminative K-SVD for dictionary learning in face recognition[C]//Proceedings of 2010 IEEE Conference on Computer Vision and Pattern Recognition(CVPR).San Francisco,CA:IEEE,2010:2691-2698.

[13]JIANG Z L,LIN Z,DAVIS L S.Label consistent KSVD:learning a discriminative dictionary for recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(11):2651-2664.

[14]YANG M,ZHANG L,YANG J,et al.Metaface learning for sparse representation based face recognition[C]// Proceedings of 2010 IEEE International Conference on Image Processing(ICIP).Hong Kong:IEEE,2010:1601-1604.

[15]YANG M,ZHANG L,F(xiàn)ENG X C,et al.Fisher discriminationdictionarylearningforsparserepresentation[C]//Proceedings of 2011 IEEE International Conference on Computer Vision(ICCV).Barcelona:IEEE,2011:543-550.

[16]MARTINEZ A,BENAVENTE R.The AR face database[R]//CVC Technical Report#24.Barcelona:Centre de Visióper Computador,1998.

[17]SIM T,BAKER S,BSAT M.The CMU pose,illumination,and expression(PIE)database[C]//Proceedings of the 5th IEEE International Conference on Automatic Face and Gesture Recognition.Washington,DC:IEEE,2002:46-51.

施靜蘭(1990—),女,廣西南寧人,2013年于廣西大學(xué)獲工學(xué)學(xué)士學(xué)位,現(xiàn)為碩士研究生,主要研究方向為人臉識別、稀疏表示、圖像處理;

SHI Jinglan was born in Nanning,Guangxi Zhuangzu Autonomous Region,in 1990.She received the B.S.degree from Guangxi University in 2013.She is now a graduate student.Her research concerns face recognition,sparse representation and image processing.

Email:shijinglan@mail.gxu.cn

常 侃(1983—)男,廣西南寧人,2010年于北京郵電大學(xué)獲博士學(xué)位,現(xiàn)為廣西大學(xué)計算機(jī)與電子信息學(xué)院副教授,主要研究方向為壓縮感知、稀疏表示、圖像處理;

CHANG Kan was born in Nanning,Guangxi Zhuangzu Autonomous Region,in 1983.He received the Ph.D.degree from Beijing University of Posts and Telecommunications in 2010.He is now an associate professor.His research interests include compressed sensing,sparse representation and image processing.

Email:pandack0619@163.com.

張智勇(1991—),男,廣西扶綏人,2014年于廣西大學(xué)獲工學(xué)學(xué)士學(xué)位,現(xiàn)為碩士研究生,主要研究方向為稀疏表示、低秩矩陣及應(yīng)用;

ZHANG Zhiyong was born in Fusui,Guangxi Zhuangzu Autonomous Region,in 1991.He received the B.S.degree from Guangxi University in 2014.He is now a graduate student.His research concerns sparse representation,low rank matrix and its application.

Email:zhangzhiyong1160@163.com

覃團(tuán)發(fā)(1966—),男,廣西賓陽人,1997年于南京大學(xué)獲博士學(xué)位,現(xiàn)為廣西大學(xué)教授、計算機(jī)與電子信息學(xué)院副院長、中國電子學(xué)會高級會員、中國通信學(xué)會高級會員,主要研究方向為無線多媒體通信、網(wǎng)絡(luò)編碼。

QIN Tuanfa was born in Binyang,Guangxi Zhuangzu Autonomous Region,in 1966.He received the Ph.D.degree from Nanjing University in 1997.He is now a professor and the Vice Dean of School of Computer and Electronic Information,Guangxi University,and also a senior member of China Institute of Electronics and senior member of China Communications Institute. His research interests include wireless multimedia communications,network coding.

Email:tfqin@gxu.edu.cn

A Dictionary Learning Algorithm for Color Face Recognition

SHI Jinglan1,CHANG Kan1,2,3,ZHANG Zhiyong1,QIN Tuanfa1,2,3(1.School of Computer and Electronic Information,Guangxi University,Nanning 530004,China;2.Guangxi Colleges and Universities Key Laboratory of Multimedia Communications and Information Processing,Guangxi University,Nanning 530004,China;3.Guangxi Key Laboratory of Multimedia Communications and Network Technology(Cultivating Base),Guangxi University,Nanning 530004,China)

The existing sparse-representation-based face recognition algorithms usually transform the color face images into gray images.Although this procedure increases the recognition speed,it ignores the information of the different color channels and the correlation among them.In order to utilize the correlation among different channels,based on the label consistent K-Singular Value Decomposition(LC-KSVD)algorithm,a new dictionary learning method for color face recognition is proposed.To improve the representing ability of each atom for color images,this algorithm concatenates R,G and B values into a single vector,and then introduces a new inner product into orthogonal matching pursuit(OMP)during sparse coding procedure.Experiments on different color face images datasets demonstrate that the proposed algorithm can achieve a higher recognition rate.

color images;face recognition;sparse representation;dictionary learning;sparse coding

The National Natural Science Foundation of China(No.61401108,61261023);The Natural Science Foundation of Guangxi(2013GXNSFBA019272)

TP391.4

A

1001-893X(2016)04-0365-07

10.3969/j.issn.1001-893x.2016.04.003

施靜蘭,常侃,張智勇,等.適用于彩色圖像人臉識別的字典學(xué)習(xí)算法[J].電訊技術(shù),2016,56(4):365-371.[SHI Jinglan,CHANG Kan,ZHANG Zhiyong,et al.A dictionary learning algorithm for color face recognition[J].Telecommunication Engineering,2016,56(4):365-371.]

2015-10-28;

2016-03-11 Received date:2015-10-28;Revised date:2016-03-11

國家自然科學(xué)基金資助項目(61401108,61261023);廣西自然科學(xué)基金資助項目(2013GXNSFBA019272)

**通信作者:pandack0619@163.com Corresponding author:pandack0619@163.com

猜你喜歡
彩色圖像識別率字典
基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
基于FPGA的實時彩色圖像邊緣檢測
字典的由來
基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系
基于專家模糊技術(shù)的彩色圖像對比度增強(qiáng)方法
提升高速公路MTC二次抓拍車牌識別率方案研究
大頭熊的字典
基于最大加權(quán)投影求解的彩色圖像灰度化對比度保留算法
正版字典
高速公路機(jī)電日常維護(hù)中車牌識別率分析系統(tǒng)的應(yīng)用
小金县| 北碚区| 靖安县| 甘洛县| 贵德县| 子洲县| 上高县| 名山县| 育儿| 祁东县| 广灵县| 乳山市| 泽库县| 东山县| 息烽县| 温州市| 聊城市| 监利县| 台山市| 峨眉山市| 禄丰县| 黔江区| 南漳县| 曲周县| 离岛区| 桐柏县| 宽甸| 安龙县| 淮南市| 温泉县| 泸溪县| 南宫市| 青田县| 民和| 临湘市| 毕节市| 常熟市| 阳东县| 临桂县| 濉溪县| 永新县|