胡俊
(四川大學(xué)軟件工程學(xué)院,成都 610065)
生物認(rèn)證技術(shù)是依靠人類(lèi)自身固有的生理或行為特征進(jìn)行身份驗(yàn)證的一種手段。而生物認(rèn)證中的人臉特征又是人與人之間互相辨識(shí)的最重要和最直觀的生物特征。由于人臉識(shí)別的無(wú)侵害性和對(duì)用戶最自然、最直觀的方式,使人臉識(shí)別成為最容易被接受的生物特征識(shí)別方式。而在人臉識(shí)別中,人臉圖片會(huì)隨著年齡變換而發(fā)生變化,這就導(dǎo)致判斷不同年齡段的人臉圖片是否是同一個(gè)人面臨更大的困難。在實(shí)際的應(yīng)用中,跨年齡人臉識(shí)別可以幫助尋找被拐賣(mài)兒童、判斷系統(tǒng)中兩張不同年齡段的圖片是否為同一個(gè)人以防止多次注冊(cè)。上述難點(diǎn)和應(yīng)用場(chǎng)景使得跨年齡人臉識(shí)別成為富有挑戰(zhàn)性和研究意義的研究課題之一。
針對(duì)跨年齡人臉識(shí)別,許多學(xué)者做了各種有意義的研究,其中大致可以分為兩個(gè)策略。一個(gè)是生成策略[1-3]:是通過(guò)生成不同年齡人臉圖片來(lái)提升人臉識(shí)別的性能,但其方法需要很強(qiáng)的參數(shù)假設(shè),并且具有相當(dāng)高的復(fù)雜度,基本上不適合現(xiàn)實(shí)場(chǎng)景的應(yīng)用。另一個(gè)是判別策略[4,5,6]:通過(guò)分離人臉的身份信息和年齡信息,得到一個(gè)年齡無(wú)關(guān)的特征以提升跨年齡人臉識(shí)別性能。在前深度學(xué)習(xí)時(shí)代,生成策略一般是通過(guò)模擬年齡變化來(lái)生成不同年齡的照片,判別策略一般是通過(guò)手工定義的特征來(lái)獲取身份特征和年齡特征。而隨著深度學(xué)習(xí)時(shí)代的到來(lái),研究人員開(kāi)始通過(guò)使用深度學(xué)習(xí)來(lái)提升跨年齡人臉識(shí)別的性能。其中針對(duì)生成策略,有學(xué)者利用生成對(duì)抗網(wǎng)絡(luò)(GAN)來(lái)生成不同年齡的人臉圖片[7]。針對(duì)判別策略,利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)提取更有效的網(wǎng)絡(luò)和更好地分離人臉圖片的身份特征和年齡來(lái)提升性能[8,9]。
本文提出使用人臉劃區(qū)域策略來(lái)幫助跨年齡人臉識(shí)別,基本研究思路是利用人臉不同區(qū)域隨著年齡變化的程度不一致,劃分區(qū)域后,能使部分區(qū)域提取的特征更具有判別性。
本文使用MORPH Album 2和CACD數(shù)據(jù)庫(kù)做為訓(xùn)練和測(cè)試數(shù)據(jù)。
MORPH Album 2數(shù)據(jù)庫(kù)是跨年齡人臉識(shí)別中最大的公開(kāi)數(shù)據(jù)庫(kù),包含20000個(gè)人,總共78000張圖片。對(duì)于每張圖片,都標(biāo)注了其年齡和身份信息。
CACD數(shù)據(jù)庫(kù)包含2000個(gè)明星,總共163446張圖片。該數(shù)據(jù)庫(kù)除了包含年齡和身份信息,其中的圖片包含各種各樣的光照變化、姿態(tài)變化、化妝等。
圖1
圖2
由于不同的人臉區(qū)域?qū)δ挲g的變化不同,如圖1所示。在眼睛區(qū)域,隨著年齡的變化,其變化也越來(lái)越大。因此筆者猜測(cè),分離這部分人臉區(qū)域,或者能提升跨年齡人臉識(shí)別的性能。因此筆者嘗試分離人臉的眼睛區(qū)域來(lái)幫助跨年齡人臉識(shí)別。算法流程如圖2所示。
算法流程細(xì)節(jié):
(1)截取出人臉圖片中的眼睛區(qū)域的圖片,然后使其經(jīng)過(guò)ResNet10層的網(wǎng)絡(luò)來(lái)得到512維的特征。
(2)對(duì)于原始圖片,我們把眼睛區(qū)域的值置為0,使其不包含眼睛區(qū)域的信息,然后再經(jīng)過(guò)ResNet20層來(lái)得到特征。
(3)歸一化1和2的特征。
(4)連接3中歸一化后的特征來(lái)做為一個(gè)整體的特征。
(5)使用SoftmaxLoss開(kāi)始訓(xùn)練。
使用隨機(jī)梯度下降法并且batchsize大小為64、動(dòng)力為0.9、權(quán)重衰減為0.0005的超參數(shù)來(lái)訓(xùn)練網(wǎng)絡(luò);其中少量的權(quán)重衰減對(duì)于模型學(xué)習(xí)是重要的;這里的權(quán)重衰減不僅僅是一個(gè)正則化矩陣,它減少了訓(xùn)練誤差;對(duì)于權(quán)重w的更新規(guī)則為:
實(shí)驗(yàn)中使用均值為0、標(biāo)準(zhǔn)差為0.01的高斯分布初始化了每一層的權(quán)重;對(duì)于所有層都使用了相等的學(xué)習(xí)率,學(xué)習(xí)率在訓(xùn)練過(guò)程中可以調(diào)整,當(dāng)訓(xùn)練誤差不在下降時(shí)就將學(xué)習(xí)率除以10;學(xué)習(xí)率初始化為0.01。
我們?nèi)ORPH Album 2中的10000個(gè)人作為訓(xùn)練數(shù)據(jù),另10000人作為測(cè)試數(shù)據(jù)。訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)沒(méi)重復(fù)。對(duì)于測(cè)試數(shù)據(jù),我們選取最年輕的圖片組成gallery,年長(zhǎng)的圖片做為probe。
對(duì)于CACD,我們使用通用的官方提供的CACDVS作為測(cè)試集,其中包含2000個(gè)正樣本對(duì)和2000個(gè)負(fù)樣本對(duì)。
筆者針對(duì)MORPH和CACD-VS測(cè)試集做了基準(zhǔn)實(shí)驗(yàn)和使用分區(qū)域跨年齡人臉識(shí)別的實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表1所示:
表1
由表1可以看出,在深度學(xué)習(xí)中使用分區(qū)域的策略能使得跨年齡人臉識(shí)別有一定的提升。
隨著深度學(xué)習(xí)的發(fā)展,現(xiàn)實(shí)的需要,跨年齡人臉識(shí)別越來(lái)越受研究者關(guān)注。因此本文提出了一個(gè)分區(qū)域跨年齡人臉識(shí)別的算法來(lái)提示跨年齡人臉識(shí)別的性能。本文也證明了該方法在MORPH和CACD年齡數(shù)據(jù)庫(kù)上的有效性。