王碩珩 羅凱鴻 趙梓鑒 趙航 劉雪飛
摘要:針對(duì)人臉圖像的性別識(shí)別領(lǐng)域,從準(zhǔn)確率、計(jì)算速度、穩(wěn)定性等多個(gè)角度出發(fā),采用無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、有監(jiān)督學(xué)習(xí)等多種機(jī)器學(xué)習(xí)方法進(jìn)行計(jì)算識(shí)別。將不同機(jī)器學(xué)習(xí)方法的運(yùn)行結(jié)果進(jìn)行統(tǒng)計(jì)整理,分析各個(gè)方法的優(yōu)缺點(diǎn)。通過參數(shù)特征的對(duì)比,得出不同應(yīng)用場(chǎng)景下的機(jī)器學(xué)習(xí)方法適用性結(jié)論,為實(shí)際應(yīng)用場(chǎng)景提供具有參考價(jià)值的機(jī)器學(xué)習(xí)方法選擇方案。
關(guān)鍵詞:性別識(shí)別;機(jī)器學(xué)習(xí)方法;適用性
中圖分類號(hào):TP181? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)18-0064-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
隨著機(jī)器學(xué)習(xí)方法的不斷發(fā)展,人臉識(shí)別技術(shù)的水平也在逐漸提高。與其他的生物特征相比較而言,人臉特征更加清晰且易于觀察,輪廓與構(gòu)造的微小差異即可提供較為顯著的區(qū)分效果。這使得對(duì)于人臉特征的識(shí)別與分析,在身份驗(yàn)證及日常生活中的人機(jī)交互等方面的應(yīng)用存在巨大的提升空間與潛在價(jià)值。在生活中,人們通過自身視覺的判斷可以輕易通過人臉來判斷其性別,但是讓計(jì)算機(jī)來進(jìn)行識(shí)別判斷并不容易。這需要計(jì)算機(jī)能夠?qū)θ四槇D像進(jìn)行特征處理及提取,并使用搭建好的模型進(jìn)行訓(xùn)練。目前,人臉識(shí)別技術(shù)的應(yīng)用場(chǎng)景,大多數(shù)情況采用人臉圖像特征提取存儲(chǔ),在人臉識(shí)別時(shí)進(jìn)行相關(guān)特征點(diǎn)差異性分析比較。
人臉識(shí)別在生活中應(yīng)用的深度與廣度都在持續(xù)增加,應(yīng)用場(chǎng)景的不斷擴(kuò)展使得識(shí)別過程對(duì)所采取的機(jī)器學(xué)習(xí)方法有了不同的側(cè)重,需要針對(duì)不同具體場(chǎng)景的功能需求做出選擇。與此同時(shí),性別識(shí)別作為人臉識(shí)別重要的前置工作,能夠大幅降低人臉識(shí)別的工作量,節(jié)約資源并提高效率。因此,研究不同機(jī)器學(xué)習(xí)方法對(duì)人臉性別識(shí)別的適用程度,分析得出在不同種類應(yīng)用場(chǎng)景中,適用度較高的機(jī)器學(xué)習(xí)方法,為人臉識(shí)別的后端實(shí)現(xiàn)提供相應(yīng)建議與參考。以人臉圖像性別識(shí)別為著手點(diǎn),嘗試使用多種機(jī)器學(xué)習(xí)方法,并且對(duì)比分析這些方法在此領(lǐng)域的適用性,在學(xué)習(xí)使用多種機(jī)器學(xué)習(xí)方法的同時(shí),判斷在此領(lǐng)域上哪種機(jī)器學(xué)習(xí)方法更具優(yōu)勢(shì)。
1 核心技術(shù)
PCA(主成分分析方法)[1];K-Means[2];標(biāo)簽傳播算法[3];K最近鄰分類算法[4];卷積神經(jīng)網(wǎng)絡(luò)[5]。
2 數(shù)據(jù)集
2.1 數(shù)據(jù)集信息
數(shù)據(jù)集分為兩類,一類是無(wú)性別標(biāo)簽的人臉圖像,另一類是已根據(jù)性別劃分好的有標(biāo)簽人臉圖像。其中,無(wú)標(biāo)簽數(shù)據(jù)集摻雜有建筑、動(dòng)物等非人臉的無(wú)效數(shù)據(jù),以及側(cè)面照、模糊照等不良數(shù)據(jù)。
2.2 數(shù)據(jù)讀取
數(shù)據(jù)集較大,故使用Total Commander文件管理器,將數(shù)據(jù)集包含數(shù)據(jù)劃分到多個(gè)文件夾中,劃分文件夾結(jié)構(gòu)見圖1。采用多線程方式進(jìn)行讀取,以提高數(shù)據(jù)讀取效率。使用Python的Threading庫(kù)創(chuàng)建多線程,劃分了多少個(gè)文件夾即為多少個(gè)線程。關(guān)鍵代碼截取如下:
path:劃分的文件夾所在路徑
x:讀取劃分文件夾編號(hào)
"""
threads = []
x = 1
for t in range(0, 5):
t = threading.Thread(target=read_img, args=(path, x))
threads.append(t)
x += 1
2.3 數(shù)據(jù)預(yù)處理
數(shù)據(jù)集圖像均為彩色,像素較高、規(guī)模較大,通過圖片灰度化操作進(jìn)行優(yōu)化。在RGB模型中,當(dāng)R=G=B時(shí),可表示一種灰度顏色,灰度圖像中的每個(gè)像素只需要一個(gè)字節(jié)用于存放灰度值即可?;叶然幚砗?,圖像所占空間從原先存放R、G、B三個(gè)軌道信息變?yōu)榇娣呕叶戎狄粋€(gè)軌道的信息,能夠大幅減小圖像的規(guī)模。
數(shù)據(jù)集中包含個(gè)別非人臉的無(wú)效圖像,通過人工篩選縮略圖的方式進(jìn)行刪除處理。
數(shù)據(jù)集中存在側(cè)面人像、模糊人像、全身人像等,通過人臉裁剪的方式,將人臉以外的部分進(jìn)行篩選及裁剪,排除圖片背景與無(wú)用信息,保留面部主要特征。
運(yùn)用主成分分析技術(shù)(PCA),對(duì)人臉圖像進(jìn)行降維處理,在保留人臉主要特征的前提下,壓縮數(shù)據(jù)空間,將多元數(shù)據(jù)的特征在低維空間里直觀地表示出來。
最后,將預(yù)處理后的數(shù)據(jù)轉(zhuǎn)存到本地,以便后續(xù)使用數(shù)據(jù)集時(shí)節(jié)省時(shí)間。
3 數(shù)據(jù)集添加標(biāo)簽
3.1 無(wú)監(jiān)督學(xué)習(xí)
采用K均值聚類算法。算法將按照數(shù)據(jù)最明顯的特征進(jìn)行聚類,聚類中心通過參數(shù)K進(jìn)行設(shè)置。預(yù)處理后的圖像,男女人臉特征差異不大,性別特征無(wú)法在圖片中直觀顯現(xiàn)。進(jìn)行灰度化處理后,灰度值特征貢獻(xiàn)度超過男女性別特征,使聚類算法按照灰度值劃分,最終導(dǎo)致結(jié)果不準(zhǔn)確,結(jié)果為不宜采用K均值聚類算法添加標(biāo)簽。
3.2 半監(jiān)督學(xué)習(xí)
采用標(biāo)簽傳播算法。面對(duì)數(shù)據(jù)集中的人臉圖像,通過人工識(shí)別的方式判斷性別,幾乎不會(huì)出現(xiàn)判斷錯(cuò)誤。因此,首先隨機(jī)選擇一部分人臉圖像,通過人工識(shí)別判斷性別,為無(wú)標(biāo)簽的數(shù)據(jù)添加標(biāo)簽。隨后,以這部分人工添加標(biāo)簽的數(shù)據(jù)為基礎(chǔ),使用標(biāo)簽傳播算法,對(duì)模型進(jìn)行訓(xùn)練,通過迭代的方式為剩余無(wú)標(biāo)簽的數(shù)據(jù)添加性別標(biāo)簽。
4 適用性分析
針對(duì)有標(biāo)簽的人臉圖像數(shù)據(jù),即可進(jìn)行不同機(jī)器學(xué)習(xí)方法的適用性分析。通過分析結(jié)果,便可為實(shí)際運(yùn)用中機(jī)器學(xué)習(xí)方法的選擇提供較為準(zhǔn)確的參考意見。本項(xiàng)目中,使用KNN算法和CNN兩種算法進(jìn)行適用性分析及比較。
4.1 KNN
如圖4所示,K值在1~100的取值范圍中,可直觀地觀察到K值與模型預(yù)測(cè)準(zhǔn)確率的關(guān)系變化。首先,將K取值為1作為起點(diǎn),隨著K值取值的逐漸變大,預(yù)測(cè)準(zhǔn)確率整體處于上升的大趨勢(shì)中。當(dāng)K值處于1~30的取值區(qū)間時(shí),準(zhǔn)確率數(shù)值處于不穩(wěn)定的震蕩狀態(tài),不具備參考價(jià)值與實(shí)際意義。當(dāng)K值處于30~60的取值區(qū)間時(shí),震蕩幅度減小,準(zhǔn)確率開始穩(wěn)定上升。繼續(xù)增大K的取值,當(dāng)K值處于60~100的取值區(qū)間時(shí),準(zhǔn)確率趨于穩(wěn)定,以較小幅度的波動(dòng)分布于0.7以上。由上述可知,使用KNN算法時(shí),K值取60以上,可得到穩(wěn)定準(zhǔn)確率高于0.7的預(yù)測(cè)結(jié)果。
4.2 CNN
如圖5所示,參數(shù)Epoch取值范圍設(shè)定為0~60,代表準(zhǔn)確度的accuracy值隨著Epoch的增大而逐漸增加。初始的增長(zhǎng)速度較快,當(dāng)Epoch值超過50時(shí),accuracy的增長(zhǎng)速度逐漸降低,趨于平緩。而loss值與lr值都隨epoch值增加而減少,有所不同的是,loss值從初始便急劇減少,而lr值下降則是呈階梯狀的。此外,lr的實(shí)際數(shù)值變化不大,圖中的lr數(shù)值的坐標(biāo)軸數(shù)量級(jí)很小,這樣做的原因是為了通過放大圖形細(xì)節(jié),清晰地觀察參數(shù)數(shù)值的變化規(guī)律。在epoch值趨近于60時(shí),loss值與lr值均趨近于0。
4.3 綜合比對(duì)
綜合比對(duì)KNN和CNN兩種算法,在參數(shù)設(shè)置為最優(yōu)時(shí),采用CNN算法的模型,其判斷的準(zhǔn)確率平均高于KNN算法模型的準(zhǔn)確率 10個(gè)百分點(diǎn)。然而在運(yùn)行速度上,KNN算法的計(jì)算速度遠(yuǎn)快于CNN算法。因此,對(duì)準(zhǔn)確率的需求較高情況下,建議在一定程度上降低運(yùn)算速度為代價(jià),使用CNN算法建立模型,從而在識(shí)別人臉圖像性別的過程中獲得更佳的效果。
5 結(jié)語(yǔ)
近年來,人臉識(shí)別隨著計(jì)算機(jī)技術(shù)的發(fā)展與算法的優(yōu)化逐漸成熟,并與傳統(tǒng)技術(shù)相結(jié)合,在許多領(lǐng)域初步投入使用,如銀行業(yè)務(wù)辦理、人臉身份識(shí)別、刷臉支付技術(shù)等。與此同時(shí),在多領(lǐng)域應(yīng)用的反饋,又加快了人臉識(shí)別技術(shù)的發(fā)展與改進(jìn)。作為一個(gè)已經(jīng)基本明確的發(fā)展方向與趨勢(shì),大量專業(yè)人員涌入,為該技術(shù)添磚加瓦,注入活力,呈現(xiàn)出百花齊放的盛況,這為人臉識(shí)別技術(shù)的飛速發(fā)展奠定了基礎(chǔ)。而在市場(chǎng)競(jìng)爭(zhēng)日趨激烈的今天,百家爭(zhēng)鳴,意味著在效率和準(zhǔn)確率等參數(shù)方面的錙銖必較。項(xiàng)目中,筆者僅針對(duì)人臉圖像性別識(shí)別領(lǐng)域,使用了有限的幾種機(jī)器學(xué)習(xí)方法進(jìn)行計(jì)算,對(duì)比結(jié)果具有局限性。
下一步工作,有兩個(gè)研究方向可供選擇。一是擴(kuò)展識(shí)別的功能維度,如通過面部特征識(shí)別人臉?biāo)鶎倌挲g段,又如通過表情特征判斷人臉此刻大致的心情狀況等。二是擴(kuò)充對(duì)比隊(duì)列中的機(jī)器學(xué)習(xí)方法。機(jī)器學(xué)習(xí)方法種類繁多,本項(xiàng)目所涉及的僅為極小部分,而每種機(jī)器學(xué)習(xí)方法都有其特征及適用場(chǎng)景。不僅如此,同一種機(jī)器學(xué)習(xí)方法,其本身,也是在人們的不斷改進(jìn)與完善中保持成長(zhǎng)的。如項(xiàng)目中使用到的K-means聚類算法,其改進(jìn)算法之一是K-means++算法,聚類中心的選擇由完全隨機(jī)變?yōu)榫嚯x其他聚類中心更遠(yuǎn)的點(diǎn),有更高的概率被選為新的中心。另一種改進(jìn)是ISODATA,在算法過程中可根據(jù)某個(gè)類別的樣本數(shù)占比和分散程度,自動(dòng)調(diào)整聚類中心的數(shù)量。此外還有將樣本映射到特征空間再進(jìn)行聚類的Kernel K-means等。改進(jìn)后的機(jī)器學(xué)習(xí)方法,其特征及使用場(chǎng)景均值得深入研究和探索。
參考文獻(xiàn):
[1] 陳佩.主成分分析法研究及其在特征提取中的應(yīng)用[D].西安:陜西師范大學(xué),2014.
[2] 李正兵,羅斌,翟素蘭,等.基于關(guān)聯(lián)圖劃分的K-means算法[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(21):141-144,151.
[3] 陶劍文,F(xiàn)u-Lai CHUNG,王士同,等.稀疏標(biāo)簽傳播:一種魯棒的領(lǐng)域適應(yīng)學(xué)習(xí)方法[J].軟件學(xué)報(bào),2015,26(5):977-1000.
[4] 張著英,黃玉龍,王翰虎.一個(gè)高效的KNN分類算法[J].計(jì)算機(jī)科學(xué),2008,35(3):170-172.
[5] 周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2017,40(6):1229-1251.
【通聯(lián)編輯:唐一東】