張雅雯+吳阿敏
摘 要 目前,隨著AI技術(shù)的興起,人臉識(shí)別正在移動(dòng)支付,智能系統(tǒng)等領(lǐng)域發(fā)揮著重要的作用。由于人的面部特征是與年齡變化緊密相關(guān)的,因此,嵌入年齡因素的人臉識(shí)別技術(shù)是有很大難度的。本研究結(jié)合人臉的特征因素,引用夾角余弦距離刻畫相似度,并用k-means算法對(duì)所有向量進(jìn)行聚類,并使分類盡可能符合實(shí)際狀況。分析聚類返回?cái)?shù)據(jù),得到一些相似度指標(biāo),例如照片到所屬類別中心的距離均值等,根據(jù)這些相似度指標(biāo)給出判別標(biāo)準(zhǔn)。結(jié)合具體的實(shí)驗(yàn)數(shù)據(jù)得到驗(yàn)證精度在90%以上。
關(guān)鍵詞 人臉識(shí)別;灰度圖;選區(qū);k-means;相似性
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2017)186-0053-01
隨著社會(huì)的不斷發(fā)展,人臉識(shí)別現(xiàn)已成為模式識(shí)別、圖像處理等學(xué)科的一大研究熱點(diǎn),可以廣泛地應(yīng)用到安全部門、身份鑒別、電視會(huì)議、數(shù)字監(jiān)控等領(lǐng)域[ 2 ]。由于年齡變化引起人臉形狀和紋理上的變化,導(dǎo)致人臉識(shí)別率下降,因此,對(duì)不同年齡段的人臉識(shí)別技術(shù)的社會(huì)需求日益增進(jìn)。精確的人臉識(shí)別技術(shù)不僅要可以識(shí)別年齡差距較小的照片,還要可以識(shí)別年齡差距較大時(shí)的照片是否是同一個(gè)人。
本文主要解決的問題是基于不同年齡段的人臉照片識(shí)別問題,即當(dāng)給出兩張不同時(shí)期的照片時(shí),要求算法識(shí)別出其是否為同一人。
1 數(shù)據(jù)預(yù)處理
眾所周知,灰度圖只包含亮度信息,不包含色彩信息。亮度由暗到明,變化是連續(xù)的。要表示灰度圖,需要把亮度值進(jìn)行量化,本文將每一張灰度照片的亮度值數(shù)據(jù)讀出作為矩陣的行向量。得到具有m行的矩陣。為了剔除圖片中一些客觀因素帶來的誤差,本文對(duì)照片進(jìn)行了分區(qū)處理,選出每張照片的中包含人臉的矩形,記錄矩形的左上和右下角坐標(biāo)。
2 聚類分析
經(jīng)過以上處理,我們已經(jīng)將每張照片抽象成為n維歐氏空間中的一個(gè)質(zhì)點(diǎn),即矩陣中的每一行都作為一個(gè)n維向量。接下來我們采用聚類分析的方法對(duì)m個(gè)質(zhì)點(diǎn)采用K-均值方法進(jìn)行聚類,由于不同個(gè)體之間人臉特征的差異性,我們將聚類之后的得到的每一簇質(zhì)點(diǎn)作為一類,即一個(gè)人臉樣本,共得到z個(gè)樣本。
3 求解相似度指標(biāo)
我們將每個(gè)點(diǎn)到每個(gè)聚類中心的距離排序,即將矩陣D(每個(gè)點(diǎn)到每個(gè)聚類中心的距離的m*z矩陣)的每一行排序得到矩陣A1。將質(zhì)點(diǎn)序號(hào)作為橫軸,質(zhì)點(diǎn)到聚類中心的距離作為縱軸,將矩陣A1的每一列數(shù)值帶入,描出m個(gè)點(diǎn),做出擬合曲線,這樣即可繪制出z條曲線。由圖像可以清晰的看出每個(gè)質(zhì)點(diǎn)到本身聚類中心的距離與到次近的聚類中心的距離之間存在明顯分界。這表明我們經(jīng)過聚類分析之后得到的同一簇照片的相似度很高,且與不同類的照片之間差距較大。
具體做法是:多次求出矩陣A1的第一列的均值K1后對(duì)K1再求均值記為K1,多次求出矩陣A1的第二列均值K2再對(duì)K2求均值記為K2,多次求出第一列最大值M1再對(duì)M1求均值記為M1,多次求出第二列最小值M2再對(duì)M2求均值記為M2,計(jì)算M1和M2的算數(shù)平均數(shù)記為M*。
4 判別標(biāo)準(zhǔn)
對(duì)于任意給定的兩張照片,先將兩張照片進(jìn)行圖像灰度處理,和選區(qū)處理,得到n維歐氏空間中的兩個(gè)點(diǎn),計(jì)算兩個(gè)點(diǎn)之間的余弦距離記為d。
1)若d<=K1;則認(rèn)為兩只照片一定屬于同一個(gè)人。
2)若K1 3)若M* 4)若K2 5 結(jié)果分析 我們選擇了50組數(shù)據(jù)進(jìn)行模型結(jié)果的計(jì)算,由于篇幅有限,局部測試結(jié)果如圖2所示。 通過結(jié)果分析我們可以得出如下結(jié)論: 1)在僅有50次隨機(jī)抽取驗(yàn)證中,我們建立的模型可保持86%的正確率,成功判別的效果還是非??捎^的,而且若在更多樣本數(shù)量的情況下,正確率還可以進(jìn)一步提升。 2)在所有正確判別的個(gè)案中,4種結(jié)果比例:“一定相似”占9.3%、“很大可能相似”占2.3%、“有可能相似”占14.0%、“不相似”占74.4%,即很容易看出我們的模型對(duì)于不相似(不是同一個(gè)人)的照片有更高更可靠的判別效果。 參考文獻(xiàn) [1]楊浩,張二喜,蔣卓蕓.基于距離測度的PCA人臉識(shí)別研究[J].陜西理工學(xué)院學(xué)報(bào):自然科學(xué)版,2016(4):45-50. [2]劉昶,周激流,郎方年,等.基于加權(quán)判別局部多線性嵌入的人臉識(shí)別[J].儀器儀表學(xué)報(bào),2011,32(10):2248-2255. [3]葉長明,蔣建國,詹曙,等.不同姿態(tài)人臉深度圖識(shí)別的研究[J].電子測量與儀器學(xué)報(bào),2011,25(10):48-56.