国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于LVQ神經(jīng)網(wǎng)絡(luò)模型的人臉檢測方法

2021-07-14 01:30艷,祁
液晶與顯示 2021年7期
關(guān)鍵詞:膚色人臉神經(jīng)元

王 艷,祁 萌

(成都工業(yè)學(xué)院 電子工程學(xué)院,四川 成都 610031)

1 引 言

人臉檢測是指在一幅給定的圖像中,采用一定的方法找出所有人臉的位置、大小和姿態(tài)[1-2]。隨著電子商務(wù)和現(xiàn)代成像技術(shù)的快速發(fā)展,自動人臉檢測技術(shù)已經(jīng)廣泛應(yīng)用到除人臉識別外的其他應(yīng)用領(lǐng)域,如面部表情分析、性別/年齡識別、圖像視頻搜索、人機(jī)交互系統(tǒng)、3D顯示等應(yīng)用領(lǐng)域。雖然人類可以非常容易地完成人臉檢測、面部表情識別等,但是基于人臉圖像分析的自動人臉檢測技術(shù)卻是一項(xiàng)復(fù)雜且及具挑戰(zhàn)性的問題。自上世紀(jì)60年代人臉識別研究開始以來,人臉檢測技術(shù)已發(fā)展了很長一段時間,但是現(xiàn)有的檢測技術(shù)仍然面臨很多問題,具體原因在于:(1)成像環(huán)境復(fù)雜;(2)人臉表情、姿態(tài)的多變性;(3)人臉遮擋等。

目前,國內(nèi)外針對人臉檢測的研究很多,常見的人臉檢測方法有特征分析法[3-7]、模板匹配法[8-10]、SVM模型[11]、AdaBoost算法[12]、深度學(xué)習(xí)[13]等?;谥R規(guī)則的特征分析法主要包括3種:人臉形狀輪廓、紋理以及膚色,其中膚色特征是人臉的顯著性特征之一,且實(shí)際應(yīng)用中采集圖像多為彩色圖像,因此基于膚色特征的人臉檢測應(yīng)用更為廣泛。

機(jī)器學(xué)習(xí)作為一種特別適合涉及智慧問題的技術(shù),近年來被引入目標(biāo)檢測、圖像識別領(lǐng)域。神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)的一個模型,已經(jīng)被廣泛地使用[14-19]。近年來,隨著人工智能的快速發(fā)展,學(xué)習(xí)矢量量化(Learning Vector Quantization,LVQ)神經(jīng)網(wǎng)絡(luò)[20-23]逐漸受到廣大學(xué)者的青睞。LVQ神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡單,只通過內(nèi)部單一的相互作用就可以完成十分復(fù)雜的分類處理,也很容易將設(shè)計(jì)域中的各種繁雜分散的設(shè)計(jì)條件收斂到結(jié)論上來。而且它不需要對輸入向量進(jìn)行歸一化、正交化處理,簡單易行。因此,本文設(shè)計(jì)出一種膚色特征和LVQ神經(jīng)網(wǎng)絡(luò)相結(jié)合的人臉檢測算法。首先分析人臉膚色特征,設(shè)定可以定位膚色區(qū)域的閾值條件,然后以該約束條件作為收斂條件,構(gòu)建LVQ神經(jīng)網(wǎng)絡(luò)模型。然后選取100幅圖像作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,20幅圖像作為測試樣本。經(jīng)過訓(xùn)練,得到了有效的權(quán)值。利用訓(xùn)練后的神經(jīng)網(wǎng)將人臉從背景中分割出來,定位出人臉部分,最后,對分割后的圖像進(jìn)行形態(tài)學(xué)處理。

2 人臉膚色特征提取

膚色特征是面部的基本特征,不依賴于人的面部表情、姿態(tài)等,且具有穩(wěn)定性,能夠區(qū)分于大多數(shù)背景物體的顏色,因此提取圖像的膚色特征作為人臉檢測的方法具有簡單直觀的優(yōu)點(diǎn)。利用膚色信息進(jìn)行人臉檢測的方法是根據(jù)膚色在某個色彩空間的膚色分布來檢測人臉的,檢測的準(zhǔn)確率與顏色空間的選擇密切相關(guān)。圖1為膚色在不同顏色空間在的分布軌跡。從圖1可以看出,顏色空間不同,膚色的分布特性不同。

圖1 膚色在不同顏色空間分布圖Fig.1 Distribution of skin color in different color spaces

在選擇色彩空間時,需要考慮膚色在某個色彩空間的聚類特性,且不受光照條件的影響。基于膚色的人臉檢測方法是通過確定每個顏色分量的閾值來分割出人臉部分的,所以在選擇顏色空間時,需要考慮膚色在該空間的聚類特性。圖2為膚色在RGB、YCbCr以及HSV顏色空間中各顏色分量的分布情況。由圖2可知,RGB彩色空間中R、G、B分量關(guān)聯(lián)性太強(qiáng)且很難將膚色聚類,因而不適合用來作為人臉膚色特征。HSV顏色空間中,各顏色分類緊湊型不好。YCbCr空間模型的Cb、Cr分量相互獨(dú)立,膚色在該空間具有良好的聚類特性,且受亮度變化影響較少,因此本文選擇將Cb、Cr分量作為人臉膚色特征進(jìn)行人臉檢測。

雖然YCbCr色彩空間具有良好的聚類特性,但膚色分布區(qū)間較大,會受到非膚色區(qū)域的干擾,且該色彩空間并非對所有彩色圖像都適合,因而考慮融合多種顏色空間,提取相應(yīng)的顏色分量作為人臉膚色特征。

(a)膚色在RGB空間中的分布情況(a)Distribution of skin in RGB

HSI色彩空間模型是從人的視覺系統(tǒng)出發(fā),直接使用顏色三要素色調(diào)、飽和度和亮度來描述顏色。亮度是指人眼感覺光的明暗程度。色調(diào)和飽和度統(tǒng)稱色度,用來表示顏色的類別和深淺程度。由于人眼對亮度的敏感程度遠(yuǎn)強(qiáng)于對顏色濃淡的敏感程度,HSI色彩空間更符合人的視覺特性。另外,HSI空間中亮度和色度具有可分離性,更適合于圖像處理和機(jī)器視覺中的算法處理。膚色在HSI空間中的顏色聚類情況如圖3所示。H分量和S分量相互分離,且明顯分布在特定區(qū)域內(nèi),具有良好的聚類特性。

圖3 膚色在HSI空間的聚類特性Fig.3 Clustering characteristics of skin in HSI space

綜上分析,選定Cb、Cr、H、S作為描述人臉信息的特征,將人臉區(qū)域從背景區(qū)域分離出來。

3 基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測算法

基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測算法如圖4所示,具體實(shí)現(xiàn)步驟為:

圖4 基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測算法Fig.4 Face detection algorithm based on LVQ neural network

(1)通過攝像系統(tǒng)采集人臉圖像;

(2)將圖像轉(zhuǎn)換到Y(jié)CbCr及HSI顏色空間,提取Cb、Cr、H、S顏色分量;

(3)以90≤Cb≤130,130≤Cr≤170,0.05

(4)創(chuàng)建LVQ網(wǎng)絡(luò),將訓(xùn)練集數(shù)據(jù)送到網(wǎng)絡(luò)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直到迭代中止;

(5)網(wǎng)絡(luò)訓(xùn)練收斂后,對測試集數(shù)據(jù)進(jìn)行預(yù)測,即對測試集的數(shù)據(jù)進(jìn)行測試;

(6)根據(jù)三庭五眼規(guī)則最終定位出人臉區(qū)域。

3.1 LVQ神經(jīng)網(wǎng)絡(luò)模型

LVQ神經(jīng)網(wǎng)絡(luò)是從Kohonen算法演變而來的一種輸入前向神經(jīng)網(wǎng)絡(luò),屬于有監(jiān)督學(xué)習(xí)方法。LVQ神經(jīng)網(wǎng)絡(luò)由輸入層、競爭層和輸出層3層神經(jīng)元組成。輸入層與競爭層采用全連接的方式,競爭層與輸出層采用部分連接的方式,競爭層神經(jīng)元個數(shù)總是大于輸出層神經(jīng)元個數(shù),每個競爭層神經(jīng)元只與一個輸出層神經(jīng)元相連接。通過網(wǎng)絡(luò)訓(xùn)練,輸入層和競爭層之間的權(quán)值會發(fā)生改變并逐漸聚類。競爭層的神經(jīng)元通過競爭,勝者的神經(jīng)元被激活為1,而其他神經(jīng)元為0,與激活神經(jīng)元相連接的輸出層神經(jīng)元狀態(tài)也調(diào)整為1,而與未激活神經(jīng)元相連接的輸出神經(jīng)元狀態(tài)為0,從而給當(dāng)前樣本進(jìn)行分類。

基于膚色信息特征的人臉檢測方法是基于圖像像素分類的一種檢測方法,根據(jù)膚色信息在各顏色空間中的聚類特性發(fā)現(xiàn),采用LVQ神經(jīng)網(wǎng)絡(luò)對像素進(jìn)行分類是非常適用的。根據(jù)前述分析,選用Cb、Cr、H、S用來描述人臉特征,作為LVQ神經(jīng)網(wǎng)絡(luò)的輸入,輸出則分為2類,人臉像素和非人臉像素。

3.2 LVQ神經(jīng)網(wǎng)絡(luò)訓(xùn)練

圖5為用于人臉檢測的LVQ神經(jīng)網(wǎng)絡(luò)模型。LVQ神經(jīng)網(wǎng)絡(luò)通過自主學(xué)習(xí)來完成對輸入向量的分類,在完成模型構(gòu)建后,需要對模型進(jìn)行不斷訓(xùn)練。具體實(shí)現(xiàn)步驟如下:

圖5 基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測模型Fig.5 Face detection model based on LVQ neural network

(1)訓(xùn)練集/測試集產(chǎn)生

選取100幅圖像作為訓(xùn)練圖像,20幅圖像作為測試圖像,分別構(gòu)造訓(xùn)練集和測試集。圖像大小為250×250像素,每張圖像按類存儲為1個62 500的行向量,這樣訓(xùn)練集有100×62 500個樣本,測試集有20×62 500個樣本。

(2)創(chuàng)建LVQ網(wǎng)絡(luò)

利用newlvq()函數(shù)創(chuàng)建LVQ神經(jīng)網(wǎng)絡(luò),輸入向量為Xi=[CbCrHS],i=1,2,3,…,400 000;競爭層神經(jīng)元的個數(shù)設(shè)為20,學(xué)習(xí)速率為0.01。由于訓(xùn)練集是隨機(jī)產(chǎn)生的,所以參數(shù)PC值需要計(jì)算,計(jì)算方式為人臉像素占整個圖像像素的比例。

(3)訓(xùn)練LVQ網(wǎng)絡(luò)

(a)將輸入向量X=[CbCrHS]T送到輸入層,計(jì)算競爭層神經(jīng)元與輸入向量的距離;

(b)與輸入向量距離最小的神經(jīng)元為獲勝神經(jīng)元;

(c)根據(jù)分類結(jié)果是否準(zhǔn)確,調(diào)整獲勝神經(jīng)元的權(quán)值;

(d)訓(xùn)練次數(shù)達(dá)到設(shè)定值,返回步驟(a)進(jìn)行新的樣本訓(xùn)練,直到訓(xùn)練結(jié)束。

4 實(shí)驗(yàn)與分析

4.1 實(shí)驗(yàn)效果

基于本文提出的算法,搭建實(shí)驗(yàn)平臺進(jìn)行性能測試。采用Intel Core i5,3 GHz CPU,3G內(nèi)存計(jì)算機(jī),配合Win7、Matlab作為實(shí)驗(yàn)平臺。圖像數(shù)據(jù)采用LFW人臉數(shù)據(jù)。LFW人臉數(shù)據(jù)集是目前做人臉檢測與識別常用的數(shù)據(jù)集,圖像均來自于真實(shí)場景,共有5 749人的13 233張人臉圖像,圖像大小為250×250。

實(shí)驗(yàn)過程為:隨機(jī)從圖像數(shù)據(jù)集中選取100幅圖片作為訓(xùn)練樣本,20幅圖像作為測試樣本。將圖像轉(zhuǎn)換到Y(jié)CbCr和HSI顏色空間,提取圖像的Cb、Cr、H、S顏色分量,分別構(gòu)造100×4大小的訓(xùn)練數(shù)據(jù)集和20×4的測試數(shù)據(jù)集,用作LVQ神經(jīng)網(wǎng)絡(luò)的輸入,輸出為0和1,分別表示非人臉像素和人臉像素。LVQ神經(jīng)網(wǎng)絡(luò)模型迭代次數(shù)為150次,誤差為0.001。

訓(xùn)練完成后得到了有效的權(quán)值,利用訓(xùn)練后的LVQ網(wǎng)絡(luò)對人臉進(jìn)行檢測,實(shí)驗(yàn)結(jié)果如圖6所示。圖6(a)為待進(jìn)行人臉檢測的原始圖像,經(jīng)過LVQ神經(jīng)網(wǎng)絡(luò)模型分類后,可以有效地將膚色區(qū)域和非膚色區(qū)域區(qū)分開,如圖6(b)所示。由于分類方法采用的是基于膚色信息進(jìn)行分類,經(jīng)過LVQ網(wǎng)絡(luò)模型分類后的圖像仍然存在非人臉區(qū)域,因此需要運(yùn)用輔助方法進(jìn)行精確人臉定位。觀察圖6(b)人臉區(qū)域發(fā)現(xiàn),人眼部分非常明顯地區(qū)分于其他部位,因此可以考慮用三庭五眼法精確定位出人臉區(qū)域,得到如圖6(c)的實(shí)驗(yàn)效果。

圖6 LVQ模型人臉檢測結(jié)果Fig.6 Results of face detect based on LVQ

4.2 對比實(shí)驗(yàn)

為進(jìn)一步驗(yàn)證本文算法的適用性,選取了LFW、丹麥藝術(shù)大學(xué)人臉庫(AFW)和加州理工大學(xué)人臉庫(Faces)數(shù)據(jù)集進(jìn)行性能測試,并將本方法與文獻(xiàn)[6]和文獻(xiàn)[7]分別在上述3個數(shù)據(jù)集上進(jìn)行了測試,測試結(jié)果如表1所示。

從表1可以看出,本文算法在LFW、AFW和Faces3個數(shù)據(jù)集的正檢率分別為76.82%,84.42%,100%,誤檢率分別為17.34%,12.34%,0,漏檢率分別為21.55%,15.63%,0。實(shí)驗(yàn)結(jié)果表明,本文算法在Faces數(shù)據(jù)集上的正檢率最高,誤檢率和漏檢率最低,檢測效果均優(yōu)于AFW數(shù)據(jù)集和LFW數(shù)據(jù)集。這是因?yàn)椋篎aces數(shù)據(jù)集中的人臉圖像全部為單人臉圖像;AFW數(shù)據(jù)集既有單人圖像,又有多人圖像,且圖像背景較為簡單;LFW數(shù)據(jù)集則是一個無約束的數(shù)據(jù)集,人臉數(shù)多且存在多人重疊、遮擋、受光照環(huán)境、人臉朝向及拍攝距離等復(fù)雜背景的影響。本文算法在檢測人臉時,主要依據(jù)的是顏色特征和三庭五眼法將人臉區(qū)域識別出來,若被檢測圖片中存在人臉遮擋、小尺度人臉的情況,由于利用膚色特征分割出來的人臉區(qū)域難以滿足三庭五眼的比例,則會導(dǎo)致檢測結(jié)果與實(shí)際情況出現(xiàn)偏差。

表1 性能對比測試結(jié)果Tab.1 Comparison result ofperformance test (%)

與文獻(xiàn)[6]和文獻(xiàn)[7]中相比,本文算法在三個數(shù)據(jù)集上的測試效果均表現(xiàn)出了較好的優(yōu)越性,正檢率提高了至少7%,漏檢率降低了10%以上,誤檢率降低了近2倍。在Face測試集上的效果尤其好,正檢率達(dá)到了100%,誤檢率和漏檢率為0。實(shí)驗(yàn)結(jié)果表明:本文提出的基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測模型具有一定的優(yōu)越性。

考慮到紋理以及邊緣均是可以作為將人臉區(qū)分于背景區(qū)域的特征,本文分別提取了紋理特征、邊緣特征以及紋理特征、邊緣特征相結(jié)合,作為LVQ神經(jīng)網(wǎng)絡(luò)的輸入,用于人臉檢測的性能測試,實(shí)驗(yàn)結(jié)果如表2所示。從表2可以看出,相較于膚色特征而言,利用紋理特征以及邊緣特征進(jìn)行人臉檢測在性能上并沒有實(shí)質(zhì)意義上的提高。人臉的表情具有復(fù)雜多變的特點(diǎn),同一個人會有不同的表情變化,從而引起面部輪廓特征和紋理特征發(fā)生變化,很難用統(tǒng)一的標(biāo)準(zhǔn)來精確進(jìn)行人臉分割。而膚色特征不依賴于人的面部表情、姿態(tài)等,具有穩(wěn)定性和良好的聚類性,便于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和分類。綜上所述,本文所提出的采用膚色作為特征,利用LVQ神經(jīng)網(wǎng)絡(luò)對人臉進(jìn)行檢測的方法具有良好的魯棒性。

表2 多特征對比測試結(jié)果Tab.2 Comparison test result of multi-feature (%)

5 結(jié) 論

人臉檢測技術(shù)作為人與計(jì)算機(jī)、機(jī)器人等各種交互系統(tǒng)的前置技術(shù),廣泛應(yīng)用于圖像搜索、智能監(jiān)控、公安偵查等各個領(lǐng)域中。基于人臉膚色特征的穩(wěn)定性和可靠性,利用LVQ神經(jīng)網(wǎng)絡(luò)模型穩(wěn)定的分類識別能力,本文構(gòu)造了一種結(jié)合膚色特征的LVQ神經(jīng)網(wǎng)絡(luò)模型用于人臉檢測。經(jīng)過實(shí)驗(yàn)測試表明,本文的方法能夠在一定程度上提高人臉檢測的性能,與其他算法在相同數(shù)據(jù)集上進(jìn)行了對比測試,顯示了良好的優(yōu)越性。

但是人臉檢測是一項(xiàng)復(fù)雜的系統(tǒng)工程,本文算法沒有考慮重疊人臉、多尺度人臉以及遮擋人臉等復(fù)雜應(yīng)用場景,因而存在漏檢率和誤檢測率較高的問題。尋找具有特征不變性和尺度不變性的多特征融合的人臉檢測方法以提高檢測的實(shí)時性和準(zhǔn)確性是下一步的研究方向。

猜你喜歡
膚色人臉神經(jīng)元
有特點(diǎn)的人臉
一起學(xué)畫人臉
Conversation in a house
人的膚色為什么不同
為什么人有不同的膚色?
三國漫——人臉解鎖
躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
基于二次型單神經(jīng)元PID的MPPT控制
ERK1/2介導(dǎo)姜黃素抑制STS誘導(dǎo)神經(jīng)元毒性損傷的作用
毫米波導(dǎo)引頭預(yù)定回路改進(jìn)單神經(jīng)元控制
景谷| 大同县| 宁夏| 宜君县| 铁力市| 利辛县| 武清区| 岚皋县| 华安县| 洪洞县| 沙湾县| 安陆市| 宜兰县| 东阳市| 息烽县| 巴林右旗| 岳阳市| 葵青区| 沂水县| 金坛市| 麻城市| 四会市| 佛冈县| 八宿县| 易门县| 同仁县| 墨玉县| 峨山| 巴马| 武山县| 沙河市| 定西市| 进贤县| 图木舒克市| 习水县| 沁源县| 丰镇市| 渭源县| 彰武县| 临武县| 秀山|