国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于PCA與SVM的人臉識別技術(shù)

2019-10-12 06:47張庶李子月劉玉超李琳韓文
指揮與控制學(xué)報 2019年3期
關(guān)鍵詞:降維分類器人臉

張庶 李子月,2 劉玉超,3 李琳 韓文

隨著人工智能技術(shù)的發(fā)展,人臉識別技術(shù)也得到了前所未有的關(guān)注.目前,人臉識別技術(shù)已經(jīng)廣泛應(yīng)用于安防、金融、數(shù)碼相機、門禁系統(tǒng)、身份識別、網(wǎng)絡(luò)應(yīng)用等場景中.人臉識別技術(shù)包括基于幾何特征的方法(Geometrical Features Based,GFB)、局部特征分析方法(Local Face Analysis,LFA)、基于動態(tài)鏈接模型的方法(Dynamic Link Architecture,DLA)、卷積神經(jīng)網(wǎng)絡(luò)算法(Convolutional Neural Networks,CNN)和主成分分析(Principal Component Analysis,PCA)算法.其中,PCA是由Turk和Pentland在20世紀(jì)90年代初期提出的[1],是目前最流行的算法之一.

PCA方法核心是基于K-L變換[2]對人臉圖像進(jìn)行降維和特征提取.該方法先對人臉庫中人臉向量歸一化并求得平均臉,然后求得每張人臉圖像與平均臉圖像插值的協(xié)方差矩陣,最后利用奇異值分解(Singular Value Decomposition,SVD)來達(dá)到降維.降維后,需要通過分類器來決策分類,利用高斯核函數(shù)的支持向量機(Support Vector Machine,SVM)分類器能夠向高維空間進(jìn)行映射,對非線性問題效果良好,具有很好的泛化能力.本文基于PCA方法和SVM方法來對圖像識別,并用K折交叉驗證法驗證SVM分類器的性能,并首次將該人臉識別技術(shù)應(yīng)用在實驗室開發(fā)的無人巡邏車中.實驗結(jié)果表明該技術(shù)與其他傳統(tǒng)方法相比具有較高的識別率和識別速度;與CNN方法相比,識別精度雖然不占有明顯優(yōu)勢,但具有更快的識別速度,具備更好的實時性能.

1 PCA算法原理

PCA本質(zhì)是找出一組投影空間,使得在投影空間的數(shù)據(jù)能最大限度地代表原始數(shù)據(jù).PCA法能夠降低數(shù)據(jù)的維數(shù),減少圖像中冗余的信息和噪聲并且使降維后的數(shù)據(jù)不能失真[3].其中,冗余信息指數(shù)據(jù)中與其他數(shù)據(jù)線性相關(guān)的數(shù)據(jù),這些數(shù)據(jù)被其他數(shù)據(jù)線性表示;噪聲代表矩陣較小的特征根對應(yīng)的特征向量,常見的噪聲包括光照、陰影等.而通常的方法是通過保留數(shù)據(jù)的低階主成分去除高階主成分,從而能夠保留數(shù)據(jù)中的核心部分去除冗余和噪聲[4].

1.1 去均值及協(xié)方差矩陣

設(shè)集合S包含m張圖片,集合S可以表示為:

其中,Ti=[Ti1,Ti2,···,Tin]T為第 i張圖片灰度值組成的列向量,n為矩陣的維度.集合S的平均向量為:

向量Ti與平均向量Ψ的差值為:

圖1為從ORL人臉數(shù)據(jù)庫選取的10張人臉圖片所得到的結(jié)果,其中,左側(cè)為原始圖人臉圖片,中間為獲取的平均臉,右側(cè)為去均值后的偏差臉.

圖1 平均臉與偏差臉

得到的去中心化的圖片向量組成的集合:

PCA降維的數(shù)學(xué)原理是求解樣本集合在新的坐標(biāo)系下的投影之和最大,以二維數(shù)據(jù)集壓縮為一維數(shù)據(jù)集為例,求解方程為數(shù)據(jù)集在單位向量u的投影最大[5]:

1.2 SVD降維及維度k k k的選擇

其中,左奇異矩陣 U=[U1,U2,···,Un]是 n× n矩陣, 奇異值矩陣 Σ =diag(σ11,σ22···,σnn). 假設(shè)降維后維度為k,則降維后的映射矩陣Ureduce=[U1,U2,···,Uk]是 n× k 矩陣.向量 Φi在標(biāo)架{U1,U2,···,Uk}的投影為:

而Zi在原坐標(biāo)系下的近似值為:

從而得到向量Φi在映射矩陣Ureduce的誤差為:

Φi?Φi_approx.

定義樣本集的投影誤差滿足門限值ε:

式(9)可以轉(zhuǎn)化為:

因此,維度k的選擇為:選組最小值k,使其滿足式(10).

圖2為對上述10張人臉原型圖進(jìn)行降維得到的特征臉圖.

圖2 降維后反投影特征人臉圖像

2 SVM分類器設(shè)計

SVM是一種二分類模型,它的基本模型是定義在特征空間上的間隔最大的線性分類器[6].支持向量機模型采用非線性核函數(shù),可將輸入數(shù)據(jù)向非線性空間投影,從而使得支持向量機能夠成為一種非線性分類器.支持向量機的學(xué)習(xí)策略是間隔最大化,可形式化為一個求解凸二次規(guī)劃的問題,其學(xué)習(xí)算法是糾結(jié)凸二次規(guī)劃的最優(yōu)化算法[7].

2.1 SVM目標(biāo)函數(shù)

SVM的凸二次規(guī)劃問題為:

其中,C為懲罰參數(shù),ξi為松弛因子.

構(gòu)造拉格朗日函數(shù):

其中,αi、μi為拉格朗日乘子.

式(12)對ω、b及ξi求偏導(dǎo)并令偏導(dǎo)為0,最終求得式(11)的對偶問題為:

最優(yōu)超平面分類器表達(dá)式為:

2.2 高斯核函數(shù)

對于線性不可分的訓(xùn)練樣本,可用核函數(shù)將樣本投影到高維空間,從而使樣本在高維空間內(nèi)線性可分[8?9].

核函數(shù)定義為:

其中,Φ(x)為投影函數(shù),可將向量x向高維投影.本文采用的核函數(shù)為高斯核函數(shù):

采用高斯核函數(shù)的支持向量機稱為徑向基函數(shù)(RBF)分類器[1],從而對偶問題式(13)轉(zhuǎn)化為:

最優(yōu)超平面為:

3 SVM人臉識別結(jié)果

本文將ORL人臉數(shù)據(jù)庫中400張人臉圖片,獲取在投影空間Ureduce下的降維特征向量,并采用隨機排序方法生成訓(xùn)練集和測試集,其中,訓(xùn)練集和測試集各為200張.支持向量機的核函數(shù)采用高斯核函數(shù),模型的最優(yōu)參數(shù)采用網(wǎng)格搜索法獲取,采用交叉驗證法驗證該SVM模型在測試數(shù)據(jù)集的性能.式(17)的最優(yōu)規(guī)劃求解采用序列最小最優(yōu)(Sequential Minimal Optimization,SMO)法.SMO算法是一種啟發(fā)式算法,其基本思路是:如果所有的變量的解都滿足此最優(yōu)化問題的KKT條件,則得到了該最優(yōu)化問題的解[11-12].

3.1 網(wǎng)格搜索法確定C C C和γ

采用高斯核函數(shù)的SVM模型有兩個非常重要的參數(shù):C和γ.其中,C是罰函數(shù)系數(shù),表征對誤差的容限度.較大的C表征對誤差具有較小的容限,往往容易導(dǎo)致數(shù)據(jù)分類過擬合;較小的C表征能容許較大的誤差,容易導(dǎo)致數(shù)據(jù)分類欠擬合.較大或較小的C都將導(dǎo)致模型不具備良好的泛化性能.

γ是核函數(shù)的參數(shù),該參數(shù)決定了數(shù)據(jù)投影到新的特征空間后的分布.γ值越大,支持向量越少,γ值越小,支持向量越多.支持向量的個數(shù)影響訓(xùn)練與預(yù)測的速度[13].

高斯核函數(shù)中σ和γ的關(guān)系如下:

即:

C與γ一般通過網(wǎng)格搜索法[14?15]來確定.

針對訓(xùn)練集,采取不同的log2C和log2γ的精度ε繪制的等高線圖如圖3所示,最終獲取支持向量機模型的參數(shù)為:γ=0.5;C=1.0,訓(xùn)練集的精度為0.975(195/200),該模型對測試集的精度為0.965(192/200).

圖3 log2C-log2γ等高線圖

3.2 K K K折交叉驗證

K折交叉驗證法先將數(shù)據(jù)集D劃分為K個大小相似的互斥子集[16],即:

子集Di從D中分層采樣獲取,從而保持子集與原始數(shù)據(jù)分布規(guī)律的一致性.在實際驗證過程中,每次以K-1個子集的并集作為訓(xùn)練集,剩下的一個子集作為測試集,因此,可以獲取K組訓(xùn)練、測試集,最終返回的是K組測試結(jié)果的平均值.

本文采用10折交叉驗證,每個子集的樣本數(shù)量為40,驗證結(jié)果如表1所示:

表1 10折交叉驗證結(jié)果

測試結(jié)果表明,該SVM分類器在整個訓(xùn)練樣本空間的精度為98.10%,在測試樣本空間的精度為97.78%,具備較高的識別率.

4 應(yīng)用場景無人巡邏車平臺測試

為驗證PCA+SVM人臉識別技術(shù)在真實場景中的性能,將其搭載于圖4所示無人巡邏車中進(jìn)行測試,并與其他方法進(jìn)行比對.圖4為一體化指揮調(diào)度技術(shù)國家工程實驗室研發(fā)的搭載高清攝像頭及其他感知設(shè)備的無人巡邏車,該無人巡邏車采用5G通信,可實現(xiàn)人臉識別、障礙物感知、車輛識別、高精度定位、路徑規(guī)劃及超高清視頻傳輸?shù)裙δ?主要用于小區(qū)治安巡邏.巡邏車人臉識別模塊采用上述PCA+SVM方法,可實現(xiàn)對小區(qū)內(nèi)出入人員精準(zhǔn)識別.

圖4 搭載PCA+SVM人臉識別技術(shù)的無人巡邏車

對無人巡邏車分別采用PCA+SVM法、CNN法、DLA法、LFA法進(jìn)行識別并比對結(jié)果,其識別精度及單張圖片識別速度如表2和圖5所示.實驗結(jié)果表明,PCA+SVM法與DLA和LFA相比,在識別精度和速度上都具有一定優(yōu)勢,與CNN方法相比,識別精度不相上下,但是識別速度較快,可以滿足無人巡邏車場景實時識別的要求.

表2 無人巡邏車人臉識別結(jié)果比對

圖5 無人巡邏車人臉識別結(jié)果比對

5 結(jié)論

本文闡述了PCA降維原理及采用高斯核函數(shù)的SVM原理,并給出了降維后維度K及基于RBF的支持向量機的參數(shù)C和γ選擇方法;基于ORL人臉數(shù)據(jù)庫對400張人臉圖片樣本進(jìn)行數(shù)據(jù)降維,降維后的人臉向量作為SVM的輸入樣本,采用分層取樣法將樣本分成訓(xùn)練集和測試集,并用訓(xùn)練集訓(xùn)練SVM模型,利用網(wǎng)格搜索法確定SVM的參數(shù).該SVM模型在測試集的精度為97.78%,用10折交叉驗證法驗證了該分類器的性能,測試表明該分類器的精度達(dá)到98.1%.

PCA結(jié)合SVM方法在無人巡邏車的實驗結(jié)果表明,相對于傳統(tǒng)的DLA和LFA方法相比,在精度與速率上都具有一定的優(yōu)勢,相對于CNN方法,在精度持平的情況下,同樣具有識別速率上的優(yōu)勢.

下一步將在該方法的基礎(chǔ)上對圖片進(jìn)行降噪濾波,以提高模型在強光照及陰雨天氣下的識別率.

猜你喜歡
降維分類器人臉
混動成為降維打擊的實力 東風(fēng)風(fēng)神皓極
學(xué)貫中西(6):闡述ML分類器的工作流程
基于數(shù)據(jù)降維與聚類的車聯(lián)網(wǎng)數(shù)據(jù)分析應(yīng)用
有特點的人臉
一起學(xué)畫人臉
玻璃窗上的人臉
基于樸素Bayes組合的簡易集成分類器①
大氣腐蝕數(shù)據(jù)降維最優(yōu)維度研究
基于動態(tài)分類器集成系統(tǒng)的卷煙感官質(zhì)量預(yù)測方法
降維打擊
奇台县| 富宁县| 尚义县| 道真| 嘉黎县| 合山市| 鄂托克旗| 中江县| 朝阳区| 汝南县| 徐汇区| 祁阳县| 华宁县| 搜索| 玛曲县| 琼中| 太湖县| 延寿县| 文水县| 抚顺县| 鸡西市| 黑山县| 吴桥县| 曲水县| 滨州市| 江都市| 元江| 廉江市| 怀柔区| 溆浦县| 遵化市| 东阿县| 略阳县| 桓台县| 红河县| 靖宇县| 武陟县| 桐柏县| 明溪县| 克山县| 辛集市|