程國(guó)建,石彩云,朱 凱
(1.西安石油大學(xué) 計(jì)算機(jī)學(xué)院,陜西 西安710065;2.美國(guó)太平洋大學(xué) 工程與計(jì)算機(jī)科學(xué)系,美國(guó) 加州斯托克頓CA 95211)
人臉識(shí)別指利用人臉視覺(jué)特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù),是機(jī)器視覺(jué)和模式識(shí)別領(lǐng)域最具有挑戰(zhàn)性的課題之一。與指紋識(shí)別、視網(wǎng)膜識(shí)別,基因識(shí)別等生物技術(shù)相比,它具有對(duì)人體無(wú)傷害、無(wú)限制、友好方便等優(yōu)點(diǎn),是一種比較理想的生物識(shí)別技術(shù)。當(dāng)前主流的人臉識(shí)別技術(shù)有基于幾何特征的方法[1]、神經(jīng)網(wǎng)絡(luò)方法[2]、彈性圖匹配方法、PCA[3](主成分分析)方法等。
粒子群優(yōu)化 (particle swarm optimization,PSO)算法是1995年Kennedy和Eberhart通過(guò)對(duì)鳥類覓食行為的研究共同提出的[4]。PSO的優(yōu)勢(shì)在于算法簡(jiǎn)單,沒(méi)有許多參數(shù)需要調(diào)整。目前已廣泛應(yīng)用于函數(shù)優(yōu)化、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、模糊系統(tǒng)控制以及遺傳算法的應(yīng)用領(lǐng)域,主要是針對(duì)連續(xù)函數(shù)優(yōu)化問(wèn)題。但是在許多優(yōu)化問(wèn)題中,自變量是整數(shù),比如生產(chǎn)調(diào)度、路由選擇、以及很多整數(shù)規(guī)劃問(wèn)題。針對(duì)0-1整數(shù)規(guī)劃問(wèn)題,Kennedy和Eberhart博士1997年提出了二進(jìn)制粒子群算法 (binary particle swarm optimization,BPSO)[5],目前已經(jīng)成功應(yīng)用于求解離散優(yōu)化問(wèn)題[6-7]。
人臉識(shí)別技術(shù)發(fā)展迅速,并且已經(jīng)應(yīng)用到了信息安全、視頻監(jiān)控、刑偵破案等領(lǐng)域。但是人臉識(shí)別技術(shù)受外部環(huán)境,如光照、攝像設(shè)備、設(shè)備距離和角度、圖像存儲(chǔ)質(zhì)量等的影響非常大?,F(xiàn)在人臉識(shí)別技術(shù)主要的挑戰(zhàn)課題就是,進(jìn)一步研究特征提取算法和識(shí)別算法,來(lái)提高識(shí)別率。本文中BPSO算法作為特征提取算法應(yīng)用到人臉識(shí)別中,希望對(duì)人臉識(shí)別技術(shù)的發(fā)展起到參考性作用。
離散余弦變換 (discrete cosine transform,DCT)經(jīng)常用作信號(hào)處理和圖像處理[8-9],對(duì)信號(hào)和圖像進(jìn)行有損數(shù)據(jù)壓縮。除了應(yīng)用在數(shù)據(jù)壓縮中,DCT還用于特征提?。?0]。這是由于DCT具有很強(qiáng)的 “能量集中”特性:大部分信號(hào)都集中在DCT變換后的低頻部分。DCT利用像素間的冗余,對(duì)圖像進(jìn)行去相關(guān)的處理。經(jīng)過(guò)去相關(guān)性處理后,變換后的相關(guān)系數(shù)可以進(jìn)行獨(dú)立編碼,而不影響壓縮效率[11]。DCT變換把圖像分成不同的部分 (不同的光譜帶),把輸入變換為加權(quán)函數(shù)的線性組合,這些基本函數(shù)就是輸入數(shù)據(jù)的頻率。DCT類似于傅立葉變換 (DFT),它們都是把信號(hào)或者圖像從空間域變換到頻域,并且都使用基函數(shù),具有良好的去相關(guān)性和能量壓縮的特性[12]。主要的不同點(diǎn)就是,DCT使用簡(jiǎn)單的余弦函數(shù)作為基函數(shù),而DFT是一個(gè)復(fù)雜的變換,圖像的大小和相位都要進(jìn)行編碼。
設(shè)f(x,y)一幅分辨率為M×N的人臉圖像矩陣,則其對(duì)應(yīng)的二維離散余弦變換和反余弦變換的公式分別為
其中
離散余弦變換是一種正交變換,在一定程度上減小了隨機(jī)變量的相關(guān)性,經(jīng)過(guò)DCT變換后,信號(hào)的能量集中在低頻部分 (對(duì)應(yīng)于DCT系數(shù)比較大的部分),也就是DCT陣列的左上角[13]。DCT變換可以用很少的系數(shù)包含圖像最具代表性的特征,也就是說(shuō),可以利用少數(shù)DCT系數(shù)就可以完成對(duì)圖像的重構(gòu)。如圖1所示,圖 (a)為原始圖像,(b)為經(jīng)過(guò)二維DCT變換后的結(jié)果,(c)為利用部分DCT系數(shù)進(jìn)行離散余弦逆變換重構(gòu)的圖像。從圖1(b)看出,能量大部分集中在變換后圖像的左上角。
圖1 離散余弦變換示例
只用很少的DCT系數(shù)就可以重構(gòu)人臉圖像,這使得DCT系數(shù)在人臉識(shí)別系統(tǒng)中非常關(guān)鍵,DCT系數(shù)對(duì)人臉識(shí)別效果非常重要,將在后面實(shí)驗(yàn)結(jié)果部分作分析介紹。
PSO算法是一種全新的智能算法[14]。類似于遺傳算法(GA),PSO算法也采用 “群體”與 “進(jìn)化”的概念,同樣也是根據(jù)個(gè)體 (粒子)的適應(yīng)度大小進(jìn)行操作。但是PSO算法不像GA算法那樣對(duì)個(gè)體使用進(jìn)化算子 (交叉和變異),而是將每個(gè)個(gè)體看作是在搜索空間中的一個(gè)沒(méi)有重量和體積的粒子,并在搜索空間中以一定的速度飛行。而且,這個(gè)飛行速度是由個(gè)體飛行經(jīng)驗(yàn)pbest和整個(gè)群體飛行經(jīng)驗(yàn)gbest進(jìn)行調(diào)整。假設(shè)在D維的搜索空間中,第i個(gè)粒子的位置為,速度為,第i個(gè)粒子經(jīng)過(guò)的最佳位置為pbest,所有粒子經(jīng)歷過(guò)的最佳位置為gbest,每次迭代的公式如下
式中:ω——慣性因子,一般取值區(qū)間為 (0.4,1.2);c1、c2——學(xué)習(xí)因子,一般取值區(qū)間為 (0,2);r1、r2——區(qū)間 (0,1)上的隨機(jī)數(shù);粒子的規(guī)模一般取30~50。圖2為基本PSO算法流程圖。
圖2 基本PSO算法流程
基本PSO算法適合求解無(wú)約束連續(xù)型最優(yōu)化問(wèn)題,對(duì)于有約束的優(yōu)化問(wèn)題,首先要轉(zhuǎn)換為無(wú)約束問(wèn)題,或者定義合理適應(yīng)度函數(shù)把問(wèn)題轉(zhuǎn)換為和原函數(shù)同解最優(yōu)化問(wèn)題[15]。為了使PSO算法應(yīng)用在離散型的優(yōu)化問(wèn)題中,Kennedy和Eberhart博士1997年提出BPSO算法。在BPSO算法中,模仿遺傳算法中的染色體,粒子被編碼成一個(gè)二進(jìn)制字符串,每一維的位置只能取0或1。從式 (5)和(6)看出,迭代后可能會(huì)取0、1以外的其它數(shù)值。為保證迭代后滿足取值為0或1,引入函數(shù)sig(x)
因此迭代公式就變?yōu)?/p>
BPSO算法在本文中的應(yīng)用主要是:從經(jīng)過(guò)DCT處理的人臉圖像特征空間中,提取最具代表性的特征子集。算法中的每個(gè)粒子代表一個(gè)可能的候選解,每代的進(jìn)化是通過(guò)適應(yīng)度函數(shù)來(lái)完成。適應(yīng)度函數(shù)如下
式中:Mi、M0——當(dāng)前分類的數(shù)目和樣本空間總平均數(shù)。
Mi的計(jì)算如下
這里,j=1,2,3,…,Ni表示wi類中的樣本圖像。M0的計(jì)算如下
這里的N表示所有類里面圖像的數(shù)目。
圖3給出了用二進(jìn)制粒子群算法進(jìn)行特征提取的算法流程圖。
實(shí)驗(yàn)用到的數(shù)據(jù)庫(kù)是ORL人臉數(shù)據(jù)庫(kù),由劍橋大學(xué)AT&T實(shí)驗(yàn)室創(chuàng)建,是人臉識(shí)別中常用的標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)庫(kù)。ORL數(shù)據(jù)庫(kù)包括40名志愿者的共400張人臉圖像,每張圖像的大小為92×112像素。部分志愿者圖像包括了姿態(tài)、表情和面部飾物的變化。圖4為ORL數(shù)據(jù)庫(kù)中部分人臉圖像。
人臉識(shí)別系統(tǒng)總的實(shí)現(xiàn)過(guò)程如圖5所示,具體實(shí)現(xiàn)步驟如下:
(1)首先對(duì)圖像進(jìn)行直方圖均衡化處理,直方圖均衡的目的是降低光照對(duì)圖像的影響,提高對(duì)比度;
(2)把人臉數(shù)據(jù)庫(kù)中每個(gè)人的前5張圖像作為訓(xùn)練樣本,后5張作為測(cè)試樣本,對(duì)訓(xùn)練樣本和測(cè)試樣本圖像都進(jìn)行二維離散余弦變換;
(3)得到離散余弦變換后的圖像,這時(shí)圖像最具代表性的元素集中在左上角,提取左上角一些元素組成特征向量;
(4)應(yīng)用BPSO算法對(duì)步驟 (3)中得到的特征向量進(jìn)行特征提?。?/p>
(5)利用歐式距離分類法判斷每個(gè)測(cè)試樣本所屬類別,最后輸出結(jié)果。
圖5 人臉識(shí)別系統(tǒng)框架
經(jīng)過(guò)二維DCT處理之后的圖像,反映圖像特征的信號(hào)主要集中在變換后圖像的左上角。實(shí)驗(yàn)中,分別提取DCT系數(shù)矩陣為50×50、40×40、30×30和20×20,作為特征選擇階段的輸入。把BPSO算法和遺傳算法 (GA)在選擇的特征數(shù)目、訓(xùn)練時(shí)間和識(shí)別率幾方面進(jìn)行了比較,結(jié)果如圖6所示。每個(gè)系數(shù)矩陣下的實(shí)驗(yàn)都做10組,然后計(jì)算平均值作為這個(gè)系數(shù)矩陣下的實(shí)驗(yàn)數(shù)值。BPSO算法和GA算法的參數(shù)設(shè)置如表1所示。
圖6 BPSO和GA在不同DCT系數(shù)下的性能比較
表1 BPSO和GA參數(shù)設(shè)置
從圖6中可以看到,當(dāng)系數(shù)矩陣為50×50時(shí),相對(duì)于其它系數(shù)矩陣,兩種算法選擇的特征數(shù)目最多,但需要的訓(xùn)練時(shí)間最長(zhǎng)。就這兩種算法而言,當(dāng)系數(shù)矩陣為50×50時(shí),GA比BPSO選擇的特征數(shù)目多,訓(xùn)練所需時(shí)間也比BPSO算法短,就識(shí)別率而言BPSO算法明顯比GA算法高。當(dāng)系數(shù)矩陣的大小為20×20時(shí),兩種算法選擇到的特征數(shù)目都非常少,但是在識(shí)別率方面,BPSO算法明顯高于GA算法,為93.25%??傮w來(lái)看最高的識(shí)別率是94.5%,是BPSO算法實(shí)現(xiàn)的結(jié)果。從DCT系數(shù)矩陣大小對(duì)識(shí)別效果來(lái)看,當(dāng)系數(shù)矩陣大小為50×50,BPSO算法識(shí)別率達(dá)到了最大,當(dāng)系數(shù)矩陣的大小為20×20時(shí),它的識(shí)別率最小。系數(shù)矩陣大小為40×40時(shí),GA算法的識(shí)別率達(dá)到實(shí)驗(yàn)中的最大值。
從上面的實(shí)驗(yàn)分析看到,DCT系數(shù)對(duì)BPSO算法和GA算法在選擇的特征數(shù)目和訓(xùn)練所需要的時(shí)間兩方面的影響是相同的。隨著DCT矩陣的增大,兩種算法選擇的特征數(shù)目也跟著增加,同時(shí)訓(xùn)練所需要的時(shí)間也增大。但是在識(shí)別率方面,GA算法沒(méi)有表現(xiàn)出明顯的規(guī)律,系數(shù)矩陣大小為40×40和30×30時(shí),識(shí)別率相對(duì)比較高,而當(dāng)系數(shù)矩陣大小為50×50和20×20時(shí)識(shí)別率相對(duì)比較低。
人臉識(shí)別是生物識(shí)別領(lǐng)域非常熱門的研究課題之一。本文首先對(duì)人臉圖像進(jìn)行二維離散余弦變換 (DCT),在變換后的圖像上應(yīng)用BPSO算法進(jìn)行特征提取,并且和GA算法進(jìn)行了比較。實(shí)驗(yàn)結(jié)果表明,BPSO應(yīng)用到人臉識(shí)別中,有較高的識(shí)別率,是一種有效的特征提取方法。和GA算法的比較結(jié)果表明,在DCT系數(shù)矩陣較低或者較高的情況下,BPSO算法的識(shí)別率優(yōu)于GA算。
[1]XU Yuan.A research on face recognition method based on geometric features[D].Beijing:China University of Geosciences(Beijing)Institute of Geophysics & Geomatics,2008 (in Chinese).[徐媛.基于幾何特征的人臉識(shí)別方法 [D].北京:中國(guó)地質(zhì)大學(xué) (北京)地球物理與信息技術(shù)學(xué)院,2008.]
[2]GAI Huaicun,ZHANG Xiaofeng,JIANG Zetao.Face recognition technology based on quantum neural networks [J].Computer Engineering and Applications,2010,46 (8):1897-1989(in Chinese).[蓋懷存,張小鋒,江澤濤.基于量子神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別技術(shù)研究 [J].計(jì)算機(jī)工程與應(yīng)用,2010,46(8):187-189.]
[3]QIN Hongwei,SUN Jinguang,WANG Qiang,et al.Research of face recognition method on adaptive pre-processing and PCA [J].Computer Engineering and Applications,2011,47(14):186-188 (in Chinese).[秦宏偉,孫勁光,王強(qiáng),等.基于自適應(yīng)預(yù)處理和PCA的人臉識(shí)別方法的研究 [J].計(jì)算機(jī)工程與應(yīng)用,2011,47 (14):186-188.]
[4]TANG Jun,ZHAO Xiaojuan.An enhanced opposition-based particle swarm optimization [C].Proceedings of the WRI Global Congress on Intelligent,2009:149-153.
[5]XU Yichun,XIAO Renbin.An improved binary particle swarm optimizer [J].Pattern Recognition and Artificial Intelligence,2007,20 (6):788-793 (in Chinese).[徐義春,肖人彬.一種改進(jìn)的二進(jìn)制粒子群算法 [J].模式識(shí)別與人工能,2007,20 (6):788-793.]
[6]LI Shuhong,ZHANG Qiaorong.Application of binary particle swarm optimization algorithm in path planning [J].Computer Engineering and Design,2009,30 (21):4953-4955 (in Chinese).[李淑紅,張巧榮.二進(jìn)制粒子群算法在路徑規(guī)劃中的應(yīng)用 [J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30 (21):4953-4955.]
[7]LU Zhigang,YANG Guoliang,ZHANG Xiaohui,et al.Reconfiguration of distribution network based on improved particle swarm optimization [J].Power System Protection and Control,2009,37 (7):31-34(in Chinese). [盧志剛,楊國(guó)良,張曉輝,等.改進(jìn)的二進(jìn)制粒子群優(yōu)化算法在配電網(wǎng)絡(luò)重構(gòu)中的應(yīng)用 [J].電力系統(tǒng)保護(hù)與控制,2009,37 (7):31-34.]
[8]FU Desheng,GU Taoeng.Color image information in DCT domain based on human visual characteristic [J].Computer Application and Software,2008,25 (9):86-88 (in Chinese).[傅德勝,顧桃峰.基于人眼視覺(jué)特征的DCT域彩色圖像的信息隱藏 [J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(9):86-88.]
[9]HONG Rui,GUO Jichang.Method of speech enhancement based on DCT and neural network [J].Electronic Measurement Technology,2006,29 (6):44-45 (in Chinese). [洪銳,郭繼昌.基于DCT與神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)方法 [J].電子測(cè)量技術(shù),2006,29 (6):44-45.]
[10]LUO Rongfang,LIN Tusheng.Finger crease identification based on discrete cosine transform [J].Data Acquisition &Processing,2008,23 (2)129-134 (in Chinese).[羅榮芳,林土勝.基于離散余弦變換的手指指節(jié)折痕識(shí)別 [J].數(shù)據(jù)采集與處理,2008,23 (2):129-134.]
[11]CHEN Bo,WANG Hongxia,CHENG Lizhi.Fast directional discrete cosine transforms based image compression [J].Journal of software,2011,22 (4):826-832 (in Chinese). [陳波,王紅霞,成禮智.圖像壓縮中的快速方向離散余弦變換[J].軟件學(xué)報(bào),2011,22 (4):826-832.]
[12]SHI Jun,CHI Yonggang,SHA Xuejun,et al.Application of weighter-type fractional Fourier transform in sampling and reconstruction [J].Journal on Communications,2010,31(4):88-93 (in Chinese).[史軍,遲永鋼,沙學(xué)軍,等.加權(quán)分?jǐn)?shù)傅里葉變換在采樣重構(gòu)中的應(yīng)用 [J].通信學(xué)報(bào),2010,31 (4):88-93.]
[13]Rabab M Ramadan,Rehab F Abdel– Kader.Face recognition using particle swarm optimization-based selected features[J].Image Processing and Pattern Recognition,2009,2(2):51-65.
[14]LI Guo,XU Chen,WU Yanke.The population diversity character of the globally convergent PSO algorithm [J].Computer Applications and Software,2008,25 (5):237-240(in Chinese).[李國(guó),徐晨,吳延科.全局收斂的PSO算法的種群多樣性特征 [J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(5):237-240.]
[15]LI Dong,WANG Dingwei.A survey on simulatior-based optimization [J].Control Engineering of China,2008,15(6):672-677 (in Chinese).[李東,汪定偉.基于仿真的優(yōu)化方法綜述 [J].控制工程,2008,15 (6):672-677.]