路 春 輝
(廣東工程職業(yè)技術(shù)學(xué)院信息工程學(xué)院 廣東 廣州 510520)
?
基于特征融合和優(yōu)化極限學(xué)習(xí)機(jī)算法的虹膜識別系統(tǒng)
路 春 輝
(廣東工程職業(yè)技術(shù)學(xué)院信息工程學(xué)院廣東 廣州 510520)
摘要針對虹膜圖像采集過程中存在光照、干擾等因素,為進(jìn)一步提高虹膜圖像識別的準(zhǔn)確率,提出一種基于組合特征提取的優(yōu)化極限學(xué)習(xí)機(jī)(ELM)模型來提高虹膜圖像識別的精度。模型考慮了特征提取和分類器優(yōu)化兩者均起著重要作用,利用灰度共生矩陣(GLCM)和多通道2D Gabor濾波器特征提取后進(jìn)行特征融合,得到更豐富的特征信息,并設(shè)計(jì)改進(jìn)了蜂群算法(IABC)優(yōu)化ELM模型作為分類器。同時(shí)設(shè)計(jì)的線性加權(quán)多目標(biāo)函數(shù)綜合考慮分類精度和網(wǎng)絡(luò)結(jié)構(gòu),從而有效提高了虹膜識別的準(zhǔn)確率。實(shí)驗(yàn)表明提出的模型通過結(jié)合兩種特征提取方法,能提取出更豐富的可區(qū)分特征,并且結(jié)合優(yōu)化分類器得到了很高的分類準(zhǔn)確率,是一種有效的虹膜識別模型。
關(guān)鍵詞特征提取虹膜識別灰度共生矩陣多通道2D Gabor濾波器極限學(xué)習(xí)機(jī)
0引言
生物特征識別技術(shù)是指通過計(jì)算機(jī),利用人體所固有的生理特征或行為特征來進(jìn)行個(gè)人身份鑒定。近年來,基于人臉、指紋、虹膜、聲音等生物特征的識別技術(shù)引起人們關(guān)注,其中人眼的虹膜具有豐富的紋理信息和特征,與其他生物特征相比,具有唯一性、穩(wěn)定性和非侵犯性等優(yōu)點(diǎn)。因此基于虹膜的身份識別系統(tǒng)研究正成為生物特征識別領(lǐng)域的一個(gè)研究熱點(diǎn)[1,2]。
虹膜識別系統(tǒng)主要包括三部分:(1) 虹膜圖像預(yù)處理;(2) 虹膜特征提??;(3) 虹膜分類。虹膜特征提取是虹膜識別系統(tǒng)中最重要的步驟之一。Daugman根據(jù)Gabor變換提出了2D Gabor濾波器理論[3]。之后Daugman[4]利用多尺度正交小波法提取虹膜紋理信息并生成2048位虹膜代碼。Monro等[5]采用一維離散余弦變換(DCT)作為特征提取方法進(jìn)行虹膜匹配。Ma等[6]采用紋理分析方法并利用多通道Gabor濾波器捕捉虹膜圖像全局和局部細(xì)節(jié)。He等[7]基于灰度共生矩陣(GLCM)提取特征和圖像像素統(tǒng)計(jì)強(qiáng)度值屬性作為虹膜的特征。
通過分析可以發(fā)現(xiàn),盡管一些研究人員分別利用2D Gabor濾波器和GLCM進(jìn)行特征提取,然而還未有相關(guān)的工作提出結(jié)合這兩種方法來進(jìn)行虹膜特征提取。多通道2D Gabor濾波器能夠提供信號空間和頻率的局部信息,達(dá)到局部最優(yōu)化。而GLCM是一種統(tǒng)計(jì)分析方法,能夠反映紋理圖像中各灰度值在空間上的分布特性,是目前應(yīng)用最廣泛的一種紋理統(tǒng)計(jì)分析法。同時(shí),由于眼瞼、眼毛等對虹膜的遮擋和干擾,會使得提取的特征在準(zhǔn)確性和穩(wěn)定性方面有所下降,影響識別準(zhǔn)確度。為了進(jìn)一步提高識別精度,本研究嘗試結(jié)合上述兩種方法,通過特征提取進(jìn)行特征組合以得到新的特征集合,從而更有效地反映虹膜圖像的特征和紋理信息。
除了特征提取之外,分類器的選擇在虹膜識別系統(tǒng)中也起著重要的影響。在大多數(shù)虹膜識別研究中,使用較多的方法包括人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)以及基于距離的分類模型(DBC)[8]。其中SVM分類方法取得的效果較好。2007年,He等[7]利用傳統(tǒng)SVM進(jìn)行虹膜識別。2008年,Roy等[9]利用遺傳算法進(jìn)行特征選擇并結(jié)合非對稱SVM進(jìn)行虹膜識別。2009年苑瑋琦等[10]提出基于紋理特征點(diǎn)匹配的自適應(yīng)虹膜識別方法。同年,他又提出利用2D Gabor濾波器提取紋理方向特征的虹膜識別方法[11]。2011年,Roy等[12]利用Daubechies小波變換提取紋理特征,并結(jié)合遺傳算法和自適應(yīng)非對稱SVM(AASVMs)以提高虹膜識別準(zhǔn)確率。
從這些研究中可以發(fā)現(xiàn),基于人工智能技術(shù)的虹膜識別方法已得到了廣泛的關(guān)注和研究,其中基于SVM的分類模型取得了很好的效果,但仍存在以下兩個(gè)問題:(1) SVM中的核寬γ和懲罰因子C對分類效果起著重要影響,傳統(tǒng)的網(wǎng)格搜索和基于梯度下降[13]的搜索方法都各有不足,難以找到最優(yōu)的參數(shù),使得模型的表現(xiàn)不穩(wěn)定;(2) 在設(shè)計(jì)適應(yīng)度函數(shù)時(shí),通常都是采用分類準(zhǔn)確率作為評估標(biāo)準(zhǔn),很少考慮其他重要因素,容易產(chǎn)生過擬合問題,也會消耗大量訓(xùn)練時(shí)間,降低模型的分類效率。
基于上述分析,為了克服上述缺點(diǎn),得到識別率更高的虹膜識別模型,提出了結(jié)合GLCM和多通道2D Gabor濾波器的特征提取方法,并結(jié)合優(yōu)化極限學(xué)習(xí)機(jī)(ELM)分類模型—IABC-ELM模型,用于虹膜識別。該模型提出利用GLCM和多通道2D Gabor濾波器進(jìn)行特征提取,然后將兩種方法得到的特征子集進(jìn)行特征組合作為分類模型的輸入。在分類模型上,提出改進(jìn)的蜂群算法IABC(Improved Artificial Bee Colony)用于優(yōu)化ELM分類模型的網(wǎng)絡(luò)權(quán)重,從而得到最優(yōu)的分類模型。此外,設(shè)計(jì)了線性加權(quán)多目標(biāo)函數(shù),在最大化分類精度的同時(shí)也考慮了網(wǎng)絡(luò)結(jié)構(gòu)的簡化,目標(biāo)函數(shù)由分類準(zhǔn)確率和網(wǎng)絡(luò)隱層節(jié)點(diǎn)個(gè)數(shù)兩個(gè)子函數(shù)通過線性加權(quán)計(jì)算所得。
1改進(jìn)的蜂群算法(IABC)
ABC算法由Erciyes大學(xué)Karaboga教授于2005年提出,它是最重要的元啟發(fā)智能算法之一,源于蜜蜂覓食行為的研究,其核心思想是利用蜂群的協(xié)作機(jī)制結(jié)合個(gè)體蜜蜂的局部搜索,實(shí)現(xiàn)有針對性尋找最優(yōu)解的過程[14]。由于ABC算法簡單易實(shí)現(xiàn)、調(diào)節(jié)參數(shù)少、全局尋優(yōu)能力強(qiáng),并且在解決實(shí)際問題中展示了優(yōu)越性,近年來被廣泛用于解決各種現(xiàn)實(shí)復(fù)雜優(yōu)化問題[15]。
ABC算法的具體機(jī)制如下:蜂群由三種蜜蜂組成,分別是雇傭蜂、跟隨蜂和偵查蜂。蜂群的食物源可看作為問題P的可行解集合,每一個(gè)食物源的位置與問題中每一個(gè)可行解相對應(yīng),目標(biāo)函數(shù)f的計(jì)算值決定食物源的優(yōu)劣,雇傭蜂的數(shù)量與食物源的數(shù)量相等,那么食物源的位置可用實(shí)數(shù)向量xi=(xi1,xi2,…,xid)表示。初始種群根據(jù)下面公式隨機(jī)生成SN個(gè)解實(shí)數(shù)向量,每個(gè)解xi,i =1,2,…,SN,其中SN是一個(gè)d維向量。
(1)
算法將這些食物源隨機(jī)分配給雇傭蜂,并利用目標(biāo)函數(shù)計(jì)算其適應(yīng)度值,然后開始對食物源進(jìn)行循環(huán)搜索,循環(huán)次數(shù)為gen,當(dāng)指定精度達(dá)到預(yù)定值或者達(dá)到最大迭代次數(shù)設(shè)定值Genmax時(shí),算法停止運(yùn)行。首先,雇傭蜂對相應(yīng)的食物源進(jìn)行搜索,隨機(jī)選擇一個(gè)不同于自己的鄰域蜂,按照下面的公式在解空間內(nèi)進(jìn)行鄰域探索,從而產(chǎn)生新的食物源vij:
vij=xij+uij(xij-xkj)
(2)
其中uij是[-1,1]之間均勻分布的隨機(jī)實(shí)數(shù),j和k是隨機(jī)產(chǎn)生的維度數(shù)值,且j必與k相異。
研究發(fā)現(xiàn),ABC算法具有較強(qiáng)的全局搜索能力,但是局部搜索能力較弱[16],在偵查蜂搜索階段,算法摒棄了當(dāng)前解,隨機(jī)生成一個(gè)新的可行解。該解可能是個(gè)比之前更差的解,降低了算法效率,因此為了進(jìn)一步提高ABC算法的性能,考慮了當(dāng)前解的情況,基于當(dāng)前解所提供的信息產(chǎn)生新的可行解,使得新的解不是完全隨機(jī)生成,而是得到之前解的指導(dǎo)信息,朝更好的方向搜索。解的更新式為:
(3)
(4)
其中fitnessi是第i個(gè)解對應(yīng)的適應(yīng)度值,NP為種群數(shù)量。
當(dāng)一個(gè)食物源xi在某一位置連續(xù)limit代都未得到改善,說明解xi很有可能陷入局部極小值而未找到全局最優(yōu)解,則相對應(yīng)的跟隨蜂棄掉該食物源,并根據(jù)式(3)的搜索方式生成一個(gè)新的食物源。算法的具體流程如圖1所示。
圖1 ABC算法的整體流程圖
2極限學(xué)習(xí)機(jī)(ELM)
ELM算法由Huang等提出,它是一種新型單隱層前饋神經(jīng)網(wǎng)絡(luò),研究已經(jīng)證明了ELM具有與神經(jīng)網(wǎng)絡(luò)相同的全局逼近能力[17]。其網(wǎng)絡(luò)結(jié)構(gòu)分為三層:輸入層、單個(gè)隱藏層和輸出層,其中的網(wǎng)絡(luò)輸入權(quán)重和隱偏倚隨機(jī)生成,且一旦生成不需要調(diào)節(jié),輸出權(quán)重值直接由最小二乘估計(jì)方法計(jì)算得出。ELM不僅具有良好的泛化能力,而且由于不需要迭代調(diào)節(jié)網(wǎng)絡(luò)權(quán)重值,避免了梯度下降算法產(chǎn)生的局部極值、學(xué)習(xí)時(shí)間長以及學(xué)習(xí)率的影響等問題,極大地提高了訓(xùn)練和測試速度,因此ELM的研究和應(yīng)用受到了廣泛的關(guān)注。
極限學(xué)習(xí)機(jī)的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 ELM的網(wǎng)絡(luò)結(jié)構(gòu)
對于N個(gè)不同的訓(xùn)練樣本集(xi,ti), i =1,2,…,N,其中xi= [xi1,xi2, …,xid]T∈ Rn, ti= [ti1,ti2,…,tim]T∈Rm,具有L個(gè)隱層節(jié)點(diǎn)和激活函數(shù)g(x)的單隱層前饋神經(jīng)網(wǎng)絡(luò),表達(dá)式如下:
(5)
其中wj= [wj1,wj2,…,wjn]T( j = 1, 2, …, L)表示連接第j個(gè)隱層節(jié)點(diǎn)和輸入層節(jié)點(diǎn)之間的輸入權(quán)重向量值,bj表示第j個(gè)隱層節(jié)點(diǎn)的偏倚,wj·xi表示wj和xi的內(nèi)積,βj= [βj1,βj2,…,βjL]T表示連接第j個(gè)隱層節(jié)點(diǎn)和輸出層節(jié)點(diǎn)之間的輸出權(quán)重向量值。Oi為網(wǎng)絡(luò)中相應(yīng)的xi的實(shí)際結(jié)果。
Huang等在文獻(xiàn)[18]中已經(jīng)證明如果激活函數(shù)g(x)無限可微,那么單隱層網(wǎng)絡(luò)中的輸入權(quán)重值和隱層偏倚值可以隨機(jī)生成,且一旦固定不需要迭代調(diào)節(jié),使得:
(6)
上述公式實(shí)際上就是找到線性系統(tǒng)Hβ = T的最小二乘解β′。其中T = [t1, t2, …, tm]T是目標(biāo)矩陣(期望得到的輸出值)。
H=H (w1,w2,…,wL,b1,b2,…,bL,x1,x2,…,xN)
(7)
其中H = {hij} (i =1,2,…,N;j =1,2,…,L)稱為隱層輸出矩陣,H的第j個(gè)隱層節(jié)點(diǎn)的第j列對應(yīng)輸入x1, x2, …, xN,H的第i行對應(yīng)輸入xi的輸出向量。
若隱層節(jié)點(diǎn)數(shù)L等于訓(xùn)練樣本個(gè)數(shù)N時(shí),那么H是個(gè)可逆方陣,單隱層前饋神經(jīng)網(wǎng)絡(luò)能以零誤差逼近訓(xùn)練樣本。但在大多數(shù)情況下,隱層節(jié)點(diǎn)個(gè)數(shù)會遠(yuǎn)小于訓(xùn)練樣本個(gè)數(shù),即L?N,那么H是一個(gè)N×L的矩陣,通常采用最小二乘方法來確定線性系統(tǒng)的輸出權(quán)重值:
β′=H+T
(8)
其中H+為隱層輸出矩陣H的Moore-Penrose廣義逆矩陣。
ELM算法的學(xué)習(xí)過程主要分為三步:
(1) 隨機(jī)產(chǎn)生輸入權(quán)重值和隱層偏倚值(wi, bi), i = 1, 2,…,L;
(2) 根據(jù)式(4)計(jì)算隱層輸出矩陣H;
(3) 計(jì)算輸出權(quán)重值β:β′=H+T,完成ELM的學(xué)習(xí)。
3提出的模型
在這一部分,將詳細(xì)介紹基于結(jié)合GLCM和多通道2D Gabor濾波器特征提取的IABC-ELM虹膜識別系統(tǒng)。如之前所述,本系統(tǒng)的目的是要進(jìn)一步提高虹膜識別的準(zhǔn)確率。為了讓系統(tǒng)獲得更好的性能,本模型整個(gè)運(yùn)行的過程包括三個(gè)階段:第一階段,利用GLCM結(jié)合多通道2D Gabor濾波器進(jìn)行特征提取,將這兩種方法提取出的特征組成新的虹膜特征集合;第二階段,利用第一階段提供的最優(yōu)特征集合作為分類模型的輸入,在不同訓(xùn)練數(shù)據(jù)集上進(jìn)行訓(xùn)練,同時(shí)利用改進(jìn)的ABC算法優(yōu)化ELM模型,得到最優(yōu)IABC-ELM分類器;第三階段,利用訓(xùn)練好的分類器在測試數(shù)據(jù)集上測試其模型的性能,從而達(dá)到虹膜識別的目的。
3.1圖像預(yù)處理
為了準(zhǔn)確獲取虹膜信息,消除光照不均勻等因素影響,提高虹膜識別準(zhǔn)確率,在特征提取前要對虹膜圖像進(jìn)行預(yù)處理。我們通過六個(gè)步驟實(shí)現(xiàn)圖像預(yù)處理,具體處理過程如圖3所示。
圖3 圖像預(yù)處理流程
第一步:評估圖像質(zhì)量,篩掉質(zhì)量較差的圖像;第二步:基于光斑中心,根據(jù)經(jīng)驗(yàn)值確認(rèn)兩個(gè)感興趣區(qū)(ROI),包括較小ROI中的瞳孔區(qū)和較大ROI中的瞳孔和虹膜區(qū);第三步:利用坎尼算子和霍夫變換對較小ROI區(qū)域中的瞳孔進(jìn)行定位;第四步:通過較大ROI區(qū)域中虹膜和白膜間的灰度梯度差異進(jìn)行邊緣定位;第五步:對圖像標(biāo)準(zhǔn)化操作,消除虹膜在徑向延伸的影響(產(chǎn)生虹膜圖像為512×64像素);第六步:用全局直方圖強(qiáng)化圖像以消除不均勻光照等外界因素的影響。圖像預(yù)處理過程效果如圖4所示。
圖4 圖像預(yù)處理各階段示意圖
3.2多通道2D Gabor濾波特征提取
基于Gabor濾波器被廣泛用于計(jì)算機(jī)視覺中,2D Gabor濾波器具有可調(diào)方向和徑向頻率選擇、可調(diào)中心頻率等一系列優(yōu)點(diǎn),具體可參考文獻(xiàn)[19]。在本文研究中,采用這種方法進(jìn)行特征提取。直角坐標(biāo)系下2D Gabor的表達(dá)式如下:
(9)
其中f是沿x軸θ方向的正弦平面波頻率,σx′和σy′分別是沿x′軸和y′軸的標(biāo)準(zhǔn)差。
為了得到多方向和多尺度的紋理信息,本文采用的多通道2D Gabor濾波器,通過不同方向的濾波器對紋理圖像進(jìn)行濾波,選輸出響應(yīng)最大的濾波器方向作為紋理方向。利用g(x)作為生成函數(shù),可得到一組自相似濾波器,即Gabor濾波,表達(dá)式如下:
(10)
其中θ=nπ/k,{k|k>1,k∈Z},k為總方向個(gè)數(shù),m和n分別表示尺度和方向的個(gè)數(shù),n∈[0,k],a-m是比例系數(shù)。通過改變m和n的值可以得到一組方向和尺度各不相同的過濾器。
同時(shí)Gabor非正交性意味著在過濾后的圖像中存在冗余信息,接下來需要降低這個(gè)冗余性。我們設(shè)置粗尺度濾波器和最優(yōu)尺度濾波器的中心頻率以確保Gabor濾波器的響應(yīng)可以相互聯(lián)系但不會在峰值頻率相交。分別設(shè)濾波器的最高和最低頻率值,差異度的計(jì)算式如下:
(11)
對給定圖像,Gabor變換函數(shù)的表達(dá)式如下:
(12)
其中*表示復(fù)共軛操作符,(u,v)∈Ω表示濾波窗口的大小。變換系數(shù)的均值μmn和方差σmn分別定義為:
(13)
(14)
最后,通過結(jié)合μmn和方差σmn,可得到虹膜的特征向量:
FS={μ00,σ00,μ01,σ01,…,μM-1K-1,σM-1K-1}
其中M和K分別為多通道2D Gabor濾波器的尺度大小和方向。
3.3IABC-ELM模型
IABC-ELM模型是針對ELM模型自身網(wǎng)絡(luò)權(quán)重參數(shù)優(yōu)化問題,利用IABC算法良好的全局尋優(yōu)能力,對ELM的權(quán)重進(jìn)行自適應(yīng)迭代優(yōu)化,以得到更優(yōu)的分類器。模型的整體流程如圖5所示。該模型主要通過下面的步驟進(jìn)行構(gòu)建:
第一步選擇L×(n+1)維粒子對解進(jìn)行編碼,其中前L×n維表示輸入權(quán)重值,其余的L維表示隱層偏倚值,它們都是連續(xù)實(shí)數(shù);
第二步對種群進(jìn)行初始化,設(shè)定種群的大小、最大迭代次數(shù)、臨界次數(shù)等參數(shù);
第三步利用第二步所得到的解在ELM模型上訓(xùn)練;
第四步由于我們在最大化分類精度的同時(shí),也要盡可能地簡化ELM網(wǎng)絡(luò)結(jié)構(gòu),所以設(shè)計(jì)的線性加權(quán)多目標(biāo)函數(shù)綜合考慮了平均分類準(zhǔn)確率ACC(Averaged accuracy rate)和網(wǎng)絡(luò)隱層節(jié)點(diǎn)個(gè)數(shù),適應(yīng)度值根據(jù)如下等式計(jì)算:
(15)
(16)
F=a·f1+(1-a)·f2
(17)
其中f1表示K折交叉驗(yàn)證K-fold CV(K-fold cross validation)得到的ACC均值,f2中的L表示ELM網(wǎng)絡(luò)隱層節(jié)點(diǎn)個(gè)數(shù),N為總節(jié)點(diǎn)個(gè)數(shù)。a為常量值,表示ELM分類精度所占的權(quán)重值,1-a為隱層節(jié)點(diǎn)個(gè)數(shù)所占的權(quán)重值,權(quán)重可以調(diào)整到一個(gè)恰當(dāng)?shù)闹?,這主要取決于各個(gè)子目標(biāo)函數(shù)對評估結(jié)果的貢獻(xiàn)大小,在本文中通過多次試驗(yàn),a取值為0.8,在計(jì)算適應(yīng)度值后,保存全局最優(yōu)適應(yīng)度值、全局最優(yōu)個(gè)體;
第五步增加迭代次數(shù);
第六步根據(jù)式(3)更新粒子相對應(yīng)的位置,新粒子的位置不能超出界限,若新的粒子的位置超出了界限[Xmin,Xmax],那么新的位置設(shè)為其邊界值Xmin或Xmax;
第七步利用第六步得到新的粒子進(jìn)行解碼所得到參數(shù)在ELM上訓(xùn)練,并根據(jù)式(17)計(jì)算該粒子的適應(yīng)度值;
第八步記錄當(dāng)前種群的最優(yōu)粒子,若當(dāng)前的適應(yīng)度值大于存儲的最優(yōu)適應(yīng)度值,更新存儲適應(yīng)度值為當(dāng)前值,否則,保持存儲的適應(yīng)度值不變;
第九步如果達(dá)到最大種群數(shù)量,算法轉(zhuǎn)到第十步運(yùn)行,否則,轉(zhuǎn)到第六步運(yùn)行;
第十步比較當(dāng)前適應(yīng)度值和全局最優(yōu)適應(yīng)度值,若當(dāng)前值大于存儲的全局最優(yōu)適應(yīng)度值,更新為當(dāng)前值,否則,保持存儲的適應(yīng)度值不變;
第十一步如果達(dá)到最大迭代次數(shù),算法轉(zhuǎn)到第十二步運(yùn)行,否則,轉(zhuǎn)到第五步繼續(xù)進(jìn)行迭代優(yōu)化;
第十二步輸出全局最優(yōu)的粒子,進(jìn)行解碼得到最優(yōu)參數(shù);
第十三步利用得到的最優(yōu)參數(shù)結(jié)合訓(xùn)練集在ELM上訓(xùn)練,構(gòu)造出最優(yōu)的分類器;
第十四步利用得到的分類器在測試集上進(jìn)行測試并輸出最終的分類結(jié)果。
圖5 模型的總體流程圖
4實(shí)驗(yàn)設(shè)計(jì)
4.1數(shù)據(jù)描述
本實(shí)驗(yàn)所采用的虹膜數(shù)據(jù)集是利用虹膜圖像捕獲設(shè)備對一些測試人員進(jìn)行數(shù)據(jù)采集,自組建的虹膜數(shù)據(jù)庫BR-IRIS。圖6給出了BR-IRIS圖像數(shù)據(jù)庫中的一些樣本,BR-IRIS數(shù)據(jù)庫的基本信息如表1所示。在該數(shù)據(jù)庫中共有180個(gè)樣本,我們分別捕捉了在不同光照條件下每個(gè)人左右虹膜的持續(xù)5秒的視頻圖像。每個(gè)視頻包含25幀/秒,共采集11 500張圖片。圖像大小為480×576的8位灰度圖像。此外,在實(shí)驗(yàn)過程中為了避免過擬合和欠擬合現(xiàn)象的發(fā)生,使得結(jié)果更具說服力,采用雙層交叉驗(yàn)證方法[20]。內(nèi)層5折交叉驗(yàn)證用來確定最優(yōu)特征子集和最優(yōu)參數(shù)組合,外層5折交叉驗(yàn)證用于評估ELM的分類性能。由于運(yùn)行一次交叉驗(yàn)證不能保證結(jié)果的公正性,同時(shí)數(shù)據(jù)是隨機(jī)抽樣分割的,每次生產(chǎn)的訓(xùn)練集和測試集不會完全一樣,在本實(shí)驗(yàn)中將模型運(yùn)行10次,然后求平均值作為最終結(jié)果。
圖6 BR-IRIS數(shù)據(jù)庫圖像的樣本
年齡性別采樣時(shí)間段采樣環(huán)境19~45歲,大部分年齡在30歲左右男:女=8:210點(diǎn),14點(diǎn)和19點(diǎn)三個(gè)時(shí)段室內(nèi)正常光線(上午、下午和晚上)
4.2實(shí)驗(yàn)設(shè)置
本文提出的虹膜識別模型是Matlab 2012a開發(fā)環(huán)境下設(shè)計(jì)實(shí)現(xiàn)的,ELM 采用的是ELM工具包,采用的機(jī)器配置為Intel四核處理器,主頻2.0GHZ,4GB內(nèi)存。
在接下來模型的訓(xùn)練和相關(guān)算法比較過程中,模型的詳細(xì)參數(shù)設(shè)置如下:對于GLCM,窗口大小為8,灰度值為16,像素對間距為4;對于Gabor濾波器,使用兩組方向的濾波器對圖像進(jìn)行濾波,選取輸出響應(yīng)最大的濾波器方向作為該塊的方向,其方向分別設(shè)置為θ=0°,45°,90°,135°和θ=0°,30°,60°,90°,120°,150°。濾波器的最高和最低頻率分別為0.45和0.05;對于ABC算法,粒子初始位置均設(shè)為[-1,1]之間的隨機(jī)數(shù),種群數(shù)量為40,最大迭代次數(shù)為80,limit值為SN×D[21],其中SN為種群個(gè)數(shù),D為解的維度。ELM中隱層激活函數(shù)采用Sigmoid函數(shù)?;诰W(wǎng)格計(jì)算的SVM(Grid-SVM)模型中C和γ的搜索范圍分別為C∈{2-10,2-9,…,215}和γ∈{2-15,2-14,…,25}。
5實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證提出的模型的有效性,首先分別采用基于GLCM和基于多通道2D Gabor過濾器特征提取,其中利用GLCM提取出一個(gè)特征子集,利用多通道2D Gabor提取出四個(gè)特征子集,然后將這兩組特征子集組合得到新的四組特征子集。也就是說,共得到九個(gè)虹膜特征子集。為了便于說明,將這九個(gè)特征集合標(biāo)記為fs1到fs9。表2給出了特征集合所相應(yīng)的特征提取方法和參數(shù)。
表2 特征子集所對應(yīng)的特征提取方法和參數(shù)設(shè)置情況
實(shí)驗(yàn)首先對虹膜特征組合的有效性進(jìn)行評估。為了驗(yàn)證特征組合的有效性,表3給出了ELM模型通過5折CV在不同特征子集上得到的分類結(jié)果(Avg為均值,Dev為均方差)。
表3 九組特征子集在5折CV下分別結(jié)合ELM所得到的識別精度
為了使實(shí)驗(yàn)結(jié)果更明晰,圖7給出了所得分類結(jié)果的比較。
圖7 基于GLCM和多通道2DGabor濾波器特征提取在ELM上的識別精度比較
從圖7中可以看出,基于多通道2D Gabor濾波器提取出四組特征子集的識別精度均高于基于GLCM的特征提取方法。這說明在虹膜特征提取方面,多通道2D Gabor濾波器比GLCM更穩(wěn)定。
圖8給出了通過GLCM提取的特征、多通道2D Gabor濾波器提取出的特征以及特征組合這三類特征集合在ELM分類模型上所取得的識別精度比較。從圖8中可以看出,組合的特征集合得到了最好的結(jié)果,這說明,基于GLCM和多通道2D Gabor濾波器在特征提取上具有互補(bǔ)性,通過特征組合能夠進(jìn)一步提高虹膜識別精度。
圖8 基于GLMC特征子集、2DGabor濾波器特征子集和組合特征子集在ELM分類器上得到的識別精度比較
從圖9可以看出,基于IABC-ELM分類模型在5折CV上的識別精度均高于ELM模型,其識別精度平均高了2%。圖10給出了ELM和IABC-ELM模型均方差的結(jié)果比較,從結(jié)果可以看出,基于IABC-ELM的模型的均方差值較小,說明了本方法具有良好的穩(wěn)定性。
圖9 基于IABC-ELM和Grid-ELM模型的識別精度比較結(jié)果
圖10 不同特征集合在兩種方法上得到的均方差值比較
另外為了驗(yàn)證提出的IABC算法的全局搜索能力和收斂速度,實(shí)驗(yàn)進(jìn)一步對IABC算法的演化機(jī)制進(jìn)行了研究,給出了IABC算法在虹膜數(shù)據(jù)集5折CV過程中某1折數(shù)據(jù)集上(選出的是第1折)最優(yōu)適應(yīng)度值的變化過程,如圖11所示。注意到圖中顯示的是全局最優(yōu)值的演化過程,將每一次迭代中所有解的最優(yōu)適應(yīng)度值記錄下來。通過觀察可以發(fā)現(xiàn),IABC適應(yīng)度曲線從第一次迭代一直到第80次迭代逐步演化,曲線在演化的初始階段增長比較迅速,在第18次迭代時(shí)收斂到最高值,之后適應(yīng)度值趨于平穩(wěn)。該現(xiàn)象說明了提出的IABC算法具有很好的全局搜索能力和收斂速度,能迅速收斂到全局最優(yōu)解,因此能夠有效地實(shí)現(xiàn)了ELM模型參數(shù)的優(yōu)化過程。
圖11 IABC算法在第1折上訓(xùn)練數(shù)據(jù)的適應(yīng)度值
由于采用ELM作為分類器,實(shí)驗(yàn)進(jìn)一步分析ELM的隱層節(jié)點(diǎn)以及權(quán)重參數(shù)變化對分類性能的影響。圖12給出的是隨ELM隱層節(jié)點(diǎn)變化對虹膜識別精度的影響。由圖可見,初始階段隨著隱層節(jié)點(diǎn)個(gè)數(shù)的增加,識別精度曲線呈顯著上升趨勢,當(dāng)節(jié)點(diǎn)個(gè)數(shù)為7時(shí),得到最大精度,然而隨著節(jié)點(diǎn)數(shù)的繼續(xù)增加,識別精度呈下降趨勢。這是由于ELM隱層節(jié)點(diǎn)個(gè)數(shù)對分類精度有較大影響,當(dāng)節(jié)點(diǎn)數(shù)過多時(shí)易造成ELM過擬合,降低了模型分類精度。因此本實(shí)驗(yàn)中取模型隱層節(jié)點(diǎn)數(shù)為7時(shí)分類性能最優(yōu)。另外,從表4結(jié)果可見,在相同特征子集和相同隱層節(jié)點(diǎn)值條件下,每一折過程中基于ELM分類器所得的識別精度均低于IABC-ELM分類器,這說明ELM的權(quán)重參數(shù)對虹膜識別精度也具有重要影響。分析其原因是由于ELM會隨機(jī)產(chǎn)生非最優(yōu)或不必要的權(quán)重值和偏倚值,降低了算法的性能,造成取得的結(jié)果不穩(wěn)定。而通過IABC優(yōu)化ELM權(quán)重參數(shù),能夠找出最優(yōu)的參數(shù)從而進(jìn)一步提高模型的分類精度。
圖12 模型分類精度隨ELM隱層節(jié)點(diǎn)個(gè)數(shù)變化情況
foldfs6fs7fs8fs9fs6fs7fs8fs9ACC(%)(ELM)ACC(%)(IABC-ELM)#197.41797.78697.04897.78699.26299.26299.26299.631#296.67998.15597.78696.67998.89398.89398.89398.893#397.77896.29697.03796.29698.88999.25999.63099.630#497.40797.40798.14897.77899.63099.63099.63099.630#596.31095.94195.94197.78698.89398.89398.89399.262Avg97.11897.11797.19297.26599.11399.18799.26199.423Dev0.6030.9570.8480.7220.3300.3080.3680.330
此外,實(shí)驗(yàn)對基于ELM、IABC-ELM和SVM模型的訓(xùn)練時(shí)間、測試時(shí)間和準(zhǔn)確率進(jìn)行了比較,如表5所示。從表中可知,SVM模型計(jì)算效率最低,這是由于采用基于網(wǎng)格的方法需要大量訓(xùn)練時(shí)間,極大降低了計(jì)算效率。ELM模型所用時(shí)間最少,這是由于原始ELM算法隨機(jī)產(chǎn)生權(quán)重參數(shù)且無需迭代調(diào)節(jié),從而具有極快的訓(xùn)練速度和測試速度。而IABC-ELM的訓(xùn)練時(shí)間和測試時(shí)間稍多于ELM模型,分析其原因是由于采用IABC算法自適應(yīng)迭代調(diào)節(jié)ELM模型權(quán)重參數(shù),與ELM模型相比,雖然訓(xùn)練時(shí)間和測試時(shí)間分別增加了1.132 s和1.016 s,但使得虹膜識別的準(zhǔn)確率提高了2.158%,因此在計(jì)算效率上是可接受的。
表5 三種模型的訓(xùn)練時(shí)間、測試時(shí)間及精度比較
6結(jié)語
虹膜識別作為身份認(rèn)證的一種新技術(shù),得到了人們廣泛的關(guān)注和研究,一個(gè)更加精確、穩(wěn)定的虹膜識別系統(tǒng)可極大地降低錯(cuò)誤識別的風(fēng)險(xiǎn)。為此提出了基于特征融合的優(yōu)化ELM虹膜識別模型。在該模型中,利用GLCM和多通道2D Gabor濾波器分別進(jìn)行特征提取,之后將兩組特征集合進(jìn)行特征組合,得到了更豐富的虹膜信息,同時(shí)提出改進(jìn)的ABC算法優(yōu)化ELM分類模型,進(jìn)一步提高了虹膜識別精度,設(shè)計(jì)了綜合考慮分類精度和ELM網(wǎng)絡(luò)隱層節(jié)點(diǎn)個(gè)數(shù)的線性加權(quán)多目標(biāo)函數(shù),在最大化精度的同時(shí)也精簡了網(wǎng)絡(luò)結(jié)構(gòu)。通過實(shí)驗(yàn),從特征提取和分類模型優(yōu)化兩方面,比較了該模型與ELM的分類準(zhǔn)確率和均方差等性能指標(biāo)。結(jié)果表明,與傳統(tǒng)特征提取算法相比,本文提出的模型不僅能夠得到更優(yōu)的虹膜特征集合,而且其識別精度也得到極大的提高,獲得了99.423%的識別精度,是一個(gè)有效的虹膜識別模型。
當(dāng)然,該模型還存在許多值得進(jìn)一步研究的地方。首先,采用的是基于ABC算法的優(yōu)化模型,其他的優(yōu)化算法在該數(shù)據(jù)集上是否具有更好的表現(xiàn);其次,將本文模型用于其他虹膜識別數(shù)據(jù)庫看其識別效果,是下一步的研究工作。
參考文獻(xiàn)
[1] Zhenan Sun,Xianchao Qiu,Tieniu Tan.Toward Accurate and Fast Iris Segmentation for Iris Biometrics[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(9):1670-1684.
[2] Tieniu Tan,Zhaofeng He,Zhenan Sun.Efficient and robust segmentation of noisy iris images for non-cooperative iris recognition[J].Image and Vision Computing,2010,28(2):223-230.
[3] John G Daugman.Two-dimensional spectral analysis of cortical receptive field profiles[J].Vision Research,1980,20(10):847-856.
[4] John G Daugman.Statistical richness of visual phase information:Update on recognizing persons by iris patterns[J].International Journal of Computer Vision,2001,45(1):25-38.
[5] Monro D M,Rakshit S,Zhang D.DCT-based iris recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(4):586-595.
[6] Ma L,Tan T N,Wang Y H.Personal identification based on iris texture analysis[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,25(12):1519-1533.
[7] He X F,An S J,Shi P F.Statistical texture analysis-based approach for fake iris detection using support vector machines[J].Advances in biometrics,Lecture Notes in Computer Science,2007,46(2):540-546.
[8] John G Daugman.New methods in iris recognition[J].IEEE Transactions on System,Man,and Cybernetic,Part B:Cybernetics,2007,37(5):1167-1175.
[9] Roy K,Bhattacharya P.An iris recognition method based on zigzag collarette area and asymmetrical support vector machines[C]//IEEE International Conference on System,Man and Cybernetics,2006(1):861-865.
[10] 苑瑋琦,林忠華,徐露.一種基于紋理特征點(diǎn)匹配的自適應(yīng)虹膜識別方法[J].儀器儀表學(xué)報(bào),2009,30(2):232-236.
[11] 苑瑋琦,馮琪,柯麗.利用2D-Gabor濾波器提取紋理方向特征的虹膜識別方法[J].計(jì)算機(jī)應(yīng)用研究,2009,26(8):3166-3168.
[12] Roy K,Bhattcharya P,Suen C Y.Towards nonideal iris recognition based on level set method,genetic algorithms and adaptive asymmetrical SVMs[J].Engineering Applications of Artificial Intelligence,2011,24(3):458-475.[13] Chapelle O,Vapnik V,Bousquet O.Choosing multiple parameters for support vector machines[J].Machine Learning,2002,46(1-3):131-159.
[14] Karaboga D,Basturk B.A powerful and efficient algorithm for numerical function optimization:artificial bee colony (ABC) algorithm[J].Journal of Global Optimization,2007,39(3):459-471.
[15] TsungJung H,WeiChang Y.Knowledge discovery employing grid scheme least squares support vector machines based on orthogonal design bee colony algorithm[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2011,41(5):1198-1212.
[16] Gao W F,Liu S Y.A modified artificial bee colony algorithm[J].Computers & Operations Research,2012,39(3):687-697.
[17] Huang G B.Extreme Learning Machine for Regression and Multiclass Classification[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B,2012,42(2):513-529.
[18] Huang G B,Ding X,Zhou H.Optimization method based extreme learning machine for classification[J].Neurocomputing,2010,74(3):155-163.
[19] Bovik A C,Clark M,Geisler W S.Multichannel texture analysis using localized spatial filters[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1990,12(1):55-73.
[20] Chen H L.A novel bankruptcy prediction model based on an adaptive fuzzy k-nearest neighbor method[J].Knowledge Based Systems,2011,24(8):1348-1359.
[21] Karaboga D,G?rkemli B,Ozturk C.A comprehensive survey: artificial bee colony (ABC) algorithm and applications[J].Artificial Intelligence Review,2014,42(1):21-57.
收稿日期:2015-04-13。廣東省科技廳項(xiàng)目(粵科規(guī)財(cái)字[2015]72號)。路春輝,講師,主研領(lǐng)域:數(shù)據(jù)挖掘,計(jì)算機(jī)圖像處理,模式識別。
中圖分類號TP3
文獻(xiàn)標(biāo)識碼A
DOI:10.3969/j.issn.1000-386x.2016.07.073
AN IRIS RECOGNITION SYSTEM BASED ON FEATURE FUSION AND OPTIMIZED EXTREME LEARNING MACHINE ALGORITHM
Lu Chunhui
(CollegeofInformationEngineering,GuangdongEngineeringPolytechnic,Guangzhou510520,Guangdong,China)
AbstractThe acquisition of iris image is easily affected by the uneven light and noise interference, thus, an optimized extreme learning machine (ELM) based on feature extraction is proposed to improve the accuracy of iris recognition. In the proposed model, considering both feature extraction and classifier selection play an important role, the gray level co-occurrence matrix (GLCM) and multi-channel 2D Gabor filters are used for separate feature extraction, and then two groups of feature sets are combined for achieving more information characteristics. Moreover, an improved artificial bee colony (IABC) is designed to conduct parameter optimization for ELM. Besides, a linear-weighted multi-objective function is designed to take into account the average accuracy rate and the number of ELM network hidden-layer nodes, which helps to improve the accuracy of model. Experimental results show that the proposed algorithm not only extracts more distinguished information by the combination of two feature extraction methods, but also obtains the highest accuracy, which proves the validity of the proposed model.
KeywordsFeature extractionIris recognitionGray level co-occurrence matrixMulti-channel 2D Gabor filtersExtreme learning machine