梁俊花,孫興華,葉永飛,劉乃迪,張 曉
(河北北方學(xué)院信息科學(xué)與工程學(xué)院,河北 張家口 075000)
基于雙尺度分解和模糊熵測(cè)量的特征選擇算法
梁俊花,孫興華,葉永飛,劉乃迪,張 曉
(河北北方學(xué)院信息科學(xué)與工程學(xué)院,河北 張家口 075000)
針對(duì)當(dāng)前樹葉識(shí)別算法缺乏足夠的魯棒性和可區(qū)分度,提出一種雙尺度分解和模糊熵測(cè)量的特征選擇算法。首先采用自適應(yīng)提升小波(ALW)和不同尺度高斯濾波的雙尺度算法,然后根據(jù)中心對(duì)稱的局部二進(jìn)制描述算子(CS-LBP)提取形狀和紋理特征,最后由模糊熵測(cè)量法(FESM)重新分配各個(gè)尺度的比例。實(shí)驗(yàn)結(jié)果說明算法具有較高的識(shí)別率和噪聲容忍度。
自適應(yīng)提升小波;CS-LBP;模糊熵
樹葉識(shí)別在農(nóng)業(yè)信息化、生態(tài)保護(hù)和自動(dòng)樹葉識(shí)別系統(tǒng)中發(fā)揮著重要的作用。目前常見的分類算法主要結(jié)合形態(tài)解剖學(xué)、細(xì)胞生物學(xué)、分子生物學(xué)和植物化學(xué)法,這些基于樹葉生物特征性質(zhì)的方法需要復(fù)雜的處理過程,不適用于在線的應(yīng)用。近年,基于樹葉圖像的植物識(shí)別吸引了學(xué)者們的目光[1]。它可以從生物中直接提取植物特征,適合在線的識(shí)別應(yīng)用。
早期的樹葉識(shí)別方法聚焦于樹葉圖像的形狀特征[2],這些方法使用邊緣檢測(cè)算子或現(xiàn)有的邊緣檢測(cè)方法來提取樹葉的輪廓,對(duì)具有明顯不同輪廓的樹葉圖像取得了較好的識(shí)別性能,但是對(duì)噪聲非常敏感。事實(shí)上,有很多不同的植物品種具有相似的樹葉輪廓,而且同種植物也會(huì)有不同的樹葉形狀。因此,這類方法對(duì)樹葉識(shí)別應(yīng)用的辨別率不是很高。
為了改進(jìn)上述方法,部分學(xué)者提出將樹葉輪廓的形態(tài)特征和區(qū)域特征結(jié)合的方法[3]。類似的方法還有流形算法、改進(jìn)的最大平面準(zhǔn)則算法等,這些方法在分類識(shí)別率上有明顯的提高,但是魯棒性和可區(qū)分性不是很強(qiáng)。
實(shí)際上,除了樹葉輪廓,紋理在樹葉圖像中也是一個(gè)非常重要的特征。受此啟發(fā),本文將植物樹葉圖像中的紋理與輪廓結(jié)合應(yīng)用于特征選擇中。Sweldens設(shè)計(jì)的提升格式小波變換繼承了經(jīng)典小波變換的多分辨分析特性,又具有原位計(jì)算、低計(jì)算成本和易于硬件實(shí)現(xiàn)的性質(zhì)。提升方案將小波變換分為預(yù)測(cè)和更新階段,為不同應(yīng)用的自適應(yīng)小波變換提供了靈活的設(shè)計(jì)空間,出現(xiàn)了很多關(guān)注不同信號(hào)特征的自適應(yīng)提升小波變換[4]。
本文提出了雙尺度分解和模糊熵相似性測(cè)量的特征選擇算法。該方法將預(yù)處理的樹葉圖像由自適應(yīng)提升小波分解為一系列子帶,每個(gè)子帶與不同尺度的高斯濾波卷積,在子帶域中提取樹葉圖像的形狀和紋理特征,最后由模糊熵相似性測(cè)量法重新分布每個(gè)尺度對(duì)整體特征的貢獻(xiàn)度。實(shí)驗(yàn)結(jié)果表明,這種特征選擇方法明顯優(yōu)于近期的樹葉識(shí)別方法。
2.1 雙尺度圖像分解
圖1 自適應(yīng)提升小波方案
雙尺度圖像分解包含兩個(gè)階段:第一由自適應(yīng)提升小波將樹葉圖像分解成一系列子帶,該階段主要考慮攜帶重要紋理與輪廓信息的間斷點(diǎn);第二將每一個(gè)子帶與不同尺度的高斯濾波卷積,進(jìn)一步提高噪聲容忍度。
結(jié)合樹葉圖像的局部特征,本文選用的自適應(yīng)提升小波對(duì)圖像紋理的間斷點(diǎn)作了特殊處理[5],如圖1所示:
x′(n,m)=x(n,m)?PnmUPnm(yh(n,m),yv(n,m),yd(n,m))
(1)
其中Pnm是二值映象判決器D的判決結(jié)果,對(duì)應(yīng)二進(jìn)值數(shù)0和1。更新操作UPnm和加操作?Pnm的運(yùn)算法則如下:
(2)
(3)
其中,σ(n,m)為x(n,m)的八個(gè)鄰域像素與其均值的梯度,T為選定的閾值。
(4)
(5)
由于樹葉圖像的間斷點(diǎn)在識(shí)別中起非常重要的作用,該方案對(duì)平滑區(qū)域與非光滑區(qū)域作不同的處理。噪聲和其它干擾引起的孤立點(diǎn)會(huì)影響樹葉識(shí)別的效果,自適應(yīng)提升小波方案可通過設(shè)定不同的閾值來平滑濾除這些奇異點(diǎn)。
為了將樹葉圖像中的主紋、微小細(xì)紋分裂成不同的結(jié)果,本文將小波分解的子圖由一系列不同尺度的高斯濾波進(jìn)行第二階段的分解:
(6)
其中μ是均值,σ代表標(biāo)準(zhǔn)差,本文分別選取μ=0和σ=15,σ=1,σ=0.05。
2.2 中心對(duì)稱的局部二進(jìn)制描述符
局部二進(jìn)制模式(LBP)最初應(yīng)用于紋理分類,由于具有較強(qiáng)的魯棒性、計(jì)算簡(jiǎn)單和較高的分辨度,成功擴(kuò)展到機(jī)器視覺問題中[6]。但是傳統(tǒng)的LBP描述符容易產(chǎn)生較多的維數(shù),例如對(duì)于8像素的鄰域,LBP的維數(shù)為256(28)。并且隨著像素值的增大,維數(shù)成指數(shù)增長(zhǎng)。為了克服這一缺點(diǎn),更有效地描述圖像感興趣區(qū)域的紋理特征,本文采用中心對(duì)稱的局部二進(jìn)制模式(CS-LBP),數(shù)學(xué)表述如下:
(7)
其中,ni和ni+n/2是在半徑為R的圓環(huán)上關(guān)于中心對(duì)稱的N個(gè)像素灰度值。明顯看出,應(yīng)用CS-LBP后特征維數(shù)減半,降低到16(24)。
2.3 模糊熵相似性測(cè)量
由于不同尺度空間對(duì)特征識(shí)別的貢獻(xiàn)度不同,本文引用模糊熵相似性測(cè)量的方法分析不同尺度空間的權(quán)重[7]。模糊集的特殊性在于引用了隸屬度的概念,將模糊集與香農(nóng)的概率熵結(jié)合,得到模糊熵定義:
(8)
其中,uA(xi)是模糊值,并且0 應(yīng)用模糊熵算法的具體步驟為: (1)計(jì)算標(biāo)準(zhǔn)矢量vj=(-vj(f1),…,vj(ft)),其中j代表樣本種類,f代表樣本種類j的特征,t代表這些特征的數(shù)目。vj可以通過廣義平均值進(jìn)行求解: (9) 其中,#Xj是屬于j的總樣本數(shù),m=1。 (2)計(jì)算未知集合與前一步建立的標(biāo)準(zhǔn)矢量之間的相似程度S (10) 其中,x,v∈[0,1]t,p是廣義Lukasiewicz結(jié)構(gòu)中的參數(shù),wr為權(quán)值,不同的權(quán)值重要性不同,此處wr=1。 (3)將相似值代入公式(8),得到對(duì)應(yīng)的模糊熵H。本文將熵值分為3部分,即雙尺度分解算法得到的特征。 (4)計(jì)算每一部分在總體中占的比例系數(shù)Cm。Cm由下面公式求解: (11) 這里N為所有特征的數(shù)目,Km為第m層分解的特征個(gè)數(shù)。由模糊熵定義可看出,熵值越接近0.5,所包含的信息量越小。由此,本文將熵值大的特征賦予較小的比例系數(shù),熵值小的特征賦予較大的比例系數(shù)。即強(qiáng)調(diào)重要特征,弱化次要特征。 (5)將每個(gè)尺度特征乘以對(duì)應(yīng)的比重系數(shù)C,得到最終選擇的分類識(shí)別特征。 3.1 算法流程 算法流程如圖2。首先將預(yù)處理的樹葉圖像由雙尺度法分解為一系列的不同級(jí)數(shù)S不同尺度σ的子圖,根據(jù)模糊熵相似性測(cè)量方法計(jì)算雙尺度域中不同尺度的權(quán)重,得到新的樹葉圖像特征,最后由對(duì)應(yīng)的相似性分類器完成識(shí)別。 圖2 本文算法流程 3.2 參數(shù)選擇 在雙尺度算法中,高斯濾波器的標(biāo)準(zhǔn)差σ以及CS-LBP模式中閾值的選擇如表1所示。 表1 雙尺度參數(shù) 采用相似性分類器,延續(xù)模糊熵相似性測(cè)量的算法思想,公式中P與M由不同的實(shí)驗(yàn)背景決定。 3.3 實(shí)驗(yàn)分析 算法仿真實(shí)驗(yàn)采用ICL植物樹葉數(shù)據(jù)庫。該庫來源于中國(guó)科學(xué)院智能機(jī)器研究所,共包含221種植物近20 000幅樹葉圖像。這些樣本圖是在不同時(shí)期采集的,具有不同的方向、尺寸和自然光照。 為了驗(yàn)證本文算法的正確率,本次實(shí)驗(yàn)從ICL植物樹葉圖像中隨機(jī)選取每個(gè)植物的20幅圖像,形成4 420幅樹葉圖片。每幅圖像的前5幅作為訓(xùn)練樣本,其余為測(cè)試。本文算法與模糊整形算法[8]、基于形狀的算法[9]、形態(tài)學(xué)方法[10]和最大平面法則算法[11]的分類率列于表2。從表中可明顯看出本文算法優(yōu)于其他方法。 本文算法的噪聲容忍度在兩種常見的噪聲圖像上進(jìn)行,將第一次實(shí)驗(yàn)中的圖像分別感染均值為零、方差σ=0.01的高斯噪聲和密度為0.05的椒鹽噪聲,對(duì)應(yīng)數(shù)據(jù)集A和數(shù)據(jù)集B。在每個(gè)數(shù)據(jù)集上的分類識(shí)別率對(duì)比列于表3。表3可以看出,所有算法的識(shí)別率在感染噪聲之后都有所下降。但是本文算法的下降率是最小的,最大平面準(zhǔn)則算法下降幅度最大。 表2 相關(guān)方法正確識(shí)別率比較(%) 表3 在數(shù)據(jù)集A與B上的正確識(shí)別率對(duì)比 本文提出一種雙尺度與相似性測(cè)量的樹葉識(shí)別算法,工作的亮點(diǎn)是:第一,提出了一種新的聯(lián)合目標(biāo)紋理與形狀的特征提取算法;第二,提出了一種基于模糊相似的特征優(yōu)化方法。通過在ICL植物樹葉庫上的對(duì)比實(shí)驗(yàn),說明本文算法具有較高的分類識(shí)別率和噪聲容忍度。 [1]CopeJS,CorneyD,ClarkJY,etal.Plantspeciesidentificationusingdigitalmorphometrics:Areview[J].ExpertSystAppl,2012,39:7562-7573. [2]AbbasiS,MokhtarianF,KittlerJ,Reliableclassificationofchrysanthemumleavesthroughcurvaturescalespace[A].in:InternationalConferenceonScale-SpaceTheoryinComputerVision[C].Netherlands,1997:284-295. [3]王曉峰,黃德雙.葉片圖像特征提取與識(shí)別技術(shù)的研究[J].計(jì)算機(jī)工程與應(yīng)用,2006,(03):190-193. [4]SweldensW.TheLiftingScheme:Acustom-designconstructionofbiorthogonalwavelets[J].ApplCompHarmAnal,1996,3(15):186-200. [5]WangX,LiangJH,WangMZ.On-linefastpalmprintidentificationbasedonadaptiveliftingwaveletscheme[J].KnowlBasedSyst,2013,42:68-73. [6]OjalaT,PietikinenM,HarwoodD.Acomparativestudyoftexturemeasureswithclassificationbasedonfeatureddistribution[J].PatternRecogn.1996,29(01):51-9. [7]DeLucaA,TerminiS.Adefinitionofnon-probabilisticentropyinsettingoffuzzysettheory[J].InformControl,1971,20:301-312. [8]WangZ,ChiZ,FengD,Fuzzyintegralforleafimageretrieval[J].ProcFuzzySyst,2002,1:372-377. [9]LingH,JacobsDW.Shapeclassificationusingtheinnerdistance[J].IEEETransPatternAnalMachIntell,2007,20:286-299. [10]ZhangSW,LeiYK.Modifiedlocallylineardiscriminantembeddingforplantleafrecognition[J].Neurocomp,2011,74:2284-2290. [11]LiHF,JiangT,ZhangKS.Efficientandrobustfeatureextractionbymaximummargincriterion[J].IEEETransactNeuralNetworks,2006,17(01):157-165. [責(zé)任編輯:王榮榮 英文編輯:劉彥哲] Feature Extraction Based on Dual-Scale Decomposition and Fuzzy Entropy Measurement LIANG Jun-hua,SUN Xing-hua,YE Yong-fei,LIU Nai-di,ZHANG Xiao (School of Information Science and Engineering,Hebei North University,Zhangjiakou,Hebei 075000,China) To improve the poor robustness and distinguishment for leaf recognition,a novel dual-scale decomposition and fuzzy entropy measurement algorithm is proposed.Firstly,the input leaf images are decomposed by adaptive lifting wavelet into several subbands,then each subband is filtered by a group of variable-scale Guassian filtered.Then CS-LBP is applied to extract shape and textural features.Lastly,the fuzzy entropy measurement is utilized to redistribute the proportion of each scale.The experimental results demonstrate that the algorithm has higher recognition rate and noise tolerance. adaptive lifting wavelet;CS-LBP;fuzzy entropy 河北省教育廳重大項(xiàng)目(ZD20131085);河北北方學(xué)院重大課題(ZD201301) 梁俊花(1985-),女,山西文化人,助教,碩士。 張曉,教授,碩士。 TP 311 A 10.3969/j.issn.1673-1492.2015.04.008 來稿日期:2015-04-033 算法仿真
4 結(jié) 論