国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

決策樹C4.5對草藥形狀特征的優(yōu)化研究

2016-01-07 08:59:48嚴傳波,孫靜,阿布都艾尼·庫吐魯克
新疆醫(yī)科大學學報 2015年7期
關鍵詞:草藥直方圖形狀

決策樹C4.5對草藥形狀特征的優(yōu)化研究

嚴傳波, 孫靜, 阿布都艾尼·庫吐魯克, 木拉提·哈米提, 楊芳, 員偉康,

伊力扎提·阿力甫, 張歲霞, 孔喜梅

(新疆醫(yī)科大學醫(yī)學工程技術學院, 烏魯木齊830011)

摘要:目的利用決策樹分類方法探討一種新的圖像特征優(yōu)化降維方法。方法首先利用圖像濾波、灰度閾值、腐蝕運算等圖像操作對新疆草藥圖像做分割預處理,獲取草藥圖像感興趣區(qū)形狀,然后提取草藥形狀的Fourier-Mellin矩、Hu矩等形狀特征及圖像主顏色直方圖特征共14個特征分量;最后應用決策樹C4.5分類算法,在不同草藥形狀特征分量組合下比較草藥圖像分類準確率,經過優(yōu)化分析,選用Hu矩的H2、H4和圖像主顏色直方圖特征的C1~C3特征分量構成圖像形狀顏色混合特征的5個特征分量,用于草藥圖像分類。結果決策樹分類方法準確率達到88.55%;將優(yōu)化后的圖像形狀顏色混合特征用于圖像檢索,其檢索結果集前60張圖的平均查準率達到89.31%,實現(xiàn)形狀特征分量的優(yōu)化降維。結論利用決策樹分類方法可以進行圖像特征優(yōu)化降維,降低圖像形狀顏色混合特征維數(shù),提高圖像分類準確率和圖像檢索效率,為進一步圖像特征的優(yōu)化研究提供參考。

關鍵詞:Hu矩; 形狀顏色混合特征; 決策樹C4.5; 圖像檢索

中圖分類號:R532.32; TP317.4文獻標識碼:A

doi:10.3969/j.issn.1009-5551.2015.07.002

[收稿日期:2015-04-19]

基金項目:國家自然科學基金(81160182,81460281,61201125); 江西民族傳統(tǒng)藥協(xié)同創(chuàng)新項目(JXXT201401001-2); 留學人員科技活動擇優(yōu)資助項目(2013-277)

作者簡介:木拉提·哈米提(1957-),男(維吾爾族),教授,碩士生導師,研究方向:醫(yī)學圖像處理及生物醫(yī)學信號分析,E-mail:murat.h@163.com。

Optimization on the features of herbal shapes by C4.5 decision tree

YAN Chuanbo, SUN Jing, Kutluk Abdugheni, Hamit Murat, YANG Fang, YUAN Weikang,

Alip Elzat, ZHANG Suixia, KONG Ximei

(CollegeofMedicalEngineeringTechnology,XinjiangMedicalUniversity,Urumqi,

Xinjiang830011,China)

Abstract:ObjectiveTo study an innovative method of dimension reduction of image feature by means of C4.5 decision tree classification algorithm. MethodsFirstly, such operations as image filtering, gray threshold and corrosion arithmetic were applied to segment Xinjiang herb image for obtaining the region of interest (ROI) of herb shape. Secondly, 14 feature components, including herbal image shape Fourier-Mellin moments, Hu moments and the herbal image main color histogram features were extracted. Finally, C4.5 decision tree classification algorithm was adopted and 5 optimized components were identified as the image mixed shape-color features for the herbal image classification. ResultsThe classification accuracy rate of this method was proved to be 88.55%; the average precision rate in the top 60 images retrieval with the optimized mixed shape-color feature was up to 89.31%. ConclusionThe optimization and dimension reduction of image feature could be realized by means of C4.5 decision tree classification algorithm to provide a reference for the further optimization of image features.

Key words: Hu moment; mixed shape-color feature; decision tree C4.5 algorithm; image retrieval

基于內容的圖像檢索是從圖像的形狀、顏色、紋理等信息中提取圖像特征進行圖像匹配的過程,其中形狀特征是圖像重要的視覺特征。圖像形狀特征描述分為基于圖像輪廓的特征和基于圖像區(qū)域的特征,如鏈碼、小波特征、Fourier-Mellin矩[1-6]、Hu矩等[7-9]。圖像的顏色特征對于圖像旋轉、平移、縮放不敏感,比較穩(wěn)定,利用圖像顏色特征進行圖像內容檢索,算法的適應性優(yōu)越,如顏色直方圖特征、顏色矩、顏色相關圖等方法[10]。同時將圖像的形狀及顏色特征相用于基于內容的圖像檢索也是檢索研究的一個方向[11]。

為提高基于內容的圖像檢索效率,要求所依據(jù)和提取的圖像內容特征描述應具有優(yōu)越的檢索性能,圖像環(huán)境適應性強,具有較好的圖像旋轉、平移和縮放不變性等特征。草藥圖像一方面具有特定形狀特性,同時又具有顏色特性。在圖像檢索時,同時考察草藥圖像的形狀與顏色特征是提高草藥圖像檢索性能的一個較佳方案。圖像的形狀與顏色特征分量較多,并非所有特征分量對提高圖像檢索準確率均有顯著作用,存在冗余特征分量,因此優(yōu)化草藥圖像形狀與顏色混合特征、減少圖像特征分量個數(shù),同時不降低檢索準確率,是基于草藥圖像形狀顏色混合特征進行圖像檢索的較佳選擇。

新疆生長著上千種有地區(qū)特色的草藥,采集新疆中草藥信息包括中草藥圖譜、提取草藥圖像形狀特征和顏色特征,構建基于草藥圖像形狀顏色混合特征的基于內容的草藥檢索系統(tǒng)有重要的研究價值。草藥形狀特征優(yōu)化方法:首先對新疆草藥圖像做圖像分割預處理,獲取草藥圖像感興趣區(qū);然后針對圖像特點,選擇提取基于Radon變換的Fourier-Mellin矩特征、Hu矩圖像形狀特征和圖像主顏色直方圖特征;草藥圖像的形狀特征分量較多,應用C4.5決策樹分類算法比較草藥形狀Fourier-Mellin矩特征和Hu矩圖像形狀特征各分量對提高草藥圖像分類準確率的作用大小,去除無顯著作用的特征分量,降低形狀特征維數(shù),在不降低草藥圖像檢索效率前提下,獲得特征分量較少的圖像形狀顏色混合特征用于圖像檢索分類,以優(yōu)化圖像檢索性能。

1草藥圖像預處理

為獲取較準確的草藥圖像形狀,從而提取有效的圖像形狀顏色混合特征,需對新疆草藥圖像進行分割預處理。實驗采用的草藥圖譜均取自新疆人民出版社1973年出版的《新疆中草藥(維文版)》。首先根據(jù)所獲取的草藥圖像特點,通過采用圖像灰度閾值法、圖像幾何運算(腐蝕、開閉等操作)、高通濾波等方法取得圖像輪廓的黑白二值圖,最后與原圖像進行圖像乘法運算,實現(xiàn)圖像分割,提取出草藥圖像形狀。以新疆草藥阿克蘇黃芪圖像處理為例,其原圖及預處理后草藥二值圖、草藥形狀結果見圖1。

2草藥圖像形狀的Fourier-Mellin矩、Hu矩和主顏色直方圖特征提取

2.1基于Radon變換的Fourier-Mellin矩形狀持續(xù)提取函數(shù)f(x,y)的Radon變換是該函數(shù)沿包含該函數(shù)的平面內的一組直線的線積分[1]。在基于內容的圖像檢索算法中,保持圖像旋轉、縮放和平移(RST)不變性對提高圖像檢索效率有重要意義。基于Radon變換的Fourier- Mellin變換是先將草藥形狀圖像做Radon變換,然后使用Fourier變換與極坐標LPM變換 (Log Polar Map )對圖像進行的變換處理,利用Fourier- Mellin算法提取Fourier-Mellin矩形狀特征4個分量M1~M4[1-2]。

a: 草藥原圖

b: 草藥形狀黑白圖

c: 草藥形狀結果圖

圖1草藥圖像預處理

2.3圖像主顏色直方圖特征提取圖像顏色直方圖是利用圖像紅、綠、藍3種顏色分量在整幅圖像中所占的比例,提取圖像顏色特征的方法。本研究圖像主顏色直方圖特征提取方法基于圖像灰度直方圖特征的提取。首先分析彩色圖像紅、綠、藍3種顏色各自分量和大小,確定分量和大者為圖像主顏色分量,根據(jù)灰度直方圖特征提取算法[12],計算該顏色分量的顏色直方圖特征包括顏色均值(Mean)、方差(Variance)、偏斜度(Skewness)、峰度(Kurtosis)、能量(Energy)、熵(Entropy)等信息作為圖像主要顏色直方圖特征。為減少計算量,根據(jù)草藥圖像的整體顏色分布特點,在計算顏色直方圖特征時,將該顏色分量矩陣中出現(xiàn)頻率低于P0的色階濾除。經過實驗,根據(jù)新疆草藥圖像特點,僅取主顏色直方圖特征中偏斜度、峰度和熵信息作為試驗中圖像主顏色直方圖特征。

已知彩色圖像f(x,y),圖像主顏色直方圖特征提取流程包括3個步驟:(1)確定彩色圖像的主顏色。設r(x,y)、g(x,y)、b(x,y)為彩色圖像的3個顏色矩陣分量,分別計算各自矩陣分量和,比較分量和大小,以最大分量和的顏色分量為彩色圖像的主顏色,經比較,設r(x,y)為彩色圖像主顏色。(2)計算主顏色直方圖如r(x,y)顏色直方圖rHist,根據(jù)圖像灰度直方圖計算方法,計算主顏色r(x,y)各色階ri(1≤i≤255)出現(xiàn)的概率Pi,若Pi小于指定值P0,則認為該色階在彩色圖像中分布較少,對圖像特征提取影響可以忽略不計,將其濾除。另外,根據(jù)分割后新疆草藥圖像顏色中黑色為圖像背景的特點,將色階為0的色階也濾除。最后得到彩色圖像的主顏色直方圖rHist(i)(1≤i≤L)。本研究中設P0=0.005。(3)計算主顏色直方圖rHist的特征分量偏斜度、峰度和熵。根據(jù)顏色直方圖特征偏斜度、峰度和熵的計算方法,提取草藥圖像主顏色直方圖的偏斜度C1、峰度C2、熵C3共計3個分量作為草藥圖像主顏色直方圖特征[12]。

2.4草藥圖像形狀顏色混合特征提取草藥圖像經過預處理,進行圖像分割,獲取草藥形狀圖像。根據(jù)Fourier-Mellin矩、Hu矩形狀特征以及圖像主顏色直方圖特征的計算算法,得到草藥圖像形狀顏色的混合特征,存入數(shù)據(jù)庫。為測試該混合特征的檢索性能,從《新疆中草藥(維文版)》草藥圖譜中選擇了27種草藥圖,通過圖像預處理,獲取它們的形狀圖像。對每種草藥形狀圖像進行旋轉、平移和縮放操作,使每種草藥圖像再隨機產生84張經過變化處理的草藥形狀圖像,共計產生2 268(27×84)幅草藥形狀圖像,提取其形狀顏色混合特征,其中Fourier-Mellin矩特征4個分量M1~M4,Hu矩特征7個分量H1~H7,主顏色特征3個分量C1~C3,共計14個特征分量,作為實驗圖像特征數(shù)據(jù)庫,用于測試評價草藥形狀不同特征分量組合對草藥分類準確率的作用大小及優(yōu)化后的形狀顏色混合特征的圖像檢索性能。

3決策樹C4.5分類算法對圖像形狀特征優(yōu)化降維

決策樹(Decision Tree)又稱為判定樹,是數(shù)據(jù)挖掘中運用于分類的一種樹結構。決策樹先使用訓練數(shù)據(jù)歸納算法生成可讀的規(guī)則和決策樹,然后利用生成的決策樹對輸入的測試數(shù)據(jù)進行分類。決策樹分類過程通常分為建樹(Tree Building)與剪樹(Tree Pruning) 2個階段,典型算法有ID3、C4.5、C5.0、CART等[13-15],算法優(yōu)點是分類精度高、生成模式簡單、對噪聲數(shù)據(jù)有健壯性。決策樹算法最早有ID3算法,C4.5算法改進了ID3算法,采用信息增益率來選擇屬性,克服了ID3用信息增益選擇屬性時偏向選擇取值多的屬性的不足;C4.5算法在樹構造過程中同時進行剪枝,能夠完成對連續(xù)屬性的離散化處理,能夠對不完整數(shù)據(jù)進行處理,對于預測變量的缺值處理、剪枝技術、派生規(guī)則等方面對ID3作了較大改進,既適合于分類問題,又適合于回歸問題。

對于草藥圖像檢索而言,形狀特征Fourier-Mellin矩、Hu矩特征分量較多,可能存在冗余特征分量。若使用全部特征分量作為圖像特征用于檢索,反而可能降低圖像檢索準確率。為此,采用決策樹C4.5分類算法,依次選擇各形狀特征分量組合用于草藥圖像分類,比較各特征分量組合對草藥圖像的分類準確率。以分類準確率最高、所需特征分量最少為約束條件,實驗優(yōu)選Fourier-Mellin矩、Hu矩形狀特征分量,從而最大可能降低形狀特征維數(shù),在不降低草藥圖像檢索效率前提下,獲得特征分量較少的圖像形狀顏色混合特征,從而提高圖像檢索性能。

3.1決策樹C4.5算法對形狀特征分量的優(yōu)選根據(jù)27種草藥圖像,經旋轉、平移和縮放操作后產生的2 268幅草藥圖像,提取圖像形狀顏色混合特征共14個特征分量作為試驗對象,使用C4.5算法,對每種草藥隨機取30個形狀顏色特征作為訓練數(shù)據(jù),剩余54個作為測試數(shù)據(jù),進行草藥分類試驗,每次試驗中,在訓練數(shù)據(jù)特征分量和測試數(shù)據(jù)特征分量中選取不同的形狀特征分量組合作為決策樹分類的訓練數(shù)據(jù)與測試數(shù)據(jù)特征分量,比較在不同的形狀特征分量組合下,草藥圖像分類的準確率。圖2是不同形狀特征分量組合決策樹C4.5算法對草藥圖像的分類準確率。圖中不同形狀特征分量的組合表示方法為Mxx、Hxx,即若采用Fourier-Mellin矩第1和第2分量,則特征分量組合表示為M12;若采用Hu矩第2和第4分量為特征分量組合,則表示分H24,圖2中X軸為需考察的形狀特征分量組合,Y軸為該組合下C4.5決策樹算法的分類準確率。

圖2a顯示,在形狀特征各分量中,H2對草藥圖像的分類準確率最高,達到81.76%,其他分量分類準確率相對較低。說明H2分量對草藥圖像的分類起顯著作用。為此,試驗重點考察與H2分量相結合的特征分量組合對草藥圖像的分類準確率。

圖2b顯示,H24、H26、H234、H246等均有較高的分類準率,分類準確率達到88.55%;H1234567分類準確率為76.34%,M1、M12、H4、H6、H12等組合分類準確率相對較低。說明形狀特征各分量對分類準確率的貢獻不同,將特征分量全部分量用于分類,其分類準確率反而會降低。以分類準確率最高、所需特征分量最少為約束條件,由圖2b可看出,特征分量可選擇Hu矩的H24、H25、H26作為候選草藥圖像形狀特征分量用于圖像檢索。

試驗選擇采用Hu矩的H2和H4特征分量組合結合主顏色特征C1~C3作為優(yōu)化后的草藥形狀顏色混合特征用于圖像檢索,優(yōu)化后的部分草藥形狀顏色混合特征數(shù)據(jù),見表1。

表1 優(yōu)化后新疆草藥圖像形狀顏色混合特征

3.2基于優(yōu)選的圖像形狀顏色混合特征的圖像檢索以草藥形狀Hu矩特征分量H2、H4和草藥主顏色特征分量C1~C3相結合,構成圖像形狀顏色混合特征,進行基于內容的新疆草藥圖像檢索,驗證其圖像檢索性能。在檢索時,對每張草藥形狀原圖,通過旋轉、平移、縮放方法新產生135(27×5)張草藥形狀圖作為訓練圖庫,從訓練圖庫中隨機選擇草藥圖像作為檢索目標圖,在2 268(27×84)幅圖像數(shù)據(jù)庫中檢索與之相關的草藥圖像。經過試驗,基于優(yōu)化的圖像形狀顏色混合特征的圖像檢索平均查準率和平均查全率如表2所示,其檢索結果集前60張圖平均查準率達到89.31%。

a: 形狀特征各單分量C4.5算法對草藥圖像的分類準確率 b: 不同形狀特征分量組合C4.5算法對草藥圖像的分類準確率

圖2形狀特征各分量C4.5算法對草藥圖像的分類準確率

表2優(yōu)化后新疆草藥圖像形狀顏色混合特征的平均查準率與查全率%

類別前10張前20張前30張前40張前50張前60張前70張前80張平均查準率/%100.00100.0096.2593.0290.3389.3186.1982.71平均查全率/%11.9023.8134.3844.3053.7763.7971.8378.77

基于優(yōu)化的新疆草藥圖像形狀顏色混合特征的圖像檢索結果如圖3所示。在進行圖像檢索時,具有很高的圖像檢索準確率。另外由于圖像特征優(yōu)化降維,檢索運算速度也得到了極大提升,實現(xiàn)了圖像特征降維和檢索優(yōu)化目標。

圖3 基于優(yōu)化后新疆草藥圖像形狀顏色混合特征的圖像檢索結果

4結論

在圖像檢索分類時,圖像形狀顏色混合特征各分量作用不同,存在冗余分量。本研究提出的圖像特征優(yōu)化方法在提取新疆中草藥圖像形狀顏色混合特征后,使用決策樹C4.5分類算法對不同形狀特征分量組合進行優(yōu)選,比較不同組合對草藥分類準確率的作用大小。以提高分類準確率、降低圖像形狀顏色混合特征維數(shù)為約束條件,對圖像形狀顏色混合特征14個特征分量進行優(yōu)化降維,最終優(yōu)選出Hu矩的H2和H4及圖像主顏色直方圖C1~C3共計5個分量用于基于內容的新疆草藥圖像檢索。試驗表明,優(yōu)化后的草藥形狀顏色混合特征對草藥分類的平均準確率達到88.55%;將該圖像形狀顏色混合特征用于圖像檢索,其檢索結果集前60張圖的平均查準率達到89.31%,達到了圖像特征優(yōu)化降維和提高圖像檢索準確率的優(yōu)化目標,為探索新的圖像特征優(yōu)化技術提供了新的方法與思路。

參考文獻:

[1]王晅,肖賦,馬建峰. 基于Radon和解析Fourier-Mellin變換的尺度與旋轉不變目標識別算法[J]. 中國圖象圖形學報,2008,13(11):2157-2161.

[2]王晅,陳至坤,潘曉娣,等. 基于Radon變換的圖像輪廓提取方法研究[J]. 傳感器與微系統(tǒng),2010,29(2):63-65,68.

[3]羅小剛,劉靜,汪德瑗,等. 基于Radon變換與功率譜結合的心臟MR圖像配準算法[J]. 計算機科學,2012,39(4):254-257.

[4]林卉,梁亮,杜培軍,等. 利用Fourier-Mellin變換的遙感圖像自動配準[J]. 武漢大學學報,2012,37(6):649-652.

[5]葉唏,李興華,張菲菲,等. 基于Radon和解析Fourier-Mellin變換的篡改圖像盲檢測算法[J]. 信號處理,2010,26(11):1695-1700.

[6]劉威,孔英蕾,肖宏濤. 基于形狀特征的圖像檢索技術[J]. 蘭州理工大學學報,2011,37(1):100-105.

[7]王振海. 融合HU不變矩和SIFT特征的商標檢索[J]. 計算機工程與應用,2012,48(1):187-190.

[8]張琪,屈嚴,董志芳. 改進的統(tǒng)一Hu矩在圖像目標識別中的應用[J]. 電子器件,2012,35(6):679-682.

[9]Hu MK. Visual pattern recognition by moment invariant[J].IEEE T Inform Theory, 1962, 8(2):179-187.

[10]王娟,孔兵,賈巧麗.基于顏色特征的圖像檢索技術[J].計算機系統(tǒng)應用,2011,20(7):160-164.

[11]吳建.基于顏色和形狀特征的彩色圖像檢索技術研究[J].蘇州大學學報:自然科學版,2012,28(1):47-52.

[12]木拉提·哈米提,周晶晶,嚴傳波,等.新疆地方性肝包蟲CT圖像的灰度直方圖特征提取與分析[J].科技導報,2012,30(6):66-70.

[13]潘琛,林怡,陳映鷹.基于多特征的遙感影像決策樹分類[J].光電子·激光,2010,21(5):731-736.

[14]閆利,孫穎超.基于影像多種特征的決策樹分類方法[J].地理空間信息,2009,7(6):15-17.

[15]王會青,陳俊杰,侯曉晶,等.決策樹分類的屬性選擇方法的研究[J].太原理工大學學報,2011,42(4):346-348,352.

(本文編輯施洋)

猜你喜歡
草藥直方圖形狀
統(tǒng)計頻率分布直方圖的備考全攻略
挖藕 假如悲傷有形狀……
符合差分隱私的流數(shù)據(jù)統(tǒng)計直方圖發(fā)布
本草藥名中的避諱
草藥在皮膚病中的應用
用直方圖控制畫面影調
你的形狀
看到的是什么形狀
基于直方圖平移和互補嵌入的可逆水印方案
計算機工程(2015年8期)2015-07-03 12:20:21
心的形狀
永平县| 定襄县| 通渭县| 信丰县| 克东县| 于田县| 大姚县| 龙口市| SHOW| 绥江县| 陈巴尔虎旗| 黑河市| 安仁县| 榆树市| 兰考县| 垦利县| 九龙坡区| 任丘市| 基隆市| 石泉县| 会宁县| 和平区| 房产| 海晏县| 阿瓦提县| 保山市| 烟台市| 磴口县| 阳春市| 荆门市| 赞皇县| 荣成市| 新乡县| 泽库县| 荆州市| 合阳县| 阿拉善右旗| 佛冈县| 钦州市| 营山县| 桂阳县|