国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多特征融合和LightGBM的金線蓮品系識(shí)別

2021-03-25 13:50:00陳舒迪柴琴琴張勛黃澤豪林羽徐偉

陳舒迪 柴琴琴 張勛 黃澤豪 林羽 徐偉

摘要: 金線蓮是中國(guó)珍稀中草藥,不同品系的金線蓮具有細(xì)微的形態(tài)差異和顯著的藥效差異。針對(duì)金線蓮的單一特征貢獻(xiàn)能力不足以及傳統(tǒng)分類器泛化能力不佳的問(wèn)題,提出使用形狀、顏色和紋理特征對(duì)金線蓮葉片圖像進(jìn)行特征提取與融合,再使用表現(xiàn)性能更優(yōu)的LightGBM(輕量級(jí)梯度提升機(jī))構(gòu)建分類器,以提高金線蓮識(shí)別正確率。LightGBM具有精確高效等優(yōu)點(diǎn),將提取得到的高層次特征導(dǎo)入LightGBM進(jìn)行訓(xùn)練預(yù)測(cè),可以有效提高分類準(zhǔn)確性。對(duì)金線蓮數(shù)據(jù)集中的6個(gè)品系共368幅葉片圖像進(jìn)行試驗(yàn),結(jié)果表明,相比于傳統(tǒng)的分類方法,基于多特征融合和LightGBM的模型識(shí)別效果最好,10次隨機(jī)試驗(yàn)的平均識(shí)別率比傳統(tǒng)方法KNN、SVM和GBDT高,并且在分類評(píng)價(jià)指標(biāo)精確率、召回率、綜合評(píng)價(jià)指標(biāo)上有較優(yōu)表現(xiàn),該研究結(jié)果可為中藥材品系識(shí)別提供參考。

關(guān)鍵詞: 金線蓮;多特征融合;LightGBM;葉片識(shí)別

中圖分類號(hào): TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1000-4440(2021)01-0155-08

Identification of Anoectochilus roxburghii strains based on multi feature fusion and LightGBM

CHEN Shu-di1,2, CHAI Qin-qin1,2, ZHANG Xun3, HUANG Ze-hao3, LIN Yu3, XU Wei3

(1.College of Electrical Engineering and Automation, Fuzhou University, Fuzhou 350108, China;2.Ministry of Education Key Laboratory of Medical Instrument and Pharmaceutical Technology, Fuzhou University, Fuzhou 350108, China;3.College of Pharmacy, Fujian University of Traditional Chinese Medicine, Fuzhou 350122, China)

Abstract: Anoectochilus roxburghii is a rare Chinese herbal medicine, different strains of A.roxburghii have slight morphological difference and significant variance in medicinal effects. To solve the problems of insufficient contribution ability of single-feature in A.roxburghii and poor generalization ability of traditional classifiers, it was proposed to use shape, color and texture features to extract and fuse features of A.roxburghii leaf images. Then LightGBM (light weight class elevator) with a better performance was used in building classifier, so as to improve the recognition accuracy of A.roxburghii. LightGBM had the advantages of accurate and efficient, and the prediction accuracy could be improved effectively by importing the extracted high-level features into LightGBM to forecast the training. A total of 368 leaf images from six strains of A.roxburghii dataset were trained and tested. The results showed that model based on multi-feature fusion and LightGBM had the best recognition effect compared with traditional classification methods. The average recognition rate of ten random experiments was higher than traditional methods such as KNN, SVM and GBDT, and it showed good performance in classification evaluation indices like precision, recall rate and comprehensive evaluation index. The result can provide reference for the identification of different strains of traditional Chinese medicine.

Key words: Anoectochilus roxburghii;multi feature fusion;LightGBM;leaf recognition

金線蓮屬于蘭科開(kāi)唇蘭屬植物[1-2],含糖類、多種氨基酸及無(wú)機(jī)元素等,常用于糖尿病、肺熱咳嗽、急慢性肝炎等疾病的治療[3-4]。由于金線蓮藥用價(jià)值高、市場(chǎng)需求量大,而野生金線蓮的繁殖率低、生存條件受限等原因,導(dǎo)致目前市場(chǎng)上銷售的金線蓮基本是人工栽培的。不同品系的金線蓮雖外觀相似但生物產(chǎn)量積累和藥用化合物組成有著很大的差異,市面上以低藥用價(jià)值的金線蓮冒充優(yōu)質(zhì)品系的金線蓮的現(xiàn)象尤為常見(jiàn)。因此,金線蓮品系識(shí)別是選擇優(yōu)質(zhì)品系的重要依據(jù),如何精確高效地對(duì)金線蓮品系進(jìn)行識(shí)別有著重要的意義。

常用的金線蓮品系鑒別方法有中藥鑒定法、解剖學(xué)法和近紅外光譜檢測(cè)法等[5-8],這些傳統(tǒng)方法存在主觀性強(qiáng)、效率低、正確率低和操作復(fù)雜等缺陷,而基于機(jī)器視覺(jué)[9]的植物品系識(shí)別技術(shù)具有速度快、準(zhǔn)確率高和操作方便等優(yōu)點(diǎn),因此使用計(jì)算機(jī)進(jìn)行植物品系識(shí)別受到了越來(lái)越多的關(guān)注。機(jī)器視覺(jué)可獲得不同品系金線蓮植株的顏色[10]、形狀[11]和紋理[12]等遺傳信息,其中葉片數(shù)據(jù)最易采集且具有較長(zhǎng)存活期,故以金線蓮葉片作為研究對(duì)象,提取其顏色、形狀和紋理特征,并將3種特征加以融合以進(jìn)行識(shí)別。然而,不同品系的金線蓮葉片圖像十分相似,識(shí)別難度大,因此如何基于獲得的圖像特征,構(gòu)建合適的分類器對(duì)采集的葉片圖像進(jìn)行進(jìn)一步品系識(shí)別仍是具有挑戰(zhàn)性的問(wèn)題。

在分類器的選擇上,傳統(tǒng)的機(jī)器算法,如支持向量機(jī)(SVM)[13]、最近鄰分類器(KNN)[14]、決策樹(shù)(DT)[15]及邏輯回歸(LR)[16]等在植物圖像識(shí)別上應(yīng)用廣泛,但上述分類器的應(yīng)用仍具有局限性,由于金線蓮脈紋復(fù)雜、種類繁多,這些傳統(tǒng)的分類方法在金線蓮數(shù)據(jù)集上的表現(xiàn)也差強(qiáng)人意。深度學(xué)習(xí)[17]算法具有覆蓋范圍廣、學(xué)習(xí)能力強(qiáng)和特征提取方便等特點(diǎn),Dyrmann等[18]基于Keras學(xué)習(xí)框架使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)10 413幅旱田雜草圖像進(jìn)行識(shí)別,取得了較好的識(shí)別效果;鄧向武等[19]將深度置信網(wǎng)絡(luò)應(yīng)用于稻田雜草圖像的檢測(cè)和分類,識(shí)別正確率為91.13%。然而直接通過(guò)原圖像構(gòu)建深度學(xué)習(xí)模型通常需要大量的標(biāo)記樣本,且訓(xùn)練時(shí)間太長(zhǎng);在處理小樣本數(shù)據(jù)集時(shí)深度學(xué)習(xí)算法往往需要對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,易出現(xiàn)精度低、過(guò)擬合等問(wèn)題??紤]到本研究樣本數(shù)量、分類品系不多和普通計(jì)算機(jī)硬件資源有限等問(wèn)題,本研究提出用輕量級(jí)梯度提升機(jī)(Light gradient boosting machine,LightGBM)[20]作為分類模型。LightGBM是一種基于梯度提升樹(shù)(Gradient boosting decision tree,GBDT)的提升算法,比起傳統(tǒng)的 GBDT算法,LightGBM通過(guò)直方圖優(yōu)化對(duì)連續(xù)特征值進(jìn)行分段處理,可以節(jié)省內(nèi)存并加快運(yùn)行速度,決策樹(shù)通過(guò)Leaf-wise的葉子生長(zhǎng)策略進(jìn)行生長(zhǎng),限制樹(shù)的深度防止過(guò)擬合,能夠有效提高模型預(yù)測(cè)的準(zhǔn)確率。Wang等[21]將LightGBM用于乳腺腫瘤的分類和診斷,并使用模型RF、XGBoost和LightGBM分別對(duì)樣本進(jìn)行分類識(shí)別,試驗(yàn)結(jié)果表明,LightGBM模型的分類精度最高。Zhang等[22]將LightGBM用于化學(xué)毒性預(yù)測(cè),在所有Tox21(21世紀(jì)毒理學(xué)測(cè)試)和致突變性數(shù)據(jù)集上,與其他分類算法相比,LightGBM提供了最佳的預(yù)測(cè)性能。目前,LightGBM分類算法鮮被用于植物圖像識(shí)別中。

綜上所述,針對(duì)不同品系金線蓮葉片差異不明顯、復(fù)雜生長(zhǎng)環(huán)境下不同品系金線蓮葉片形態(tài)多變等因素引起的品系鑒別困難,本研究提出了基于多特征融合和LightGBM的金線蓮品系識(shí)別。對(duì)提取得到的特征進(jìn)行融合,解決了金線蓮葉片單一特征貢獻(xiàn)能力不足的缺點(diǎn),通過(guò)LightGBM分類器進(jìn)行預(yù)測(cè),解決了傳統(tǒng)機(jī)器學(xué)習(xí)算法識(shí)別效果不佳的問(wèn)題。

1 樣本預(yù)處理及特征提取

1.1 圖像預(yù)處理

在試驗(yàn)研究階段,所用金線蓮樣品均采自福建葛園生物科技有限公司,為金線蓮成熟期葉片,采集6個(gè)品系的金線蓮葉片,共368個(gè)樣本,在實(shí)驗(yàn)室環(huán)境下用尼康單反數(shù)碼相機(jī)(型號(hào)為NIKON D7100)獲取金線蓮葉片圖像。其中臺(tái)灣金線蓮圖像69幅、紅霞圖像70幅、小圓葉圖像50幅、 尖葉圖像58幅、一株圓葉圖像66幅、 大圓葉圖像55幅,采集的金線蓮各品系代表圖像如圖1所示。

針對(duì)獲取的金線蓮葉片圖像,在進(jìn)行特征提取和識(shí)別之前先對(duì)其進(jìn)行預(yù)處理,突出葉片圖像中的有效特征,削弱噪聲和蟲(chóng)洞的影響。將金線蓮葉片圖像轉(zhuǎn)換成灰度圖像,接著使用中值濾波對(duì)灰度圖像進(jìn)行去噪處理,增強(qiáng)葉片的目標(biāo)信息,之后使用形態(tài)學(xué)膨脹和腐蝕方法對(duì)葉片蟲(chóng)洞進(jìn)行填充,并將葉柄與葉面分割,最后選取自適應(yīng)閾值確定的大津法獲取葉片二值圖像,將二值圖像和金線蓮葉片原始圖像通過(guò)掩膜操作,獲得金線蓮葉片前景圖像(圖2)。

1.2 金線蓮葉片特征提取

在人工智能時(shí)代,特征數(shù)據(jù)決定了機(jī)器學(xué)習(xí)的上限,特征數(shù)據(jù)是否有效是識(shí)別模型作用能否發(fā)揮到極致的重要前提[23]。如果從金線蓮葉片圖像中提取到的特征數(shù)據(jù)含有大量品系差異信息,那么識(shí)別模型的識(shí)別性能將會(huì)大大提高。本研究從金線蓮葉片圖像中提取23維形狀特征、18維顏色特征和75維紋理特征,共116維特征,作為表征金線蓮品系差異的主要特征。

1.2.1 形狀特征 形狀特征是圖像識(shí)別中廣泛應(yīng)用的重要特征,由圖1可以看出,不同品系的金線蓮葉片存在一定的形態(tài)差異。本研究選擇16維傅里葉特征以及7維HU不變矩特征共23維特征作為金線蓮葉片的形狀特征。

1.2.1.1 傅里葉描述子 傅里葉描述子只需通過(guò)少量的描述子即可大致代表整個(gè)金線蓮葉片的輪廓[24]。將傅里葉描述子歸一化后,提取到的形狀特征可以不受輪廓在圖像中的位置、大小和角度的影響,具有良好的魯棒性。傅里葉描述子用1個(gè)總長(zhǎng)度為N的離散的坐標(biāo)序列{x(n),y(n)|n=0,1,…,N-1}來(lái)表示金線蓮的閉合輪廓,坐標(biāo)序列使用復(fù)數(shù)形式表示,如公式(1)所示:

通過(guò)傅里葉變換可得a(u):

對(duì)a(u)進(jìn)行傅立葉反變換可獲得金線蓮葉片的邊緣系數(shù),本研究通過(guò)選取16個(gè)邊緣系數(shù)來(lái)描述金線蓮葉片輪廓。

1.2.1.2 HU不變矩 HU不變矩通過(guò)統(tǒng)計(jì)矩計(jì)算得到,常被用來(lái)表示圖像的形狀特征[25]。對(duì)于灰度分布為f(x,y)的圖像,該圖像的HU不變矩(p+q)階統(tǒng)計(jì)量的定義為:

其中p,q=0,1,2,…,(p+q)階中心矩定義為:

其中矩心為:x0=m10m00,y0=m01m00,通過(guò)公式(5)計(jì)算可得歸一化中心矩:

式中:r=p+q+22,p,q=0,1,2,…,本研究通過(guò)二階和三階歸一化中心矩共構(gòu)造7個(gè)HU不變矩。

1.2.2 顏色特征 顏色特征是彩色圖像中最顯著的特征,常用于描述顏色特征的方法有顏色矩、顏色聚合向量和顏色集等[26]。本研究通過(guò)顏色矩來(lái)提取顏色特征,共提取了18維特征,分別是RGB(紅-綠-藍(lán))、HSV(色調(diào)-飽和度-明度)顏色空間的R、G、B、H、S和V 6個(gè)分量的均值、方差和斜度,均值(Mi1)、方差(Mi2)和斜度(Mi3)的計(jì)算方法如公式(6)~公式(8)所示:

式中,Pij為圖像中灰度為j的像素在第i個(gè)顏色通道分量中出現(xiàn)的概率,N為圖像中所有像素的個(gè)數(shù)。

1.2.3 紋理特征 紋理特征描述了物體局部特征的周期性變化及排列規(guī)則,本研究根據(jù)金線蓮葉片紋理特征分別使用灰度共生矩陣(GLCM)[27]和圓形LBP(CLBP)方法[28]對(duì)葉片圖像進(jìn)行紋理特征提取,共得到75維紋理特征。

1.2.3.1 灰度共生矩陣 灰度共生矩陣通過(guò)計(jì)算像素之間不同灰度值組合出現(xiàn)的次數(shù)來(lái)反映紋理信息。本研究通過(guò)計(jì)算金線蓮葉片圖像4個(gè)方向(0°,45°,90°,135°)的 4 個(gè)GLCM關(guān)鍵特征[對(duì)比度(Con)、能量(Ent)、熵(Asm)和相關(guān)性(Idm)],共可提取得到 16 個(gè)特征值。4個(gè)關(guān)鍵特征的計(jì)算方法如公式(9)~公式(12)所示:

式中P(ij)為歸一化后的灰度共生矩陣,N為灰度級(jí)數(shù)。

1.2.3.2 圓形LBP LBP是一種常用的紋理描述方法,具有計(jì)算簡(jiǎn)單、速度快和旋轉(zhuǎn)不變性等特點(diǎn)。然而傳統(tǒng)LBP算子提取的是固定領(lǐng)域內(nèi)的灰度值,當(dāng)圖像的比例發(fā)生改變時(shí),傳統(tǒng)LBP特征將無(wú)法正確地反映紋理信息。故本研究使用圓形LBP算子來(lái)描述紋理特征,圓形LBP可適應(yīng)圖像不同尺度的變換,使用靈活的圓形鄰域代替固定的3×3正方形鄰域,可設(shè)置得到采樣點(diǎn)為P、半徑為R的圓形LBP算子。對(duì)于1個(gè)點(diǎn)(Xc,Yc),它鄰近的(Xa,Ya)a∈P的計(jì)算公式如公式(13)、公式(14)所示:

式中,R為所設(shè)置的圓形領(lǐng)域的半徑,P為采樣點(diǎn)的個(gè)數(shù)。中心為(Xc,Yc)的LBP值計(jì)算方法如公式(15)、公式(16)所示:

本研究共設(shè)置8個(gè)采樣點(diǎn),共產(chǎn)生二進(jìn)制形式的LBP值28=256種,由于太大的特征維度會(huì)影響特征融合后其他特征的描述效果,故使用Uniform降維方法[29]對(duì)采樣得到的特征進(jìn)行降維處理,特征由256維降至59維。

2 金線蓮品類識(shí)別模型

2.1 梯度提升樹(shù)(GBDT)原理

梯度提升(Gradient boosting)是一種常用的機(jī)器學(xué)習(xí)算法,常被用于回歸和分類任務(wù)。梯度提升通過(guò)目前模型的殘差來(lái)對(duì)新的弱分類器進(jìn)行訓(xùn)練,之后將訓(xùn)練好的弱分類器不斷累加到現(xiàn)有模型中,保證損失函數(shù)不斷減小。假設(shè)fi(x)為弱分類器,得到最終強(qiáng)分類器為:

決策樹(shù)(Decision tree)為樹(shù)形結(jié)構(gòu)的分類方法。從決策樹(shù)的根節(jié)點(diǎn)開(kāi)始進(jìn)行決策,其中的每個(gè)內(nèi)部節(jié)點(diǎn)代表1個(gè)劃分標(biāo)準(zhǔn),每個(gè)分支代表1個(gè)劃分結(jié)果。

GBDT將梯度提升思想和決策樹(shù)思想相融合,以決策樹(shù)為弱分類器,通過(guò)多輪迭代,不斷減小損失。在迭代過(guò)程中,逐步增加弱分類器,最后將訓(xùn)練好的各個(gè)弱分類器的結(jié)果進(jìn)行集成,從而得出最終的預(yù)測(cè)結(jié)果,GBDT訓(xùn)練過(guò)程如圖3所示。

2.2 LightGBM

2.2.1 直方圖優(yōu)化 LightGBM是GBDT算法的一種改進(jìn),LightGBM沒(méi)有使用傳統(tǒng)的預(yù)排序思想,而是對(duì)特征值進(jìn)行直方圖優(yōu)化。直方圖優(yōu)化首先對(duì)特征數(shù)據(jù)進(jìn)行“裝箱處理”,得到n個(gè)“桶”。之后對(duì)數(shù)據(jù)進(jìn)行遍歷,將離散化后的值作為索引在直方圖中的每個(gè)“桶”中進(jìn)行累計(jì),遍歷完成后,就可以得到每個(gè)“桶”的統(tǒng)計(jì)量,直方圖統(tǒng)計(jì)過(guò)程如圖4所示。比起傳統(tǒng)的預(yù)排序思想,直方圖優(yōu)化只需保存特征離散化后的值,明顯降低了內(nèi)存的損耗,加快了訓(xùn)練速度。

2.2.2 葉子生長(zhǎng)策略為了提高模型訓(xùn)練的效率,LightGBM選擇Leaf-wise作為葉子生長(zhǎng)策略,傳統(tǒng)的GBDT

算法通常使用Level-wise葉子生長(zhǎng)策略,Leaf-wise和Level-wise的對(duì)比如圖5所示。由圖5可見(jiàn),Level-wise葉子生長(zhǎng)策略每次分裂需要對(duì)同一層的所有葉子同時(shí)進(jìn)行分裂,因此在很多葉子上進(jìn)行了不必要的分裂和搜索,而Leaf-wise每次分裂只對(duì)分裂增益最大的1個(gè)葉子進(jìn)行分裂,避免不必要的分裂和搜索,可以達(dá)到提升分類精度的目的。但Leaf-wise可能會(huì)產(chǎn)生1棵過(guò)深的決策樹(shù),使結(jié)果過(guò)擬合,因此LightGBM在Leaf-wise葉子分裂策略的基礎(chǔ)上增加了決策樹(shù)最大深度的限制,最大程度避免了過(guò)擬合。

2.3 識(shí)別模型

為訓(xùn)練LightGBM識(shí)別模型,本研究選取70%的金線蓮葉片特征數(shù)據(jù)用作訓(xùn)練樣本,30%的特征數(shù)據(jù)用作測(cè)試樣本,識(shí)別模型如圖6所示。

識(shí)別流程如下:

(1)特征提取及融合:對(duì)6個(gè)品系共368幅金線蓮葉片圖像分別提取形狀、顏色和紋理特征,通過(guò)融合,共提取得到116維特征。

(2)數(shù)據(jù)集劃分:本研究從368個(gè)數(shù)據(jù)樣本中選擇258個(gè)數(shù)據(jù)樣本作為訓(xùn)練樣本,將剩下的110個(gè)數(shù)據(jù)作為測(cè)試樣本。

(3)訓(xùn)練過(guò)程:

(a)初始化決策樹(shù)棵數(shù)為m,訓(xùn)練樣例權(quán)重為1/m;初始化迭代次數(shù)iter=1,設(shè)置最大迭代次數(shù)imax;

(b)根據(jù)樣例特征直方圖計(jì)算各個(gè)切分點(diǎn),并尋找最優(yōu)分割點(diǎn);再采用帶有深度限制的Leaf-wise葉子生長(zhǎng)策略訓(xùn)練每棵決策樹(shù)fi(x);

(c)根據(jù)誤差確定當(dāng)前弱分類器的話語(yǔ)權(quán)ai;

(d)按公式(17)合并基分類器為強(qiáng)分類器;

(e)若訓(xùn)練誤差或者最大迭代次數(shù)滿足要求則停止訓(xùn)練,轉(zhuǎn)步驟(4); 否則iter=iter+1, 轉(zhuǎn)步驟(b);

(4)預(yù)測(cè)過(guò)程:使用訓(xùn)練后的LightGBM識(shí)別模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),并獲得識(shí)別結(jié)果。

2.4 試驗(yàn)結(jié)果及分析

本試驗(yàn)均在pycharm環(huán)境下進(jìn)行,試驗(yàn)所用電腦為Windows 10系統(tǒng),配備4 GB內(nèi)存,處理器為英特爾第七代酷睿i5-7200U@2.50 GHz。為了研究基于多特征融合和LightGBM的識(shí)別模型的識(shí)別性能,本研究基于融合特征分別構(gòu)建KNN、SVM、GBDT和LightGBM識(shí)別模型,統(tǒng)計(jì)金線蓮品系識(shí)別正確率。并且為了避免識(shí)別結(jié)果的不確定性,數(shù)據(jù)集劃分的隨機(jī)數(shù)種子是由系統(tǒng)隨機(jī)給出的,重復(fù)測(cè)試10次,4種分類器的10次試驗(yàn)分類結(jié)果如圖7所示。

考慮到尋優(yōu)算法在尋優(yōu)過(guò)程中所需要的時(shí)間和模型的自適應(yīng)等原因,本研究所用的4種識(shí)別模型KNN、SVM、GBDT和LightGBM在試驗(yàn)過(guò)程中均未對(duì)參數(shù)進(jìn)行優(yōu)化,4種識(shí)別模型均選擇合理參數(shù)。從圖7可知:將3種特征進(jìn)行融合后,LightGBM分類器10次試驗(yàn)的平均正確率高于其他分類器,由于SVM分類模型對(duì)于小樣本數(shù)據(jù)的識(shí)別效果比較好,故通過(guò)網(wǎng)格尋優(yōu)算法對(duì)SVM模型進(jìn)行參數(shù)尋優(yōu),10次隨機(jī)試驗(yàn)平均正確率為88.20%,正確率仍然低于未尋優(yōu)的LightGBM模型,體現(xiàn)了LightGBM識(shí)別模型良好的性能。為驗(yàn)證特征融合的有效性,基于顏色、形狀和紋理單一特征分別構(gòu)建KNN、SVM、GBDT和LightGBM識(shí)別模型,統(tǒng)計(jì)不同分類器和不同特征的金線蓮品系識(shí)別率,隨機(jī)進(jìn)行10次試驗(yàn),取平均值,結(jié)果如表1所示。

由表1可以看出,在金線蓮品系識(shí)別中,葉片顏色特征對(duì)識(shí)別率貢獻(xiàn)最大,將所有特征進(jìn)行融合后識(shí)別率有很大的提升,識(shí)別率高于任意單一特征向量,證明了對(duì)特征進(jìn)行融合的有效性。除基于單一顏色特征的LightGBM識(shí)別模型的識(shí)別率略低于GBDT識(shí)別模型外,基于單一形狀特征、單一紋理特征和融合特征的LightGBM識(shí)別模型的識(shí)別率均高于GBDT、KNN和SVM識(shí)別模型,充分體現(xiàn)了LightGBM識(shí)別模型性能的優(yōu)越性。

此外,本研究使用常見(jiàn)識(shí)別性能度量指標(biāo)精確率、召回率和綜合評(píng)價(jià)指標(biāo)來(lái)評(píng)價(jià)識(shí)別模型,LightGBM對(duì)各個(gè)金線蓮品系的識(shí)別性能度量指標(biāo)如表2所示。

從表2數(shù)據(jù)可得,除紅霞由于與尖葉的葉片特征相似度太高,精確率只有80.77%以外,其他各個(gè)品系的精確率、召回率、綜合評(píng)價(jià)指標(biāo)均在85.00%以上,可見(jiàn)基于多特征融合和LightGBM的模型在分類評(píng)價(jià)指標(biāo)方面有較優(yōu)表現(xiàn)。

綜上可得,本研究提出的方法對(duì)金線蓮葉片特征的表述更加準(zhǔn)確,對(duì)金線蓮數(shù)據(jù)集的識(shí)別率達(dá)91.08%,取得了較好的識(shí)別效果。

3 結(jié)論

本研究從金線蓮葉片圖像的單一特征貢獻(xiàn)能力不足以及傳統(tǒng)分類器泛化能力不佳引起的金線蓮品系識(shí)別問(wèn)題出發(fā),研究基于機(jī)器視覺(jué)的金線蓮品系識(shí)別問(wèn)題,提出了基于多特征融合和LightGBM的金線蓮品系識(shí)別方法。對(duì)金線蓮葉片圖像進(jìn)行預(yù)處理后,分別從葉片顏色、形狀和紋理3個(gè)方面共提取116維特征,并對(duì)特征進(jìn)行融合,構(gòu)建了基于LightGBM的分類模型,對(duì)金線蓮進(jìn)行品系識(shí)別,并與傳統(tǒng)分類算法GBDT、KNN和SVM進(jìn)行比較。結(jié)果表明,基于多特征融合和LightGBM的金線蓮品系識(shí)別方法能夠有效提取金線蓮葉片特征,具有良好的魯棒性,能夠快速識(shí)別不同品系的金線蓮。但本研究依然具有局限性,研究所用金線蓮葉片圖像數(shù)據(jù)集均為實(shí)驗(yàn)室環(huán)境下采集得來(lái),葉片特征提取相對(duì)簡(jiǎn)單,如何處理復(fù)雜背景下的葉片圖像,在復(fù)雜環(huán)境下對(duì)植物葉片進(jìn)行識(shí)別,將是下一步研究的重點(diǎn)。

參考文獻(xiàn):

[1] 王 勇,陳 碩,盧端萍, 等.金線蓮化學(xué)成分的研究[J]. 中草藥, 2017(13):36-41.

[2] 何春年,王春蘭,郭順星,等. 福建金線蓮的化學(xué)成分研究Ⅱ[J]. 中國(guó)中藥雜志, 2005, 39(10): 581-582.

[3] 馬玉芳,鄭小香,衣偉萌,等. 金線蓮多糖對(duì)免疫抑制小鼠脾淋巴細(xì)胞體外增殖、 分泌NO及細(xì)胞因子的影響[J]. 天然產(chǎn)物研究與開(kāi)發(fā), 2018,30(1):21-26.

[4] 李 芹,周 文,劉 路,等. 金線蓮噴霧劑治療手足口病口腔皰疹臨床觀察[J]. 福建中醫(yī)藥, 2012, 43(3):9-10.

[5] 肖雪洋. 植物葉片圖像識(shí)別特征的研究和在線識(shí)別系統(tǒng)實(shí)現(xiàn)[D]. 合肥:中國(guó)科學(xué)技術(shù)大學(xué),2011.

[6] 蔡 超. 金線蓮的鑒別與應(yīng)用[J]. 中國(guó)中醫(yī)藥現(xiàn)代遠(yuǎn)程教育, 2016, 14(21):123-124, 127.

[7] 蔡文燕,肖華山,范秀珍. 金線蓮研究進(jìn)展(綜述)[J]. 亞熱帶植物科學(xué), 2003(3):69-73.

[8] 王海閣,許 文,張 勛,等. 林下栽培金線蓮的生藥鑒別[J]. 中藥材, 2020, 43(2):303-308.

[9] TAO O, LIN Z, ZHANG X B, et al. Research on identification model of chinese herbal medicine by texture feature parameter of transverse section image[J]. World Science and Technology-Modernization of Traditional Chinese Medicine, 2014(12):2558-2562.

[10]沈?qū)殗?guó),陳樹(shù)人,尹建軍,等. 基于顏色特征的棉田綠色雜草圖像識(shí)別方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2009,25(6):163-167.

[11]HERRERA P J, DORADO J, RIBEIRO . A novel approach for weed type classification based on shape descriptors and a fuzzy decision-making method[J]. Sensors, 2014(14):15304-15324.

[12]TURKOGLU M, HANBAY D. Leaf-based plant species recognition based on improved local binary pattern and extreme learning machine[J]. Physica A: Statistical Mechanics and its Applications, 2019, 527: 121297.

[13]PAL M , FOODY G M . Feature selection for classification of hyperspectral data by SVM[J]. IEEE Transactions on Geoence and Remote Sensing, 2010, 48(5): 2297-2307.

[14]ZHANG S C, LI X L, ZONG M,et al. Learning k for kNN classification[J]. ACM Transactions on Intelligent Systems and Technology, 2017, 8(8):1-19.

[15]KIM S Y , UPNEJA A . Predicting restaurant financial distress using decision tree and AdaBoosted decision tree models[J]. Economic Modelling, 2014, 36(1): 354-362.

[16]FAGERLAND M W , HOSMER D W , BOFIN A M . Multinomial goodness-of-fit tests for logistic regression models[J]. Statistics in Medicine, 2008, 27(21): 4238-4253.

[17]HAN J , ZHANG D , CHENG G , et al. Advanced deep-learning techniques for salient and category-specific object detection: a survey[J]. IEEE Signal Processing Magazine, 2018, 35(1):84-100.

[18]DYRMANN M, KARSTOFT H, MIDTIBY H S, et al. Plant species classification using deep convolutional neural network[J]. Biosystems Engineering,2016, 151:72-80 .

[19]鄧向武,齊 龍,馬 旭,等. 基于多特征融合和深度置信網(wǎng)絡(luò)的稻田苗期雜草識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2018, 34(14):173-180.

[20]KE G, MENG Q, FINLEY T, et al. Lightgbm: a highly efficient gradient boosting decision tree[C]//Ulrike von Luxburg, Isabelle Guyon. Proceedings of the 31st International Conference on Neural Information Processing SystemsDecember. San Diego,CA: Neural Information Processing Systems Foundation, 2017: 3146-3154.

[21]WANG D H, ZHANG Y, ZHAO Y. LightGBM: an effective miRNA classification method in breast cancer patients [C]// Association for Computing Machinery.Proceedings of the 2017 International Conference on Computational Biology and Bioinformatics. New York: Association for Computing Machinery, 2017: 7-11.

[22]ZHANG J, MUCS D, NORINDER U, et al. LightGBM: an effective and scalable algorithm for prediction of chemical toxicity-application to the Tox21 and mutagenicity data sets[J]. Journal of Chemical Information & Modeling, 2019, 59(10):4150-4158.

[23]POST F H, VROLIJK B, HAUSER H, et al. The state of the art in flow visualisation: feature extraction and tracking[J]. Computer Graphics Forum, 2010, 22(4):775-792.

[24]胡維煒,張 武,劉連忠,等. 利用圖像處理技術(shù)計(jì)算大豆葉片相對(duì)病斑面積[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2016,32(4):774-779.

[25]WANG X F, HUANG D S, DU J X, et al. Classification of plant leaf images with complicated background[J]. Applied Mathematics and Computation, 2008, 205(2): 916-926.

[26]HWANG W, WANG H T, KIM H, et al. Face recognition system using multiple face model of hybrid fourier feature under uncontrolled illumination variation[J]. IEEE Transactions on Image Processing, 2011, 20(4):1152-1165.

[27]HARALICK R M, SHANMUGAM K, DINSTEIN I H. Textural features for image classification[J]. Studies in Media and Communication, 1973, 3(6): 610-621.

[28]LIU L, FIEGUTH P, GUO Y, et al. Local binary features for texture classification: taxonomy and experimental study[J]. Pattern Recognition, 2017(62): 135-160.

[29]OJALA T, PIETIKINEN M, MENP T. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 971-987.

(責(zé)任編輯:陳海霞)

收稿日期:2020-06-02

基金項(xiàng)目:福建省科技廳重大產(chǎn)學(xué)研項(xiàng)目(2019Y4009);晉江市福大科教園區(qū)發(fā)展中心科研項(xiàng)目(2019-JJFDKY-48)

作者簡(jiǎn)介:陳舒迪(1997-),女,福建南平人,碩士研究生,主要從事機(jī)器學(xué)習(xí)與圖像處理研究。(E-mail)chshud@163.com

通訊作者:柴琴琴,(E-mail)qq.chai@fzu.edu.cn;林 羽,(E-mail)lyfjtcm@163.com

湖南省| 普宁市| 陕西省| 南陵县| 扶绥县| 泾阳县| 贵德县| 河南省| 伊吾县| 巴东县| 安平县| 大悟县| 双流县| 葵青区| 如东县| 封开县| 金华市| 台前县| 恩平市| 通渭县| 久治县| 庄浪县| 禄丰县| 金阳县| 南涧| 宜兰市| 蒙自县| 定西市| 禹城市| 婺源县| 达尔| 漯河市| 乳源| 奉新县| 开化县| 白水县| 嵊州市| 安陆市| 阿坝县| 岚皋县| 嘉义市|