国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機森林方法的小麥葉片病害識別研究

2018-02-09 01:44夏永泉黃海鵬孫靜茹
圖學學報 2018年1期
關(guān)鍵詞:紋理準確率病害

夏永泉,王 兵,支 俊,黃海鵬,孫靜茹

?

基于隨機森林方法的小麥葉片病害識別研究

夏永泉,王 兵,支 俊,黃海鵬,孫靜茹

(鄭州輕工業(yè)學院計算機與通信工程學院,河南 鄭州 450001)

為了提高小麥葉部病害的識別準確率,采用高斯混合模型結(jié)合EM算法對小麥葉片進行提取,獲得較大目標,使得分割準確率比直接分割病害區(qū)域有所提高,同時降低了分割難度。并結(jié)合HSV主顏色直方圖和通過Tamura紋理特征中的粗糙度、方向度和對比度作為特征進行篩選,采用隨機森林方法對小麥健康葉片、白粉病、葉枯病和葉銹病圖像進行了識別,整體識別準確率可達95%。通過實驗驗證,該方法是有效可行的,并優(yōu)于同等條件下的支持向量機(SVM)方法。

高斯混合模型;EM算法;HSV主顏色直方圖;紋理特征;支持向量機

小麥是我國主要的糧食作物之一,其種植面積廣泛,經(jīng)濟價值較高。病害問題是影響小麥產(chǎn)量的主要問題,但由于其病害種類繁多,如何快速對小麥病害進行有效地識別和預測有著重要的社會及現(xiàn)實意義。王美麗等[1]利用HSV顏色空間中的色相和飽和度,對病害的顏色特征值范圍加以分析,對小麥白粉病和銹病加以識別,再根據(jù)幾何形狀特征(周長、面積、矩形度等)對葉銹病、條銹病和桿銹病進行了識別,效果明確,實現(xiàn)較為簡單。余秀麗等[2]將小麥葉片病斑區(qū)域的紋理特征和形狀特征進行結(jié)合,利用支持向量機(support vector machine,SVM)算法實現(xiàn)了小麥葉部白粉病、條銹病和葉銹病的準確識別。鄧繼忠等[3]對病害孢子圖像的16個形狀和紋理特征,進行分析優(yōu)選,并對比了最小距離法、BP神經(jīng)網(wǎng)絡(luò)和SVM分類器實驗效果,最終SVM方法的識別率較高,為小麥腥黑穗病害識別提供了可行的方法。張飛云[4]使用K-means硬聚類算法對小麥葉部病害進行彩色圖像分割,得到彩色分割和二值化分割圖像,其利用多重分形分析提取二值圖像中的病害形狀特征參數(shù),分別提升小波變換和脈沖耦合神經(jīng)網(wǎng)絡(luò)完成從彩色圖像中提取顏色及紋理特征,將其進行結(jié)合,最后利用向量量化神經(jīng)網(wǎng)絡(luò)進行識別,效果明確。

上述文獻中多采用SVM的方法,但SVM的訓練與參數(shù)尋優(yōu)需要耗費大量的時間,而且存在過擬合、過程復雜等問題。神經(jīng)網(wǎng)絡(luò)方法也存在類似的問題。本文采用隨機森林方法與SVM方法進行對比,驗證了隨機森林方法的分類優(yōu)越性。使用主顏色描述符對圖像顏色特征進行表述,使得顏色特征表述更加緊湊、準確,降低了運算復雜度,然后與Tamura紋理特征進行結(jié)合,使用隨機森林方法對3種小麥病害和健康葉片進行分析識別,可達到較高的識別準確率,為小麥葉片常見病害識別和診斷提供了較好的參考價值。

1 圖像采集和處理

為了模擬小麥病害發(fā)病的真實環(huán)境,圖像的采集在開放大田自然光照情況下進行,分別采集表面潔凈無泥土的小麥健康葉片、白粉病、葉枯病和葉銹病圖片。眾所周知,開放大田環(huán)境、自然光照下的小麥葉片背景異常復雜,需進行必要的簡化背景處理,將采集到的小麥葉片置于背景簡單且與葉片目標具有明顯差異的環(huán)境下,如在實驗室或室外瀝青地面等環(huán)境下,對小麥葉片圖片進行采集。為了保證采集樣本的質(zhì)量,需將小麥葉片固定并展開,可保證采集完整的葉部病害區(qū)域。為了提升分類的準確性,采集的樣本均為病害初期的單一病種小麥葉片,預防意義較大;當多種病害同時發(fā)生時,分類難度增加,預防的意義也隨之降低。

目前,對于小麥葉片目標的提取未有統(tǒng)一的特定方法,其效果也因目標的不同而不確定,閾值等經(jīng)典方法雖然能夠快速分割,但分割精度不能滿足實驗要求。而且由于識別精度很大程度上會受分割精度的影響,故分割精度十分重要。本文采用高斯混合模型結(jié)合EM算法[5]進行實驗,可以較好地滿足實驗要求,并較準確地提取小麥葉片目標。采用對圖像像素數(shù)據(jù)進行無監(jiān)督聚類的分割算法,即根據(jù)最大似然估計方法計算數(shù)據(jù)像素的高斯混合模型的先驗概率,然后通過概率比較將每個像素進行相應的分類,實現(xiàn)聚類。通過EM算法的E-step和M-step進行不斷迭代,其迭代次數(shù)越多,結(jié)果越準確,本文設(shè)定當誤差小于0.1時停止迭代,完成分割,提取目標葉片。由于葉片目標與病害區(qū)域多為黃色和綠色,利用顏色閾值法來保持綠色和黃色,可以彌補邊界的提取缺陷,使其更加符合實驗要求,并提高了分割的準確性,其分割難度一般低于直接分割葉片病害區(qū)域,且易于實現(xiàn)。在分割之前大部分的病害圖像需經(jīng)人工進行裁剪等操作,以便獲得較簡單的子圖像再進行分割,這樣并不利于分割的自動化,而本文提取方法減少了人工干預,提取效果也可滿足實驗要求。提取效果如圖1所示。

圖1 小麥病害葉片提取結(jié)果

2 特征提取

為了辨別不同的小麥葉片病害種類,需要選取合適的特征對不同病害進行較為準確地描述。如果特征選取不當,會造成分類準確率低或計算時間過長、效率過低的情況出現(xiàn)。因此合適的特征選取對于小麥葉片病害的分類十分重要。特征提取是一種針對興趣區(qū)域表示為緊湊特征向量的降維方法。本文主要選取顏色和紋理特征相結(jié)合的方法進行篩選,這是因為病害種類的不同伴隨有顏色的差異,而選取的3種小麥病害用紋理特征可以較為準確地捕捉病害的高級視覺特征[6]。在完成小麥葉片目標提取的基礎(chǔ)上可進行顏色與紋理特征的提取。

2.1 顏色特征

經(jīng)過小麥葉片提取后,已將背景中的簡單、無關(guān)顏色進行了濾除,若使用傳統(tǒng)的顏色直方圖或色彩矩進行描述會使得計算復雜度變大,故此引用了HSV顏色空間下主顏色描述符[7]對葉片顏色特征進行描述。基于此采用更加緊湊的主顏色描述方法會顯得更加準確,也可以使實驗結(jié)果更加精準。

對每個分割區(qū)域執(zhí)行顏色聚類以獲得其代表顏色,由于背景在目標提取的基礎(chǔ)上變?yōu)榱撕谏?,在更加緊湊的前提下,少量的顏色足以表示圖像整個區(qū)域中的顏色信息,即稱為主顏色描述符。主顏色描述符由代表性顏色及其在給定區(qū)域中的相對分布組成。主顏色描述符和顏色直方圖之間的區(qū)別在于,前者從每幅圖像出發(fā)計算其代表性顏色,而不是在顏色空間中計算距離,從而允許特征表示更加精確且緊湊。

每個代表性顏色及其對應的百分比形成描述圖像區(qū)域中的顏色特性的一對屬性。需計算不同顏色所占的百分比。主顏色描述符定義為[7]

其中,是圖像區(qū)域的顏色總類別,可因區(qū)域而異;是一個三維的顏色向量,P是其所占比例,其和為1。

通過主顏色描述符可對顏色特征進行提取,同一種病害的不同葉片的HSV主顏色直方圖擁有相似分布特性,而不同種類病害的主顏色直方圖分布特性各異,其結(jié)果如圖2所示。

2.2 紋理特征

基于人類對紋理特征感知的心理學研究,TAMURA等[6]提出了紋理特征的表達,其度量對應與心理學角度紋理特征的6種屬性為:粗糙度、對比度、方向度、線性度、規(guī)整度和粗略度。前3種可很好地表達紋理的高級視覺特征,在本文中可很好地表達小麥葉片紋理特征。

(1) 粗糙度。反映紋理粒度的一個量,是最基本的紋理特征。當兩種紋理模式的紋理基元尺寸不同時,給人的感覺較大的更粗糙。數(shù)據(jù)集粗糙度如圖3所示。

(2) 方向度。指定紋理區(qū)域的全局特性,表達了紋理是如何沿特定方向集散或集中的。數(shù)據(jù)集的方向度如圖4所示。

其值可以對整幅圖像或特定區(qū)域中對比度進行全局度量。數(shù)據(jù)集對比度如圖5所示。

圖4 數(shù)據(jù)集的方向度(前140為訓練集,后120為測試集)

圖5 數(shù)據(jù)集的對比度(前140為訓練集,后120為測試集)

3 隨機森林算法

隨機森林算法是BREIMAN[8]于2001年提出的一種集成機器學習算法。隨機森林分類器由一些列相互獨立的樹狀分類器(即決策樹)構(gòu)成。決策樹預測從決策點開始,不斷對分類的屬性測試,根據(jù)屬性值選擇輸出分支,到達結(jié)果節(jié)點,實現(xiàn)分類。類似于多個專家舉手表決的決策過程就是隨機森林的核心思想。

隨機森林法是以決策樹為舉出預測器的組合分類模型。決策樹模型表示為{(,),=1,2,…,}。其中代表輸入向量;{}是獨立同分布的隨機向量,用于控制決策樹的生長。隨機森林利用bootstrap從原始訓練集抽取個樣本,并同時建立個決策樹模型,從而形成分類模型序列{1(,1),2(,2)…h(,)}。在給定自變量的情況下,每個決策樹會得到一個預測結(jié)果。對于分類問題,隨機森林的預測結(jié)果取決于各個決策樹結(jié)果的簡單多數(shù)投票。其公式為[9]

其中,()為隨機森林分類模型;為分類的標簽;()為示性函數(shù)。

隨機森林解決了決策樹創(chuàng)建不穩(wěn)定、過擬合等問題,在分類精度上比彈珠的決策樹有明顯的提高。此外,隨機森林對比其他主流分類算法具有分類速度快和能夠處理高維數(shù)據(jù)等特點,而且具有對噪聲和孤立點不敏感,不存在過擬合問題[10]。

4 實驗與分析

實驗選取開放環(huán)境、自然光照下的小麥健康及病害圖片樣本260個,其中健康葉片、白粉病、葉枯病和葉銹病每類65個;將140個樣本作為訓練樣本(每類35個),其余120個作為測試樣本(每類30個),均有對應的正確標簽。為了提高分類的準確率,全部樣本都進行了歸一化處理,均在[0,1]范圍內(nèi)。用訓練集對隨機森林進行訓練得到分類模型,再用得到的模型對測試集進行類別標簽預測,并在matlab2016仿真軟件下進行仿真實驗。

分類樹數(shù)目是隨機森林方法的一個重要參數(shù)。一般而言,隨著分類樹數(shù)目增多,正確識別率會升高,錯誤識別率會降低直至收斂,但預測花費時間增多。對于文中訓練圖像,通過實驗發(fā)現(xiàn)以50棵分類樹數(shù)目進行識別,其正確識別率比較高。當分類樹數(shù)目大于50時,雖然對正確識別率和錯誤識別率都有一定的影響,但差別不大。其正確識別率和最優(yōu)參數(shù)(懲罰因子=2.8284核參數(shù)=2.8284)下使用徑向基核函數(shù)的SVM方法[11]的預測結(jié)果如圖6所示。

在不使用參數(shù)尋優(yōu)的情況下,SVM方法的預測準確率僅為40.5%,由于其準確率太低就不計入分類結(jié)果準確率當中,僅比較這兩類的測試集分類識別結(jié)果,見表1。

表1 分類識別結(jié)果

通過表1可以發(fā)現(xiàn),隨機森林方法對于健康葉片可以進行準確地識別(100%),是因為其具有明顯的顏色特征;而錯分主要是受自然光照條件下光照和陰影對于顏色特征的影響,將葉枯病和葉銹病錯分為白粉病。SVM方法對葉枯病具有良好的分類準確率(100%),而其他3類會錯分為葉枯病,識別率不高,其原因為:①葉枯病和葉銹病由于光照使得顏色相近,以及發(fā)病部位幾近相同使得分類易產(chǎn)生錯誤;②在過渡曝光的情況下會將葉銹病錯分為白粉?。虎劢】等~片與葉枯病紋理差異較小,受光照等影響較大,易出現(xiàn)健康葉片和葉枯病的錯分,這些原因大大降低了其整體分類的準確率。

隨機森林方法的整體正確分類結(jié)果可以達到95%,優(yōu)于參數(shù)尋優(yōu)情況下使用徑向基核函數(shù)的SVM方法,為小麥同一部位發(fā)病診斷提供了有效手段。目的是在小麥發(fā)病前期快速判斷出小麥病害種類,防止病害擴散。

5 結(jié) 論

對自然光照條件下的小麥葉片進行背景簡化處理,并結(jié)合顏色特征和紋理特征對小麥葉片常見病害進行了有效地識別。經(jīng)過測試集測試結(jié)果驗證,對于小麥常見3種病害的白粉病、葉枯病和葉銹病以及健康葉片,在樣本數(shù)目不變的情況下,整體120次實驗有114次準確識別,其識別準確率大致是(0-1)分布的參數(shù),通過計算其置信度為95%的近似置信區(qū)間為(0.895, 0.976),結(jié)果較為可靠。3種常見病害的識別準確率均在90%以上,基本可以達到實用化水平。對小麥葉片病害的快速識別診斷可以提供一些參考,避免病害的擴散,降低經(jīng)濟作物產(chǎn)量的損失,對農(nóng)業(yè)現(xiàn)代化和人力成本的節(jié)省都有較大地提升。

[1] 王美麗, 牛曉靜, 張宏鳴, 等. 小麥葉部常見病害特征提取及識別技術(shù)研究[J]. 計算機工程與應用, 2014, 50(7): 154-157.

[2] 余秀麗, 徐超, 王丹丹, 等. 基于SVM的小麥葉部病害識別方法研究[J]. 農(nóng)機化研究, 2014, 11(36): 151-159.

[3] 鄧繼忠, 李敏, 袁之報, 等. 基于圖像識別的小麥腥黑穗病害特征提取與分類[J]. 農(nóng)業(yè)工程學報, 2012, 28(3): 172-176.

[4] 張飛云. 基于提升小波和學習向量量化神經(jīng)網(wǎng)絡(luò)的小麥病害圖像識別[J]. 江蘇農(nóng)業(yè)科學, 2013, 41(5): 103-106.

[5] 黃韶杰, 劉建功. 基于高斯混合聚類的煤巖識別技術(shù)研究[J]. 煤炭學報, 2015, 40(S2): 576-582.

[6] TAMURA H, MORI S, YAMAWAKI Y. Textural features corresponding to visual perception [J]. IEEE Transactions on Systems, Man and Cybernetics, 1978, 8(6): 460-473.

[7] DENG Y N, MANJUNATH B S, KENNEY C, et al. An efficient color representation for image retrieval [J]. IEEE Transactions on Image Processing, 2001, 1(10): 140-147.

[8] BREIMAN L. Random forests [J]. Machine Learning, 2001, 45(1): 5-32.

[9] 張經(jīng)緯, 貢亮, 黃亦翔, 等. 基于隨機森林算法的黃瓜種子腔圖像分割方法[J]. 農(nóng)機化研究, 2017, 37(10): 163-167.

[10] 顧海燕, 閆利, 李海濤, 等. 基于隨機森林的地理要素面向?qū)ο笞詣咏庾g方法[J]. 武漢 大學學報: 信息科學版, 2016, 41(2): 228-233.

[11] 劉銘, 黃凡玲, 傅彥銘, 等. 改進的人工蜂群優(yōu)化支持向量機算法在入侵檢測中的應用[J]. 計算機應用與軟件, 2017, 31(1): 230-235.

Identification of Wheat Leaf Disease Based on Random Forest Method

XIA Yongquan, WANG Bing, ZHI Jun, HUANG Haipeng, SUN Jingru

(College of Computer and Communication Engineering, Zhenzhou University of Light Industry, Zhengzhou Henan 450001, China)

In order to improve the recognition accuracy of wheat leaf disease, the Gaussian mixture model combined with EM algorithm was used to extract the wheat leaves and obtain the bigger target, which made the segmentation accuracy higher than the direct segmentation disease area. And the roughness, the degree of orientation and the contrast were selected by combining the HSV main color histogram and the Tamura texture feature. The images of wheat healthy leaves, powdery mildew, leaf blight and leaf rust were identified by random forest method and recognition accuracy is up to 95%. Experiments show that this method is effective and superior to the support vector machine (SVM) method under the same conditions.

Gaussian mixture model; EM algorithm; HSV main color histogram; texture feature; support vector machine

TP 391.41

10.11996/JG.j.2095-302X.2018010057

A

2095-302X(2018)01-0057-06

2017-04-10;

2017-05-20

國家自然科學基金項目(61302118,81501547)

夏永泉(1972-),男,遼寧綏中人,副教授,博士。主要研究方向為圖像處理、計算機視覺、模式識別與人工智能研究。E-mail:563241627@qq.com

猜你喜歡
紋理準確率病害
早春養(yǎng)羊需防六大病害
小麥常見三種病害咋防治
葡萄病害周年防治歷
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產(chǎn)品質(zhì)量檢驗分析
果樹休眠期咋防病害
基于BM3D的復雜紋理區(qū)域圖像去噪
使用紋理疊加添加藝術(shù)畫特效
高速公路車牌識別標識站準確率驗證法
荣昌县| 平泉县| 平乐县| 洛南县| 简阳市| 利川市| 阿拉善左旗| 滦南县| 宜宾市| 陈巴尔虎旗| 镇安县| 呼伦贝尔市| 库伦旗| 尤溪县| 永川市| 安泽县| 济阳县| 招远市| 仙居县| 夏津县| 防城港市| 岳池县| 西峡县| 五常市| 尚志市| 精河县| 麟游县| 平顶山市| 枣庄市| 吉林市| 德昌县| 昆山市| 六枝特区| 惠州市| 二连浩特市| 多伦县| 恩施市| 巧家县| 迁西县| 顺义区| 宣化县|