項(xiàng)小東,翟蔚,黃言態(tài),劉薇
(浙江科技學(xué)院自動(dòng)化與電氣工程學(xué)院,杭州市,310023)
智慧農(nóng)業(yè)[1]運(yùn)用人工智能技術(shù),結(jié)合傳統(tǒng)機(jī)械和軟件,智能感知和控制農(nóng)業(yè)生產(chǎn),引領(lǐng)了一場(chǎng)農(nóng)業(yè)技術(shù)的革命。將不斷創(chuàng)新的現(xiàn)代化智能算法,應(yīng)用在現(xiàn)代農(nóng)業(yè)機(jī)械上[2-3]能夠更好的實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn),提升生產(chǎn)效率。影響農(nóng)業(yè)生產(chǎn)量的一個(gè)重要因素是農(nóng)作物病蟲害,農(nóng)作物病害具有種類多,傳播速度快的特點(diǎn)。因此,我們需要尋找一種高效率,低成本和準(zhǔn)確性高、實(shí)時(shí)性強(qiáng)的方法,來(lái)快速識(shí)別農(nóng)作物病蟲害。
CNN在圖像識(shí)別方面的良好表現(xiàn),常作為圖像特征提取器應(yīng)用在深度學(xué)習(xí)方法中。隨著深度學(xué)習(xí)技術(shù)不斷發(fā)展,基于CNN的深度學(xué)習(xí)方法也開始應(yīng)用在農(nóng)作物病蟲害的識(shí)別。深度學(xué)習(xí)技術(shù)能夠取代人工提取特征,閆建偉等[4]通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)深層次的果實(shí)特征進(jìn)行提取,將提取到的特征與低層次特征進(jìn)行多次融合,有效的提升了識(shí)別精度。蒲秀夫等[5]以符號(hào)函數(shù)和尺度因子α代替浮點(diǎn)型權(quán)值參數(shù),并將權(quán)值二值化,提高病蟲害的準(zhǔn)確識(shí)別度。Luna等[6]在AlexNet上遷移學(xué)習(xí),設(shè)計(jì)出能夠識(shí)別番茄疾病的診斷系統(tǒng)。Durmu等[7]訓(xùn)練深度學(xué)習(xí)模型SqueezeNet,應(yīng)用在田間實(shí)時(shí)識(shí)別番茄病蟲害的機(jī)器人。Darwish等[8]在VGG16和VGG19兩個(gè)預(yù)訓(xùn)練集成模型上,采用正交學(xué)習(xí)粒子群優(yōu)化方法尋最優(yōu)超參數(shù)和指數(shù)衰減的學(xué)習(xí)速率方法提高訓(xùn)練效率,用于植物病害診斷。Zhang等[9]通過(guò)對(duì)GoogLeNet增加Droupout層、ReLU函數(shù)和減少分類器的數(shù)量進(jìn)行優(yōu)化。改進(jìn)后的模型在玉米的9種病害中達(dá)到了98.9%的識(shí)別精度。為了增強(qiáng)在復(fù)雜環(huán)境下的玉米病害識(shí)別能力,Lü等[10]設(shè)計(jì)了一種基于AlexNet模型的DMS-AlexNet。DMS-AlexNet用擴(kuò)張卷積和多尺度卷積來(lái)增強(qiáng)網(wǎng)絡(luò)特征提取能力,在自然環(huán)境獲取的玉米圖像上,識(shí)別精度達(dá)到了98.62%。對(duì)于其他農(nóng)作物疾病,Ramcharan等[11]在InceptionV3上遷移學(xué)習(xí),實(shí)現(xiàn)了能在移動(dòng)設(shè)備上識(shí)別三種木薯疾病的深度學(xué)習(xí)算法。Lu等[12]設(shè)計(jì)出了一個(gè)能識(shí)別10種水稻疾病的深度學(xué)習(xí)模型,在10次交叉驗(yàn)證策略下精度遠(yuǎn)高于傳統(tǒng)機(jī)器學(xué)習(xí)方法。Lin等[13]將卷積層的卷積核以矩陣形式排列,提出了M-BCNN,用來(lái)識(shí)別細(xì)粒度的水稻疾病圖像。M-BCNN在細(xì)粒度圖像上的精度相比AlexNet和VGG得到了顯著提高。Liu等[14]基于AlexNet移除部分全連接層,加入池化層、Inception模塊和NAG算法,提出了一種能識(shí)別蘋果四種病蟲害疾病的網(wǎng)絡(luò)模型。黃亦其等[15]通過(guò)改進(jìn)的LeNet-5對(duì)無(wú)人機(jī)獲取到的紅樹林圖像進(jìn)行識(shí)別分類,將無(wú)人機(jī)技術(shù)和深度學(xué)習(xí)應(yīng)用在傳統(tǒng)農(nóng)業(yè)保護(hù)中。孫鵬等[16]將注意力機(jī)制應(yīng)用在大豆蚜蟲的檢測(cè)中,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比提高6%的準(zhǔn)確率。深度學(xué)習(xí)技術(shù)在農(nóng)業(yè)方面廣泛應(yīng)用,對(duì)于農(nóng)作物的識(shí)別和病蟲害檢測(cè)取得了較好的成果。但是對(duì)于復(fù)雜環(huán)境下獲取的農(nóng)業(yè)圖像,還存在精度不高和實(shí)時(shí)性不強(qiáng)的問(wèn)題。對(duì)于植物病害的細(xì)粒度區(qū)分,還存在區(qū)分不明顯的現(xiàn)象。因此需要提高神經(jīng)網(wǎng)絡(luò)的特征提取能力,來(lái)更好的識(shí)別植物病害,提高農(nóng)作物的產(chǎn)量。本文在以上分析的基礎(chǔ)上,對(duì)基于Xception識(shí)別病蟲害類別進(jìn)行研究,為智能化農(nóng)業(yè)診斷系統(tǒng)提供依據(jù)。
本文的數(shù)據(jù)集采用AIChallenger2018農(nóng)作物病害檢測(cè)數(shù)據(jù)集,以及PlantVillage數(shù)據(jù)集中的部分農(nóng)作物數(shù)據(jù)。其中AIChallenger2018有26 820張,PlantVillage數(shù)據(jù)集有6 834張。數(shù)據(jù)集總共有39 234張,其中訓(xùn)練數(shù)據(jù)集有33 654張,占總數(shù)的86%,測(cè)試集數(shù)據(jù)集有5 580 張,占總數(shù)的14%;數(shù)據(jù)集由10種不同植物的50類圖像組成,分別包括這10種健康植物和27種病害,其中對(duì)13種病害進(jìn)行了兩種程度的分類??紤]到農(nóng)業(yè)生產(chǎn)中的實(shí)際需求,對(duì)產(chǎn)量較大的農(nóng)作物進(jìn)行病害程度分類,更有利于農(nóng)作物的保護(hù)與培育。因此對(duì)蘋果黑星病、玉米灰斑病和玉米銹病等13種疾病進(jìn)行了程度分類,分成健康、一般和嚴(yán)重三個(gè)程度。如圖1所示為列舉玉米灰斑病的程度圖。
(a)嚴(yán)重
考慮到數(shù)據(jù)集在良好的環(huán)境下采集,與實(shí)際田間作業(yè)獲取的圖像存在差異性。為了提高網(wǎng)絡(luò)的泛化能力,增強(qiáng)網(wǎng)絡(luò)識(shí)別圖像的表現(xiàn),本文對(duì)數(shù)據(jù)集進(jìn)行了隨機(jī)田間化預(yù)處理。本文的預(yù)處理包括:以圖像中心為軸進(jìn)行(0,45°)隨機(jī)取角度旋轉(zhuǎn),來(lái)模擬田間抖動(dòng)獲取圖像帶來(lái)的誤差,以[0.9,1.1]為等比例縮放系數(shù)進(jìn)行隨機(jī)縮放,來(lái)平衡圖像因旋轉(zhuǎn)操作帶來(lái)的特征缺失問(wèn)題;將圖像進(jìn)行水平和垂直的隨機(jī)翻轉(zhuǎn),來(lái)模擬田間獲取圖像的真實(shí)性;將圖像進(jìn)行圖像增強(qiáng)和銳化操作,增加圖像的復(fù)雜性;圖像進(jìn)行標(biāo)準(zhǔn)歸一化操作,消除特征之間的差異性,便于網(wǎng)絡(luò)學(xué)習(xí)。最后將圖像分辨率統(tǒng)一為256像素×256像素,圖像類型為RGB。田間化隨機(jī)預(yù)處理的效果如圖2所示。
(d)垂直翻轉(zhuǎn)
具體流程如圖3所示。
圖3 系統(tǒng)流程圖Fig.3 Flowchart of system
本文提出了一個(gè)基于深度學(xué)習(xí)的植物病蟲害識(shí)別系統(tǒng),應(yīng)用于田間作物病害程度識(shí)別,提高作物的產(chǎn)量。該系統(tǒng)由訓(xùn)練模型的計(jì)算機(jī)和實(shí)際應(yīng)用的計(jì)算機(jī)或移動(dòng)電子設(shè)備組成。一方面,通過(guò)33 654張隨機(jī)田間化處理的數(shù)據(jù)信息和類別標(biāo)注信息訓(xùn)練模型,不斷迭代優(yōu)化模型參數(shù),并保存識(shí)別精度最高的Xception-CEMs參數(shù)模型。另一方面,輸入測(cè)試圖像,在最優(yōu)的模型參數(shù)上預(yù)測(cè),得到概率最高的分類結(jié)果。
本文基于Xception提出了一個(gè)識(shí)別植物病害能力更強(qiáng)、速度更快的Xception-CEMs,網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
圖4 Xception-CEMs網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.4 Network structure of Xception-CEMs
Xception-CEMs圖像經(jīng)過(guò)不同階段的卷積、下采樣等處理后的特征信息如圖5所示。Xception-CEMs由數(shù)個(gè)CEM堆疊的模塊和一個(gè)改進(jìn)的密集連接模塊組成。不同于Xception的深度可分離卷積,通過(guò)帶有通道權(quán)重的多尺度深度卷積和1×1組卷積的形式組合,提出了一個(gè)通道擴(kuò)展模塊。該模塊不僅保證了圖像空間和通道的獨(dú)立性,獲得更多的病害分布、病害形狀等信息,而且大大減少了模型參數(shù)量。圖5階段一中的三張圖體現(xiàn)了通道擴(kuò)張模塊的有效性,特征圖邊緣信息和病害分布較明顯。由于ResNnet[17-18]中提出對(duì)特征的復(fù)用,并且Densenet[19]中的密集連接方式更進(jìn)一步對(duì)特征進(jìn)行跨層復(fù)用,因此在深度可分離卷積中采用密集連接,并將改進(jìn)的密集連接模塊應(yīng)用于Xception-CEMs中。密集連接模塊的加入,得到病害的高級(jí)邊緣特征和病害程度的信息,有利于病害程度識(shí)別。圖5階段2中的圖體現(xiàn)了特征復(fù)用的有效性,高級(jí)邊緣信息和病害分布較明顯。此外,在提出Xception-CEMs的基礎(chǔ)上,還提出了一種先擴(kuò)張—保持—再擴(kuò)張—壓縮形式的通道擴(kuò)張新策略。新的通道擴(kuò)張策略,減少了MAC時(shí)間和降低網(wǎng)絡(luò)運(yùn)算成本。
圖5 Xception-CEMs各階段處理后植物病害結(jié)果Fig.5 Results of plant diseases after Xception-CEM streatment
一個(gè)CEM模塊由三部分組成而成,分別為:多尺度深度卷積、通道權(quán)重和組數(shù)為8的1×1的組卷積組成。鑒于GoogLeNet[20-22]提出了采用多尺度的卷積核進(jìn)行信息篩選的Inception結(jié)構(gòu)。MobileNet[23-25]和Xception[26]提出了對(duì)圖像通道進(jìn)行卷積操作的深度卷積。結(jié)合Inception結(jié)構(gòu)的多尺度卷積核和Xception的深度可分離卷積,我們引進(jìn)了由卷積核大小為3×3和5×5的兩個(gè)分支通過(guò)通道相加組合而成的多尺度深度卷積。多尺度深度卷積在空間上更好的適應(yīng)植物病害的信息分布,在通道上實(shí)現(xiàn)了通道信息的獨(dú)立性。在通道上單純將通道信息平等相加,容易在空間上造成特征冗余現(xiàn)象,從而影響模型的識(shí)別能力,造成病害程度分類和類別分類的錯(cuò)誤。因此本文考慮通過(guò)增加通道權(quán)重分配到多尺深度卷積,來(lái)提升網(wǎng)絡(luò)的性能??紤]到參數(shù)問(wèn)題,本文中5×5卷積核由兩個(gè)3×3堆疊代替。在減少了0.02 MB參數(shù)的同時(shí),實(shí)現(xiàn)了相同的視野。不同于Xception中的點(diǎn)卷積,本文通過(guò)用組數(shù)為8的1×1的組卷積來(lái)控制通道數(shù)。這里選用1×1的組卷積,是考慮到利用1×1組卷積的較小參數(shù)來(lái)平衡多分支卷積帶來(lái)的參數(shù),并且過(guò)多的通道獨(dú)立卷積相加得到的植物病害特征圖缺乏通道聯(lián)系性,所以以分組的形式可以增加局部通道的聯(lián)系性,提高植物病害識(shí)別準(zhǔn)確率。
圖6顯示了CEM的兩種組成形式,考慮到植物病害的淺特征主要體現(xiàn)在病害局部與邊緣的信息,因此選用圖6(a)中的CEM模塊,在提取更多病害特征的同時(shí)也不會(huì)造成特征冗余現(xiàn)象??紤]到植物病害的深特征主要體現(xiàn)在語(yǔ)義的抽象特征,因此選用圖6(b)中的CEM模塊,有利于模型的預(yù)測(cè)輸出。
(a)通道擴(kuò)張兩倍時(shí)CEM模塊
本文中,通過(guò)堆疊CEM模塊,提出了一種新穎的通道擴(kuò)張策略。不同于Xception的擴(kuò)張-保持策略,這種策略是讓通道先擴(kuò)張—保持—再擴(kuò)張—壓縮的形式進(jìn)行通道數(shù)變化。通道先擴(kuò)張,保證在空間上和通道上先獲取更多的病害特征信息。參考ShuffleNetV2[27],過(guò)多的組卷積會(huì)增加MAC時(shí)間。通道保持減少了MAC時(shí)間,來(lái)降低網(wǎng)絡(luò)運(yùn)算成本,從而提高植物病害識(shí)別速度。通道再一次擴(kuò)張,為了在相對(duì)較深的特征上提取更多的抽象特征,有利于模型的預(yù)測(cè)。最后通道壓縮,防止通道數(shù)增加過(guò)快而帶來(lái)參數(shù)過(guò)大問(wèn)題。本文提出的通道擴(kuò)張新策略相比原來(lái)的Xception,不僅模型參數(shù)量變小了,同時(shí)提升了網(wǎng)絡(luò)的識(shí)別性能,提高了病害識(shí)別的精度,降低了網(wǎng)絡(luò)復(fù)雜度,更快的識(shí)別病害。
本文通過(guò)對(duì)特征信息進(jìn)行特征復(fù)用的方法,代替了Xception中重復(fù)堆疊深度可分離卷積和殘差結(jié)構(gòu)的方法。提出了基于深度可分離卷積的密集連接模塊。該模塊在保持通道數(shù)不變的情況下,總共有4個(gè)卷積層,前三層采用的是深度可分離卷積,最后一層采用了1×1的卷積。深層網(wǎng)絡(luò)中提取得到的是高級(jí)的病害特征,采用特征復(fù)用的方式,使得模型更具有判別力用于病害分類。
為了驗(yàn)證網(wǎng)絡(luò)性能,將Xception-CEMs網(wǎng)絡(luò)應(yīng)用在39 234張數(shù)據(jù)集上進(jìn)行試驗(yàn),所有試驗(yàn)都采用了相同的參數(shù)配置。模型訓(xùn)練的處理器是Intel(R)Core(TM)i7-9700CPU@3.0GHZ,內(nèi)存是32 G,圖形卡是NVIDIAGTX2080Ti,視頻內(nèi)存是11 G,并且操作系統(tǒng)為win10。軟件系統(tǒng)使用pycharm2019.2,tensorflow-gpu2.0.0,keras-gpu2.2.4,OpenCV3.3.1。試驗(yàn)采用Keras框架,迭代次數(shù)為50次,批量大小設(shè)置為20,選用了Adam作為優(yōu)化器,學(xué)習(xí)率的初始值設(shè)為0.001,當(dāng)模型的精度在2個(gè)epoch下降時(shí),會(huì)以0.1為減小因子調(diào)整學(xué)習(xí)率。
為了在空間上獲得更多的特征信息和增加特征通道的獨(dú)立性,在方法中分析了多尺度深度卷積的加入對(duì)于網(wǎng)絡(luò)的精度提升的有效性。實(shí)驗(yàn)中,采用卷積核大小為3和5組合的多尺度深度可分離卷積來(lái)代替原模型中卷積核大小為3的深度可分離卷積的可行性卷積,對(duì)于精度的差異如表1所示。
為了驗(yàn)證多尺度深度可分離卷積的可行性,本文采取了控制變量,當(dāng)將多尺度深度可分離卷積部署在不同階段時(shí),剩余的卷積采用同原模型相同的卷積進(jìn)行試驗(yàn)進(jìn)行對(duì)比。
表2反映了將多尺度深度卷積放置在Xception網(wǎng)絡(luò)不同階段時(shí),網(wǎng)絡(luò)的準(zhǔn)確率都有提升。其中階段1為輸入流,階段2為中間流,階段3為輸出流。根據(jù)上表的結(jié)果可以分析出,多尺度深度卷積模塊的加入,總體上對(duì)網(wǎng)絡(luò)都有精度的提高效果。其中,在輸入流和輸出流同時(shí)部署效果最佳。由于在低層級(jí)和高層級(jí)對(duì)卷積層的優(yōu)化,可以加強(qiáng)特征提取,更好的保存特征。但是過(guò)多的多尺度深度卷積,會(huì)造成特征信息冗余現(xiàn)象。因此將多尺度深度卷積應(yīng)用在輸入流和輸出流,使分類的結(jié)果更加趨于真實(shí)結(jié)果。
表2 多尺度深度可分離卷積部署在網(wǎng)絡(luò)不同階段準(zhǔn)確率變化表Tab.2 Accuracy of multi-scale depthwise separable convolution deployed at different stages of the network
除了對(duì)網(wǎng)絡(luò)的精度評(píng)價(jià),計(jì)算量和參數(shù)量也是網(wǎng)絡(luò)的一個(gè)評(píng)價(jià)標(biāo)準(zhǔn),該模塊部署在網(wǎng)絡(luò)的不同部分的計(jì)算量和參數(shù)量如表3所示。
表3 多尺度深度可分離模塊在網(wǎng)絡(luò)不同部分應(yīng)用的計(jì)算量和參數(shù)量表Tab.3 MFLOPs and parameters of multi-scale depthwise separable convolution applied in different parts of the network
表3反映了將多尺度深度卷積加在不同位置時(shí),用計(jì)算量和參數(shù)量分別來(lái)衡量模型的復(fù)雜度和輕量化度。這里用M作為單位??梢詮纳媳淼慕Y(jié)果得到,該模塊應(yīng)用在網(wǎng)絡(luò)的輸入流、中間流和輸出流中,模型的復(fù)雜度過(guò)高和參數(shù)量過(guò)大。只在輸入流或在輸入流和輸出流中應(yīng)用該模塊,計(jì)算量和參數(shù)量與原模型差距不大。
從評(píng)價(jià)網(wǎng)絡(luò)的角度出發(fā),綜合考慮多尺度深度卷積的加入對(duì)模型的精度、復(fù)雜度和參數(shù)的影響。在精度、模型復(fù)雜度和參數(shù)量這三者獲取一個(gè)平衡點(diǎn),得出將模塊應(yīng)用在輸入流和輸出流兩個(gè)部分的結(jié)論。多尺度深度卷積可以在特征圖的低級(jí)特征中獲取更多的圖像實(shí)體特征,在特征圖的高級(jí)特征中獲得更多的信息概括實(shí)體圖像的屬性,結(jié)果更加接近真實(shí)。
通過(guò)多尺度深度卷積代替原網(wǎng)絡(luò)中的單一深度可分離卷積后,得到最優(yōu)的部署策略是將該模塊應(yīng)用在輸入流和輸出流部分。接著考慮到過(guò)多通道獨(dú)立卷積,使通道之間缺乏聯(lián)系性,從而影響網(wǎng)絡(luò)的性能。本文加入了分組卷積的策略來(lái)代替原網(wǎng)絡(luò)的點(diǎn)卷積,對(duì)組卷積的組數(shù),分別嘗試對(duì)一組、兩組、四組和八組的應(yīng)用。以下圖7是多尺度深度卷積和分組策略應(yīng)用的精度和損失值變化圖。圖中的標(biāo)注表示的是不同組數(shù)的組卷積與多尺度可分離卷積組合和原模型。從精度角度,組卷積和多尺度深度卷積組合后,網(wǎng)絡(luò)整體的精度都提高了。當(dāng)epoch為50的情況下,其中組數(shù)為2和8這兩個(gè)組別,相比原網(wǎng)絡(luò)精度提升較明顯,分別提升了8.4%和8.2%。從擬合速度來(lái)看,組數(shù)2和8在epoch為10左右,曲線就開始趨于平緩,表示網(wǎng)絡(luò)擬合速度較快。從損失值的角度,當(dāng)epoch為50情況下,組數(shù)2和8的損失值較原網(wǎng)絡(luò)也有明顯的下降。其中組數(shù)為2下降了0.233,組數(shù)為8下降了0.215。
(a)不同組數(shù)與原網(wǎng)絡(luò)精度對(duì)比圖
有了精度和損失值的指標(biāo),網(wǎng)絡(luò)的參數(shù)量和模型計(jì)算量依然是本文的重要評(píng)價(jià)指標(biāo)。表4反應(yīng)了多尺度深度卷積與組卷積結(jié)合的參數(shù)量和計(jì)算量。從參數(shù)量考慮,當(dāng)組數(shù)為2、4和8,都有參數(shù)量的降低的趨勢(shì)。當(dāng)組數(shù)為8時(shí),模型有最小的參數(shù)量為19.5 M。在計(jì)算量方面,分組為2、4和8的時(shí)候,都有接近的模型復(fù)雜度,與原模型對(duì)比,復(fù)雜度都減小。其中組數(shù)為8的模型復(fù)雜度最小。因此能證明,分組的策略有利于輕量化模型。
表4 多尺度深度卷積和組卷積的參數(shù)量和計(jì)算量表Tab.4 Parameters and FLOPs of multi-scale depthwise convolution and group convolution
在分組策略的融合下,不僅要考慮模型的計(jì)算量和參數(shù)量,還需要考慮模型的精度和損失值。綜合上述指標(biāo)考慮,CEM模塊中選擇了組數(shù)為8的組卷積。
在多尺度深度卷積和組卷積組合的基礎(chǔ)上,根據(jù)特征通道的重要程度,還需要在通道上加上權(quán)重來(lái)增強(qiáng)重要的通道信息,減弱次重要或者無(wú)關(guān)信息。表5反映了兩種不同的得到通道權(quán)重方法,分別應(yīng)用在多尺度深度卷積與組數(shù)為2和8的1×1組卷積上。
表5 采取兩種不同通道權(quán)重的結(jié)果表Tab.5 Results of two different channel weight
第一種方法是通過(guò)并行全局平局池化→全連接→全連接和全局最大池化→全連接→全連接這兩個(gè)分支然后相加得到的通道權(quán)重策略。考慮到全連接層的參數(shù)量較大和全局最大池化只是通過(guò)選擇最大值來(lái)衡量通道的信息,會(huì)使次重要信息丟失。第二種方法是通過(guò)全局平均池化→點(diǎn)卷積→點(diǎn)卷積得到通道權(quán)重。實(shí)驗(yàn)證明,在多尺度深度卷積與組數(shù)為8的1×1組卷積組合上,搭配第一種方法得到的通道權(quán)重,是網(wǎng)絡(luò)的最佳結(jié)構(gòu)方案。
通過(guò)上述的三個(gè)試驗(yàn),最終得到了本文提出的CEM模塊。試驗(yàn)證明,把CEM模塊應(yīng)用在網(wǎng)絡(luò)的輸入流和輸出流效果最佳,通過(guò)對(duì)特征圖低級(jí)特征和高級(jí)特征的處理,得到在精度、模型復(fù)雜度和參數(shù)量上更優(yōu)的網(wǎng)絡(luò)。
本文通過(guò)準(zhǔn)確率、精確率、召回率和F1值對(duì)模型進(jìn)行評(píng)價(jià)。其中精確率表示真實(shí)樣本實(shí)例占模型預(yù)測(cè)正樣本的比例,其計(jì)算公式如式(1)。
(1)
召回率表示真實(shí)樣本占所有樣本的比例,其計(jì)算公式如式(2)。
(2)
式中:TP——真陽(yáng);
TN——假陽(yáng);
FP——真陰;
FN——假陰。
F1值表示精確率與召回率的平衡值,其式如式(3)所示。
(3)
該網(wǎng)絡(luò)在33 654張數(shù)據(jù)集上訓(xùn)練,達(dá)到91.9%的準(zhǔn)確率,在5 580張上測(cè)試,可以達(dá)到89.9%的準(zhǔn)確率,Xception-CEMs的參數(shù)量是14.05 M,計(jì)算量是29.33 M。在10種不同植物的50類圖像組成的分別包括10種健康植物和27種病害,其中對(duì)13種病害進(jìn)行了程度分類的數(shù)據(jù)集上,達(dá)到了88.7%的精確度,82.45%的召回率和85.33%的F1值。關(guān)于Xception-CEMs各個(gè)指標(biāo)的具體數(shù)值如表6所示。
表6 Xception-CEMs性能表Tab.6 Performance of the Xception-CEMs
在相同實(shí)驗(yàn)設(shè)備的條件下,與其他經(jīng)典神經(jīng)網(wǎng)絡(luò)模型對(duì)比,能夠更好的體現(xiàn)本研究中優(yōu)化策略的優(yōu)越性。表7是本研究中優(yōu)化的網(wǎng)絡(luò)與其他的典型網(wǎng)絡(luò)的訓(xùn)練后的模型在精度和損失值上的對(duì)比。
表7 優(yōu)化模型與典型模型結(jié)果的對(duì)比表Tab.7 Comparison of results between optimized model and typical models
由表8可以看出,經(jīng)過(guò)本研究?jī)?yōu)化后的Xception-CEMs模型,在植物病蟲害識(shí)別領(lǐng)域上有更好的優(yōu)勢(shì)。在經(jīng)過(guò)同等配置的訓(xùn)練后,相比Resnet、Xception這些經(jīng)典網(wǎng)絡(luò),Xception-CEMs有更高的訓(xùn)練和測(cè)試精度和更低的損失值。Xception-CEMs在參數(shù)量和模型復(fù)雜度方面也有著顯著的優(yōu)勢(shì),在保證模型精度的條件下,參數(shù)量明顯下降,模型復(fù)雜度明顯下降。該結(jié)果證實(shí)了,將Xception-CEMs模型應(yīng)用在病蟲害圖像識(shí)別上的可行性。
將Xception-CEMs應(yīng)用在10種不同植物的50類圖像組成的分別包括10種健康植物和27種病害,其中對(duì)13種病害進(jìn)行了程度分類的數(shù)據(jù)集上,分析了每一類的精度結(jié)果,結(jié)果如圖7表示。模型在優(yōu)化之后,在50個(gè)類別中,有45個(gè)類別都有更高的精度。其中有5個(gè)類別的精度有所降低,分析原因可能為一些植物病害的一般、嚴(yán)重程度,圖像特征區(qū)別很小。對(duì)于這些數(shù)據(jù)的標(biāo)定都有困難,因此很難被區(qū)分開來(lái)。
圖7 Xception-CEMs與Xception每一類的精度Fig.7 Accuracy of Xception-CEMs and Xceptionon each disease
本文還運(yùn)用了混淆矩陣,來(lái)可視化類別的預(yù)測(cè)結(jié)果和實(shí)際結(jié)果。我們對(duì)典型的蘋果、玉米、葡萄和番茄這四個(gè)農(nóng)作物大類做了混淆矩陣的分析。關(guān)于這四類農(nóng)作物的混淆矩陣如圖8~圖11所示。
圖8 蘋果的混淆矩陣Fig.8 Confusion matrix of apple
圖9 玉米的混淆矩陣Fig.9 Confusion matrix of corn
圖10 葡萄的混淆矩陣Fig.10 Confusion matrix of grape
圖11 番茄的混淆矩陣Fig.11 Confusion matrix of tomato
主對(duì)角線上的顏色越深,代表模型在該類別上的識(shí)別精度越高。其中X表示為預(yù)測(cè)的類別,Y軸表示為真實(shí)的類別。對(duì)角線上的數(shù)據(jù)代表正確的分類,從圖中可以看出,預(yù)測(cè)分類的最大值都在對(duì)角線,驗(yàn)證了本文算法的可行性,具有較好的植物病蟲害識(shí)別能力。
通過(guò)保存訓(xùn)練好的最佳模型,對(duì)上傳的預(yù)測(cè)圖片可以顯示不同類別和不同程度的預(yù)測(cè)結(jié)果。本文對(duì)5 580 張數(shù)據(jù)進(jìn)行了預(yù)測(cè),其中部分病害的測(cè)試結(jié)果表8所示。
比如蘋果黑腐病這類病害圖像,圖像總數(shù)為122張,其中88張是預(yù)測(cè)正確的數(shù)量,即表示為真陽(yáng)。34張表示預(yù)測(cè)錯(cuò)誤的圖像,即表示為假陰。根據(jù)式(2)中對(duì)召回率的定義,即預(yù)測(cè)正確的數(shù)量占總數(shù)的比例,得到蘋果黑腐病的召回率,來(lái)衡量測(cè)試結(jié)果的好壞,從而評(píng)價(jià)模型的性能。表8中其他數(shù)據(jù)均根據(jù)以上定量描述計(jì)算得到。根據(jù)測(cè)試結(jié)果,蘋果和玉米的召回率都比較高,表明基于Xception-CEMs神經(jīng)網(wǎng)絡(luò)的方法可以高效的完成植物病蟲識(shí)別工作。
表8 各類別的測(cè)試精度結(jié)果表Tab.8 Tes tprecision results in different categories
1)為了增強(qiáng)神經(jīng)網(wǎng)絡(luò)的特征提取能力可以及時(shí)分辨植物疾病,應(yīng)用于實(shí)際農(nóng)業(yè)生產(chǎn)需求。本文建立了一個(gè)由AIChallenger2018和PlantVillage組成的包含33 654張圖像的數(shù)據(jù)集。其中,AIChallenger2018有26 820張圖像,占數(shù)據(jù)集的80%;PlantVillage有6 834 張圖像,占數(shù)據(jù)集的20%。
2)本文提出了一個(gè)新穎的植物病蟲害識(shí)別方法,該方法基于深度學(xué)習(xí)和Xception-CEMs網(wǎng)絡(luò)框架。在Xception-CEMs中,本文了引入了CEM模塊、基于深度可分離卷積的密集連接模塊和一種新穎的擴(kuò)張-保持-再擴(kuò)張-壓縮的通道擴(kuò)張策略。Xception-CEMs對(duì)10種植物作為研究對(duì)象,數(shù)據(jù)集包括這10種健康植物和27種病害,并對(duì)其中的13種病害類別進(jìn)行程度分類,在所組成的50個(gè)類別中,達(dá)到了91.9%的準(zhǔn)確率,88.7%的準(zhǔn)確率,82.45%的召回率以及85.33%的F1得分。Xception-CEMs在植物病害識(shí)別上具有更大的優(yōu)勢(shì),相比Xception,準(zhǔn)確率提高了7.7%。Xception-CEMs在模型輕量化方面也得到了優(yōu)化,計(jì)算量為29.33 M,參數(shù)量為14.05 M,相比Xception分別降低了33.6%和33.1%。
3)本文提出的基于深度學(xué)習(xí)的植物病蟲害識(shí)別系統(tǒng),成為植物病害診斷系統(tǒng)的候選。農(nóng)業(yè)人員可以依據(jù)該方法的識(shí)別結(jié)果,對(duì)有疾病的植物及時(shí)采取措施,提高作物的產(chǎn)量。未來(lái),本文提出的算法還可以應(yīng)用于移動(dòng)端用來(lái)實(shí)時(shí)識(shí)別作物病害,提高檢測(cè)系統(tǒng)的便攜性。提出的Xception-CEMs可以作為特征提取器應(yīng)用在病害檢測(cè)等領(lǐng)域,為農(nóng)業(yè)領(lǐng)域做出貢獻(xiàn)。