謝家興 陳斌瀚 彭家駿 何培華 景庭威 孫道宗 高鵬 王衛(wèi)星 鄭代德 李君
摘要:【目的】探索及時、準確識別危害荔枝葉片病蟲害的方法,做好防護和治理工作?!痉椒ā恳猿R娎笾θ~片病蟲害圖像為研究對象,針對荔枝病蟲害圖像的病斑分布區(qū)域廣、面積大小不一等特點,對ShuffleNet V2 模型進行相應(yīng)改進。首先,采集荔枝5 類葉片病蟲害制作數(shù)據(jù)集,采用數(shù)據(jù)增強操作構(gòu)建更加豐富的數(shù)據(jù)集;其次,在網(wǎng)絡(luò)特征提取模塊采用混合空洞卷積,避免傳統(tǒng)卷積在下采樣過程中造成圖像分辨率降低及信息丟失;然后,通過嵌入輕量型通道注意力模塊ECA(efficient channel attention),增進特征圖之間相互依賴關(guān)系。此外,刪減模型中不必要的層數(shù)和通道數(shù),降低模型的參數(shù)量及運算量?!窘Y(jié)果】研究所改進模型在5 類荔枝病蟲害圖像(毛氈病、炭疽病、煤煙病、葉癭蚊、藻斑?。┲羞_到了99.04%的識別準確率,比原網(wǎng)絡(luò)ShuffleNet V2 高出2.55%。相較于經(jīng)典網(wǎng)絡(luò)AlexNet、ResNet-18、DenseNet 和MobileNet V2 等,改進模型不僅有著更高的識別準確率,并且改進后模型參數(shù)量僅為0.059?106,為原模型的4.92%,浮點運算量僅為0.183?109?!窘Y(jié)論】研究結(jié)果適合部署在移動終端等嵌入式資源受限設(shè)備上,有助于實現(xiàn)對作物病蟲害實時、準確地識別。
關(guān)鍵詞:荔枝;葉斑癥狀;圖像識別;ShuffleNet V2 模型;模型參數(shù)
中圖分類號:S667.1 文獻標志碼:A 文章編號:1009-9980(2023)05-1024-12
中國荔枝種植面積、產(chǎn)量和產(chǎn)值均居世界首位,種植面積達47.57 萬hm?[1]。荔枝作為目前廣東最重要的經(jīng)濟作物之一,種植面積以27.3 萬hm?居全國第一,品種最為豐富,種質(zhì)資源在全國乃至國際上也獨具優(yōu)勢[2]。但是荔枝在種植過程易受到多種病蟲害的侵襲,因此,快速、準確地判斷荔枝病蟲害類型是植保精準施藥、降低損失的前提和基礎(chǔ)[3]。傳統(tǒng)病蟲害識別和檢測主要依靠人工根據(jù)經(jīng)驗現(xiàn)場觀察判定的方法,存在判定效率低、成本高、受主觀性影響等問題,無法滿足現(xiàn)代農(nóng)業(yè)大規(guī)模、實時檢測的需求[4-6]。
隨著計算機技術(shù)的發(fā)展,研究人員開始將機器學習和圖像處理的方法作為對作物病蟲害進行識別的一種技術(shù)手段。在作物病蟲害識別研究方面,Hlaing 等[7]通過Johnson SB 分布模型對番茄圖像的尺度不變特征轉(zhuǎn)換(scale invariant feature transform,SIFT)特征進行建模,獲得圖像的紋理統(tǒng)計信息,結(jié)合顏色特征信息,經(jīng)過支持向量機訓練,平均精度可達85.1%。黨滿意等[8]通過將馬鈴薯晚疫病葉片提取的顏色、紋理及形狀特征參數(shù)結(jié)合起來進行建模,識別率達90%,識別時間為9 s。卜俊怡等[9]通過提取誘蟲板圖像RGB顏色模型中的B分量和HSV顏色模型中V分量,利用最大類間方差法分割提取顏色、形狀及紋理特征,識別率達到90.40%。上述基于傳統(tǒng)圖像處理和機器學習方法的試驗,關(guān)鍵在于提取到豐富、準確的特征。然而,由于作物病害圖像紋理、顏色等特征非常復(fù)雜且不規(guī)則,傳統(tǒng)方法中提取的低層次特征無法應(yīng)用于大量、多類目標的識別[10]。
近年來,深度學習技術(shù)在不斷發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為深度學習的典型代表[11-12],相比于傳統(tǒng)圖像處理和機器學習的圖像分類算法,卷積神經(jīng)網(wǎng)絡(luò)通過卷積操作對輸入圖像進行特征提取,不僅能提取到更高層、表達能力更好的特征,還能實現(xiàn)在一個模型中完成端到端的特征提取、選擇及分類。卷積神經(jīng)網(wǎng)絡(luò)在作物葉片病蟲害識別相關(guān)領(lǐng)域已得到廣泛應(yīng)用。鮑文霞等[13]利用深度語義分割網(wǎng)絡(luò)U-Net 分割出麥穗圖像,并設(shè)計了多路卷積神經(jīng)網(wǎng)絡(luò)進行小麥赤霉病的識別,識別精度超過98%;Zhang 等[14]提出了全局池化擴張卷積網(wǎng)絡(luò)(global pooling dilated convolutionalneural network,GPDCNN)用于植物病害識別,對6 種常見黃瓜葉片病害的識別精度達94.65%;Liu 等[15]通過基于全局對比度的顯著性區(qū)域檢測算法計算用于定位害蟲的顯著性圖,提取目標的邊界框,通過卷積神經(jīng)網(wǎng)絡(luò)對水稻害蟲進行識別,平均精度達到95.1%。上述研究基于CNN的方法通過提取農(nóng)作物病害圖像的深層特征,在一定程度上提高了病害識別的準確率。由于荔枝葉片病蟲害的紋理形狀等相近,為了能夠更加準確地識別荔枝葉片病蟲害類型,需要在深層特征基礎(chǔ)上進一步利用注意力機制(attention mechanism)選擇關(guān)注對目標更為關(guān)鍵的信息[16]。深度學習中的注意力機制源于對人類視覺的研究,通過學習的方式自適應(yīng)對每張?zhí)卣鲌D的重要性進行選取,從眾多特征信息中選擇出對當前目標任務(wù)更為關(guān)鍵的信息[17]。例如,通道注意力模塊SE 中通過擠壓(squeeze)將每一張?zhí)卣鲌D擠壓成一個具有全局信息的實數(shù),接著經(jīng)過激勵(excitation)將此信息通過全連接層與激活函數(shù)放大對識別任務(wù)重要的特征圖權(quán)重,縮小不重要的特征圖權(quán)重[18]。坐標注意力模塊(coordinateattention, CA)通過在像素坐標系上的有效定位,將位置信息嵌入到通道注意力從而捕獲方向感知和位置敏感信息,最終達到更好的目標分類效果[19]。雙注意力機制(DA-Net)通過綜合通道和空間的特征信息對關(guān)鍵特征權(quán)重進行更新,將更多的注意力放在更易于進行區(qū)分的關(guān)鍵特征之上[20]。Junde 等[21]在輕量型神經(jīng)網(wǎng)絡(luò)模型MobileNet V2 中結(jié)合了通道注意力機(CAM),增強了對復(fù)雜背景害蟲的識別能力,平均準確率達92.79%;Yun 等[22]將改進的通道和空間注意力模塊嵌入到ResNet中,減少了通道之間的信息冗余,并將注意力集中在特征圖中信息最豐富的區(qū)域,平均準確率超過95.37%;王美華等[23]對CBAM注意力模塊進行改進并嵌入到ResNet、AlexNet 等網(wǎng)絡(luò)中,平均準確率均得到了0.5%的提升。
上述研究通過下采樣的方式逐步降低特征圖尺寸(典型尺寸7×7),雖然下采樣的方式能夠降低運算量,但同時也伴隨著分辨率的降低導(dǎo)致很多小特征信息的丟失,例如本研究中葉片較小面積的病斑特征。筆者通過對ShuffleNet V2 模型添加注意力模塊ECA自適應(yīng)對特征圖重要信息進行提??;采用混合空洞卷積獲得大感受野同時避免下采樣造成的小特征信息丟失;采用分組卷積等設(shè)計手段對荔枝5 種葉片病蟲害進行訓練及測試,結(jié)果顯示在提高了對荔枝葉片病蟲害識別率的同時進一步減少了網(wǎng)絡(luò)模型的參數(shù)量及浮點運算量,為小病斑識別及模型移植到可移動設(shè)備提供思路。
1 材料和方法
1.1 試驗數(shù)據(jù)獲取
圖像數(shù)據(jù)集在2020 年6—10 月采集于廣東省廣州市柯木塱農(nóng)業(yè)技術(shù)推廣中心的荔枝園,分別采集了荔枝葉片毛氈病、炭疽病、煤煙病、葉癭蚊、藻斑病5 種病蟲害圖片數(shù)據(jù)共1160 張,5 種病蟲害數(shù)據(jù)圖片如圖1 所示。圖中顯示了葉片病蟲害存在著病斑面積大小不一且分布區(qū)域廣的特點。
1.2 試驗數(shù)據(jù)擴充
由于卷積神經(jīng)網(wǎng)絡(luò)的訓練屬于監(jiān)督學習,需要大量的樣本進行訓練,為避免網(wǎng)絡(luò)過擬合并增強模型的魯棒性,因此使用Python 中的開源工具庫imgaug 對原始數(shù)據(jù)集進行數(shù)據(jù)增強。采用水平鏡像翻轉(zhuǎn)、垂直鏡像翻轉(zhuǎn)、隨機比例裁剪、添加高斯噪聲、改變亮度和對比度等隨機2~4 種方法疊加增強,增加數(shù)據(jù)的多樣性并將圖像尺寸歸一化之224×224 像素。增強后數(shù)據(jù)集共6523 張。隨機選取增強后數(shù)據(jù)集中的80%作為訓練集,其余20%作為測試集,擴充后的葉片病蟲害種類和數(shù)目如表1所示。
1.3 方法
試驗運行環(huán)境為Windows10(64 位)操作系統(tǒng),訓練基于PyTorch 深度學習框架,編程語言為Python3.8,GPU 為GeForce GTX 1080Ti,CPU 為Intel(R) Core(TM)i7-6800K,CUDA11.0 版本。試驗中選取所有圖像樣本的80%用于訓練,剩余20%作為測試集對模型效果進行驗證并輸出病蟲害類別的識別情況。超參數(shù)根據(jù)文獻[24]和本研究對比試驗情況進行設(shè)置,批處理大小(Batch-size)設(shè)置為32,模型的訓練輪次為100 epoch,模型訓練的優(yōu)化器選用動量梯度下降算法(gradient descent with momentum),學習率設(shè)置為0.01,動量取0.9,為避免模型發(fā)生過擬合,在全連接層采用了隨機失活(dropout)技術(shù),其參數(shù)值設(shè)置為0.5。在特征提取模塊采用混合空洞卷積,分別設(shè)置采用普通卷積、空洞卷積、混合空洞卷積3 種不同方式的對照組。通過增加網(wǎng)絡(luò)感受野方法,在保持圖像分辨率的同時能夠提供更多的全局信息。空洞卷積(dilated convolution)是在標準的卷積核中注入空洞(圖2-a),以此來增加模型的感受野尺寸,見公式(1)。相比原來的普通卷積操作,它以一定的步長跳過輸入值,從而覆蓋更大的輸入[25]。
s = (d -1) × (k -1) +k。 (1)
式中s 表示感受野的大小,d 表示空洞率,k 表示卷積核大小。
從公式(1)的定義可以看出,相比于標準卷積,空洞卷積可以在不增加參數(shù)的情況下獲取更大的感受野。如圖2-b 所示,3×3 的標準卷積的感受野為3×3,空洞率為2 的3×3 空洞卷積的感受野為5×5。
空洞卷積雖然能夠增加感受野,但是如果相同空洞率的卷積層堆疊會造成局部信息的丟失(圖2-c)。stage 模塊中的分支2 采用混合空洞卷積(hybriddilated convolution)[2(6] 圖2-d)。
通過嵌入輕量型通道注意力模塊ECA,并分別設(shè)置了4 個對照組,對模型中嵌入ECA 注意力模塊[27]、BAM注意力模塊、SE 注意力模塊、CBAM注意力模塊4 種不同注意力模塊進行了對比試驗。ECA的結(jié)構(gòu)如圖3 所示。
為了達到模型輕量化的目的,將ShuffleNetV2[28-29]結(jié)構(gòu)中的stage2、stage3、stage4 中模塊個數(shù)調(diào)整為3、6、3 個,通道數(shù)調(diào)整為16、24、48、96、192。模型結(jié)構(gòu)如圖4 所示。
設(shè)置7 個對照組,采用控制單一變量的方式,對混合空洞卷積、ECA注意力模塊、模型結(jié)構(gòu)調(diào)整3 個因素對模型的影響進行了消融試驗;最后將模型分別與AlexNet、ResNet-18、DenseNet 和MobileNet V24 種不同模型進行對比。
1.4 評價指標
為了客觀評價改進模型對荔枝病蟲害檢測分類的性能,本研究中采用5 種分類評價指標進行衡量。
1.4.1 查準率(Percision) 是分類器預(yù)測的正樣本中預(yù)測正確的比例,計算公式如下:
1.4.2 查全率(Recall) 是分類器預(yù)測的正樣本占所有正樣本的比例,計算公式如下:
1.4.3 綜合分類率(F1-score) 是查準率和查全率的調(diào)和平均數(shù),計算公式如下:
1.4.4 模型參數(shù)量(pares) 是模型結(jié)構(gòu)中包含的參數(shù)量,參數(shù)量越小模型運算所需的內(nèi)存空間就越小。
1.4.5 浮點運算量(FLOPs) 用來衡量模型的復(fù)雜度,F(xiàn)LOPs越小模型越容易移植至移動端。
2 結(jié)果與分析
2.1 空洞卷積對模型性能的影響
為了驗證空洞卷積對ShuffleNet V2 模型識別性能的影響,選擇ShuffleNet V2 進行荔枝病蟲害識別對比試驗,ShuffleNet V2_DC 特征提取模塊采用同一尺寸的空洞卷積設(shè)計,ShuffleNetV2_HDC特征提取模塊采用混合空洞卷積設(shè)計,ShuffleNetV2_HDC_ECA 在特征提取模塊結(jié)合了混合空洞卷積和ECA注意力模塊。3 種不同結(jié)構(gòu)模型的訓練結(jié)果如圖5 所示。
在相同的試驗條件下,特征提取模塊采用混合空洞卷積搭建的ShuffleNet V2_HDC模型在識別準確率上優(yōu)于原ShuffleNet V2 和ShuffleNet V2_DC模型,其中ShuffleNet V2_HDC 的最終識別率達到97.55%;而原ShuffleNet V2 模型的最終識別率只有95.53%,說明傳統(tǒng)下采樣造成了信息損失,識別效果低于采用空洞卷積設(shè)計的模型,同時高于ShuffleNetV2_DC模型的96.61%,說明在使用統(tǒng)一尺寸空洞卷積時產(chǎn)生的網(wǎng)格效應(yīng)造成了部分信息丟失,降低了模型識別效果。
2.2 注意力機制對模型性能的影響
為了驗證ECA注意力模塊相比于其他注意力模塊對模型的提升效果,在相同試驗條件下,使用BAM注意力模塊、SE 注意力模塊和CBAM注意力模塊替換本研究使用的ECA 模塊進行對比試驗。得到網(wǎng)絡(luò)模型識別結(jié)果和模型參數(shù)量及運算量,如表2 所示。
從表2 可以看出,與其他注意力模塊對比,本研究模型添加的ECA 注意力模塊參數(shù)量和運算量最少,性能表現(xiàn)最好。其中SE、BAM 以及CBAM3 種注意力模塊都存在壓縮通道降維操作,不利于學習通道之間的依賴關(guān)系,缺少相鄰?fù)ǖ乐g的信息交互,適當?shù)目缤ǖ佬畔⒔换タ梢燥@著降低模型復(fù)雜度的同時保持性能。研究采用的ECA注意力模塊在不壓縮維度的情況下進行跨通道交互學習,有助于模型學習荔枝病蟲害特征通道之間的信息交互和依賴關(guān)系,進一步提升了模型識別性能。
2.3 模型的消融實驗結(jié)果
為了探究使用HDC混合空洞卷積、ECA注意力模塊和結(jié)構(gòu)調(diào)整的改進方式對ShuffleNet V2 模型帶來的性能提升效果,進行消融試驗,結(jié)果如表3所示。
從表3 中可以看出,在ShuffleNet V2 中采用HDC混合空洞卷積代替?zhèn)鹘y(tǒng)卷積,模型的準確率提升了1.59 個百分點,F(xiàn)1 分數(shù)提升了1.56 個百分點,模型的參數(shù)量減少了1/3,模型的運算量增加較多。
將ECA 注意力模塊添加到ShuffleNet V2 的基本單元中,模型的準確率和F1 分數(shù)均得到了提升,分別為0.53 個百分點和0.77 個百分點,模型參數(shù)量和運算量變化較小。綜合HDC混合空洞卷積、ECA注意力模塊的改進,ShuffleNet V2 的性能得到了較大的提升,準確率和F1 分數(shù)分別提升了2.45 個百分點和2.46 個百分點,但是參數(shù)量增加了,運算量增加了。
通過對模型的結(jié)構(gòu)進行調(diào)整,顯著降低了模型的參數(shù)量和運算量。最終提出的ShuffleNetV2_HDC_ECA 輕量化模型的識別率為99.04%,F(xiàn)1分數(shù)為99.03%,較改進前的ShuffleNet V2 模型提高了2.55 個百分點和2.53 個百分點,而參數(shù)量和浮點運算量分別為0.059 G和0.183 M。
為了更直觀地展示本研究提出的ShuffleNetV2_HDC_ECA輕量化模型的有效性,使用類激活圖(CAM)對病蟲害進行可視化分析。CAM能夠以熱力圖的形式顯示模型在訓練過程中權(quán)重或重心在何處、如何轉(zhuǎn)移,分類模型是根據(jù)哪一部分的特征進行判斷[30]。圖6 給出了葉癭蚊圖像在不同模型下的類激活特征熱力圖及中間特征圖。在ShuffleNet V2模型中,下采樣的分辨率下降導(dǎo)致底層的病斑小特征點的信息丟失,提取到了葉片的邊緣但沒有提取到病斑特征;使用統(tǒng)一尺寸的空洞卷積設(shè)計的ShuffleNetV2_DC_ECA模型,對葉片病斑的特征提取存在不足,由于網(wǎng)格效應(yīng)造成的部分信息丟失,不能夠提取到所有的病斑信息;研究模型ShuffleNetV2_HDC_ECA,在增大感受視野的同時避免了下采樣和網(wǎng)格效應(yīng)造成的小特征信息丟失,準確提取到了病斑特征點。針對荔枝病蟲害的病斑分布范圍廣、面積大小不一的特點,本研究改進的特征提取模塊能夠更好地學習到全局信息,從而提升了模型分類性能。
2.4 與其他模型性能的對比
為進一步驗證所設(shè)計的模型識別荔枝病蟲害的效果,基于模型競爭力角度選擇AlexNet、ResNet-18、DenseNet 和MobileNetV2 作為對比模型進行對比試驗,在相同的試驗條件下進行對比(表4)。
從表4 可以看出,不同的網(wǎng)絡(luò)架構(gòu)對荔枝葉片病蟲害識別效果不同,ShuffleNet V2_HDC_ECA 的識別率達到了99.04%,參數(shù)量和運算量遠遠小于AlexNet、ResNet-18、DenseNet,因此改進的模型在識別準確率和參數(shù)量、運算量之間取得了良好的平衡,能夠應(yīng)用于移動端等算力有限設(shè)備對荔枝葉片病蟲害的識別。并且圖7 的混淆矩陣顯示,5 種病蟲害中炭疽病和煙煤病容易被誤識別,本研究通過保留更多底層微小病斑特征而能夠有著較低的誤識別率。
3 討論
研究在原ShuffleNet V2 模型結(jié)構(gòu)的基礎(chǔ)上,采用混合空洞卷積替換了模型中的常規(guī)卷積、嵌入ECA注意力模塊和縮減及刪除了不必要的網(wǎng)絡(luò)層數(shù)及通道數(shù)等方法并進行了對比試驗。
筆者在本研究中分析了普通卷積、空洞卷積和混合空洞卷積對網(wǎng)絡(luò)性能的影響,分別使用不同的下采樣方式設(shè)置對照組進行了驗證。發(fā)現(xiàn)在圖像分類的任務(wù)中,感興趣區(qū)域往往分布在圖像的多個區(qū)域,需要更多的全局信息及更高層的特征信息才能更好地識別目標。感受野越小,它對應(yīng)的原始圖像的范圍就越小,意味著它包含的特征更加趨近于局部和細節(jié),而用來處理復(fù)雜任務(wù)的高級語義信息很難被網(wǎng)絡(luò)捕捉;感受野越大,它對應(yīng)的原始圖像的范圍就越大,意味著它蘊含更多全局的、語義層次更高的特征。在實際環(huán)境中,荔枝葉片病蟲害存在著病斑面積大小不一、病蟲害分布范圍廣等問題。采用混合空洞卷積能夠提高特征信息的提取,避免了下采樣分辨率下降而導(dǎo)致的小特征信息丟失問題。本研究與孫俊等對網(wǎng)絡(luò)中不同尺寸的特征圖采取上采樣融合操作,構(gòu)建兼具網(wǎng)絡(luò)高、低層信息的新特征圖避免了特征信息丟失的作用一樣[31],但本研究采用混合空洞卷積在不需要增加卷積層的情況下便得到更大的感受野不會增加網(wǎng)絡(luò)的參數(shù)量及計算量。
注意力機制能夠更好地聚集網(wǎng)絡(luò)模型對待識別目標的特征信息,減少無關(guān)背景的影響。常用的注意力模塊SE模塊中,主要由全局平均池化層(golbal averagepooling,GAP)、全連接層(fully connected,F(xiàn)C)和Sigmoid 函數(shù)組成。兩個FC 層的設(shè)計是為了捕捉非線性的跨通道交互,其中包括采用降維操作來控制模型的復(fù)雜度,在SE模塊中進行降維操作對通道預(yù)測效果造成負面影響,捕獲所有通道之間的依賴是低效的。因此,本研究選用由SE 變化改進的ECA注意力模塊,該注意力模塊采用了一種不降維的局部跨通道交互策略和自適應(yīng)選擇一維卷積核大小的方法,通過一維卷積層匯總跨通道信息的方法獲取更加精確的注意力信息。該注意力模塊首先將輸入特征圖進行全局平均池化操作,接著進行卷積核大小為K的一維卷積進行卷積操作并經(jīng)過sigmoid 激活函數(shù)得到各個通道的權(quán)重,最后將各通道權(quán)重與對應(yīng)原始通道權(quán)重相乘得到輸出特征圖。由于荔枝葉片病蟲害的識別主要依據(jù)病斑的顏色、形狀和紋理,在傳統(tǒng)的網(wǎng)絡(luò)模型中加入ECA注意力模塊能夠增加網(wǎng)絡(luò)權(quán)重分配給病斑這一分類的關(guān)鍵信息量。
使用混合空洞卷積雖然避免了下采樣造成的信息損失,但這同時產(chǎn)生了巨大的運算量。在引入混合空洞卷積后保證了分辨率不變且能夠很好地提取到葉片病斑的特征,以及嵌入了ECA注意力模塊能夠更加有效地使用通道信息,圖像數(shù)據(jù)不需要更深的網(wǎng)絡(luò)層數(shù)和更多的通道數(shù)即可獲得最終的分類結(jié)果,可以進一步對網(wǎng)絡(luò)模型進行結(jié)構(gòu)調(diào)整減少模型的參數(shù)量及浮點計算量。在輕量型網(wǎng)絡(luò)的研究方面,平衡了準確率、模型參數(shù)量和浮點計算量這3 個指標,部署在移動終端等嵌入式資源受限設(shè)備上,是后續(xù)研究的內(nèi)容之一。
4 結(jié)論
針對荔枝葉片病蟲害的識別,以5 種不同荔枝病蟲害圖像作為研究對象,通過實地采集的1160 張圖像構(gòu)建了荔枝葉片病蟲害種類識別圖像數(shù)據(jù)集。在原ShuffleNet V2 模型結(jié)構(gòu)的基礎(chǔ)上,采用混合空洞卷積替換了模型中的常規(guī)卷積、嵌入ECA注意力模塊、縮減或刪除了不必要的網(wǎng)絡(luò)層數(shù)及通道數(shù)等方法并進行了對比試驗。
(1)相對于傳統(tǒng)分類模型僅依靠網(wǎng)絡(luò)高層信息進行分類,采用混合空洞卷積進行采樣避免了下采樣分辨率下降而導(dǎo)致的小特征信息丟失問題,表明本研究的方法能夠針對荔枝葉片病蟲害特點強化對病斑的特征提取,識別準確率達到了99.04%。
(2)通過與不同的注意力模塊進行對比試驗,采用ECA注意力模塊自適應(yīng)提取對識別目標重要的通道信息,在增加少量參數(shù)的情況下提升模型識別準確率。
(3)識別模型的試驗結(jié)果表明,在特征提取中保持高分辨率能夠獲得更好的分類效果,并且能夠在達到識別效果的前提下進一步刪減模型網(wǎng)絡(luò)層數(shù)及通道數(shù),有利于將卷積神經(jīng)網(wǎng)絡(luò)模型部署在移動終端等嵌入式資源受限設(shè)備上。
參考文獻References:
[1] 莊麗娟,邱澤慧. 2019 年中國荔枝產(chǎn)業(yè)發(fā)展特征與政策建
議[J]. 中國南方果樹,2021,50(4):184-188.
ZHUANG Lijuan,QIU Zehui. Development characteristics and
policy recommendations of Chinas lychee industry in 2019[J].
South China Fruits,2021,50(4):184-188.
[2] 向旭. 廣東荔枝產(chǎn)業(yè)發(fā)展瓶頸與產(chǎn)業(yè)技術(shù)研發(fā)進展[J]. 廣東
農(nóng)業(yè)科學,2020,47(12):32-41.
XIANG Xu. Bottleneck of litchi industry development and progress
of technology research and deveopment[J]. Guangdong Agricultural
Sciences,2020,47(12):32-41.
[3] 黃康泉. 荔枝主要病蟲害的危害癥狀及防治方法[J]. 現(xiàn)代園
藝,2021,44(22):40-41.
HUANG Kangquan. Symptoms and control methods of main
diseases and insect pests of litchi[J]. Contemporary Horticulture,
2021,44(22):40-41.
[4] 謝堂勝,劉德營,陳京,蔡俊. 白背飛虱智能識別技術(shù)研究[J].
南京農(nóng)業(yè)大學學報,2016,39(3):519-526.
XIE Tangsheng,LIU Deying,CHEN Jing,CAI Jun. Automatic
identification of Sogatella furcifera[J]. Journal of Nanjing Agricultural
University,2016,39(3):519-526.
[5] BARMAN U,CHOUDHURY R D,SAHU D,BARMAN G G.
Comparison of convolution neural networks for smartphone image
based real time classification of citrus leaf disease[J]. Computers
and Electronics in Agriculture,2020,177:105661.
[6] SINGH V,MISRA A K. Detection of plant leaf diseases using
image segmentation and soft computing techniques[J]. Information
Processing in Agriculture,2017,4(1):41-49.
[7] HLAING C S,MAUNG ZAW S M. Tomato plant diseases classification
using statistical texture feature and color feature[C]//
2018 IEEE/ACIS 17th International Conference on Computer
and Information Science (ICIS). IEEE,2018:439-444.
[8] 黨滿意,孟慶魁,谷芳,顧彪,胡耀華. 基于機器視覺的馬鈴薯
晚疫病快速識別[J]. 農(nóng)業(yè)工程學報,2020,36(2):193-200.
DANG Manyi,MENG Qingkui,GU Fang,GU Biao,HU Yaohua.
Rapid recognition of potato late blight based on machine vision[
J]. Transactions of the Chinese Society of Agricultural Engineering,
2020,36(2):193-200.
[9] 翟肇裕,曹益飛,徐煥良,袁培森,王浩云. 農(nóng)作物病蟲害識別
關(guān)鍵技術(shù)研究綜述[J]. 農(nóng)業(yè)機械學報,2021,52(7):1-18.
ZHAI Zhaoyu,CAO Yifei,XU Huanliang,YUAN Peisen,
WANG Haoyun. Review of key techniques for crop disease and
pest detection[J]. Transactions of the Chinese Society for Agricultural
Machinery,2021,52(7):1-18.
[10] 卜俊怡,孫國祥,王迎旭,魏天翔,汪小旵. 基于誘蟲板圖像的
溫室番茄作物害蟲識別與監(jiān)測方法[J]. 南京農(nóng)業(yè)大學學報,
2021,44(2):373-383.
BU Junyi,SUN Guoxiang,WANG Yingxu,WEI Tianxiang,
WANG Xiaochan. Identification and monitoring method of tomato
crop pests in greenhouse based on trapping board image[J].
Journal of Nanjing Agricultural University,2021,44(2):373-
383.
[11] LECUN Y,BENGIO Y,HINTON G. Deep learning[J]. Nature,
2015,521:436-444.
[12] LECUN Y,KAVUKCUOGLU K,F(xiàn)ARABET C. Convolutional
networks and applications in vision[C]//Proceedings of 2010
IEEE international symposium on circuits and systems. IEEE,
2010:253-256.
[13] 鮑文霞,孫慶,胡根生,黃林生,梁棟,趙健. 基于多路卷積神經(jīng)
網(wǎng)絡(luò)的大田小麥赤霉病圖像識別[J]. 農(nóng)業(yè)工程學報,2020,36
(11):174-181.
BAO Wenxia,SUN Qing,HU Gensheng,HUANG Linsheng,
LIANG Dong,ZHAO Jian. Image recognition of field wheat
scab based on multi-way convolutional neural network[J]. Transactions
of the Chinese Society of Agricultural Engineering,
2020,36(11):174-181.
[14] ZHANG S W,ZHANG S B,ZHANG C L,WANG X F,SHI Y.
Cucumber leaf disease identification with global pooling dilated
convolutional neural network[J]. Computers and Electronics in
Agriculture,2019,162:422-430.
[15] LIU Z Y,GAO J F,YANG G G,ZHANG H,HE Y. Localization
and classification of paddy field pests using a saliency map and
deep convolutional neural network[J]. Scientific Reports,2016,6
(1):1-12.
[16] VASWANI A,SHAZEER N,PARMAR N,USZKOREIT J,
JONES L,GOMEZ A N,KAISER L,POLOSUKHIN I. Attention
is all you need[C]. In Advances in Neural Information Processing
Systems,2017:6000-6010.
[17] 張宸嘉,朱磊,俞璐. 卷積神經(jīng)網(wǎng)絡(luò)中的注意力機制綜述[J].
計算機工程與應(yīng)用,2021,57(20):64-72.
ZHANG Chenjia,ZHU Lei,YU Lu. Review of attention mechanism
in convolutional neural networks[J]. Computer Engineering
and Applications,2021,57(20):64-72.
[18] HU J,SHEN L,SUN G,ALBANIE S,WU E H. Squeeze and excitation
networks[C]//Proceedings of the IEEE conference on computer
vision and pattern recognition. IEEE,2018:7132-7141.
[19] HUANG Z L,WANG X G,WEI Y C,HUANG L C,SHI H,
LIU WY,HUANG T S. CCNet:Criss-cross attention for semantic
segmentation[C]//Proceedings of the IEEE/CVF International
Conference on Computer Vision. IEEE,2019:603-612.
[20] FU J,LIU J,TIAN H J,LI Y,BAO Y J,F(xiàn)ANG Z W,LU H Q.
Dual attention network for scene segmentation[C]//Proceedings
of the IEEE/CVF conference on computer vision and pattern recognition.
IEEE,2020:3141-3149.
[21] CHEN J D,CHEN W R,ZEB A,ZHANG D F,NANEHKARAN
Y A. Crop pest recognition using attention-embedded
lightweight network under field conditions[J]. Applied Entomology
and Zoology,2021,56(4):427-442.
[22] ZHAO Y,CHEN J G,XU X,LEI J S,ZHOU W J. SEV-Net:residual
network embedded with attention mechanism for plant
disease severity detection[J]. Concurrency and Computation:
Practice and Experience,2021,33(10):e6161.1-e6161.18.
[23] 王美華,吳振鑫,周祖光. 基于注意力改進CBAM 的農(nóng)作物
病蟲害細粒度識別研究[J]. 農(nóng)業(yè)機械學報,2021,52(4):239-
247.
WANG Meihua,WU Zhenxin,ZHOU Zuguang. Fine- grained
identification research of crop pests and diseases based on improved
CBAM via attention[J]. Transactions of the Chinese Society
for Agricultural Machinery,2021,52(4):239-247.
[24] [MISHKIN D,NIKOLAY S,JIRI M. Systematic evaluation of
convolution neural network advances on the imagenet[J]. Computer
Vision and Image Understanding,2017,161:11-19.
[25] YU F,KOLTUN V,F(xiàn)UNKHOUSER T. Dilated residual networks[
C]//Proceedings of the IEEE conference on computer vision
and pattern recognition. IEEE,2017:636-644.
[26] WANG P Q,CHEN P F,YUAN Y,LIU D,HUANG Z H,HOU
X D,COTTRELL G. Understanding convolution for semantic
segmentation[C]//2018 IEEE winter conference on applications
of computer vision (WACV). IEEE,2018:1451-1460.
[27] WANG Q L,WU B G,ZHU P F,LI P H,ZUO W M,HU Q H.
ECA-Net:Efficient channel attention for deep convolutional neural
networks[C]//Proceedings of the 2020 IEEE/CVF Conference
on Computer Vision and Pattern Recognition. IEEE,2020:
11531-11539.
[28] NINGNING M,ZHANG X Y,ZHENG H T,SUN J. ShuffleNet
V2:Practical guidelines for efficient CNN architecture design[C]//
European Conference on Computer Vision. Cham,Springer,
2018:122-138.
[29] 張珂,馮曉晗,郭玉榮,蘇昱坤,趙凱,趙振兵,馬占宇,丁巧林.
圖像分類的深度卷積神經(jīng)網(wǎng)絡(luò)模型綜述[J]. 中國圖象圖形學
報,2021,26(10):2305-2325.
ZHANG Ke,F(xiàn)ENG Xiaohan,GUO Yurong,SU Yukun,ZHAO
Kai,ZHAO Zhenbing,MA Zhanyu,DING Qiaolin. Overview of
deep convolutional neural networks for image classification[J].
Journal of Image and Graphics,2021,26(10):2305-2325.
[30] ZHOU B L,KHOSLAA,LAPEDRIZAA,OLIVAA,TORRALBAA.
Learning deep features for discriminative localization[C]//
Proceedings of the IEEE conference on computer vision and pattern
recognition. IEEE,2016:2921-2929.
[31] 孫俊,朱偉棟,羅元秋,沈繼鋒,陳義德,周鑫. 基于改進MobileNet-
V2 的田間農(nóng)作物葉片病害識別[J]. 農(nóng)業(yè)工程學報,
2021,37(22):161-169.
SUN Jun,ZHU Weidong,LUO Yuanqiu,SHEN Jifeng,CHEN
Yide,ZHOU Xin. Recognizing the diseases of crop leaves in
fields using improved Mobilenet-V2[J]. Transactions of the Chinese
Society of Agricultural Engineering,2021,37(22):161-
169.