石放 王瑩 王新法 馬玉琨
摘要:為克服傳統(tǒng)網(wǎng)絡(luò)模型結(jié)構(gòu)固化、對(duì)馬鈴薯病害識(shí)別率低的問(wèn)題,以PlantVillage數(shù)據(jù)集中的五類(lèi)馬鈴薯病害為研究對(duì)象,對(duì)圖像進(jìn)行隨機(jī)放大縮小、水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)等操作進(jìn)行數(shù)據(jù)增強(qiáng)。使用一種基于網(wǎng)絡(luò)設(shè)計(jì)空間思想設(shè)計(jì)出具有高度靈活性的RegNet網(wǎng)絡(luò)模型,利用PoLy損失函數(shù)對(duì)RegNet進(jìn)行改進(jìn),并加入注意力機(jī)制,對(duì)數(shù)據(jù)增強(qiáng)后的馬鈴薯病害圖片進(jìn)行預(yù)測(cè),再與傳統(tǒng)網(wǎng)絡(luò)模型AlexNet和GoogLeNet進(jìn)行對(duì)比。試驗(yàn)結(jié)果表明:改進(jìn)后的RegNetX在馬鈴薯識(shí)別方面具有良好的性能,最高準(zhǔn)確率可達(dá)99.8%,模型準(zhǔn)確率超過(guò)AlexNet與GoogLeNet,可為馬鈴薯病害識(shí)別作參考。
關(guān)鍵詞:馬鈴薯;農(nóng)作物病害;RegNet網(wǎng)絡(luò);圖像識(shí)別;網(wǎng)絡(luò)設(shè)計(jì)空間
中圖分類(lèi)號(hào):S435.32; TP391.4
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):2095-5553 (2024) 06-0229-06
收稿日期:2022年7月2日
修回日期:2022年9月16日
*基金項(xiàng)目:河南省科技攻關(guān)項(xiàng)目(212102110234,222102320080);河南省高等學(xué)校重點(diǎn)科研項(xiàng)目(22A210013);河南省博士后科研啟動(dòng)項(xiàng)目(202102090);河南省新鄉(xiāng)市重大科技專(zhuān)項(xiàng)(21ZD003)
第一作者:石放,男,1997年生,河南周口人,碩士;研究方向?yàn)檗r(nóng)業(yè)信息化。E-mail: 281139088@qq.com
通訊作者:馬玉琨,女,1983年生,河南新鄉(xiāng)人,博士,副教授;研究方向?yàn)樾盘?hào)處理與識(shí)別。E-mail: yukuner@126.com
Research on potato disease identification based on RegNet network
Shi Fang, Wang Ying, Wang Xinfa, Ma Yukun
(Henan Institute of Science and Technology, Xinxiang, 453003, China)
Abstract: In order to overcome the problems of solidified structure of traditional network model and low recognition rate of potato diseases, five types of potato diseases in PlantVillage dataset are taken as the research object, and the images are randomly zoomed in and out, horizontally flipped, vertically flipped and so on for data enhancement. Then a RegNet network model with a high degree of flexibility is designed using a network-based design space idea, and the PoLy loss function is used to improve RegNet and the attention mechanism is added to predict the potato disease images after data enhancement, and the traditional network models are compared with AlexNet and GoogLeNet. The experimental results show that the improved RegNetX has good performance in potato recognition, the highest accuracy can reach 99.8%, and the model accuracy is higher than AlexNet and GoogLeNet, which can be used as a reference for potato disease recognition.
Keywords: potato; crop diseases; RegNet network; image recognition; network design space
0 引言
馬鈴薯的生產(chǎn)對(duì)我國(guó)居民的日常生活和國(guó)際蔬菜貿(mào)易有著重大的影響。然而在馬鈴薯的種植過(guò)程中,難免受到環(huán)境、氣候、土壤和病害的影響,其中病害是影響馬鈴薯減產(chǎn)的重要問(wèn)題。傳統(tǒng)的馬鈴薯病害防治需要大量的植保人員根據(jù)他們已有的知識(shí)儲(chǔ)備和相關(guān)種植經(jīng)驗(yàn),人為地去判斷馬鈴薯是否發(fā)生了病害,這種識(shí)別的方法效率低、準(zhǔn)確率難以保證,具有一定的滯后性。
為解決農(nóng)作物病害識(shí)別的問(wèn)題,國(guó)內(nèi)外學(xué)者進(jìn)行了相關(guān)研究。徐巖等[1]為解決馬鈴薯病害導(dǎo)致的減產(chǎn)問(wèn)題,提出了一種基于注意力和殘差思想的深度卷積神經(jīng)網(wǎng)絡(luò)模型RANet,取得了93.86%的平均識(shí)別率。蒲秀夫等[2]使用二值化卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)PlantVillage數(shù)據(jù)集共54 306張圖片進(jìn)行識(shí)別,試驗(yàn)表明二值化模型的計(jì)算速度遠(yuǎn)遠(yuǎn)高于原模型且準(zhǔn)確率可以達(dá)到96.8%。趙建敏等[3]為實(shí)現(xiàn)馬鈴薯葉片病害識(shí)別,設(shè)計(jì)了一種基于壓縮感知理論的馬鈴薯病害圖像分類(lèi)方法,經(jīng)對(duì)比測(cè)試,采用字典學(xué)習(xí)的圖像分類(lèi)方法對(duì)馬鈴薯三種葉片病害平均識(shí)別率可達(dá)95.33%。姜敏等[4]采用截取感興趣區(qū)域、圖片尺寸歸一化等預(yù)處理方式與SSD MobileNet v1等深度學(xué)習(xí)模型結(jié)合對(duì)水稻病害進(jìn)行識(shí)別,平均準(zhǔn)確率達(dá)到了75%。黨滿(mǎn)意等[5]基于機(jī)器視覺(jué)技術(shù)對(duì)馬鈴薯葉部晚疫病進(jìn)行檢測(cè),提出顏色紋理形狀特征結(jié)合的識(shí)別方法,試驗(yàn)結(jié)果顯示對(duì)患病中期與后期的識(shí)別率分別為90%和92.5%。于洪濤等[6]使用Retinex算法結(jié)合VGG-F網(wǎng)絡(luò)模型對(duì)蘋(píng)果病害進(jìn)行識(shí)別,結(jié)果相較于原始的VGG模型,準(zhǔn)確率提高了5%。牛沖等[7]基于圖像灰度直方圖特征的草莓病害識(shí)別算法對(duì)草莓蛇眼病進(jìn)行識(shí)別,結(jié)果表明,SVM分類(lèi)器的分類(lèi)效果優(yōu)于其他分類(lèi)器,準(zhǔn)確率達(dá)到90%以上。王林柏等[8]針對(duì)自然環(huán)境下馬鈴薯葉片病害識(shí)別率低和晚疫病斑定位難的問(wèn)題,提出一種改進(jìn)型的CenterNet-SPP模型,對(duì)馬鈴薯葉片病害進(jìn)行識(shí)別,試驗(yàn)結(jié)果表明訓(xùn)練后的模型在驗(yàn)證集下的mAP可達(dá)90.03%,準(zhǔn)確率為94.93%,召回率為90.34%,F(xiàn)1值為92.58%。
然而傳統(tǒng)的機(jī)器學(xué)習(xí)方法與普通的卷積神經(jīng)網(wǎng)絡(luò)模型[9-12]具有識(shí)別率低、網(wǎng)絡(luò)結(jié)構(gòu)固化等局限性,基于此問(wèn)題,本文使用數(shù)據(jù)增強(qiáng)技術(shù)對(duì)數(shù)據(jù)進(jìn)行擴(kuò)充以增加網(wǎng)絡(luò)的魯棒性,采用更具靈活性的RegNet模型對(duì)5類(lèi)馬鈴薯病害圖片進(jìn)行識(shí)別,并針對(duì)識(shí)別率低的問(wèn)題引入注意力機(jī)制[13-18]和PolyLoss[19]以提高識(shí)別準(zhǔn)確率,最后與AlexNet和GooLeNet的準(zhǔn)確率和訓(xùn)練時(shí)長(zhǎng)進(jìn)行對(duì)比分析,能為馬鈴薯病害識(shí)別作為參考。
1 RegNet網(wǎng)絡(luò)模型
1.1 RegNet設(shè)計(jì)原理
RegNet[20]是2020年由何凱明團(tuán)隊(duì)在《Designing Network Design Spaces》提出的。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)一般都是基于神經(jīng)結(jié)構(gòu)搜索(Neural Architecture Search)思想,其特點(diǎn)為在特定的設(shè)計(jì)空間內(nèi)通過(guò)搜索算法從而尋找出最佳的參數(shù)組合,具有一定的局限性,而RegNet的設(shè)計(jì)者不再只局限于單一網(wǎng)絡(luò)的設(shè)計(jì),而是通過(guò)研究網(wǎng)絡(luò)設(shè)計(jì)空間,來(lái)探索出相對(duì)不被定義的網(wǎng)絡(luò)模型簇。
RegNet的設(shè)計(jì)者采用誤差評(píng)估的方法對(duì)設(shè)計(jì)空間的質(zhì)量進(jìn)行評(píng)價(jià),其表達(dá)式如式(1)所示。
F(e)=1n∑ni=11[ei 式中:n——設(shè)計(jì)空間在ImageNet上訓(xùn)練的模型個(gè)數(shù); e——訓(xùn)練誤差; F(e)——誤差小于e的模型比例。 RegNet的設(shè)計(jì)者提出了初始設(shè)計(jì)空間(AnyNet)這一概念,AnyNet由三層結(jié)構(gòu)組成,這種結(jié)構(gòu)猶如植物的生長(zhǎng)結(jié)構(gòu)一樣,分別是莖部、身體和頭部。其結(jié)構(gòu)如圖1(a)所示。其中莖部和頭部在結(jié)構(gòu)中固定不變。莖部為一個(gè)3×3大小,步長(zhǎng)為2,卷積核個(gè)數(shù)為32的普通卷積層。頭部由一個(gè)全局平均池化層和全連接層組成,用于預(yù)測(cè)分類(lèi)。而身體內(nèi)部則是由4個(gè)階段構(gòu)成,這些階段的分辨率r逐步降低,如圖1(b)所示,每一個(gè)階段內(nèi)又由若干個(gè)模塊組成,默認(rèn)第一個(gè)塊使用的步長(zhǎng)為2,如圖1(c)所示,但模塊的參數(shù)不受限制,可以是任意可能的組合。圖1中w表示網(wǎng)絡(luò)深度,r表示分辨率,n表示輸出類(lèi)別的個(gè)數(shù)。 AnyNet中的block結(jié)構(gòu)主分支由一個(gè)1×1的卷積核,一個(gè)3×3的組卷積,最后再接一個(gè)1×1的卷積組成,當(dāng)步長(zhǎng)為1時(shí),捷徑分支不作處理,如圖2(a)所示,當(dāng)步長(zhǎng)為2時(shí),僅通過(guò)一個(gè)1×1的卷積,如圖2(b)所示。 其中w為網(wǎng)絡(luò)深度,r為分辨率,g為組卷積中每個(gè)組的組寬,b為瓶頸比。這種模塊結(jié)構(gòu)被定義為“X模塊”,通過(guò)X模塊的各種組合可以使網(wǎng)絡(luò)靈活地應(yīng)用于各種場(chǎng)景,RegNetX網(wǎng)絡(luò)就是基于此來(lái)設(shè)計(jì)的,本文使用RegNetX網(wǎng)絡(luò)模型進(jìn)行馬鈴薯病害識(shí)別試驗(yàn)。 1.2 RegNet網(wǎng)絡(luò)改進(jìn) 為解決識(shí)別率低的問(wèn)題,本文在RegNetX網(wǎng)絡(luò)中引入了注意力機(jī)制,同時(shí)使用PolyLoss損失函數(shù)替換了傳統(tǒng)的交叉熵?fù)p失函數(shù)。 1.2.1 SE模塊 SE全稱(chēng)Squeeze-and-Excitation,是一種注重通道的注意力機(jī)制,主要由Squeeze和Excitation兩部分組成,結(jié)構(gòu)如圖3所示,其中W為特征圖的寬,H為特征圖的高,C為通道數(shù),輸入特征圖大小為W×H×C。 SE模塊的壓縮操作實(shí)際是一個(gè)全局平均池化操作,通過(guò)壓縮操作使特征圖變?yōu)?×1×C向量。其流程如圖4(a)所示。SE模塊的激勵(lì)操作由兩個(gè)全連接層和兩個(gè)激活函數(shù)組成,第一個(gè)全連接層有C×SERatio個(gè)神經(jīng)元,輸入為1×1×C,輸出1×1×C×SERadio,后接一個(gè)ReLu激活函數(shù)。第二個(gè)全連接層有C個(gè)神經(jīng)元,輸入為1×1×C×SERadio,輸出為1×1×C,后接一個(gè)Sigmoid激活函數(shù)。其流程如圖4(b)所示。 最后執(zhí)行scale操作,在得到1×1×C向量后,對(duì)原來(lái)的特征圖進(jìn)行scale操作,即通道權(quán)重相乘,原有特征向量為W×H×C,將SE模塊計(jì)算出來(lái)的各通道權(quán)重值分別和原特征圖對(duì)應(yīng)通道的二維矩陣相乘,得出的結(jié)果輸出。 1.2.2 PolyLoss損失函數(shù) PolyLoss來(lái)自交叉熵?fù)p失函數(shù)的泰勒展開(kāi)式,如式(2)所示。 LCE=-log(Pt)=∑∞j=11/j(1-Pt)j =(1-Pt)+1/2(1-Pt)2…(2) 式中:Pt——目標(biāo)類(lèi)標(biāo)簽的預(yù)測(cè)概率; (1-Pt)j——每個(gè)多項(xiàng)式基,在使用泰勒公式展開(kāi)交叉熵后,可知其多項(xiàng)式系數(shù)為1/j,但這些系數(shù)過(guò)于固定,并不是所有模型和任務(wù)的最優(yōu)條件。 PolyLoss在此基礎(chǔ)上添加了一個(gè)可調(diào)整項(xiàng)ε1·(1-Pt),從而形成一個(gè)更為靈活的框架,通過(guò)調(diào)整ε1的值來(lái)更好地提升模型效果,其表達(dá)式如式(3)所示。 LPoly-1=(1+ε1)(1-Pt)+1/2(1-Pt)2+… =-log(Pt)+ε1(1-Pt)(3) PolyLoss可以根據(jù)不同模型調(diào)整適用參數(shù)這一特點(diǎn)相對(duì)于傳統(tǒng)的交叉熵?fù)p失函數(shù)更為靈活與精準(zhǔn),本文使用PolyLoss代替交叉熵?fù)p失函數(shù)。 2 數(shù)據(jù)來(lái)源和數(shù)據(jù)增強(qiáng) 本文采取PlantVillage數(shù)據(jù)集中的馬鈴薯細(xì)菌斑、早疫病、晚疫病、葉霉菌、七星葉斑病五種常見(jiàn)病害作為研究對(duì)象,原始數(shù)據(jù)馬鈴薯細(xì)菌斑圖片數(shù)量為2 127張、馬鈴薯早疫病圖片數(shù)量為1 000張、馬鈴薯晚疫病圖片數(shù)量為1 909張、馬鈴薯葉霉菌圖片數(shù)量為952張、馬鈴薯七星葉斑病圖片數(shù)量為1 771張,總數(shù)量為7 759張。由于原始數(shù)據(jù)量較少,又通過(guò)網(wǎng)絡(luò)爬蟲(chóng)爬取部分?jǐn)?shù)據(jù),篩選可用數(shù)據(jù),對(duì)每一類(lèi)病害圖片進(jìn)行標(biāo)注,并分別放入Tomato_Bacterial_spot、Tomato_Early_blight、Tomato_Late_blight、Tomato_Leaf_Mold、Tomato_Septoria_leaf_spot文件夾中,按8∶2的比例劃分訓(xùn)練集和測(cè)試集。部分爬取結(jié)果如圖5所示,整合后部分?jǐn)?shù)據(jù)集如圖6所示,圖6中第三行為爬取圖片。 本試驗(yàn)對(duì)原始數(shù)據(jù)集進(jìn)行了數(shù)據(jù)增強(qiáng),數(shù)據(jù)增強(qiáng)是一種重要的深度學(xué)習(xí)方法之一,是基于已有的訓(xùn)練樣本數(shù)據(jù)來(lái)生成更多的訓(xùn)練數(shù)據(jù),其目的就是為了使擴(kuò)增的訓(xùn)練數(shù)據(jù)盡可能接近真實(shí)分布的數(shù)據(jù),從而提高檢測(cè)精度。此外,數(shù)據(jù)增強(qiáng)能夠迫使模型學(xué)習(xí)到更多魯棒性的特征,從而有效提高模型的泛化能力。本文采用的數(shù)據(jù)增強(qiáng)操作包括隨機(jī)放大縮小、水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)、隨機(jī)度數(shù)旋轉(zhuǎn)、明暗度調(diào)整、平移、添加噪聲、模糊等,圖7為進(jìn)行過(guò)數(shù)據(jù)增強(qiáng)后的效果圖。 經(jīng)數(shù)據(jù)增強(qiáng)后,馬鈴薯細(xì)菌斑圖片數(shù)量為4 650張、馬鈴薯早疫病圖片數(shù)量為2 996張、馬鈴薯晚疫病圖片數(shù)量為4 165張、馬鈴薯葉霉菌圖片數(shù)量為3 478張、馬鈴薯七星葉斑病圖片數(shù)量為4 279張,總數(shù)量為19 568張。 3 試驗(yàn)和結(jié)果分析 3.1 環(huán)境配置 本文試驗(yàn)采用個(gè)人計(jì)算機(jī),具體參數(shù)配置見(jiàn)表1。 3.2 試驗(yàn)參數(shù) 本文使用Pytorch框架搭建RegNetX200MF網(wǎng)絡(luò),并采用遷移學(xué)習(xí)加快模型收斂速度,遷移學(xué)習(xí)是將在某一領(lǐng)域或任務(wù)中學(xué)到的知識(shí)或模式應(yīng)用到不同但相關(guān)的領(lǐng)域或問(wèn)題上,在訓(xùn)練過(guò)程中,模型提升的速率更快,訓(xùn)練結(jié)束后得到的收斂性更好,本文把在ImageNet中學(xué)習(xí)到的知識(shí)遷移到試驗(yàn)當(dāng)中。并與AlexNet和GoogLeNet訓(xùn)練的結(jié)果進(jìn)行對(duì)比。 RegNetX200MF設(shè)置學(xué)習(xí)率為0.001,batch size(一次訓(xùn)練選取的樣本數(shù)量)設(shè)為16,epoch設(shè)為15,優(yōu)化器選擇SGD。AlexNet與GoogLeNet設(shè)置學(xué)習(xí)率為0.000 1,batch size設(shè)為32,epoch設(shè)為100,優(yōu)化器選擇Adam。 3.3 不同模型的結(jié)果分析 不同模型的準(zhǔn)確率和損失值對(duì)比如圖8、圖9所示。由圖8和圖9對(duì)比可以明顯看到,RegNetX200MF在第11個(gè)epoch時(shí)開(kāi)始收斂,而AlexNet和GoogLeNet直至100個(gè)epoch才收斂,收斂速度遠(yuǎn)遠(yuǎn)不如RegNetX200MF。 三種網(wǎng)絡(luò)模型的測(cè)試準(zhǔn)確率、損失值及訓(xùn)練耗時(shí)如表2所示。 由表2對(duì)比可知,AlexNet和GooLeNet的準(zhǔn)確率分別為98.9%和99.1%,RegNetX200MF的準(zhǔn)確率最高可達(dá)99.8%,分別高于AlexNet 0.9個(gè)百分點(diǎn)和GooLeNet 0.7個(gè)百分點(diǎn),說(shuō)明RegNetX200MF在準(zhǔn)確率上要由于AlexNet和GooLeNet。但在模型收斂后,RegNetX200MF的損失值在0.105上下輕微浮動(dòng),GooLeNet的損失值約為0.06,AlexNet的損失值最少,約在0.053左右,說(shuō)明RegNetX200MF在損失值上還有改進(jìn)的空間。在訓(xùn)練耗時(shí)上,RegNetX200MF用了5.3 h,低于GooLeNet的9.3 h,高于AlexNet的2.2 h,說(shuō)明RegNetX200MF在網(wǎng)絡(luò)結(jié)構(gòu)上還有優(yōu)化的空間。 3.4 不同病害的結(jié)果分析 本文使用精準(zhǔn)率Precision、召回率Recall作為不同病害識(shí)別性能評(píng)價(jià)指標(biāo)。 Precision=TNFP+TN(4) Recall=TPTP+FN(5) 式中:TP——真實(shí)值為正且預(yù)測(cè)也為正的樣本數(shù)量,記為真陽(yáng)性; TN——真實(shí)值為負(fù)且預(yù)測(cè)也為負(fù)的樣本數(shù)量,記為真陰性; FP——真實(shí)值為負(fù)但預(yù)測(cè)為正的樣本數(shù)量,記為假陽(yáng)性; FN——真實(shí)值為正但預(yù)測(cè)為負(fù)的樣本數(shù)量,記為假陰性。 使用RegNetX200MF模型對(duì)馬鈴薯細(xì)菌斑、早疫病、晚疫病、葉霉菌、七星葉斑病五類(lèi)病蟲(chóng)害進(jìn)行測(cè)試,按數(shù)據(jù)集8∶2的比例隨機(jī)劃分測(cè)試集,約3 900多張圖片,評(píng)價(jià)結(jié)果如表3所示。 由表3可以看出,RegNetX200MF網(wǎng)絡(luò)對(duì)馬鈴薯五類(lèi)病害的識(shí)別的精準(zhǔn)率平均值為98.74%,召回率的平均值為98.6%,模型表現(xiàn)與各類(lèi)指標(biāo)呈正比,且五類(lèi)病害指標(biāo)都比較均勻,平均值都在95%以上,說(shuō)明模型表現(xiàn)較好,各類(lèi)病害測(cè)試的混淆矩陣如圖10所示,隨機(jī)抽取圖片對(duì)五類(lèi)病害單張圖片進(jìn)行測(cè)試,部分結(jié)果如圖11所示。 4 結(jié)論 1) 針對(duì)傳統(tǒng)模型識(shí)別馬鈴薯病害準(zhǔn)確率不高的問(wèn)題,本文使用經(jīng)過(guò)Poly損失函數(shù)和注意力機(jī)制改進(jìn)的RegNetX200MF網(wǎng)絡(luò)對(duì)五類(lèi)馬鈴薯病害進(jìn)行識(shí)別試驗(yàn),并與傳統(tǒng)網(wǎng)絡(luò)模型AlexNet和GooLeNet進(jìn)行對(duì)比分析。 2) 所采用的RegNetX200MF在馬鈴薯識(shí)別方面具有良好的性能,準(zhǔn)確率最高可達(dá)99.8%,超過(guò)傳統(tǒng)的AlexNet和GooLeNet,適合作用于馬鈴薯病害識(shí)別。 3) 綜上所述,經(jīng)過(guò)Poly損失函數(shù)和注意力機(jī)制改進(jìn)的RegNetX200MF網(wǎng)絡(luò)在馬鈴薯病害識(shí)別方面表現(xiàn)良好,可為農(nóng)作物病害識(shí)別提供參考,對(duì)農(nóng)業(yè)信息化的發(fā)展具有推動(dòng)意義。 參 考 文 獻(xiàn) [1]徐巖, 李曉振, 吳作宏, 等. 基于殘差注意力網(wǎng)絡(luò)的馬鈴薯葉部病害識(shí)別[J]. 山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 40(2): 76-83. Xu Yan, Li Xiaozhen, Wu Zuohong, et al. Potato leaf disease recognition via residual attention network [J]. Journal of Shandong University of Science and Technology (Natural Science), 2021, 40(2): 76-83. [2]蒲秀夫, 寧芊, 雷印杰, 等. 基于二值化卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)業(yè)病蟲(chóng)害識(shí)別[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào), 2020, 41(2): 177-182. Pu Xiufu, Ning Qian, Lei Yinjie, et al. Identification of agricultural plant diseases based on binarized convolutional neural network [J]. Journal of Chinese Agricultural Mechanization, 2020, 41(2): 177-182. [3]趙建敏, 蘆建文. 基于字典學(xué)習(xí)的馬鈴薯葉片病害圖像識(shí)別算法[J]. 河南農(nóng)業(yè)科學(xué), 2018, 47(4): 154-160. Zhao Jianmin, Lu Jianwen. Identification algorithm of potato diseases on leaves using dictionary learning theory [J]. Journal of Henan Agricultural Sciences, 2018, 47(4): 154-160. [4]姜敏, 沈一鳴, 張敬堯, 等. 基于深度學(xué)習(xí)的水稻病蟲(chóng)害診斷方法研究[J]. 洛陽(yáng)理工學(xué)院學(xué)報(bào)(自然科學(xué)版), 2019, 29(4): 78-83. Jiang Min, Shen Yiming, Zhang Jingyao, et al. Research on rice diseases and pests diagnosis based on deep learning [J]. Journal of Luoyang Institute of Science and Technology (Natural Science Edition), 2019, 29(4): 78-83. [5]黨滿(mǎn)意, 孟慶魁, 谷芳, 等. 基于機(jī)器視覺(jué)的馬鈴薯晚疫病快速識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2020, 36(2): 193-200. Dang Manyi, Meng Qingkui, Gu Fang, et al. Rapid recognition of potato late blight based on machine vision [J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(2): 193-200. [6]于洪濤, 袁明新, 王琪, 等. 基于VGG-F動(dòng)態(tài)學(xué)習(xí)模型的蘋(píng)果病蟲(chóng)害識(shí)別[J]. 科學(xué)技術(shù)與工程, 2019, 19(32): 249-253. Yu Hongtao, Yuan Mingxin, Wang Qi, et al. Recognition of apple pests and diseases based on VGG-F dynamic leaming model [J]. Science Technology and Engineering, 2019, 19(32): 249-253. [7]牛沖, 牛昱光, 李寒, 等. 基于圖像灰度直方圖特征的草莓病蟲(chóng)害識(shí)別[J]. 江蘇農(nóng)業(yè)科學(xué), 2017, 45(4): 169-172. Niu Chong, Niu Yuguang, Li Han, et al. Strawberry disease recognition based on image gray histogram feature [J]. Jiangsu Agricultural Science, 2017, 45(4): 169-172. [8]王林柏, 張博, 姚竟發(fā), 等. 基于卷積神經(jīng)網(wǎng)絡(luò)馬鈴薯葉片病害識(shí)別和病斑檢測(cè)[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào), 2021, 42(11): 122-129. Wang Linbai, Zhang Bo, Yao Jingfa, et al. Potato leaf disease recognition and potato leaf disease spot detection based on Convolutional Neural Network [J]. Journal of Chinese Agricultural Mechanization, 2021, 42(11): 122-129. [9]趙晉陵, 詹媛媛, 王娟, 等. 基于SE-UNet的冬小麥種植區(qū)域提取方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2022, 53(9): 189-196. Zhao Jinling, Zhan Yuanyuan, Wang Juan, et al. SE-UNet-Based extraction of winter wheat planting areas [J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(9): 189-196. [10]張為, 李璞. 基于注意力機(jī)制的人臉表情識(shí)別網(wǎng)絡(luò)[J]. 天津大學(xué)學(xué)報(bào)(自然科學(xué)與工程技術(shù)版), 2022, 55(7): 706-713. Zhang Wei, Li Pu. Facial expression recognition network based on attention mechanism [J]. Journal of Tianjin University (Science and Technology), 2022, 55(7): 706-713. [11]黃海松, 陳星燃, 韓正功, 等. 基于多尺度注意力機(jī)制和知識(shí)蒸餾的茶葉嫩芽分級(jí)方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2022, 53(9): 399-407, 458. Huang Haisong, Chen Xingran, Han Zhenggong, et al. Tea buds grading method based on multi-scale attention mechanism and knowledge distillation [J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(9): 399-407, 458. [12]殷獻(xiàn)博, 鄧小玲, 蘭玉彬, 等. 基于改進(jìn)YOLOX-Nano算法的柑橘梢期長(zhǎng)勢(shì)智能識(shí)別[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報(bào), 2023, 44(1): 142-150. Yin Xianbo, Deng Xiaoling, Lan Yubin, et al. Intelligent recognition of citrus shoot growth based on improved YOLOX-Nano algorithm [J]. Journal of South China Agricultural University, 2023, 44(1): 142-150. [13]于雪瑩, 高繼勇, 王首程, 等. 基于生成對(duì)抗網(wǎng)絡(luò)和混合注意力機(jī)制殘差網(wǎng)絡(luò)的蘋(píng)果病害識(shí)別[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào), 2022, 43(6): 166-174. Yu Xueying, Gao Jiyong, Wang Shoucheng, et al. Apple disease recognition based on Wasserstein generative adversarial networks and hybrid attention mechanism residual network [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(6): 166-174. [14]高榮華, 白強(qiáng), 王榮, 等. 改進(jìn)注意力機(jī)制的多叉樹(shù)網(wǎng)絡(luò)多作物早期病害識(shí)別方法[J]. 計(jì)算機(jī)科學(xué), 2022, 49(S1): 363-369. Gao Ronghua, Bai Qiang, Wang Rong, et al. Multi-tree network multi-crop early disease recognition method based on improved attention mechanism [J]. Computer Science, 2022, 49(S1): 363-369 [15]楊玥, 馮濤, 梁虹, 等. 融合交叉注意力機(jī)制的圖像任意風(fēng)格遷移[J]. 計(jì)算機(jī)科學(xué), 2022, 49(S1): 345-352, 396. Yang Yue, Feng Tao, Liang Hong,et al. Image arbitrary style transfer via criss-cross attention [J]. Computer Science, 2022, 49(S1): 345-352, 396. [16]高雨亮, 徐向英, 章永龍, 等. 融合分組注意力機(jī)制的水稻病蟲(chóng)害圖像識(shí)別算法[J]. 揚(yáng)州大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 24(6): 53-57. Gao Yuliang, Xu Xiangying, Zhang Yonglong, et al. Image recognition algorithm of rice diseases and insect pests based on shuffle attention mechanism [J]. Journal of Yangzhou University (Natural Science Edition), 2021, 24(6): 53-57. [17]毛騰躍, 宋陽(yáng), 鄭祿. 基于多尺度與混合注意力機(jī)制的蘋(píng)果目標(biāo)檢測(cè)[J]. 中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 41(2): 235-242. Mao Tengyue, Song Yang, Zheng Lu. Apple target detection based on multi-scale and hybrid attention mechanism [J].Journal of South-Central Minzu University (Natural Science Edition), 2022, 41(2): 235-242. [18]駱潤(rùn)玫, 殷惠莉, 劉偉康, 等. 基于YOLOv5-C的廣佛手病蟲(chóng)害識(shí)別[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報(bào), 2023, 44(1): 151-160. Luo Runmei, Yin Huili, Liu Weikang, et al. Identification of bergamot pests and diseases in complex background using YOLOv5-C algorithm [J]. Journal of South China Agricultural University, 2023, 44(1): 151-160. [19]Leng Z, Tan M, Liu C, et al. PolyLoss: A polynomial expansion perspective of classification loss functions [C]. International Conference on Learning Representations (ICLR), 2022. [20]Radosavovic I, Kosaraju R P, Girshick R, et al. Designing network design spaces [C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020.
中國(guó)農(nóng)機(jī)化學(xué)報(bào)2024年6期