趙玲娜
摘要:長期以來,玉米生產(chǎn)一直面臨著病蟲草害的威脅,從而導(dǎo)致品質(zhì)和產(chǎn)量下降,增加了生產(chǎn)成本,使得種植的綜合收益降低。相比于傳統(tǒng)的防治方式,利用無人機(jī)進(jìn)行玉米病蟲害的防控植保具有防治效果好、對環(huán)境污染影響少、使用成本低等特點(diǎn),因此該手段尤其適合用于應(yīng)對暴發(fā)性病蟲害。經(jīng)過研究提出一種適用于無人機(jī)植保的玉米病蟲害檢測方法,可以通過無人機(jī)采集的玉米葉圖像,利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)處理,并判斷區(qū)域內(nèi)玉米的健康狀況。同時(shí),無人機(jī)可以在玉米田范圍內(nèi)自動(dòng)巡航,并記錄時(shí)間、地點(diǎn)、可能的病因及 GPS 坐標(biāo),減少了人工巡查,提高了巡檢效率。農(nóng)民可以直接依靠無人機(jī)反饋的信息前往患病玉米區(qū)域進(jìn)行治療,從而促進(jìn)玉米產(chǎn)量和質(zhì)量的提高。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);無人機(jī)植保;玉米病蟲害
中圖分類號:TP29 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)13-0045-04 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID) :
0 引言
玉米生長常受天氣條件、栽培方法、管理技術(shù)等各種因素的制約[1]。在玉米的生長周期中,通常主要的病蟲害包括小斑病、大斑病、絲黑穗病、花莖基腐病、玉米螟等,玉米植株從根部到穗部都可能受到不同程度的病蟲害侵襲。由于玉米種植密度較大,農(nóng)田之間的封閉性較高,大約60% 的玉米在生長中后期都有病蟲害發(fā)生 [2]。如果采用人工檢測進(jìn)行玉米病蟲害的防治,難度較大,作業(yè)效率較低,農(nóng)藥利用率也低。
因此,許多玉米的病蟲害防治采用了無人機(jī)植保。無人機(jī)植保是指利用無人機(jī)作為載體,搭載農(nóng)藥噴灑系統(tǒng),對農(nóng)作物進(jìn)行病蟲害防治的技術(shù)。無人機(jī)植保具有高效、靈活、安全、環(huán)保等優(yōu)點(diǎn),是農(nóng)業(yè)現(xiàn)代化的重要標(biāo)志之一。未來,無人機(jī)植保的新技術(shù)手段將在地面遙感信息反演、作業(yè)效率優(yōu)化、作業(yè)過程管控智能化等方面帶來革命性的進(jìn)步,使植保作業(yè)數(shù)據(jù)化和透明化,全過程可視化和可控化,推動(dòng)農(nóng)業(yè)生產(chǎn)管理從機(jī)械化向智能化和智慧化邁進(jìn)[3]。
然而,目前植保領(lǐng)域的無人機(jī)大多僅能夠?qū)崿F(xiàn)農(nóng)藥噴灑等智能化較低的功能。因?yàn)槟壳稗r(nóng)作物識別的方法主要有:1) 利用RGB顏色直方圖波峰分布位置,來提取葉片的顏色特征[4],但此方法提取的特征不明顯,較難區(qū)分不同農(nóng)作物所患疾病。2) 利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)來識別植物病蟲害圖像[5],然而這種方式大多并未基于卷積神經(jīng)網(wǎng)絡(luò)(CNN) ,而是基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) 、極限學(xué)習(xí)機(jī)(ELM) 等,因此計(jì)算量大,實(shí)時(shí)性較差,難以搭載在嵌入式系統(tǒng)上。
為了提高無人機(jī)在玉米植保中的自動(dòng)化和智能化程度,本文提出了一種適用于無人機(jī)植保的玉米病蟲害檢測方法。該方法利用無人機(jī)攝像頭遠(yuǎn)程采集玉米作物的圖像,基于卷積神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)處理并判斷區(qū)域內(nèi)玉米的健康狀況。同時(shí),無人機(jī)在玉米田范圍內(nèi)進(jìn)行自動(dòng)巡航,并記錄時(shí)間、地點(diǎn)和可能的病因及GPS 坐標(biāo),以此來減少人工巡查,提高巡檢效率,從而進(jìn)行有效準(zhǔn)確的噴灑。
1 玉米病蟲害檢測方法
在玉米的病蟲害疾病中,大斑病是玉米最易患的一種病,有其獨(dú)特的患病特征。為了正確識別這些特征,需要提取相應(yīng)的特征向量,并訓(xùn)練出具有高準(zhǔn)確度的識別模型,以便無人機(jī)能夠進(jìn)行正確判斷。同時(shí),這個(gè)模型還需要具有較快的識別速度,以滿足無人機(jī)的需求??紤]到Y(jié)OLO擁有準(zhǔn)確性與速度兼具,且網(wǎng)絡(luò)結(jié)構(gòu)簡單的特點(diǎn),基于YOLOv5進(jìn)行識別模型訓(xùn)練可以較好地滿足上述需求。
1.1 獲得數(shù)據(jù)集
數(shù)據(jù)集主要由已有的開源病蟲害玉米葉片數(shù)據(jù)集和通過Python在網(wǎng)絡(luò)上爬取的圖像組成。其中,病蟲害玉米葉片數(shù)據(jù)集主要包括麥白粉病、葉銹病、花生黑斑病和大斑病等。在獲得數(shù)據(jù)集后,我們對其進(jìn)行了標(biāo)記,并對錯(cuò)標(biāo)或漏標(biāo)的圖片進(jìn)行重新標(biāo)注或刪除;對于質(zhì)量低下的圖片進(jìn)行了刪除,并將圖片格式轉(zhuǎn)換為jpg,以適應(yīng)模型。
為了提高算法在不同條件下的識別率,我們對數(shù)據(jù)集進(jìn)行了擴(kuò)充:重新爬取了高質(zhì)量的圖片,并進(jìn)行了標(biāo)注,以擴(kuò)充數(shù)據(jù)集。利用圖像增強(qiáng)技術(shù),對原有圖片進(jìn)行了變換,以增強(qiáng)算法的魯棒性。由于實(shí)際環(huán)境的復(fù)雜多變,為了增強(qiáng)算法在各類場景下的檢測效率,我們通過改變亮度、圖片翻轉(zhuǎn)等方式使得圖像更加多樣化。將改變后的圖片放入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練可以提高網(wǎng)絡(luò)的魯棒性,降低各方面額外因素對識別的影響。
為了達(dá)到訓(xùn)練目標(biāo),我們在確定了玉米葉片圖像集合后,首先對其健康狀況進(jìn)行記錄,并將圖片文件與標(biāo)簽文件一一對應(yīng)。標(biāo)簽文件被放置在Annotation 文件夾中,而圖片文件則被放置在JPEGImages文件夾中。為了隨機(jī)劃分?jǐn)?shù)據(jù)集,我們將所有玉米葉片圖像集合的60% 設(shè)置為訓(xùn)練集,20% 設(shè)置為驗(yàn)證集,最后20% 設(shè)置為測試集。
1.2 對數(shù)據(jù)進(jìn)行預(yù)處理
在機(jī)器視覺中,通常需要對圖形進(jìn)行一些隨機(jī)的改變,形成相同而又不完全一致的樣本[3]。其功能為擴(kuò)展訓(xùn)練信息集合,抑制過擬合現(xiàn)象,提高模型的泛化水平,該項(xiàng)目采用的主要方法是灰度拉伸[4]。
灰度拉伸需要采用的轉(zhuǎn)換函數(shù)有:
其中,r 是變換前的灰度;T 是變換后的像素;[l1,l2 ] 為原灰度級范圍,[l3,l4 ]為目標(biāo)灰度級范圍,由此可以提高圖像的對比度,使圖像得到增強(qiáng)。
數(shù)據(jù)預(yù)處理是訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)非常重要的步驟。合適的預(yù)處理方法可以幫助模型更好地收斂,并防止過擬合。
1.3 特征提取及檢測網(wǎng)絡(luò)搭建
基于Tensorflow的YOLOv5算法可以通過無人機(jī)傳輸?shù)囊曨l數(shù)據(jù)流信息實(shí)現(xiàn)基本的實(shí)時(shí)檢測。但為了加快YOLOv5算法的檢測速度,提高檢測效率和準(zhǔn)確率,需要對其中的Backbone算法進(jìn)行優(yōu)化,采用性能更優(yōu)越的CNN網(wǎng)絡(luò)。我們采用了MobileNet v3網(wǎng)絡(luò)結(jié)構(gòu),并將最后的激活函數(shù)Rule 換成了h-swish。Swish具備無上界有下界、平滑、非單調(diào)的特性,并且在深層模型上的效果優(yōu)于ReLU。僅僅使用Swish單元替換ReLU就能在ImageNet上的top-1分類準(zhǔn)確率提高0.9%。h-swish 是用一個(gè)近似函數(shù)來逼近這個(gè)Swish,使得模型幾乎可以在所有的軟件和硬件框架上都可以使用,具體轉(zhuǎn)化如下:
f (x) = x × sigmoid ( βx) (2)
在深度學(xué)習(xí)中,學(xué)習(xí)率的調(diào)整非常重要。學(xué)習(xí)率較大時(shí),可以加快學(xué)習(xí)效率,有助于跳出局部最優(yōu)值。然而,過大的學(xué)習(xí)率可能導(dǎo)致模型不精確,甚至導(dǎo)致模型訓(xùn)練不收斂。相反,學(xué)習(xí)率較小時(shí),有利于模型的收斂,可以幫助模型細(xì)化,提高模型精度,但收斂速度較慢,可能導(dǎo)致無法跳出局部最優(yōu)值。因此,學(xué)習(xí)率大和學(xué)習(xí)率小的功能幾乎是相反的。為了最大程度地提高訓(xùn)練性能,我們需要適當(dāng)?shù)卣{(diào)整學(xué)習(xí)率。我們利用Callback類來實(shí)現(xiàn)學(xué)習(xí)率的指數(shù)型下降。指數(shù)型下降意味著學(xué)習(xí)率會隨著指數(shù)函數(shù)的不斷下降,具體公式如下:
learning_rate = learning_rate_base × decay_rateglobal_epoch
其中,learning_rate 為當(dāng)前的學(xué)習(xí)率,learn?ing_rate_base為基礎(chǔ)學(xué)習(xí)率,decay_rate為衰減系數(shù)。
1.4 模型訓(xùn)練
通過卷積層網(wǎng)絡(luò)獲取數(shù)據(jù),然后再利用全連結(jié)層得到預(yù)測值。在網(wǎng)絡(luò)結(jié)構(gòu)上,采用了GooLeNet模型[5],其中包含了24個(gè)卷積層級和2個(gè)全連接層級。對于卷積層,通常使用1×1卷積來做共波干道消融,并緊跟3×3 卷積。而對于卷積層和全連接層,通常使用Leaky ReLU激活函數(shù)[6]:
f (x) = max (αx,x) (4)
其中,α是負(fù)斜率的系數(shù),一般取值為0.01-0.1。
構(gòu)造損失函數(shù)可以確定神經(jīng)網(wǎng)絡(luò)的特性,并針對不同的部分選擇了不同的權(quán)重系數(shù)。首先是定位誤差和分類偏差。針對定位誤差,如邊框位置的偏差,一般選擇最大的權(quán)重。然后將它劃分成不含有目標(biāo)的邊框和含有目標(biāo)的邊框間的置信度,并針對前者,一般選擇最少的權(quán)重值。其他數(shù)值設(shè)為一。
損失函數(shù)計(jì)算如下:
其中,1objij 指代第ij個(gè)單元格的存在目標(biāo),第1項(xiàng)為邊界框中心位置的偏差項(xiàng),而第2項(xiàng)則為邊界框的高度與寬度的偏差項(xiàng)。第3項(xiàng)是包含目標(biāo)的邊界框的置信度計(jì)算偏差項(xiàng),而第4項(xiàng)則是不含目標(biāo)邊界的置信度計(jì)算偏差項(xiàng)。最后,第5項(xiàng)是含目標(biāo)單元格的分類偏差項(xiàng)。默認(rèn)λcoord = 5,λnoobj = 0.5。
利用玉米病蟲害樣本訓(xùn)練集圖像對構(gòu)建的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并在訓(xùn)練過程中利用遺傳算法對神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行更新優(yōu)化,從而得到基于YOLOv5 [7]的玉米病蟲害識別模型。
2 實(shí)驗(yàn)與分析
玉米病蟲害識別模型訓(xùn)練的預(yù)定計(jì)劃包括三個(gè)階段:數(shù)據(jù)收集和預(yù)處理、模型訓(xùn)練和優(yōu)化、模型評估。在第一階段,我們計(jì)劃從公共數(shù)據(jù)集中采集數(shù)據(jù),對數(shù)據(jù)進(jìn)行清洗、標(biāo)注和增強(qiáng)處理。在第二階段,我們將使用YOLOv5模型對數(shù)據(jù)進(jìn)行訓(xùn)練和優(yōu)化,并測試不同的網(wǎng)絡(luò)結(jié)構(gòu)、超參數(shù)和損失函數(shù)。在第三階段,我們將對模型進(jìn)行評估,測試模型的準(zhǔn)確率。
2.1 實(shí)驗(yàn)準(zhǔn)備
由于原始圖片來源于網(wǎng)頁爬取,包含多種不同分辨率,為了獲取較好的實(shí)驗(yàn)效果,我們將數(shù)據(jù)集中的圖片數(shù)據(jù)裁剪并壓縮到統(tǒng)一分辨率。我們使用的玉米葉片圖像數(shù)據(jù)集,每張圖片除了包含類別標(biāo)簽外,還需要一個(gè)標(biāo)注的物體邊框,涉及的病蟲害種類主要有麥白粉病、葉銹病、花生黑斑病和大斑病等。
玉米葉片病蟲害數(shù)據(jù)集中,訓(xùn)練集含有741張圖片,驗(yàn)證集含有217張圖片,測試集包含239張圖片。在實(shí)驗(yàn)開始前,我們對每張圖像都使用LabelImg工具進(jìn)行了標(biāo)注,標(biāo)注出圖像中玉米葉片的物體邊框,以及玉米葉片的局部關(guān)鍵信息和病蟲害屬性信息。
將YOLOv5模型部署到Jetson Nano上,此過程主要分為三個(gè)階段:第一階段,在Nano 上安裝好Py?Torch、OpenCV等YOLOv5模型所需要的依賴庫;第二階段,安裝ONNX Runtime 和TensorRT,通過使用torch.onnx.export()函數(shù)將PyTorch 模型轉(zhuǎn)換為ONNX 格式的模型文件,再使用ONNX Runtime將ONNX格式的模型轉(zhuǎn)換為TensorRT格式,并最終保存轉(zhuǎn)換后的TensorRT模型。第二階段的模型轉(zhuǎn)換主要是為了提高模型的推理速度。第三階段是將轉(zhuǎn)換后的模型部署到Jetson Nano上,使用圖像和視頻數(shù)據(jù)對模型進(jìn)行測試,評估模型的準(zhǔn)確率和性能。
2.2 實(shí)驗(yàn)結(jié)果
我們已完成了數(shù)據(jù)收集和預(yù)處理階段,并針對模型訓(xùn)練和優(yōu)化階段出現(xiàn)的問題進(jìn)行了解決。采用了深度學(xué)習(xí)的方法,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和目標(biāo)檢測技術(shù),對玉米的病蟲害進(jìn)行識別和分類。我們從公共數(shù)據(jù)集中選取了部分圖像進(jìn)行訓(xùn)練,使用voc格式數(shù)據(jù)集,將訓(xùn)練集和相應(yīng)的配置文件上傳至云端,并利用Colab云端服務(wù)器實(shí)現(xiàn)了云端訓(xùn)練。隨后,下載訓(xùn)練得到的權(quán)重文件,運(yùn)行YOLOv5網(wǎng)絡(luò),實(shí)現(xiàn)對目標(biāo)的識別。
模型召回率是指模型正確辨識的樣本數(shù)量與測試的相應(yīng)物體總量的百分比,是衡量某疾病辨識模型效果優(yōu)劣的一項(xiàng)關(guān)鍵參數(shù),即該模型在不同置信率下對相關(guān)病人的召回次數(shù)。
在不同置信度下,本模型識別玉米黃葉病和大斑病的回調(diào)率??梢钥闯鲈谥眯哦燃s為0.6時(shí),本模型對兩種疾病的平均召回率超過60%,說明本模型對目標(biāo)疾病的識別效果較好,滿足實(shí)際應(yīng)用需要(如圖2 所示)。
總體而言,本模型對玉米疾病的識別效果較好,但對不同疾病之間的識別效果也存在一定的差異。表1 對本模型識別不同疾病時(shí)的各項(xiàng)指標(biāo)進(jìn)行了比較。
通過上述指標(biāo)可以看出,該模型在識別兩種疾病的患病位置時(shí)表現(xiàn)良好,對大斑病的識別正確率較高,并且穩(wěn)定性也較好。
圖3為模型對大斑病的實(shí)際識別效果??梢钥闯?,該模型正確識別了大斑病,并且對患病區(qū)域的定位較為準(zhǔn)確??傮w而言,該模型可以較好地滿足實(shí)際應(yīng)用中的需求。
3 結(jié)論
在目標(biāo)識別和分類方面,深度學(xué)習(xí)模型,如卷積神經(jīng)網(wǎng)絡(luò)(CNN) ,是一種常用的技術(shù)。CNN 可以通過對大量的圖像數(shù)據(jù)進(jìn)行訓(xùn)練來實(shí)現(xiàn)高精度的目標(biāo)檢測。針對玉米病蟲害的檢測與防治,本文提出了一種適用于無人機(jī)植保的玉米病蟲害檢測方法。該方法采用YOLOv5算法,通過對大量的玉米葉病蟲害圖像進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,得到了一個(gè)高效準(zhǔn)確的病蟲害識別模型。經(jīng)實(shí)驗(yàn)驗(yàn)證,該模型可以實(shí)時(shí)地對無人機(jī)拍攝的玉米田圖像進(jìn)行分析,判斷玉米葉片是否存在病蟲害,以及病蟲害的類型和程度。
未來,希望將該方法部署在無人機(jī)的機(jī)載運(yùn)算平臺上,開發(fā)一套玉米病蟲害智能化的無人機(jī)植保系統(tǒng)。該系統(tǒng)可以根據(jù)預(yù)設(shè)的航線,自動(dòng)地控制無人機(jī)在玉米田內(nèi)進(jìn)行巡航,實(shí)現(xiàn)對大面積玉米田的快速覆蓋,節(jié)省人力資源,提高檢測效率。此外,該系統(tǒng)還可以根據(jù)檢測結(jié)果,為農(nóng)民提供專業(yè)的防治建議,指導(dǎo)農(nóng)民采取合理的施藥措施,降低農(nóng)藥用量,提高玉米產(chǎn)量和質(zhì)量。
參考文獻(xiàn):
[1] 韓鼎,陳喬,王暉,等. 植保無人機(jī)在玉米生產(chǎn)中的應(yīng)用[J]. 種子科技,2020,38(17):139-140.
[2] 趙勝利. 玉米病蟲害防治與種植技術(shù)應(yīng)用研究[J]. 農(nóng)家參謀,2022(9):52-54.
[3] 徐旻,張瑞瑞,陳立平,等. 智能化無人機(jī)植保作業(yè)關(guān)鍵技術(shù)及研究進(jìn)展[J]. 智慧農(nóng)業(yè),2019,1(2):20-33.
[4] 汪京京,張武,劉連忠,等. 農(nóng)作物病蟲害圖像識別技術(shù)的研究綜述[J]. 計(jì)算機(jī)工程與科學(xué),2014,36(7):1363-1370.
[5] 孫亮,柯宇航,劉輝,等. 計(jì)算機(jī)視覺技術(shù)在植物病蟲害識別上的研究進(jìn)展[J]. 熱帶生物學(xué)報(bào),2022,13(6):651-658.
[6] 王萬亮,江高飛,嚴(yán)江偉,等. 基于卷積評價(jià)及對抗網(wǎng)絡(luò)的花粉、孢子圖像增廣算法[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2021,37(5):1190-1198.
[7] 唐圣凱. 基于Otsu 可控灰度拉伸的直方均衡化算法[D]. 蘭州:蘭州大學(xué),2019.
[8] HUANG J, HU Y, YANG W L.Adapted GooLeNet for visual ques?tion answering[C]//2018 3rd Interna?tional Conference on Mechanical,Control and Computer Engineering(ICMCCE). Huhhot, China. IEEE,2018:603-606.
[9] ZHANG X H,ZOU Y X,SHI W. Dilated convolution neural net?work with LeakyReLU for environmental sound classification[C]//2017 22nd International Conference on Digital Signal Pro?cessing (DSP). London,UK. IEEE,2017:1-5.
[10] JIANG P Y,ERGU D J,LIU F Y,et al.A review of yolo algo?rithm developments[J].Procedia Computer Science,2022,199:1066-1073.
【通聯(lián)編輯:梁書】
基金項(xiàng)目:2022—2024 安徽高校自然科學(xué)研究項(xiàng)目(2022AH052300)