文 斌,曹仁軒,楊啟良,張 健,朱 晗,李知聰
(1. 三峽大學(xué)電氣與新能源學(xué)院,宜昌 443000;2. 昆明理工大學(xué)現(xiàn)代農(nóng)業(yè)工程學(xué)院,昆明 650500)
三七是中國(guó)的名貴中草藥,具有止血,散淤,止痛等功效。近年來(lái),市場(chǎng)對(duì)三七的需求量已經(jīng)超過了9 000 t,為了滿足市場(chǎng)的需求,三七的人工培育面積不斷擴(kuò)大,但其作為一種典型的陰生植物,人工培育需要在遮蔭環(huán)境下進(jìn)行,而這種獨(dú)特的培養(yǎng)環(huán)境容易誘發(fā)多種病害問題,如何準(zhǔn)確識(shí)別其各種病害已成為一個(gè)亟待解決的問題。
傳統(tǒng)三七葉片病害的檢測(cè)方法主要包括人工識(shí)別和生物試劑檢測(cè)等。王志敏等提出使用人工檢疫法來(lái)識(shí)別三七的若干種病害。楊濤等提出使用人工抗病性鑒定識(shí)別三七的病害。李欣采用基因生物學(xué)方法對(duì)三七的多種病害進(jìn)行檢測(cè)。傳統(tǒng)病害檢測(cè)方法實(shí)時(shí)性不高,由于病害種類的多樣性,識(shí)別的準(zhǔn)確性也難以保證。隨著病害檢測(cè)技術(shù)的發(fā)展,傳統(tǒng)圖像處理方法被用于農(nóng)作物的病害檢測(cè),這些方法基于閾值分割,顏色空間轉(zhuǎn)換等技術(shù),識(shí)別精度高于人工識(shí)別方法,但算法的構(gòu)建比較復(fù)雜,檢測(cè)速度較慢。
近年來(lái),深度學(xué)習(xí)技術(shù)快速發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法不需要人為設(shè)計(jì)復(fù)雜的特征,它能自動(dòng)提取圖像中的各種抽象特征,并根據(jù)提取結(jié)果進(jìn)行目標(biāo)的分類和定位,大幅提高了目標(biāo)檢測(cè)效率。研究者們引入了多種基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法用于農(nóng)作物病害檢測(cè)。Patarapuwadol等使用YOLOv3算法進(jìn)行水稻病害的檢測(cè),并將算法部署到了服務(wù)器端。黃麗明等將改進(jìn)后的YOLOv4算法用于松材線蟲病的檢測(cè),檢測(cè)的平均精度達(dá)到了80.85%。Tassis等將多種卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行集成用于咖啡作物的病蟲害檢測(cè),該網(wǎng)絡(luò)不僅能夠達(dá)到很好的檢測(cè)效果,而且適合于客戶端部署。李就好等將改進(jìn)后的Faster-RCNN算法用于苦瓜葉片的病害檢測(cè),平均檢測(cè)精度達(dá)到了86.39%。Sun等改進(jìn)了SSD算法,提出了MEAN-SSD算法并將其用于蘋果葉片病害的檢測(cè),平均檢測(cè)精度達(dá)到了83.12%?;谏疃葘W(xué)習(xí)的目標(biāo)檢測(cè)算法,具有檢測(cè)速度快、檢測(cè)精度高的特點(diǎn),這為農(nóng)作物的病害檢測(cè)問題提供了新的方法。
在三七葉片的病害檢測(cè)中,使用計(jì)算機(jī)視覺技術(shù)進(jìn)行識(shí)別的案例極少。羅匡男等使用傳統(tǒng)圖像算法結(jié)合機(jī)器學(xué)習(xí)算法對(duì)三七葉片典型病害進(jìn)行檢測(cè),平均準(zhǔn)確率均達(dá)到80%以上。但該方法需要人工選取閾值以提取葉片病害的邊緣信息,閾值選取的好壞會(huì)對(duì)檢測(cè)結(jié)果產(chǎn)生很大影響,且該方法僅針對(duì)三七葉片的兩種病害,其余種類的病害檢測(cè)并未涉及,算法缺少普適性。曹春號(hào)使用Faster-RCNN算法配合手機(jī)App實(shí)現(xiàn)了三七葉片病害的在線檢測(cè)。該方法克服了人為設(shè)計(jì)特征量的缺點(diǎn),并且能檢測(cè)多種病害,提高了三七葉片病害檢測(cè)的實(shí)時(shí)性和準(zhǔn)確性。但Faster-RCNN的模型結(jié)構(gòu)十分龐大,算法的檢測(cè)速度較慢,不適合在移動(dòng)設(shè)備中部署。熊凱使用不同版本的YOLOv5算法進(jìn)行三七葉片病害的檢測(cè),檢測(cè)的平均精度最高達(dá)到了89.22%。YOLOv5是YOLO系列算法截至目前的最新版,檢測(cè)速度和精度都能達(dá)到較高標(biāo)準(zhǔn),但算法實(shí)現(xiàn)比較復(fù)雜。
為了獲得兼具速度和精度且易于實(shí)現(xiàn)的病害檢測(cè)方法,研究者通常會(huì)選擇YOLOv3算法。但在三七葉片的病害檢測(cè)中存在病害區(qū)域密集和病害區(qū)域小的問題,YOLOv3算法對(duì)于密集目標(biāo)和小目標(biāo)的檢測(cè)能力有限,當(dāng)病害區(qū)域過小或過于密集時(shí),容易出現(xiàn)漏檢現(xiàn)象,為了解決這些問題,本文改進(jìn)了YOLOv3算法,引入注意力特征金字塔解決YOLOv3特征金字塔特征融合時(shí)的噪聲干擾問題。引入雙瓶頸層對(duì)注意力特征金字塔的輸出特征再次篩選,獲取核心特征,舍棄無(wú)效特征,提高模型的魯棒性,綜合兩種改進(jìn)方法提出了AD-YOLOv3算法用于三七葉片病害的檢測(cè)。
YOLO系列算法通過卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像進(jìn)行特征提取,對(duì)提取結(jié)果進(jìn)行一系列后處理,最后根據(jù)處理結(jié)果進(jìn)行目標(biāo)檢測(cè)。相比于其他目標(biāo)檢測(cè)算法,YOLO算法的特點(diǎn)是兼具精度和速度,這使得工程部署成為可能。YOLOv3作為YOLO系列的第三個(gè)版本,其使用了新型特征提取網(wǎng)絡(luò)Darknet53,增強(qiáng)了主干網(wǎng)絡(luò)的特征提取能力。此外還引入了多尺度檢測(cè),提高目標(biāo)檢測(cè)的精度和效率。YOLOv3進(jìn)行目標(biāo)檢測(cè)時(shí)會(huì)將圖像分成個(gè)網(wǎng)格,每個(gè)網(wǎng)格配備三種大小不同的邊框作為初始檢測(cè)框,每個(gè)檢測(cè)框有5個(gè)參數(shù),代表該檢測(cè)任務(wù)中目標(biāo)的類別總數(shù),5個(gè)參數(shù)分別表征檢測(cè)框中心的橫縱坐標(biāo),框的寬度和高度,以及框中含有目標(biāo)的置信度,通過反復(fù)調(diào)整檢測(cè)框與實(shí)際目標(biāo)的位置來(lái)匹配目標(biāo),最后通過非極大值抑制(Non-Maximum Suppression,NMS)算法進(jìn)行檢測(cè)框的最后確定。
本研究使用注意力特征金字塔(Attention Feature Pyramid,AFP)替代了原始特征金字塔結(jié)構(gòu),并且引入了雙瓶頸層(Dual-Bottleneck,DB)對(duì)提取的特征進(jìn)行后處理,改進(jìn)后的算法稱為AD-YOLOv3,其結(jié)構(gòu)如圖1所示。
AD-YOLOv3使用Darknet53作為特征提取網(wǎng)絡(luò)對(duì)輸入圖像進(jìn)行特征提取,與YOLOv3算法不同的是,AD-YOLOv3在特征提取完畢后使用注意力特征金字塔對(duì)提取到的特征進(jìn)行聚合與篩選,然后使用雙瓶頸層對(duì)特征進(jìn)行增強(qiáng),最后通過后續(xù)卷積層進(jìn)行處理得到3種不同尺寸(20×20×33、40×40×33、80×80×33)的特征圖進(jìn)行檢測(cè),特征圖尺寸的前兩個(gè)維度代表其寬度和高度,最后一個(gè)維度代表檢測(cè)數(shù)據(jù),由于需檢測(cè)的病害一共有6種,特征圖的每個(gè)網(wǎng)格有3種檢測(cè)框,由前一節(jié)公式可得各尺寸特征圖上均預(yù)測(cè)33個(gè)數(shù)據(jù)。
圖1 AD-YOLOv3與改進(jìn)模塊結(jié)構(gòu)Fig.1 AD-YOLOv3 and improved module structure
1.2.1 注意力特征金字塔(AFP)
特征金字塔作為一種融合信息的結(jié)構(gòu),其工作流程為:從原始圖像開始進(jìn)行特征提取,直至最深層特征圖。使用最深層特征圖作為第一個(gè)預(yù)測(cè)特征層,同時(shí)對(duì)其進(jìn)行上采樣,使其尺寸擴(kuò)大為原來(lái)的兩倍,然后與淺層特征圖進(jìn)行融合得到新特征圖進(jìn)行預(yù)測(cè)。
特征金字塔的優(yōu)勢(shì)是將淺層特征與深層特征進(jìn)行融合,從而豐富預(yù)測(cè)特征層上的語(yǔ)義信息,增強(qiáng)算法對(duì)小目標(biāo)和密集目標(biāo)的檢測(cè)能力。特征金字塔結(jié)構(gòu)的問題在于深淺層特征圖進(jìn)行特征融合時(shí),特征圖本身的噪聲特征也會(huì)被融合,進(jìn)而干擾預(yù)測(cè)特征層上的預(yù)測(cè)效果。為了解決噪聲對(duì)于融合特征的干擾問題,本文采用注意力特征金字塔替代原始特征金字塔,將原始特征金字塔的輸出分別送入3個(gè)通道注意力模塊,其結(jié)構(gòu)如圖1a所示。
注意力特征金字塔由特征金字塔與通道注意力模塊(Channel Attention Module,CAM)組合而成。其核心的通道注意力模塊能夠?qū)μ卣鹘鹱炙诤系玫降牟煌卣鲌D按通道權(quán)重進(jìn)行重新劃分,強(qiáng)化有效特征的同時(shí)抑制噪聲,從而對(duì)特征金字塔的輸出進(jìn)行優(yōu)化,其結(jié)構(gòu)如圖 1b所示。
通道注意力模塊包含兩個(gè)分支,分別為掩碼分支和映射分支,掩碼分支對(duì)輸入特征圖的每個(gè)通道進(jìn)行壓縮和激活操作。本研究使用全局平均池化進(jìn)行壓縮,即對(duì)每個(gè)通道求平均值,用平均值表示通道的特征。相比于傳統(tǒng)的全局最大池化方式壓縮,全局平均池化能夠較好地保存特征信息,減少信息的丟失,擁有更好的壓縮效果。
特征圖經(jīng)過壓縮后需要進(jìn)行激活,即對(duì)各通道平均值進(jìn)行非線性處理,增強(qiáng)特征的表達(dá)能力,同時(shí)將輸出值限制在0~1內(nèi)以表示各通道的權(quán)重。權(quán)重值與映射分支的初始特征圖各通道相乘,即可得到按權(quán)重重新排列的特征圖。通道注意力模塊捕獲通道之間的相關(guān)性,聚焦重要特征的同時(shí)抑制干擾特征,提高檢測(cè)效果。
注意力特征金字塔通過特征金字塔與通道注意力模塊的組合,既能融合特征又能優(yōu)化特征表達(dá),能夠提升模型的整體檢測(cè)效果。
1.2.2 雙瓶頸層(DB)
YOLOv3算法中,對(duì)于特征金字塔提取到的特征只是通過簡(jiǎn)單的無(wú)殘差瓶頸塊進(jìn)行處理。這種處理過于簡(jiǎn)單,特征金字塔提取到的特征中的冗余部分會(huì)對(duì)最終檢測(cè)結(jié)果產(chǎn)生不良影響,所以特征金字塔的后處理模塊需要對(duì)特征進(jìn)行進(jìn)一步篩選,丟棄無(wú)關(guān)信息,只保留最有效信息,以達(dá)到最優(yōu)的檢測(cè)效果。因此提出雙瓶頸層對(duì)注意力特征金字塔提取到的特征進(jìn)行后處理,其結(jié)構(gòu)如圖1c所示。
雙瓶頸層中前一個(gè)瓶頸塊帶有特征融合的殘差結(jié)構(gòu),先用1×1尺寸卷積核對(duì)特征圖進(jìn)行卷積以降低維度減少計(jì)算量,然后使用3×3尺寸的卷積核提取特征并進(jìn)行升維,最后使用殘差結(jié)構(gòu)的跳連接與原特征圖進(jìn)行特征融合,殘差結(jié)構(gòu)在深層神經(jīng)網(wǎng)絡(luò)中可以有效應(yīng)對(duì)梯度消失問題,并且可以加快訓(xùn)練過程的收斂。第二個(gè)瓶頸塊不帶殘差結(jié)構(gòu),同樣先對(duì)輸入的高維特征進(jìn)行降維以減少模塊參數(shù)量,然后再進(jìn)行特征提取并升維,此時(shí)特征信息已足夠豐富,后一個(gè)瓶頸塊不再進(jìn)行殘差連接,減少計(jì)算資源的消耗。雙瓶頸層中的兩次降維卷積會(huì)造成特征的丟失,但其后的升維卷積可以通過有損特征進(jìn)行整體特征重構(gòu),增強(qiáng)特征表達(dá)的魯棒性。重構(gòu)特征與原始特征相比,削弱了原始特征中的無(wú)關(guān)信息,并對(duì)有效特征進(jìn)行了增強(qiáng),因此雙瓶頸層結(jié)構(gòu)能夠?qū)W習(xí)到數(shù)據(jù)中更重要的特征。
通過兩種瓶頸塊的組合,擴(kuò)展了后處理卷積層的深度,使得網(wǎng)絡(luò)的學(xué)習(xí)能力進(jìn)一步增強(qiáng)。注意力特征金字塔提取到的特征經(jīng)過雙瓶頸層的反復(fù)升降維處理,得到最簡(jiǎn)潔有效的特征表達(dá)形式,增強(qiáng)了特征的特異性,從而達(dá)到更好的檢測(cè)效果。
本次試驗(yàn)數(shù)據(jù)集三七葉片病害圖像采集地點(diǎn)為云南省紅河州滬西縣午街鋪鎮(zhèn)昆明理工大學(xué)三七控水減排提質(zhì)增效關(guān)鍵技術(shù)研究與示范基地(24°25′~24°36′N,103°42′~105°35′E,海拔1 796 m),采集方式為基地?cái)z像頭拍攝,采集到明暗程度、葉片大小、病害種類各不相同的三七葉片圖片共1 886張,全部裁剪到640×640像素大小,使用LabelImg工具對(duì)圖片進(jìn)行標(biāo)注,最后按約8∶1∶1的比例將所有圖片劃分為訓(xùn)練集,驗(yàn)證集和測(cè)試集,其中訓(xùn)練集1 500張,驗(yàn)證集186張,測(cè)試集200張。數(shù)據(jù)集中包含的各類病害圖片數(shù)量如表1所示。
表1 各類病害圖像數(shù)量表Table 1 Number of images of various diseases
數(shù)據(jù)集中葉片病害一共有6類,分別為疫病、黃銹病、炭疽病、白粉病、圓斑病、病毒病。在試驗(yàn)中為了方便,將6種病害標(biāo)記為類別1~6,病害典型樣本如圖 3所示。
本文全部試驗(yàn)由單計(jì)算機(jī)完成,計(jì)算機(jī)硬件配置為Intel Core i5-3470 CPU@3.2GHz,GeForce RTX 2060Super GPU,16G運(yùn)行內(nèi)存,操作系統(tǒng)為64位Windows 10,Pytorch深度學(xué)習(xí)框架,Python3.7編程語(yǔ)言,CUDA11.0 GPU加速庫(kù)。
訓(xùn)練過程中的批量尺寸(Batchsize)設(shè)置為8,初始學(xué)習(xí)率設(shè)置為0.01,動(dòng)量設(shè)置為0.937,總訓(xùn)練輪數(shù)(Epoch)設(shè)置為500,使用SGD優(yōu)化器進(jìn)行優(yōu)化,保存精度最高的一次和最后一次的模型參數(shù)。訓(xùn)練過程使用Warm up方法加快模型收斂速度。
圖3 三七葉片病害圖Fig.3 Leaf disease of Panax notoginseng
本研究使用精確率,召回率,整體精度1以及類別平均精度mAP指標(biāo)對(duì)試驗(yàn)結(jié)果進(jìn)行評(píng)估。精確率表征算法檢測(cè)到的所有目標(biāo)的準(zhǔn)確率,召回率表征算法檢測(cè)目標(biāo)的全面性,1精度表征算法在準(zhǔn)確率和召回率上的綜合性能,mAP表征算法在不同類別上的平均檢測(cè)精度。計(jì)算公式如下:
式中TP為算法檢測(cè)正確的目標(biāo)數(shù)量;FP為算法檢測(cè)錯(cuò)誤的目標(biāo)數(shù)量;FN為算法漏檢的目標(biāo)數(shù)量;為檢測(cè)的類別總數(shù);()為以召回率為自變量,精確率為因變量的函數(shù)。
使用AD-YOLOv3算法在數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試。訓(xùn)練過程的總損失下降過程如圖4所示。
圖4 訓(xùn)練過程參數(shù)指標(biāo)Fig.4 Parameters of training process
如圖4a所示,訓(xùn)練過程前50輪損失值下降速度最快,50輪之后損失下降速度逐漸變慢,在訓(xùn)練輪數(shù)達(dá)到500次時(shí),損失曲線趨近于平緩,表明模型精度已經(jīng)達(dá)到了穩(wěn)定值,模型訓(xùn)練過程完畢。如圖4b、4c所示,隨著訓(xùn)練輪數(shù)的增加,總損失下降的同時(shí),準(zhǔn)確率和召回率均不斷上升,訓(xùn)練至500輪時(shí),準(zhǔn)確率和召回率分別達(dá)到89.1%和93.6%,同時(shí)mAP曲線也隨訓(xùn)練輪數(shù)的增加而逐漸升高,最終各類型病害檢測(cè)的平均準(zhǔn)確率能達(dá)到80.6%,訓(xùn)練過程中各曲線走勢(shì)能夠反映出訓(xùn)練的有效性。
對(duì)AD-YOLOv3進(jìn)行消融試驗(yàn),各性能指標(biāo)如表2所示。由消融試驗(yàn)結(jié)果可得,使用注意力特征金字塔改進(jìn)后的模型在精確率上提升1.35個(gè)百分點(diǎn),1精度提升0.87個(gè)百分點(diǎn),mAP提升0.31個(gè)百分點(diǎn)。注意力特征金字塔對(duì)融合特征圖按權(quán)重進(jìn)行通道的重新排列,使算法聚焦重要特征通道,提升了檢測(cè)精度。使用雙瓶頸層改進(jìn)后的模型在精確率和1精度上提升不大,但mAP提升了0.81個(gè)百分點(diǎn)。雙瓶頸層主要用于對(duì)特征進(jìn)行再次篩選,篩選前需保證特征足夠精簡(jiǎn)。沒有注意力特征金字塔的情況下,進(jìn)入雙瓶頸層的特征包含了較多噪聲,篩選后的特征中也包含較多無(wú)用信息,所以單獨(dú)使用雙瓶頸層對(duì)精度的提升并不明顯。綜合使用雙瓶頸層與注意力特征金字塔后的模型在精確率提升了2.83個(gè)百分點(diǎn),1精度提升了1.68個(gè)百分點(diǎn),mAP提升了1.47個(gè)百分點(diǎn)。所有性能指標(biāo)提升比較明顯,得益于注意力特征金字塔和雙瓶頸層的聯(lián)合使用。因此,注意力特征金字塔可以提升算法的性能指標(biāo),雙瓶頸層能夠起到特征修正作用,兩者配合使用能夠?qū)崿F(xiàn)較好的性能提升,綜合使用兩種方法得到的AD-YOLOv3可以達(dá)到較好檢測(cè)效果。
AD-YOLOv3與其他算法模型的檢測(cè)性能對(duì)比如表3所示,試驗(yàn)對(duì)比了一階目標(biāo)檢測(cè)算法中的YOLOv3模型和使用了跨階段局部網(wǎng)絡(luò)(Cross Stage Partial Network,CSPNet)作為主干提取網(wǎng)絡(luò)的CSPYOLOv3模型,此外還對(duì)比了二階目標(biāo)檢測(cè)模型中檢測(cè)效果較好的Mask R-CNN。
表2 消融試驗(yàn)性能指標(biāo)對(duì)比Table 2 Conparision of performance of ablation experiment %
表3 不同模型檢測(cè)性能對(duì)比Table 3 Comparison of the model performance
由表3可知,AD-YOLOv3在所有類型病害的檢測(cè)中準(zhǔn)確率均優(yōu)于YOLOv3與CSPYOLOv3,在平均精度均值mAP上AD-YOLOv3低于二階檢測(cè)模型Mask-RCNN,但在炭疽病和圓斑病檢測(cè)中精度高于Mask-RCNN。AD-YOLOv3在6類病害的檢測(cè)中對(duì)白粉病的檢測(cè)效果較差,原因是白粉病的多數(shù)病害區(qū)域過小,在圖片中所占像素點(diǎn)極少,而YOLO系列算法恰好對(duì)于小目標(biāo)的檢測(cè)能力較弱,因此算法對(duì)白粉病的檢測(cè)效果不佳,而二階檢測(cè)算法Mask-RCNN對(duì)小目標(biāo)的檢測(cè)能力較強(qiáng),在白粉病的檢測(cè)中精度大幅領(lǐng)先YOLO系列算法。AD-YOLOv3對(duì)6類病害中圓斑病的檢測(cè)效果最好,原因是圓斑病的特征十分明顯,病害區(qū)域和葉片正常區(qū)域有明顯差異且病害區(qū)域較大,因此模型對(duì)圓斑病的檢測(cè)能夠達(dá)到較好效果。
實(shí)際病害檢測(cè)中,需要考慮到算法的檢測(cè)速度和模型的復(fù)雜度,二階檢測(cè)模型Mask-RCNN雖然精度高,但其構(gòu)成相對(duì)復(fù)雜,檢測(cè)速度慢,由表可知AD-YOLOv3每秒檢測(cè)的圖片數(shù)量幾乎是Mask-RCNN的60倍。而相比于原始YOLOv3,AD-YOLOv3在速度幾乎沒有損失的情況下實(shí)現(xiàn)了多方面性能的提升。
隨機(jī)選取含有少量病害、中等數(shù)量病害和密集病害且病害類型不同的多張圖片對(duì)YOLOv3和AD-YOLOv3進(jìn)行測(cè)試,典型檢測(cè)結(jié)果如圖5所示。
兩組圖片中圖I病害為病毒?。粓DII有兩種病害,類別2為黃銹病,類別5為圓斑??;圖III病害為黃銹病。圖I中AD-YOLOv3模型檢測(cè)出病毒病的置信度為83%,高于YOLOv3模型的46%;圖II中,AD-YOLOv3模型對(duì)于黃銹病的檢測(cè)置信度為84%,高于YOLOv3模型的64%。發(fā)病區(qū)域最多的圖III中,AD-YOLOv3模型對(duì)于所有病害區(qū)域的置信度均高于YOLOv3。置信度的提高說(shuō)明AD-YOLOv3獲取到了圖像中更豐富的語(yǔ)義信息,而語(yǔ)義信息的豐富得益于算法中深層特征圖和淺層特征圖的融合,融合后的特征圖能夠達(dá)到更好的檢測(cè)效果。
圖5 置信度對(duì)比圖Fig.5 Confidence comparison
不同三七葉片的病害情況不同,有些葉片存在多種病害,有些葉片存在多個(gè)病害區(qū)域,人工檢測(cè)容易漏檢,而使用計(jì)算機(jī)檢測(cè)能夠提高檢測(cè)精度。在測(cè)試集中隨機(jī)選取多張存在易漏檢病害區(qū)域的圖片,分別使用YOLOv3和AD-YOLOv3進(jìn)行檢測(cè),典型檢測(cè)結(jié)果如圖6所示。
兩種模型對(duì)密集病害的檢測(cè)結(jié)果如表4所示。YOLOv3在圖1和圖2的大量炭疽病區(qū)域檢測(cè)中存在漏檢現(xiàn)象,在圖3的白粉病和病毒病混雜的病害區(qū)域中存在白粉病區(qū)域的漏檢現(xiàn)象,漏檢區(qū)域在AD-YOLOv3檢測(cè)結(jié)果圖中已用箭頭標(biāo)出。AD-YOLOv3檢測(cè)出了不同種類病害中所有病害區(qū)域,未出現(xiàn)漏檢,檢測(cè)能力明顯增強(qiáng)。在密集病害區(qū)域的檢測(cè)中,重疊的病害區(qū)域容易被忽略,注意力特征金字塔通過通道注意力模塊對(duì)融合特征按權(quán)重重新進(jìn)行排列,高權(quán)值特征通道的特征會(huì)更加顯著,即使密集區(qū)域發(fā)生了重疊現(xiàn)象,該區(qū)域特征也會(huì)因?yàn)槠涓邫?quán)重而得到保留,在一定程度上解決了因重疊造成的密集區(qū)域漏檢現(xiàn)象。因此,注意力特征金字塔的引入有助于解決密集區(qū)域病害的檢測(cè)問題。試驗(yàn)表明,AD-YOLOv3在密集區(qū)域病害的檢測(cè)中表現(xiàn)更好。
圖6 密集病害檢測(cè)Fig.6 Detection results of dense disease
表4 密集病害檢測(cè)結(jié)果統(tǒng)計(jì)表Table 4 Detection results of dense disease summary table
YOLO算法對(duì)于小目標(biāo)的檢測(cè)能力較弱,三七葉片病害中存在較多發(fā)病面積小的病害,主要類型為早期炭疽病以及早期黃銹病以及極小區(qū)域的白粉病。為驗(yàn)證AD-YOLOv3對(duì)小區(qū)域病害的檢測(cè)效果,從測(cè)試集小面積病害圖片中選取多張含有典型早期黃銹病和早期炭疽病區(qū)域的圖片進(jìn)行測(cè)試,其典型檢測(cè)結(jié)果如圖7所示。
如圖7所示,在不同病害類型的葉片中,原始YOLOv3模型對(duì)于小區(qū)域病害的檢測(cè)均有漏檢現(xiàn)象,漏檢區(qū)域在AD-YOLOv3檢測(cè)結(jié)果圖中用箭頭標(biāo)出。圖中病害區(qū)域小,分辨率低,在固定區(qū)域中能反映的信息少,卷積神經(jīng)網(wǎng)絡(luò)提取特征過程中經(jīng)過多次下采樣,很多小區(qū)域病害的特征信息已經(jīng)丟失,導(dǎo)致小區(qū)域病害的漏檢。AD-YOLOv3引入注意力特征金字塔對(duì)深層特征圖進(jìn)行上采樣,通過深層特征信息對(duì)圖像中的原始語(yǔ)義信息進(jìn)行重構(gòu),最后將兩者融合,使病害區(qū)域淺層位置信息和深層語(yǔ)義信息都能在融合特征圖上進(jìn)行反映,后續(xù)雙瓶頸層對(duì)融合特征圖進(jìn)一步篩選,得到準(zhǔn)確的小區(qū)域病害的特征信息,明顯改善了小區(qū)域病害的檢測(cè)效果。試驗(yàn)表明,引入了注意力特征金字塔和雙瓶頸層結(jié)構(gòu)的AD-YOLOv3能更好地檢測(cè)出容易被忽略的小區(qū)域病害,在實(shí)際檢測(cè)中能夠達(dá)到更好的檢測(cè)效果。
圖7 小區(qū)域病害檢測(cè)Fig.7 Detection results of small region
算法的魯棒性是指算法在各種干擾情況下保持正常工作的能力,三七葉片病害的實(shí)際檢測(cè)中存在各種環(huán)境干擾問題,例如在拍攝葉片圖片時(shí)可能存在光線不足,雨霧干擾等問題,這就要求算法有較強(qiáng)的魯棒性,能夠在有干擾的情況下保證檢測(cè)的準(zhǔn)確性。隨機(jī)選取測(cè)試圖片并對(duì)圖片進(jìn)行霧化、加雨、降低亮度處理,并比較YOLOv3和AD-YOLOv3在霧,雨,暗光條件下的檢測(cè)效果,結(jié)果如圖8所示。
處于濃霧環(huán)境中的葉片病害類型分別為早期黃銹病和圓斑病。處于雨水環(huán)境中葉片病害為圓斑病與早期黃銹病,處于暗光條件下葉片病害類型為早期黃銹病。由3種干擾情況下檢測(cè)結(jié)果可看出,在濃霧環(huán)境中,兩種算法都能夠檢測(cè)出病害區(qū)域,但AD-YOLOv3檢測(cè)出的結(jié)果置信度明顯高于YOLOv3;在雨水和暗光條件下,YOLOv3出現(xiàn)了漏檢現(xiàn)象,漏檢區(qū)域在圖8中用箭頭標(biāo)出。霧,雨,暗光條件都會(huì)給檢測(cè)帶來(lái)困難,這是由于干擾因素改變了圖像中的原始特征,卷積神經(jīng)網(wǎng)絡(luò)提取到的特征中包含了很多干擾信息,病害的表征受到了噪聲影響,因此一些病害就可能無(wú)法被檢出,為了應(yīng)對(duì)這種情況,就需要提升算法的魯棒性。AD-YOLOv3使用了注意力特征金字塔對(duì)不同尺度的特征圖進(jìn)行特征的一次聚焦,關(guān)注重要特征的同時(shí)弱化干擾特征。通過特征的初次篩選后,特征又經(jīng)過雙瓶頸層進(jìn)行二次篩選,兩次特征篩選過程使AD-YOLOv3有很強(qiáng)的魯棒性,提升了算法在干擾環(huán)境下的檢測(cè)能力。試驗(yàn)和理論兩方面都證明注意力特征金字塔和雙瓶頸層結(jié)構(gòu)增強(qiáng)了算法的魯棒性,AD-YOLOv3更適合實(shí)際環(huán)境下的三七葉片病害檢測(cè)。
圖8 算法魯棒性對(duì)比Fig.8 Comparison of algorithm robustness
本研究使用YOLOv3作為基礎(chǔ)檢測(cè)算法,使用注意力特征金字塔替換原算法中的特征金字塔,并在注意力特征金字塔結(jié)構(gòu)后插入了雙瓶頸層結(jié)構(gòu),對(duì)改進(jìn)后的算法使用含有6種葉片病害的數(shù)據(jù)集進(jìn)行訓(xùn)練,最后比較了改進(jìn)算法與原算法在小目標(biāo)病害和密集數(shù)量病害以及各種干擾環(huán)境下的檢測(cè)效果,得出如下結(jié)論:
1)相比于原始YOLOv3算法,注意力特征金字塔和雙瓶頸層均能提升算法的檢測(cè)精確率和平均精度均值。注意力特征金字塔的引入對(duì)算法的精確率提升明顯,雙瓶頸層的引入對(duì)于算法平均精度均值的提升明顯。
2)改進(jìn)算法在檢測(cè)速度不變的情況下對(duì)6種病害的檢測(cè)精確率均優(yōu)于原始算法,注意力特征金字塔與雙瓶頸層的引入對(duì)檢測(cè)速度影響很小。
3)改進(jìn)算法在小目標(biāo)病害和密集病害的檢測(cè)上均優(yōu)于原始算法并且算法的魯棒性得到提升。相比于原始算法,改進(jìn)算法的精確率提升了2.83個(gè)百分點(diǎn),1精度提升了1.68個(gè)百分點(diǎn),平均精度均值提升了1.47個(gè)百分點(diǎn),性能指標(biāo)提升明顯。改進(jìn)算法在霧、雨、暗光等干擾環(huán)境下也能達(dá)到較好檢測(cè)效果。