游子繹, 王文瑾, 邵歷江, 郭 丹, 吳松青, 黃世國(guó)2,*, 張飛萍
1福建農(nóng)林大學(xué)林學(xué)院,福建 福州 350002; 2福州農(nóng)林大學(xué)生態(tài)公益重大有害生物防控福建省高校重點(diǎn)實(shí)驗(yàn)室,福建 福州 350002; 3福建農(nóng)林大學(xué)計(jì)算機(jī)與信息學(xué)院,福建 福州 350002
松材線蟲病Bursaphelenchusxylophilus(Steiner et Buhrer) Nickle是一種危害松科植物的林業(yè)檢疫性有害生物,已在我國(guó)造成較大危害(葉建仁,2019)。該病主要通過(guò)媒介昆蟲松墨天牛MonochamusalternatusHope擴(kuò)散蔓延,而該蟲具有選擇衰弱、瀕死松樹產(chǎn)卵的習(xí)性。準(zhǔn)確監(jiān)測(cè)和定位林分中的松枯死樹,并對(duì)其及時(shí)進(jìn)行無(wú)害化處理,是防治松材線蟲病的核心措施之一(李成和劉波,2021)。長(zhǎng)期以來(lái)我國(guó)主要采用地面人工普查、目測(cè)方法進(jìn)行松枯死樹的監(jiān)測(cè)定位。然而,由于山地地形復(fù)雜、林層多樣、交通不便以及地面人工普查存在成本高、效率低等,大量的松枯死樹不能被及時(shí)發(fā)現(xiàn)和無(wú)害化處理,已成為影響松材線蟲病防治的重要因素之一。
隨著無(wú)人機(jī)和數(shù)字圖像等技術(shù)的快速發(fā)展,利用無(wú)人機(jī)快速獲取林分彩色(red-green-blue color space, RGB)遙感影像監(jiān)測(cè)定位野外松枯死樹,具有高效、精準(zhǔn)、低成本、受地形因子限制小等優(yōu)勢(shì),具有廣闊的應(yīng)用前景。但由于無(wú)人機(jī)獲取的影像數(shù)據(jù)量大,人工判讀存在工作量大、時(shí)效性差等問(wèn)題,因此,利用計(jì)算機(jī)視覺技術(shù)自動(dòng)識(shí)別影像中的松枯死樹已成為生產(chǎn)應(yīng)用上亟待解決的問(wèn)題(地力夏提·包爾漢,2021)。對(duì)此,國(guó)內(nèi)外進(jìn)行了大量相關(guān)研究,如:尹華陽(yáng)等(2020)采用傳統(tǒng)機(jī)器學(xué)習(xí)方法,利用手工設(shè)計(jì)的特征通過(guò)算子提取松枯死樹的特征,然后應(yīng)用分類器進(jìn)行識(shí)別,取得了良好的效果;陳魏冬(2018)、陶歡等(2019)研究發(fā)現(xiàn),在“色調(diào)—飽和度—明度”(hue-saturation-value, HSV)色彩空間和LAB (CIELab color space)色彩空間中,可以識(shí)別出在RGB色彩空間中無(wú)法識(shí)別的松枯死樹。
隨著深度學(xué)習(xí)技術(shù)的逐漸成熟(Dosovitskiyetal.,2020),利用該方法替代傳統(tǒng)的機(jī)器學(xué)習(xí)方法被廣泛用于松枯死樹的監(jiān)測(cè)研究(Dengetal.,2019)。相較于傳統(tǒng)機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)不需要手工提取特征,而是使用自動(dòng)設(shè)計(jì)特征提取的方法,自動(dòng)抽取無(wú)人機(jī)拍攝的松枯死樹低層的細(xì)節(jié)信息和高層的語(yǔ)義信息,并通過(guò)信息融合的方式實(shí)現(xiàn)識(shí)別,其識(shí)別性能顯著高于傳統(tǒng)方法。因此,深度學(xué)習(xí)算法等已成為松枯死樹識(shí)別最重要的方法(李浩等,2021; 劉順利等,2022; Wuetal.,2021)。
盡管將深度學(xué)習(xí)算法應(yīng)用于松枯死樹的監(jiān)測(cè)研究中取得了很高的精度,但在實(shí)踐應(yīng)用中還存在一些局限性。首先,對(duì)于松材線蟲病防治而言,全面徹底無(wú)害化處置松枯死樹是其中關(guān)鍵的環(huán)節(jié),這就要求對(duì)松枯死樹的監(jiān)測(cè)和識(shí)別有高準(zhǔn)確率的同時(shí)還要有低漏檢率。現(xiàn)有研究雖已有了較高的精度,但是對(duì)識(shí)別誤差的分析表明,漏檢是當(dāng)前誤差的主要來(lái)源。其次,現(xiàn)有研究大多在特定飛行高度、小面積林分等場(chǎng)景下進(jìn)行,但由于野外地形的復(fù)雜多變,在野外大面積實(shí)踐應(yīng)用中往往需要提高無(wú)人機(jī)飛行高度以便提高效率,這也導(dǎo)致識(shí)別的性能降低。造成上述問(wèn)題的一個(gè)重要原因在于現(xiàn)有深度學(xué)習(xí)算法僅在RGB空間進(jìn)行分析,對(duì)不同顏色空間的信息利用缺乏研究。
鑒于此,本研究在生產(chǎn)應(yīng)用實(shí)際場(chǎng)景下,利用無(wú)人機(jī)采集大面積松材線蟲病發(fā)生林分的RGB遙感影像。在此基礎(chǔ)上,應(yīng)用多種基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法識(shí)別松枯死樹,在篩選出性能最優(yōu)算法的基礎(chǔ)上,充分利用不同色彩空間存在的互補(bǔ)作用(Gowda &Yuan,2018),進(jìn)一步挖掘在多個(gè)色彩空間的目標(biāo)檢測(cè)結(jié)果,達(dá)到降低漏檢率并提高識(shí)別性能的目的,以期建立一種滿足生產(chǎn)實(shí)踐需求,能夠及時(shí)、高效、省時(shí)省力地從大面積林分中準(zhǔn)確識(shí)別松枯死樹的技術(shù),為科學(xué)有效防治松材線蟲病提供技術(shù)支撐。
本研究設(shè)2個(gè)無(wú)人機(jī)航拍樣地:樣地1位于福建省福州市閩侯縣鴻尾鄉(xiāng)(118.97°E,26.147°N),屬南方典型丘陵地勢(shì),林地最高點(diǎn)海拔1037 m,林分構(gòu)成以馬尾松PinusmassonianaLamb.為主,混有杉木Cunninghamialanceolata(Lamb.) Hook.以及多種彩色闊葉樹或落葉闊葉樹,該樣地松材線蟲病發(fā)生嚴(yán)重,松枯死樹多;研究樣地2位于福建省莆田市仙游縣西天尾鎮(zhèn)(119.04°E,25.539°N),其林分類型也是馬尾松為優(yōu)勢(shì)種的馬、杉、闊混交林。
2020年11月,松樹受害枯死高峰期后,選擇晴朗天氣采集2個(gè)研究樣地的遙感影像。使用CW-007型固定翼無(wú)人機(jī)搭載CA-102型無(wú)人機(jī)相機(jī)(60 mm f/2.0G定焦鏡頭,分辨率7952×5304像素);根據(jù)地勢(shì)情況確定無(wú)人機(jī)飛行高度,樣地1為400~1200 m,樣地2為800 m左右,飛行速度均為20 m·s-1,均在最優(yōu)光照條件期間(10:00—15:00)飛行;采用定距曝光的方式航拍采集影像數(shù)據(jù)。樣地1采集遙感影像15個(gè)架次,總計(jì)飛行面積約368.1 km2。樣地2采集遙感影像2個(gè)架次,總計(jì)飛行面積約32.3 km2。遙感影像采集完成后,將每個(gè)架次拍攝的影像導(dǎo)入Pix4Dmapper軟件進(jìn)行圖像拼接,得到包含地理信息的完整航空?qǐng)D像,2個(gè)樣地共計(jì)獲得完整航空?qǐng)D像17張。
將樣地1每架次用Pix4D拼接好的RGB遙感影像數(shù)據(jù)等分為4096張圖像,共得到15×4096張圖像。參照李鳳迪(2020)的方法,應(yīng)用LabelImg軟件使用矩形框人工標(biāo)注每幅圖像中的松枯死樹,每個(gè)矩形框?qū)?yīng)一棵松枯死樹樣本,并將red標(biāo)簽作為松枯死樹類別標(biāo)簽,從而得到VOC格式數(shù)據(jù)集。標(biāo)注示例見圖1。人工標(biāo)注結(jié)果發(fā)現(xiàn),有松枯死樹的圖像3436張,標(biāo)注得到松枯死樹共9023棵。在完成標(biāo)注后,針對(duì)樣地1中連片或多棵松枯死樹聚集的樣本以及因圖像清晰度不高導(dǎo)致無(wú)法確定的樣本,采用人工地面踏查結(jié)合無(wú)人機(jī)低空巡查對(duì)松枯死樹標(biāo)注情況進(jìn)行實(shí)地驗(yàn)證,確保標(biāo)注準(zhǔn)確性和完整性。然后再按照0.35∶0.35∶0.30的比例隨機(jī)劃分訓(xùn)練集、驗(yàn)證集、測(cè)試集,對(duì)模型進(jìn)行訓(xùn)練。
圖1 枯死松樹樣本示例
采用當(dāng)前流行的目標(biāo)檢測(cè)算法YOLOv5作為松枯死樹識(shí)別模型。該模型根據(jù)殘差組件和卷積核數(shù)量從少到多可分為4個(gè)網(wǎng)絡(luò)結(jié)構(gòu),即YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x。由于航拍時(shí)間、天氣、地形因素等影響,獲取的松枯死樹大小、顏色、亮度、紋理、尺度等變化很大,因此使用殘差組件和卷積核數(shù)量最多的YOLOv5x網(wǎng)絡(luò)結(jié)構(gòu)。該結(jié)構(gòu)通過(guò)增加模型深度和寬度提高了網(wǎng)絡(luò)特征提取和特征融合的能力,能夠更好地應(yīng)對(duì)野外松枯死樹樣本特征復(fù)雜多變的情況。
在使用YOLOv5算法時(shí),本研究首先對(duì)輸入圖像通過(guò)Mosaic數(shù)據(jù)增強(qiáng)(隨機(jī)選取帶標(biāo)注的4張圖片,分別對(duì)4張圖片進(jìn)行翻轉(zhuǎn)、縮放、色域變化等操作,分別進(jìn)行圖片和框的組合),以隨機(jī)縮放、隨機(jī)裁剪、隨機(jī)排布的方式對(duì)圖片進(jìn)行拼接,然后將圖像按目標(biāo)檢測(cè)的通常做法自適應(yīng)縮放至608×608像素。同時(shí),在輸入卷積神經(jīng)網(wǎng)絡(luò)前,使用k-means算法和遺傳學(xué)習(xí)算法自適應(yīng)地生成與數(shù)據(jù)集匹配的先驗(yàn)框尺寸,避免人工設(shè)計(jì)的誤差。
采用CSPDarkNet53實(shí)現(xiàn)特征提取,該網(wǎng)絡(luò)包括了Focus結(jié)構(gòu)、CSP結(jié)構(gòu)和SPP結(jié)構(gòu)。在特征提取前使用Focus結(jié)構(gòu)進(jìn)行切片操作,將圖片隔像素取值并按區(qū)域劃分組合,得到4份圖像后再按通道融合。融合后的圖像經(jīng)CBL (conv-bn-leakyrelu)層通過(guò)卷積、批量歸一化和Leaky_ReLU函數(shù)激活,提取特定的局部圖像特征。YOLOv5在主干網(wǎng)絡(luò)(backbone)和模型頸部(neck)2部分均設(shè)計(jì)了CSP_X結(jié)構(gòu),本研究使用CSP1_12和CSP2_4結(jié)構(gòu)。SPP結(jié)構(gòu)使用濾波器為5×5、9×9、13×13的最大值池化提取不同尺度特征,再將原圖和池化后的3幅圖像疊加。同時(shí),模型頸部使用FPN+PAN的結(jié)構(gòu)。經(jīng)過(guò)特征提取和特征融合網(wǎng)絡(luò)后,得到3種不同尺寸的下采樣特征圖。計(jì)算定位損失采用了GIOU_Loss,對(duì)于多目標(biāo)框篩選采用DIOU_nms模塊。并最終輸出預(yù)測(cè)結(jié)果,從而實(shí)現(xiàn)多尺度網(wǎng)絡(luò)預(yù)測(cè)。
本研究以遷移學(xué)習(xí)的方式用Bdd100k數(shù)據(jù)(Yuetal.,2020)學(xué)習(xí)的權(quán)重參數(shù)初始化網(wǎng)絡(luò),然后對(duì)目標(biāo)數(shù)據(jù)集從頭開始訓(xùn)練,加快并優(yōu)化模型的學(xué)習(xí)效率。同時(shí),由于不同色彩空間在松枯死樹識(shí)別過(guò)程中存在互補(bǔ)性,本研究提出在深度學(xué)習(xí)的晚期階段結(jié)合不同色彩空間的信息以提高識(shí)別的性能。具體如下:首先將訓(xùn)練集RGB通道圖像分別轉(zhuǎn)化為L(zhǎng)AB通道圖像和HSV通道圖像,之后使用3個(gè)色彩通道的圖像分別進(jìn)行訓(xùn)練。訓(xùn)練出3個(gè)色彩通道的預(yù)測(cè)模型后,再分別對(duì)3個(gè)色彩通道圖像進(jìn)行預(yù)測(cè),匯總不同顏色空間的目標(biāo)預(yù)測(cè)邊界框,使用非極大值抑制(non-maximum suppression, NMS)算法保留置信度最高的候選框后,過(guò)濾交并比(IoU)大于0.5的其他候選框,解決松枯死樹重復(fù)計(jì)數(shù)的問(wèn)題,最終實(shí)現(xiàn)不同色彩空間的信息利用。
當(dāng)林分中存在沒(méi)有被檢測(cè)發(fā)現(xiàn)和無(wú)害化處置的松枯死樹,將顯著降低松材線蟲病的防治效果。因此,漏檢率(即召回率)即沒(méi)有被檢測(cè)到的松枯死樹樣本數(shù)是很重要的一個(gè)指標(biāo)。在現(xiàn)有松枯死樹識(shí)別研究采用的性能指標(biāo)中,一般采用平均準(zhǔn)確率去綜合考慮精確率和召回率,而沒(méi)有對(duì)精確率和召回率作進(jìn)一步分析(黃麗明等,2021),這導(dǎo)致該類研究的平均精度較高,但漏檢情況不明確。因此,本研究采用精確率(precision)、召回率(recall)、平均準(zhǔn)確率(average precision, AP)和F1分?jǐn)?shù)作為模型性能的評(píng)價(jià)指標(biāo)。其中,精確率是指正樣本預(yù)測(cè)數(shù)占樣本預(yù)測(cè)數(shù)的比例;召回率是指正樣本預(yù)測(cè)數(shù)占正樣本數(shù)的比例;平均準(zhǔn)確率是指精確率和召回率曲線(P-R曲線)下的面積,即為不同召回率的情況下所有精確率的平均值;F1分?jǐn)?shù)是指精確率和召回率的調(diào)和平均,是一種衡量二分類模型精準(zhǔn)度的指標(biāo),公式如下:
(1)
(2)
(3)
式(1)、(2)中TP、FP、FN的含義見表1混淆矩陣。
表1 混淆矩陣
YOLOv5模型使用Pytorch框架實(shí)現(xiàn),CPU為Intel Xeon Cascade Lake 8255C (2.5 GHz),內(nèi)存為32 GB,GPU為Tesla V100。為了說(shuō)明YOLOv5在松枯死樹識(shí)別中的性能情況,選擇幾種常見的基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法進(jìn)行對(duì)比,分別為Faster R-CNN、YOLOv3、YOLOv4、SSD和EfficientDet等目標(biāo)檢測(cè)模型。其中,YOLOv3、YOLOv4、Faster R-CNN與SSD模型已應(yīng)用到松枯死木識(shí)別中,EfficientDet模型(Tanetal.,2020)是新提出的性能較優(yōu)的目標(biāo)檢測(cè)模型。不同模型采用的框架見表2,其他參數(shù)設(shè)置:批量大小8,訓(xùn)練輪次300,學(xué)習(xí)速率0.001。
表2 不同深度學(xué)習(xí)算法使用的主干網(wǎng)絡(luò)
為進(jìn)一步測(cè)試模型性能,模擬實(shí)際生產(chǎn)應(yīng)用的場(chǎng)景。本研究在研究樣地1測(cè)試集的基礎(chǔ)上,以研究樣地2為新的測(cè)試集,并同樣采取人工地面踏查結(jié)合無(wú)人機(jī)低空飛行的方式,對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行驗(yàn)證,根據(jù)驗(yàn)證結(jié)果對(duì)模型性能進(jìn)行評(píng)價(jià)。
采用不同深度學(xué)習(xí)算法處理樣地1的數(shù)據(jù)集,得到RGB圖像空間下的松枯死樹識(shí)別精確率、召回率、平均準(zhǔn)確率及F1分?jǐn)?shù)見表3。從表中可以看出,不同算法的精確率高低依次為YOLOv5>EfficientDet>YOLOv4>SSD>YOLOv3>Faster R-CNN,YOLOv5模型在所有算法中最高,達(dá)到97.58%,說(shuō)明該算法能夠很好地識(shí)別出松枯死樹樣本,將松枯死樹誤分為負(fù)樣本的情況很少。Faster R-CNN的精確率最低,說(shuō)明該算法將松樹枯死誤分為負(fù)樣本的情況很多。不同算法的召回率大小次序?yàn)镕aster R-CNN>YOLOv5>YOLOv4>SSD>YOLOv3>EfficientDet,說(shuō)明Faster R-CNN算法將松枯死樹漏檢的情況較少,而YOLOv5算法的漏檢率僅比Faster R-CNN低,普遍優(yōu)于其他算法,EfficientDet則存在嚴(yán)重的漏檢情況,說(shuō)明不同算法在精確率和召回率指標(biāo)上有很大差異。不同算法的平均準(zhǔn)確率從高到低依次為YOLOv5>EfficientDet>YOLOv4>Faster R-CNN>SSD>YOLOv3。綜合考慮各項(xiàng)評(píng)價(jià)指標(biāo),YOLOv5是性能最優(yōu)的算法,其準(zhǔn)確率達(dá)到了82.40%,在精確率和召回率上取得了較優(yōu)的平衡。
表3 不同深度學(xué)習(xí)算法的性能評(píng)價(jià)
分別計(jì)算在RGB、LAB、HSV 3個(gè)色彩空間及其融合色彩空間中YOLOv5模型的識(shí)別性能,結(jié)果見表4:與RGB和LAB色彩空間相比,基于多色彩空間的精確率為77.51%,說(shuō)明不同色彩空間融合后錯(cuò)誤樣本判別數(shù)增加;基于多色彩空間的召回率為98.99%,而在單獨(dú)的色彩空間中,其召回率均低于80%,說(shuō)明結(jié)合了不同色彩空間的信息后,松枯死樹被漏判的情況顯著減少;基于多色彩空間的平均準(zhǔn)確率達(dá)到98.39%,遠(yuǎn)高于RGB空間的82.40%;基于多色彩空間的F1分?jǐn)?shù)也比獨(dú)立的色彩空間有明顯提升。
表4 YOLOv5算法在不同色彩空間的性能評(píng)價(jià)
進(jìn)一步對(duì)模型在不同色彩空間中的性能進(jìn)行可視化分析(圖2)。從圖中可以看出,圖2A中在RGB彩色空間中未檢測(cè)到3棵松樹,但在LAB空間中(圖2B)能夠全部檢測(cè)出圖像中的松枯死樹;在HSV空間中(圖2C)能夠檢測(cè)出RGB空間中遺漏的3棵樹,但RGB空間中能夠檢測(cè)出的部分目標(biāo)在HSV空間則未能檢測(cè)出。在圖2D的RGB空間中有一棵松樹被漏檢,在LAB空間(圖2E)也同樣未檢出,但在HSV空間中(圖2F)被檢出。上述結(jié)果說(shuō)明,不同色彩空間之間存在著較強(qiáng)的互補(bǔ)性。因此,將3個(gè)色彩空間的結(jié)果匯總后,通過(guò)NMS算法保留置信度最高的候選框后過(guò)濾交并比大于0.5的其他候選框,就可以利用不同色彩空間的檢測(cè)信息得到比單一色彩空間更優(yōu)的性能。
圖2 不同色彩通道下枯死松樹檢測(cè)示例
采用樣地2的數(shù)據(jù)驗(yàn)證YOLOv5算法在不同色彩空間的性能,結(jié)果見表5。從表中可以看出,基于多色彩空間的模型相對(duì)于單色彩空間的模型在精確率上略有下降,但是召回率顯著上升,說(shuō)明此前單一色彩空間中被遺漏的樣本經(jīng)過(guò)挖掘多色彩空間的信息后被預(yù)測(cè)出來(lái)。平均準(zhǔn)確率和F1分?jǐn)?shù)也顯著提高。綜合以上評(píng)價(jià)結(jié)果發(fā)現(xiàn),單色彩空間下模型性能伴隨著數(shù)據(jù)集的更換準(zhǔn)確率有所浮動(dòng),但是綜合利用多色彩空間信息的模型表現(xiàn)十分穩(wěn)定,性能相較于單色彩空間的模型均有明顯提升。
表5 YOLOv5算法在不同色彩空間性能的驗(yàn)證
本研究發(fā)現(xiàn),對(duì)比樣地1與樣地2的數(shù)據(jù),在LAB色彩空間和HSV色彩空間中的精確率、RGB色彩空間下的召回率差別較大。對(duì)此進(jìn)行了可視化分析,通過(guò)篩選被模型判定為正確,實(shí)際為錯(cuò)誤的樣本,發(fā)現(xiàn)誤差主要來(lái)源于幾方面。(1)闊葉樹的混入。在RGB圖像轉(zhuǎn)換為HSV圖像之后,考慮到HSV色彩通道圖像的特點(diǎn),不同色系的對(duì)比更加明顯,但是相同色系的對(duì)比被顯著弱化。在這種情況下,松枯死樹與闊葉樹的特征在圖像上看來(lái)十分接近。如圖3B所示,3個(gè)樣本在HSV圖像中極為相似,導(dǎo)致了誤判的發(fā)生。(2)紅土地的混入。由圖3C與圖3D可以看出,經(jīng)過(guò)色彩空間的轉(zhuǎn)換后,部分圖像中松枯死樹特征與紅土地特征相比更加相近。因此,外觀形狀接近于松枯死樹的紅土地會(huì)被機(jī)器誤判為正確樣本。(3)屋頂?shù)幕烊?。在LAB色彩空間下,屋頂?shù)奶卣鹘咏谒煽菟罉涞奶卣?圖3F),造成了在該色彩空間下有屋頂?shù)臉颖颈蛔R(shí)別為松枯死樹帶來(lái)誤差。上述三點(diǎn)對(duì)精確率帶來(lái)了影響,根據(jù)樣地的不同精確率會(huì)產(chǎn)生波動(dòng)。由于樣地2的航拍面積較小,遇到上述誤差來(lái)源少,因此精確率顯著高于樣地1。(4)松枯死樹連片導(dǎo)致矩形框框選不準(zhǔn)確。分析發(fā)現(xiàn),樣地2相對(duì)于樣地1存在更多松枯死樹連片的情況。在這種情況下,本模型在樣本框的預(yù)測(cè)上可能不準(zhǔn)確,即模型可以準(zhǔn)確預(yù)測(cè)連片區(qū)域,但無(wú)法準(zhǔn)確框選每個(gè)樣本。如圖3G所示,模型僅檢測(cè)出7個(gè)矩形框的結(jié)果,但經(jīng)過(guò)現(xiàn)場(chǎng)驗(yàn)證后實(shí)際結(jié)果共有13棵松枯死樹,這也導(dǎo)致了召回率的大幅降低。
圖3 誤差主要來(lái)源
目前,利用基于深度學(xué)習(xí)的計(jì)算機(jī)視覺方法判別松材線蟲病發(fā)生林分中的松枯死樹研究取得了重要進(jìn)展,一些模型已在我國(guó)被嘗試用于生產(chǎn)實(shí)踐中。但由于建模樣本量少、評(píng)價(jià)方法單一和模型先天缺陷等,實(shí)踐中上述模型對(duì)松枯死樹樣本識(shí)別準(zhǔn)確性不高,特別是漏檢造成識(shí)別性能降低。此外,現(xiàn)有研究樣本數(shù)據(jù)集的采集均存在無(wú)人機(jī)飛行高度較低且單一的局限性,其飛行高度均在600 m以內(nèi),且研究樣地較為集中,因此研究結(jié)果往往十分理想,但忽視了大面積野外作業(yè)條件的復(fù)雜性。顯然,無(wú)人機(jī)低空飛行采集數(shù)據(jù)擁有更高的識(shí)別準(zhǔn)確率,但實(shí)踐中進(jìn)行大面積樣地飛行時(shí),無(wú)人機(jī)航拍需根據(jù)樣地高程情況決定航拍高度,無(wú)法以單一飛行高度進(jìn)行所有航拍圖像的采集,這是導(dǎo)致上述模型在應(yīng)用實(shí)踐中存在局限性的主要原因。
針對(duì)以上問(wèn)題,本研究根據(jù)實(shí)際生產(chǎn)應(yīng)用的場(chǎng)景,提出了一種基于深度學(xué)習(xí)的松枯死樹檢測(cè)方法,通過(guò)建立大數(shù)據(jù)量的數(shù)據(jù)集,選擇多種深度學(xué)習(xí)算法,對(duì)目標(biāo)檢測(cè)模型進(jìn)行訓(xùn)練,篩選出平均準(zhǔn)確率最高的深度學(xué)習(xí)模型,并通過(guò)綜合多個(gè)色彩空間信息的方式,明顯減少了松枯死樹漏檢的情況,提高了松枯死樹的識(shí)別準(zhǔn)確率。與前人的研究相比,一方面,本研究采集的數(shù)據(jù)集樣本量大,經(jīng)驗(yàn)證過(guò)的松枯死樹樣本量超過(guò)9000株,遠(yuǎn)高于現(xiàn)有研究的數(shù)據(jù)量,確保深度學(xué)習(xí)技術(shù)可以更加準(zhǔn)確、高效地從樣本中提取松枯死樹的目標(biāo)特征。另一方面,本研究通過(guò)收集不同飛行高度下的航拍圖像,獲得了更加豐富的樣本數(shù)據(jù),不會(huì)因?yàn)檫^(guò)高或過(guò)低的飛行高度影響識(shí)別準(zhǔn)確率。
此外,本研究將Faster R-CNN、YOLOv3、YOLOv4、YOLOv5、SSD和EfficientDet等6個(gè)深度學(xué)習(xí)算法用于松枯死樹識(shí)別,并采用精確率、召回率、平均準(zhǔn)確率及F1分?jǐn)?shù)4個(gè)評(píng)價(jià)指標(biāo)對(duì)不同模型進(jìn)行全面評(píng)價(jià)和對(duì)比分析,發(fā)現(xiàn)YOLOv5目標(biāo)檢測(cè)算法的性能明顯優(yōu)于Faster R-CNN、YOLOv3等模型。在此基礎(chǔ)上進(jìn)一步有針對(duì)性地綜合利用多色彩空間的信息,使用NMS算法對(duì)不同色彩空間下的樣本進(jìn)行匯總,發(fā)現(xiàn)相對(duì)于單一色彩空間下的模型,充分利用多色彩空間信息的模型在召回率、平均準(zhǔn)確率和F1分?jǐn)?shù)上均有明顯提升,特別是召回率提升了15.74%以上,有效控制了松枯死樹漏檢的情況。
本研究可視化的定性分析結(jié)果也表明,不同色彩空間在進(jìn)行目標(biāo)檢測(cè)時(shí)存在著互補(bǔ)作用。在RGB顏色空間中存在特征模糊的樣本和小樣本漏檢的情況,在HSV和LAB空間中可以被檢出,這表明HSV和LAB空間具有更強(qiáng)的紅色特征提取能力,通過(guò)3種色彩空間的互補(bǔ),可以大幅減少樣本被漏檢的數(shù)量,從而有效提高目標(biāo)檢測(cè)的性能。本研究認(rèn)為,采用基于多色彩空間的YOLOv5目標(biāo)檢測(cè)模型是當(dāng)前更優(yōu)的檢測(cè)識(shí)別松枯死樹的方法,能夠滿足生產(chǎn)實(shí)踐的需求。