俞龍,黃楚斌,唐勁馳,黃浩宜,周運(yùn)峰,黃永權(quán),孫佳琪
(1.華南農(nóng)業(yè)大學(xué)電子工程學(xué)院(人工智能學(xué)院),廣東 廣州 510642;2.國(guó)家精準(zhǔn)農(nóng)業(yè)航空施藥技術(shù)國(guó)際聯(lián)合研究中心,廣東 廣州 510642;3.廣東省農(nóng)業(yè)科學(xué)院茶葉研究所/廣東省茶樹資源創(chuàng)新利用重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510640;4.華南農(nóng)業(yè)大學(xué)工程學(xué)院,廣東 廣州 510642)
【研究意義】長(zhǎng)期以來,中國(guó)茶產(chǎn)量和貿(mào)易量穩(wěn)居世界前列,對(duì)世界茶產(chǎn)業(yè)發(fā)展產(chǎn)生了重要影響[1]。進(jìn)入21 世紀(jì)以來,農(nóng)業(yè)勞動(dòng)力不斷向其他產(chǎn)業(yè)轉(zhuǎn)移,結(jié)構(gòu)性短缺和老齡化趨勢(shì)成為全球性問題[2]。隨著人們對(duì)茶葉的需求量越來越大,茶農(nóng)也需要加速茶葉制作生產(chǎn)的過程,而尤為迫切的是提高茶葉嫩芽采摘效率。現(xiàn)階段茶葉的采收方式主要以人工手采為主,機(jī)械化粗采為輔[3]。機(jī)械化粗采雖然解決了人工采摘耗費(fèi)人力巨大且效率低下的問題,但不能精確區(qū)分嫩芽與老葉。
【前人研究進(jìn)展】機(jī)器視覺技術(shù)是近20 年發(fā)展起來的一種新興檢測(cè)技術(shù),在農(nóng)產(chǎn)品的大小分級(jí)、形態(tài)檢測(cè)、顏色識(shí)別等方面應(yīng)用較多[4]。針對(duì)茶葉嫩芽識(shí)別問題,國(guó)內(nèi)外學(xué)者基于傳統(tǒng)機(jī)器視覺開展了許多研究。陳妙婷[5]基于改進(jìn)PSOSVM 算法對(duì)茶葉嫩芽圖像進(jìn)行分割以獲取嫩芽特征信息,并選擇YOLO 算法進(jìn)行嫩芽采摘點(diǎn)的識(shí)別,準(zhǔn)確率達(dá)到84%以上;唐仙等[6]對(duì)RGB 顏色模型的色差法(R-B)進(jìn)行分析,對(duì)比研究了多種閾值分割法的優(yōu)劣;段勇強(qiáng)等[7]基于改進(jìn)Kmeans 算法對(duì)富硒綠茶圖像進(jìn)行采集并識(shí)別其中的嫩芽,識(shí)別率最高達(dá)到95%,但該方法在圖片分辨率很高的情況下會(huì)嚴(yán)重影響聚類過程,存在一定的局限性;周穎穎等[8]基于傳統(tǒng)視覺技術(shù)對(duì)茶葉嫩芽圖像進(jìn)行分割后,再通過對(duì)分割后圖像的關(guān)鍵區(qū)域進(jìn)行色差判斷實(shí)現(xiàn)了龍井茶嫩芽的分級(jí)并提供了合理的采摘點(diǎn)。上述傳統(tǒng)機(jī)器視覺的方法雖然能較為準(zhǔn)確地識(shí)別茶葉嫩芽,但識(shí)別的圖片背景環(huán)境比較單一,對(duì)于復(fù)雜環(huán)境下的識(shí)別任務(wù)魯棒性較低,并且在選擇物體特征時(shí)需要人工進(jìn)行選擇,難以滿足更多的實(shí)際需求。在提取物體特征方面,基于深度網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法遠(yuǎn)超于傳統(tǒng)機(jī)器視覺方法。近年來,越來越多的學(xué)者將目標(biāo)檢測(cè)算法應(yīng)用于農(nóng)業(yè)檢測(cè)領(lǐng)域,代表算法有R-CNN[9]、Fast R-CNN[10]、Faster R-CNN[11]、YOLO(You Only Look Once)[12]及SSD(Single Shot MultiBox Detector)[13]等,它們?cè)谵r(nóng)業(yè)檢測(cè)領(lǐng)域不斷被改進(jìn)優(yōu)化[14],加速了農(nóng)業(yè)作物檢測(cè)領(lǐng)域的發(fā)展。黃河清等[15-16]基于Fcos[17]的思想,以Darknet19 為主干網(wǎng)絡(luò),連接特征金字塔進(jìn)行特征多尺度融合,訓(xùn)練完成后,將權(quán)重小于30%的通道刪除,實(shí)現(xiàn)了對(duì)柑橘的識(shí)別。在茶葉嫩芽識(shí)別領(lǐng)域中,張晴晴等[18]針對(duì)復(fù)雜場(chǎng)景下傳統(tǒng)嫩芽識(shí)別方法準(zhǔn)確率低的問題,提出一種基于改進(jìn)YOLOV3 模型的識(shí)別方法,提高模型對(duì)茶樹嫩芽的識(shí)別能力,但在茶樹冠層出現(xiàn)與嫩芽相似的其他作物或雜草時(shí),模型可能會(huì)出現(xiàn)誤檢。孫肖肖等[19]將深度學(xué)習(xí)與OSTU 算法結(jié)合,對(duì)茶葉嫩芽圖像進(jìn)行分割,使得茶葉嫩芽區(qū)域更加明顯,提高了檢測(cè)精度,但由于其茶葉嫩芽數(shù)據(jù)集中小目標(biāo)較少,會(huì)導(dǎo)致模型對(duì)目標(biāo)較小的茶葉嫩芽的檢測(cè)能力不強(qiáng),在實(shí)際場(chǎng)景中應(yīng)用時(shí),對(duì)于較小的茶葉嫩芽,會(huì)出現(xiàn)漏檢的情況。許高建等[20]選用基于不同特征提取網(wǎng)絡(luò)的Faster R-CNN網(wǎng)絡(luò)模型對(duì)茶葉嫩芽數(shù)據(jù)樣本進(jìn)行訓(xùn)練,得出基于VGG-16 網(wǎng)絡(luò)的Faster R-CNN 模型識(shí)別效果較好的結(jié)論。施瑩瑩等[21]基于YOLOv3 算法,通過單一的特征提取網(wǎng)絡(luò)進(jìn)行多尺度目標(biāo)檢測(cè),對(duì)自然環(huán)境下的茶葉嫩芽進(jìn)行識(shí)別時(shí)具有較高的召回率以及準(zhǔn)確度。王子鈺等[22]通過提取超綠因子對(duì)嫩芽圖像進(jìn)行預(yù)處理,利用SSD 模型進(jìn)行訓(xùn)練,實(shí)現(xiàn)對(duì)茶葉嫩芽的檢測(cè),但其并未就SSD 模型對(duì)小目標(biāo)檢測(cè)效果不好的問題進(jìn)行優(yōu)化。
【本研究切入點(diǎn)】目前,深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等技術(shù)手段發(fā)展迅速且日益成熟[23]。YOLO 系列算法為“one stage”目標(biāo)檢測(cè)算法,在不損失精度的同時(shí),具有較快的檢測(cè)速度。為改善上述方案的誤檢、漏檢等問題,本研究以YOLOX[24]模型為基本框架對(duì)茶葉嫩芽識(shí)別展開研究,在模型中融入SE(Squeeze and excitation)[25]注意力模塊,并引入Soft NMS[26]算法替代原模型中傳統(tǒng)NMS[27]算法?!緮M解決的關(guān)鍵問題】采用基于YOLOX 改進(jìn)模型的茶葉嫩芽識(shí)別方法,明顯改善復(fù)雜場(chǎng)景下的識(shí)別能力及小目標(biāo)嫩芽識(shí)別能力。
數(shù)據(jù)集原始圖像采集自廣東省英德市英德茶葉世界,采集對(duì)象為英紅九號(hào),采集設(shè)備為Iphone XR。對(duì)茶葉嫩芽圖像進(jìn)行采集時(shí),嫩芽以外的信息為背景,所拍攝圖像包含1 個(gè)或多個(gè)目標(biāo)。共采集原始圖像1 215 幅,包括晴天、陰天、順光、逆光等情況,數(shù)據(jù)集圖片示例見圖1。為加強(qiáng)數(shù)據(jù)的多樣化、提高模型的魯棒性,對(duì)原始數(shù)據(jù)集進(jìn)行鏡像翻轉(zhuǎn)、光照亮度調(diào)整操作。經(jīng)過鏡像翻轉(zhuǎn)后,數(shù)據(jù)集擴(kuò)充為2 430 幅,再對(duì)原始數(shù)據(jù)集進(jìn)行亮度調(diào)整操作,最終數(shù)據(jù)集為3 645 幅。
圖1 數(shù)據(jù)集圖片示例Fig.1 Sample dataset pictures
將上述嫩芽圖片整理經(jīng)增強(qiáng)后的數(shù)據(jù)集共3 645 張,使用LabelImg 圖像標(biāo)注工具對(duì)圖片中的目標(biāo)嫩芽進(jìn)行標(biāo)注:圖2A 表示采集設(shè)備正視茶葉嫩芽時(shí)一芽一葉的類型,標(biāo)注為“one”;圖2B 表示采集設(shè)備正視茶葉嫩芽時(shí)一芽?jī)扇~的類型,標(biāo)注為“two”;圖2C 表示采集設(shè)備側(cè)視茶葉嫩芽的類型,標(biāo)注為“side”,其特點(diǎn)為嫩葉對(duì)嫩芽莖部造成遮擋;圖2D 表示采集設(shè)備俯視茶葉嫩芽的類型,標(biāo)注為“top”,其特點(diǎn)為嫩芽本身對(duì)莖部造成遮擋。將數(shù)據(jù)集中晴天、陰天、順光、逆光4 種情況的圖片數(shù)據(jù)均按照70%、20%、10%的比例劃分,最終組成訓(xùn)練集2 552 幅、驗(yàn)證集729 幅、測(cè)試集364 幅,圖片總數(shù)3 645 幅。
圖2 茶葉嫩芽標(biāo)注類型Fig.2 Schematic of marking types of tea buds
1.3.1 YOLOX 模型改進(jìn) YOLOX 模型主要可分為Backbone、Neck 以及YOLO Head 3 個(gè)部分。輸入端的圖片首先會(huì)在Backbone 進(jìn)行特征提取,提取到的特征信息所包含的位置信息、細(xì)節(jié)信息較多,語義信息較少;Neck 作為YOLOX 模型的加強(qiáng)特征提取網(wǎng)絡(luò),會(huì)結(jié)合不同尺度的特征信息,進(jìn)行上采樣特征融合以及下采樣特征融合以獲取更豐富的特征信息;最后在YOLO Head 對(duì)獲取到的特征信息通過分類器和回歸器進(jìn)行判斷,判斷是否有對(duì)應(yīng)物體。
由于在Backbone 提取的特征包含的細(xì)節(jié)信息較多,而語義信息較少,小目標(biāo)(茶葉嫩芽)的特征信息經(jīng)過處理后,特征信息易丟失,從而引起對(duì)茶葉嫩芽的誤檢和漏檢。為提高YOLOX 原始模型對(duì)小目標(biāo)嫩芽的檢測(cè)精度,在原有的網(wǎng)絡(luò)模型基礎(chǔ)上,在Backbone 和Neck 之間增添SE 模塊,改進(jìn)YOLOX 網(wǎng)絡(luò)模型框架如圖3 所示。
圖3 改進(jìn)YOLOX 網(wǎng)絡(luò)模型框架Fig.3 Improved YOLOX network model framework
1.3.2 融合SE(Squeeze.and.excitation)注意力機(jī)制 SE 模塊通過構(gòu)建特征通道之間的依賴關(guān)系,先通過學(xué)習(xí)的方式獲取每個(gè)特征通道的重要程度,再依據(jù)每個(gè)通道的重要程度抑制對(duì)識(shí)別任務(wù)用處不大的特征信息并增強(qiáng)有用的特征信息,提升識(shí)別精確度。該模塊新增的參數(shù)和計(jì)算量較小,原模型參數(shù)總量為8.94 M,引入SE 模塊后,模型參數(shù)總量為8.99 M。SE 模塊的結(jié)構(gòu)如圖4所示。
圖4 SE 模塊結(jié)構(gòu)Fig.4 Structure of SE module
SE 模塊主要由Squeeze 和Excitation 兩部分組成,Squeeze 部分通過全局平均池化操作將原始維度為H*W*C 的特征圖壓縮為1*1*C 的特征圖,如下式所示:
式中,Uc(i,k)表示第i個(gè)通道位置為(i,k)的元素,H是高度(height)、W 為寬度(width)、C 為通道數(shù)(channel)。Squeeze 操作后獲取到H*W的全局特征感受區(qū)域更廣。
Squeeze 操作完成后,通過Excitation 操作獲得通道之間的依賴關(guān)系,這一部分由兩個(gè)全連接實(shí)現(xiàn),第一個(gè)全連接層FC1將C個(gè)通道壓縮成C/r個(gè)通道(r為壓縮比例,本研究取r=16),以降低計(jì)算量,再經(jīng)ReLu 函數(shù)激活通過FC2;第二個(gè)全連接恢復(fù)回C個(gè)通道,再經(jīng)Sigmoid 函數(shù)生成權(quán)重,最后經(jīng)過Scale 操作生成最終的輸出X。
1.3.3 引入Soft NMS 算法 目標(biāo)檢測(cè)算法在檢測(cè)過程中,通常會(huì)在目標(biāo)附近產(chǎn)生較多候選框,NMS(Non-Maximum Suppression)算法的核心思想對(duì)重疊度較高的候選框進(jìn)行評(píng)分,最后保留分?jǐn)?shù)最高的候選框。利用傳統(tǒng)的NMS 算法去除檢測(cè)時(shí)的重復(fù)框,會(huì)將與目標(biāo)框相鄰的且正確識(shí)別出物體檢測(cè)框的分?jǐn)?shù)強(qiáng)制歸零,容易導(dǎo)致漏檢。針對(duì)這種情況,本研究引入Soft NMS 算法。Soft NMS 算法是基于NMS 算法改進(jìn)而成,為避免出現(xiàn)分?jǐn)?shù)為0 的情況,對(duì)候選框進(jìn)行小分?jǐn)?shù)權(quán)重打分。權(quán)重打分有線性加權(quán)和高斯加權(quán)兩種,本研究采用高斯加權(quán)的Soft NMS 算法,其計(jì)算公式為:
式中,Si為當(dāng)前檢測(cè)框的得分,M為權(quán)重最高的候選框,bi為檢測(cè)過程中產(chǎn)生的候選框,Nt為IoU 閾值,?為高斯懲罰系數(shù),D為最終檢測(cè)結(jié)果集合。兩個(gè)檢測(cè)框重疊度越高,高斯懲罰系數(shù)越大,則得分Si越小。
1.3.4 試驗(yàn)環(huán)境 本試驗(yàn)訓(xùn)練模型使用的操作系統(tǒng)為Ubuntu 20.0.4,處理器為Inter i7 11700@2.6G Hz,GPU 型號(hào) 為Nvidia Geforce RTX3090。測(cè) 試框架為pytorch1.7.0,使用CUDA 11.0 版本并行計(jì)算框架配合CUDNN8.0.5 版本的深度神經(jīng)網(wǎng)絡(luò)加速庫(kù)。
本研究所使用模型的性能采用均值平均精度(mAP)進(jìn)行衡量,計(jì)算公式為:
式中,R為召回率,TP為陽性的正樣本數(shù)量,F(xiàn)N為陰性的負(fù)樣本數(shù)量,n 為目標(biāo)類別數(shù)量。
本研究主要參數(shù)設(shè)置:每次迭代訓(xùn)練的樣本數(shù)為16,對(duì)數(shù)據(jù)集樣本迭代47 000 次,初始學(xué)習(xí)率為0.001,采用余弦退火的學(xué)習(xí)率下降方式改變學(xué)習(xí)率,網(wǎng)絡(luò)模型的Loss 值變化曲線如圖5 所示。圖5 顯示了每次迭代的Loss 變化,隨著迭代次數(shù)的增加,模型的損失值減小。在迭代到40 000 次左右時(shí),損失曲線趨于收斂,模型可以用于茶葉嫩芽圖像的識(shí)別。
圖5 網(wǎng)絡(luò)模型Loss 值變化曲線Fig.5 Curve of change in Loss value of network model
本研究檢測(cè)目標(biāo)共4 類(one、two、side、top),需先計(jì)算每一類的平均精度(Average precision,AP),然后再計(jì)算所有類的平均精度(mAP)。用相同數(shù)據(jù)集分別對(duì)YOLOX 模型和YOLOX 改進(jìn)模型進(jìn)行訓(xùn)練,在訓(xùn)練結(jié)束時(shí),用兩個(gè)模型得到的最佳權(quán)重文件進(jìn)行性能的對(duì)比,改進(jìn)前后兩種模型mAP值變化曲線如圖6 所示。從圖6 可以看出,隨著訓(xùn)練輪數(shù)的增加,兩種模型的mAP曲線均呈現(xiàn)上升的趨勢(shì),且YOLOX模型的收斂速度快于SS-YOLOX 模型。在第20個(gè)epoch 前,YOLOX 模型的mAP值略高于SSYOLOX 模型;在第20 個(gè)epoch 后,SS-YOLOX 模型的mAP值明顯高于YOLOX 模型;由圖5 可知,在第90 個(gè)epoch 后,SS-YOLOX 模型Loss 值已不再明顯下降,因此在第100 個(gè)epoch 后停止訓(xùn)練。
圖6 改進(jìn)前后兩種模型mAP 值變化曲線Fig.6 Curve of change in mAP value of two models beforeand after improvement
為驗(yàn)證本研究提出的對(duì)YOLOX 的兩種改進(jìn)策略,對(duì)數(shù)據(jù)集進(jìn)行消融實(shí)驗(yàn),以判斷每個(gè)改進(jìn)點(diǎn)的可行性,在原有模型上加入SE 與Soft NMS函數(shù),運(yùn)用該改進(jìn)點(diǎn)用“√”表示,訓(xùn)練過程中,除有無運(yùn)用改進(jìn)點(diǎn)外,其他參數(shù)配置均一致,消融實(shí)驗(yàn)結(jié)果見表1。從表1 可以看出,原模型mAP值為0.841,引入SE 后,mAP值提高1.7%,Recall 提高2%,而引入Soft NMS 算法的提升較小。分析認(rèn)為引入SE 后,增強(qiáng)了網(wǎng)絡(luò)融合特征信息的能力,關(guān)注到許多易被忽略的語義信息,因此在檢測(cè)精度上的提升較為明顯;而Soft NMS 僅在檢測(cè)框重疊程度較大時(shí)發(fā)揮作用,因此僅有小幅度提升。
表1 YOLOX 消融實(shí)驗(yàn)結(jié)果Table 1 Result of YOLOX ablation experiment
從實(shí)際場(chǎng)景出發(fā),茶葉嫩芽姿態(tài)千姿萬化,嫩芽大小以及嫩芽數(shù)量不同、不同光照的光照條件、采集設(shè)備拍攝的距離和角度不同,都會(huì)導(dǎo)致由于采集的原始圖像的波動(dòng)對(duì)模型識(shí)別效果產(chǎn)生影響。下面通過對(duì)比兩個(gè)模型的識(shí)別結(jié)果,討論分析兩種模型的性能。
兩種模型在茶葉嫩芽數(shù)量較多的情況下的識(shí)別結(jié)果(圖7)顯示,兩種模型均能識(shí)別出茶葉嫩芽,但可以看到Y(jié)OLOX 模型的檢測(cè)結(jié)果(圖7A)有一處一芽一葉“one”類型以及一芽?jī)扇~“two”類型沒有被YOLOX模型檢測(cè)到,存在漏檢的情況;而SS-YOLOX 模型可以檢測(cè)到(圖7B),表明SS-YOLOX 模型對(duì)于圖片中的小目標(biāo)檢測(cè)性能有所提升。
圖7 兩種模型識(shí)別結(jié)果對(duì)比Fig.7 Comparison of recognition results of two models
圖8 顯示,YOLOX 原模型存在誤檢,將“top”類型錯(cuò)誤檢測(cè)為“one”類型,其原因可能是嫩葉遮擋住部分嫩芽,導(dǎo)致模型錯(cuò)誤將其檢測(cè)為“two”類型。
圖8 錯(cuò)誤檢測(cè)結(jié)果Fig.8 Error detection results
YOLOX 模型是曠視科技發(fā)表的開源高性能檢測(cè)器,曠視的研究者將目標(biāo)檢測(cè)領(lǐng)域中諸如解耦頭、數(shù)據(jù)增強(qiáng)等亮點(diǎn)與YOLOX 以往的系列進(jìn)行集成。本研究基于YOLOX 模型,針對(duì)在復(fù)雜場(chǎng)景下可能出現(xiàn)的茶葉嫩芽誤檢、漏檢的問題,對(duì)原YOLOX 模型進(jìn)行改進(jìn),引入Soft NMS 算法改善檢測(cè)框重疊時(shí)的打分機(jī)制。傳統(tǒng)的NMS 算法在去除與目標(biāo)框重疊度較高的檢測(cè)框時(shí),會(huì)將相鄰的檢測(cè)框分?jǐn)?shù)強(qiáng)制歸零,導(dǎo)致模型容易出現(xiàn)漏檢的問題。Soft NMS 的打分機(jī)制分為兩種,分別為線性加權(quán)以及高斯加權(quán),本研究采用高斯加權(quán)打分機(jī)制的Soft NMS 算法,兩個(gè)檢測(cè)框重疊度越高,懲罰系數(shù)越大,得分Si 越小,而不是強(qiáng)制歸零。此外,在一幅圖像中遠(yuǎn)處的茶葉嫩芽會(huì)成為小目標(biāo),增大模型的檢測(cè)難度,容易造成誤檢、漏檢的問題,為了進(jìn)一步改善以上問題,在已引入Soft NMS 算法的模型中融入SE 模塊,將SE 模塊加入到主干特征提取網(wǎng)絡(luò)CSPDarknet 和加強(qiáng)特征提取網(wǎng)絡(luò)FPN 之間。SE 模塊通過學(xué)習(xí)的方式得到每個(gè)特征通道的重要程度,再依據(jù)通道的重要程度增強(qiáng)有用的特征信息并抑制無用的特征信息,能夠更好地識(shí)別圖像中的小目標(biāo),從而達(dá)到提升精度的目的。SE 模塊內(nèi)部主要分為Squeeze部分和Excitation 部分,引入模塊后新增的參數(shù)和計(jì)算量小,提升精度的同時(shí)并不會(huì)給網(wǎng)絡(luò)模型增加繁重的參數(shù)量。
由試驗(yàn)結(jié)果可知,改進(jìn)后的模型SS-YOLOX對(duì)茶葉嫩芽進(jìn)行檢測(cè),且引入的Soft NMS 算法和SE 模塊均能提升模型的檢測(cè)性能。雖然本研究模型對(duì)茶葉嫩芽圖像的識(shí)別具有較好的精確度,但未與其他網(wǎng)絡(luò)模型進(jìn)行對(duì)比,后續(xù)將會(huì)加入其他檢測(cè)模型進(jìn)行研究對(duì)比,如Faster R-CNN、SSD模型等。此外,本研究暫未考慮到茶樹的葉片對(duì)嫩芽遮擋較多的情況,對(duì)于遮擋較為嚴(yán)重的嫩芽,在數(shù)據(jù)集標(biāo)注階段根據(jù)情況進(jìn)行了取舍;對(duì)于不同茶葉品種對(duì)識(shí)別結(jié)果的影響也暫未作進(jìn)一步研究。
在后續(xù)研究中將會(huì)實(shí)現(xiàn)軟硬件通信,將模型移植入邊緣設(shè)備,利用邊緣設(shè)備對(duì)茶園中茶葉嫩芽進(jìn)行實(shí)時(shí)檢測(cè),研究此模型是否能滿足實(shí)時(shí)檢測(cè)的要求;也會(huì)將芽葉遮擋情況對(duì)識(shí)別結(jié)果的影響進(jìn)行研究,從而提升模型的泛化能力,使其更適用于茶葉嫩芽的識(shí)別。
隨著農(nóng)業(yè)工程與信息化技術(shù)的迅速發(fā)展,農(nóng)業(yè)信息化已經(jīng)成為一種趨勢(shì)。針對(duì)目前茶葉嫩芽識(shí)別領(lǐng)域中的研究現(xiàn)狀及出現(xiàn)的問題,本研究提出了一種改進(jìn)的茶葉嫩芽檢測(cè)識(shí)別模型SSYOLOX。該模型在原YOLOX 模型上融入注意力模塊SE,加強(qiáng)模型對(duì)特征信息的提取能力,改善小目標(biāo)的漏檢、誤檢的問題;引入Soft NMS 算法改變檢測(cè)框的打分機(jī)制,進(jìn)一步提高模型的識(shí)別準(zhǔn)確率。對(duì)算法模型進(jìn)行性能分析,SS-YOLOX的mAP值達(dá)到0.863、比原模型提高0.022,召回率為76%、比原模型提高2 個(gè)百分點(diǎn),證明了本研究提出模型的可行性。