摘要:黃精是重要的藥食同源品種,在黃精的種植與育種過(guò)程中,通常采用基于個(gè)人經(jīng)驗(yàn)的人工方式進(jìn)行種子成熟度識(shí)別,但該方式存在主觀性強(qiáng)、精確度不穩(wěn)定的問(wèn)題,會(huì)在一定程度上影響種植后黃精的產(chǎn)量和質(zhì)量,進(jìn)而影響黃精產(chǎn)品的品質(zhì)和下游產(chǎn)業(yè)的經(jīng)濟(jì)效益;另一方面,由于黃精種植地塊通常較為分散,使得人工識(shí)別種子成熟度的方式較為低效。為了解決以上問(wèn)題,本研究提出一種基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)YOLOv8n的黃精種子成熟度識(shí)別模型-YOLOv8n-FasterNeL-EMA。首先,在模型輕量化方面,通過(guò)將YOLOv8n主干網(wǎng)絡(luò)中原本的卷積替換為FasIerNet的PConv卷積結(jié)構(gòu),與BotIleneck層結(jié)合后得到新的c2f-FasLerNet模塊,從而減小模型的計(jì)算量與內(nèi)存消耗;其次,在模型泛化性能方面,通過(guò)使用EMA注意力機(jī)制與YOLOv8n頸部網(wǎng)絡(luò)中檢測(cè)處的c2f模塊結(jié)合,提升模型的特征提取能力,進(jìn)而改善模型的泛化能力。為驗(yàn)證所提模型的性能,在構(gòu)建的黃精種子成熟度數(shù)據(jù)集上進(jìn)行了對(duì)比實(shí)驗(yàn),結(jié)果表明,與原YOLOv8n模型相比,本研究所提模型在平均識(shí)別精度上提升了2.1%,同時(shí)模型的參數(shù)量降低了21.3%;此外,與SSD、YOLOv5n相比,本研究所提模型在識(shí)別精度和速度上也取得一定的提升。因此,YOLOv8n-FasterNet-EMA能有效識(shí)別黃精種子的成熟度,這對(duì)實(shí)現(xiàn)黃精種子成熟度的智能化識(shí)別,進(jìn)而提升黃精育種的質(zhì)量、改善下游產(chǎn)業(yè)的經(jīng)濟(jì)效益均具有重要的實(shí)際意義。
關(guān)鍵詞:黃精;種子成熟度識(shí)別;卷積神經(jīng)網(wǎng)絡(luò);YOLOv8n;FasterNet;EMA注意力機(jī)制
中圖分類號(hào):S126:S567.23+9 文獻(xiàn)標(biāo)識(shí)號(hào):A 文章編號(hào):1001-4942(2025)01-0156-10
黃精是藥食同源的品種,有補(bǔ)陰益氣、美容養(yǎng)顏、調(diào)節(jié)血糖血脂等多種功效。隨著現(xiàn)代人對(duì)養(yǎng)生的重視,市場(chǎng)對(duì)于黃精產(chǎn)品的需求不斷上升,導(dǎo)致野生黃精的產(chǎn)量難以滿足市場(chǎng)的需要,人工栽培的黃精成為黃精有關(guān)產(chǎn)品原料來(lái)源的主要渠道。育種是人工栽培黃精必不可少的環(huán)節(jié),而育種過(guò)程中關(guān)于黃精種子成熟度的判斷,多采用基于個(gè)人經(jīng)驗(yàn)的人工方式,存在主觀性強(qiáng)、精確度不穩(wěn)定的問(wèn)題;另外,人工栽培黃精地塊分散,而收獲時(shí)間較集中,人工識(shí)別成熟度的方式較為低效,易受客觀因素影響,導(dǎo)致優(yōu)質(zhì)種子的浪費(fèi),影響后續(xù)黃精種植后的產(chǎn)量和質(zhì)量,進(jìn)而影響黃精下游產(chǎn)業(yè)的質(zhì)量和經(jīng)濟(jì)效益。黃精種子成熟度智能識(shí)別技術(shù)能夠有效解決人工識(shí)別成熟度低效和精確度不穩(wěn)的問(wèn)題,提高采摘和種植的效率,而且還有助于農(nóng)民選擇達(dá)到要求的地塊進(jìn)行采摘,確保種子來(lái)源的一致性和可靠性。因此,這一技術(shù)對(duì)于推動(dòng)黃精種植業(yè)及其下游產(chǎn)業(yè)的品質(zhì)和經(jīng)濟(jì)效益是必要的。
深度學(xué)習(xí)已廣泛應(yīng)用于農(nóng)業(yè)工程領(lǐng)域,在農(nóng)作物種子或果實(shí)的成熟度識(shí)別領(lǐng)域也有應(yīng)用。目前,對(duì)于果實(shí)與種子成熟度的識(shí)別算法主要有兩種,一種是使用區(qū)域卷積神經(jīng)網(wǎng)絡(luò)R-CNN為代表的二階段算法,另一種是以卷積神經(jīng)網(wǎng)絡(luò)YOLO為代表的一階段算法。兩種算法各有優(yōu)劣:二階段算法在精度方面有優(yōu)勢(shì),但識(shí)別速度較慢,難以滿足較為實(shí)時(shí)性的需求:一階段算法在實(shí)時(shí)性上更具優(yōu)勢(shì),但精度相對(duì)較低。因此,在選擇識(shí)別算法時(shí)需根據(jù)具體任務(wù)需求和場(chǎng)景進(jìn)行權(quán)衡。袁明新等選用VGG-F模型進(jìn)行預(yù)訓(xùn)練,并在訓(xùn)練過(guò)程中融入局部歸一化的數(shù)據(jù)預(yù)處理,對(duì)于自然環(huán)境下的蘋(píng)果成熟度識(shí)別的平均準(zhǔn)確率達(dá)到了65.5%。曾俊等通過(guò)改進(jìn)YOLOv5s模型,并引入CBAM(convolutional block attention module)注意力機(jī)制,對(duì)自然環(huán)境下桃子成熟度進(jìn)行快速檢測(cè)識(shí)別,平均精度均值達(dá)到了88.6%。李陽(yáng)德等通過(guò)將YOLOv4的骨干網(wǎng)絡(luò)替換為輕量級(jí)網(wǎng)絡(luò)MobileNet V3,對(duì)于自然環(huán)境下的菠蘿成熟度識(shí)別的平均精度均值達(dá)到了90.92%。熊俊濤等利用輕量化YOLOv5,通過(guò)去掉Focus層及減少使用C3 Layer的方式,對(duì)自然環(huán)境下的木瓜成熟度進(jìn)行識(shí)別,平均精度均值達(dá)到了92.4%。朱旭等改進(jìn)Faster R-CNN算法,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)(CNN)、區(qū)域候選網(wǎng)絡(luò)(RPN)、感興趣區(qū)域池化(ROI Pooling)和分類網(wǎng)絡(luò)實(shí)現(xiàn)藍(lán)莓圖像背景消除來(lái)提升果實(shí)識(shí)別效果,平均識(shí)別準(zhǔn)確率達(dá)到了94.67%。馬瑞峻等通過(guò)替換YOLOv5主干網(wǎng)絡(luò)為CSPDarkNet,并引入SE(squeeze-and-ex-citation)注意力機(jī)制,對(duì)于存在枝條遮擋與果實(shí)遮擋情況下的火龍果檢測(cè)能力明顯增強(qiáng),平均精度均值達(dá)到了94.9%。王立舒等采用CSPDark-net53-Tiny網(wǎng)絡(luò)模型替換YOLOv4的主干網(wǎng)絡(luò),并將CBAM注意力機(jī)制加入到Y(jié)OLOv4的特征金字塔中,實(shí)現(xiàn)了在遮擋與光照不均的環(huán)境下對(duì)藍(lán)莓成熟度檢測(cè)的平均精度均值達(dá)到96.24%。陳仁凡等通過(guò)在YOLOv5s的主干中引入Shuffle-Block作為提取網(wǎng)絡(luò),實(shí)現(xiàn)模型輕量化,在溫室環(huán)境下對(duì)草莓成熟度識(shí)別的平均精度均值達(dá)到了97.4%。楊堅(jiān)等通過(guò)將CBAM注意力機(jī)制集成到Y(jié)OLOv4-tiny模型骨干網(wǎng)絡(luò)中,并用Mish激活函數(shù)替代ReLU激活函數(shù),對(duì)自然環(huán)境下的番茄成熟度識(shí)別的平均精度均值達(dá)到了97.9%。王鐵偉等提出了一種基于數(shù)據(jù)平衡的Faster R-CNN冬棗識(shí)別方法,利用ROI提取方法,并采用數(shù)據(jù)平衡操作,對(duì)自然環(huán)境下不同成熟度的冬棗進(jìn)行識(shí)別,平均精確度達(dá)到了98.5%。