摘 要:水面圖像具有水波擾動、光線反射、岸上倒影等復(fù)雜特征,導(dǎo)致現(xiàn)有目標(biāo)檢測方法不能很好地完成對水面漂浮物的識別?;诖?,提出了一種基于改進YOLOv5s 的水面漂浮物檢測優(yōu)化模型,通過增加目標(biāo)檢測層以提升模型檢測多尺度目標(biāo)的能力,在特征融合層引入無參注意力機制SimAM 以提高模型對漂浮物特征的學(xué)習(xí),并采用CARAFE 上采樣方式增強網(wǎng)絡(luò)的感受野以提高對特征的重建能力,在YOLOv5s 網(wǎng)絡(luò)結(jié)構(gòu)中融入卷積混合層以保持模型檢測精度且減少參數(shù)量,從而提高模型運行速度。實例驗證結(jié)果表明:改進模型檢測效果良好,平均精度達(dá)97.1%,較原YOLOv5s 模型提高了4.9 個百分點,能夠有效改善水面漂浮物漏檢、誤檢問題。
關(guān)鍵詞:漂浮物檢測;YOLOv5s;多尺度特征檢測;注意力機制;CARAFE;卷積混合層
中圖分類號:TV213.4 文獻標(biāo)志碼:A doi:10.3969/ j.issn.1000-1379.2024.07.015
引用格式:項新建,翁云龍,謝建立,等.基于改進YOLOv5s 的水面漂浮物檢測算法研究[J].人民黃河,2024,46(7):85-91.
水面漂浮物危害水利水電工程安全,同時會對水體水質(zhì)、水產(chǎn)養(yǎng)殖、航運等造成不利影響[1] ,因此水面漂浮物的及時清理是水環(huán)境管理的主要工作之一[2] 。目前水面漂浮物檢測方法主要有傳統(tǒng)數(shù)字圖像處理和基于深度學(xué)習(xí)的檢測兩類。傳統(tǒng)數(shù)字圖像處理方法主要通過水面圖像的前景和背景特征、濾波理論完成對水面漂浮物的識別[3] 。江杰等[4] 提出了基于混合高斯模型的背景差分法和幀差法對河流漂浮物進行自動檢測。湯偉等[5] 利用均值漂移算法與改進的最大類間方差法提取水面漂浮物。魏建榮[6] 提出基于背景紋理法檢測水面漂浮物。傳統(tǒng)數(shù)字圖像處理方法在光照條件良好、干擾少的環(huán)境下漂浮物檢測精度較高[7] ,但水面環(huán)境復(fù)雜多變,例如反光、倒影等因素影響漂浮物特征的提取,導(dǎo)致水面漂浮物檢測精度降低。近年來,深度學(xué)習(xí)成為目標(biāo)檢測領(lǐng)域的主流[8] ,深度學(xué)習(xí)目標(biāo)檢測主要分為基于區(qū)域選擇的兩階段目標(biāo)檢測和基于回歸方法的單階段目標(biāo)檢測。基于區(qū)域選擇的兩階段目標(biāo)檢測主要包括區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(RCNN)[9] 、空間金字塔池化網(wǎng)絡(luò)(SPP-Net)[10] 、快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Fast R-CNN)[11] 等,這類方法檢測精度較高,但檢測速度較慢,難以達(dá)到實時檢測的目的?;诨貧w方法的單階段目標(biāo)檢測方法主要包括單發(fā)多框檢測器(SSD)[12] 、YOLO[13] 、視網(wǎng)膜網(wǎng)絡(luò)(Reti?naNet)、YOLOv3 等,這類方法的檢測速度快于兩階段目標(biāo)檢測的,但檢測精度低于兩階段目標(biāo)檢測的。