国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進(jìn)YOLOX 的SAR 近岸區(qū)域船只檢測(cè)方法

2023-02-15 08:38肖嘉榮王曉蓓張德生喻忠軍
關(guān)鍵詞:船只注意力特征

劉 霖,肖嘉榮,王曉蓓,張德生,喻忠軍,3

(1. 電子科技大學(xué)信息與通信工程學(xué)院 成都 611731;2. 中國(guó)科學(xué)院空天信息創(chuàng)新研究院 北京 海淀區(qū) 100094;3. 中國(guó)科學(xué)院大學(xué)電子電氣與通信工程學(xué)院 北京 懷柔區(qū) 100049)

合成孔徑雷達(dá)(synthetic aperture radar, SAR)具有全天時(shí)、全天候?qū)Φ赜^測(cè)能力,針對(duì)廣闊的海洋區(qū)域可以大范圍地獲取海面SAR 圖像,有效探測(cè)海面船只,對(duì)我國(guó)海洋事業(yè)起著至關(guān)重要的作用。但是SAR 圖像在視覺上是灰度圖像,目標(biāo)紋理特征不明顯,導(dǎo)致基于SAR 圖像的目標(biāo)信息提取困難。同時(shí),由于SAR 相干成像的特點(diǎn),近岸區(qū)域中存在的各類金屬建筑會(huì)產(chǎn)生與船只特征相近的強(qiáng)散射點(diǎn),僅靠人工進(jìn)行目標(biāo)檢測(cè)難度很高,效率較低,容易產(chǎn)生誤檢現(xiàn)象,且船只目標(biāo)具有不定朝向、密集排列特點(diǎn),易產(chǎn)生漏檢現(xiàn)象,因此近岸區(qū)域下的SAR 圖像船只檢測(cè)是一個(gè)具有挑戰(zhàn)性的問(wèn)題。

傳統(tǒng)的SAR 圖像船只目標(biāo)檢測(cè)方法多采用恒虛警率法,其依賴于人工建模,通過(guò)設(shè)計(jì)海雜波模型提取船只特征,無(wú)法有效區(qū)分船只與島嶼、近岸建筑等虛警目標(biāo),因此在背景復(fù)雜的近岸情形下效果不佳[1]。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,其在SAR 圖像目標(biāo)檢測(cè)方面的應(yīng)用具有良好的發(fā)展前景,目前基于深度學(xué)習(xí)方法進(jìn)行SAR 船只檢測(cè)大體分為兩個(gè)技術(shù)路線,前者對(duì)以YOLO[2]和SSD[3]為代表的單階段目標(biāo)檢測(cè)算法進(jìn)行適應(yīng)性改進(jìn),以實(shí)現(xiàn)實(shí)時(shí)高效船只檢測(cè)。如文獻(xiàn)[4]針對(duì)船只在近岸場(chǎng)景下方向多變問(wèn)題,對(duì)YOLOv3 算法進(jìn)行改進(jìn),結(jié)合水平框和旋轉(zhuǎn)框的預(yù)測(cè)結(jié)果實(shí)現(xiàn)船只目標(biāo)方位角估計(jì),提升了YOLOv3 算法在復(fù)雜場(chǎng)景下的船只檢測(cè)效果。文獻(xiàn)[5]針對(duì)單階段目標(biāo)檢測(cè)算法在復(fù)雜場(chǎng)景下船只檢測(cè)性能不佳問(wèn)題,在YOLOv3上引入了通道注意力機(jī)制,通過(guò)加強(qiáng)各網(wǎng)絡(luò)層通道間的特征融合,提高模型在近岸場(chǎng)景下的檢測(cè)性能。后者以Faster R-CNN[6]為代表的雙階段目標(biāo)檢測(cè)算法進(jìn)行適應(yīng)性改進(jìn),以實(shí)現(xiàn)高精度船只目標(biāo)檢測(cè),如文獻(xiàn)[7]通過(guò)多尺度特征融合與特征通道校準(zhǔn)方法,提高Faster-RCNN 算法在復(fù)雜場(chǎng)景下的船只目標(biāo)檢測(cè)性能。

單階段目標(biāo)檢測(cè)算法由于缺少了雙階段算法的精細(xì)處理,在面對(duì)SAR 圖像中尺度大小不一、視覺特征不明顯的船只目標(biāo)時(shí)表現(xiàn)不佳。另外,單階段目標(biāo)檢測(cè)算法YOLOv3 作為Anchor Based 算法雖然在一定程度上緩解了雙階段目標(biāo)檢測(cè)算法,如在Faster R-CNN 中選擇性搜索帶來(lái)的候選框計(jì)算量爆炸的問(wèn)題,但其每個(gè)網(wǎng)格中不同尺寸錨框的生成依賴于人工參數(shù)設(shè)置,目標(biāo)的定位精度嚴(yán)重依賴于手動(dòng)調(diào)參。同時(shí)為兼顧目標(biāo)檢測(cè)實(shí)時(shí)處理平臺(tái)資源功耗受限等情形,需要避免主流算法模型參數(shù)量大、網(wǎng)絡(luò)推理耗時(shí)長(zhǎng)的問(wèn)題。

針對(duì)以上問(wèn)題,本文提出了一種基于改進(jìn)YOLOX 的SAR 近岸區(qū)域密集船只高精度檢測(cè)方法,有效地解決SAR 近岸情形下算法模型準(zhǔn)確率低、虛警率高且參數(shù)冗余問(wèn)題,主要?jiǎng)?chuàng)新點(diǎn)如下:

1) 改進(jìn)坐標(biāo)注意力機(jī)制,進(jìn)一步提升對(duì)空間域信息的學(xué)習(xí),并引入至特征提取網(wǎng)絡(luò),提升網(wǎng)絡(luò)對(duì)船只目標(biāo)信息的聚焦,實(shí)現(xiàn)目標(biāo)信息的有效提??;

2) 采用旋轉(zhuǎn)目標(biāo)框進(jìn)行目標(biāo)檢測(cè),增加角度分類頭學(xué)習(xí)目標(biāo)的角度信息,并通過(guò)將旋轉(zhuǎn)目標(biāo)框轉(zhuǎn)化為二維高斯分布的方法,計(jì)算預(yù)測(cè)分布與目標(biāo)分布的KL 散度作為旋轉(zhuǎn)框損失值訓(xùn)練網(wǎng)絡(luò),提升網(wǎng)絡(luò)在近岸區(qū)域下的檢測(cè)精度;

3) 基于YOLOX 的Anchor Free 機(jī)制,結(jié)合上述兩點(diǎn)設(shè)計(jì),有效減少由于角度分類頭導(dǎo)致的冗余候選框激增問(wèn)題,避免冗余框帶來(lái)的無(wú)效計(jì)算。

1 算法結(jié)構(gòu)

當(dāng)前最新提出的YOLO 系列算法中效果最優(yōu)的單階段目標(biāo)檢測(cè)算法YOLOX[8],其大致分為3 個(gè)組成部分:主干網(wǎng)絡(luò)、特征聚合網(wǎng)絡(luò)與檢測(cè)頭。主干網(wǎng)絡(luò)采用CSPDarknet 來(lái)對(duì)圖像進(jìn)行特征提取,其主要組成部分CBS 由卷積(convolution)、批量歸一化(batch-normalization, BN)和激活函數(shù)(silu)組成,YOLOX 在主干網(wǎng)絡(luò)前通過(guò)采用Focus模塊將輸入的高分辨率圖像拆分成多個(gè)低分辨率的特征圖,以減少傳統(tǒng)下采樣操作產(chǎn)生的信息損失,而在主干網(wǎng)絡(luò)提取特征后通過(guò)空間金字塔池化層(spatial pyramid pooling, SPP)來(lái)提取不同尺寸的空間特征信息,提升模型對(duì)不同尺寸目標(biāo)的魯棒性。此外,主干網(wǎng)絡(luò)中的CSPLayer 通過(guò)其殘差結(jié)構(gòu)可以將特征圖的梯度變化集成到了最后的輸出中,減少網(wǎng)絡(luò)參數(shù)與運(yùn)算量,并同樣用于特征聚合網(wǎng)絡(luò)PAFPN 中以加強(qiáng)網(wǎng)絡(luò)特征聚合能力,是目標(biāo)特征提取的關(guān)鍵網(wǎng)絡(luò)。

而YOLOX 檢測(cè)頭采用Decoupled Head 對(duì)提取的特征進(jìn)行解耦,使回歸與分類任務(wù)分成兩部分,cls 特征圖負(fù)責(zé)學(xué)習(xí)目標(biāo)的類別信息,reg 與obj 特征圖則負(fù)責(zé)學(xué)習(xí)目標(biāo)的位置及存在信息,以有效提高網(wǎng)絡(luò)的檢測(cè)精度,實(shí)現(xiàn)高精度的船只目標(biāo)檢測(cè)。最后在預(yù)測(cè)端將不同尺度的特征向量進(jìn)行融合,通過(guò)SimOTA 方法對(duì)融合的特征向量進(jìn)行正樣本篩選匹配,得到與真實(shí)樣本近似的預(yù)測(cè)候選框,以消除先前YOLO 系列檢測(cè)算法中對(duì)先驗(yàn)Anchor 設(shè)置的依賴,減少冗余候選框造成的無(wú)意義計(jì)算資源消耗,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。

圖1 網(wǎng)絡(luò)結(jié)構(gòu)示意圖

1.1 改進(jìn)坐標(biāo)注意力機(jī)制引入

CSPDarknet 主干網(wǎng)絡(luò)的設(shè)計(jì)能夠有效提取船只目標(biāo)的細(xì)節(jié)信息,但設(shè)有對(duì)細(xì)節(jié)信息做出有效聚焦,忽略了能有效提升網(wǎng)絡(luò)檢測(cè)性能的目標(biāo)空間結(jié)構(gòu)信息與內(nèi)部通道信息。因此引入注意力模塊對(duì)原有網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),目前主流注意力機(jī)制模塊有SE[9]、CBAM[10]、CA[11]等,其中模塊CA 作為通道域的最新進(jìn)展,對(duì)輸入的特征圖沿水平坐標(biāo)與垂直坐標(biāo)方向進(jìn)行平均池化以對(duì)每個(gè)通道進(jìn)行編碼,此步驟相較于SE 通道注意力模塊而言對(duì)不同方向的空間信息進(jìn)行了篩選,以嵌入到通道信息中,實(shí)現(xiàn)了空間信息的引入。進(jìn)一步地,坐標(biāo)注意力機(jī)制采用1*1 卷積進(jìn)行通道信息學(xué)習(xí),該步驟結(jié)合了ECANet 注意力機(jī)制[12]的思想,采用1*1 卷積替代了原SE 通道注意力模塊中的全連接層,以提升注意力模塊的運(yùn)行效率與精度,但該模塊對(duì)空間域信息特征的利用仍不夠全面。因此,本文結(jié)合BAM 注意力模塊[13]的構(gòu)造思想,將坐標(biāo)注意力模塊加以改進(jìn)并引入到特征提取網(wǎng)絡(luò)中,學(xué)習(xí)目標(biāo)空間結(jié)構(gòu)信息與通道信息,引導(dǎo)神經(jīng)網(wǎng)絡(luò)更有效地提取目標(biāo)特征,提高網(wǎng)絡(luò)對(duì)SAR 圖像船只目標(biāo)的特征表達(dá)能力,實(shí)現(xiàn)近岸船只目標(biāo)信息的有效提取,改進(jìn)后的坐標(biāo)注意力模塊如圖2 所示。

圖2 改進(jìn)坐標(biāo)注意力機(jī)制模塊示意圖

改進(jìn)后的坐標(biāo)注意力模塊BCA 通過(guò)結(jié)合空間域信息學(xué)習(xí)模塊分支對(duì)輸入維度為C×H×W的特征圖m進(jìn)行空間域與通道域的特征聚焦,原坐標(biāo)注意力機(jī)制作為通道分支沿水平坐標(biāo)與垂直坐標(biāo)方向進(jìn)行尺寸為(H,1)和(1,W)的平均池化,對(duì)每個(gè)通道進(jìn)行編碼,得到兩個(gè)一維向量,當(dāng)高度為h時(shí),向量第c個(gè)通道的輸出如式(1)所示;當(dāng)寬度為w時(shí),第c個(gè)通道的輸出如式(2)所示。

兩個(gè)一維向量沿著空間維度進(jìn)行特征聚合壓縮通道,而后級(jí)聯(lián)生成兩個(gè)特征圖nh和nw,用大小為1 的卷積核進(jìn)行卷積,如式(3)所示,生成水平方向與垂直方向的空間信息特征圖t;再沿空間維度將特征圖t分成兩個(gè)單張量th和tw,利用兩個(gè)大小為1 的卷積對(duì)張量進(jìn)行卷積,如式(4)和式(5)所示,得到與輸入特征圖同樣的通道數(shù);最后將經(jīng)過(guò)激活函數(shù)運(yùn)算后的值作為通道域注意力權(quán)重,與輸入特征圖相乘,得到權(quán)值調(diào)整后的特征圖S如式(6)所示,實(shí)現(xiàn)對(duì)特征圖通道域信息的加強(qiáng)。

式中,δ 為卷積運(yùn)算;σ 為sigmoid 激活函數(shù)運(yùn)算。

空間分支則通過(guò)引入1×1 卷積將輸入維度為C×H×W的 特 征 圖m進(jìn) 行 通 道 擠 壓,變 化 為1×H×W的空間特征圖,再將經(jīng)過(guò)激活函數(shù)運(yùn)算后的值作為空間域注意力權(quán)重,與輸入特征圖進(jìn)行相乘得到權(quán)值調(diào)整后的特征圖Q,實(shí)現(xiàn)對(duì)特征圖空間域信息的加強(qiáng)。最終將通道分支輸出的加強(qiáng)特征圖S與空間分支輸出的加強(qiáng)特征圖Q進(jìn)行相加,得到空間信息與通道信息融合的最終特征圖。

改進(jìn)前后的特征提取網(wǎng)絡(luò)AttCSPLayer 如圖3所示,在原始CSPLayer 網(wǎng)絡(luò)初步卷積提取產(chǎn)生的特征圖后,將改進(jìn)坐標(biāo)注意力機(jī)制作用于輸出的特征圖中,根據(jù)通道域信息與空間域信息調(diào)整特征圖的權(quán)重,再進(jìn)行各層級(jí)特征融合提取。

圖3 特征提取網(wǎng)絡(luò)示意圖

1.2 旋轉(zhuǎn)目標(biāo)框轉(zhuǎn)化

基于水平框的船只檢測(cè)在近岸情形下表現(xiàn)不佳,且無(wú)法提供船只的方位角信息,不利于近岸船只調(diào)度任務(wù)進(jìn)行。為此本文采用旋轉(zhuǎn)目標(biāo)框進(jìn)行目標(biāo)檢測(cè),增加角度分類頭學(xué)習(xí)目標(biāo)的角度信息,使檢測(cè)頭能同時(shí)輸出船只目標(biāo)位置與方位角估計(jì)信息,改進(jìn)后的旋轉(zhuǎn)檢測(cè)頭如圖4 所示。

圖4 增加角度分類頭的旋轉(zhuǎn)檢測(cè)頭示意圖

圖4 中旋轉(zhuǎn)檢測(cè)頭的reg 特征圖為目標(biāo)的位置信息,其輸出為(x,y,w,h),θ 特征圖為目標(biāo)的角度信息,其輸出為目標(biāo)在0°~180°之間的概率,取最大概率的角度作為預(yù)測(cè)角度值,構(gòu)成預(yù)測(cè)旋轉(zhuǎn)目標(biāo)框(x,y,w,h, θ),通過(guò)式(7)將旋轉(zhuǎn)目標(biāo)框(x,y,w,h, θ)轉(zhuǎn)化為二維高斯分布(μ, Σ),以計(jì)算目標(biāo)真實(shí)分布與模型預(yù)測(cè)分布之間的KL 散度[14]作為損失值進(jìn)行反向傳播優(yōu)化,其中KL 散度計(jì)算公式如式(8)所示,特別地,設(shè)目標(biāo)角度值為0,計(jì)算位置信息的損失梯度,可得式(9)。

式中,Dkl為兩分布間的KL 散度距離;Np代表模型預(yù)測(cè)旋轉(zhuǎn)框轉(zhuǎn)化的二維高斯分布;Nt代表真實(shí)數(shù)據(jù)旋轉(zhuǎn)框轉(zhuǎn)化的二維高斯分布;Tr 為求矩陣的跡。目標(biāo)旋轉(zhuǎn)框轉(zhuǎn)化為二維高斯分布的示意圖如圖5 所示,通過(guò)式(7)將旋轉(zhuǎn)目標(biāo)框轉(zhuǎn)化為二維高斯分布,每個(gè)目標(biāo)框轉(zhuǎn)化的高斯分布受目標(biāo)的長(zhǎng)寬與角度影響,大小形狀不盡相同。由式(9)可知其梯度權(quán)重受1/w2和1/h2影響,使得模型可根據(jù)目標(biāo)的尺度來(lái)動(dòng)態(tài)調(diào)整權(quán)重,當(dāng)目標(biāo)尺度較小或縱橫比較大時(shí),模型通過(guò)反向傳播學(xué)習(xí)損失,會(huì)增大相應(yīng)方向的梯度,便于有效地進(jìn)行位置偏移的優(yōu)化,提高船只目標(biāo)中心位置的定位精度。

圖5 旋轉(zhuǎn)框轉(zhuǎn)化二維高斯分布示意圖

1.3 改進(jìn)后的算法結(jié)構(gòu)

引入改進(jìn)坐標(biāo)注意力機(jī)制與旋轉(zhuǎn)目標(biāo)框后的算法結(jié)構(gòu)如圖6 所示,在原有YOLOX 網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,采用改進(jìn)坐標(biāo)注意力機(jī)制改進(jìn)特征提取網(wǎng)絡(luò)結(jié)構(gòu),提高網(wǎng)絡(luò)對(duì)船只目標(biāo)信息的聚焦;增加角度分類頭學(xué)習(xí)目標(biāo)的角度信息。在訓(xùn)練階段讀取數(shù)據(jù)集的目標(biāo)旋轉(zhuǎn)框信息(x,y,w,h, θ)并將其轉(zhuǎn)化為二維高斯分布(μ, Σ),而后與旋轉(zhuǎn)檢測(cè)頭輸出的特征向量進(jìn)行特征匹配,得到與目標(biāo)分布相近的預(yù)測(cè)分布信息,通過(guò)計(jì)算預(yù)測(cè)分布與目標(biāo)分布的KL 散度作為旋轉(zhuǎn)框損失值訓(xùn)練網(wǎng)絡(luò),使網(wǎng)絡(luò)模型根據(jù)目標(biāo)的尺度與角度來(lái)動(dòng)態(tài)調(diào)整位置偏移權(quán)重,提升網(wǎng)絡(luò)在近岸區(qū)域下對(duì)船只目標(biāo)位置的定位精度,實(shí)現(xiàn)高精度的船只目標(biāo)檢測(cè)。

圖6 改進(jìn)后的YOLOX 算法結(jié)構(gòu)示意圖

2 實(shí)驗(yàn)結(jié)果與分析

2.1 數(shù)據(jù)集介紹與實(shí)驗(yàn)設(shè)置

本文使用公開的offical-ssdd 數(shù)據(jù)集[15],該數(shù)據(jù)集對(duì)近岸船只目標(biāo)與遠(yuǎn)海船只目標(biāo)進(jìn)行了劃分,并提供了經(jīng)過(guò)二次校驗(yàn)后的船只目標(biāo)精確標(biāo)注,數(shù)據(jù)集樣本采用C 波段的Radarsat-2、Sentinel-1衛(wèi)星以及X 波段的TerrraSAR-X 衛(wèi)星的SAR 圖像的裁剪得到數(shù)據(jù),共包含1 160 張圖像、2 587 只船舶目標(biāo),其中928 張圖像、2 041 只船舶作為訓(xùn)練集,232 張圖像、546 只船舶作為測(cè)試集,平均每張圖像有2.23 個(gè)船只,包含5×4 像素的小目標(biāo)船只到384×251 像素的大目標(biāo)船只,涉及了大片遠(yuǎn)海區(qū)域和近岸區(qū)域目標(biāo),測(cè)試集共172 只近岸區(qū)域船舶目標(biāo),374 只遠(yuǎn)海區(qū)域船舶目標(biāo),背景多樣。

實(shí)驗(yàn)采用Pytorch 深度學(xué)習(xí)框架,基于CUDA11.4 和cuDNN8.2.4 加速訓(xùn)練,基于TensorRT部署推理,YOLOX 根據(jù)不同的網(wǎng)絡(luò)深度與寬度,由淺到深可以分為YOLOXnano、YOLOXtiny、YOLOXs 和YOLOXm 等多個(gè)模型,本文采用最輕量的模型YOLOXnano 進(jìn)行實(shí)驗(yàn),在此基礎(chǔ)上進(jìn)行改進(jìn)并與其原始網(wǎng)絡(luò)對(duì)比,最后再跟其他一些改進(jìn)方法進(jìn)行測(cè)試對(duì)比。輸入到模型的圖像大小設(shè)為416×416,batch size 大小為128,訓(xùn)練優(yōu)化器采用Adam 優(yōu)化器更新網(wǎng)絡(luò)參數(shù),其中學(xué)習(xí)率(learning rate)和權(quán)值衰減(weight decay)參數(shù)設(shè)為0.001 和0.000 5,旋 轉(zhuǎn) 目 標(biāo) 框 損 失 函 數(shù) 采 用KLD_Loss,損失權(quán)重為5,目標(biāo)角度損失采用CSL_Loss[16],損失權(quán)重為0.1,置信度損失采用BCE_Loss,損失權(quán)重為1;計(jì)算機(jī)具體配置為Intel? Xeon? E52640,2.40 GHz,顯卡為2*P5000[Pascal Quadro],顯存2×16 GB;部署平臺(tái)選用嵌入式平臺(tái)(NVIDIA Jetson AGX Xavier),顯存32 GB;算法的訓(xùn)練和測(cè)試均在GPU 加速下完成。

2.2 實(shí)時(shí)數(shù)據(jù)增強(qiáng)

深度學(xué)習(xí)需要足夠的訓(xùn)練樣本作為支撐,相較于光學(xué)圖像,SAR 圖像數(shù)據(jù)難以大量獲取,為了充分利用有限的訓(xùn)練數(shù)據(jù),加強(qiáng)模型泛化能力,抑制過(guò)擬合現(xiàn)象[17],本文通過(guò)隨機(jī)縮放、隨機(jī)旋轉(zhuǎn)、mosaic 拼接、mixup 變化等方法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行進(jìn)行實(shí)時(shí)數(shù)據(jù)增強(qiáng),效果如圖7 所示。

圖7 實(shí)時(shí)數(shù)據(jù)增強(qiáng)示意圖

2.3 實(shí)驗(yàn)結(jié)果與分析

本文采用平均精度(average precision, AP)作為SAR 圖像船只檢測(cè)模型性能的評(píng)價(jià)指標(biāo),計(jì)算式為:

式中,TP 為模型正確檢測(cè)的船只目標(biāo)數(shù)量;FP 為誤檢船只目標(biāo)數(shù)量;FN 為漏檢船只目標(biāo)數(shù)量;精確率P表示正確檢測(cè)的船只目標(biāo)數(shù)量在全部檢測(cè)結(jié)果中的比率;召回率R表示正確檢測(cè)的船只目標(biāo)數(shù)量占所有船只目標(biāo)真實(shí)數(shù)量的比率。以P為縱軸,R為橫軸,繪制出PR曲線,曲線與橫坐標(biāo)圍成的面積為AP 值,Ap50 為交并比閾值設(shè)為0.5 時(shí)的AP 值。

利用本文算法在offical-ssdd 數(shù)據(jù)集上進(jìn)行檢測(cè),對(duì)采用不同改進(jìn)方案的YOLOX 檢測(cè)算法結(jié)果進(jìn)行對(duì)比,以檢測(cè)精度Ap50 作為算法檢測(cè)精度性能指標(biāo),實(shí)驗(yàn)結(jié)果如表1 所示。表中YOLOX 為原始網(wǎng)絡(luò)不加任何改進(jìn)的檢測(cè)結(jié)果;CA_YOLOX 為引入了坐標(biāo)注意力機(jī)制到特征提取網(wǎng)絡(luò)中進(jìn)行改進(jìn)的YOLOX 算法;BCA_YOLOX 為引入了改進(jìn)后坐標(biāo)注意力機(jī)制到特征提取網(wǎng)絡(luò)中進(jìn)行改進(jìn)的YOLOX 算法;R_YOLOX 為引入了旋轉(zhuǎn)框方法到檢測(cè)頭中進(jìn)行改進(jìn)的YOLOX 算法;本文方法則是結(jié)合了改進(jìn)坐標(biāo)注意力機(jī)制與旋轉(zhuǎn)框的YOLOX 算法。從表1 可以看出,引入坐標(biāo)注意力機(jī)制后算法模型的精確率有所提升,召回率差異減少,誤檢嚴(yán)重問(wèn)題得到改善,引入改進(jìn)坐標(biāo)注意力機(jī)制后算法模型的精確率進(jìn)一步提升。引入旋轉(zhuǎn)框后算法模型在近岸區(qū)域的精確率有所提升,召回率基本保持一致,能更有效地定位出目標(biāo)的正確位置。通過(guò)結(jié)合改進(jìn)坐標(biāo)注意力機(jī)制與旋轉(zhuǎn)框方法,本文方法在近岸區(qū)域的檢測(cè)精度高于其他算法,擁有更好的檢測(cè)性能,在offical-ssdd 數(shù)據(jù)集近岸區(qū)域檢測(cè)的Ap50值相較于YOLOX 算法提升了18.77%,引入注意力機(jī)制與旋轉(zhuǎn)框方法都提高了近岸區(qū)域下船只目標(biāo)的檢測(cè)平均精度,同時(shí)引入改進(jìn)坐標(biāo)注意力機(jī)制與旋轉(zhuǎn)框這兩種改進(jìn)方法后,網(wǎng)絡(luò)的檢測(cè)性能最好。

表1 SAR 船只檢測(cè)結(jié)果評(píng)價(jià)指標(biāo)

為驗(yàn)證本文所提檢測(cè)網(wǎng)絡(luò)的性能,在offical-ssdd數(shù)據(jù)集上完成本文方法與YOLOv3[18]、YOLOv5[19]和Faster R-CNN 算法的對(duì)比實(shí)驗(yàn),結(jié)果如表2 所示。從表中可以看出,本文方法相較除YOLOX 以外的其他算法,模型計(jì)算參數(shù)最少,總體測(cè)試檢測(cè)精度最優(yōu),網(wǎng)絡(luò)推理延時(shí)最低,且能獲取船只目標(biāo)方位角信息,滿足實(shí)時(shí)處理需求。

表2 不同算法檢測(cè)性能對(duì)比

本文實(shí)驗(yàn)檢測(cè)結(jié)果如圖8 所示。對(duì)于緊密排列的鄰岸大目標(biāo),傳統(tǒng)YOLOX 算法會(huì)出現(xiàn)漏檢現(xiàn)象,或如圖8b 所示只輸出一個(gè)大的目標(biāo)框,而本文算法則能有效地檢測(cè)并區(qū)分鄰近排列的船只,如圖8c 所示。

圖8 鄰岸大目標(biāo)檢測(cè)對(duì)比示意圖

對(duì)于在港口中??康拇?圖9a),采用傳統(tǒng)YOLOX 算法進(jìn)行檢測(cè)時(shí),出現(xiàn)了誤檢與漏檢現(xiàn)象,將陸地建筑誤檢為船只目標(biāo),對(duì)港口停靠緊密的船只則只輸出一個(gè)較大的目標(biāo)框,無(wú)法有效區(qū)分排列緊密的船只目標(biāo),如圖9b 所示。而本文方法則有效檢測(cè)并區(qū)分各船只目標(biāo),沒(méi)有錯(cuò)檢現(xiàn)象,如圖9c 所示。

圖9 港口大目標(biāo)檢測(cè)對(duì)比示意圖

從圖10 可以看出,傳統(tǒng)YOLOX 算法采用水平框檢測(cè),船只越大水平框引入的背景信息越多,模型對(duì)大船只目標(biāo)的關(guān)注度不夠,導(dǎo)致輸出預(yù)測(cè)框置信度較低。本文算法預(yù)測(cè)框置信度明顯提升,且預(yù)測(cè)框可以更精確地涵蓋目標(biāo)區(qū)域,輸出更精確的目標(biāo)位置信息,檢測(cè)更為準(zhǔn)確。

圖10 河道大目標(biāo)檢測(cè)對(duì)比示意圖

對(duì)于近岸小目標(biāo),傳統(tǒng)YOLOX 算法會(huì)出現(xiàn)漏檢現(xiàn)象,如圖11 所示,難以檢測(cè)出??吭诎哆叺男∧繕?biāo)船只。而本文方法則能對(duì)近岸小目標(biāo)進(jìn)行有效檢測(cè),但由于近岸場(chǎng)景下,近岸建筑產(chǎn)生的強(qiáng)散射點(diǎn)與臨近的船只特征相近,在特征提取的過(guò)程中引入背景干擾信息過(guò)多,導(dǎo)致近岸區(qū)域小目標(biāo)的檢測(cè)置信度較低,僅在50%~60%之間。

圖11 近岸小目標(biāo)檢測(cè)對(duì)比示意圖

在海島周圍區(qū)域,從圖12 可以看出,傳統(tǒng)YOLOX 算法將島嶼誤檢為船只目標(biāo),而本文方法則是將海面雜波散射點(diǎn)誤檢為船只目標(biāo)。這是由于本文方法采用旋轉(zhuǎn)框檢測(cè),對(duì)異于周圍海面背景下的雜波散射點(diǎn)更為敏感,導(dǎo)致誤檢現(xiàn)象。而傳統(tǒng)YOLOX 采用水平框檢測(cè),在周圍背景干擾下對(duì)海面雜波散射點(diǎn)的關(guān)注度降低,其對(duì)船只目標(biāo)輸出的預(yù)測(cè)框置信度也較低,在檢測(cè)閾值設(shè)為0.5 的情況下不會(huì)將雜波散射點(diǎn)視為船只目標(biāo),但會(huì)將區(qū)域亮度信息較為明顯的島嶼錯(cuò)檢為船只目標(biāo)。

圖12 鄰島小目標(biāo)檢測(cè)對(duì)比示意圖

從圖13 也可以看出,本文方法對(duì)異于周圍海面背景下的散射信息更為敏感,將海面雜波散射點(diǎn)誤檢為船只目標(biāo),而傳統(tǒng)YOLOX 算法對(duì)海面散射信息的關(guān)注度較低,因此未產(chǎn)生誤檢現(xiàn)象。在近海區(qū)域,本文方法預(yù)測(cè)框置信度較傳統(tǒng)YOLOX 算法有明顯提升。

圖13 近海小目標(biāo)檢測(cè)對(duì)比示意圖

本文方法在遠(yuǎn)海場(chǎng)景不同海況情形下檢測(cè)效果如圖14 所示,可以看到,對(duì)于不同海況情形下的遠(yuǎn)海場(chǎng)景目標(biāo),本文方法依舊可有效進(jìn)行檢測(cè)。綜上所述,對(duì)于SAR 船只目標(biāo)檢測(cè)任務(wù),本文方法在近岸和遠(yuǎn)海場(chǎng)景下都能取得良好的效果,能夠在復(fù)雜背景下識(shí)別船只目標(biāo),并且能更好地處理多尺度問(wèn)題,得到更加精準(zhǔn)的檢測(cè)框。

圖14 遠(yuǎn)海船只目標(biāo)檢測(cè)結(jié)果示意圖

3 結(jié) 束 語(yǔ)

本文提出了基于改進(jìn)坐標(biāo)注意力機(jī)制與旋轉(zhuǎn)目標(biāo)框的單階段檢測(cè)網(wǎng)絡(luò)方法。在構(gòu)建特征提取網(wǎng)絡(luò)時(shí)加入改進(jìn)坐標(biāo)注意力機(jī)制準(zhǔn)確提取感興趣區(qū)域,同時(shí)選用旋轉(zhuǎn)目標(biāo)框獲得船只方位角信息,提高檢測(cè)精度。經(jīng)offical-ssdd 數(shù)據(jù)集實(shí)驗(yàn)驗(yàn)證,改進(jìn)的YOLOX 檢測(cè)算法的檢測(cè)精度在近岸情形下較YOLOX模型提升了18.77%,與主流YOLOv5 檢測(cè)算法相比,本文模型計(jì)算參數(shù)量減少了84.2%,推理耗時(shí)縮減至1/3,總體檢測(cè)精度提升了4.1%,滿足實(shí)時(shí)處理需求,驗(yàn)證了本方法的有效性。本文方法雖較基于水平框檢測(cè)方法能得到更精準(zhǔn)的目標(biāo)框,但對(duì)SAR 圖像近岸場(chǎng)景中的大船只目標(biāo)中心定位仍有待進(jìn)一步提升。后續(xù)仍需進(jìn)一步擴(kuò)充數(shù)據(jù)集,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),減小網(wǎng)絡(luò)對(duì)近岸船只的定位偏移量。

猜你喜歡
船只注意力特征
讓注意力“飛”回來(lái)
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
“揚(yáng)眼”APP:讓注意力“變現(xiàn)”
A Beautiful Way Of Looking At Things
國(guó)產(chǎn)多波束系統(tǒng)在海上失事船只探測(cè)中的應(yīng)用
線性代數(shù)的應(yīng)用特征
孟加拉船只“罷工”
桑植县| 新平| 罗源县| 河东区| 佛山市| 民和| 四子王旗| 沿河| 浦江县| 荥经县| 嘉峪关市| 锡林浩特市| 瑞昌市| 榆社县| 双辽市| 林甸县| 航空| 志丹县| 德格县| 泰宁县| 彭阳县| 宜宾市| 瑞金市| 祁连县| 贵港市| 太原市| 文登市| 六枝特区| 平阳县| 新兴县| 海晏县| 原平市| 海伦市| 玉环县| 青州市| 兖州市| 靖安县| 如皋市| 喀什市| 莒南县| 盘锦市|