王春平, 韓子碩, 付 強(qiáng)
(陸軍工程大學(xué) 石家莊校區(qū),河北 石家莊 050003)
合成孔徑雷達(dá)(Synthetic aperture radar, SAR)是一種主動(dòng)式微波成像傳感器,可以全天候、全天時(shí)地執(zhí)行遙感監(jiān)視任務(wù),其多極化和高分辨率成像模式,為對(duì)地監(jiān)測(cè)提供了大量可利用數(shù)據(jù)[1]。目標(biāo)檢測(cè)作為SAR的一項(xiàng)前沿技術(shù),已被廣泛應(yīng)用于戰(zhàn)場(chǎng)態(tài)勢(shì)監(jiān)測(cè)、軍事目標(biāo)搜索、水上目標(biāo)檢測(cè)和城市交通管控等多個(gè)軍事及民用領(lǐng)域。
由于SAR獨(dú)特的成像機(jī)制和復(fù)雜的電磁波散射過程,導(dǎo)致所成圖像中的地物存在幾何畸變和陰影,且充斥著大量的相干斑噪聲,使得傳統(tǒng)的目標(biāo)檢測(cè)算法[2-4]收效甚微。近年來,隨著深度學(xué)習(xí)算法的崛起,許多優(yōu)異的目標(biāo)檢測(cè)模型[5-7]脫穎而出。然而,當(dāng)將其應(yīng)用于SAR圖像目標(biāo)檢測(cè)時(shí),檢測(cè)性能往往會(huì)急劇下降。究其原因,一是受相干斑噪聲和復(fù)雜環(huán)境影響,許多目標(biāo)特征淹沒于背景當(dāng)中,導(dǎo)致目標(biāo)視覺線索匱乏;二是地物成像畸變和諸多假目標(biāo)干擾檢測(cè)器判斷,導(dǎo)致虛警和漏警;三是目標(biāo)特性及其分布多變,給檢測(cè)任務(wù)帶來巨大挑戰(zhàn)。顯然,增強(qiáng)目標(biāo)的顯著性特征和優(yōu)化檢測(cè)器的判別能力是提高網(wǎng)絡(luò)性能的有效途徑。此外,提高檢測(cè)效率也是至關(guān)重要的。大多數(shù)現(xiàn)有的深度學(xué)習(xí)網(wǎng)絡(luò)模型通常需要一組具有預(yù)定尺寸和縱橫比的錨框,然后借助真實(shí)目標(biāo)將其回歸至所需位置,再通過非極大值抑制(Non-maxima suppression, NMS)消除對(duì)同一目標(biāo)的重復(fù)檢測(cè)。盡管此類基于錨框的檢測(cè)算法已經(jīng)取得巨大成功,但這種思想不僅需要根據(jù)不同的應(yīng)用背景手動(dòng)設(shè)定合適的錨框參數(shù),而且還需要枚舉所有可能的目標(biāo)位置,大量的錨框冗余令檢測(cè)器耗時(shí)耗力,也限制了其通用性。
無錨框模型通過直接預(yù)測(cè)目標(biāo)關(guān)鍵點(diǎn)和相關(guān)元素(如分類概率、目標(biāo)置信度等)實(shí)現(xiàn)目標(biāo)檢測(cè)。CornerNet[8]通過預(yù)測(cè)目標(biāo)框的左上角和右下角兩個(gè)關(guān)鍵點(diǎn)得到預(yù)測(cè)邊框,ExtremeNet[9]通過預(yù)測(cè)目標(biāo)的中心點(diǎn)以及4個(gè)頂點(diǎn)共5個(gè)關(guān)鍵點(diǎn)實(shí)現(xiàn)目標(biāo)檢測(cè)。然而,這兩種算法都需要增設(shè)一個(gè)分組模塊將預(yù)測(cè)的眾多關(guān)鍵點(diǎn)分配給所屬目標(biāo),這無疑降低了檢測(cè)速度。CenterNet[10]將目標(biāo)建模成單個(gè)中心點(diǎn),并回歸所有其他坐標(biāo)參數(shù)(如目標(biāo)寬度、高度和分類概率等)完成目標(biāo)檢測(cè)任務(wù),其摒棄了關(guān)鍵點(diǎn)分組,提高了檢測(cè)效率。在此基礎(chǔ)上,BBAVectorst[11]通過預(yù)測(cè)目標(biāo)的中心點(diǎn)以及對(duì)應(yīng)的10維參數(shù)向量實(shí)現(xiàn)旋轉(zhuǎn)目標(biāo)定向檢測(cè),但由于預(yù)測(cè)參數(shù)較多,其檢測(cè)速度也不夠理想。
基于以上分析,針對(duì)SAR圖像目標(biāo)檢測(cè)困難以及錨框機(jī)制所引起的計(jì)算冗余和應(yīng)用場(chǎng)景受限問題,提出了一種基于無錨框機(jī)制的中心點(diǎn)、尺度和旋轉(zhuǎn)角度預(yù)測(cè)網(wǎng)絡(luò)(Center, scale and angle prediction network, CSAP-Net)。CSAP-Net將目標(biāo)檢測(cè)轉(zhuǎn)化為中心點(diǎn)估計(jì)問題,然后在中心點(diǎn)位置直接預(yù)測(cè)目標(biāo)的其他坐標(biāo)參數(shù),如寬度、高度、旋轉(zhuǎn)角度等,其具有快速準(zhǔn)確的特點(diǎn),可以高效完成多場(chǎng)景、多類型SAR圖像目標(biāo)定向檢測(cè)。
CSAP-Net為無錨框單階段網(wǎng)絡(luò)模型,以ResNet-101的為主干網(wǎng)絡(luò),并利用U型跳躍連接和注意力模塊提取輸入圖像極具表征能力的高分辨率語(yǔ)義特征圖,檢測(cè)層輸出用于估計(jì)中心點(diǎn)的熱力圖(Heatmap)、計(jì)算中心點(diǎn)偏移量(Center offset)的特征圖和邊框參數(shù)(Box param)特征圖,三者聯(lián)合完成目標(biāo)定向檢測(cè)。訓(xùn)練過程中,通過優(yōu)化損失函數(shù)來增強(qiáng)邊框約束,并利用“翻轉(zhuǎn)+剪切”的數(shù)據(jù)增強(qiáng)技術(shù)擴(kuò)增訓(xùn)練數(shù)據(jù)集以提升模型檢測(cè)性能。圖1展示了該網(wǎng)絡(luò)的基本框架。
CSAP-Net的特征提取網(wǎng)絡(luò)是一個(gè)U型結(jié)構(gòu),以ResNet-101為主干,ResNet-101的網(wǎng)絡(luò)結(jié)構(gòu)如表1所示。為了得到特征更加豐富的預(yù)測(cè)特征層,將主干網(wǎng)絡(luò)殘差模塊Ⅴ的輸出經(jīng)上采樣后與殘差模塊IV的輸出進(jìn)行跳躍連接,并利用基于注意力機(jī)制的特征層級(jí)聯(lián)(Attention-based concatenation, AC)策略將兩者特征進(jìn)行融合。同理,將融合后的特征圖與殘差模塊III的輸出進(jìn)行連接融合。最后,共經(jīng)3次上采樣和3個(gè)AC后得到高分辨率語(yǔ)義特征圖。融合過程中的上采樣用于統(tǒng)一兩層特征圖的尺寸大小,跳躍連接可以將網(wǎng)絡(luò)深層特征與淺層特征結(jié)合起來,共享高層語(yǔ)義特征和淺層細(xì)節(jié)信息,AC模塊將網(wǎng)絡(luò)注意力聚焦于信息量較大的區(qū)域,抑制無關(guān)區(qū)域。
表1 ResNet-101的網(wǎng)絡(luò)結(jié)構(gòu)
AC模塊共有兩路輸入,一路是待上采樣的特征圖,即ResNet-101殘差模塊V或前一個(gè)AC模塊的輸出,另一路是由殘差模塊II~I(xiàn)V輸出的高分辨率特征圖。假設(shè)ResNet-101殘差模塊II~V的輸出分別為F2~F5,則3個(gè)AC模塊的輸出Ai(i∈[2,3,4)可表示為
圖2 真實(shí)目標(biāo)中心點(diǎn)設(shè)置
圖3 中心點(diǎn)周圍負(fù)樣本的懲罰衰減量
(3)
(4)
(5)
(6)
Ltotal=Lh+Lo+Lb+LGIoU
(7)
圖4 不同邊框重疊情況時(shí)的平滑L1損失、IoU和GIoU損失
為了驗(yàn)證所提算法的有效性,實(shí)驗(yàn)中使用了MSTAR數(shù)據(jù)集和SSDD數(shù)據(jù)集,其中前者為公開的軍事車輛數(shù)據(jù)集,后者為艦船數(shù)據(jù)集。
MSTAR數(shù)據(jù)集由美國(guó)國(guó)防高級(jí)研究計(jì)劃局和空間實(shí)驗(yàn)室發(fā)布。該數(shù)據(jù)集由X波段、HH極化方式、高分辨率聚束式星載合成孔徑雷達(dá)采集得到,共包括10類典型軍事目標(biāo)在0~360°不同姿態(tài)角下的靜止切片圖像和100幅場(chǎng)景圖(圖像尺寸為1 784像素×1 478像素)。為了獲得大場(chǎng)景SAR圖像下的軍事車輛樣本,利用合成的方法制作包含BMP2、BTR70和T72三類目標(biāo)的大場(chǎng)景SAR圖像。首先,建立包含100個(gè)場(chǎng)景的背景庫(kù)和包含1 283個(gè)目標(biāo)的目標(biāo)庫(kù),其中587個(gè)目標(biāo)的SAR入射角為15°、696個(gè)目標(biāo)的SAR入射角為17°。然后,每次選取一幅背景圖像和若干個(gè)目標(biāo)合成一幅場(chǎng)景圖,共合成340幅大場(chǎng)景SAR圖像,圖5給出了合成示例。其中,包含2 730個(gè)目標(biāo)(SAR入射角為15°)的300幅場(chǎng)景圖用于模型訓(xùn)練,其余包含696個(gè)目標(biāo)(SAR入射角為17°)的40幅場(chǎng)景圖用于測(cè)試。訓(xùn)練過程中,一幅場(chǎng)景圖將被分割成一系列尺寸為400×400的子圖像(重疊率為20%)。在此基礎(chǔ)之上,對(duì)原始的SAR入射角為15°的587個(gè)目標(biāo)切片周圍的像素進(jìn)行隨機(jī)填充,以匹配子圖像的大小,并為每個(gè)切片選擇兩個(gè)擴(kuò)展圖像作為擴(kuò)展數(shù)據(jù)集。數(shù)據(jù)集的詳細(xì)信息見表2。
圖5 大場(chǎng)景SAR圖像合成示例
表2 MSTAR數(shù)據(jù)集詳細(xì)信息
SSDD數(shù)據(jù)集包含由Radarsat-2、TerraSAR-X和Sentinel-1 SAR衛(wèi)星收集的總共1 160幅SAR圖像,含有2 456個(gè)尺度變化范圍較大的艦船目標(biāo),場(chǎng)景類型包含港口、島礁、遠(yuǎn)海區(qū)域等,適合驗(yàn)證檢測(cè)算法對(duì)不同大小目標(biāo)的檢測(cè)能力以及對(duì)不同背景的適應(yīng)能力。該數(shù)據(jù)集中圖像的分辨率和尺寸均不固定,樣例如圖6所示, 詳細(xì)信息如表3所示。
圖6 SSDD數(shù)據(jù)集樣例
表3 SSDD數(shù)據(jù)集詳細(xì)信息
本文所有實(shí)驗(yàn)均在配置為E5-2630v4 CPU,NVIDIA GTX-1080Ti GPU (11 GB顯存),64 GB RAM的圖像工作站上進(jìn)行,以深度學(xué)習(xí)框架Tensorflow為編譯工具完成。
網(wǎng)絡(luò)接收視野固定為608×608,則預(yù)測(cè)特征圖尺寸為152×152。訓(xùn)練過程中,利用基于ImageNet數(shù)據(jù)集訓(xùn)練的ResNet-101預(yù)訓(xùn)練模型初始化網(wǎng)絡(luò)參數(shù),并采用“翻轉(zhuǎn)+裁剪”的數(shù)據(jù)增強(qiáng)技術(shù)擴(kuò)增訓(xùn)練數(shù)據(jù)集,提升模型的魯棒性。MSTAR數(shù)據(jù)集訓(xùn)練80輪次,SSDD數(shù)據(jù)集訓(xùn)練50輪次,并采用初始學(xué)習(xí)率為1.25×10-4的Adam優(yōu)化器優(yōu)化損失函數(shù)。
CSAP-Net借助旋轉(zhuǎn)檢測(cè)(Rotation detection, RD)技術(shù)、基于注意力機(jī)制的特征層級(jí)聯(lián)策略(AC)和GIoU損失(LGIoU)實(shí)現(xiàn)了不同應(yīng)用場(chǎng)景下的目標(biāo)定向檢測(cè)。為了探究以上3種功能策略對(duì)檢測(cè)結(jié)果的影響,分別在MSTAR大場(chǎng)景數(shù)據(jù)集和SSDD數(shù)據(jù)集上進(jìn)行了6組實(shí)驗(yàn),各組實(shí)驗(yàn)的檢測(cè)結(jié)果如表4所示,其中“√”表示采用某項(xiàng)策略,而“×”表示不采用某項(xiàng)策略,AP表示平均準(zhǔn)確率,mAP表示均值平均精度,兩者用于衡量模型的檢測(cè)精度,F(xiàn)PS(幀/s)表示檢測(cè)器每秒處理的圖像數(shù)量,用于衡量模型的檢測(cè)速度。
表4 CSAP-Net采用不同功能策略模塊的檢測(cè)結(jié)果
由表4可知,實(shí)驗(yàn)1未附加任何策略,相當(dāng)于一個(gè)以ResNet-101的U型網(wǎng)絡(luò)結(jié)構(gòu)為特征提取網(wǎng)絡(luò)的CenterNet無錨框檢測(cè)模型,在MSTAR數(shù)據(jù)集上的mAP值達(dá)到了84.20%,檢測(cè)速度為18.21 FPS,在SSDD數(shù)據(jù)集上的AP值達(dá)到了90.29%,檢測(cè)速度為18.96 FPS。實(shí)驗(yàn)2在實(shí)驗(yàn)1的基礎(chǔ)上引入了旋轉(zhuǎn)角度θ,實(shí)現(xiàn)了對(duì)任意向目標(biāo)的旋轉(zhuǎn)檢測(cè)。如圖7所示,盡管θ能夠指示目標(biāo)的朝向信息,為觀測(cè)者提供更多的可依據(jù)判定信息,然而由于預(yù)測(cè)邊框與真實(shí)邊框之間的IoU對(duì)θ十分敏感,而實(shí)驗(yàn)2的檢測(cè)模型對(duì)θ的約束力又略有不足,致使檢測(cè)性能有所下降,相較于實(shí)驗(yàn)1,在兩個(gè)數(shù)據(jù)集上的檢測(cè)精度分別降低了3.24%、5.97%。在實(shí)驗(yàn)2基礎(chǔ)上,實(shí)驗(yàn)3將基于注意力機(jī)制的特征層級(jí)聯(lián)策略引入檢測(cè)模型中,構(gòu)建信息豐富的高分辨率語(yǔ)義特征圖,為目標(biāo)預(yù)測(cè)提供強(qiáng)力支撐,相較于前者,在兩個(gè)數(shù)據(jù)集上的檢測(cè)精度分別提升了3.87%、4.55%。實(shí)驗(yàn)4在實(shí)驗(yàn)2的基礎(chǔ)上,將GIoU損失加入總損失當(dāng)中,增強(qiáng)檢測(cè)器對(duì)目標(biāo)位置參數(shù)尤其是旋轉(zhuǎn)角度θ的約束,兩個(gè)數(shù)據(jù)集上的檢測(cè)精度分別提升了8.32%、5.03%。實(shí)驗(yàn)5的檢測(cè)模型即為CSAP-Net,在兩個(gè)數(shù)據(jù)集上的檢測(cè)精度達(dá)到了最優(yōu),分別為93.93%、92.07%,且保持了16 FPS以上的檢測(cè)速度,達(dá)到了精度與速度的最佳均衡。
圖7 水平邊框和旋轉(zhuǎn)邊框檢測(cè)效果
為了驗(yàn)證CSAP-Net在眾多檢測(cè)模型中的優(yōu)越性,將其與SSD[12]、R2CNN[13]、Faster RCNN++[14]、RRPN[15]、YOLOv3[7]、LRTDet[16]、R-DFPN[17]、CenterNet[10]、BBAVectors[11]等9種檢測(cè)模型進(jìn)行比較。各種方法在MSTAR和SSDD數(shù)據(jù)集上的檢測(cè)結(jié)果定量比較如表5所示。
表5 不同算法的檢測(cè)結(jié)果比較
分析表5檢測(cè)結(jié)果,F(xiàn)aster RCNN++雖然采用了多層融合策略,在一定程度上綜合了高層語(yǔ)義信息和淺層細(xì)粒度特征,但主干網(wǎng)絡(luò)由5層卷積堆疊而成,其泛化能力不足以處理復(fù)雜的SAR圖像環(huán)境,導(dǎo)致檢測(cè)效果不理想。但由于其結(jié)構(gòu)簡(jiǎn)單,檢測(cè)速度優(yōu)于其他雙階段網(wǎng)絡(luò)。R2CNN和RRPN均以ResNet-50作為主干網(wǎng)絡(luò),并通過旋轉(zhuǎn)角度因子實(shí)現(xiàn)任意朝向目標(biāo)的定向檢測(cè),但兩者對(duì)目標(biāo)特征的刻畫能力有限,在MSTAR和SSDD數(shù)據(jù)集上的檢測(cè)精度均低于83%。相較于前三者,R-DFPN與LRTDet在兩個(gè)數(shù)據(jù)集上的表現(xiàn)有所改善,但兩者均以復(fù)雜的模型結(jié)構(gòu)來?yè)Q取性能的提升,從精度-速度效能以及檢測(cè)效率的角度來看,這是非常不明智的。SSD和YOLOv3作為應(yīng)用最為廣泛的單階段網(wǎng)絡(luò),檢測(cè)速度比雙階段網(wǎng)絡(luò)有了大幅提高。然而,由于Mobilenet-v1削弱了SSD的泛化能力,致使其在兩個(gè)數(shù)據(jù)集上檢測(cè)效果較差,mAP(或AP)僅達(dá)57.50%和61.00%。YOLOv3以Darknet-53為主干網(wǎng)絡(luò),且采用多層預(yù)測(cè)模式,有益于多尺度目標(biāo)檢測(cè),在MSTAR上的mAP為78.19%、檢測(cè)速度為10.20 FPS,在SSDD上的AP為83.56%、檢測(cè)速度為11.60 FPS。以上網(wǎng)絡(luò)模型均為基于錨框的檢測(cè)方法,由于大量的錨框和計(jì)算冗余,導(dǎo)致其檢測(cè)速度較慢。CenterNet和BBAvectors是當(dāng)前性能比較優(yōu)異的無錨框檢測(cè)模型,CenterNet在SSDD上的性能要優(yōu)于BBAVectors,而后者在MSTAR上的表現(xiàn)更佳。BBAVectors通過直接預(yù)測(cè)一個(gè)包含12個(gè)參數(shù)的坐標(biāo)向量實(shí)現(xiàn)目標(biāo)定向檢測(cè),在兩個(gè)數(shù)據(jù)集上的mAP(或AP)分別達(dá)91.94%、89.21%,但由于預(yù)測(cè)參數(shù)量的增大致使其檢測(cè)速度略輸于CenterNet。后者通過直接預(yù)測(cè)目標(biāo)中心點(diǎn)、寬和高實(shí)現(xiàn)目標(biāo)檢測(cè),在兩個(gè)數(shù)據(jù)集上的mAP(或AP)分別達(dá)84.20%、90.29%,且檢測(cè)速度均高于18 FPS。值得注意的是,CenterNet是水平框檢測(cè),而BBAVectors為旋轉(zhuǎn)框檢測(cè)(可提供目標(biāo)朝向信息)。CSAP-Net通過引入旋轉(zhuǎn)角度實(shí)現(xiàn)目標(biāo)定向檢測(cè),并利用跳躍連接和注意力結(jié)構(gòu)提取極具表征力的高分辨率語(yǔ)義特征,訓(xùn)練過程引入GIoU損失和“翻轉(zhuǎn)+裁剪”的數(shù)據(jù)增強(qiáng)技術(shù)提升模型檢測(cè)性能,在兩個(gè)測(cè)試數(shù)據(jù)集上的mAP(或AP)分別達(dá)93.93%、92.07%,且保持了16 FPS以上的檢測(cè)速度。相較于具有相同功能的BBAVectors,CSAP-Net不僅檢測(cè)精度高,而且檢測(cè)速度提升了3.4 FPS。圖8展示了所提模型在不同應(yīng)用背景下的目標(biāo)檢測(cè)可視化結(jié)果,說明所提方法可有效完成不同背景下的多尺度、多類型目標(biāo)的定向檢測(cè)任務(wù)。
圖8 聯(lián)合模型在不同場(chǎng)景下的目標(biāo)檢測(cè)可視化結(jié)果
中心點(diǎn)預(yù)測(cè)是 CSAP-Net 的首要任務(wù)和關(guān)鍵,一旦中心點(diǎn)丟失,則會(huì)造成目標(biāo)漏檢。SAR圖像中存在著大量的相干斑噪聲,而且目標(biāo)與背景的對(duì)比度較低,這無疑給檢測(cè)器預(yù)測(cè)中心點(diǎn)帶來很大挑戰(zhàn)。因此分析檢測(cè)模型的抗噪性能至關(guān)重要。下面,對(duì)CSAP-Net的抗噪性能進(jìn)行驗(yàn)證,首先使用不同噪聲比(Noise ratio)的椒鹽噪聲污染原始測(cè)試集中的樣本,噪聲比分別設(shè)置為2%、4%、8%、10% 和 12%,而后利用原數(shù)據(jù)集訓(xùn)練的檢測(cè)模型對(duì)噪聲污染的測(cè)試集進(jìn)行目標(biāo)檢測(cè),測(cè)試結(jié)果如圖9所示。
圖9 CSAP-Net和CenterNet的檢測(cè)性能與噪聲比關(guān)系圖
由圖9可知,隨著噪聲比的增加,CSAP-Net和CenterNet都產(chǎn)生了不同程度的性能下降。當(dāng)噪聲比達(dá)到 6% 時(shí),CSAP-Net 在兩個(gè)數(shù)據(jù)集上的 mAP 值仍然可以保持在 70% 以上甚至接近 80%,而 CenterNet 的 mAP 值則下降到 60% 以下。此外,當(dāng)噪聲比達(dá)到 12% 時(shí),CSAP-Net 的 mAP 值保持在 50% 以上,遠(yuǎn)遠(yuǎn)高于CenterNet。說明CSAP-Net對(duì)噪聲有一定的抑制作用,驗(yàn)證了其抗噪聲能力。結(jié)合2.3節(jié)中的消融實(shí)驗(yàn)分析可推斷出,CSAP-Net的抗噪能力主要得益于3個(gè)方面:(1)注意力模塊可以抑制背景、突顯前景,引導(dǎo)檢測(cè)器關(guān)注包含更多目標(biāo)信息的區(qū)域,進(jìn)而起到消除背景及噪聲干擾的目的;(2)旋轉(zhuǎn)定向檢測(cè)標(biāo)注的是目標(biāo)最小外接矩形,減小了邊框冗余,進(jìn)一步降低了噪聲干擾;(3)GIoU 損失增強(qiáng)了對(duì)回歸邊框的約束,使檢測(cè)器更加穩(wěn)健。比較CSAP-Net在SSDD和MSTAR上的抗噪表現(xiàn)不難發(fā)現(xiàn),隨著噪聲比的增加,檢測(cè)器性能在MSTAR數(shù)據(jù)集上的下降速度比SSDD數(shù)據(jù)集快。原因是在SSDD數(shù)據(jù)集中,目標(biāo)和背景之間的對(duì)比度較高,令其能夠承受一定程度的噪聲污染。相反,在 MSTAR 數(shù)據(jù)集中,目標(biāo)和背景的對(duì)比度本身并不占優(yōu),而噪聲無疑會(huì)加劇這一劣勢(shì)。
針對(duì)錨框機(jī)制所引起的大量冗余計(jì)算和模型通用性受限問題,本文提出了一種單階段無錨框深度學(xué)習(xí)框架CSAP-Net。該模型利用ResNet-101的U型結(jié)構(gòu)和特別設(shè)計(jì)的注意力模塊提取輸入樣本的高分辨率語(yǔ)義特征圖,突顯前景、抑制背景;在訓(xùn)練過程中引入GIoU損失消除旋轉(zhuǎn)角度θ引起的IoU誤差,彌補(bǔ)了平滑L1損失的不足,并采用“翻轉(zhuǎn)+裁剪”的數(shù)據(jù)增強(qiáng)技術(shù)擴(kuò)增訓(xùn)練集,提升模型檢測(cè)能力,實(shí)現(xiàn)目標(biāo)定向檢測(cè)。CSAP-Net具有簡(jiǎn)單、快速、準(zhǔn)確的特點(diǎn)。在SSDD和MSTAR數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果驗(yàn)證了所提方法對(duì)不同復(fù)雜背景下的多類型目標(biāo)檢測(cè)的有效性和通用性。