李 揚(yáng),蔡廣飛
(1.江蘇商貿(mào)職業(yè)學(xué)院 電子與信息學(xué)院,江蘇 南通 226011;2.江蘇省物聯(lián)網(wǎng)與視覺智能處理工程技術(shù)研究開發(fā)中心,江蘇 南通 226011)
光電檢測技術(shù)[1]在現(xiàn)代化戰(zhàn)爭中所扮演的角色愈發(fā)關(guān)鍵,同時在海事搜救、航空航天及農(nóng)業(yè)生產(chǎn)等領(lǐng)域也發(fā)揮了積極的作用[2]。紅外熱成像設(shè)備具有隱蔽性好、機(jī)動性佳以及環(huán)境適應(yīng)能力強(qiáng)等優(yōu)點(diǎn),成為光電檢測技術(shù)的一個研究熱點(diǎn)[3]。國際光學(xué)工程學(xué)會(Society of Photo-Optical Instrumentation Engineers,SPIE)[4]將占圖像面積比例小于 0.15%的目標(biāo)定義為紅外弱小目標(biāo),致使紅外弱小目標(biāo)缺少形狀、顏色以及紋理等視覺信息,為弱小目標(biāo)檢測任務(wù)帶來了極大的困難與挑戰(zhàn)[5]。
當(dāng)前主流的紅外弱小目標(biāo)檢測方法大體可分為基于空間域[6]、基于變換域[7]與基于神經(jīng)網(wǎng)絡(luò)[8]三大類別。基于空間域的檢測方法[6]通常采用圖像預(yù)處理技術(shù)使目標(biāo)與背景分離,在此基礎(chǔ)上再增強(qiáng)目標(biāo)特征并抑制背景噪聲?;谧儞Q域的檢測方法[7]通常對紅外圖像進(jìn)行濾波來預(yù)測目標(biāo)可能出現(xiàn)的區(qū)域,然后在變換域?qū)δ繕?biāo)進(jìn)行精細(xì)化預(yù)測?;谏窠?jīng)網(wǎng)絡(luò)的檢測方法[8]主要利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征學(xué)習(xí)能力提取紅外圖像的特征,能有效解決基于空間域與基于變換域提取特征的局限性,再結(jié)合分類器對圖像中的目標(biāo)進(jìn)行檢測與分類?;诳臻g域與基于變換域的紅外弱小目標(biāo)檢測方法具有檢測效率高、無需訓(xùn)練的優(yōu)點(diǎn),但在復(fù)雜背景下的檢測虛警高、準(zhǔn)確性低?;谏窠?jīng)網(wǎng)絡(luò)的紅外弱小目標(biāo)檢測方法檢測準(zhǔn)確性較高,但其訓(xùn)練難度大且檢測效率較低[9-10]。
文獻(xiàn)[11]提出基于完全連接卷積神經(jīng)網(wǎng)絡(luò)的紅外弱小目標(biāo)檢測方法,利用完全卷積網(wǎng)絡(luò)初步檢測紅外弱小目標(biāo)與抑制背景,利用分類網(wǎng)絡(luò)對候選目標(biāo)點(diǎn)進(jìn)行精細(xì)化選擇。文獻(xiàn)[12]提出基于完全卷積網(wǎng)絡(luò)和稠密條件隨機(jī)場的深度學(xué)習(xí)分割算法,利用全卷積網(wǎng)絡(luò)進(jìn)行像素級別特征提取,使用稠密條件隨機(jī)場進(jìn)行上下文信息優(yōu)化的精確分割,最終對復(fù)雜背景下紅外弱小目標(biāo)的檢測效果也較理想。分析文獻(xiàn)[11-12]的實(shí)驗(yàn)結(jié)果可得出,基于完全卷積神經(jīng)網(wǎng)絡(luò)的紅外弱小目標(biāo)檢測方法通常由特征學(xué)習(xí)與分類器訓(xùn)練2個階段構(gòu)成,雖然能實(shí)現(xiàn)較高的查準(zhǔn)率與查全率,但訓(xùn)練難度大且耗時長。
研究人員結(jié)合現(xiàn)有研究成果并加以組合,建立了單階段的目標(biāo)檢測神經(jīng)網(wǎng)絡(luò)模型YOLO[13],該模型在單幀目標(biāo)檢測問題上的檢測速度快于Mask R-CNN[14]與Faster R-CNN[15]等兩階段的目標(biāo)檢測網(wǎng)絡(luò),而檢測性能好于SSD[16]與Detectnet[17]等單階段的目標(biāo)檢測網(wǎng)絡(luò),YOLO的最大優(yōu)點(diǎn)是在檢測速度和檢測性能之間實(shí)現(xiàn)了較好的平衡?;谏鲜鰞?yōu)點(diǎn),研究了YOLO模型在紅外弱小目標(biāo)檢測問題上的可行性。周薇娜等[18]提出了基于YOLOv3模型與YOLOv2模型的紅外弱小目標(biāo)檢測方法,采用SELU激活函數(shù)替換原YOLO模型的激活函數(shù),比原YOLO模型的檢測精度與檢測速度更高。Zhao等[19]提出了一種基于YOLOv3模型的紅外弱小目標(biāo)檢測方法,采用Focal Loss(FL)函數(shù)替換原YOLO模型的損失函數(shù)來緩解弱小目標(biāo)檢測的類不平衡問題,將YOLOv3的平均精度均值提高了4%。文獻(xiàn)[18-19]成功證明采用YOLOv3模型進(jìn)行紅外弱小目標(biāo)檢測的可行性,但也存在以下2點(diǎn)不足:① YOLOv3的計算成本高、檢測速度較慢;② 因紅外弱小目標(biāo)的目標(biāo)像素極少,YOLO模型提取特征圖的過程中忽略了弱小目標(biāo)的部分視覺信息,導(dǎo)致紅外弱小目標(biāo)的檢測性能受限。
YOLOv4模型是YOLOv3模型的改進(jìn)版本,將YOLOv3模型平均檢測精度與檢測速度分別提高了10%和12%。YOLOv4-Tiny模型是YOLOv4網(wǎng)絡(luò)的輕量化版本,其網(wǎng)絡(luò)規(guī)模僅為YOLOv4模型的1/10。YOLOv4-Tiny包含21個卷積層與2個檢測層,因此其訓(xùn)練速度更高且計算成本更低,可安裝于計算資源有限的移動無線設(shè)備。本文采用YOLOv4-Tiny模型作為紅外弱小目標(biāo)檢測的骨干網(wǎng)絡(luò),同時對YOLOv4-Tiny模型進(jìn)行改進(jìn)以提高對紅外弱小目標(biāo)的檢測性能。對YOLOv4-Tiny模型的改進(jìn)主要包括:① 在YOLOv4-Tiny模型的特征提取部分增加卷積層數(shù)與卷積核尺寸,以增加紅外圖像特征提取的信息量,避免忽略弱小目標(biāo)的有用信息;② 將YOLOv4-Tiny模型的激活函數(shù)替換為SiLU激活函數(shù),SiLU激活函數(shù)對細(xì)節(jié)的學(xué)習(xí)能力強(qiáng)于ReLU激活函數(shù)。改進(jìn)后的模型記為IDSTD-YOLO,該模型能在保證檢測速度的同時,提高紅外弱小目標(biāo)的檢測性能。
IDSTD-YOLO是一種單階段的目標(biāo)檢測模型,該模型檢測紅外弱小目標(biāo)的原理如圖1所示。YOLO目標(biāo)檢測模型主要包含以下2個步驟:① YOLO利用閾值法初步篩選目標(biāo)邊框,如果邊框的估計概率C(p)低于該閾值,那么認(rèn)為該網(wǎng)格中不可能存在目標(biāo)邊框的中心;② 利用非極大值抑制算法處理所有的候選目標(biāo)邊框,通過損失函數(shù)尋找最佳的目標(biāo)邊框。
圖1 YOLO網(wǎng)絡(luò)的檢測流程Fig.1 Detection process of YOLO networks
IDSTD-YOLO的損失函數(shù)共包含3個部分:定位損失、置信度損失與分類損失。定位損失計算預(yù)測目標(biāo)邊框與實(shí)際目標(biāo)邊框之間的位置誤差;置信度損失計算預(yù)測邊框內(nèi)包含目標(biāo)的置信度。IDSTD-YOLO以最小化總損失為目標(biāo)在訓(xùn)練集上進(jìn)行訓(xùn)練,所訓(xùn)練的模型能成功檢測紅外弱小目標(biāo)。
基于YOLO模型的弱小目標(biāo)檢測算法將輸入紅外圖像劃分成大小相等的網(wǎng)格,網(wǎng)格大小為S×S,如圖1所示。YOLO模型基于網(wǎng)格進(jìn)行邊框估計與目標(biāo)分類。首先,估計當(dāng)前網(wǎng)格中包含目標(biāo)邊框中心的概率,計算如下:
C(p)=P(p)×IoU(bp,b),
(1)
式中,P(p)表示紅外弱小目標(biāo)是否在邊框中;IoU()表示預(yù)測邊框與目標(biāo)邊框間的重疊度。
重疊度的計算方法如下:
(2)
式中,Bg為實(shí)際目標(biāo)邊框;B為預(yù)測目標(biāo)邊框。YOLO算法通過不斷地估計邊框來學(xué)習(xí)最合適的目標(biāo)邊框,邊框估計的數(shù)學(xué)模型為:
(3)
式中,(x,y)為邊框中心坐標(biāo);(cx,cy)為邊框左頂點(diǎn)的坐標(biāo);pw與ph分別為邊框的長與高;bx,by,bw,bh定位了邊框的位置與大小。每個邊框估計的4個坐標(biāo)為tx,ty,tw,th。
1.2.1 YOLOv4-Tiny的網(wǎng)絡(luò)結(jié)構(gòu)
YOLOv4-Tiny網(wǎng)絡(luò)是YOLOv4網(wǎng)絡(luò)的輕量化版本,共包含21個卷積層與2個YOLO檢測層,該網(wǎng)絡(luò)的目標(biāo)檢測流程如圖2所示。
圖2 YOLOv4-Tiny網(wǎng)絡(luò)的目標(biāo)檢測流程Fig.2 Target detection diagram of YOLOv4-Tiny networks
YOLOv4-Tiny網(wǎng)絡(luò)的詳細(xì)結(jié)構(gòu)如圖3所示。
圖3 YOLOv4-Tiny網(wǎng)絡(luò)的詳細(xì)參數(shù)Fig.3 Detailed parameters of YOLOv4-Tiny networks
YOLOv4-Tiny網(wǎng)絡(luò)采用CSPDarkNet網(wǎng)絡(luò)[20]提取特征,使用2個YOLO檢測層產(chǎn)生大小為13×13×27與26×26×27的特征圖。采用C-IoU函數(shù)作為訓(xùn)練的損失函數(shù),采用貪婪非極大值抑制(Gready Non-maximum Suppression, GNMS)進(jìn)行非極大值抑制。卷積層的激活函數(shù)為Leaky ReLU函數(shù),YOLO檢測層的激活函數(shù)為線性函數(shù)。
1.2.2 IDSTD-YOLO的網(wǎng)絡(luò)結(jié)構(gòu)
YOLOv4-Tiny模型在紅外弱小目標(biāo)檢測任務(wù)上存在2點(diǎn)不足:① YOLOv4-Tiny特征提取器生成的特征圖大小為13×13×512,容易忽略紅外弱小目標(biāo)的部分重要信息;② YOLOv4-Tiny的2個YOLO檢測層的特征圖尺寸分別為13×13×27與26×26×27,難以準(zhǔn)確檢測紅外圖像中的弱小目標(biāo)。為解決上述問題,本文為YOLOv4-Tiny模型提出2點(diǎn)針對性修改措施,如圖4所示。
圖4 IDSTD-YOLO網(wǎng)絡(luò)的主要結(jié)構(gòu)Fig.4 Main structure of IDSTD-YOLO networks
修改的相關(guān)細(xì)節(jié)如下:
① 在YOLOv4-Tiny模型的卷積層(3)與卷積層(4)之間增加一個密集網(wǎng)絡(luò)塊,密集網(wǎng)絡(luò)塊的詳細(xì)參數(shù)如圖5所示。該網(wǎng)絡(luò)塊包括4個最大池化層:3×3,5×5,7×7,9×9,作用是將第15個卷積層輸出的特征圖由13×13×512擴(kuò)大為13×13×2 560,通過增加特征圖尺寸來提高紅外弱小目標(biāo)的信息量。
圖5 密集網(wǎng)絡(luò)塊的網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Network structure of dense block
② 為YOLOv4-Tiny模型增加2個YOLO檢測層,以增強(qiáng)對紅外弱小目標(biāo)的檢測能力,檢測層的詳細(xì)參數(shù)如圖6所示。增加的2個YOLO檢測層編號為第3檢測層與第4檢測層,YOLO檢測層(3)的卷積尺寸分別為512,128,256,512,27,YOLO檢測層(4)的卷積尺寸分別為27,64,128,256,27。第1~4個YOLO檢測層的特征圖尺寸分別為13×13×27,26×26×27,52×52×27,104×104×27。
圖6 YOLO檢測層的網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 Network structure of YOLO detection layer
1.2.3 損失函數(shù)
本文ETL-YOLOv4網(wǎng)絡(luò)使用貪婪NMS進(jìn)行非極大值抑制,將紅外弱小目標(biāo)檢測視為一個邊框回歸問題。在目標(biāo)檢測算法中,損失函數(shù)為目標(biāo)位置、目標(biāo)分類與目標(biāo)置信度損失函數(shù)的總和,基于IoU的損失函數(shù)可定義為:
ΓIoU=1-IoU。
(4)
CIoU在IoU基礎(chǔ)上考慮了目標(biāo)邊框與預(yù)測邊框之間的距離,CIoU損失在邊框回歸任務(wù)上的收斂速率更快且性能更好,因此本文采用CIoU損失?;贑IoU的損失函數(shù)可定義為:
(5)
式中,b為預(yù)測邊框B的中心點(diǎn);bgt為目標(biāo)邊框Bgt的中心點(diǎn);p()為歐氏距離;c為2個邊框間的對角長度;v為長寬比的一致性;α為正的權(quán)衡因子。
v的計算如下:
(6)
α的計算如下:
(7)
1.2.4 激活函數(shù)
YOLOv4-Tiny模型默認(rèn)的激活函數(shù)為Leaky ReLU激活函數(shù),ReLU激活函數(shù)的檢測速度快、正則化能力強(qiáng)且防止過擬合效果好,但學(xué)習(xí)的特征圖信息量不足,對復(fù)雜模式的學(xué)習(xí)能力不足。為提高IDSTD-YOLO對紅外弱小目標(biāo)的特征提取能力,將YOLOv4-Tiny模型的激活函數(shù)由Leaky ReLU替換為SiLU函數(shù)。
SiLU函數(shù)是一個基于強(qiáng)化學(xué)習(xí)的近似函數(shù),定義如下:
σk(s)=zkσ(zk),
(8)
式中,s為輸入向量;zk為第k個隱藏層的輸入。
第k個隱藏層的輸入可描述為:
(9)
式中,bk為第k個神經(jīng)層的偏置;wik為第k層第i個神經(jīng)元的連接權(quán)重。
SiLU函數(shù)與ReLU函數(shù)曲線如圖7所示,SiLU函數(shù)能提取紅外圖像的細(xì)節(jié)視覺信息,可提高對紅外弱小目標(biāo)的檢測能力。
圖7 SiLU函數(shù)與ReLU函數(shù)的曲線Fig.7 Curves of SiLU and ReLU function
實(shí)驗(yàn)計算機(jī)的硬件為Intel Core i7處理器,其主頻為2.5 GHz,內(nèi)存容量為16 GB;顯卡為NVIDIA GeForce GTX 1660,顯存容量為6 GB;操作系統(tǒng)為Ubuntu16.04,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練環(huán)境為TensorFlow框架。
為了觀察本文方法對不同場景的兼容性,選取4個不同場景的紅外圖像數(shù)據(jù)集,第1個序列來自于https:∥github.com/YimianDai/sirst,第2~4個序列來自于中國科學(xué)數(shù)據(jù)庫。紅外弱小目標(biāo)檢測實(shí)驗(yàn)的圖像樣本如圖8所示。紅外實(shí)驗(yàn)序列的相關(guān)特點(diǎn)如表1所示。觀察圖中紅外弱小目標(biāo)的樣本可看出,這些目標(biāo)既昏暗又渺小,同時背景紋理復(fù)雜且成像質(zhì)量低下。實(shí)驗(yàn)中將每個序列幀按80%,10%,10%隨機(jī)分成訓(xùn)練集、驗(yàn)證集與測試集,采用labelImg工具對紅外序列1進(jìn)行標(biāo)注,紅外序列2~4采用數(shù)據(jù)集作者提供的標(biāo)注數(shù)據(jù)。
(a)紅外序列1
(b)紅外序列2
(c)紅外序列3
(d)紅外序列4
表1 紅外實(shí)驗(yàn)序列的相關(guān)特點(diǎn)Tab.1 Relative characters of infrared experimental sequences
實(shí)驗(yàn)將IoU重疊率大于50%視為命中目標(biāo),選取檢測精度(P)、召回率(R)及受試者工作特征(Receiver Operating Characteristic, ROC)曲線客觀評價紅外弱小目標(biāo)檢測的性能。
P的計算如下:
(10)
式中,TP為真陽性樣本數(shù)量;FP為假陽性樣本數(shù)量。
R的計算如下:
(11)
式中,F(xiàn)N為假陰性樣本數(shù)量。
ROC曲線的橫坐標(biāo)為召回率R,縱坐標(biāo)為虛警率F。虛警率的計算如下:
(12)
式中,TN為真陰性樣本數(shù)量。ROC曲線下方的面積越大,目標(biāo)檢測性能越好。
IDSTD-YOLO訓(xùn)練的實(shí)驗(yàn)結(jié)果如圖9所示。
(a)IDSTD-YOLO訓(xùn)練階段的目標(biāo)檢測性能
(b)IDSTD-YOLO訓(xùn)練階段的CIoU損失曲線圖9 IDSTD-YOLO訓(xùn)練的實(shí)驗(yàn)結(jié)果Fig.9 Experimental results of IDSTD-YOLO training
深度學(xué)習(xí)算法在TensorFlow框架與Keras深度學(xué)習(xí)庫上編程實(shí)現(xiàn),非深度學(xué)習(xí)算法在Mablab 2019B上編程實(shí)現(xiàn)。IDSTD-YOLO的輸入圖像大小統(tǒng)一為256 pixel×256 pixel,batch大小為16,訓(xùn)練動量為0.9,衰減率為0.5,學(xué)習(xí)率為0.031。神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中最大epoch次數(shù)為500,YOLO的IoU閾值設(shè)為50%,分類的置信度閾值為0.48。
IDSTD-YOLO訓(xùn)練的平均精度與平均召回率曲線如圖9(a)所示,觀察圖中曲線可知,檢測精度與召回率大約經(jīng)過300次epoch達(dá)到收斂。IDSTD-YOLO訓(xùn)練的CIoU損失曲線如圖9(b)所示,觀察圖中曲線可知,YOLO的損失函數(shù)大約經(jīng)過300次epoch達(dá)到收斂,與圖9(a)的結(jié)論一致。
本文提出的IDSTD-YOLO模型對YOLOv4-Tiny的骨干網(wǎng)絡(luò)進(jìn)行了修改,以期提高紅外弱小目標(biāo)的檢測能力。在此將IDSTD-YOLO模型與YOLOv4-Tiny模型在4個紅外序列上的檢測效果進(jìn)行比較,評估本文工作的有效性。YOLOv4-Tiny模型與IDSTD-YOLO模型的訓(xùn)練環(huán)境與參數(shù)配置相同,如2.3節(jié)所示。
為了進(jìn)一步驗(yàn)證本文方法的優(yōu)劣,實(shí)驗(yàn)選擇了5個同類型算法作為對比方法,包括引言部分討論的SELU_YOLOv3[18],F(xiàn)L_YOLOv3[19]以及3DModel[21],AttLCNet[22],MultiScaleNet[23],上述對比方法的參數(shù)值選取原作者的推薦值。3DModel是一種基于三維信息抽取模型的紅外弱小目標(biāo)檢測方法,該方法引入粒子群優(yōu)化算法搜索三維信息抽取模型的最佳參數(shù)值,以提高對紅外弱小目標(biāo)的特征學(xué)習(xí)能力。AttLCNet與MultiScaleNet是2種基于深度神經(jīng)網(wǎng)絡(luò)的紅外弱小目標(biāo)檢測方法,分別通過注意力機(jī)制與多尺度特征提取機(jī)制增強(qiáng)對紅外弱小目標(biāo)的細(xì)節(jié)捕捉能力與判別能力。
2.4.1 視覺效果實(shí)驗(yàn)
圖10(a)~(g)分別為YOLOv4-Tiny,SELU_YOLOv3,F(xiàn)L_YOLOv3,3DModel,AttLCNet,MultiScaleNet以及IDSTD-YOLO模型在序列1上的檢測視覺樣本,IoU重疊率分別為78%,66%,72%,75%,88%,79%,86%。該紅外圖像中背景簡單且紅外弱小目標(biāo)較突出,通過視覺可直觀發(fā)現(xiàn)紅外弱小目標(biāo)。各檢測算法均成功發(fā)現(xiàn)紅外弱小目標(biāo),且達(dá)到了較高IoU重疊率。
圖10 序列1的紅外弱小目標(biāo)檢測視覺效果Fig.10 Visual effect of infrared dim and small target detection of sequence 1
圖11(a)~(g)分別為YOLOv4-Tiny,SELU_YOLOv3,F(xiàn)L_YOLOv3,3DModel,AttLCNet,MultiScaleNet以及IDSTD-YOLO模型在序列4上的檢測樣本。YOLOv4-Tiny,SELU_YOLOv3,F(xiàn)L_YOLOv3以及IDSTD-YOLO成功檢測出紅外弱小目標(biāo),IoU重疊率分別為53%,62%,68%,70%。該紅外圖像中背景復(fù)雜,大量樹木與復(fù)雜地面環(huán)境對紅外弱小目標(biāo)造成了極大的干擾,導(dǎo)致3DModel發(fā)生虛警,而AttLCNet與MultiScaleNet發(fā)生漏檢。
圖11 序列4的紅外弱小目標(biāo)檢測視覺效果Fig.11 Visual effect of infrared dim and small target detection of sequence 4
總體而言,紅外序列中高亮度邊緣與雜波對于紅外弱小目標(biāo)檢測產(chǎn)生嚴(yán)重干擾,導(dǎo)致一些目標(biāo)檢測算法發(fā)生虛警與漏檢。本文通過對YOLOv4-Tiny模型的特征提取部分進(jìn)行修改,增加卷積層數(shù)與卷積核尺寸來增加紅外圖像特征提取的信息量,避免忽略弱小目標(biāo)的有用信息。通過上述視覺實(shí)驗(yàn)結(jié)果可證明本文方法的有效性。
2.4.2 量化實(shí)驗(yàn)分析
為定量評估紅外弱小目標(biāo)檢測的性能,總結(jié)了各檢測算法在4個測試序列上的平均精度與召回率結(jié)果,如表2所示。將表中YOLOv4-Tiny模型與IDSTD-YOLO模型的檢測精度與召回率結(jié)果進(jìn)行對比,本文對YOLOv4-Tiny模型的特征提取部分進(jìn)行修改,通過增加卷積層數(shù)與卷積核尺寸來增加紅外圖像特征提取的信息量,IDSTD-YOLO模型在4個紅外序列上的檢測精度與召回率均明顯高于YOLOv4-Tiny模型。
表2 紅外弱小目標(biāo)檢測的量化評價結(jié)果Tab.2 Quantitative evaluation results of infrared dim and small target detection
因序列1的背景較簡單,目標(biāo)面積較大,因此SELU_YOLOv3,F(xiàn)L_YOLOv3,3DModel,AttLCNet與MultiScaleNet等檢測算法均取得了較高的檢測精度與召回率。序列2~4的背景復(fù)雜,目標(biāo)面積較小,SELU_YOLOv3,F(xiàn)L_YOLOv3,3DModel,AttLCNet與MultiScaleNet等檢測算法的檢測精度與召回率均有所下降??傮w而言,本文IDSTD-YOLO模型在4個紅外序列上的目標(biāo)檢測能力優(yōu)于其他6個對比方法。
各檢測算法在4個紅外序列上的ROC曲線如圖12所示。
(a)紅外序列1
(b)紅外序列2
(c)紅外序列3
(d)紅外序列4圖12 紅外弱小目標(biāo)檢測的ROC曲線Fig.12 ROC curves of infrared dim and small target detection
圖12(a)顯示各檢測算法在紅外序列1的ROC曲線均較好,說明檢測性能較高。觀察圖12(c)~(d)可知,3DModel的AUC值較小,但依然大于0.5。因?yàn)樯疃葘W(xué)習(xí)技術(shù)是屬于數(shù)據(jù)驅(qū)動型技術(shù),在訓(xùn)練數(shù)據(jù)充足的情況下具有較好的魯棒性,因此SELU_YOLOv3,F(xiàn)L_YOLOv3,AttLCNet與MultiScaleNet四個基于神經(jīng)網(wǎng)絡(luò)的檢測算法達(dá)到了較穩(wěn)定的性能??傮w而言,本文IDSTD-YOLO模型在4個紅外序列上的AUC值優(yōu)于其他6個對比方法,該結(jié)論與檢測精度、召回率的結(jié)果一致。
本文提出一種單階段的目標(biāo)檢測模型IDSTD-YOLO,該模型對YOLOv4-Tiny模型的特征提取部分進(jìn)行修改,通過增加卷積層數(shù)與卷積核尺寸來增加紅外圖像特征提取的信息量,避免忽略弱小目標(biāo)的有用信息。此外,將YOLOv4-Tiny模型的激活函數(shù)替換為SiLU激活函數(shù),以提高對弱小目標(biāo)的細(xì)節(jié)學(xué)習(xí)能力。對比實(shí)驗(yàn)結(jié)果表明,該檢測模型的目標(biāo)檢測精度、召回率與視覺效果均取得了較好的結(jié)果。