閆廣利,郭 銳,劉榮忠,武軍安
(南京理工大學(xué) 智能彈藥技術(shù)國(guó)防重點(diǎn)學(xué)科實(shí)驗(yàn)室,江蘇 南京 210094)
末敏彈是一種重要的反裝甲靈巧彈藥,通過(guò)彈載探測(cè)器在作戰(zhàn)區(qū)域上空旋轉(zhuǎn)掃描搜集目標(biāo)信息,一旦發(fā)現(xiàn)目標(biāo)立刻起爆EFP戰(zhàn)斗部,從而實(shí)現(xiàn)在特定區(qū)域內(nèi)對(duì)目標(biāo)的精準(zhǔn)打擊。為了提升識(shí)別準(zhǔn)確度,末敏彈一般采用多模探測(cè)方案,即同時(shí)采用多種傳感器進(jìn)行掃描,以獲取目標(biāo)的多維度信息,例如美國(guó)的SADARM和德國(guó)的SMART均采用了主、被動(dòng)毫米波/紅外探測(cè),法國(guó)的ACED末敏彈和俄羅斯的改進(jìn)型9K55K1都采用了紅外/毫米波復(fù)合探測(cè),美國(guó)的BLU-108智能反坦克彈藥攜帶的Skeet末敏子彈和法、瑞兩國(guó)聯(lián)合研制的BONUS末敏彈最初只采用的多波段紅外敏感器,后來(lái)都加裝了激光雷達(dá)實(shí)現(xiàn)復(fù)合探測(cè)。目前我國(guó)已經(jīng)研制出采用3 mm主、被動(dòng)毫米波/紅外復(fù)合探測(cè)的末敏彈,為進(jìn)一步提升末敏彈的作戰(zhàn)效能,已經(jīng)展開(kāi)了毫米波/激光/紅外三模復(fù)合探測(cè)末敏彈的研制工作[1-3]。
當(dāng)前目標(biāo)識(shí)別算法大體可以分為兩類:基于人工特征提取的方法和基于深度學(xué)習(xí)的方法。傳統(tǒng)的末敏彈目標(biāo)識(shí)別算法屬于前者,特征提取由人工完成,比較依賴設(shè)計(jì)人員的經(jīng)驗(yàn),且所得特征大多屬于淺層次特征,其穩(wěn)定性一般,易受外界干擾,而特征表示的優(yōu)劣對(duì)算法的識(shí)別精度有著重要影響。
經(jīng)典的末敏彈目標(biāo)識(shí)別方法基于人工特征提取,其算法流程大致為:數(shù)據(jù)預(yù)處理,特征提取,特征分類。其中數(shù)據(jù)預(yù)處理階段多采用濾波方法或小波理論進(jìn)行信號(hào)降噪,特征提取階段一般選擇提取探測(cè)信號(hào)的峰值、脈寬、能量、最大斜率等構(gòu)成特征向量,特征分類階段一般基于BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、模糊集理論等設(shè)計(jì)分類器[3-5]。整個(gè)算法模型的構(gòu)建采用分治策略,將目標(biāo)識(shí)別問(wèn)題分解為若干環(huán)節(jié),并試圖在每個(gè)環(huán)節(jié)獲得局部最優(yōu)解,但局部最優(yōu)并不意味著全局最優(yōu),而且每個(gè)環(huán)節(jié)——特別是特征選擇與提取,含有較多人為因素,會(huì)對(duì)最終算法的精度產(chǎn)生重要影響,導(dǎo)致算法的魯棒性較低。
以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)方法,能夠通過(guò)“端到端”的學(xué)習(xí),自動(dòng)提取目標(biāo)的深度穩(wěn)定特征,已經(jīng)在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等眾多領(lǐng)域取得出色效果,當(dāng)前,將深度學(xué)習(xí)方法應(yīng)用于新領(lǐng)域已成為一股研究熱潮。蘇寧遠(yuǎn)等[6]將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于雷達(dá)海上目標(biāo)識(shí)別,設(shè)計(jì)了一種雙通道CNN對(duì)雷達(dá)信號(hào)預(yù)處理得到的時(shí)間-多普勒譜和幅度信息分別進(jìn)行特征抽取,獲得了較好的識(shí)別性能;張弘斌等[7]提出一種多通道輸入的卷積神經(jīng)網(wǎng)絡(luò)來(lái)診斷軸承故障,通過(guò)設(shè)計(jì)一種三通道樣本交給CNN融合處理得到診斷結(jié)果,其模型比基于單通道樣本的模型診斷準(zhǔn)確度高;郭迎福[8]等將CNN用于風(fēng)力機(jī)葉片裂紋診斷,在雙目攝影測(cè)量原理的基礎(chǔ)上,提出一種三維振動(dòng)信息融合的多通道樣本構(gòu)造方法,然后設(shè)計(jì)了一種新的多尺度卷積神經(jīng)網(wǎng)絡(luò)來(lái)獲取裂紋多層次語(yǔ)義信息,該方法具有較高的診斷精度;葉壯[9]等利用經(jīng)驗(yàn)?zāi)B(tài)分解對(duì)振動(dòng)信號(hào)進(jìn)行處理獲得多通道一維信號(hào),然后提出了一種基于多通道一維卷積神經(jīng)網(wǎng)絡(luò)的齒輪箱故障診斷方法,所提方法的故障診斷能力優(yōu)于典型的深度學(xué)習(xí)方法和機(jī)器學(xué)習(xí)分類器。
目前末敏彈的目標(biāo)識(shí)別多采用傳統(tǒng)方法,在公開(kāi)的文獻(xiàn)中鮮有采用深度學(xué)習(xí)方法的案例,南京理工大學(xué)的武軍安[10]等以線陣激光雷達(dá)作為末敏彈探測(cè)器,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)線陣激光雷達(dá)掃描獲取的距離像進(jìn)行目標(biāo)分類與識(shí)別,所用方法識(shí)別精度較高,即使在復(fù)雜背景下也能有效識(shí)別裝甲目標(biāo)。但目前尚未有針對(duì)末敏彈點(diǎn)源、多模探測(cè)信號(hào)的深度學(xué)習(xí)識(shí)別算法研究,本文針對(duì)毫米波輻射計(jì)、激光測(cè)距雷達(dá)和紅外敏感器三模探測(cè)信號(hào),提出了3種樣本構(gòu)造方案和3種卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并通過(guò)實(shí)驗(yàn)測(cè)試了各個(gè)模型性能。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是受到生物學(xué)上的感受野概念啟發(fā)而提出來(lái)的,最早主要用于處理圖像信息,一般由卷積層、池化層和全連接層這樣的基礎(chǔ)層堆疊構(gòu)成。
卷積層(Convolution Layer)的作用是特征提取,計(jì)算方式如下:
(1)
池化層(Pooling Layer)用于特征選擇和降采樣,一般采用最大池化(Max Pooling)方法,計(jì)算方式如下:
(2)
其中,pi,m表示一個(gè)池化區(qū)域的輸出;Rm表示一個(gè)池化區(qū)域;qi,k是池化區(qū)域中的元素。
全連接層(Fully Connected Layer)的作用是整合上一層輸出的所有特征表示,將其映射到樣本標(biāo)記空間,計(jì)算方式如下:
(3)
其中,δk表示當(dāng)前層第k個(gè)神經(jīng)元的輸出;xi是上一層輸出的第i個(gè)元素;wk,i是第k個(gè)神經(jīng)元的第i個(gè)權(quán)重;bk是第k個(gè)神經(jīng)元的偏置;f(x)是當(dāng)前層的激活函數(shù)。
CNN在結(jié)構(gòu)上具有權(quán)重共享、局部連接、匯聚等特性,這使其參數(shù)量較少,且具有一定的平移、縮放和旋轉(zhuǎn)不變性。最初CNN主要應(yīng)用于圖像分析任務(wù),其性能遠(yuǎn)超其他種類的神經(jīng)網(wǎng)絡(luò),近年來(lái)也被廣泛地應(yīng)用于推薦系統(tǒng)和自然語(yǔ)言處理等領(lǐng)域。當(dāng)前,利用卷積神經(jīng)網(wǎng)絡(luò)給各行業(yè)賦能已成為一個(gè)研究熱點(diǎn)。
本文所提算法主要是利用卷積神經(jīng)網(wǎng)絡(luò)出色的擬合能力,獲得從探測(cè)信號(hào)到識(shí)別結(jié)果的良好映射,同時(shí),通過(guò)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)將多種不同傳感器信號(hào)中蘊(yùn)含的信息加以融合,以提升算法的識(shí)別能力。
考慮到數(shù)據(jù)對(duì)于深度學(xué)習(xí)模型的重要性,本文采用多種不同的樣本構(gòu)造方法,以求找到相對(duì)適合于CNN模型提取特征的樣本類型。針對(duì)多種樣本類型,本文提出了單通道和多通道兩種類型的網(wǎng)絡(luò)結(jié)構(gòu),以求找到性能相對(duì)較好的模型結(jié)構(gòu)。
末敏彈是智能化彈藥的一種,為了提高戰(zhàn)場(chǎng)環(huán)境適應(yīng)能力和精準(zhǔn)打擊能力,目前多采用復(fù)合探測(cè)識(shí)別手段,通過(guò)掛載多種不同類型的探測(cè)器,獲取不同維度下的戰(zhàn)場(chǎng)信息,例如采用毫米波、激光和紅外復(fù)合探測(cè),就可以同時(shí)獲得目標(biāo)的幾何與溫度信息,這樣的復(fù)合探測(cè)信號(hào)能夠提供更為全面的戰(zhàn)場(chǎng)信息,進(jìn)而能為目標(biāo)識(shí)別算法提供更豐富的環(huán)境特征,有利于提高目標(biāo)識(shí)別準(zhǔn)確率、降低虛警率。
本文采用課題組積累的多模探測(cè)試驗(yàn)數(shù)據(jù)制作訓(xùn)練樣本,其中含有毫米波輻射計(jì)、激光測(cè)距雷達(dá)和紅外敏感器3種探測(cè)信號(hào),均為點(diǎn)源探測(cè)器。由于探測(cè)器需要現(xiàn)場(chǎng)調(diào)試,試驗(yàn)現(xiàn)場(chǎng)環(huán)境較為復(fù)雜,部分探測(cè)信號(hào)存在不同程度的干擾,但這恰恰為神經(jīng)網(wǎng)絡(luò)模型提供了豐富的樣本,有利于提升算法的魯棒性,以適應(yīng)復(fù)雜的現(xiàn)場(chǎng)情況。信號(hào)波形如圖1所示,對(duì)于這3個(gè)時(shí)間序列,不同的樣本構(gòu)造方式,輸入模型后所能提取的特征和信息融合的過(guò)程是存在差異的,對(duì)此本文提出了3種樣本構(gòu)造方案,以探究何種構(gòu)造方案相對(duì)更有利于特征提取與分類。
圖1 三種探測(cè)信號(hào)Fig.1 Three detection signals
方案1:直接以灰度值表示信號(hào)強(qiáng)度,將3種信號(hào)值分別映射到[0,255]灰度區(qū)間,然后并排構(gòu)成一張3×n×1的灰度圖(n為信號(hào)所含時(shí)間點(diǎn)的數(shù)量),如圖2所示。
圖2 并排形式的多信號(hào)樣本Fig.2 Multiple signal samples side by side
方案2:同樣直接以灰度值表示信號(hào)強(qiáng)度,將3種信號(hào)值分別映射到[0,255]灰度區(qū)間,然后將每種信號(hào)作為一個(gè)圖像通道,構(gòu)成一張1×n×3的RGB圖,如圖3所示。
圖3 多信號(hào)RGB樣本Fig.3 Multi-signal samples in RGB format
方案3:以波形圖呈現(xiàn)信號(hào),圖像的縱向表示信號(hào)強(qiáng)度,橫向表示時(shí)間,即取一段時(shí)間內(nèi)的信號(hào),將三種信號(hào)值映射到圖像高度,再將這段信號(hào)降采樣到圖像寬度,然后將每種信號(hào)的波形圖作為一個(gè)圖像通道,構(gòu)成一張H×W×3的RGB圖像,如圖4所示。
圖4 波形RGB樣本Fig.4 Waveform samples in RGB format
針對(duì)上述復(fù)合信號(hào)樣本的類型,考慮到不同層面的信息融合,本文設(shè)計(jì)了單通道和多通道兩種基本的網(wǎng)絡(luò)結(jié)構(gòu),將二者結(jié)合形成第三種網(wǎng)絡(luò)結(jié)構(gòu),其中多通道網(wǎng)絡(luò)是以單通道網(wǎng)絡(luò)模塊為分支搭建的。
結(jié)構(gòu)1:單通道網(wǎng)絡(luò)采用兩個(gè)卷積層,兩個(gè)池層化和兩個(gè)全連接層,最后連接Softmax分類器,但根據(jù)樣本的不同,采用不同類型的卷積核,整體結(jié)構(gòu)如圖5所示,如果輸入數(shù)據(jù)是復(fù)合信號(hào),則相當(dāng)于在數(shù)據(jù)層進(jìn)行了信息融合。
圖5 單通道網(wǎng)絡(luò)Fig.5 Single channel network
結(jié)構(gòu)2:多通道網(wǎng)絡(luò)是在輸入層之后產(chǎn)生多個(gè)分支,每個(gè)分支連接一個(gè)單通道網(wǎng)絡(luò)模塊,對(duì)復(fù)合信號(hào)中的一種進(jìn)行單獨(dú)卷積,以提取出該種信號(hào)的獨(dú)有特征,然后在全連接層以級(jí)聯(lián)的方式完成特征融合,再經(jīng)過(guò)一層全連接層,將融合特征輸入Softmax分類器,如圖6所示。
圖6 三通道網(wǎng)絡(luò)Fig.6 Three-channel network
結(jié)構(gòu)3:從信息融合層次的角度看,單通道網(wǎng)絡(luò)在輸入層之后直接對(duì)原始復(fù)合信號(hào)施加了卷積操作,屬于數(shù)據(jù)層融合,而多通道網(wǎng)絡(luò)通過(guò)單獨(dú)的卷積通道對(duì)每種信號(hào)分別提取獨(dú)立特征,然后在全連接層組合所有特征,屬于特征層融合。前者最終提取到的是復(fù)合信號(hào)特征,后者提取到的是單種信號(hào)的獨(dú)立特征,將這兩類特征組合起來(lái),即同時(shí)在數(shù)據(jù)層和特征層進(jìn)行信息融合,所得特征在理論上能更全面地描述輸入信號(hào),相應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。
圖7 四通道網(wǎng)絡(luò)Fig.7 Four-channel network
實(shí)驗(yàn)樣本來(lái)自高塔試驗(yàn)數(shù)據(jù),含毫米波輻射計(jì)、激光測(cè)距雷達(dá)和紅外敏感器三種探測(cè)信號(hào),如圖1所示。根據(jù)信號(hào)波形,為了充分捕捉有目標(biāo)的時(shí)段,采用長(zhǎng)度為256的滑動(dòng)時(shí)間窗口對(duì)信號(hào)進(jìn)行截取,在此基礎(chǔ)上,分別按照前文所提的3種樣本構(gòu)造方案制作數(shù)據(jù)集,圖8展示了每種樣本構(gòu)造方案下的4對(duì)樣本。
圖8 實(shí)驗(yàn)樣本Fig.8 Experimental samples
由于在末敏彈探測(cè)信號(hào)中,掃描到目標(biāo)的時(shí)段相對(duì)較短,為了保證樣本數(shù)量均衡,對(duì)滑動(dòng)時(shí)間窗口采用變步長(zhǎng)策略,在有目標(biāo)區(qū)域采用小步長(zhǎng),在無(wú)目標(biāo)區(qū)域采用大步長(zhǎng),以保證正負(fù)樣本數(shù)量基本相等,最終獲得各方案下的樣本87128個(gè),其中負(fù)樣本(無(wú)目標(biāo))43580個(gè),正樣本(有目標(biāo))43548個(gè),并按照3∶1的比例將數(shù)據(jù)集劃分為訓(xùn)練集、測(cè)試集。
為了說(shuō)明復(fù)合探測(cè)的優(yōu)勢(shì),根據(jù)3.1小節(jié)的樣本方案2和方案3,以單模毫米波輻射計(jì)信號(hào)構(gòu)造樣本作為對(duì)照組,采用相同的單通道網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練。各類型的樣本、網(wǎng)絡(luò)結(jié)構(gòu)與模型的對(duì)應(yīng)關(guān)系如表1所示。
表1 樣本與模型對(duì)應(yīng)關(guān)系Tab.1 Correspondence between samples and models
本文針對(duì)末敏彈點(diǎn)源探測(cè)器的信號(hào)數(shù)據(jù)設(shè)計(jì)了3種不同類型的樣本,又提出了3種基本網(wǎng)絡(luò)結(jié)構(gòu),其中多通道模型是基于單通道網(wǎng)絡(luò)模塊構(gòu)建的,即Model2系列和Model3系列各自采用相同的單通道網(wǎng)絡(luò)模塊,故在此僅列出其單通道網(wǎng)絡(luò)模塊的主要結(jié)構(gòu)參數(shù),如表2~4所示,其中Input Shape和Output Shape采用“Height×Width×Channel”的格式表示。
表2 Model 1主要結(jié)構(gòu)參數(shù)Tab.2 Main structural parameters of Model 1
表3 Model 2系列單通道網(wǎng)絡(luò)模塊主要結(jié)構(gòu)參數(shù)Tab.3 Main structural parameters of Model 2 series singlechannel network module
表4 Model 3系列單通道網(wǎng)絡(luò)模塊主要結(jié)構(gòu)參數(shù)Tab.4 Main structural parameters of Model 3 series singlechannel network module
模型的訓(xùn)練平臺(tái)為Win10,采用Caffe框架,GPU型號(hào)為NVIDIA GeForce GTX 1650,batch size為256,優(yōu)化器為Adam,訓(xùn)練迭代次數(shù)為10000,學(xué)習(xí)率為0.0001。
4.3.1 準(zhǔn)確率(Accuracy)
準(zhǔn)確率表示在所有測(cè)試樣本中,預(yù)測(cè)正確的樣本所占的比例,計(jì)算公式如下:
(4)
其中,I(·)表示指示函數(shù),當(dāng)x為真時(shí),I(x)=1,x為假時(shí)I(x)=0。
4.3.2 召回率(Recall)
召回率表示實(shí)際屬于c類的測(cè)試樣本中,被預(yù)測(cè)為c的樣本所占的比例,計(jì)算公式如下:
(5)
其中,TPc表示被預(yù)測(cè)為c類實(shí)際也確實(shí)屬于c類的樣本數(shù)量;FNc表示未被預(yù)測(cè)為c類實(shí)際屬于c類的樣本數(shù)量。
4.3.3 精確率(Precision)
精確率表示被預(yù)測(cè)為c類的樣本中,確實(shí)為c類的樣本所占的比例,計(jì)算公式如下:
(6)
其中,TPc表示被預(yù)測(cè)為c類實(shí)際也確實(shí)是c類的樣本數(shù)量,FPc表示被預(yù)測(cè)為c類實(shí)際卻不屬于c類的樣本數(shù)量。
4.3.4F1值(F1 Measure)
為綜合考慮模型的精確率和召回率,可采用F1指標(biāo)評(píng)價(jià),F1值是召回率和精確率的調(diào)和平均值,計(jì)算公式如下:
(7)
其中,Pc表示模型對(duì)c類的精確率;Rc表示模型對(duì)c類的召回率。
由于末敏彈主要關(guān)注掃描區(qū)域是否存在目標(biāo),因此本文僅關(guān)注對(duì)“有目標(biāo)”類別的F1值。
本文提出的各個(gè)模型,經(jīng)訓(xùn)練后在測(cè)試集上所得各項(xiàng)指標(biāo)如表5所示。
表5 各模型的最優(yōu)性能對(duì)比Tab.5 Comparison of the best performance of each model
根據(jù)表5可以看出:
(1)采用相同的模型,多模信號(hào)相對(duì)于單模信號(hào),能提供更豐富的探測(cè)信息,獲得更好的識(shí)別效果;
(2)對(duì)于相同的樣本,網(wǎng)絡(luò)結(jié)構(gòu)3表現(xiàn)最佳,即同時(shí)進(jìn)行數(shù)據(jù)層融合與特征層融合的多通道網(wǎng)絡(luò)結(jié)構(gòu),能更有效地提取目標(biāo)特征,獲得更好的識(shí)別效果;
(3)整體來(lái)看,樣本方案1、2的優(yōu)于樣本方案3,這可能是由于后者將序列信號(hào)轉(zhuǎn)換為二維波形圖時(shí)丟失了大量信息,而CNN由于具備強(qiáng)大的擬合能力,能夠從樣本1、2這樣的原始信息中有效提取特征;
(4)所有模型的準(zhǔn)確率均在90%以上,從各項(xiàng)評(píng)估指標(biāo)來(lái)看,model2_3的性能明顯優(yōu)于其他模型,表明所提方法具有較好的應(yīng)用潛力。
為了提高實(shí)驗(yàn)結(jié)論可信度,本小節(jié)基于同樣的信號(hào)數(shù)據(jù),對(duì)末敏彈經(jīng)典識(shí)別方法進(jìn)行測(cè)試。經(jīng)典方法有賴于人工特征提取,本文選擇末敏彈一維探測(cè)信號(hào)常用的特征——峰值、脈寬、脈沖高度、能量和最大斜率,將三種探測(cè)信號(hào)的特征依次排列構(gòu)成特征向量,作為分類器的輸入,而特征分類器選取常用的BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)。其中BP神經(jīng)網(wǎng)絡(luò)的隱藏層神經(jīng)元數(shù)設(shè)為5,支持向量機(jī)的核函數(shù)采用Linear核,測(cè)試結(jié)果如表6所示。
表6 經(jīng)典模型與本文模型性能對(duì)比Tab.6 Performance comparison between the classic model and the model in this article
從表6可以看出,本文方法的識(shí)別準(zhǔn)確率明顯高于兩種經(jīng)典識(shí)別方法,體現(xiàn)了自動(dòng)特征提取的優(yōu)勢(shì)。此外這種差異與模型輸入的信息量也有關(guān)系,無(wú)論采用何種分類器,經(jīng)典方法對(duì)原始信號(hào)進(jìn)行特征提取的過(guò)程都是對(duì)數(shù)據(jù)的降維操作,損失了大量隱含信息,而本文基于卷積神經(jīng)網(wǎng)絡(luò)的方法,可以在保持較小計(jì)算量和參數(shù)量的同時(shí),直接以原始信號(hào)作為輸入,用卷積層自動(dòng)提取特征,信息損失較少。
本文針對(duì)末敏彈探測(cè)識(shí)別問(wèn)題,結(jié)合人工智能技術(shù),引入卷積神經(jīng)網(wǎng)絡(luò)模型,提出了基于CNN的末敏彈多模復(fù)合識(shí)別方法,獲得了較好的識(shí)別效果。實(shí)驗(yàn)表明,多模復(fù)合信號(hào)相比單模信號(hào)能提供更豐富的信息,獲得更好的識(shí)別效果;對(duì)于復(fù)合信號(hào),同時(shí)進(jìn)行數(shù)據(jù)層和特征層融合能在一定程度上改善識(shí)別效果;基于原始信號(hào)的樣本構(gòu)造方案1、2優(yōu)于方案3;總體上,本文所提方法能夠充分自動(dòng)提取復(fù)合探測(cè)信號(hào)中蘊(yùn)含的目標(biāo)信息,獲得出色的識(shí)別效果,優(yōu)于傳統(tǒng)識(shí)別方法,可以為新型末敏彈的目標(biāo)識(shí)別方案提供參考。