張力文 潘 劍 張右承 陳元培 馬 喆 黃旭輝 孫科武(航天科工集團(tuán)智能科技研究院有限公司 北京 100144)(航天防務(wù)智能系統(tǒng)與技術(shù)科研重點(diǎn)實(shí)驗(yàn)室 北京 100144)
作為廣泛應(yīng)用于社會(huì)科學(xué)發(fā)展和軍事國(guó)防等領(lǐng)域的探測(cè)設(shè)備,雷達(dá)具備極端天氣下的良好魯棒性[1],以及對(duì)光照不敏感等特點(diǎn)[2],具有重要的學(xué)術(shù)和實(shí)用價(jià)值[3]。經(jīng)典的雷達(dá)目標(biāo)檢測(cè)方法遵循恒虛警檢測(cè)(Constant False Alarm Rate,CFAR)[4–6]原則。CFAR檢測(cè)隸屬于統(tǒng)計(jì)檢測(cè)理論,即一種利用信號(hào)和噪聲的統(tǒng)計(jì)特性,遵照檢測(cè)概率最大準(zhǔn)則(Neyman-Pearson,N-P)來建立最佳判決的數(shù)學(xué)理論。其本質(zhì)上是一種在先驗(yàn)概率和代價(jià)函數(shù)均未知的情況下,固定虛警概率,再去最小化漏檢概率或最大化檢出(召回)概率的檢測(cè)方法。
隨著大數(shù)據(jù)科學(xué)的發(fā)展,以數(shù)據(jù)為驅(qū)動(dòng)的經(jīng)典機(jī)器學(xué)習(xí)和當(dāng)下的深度學(xué)習(xí)技術(shù)也被廣泛應(yīng)用于雷達(dá)目標(biāo)檢測(cè)與識(shí)別。從原理上來說,無論是經(jīng)典的機(jī)器學(xué)習(xí)還是深度學(xué)習(xí)方法(以下統(tǒng)稱機(jī)器學(xué)習(xí)方法),他們實(shí)現(xiàn)雷達(dá)目標(biāo)檢測(cè)都是基于對(duì)數(shù)據(jù)的合理表示,其涉及模式識(shí)別中的特征工程和表示學(xué)習(xí)理論范疇。他們與經(jīng)典CFAR的檢測(cè)原理有著本質(zhì)的不同,機(jī)器學(xué)習(xí)更多地是在探討如何在一個(gè)更加抽象或高維的特征空間中對(duì)樣本進(jìn)行表示,并利用此種表示來訓(xùn)練分類器,最終實(shí)現(xiàn)對(duì)目標(biāo)的檢測(cè)。這些特征表示可以通過利用基于統(tǒng)計(jì)建模的投影算子轉(zhuǎn)換而來[7,8],也可以通過學(xué)習(xí)的方式來獲得[9]。而在分類器的訓(xùn)練方面,其可以是和特征學(xué)習(xí)部分相分離的方式來單獨(dú)進(jìn)行,如經(jīng)典的支持向量機(jī)(Support Vector Machines,SVM)[10]與k近鄰(k-Nearest Neighbors,k-NN)[7,8];也可以是與特征學(xué)習(xí)部分耦合在一起的聯(lián)合學(xué)習(xí)方式[9]。
因此,可分析出數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法與經(jīng)典CFAR的本質(zhì)區(qū)別:前者是在樣本空間中挖掘或者構(gòu)造出能有效表示每個(gè)樣本的方式,然后在這些表示所處的空間中以任務(wù)(例如分類)為驅(qū)動(dòng)的方式去尋找一種能夠有效區(qū)分目標(biāo)與雜波的超平面,其不需要顯式地獲得樣本的統(tǒng)計(jì)信息,也不需要對(duì)樣本的分布進(jìn)行顯式的刻畫;而后者需要顯性地構(gòu)造出樣本在不同假設(shè)條件下的分布特性,從而在這些分布特性的明確定義下給出目標(biāo)檢測(cè)的依據(jù)。而若要類比CFAR與機(jī)器學(xué)習(xí)方法的相似之處,那么筆者認(rèn)為特征表示部分對(duì)應(yīng)了CFAR中對(duì)被檢單元和參考單元的采樣后的計(jì)算部分;而分類器則對(duì)應(yīng)于檢測(cè)閾值本身。
基于以上分析不難看出,由于缺乏對(duì)信號(hào)統(tǒng)計(jì)分布特性的顯式定義,機(jī)器學(xué)習(xí)方法雖無法嚴(yán)格保持CFAR性質(zhì),但仍然具備很多其他優(yōu)勢(shì):自動(dòng)化的學(xué)習(xí)機(jī)制可以在一定程度上擺脫對(duì)人工先驗(yàn)設(shè)參的依賴程度;當(dāng)具備新的可用數(shù)據(jù)時(shí),模型可再次經(jīng)過微調(diào)以獲得更好的泛化能力(進(jìn)化學(xué)習(xí));靈活多樣的建模形式以適配多種雷達(dá)檢測(cè)識(shí)別任務(wù);以及復(fù)雜結(jié)構(gòu)帶來的更高容量的數(shù)據(jù)表示能力等等。這些優(yōu)勢(shì)也極大地促使研究者開展了眾多此方面的研究。
然而,考慮到雷達(dá)信號(hào)在數(shù)據(jù)形態(tài)上的多樣性遠(yuǎn)超過其他形式的信號(hào)(如可見光圖像、文本類數(shù)據(jù)),加之不同的任務(wù)需求使得相應(yīng)的處理方法存在著很大的差異。因此,為便于歸納總結(jié),本文根據(jù)所面對(duì)任務(wù)的不同將近期主流的機(jī)器學(xué)習(xí)方法進(jìn)行如下分類:
(1) 基于回波信號(hào)的目標(biāo)-雜波檢測(cè)方法。此類方法是在探討如何在一維的回波信號(hào)上對(duì)某個(gè)距離單元上回波信號(hào)進(jìn)行目標(biāo)/雜波的辨識(shí),是與經(jīng)典CFAR在任務(wù)形態(tài)上最為相似的一種方法。目前具有代表性的有基于線性SVM (Linear-SVM,L-SVM)[10],以及最近基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)與注意力機(jī)制[11,12]的雷達(dá)目標(biāo)檢測(cè)方法。以L-SVM為例,該方法借鑒CFAR的處理流程,將經(jīng)過脈沖壓縮和線性匹配濾波后的被檢單元與參考單元拼接成向量的形式訓(xùn)練SVM分類器,相比于均值類CFAR方法,SVM能在較低信噪比(Signal-to-Noise Ratio,SNR)的情況下獲得穩(wěn)健的檢出效果。為了抑制k-NN算法對(duì)雜波的敏感程度,Coluccia等人[7,8]將參考單元的回波信號(hào)看作輔助數(shù)據(jù),并用其構(gòu)建出回波信號(hào)的正則化協(xié)方差矩陣,從而將原始回波投影為更加平滑的向量表示(雜波抑制),利用該種向量構(gòu)建出的訓(xùn)練樣本集合可以獲得在不同信雜比(Signal-to-Clutter Ratio,SCR)情況下都更為魯棒的檢測(cè)模型。盡管這些方法無法嚴(yán)格保證CFAR的性質(zhì),然而在實(shí)際測(cè)得的虛警率上都取得了比CFAR更加穩(wěn)健的表現(xiàn)。
(2) 基于距離/多普勒/角度頻域變換的目標(biāo)檢測(cè)-識(shí)別方法。此類方法綜合運(yùn)用了當(dāng)下視覺目標(biāo)檢測(cè)[9,13]或語義分割[14–16]的原理,將經(jīng)典的雷達(dá)目標(biāo)檢測(cè)任務(wù)推廣為一種雷達(dá)目標(biāo)檢測(cè)-識(shí)別任務(wù)。相比于經(jīng)典的目標(biāo)/雜波檢測(cè)機(jī)制,該種方法額外引入了對(duì)目標(biāo)類型的識(shí)別。為了能在多種作用域上獲取目標(biāo)的信息,通常都是利用級(jí)聯(lián)式的快速傅里葉變換(Fast Fourier Transform,FFT)將原始回波轉(zhuǎn)換為距離-多普勒(Range-Doppler,RD)、距離-方位角(Range-Angle,RA)或距離-方位角-多普勒(Range-Angle-Doppler,RAD)等聯(lián)合多域的頻譜表示作為模型的輸入,并在輸出中得到各域上的位置信息和目標(biāo)類別語義信息。例如,文獻(xiàn)[17]利用CNN網(wǎng)絡(luò)作為檢測(cè)器,實(shí)現(xiàn)了在RD視角上的雷達(dá)目標(biāo)檢測(cè);文獻(xiàn)[18]在距離壓縮雷達(dá)數(shù)據(jù)的RA視角上,引入目標(biāo)檢測(cè)網(wǎng)絡(luò)Fast-RCNN以提升雷達(dá)目標(biāo)檢測(cè)性能。然而由于這是一種更為復(fù)雜的機(jī)器學(xué)習(xí)任務(wù),其對(duì)訓(xùn)練數(shù)據(jù)和模型的規(guī)模要求都會(huì)更高。為了避免引入大量的人工標(biāo)注成本,Wang等人[13]和Ouaknine等人[19]提出了一系列對(duì)RA及RD表示的自監(jiān)督標(biāo)注方法。在模型方面,這些工作多以參數(shù)規(guī)模龐大的自編碼-解碼(Auto-Encoder-Decoder,AED)卷積網(wǎng)絡(luò)作為基礎(chǔ)框架,并在編碼部分強(qiáng)調(diào)多尺度空域信息[13–16]和時(shí)域信息學(xué)習(xí)[13,14,16]的重要性。這些方法都已經(jīng)完全脫離了經(jīng)典雷達(dá)目標(biāo)檢測(cè)方法的框架,因此也無法直接套用經(jīng)典雷達(dá)目標(biāo)檢測(cè)方法的評(píng)價(jià)指標(biāo)對(duì)這些方法進(jìn)行評(píng)估。
(3) 基于雷達(dá)成像數(shù)據(jù)的目標(biāo)識(shí)別方法。此類方法通常是在高分辨的雷達(dá)成像數(shù)據(jù)上對(duì)目標(biāo)的類型進(jìn)行識(shí)別,通常不關(guān)心目標(biāo)的空間位置信息。目前代表性的工作有基于(CNN)的合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)圖像目標(biāo)識(shí)別[20],以及基于長(zhǎng)短時(shí)記憶(Long Short-Term Memory,LSTM)的高分辨距離像(High Resolution Range Profile,HRRP)目標(biāo)識(shí)別[21]等。此類方法雖不像檢測(cè)任務(wù)那樣關(guān)心目標(biāo)的空間位置信息,但是利用深度學(xué)習(xí)模型的編碼能力來獲得有效的雷達(dá)信號(hào)表示的這一機(jī)理也對(duì)檢測(cè)類方法提供了可借鑒的經(jīng)驗(yàn)。
目前,在以上這些方法中,研究熱度大都集中于第(2)和第(3)類方法,一方面是由于他們擁有公開可用的大規(guī)模訓(xùn)練數(shù)據(jù),同時(shí)數(shù)據(jù)中目標(biāo)信息量的充分程度也能夠給網(wǎng)絡(luò)的學(xué)習(xí)提供“燃料”;另一方面也是由于任務(wù)的定義也遵從了當(dāng)下主流機(jī)器學(xué)習(xí)方法的定義,使得方法的引入更加自然。而對(duì)于與本文最為相關(guān)的第(1)類方法來說,樣本中可供模型挖掘的有效目標(biāo)信息量非常稀少,往往很難充分發(fā)揮出復(fù)雜模型的樣本刻畫能力,同時(shí)也缺乏公開可用的大規(guī)模訓(xùn)練數(shù)據(jù)集,因此現(xiàn)在此方面的研究還存在以下局限性:
(1) 所使用的模型較為簡(jiǎn)單,通常是線性SVM和k-NN這種經(jīng)典模型,并且方法大都聚焦分類/判別器部分,而對(duì)回波特征表示學(xué)習(xí)方面的探討明顯存在不足。
(2) 實(shí)際情況下獲取到的回波數(shù)據(jù)中可用的目標(biāo)信息是非常稀疏的,以本文的地面預(yù)警雷達(dá)實(shí)測(cè)回波數(shù)據(jù)為例,在一圈掃描后得到的43×6000個(gè)距離單元上,有時(shí)僅有1~2個(gè)單元上存在目標(biāo)信息,這種目標(biāo)/雜波極為不均衡的檢測(cè)任務(wù)也給當(dāng)下主流的機(jī)器學(xué)習(xí)提出了巨大的挑戰(zhàn)。
(3) 所處理的數(shù)據(jù)大都是模擬仿真環(huán)境下生成的,缺乏更為極端條件下實(shí)測(cè)數(shù)據(jù)上的實(shí)驗(yàn)驗(yàn)證;同時(shí)目前的研究工作中也很少見到在統(tǒng)一實(shí)驗(yàn)條件下對(duì)于經(jīng)典CFAR方法、經(jīng)典機(jī)器學(xué)習(xí)方法,以及深度學(xué)習(xí)方法的綜合性能評(píng)價(jià)。
針對(duì)以上現(xiàn)有研究的局限性,本文提出一系列適用于雷達(dá)回波的特征表示學(xué)習(xí)方法和針對(duì)目標(biāo)-雜波樣本不均衡性的少數(shù)樣本數(shù)據(jù)生成方法,進(jìn)而系統(tǒng)性地給出如圖1所示的基于雷達(dá)回波的目標(biāo)檢測(cè)方法框架,最后使用以無人機(jī)為目標(biāo)的地面預(yù)警雷達(dá)實(shí)測(cè)回波數(shù)據(jù)來對(duì)方法進(jìn)行驗(yàn)證。
圖1 回波時(shí)序關(guān)系依賴的時(shí)空域稀疏條件下雷達(dá)目標(biāo)檢測(cè)框架Fig.1 Radar echo temporal relation learning-based spatial-temporal sparse target detection
針對(duì)雷達(dá)回波的表示學(xué)習(xí)問題,本文以雷達(dá)回波自身的時(shí)序性質(zhì)為約束,分別從無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)兩個(gè)方面給出了雷達(dá)回波特征的表示學(xué)習(xí)方法,并以目標(biāo)檢測(cè)性能為衡量指標(biāo)來對(duì)表示學(xué)習(xí)方法的有效性進(jìn)行驗(yàn)證;針對(duì)實(shí)際雷達(dá)探測(cè)中目標(biāo)時(shí)空域范圍在雷達(dá)回波中展現(xiàn)出的稀疏性,本文將異常值檢測(cè)中的樣本均衡思想引入訓(xùn)練樣本集構(gòu)建過程,提出一種目標(biāo)-雜波樣本規(guī)模均衡化處理策略,緩解了基于機(jī)器學(xué)習(xí)的雷達(dá)目標(biāo)探測(cè)任務(wù)中目標(biāo)樣本驅(qū)動(dòng)力不足的問題。最后,本文利用實(shí)測(cè)數(shù)據(jù)對(duì)所提出的完整檢測(cè)框架進(jìn)行消融實(shí)驗(yàn)分析,以驗(yàn)證回波時(shí)序性特征表示學(xué)習(xí)及樣本均衡策略的有效性;并在盡可能模擬雷達(dá)實(shí)際工作的情況下與多種經(jīng)典CFAR算法進(jìn)行對(duì)比實(shí)驗(yàn)分析。本文所涉及的具體技術(shù)包含以下3個(gè)方面:
(1) 雷達(dá)目標(biāo)回波增強(qiáng)。雷達(dá)在對(duì)目標(biāo)進(jìn)行探測(cè)時(shí),不僅會(huì)接收到目標(biāo)回波,同時(shí)也會(huì)接收到周圍環(huán)境反射的雜波信號(hào),一般而言,雜波信號(hào)的回波功率會(huì)遠(yuǎn)超目標(biāo)回波,尤其是對(duì)于飛行高度低(≤500 m)、速度慢(6~200 m/s)、有效反射截面積(Radar Cross Section,RCS)遠(yuǎn)低于1 m2的無人機(jī)目標(biāo),周圍雜波會(huì)更強(qiáng),從而嚴(yán)重影響系統(tǒng)的目標(biāo)檢測(cè)性能。而雷達(dá)目標(biāo)檢測(cè)問題首先需要解決的是如何獲取足夠“純凈”的目標(biāo)回波數(shù)據(jù),因此本文首先采用經(jīng)典的雷達(dá)信號(hào)處理手段對(duì)原始回波進(jìn)行雜波抑制,從而提升回波的SCR。
(2) 時(shí)序關(guān)系依賴的雷達(dá)回波表示學(xué)習(xí)。在機(jī)器學(xué)習(xí)領(lǐng)域中,檢測(cè)問題本質(zhì)上是一種數(shù)據(jù)驅(qū)動(dòng)的模式識(shí)別問題,其中對(duì)數(shù)據(jù)的有效特征表示至關(guān)重要。雷達(dá)回波作為一種時(shí)序性的信號(hào),其中的動(dòng)態(tài)時(shí)序信息是表示雷達(dá)回波的一種重要線索。而該種信息實(shí)際上可看作回波沿著距離(時(shí)間)方向的變化趨勢(shì),該趨勢(shì)依賴于序列中各個(gè)元素之間的時(shí)序關(guān)系。為此,本文試圖以回波序列各距離單元間的時(shí)間依賴關(guān)系為約束,來分別從無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)兩種方式學(xué)習(xí)出可以代表輸入回波序列的時(shí)序性特征表示。
(3) 時(shí)空域稀疏條件下的雷達(dá)低慢小目標(biāo)檢測(cè)。與常見的視覺目標(biāo)檢測(cè)任務(wù)不同,可見光傳感器的感受野有限,通常都是針對(duì)近距離的感興趣目標(biāo),目標(biāo)所占據(jù)的感受野區(qū)域相對(duì)更大,而雷達(dá)探測(cè)的范圍通常要更大,其所針對(duì)的通常也都是遠(yuǎn)距離的目標(biāo),這就導(dǎo)致目標(biāo)在雷達(dá)感受野范圍內(nèi)所占據(jù)的時(shí)空區(qū)域非常有限,若被檢目標(biāo)自身RCS很小,那么其在感受野下將會(huì)呈現(xiàn)出極高的時(shí)空稀疏性。這一特點(diǎn)會(huì)導(dǎo)致訓(xùn)練數(shù)據(jù)中目標(biāo)與雜波的比例嚴(yán)重失衡,因此,本文試圖引入異常值檢測(cè)中的樣本平衡策略來構(gòu)建出目標(biāo)-雜波樣本規(guī)模均衡的訓(xùn)練數(shù)據(jù)集。
本文主要?jiǎng)?chuàng)新點(diǎn)如下:
(1) 系統(tǒng)性地提出了一種有效的基于雷達(dá)回波的目標(biāo)/雜波檢測(cè)的機(jī)器學(xué)習(xí)方法框架,該方法框架不僅局限于檢測(cè)器的構(gòu)建,也對(duì)雷達(dá)回波的有效特征表示學(xué)習(xí)問題進(jìn)行了探討;
(2) 著重研究了時(shí)序信息對(duì)于雷達(dá)回波表示的重要性,并給出了無監(jiān)督和有監(jiān)督兩種回波表示學(xué)習(xí)方法的具體實(shí)現(xiàn);
(3) 采用基于少數(shù)實(shí)測(cè)目標(biāo)樣本鄰域內(nèi)擾動(dòng)的樣本平衡策略解決了目標(biāo)-雜波樣本不均衡的問題,并基于此方法構(gòu)建出目標(biāo)-雜波樣本數(shù)均衡的數(shù)據(jù)集,以進(jìn)行特征表示學(xué)習(xí)和檢測(cè)模型的訓(xùn)練;
(4) 分別利用均衡策略構(gòu)建的數(shù)據(jù)集與實(shí)測(cè)序貫數(shù)據(jù)集設(shè)計(jì)實(shí)驗(yàn),對(duì)所提出的方法進(jìn)行消融實(shí)驗(yàn)以及與經(jīng)典CFAR方法的對(duì)比實(shí)驗(yàn)。
如圖1所示,本文所提檢測(cè)方法的完整框架可大致分為4個(gè)部分:(1)原始回波預(yù)處理;(2)回波時(shí)序關(guān)系依賴的特征表示學(xué)習(xí);(3)基于目標(biāo)回波上采樣的訓(xùn)練數(shù)據(jù)集構(gòu)建;(4)目標(biāo)檢測(cè)器。本小節(jié)將逐一對(duì)這4個(gè)部分進(jìn)行介紹。
雷達(dá)目標(biāo)檢測(cè)問題首先需要解決的是如何獲取足夠“純凈”的目標(biāo)回波數(shù)據(jù),為此,首先對(duì)原始回波進(jìn)行異常點(diǎn)剔除、數(shù)字脈沖壓縮(Digital Pulse Compression,DPC)[22],以及有限沖擊響應(yīng)(Finite Impulse Response,FIR)濾波[22],從而獲得信雜比更高的回波信號(hào)。此外,綜合考慮回波時(shí)序上下文內(nèi)容與處理的時(shí)效性,還對(duì)濾波之后的回波進(jìn)行滑動(dòng)窗切分以得到之后時(shí)序建模和檢測(cè)的最短序列。以本文處理的回波數(shù)據(jù)為例,3個(gè)步驟的大致流程如下:
步驟1 DPC。由于目標(biāo)的運(yùn)動(dòng)速度慢,其回波常常會(huì)與雜波交疊,甚至淹沒于后者之中。而DPC可以在不降低目標(biāo)回波功率的同時(shí),將較寬的回波進(jìn)行壓縮,以提升距離分辨率。給定一個(gè)6通道的回波序列X∈CT×6(其中T為距離單元個(gè)數(shù)即快時(shí)間維度,6為多普勒通道個(gè)數(shù)即慢時(shí)間維)與參考發(fā)射波形S∈R2N(其中,N為發(fā)射波形長(zhǎng)度,由于S包含發(fā)射波形的實(shí)部和虛部?jī)刹糠郑虼司S度為2N),首先對(duì)回波進(jìn)行逐多普勒通道FFT,以得到每個(gè)脈沖的頻域響應(yīng)曲線∈CN(i=1,2,...,6);隨后將頻域響應(yīng)與經(jīng)過復(fù)數(shù)形式還原后的參考信號(hào)S?∈CN進(jìn)行逐位相乘;最后對(duì)乘后的結(jié)果進(jìn)行逐通道的傅里葉逆變換(Inversed FFT,IFFT),以得到最終壓縮后的回波序列Y∈CT×6。
步驟2 FIR濾波。由于目標(biāo)飛行高度低,目標(biāo)回波易被地物雜波所干擾,為此引入FIR濾波來對(duì)雜波進(jìn)行抑制,從而提升目標(biāo)回波信號(hào)的信雜比SCR。本文采用文獻(xiàn)[23]中所推薦的方式設(shè)計(jì)相應(yīng)的濾波器組,用設(shè)計(jì)好的6組FIR濾波器系數(shù)矩陣H∈C6×6對(duì)經(jīng)過DPC壓縮后的6通道回波序列Y∈CT×6進(jìn)行逐時(shí)刻(距離單元)濾波處理,具體地,對(duì)于通道p的第n個(gè)距離單元的FIR濾波輸出可由式(1)得到:
最終得到6通道的濾波輸出Z∈C6×T。
步驟3 回波滑動(dòng)窗切分。雷達(dá)回波與其他常見的序列數(shù)據(jù)如視頻和音頻不同,其中所蘊(yùn)含的感興趣動(dòng)態(tài)信息非常稀有。若直接對(duì)完整的一段回波序列進(jìn)行時(shí)序建模,感興趣的目標(biāo)動(dòng)態(tài)信息將很有可能被淹沒于占絕大部分的雜波信息之中,隨著序列長(zhǎng)度的增加,感興趣信息被淹沒的可能性也會(huì)更大。同時(shí),以循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[24]和LSTM[25]為例,相關(guān)研究表明,隨著建模序列長(zhǎng)度的增加,模型對(duì)于序列之中的時(shí)序依賴的刻畫能力也會(huì)有所下降,即歷史累積遺忘效應(yīng)[26]。因此,綜合考慮目標(biāo)信息的時(shí)域稀疏性和序列建模方法的遺忘效應(yīng)問題,本文采用滑動(dòng)窗機(jī)制對(duì)濾波后的回波序列進(jìn)行切分,以得到多個(gè)更緊湊的回波子序列,該子序列將作為之后時(shí)序建模方法的輸入?;瑒?dòng)窗切分的具體方式如圖2所示,為了保留目標(biāo)信息的時(shí)序上下文,系統(tǒng)待檢測(cè)的距離單元將會(huì)作為子序列的中心單元,并在其前后補(bǔ)充若干參考單元。如此,滑動(dòng)窗的大小將取決于所用參考單元的個(gè)數(shù),若參考單元個(gè)數(shù)為L(zhǎng),則滑動(dòng)窗大小為2L+1,此外,滑動(dòng)窗移動(dòng)的步長(zhǎng)也是一個(gè)可以設(shè)置的參數(shù),在序貫驗(yàn)證環(huán)節(jié)中,由于要遍歷完整序列,因此步長(zhǎng)為1。這里值得注意的是,由于本文強(qiáng)調(diào)了序列的時(shí)序性,沒有像CFAR一樣設(shè)置保護(hù)單元以避免產(chǎn)生不連貫的子序列。
圖2 滑動(dòng)窗切分回波示意圖Fig.2 The sliding-window-based echo splitting
本節(jié)將探討如何在雷達(dá)回波的時(shí)序依賴關(guān)系約束下,獲取雷達(dá)回波的有效特征表示。時(shí)序依賴關(guān)系約束下的回波特征表示學(xué)習(xí)問題從本質(zhì)上來說,是一種序列建模問題,建模方法需要將待檢中心單元與其前后若干參考單元一同構(gòu)成的序列轉(zhuǎn)換為維度固定的特征表示,而后檢測(cè)模型以該特征表示為依據(jù)判定待檢中心單元是否存在目標(biāo)信息。
正如本文在引言部分所介紹的,檢測(cè)模型可以與特征表示模型分開單獨(dú)學(xué)習(xí),也可以耦合在一起聯(lián)合優(yōu)化,若二者分離單獨(dú)優(yōu)化,則對(duì)應(yīng)于無監(jiān)督式的時(shí)序性特征表示學(xué)習(xí),若聯(lián)合優(yōu)化則對(duì)應(yīng)于有監(jiān)督式的時(shí)序性特征表示學(xué)習(xí)。因此,為充分討論時(shí)序信息對(duì)于雷達(dá)回波表示的重要性,本文將以無監(jiān)督和有監(jiān)督的方式分別給出雷達(dá)回波時(shí)序性特征表示學(xué)習(xí)方法,并對(duì)二者的學(xué)習(xí)機(jī)理進(jìn)行對(duì)比分析。
2.2.1 無監(jiān)督回波時(shí)序性表示學(xué)習(xí)
無監(jiān)督學(xué)習(xí)旨在僅利用輸入樣本自身信息來完成某一特定任務(wù),對(duì)于本文來說,輸入數(shù)據(jù)即為經(jīng)過預(yù)處理之后的回波子序列,任務(wù)即為回波時(shí)序關(guān)系。作為一種極端情況下的學(xué)習(xí)策略,無監(jiān)督學(xué)習(xí)方法需要盡可能利用數(shù)據(jù)自身的信息,而回波作為一種時(shí)序信號(hào),其中各個(gè)單元間的時(shí)間順序信息就是一個(gè)重要的依據(jù),為此本文借鑒時(shí)序池化方法[27]中以序列時(shí)間先后順序?yàn)榧s束的序列回歸學(xué)習(xí)思想,提出一種適用于雷達(dá)回波的無監(jiān)督時(shí)序性特征學(xué)習(xí)方法—EchoDarwin1EchoDarwin旨在捕捉回波隨時(shí)間演進(jìn)的變化趨勢(shì),Echo取雷達(dá)回波之意,Darwin取隨時(shí)間演進(jìn)而發(fā)生變化之意。。
鑒于雷達(dá)回波的特殊性以及機(jī)器學(xué)習(xí)方法的自身特點(diǎn),在給出EchoDarwin定義之前,首先要對(duì)其輸入進(jìn)行實(shí)數(shù)化和歸一化處理。給定由2.1節(jié)預(yù)處理環(huán)節(jié)獲得的某個(gè)回波子序列X=[x1,x2,...,xT]T2請(qǐng)注意本文中正體“T”表示轉(zhuǎn)置,斜體“T”表示序列長(zhǎng)度,二者并非相同的符號(hào)。,其中xi∈CP,P為脈沖通道數(shù),T=2L+1為序列長(zhǎng)度。出于不損失輸入序列信息量的考慮,首先將每個(gè)xi按照如式(2)方式進(jìn)行復(fù)數(shù)-實(shí)數(shù)域轉(zhuǎn)換:
其中,Cmplx2Real(·): CP →R2P為轉(zhuǎn)換算子,real(·)和imag(·)分別表示按位取實(shí)部和虛部操作,(·)T表示矩陣轉(zhuǎn)置。在序列歸一化方面,一方面考慮到回波信號(hào)的幅值變化范圍很大,直接處理會(huì)使得模型難以收斂,需要壓縮其幅值變化范圍;另一方面考慮到信號(hào)的劇烈變化會(huì)加劇時(shí)序建模的難度,還需要進(jìn)行時(shí)域上的平滑處理?;诖藘煞矫婵紤],對(duì)于經(jīng)過實(shí)數(shù)化處理的某一,本文進(jìn)行如下歸一化處理:
圖3 Echo Darwin原理示意圖Fig.3 The schematic diagram of Echo Darwin
其中,∥·∥是某種范數(shù)算子。
然而,即使經(jīng)過歸一化平滑處理,回波序列自身仍然存在很大的抖動(dòng)性,因此還需要對(duì)式(6)這種形式嚴(yán)格的回歸目標(biāo)進(jìn)行放松,同時(shí)對(duì)參數(shù)e進(jìn)行正則化約束以提升回歸模型的泛化性。為此,進(jìn)而引入回歸松弛量ε和e的正則約束項(xiàng),如此可進(jìn)一步將式(6)寫成:
其中,是L2正則項(xiàng),ε與λ分別為回歸誤差項(xiàng)的松弛因子和懲罰因子,[·]≥0=max{·;0}表示誤差損失項(xiàng)僅關(guān)心超過誤差松弛邊界的回歸結(jié)果。如此,式(7)的形式正好滿足L2正則化約束的支持向量回歸(Support Vector Regression,SVR)[28]問題,其即為本文所提EchoDarwin的優(yōu)化目標(biāo)。在具體求解過程中,本文采用牛頓信賴域法(Trust Region Newton,TRON)[29],其是一種用于求解無約束和帶有邊界約束可微問題的通用優(yōu)化方法。
至此,本文已對(duì)EchoDarwin的原理思想進(jìn)行了分析,并基于此給出了其優(yōu)化目標(biāo)函數(shù),然而其本身仍然是一種線性回歸模型,其對(duì)回波時(shí)序信息的編碼能力有限。為此,本文進(jìn)而基于核函數(shù)的思想,通過引入一個(gè)形式確定的非線性特征映射(Non-Linear Feature Mapping,NFM)算子,來進(jìn)一步提升EchoDarwin的時(shí)序編碼能力。已知利用一個(gè)形式確定的NFM操作來將處于原始空間的輸入特征映射至更高維的目標(biāo)空間之中,等價(jià)于在原始低維空間中計(jì)算非線性核函數(shù)[30,31]。那么若選取合適的NFM,就可在不改變線性SVR問題求解形式的情況下,將其轉(zhuǎn)換為一個(gè)非線性的回歸模型,從而達(dá)到提升EchoDarwin時(shí)序編碼能力的目的。具體來說,對(duì)于某個(gè)作用于的NFM操作Ψ(·):R2P vt∈RD,其中D≥2P,其將非線性地映射至一個(gè)更高維的空間之中,并在此空間求解如下優(yōu)化問題:
2.2.2 有監(jiān)督回波時(shí)序性表示學(xué)習(xí)
正如引言所述,若直接求解式(10),則將退化為目前基于機(jī)器學(xué)習(xí)的回波目標(biāo)檢測(cè)方法的形式,雖在分類器的選取上略有不同,但本質(zhì)上都是沒有特征表示學(xué)習(xí)的部分。而本文認(rèn)為特征表示學(xué)習(xí)作為目前機(jī)器學(xué)習(xí)中的一個(gè)重要組成部分,是不應(yīng)該被忽略的,因此若將EchoDarwin引入式(10)中則可以得到如下既包含特征表示學(xué)習(xí)也包括檢測(cè)模型的優(yōu)化問題:
圖4 EchoDarwin無監(jiān)督回波時(shí)序性特征表示學(xué)習(xí)示意圖Fig.4 The diagram of EchoDarwin for unsupervised temporal feature learning of radar echo
從式(11)不難看出,其本質(zhì)上是將EchoDarwin看作檢測(cè)目標(biāo)函數(shù)約束條件的聯(lián)合優(yōu)化問題,若要采用梯度下降算法進(jìn)行優(yōu)化,則需要求解?L/?e,而根據(jù)鏈?zhǔn)角髮?dǎo)法則,求解?L/?e涉及(?L?Φ())/(?Φ()?e)的計(jì)算。但由于式(7)中松弛化的誤差損失項(xiàng)[·]≥0并不是在各點(diǎn)均可導(dǎo),無法保證正確的梯度優(yōu)化方向,進(jìn)而無法保證模型收斂到最優(yōu)解。因此,需要引入另外一種時(shí)序編碼機(jī)制來實(shí)現(xiàn)時(shí)序性特征學(xué)習(xí)與檢測(cè)模型的聯(lián)合優(yōu)化,即有監(jiān)督的回波時(shí)序性特征表示學(xué)習(xí)。
為此,本文引入時(shí)序建模問題廣泛應(yīng)用的LSTM[25]及門控循環(huán)單元(Gated Recurrent Unit,GRU)[32]等來對(duì)回波中的時(shí)序關(guān)系進(jìn)行捕捉,同時(shí)優(yōu)化目標(biāo)檢測(cè)模型。LSTM與GRU都屬于RNN[24]的一種,基礎(chǔ)運(yùn)算框架都是迭代式的序列到序列(Sequence-to-Sequence,Seq2Seq)的建模模型,LSTM可緩解常規(guī)RNN梯度消失和梯度爆炸問題,而GRU則在盡可能保留LSTM優(yōu)勢(shì)的同時(shí),對(duì)其進(jìn)行計(jì)算上的簡(jiǎn)化。通常,這些循環(huán)式的網(wǎng)絡(luò)都是用于解決序列到序列的編碼轉(zhuǎn)錄或序列預(yù)測(cè)問題,例如機(jī)器翻譯、語音識(shí)別或天氣預(yù)測(cè)等。與這些問題不同,本文所關(guān)注的序列建模問題是一種形如EchoDarwin的序列到向量的編碼問題,即期望對(duì)一段序列的完整上下文進(jìn)行編碼,同時(shí)保證編碼結(jié)果能保留序列之中的時(shí)序依賴關(guān)系。為便于理解,本文嘗試使用一個(gè)統(tǒng)一的形式來對(duì)循環(huán)式神經(jīng)網(wǎng)絡(luò)的回波序列建模進(jìn)行闡釋。首先考慮某一參數(shù)為WS的單層循環(huán)網(wǎng)絡(luò)模型Seq2Seq(·;WS),其會(huì)將經(jīng)過實(shí)數(shù)化及歸一化處理后的某一回波子序列=其中,∈R2P,i=1,2,...,T,進(jìn)行如下序列到序列的編碼:
其中,對(duì)于每一時(shí)刻的輸出vt,將由式(13)和式(14)計(jì)算得出:
其中,O(·;)與H(·,·;)分別為Seq2Seq模型的輸出函數(shù)與隱藏編碼函數(shù),ht為隱藏編碼函數(shù)的輸出,其與當(dāng)前時(shí)刻的輸入和上一時(shí)刻隱藏編碼結(jié)果有關(guān),依次迭代式地使用此種編碼方式,最后一個(gè)時(shí)刻的輸出結(jié)果vT將會(huì)攜帶所有歷史時(shí)刻信息,從而實(shí)現(xiàn)時(shí)序關(guān)系的學(xué)習(xí),最終vT也將作為的時(shí)序編碼結(jié)果參與到頂層檢測(cè)模型的訓(xùn)練。
然而,與EchoDarwin不同之處在于,Seq2Seq這種前后時(shí)刻依賴的編碼機(jī)制之中并沒有嚴(yán)格地以顯性的方式體現(xiàn)出一維時(shí)間偏序關(guān)系的約束,其是將這種偏序關(guān)系隱式地用循環(huán)迭代的隱藏編碼函數(shù)H(·,·;)來體現(xiàn)。這也是目前大多數(shù)深度神經(jīng)網(wǎng)絡(luò)與經(jīng)典機(jī)器學(xué)習(xí)方法的一大不同之處,即將一些具有顯式化約束條件的優(yōu)化問題轉(zhuǎn)換為無約束或者弱約束的可以逐層梯度反傳的復(fù)雜模型,即弱化優(yōu)化問題自身的約束條件,而強(qiáng)調(diào)模型對(duì)輸入的非線性表達(dá)能力。
其中,L(,y;WS,θ)表示檢測(cè)任務(wù)的損失函數(shù),P(y′=y|vT;θ)為檢測(cè)模型打分函數(shù)輸出的關(guān)于vT屬于預(yù)測(cè)結(jié)果y的概率值。由于涉及時(shí)序編碼和檢測(cè)分類的模型均由具有閉式解的算子組成,因此可很方便地采用隨機(jī)梯度下降算法來實(shí)現(xiàn)時(shí)序編碼模型參數(shù)WS與檢測(cè)器模型參數(shù)θ的更新。圖5(a)以直觀的方式展示了有監(jiān)督回波時(shí)序關(guān)系建模的過程。
無論是RNN,LSTM,還是GRU,他們?cè)跁r(shí)序編碼機(jī)制方面沒有本質(zhì)區(qū)別,唯一不同之處體現(xiàn)在Seq2Seq(·;WS)中的隱藏編碼函數(shù)H(·,·;),在RNN中H主要是分別對(duì)歷史時(shí)刻的隱藏編碼結(jié)果和當(dāng)前輸入進(jìn)行線性加權(quán)求和。而此種方式往往會(huì)使得歷史信息利用不充分,隨著輸入序列的長(zhǎng)度增加,模型的建模能力逐漸退化。為此,LSTM引入“細(xì)胞(cell)狀態(tài)”來對(duì)流入網(wǎng)絡(luò)的信息進(jìn)行保持,并且通過精心設(shè)計(jì)的輸入、輸出和遺忘等多種門的操作來控制信息的流入流出,進(jìn)而提升模型的歷史信息利用能力。而在此基礎(chǔ)上,GRU通過將輸入和遺忘門簡(jiǎn)化為一個(gè)單一的更新門,同時(shí)將顯式的細(xì)胞狀態(tài)隱式地融合進(jìn)隱藏狀態(tài),從而在盡可能保留LSTM編碼能力的同時(shí),達(dá)到精簡(jiǎn)模型的目的,二者的區(qū)別詳見圖5(b)。
圖5 基于有監(jiān)督Seq2Seq模型的雷達(dá)回波時(shí)序性特征表示學(xué)習(xí)方法示意圖Fig.5 The illustration of supervised Seq2Seq-based radar echo temporal feature learning method
正如引言部分所分析的,對(duì)實(shí)際情況中的低慢小無人預(yù)警任務(wù)來說,多個(gè)方向上收到的回波中存在目標(biāo)信息的距離單元是極為稀少的。以本文所處理的回波數(shù)據(jù)為例,在一個(gè)掃描周期所收到的回波中存在目標(biāo)的距離單元與雜波距離單元的比例≤1:129,000。這種正負(fù)樣本極為不均衡的檢測(cè)任務(wù)對(duì)于目前的機(jī)器學(xué)習(xí)方法來說是極具挑戰(zhàn)性的,即正例樣本的驅(qū)動(dòng)力嚴(yán)重不足。因此,不能以常規(guī)的處理方式來應(yīng)對(duì)此種極端情況下的檢測(cè)任務(wù)。粗略地以全局視角來看,低慢小目標(biāo)檢測(cè)問題更像是在密集發(fā)生的不感興趣的事件之中尋找出極小概率發(fā)生的感興趣事件,這更像是一種異常事件檢測(cè)問題,此處的異常便對(duì)應(yīng)著發(fā)生概率或者次數(shù)極為稀少的含義,因此本文嘗試以異常檢測(cè)問題的解決思路來應(yīng)對(duì)低慢小目標(biāo)檢測(cè)問題。
異常檢測(cè)最為關(guān)鍵的問題是數(shù)據(jù)的嚴(yán)重不平衡現(xiàn)象,即訓(xùn)練數(shù)據(jù)中不同類別數(shù)據(jù)規(guī)模大小不一致,若直接采用不平衡的數(shù)據(jù)對(duì)檢測(cè)模型進(jìn)行訓(xùn)練,會(huì)使得模型的預(yù)測(cè)方向往樣本規(guī)模更大的那一類別傾斜,造成過擬合現(xiàn)象。因此,為避免數(shù)據(jù)不均衡,本文采用一種基于聚類的少數(shù)類別樣本生成算法SMOTE[33]來對(duì)存在樣本不平衡的數(shù)據(jù)進(jìn)行均衡化處理。如圖6所示,均衡化處理的目的是對(duì)規(guī)模更小的目標(biāo)數(shù)據(jù)進(jìn)行生成(上采樣過程),同時(shí)按照與上采樣擴(kuò)充后的目標(biāo)樣本量,隨機(jī)性地選取相當(dāng)數(shù)量的雜波樣本(下采樣過程),從而最終得到目標(biāo)-雜波占比均衡的訓(xùn)練/測(cè)試數(shù)據(jù)集。
圖6 目標(biāo)-雜波樣本規(guī)模均衡化處理示意圖Fig.6 The illustration of target-clutter sample scale balance
均衡化處理策略的大致思想是利用少數(shù)類別樣本在數(shù)據(jù)空間中的近鄰,來生成新的屬于該類別的樣本,近鄰的尋找方法一般采用經(jīng)典的k-NN算法。給定具有M個(gè)目標(biāo)回波子序列的集合,?tgt={X1,X2,...,XM},Xi∈CT×P,i=1,2,...,M,表1將會(huì)按照預(yù)先設(shè)置的合成倍數(shù)N,額外生成具有N ×M個(gè)生成目標(biāo)樣本的集合。從表1中的式(16)可以看出,少數(shù)樣本生成的原理本質(zhì)上是在真實(shí)目標(biāo)樣本的某個(gè)鄰域空間內(nèi)進(jìn)行微小的擾動(dòng),從而達(dá)到豐富目標(biāo)樣本在訓(xùn)練集之中多樣性的目的,進(jìn)而以一種合理的方式增加了目標(biāo)樣本的規(guī)模。圖7以兩種降維方法主成分分析(Principal Component Analysis,PCA)與T分布隨機(jī)鄰域嵌入(T-distributed Stochastic Neighbor Embedding,T-SNE)可視化地展示了經(jīng)過均衡化處理前后,目標(biāo)樣本規(guī)模的變化,可以看出,均衡化算法有效地平衡了目標(biāo)-雜波樣本規(guī)模的比例。
圖7 目標(biāo)樣本均衡化處理前后數(shù)據(jù)分布可視化對(duì)比Fig.7 The target sample scale visualization of target-clutter sample scale balancing
表1 目標(biāo)-雜波樣本規(guī)模均衡化處理算法Tab.1 Target-Clutter sample scale balancing algorithm
此外,值得注意的是表1實(shí)際上類似于一種在深度學(xué)習(xí)方法中經(jīng)常使用的數(shù)據(jù)增廣方法mixup[34],其原理是對(duì)兩個(gè)隨機(jī)采樣出的不同真實(shí)樣本進(jìn)行線性加權(quán)來豐富樣本的多樣性,被采樣的兩個(gè)樣本在統(tǒng)計(jì)上是獨(dú)立分布的,即該方法假設(shè)兩個(gè)被采樣本沒有統(tǒng)計(jì)上的依賴關(guān)系。而表1認(rèn)為被采樣本之間應(yīng)該具備一定的關(guān)聯(lián),對(duì)隨機(jī)采樣進(jìn)行了進(jìn)一步的約束,即將其中一個(gè)樣本看作錨定樣本,并且在錨定樣本的鄰域內(nèi)進(jìn)行隨機(jī)采樣,被選中的兩個(gè)樣本實(shí)際上是具有統(tǒng)計(jì)相關(guān)性的,此種方式會(huì)避免生成的樣本與原始樣本之間存在較大的差異性。
至此,本文已對(duì)所提完整的基于雷達(dá)回波目標(biāo)檢測(cè)框架的各個(gè)重要環(huán)節(jié)分別進(jìn)行了介紹,其中回波時(shí)序性表示學(xué)習(xí)與檢測(cè)器均是可學(xué)習(xí)的模型。圖8直觀地展示了這些模型的大致訓(xùn)練過程,其中在無監(jiān)督時(shí)序關(guān)系學(xué)習(xí)的情況下,特征表示學(xué)習(xí)與檢測(cè)模型的訓(xùn)練過程是分離的,并且每個(gè)樣本的特征學(xué)習(xí)過程都是獨(dú)立進(jìn)行的,也無需樣本標(biāo)簽參與學(xué)習(xí)過程;而在有監(jiān)督時(shí)序關(guān)系學(xué)習(xí)的情況下,時(shí)序性特征表示學(xué)習(xí)模型與檢測(cè)模型是在完整的訓(xùn)練樣本集上端到端聯(lián)合優(yōu)化的。
圖8 回波時(shí)序關(guān)系依賴的雷達(dá)目標(biāo)檢測(cè)框架訓(xùn)練流程示意圖Fig.8 The illustration of training process for echo temporal relation-based radar target detection framework
本文使用地面情報(bào)雷達(dá)的實(shí)測(cè)數(shù)據(jù)來驗(yàn)證所提方法,雷達(dá)采集對(duì)象為復(fù)雜氣象環(huán)境中濱海強(qiáng)雜波條件下的低空飛行慢速小目標(biāo),總共包括19個(gè)掃描周期共計(jì)814幀的回波數(shù)據(jù),掃描覆蓋60°到90°的空域范圍,每個(gè)方向上包含6個(gè)脈沖,每個(gè)脈沖的有效距離單元數(shù)均為6000,每幀數(shù)據(jù)相當(dāng)于是一個(gè)6000×6的復(fù)數(shù)矩陣。在每個(gè)包含大約43幀數(shù)據(jù)的掃描周期內(nèi),僅有兩個(gè)距離單元上存在目標(biāo)信息(43×6000個(gè)距離只有2個(gè)單元存在目標(biāo)),正如2.3節(jié)中所討論的,這在機(jī)器學(xué)習(xí)領(lǐng)域中更像是異常檢測(cè)問題。
如引言所述,經(jīng)典的雷達(dá)目標(biāo)檢測(cè)遵照統(tǒng)計(jì)檢測(cè)理論,其是通過對(duì)含有目標(biāo)信息的信號(hào)或雜波信號(hào)的分布特性提出假設(shè),從而能夠給出輸入信號(hào)在不同假設(shè)條件下的概率密度函數(shù)的形式,因此其中所探討的檢測(cè)概率和虛警概率是一種概率值估計(jì),即待檢信號(hào)服從某個(gè)分布的概率值。而數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法直接對(duì)式(9)中所定義假設(shè)條件下的概率取值進(jìn)行估計(jì),不事先對(duì)信號(hào)的分布特性進(jìn)行先驗(yàn)性假設(shè)。其所估計(jì)的概率值并不直接用于評(píng)價(jià)模型算法的好壞,而是對(duì)量化后的概率估計(jì)值在測(cè)試樣本集中所占比例來對(duì)模型進(jìn)行評(píng)估。
為盡可能科學(xué)嚴(yán)謹(jǐn)?shù)仳?yàn)證本文所提方法,本文將設(shè)計(jì)兩種數(shù)據(jù)集來對(duì)方法進(jìn)行實(shí)驗(yàn)驗(yàn)證:
3.1.1 實(shí)測(cè)-生成混檢數(shù)據(jù)集(Real Synthetic Hybrid Dataset,RSHD)設(shè)計(jì)
為充分對(duì)所提方法中各個(gè)環(huán)節(jié)的有效性進(jìn)行驗(yàn)證,采用經(jīng)典的K-折交叉檢驗(yàn)法來構(gòu)建RSHD的訓(xùn)練/測(cè)試集(K=4),訓(xùn)練測(cè)試的樣本規(guī)模比例約為3:1。具體如下:
(1) 濾波預(yù)處理:對(duì)所有回波數(shù)據(jù)進(jìn)行DPC和FIR濾波預(yù)處理;
最終,每一份訓(xùn)練集與測(cè)試集的子序列個(gè)數(shù)分別為592和310。這里需要額外說明的是,在給子序列進(jìn)行標(biāo)注時(shí),都是以中心距離單元的類別為準(zhǔn)。同時(shí)確保有3個(gè)完整掃描周期的回波數(shù)據(jù)不會(huì)出現(xiàn)在每一份訓(xùn)練集之中,從而保證后續(xù)實(shí)測(cè)序貫回放驗(yàn)證集(Real Sequential Playback verification Dataset,RSPD)中不會(huì)存在所訓(xùn)模型“見過”的樣本。
3.1.2 RSPD設(shè)計(jì)
RSPD僅作為驗(yàn)證集使用。為還原真實(shí)的雷達(dá)目標(biāo)檢測(cè)過程,將未出現(xiàn)于RSHD訓(xùn)練集中的3個(gè)掃描周期的數(shù)據(jù)按照掃描周期數(shù)保存。在序貫驗(yàn)證過程中,滑動(dòng)窗切分算法將按照參考單元數(shù)L=10,滑動(dòng)步長(zhǎng)1對(duì)每幀回波序列進(jìn)行切分,并且對(duì)序列的開頭與結(jié)尾處進(jìn)行補(bǔ)0,以保證序貫實(shí)驗(yàn)環(huán)節(jié)中,驗(yàn)證集中每個(gè)距離單元都按照雷達(dá)實(shí)際掃描的順序被檢測(cè)模型處理。
本小節(jié)將首先介紹無監(jiān)督時(shí)序性回波表示學(xué)習(xí)方法EchoDarwin與基于深度循環(huán)網(wǎng)絡(luò)的有監(jiān)督時(shí)序性回波表示學(xué)習(xí)方法訓(xùn)練過程中的模型超參設(shè)置。由于前者是一種與檢測(cè)模型相解耦的表示學(xué)習(xí)方法,因此還需要額外訓(xùn)練檢測(cè)模型來對(duì)特征進(jìn)行判別和區(qū)分,為此,本文采用基于卡方核函數(shù)(Chi-square kernel function,Chi-2)的支持向量機(jī)(SVM)[35]作為檢測(cè)模型。EchoDarwin相關(guān)參數(shù)設(shè)置如下:
(1) 時(shí)序性特征學(xué)習(xí)模型。若無特殊說明,NFM默認(rèn)采用Hellinger核函數(shù)的簡(jiǎn)化變種PosNeg[27],回歸的懲罰因子λ(見式(7))默認(rèn)設(shè)置為1×10–5;
(2) 檢測(cè)模型。訓(xùn)練過程中采用二階段的網(wǎng)格搜索法確定SVM懲罰因子,首先從取值范圍為[1,10000],且以幾何倍數(shù)為10增長(zhǎng)的等比數(shù)列中確定性能表現(xiàn)較好的大致取值范圍,再等間隔均勻劃分縮小后的取值范圍,并最終選取性能最好的懲罰因子。
對(duì)于有監(jiān)督的方法而言,本文設(shè)計(jì)了4種基于LSTM和GRU的回波時(shí)序關(guān)系學(xué)習(xí)網(wǎng)絡(luò):(a)基于雙向(Bi-directional,Bi-LSTM)的網(wǎng)絡(luò):時(shí)序編碼部分由兩層Bi-LSTM構(gòu)成[36],相比常規(guī)LSTM,Bi-LSTM會(huì)額外對(duì)序列進(jìn)行反向時(shí)序建模,以獲得更豐富的上下文依賴關(guān)系;(b)雙向GRU(Bi-directional GRU,Bi-GRU):時(shí)序編碼部分由兩層雙向GRU構(gòu)成[36],相比LSTM,GRU會(huì)以更為精簡(jiǎn)的方式對(duì)序列進(jìn)行建模;(c)MLP-LSTM:時(shí)序編碼部分由若干時(shí)序上不共享的作用于完整序列的多層感知機(jī)(Multi-Layer Perceptron,MLP)和一個(gè)Bi-LSTM層構(gòu)成,其中MLP由兩個(gè)全連接(Fully-Connected,FC)層和一個(gè)Leaky ReLU[37]激活層構(gòu)成;(d)基于卷積的LSTM(Convolutional LSTM,ConvLSTM):與MLP-LSTM不同之處在于,時(shí)序不共享的MLP部分由若干1×1共享卷積核代替。為保持實(shí)驗(yàn)條件一致,所有網(wǎng)絡(luò)都采用相同的優(yōu)化算法及超參進(jìn)行訓(xùn)練,訓(xùn)練配置與網(wǎng)絡(luò)具體結(jié)構(gòu)詳見表2。
表2 雷達(dá)回波時(shí)序關(guān)系學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)及訓(xùn)練配置Tab.2 Network structure and training configuration of radar echo temporal relationship learning
實(shí)驗(yàn)部分將分別采用RSHD的測(cè)試集和RSPD進(jìn)行模型的性能驗(yàn)證,其中在RSHD部分評(píng)價(jià)皆采用相同的指標(biāo)體系,具體為正確率(Accuracy)、虛警率(False Alarm Rate,FA)、檢測(cè)精度(Precision)、檢出率或召回率(Recall),以及F值(F Score)。其中,綜合評(píng)價(jià)指標(biāo)F值的計(jì)算方式為
其中,系數(shù)β設(shè)為1。最終指標(biāo)的結(jié)果為4份訓(xùn)練/測(cè)試集所獲得結(jié)果的均值。在RSPD部分的評(píng)價(jià)指標(biāo)則主要采用目標(biāo)檢出率和虛警率來進(jìn)行評(píng)價(jià)。對(duì)于RSHD的實(shí)驗(yàn)部分,本文將考察時(shí)序性特征學(xué)習(xí)與樣本均衡策略對(duì)時(shí)空域目標(biāo)稀疏的雷達(dá)回波檢測(cè)任務(wù)的有效性;對(duì)于RSPD實(shí)驗(yàn)部分,本文將盡可能在模擬雷達(dá)實(shí)際工作的情況下,來驗(yàn)證檢測(cè)模型的性能,并與多種經(jīng)典的CFAR算法進(jìn)行對(duì)比分析。
3.3.1 時(shí)序性表示學(xué)習(xí)消融實(shí)驗(yàn)
為考察時(shí)序性特征學(xué)習(xí)的有效性,基于RSHD分別設(shè)計(jì)兩組實(shí)驗(yàn):(a)無監(jiān)督EchoDarwin的消融實(shí)驗(yàn);(b)無監(jiān)督與有監(jiān)督時(shí)序性特征表示學(xué)習(xí)的對(duì)比實(shí)驗(yàn)。在(a)組中,首先對(duì)EchoDarwin中的歸一化操作TVM和NFM進(jìn)行消融實(shí)驗(yàn)分析,而后在同等實(shí)驗(yàn)條件下比較EchoDarwin與其他不經(jīng)過學(xué)習(xí)的序列表示方法之間的性能差異。
如表3所示,使用TVM歸一化平滑處理后的回波序列作為EchoDarwin的輸入,除了采用Chi-2核函數(shù)作為NFM操作的對(duì)照組之外,檢測(cè)模型能獲取到更好的綜合性能指標(biāo),尤其是在目標(biāo)召回率方面,優(yōu)勢(shì)更為突出;而在Chi-2核函數(shù)的作用下,TVM的優(yōu)勢(shì)并沒有那么突出,這是由于Chi-2核函數(shù)自身可看作兩個(gè)輸入向量的內(nèi)積除以該兩個(gè)向量之和的L1范數(shù),從而也起到了一定的歸一化效果,因而在此種情況下二者相結(jié)合后的優(yōu)勢(shì)就不如其他情況那樣明顯。然而這一對(duì)比結(jié)果也說明了,歸一化平滑處理對(duì)于回波特征學(xué)習(xí)的有效性。而在NFM的對(duì)照實(shí)驗(yàn)可以看出,無論使用哪種非線性核函數(shù),檢測(cè)模型的性能都在各個(gè)方面有了明顯的提升,這也充分地驗(yàn)證了利用更為復(fù)雜的回歸模型來進(jìn)行時(shí)序性特征表示學(xué)習(xí)的有效性,其中使用PosNeg核函數(shù)的EchoDarwin總能在綜合性能上超越其他對(duì)照組。
表3 EchoDarwin+SVM消融實(shí)驗(yàn)結(jié)果Tab.3 Ablation experiment results of EchoDarwin
在(a)組的第2部分實(shí)驗(yàn)中,本文進(jìn)一步考察在時(shí)序關(guān)系依賴下學(xué)習(xí)得出的特征表示與未經(jīng)過學(xué)習(xí)的特征表示對(duì)于檢測(cè)性能的影響。這里選取3種非學(xué)習(xí)的回波表示方法:(1)Temp.Avg-Pooling:在時(shí)間維度(距離向)上將回波子序列求取平均的表示方法;(2)Temp.Max-Pooling:在時(shí)間維度上將回波子序列中最大值進(jìn)行保留的表示方法;(3)Temp.Concatenation:不做任何處理,僅將回波子序列按照時(shí)間維進(jìn)行拼接的表示方法(該種情況就近似退化成了文獻(xiàn)[7]中所提出的方法)。
從表4所示結(jié)果不難看出,經(jīng)過學(xué)習(xí)后的Echo-Darwin明顯可以取得更好的綜合檢測(cè)性能,雖在虛警率與檢測(cè)精度上比Temp.Concatenation要有所下降,但其能保持緊湊的特征維度,這都體現(xiàn)出了時(shí)序性學(xué)習(xí)機(jī)制對(duì)于回波特征表示的有效性。
表4 EchoDarwin與其他非學(xué)習(xí)序列表示的性能對(duì)比結(jié)果Tab.4 Performance comparison between EchoDarwin and other representations of non-learning sequence
在(b)組實(shí)驗(yàn)中,本文考察無監(jiān)督時(shí)序性特征表示與有監(jiān)督時(shí)序性特征表示之間的性能差異,結(jié)果匯總于表5,其中與Bi-LSTM類似,Bi-EchoDarwin表示對(duì)回波序列在正向和反向上都進(jìn)行時(shí)序建模,并將兩個(gè)方向上獲得的時(shí)序性特征進(jìn)行拼接,因此特征維度相比EchoDarwin會(huì)提升2倍。
表5 無監(jiān)督與有監(jiān)督式回波表示學(xué)習(xí)方法檢測(cè)性能對(duì)比Tab.5 Comparison of detection performance between unsupervised and supervised echo representation learning methods
從實(shí)驗(yàn)結(jié)果可以看出,無監(jiān)督和有監(jiān)督學(xué)習(xí)的模型都能以較高的準(zhǔn)確率辨識(shí)出目標(biāo),這也說明時(shí)序關(guān)系的學(xué)習(xí)有助于獲取到有效的雷達(dá)回波特征表示;而相比于僅在前向進(jìn)行時(shí)序關(guān)系提取的模型EchoDarwin、LSTM和GRU來說,其雙向?qū)φ战M模型Bi-EchoDarwin,Bi-LSTM,以及Bi-GRU可以在各個(gè)指標(biāo)上都獲得性能更佳的檢測(cè)結(jié)果,這也說明了在正向反向上都進(jìn)行學(xué)習(xí)可以提升特征表示的豐富度,從而提升檢測(cè)模型的性能。
進(jìn)一步地,整體對(duì)比無監(jiān)督方法與有監(jiān)督方法的各項(xiàng)性能指標(biāo)可看出,有監(jiān)督的深度學(xué)習(xí)方法明顯更具優(yōu)勢(shì),這一方面是由于相比起淺層的機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)方法通常擁有更高的編碼容量,能輕松將數(shù)據(jù)從原始低維空間嵌入至表達(dá)能力更為豐富的高維空間之中;另一方面也是由于其在學(xué)習(xí)時(shí)序依賴關(guān)系的同時(shí)兼顧了目標(biāo)回波與雜波之間的區(qū)分性,即以任務(wù)驅(qū)動(dòng)的方式聯(lián)合學(xué)習(xí)時(shí)序性特征和檢測(cè)模型。而所有模型之中,Bi-LSTM和Bi-GRU能獲得最好的性能,其中前者在召回率(目標(biāo)檢出率)上更具優(yōu)勢(shì),而后者能有更高的檢測(cè)精度,相應(yīng)的虛警率也更低。
最后對(duì)比純Bi-LSTM網(wǎng)絡(luò)與混合式的MLP-LSTM和ConvLSTM,前者由于具有雙層循環(huán)結(jié)構(gòu),因而可以擁有更好的時(shí)序建模能力,進(jìn)而取得更好的性能表現(xiàn)。
盡管無監(jiān)督的EchoDarwin在性能方面表現(xiàn)稍弱,然而由于其本質(zhì)上是一個(gè)淺層的線性回歸模型,相比起LSTM等深度神經(jīng)網(wǎng)絡(luò)來說,它是一種更為輕量化的模型,運(yùn)算資源的耗費(fèi)程度也更少,取得的特征也更為緊湊,在實(shí)時(shí)處理方面更具優(yōu)勢(shì)。而在特征學(xué)習(xí)方面,與帶標(biāo)簽數(shù)據(jù)驅(qū)動(dòng)的LSTM等模型不同,EchoDarwin是一種樣本依賴的方法,其在特征學(xué)習(xí)的過程中不需要遍歷整個(gè)訓(xùn)練集,即是說其不依賴于樣本在數(shù)據(jù)空間中的統(tǒng)計(jì)分布信息,只利用了回波數(shù)據(jù)在時(shí)間維上的偏序關(guān)系這一先驗(yàn)信息,這也使得該模型與數(shù)據(jù)本身的耦合程度更低,應(yīng)用更為靈活。綜合這些優(yōu)勢(shì),EchoDarwin能更容易部署在各種移動(dòng)計(jì)算設(shè)備上,具有一定的實(shí)用價(jià)值。
3.3.2 樣本均衡策略有效性實(shí)驗(yàn)
在本組實(shí)驗(yàn)中,本文固定檢測(cè)方法來考察樣本均衡策略對(duì)檢測(cè)性能的影響。為此,本文按照與RSHD相同的數(shù)據(jù)集設(shè)計(jì)方法生成不同目標(biāo)樣本合成比例下的訓(xùn)練集和測(cè)試集。目標(biāo)樣本合成比例即為表1中的SyncRatio,比例的選取按照200%的遞增速度從0(不使用均衡策略)到1000%(本文推薦比例),如此便得到6組訓(xùn)練/測(cè)試樣本集,表6記錄了6組數(shù)據(jù)集下Bi-EchoDarwin方法的檢測(cè)性能結(jié)果及訓(xùn)練/測(cè)試樣本規(guī)模。
從表6所示結(jié)果不難看出,合成比例為0(即不采用均衡處理)的情況下,檢測(cè)模型雖在正確率和虛警率上取得了最優(yōu)的結(jié)果,但這是由于訓(xùn)練/測(cè)試集中的真實(shí)目標(biāo)樣本極為稀少,導(dǎo)致模型嚴(yán)重向雜波傾斜,將大多數(shù)目標(biāo)樣本錯(cuò)誤地辨識(shí)為雜波,從而產(chǎn)生了最低的目標(biāo)召回率;而在引入均衡策略之后(SycRatio≥200%),目標(biāo)的召回情況有了明顯的好轉(zhuǎn),模型的綜合性能指標(biāo)F值也得到顯著的提升。為更加直觀展現(xiàn)這一趨勢(shì),本文繪制了圖9以展現(xiàn)均衡化策略對(duì)于模型綜合性能的影響。其中,圖9(a)通過平行對(duì)比目標(biāo)召回率和虛警率來顯示模型在不同生成比例下的綜合檢測(cè)性能,不難看出隨著生成比例的增加,召回率和虛警率之差呈現(xiàn)出逐漸增長(zhǎng)的趨勢(shì);而圖9(b)通過觀察F值的變化趨勢(shì)來綜合性地體現(xiàn)檢測(cè)模型性能的變化,可以看出模型的綜合性能會(huì)隨著生成比例的增加而呈現(xiàn)出明顯增長(zhǎng)的趨勢(shì),并在200%和800%處取得較大幅度的提升后,進(jìn)入較為緩慢的增長(zhǎng)狀態(tài)。
圖9 不同目標(biāo)樣本均衡化處理程度對(duì)檢測(cè)性能的影響Fig.9 The target sample scale visualization of target-clutter sample scale balancing
表6 不同目標(biāo)樣本生成比例下Bi-EchoDarwin的檢測(cè)性能結(jié)果Tab.6 Detection performance of Bi-EchoDarwin under different target sample generation ratio
3.3.3 實(shí)測(cè)序貫驗(yàn)證實(shí)驗(yàn)
在本組實(shí)驗(yàn)中,本文利用RSPD驗(yàn)證集來模擬實(shí)際情況下所提方法的有效性,同時(shí)選取4個(gè)常用的CFAR檢測(cè)算法:CA-CFAR,GOCA-CFAR,OSCFAR與SOCA-CFAR進(jìn)行檢測(cè)效果的對(duì)比。為保持公平的原則,CFAR算法的參考單元數(shù)大小與本文所提方法一致,即左右各10個(gè)距離單元,保護(hù)單元左右各1個(gè)距離單元。同時(shí),為盡可能發(fā)揮出各種CFAR算法的性能,虛警概率值Pfa的選取將秉持在有檢出的情況下,虛警預(yù)測(cè)結(jié)果最少的原則,Pfa的選取范圍為1e–3~1e–7。
圖10以極坐標(biāo)的形式繪制了兩種基于回波時(shí)序性特征表示學(xué)習(xí)的檢測(cè)方法Bi-EchoDarwin和Bi-LSTM與4種CFAR算法在其中一個(gè)雷達(dá)掃描周期中的完整檢出結(jié)果。不難看出,在合適的虛警率取值下,各CFAR算法均能對(duì)目標(biāo)進(jìn)行檢出,并且OS-CFAR獲得了最少的虛警結(jié)果,然而這些方法都存在漏檢的情況。而對(duì)于Bi-EchoDarwin與Bi-LSTM來說,二者都取得了更全的目標(biāo)檢出結(jié)果,同時(shí)直觀上看虛警結(jié)果的數(shù)量也處在一個(gè)可接受的范圍(相較于CFAR來說)。
圖10 實(shí)測(cè)序貫驗(yàn)證條件下與多種CFAR方法的檢測(cè)結(jié)果對(duì)比示例圖(一次掃描周期)Fig.10 Example of detection results comparison with CFARs under sequential validation of real-measured data(in one radar scanning cycle)
為更加定量地對(duì)比這些方法的檢出情況,本文統(tǒng)計(jì)了RSPD完整3個(gè)周期的檢出情況,結(jié)果如表7所示。從對(duì)比結(jié)果可以看出,雖然本文所提出的方法不具備CFAR的恒虛警性質(zhì),然而在實(shí)際測(cè)試過程中,他們?cè)跈z后虛警統(tǒng)計(jì)值上與CFAR仍處在同一個(gè)量級(jí),而且同時(shí)還能獲得更全的目標(biāo)檢出效果。進(jìn)一步結(jié)合之前的實(shí)驗(yàn)結(jié)果可以看出,引入合適的表示學(xué)習(xí)機(jī)制和樣本均衡策略,數(shù)據(jù)驅(qū)動(dòng)的方法可以在虛警數(shù)量可接受的范圍內(nèi)取得更好的檢出效果,這些實(shí)驗(yàn)結(jié)果都體現(xiàn)出了本文所提檢測(cè)方法框架的有效性。
表7 所提方法與多種CFAR方法在RSPD下的檢出結(jié)果統(tǒng)計(jì)情況Tab.7 Statistical analysis of detection results of the proposed method and multiple CFAR methods under RSPD
針對(duì)時(shí)空域稀疏條件下的低慢小雷達(dá)目標(biāo)檢測(cè)問題,本文系統(tǒng)性地提出了一種有效的面向回波的目標(biāo)-雜波檢測(cè)方法框架。在經(jīng)典雷達(dá)雜波抑制方法的基礎(chǔ)之上,本文在方法框架中著重強(qiáng)調(diào)了回波表示學(xué)習(xí)和目標(biāo)-雜波樣本均衡策略的重要性。在回波表示學(xué)習(xí)方面,通過充分利用回波自身的時(shí)序依賴關(guān)系約束,本文分別對(duì)無監(jiān)督式和有監(jiān)督式兩種回波時(shí)序性特征表示學(xué)習(xí)問題給出了相應(yīng)的定義和求解方法;在目標(biāo)-雜波樣本均衡策略方面,通過將低慢小雷達(dá)目標(biāo)檢測(cè)問題轉(zhuǎn)化為一種異常事件檢測(cè)問題,本文利用一種基于目標(biāo)樣本鄰域內(nèi)擾動(dòng)的上采樣生成方法克服了檢測(cè)模型的決策偏移問題。此外,為充分驗(yàn)證所提方法的有效性,本文根據(jù)實(shí)測(cè)雷達(dá)回波數(shù)據(jù)分別設(shè)計(jì)了實(shí)測(cè)-生成混檢式的RSHD訓(xùn)練/測(cè)試數(shù)據(jù)集和實(shí)測(cè)序貫回放驗(yàn)證集RSPD。RSHD的實(shí)驗(yàn)結(jié)果表明,相較于忽略表示學(xué)習(xí)的檢測(cè)方法來說,時(shí)序性表示學(xué)習(xí)方法能以更緊湊的回波表示讓檢測(cè)模型取得更好的綜合檢測(cè)性能;在不進(jìn)行均衡處理的情況下,模型會(huì)嚴(yán)重向雜波樣本傾斜,而經(jīng)過樣本均衡處理后,模型的雜波樣本傾斜程度得到了有效的改善,并明顯取得了更高的目標(biāo)召回率和F值。基于RSPD,本文模擬檢測(cè)模型的實(shí)際工作情況,對(duì)所提方法和多種CFAR檢測(cè)方法進(jìn)行了統(tǒng)一的性能對(duì)比評(píng)價(jià),實(shí)驗(yàn)結(jié)果表明所提方法在與CFAR取得相當(dāng)量級(jí)虛警率的同時(shí),還能獲得更全的目標(biāo)檢出效果。
然而,作為數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法,本文所提完整的目標(biāo)檢測(cè)框架仍然未擺脫對(duì)樣本標(biāo)簽的依賴,這使得模型在真正應(yīng)用的過程中,需要提前收集和構(gòu)造攜帶目標(biāo)標(biāo)記的數(shù)據(jù)集,并且在此數(shù)據(jù)集上提前進(jìn)行學(xué)習(xí)和優(yōu)化。從這一點(diǎn)出發(fā),EchoDarwin這種樣本級(jí)別的無監(jiān)督方法雖然在最終檢測(cè)性能上不如有監(jiān)督式的回波時(shí)序性特征表示學(xué)習(xí)方法,但由于其在特征表示學(xué)習(xí)方面無需樣本類別標(biāo)簽進(jìn)行監(jiān)督,因此在實(shí)際應(yīng)用方面具備更加靈活的特性。因此,未來也有必要在EchoDarwin的基礎(chǔ)上,進(jìn)一步考慮如何將無監(jiān)督的思想也引入檢測(cè)模型,從而使完整的目標(biāo)檢測(cè)框架擺脫對(duì)標(biāo)簽數(shù)據(jù)的依賴。