劉軍偉,李 川,聶熠文,崔國(guó)龍,汪育苗,徐瑞昆
(1. 中國(guó)電子科技集團(tuán)公司第三十八研究所,安徽合肥 230088; 2. 孔徑陣列與空間探測(cè)安徽省重點(diǎn)實(shí)驗(yàn)室,安徽合肥 230088; 3. 電子科技大學(xué)信息與通信工程學(xué)院,四川成都 611731)
傳統(tǒng)雷達(dá)檢測(cè)技術(shù)主要通過利用回波能量來完成目標(biāo)檢測(cè)。在實(shí)際場(chǎng)景中,雷達(dá)回波不僅包含目標(biāo)信息,還包含諸如地雜波、海雜波、干擾等雜波及背景信息。傳統(tǒng)的恒虛警檢測(cè)(Constant False Alarm Rate,CFAR)方法[1-3]使用一個(gè)電平由雜波和雷達(dá)回波附近的噪聲決定的自適應(yīng)門限值來發(fā)現(xiàn)回波中的目標(biāo)。根據(jù)紐曼-皮爾遜準(zhǔn)則,在保證虛警率下,CFAR可檢測(cè)到目標(biāo)的信噪比需大于12.8 dB。由于可用于參考的單元環(huán)境有限,且受到時(shí)間、空間、頻率、功率、波形、極化、算力等資源的限制,最終捕獲的雷達(dá)目標(biāo)信號(hào)能量未必能超過門限,對(duì)于微弱目標(biāo)容易造成漏警/虛警。此外,傳統(tǒng)的目標(biāo)檢測(cè)方法本質(zhì)上是對(duì)回波信號(hào)進(jìn)行統(tǒng)計(jì)分析,提取具有代表性的統(tǒng)計(jì)特征,通過對(duì)統(tǒng)計(jì)特征的判斷實(shí)現(xiàn)對(duì)目標(biāo)的檢測(cè)。但在實(shí)際應(yīng)用中,地物雜波與目標(biāo)所處環(huán)境緊密相關(guān),沙漠、海洋、高原等不同地形下雜波分布存在差異,城市、郊區(qū)等不同環(huán)境下雜波分布也不相同,森林、草原等不同植被條件下的雜波情況也各有差異,甚至不同天氣環(huán)境下雜波的分布也不盡相同。因此根據(jù)環(huán)境提供差異化、符合環(huán)境雜波特性的目標(biāo)檢測(cè)方法,對(duì)于在不同環(huán)境下及時(shí)準(zhǔn)確地發(fā)現(xiàn)雷達(dá)目標(biāo)具有重要意義。
深度學(xué)習(xí)[4-8]是機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)新的研究方向。2012年基于深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)的深度卷積神經(jīng)網(wǎng)絡(luò)AlexNet在ImageNet大規(guī)模視覺識(shí)別挑戰(zhàn)賽獲得冠軍,自此基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法逐漸走入研究人員的視野。目前深度學(xué)習(xí)也被廣泛應(yīng)用到目標(biāo)檢測(cè)中,如在沙漠環(huán)境下的SAR圖像目標(biāo)檢測(cè)[9]、基于卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像車輛[10]、飛機(jī)[11]等目標(biāo)的檢測(cè)。
基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法可分為兩類,一類為基于候選區(qū)域方式,另一類為基于端到端[12]方式。基于候選區(qū)域的方式,目標(biāo)所在區(qū)域會(huì)被作為候選窗,從候選窗中提取特征,神經(jīng)網(wǎng)絡(luò)模型依據(jù)提取出的特征再去判斷區(qū)域中是否有目標(biāo)。這種方法可以有效減少人工判斷目標(biāo)特征的工作量,且可發(fā)現(xiàn)利用一些并不直接可視的特征,提高目標(biāo)發(fā)現(xiàn)概率,但候選窗產(chǎn)生和特征提取分類步驟分離,難以實(shí)現(xiàn)工程實(shí)時(shí)性要求。另一種基于端到端的方式相比于候選區(qū)域方式則犧牲一定檢測(cè)精度換取工程化應(yīng)用的實(shí)時(shí)性。
針對(duì)環(huán)境多樣性造成的雜波分布差異性,本文提出一種利用條件生成對(duì)抗網(wǎng)絡(luò)(Conditional Generative Adversarial Nets,CGAN)建立的距離-多普勒(Range-Doppler,RD)域雜波抑制處理方法,對(duì)抗式訓(xùn)練一種可以從帶有雜波干擾的復(fù)雜分布中找到感興趣目標(biāo)的生成模型,從而達(dá)到抑制雜波干擾,提升目標(biāo)信噪比的目的。
雜波抑制的目的是保留目標(biāo)的同時(shí)消除雜波干擾,從另一理想角度來說是從干擾雜波中提取感興趣目標(biāo)的過程。在不發(fā)生突變的環(huán)境下,感興趣目標(biāo)往往處于特定分布上,而雷達(dá)采集到的回波數(shù)據(jù)處于另一種復(fù)雜高維分布,其中隱藏著感興趣目標(biāo)的分布,我們的目的就是利用CGAN網(wǎng)絡(luò)在高維空間的復(fù)雜雜波分布中找到目標(biāo)的特定分布并將其提取放大,從而檢測(cè)。
CGAN的訓(xùn)練并不是隨機(jī)生成,而是一一對(duì)應(yīng)進(jìn)行生成,因此考慮采用圖像解譯的思想,結(jié)合感興趣目標(biāo)的分布作為生成與對(duì)抗中的監(jiān)督信息輔助提取。若環(huán)境發(fā)生變化,通過網(wǎng)絡(luò)模型的再訓(xùn)練來學(xué)習(xí)這種變化,從而達(dá)到對(duì)環(huán)境變化的及時(shí)響應(yīng),保證目標(biāo)檢測(cè)效果。
生成對(duì)抗網(wǎng)絡(luò)是一種無(wú)監(jiān)督學(xué)習(xí)方法,包含生成模型(Generator,G)和判決模型(Discriminator,D)兩個(gè)組成模塊,在相互博弈學(xué)習(xí)中獲得優(yōu)化的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)。通過對(duì)每個(gè)小區(qū)域進(jìn)行差別判別,實(shí)現(xiàn)對(duì)局部特征的提取和表征,之后在對(duì)抗過程中將局部特征與整體特征相融合,不斷迭代。
如圖1所示,首先以少量有標(biāo)簽時(shí)域雜波/干擾抑制后的距離像作為雜波抑制模塊的輸入,順序使用傳統(tǒng)雷達(dá)目標(biāo)檢測(cè)跟蹤方法中的動(dòng)目標(biāo)顯示(Moving Target Indication,MTI)和動(dòng)目標(biāo)檢測(cè)(Moving Target Detection,MTD)進(jìn)行處理,得到RD矩陣;后將二維RD矩陣輸入生成對(duì)抗網(wǎng)絡(luò)進(jìn)行對(duì)抗訓(xùn)練;待結(jié)果收斂,輸出雜波抑制后的RD矩陣以及此時(shí)訓(xùn)練所得的生成對(duì)抗網(wǎng)絡(luò)模型參數(shù)。
圖1 RD域雜波抑制網(wǎng)絡(luò)訓(xùn)練過程
以距離像的二維矩陣為輸入,每一行都對(duì)應(yīng)于對(duì)一個(gè)脈沖回波的連續(xù)采樣,即連續(xù)的距離單元。行中的每一個(gè)元素都是一個(gè)復(fù)數(shù),代表一個(gè)距離單元的I通道分量以及Q通道分量,每一列代表對(duì)同一距離單元的多個(gè)脈沖測(cè)量。MTI是對(duì)矩陣的列數(shù)據(jù)(同一距離單元的數(shù)據(jù))進(jìn)行操作。當(dāng)固定目標(biāo)、地雜波等與運(yùn)動(dòng)目標(biāo)處于同一距離單元時(shí),因固定目標(biāo)回波中的多普勒頻率為零。因此,若將同一距離單元在相鄰脈沖中作相減運(yùn)算,則運(yùn)動(dòng)目標(biāo)回波得以保留,可以除去零頻附近的雜波和靜止的目標(biāo)。
由于雷達(dá)數(shù)據(jù)為非均勻脈沖重復(fù)間隔(Pulse Repetition Interval,PRI),所以無(wú)法對(duì)二維矩陣中列數(shù)據(jù)作傅里葉變換。目標(biāo)所在距離單元的慢時(shí)域回波向量如式(1)所示:
gr=[ej2πfdt1,ej2πfdt2,…,ej2πfdtN]T
(1)
因此采取利用非均勻離散傅里葉變換(Non-Uniform Discrete Fourier Transform,NUDFT)濾波器對(duì)目標(biāo)回波的相位進(jìn)行相參積累。經(jīng)過NUDFT處理后的數(shù)據(jù)依然為一個(gè)二維矩陣,輸入MTI進(jìn)行處理。NUDFT濾波器矩陣如式(2)所示:
(2)
慢時(shí)域回波信號(hào)經(jīng)過NUDFT積累后,目標(biāo)所在距離單元的多普勒電平可表示為
(3)
式中,fi(i=1,2,…,N)表示多普勒域的采樣頻點(diǎn),當(dāng)fd=fi時(shí),相參積累增益達(dá)到最大,最大值為1。經(jīng)過數(shù)據(jù)預(yù)處理可得到兩類數(shù)據(jù)樣本,并分別按一定比例劃入訓(xùn)練集和測(cè)試集。
有標(biāo)簽的一維距離像和理想一維距離像為網(wǎng)絡(luò)訓(xùn)練的輸入,其中第二類數(shù)據(jù)為引導(dǎo)信息,引導(dǎo)生成模型將第一類數(shù)據(jù)朝著理想數(shù)據(jù)去生成。生成模型給判決模型輸送包含雜波干擾的樣本,判決模型識(shí)別雜波條件下的樣本和僅有目標(biāo)存在的樣本及不匹配樣本。生成的數(shù)據(jù)通過判別模型去判別與理想數(shù)據(jù)的差異,結(jié)果反饋給生成模型;生成模型再依據(jù)差異去處理包含干擾的數(shù)據(jù)。生成模型和判別模型不斷運(yùn)轉(zhuǎn)和對(duì)抗,直到判別模型無(wú)法判別生成的數(shù)據(jù)是否是理想數(shù)據(jù),即生成數(shù)據(jù)已經(jīng)十分逼近理想數(shù)據(jù),此時(shí)輸出生成器模型參數(shù)。通過生成模型與判決模型的對(duì)抗過程,CGAN在保留目標(biāo)的同時(shí)去除雜波干擾。其訓(xùn)練過程如圖2所示。
圖2 模型訓(xùn)練過程
CGAN在生成模型和判決模型中均使用目標(biāo)信息標(biāo)簽進(jìn)行訓(xùn)練,不僅能產(chǎn)生僅有目標(biāo)存在的特定標(biāo)簽的數(shù)據(jù),還能夠提高生成的雜波抑制后數(shù)據(jù)的質(zhì)量。訓(xùn)練過程中,CGAN優(yōu)化函數(shù)由兩部分組成,分別為條件生成對(duì)抗網(wǎng)絡(luò)的誤差函數(shù)LCGAN(G,D)和生成器判別誤差函數(shù)L1(G)組成,兩者按照參數(shù)λ進(jìn)行權(quán)重分配:
(4)
條件生成對(duì)抗網(wǎng)絡(luò)的誤差函數(shù)和生成器判別誤差函數(shù)分別為
LCGAN(G,D)=Ey[logD(y)]+
Ex,z[log(1-D(G(x,z)))]
(5)
L1(G)=Ex,y,z[‖y-G(x,z)‖1]
(6)
式中,y表示指導(dǎo)信息,z表示條件信息,x表示生成信息。
利用訓(xùn)練好的模型對(duì)在線采集的數(shù)據(jù)進(jìn)行雜波/干擾抑制。根據(jù)模型在大量無(wú)標(biāo)簽基帶雷達(dá)回波數(shù)據(jù)上的表現(xiàn),分析該雜波抑制網(wǎng)絡(luò)的泛化性能。經(jīng)過該條件生成網(wǎng)絡(luò)處理后,目標(biāo)信息在RD域的雜波和干擾得到一定程度的抑制,最終得到RD域雜波/干擾抑制后結(jié)果。將該結(jié)果作為目標(biāo)檢測(cè)網(wǎng)絡(luò)的輸入,進(jìn)而實(shí)現(xiàn)目標(biāo)檢測(cè)的目的。測(cè)試過程如圖3所示。
圖3 模型測(cè)試過程
為了驗(yàn)證基于條件生成對(duì)抗網(wǎng)絡(luò)的RD域雜波抑制網(wǎng)絡(luò)可行性,通過仿真雷達(dá)實(shí)際波形,并分別添加切片(Chopping Interleaving,CI)、彌散頻譜(Smeared Spectrum,SMSP)干擾、瑞利分布雜波和高斯白噪聲來模擬真實(shí)數(shù)據(jù)中某一個(gè)波束的回波數(shù)據(jù);將進(jìn)行預(yù)處理后得到的RD圖送入CGAN網(wǎng)絡(luò)進(jìn)行雜波/干擾抑制,比對(duì)抑制效果,證明基于條件生成對(duì)抗網(wǎng)絡(luò)的RD域雜波/干擾抑制網(wǎng)絡(luò)可行性。
為模擬復(fù)雜電磁環(huán)境,本實(shí)驗(yàn)選取新式靈巧CI和SMSP干擾。首先產(chǎn)生CI干擾,使用一等間距的矩形脈沖串對(duì)信號(hào)采樣,并將采樣后的信號(hào)復(fù)制到相鄰的間隙中,直到間隙被填充滿。SMSP干擾產(chǎn)生是利用信號(hào)載頻在脈沖寬度內(nèi)隨時(shí)間線性變化這一規(guī)律產(chǎn)生的。先對(duì)原始信號(hào)在時(shí)域上采樣,再將時(shí)鐘頻率提高到原來的n倍,對(duì)采樣數(shù)據(jù)進(jìn)行抽取并按原順序進(jìn)行排序,然后對(duì)排序后的信號(hào)復(fù)制n次,便可產(chǎn)生SMSP干擾。
在雷達(dá)可分辨范圍內(nèi),當(dāng)散射體的數(shù)目很多時(shí),如氣象雜波、箔條干擾等,根據(jù)散射體反射信號(hào)振幅和相位的隨機(jī)特性,它們合成的回波包絡(luò)振幅服從瑞利分布。因此我們采用瑞利分布來模擬雜波分布。瑞利分布的概率密度函數(shù)為
(7)
高斯白噪聲能部分反映雷達(dá)通道中的噪聲情況,故噪聲樣式使用高斯白噪聲。高斯白噪聲的概率分布為高斯分布,其二階矩不相關(guān)而一階矩為常數(shù),高斯分布的一維概率密度函數(shù)可表示為
(8)
通過預(yù)處理可以獲得兩類目標(biāo)參數(shù)完全一致的數(shù)據(jù),第一類數(shù)據(jù)為包含噪聲/干擾/雜波有標(biāo)簽RD圖,第二類數(shù)據(jù)為理想環(huán)境下目標(biāo)RD圖。實(shí)驗(yàn)分為訓(xùn)練模型和測(cè)試模型,其中訓(xùn)練集包含600個(gè)樣本,進(jìn)行200輪迭代訓(xùn)練;測(cè)試集包含 8 000個(gè)樣本,進(jìn)行驗(yàn)證。
存在噪聲時(shí),基于條件生成對(duì)抗網(wǎng)絡(luò)的雜波抑制RD圖距離維對(duì)比效果如圖4所示。圖中縱坐標(biāo)為各距離段上的目標(biāo)值除以整個(gè)距離段上目標(biāo)最大值的歸一化結(jié)果。
圖4 高斯白噪聲模式下效果
存在瑞利分布雜波時(shí),基于條件生成對(duì)抗網(wǎng)絡(luò)的雜波抑制的RD圖距離維效果如圖5所示。圖中縱坐標(biāo)為各距離段上的目標(biāo)值除以整個(gè)距離段上目標(biāo)最大值的歸一化結(jié)果。
圖5 瑞利分布雜波環(huán)境下效果
從圖4、圖5可知,本方法在對(duì)于雜波和噪聲的抑制效果較為明顯,相同虛警率下等效檢測(cè)門限下降3.2 dB,雜波抑制效果明顯,有效突出目標(biāo)。
存在CI干擾和SMSP干擾時(shí),基于條件生成對(duì)抗網(wǎng)絡(luò)的雜波抑制效果分別如圖6和圖7所示。與原本RD圖相比,經(jīng)CGAN網(wǎng)絡(luò)處理后的RD圖干擾信號(hào)幾乎清除干凈,目標(biāo)信號(hào)明顯,說明本方法對(duì)于CI、SMSP干擾抑制效果顯著。
圖6 CI干擾環(huán)境下效果
圖7 SMSP干擾環(huán)境下效果
上述實(shí)驗(yàn)數(shù)據(jù)表明,在新型靈巧CI和SMSP干擾、瑞利分布雜波、噪聲存在的情況下,經(jīng)過CGAN網(wǎng)絡(luò)雜波抑制,目標(biāo)信息均可得到有效增強(qiáng),本方法的可行性和效果可得到驗(yàn)證。此外通過對(duì)雜波抑制后輸出點(diǎn)跡的統(tǒng)計(jì),與恒虛警檢測(cè)方法相比,點(diǎn)跡數(shù)減少32.3%,本方法可有效減少雜波點(diǎn)數(shù)目。
針對(duì)傳統(tǒng)目標(biāo)檢測(cè)恒虛警方法對(duì)雷達(dá)微弱目標(biāo)檢測(cè)性能的限制,本文提出了一種基于條件生成對(duì)抗網(wǎng)絡(luò)的RD域雜波抑制方法。對(duì)雷達(dá)回波數(shù)據(jù)的實(shí)驗(yàn)表明,本文方法可避開12.8 dB的限制,在抑制雜波和噪聲,提升目標(biāo)信號(hào)顯著度方面具有良好性能,為改善雷達(dá)雜波抑制和目標(biāo)檢測(cè)效果提供新的可行途徑。