李忠媛,鮮 果,龔曉峰,雒瑞森
(1.四川大學(xué) 電氣工程學(xué)院,成都 610065;2.成都大公博創(chuàng)信息技術(shù)有限公司,成都 610065)
雷達(dá)信號的脈沖重復(fù)間隔(Pulse Repetition Interval,PRI)指輻射源發(fā)射脈沖的重復(fù)時(shí)間間隔,是用于雷達(dá)輻射源型號識別和雷達(dá)工作狀態(tài)估計(jì)的主要參數(shù)。它具有多種模式,與雷達(dá)工作性能、工作體制有著直接密切的關(guān)系[1]。開展PRI調(diào)制模式識別對于雷達(dá)輻射源識別及威脅分析具有重要意義。
PRI調(diào)制模式的傳統(tǒng)識別方法主要是直方圖法[2-3]、PRI變換法[4]以及基于它們的變式[5-9]。這些方法通過脈沖分布數(shù)量統(tǒng)計(jì)或結(jié)合其他手工提取的特征,可以實(shí)現(xiàn)簡單體制雷達(dá)的分類識別。對于復(fù)雜PRI調(diào)制識別,由于深度學(xué)習(xí)在圖像、文本分類識別方面的有效性[10],近年來許多學(xué)者也將神經(jīng)網(wǎng)絡(luò)運(yùn)用到該問題上。Liu等人[11]利用多層神經(jīng)網(wǎng)絡(luò)對四種PRI調(diào)制進(jìn)行分類,但需要手動(dòng)提取PRI序列相關(guān)特征。Feng等人[12]設(shè)計(jì)了一種帶有向量化嵌入和壓縮-激勵(lì)注意力機(jī)制的多尺度卷積塊來進(jìn)行特征提取,然后利用網(wǎng)絡(luò)層進(jìn)行分類識別。這類方法主要集中在特征提取上,并不是利用PRI序列本身規(guī)律進(jìn)行分選。
在現(xiàn)代電磁環(huán)境中,受復(fù)雜信號環(huán)境接收脈沖發(fā)生碰撞、接收條件的限制(雷達(dá)天線旋轉(zhuǎn)掃描)以及低截獲概率技術(shù)的發(fā)展等影響,大量雷達(dá)脈沖無法被接收,丟失脈沖率高,導(dǎo)致分選出的PRI序列規(guī)律性被破壞,現(xiàn)有PRI識別方法準(zhǔn)確率不足。當(dāng)前研究人員也對脈沖高丟失率情況下的PRI識別進(jìn)行了一些有益的探討。Li等人[13]通過搭建卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了7種PRI調(diào)制類型的自動(dòng)識別,在脈沖缺失率50%條件下能達(dá)到96%的識別精度。孟等人[14]考慮到PRI是時(shí)序數(shù)據(jù),利用均值替換法對數(shù)據(jù)進(jìn)行預(yù)處理后,采用長短時(shí)記憶網(wǎng)絡(luò)對不同體制雷達(dá)進(jìn)行分類識別,在脈沖丟失率不大于30%時(shí)能實(shí)現(xiàn)較好的識別效果。另外,深度自編碼器(Deep Auto-Encoding,DAE)[15]、全卷積深度學(xué)習(xí)網(wǎng)絡(luò)(Fully Convolutional Network,FCN)[16]也被用于PRI調(diào)制模式識別。上述方法無需手動(dòng)提取特征,提供“端對端”的識別過程,但都是通過大量數(shù)據(jù)進(jìn)行模型訓(xùn)練以提高分類精度,對脈沖丟失情況數(shù)據(jù)未做分析處理。
考慮到脈沖丟失率過大時(shí)對識別效果的不利影響,本文從另一個(gè)角度——缺失數(shù)據(jù)補(bǔ)全角度出發(fā),探索了基于深度學(xué)習(xí)的數(shù)據(jù)補(bǔ)全方法[17-18]。GAIN(Generative Adversarial Imputation Nets)是基于生成式對抗網(wǎng)絡(luò)的序列補(bǔ)全方法,在多領(lǐng)域數(shù)據(jù)集上獲得了良好的補(bǔ)全效果[18]。本文通過GAIN對有缺失數(shù)據(jù)的PRI序列實(shí)現(xiàn)還原,恢復(fù)不同體制PRI變化規(guī)律,同時(shí)結(jié)合PRI序列本質(zhì)是一維時(shí)間序列的特征,利用長短期記憶(Long Short Term Memory,LSTM)網(wǎng)絡(luò)對補(bǔ)全時(shí)序數(shù)據(jù)進(jìn)行分類識別。由此搭建的GAIN-LSTM網(wǎng)絡(luò)架構(gòu),通過對PRI序列進(jìn)行特征自動(dòng)提取,實(shí)現(xiàn)PRI還原和識別功能。仿真生成了多種調(diào)制類型的樣本集,測試了脈沖丟失數(shù)據(jù)補(bǔ)全效果以及在不同條件下的PRI模式識別性能,為該方法進(jìn)一步研究和工程應(yīng)用提供了有益參考。
接收機(jī)截獲雷達(dá)輻射源脈沖信號,相鄰脈沖到達(dá)時(shí)間的間隔即是脈沖重復(fù)間隔,用函數(shù)定義如下:
P={p1,p2,…,pN},pi=ti+1-ti
(1)
式中:{ti,i=1,2,…,N+1}是雷達(dá)脈沖流中各個(gè)脈沖的到達(dá)時(shí)間,N+1為當(dāng)前所分析雷達(dá)脈沖串中所包含的雷達(dá)脈沖個(gè)數(shù)。
雷達(dá)輻射源根據(jù)任務(wù)需求,通過調(diào)整PRI變換規(guī)律實(shí)現(xiàn)不同的功能模式[20]。表1描述了6種典型雷達(dá)輻射源PRI調(diào)制類型的PRI變化規(guī)律和相關(guān)應(yīng)用場景。
表1 典型雷達(dá)輻射源PRI調(diào)制類型及應(yīng)用場景[19]Tab.1 Typical PRI modulation types and application scenarios
圖1展示了不同脈沖重復(fù)間隔調(diào)制模式序列的PRI分布圖,橫坐標(biāo)表示PRI序列個(gè)數(shù),此處展示PRI序列長度為50,縱坐標(biāo)為PRI歸一化值。圖1(a)是理想情況下PRI分布圖,可見在完整偵收雷達(dá)脈沖的情況下,PRI分布完全符合PRI調(diào)制規(guī)律。然而,受復(fù)雜電磁環(huán)境和接收設(shè)備本身的影響,雷達(dá)偵察機(jī)接收到的輻射源脈沖是各種輻射源和隨機(jī)噪聲信號相互交疊的混疊脈沖流,且接收過程中常出現(xiàn)丟失脈沖的現(xiàn)象,分選后雷達(dá)PRI變化規(guī)律被破壞,圖1(b)展示了實(shí)際情況下PRI分布情況。我們的目的在于還原這些因脈沖丟失導(dǎo)致的錯(cuò)誤PRI值,進(jìn)而完成PRI調(diào)制模式識別。
圖1 不同PRI調(diào)制模式雷達(dá)信號的PRI分布Fig.1 Distribution of PRI in different modulation modes
圖2 基于GAIN-LSTM的PRI序列還原及體制識別架構(gòu)Fig.2 PRI sequence restoration and modulation modes recognition architecture based on GAIN-LSTM
基于雷達(dá)脈沖流的到達(dá)時(shí)間(Time of Arrival,TOA)序列,由式(1)求取一階差分獲取PRI時(shí),如果發(fā)生脈沖丟失,相應(yīng)就會(huì)產(chǎn)生數(shù)值增加的虛假PRI值,即異常值,多個(gè)脈沖連續(xù)丟失,導(dǎo)致虛假PRI值成倍增加,原有PRI變化規(guī)律就被嚴(yán)重破壞。通常采用的虛假PRI異常值處理方法是用均值替代[14]。本文通過均值比較檢索PRI異常值,并通過填充“*”的方式標(biāo)記PRI待補(bǔ)全位置,公式描述如下:
(2)
式中:N表示處理脈沖段PRI總數(shù)量數(shù),如果當(dāng)前PRI值大于前后PRI值均值(k=1),認(rèn)為此處漏掉一個(gè)脈沖,用“*”補(bǔ)該位置空缺;如果大于均值2倍(k=2),認(rèn)為此處漏掉兩個(gè)脈沖,相應(yīng)地在此處填補(bǔ)兩個(gè)“*”。以此類推。
經(jīng)上述處理獲取輸入原始向量X,表征PRI序列,缺失值位置已用‘*’標(biāo)記。根據(jù)X生成對應(yīng)掩碼向量M={mi},M為二值矩陣,真實(shí)值位置為1,缺失值位置為0。定義新向量Z,大小等同X,在缺失值位置隨機(jī)生成噪聲作為填充,相當(dāng)于初始化。
整體網(wǎng)絡(luò)包括生成器(Generator,G)、判別器(Discriminator,D)、提示機(jī)制(Hint,H)三部分。G通過觀察真實(shí)數(shù)據(jù)的分布和內(nèi)部聯(lián)系,根據(jù)觀察結(jié)果填補(bǔ)缺失的部分,輸出一個(gè)填補(bǔ)后完整的向量并送入到D。D需要判斷接收向量中,哪一部分是真實(shí)數(shù)據(jù),哪一部分是填補(bǔ)的。D最小化分類誤差率,而G要最大化判別器的分類誤差率,這樣兩者就處在了一種相互對抗的過程中。為了使該對抗過程得到更加理想的結(jié)果,添加了提示機(jī)制H,它揭示了原始數(shù)據(jù)中缺失部分的某些信息,讓D更加關(guān)注它所提示的部分,同時(shí)也使G生成更加接近真實(shí)分布的填補(bǔ)數(shù)據(jù)。具體介紹如下。
2.3.1 生成器G
(3)
(4)
2.3.2 判別器D
判別器D被用作對手訓(xùn)練生成器G。不同于標(biāo)準(zhǔn)生成對抗網(wǎng)絡(luò),這里的判別器D判斷輸入向量中哪些部分是真實(shí)的,哪些部分是估算生成的,這相當(dāng)于預(yù)測掩碼向量,其輸出的值意味著預(yù)測該值是原始真實(shí)值的概率。在圖2右側(cè),判別器的輸出與掩碼向量的交叉熵?fù)p失同時(shí)作用于生成器G和判別器D。
2.3.3 提示機(jī)制H
提示機(jī)制是一個(gè)隨機(jī)變量H,H中的元素h依賴于分布H|M=m,其與生成向量橫向結(jié)合后輸入到D中,用以提示D更需要關(guān)注的部分,強(qiáng)化了G和D的對抗過程。
2.3.4 優(yōu)化目標(biāo)
類似于生成對抗網(wǎng)絡(luò),通過最大化正確預(yù)測M的概率來訓(xùn)練D,通過最小化D能正確預(yù)測M的概率來訓(xùn)練G,定義如下的評估函數(shù):
(5)
因此GAIN的目標(biāo)就是
(6)
因?yàn)閷τ谂袆e器來說就是一個(gè)簡單的二分類問題,所以這里就使用交叉熵來定義損失函數(shù),如下所示:
L(a,b)=ailgbi+(1-ai)lg(1-bi)
(7)
(8)
訓(xùn)練過程中固定一方,更新另一個(gè)網(wǎng)絡(luò)的參數(shù),交替迭代,使得對方的錯(cuò)誤最大化,最終G能根據(jù)學(xué)習(xí)到的數(shù)據(jù)分布規(guī)律估算出更合理的缺失值。
GAIN網(wǎng)絡(luò)對雷達(dá)PRI序列缺失位置填補(bǔ)后生成向量是LSTM識別網(wǎng)絡(luò)的輸入,設(shè)輸入向量長度為N。如圖3所示,輸入至LSTM單元構(gòu)成的隱藏層神經(jīng)網(wǎng)絡(luò),最后一個(gè)LSTM單元的輸出作為輸出層的輸入,輸出層輸出結(jié)果反向傳播至隱藏層進(jìn)行網(wǎng)絡(luò)訓(xùn)練。具體介紹如下。
圖3 基于LSTM的雷達(dá)PRI序列識別網(wǎng)絡(luò)Fig.3 PRI modulation modes recognition network based on LSTM
2.4.1 隱藏層
各個(gè)PRI值依次輸入N個(gè)LSTM單元。LSTM單元傳遞過程可描述如下:引入輸入門限it、遺忘門限ft、輸出門限ot以及記憶細(xì)胞ct。利用記憶細(xì)胞記錄網(wǎng)絡(luò)的長期狀態(tài),并通過3個(gè)門限對記憶的丟棄、增加以及讀取進(jìn)行控制。3個(gè)門限更新計(jì)算方式表示為
(9)
式中:W和b分別是對應(yīng)的權(quán)重系數(shù)和偏置系數(shù)。每個(gè)LSTM單元接收當(dāng)前輸入xt、前一個(gè)單元的ht-1和ct-1為輸入,即在獲得上一時(shí)刻的單元狀態(tài)的前提下進(jìn)行運(yùn)算,用T代指tanh激活函數(shù),ht和ct更新過程如下:
ct=it·T(xt·Wxg+ht-1·Whg+bg)+ft·ct-1
(10)
ht=ot·tanh(ct)
(11)
2.4.2 輸出層
輸出層由全連接層和softmax層組成,隱藏層的輸出接入全連接層,softmax層輸出分類結(jié)果。本文對6種典型PRI體制進(jìn)行分選識別,標(biāo)簽為6位one-hot編碼,采用softmax函數(shù)結(jié)合交叉熵?fù)p失函數(shù)進(jìn)行單標(biāo)簽分類,通過時(shí)間反向傳播算法對網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
通過深度學(xué)習(xí)平臺tensorflow完成網(wǎng)絡(luò)的搭建。訓(xùn)練和測試網(wǎng)絡(luò)使用服務(wù)器CPU為Intel(R) Core(TM) i5-7500,GPU為NVIDIA GeForce GTX 3070。網(wǎng)絡(luò)訓(xùn)練以損失函數(shù)最小為目標(biāo),利用反向傳播算法不斷迭代更新網(wǎng)絡(luò)參數(shù),得到最終的PRI序列還原和識別網(wǎng)絡(luò)。
雷達(dá)偵察機(jī)實(shí)際接收到的數(shù)據(jù)存在脈沖碰撞和虛假脈沖等問題,通過載頻、脈寬、到達(dá)角等脈內(nèi)參數(shù)進(jìn)行聚類分選得到的雷達(dá)脈沖序列脈沖丟失嚴(yán)重,同時(shí)脈沖數(shù)量不固定,需要對分選后PRI序列樣本進(jìn)行預(yù)處理以適應(yīng)模型輸入。這里根據(jù)表2中仿真生成脈沖數(shù)量不一致的各種PRI體制雷達(dá)脈沖序列,包含不同脈沖丟失率各20萬條樣本。根據(jù)2.2小節(jié)對樣本進(jìn)行待補(bǔ)全位置標(biāo)記操作,獲取原始PRI序列。
表2 仿真數(shù)據(jù)設(shè)置Tab.2 Setting of dataset parameters
因?yàn)樯婕暗酵ㄟ^LSTM對補(bǔ)全PRI的識別過程,送入樣本長度因與LSTM隱藏層包含的時(shí)間迭代單元數(shù)量保持一致,故需要做統(tǒng)一樣本長度處理。設(shè)需要將樣本統(tǒng)一變換為N,對長度為m的PRI序列,m
(12)
樣本標(biāo)簽需要轉(zhuǎn)換成one-hot編碼。
為了驗(yàn)證搭建的GAIN模型對脈沖丟失樣本的PRI序列還原效果,與文獻(xiàn)[16]中自編碼器還原方法進(jìn)行對比實(shí)驗(yàn),使用均方根誤差(Root Mean Square Error,RMSE)為評價(jià)指標(biāo),衡量丟失數(shù)據(jù)部分的重構(gòu)誤差。其計(jì)算公式如下:
(13)
表3記錄了PRI序列長度100、脈沖丟失率30%條件下,分別利用自編碼器和GAIN對PRI序列進(jìn)行還原的效果。對不同PRI調(diào)制模式的仿真數(shù)據(jù)進(jìn)行分層采樣,各模式1萬條共計(jì)6萬條數(shù)據(jù),并隨機(jī)打亂樣本順序,送入GAIN網(wǎng)絡(luò)重構(gòu),進(jìn)行10次實(shí)驗(yàn),取平均結(jié)果。可見,對于不同PRI調(diào)制模式,GAIN都有更好的重構(gòu)效果,而抖動(dòng)、參差、組變由于PRI值的隨機(jī)性,重構(gòu)RMSE相較于其他調(diào)制模式略大一點(diǎn)。圖4展示了10%~80%脈沖丟失率條件下,兩種方法對各類調(diào)制模式的平均重構(gòu)誤差曲線。脈沖丟失率小于60%條件下,GAIN方法重構(gòu)RMSE始終保持在0.04左右,相較于自動(dòng)編碼方法高出10%以上。
圖4 不同脈沖丟失率下重構(gòu)誤差Fig.4 Reconstruction error under different pulse loss rates
表3 GAIN與自編碼器重構(gòu)誤差Tab.3 Comparison of reconstruction errors between GAIN and autoencoder
為了反映模型的準(zhǔn)確性,對PRI序列長度100,30%脈沖丟失率的10萬條包含不同PRI調(diào)制模式的數(shù)據(jù)集,進(jìn)行5折交叉驗(yàn)證,其對應(yīng)測試集的識別率統(tǒng)計(jì)在表4中,可見,各自的識別率保持在同一水平,說明模型是穩(wěn)定的。
表4 5輪訓(xùn)練模型識別率Tab.4 Model accuracy under five rounds of training
為了驗(yàn)證網(wǎng)絡(luò)的識別性能,分別測試不同脈沖丟失率和不同序列長度對模型識別性能的影響。首先,統(tǒng)計(jì)固定序列長度100,10%~80%脈沖丟失率下的各種PRI調(diào)制模式識別結(jié)果,如圖5所示。
圖5 不同脈沖丟失率下GAIN-LSTM網(wǎng)絡(luò)識別率Fig.5 Recognition accuracy of GAIN-LSTM network under different pulse loss rates
由圖5可見,所提方法對各種PRI調(diào)制模式識別率均保持在較高水平,在脈沖丟失率超過50%時(shí),識別率隨丟失率增大而下降且下降速度加快。但脈沖丟失率為70%時(shí),對各種PRI調(diào)制模式識別率仍都在95%以上,這說明脈沖丟失極為顯著情況下,所提序列還原再識別方法具有可靠的識別效果。
圖6展示了固定脈沖丟失率30%,不同PRI序列長度下的識別率曲線。在序列長度大于35時(shí),模型平均識別率超過98%;小于35時(shí),組變、參差調(diào)制模式識別率下降,周期、滑變模式識別率也略微下降,這是由于序列長度過短且存在30%的脈沖丟失率時(shí),這幾類長周期變化規(guī)律難以被學(xué)習(xí)到,導(dǎo)致在序列還原及模式識別時(shí),特征提取不足,對最終識別率造成影響。但值得一提的是,在脈沖丟失率30%,序列長度為20時(shí),所提方法仍有92.2%的平均識別率。
圖6 不同序列長度下GAIN-LSTM網(wǎng)絡(luò)識別率Fig.6 Recognition accuracy of GAIN-LSTM network under different pulse sequence lengths
將所提方法與CNN[13]、DAE[16]、LSTM[14]等當(dāng)前先進(jìn)PRI調(diào)制模式識別模型進(jìn)行對比實(shí)驗(yàn)。同時(shí),為了進(jìn)一步驗(yàn)證GAIN網(wǎng)絡(luò)對PRI序列的還原效果,對GAIN網(wǎng)絡(luò)進(jìn)行還原后的PRI序列,也送入上述各識別模型進(jìn)行還原前后識別效果對比。
圖7繪制了6種模型對各類PRI調(diào)制模式平均識別率曲線,虛線展示了3種識別模型的識別效果,相同顏色的實(shí)線曲線對應(yīng)于加上GAIN序列還原模塊的模型識別效果??梢?添加GAIN還原模塊的模型,其識別率均有所提升,這說明對PRI序列進(jìn)行還原,恢復(fù)其PRI變換規(guī)律,是提升高脈沖丟失率序列分類識別率的有效手段。
圖7 不同脈沖丟失率下不同模型識別率Fig.7 Recognition accuracy of different models under different pulse loss rates
而在所有模型中,其識別率都隨脈沖丟失率增大而有所降低,可見,脈沖丟失對各種直接基于PRI序列的模型識別效果都有直接影響,在脈沖丟失率過大時(shí),現(xiàn)有方法CNN、DAE、LSTM的識別率劇烈下降,藍(lán)色實(shí)線展示的所提方法識別率曲線則平緩得多。本文所提GAIN-LSTM顯著優(yōu)于其他網(wǎng)絡(luò)模型,在脈沖丟失率過大時(shí)優(yōu)勢更為顯著,在脈沖丟失率為70%時(shí)仍有96.33%的平均識別準(zhǔn)確率。
針對常見的由于脈沖碰撞導(dǎo)致的高脈沖丟失率場景,本文提出了一種GAIN-LSTM架構(gòu),通過缺失數(shù)據(jù)補(bǔ)全還原真實(shí)PRI序列,恢復(fù)PRI變化規(guī)律,再由還原后序列進(jìn)行模式識別,對于雷達(dá)脈沖丟失率顯著的PRI調(diào)制模式識別準(zhǔn)確率大大提升?,F(xiàn)代復(fù)雜電磁場景下,常見高密度雷達(dá)脈沖流和多部雷達(dá)輻射源混疊情形,脈沖碰撞和虛假脈沖出現(xiàn)的幾率大幅增加,本文提出的模型可應(yīng)用于上述脈沖丟失率極端場景,恢復(fù)脈沖序列規(guī)律,準(zhǔn)確識別PRI調(diào)制模式。