殷雪鳳,武 斌
(西安電子科技大學(xué)電子工程學(xué)院,陜西西安 710126)
雷達(dá)輻射源識別(REI/RER)技術(shù)是電子戰(zhàn)中至關(guān)重要的一部分,是電子支援措施(ESM)的核心和雷達(dá)對抗系統(tǒng)中的關(guān)鍵技術(shù)[1]。輻射源識別技術(shù)通過從偵察信號中獲取目標(biāo)輻射源的體制、用途、型號等信息,為下一步態(tài)勢估計、威脅估計和決策調(diào)整提供依據(jù)。
在輻射源識別研究的早期,信號穩(wěn)定、調(diào)制簡單,傳統(tǒng)的雷達(dá)輻射源識別方法主要是基于脈沖描述字(PDW)的特征提取方法[2]。但隨著雷達(dá)技術(shù)的發(fā)展,特別是新體制、新用途雷達(dá)的使用,調(diào)制形式變得復(fù)雜,調(diào)制參數(shù)轉(zhuǎn)換越來越快捷,時空領(lǐng)域范圍內(nèi)的雷達(dá)信號交錯,密度增大,傳統(tǒng)雷達(dá)輻射源識別方法不能有效對輻射源進(jìn)行識別[3]。因此,最新的電子戰(zhàn)系統(tǒng)還對雷達(dá)信號的脈內(nèi)特征進(jìn)行分析,不少研究人員在這方面做了大量工作。時頻特征、小波包特征、分?jǐn)?shù)階傅里葉變換域特征和小波脊頻特征等參數(shù)在輻射源識別領(lǐng)域中都取得了不錯的效果[4]。但這些方法都需要人工提取特征,費時費力,而且人為提取的特征在輻射源識別系統(tǒng)中的有效性和普適性還有待深入研究,因此,整個系統(tǒng)對人為因素的依賴太強(qiáng)。
隨著人工智能的發(fā)展,特別是近幾年深度學(xué)習(xí)的崛起,不少專家學(xué)者將深度學(xué)習(xí)模型應(yīng)用于雷達(dá)輻射源識別中,并取得了一定的成果。文獻(xiàn)[5]提出了一種基于深度置信網(wǎng)絡(luò)的識別算法,將信號的時頻圖輸入訓(xùn)練好的深度置信網(wǎng)絡(luò),識別不同調(diào)制信號。文獻(xiàn)[6]對輻射源信號進(jìn)行幅-相二維圖像表征,利用卷積神經(jīng)網(wǎng)絡(luò)對二維圖像進(jìn)行特征提取和分類,實現(xiàn)了對不同調(diào)制信號的分類識別。文獻(xiàn)[4]將輻射源的二維時頻圖用隨機(jī)投影和主成分分析方法進(jìn)行降維,再利用層級編碼器(SAE)模型挖掘時頻圖像的深度聯(lián)合特征,實現(xiàn)對輻射源信號的識別。然而,這些深度學(xué)習(xí)識別算法,需要對信號進(jìn)行處理,變換到時頻域或其他維度,增大了信號處理的復(fù)雜性。
針對以上問題,本文提出一種基于一維卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長短期記憶網(wǎng)絡(luò)(LSTM)的深度學(xué)習(xí)雷達(dá)輻射源識別模型,首先通過一維CNN的局部特征學(xué)習(xí)能力自動提取雷達(dá)信號的局部特征,然后通過LSTM學(xué)習(xí)雷達(dá)輻射源信號序列在整個時間維度上的信息,最后通過全連接層得到樣本數(shù)據(jù)屬于各個輻射源的概率完成分類,實現(xiàn)對原始輻射源時域信號端到端的識別。仿真實驗證明了該方法的有效性。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)常用于計算機(jī)視覺領(lǐng)域,它通過直接與圖像像素進(jìn)行卷積來提取圖像特征[7]。CNN相鄰層的節(jié)點不采用全連接的方式,一般由卷積層和池化層交替級聯(lián)。
卷積層的目的主要是提取輸入的特征值點,通過設(shè)置一個卷積核,然后以一定的步長滑動卷積核,基于卷積核與輸入的卷積,由此得到對應(yīng)的局部特征矩陣。通過采用不同的卷積核與原始輸入進(jìn)行卷積運(yùn)算,即可從不同角度提取輸入的特征。這樣的方式保留了原有輸入特征的順序關(guān)系,同時卷積運(yùn)算特征提取的方式實現(xiàn)了權(quán)值共享,減少了參數(shù)數(shù)量。池化層使用一個過濾器以一定步長對矩陣進(jìn)行掃描,獲取視野域的最大值或平均值,其作用是對卷積層的輸入結(jié)果進(jìn)行采樣,進(jìn)一步壓縮特征圖,實現(xiàn)特征降維,防止過擬合。
長短期記憶網(wǎng)絡(luò)(LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),由Hochreiter等人提出[8],它可以根據(jù)當(dāng)前以及過去較遠(yuǎn)時間的輸入,完成輸出預(yù)測的任務(wù)。
LSTM由遞歸連接的LSTM單元組成,每個LSTM單元結(jié)構(gòu)如圖1所示,分別由遺忘門、輸入門、輸出門組成。首先通過遺忘門σf根據(jù)輸入xt和上一LSTM單元的輸出ht-1對上一時刻的輸入狀態(tài)Ct-1進(jìn)行控制,丟失不重要的信息;然后輸入門的控制信息σj來決定添加有用的信息,得到當(dāng)前狀態(tài)Ct;最后通過遺忘門和輸入門影響輸出門,得到最終輸出ht。其中,tanh為激活函數(shù)對狀態(tài)量和輸入量進(jìn)行縮放。這種結(jié)構(gòu)使網(wǎng)絡(luò)能夠選擇性地記住對輸出重要的信息,遺忘不重要的輸入[9]。
圖1 LSTM單元結(jié)構(gòu)圖
在本文提出的輻射源識別算法中,采集得到的不同調(diào)制方式的帶標(biāo)簽的基帶雷達(dá)輻射源信號,在經(jīng)過z-score標(biāo)準(zhǔn)化預(yù)處理之后,直接輸入搭建好的CNNSLTM深度學(xué)習(xí)模型中,模型通過反向傳播算法調(diào)節(jié)網(wǎng)絡(luò)參數(shù),使網(wǎng)絡(luò)收斂,最終能夠?qū)崿F(xiàn)對不同調(diào)制方式的時域信號進(jìn)行識別。
本文采用的預(yù)處理方式為z-score標(biāo)準(zhǔn)化方法,這是一種在深度學(xué)習(xí)中常用的數(shù)據(jù)處理方法,經(jīng)過處理的數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1,保證不同維度的數(shù)據(jù)具有相同的分布規(guī)模,更有利于網(wǎng)絡(luò)優(yōu)化,能有效縮短訓(xùn)練時間。
設(shè)原始輻射源采樣序列為x=[x1,x2,x3…xN],其中N為采樣點數(shù)。以第i個采樣點為例,標(biāo)準(zhǔn)化之后的采樣值為:
通過以上的標(biāo)準(zhǔn)化處理,使得輸入數(shù)據(jù)分布在較為合理的范圍以內(nèi),有利于減小樣本數(shù)據(jù)間量綱的差異對預(yù)測結(jié)果的影響。
由于雷達(dá)輻射源信號是典型的時間序列數(shù)據(jù),因此本文選用擅長處理時間序列的一維CNN網(wǎng)絡(luò)和LSTM網(wǎng)絡(luò)解決雷達(dá)輻射源識別問題。CNN擅長局部特征的提取,而LSTM則擅長捕獲數(shù)據(jù)時序性,適合處理時間序列。為了更好地提取雷達(dá)輻射源信號的特征,本文將二者結(jié)合,用CNN提取雷達(dá)信號的局部特征,用LSTM挖掘信號整體的關(guān)聯(lián),提取全局特征,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。用3個卷積單元提取輸入信號的局部特征,即短時間內(nèi)各個采樣點之間的關(guān)系;1個LSTM層用于提取較長時間采樣點之間的相關(guān)關(guān)系;最后通過2個全連接層,實現(xiàn)對于不同調(diào)制信號的識別[10]。
圖2 CNN-LSTM網(wǎng)絡(luò)結(jié)構(gòu)示意圖
此處的3個卷積單元的結(jié)構(gòu)相同,都由卷積層、批量歸一化層(BN)、激活層、池化層構(gòu)成,如圖3所示。卷積層計算信號與不同卷積核的卷積,激活層將卷積得到的特征進(jìn)行非線性激活。為了更有利于提取信號的局部特征,每個卷積單元的卷積核大小分別為:4×1、3×1、3×1,較小的卷積核具有更小范圍的感受野,更有利于關(guān)注局部的特征。為了加快網(wǎng)絡(luò)的訓(xùn)練和收斂速度,降低梯度爆炸和梯度消失的情況發(fā)生,防止網(wǎng)絡(luò)過擬合,在對卷積結(jié)果進(jìn)行激活之前,加入了BN層[11]。最后將激活層的輸出輸入池化層進(jìn)行下采樣,對特征進(jìn)行降維,此處池化層采用的池化方式為最大池化,另外,在池化層中為了進(jìn)一步提高模型的泛化能力,還進(jìn)行了Dropout操作。卷積單元這樣的設(shè)置,即保證輸入信號的特征能被有效提取,BN層和池化層的加入也能防止網(wǎng)絡(luò)過擬合,同時提高訓(xùn)練速度。
圖3 卷積單元結(jié)構(gòu)示意圖
LSTM層將卷積單元得到的特征圖進(jìn)行計算,得到特征之間的全局關(guān)系,使得網(wǎng)絡(luò)對于整個采樣時間內(nèi)的采樣值有更加全面的認(rèn)識。通過CNN之后的網(wǎng)絡(luò)輸出不僅數(shù)據(jù)規(guī)模減小,而且時間維度的局部特征更為明顯,這幫助提高了LSTM的訓(xùn)練速度。而LSTM層可以很好地完成時間上的特征提取,更好地發(fā)現(xiàn)時間片間的聯(lián)系,得到更有利于雷達(dá)輻射源識別的特征。最后,網(wǎng)絡(luò)末尾的2個全連接層對LSTM的輸出進(jìn)行處理,實現(xiàn)不同調(diào)制信號的分類識別。整個網(wǎng)絡(luò)部分參數(shù)如表1所示;LSTM輸出節(jié)點數(shù)為64;FC1輸出節(jié)點數(shù)為64,激活函數(shù)為ReLU,Dropout為0.5;FC2輸出節(jié)點數(shù)為6,激活函數(shù)為Softmax。
本文采用的損失函數(shù)為交叉熵函數(shù),這是由于本文研究的雷達(dá)輻射源識別問題屬于機(jī)器學(xué)習(xí)中的多分類問題,采用該函數(shù)更利于網(wǎng)絡(luò)訓(xùn)練。優(yōu)化算法為隨機(jī)梯度下降算法,學(xué)習(xí)率設(shè)置為0.001。訓(xùn)練時批處理的大小為256,每次迭代結(jié)束后檢查驗證集損失值,當(dāng)其連續(xù)多次不再發(fā)生變化,則表明模型參數(shù)訓(xùn)練充分,停止訓(xùn)練,得到訓(xùn)練好的雷達(dá)輻射源識別網(wǎng)絡(luò)模型。
表1 CNN?LSTM網(wǎng)絡(luò)參數(shù)
本文的仿真實驗是在谷歌的Google Colaboratory在線平臺上進(jìn)行的,平臺GPU的型號為Tesla T4,內(nèi)存為12.78 GB,硬盤為40 GB。系統(tǒng)版本為Ubuntu 18.04.3,軟件上用python 3語言在以TensorFlow為后端運(yùn)行的Keras上實現(xiàn)。
實驗中的雷達(dá)輻射源數(shù)據(jù)均是通過Matlab仿真得到,主要包含6類不同的調(diào)制信號,分別為:常規(guī)脈沖信號(CP)、線性調(diào)頻信號(LFM)、非線性余弦調(diào)頻信號(NCFM)、二相編碼壓縮信號(BPSK)、二頻率編碼信號(BFSK)和四頻率編碼信號(QFSK)。為使仿真信號更接近原始雷達(dá)輻射源信號,信號調(diào)制參數(shù)不取固定參數(shù),而是在設(shè)置的參數(shù)值的一定范圍內(nèi)波動,如常規(guī)脈沖信號的載波頻率為200 MHz,實際仿真載波頻率值在(190 MHz,210 MHz)區(qū)間內(nèi)均勻分布,具體參數(shù)如表2所示。統(tǒng)一取采樣頻率fs=4 GHz,仿真時長T=1.024 μs,脈寬為τ=1 μs,采樣點數(shù)為4 097個點。其中,BPSK和BFSK采用的編碼方式為11位巴克碼,碼元寬度為0.09 μs;QFSK采用的編碼方式為16位Frank碼,碼元寬度為0.062 5 μs。
為驗證模型的抗噪聲性能,仿真生成了-12~14 dB、步長為2 dB的樣本數(shù)據(jù)。在模型訓(xùn)練階段,每類調(diào)制信號在一種信噪比條件下仿真了500個樣本數(shù)據(jù),設(shè)置6種調(diào)制類型、14個不同的信噪比,共42 000個數(shù)據(jù)作為訓(xùn)練集。在訓(xùn)練時隨機(jī)選用37 800個樣本訓(xùn)練,4 200個樣本用于驗證。另外,生成了每種調(diào)制信號單一信噪比下100個樣本、共8 400個樣本的數(shù)據(jù)集作為測試集,用于測試訓(xùn)練得到的網(wǎng)絡(luò)性能。
表2 不同調(diào)制信號的參數(shù)設(shè)置
本文提出的基于CNN-LSTM深度神經(jīng)網(wǎng)絡(luò)的雷達(dá)輻射源識別模型,在訓(xùn)練集上得到充分訓(xùn)練后,最終在測試集上的平均識別準(zhǔn)確率達(dá)到了91.13%。為了進(jìn)一步探究CNN-LSTM網(wǎng)絡(luò)對不同調(diào)制信號的識別情況,本文分別統(tǒng)計了每種調(diào)制信號在不同信噪比下,樣本的識別正確率,如圖4所示。由圖4可知,在信噪比大于-4 dB時,網(wǎng)絡(luò)對于6種調(diào)制信號的識別正確率都達(dá)到了90%以上;當(dāng)信噪比在4 dB以上時,對于所有調(diào)制信號的識別正確率都達(dá)到了100%,可見,CNN-LSTM網(wǎng)絡(luò)對于不同的調(diào)制信號都有較好的識別效果,具有較好的抗噪聲性能。
圖4 不同信噪比下6種調(diào)制信號識別結(jié)果圖
另外,為了說明LSTM層對于網(wǎng)絡(luò)的影響,在實驗中,設(shè)置了對照實驗,訓(xùn)練了另一個CNN網(wǎng)絡(luò),該網(wǎng)絡(luò)結(jié)構(gòu)將CNN-LSTM網(wǎng)絡(luò)中的LSTM層改成了Flatten層,直接把多維輸入一維化,其他結(jié)構(gòu)和參數(shù)與CNN-LSTM完全相同,以同樣的方式對該網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并在相同的測試集上測試網(wǎng)絡(luò),將其識別結(jié)果與CNN-LSTM網(wǎng)絡(luò)識別結(jié)果進(jìn)行對比。圖5為CNN-LSTM網(wǎng)絡(luò)以及CNN網(wǎng)絡(luò)在不同信噪比下的識別結(jié)果。從圖5中可以看出,在信噪比高于-6 dB的情況下,CNN-LSTM網(wǎng)絡(luò)的識別結(jié)果的正確率都在90%以上;在信噪比高于2 dB之后,該模型的準(zhǔn)確率達(dá)到了100%。相比之下,CNN模型在低信噪比的情況下識別結(jié)果遠(yuǎn)不如CNN-LSTM模型,在信噪比為-8 dB時,識別準(zhǔn)確率就已降到了70%以下。由此可見,CNN-LSTM模型能更有效識別不同調(diào)制信號,具有更好的抗噪聲性能。
圖5 CNN-LSTM與CNN網(wǎng)絡(luò)識別結(jié)果比較
為了進(jìn)一步分析模型識別的準(zhǔn)確性,對識別結(jié)果進(jìn)行了抗混淆性能分析。表3為測試集識別結(jié)果的混淆矩陣,由表3可知,模型對于所有調(diào)制類型的信號識別正確率都能達(dá)到80% 以上。模型對于LFM和QFSK的識別效果最好,識別的正確率達(dá)到了94%以上;不論何種信噪比條件下,模型對于NCFM、BFSK的識別效果也比較好,識別準(zhǔn)確率都達(dá)到了90%以上;但對于BPSK信號的識別效果不佳,僅為81.57%,模型易把BPSK信號錯誤識別成CP信號,而對于CP信號,被錯分成BPSK信號的概率也是最高的。可見,不論對于何種信號,模型的整體識別能力都是不錯的,都達(dá)到了80%以上,但對于CP和BPSK信號的識別能力還有待加強(qiáng)。
表3 CNN?LSTM網(wǎng)絡(luò)輻射源識別混淆矩陣 %
為了研究批處理大小對單個測試信號處理時間的影響,實驗選取設(shè)置不同取值的批量,在不同批處理大小下統(tǒng)計處理單個信號的時間,其中批處理的取值為[2,4,8,…,4 096,8 192]。實驗結(jié)果如圖6所示。由圖6可知,批量大小對單個樣本的測試時間有較大的影響,當(dāng)批處理大小為2時,單個樣本的測試時間約為200 ms,當(dāng)批量大小大于1 024后,單個樣本的測試時間基本穩(wěn)定在3 ms左右。因此,每次將多個測試樣本輸入網(wǎng)絡(luò)能有效降低單個測試信號的處理時間,提高網(wǎng)絡(luò)工作效率。
圖6 不同批處理大小與單個樣本測試時間關(guān)系圖
本文提出了一種基于一維CNN和LSTM的深度學(xué)習(xí)輻射源識別模型,對輻射源時域信號進(jìn)行自動特征提取,實現(xiàn)了對6種不同調(diào)制信號的識別,避免了人工提取特征的困難;另外,本文用LSTM網(wǎng)絡(luò)提取輻射源信號的全局關(guān)系,提高了網(wǎng)絡(luò)的抗噪聲性能。仿真結(jié)果表明,相比于單一CNN網(wǎng)絡(luò),加入LSTM層的網(wǎng)絡(luò)的抗噪聲性能更好,在-6 dB的信噪比條件下,識別的準(zhǔn)確率能達(dá)到90%。CNN-LSTM網(wǎng)絡(luò)從整體來看具有很好的識別效果,但是對于某些特定調(diào)制信號的識別正確率偏低,如常規(guī)脈沖信號。未來的工作將進(jìn)一步改進(jìn)網(wǎng)絡(luò),提高網(wǎng)絡(luò)對于CP信號的識別率。另外,本文發(fā)掘出的LSTM網(wǎng)絡(luò)結(jié)構(gòu)良好的抗噪聲和全局學(xué)習(xí)性能,可以考慮將其應(yīng)用到輻射源識別的其他方面,如雷達(dá)指紋識別等。