鄭博元,叢迅超,胡 超,陳杰梅
(中國西南電子技術(shù)研究所,成都 610036)
輻射源識別是應(yīng)用于電磁管控、航管、軍事等應(yīng)用場景的重要技術(shù)[1]。雷達(dá)輻射源識別技術(shù)主要通過處理雷達(dá)輻射源信號參數(shù)和特征,利用輻射源的特征和分類器來實現(xiàn)輻射源的分類識別[2]。
近年來,基于深度學(xué)習(xí)方法的雷達(dá)輻射源識別任務(wù)的識別效率和準(zhǔn)確度有較大提升[3-6],推動了輻射源信號識別向著流程自動化、功能智能化方向發(fā)展。文獻(xiàn)[7-13]提出的方法主要針對在有標(biāo)簽樣本比較充足條件下的有監(jiān)督學(xué)習(xí)的雷達(dá)輻射源識別,但是實際場景中,由于新體制雷達(dá)變化豐富、電磁環(huán)境擁擠密集、信號易被干擾且難以捕獲等問題,難以收集足量的訓(xùn)練數(shù)據(jù)。曹等人[14]結(jié)合降噪自編碼器和生成對抗網(wǎng)絡(luò)的優(yōu)勢,構(gòu)建噪聲增強網(wǎng)絡(luò)與信號增強網(wǎng)絡(luò)進(jìn)行對抗訓(xùn)練,使網(wǎng)絡(luò)對抗噪聲的能力得到提升。梁[15]提出了一種基于優(yōu)化孿生網(wǎng)絡(luò)模型的方法,用于小樣本輻射源個體識別。該方法通過孿生網(wǎng)絡(luò)構(gòu)建了一個彈簧模型,使得不同類別樣本對特征向量距離增大,相同類別樣本對特征向量距離減小,從而實現(xiàn)小樣本訓(xùn)練損失函數(shù)的快速收斂。Huang等人[16]采用屬于基于度量的元學(xué)習(xí)的原型網(wǎng)絡(luò)(Prototypical Network,PN)來實現(xiàn)小樣本雷達(dá)輻射源信號識別,并提出注意力平衡策略來改進(jìn)元學(xué)習(xí),解決了少量基類引起的判別位置偏差或基類與新類之間存在較大差異的問題。而本文提出了一種基于信號增強與自監(jiān)督學(xué)習(xí)的深度學(xué)習(xí)網(wǎng)絡(luò),通過自編碼器增強信號,同時應(yīng)用自監(jiān)督學(xué)習(xí)增強小樣本情況下的模型特征提取能力。本文主要工作和創(chuàng)新點如下:
一是針對雷達(dá)輻射源信號數(shù)據(jù)實際樣本少的問題,使用4種輻射源信號對輻射源信號數(shù)據(jù)集進(jìn)行了仿真擴充;并且針對復(fù)雜的電磁環(huán)境下雷達(dá)信號受噪聲干擾明顯、脈寬小、脈間間隔大的特點,分別提出了組合使用基于稀疏自編碼器(Sparse Auto Encoder,SAE)的一維雷達(dá)信號序列重構(gòu)和基于降噪自編碼器(Denoising Auto Encode,DAE)的二維圖像去噪處理方法,降低噪聲對后續(xù)算法性能的影響,并以此作為雙流網(wǎng)絡(luò)的兩種輸入。
二是針對小樣本條件下深度學(xué)習(xí)方法泛化能力有限、表征能力不足等問題,設(shè)計了基于自監(jiān)督雙流融合的小樣本識別框架。該框架分別以一維雷達(dá)信號序列和二維圖像作為輸入,使用對比學(xué)習(xí)思想設(shè)計自監(jiān)督代理任務(wù),訓(xùn)練得到具備強表征能力的特征提取器,可通過使用少量標(biāo)記數(shù)據(jù)微調(diào)實現(xiàn)準(zhǔn)確分類。
本文依據(jù)實際信號的射頻參數(shù)、脈間間隔以及脈寬等雷達(dá)參數(shù)設(shè)計4種輻射源信號,并通過仿真生成基于不同調(diào)制方式的一維雷達(dá)信號序列。在此基礎(chǔ)上,為了擴增數(shù)據(jù)集大小,本文設(shè)計了3種信號減損方法。
第一種減損方法是對原始一維雷達(dá)信號序列增加不同信噪比的高斯分布噪聲。高斯噪聲分布為
(1)
式中:μ是均值;σ是標(biāo)準(zhǔn)差。
第二種減損方法采用萊斯多徑衰落,模擬現(xiàn)實環(huán)境中目標(biāo)平臺接收機收到經(jīng)折射、反射和直射等幾條路徑到達(dá)的電磁波產(chǎn)生的多徑效應(yīng)。
(2)
式中:A表示信通增益;Z表示陰影衰落。
第三種方法針對發(fā)射機和接收機的內(nèi)部時鐘源不準(zhǔn)確的問題,設(shè)計時鐘偏移因子,并根據(jù)時鐘偏移因子對每條一維雷達(dá)信號序列增加頻率偏移和采樣率偏移。時鐘偏移因子C定義為
(3)
式中:Δclock表示時鐘變化量。
通過對原始一維雷達(dá)信號序列應(yīng)用以上3種信號減損方法,擴增數(shù)據(jù)集。
同時,為了充分發(fā)揮卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)模型在圖像特征提取方面的優(yōu)勢,需要在預(yù)處理階段將雷達(dá)信號處理為無損且易于卷積計算的數(shù)字圖像。本文采用短時傅里葉變換將信號轉(zhuǎn)換到時頻域,并繪制頻譜圖。連續(xù)短時傅里葉變換定義為
(4)
為解決雷達(dá)信號脈寬小、脈間間隔大導(dǎo)致一維雷達(dá)信號序列稀疏問題,本文提出了一種基于稀疏自編碼器的一維雷達(dá)信號序列處理方法,通過提取稀疏時序數(shù)據(jù)的有效特征,對一維雷達(dá)信號序列進(jìn)行降維處理,生成定長的特征向量。
如圖1(a)所示,稀疏自編碼器的基本模型是由輸入層、隱含層和輸出層三層的神經(jīng)網(wǎng)絡(luò)構(gòu)成,在學(xué)習(xí)時讓網(wǎng)絡(luò)輸出的目標(biāo)值接近于輸入的信號本身,從而學(xué)習(xí)信號中的特征。訓(xùn)練過程中對隱含層進(jìn)行限制,比如減小神經(jīng)元的個數(shù),網(wǎng)絡(luò)被迫壓縮數(shù)據(jù)并嘗試重構(gòu)輸入。通過重構(gòu)的過程,隱含層可以學(xué)習(xí)到輸入信號的有效稀疏特征表示。
圖1 基于自編碼器的數(shù)據(jù)預(yù)處理
使用稀疏自編碼器對仿真的一維雷達(dá)信號序列進(jìn)行重構(gòu)。訓(xùn)練過程中,對隱含層加入懲罰項,進(jìn)行稀疏化處理,以此在隱含層學(xué)習(xí)到輸入數(shù)據(jù)的稀疏特征表示;之后舍棄輸出層,以隱含層輸出的定長特征向量作為數(shù)據(jù)處理后的信號,輸入到深度學(xué)習(xí)模型。
相對于一維雷達(dá)信號序列,二維圖像通常尺寸固定,可以直接送入卷積神經(jīng)網(wǎng)絡(luò)。但在復(fù)雜的電磁環(huán)境中,輻射源信號通常會受到明顯的噪聲干擾,本文提出使用降噪自編碼器對二維圖像進(jìn)行處理,達(dá)到去噪的效果。
基于降噪自編碼器的二維圖像處理方法如圖1(b)所示,將原始一維雷達(dá)信號序列增加三種信號減損后進(jìn)行短時傅里葉變換,生成帶噪聲的二維圖像輸入到DAE網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,此時網(wǎng)絡(luò)隱含層從添加噪聲的圖像中學(xué)習(xí)到數(shù)據(jù)真實的隱藏特征;最后通過輸出層重構(gòu)出純凈的二維圖像,并根據(jù)重構(gòu)出的圖像與原始一維雷達(dá)信號序列生成的二維圖像計算重構(gòu)誤差,返回更新DAE網(wǎng)絡(luò)。因此,DAE網(wǎng)絡(luò)能夠在噪聲干擾的環(huán)境下輸出純凈信號,擁有降噪的性能。
自監(jiān)督學(xué)習(xí)基于大量的未標(biāo)注數(shù)據(jù),通過設(shè)計代理任務(wù)賦予未標(biāo)注數(shù)據(jù)標(biāo)簽,讓模型從成本較低的未標(biāo)注數(shù)據(jù)中充分學(xué)習(xí),因此該方法適用于解決小樣本雷達(dá)輻射源問題。自監(jiān)督學(xué)習(xí)首先通過代理任務(wù)賦予大量未標(biāo)記數(shù)據(jù)標(biāo)簽,訓(xùn)練深度學(xué)習(xí)模型處理代理任務(wù),從中自動挖掘數(shù)據(jù)特征,訓(xùn)練出一個有效的特征提取器。通過將特征提取器應(yīng)用在下游任務(wù)中,提取小樣本的訓(xùn)練數(shù)據(jù)的特征,以輔助訓(xùn)練深度學(xué)習(xí)模型。自監(jiān)督學(xué)習(xí)的方法能有效改善小樣本條件下的監(jiān)督學(xué)習(xí)模型易過擬合、魯棒性不足等問題,其中結(jié)合數(shù)據(jù)特點設(shè)計代理任務(wù)是自監(jiān)督方法中的關(guān)鍵問題。
針對雷達(dá)輻射源天然存在的小樣本問題,本文通過對一維雷達(dá)信號序列和二維圖像的組合使用提出了一種基于對比學(xué)習(xí)的自監(jiān)督代理任務(wù),解決特征提取器表征能力不足的問題。通過凍結(jié)的自編碼器進(jìn)行數(shù)據(jù)處理,得到長度對齊的一維時序特征向量和降噪后純凈的二維圖像,其中二維圖像是一維雷達(dá)信號序列經(jīng)過短時傅里葉變換得到的。本文代理任務(wù)的核心思想是判斷一維雷達(dá)信號序列與二維圖像是否相互對應(yīng)。通過仿真輻射源信號,生成數(shù)據(jù)集D={x1,x2,…,xM},包含M條一維雷達(dá)信號序列,xm代表第m條一維雷達(dá)信號序列。
針對一維雷達(dá)信號序列采用SAE進(jìn)行特征提取fm,利用一維卷積核和池化操作提取特征,最后通過全連接層壓縮成為一維特征用于對比損失判別。sm是xm短時傅里葉變換的二維頻譜圖,基于sm利用卷積、池化和全連接構(gòu)建一維特征。將M條fm的一維特征和M條sm生成的一維特征組合生成M×M條輸入對(FX(fm),FS(sm))。其中,FX代表一維信號網(wǎng)絡(luò),FS代表二維圖像網(wǎng)絡(luò)。此時fm和sm相互對應(yīng),賦予這一對輸入標(biāo)簽ym=1,反之則賦予標(biāo)簽ym=0。
該自監(jiān)督代理任務(wù)網(wǎng)絡(luò)框架如圖2所示。一維雷達(dá)信號序列通過凍結(jié)的稀疏自編碼器處理成等長的特征向量,接著通過一維信號網(wǎng)絡(luò)提取特征。除此之外,本文設(shè)計了額外的修剪網(wǎng)絡(luò),由卷積層、全局池化層與全連接層組成,用以修剪特征向量的大小,以便進(jìn)行對比損失計算。
圖2 雙模態(tài)信號對比網(wǎng)絡(luò)
二維圖像與上述過程類似,先通過凍結(jié)的降噪自編碼器去噪后,再通過二維圖像網(wǎng)絡(luò)提取特征,最后通過額外的修剪網(wǎng)絡(luò)進(jìn)行特征向量修剪,得到與一維雷達(dá)信號序列修改后相同大小的特征向量,通過計算兩個向量的對比損失更新整體網(wǎng)絡(luò)。對比損失函數(shù)如下:
(1-ym)max(α-‖F(xiàn)X(fm)-FS(sm)‖2,0)2。
(5)
式中:α是當(dāng)樣本為負(fù)時控制損失值超參數(shù)。該對比損失函數(shù)通過整合同一樣本的不同模態(tài)形式,從而達(dá)到有效訓(xùn)練一維信號網(wǎng)絡(luò)和二維圖像網(wǎng)絡(luò)的目的。
通過訓(xùn)練自監(jiān)督代理任務(wù)的對比網(wǎng)絡(luò),本文得到針對一維雷達(dá)信號序列特征提取的一維信號網(wǎng)絡(luò)和針對二維圖像特征提取的二維圖像網(wǎng)絡(luò)。為了實現(xiàn)信號輻射源類型識別的目的,在下游分類任務(wù)中,本文使用少量標(biāo)記數(shù)據(jù),通過預(yù)訓(xùn)練的一維信號網(wǎng)絡(luò)和二維圖像網(wǎng)絡(luò)提取一維雷達(dá)信號序列特征以及二維圖像特征,并通過對兩種特征進(jìn)行特征融合,訓(xùn)練分類層。
下游分類模塊如圖3所示。一維雷達(dá)信號序列通過凍結(jié)的稀疏編碼器降維得到一維特征向量,接著將特征向量通過預(yù)訓(xùn)練的一維信號網(wǎng)絡(luò)提取特征(卷積層、池化層和全連接層),得到大小為m×n特征向量μ;二維圖像特征經(jīng)過凍結(jié)的降噪自編碼器降噪后,通過二維圖像網(wǎng)絡(luò)提取得到大小為m×l特征向量λ。接著將特征向量μ和λ拼接得到m×(n+l)的特征向量,通過卷積層進(jìn)行特征融合,通過由全連接層組成的分類層進(jìn)行分類。最后通過由全連接層組成的分類層進(jìn)行分類,該雙流融合網(wǎng)絡(luò)使用基于自監(jiān)督代理任務(wù)預(yù)訓(xùn)練的特征提取網(wǎng)絡(luò),僅需使用少量樣本微調(diào)分類層即可實現(xiàn)輻射源類型識別,解決了面向小樣本條件的限制下的信號輻射源類別識別問題。
圖3 基于雙流融合網(wǎng)絡(luò)的分類模塊
本仿真實驗以少量實際數(shù)據(jù)為基礎(chǔ),利用式(1)~(3)中的3種信號減損方法對有限實際數(shù)據(jù)樣本進(jìn)行擴充,構(gòu)建包含4類數(shù)據(jù)的實驗樣本集,并對數(shù)據(jù)集進(jìn)行劃分,定義訓(xùn)練集、適應(yīng)集和測試集,明確實驗數(shù)據(jù)設(shè)置。然后對本文所提出的自監(jiān)督小樣本信號識別模型中的信號時間序列與時頻圖特征表征網(wǎng)絡(luò)進(jìn)行設(shè)計。最后,在不同的信噪下,進(jìn)行在不同小樣本數(shù)據(jù)量條件下的對比實驗,同時分析超參數(shù)影響。
3.1.1 樣本增強
根據(jù)4類實際輻射源信號的參數(shù),使用某軟件雷達(dá)信號仿真工具箱,生成相應(yīng)的一維時間序列,并使用高斯分布噪聲、萊斯多徑衰落和時鐘偏移3種方法對信號時間序列進(jìn)行擴充,增強后的數(shù)量為每類1 600個。
針對不同一維雷達(dá)信號序列長度不同的問題,本文采用滑動時間窗口的方法。設(shè)置窗口大小為10 240,重疊率為30%。為避免窗口內(nèi)信號大部分為脈間間隔信號,采用窗口內(nèi)信號平均幅值大于設(shè)定值的方式確保每個時間窗口內(nèi)至少包含一個完整周期的雷達(dá)信號。通過滑動窗口方式,得到定長的一維雷達(dá)信號序列。使用式(4)中的短時傅里葉變換將增強后一維時域數(shù)據(jù)樣本轉(zhuǎn)化成相應(yīng)的二維時頻圖,如圖4所示。
圖4 樣本數(shù)據(jù)生成示意圖
3.1.2 實驗數(shù)據(jù)設(shè)置
為驗證本文所提法在不同信噪比下的性能,生成了兩組不同信噪比下同等規(guī)模和同樣劃分方式的對比實驗數(shù)據(jù)集來支撐對比研究,實驗數(shù)據(jù)的具體組成與使用方法如表1和表2所示。
表1 實驗樣本數(shù)量
表2 實驗數(shù)據(jù)設(shè)置
3.1.3 實驗主要網(wǎng)絡(luò)設(shè)計
自監(jiān)督代理任務(wù)網(wǎng)絡(luò)框架由特征提取網(wǎng)絡(luò)和特征修剪網(wǎng)絡(luò)兩部分組成,其中特征提取網(wǎng)絡(luò)由三層卷積模塊組成,具體超參數(shù)如表3和表4所示。特征修剪網(wǎng)絡(luò)由卷積層、全局池化層與全連接層組成,其中卷積層的核大小為3,并通過全局池化與全連接層將特征展開為1×256的特征向量。
表3 一維信號網(wǎng)絡(luò)結(jié)構(gòu)
表4 二維圖像網(wǎng)絡(luò)結(jié)構(gòu)
在基于雙流融合網(wǎng)絡(luò)的分類模塊中,特征提取網(wǎng)絡(luò)結(jié)構(gòu)保持不變,用于特征融合的卷積層大小設(shè)置為3×3,并通過兩層全連接層將特征展開為1×4的特征向量用于分類。
3.1.4 評價指標(biāo)
為驗證算法的性能,本文除使用準(zhǔn)確率作為評價指標(biāo)外,還使用分類問題中常用的F1值作為評價指標(biāo)。準(zhǔn)確率能夠直觀地表現(xiàn)模型的性能,但在正負(fù)樣本不均衡時容易受到占比大的類別的影響相對于準(zhǔn)確率,F1值綜合平衡了精確率precision和召回率recall的影響,能夠更為全面地評價一個分類器。F1值的計算公式如下:
(6)
3.2.1 對比實驗
為驗證本文所提算法的性能,使用3.1.2中描述的兩組不同信噪比環(huán)境下生成的數(shù)據(jù)集展開實驗,其中對照組的設(shè)置選擇以一維數(shù)據(jù)作為輸入的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和具有代表性的長短期記憶(Long Short Term Memory,LSTM)方法。實驗結(jié)果如圖5所示,可見本文所提的自監(jiān)督方法在不同的噪聲環(huán)境下均優(yōu)于傳統(tǒng)的一維CNN和LSTM方法,在噪聲環(huán)境偏低的信噪比2數(shù)據(jù)集下F1值和準(zhǔn)確率均可達(dá)到最優(yōu)水平,分別為97%和97.1%。
圖5 對比實驗結(jié)果
實驗結(jié)果的混淆矩陣如圖6~8所示。傳統(tǒng)一維CNN和LSTM方法在進(jìn)行輻射源分類的過程中,4類輻射源之間都容易發(fā)生混淆,但本文提出的自監(jiān)督算法僅在B類的識別上與其他三類發(fā)生混淆,且在低噪環(huán)境下的信噪比2數(shù)據(jù)集上能夠精準(zhǔn)識別C、D兩類。
圖6 一維CNN混淆矩陣
圖7 LSTM混淆矩陣
圖8 自監(jiān)督雙流特征混淆矩陣
3.2.2 適應(yīng)集樣本數(shù)量影響
為探究不同適應(yīng)集樣本數(shù)量對模型識別效果的影響情況,在信噪比2的實驗條件下,使用一維CNN方法、LSTM與自監(jiān)督方法在不同適應(yīng)集樣本數(shù)量下進(jìn)行對比實驗,結(jié)果如圖9和圖10所示。
圖9 F1值實驗結(jié)果
從圖9和圖10可以觀察到,隨著適應(yīng)集每類樣本數(shù)量的減少,三種方法總體上都呈現(xiàn)遞減趨勢,然而當(dāng)適應(yīng)集每類樣本數(shù)量從100個降低到30個時,自監(jiān)督算法的F1值和準(zhǔn)確率均處于最優(yōu),且準(zhǔn)確率和F1值保持在95%以上;一維CNN算法的識別準(zhǔn)確率和F值皆有明顯下降;LSTM算法下降不明顯,但均處在76.5%左右,效果較差。由此可見,自監(jiān)督雙流特征識別方法對于適應(yīng)集樣本個數(shù)具有較強的魯棒性。
3.2.3 超參數(shù)實驗效果
一般的深度學(xué)習(xí)方法需要通過長時間的訓(xùn)練使模型收斂,耗費大量算力。本文提出的方法在自監(jiān)督預(yù)訓(xùn)練的基礎(chǔ)上,僅使用少量適應(yīng)集數(shù)據(jù)微調(diào)模型即可達(dá)到較好的效果。為了驗證本文所提算法在自監(jiān)督預(yù)訓(xùn)練階段收斂較快的特點,設(shè)計模型分別在預(yù)訓(xùn)練20輪和10輪的情況下,面對不同適應(yīng)集樣本量的表現(xiàn),實驗結(jié)果如圖11所示。
圖11 訓(xùn)練20輪對實驗結(jié)果的影響
實驗結(jié)果表明,傳統(tǒng)的一維CNN在訓(xùn)練輪次10輪時,由于模型并未擬合,識別準(zhǔn)確率皆低于訓(xùn)練輪次20輪時的情況,且隨著樣本數(shù)量的減少,未擬合情況進(jìn)一步加劇,在信噪比2的數(shù)據(jù)集下,樣本量縮減到30時,識別準(zhǔn)確率降低了8.9%;LSTM算法相對穩(wěn)定性較高,在較短時間內(nèi)可以使模型達(dá)到正常水平,但LSTM在面對復(fù)雜電磁環(huán)境下的識別精度皆低于一維CNN和自監(jiān)督算法;本文提出的自監(jiān)督算法在訓(xùn)練輪次減少時,準(zhǔn)確率下降不明顯,且同樣在信噪比2的數(shù)據(jù)集下,樣本量縮減到30時,僅降低了4.6%,并且依舊能達(dá)到90.8%的較高識別準(zhǔn)確率。該實驗說明本文所提自監(jiān)督方法在面對復(fù)雜電磁環(huán)境下,可以以少量的樣本短時間內(nèi)達(dá)到較好的識別精度,具有較強的魯棒性和較快收斂的特點。本文實驗為離線環(huán)境下的批量處理,在在線環(huán)境下的流式處理中可能存在效果下降的問題。
圖12 訓(xùn)練10輪對實驗結(jié)果的影響
本文提出了一種小樣本深度學(xué)習(xí)方法用以解決樣本數(shù)量不足條件下的輻射源類型識別問題。該方法首先利用有限數(shù)量實際樣本數(shù)據(jù),通過信號減損方法模擬不同信道條件下輻射源信號,擴充數(shù)據(jù)樣本數(shù)量,構(gòu)建實驗數(shù)據(jù)集;而后針對小樣本問題特點,提出了基于對比學(xué)習(xí)與雙流融合架構(gòu)的輻射源特征表征和分類識別網(wǎng)絡(luò),利用輻射源信號一維時間序列與二維時頻圖作為網(wǎng)絡(luò)輸入,進(jìn)行跨模態(tài)對比訓(xùn)練與融合分類識別。實驗結(jié)果證明,本文所提方法可在多類信道條件下利用有限數(shù)量樣本實現(xiàn)準(zhǔn)確輻射源類型識別,具備較強的應(yīng)用場景適應(yīng)與泛化能力,可為相關(guān)技術(shù)研究與運用推廣提供新思路和新參考。與其他方法相比,本文提出的模型更加輕量,適用場景更為廣泛。
但在自監(jiān)督雙流融合框架中學(xué)習(xí)到的特征是否能夠適用于不同任務(wù)和領(lǐng)域,以及如何進(jìn)行有效的遷移學(xué)習(xí)仍是待解決的問題。此外,如何處理現(xiàn)實情況下數(shù)據(jù)不平衡導(dǎo)致的訓(xùn)練偏差和學(xué)習(xí)困難,也是未來研究中面臨的挑戰(zhàn)。