王 聰,但 波,張財生
(海軍航空大學(xué), 山東 煙臺 264001)
特定輻射源識別技術(shù)是指通過接收信號的外部特征來區(qū)分輻射源個體的技術(shù)[1]。該特征是由于發(fā)射機組成器件的多種非理想特性混合在一起,導(dǎo)致同一型號的不同個體之間發(fā)射的信號存在細(xì)微的差異,具有一定的穩(wěn)定性和唯一性,又被稱為射頻指紋。在軍事領(lǐng)域,由于大量同型號的輻射源廣泛部署,通過特定輻射源識別技術(shù)來區(qū)分同樣型號、參數(shù)一致的軍用輻射源設(shè)備,具有重要的戰(zhàn)略和戰(zhàn)術(shù)意義[2-3]。傳統(tǒng)基于特征變換的輻射源個體識別技術(shù)[4-6]需要借助豐富的專家知識并且經(jīng)過復(fù)雜的處理步驟才能保證特征的有效性。隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,憑借其強大的特征提取和分類能力,給特定輻射源識別技術(shù)提供了一個更高效且通用的處理框架和流程[7-9]。文獻(xiàn)[10]將采集到的IQ數(shù)據(jù)作為輸入,驗證了有監(jiān)督條件下,卷積神經(jīng)網(wǎng)絡(luò)可以實現(xiàn)對5個軟件無線電設(shè)備的精確識別。
在電子偵察過程中,時常面臨的是復(fù)雜多變的信號環(huán)境,即輻射源目標(biāo)經(jīng)過各種外部因素影響導(dǎo)致到達(dá)接收機的信號不是恒定不變的,其中信道的影響最大[11-12]。具體而言,包括多徑、多普勒頻移、帶內(nèi)噪聲等,不同的信道會對輻射源信號造成“染色”。
為了克服信道帶來的不利影響,文獻(xiàn)[13]通過實驗說明了在低信噪比條件下通過增加網(wǎng)絡(luò)規(guī)模進(jìn)行有監(jiān)督訓(xùn)練可以提高識別精度。但是網(wǎng)絡(luò)規(guī)模的增加必然帶來較大的計算量并且需要重新訓(xùn)練模型。并且在實際應(yīng)用中,實時采集到的大量無標(biāo)簽的數(shù)據(jù)難以被利用進(jìn)行有監(jiān)督的訓(xùn)練。文獻(xiàn)[14]提出了合作通信基礎(chǔ)上的信道校正的方法來補償信道帶來的影響,但是在實際電子偵察過程中主要面臨的是非合作通信場景。
本文中基于深度學(xué)習(xí)的輻射源識別方法在信道變化時識別性能下降的問題,提出了信道自適應(yīng)的特定輻射源無監(jiān)督訓(xùn)練和識別方法,提高了識別系統(tǒng)的魯棒性和可靠性,以適應(yīng)實際應(yīng)用中不可預(yù)測的戰(zhàn)場情況。
根據(jù)已有的研究,通常認(rèn)為輻射源的指紋特性源于發(fā)射機各器件的“非理想”特性,這會給信號帶來各種“無意調(diào)制”,而這些“無意調(diào)制”是客觀存在且相對穩(wěn)定的,并具有一定程度的唯一性和可分辨性,因此也被認(rèn)為是輻射源指紋。理想通信信號的模型可表示為:
s(t)=(ao(t)+au(t))cos[2π(fo(t)+
fu(t))t+(φo(t)+φu(t))]
(1)
式中:ao(t)、fo(t)、φo(t)分別表示理想信號的幅度、頻率、相位;au(t)、fu(t)、φu(t)分別表示幅度的無意調(diào)制、頻率的無意調(diào)制、相位的無意調(diào)制。
在實際環(huán)境中,經(jīng)過對不同信道條件下的實測信號進(jìn)行分析,由于多徑、多普勒頻移、帶內(nèi)噪聲的因素,會給接收到的信號附加一些非指紋的信道特征。對于同一個輻射源發(fā)出的信號,在2個不同場景下接收到的相同信號分別可以表示為:
(2)
式中:h(t)為信道的沖擊響應(yīng);?為卷積操作;ξ(t)為信道噪聲。我們的目的就是在接收到的信號中突出個體指紋特征,而且盡量少的受到信道等因素的影響。
通常在有限數(shù)據(jù)集上訓(xùn)練的深度學(xué)習(xí)模型泛化性比較差,這是因為基于深度學(xué)習(xí)的分類方法通常假設(shè)所有的數(shù)據(jù)都服從相同的分布。但在實際中,這種假設(shè)過于嚴(yán)格,用于訓(xùn)練的數(shù)據(jù)和測試數(shù)據(jù)由于環(huán)境的影響會存在一定的差異。這種差異會使得基于深度學(xué)習(xí)的識別方法在實際應(yīng)用無法適應(yīng)新數(shù)據(jù)。
我們借鑒了文獻(xiàn)[17]中的所提出的域?qū)咕W(wǎng)絡(luò)的方法設(shè)計了一個適用于輻射源個體識別的訓(xùn)練和識別模型。通過在訓(xùn)練中對得到的特征加以約束,提升模型在目標(biāo)域數(shù)據(jù)集上的適應(yīng)能力。如圖1所示,本模型主要包括特征提取模塊、分類模塊和信道判別模塊。下面逐一進(jìn)行詳細(xì)介紹。
圖1 網(wǎng)絡(luò)結(jié)構(gòu)示意Fig.1 The network architecture
特征提取模塊主要功能是對輸入數(shù)據(jù)進(jìn)行特征提取。改進(jìn)于經(jīng)典ResNet18結(jié)構(gòu)[18]的殘差網(wǎng)絡(luò)部分,共由4個部分組成。模塊的第一部分由卷積層、批歸一化層和Leaky Relu激活層組成。后續(xù)第二至第四部分是3個相同的殘差塊。每個殘差塊包括2個計算單元,每個計算單元都是由卷積層、批歸一化層、Leaky Relu激活層組成。第1個計算單元的輸入和第2個計算單元的輸出之和經(jīng)過Leaky Relu激活之后作為這一部分的總輸出。
本模塊中的改進(jìn)主要體現(xiàn)在3個部分:一是將二維卷積濾波器改為適應(yīng)通信信號的一維卷積濾波器;二是設(shè)置合適的濾波器個數(shù)和卷積核大小,提高訓(xùn)練和識別的運算速度;三是采用Leaky Relu激活函數(shù),相比于原Relu激活函數(shù)可以使網(wǎng)絡(luò)學(xué)習(xí)到值為負(fù)數(shù)的信號部分。
分類模塊主要功能是對特征提取模塊得到的高維特征向量進(jìn)行分類判別,由兩層全連接層和Leaky Relu激活函數(shù)組成。
訓(xùn)練中優(yōu)化器選擇為隨機梯度下降法,損失函數(shù)為負(fù)對數(shù)似然損失,學(xué)習(xí)率函數(shù)為指數(shù)衰減函數(shù)。訓(xùn)練的損失函數(shù)可以寫為:
(3)
式中:Xs和Ys表示原始信號數(shù)據(jù)集的數(shù)據(jù)和標(biāo)簽;F代表特征提取模塊;C代表分類模塊。
信道判別模塊由一層梯度反轉(zhuǎn)層,兩層全連接層、激活函數(shù)組成。若要在目標(biāo)數(shù)據(jù)集實現(xiàn)較好的分類結(jié)果,必須讓特征提取器和判別器不能正確區(qū)分目標(biāo)信號數(shù)據(jù)集和原始信號數(shù)據(jù)集。因此,信道判別模塊的主要任務(wù)是在訓(xùn)練過程中不斷優(yōu)化特征提取器,實現(xiàn)信道判別誤差的最大化,從而使得輸出的高維特征向量不能被信道判別模塊正確判別。
此模塊的輸入為原始信號數(shù)據(jù)xi和目標(biāo)信號數(shù)據(jù)zj經(jīng)過特征提取模塊后的特征向量,分別表示為Xi和Zj:
Xi=F(xi),xi∈Xs
(4)
Zj=F(zj),zj∈Xt
(5)
損失函數(shù)可以寫為:
(6)
在特征提取器F進(jìn)行優(yōu)化更新過程中,由于lossdis和lossclass的梯度方向是相反的,為了避免分階段訓(xùn)練,在此模塊中加入了梯度反轉(zhuǎn)層,使得前向傳播的過程中實現(xiàn)恒等變換,反向傳播的過程中梯度方向自動取反。如下式:
(7)
其中,Rλ為梯度反轉(zhuǎn)層;Xi為輸入的特征向量;λ為動態(tài)參數(shù),隨著迭代次數(shù)而變化。
本文中算法按照以下步驟進(jìn)行:
1) 特征提取模塊和分類模塊隨機初始化后在原始信號數(shù)據(jù)集上進(jìn)行訓(xùn)練,收斂后保存模型參數(shù)。
2) 加載有監(jiān)督訓(xùn)練保存的特征提取模塊和分類模塊的網(wǎng)絡(luò)參數(shù),從原始信號數(shù)據(jù)集中隨機選出一批數(shù)據(jù)送入特征提取模塊,得到特征向量Xi,接著送入分類模塊,同已知的分類標(biāo)簽得到分類損失lossclass。
3) 從目標(biāo)信號數(shù)據(jù)集中隨機選出一批數(shù)據(jù)送入特征提取模塊得到特征向量Zj,將Xi和Zj送入信道判別模塊,得到判別損失lossdis。
4) 統(tǒng)計2)和3)模塊中總的損失,通過梯度反向傳播,實現(xiàn)各網(wǎng)絡(luò)模塊的參數(shù)更新。多次重復(fù)第2)至第4)步至收斂后,保存各模塊網(wǎng)絡(luò)參數(shù)。
5) 最后是模型推理,加載無監(jiān)督訓(xùn)練后保存的特征提取模塊和分類模塊的網(wǎng)絡(luò)參數(shù)。將測試集數(shù)據(jù)送入特征提取模塊和分類模塊,選取置信度最高的類別作為每一個數(shù)據(jù)的推理結(jié)果。
為了驗證本文中所提方法的有效性,使得實驗更符合實際的應(yīng)用場景,同時保證實驗的可擴展性。本文中實驗采用5個軟件無線電設(shè)備,型號為USRP B210。每個設(shè)備包含2個發(fā)射通道,所以一共可以構(gòu)造10個帶有輻射源指紋特征的數(shù)據(jù)集。這樣做的優(yōu)勢是模擬實戰(zhàn)場景構(gòu)建參數(shù)可控的標(biāo)準(zhǔn)數(shù)據(jù)集,以便更靈活和全面的評估本方案的性能。出于研究的目的,采用仿真信道的方式也是為了更容易控制變量,同樣也包含了輻射源的指紋信息。
首先用一個采集設(shè)備通過同一個同軸電纜采集了10類輻射源發(fā)出的連續(xù)數(shù)據(jù),實驗場景如圖2所示。因為通過同軸電纜連接輻射源和采集設(shè)備,可以認(rèn)為采集到的數(shù)據(jù)不受自由空間傳輸過程中信道影響。每一類共采集3×108個樣點作為原始信號數(shù)據(jù)集,信號參數(shù)和采集參數(shù)如表1所示。
表1 信號參數(shù)Table 1 The parameter of the signal
圖2 數(shù)據(jù)采集場景示意圖Fig.2 Setup of the data collection
將原始信號數(shù)據(jù)集和對應(yīng)標(biāo)簽劃分成訓(xùn)練集、驗證集和測試集,分別為總數(shù)據(jù)量的70%、20%、10%。訓(xùn)練集用于網(wǎng)絡(luò)模塊調(diào)優(yōu),驗證集用于評估網(wǎng)絡(luò)模塊訓(xùn)練過程的進(jìn)展,測試集用于客觀的測試網(wǎng)絡(luò)模塊的識別性能。
目標(biāo)信號數(shù)據(jù)集是通過原始信號數(shù)據(jù)集仿真疊加仿真信道影響后得到,仿真的瑞麗信道環(huán)境同時包括了多徑效應(yīng)、多普勒效應(yīng)、頻率抖動以及高斯噪聲的影響。每一類輻射源數(shù)據(jù)分別通過此信道后保存為目標(biāo)信號數(shù)據(jù)集。信道響應(yīng)通過Matlab軟件的comm.RayleighChannel函數(shù)來隨機產(chǎn)生,然后疊加到每一個數(shù)據(jù)上。
通信信號采集到的通常為一維連續(xù)數(shù)據(jù)。如圖3所示,每類輻射源收集到的連續(xù)信號采樣點為L=3×108。在后續(xù)訓(xùn)練過程中,每一次優(yōu)化都在所有輻射源類別中隨機選擇固定長度為k=4 096,m=128個數(shù)據(jù)組成維度為128×4 096的數(shù)據(jù)集,同時得到維度為128×1的對應(yīng)標(biāo)簽。這種隨機起始點的方式可以避免數(shù)據(jù)中所含信息的影響,使得訓(xùn)練的模型更加穩(wěn)健。
圖3 隨機選取數(shù)據(jù)示意圖Fig.3 The random sampling process
然后對數(shù)據(jù)集中每個數(shù)據(jù)x按照下式分別進(jìn)行標(biāo)準(zhǔn)化:
(8)
(9)
標(biāo)準(zhǔn)化操作可以提升模型訓(xùn)練過程中的速度,使模型盡快收斂。
1) 本文中實驗使用的深度學(xué)習(xí)環(huán)境版本分別為Python 3.8,Pytorch 1.6.0,cuda10.2.89,顯卡型號為 NVIDIA Tesla V100。
2) 在網(wǎng)絡(luò)訓(xùn)練過程中,式(7)中的λ取值如下所示:
(10)
式中: epoch為網(wǎng)絡(luò)優(yōu)化過程中的迭代次數(shù);batchsize設(shè)置為128;最大epoch設(shè)置為200;分類模塊和信道判別模塊的優(yōu)化器均為Adam優(yōu)化器;初始學(xué)習(xí)率為10-4;更新函數(shù)為每10個epoch變?yōu)樯弦粋€值的0.8倍。
本文中基于原始信號數(shù)據(jù)集和目標(biāo)信號數(shù)據(jù)集設(shè)計3個實驗。第1個實驗是有監(jiān)督訓(xùn)練實驗,將特征提取模塊和分類模塊在原始信號數(shù)據(jù)集上進(jìn)行訓(xùn)練,并評估模型的識別性能;第2個實驗是將目標(biāo)信號數(shù)據(jù)集送入已訓(xùn)練好的特征提取模塊和分類模塊,驗證網(wǎng)絡(luò)在模型失配下的識別性能;第3個實驗是測試通過本文中所提方法進(jìn)行訓(xùn)練后,模型對于目標(biāo)信號數(shù)據(jù)集數(shù)性能的提升情況。
在本文中,衡量模型的性能主要有以下2個指標(biāo):一個是混淆矩陣,混淆矩陣是一個誤差矩陣,常用來可視化地評估監(jiān)督學(xué)習(xí)算法的性能;二是為了更直觀的展示特征分布,我們采用了t-SNE(t-distributed stochastic neighbor embedding,t-SNE)[19]降維算法來可視化所有類別在二維空間的特征分布情況。T-SNE是一種非線性降維算法,通過仿射變換將數(shù)據(jù)點映射到概率分布上,可以將深度學(xué)習(xí)所提取的高維特征降維到二維或者三維。在實驗中,通過將數(shù)據(jù)輸入訓(xùn)練好的特征提取模塊和分類模塊,然后提取出分類識別模塊最后一層全連接的輸出向量進(jìn)行t-SNE降維。
按照2.4節(jié)的算法流程,首先在原始信號數(shù)據(jù)集上展開訓(xùn)練。模型收斂后將測試數(shù)據(jù)輸入訓(xùn)練好的特征提取模塊和分類模塊,統(tǒng)計后得到的混淆矩陣的結(jié)果如圖4所示。識別率接近100%。然后提取出分類識別模塊最后一層全連接的輸出向量進(jìn)行t-SNE降維,結(jié)果如圖5所示??梢钥闯?0類目標(biāo)的聚集性較好,類別之間的差異可以通過神經(jīng)網(wǎng)絡(luò)進(jìn)行區(qū)分。
圖4 原始信號數(shù)據(jù)集的混淆矩陣Fig.4 The confusion matrix of original data
圖5 原始信號數(shù)據(jù)集的特征分布圖Fig.5 The feature map of original data
本實驗是測試目標(biāo)信號數(shù)據(jù)集在未進(jìn)行所提方法的訓(xùn)練之前的識別率。首先加載訓(xùn)練好的特征提取模塊和分類模塊的網(wǎng)絡(luò)參數(shù),然后將目標(biāo)信號數(shù)據(jù)集中的數(shù)據(jù)分批次送入模塊,經(jīng)過統(tǒng)計得到混淆矩陣如圖6所示。整體準(zhǔn)確率為52.5%。訓(xùn)練出的網(wǎng)絡(luò)模型比原始目標(biāo)數(shù)據(jù)集上的識別率下降了47.5%。通過提取出分類識別模塊最后一層全連接的輸出向量進(jìn)行t-SNE降維,結(jié)果如圖7所示,可以看出特征混淆比較嚴(yán)重。說明在目標(biāo)信號數(shù)據(jù)集中,變化的信道極大的影響了網(wǎng)絡(luò)模塊的特征提取和分類的準(zhǔn)確性。
圖6 目標(biāo)信號數(shù)據(jù)集的混淆矩陣Fig.6 The confusion matrix of target data
圖7 目標(biāo)信號數(shù)據(jù)集的特征分布圖Fig.7 The feature map of target data
執(zhí)行2.4節(jié)的算法第2~5步,利用無標(biāo)簽的目標(biāo)數(shù)據(jù)集和已經(jīng)訓(xùn)練好的模型參數(shù)進(jìn)行無監(jiān)督訓(xùn)練。結(jié)果的混淆矩陣如圖8所示,準(zhǔn)確率提升到77.6%。相比于未訓(xùn)練之前的識別率提升了47.8%。t-SNE降維結(jié)果如圖9所示,10類目標(biāo)又具有了相對較好區(qū)分性,驗證了所提方法的有效性和可行性??梢钥闯鼋?jīng)過無監(jiān)督訓(xùn)練,特征提取模塊和分類模塊已經(jīng)可以適應(yīng)信道的變化提取到較穩(wěn)定的特征,得到較高的識別率。
圖8 無監(jiān)督訓(xùn)練后目標(biāo)信號數(shù)據(jù)集的混淆矩陣Fig.8 The confusion matrix of target data after training
圖9 無監(jiān)督訓(xùn)練后目標(biāo)信號數(shù)據(jù)集的特征分布圖Fig.9 The feature map of target data after training
在利用深度學(xué)習(xí)算法實現(xiàn)輻射源個體識別時,針對用于訓(xùn)練網(wǎng)絡(luò)的數(shù)據(jù)集與待測無標(biāo)簽數(shù)據(jù)集分布不一致,從而導(dǎo)致識別率嚴(yán)重降低的問題,本文中提出了一種基于信道自適應(yīng)的無監(jiān)督訓(xùn)練與識別方法。該方法通過在模型訓(xùn)練中對特征層進(jìn)行約束,使得模型可以魯棒性的提取個體特征,降低信道等環(huán)境參數(shù)對模型性能的影響。通過實采數(shù)據(jù)集和仿真實驗,在識別率嚴(yán)重降低的情況下,本文中所提的方法帶來了47.8%的性能提升。對于推動基于深度學(xué)習(xí)的輻射源識別算法在實際中的應(yīng)用具有較高的參考價值。
雖然本文中所提的方法可以帶來較大的性能提升,但是相比于有監(jiān)督訓(xùn)練的識別率還有較大的差距。未來需要進(jìn)一步研究提升無監(jiān)督訓(xùn)練識別率的方法。同時未來需要針對不同類型的信號樣式、更復(fù)雜的信道環(huán)境、變化的接受設(shè)備等開展研究,真正解決深度學(xué)習(xí)方法在射頻指紋識別領(lǐng)域的應(yīng)用問題。