溫雪芳 姚金杰 白建勝 郭鈺榮
(中北大學信息探測與處理山西省重點實驗室 太原 030051)
隨著無線通信技術的發(fā)展,電磁環(huán)境變得愈發(fā)惡劣并對電磁安全造成了一定的威脅。電磁信號識別對于作戰(zhàn)環(huán)境、復雜電磁環(huán)境中對電磁目標設備(系統(tǒng))異常行為的判斷和預警具有重要作用,同時在空間頻譜監(jiān)測、惡意電磁攻擊和電磁干擾識別等領域極具意義。不同的電磁信號數(shù)據(jù)具有不同的特征,為避免造成關鍵信息泄露和電磁信號入侵,需要及時對電磁信號進行識別。
目前國內(nèi)外關于電磁信號識別的方法主要有兩種,基于似然比檢驗[1~2]和基于特征提?。?]。前者需先驗知識多,普適性差,計算量大[4];基于特征提取的識別方法的核心分類依據(jù)是提取的特征參數(shù)[5],具體是從接收信號中提取預定義的特征,根據(jù)特征值之間的差異性進行信號識別。用于進行特征分析的參數(shù)較多,除了常見的幅度、相位和頻率[6]等特征,還有更復雜的參數(shù)如高階累積量[7]、循環(huán)譜[8]、時頻域特征[9]、IQ波形特征[10]等。常用的識別網(wǎng)絡有人工神經(jīng)網(wǎng)絡[11],支持向量機(SVM)[12],聚類[13],生成對抗網(wǎng)絡[14],徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡[15],二值化神經(jīng)網(wǎng)絡(Binary Neural Network,BNN)[16]等網(wǎng)絡都被應用于信號識別中,且取得了不錯的效果。另還有侯進等人提出一種基于復合神經(jīng)網(wǎng)絡的調(diào)制識別算法,利用CNN 網(wǎng)絡和時頻圖進行識別[17]。袁莉芬等使用堆疊自編碼器網(wǎng)絡和高階累積量實現(xiàn)了信號識別[18]。
基于原始信號直接進行深度學習計算量大,且特征物理意義不凸顯,可解釋性差;且電磁信號特征如何表征、如何選擇也是影響深度學習效能的重要因素。本文基于特征降維和深度學習的電磁信號識別方法。先構(gòu)建靜態(tài)物理特征庫,在具體識別的過程中先對這些特征進行降維處理,剔除對識別貢獻小的特征,選擇更加穩(wěn)定和更具判別性的特征;然后利用深度學習強大的學習能力,構(gòu)建電磁信號識別系統(tǒng)。
因直接利用原始信號直接進行深度學習計算量大,且用于電磁信號識別的特征眾多,如何選擇合適的特征對電磁信號識別十分重要,所以引入特征降維來選取合適的表征特征。圖像在深度學習中存在先進且強大的優(yōu)勢,將降維后的特征利用圖像顯示就很有必要。熱力圖,是一種通過對色塊著色來顯示數(shù)據(jù)的統(tǒng)計圖表,所以熱力圖作為神經(jīng)網(wǎng)絡的輸入。本文提出了基于特征降維和深度學習的電磁信號識別算法將特征降維、熱力圖與改進殘差神經(jīng)網(wǎng)絡(ResNet50-A)相結(jié)合,達到準確識別電磁信號的目的。整體方案結(jié)構(gòu)如圖1所示。具體步驟表述為:1)特征提取。對每個數(shù)據(jù)進行40個靜態(tài)物理特征表征,構(gòu)建特征集。2)特征降維。使用ReliefF 算法獲得優(yōu)選特征子集。3)利用熱力圖構(gòu)建數(shù)據(jù)集。通過熱力圖將上一步得到的特征子集轉(zhuǎn)換為二維圖像,作為ResNet50-A 的輸入。4)模型訓練。通過ResNet50-A 網(wǎng)絡模型對第三步得到的數(shù)據(jù)集進行訓練和測試,得到電磁調(diào)制信號的識別結(jié)果。
圖1 整體方案結(jié)構(gòu)圖
對電磁信號進行靜態(tài)物理特征提取并構(gòu)建特征集,包括13 個統(tǒng)計特征和27 個信號特征,編號1~40。其中統(tǒng)計特征包括:均值、方差、偏度、峭度、均方根、方根幅值、整流平均值、峰峰值、波形因子、峰值因子、裕度因子和脈沖因子[19]。信號特征即瞬時特征,是從信號波形中提取一系列信息,下面列出部分信號特征計算公式。
1)零中心歸一化瞬時幅度之譜密度γmax[20]:
式中,Ns為取樣點數(shù),acn(i)為零中心歸一化瞬時幅度,由下式計算:為瞬時幅度,而為瞬時幅度an(i)的平均值。
2)零中心非弱信號段瞬時相位非線性分量絕對值的標準偏差σap:
式中,at是判斷弱信號的一個幅度判決門限值,c是在全部取樣數(shù)據(jù)Ns中屬于非弱信號值的個數(shù),?NL(i)是經(jīng)過零中心化處理后瞬時相位的非線性分量,在載波安全同步時,有:?NL(i)=φ(i)-φ0其中,φ(i)為瞬時相位。
3)零中心非弱信號段瞬時相位非線性分量的標準差σdp:
4)零中心歸一化非弱信號段瞬時頻率絕對值的標準差σaf:
5)零中心歸一化瞬時幅度絕對值的標準偏差σaa:
6)瞬時幅度中心化并歸一化后的峰度μa42:
7)瞬時頻率中心化并歸一化后的峰值:
式中fn(i)=f(i)/max{f(i)}。
8)P階混合高階矩特征:
式中,“*”表示信號的共軛。
9)高階累積量特征[21]:
其中,k為分割的子集數(shù),Uj表示k個子集中第j個子集元素的下標集。
10)根據(jù)各階累積量還可以構(gòu)造不同的特征參數(shù)如:
ReliefF 算法利用信號特征與分類標簽的相關性給特征向量賦予權值,權值越大代表貢獻越大,并根據(jù)權值大小刪除對貢獻度較小的特征,達到特征集降維的目的[22]。特征降維不僅可以減少數(shù)據(jù)運算的內(nèi)存消耗,還可以減少過擬合,提升模型的泛化能力。式(12)為樣本總量為m的樣本集中第i個樣本權重系數(shù)的計算公式:
式中:W(fl)為權值集合,fl為第l個特征的權值;Hj為R與同類樣本的間距;Mj(C)為R與不同類樣本的間距;P(C) 為C在樣本集中所占比例;D(fl,R1,R2)為R1,R2兩類樣本在特征fl上的距離。當fl連續(xù)時,有
熱力圖,是一種通過對色塊著色來顯示數(shù)據(jù)的統(tǒng)計圖表。繪圖時,需指定顏色映射的規(guī)則。例如,較大的值由較深的顏色表示,較小的值由較淺的顏色表示;較大的值由偏暖的顏色表示,較小的值由較冷的顏色表示。本文對降維后的數(shù)據(jù)特征采用特征矩陣二維化,轉(zhuǎn)換為熱力圖,組成6×6,12×12,18×18,24×24,36×36,40×40 的電磁信號特征矩陣。為增加圖像樣本數(shù)量,采用滑動窗口的方法來遍歷數(shù)據(jù)集,每類數(shù)據(jù)樣本形成的熱力圖像個數(shù)=樣本數(shù)/特征數(shù)量×3。熱力圖尺寸為224×224,分辨率為300dpi,符合ResNet50-A 的輸入格式。
殘差神經(jīng)網(wǎng)絡(ResNet)[23]通過跳躍連接構(gòu)建了恒等映射H(x)=F(x)+x,其中H(x) 為輸出,F(xiàn)(x)為輸入,使得深層和淺層特征可以交互,解決了傳統(tǒng)網(wǎng)絡結(jié)構(gòu)因堆疊卷積層深度,導致網(wǎng)絡發(fā)生退化的問題[24]。ResNet 網(wǎng)絡在圖片識別中有著很好的應用。同樣深度學習中提取特征時只需提取重要特征忽略不重要特征。而SENet[25]注意力機制可以增強重要特征抑制一般特征;其重點是獲得輸入進來的特征層每一個通道的權值。這樣我們可以讓網(wǎng)絡關注它最需要關注的通道。所以考慮將SENet注意力機制和ResNet網(wǎng)絡結(jié)合起來,構(gòu)建本文的電磁信號識別的網(wǎng)絡。
ResNet50模型在圖片識別中效果很好,既可以通過預訓練模型減少訓練時間,降低過擬合,又可以使用較少的樣本來訓練,所以選擇ResNet50 網(wǎng)絡進行信號識別分類。ResNet50 劃分為5 個階段stage0-stage4[26]。網(wǎng)絡結(jié)構(gòu)如圖2(a)所示。Stage0相當于輸入的預處理部分:首先,將輸入的圖片進行卷積(Convolution,Conv)、批量歸一化(Batch Normalisation,BN)[27]和激活函數(shù)ReLU 處理;然后進行最大池化層(Max Pooling)。將圖像的大小縮小為輸入尺寸的1/4。Stage1-stage4 均是由Bottleneck組成,結(jié)構(gòu)相似,只是所含Bottleneck 個數(shù)不同。Bottleneck 由兩個基本模塊構(gòu)成:Conv Block 和Identity Block,前者用于改變結(jié)構(gòu),后者用于加深網(wǎng)絡。
圖2 ResNet50-A的網(wǎng)絡結(jié)構(gòu)圖
為解決減少訓練時間和提高識別準確率的問題,引入SENet模塊,減少參數(shù),關注重要通道的特征,且Identity Block 模塊的作用是加深網(wǎng)絡,所以將ResNet50 中stage4 模塊的第二個Identity Block模塊由SENet 所代替。在保證熱力圖信息的有效提取下,本文提出基于深度學習搭建網(wǎng)絡模型ResNet50-A 來完成信號識別。具體網(wǎng)絡結(jié)構(gòu)示意圖如圖2(b)所示。
電磁信號產(chǎn)生采用可編程信號源(載波、碼元信息可調(diào)),通過改變載波頻率和碼元信息輸出多類型電磁信號。載波頻率選取5 種:50MHz、80MHz、160MHz、300MHz、500MHz,通過發(fā)射天線向空間中輻射的不同類型的電磁信號,然后通過接收天線連接數(shù)據(jù)采集設備采集電磁空間中的信號,采樣頻率為50MHz,采樣時間2ms。單類型載波電磁信號采集的數(shù)據(jù)點為50MHz×2ms=100000。
為了構(gòu)建足夠的數(shù)據(jù)樣本,采用滑動窗口的方式對原始數(shù)據(jù)進行裁剪。采用滑動窗口裁剪信號具有避免數(shù)據(jù)冗余、減小計算復雜度的優(yōu)點。對原始數(shù)據(jù)以50000 個點為一個滑動窗口周期進行保存,成為一個新的數(shù)據(jù)樣本,2ms 單次采集的數(shù)據(jù)每次滑動642 個數(shù)據(jù)點間隔,共滑動保存80 次,保存數(shù)據(jù)并構(gòu)建數(shù)據(jù)集。構(gòu)建的數(shù)據(jù)集中的信號類型包括碼元1、碼元2、碼元1 與碼元2 混合和其他類,其中碼元1、碼元2、碼元1、2 混合信號共有5 種載波類型,其他類信號包括5 個頻段的通信信號,每一類樣本數(shù)為5200,其中80%是訓練樣本,20%為測試樣本。表1為本文中電磁信號的具體參數(shù)。
表1 各類型電磁信號參數(shù)
實驗環(huán)境是Windows10,處理器為Intel(R)Gold 5188CPU 和NVIDIA Quadro P4000 GPU,基于python3.7,Tensorflow2.1構(gòu)建分類模型。
采用ReliefF 算法分別計算特征集中編號1~40特征的權重系數(shù),判斷每類特征對分類的貢獻度,結(jié)果如圖3所示。本文共設置5個閾值并對應劃分特征子集,5 個特征子集分別含有6 個、12 個、18個、24個、36個特征個數(shù)。
圖3 特征權重圖
40×40 電磁信號特征矩陣生成的熱力圖效果如圖4所示。從圖中可以看出對于不同類型的信號,二維化處理后的熱力圖存在明顯差異,這有利于ResNet50-A網(wǎng)絡進行深度特征提取。
圖4 四類信號熱力圖
將5 個電磁信號特征子集和特征集構(gòu)建的熱力圖作為輸入送入神經(jīng)網(wǎng)絡中,采用SGD優(yōu)化器進行訓練,學習率采用自適應調(diào)整學習率,解決了學習率固定的弊端,范圍設置為0.001~0.00001,一共進行500 次迭代訓練,以損失函數(shù)值和準確率作為模型收斂性度量指標,選取最優(yōu)的參數(shù)進行保存。
不同電磁信號特征子集的損失函數(shù)曲線如圖5所示。圖中epoch-train-loss6 表示6 個特征個數(shù)訓練損失曲線,epoch-val-loss6 表示6 個特征個數(shù)驗證損失曲線。由圖5知:在網(wǎng)絡訓練迭代前50次損失值都較高,迭代次數(shù)超過50 之后損失函數(shù)值開始驟減,之后隨著訓練次數(shù)的增加模型逐漸收斂。
圖5 不同電磁信號特征集的損失函數(shù)曲線圖
不同電磁信號特征集的識別率隨迭代次數(shù)變化的曲線如圖6所示。由圖6知,特征個數(shù)24、36、40 個電磁信號特征集的識別率曲線較為接近,最高識別率分別為96.67%、96.1%,95.75%,比特征個數(shù)為18的電磁信號特征子集最高識別率98.61%低2%、2.5%、2.86%,說明提取的特征中存在冗余信息,對識別效果沒起作用或者在起負作用,所以特征降維后,不僅降低了計算復雜度,節(jié)省時間,而且可以提高識別率。但一味地降低特征維度不能很好地保證電磁信號的識別率,取特征個數(shù)為6和12的識別率較低,識別效果明顯不好。選擇合適的電磁信號特征子集很有必要,這里我們選擇18 個左右的特征子集。
圖6 電磁信號識別率對比圖
基于信號識別準確率,選擇以特征個數(shù)為18的特征子集,使用ResNet50和ResNet50-A網(wǎng)絡,從訓練時間和識別率方面進行對比,驗證本文所提出的ResNet50-A網(wǎng)絡的性能更好。
每一次迭代的訓練時間使用兩種神經(jīng)網(wǎng)絡的影響如圖7,ResNet50-A 的訓練時間為27s/epoch,ResNet50 訓練時間為32s/epoch,明顯ResNet50-A的訓練時間比ResNet50 訓練時間減少了4s,表明本文提出的ResNet50-A 網(wǎng)絡在模型訓練時間方面確實有效。表2為兩種網(wǎng)絡在不同迭代次數(shù)的信號識別率,由表可以看出迭代次數(shù)在100 輪之前改進網(wǎng)絡的識別率不如ResNet50,但是100 次迭代之后識別率提升1.39%以上。由此可見,本文提出的改進的ResNet50-A 網(wǎng)絡更適合于本文的電磁信號識別。
表2 不同神經(jīng)網(wǎng)絡對識別率的影響
圖7 各模型訓練耗時
鑒于將原始數(shù)據(jù)直接利用深度學習進行特征提取時間長,可解釋性弱的問題,本文基于提取靜態(tài)物理特征和特征降維的方法選擇具有解釋性的最優(yōu)特征子集,并利用改進的殘差網(wǎng)絡(ResNet50-A)通過挖掘特征子集的深度特征實現(xiàn)對電磁信號的識別。實驗結(jié)果表明進行特征降維后節(jié)省了訓練時間,而且提高了電磁信號識別率。并且對使用的網(wǎng)絡和ResNet50進行對比,驗證了網(wǎng)絡的優(yōu)越性。