宋子豪,程 偉,李敬文,李曉柏
(1.空軍預(yù)警學(xué)院 預(yù)警情報系,湖北 武漢 430019;2.空軍預(yù)警學(xué)院雷達(dá)士官學(xué)校 教研保障中心,湖北 武漢 430019)
特定輻射源識別(Specific Emitter Identification,SEI)技術(shù)是非合作通信領(lǐng)域的關(guān)鍵技術(shù),特征提取作為SEI技術(shù)的關(guān)鍵步驟,對識別性能有著極為重要的影響。在日趨復(fù)雜的電磁環(huán)境中,用于SEI的典型一維特征,如瞬時頻率[1]、脈沖幅度[2]、脈沖寬度[3]和功率譜密度[4]等,因表達(dá)信息能力受限等常常引發(fā)識別性能下滑等問題。因此,一些包含更多指紋信息的高維度特征被應(yīng)用于SEI領(lǐng)域,如短時傅里葉變換[5]、雙線性時頻變換[6]、小波變換[7]、同步擠壓小波變換[8]和希爾伯特譜[9]等。但是,將上述高維度特征數(shù)據(jù)輸入至傳統(tǒng)分類器中訓(xùn)練模型時,計算負(fù)擔(dān)較重、耗時較長。
針對上述問題和通信輻射源信號存在的非線性非平穩(wěn)特點,部分學(xué)者提出可以提取輻射源信號時域序列或頻域序列的熵復(fù)雜度特征作為特征向量,完成SEI工作[10-12]。上述方法存在的問題有:部分變換方法在處理非線性非平穩(wěn)信號時存在局限性;直接從原始信號或變換后序列的結(jié)果中提取特征區(qū)分能力有限。
基于上述考慮,一些學(xué)者開始嘗試先利用經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)[13]、經(jīng)驗小波變換(Empirical Wavelet Transform,EWT)、變分模態(tài)分解(Variational Mode Decomposition,VMD)等算法將原始信號分解成多個本征模態(tài)函數(shù)(Intrinsic Mode Functions,IMF)后進(jìn)行熵復(fù)雜度特征提取的SEI方法。由于EMD算法存在模態(tài)混疊和端點效應(yīng)問題,EWT不適用于非線性時間序列的分析,VMD算法在SEI領(lǐng)域得到了更為廣泛的應(yīng)用。國內(nèi)外學(xué)者提出了諸多VMD聯(lián)合熵復(fù)雜度特征的SEI方法[14-15]。但是,多數(shù)方法仍然將單一尺度熵作為識別特征,使得識別性能的上限不高?;诙喑叨褥氐姆椒ㄟx取的特征仍然以多尺度排列熵(Multi-scale Permutation Entropy,MPE)和多尺度樣本熵(Multi-scale Sample Entropy,MSE)為主,前者未能考慮幅值之間的大小關(guān)系,后者的計算速度慢、受突變信息影響較大。
本文提出了一種基于VMD與精細(xì)復(fù)合多尺度散布熵(Refined Composite Multi-scale Dispersion Entropy,RCMDE)的SEI方法[16]。由于RCMDE擁有更高的計算精度和更強(qiáng)的細(xì)微特征提取能力,使得該方法克服了過往基于VMD和多尺度分析方法的弊端和應(yīng)用上的不足,以更小的耗時獲得了更高的識別準(zhǔn)確率。
輻射源個體的細(xì)微差異主要來源于輻射源系統(tǒng)中元器件的物理層面。一個典型的輻射源發(fā)射機(jī)系統(tǒng)如圖1所示。
圖1 典型輻射源發(fā)射機(jī)系統(tǒng)Fig.1 Typical emitter system of radiation source
在圖1中,經(jīng)數(shù)字信號處理的基帶信號被數(shù)模轉(zhuǎn)換器轉(zhuǎn)換為模擬信號,模擬信號被濾波后經(jīng)過正交的上變頻器,最后被送入功率放大器。功率放大器的作用是增大信號的強(qiáng)度和傳播距離。輻射源的個體特征主要來源于系統(tǒng)內(nèi)各元器件的容差,容差效應(yīng)使得電子元器件的實際參數(shù)值與標(biāo)稱參數(shù)值發(fā)生了偏差[17]。容差效應(yīng)在各電子元器件中普遍存在,其中,頻率源和功放的容差效應(yīng)對輻射源個體特征的形成影響較大。在輻射源發(fā)射機(jī)系統(tǒng)中,頻率源的穩(wěn)定度受振蕩電路工藝、電源電壓變化、機(jī)械振動等因素影響,難以人為控制,常常引發(fā)不可避免的載頻偏移及相位噪聲。此外,實際應(yīng)用情形下的功率放大器的輸入輸出曲線不可能嚴(yán)格線性。隨著功放輸入信號功率或幅度的持續(xù)增大,輸出信號將不可避免地產(chǎn)生非線性失真,而不同輻射源個體的非線性曲線則存在較為明顯的差異,上述因素的存在為輻射源個體發(fā)出的信號添加了“指紋”[18]。然而,伴隨著頻率源的晶體品質(zhì)以及制作工藝的不斷提升,不同輻射源發(fā)射機(jī)載波頻偏越來越接近,使得載波頻偏已難以體現(xiàn)輻射源的個體差異[18]。因此,本文主要圍繞影響輻射源個體特征的相位噪聲以及功放非線性特性進(jìn)行建模分析。
相位噪聲是指發(fā)射機(jī)系統(tǒng)在各類噪聲的作用下引起的輸出信號的相位產(chǎn)生的隨機(jī)變化。相位噪聲可由高頻振蕩器、功放等發(fā)射機(jī)器件引起。
理論上輻射源發(fā)射的信號為:
s(t)=Aej(2πfct+θn+φ0),
(1)
式中,A為信號幅度;fc為載波頻率;θn和φ0分別為信號相位和初始相位。
以相位噪聲建模輻射源個體差異,則實際的發(fā)射信號為:
x(t)=Aej(2πfct+θn+φ0+Δφ(t)),
(2)
式中,Δφ(t)為信號的相位噪聲,表達(dá)式為:
(3)
式中,Mf為調(diào)相系數(shù);fm為隨機(jī)正弦波的頻率。
在輻射源發(fā)射機(jī)中,功率放大器作為重要的元器件,起著放大信號功率的作用。理想條件下,功率放大器的增益保持不變。然而,由于制造工藝的限制以及長期使用下的損耗,即使同型號、同批次的功率放大器,其增益也存在差異。不同輻射源個體非線性特性存在的差異,為信號添加了“指紋特征”。目前,針對窄帶非理想功率放大器的建模方式主要有Taylor級數(shù)模型、Rapp模型和Basel模型等,其中Taylor級數(shù)模型應(yīng)用最為廣泛,當(dāng)功率放大器的非線性較弱時,應(yīng)用Taylor級數(shù)模型建模更能表征功放的非線性特性。Taylor級數(shù)模型的表達(dá)式為:
(4)
式中,x(t)為輸入信號;y(t)為輸出信號;an為功放Taylor級數(shù)模型的第n階參數(shù),an的不同直接導(dǎo)致了不同功率放大器的非線性差異。
VMD是在變分問題的整體框架下,最終將原始信號f(x)分解成K個中心頻率不同的IMF的自適應(yīng)分解方法[19]。
首先,定義每個IMF為調(diào)頻-調(diào)幅(FM-AM)信號,表達(dá)式為:
uk(t)=Ak(t)cos(φk(t)),
(5)
(6)
式中,ωk為各IMF的中心頻率,k=1,2,…,K。
為求解最優(yōu)解,將約束性變分問題轉(zhuǎn)化為非約束性變分問題引入二次懲罰因子α和拉格朗日乘數(shù)算子λ,得到增廣的拉格朗日函數(shù):
(7)
VMD算法運(yùn)算步驟如下:
步驟2:n=n+1,更新uk,ωk,從1循環(huán)至K,
(8)
(9)
式中,ω為頻率。
步驟3:更新λ
(10)
式中,σ為保真度系數(shù)。
步驟4:滿足
(11)
時,迭代終止,其中ε為判別精度。
在信息論領(lǐng)域,熵是由香農(nóng)提出的用于檢測時間序列動態(tài)特征的強(qiáng)大工具[20]。近似熵、樣本熵、模糊熵、排列熵和散布熵等特征被廣泛應(yīng)用于信號分類和故障檢測等領(lǐng)域[21-25]。但是,上述特征均為單一尺度提取獲得,不能完全反映序列性質(zhì)。因此,多尺度分析方法越來越受到研究者的關(guān)注。常用的多尺度模糊熵(Multi-scale Fuzzy Entropy,MFE)往往會忽略各尺度時間序列的相互關(guān)系而不能準(zhǔn)確地表征原信號,MSE及MPE存在計算復(fù)雜度高和耗時較長的問題。相較于其他多尺度熵,Azami等人[16]在散布熵的基礎(chǔ)上提出的RCMDE計算更為迅速,更適合分析長時間序列。求解RCMDE的步驟如下:
步驟1:將待分析時間序列設(shè)為uk,長度為Ψ,對uk進(jìn)行粗?;僮鳎玫降牡趆個粗粒度近似信號為
(12)
步驟2:將粗粒度近似信號a={a1,a2,…,aN}通過正態(tài)分布函數(shù)映射為b={b1,b2,…,bN},
(13)
步驟3:將b以線性變換的形式映射到{1,2,…,c},記為z,即,
(14)
式中,R()為取整運(yùn)算;c為類別個數(shù)。
步驟4:嵌入維數(shù)為m,時間延遲為d。時間序列定義為
(15)
式中,i={1,2,…,N-(m-1)d}。
步驟6:計算每種散布模式πv0v1…vm-1的概率P(πv0v1…vm-1),表達(dá)式為
(16)
步驟7:對于各尺度下的τ,RCMDE的定義如下
(17)
利用相位噪聲及功放非線性特性建模輻射源個體差異,實驗所用的信號數(shù)據(jù)均由計算機(jī)軟件仿真得到。輻射源信號參數(shù)如表1所示。各輻射源的相位噪聲和功放非線性特性參數(shù)如表2所示。單個信噪比下單個發(fā)射機(jī)產(chǎn)生的樣本個數(shù)為50。
表1 輻射源信號參數(shù)Tab.1 Parameters of signal of radiation source
表2 各輻射源的相位噪聲和功放非線性特性參數(shù)Tab.2 Phase noise and non-linear characteristic parameters of each radiation source
10 dB時,選取3個輻射源個體的某一樣本,分別繪制其時域、頻域波形,如圖2和圖3所示??芍?,3個輻射源個體發(fā)出的信號的包絡(luò)整體上較為接近,但仍然存在細(xì)微差異;3個輻射源發(fā)射信號的中心頻率一致,其他頻率下的幅值有細(xì)微差異。
(a) 個體1時域波形
(a) 個體1頻域波形
在對信號進(jìn)行VMD分解前須確定分解的層次數(shù)KVMD。KVMD值過小會造成信號的欠分解,不能提取到原始信號的最有效信息;而KVMD值過大往往會引發(fā)模態(tài)混疊現(xiàn)象,影響分類效果。因此,隨機(jī)選取某一信號樣本,對其進(jìn)行分解,通過實驗,不同KVMD值下各IMF的中心頻率如表3所示。
由表3可以看出,當(dāng)KVMD<6時,分解得到的模態(tài)分量未能提取到主要的頻率成分;KVMD=6時,主要的頻率成分1 550,1 800 Hz均被提取出。因此,本文選取的KVMD值為6。KVMD為6時,隨機(jī)選擇個體1的某一信號,對其進(jìn)行分解后各IMF的時域信號波形及頻譜如圖4所示。
表3 不同KVMD值下各IMF的中心頻率Tab.3 The center frequency of each modal component under different KVMD values 單位:Hz
(a) 原始信號和各IMF的時域波形
隨后,計算各IMF與原信號的相關(guān)系數(shù)ri,如圖5所示。IMF1~I(xiàn)MF6與原始信號的相關(guān)程度均較高,剔除任何IMF都會造成較多有效信息的損失。因此,本文選擇保留所有分量。KVMD設(shè)置為6時,對維度為1×20 000的原始時域信號序列進(jìn)行VMD分解,最終得到維度為6×20 000的IMF矩陣。
圖5 各IMF與原信號的相關(guān)系數(shù)Fig.5 Correlation coefficient of each IMF and the original signal
本文對6個有效IMF分量分別提取RCMDE,MPE,MFE等多尺度特征。由式(12)~式(17)可知,計算RCMDE需要分別設(shè)置類別個數(shù)c、嵌入維度m、時間延遲d和尺度因子τ。MPE,MFE的計算同樣需要設(shè)置m,d,τ。c,d的設(shè)置一般依從過往研究的經(jīng)驗。根據(jù)文獻(xiàn)[16]的建議,本文將c設(shè)置為6,m設(shè)置為4,d設(shè)置為1。由于τ的設(shè)置直接決定特征的維度、耗時以及識別準(zhǔn)確率,本節(jié)改變τ的取值,分別計算各IMF在不同τ值下的RCMDE,MFE,MPE,MSE等特征,隨后對比計算耗時并將特征分別輸入至支持向量機(jī)(SVM)中比較分類識別性能,SVM最優(yōu)參數(shù)通過網(wǎng)格搜索獲得。不同τ值下,計算長度為20 000的IMF的RCMDE,MDE,MSE,MPE的耗時如表4所示??芍?,MSE的計算耗時最長,計算耗時是其他特征計算耗時的10倍以上;MDE,MPE,RCMDE的計算耗時差距較小,均為1.10 s左右。
表4 各熵特征計算耗時Tab.4 Calculation time of different entropy feature 單位:s
在相同計算機(jī)配置、使用相同軟件條件下,不同τ值,RCMDE,MDE,MSE,MPE輸入至SVM中的識別準(zhǔn)確率如圖所6示。由圖6可知,不論使用何種特征,識別準(zhǔn)確率基本隨τ值增大而增大。此外,當(dāng)1≤τ≤6時,在4種特征中,RCMDE的識別準(zhǔn)確率均優(yōu)于其他特征;τ=6時,RCMDE的識別準(zhǔn)確率達(dá)到了99.237 6%,達(dá)到了最高值。
圖6 不同τ值下不同特征輸入至SVM的識別準(zhǔn)確率Fig.6 Recognition accuracy of different features input to the SVM under different τ
在權(quán)衡計算耗時和識別準(zhǔn)確率后,最終選擇RCMDE作為識別特征,其中τ設(shè)置為6,特征重構(gòu)后的維度為1×36。
在確定將維度為1×36的RCMDE矩陣作為特征向量后,按照1∶1劃分訓(xùn)練集和測試集,將訓(xùn)練集分別輸入AdaBoosting、GaussianNB、Gradient Boosting(GDBT)、 KNN、多層感知器(Multi-Layer Perceptron,MLP )、隨機(jī)森林(Random Forest,RF)、SVM等機(jī)器學(xué)習(xí)常用分類器,在參數(shù)尋優(yōu)過程中采用網(wǎng)格搜索法及5折交叉驗證,得到最優(yōu)參數(shù)分類器后將測試集樣本輸入,得到識別結(jié)果并對比各分類器識別準(zhǔn)確率。分類器參數(shù)確定后,不同機(jī)器學(xué)習(xí)方法500次蒙特卡羅實驗的平均識別準(zhǔn)確率如圖7所示。
圖7 500次蒙特卡羅實驗下不同機(jī)器學(xué)習(xí)方法的識別準(zhǔn)確率Fig.7 Recognition accuracy of different machine learning methods under 500 Monte Carlo experiments
在所選取的7種機(jī)器學(xué)習(xí)分類算法中,AdaBoosting及GaussianNB算法的分類效果遠(yuǎn)遠(yuǎn)低于其他算法;MLP,GBDT,SVM,RF的識別準(zhǔn)確率均超過了99%。各機(jī)器學(xué)習(xí)算法在樣本規(guī)模均為3 150時進(jìn)行500次蒙特卡羅實驗的耗時如表5所示。其中,GBDT,AdaBoosting以及MLP進(jìn)行500次蒙特卡羅實驗的時間均超過了270 s,遠(yuǎn)遠(yuǎn)高于其他方法。此外,GaussianNB方法耗時最短,為3.597 9 s,但是該方法識別性能較一般。RF,SVM以及KNN計算耗時較為接近,且三者識別性能均超過99%,識別性能差距微小。綜合識別性能及計算耗時表現(xiàn),本文選擇SVM作為識別算法。
表5 不同機(jī)器學(xué)習(xí)方法的計算耗時Tab.5 Calculation time of different machine learning methods
實驗1 不同樣本個數(shù)下的識別性能分析
在機(jī)器學(xué)習(xí)領(lǐng)域,部分方法受樣本個數(shù)的影響較大,在樣本量過小的時候會出現(xiàn)性能嚴(yán)重下滑的情況。本部分在其他條件不變的情況下,改變樣本個數(shù),對比識別性能,分析本文方法在小樣本條件下的性能和魯棒性。原有的樣本個數(shù)為3 150,將樣本個數(shù)設(shè)置為原有樣本個數(shù)的10%~90%,間隔為10%。訓(xùn)練集和測試集的比例為1∶1,SVM分類器的參數(shù)為3.4節(jié)尋優(yōu)后得到的數(shù)值。不同樣本個數(shù)下的識別準(zhǔn)確率如圖8所示。由圖8可知,當(dāng)樣本個數(shù)提升時,識別的準(zhǔn)確程度隨之上升,當(dāng)樣本個數(shù)達(dá)到1 890時,識別準(zhǔn)確率超過了98.9%。樣本個數(shù)為315時,識別準(zhǔn)確率達(dá)到了97.46%。這說明本文方法在小樣本條件下仍能保持較高的識別準(zhǔn)確率。
圖8 不同樣本個數(shù)下的識別準(zhǔn)確率Fig.8 Recognition accuracy under different sample numbers
實驗2 不同訓(xùn)練集占比下的識別性能分析
在本實驗中,將樣本個數(shù)設(shè)定為3 150,改變訓(xùn)練集樣本占全體樣本個數(shù)的比例,訓(xùn)練集占比10%~90%,間隔為10%。SVM分類器的參數(shù)為3.4節(jié)尋優(yōu)后得到的數(shù)值。在經(jīng)過500次蒙特卡羅實驗后,得到不同訓(xùn)練集占比下的識別準(zhǔn)確率,如圖9所示。由圖9可以看出,識別準(zhǔn)確率總體上隨著訓(xùn)練集占比的提高而提升,在訓(xùn)練集占比超過50%后,識別準(zhǔn)確率超過了99.2%,此后,訓(xùn)練集占比的提高也不會帶來明顯的性能提升。此外,當(dāng)訓(xùn)練集占比為10%時,識別準(zhǔn)確率為97.46%,這表明本文提出的方法在訓(xùn)練集占比較低時也有較好的識別性能。
圖9 不同訓(xùn)練集占比下的識別準(zhǔn)確率Fig.9 Recognition accuracy under different proportions of the training sets
實驗3 與其他文獻(xiàn)方法的對比
將本文方法命名為VMD-RCMDE,在同等的實驗條件下,與文獻(xiàn)[26]提出的VMD-LZC方法、文獻(xiàn)[14]提出的VMD-SE-PE方法以及文獻(xiàn)[15]提出的VMD-MPE-PCA方法進(jìn)行對比。LZC 指代Lempel-Ziv 復(fù)雜度。訓(xùn)練集占比為50%。本文方法與其他文獻(xiàn)方法的識別性能及不同信噪比下的識別準(zhǔn)確率如圖10和圖11所示;不同方法在樣本規(guī)模均為3 150時進(jìn)行500次蒙特卡羅實驗的耗時如表6所示。
圖10 本文方法與其他文獻(xiàn)方法的識別性能Fig.10 Recognition performances compared with other literature methods
圖11 不同方法在不同信噪比下的識別準(zhǔn)確率Fig.11 Recognition accuracy of different methods under different SNRs
由圖10和圖11可知,在-5~15 dB的信噪比范圍內(nèi),VMD-RCMDE方法總體識別性能優(yōu)于其他文獻(xiàn)方法,500次蒙特卡羅實驗的平均識別準(zhǔn)確率達(dá)到了99.237 6%;信噪比為-5 dB時,識別準(zhǔn)確率達(dá)到了93.7%,較其他方法高27%以上;信噪比在-1 dB及以上時,識別準(zhǔn)確率達(dá)到了100%。此外,VMD與熵復(fù)雜度特征結(jié)合的方法識別性能優(yōu)于VMD-LZC方法,這說明熵特征在挖掘個體指紋特征上更具有優(yōu)勢。在上述VMD與熵復(fù)雜度特征結(jié)合的方法中,VMD-RCMDE性能最優(yōu),這是由于RCMDE從多尺度進(jìn)行特征提取后得到的指紋特征更為細(xì)膩豐富。同時,不對RCMDE進(jìn)行降維操作保留了全部的有效信息,避免了識別性能的下滑。由表6可知,在同等樣本規(guī)模下進(jìn)行500次蒙特卡羅實驗,VMD-RCMDE方法耗時17.110 0 s,遠(yuǎn)低于其他方法,這說明該方法不僅提升了識別準(zhǔn)確率,還使耗時大為降低。
表6 不同方法同等樣本規(guī)模下500次蒙特卡羅實驗的耗時Tab.6 Calculation time of 500 Monte Carlo experiments with different sample sizes 單位:s
針對用于SEI的典型一維特征常常引發(fā)識別性能下滑,高維度特征維度較大、與一般分類器結(jié)合使用時計算效率較低等問題,本文提出了一種基于VMD和RCMDE的SEI方法。仿真結(jié)果表明,當(dāng)信噪比在-5~15 dB時,以IMF的RCMDE為輸入的SVM的識別準(zhǔn)確率達(dá)到99.237 6%。通過實驗,驗證了所提出的方法在樣本個數(shù)、訓(xùn)練集占比等變化時仍具有較強(qiáng)的魯棒性。最后,與其他SEI方法相比,所提出的方法在識別性能上更優(yōu)、耗時更短。