王紅衛(wèi) 董鵬宇 陳 游 周一鵬 肖冰松
(空軍工程大學(xué)航空工程學(xué)院 西安 710038)
雷達(dá)信號(hào)識(shí)別是電子偵察系統(tǒng)的關(guān)鍵環(huán)節(jié),為后續(xù)的目標(biāo)識(shí)別、定位、威脅告警等提供重要的先驗(yàn)信息[1,2]。當(dāng)接收機(jī)接收到信號(hào)時(shí),提取雷達(dá)信號(hào)的脈沖描述字等參數(shù)[3],并通過與先驗(yàn)知識(shí)庫進(jìn)行比較來判斷輻射源信號(hào)樣式以及目標(biāo)類型。然而隨著電子戰(zhàn)環(huán)境的復(fù)雜度越來越高,這些經(jīng)典參數(shù)的識(shí)別效果越來越不適應(yīng)環(huán)境的變化,為了適應(yīng)現(xiàn)代新體制雷達(dá)輻射源信號(hào)識(shí)別的需要,脈內(nèi)特征參數(shù)成為研究的熱點(diǎn),基于信號(hào)脈內(nèi)特征的輻射源信號(hào)識(shí)別自然成為研究的突破口[4]。
雷達(dá)信號(hào)識(shí)別技術(shù)可以分為3類:第1類是基于對(duì)系統(tǒng)參數(shù)的匹配分析,隨著電磁環(huán)境越來越復(fù)雜,該方法已經(jīng)無法適應(yīng)作戰(zhàn)需求;第2類是基于人工智能的識(shí)別分析,包括專家系統(tǒng)[5]、人工神經(jīng)網(wǎng)絡(luò)[6]和進(jìn)化算法[7];第3類是脈內(nèi)特征參數(shù)分析,提取的特征諸如能量聚焦效率檢驗(yàn)[8]、模糊函數(shù)多普勒切片[9]以及時(shí)頻特征[10,11],這些新特征的挖掘打破了雷達(dá)輻射源信號(hào)識(shí)別對(duì)于5大參數(shù)的依賴。另外,用于解決雷達(dá)信號(hào)識(shí)別問題的分類器主要包括監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。一些學(xué)者將K-means聚類[12]、K近鄰算法[13]等無監(jiān)督學(xué)習(xí)算法用于雷達(dá)輻射源信號(hào)識(shí)別過程,其操作簡(jiǎn)單成本低。但是因?yàn)闊o標(biāo)簽,導(dǎo)致最終識(shí)別結(jié)果不理想;還有一些學(xué)者將模板匹配法[14]、支持向量機(jī)[15,16]等監(jiān)督學(xué)習(xí)算法用于信號(hào)識(shí)別過程,得到較好的識(shí)別效果,但是其學(xué)習(xí)過程需要大量先驗(yàn)信息,而現(xiàn)今復(fù)雜電磁環(huán)境下偵察方對(duì)復(fù)雜體制雷達(dá)信號(hào)往往得不到充足的先驗(yàn)信息,必然在非合作識(shí)別中存在缺陷,制約其對(duì)復(fù)雜體制雷達(dá)信號(hào)識(shí)別的推廣。對(duì)于非合作偵察來說,偵察方能夠得到的往往是少量的標(biāo)記樣本,大量的數(shù)據(jù)都是未標(biāo)記過的。如果只使用少量的標(biāo)記樣本進(jìn)行訓(xùn)練,一方面使用它們所訓(xùn)練出的學(xué)習(xí)系統(tǒng)往往很難具有強(qiáng)泛化能力;另一方面,大量的未標(biāo)記樣本不被利用也是對(duì)數(shù)據(jù)資源的一種浪費(fèi)。對(duì)此,研究人員提出了使用大量未標(biāo)記樣本來改善學(xué)習(xí)性能的半監(jiān)督算法,不僅較好地克服了監(jiān)督學(xué)習(xí)模型泛化能力不強(qiáng)的缺點(diǎn),也對(duì)無監(jiān)督學(xué)習(xí)模型不精確的缺點(diǎn)進(jìn)行了改善,使其成為機(jī)器學(xué)習(xí)領(lǐng)域研究的熱點(diǎn)方向[17]。
考慮到傳統(tǒng)方法在雷達(dá)信號(hào)非合作識(shí)別存在的不足,本文將樸素貝葉斯(Na?ve Bayes, NB)和半監(jiān)督學(xué)習(xí)結(jié)合,提出了改進(jìn)的半監(jiān)督樸素貝葉斯(Improved Semi-supervised Na?ve Bayes, ISNB)學(xué)習(xí)算法并將其用于非合作雷達(dá)信號(hào)識(shí)別過程。在特征提取方面,考慮到低信噪比下的噪聲導(dǎo)致Choi-Williams時(shí)頻分布(Choi-Williams Distribution,CWD)圖像惡化嚴(yán)重,使得識(shí)別效果不佳,本文基于時(shí)頻變換得到一個(gè)在識(shí)別工作中有優(yōu)勢(shì)的特征—能量累積量,并將其定義為輸入特征向量;在分類器設(shè)計(jì)方面,利用ISNB算法在無標(biāo)記樣本集生成的置信度列表中選取置信度較高的樣本添加到有類標(biāo)號(hào)樣本集中,從而有效避免迭代失誤,進(jìn)而實(shí)現(xiàn)對(duì)雷達(dá)信號(hào)的準(zhǔn)確識(shí)別。
本文研究的雷達(dá)輻射源脈內(nèi)信號(hào)包括以下6種:線性調(diào)頻(Linear Frequency Modulated,LFM)、非線性調(diào)頻(Non-Linear Frequency Modulated,NLFM)、正弦調(diào)頻(Sine Frequency Modulated,SFM)、Frank編碼、相移鍵控(Quadrature Phase Shift Keying, QPSK)以及PSK/FSK混合編碼信號(hào)。
常用的時(shí)頻分析方法有:短時(shí)傅里葉變換(Short Time Fourier Transform, STFT), Wigner-Ville分布(Wigner-Ville Distribution, WVD),Choi-Williams分布(CWD)等。其中,CWD克服了STFT和WVD的缺點(diǎn),不僅有較高的時(shí)頻分辨率,還能夠抑制和消除交叉項(xiàng)[18]。所以,本文選取CWD獲得調(diào)制信號(hào)的時(shí)頻分布圖像。其表達(dá)式為
圖1給出了信噪比在10 dB時(shí)上述6種信號(hào)的CWD 2維圖像。其中,F(xiàn).S.和T.S.分別為頻率序列長(zhǎng)度和時(shí)間序列長(zhǎng)度。
文獻(xiàn)[19]提出了基于CWD和CNN的雷達(dá)輻射源信號(hào)識(shí)別方法,在低信噪比條件下,噪聲對(duì)于信號(hào)的CWD圖像影響較大,造成了時(shí)頻圖像的嚴(yán)重失真,因此低信噪比條件下的識(shí)別效果較差。圖2給出了信噪比在–5 dB時(shí)6種信號(hào)的CWD2維時(shí)頻圖,從圖2可以清晰地看出,低信噪比條件下信號(hào)被噪聲淹沒得很嚴(yán)重,如果僅從CWD時(shí)頻圖進(jìn)行信號(hào)識(shí)別,識(shí)別效果定然不理想。
在對(duì)高信噪比和低信噪比條件下調(diào)制信號(hào)CWD時(shí)頻2維圖進(jìn)行對(duì)比分析后,可以看出雖然噪聲對(duì)時(shí)頻分布有較大的影響,但其大部分時(shí)頻能量仍保留。定義時(shí)頻分布能量點(diǎn)隨時(shí)間序列在每一個(gè)頻率點(diǎn)上的累積為能量累積量,定義式為
其中,m為時(shí)間序列,n為頻率序列,p為CWD時(shí)頻分布時(shí)間序列的長(zhǎng)度,q為CWD時(shí)頻分布頻率序列的長(zhǎng)度。
圖3給出了6種信號(hào)在信噪比為10 dB條件下的CWD能量累積量圖,從圖3中可以看出,不同調(diào)制模式信號(hào)的時(shí)頻圖像的能量累積量圖的形狀是不同的,為后續(xù)識(shí)別提供了良好的依據(jù)。
圖4給出了6種信號(hào)在信噪比為-5 dB條件下的CWD能量累積量圖,從圖4中可以看出,雖然不同調(diào)制模式信號(hào)的時(shí)頻圖像的能量累積量圖的形狀受到噪聲的污染比較嚴(yán)重,但是相比于信號(hào)CWD時(shí)頻圖像來說,其保留了足夠的峰值和寬度,其形狀的不同足夠使后續(xù)的識(shí)別系統(tǒng)識(shí)別不同的調(diào)制信號(hào)。
圖1 6種調(diào)制信號(hào)在信噪比為10 dB時(shí)的CWD時(shí)頻分布圖
圖2 6種調(diào)制信號(hào)在信噪比為–5 dB時(shí)的CWD時(shí)頻分布圖
復(fù)雜電磁環(huán)境中接收到的雷達(dá)信號(hào)由于噪聲的影響其CWD圖像會(huì)發(fā)生嚴(yán)重失真。本文在將特征參數(shù)輸入信號(hào)識(shí)別網(wǎng)絡(luò)之前,對(duì)時(shí)頻分布矩陣作如下處理,設(shè)時(shí)頻分布矩陣為Ap×q,為了更好地進(jìn)行降噪處理,將矩陣Ap×q轉(zhuǎn)換為向量α=[α1, α2,···, αp]。其中,αi是矩陣Ap×q的行向量。
對(duì)于α,其0均值歸一化由式(3)求得
其中,mean(α)是向量α中所有元素值的均值,var(α)是向量中所有元素值的方差。
圖3 6種調(diào)制信號(hào)在信噪比為10 dB時(shí)的CWD時(shí)頻能量積累圖
圖4 6種調(diào)制信號(hào)在信噪比為–5 dB時(shí)的CWD時(shí)頻能量積累圖
然后對(duì)新的向量α*進(jìn)行如式(4)的操作
由式(3)和式(4)去除噪聲點(diǎn),顯然,進(jìn)行1次式(4)的操作只能去除一部分噪聲。為了得到更好的降噪性能,需要重復(fù)式(3)、式(4)至少6次[20]。
然后,將處理后的向量α*轉(zhuǎn)化為矩陣A*p×q。由式(2)求得新的特征向量,經(jīng)過歸一化處理得
圖5展示了對(duì)NLFM信號(hào)去噪前后的CWD圖像、EC-CWD和EC-CWD振幅直方圖的對(duì)比。從CWD圖像可以看出,圖5(c)的大部分噪聲已經(jīng)消除了。另外,圖5(d)—圖5(f)顯示了經(jīng)過降噪預(yù)處理后,EC-CWD保留了脈沖信號(hào)的顯著特征,圖5(g)—圖5(i)的振幅直方圖表明了本文降噪方法是可行的。
樸素貝葉斯分類算法的基本思想是根據(jù)貝葉斯定理,首先計(jì)算出測(cè)試樣本數(shù)據(jù)特征的先驗(yàn)概率,進(jìn)而估計(jì)出其屬于某一類別的后驗(yàn)概率,最后預(yù)測(cè)出該樣本數(shù)據(jù)的類別[21]。假設(shè)雷達(dá)信號(hào)特征分布為正態(tài)分布,通過提取訓(xùn)練樣本的特征向量對(duì)分類器進(jìn)行學(xué)習(xí),得到訓(xùn)練后的分類器的參數(shù),即均值向量mi=(mi1, mi2, ···, min)和方差向量σi=(σi1, σi2,···, σin),則根據(jù)正態(tài)分布概率公式有
則NB模型為
半監(jiān)督樸素貝葉斯識(shí)別算法綜合了監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)兩者的優(yōu)點(diǎn),能夠同時(shí)利用少量的有標(biāo)簽樣本數(shù)據(jù)和大量的無標(biāo)簽樣本數(shù)據(jù)來進(jìn)行識(shí)別。設(shè)有標(biāo)簽的數(shù)據(jù)集為l,無標(biāo)簽的數(shù)據(jù)集為u。貝葉斯分類算法根據(jù)有標(biāo)簽的訓(xùn)練集來預(yù)測(cè)測(cè)試樣本集數(shù)據(jù)的類別,根據(jù)貝葉斯定理有
圖5 NLFM信號(hào)降噪前后的CWD, EC-CWD及振幅直方圖
其中,P(Xk/Ci)(l+u)和P(Ci)(l+u)的計(jì)算包含了無標(biāo)簽數(shù)據(jù)中的高置信度數(shù)據(jù)集[22,23]。
半監(jiān)督樸素貝葉斯分類算法在對(duì)雷達(dá)信號(hào)進(jìn)行分類識(shí)別時(shí),首先利用少量的有標(biāo)簽的樣本數(shù)據(jù)對(duì)分類器進(jìn)行訓(xùn)練,然后利用訓(xùn)練好的分類對(duì)無標(biāo)簽數(shù)據(jù)進(jìn)行識(shí)別,得到無標(biāo)簽數(shù)據(jù)的類標(biāo)簽,將識(shí)別到的無標(biāo)簽數(shù)據(jù)的類標(biāo)簽連同原始樣本數(shù)據(jù)一起加入有標(biāo)簽的樣本集中進(jìn)一步訓(xùn)練分類器,提高對(duì)測(cè)試集數(shù)據(jù)預(yù)測(cè)的準(zhǔn)確性。但是其存在一個(gè)問題,在對(duì)測(cè)試集進(jìn)行預(yù)測(cè)的過程中,一旦預(yù)測(cè)錯(cuò)誤,則會(huì)導(dǎo)致在迭代的過程中將大量的錯(cuò)誤類標(biāo)簽的數(shù)據(jù)集添加到有標(biāo)簽的樣本訓(xùn)練集中,從而降低識(shí)別的正確率。
針對(duì)上述SNB算法存在的問題,本文提出了改進(jìn)的半監(jiān)督樸素貝葉斯算法(ISNB)。改進(jìn)的算法沒有將無標(biāo)簽數(shù)據(jù)全部加入到初始樣本中,而是選取其中置信度較高的樣本,這樣極大地提高了訓(xùn)練樣本的正確率。在對(duì)后續(xù)測(cè)試集進(jìn)行分類識(shí)別時(shí),將會(huì)得到更加準(zhǔn)確的結(jié)果,再利用預(yù)測(cè)后的分類結(jié)果對(duì)分類器參數(shù)(即特征期望向量mi和方差向量σi)進(jìn)行改進(jìn),從而提高分類準(zhǔn)確率。
對(duì)于基本的SNB算法,在式(9)中,需要計(jì)算多個(gè)概率的連乘,可能會(huì)造成結(jié)果的偏差,對(duì)乘積取對(duì)數(shù),將連乘變成連加。改進(jìn)后的SNB算法分類器表示為
步驟 3 將Ai中數(shù)值最大的Aimax返回并將其添加到置信度列表Clist中,令|U|=|U|–1,若|U|不為0,則返回步驟1;
步驟 4 將置信度列表中樣本xj根據(jù)Ai的數(shù)值從大到小進(jìn)行排列,取出前M個(gè)Ai所對(duì)應(yīng)的樣本,將其添加至有標(biāo)簽數(shù)據(jù)集L中,完成對(duì)樣本集的更新。
本文提取雷達(dá)信號(hào)CWD時(shí)頻能量積累量作為特征,利用改進(jìn)的半監(jiān)督樸素貝葉斯作為分類器,進(jìn)而完成對(duì)輻射源信號(hào)的識(shí)別。具體流程為:首先對(duì)接收到的雷達(dá)輻射源信號(hào)進(jìn)行參數(shù)提取和分選預(yù)處理;然后對(duì)輻射源信號(hào)求取CWD時(shí)頻圖像并進(jìn)行降噪預(yù)處理,提取其能量累積量作為特征參數(shù),選取部分有標(biāo)簽樣本的特征參數(shù)對(duì)分類器進(jìn)行訓(xùn)練;利用初始樣本訓(xùn)練完分類器之后,對(duì)沒有標(biāo)簽的數(shù)據(jù)進(jìn)行特征提取,并利用初始分類器進(jìn)行分類,每次更新迭代過程中,選取沒有標(biāo)簽樣本中預(yù)測(cè)準(zhǔn)確度較高的樣本加入訓(xùn)練集,再次對(duì)分類器進(jìn)行訓(xùn)練和修正,直到分類器參數(shù)滿足收斂性條件;最后利用訓(xùn)練好的分類器對(duì)接收到的雷達(dá)輻射源信號(hào)進(jìn)行分類和識(shí)別。
具體識(shí)別流程如圖6所示。
仿真采用6種典型的雷達(dá)信號(hào)進(jìn)行分類識(shí)別,分別為L(zhǎng)FM, NLFM, SFM, BPSK, QPSK, PSK/FSK。載頻設(shè)置為10 MHz,采樣頻率設(shè)置為100 MHz,脈寬設(shè)置為10 μs; LFM和NLFM的帶寬設(shè)置為5 MHz,其中LFM信號(hào)的調(diào)頻斜率設(shè)為0.5 MHz/μs, NLFM信號(hào)采用的多項(xiàng)式為f(t) =Bt/τ + Bt2/τ2; BPSK信號(hào)采用的編碼方式為{1, 1,1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1}, QPSK信號(hào)采用弗蘭克編碼方式;PSK/FSK信號(hào)的跳頻設(shè)置為2 MHz。
圖6 輻射源信號(hào)識(shí)別流程
將本文提出的CWD能量積累特征作為圖6識(shí)別流程的輸入,6種雷達(dá)信號(hào)時(shí)域長(zhǎng)度設(shè)為1000,能量累積量的長(zhǎng)度為500,每種信號(hào)提取500組樣本數(shù)據(jù),在此基礎(chǔ)上完成半監(jiān)督分類器的訓(xùn)練和分類識(shí)別。
本文采用Micro-precision標(biāo)準(zhǔn)[24]來計(jì)算識(shí)別率,具體公式為
設(shè)Clist.size為數(shù)據(jù)置信度列表的大小,將M值設(shè)為Clist.size×40%,且分類器參數(shù)收斂條件為α=0.05。對(duì)每一種雷達(dá)信號(hào),隨機(jī)選取樣本的5%,10%, 15%, 20%, 25%作為有標(biāo)簽樣本,剩余的作為無標(biāo)簽數(shù)據(jù)樣本,將改進(jìn)半監(jiān)督算法同傳統(tǒng)的半監(jiān)督算法進(jìn)行對(duì)比,仿真結(jié)果如表1所示。
從表1實(shí)驗(yàn)結(jié)果可看出,對(duì)于實(shí)驗(yàn)的6種雷達(dá)信號(hào),隨著有標(biāo)簽樣本比例的增加,改進(jìn)半監(jiān)督樸素貝葉斯算法(ISNB)的識(shí)別率要高于傳統(tǒng)的半監(jiān)督樸素貝葉斯算法(SNB),說明改進(jìn)后的SNB算法具有一定的優(yōu)勢(shì)。但是在實(shí)驗(yàn)的過程中,也發(fā)現(xiàn)了存在SNB算法識(shí)別率高于ISNB算法的情況,這是因?yàn)樵璖NB算法會(huì)使更多的數(shù)據(jù)加入有標(biāo)簽樣本集,這樣就使得信號(hào)樣本集中大多數(shù)都是準(zhǔn)確率較高的數(shù)據(jù);而改進(jìn)后的SNB算法是靠M值調(diào)整后續(xù)加入的準(zhǔn)確度的數(shù)據(jù)的,這樣就導(dǎo)致大量的高預(yù)測(cè)準(zhǔn)確度的數(shù)據(jù)無法添加至有標(biāo)簽樣本集中,使得其識(shí)別率不如原SNB算法。這樣也可以得出這樣的結(jié)論,當(dāng)信號(hào)樣本集中預(yù)測(cè)結(jié)果準(zhǔn)確率整體較高時(shí),應(yīng)選取較大的M值,也就是將盡量多的高準(zhǔn)確率的無標(biāo)簽樣本加入至訓(xùn)練集中;另一方面,若對(duì)無標(biāo)簽樣本的預(yù)測(cè)不是很準(zhǔn)確,應(yīng)選取較小的M值,此時(shí)應(yīng)將盡可能少的那部分高置信度的樣本加入至訓(xùn)練集中,而避免添加大量預(yù)測(cè)程度不高的無標(biāo)簽樣本,進(jìn)而對(duì)預(yù)測(cè)結(jié)果的正確性產(chǎn)生影響。
從圖7可看出,ISNB算法較SNB算法具有更好的分類性能。該方法通過提取高置信度的無標(biāo)簽樣本添加到訓(xùn)練集中,使得訓(xùn)練樣本集中始終保留的是高質(zhì)量的樣本,從而避免了傳統(tǒng)的SNB將預(yù)測(cè)的全部無標(biāo)簽樣本添加至有標(biāo)簽樣本集會(huì)產(chǎn)生迭代錯(cuò)誤的缺陷,提高了對(duì)測(cè)試樣本集的分類準(zhǔn)確率。
文獻(xiàn)[25]采用主成分分析法(Principal Component Analysis, PCA)對(duì)雙譜進(jìn)行降維從而提取出特征向量,下面使用此特征提取方法提取4種信號(hào)的特征向量,將本文提出的算法與SNB算法、文獻(xiàn)[19]算法和PCA-SVM算法進(jìn)行比較,當(dāng)有標(biāo)記樣本比例為25%時(shí)在不同信噪比下對(duì)4種LPI雷達(dá)信號(hào)進(jìn)行識(shí)別,識(shí)別結(jié)果如表2所示。
從表2中可以看出,相比于SNB算法和PCA-SVM算法,本文ISNB算法在不同信噪比下的識(shí)別率較高,識(shí)別效果較好。由于SNB算法將預(yù)測(cè)到的所有特征樣本都添加至有標(biāo)記樣本,會(huì)產(chǎn)生迭代錯(cuò)誤進(jìn)而降低識(shí)別率;而采用PCA-SVM算法時(shí),對(duì)信號(hào)進(jìn)行雙譜對(duì)角切片提取后的維數(shù)依然很高,此時(shí)訓(xùn)練出的SVM分類器學(xué)習(xí)能力不強(qiáng),識(shí)別效果不太理想;ISNB算法通過提取CWD時(shí)頻分布能量累積量作為特征,然后生成置信度列表進(jìn)而選取預(yù)測(cè)準(zhǔn)確度較高的特征樣本,極大地提高了識(shí)別率,因而對(duì)于6類LPI雷達(dá)信號(hào)的識(shí)別更有效。
本文針對(duì)先驗(yàn)信息殘缺的非合作電子偵察背景下的雷達(dá)輻射源信號(hào)識(shí)別問題,提出了基于半監(jiān)督條件下樸素貝葉斯和Choi-Williams時(shí)頻分布能量積累的識(shí)別算法,具體完成了以下內(nèi)容:
表1 兩種方法在不同標(biāo)記樣本下的識(shí)別效果比較
圖7 兩種算法平均識(shí)別率對(duì)比
表2 不同信噪比下的識(shí)別正確率
(1) 在特征提取部分,本文針對(duì)低信噪比條件下雷達(dá)信號(hào)Choi-Williams時(shí)頻分布出現(xiàn)嚴(yán)重失真的問題,提出了時(shí)頻能量積累量這一新的特征用于后續(xù)分類器的輸入,在經(jīng)過降噪處理后,可以獲得更加清晰的新特征包絡(luò),不僅有助于為后續(xù)分類器的分類識(shí)別工作,而且拓寬了電子偵察中的信息維度;
(2) 針對(duì)傳統(tǒng)的半監(jiān)督樸素貝葉斯算法在更新訓(xùn)練樣本集過程中會(huì)產(chǎn)生迭代錯(cuò)誤的不足,通過在無標(biāo)簽樣本集生成的置信度列表中選取置信度高的樣本添加到有標(biāo)簽樣本集中,再利用預(yù)測(cè)后的分類結(jié)果對(duì)分類器參數(shù)進(jìn)行修正,進(jìn)而構(gòu)建改進(jìn)的SNB分類器,有效解決了傳統(tǒng)SNB算法分類精度低且分類性能不穩(wěn)定的缺點(diǎn)。
(3) 本文從理論論證了所提方法的可行性,并與經(jīng)典算法進(jìn)行對(duì)比,通過仿真驗(yàn)證了算法的有效性,為非合作偵察中輻射源信號(hào)的識(shí)別提供了新思路。