錢磊,吳昊,張濤,張江
(1.國防科技大學(xué)第六十三研究所,江蘇 南京 210007;2.國防科技大學(xué) 電子科學(xué)學(xué)院,湖南 長沙 410073)
在日趨復(fù)雜的電磁環(huán)境中,通常會接收到各種未知信號,該信號可能是己方的,也可能是敵方的,因此需要對信號的各種參數(shù)進(jìn)行分析,以加強電磁頻譜管控,調(diào)制樣式就是其中一種關(guān)鍵參數(shù)。對非協(xié)作通信中接收信號的調(diào)制樣式的識別與確定是頻譜安全防護(hù)技術(shù)的重要一環(huán),在電磁偵察、干擾信號識別、頻譜監(jiān)測等場景中都有著廣泛的應(yīng)用場景和巨大的發(fā)展?jié)摿Γ谥械托旁氡拳h(huán)境下進(jìn)行增強調(diào)制識別率的理論及方法研究是一項很重要的課題。
調(diào)制識別可以看作是一類模式識別問題,其原理就是通過提取樣本的特征進(jìn)行分類識別,主要包含三大模塊,即預(yù)處理、特征提取和分類識別。常見的信號特征提取方法有:瞬時特征[1]、高階累積特征[2]、小波變換[3]、時頻分析[4]等。決策樹[5]是常用的分類器,該方法易于理解但是泛化能力較差,于是產(chǎn)生了隨機森林(Random Forest,RF)[6]的方法,利用多棵決策樹對樣本進(jìn)行訓(xùn)練并預(yù)測的,有效地提高了泛化能力,但這兩類方法需人工確定節(jié)點,較為繁瑣。K 最鄰近(K-Nearest Neighbors,K-NN)[7]算法使用距離度量將新示例與現(xiàn)有的示例比較,以最近的類標(biāo)進(jìn)行分類。以上傳統(tǒng)的方法結(jié)構(gòu)簡單,易于理解,但是存在效率低下、惰性學(xué)習(xí)等局限性。目前更多地采用積極學(xué)習(xí)的算法,如支持向量機(Support Vector Machines,SVM)[8],把結(jié)構(gòu)風(fēng)險最小化原則應(yīng)用于分類領(lǐng)域中,擅于處理小樣本和二分類問題;神經(jīng)網(wǎng)絡(luò)(Neural Networks,NN)[9],是模擬人腦功能的一種數(shù)學(xué)模型,在多分類問題中表現(xiàn)更好。此外,相比于淺層結(jié)構(gòu)算法,深度學(xué)習(xí)通過深層非線性網(wǎng)絡(luò)結(jié)構(gòu),提取數(shù)據(jù)的內(nèi)在特征,在圖像識別和語音識別等方面取得了引人矚目的成績。調(diào)制識別和圖像識別及語音信號識別等方面存在很多關(guān)聯(lián)性和相似性,因此采用深度學(xué)習(xí)的方法來解決調(diào)制識別問題是一個切實可行的研究方向。
不同調(diào)制樣式的信號通常在頻率、幅度或相位等方面有著不同的表現(xiàn)。在數(shù)值特征提取方面,文獻(xiàn)[10]基于高階累積量提取信號特征,從而實現(xiàn)對MPSK 和MQAM 兩大類信號的識別。圖像特征提取方面,文獻(xiàn)[11]將星座圖送入卷積神經(jīng)網(wǎng)絡(luò),成功實現(xiàn)了數(shù)字調(diào)制信號的識別。文獻(xiàn)[12]通過短時傅里葉變換獲取信號的時頻特征對信號進(jìn)行識別。特征的選擇與提取是調(diào)制識別的關(guān)鍵,現(xiàn)有的研究方法多采用單一特征,但很難有一種特征能較好地體現(xiàn)信號的所有信息。
本文針對時頻圖特征對頻率信息更敏感,而對相移鍵控和正交幅度調(diào)制類信號識別率低的問題,提出了將時頻圖特征與高階累積量數(shù)值特征融合的方法,通過特征的優(yōu)勢互補,提高該算法的識別率與魯棒性。同時基于深度學(xué)習(xí)提取信號特征并分類,使系統(tǒng)具備自學(xué)習(xí)的能力,而減少人工干預(yù)。對常見的BPSK、QPSK、16QAM、64QAM、4ASK、2FSK、4FSK 信號進(jìn)行識別,首先將接收信號分為兩路,一路計算信號的高階累積量得到一維特征參數(shù)向量,一路通過平滑偽魏格納威利分布(Smooth Pseudo Wigner-Viller Distribution,SPWVD)得到特征圖像,再將圖像送入卷積神經(jīng)網(wǎng)絡(luò)得到提取的一維的圖像特征向量,最后將兩類特征向量首尾相連得到融合的特征,送入分類層進(jìn)行訓(xùn)練分類。本文所提的將高階累積量特征和時頻圖特征融合的方法具有結(jié)構(gòu)清晰、識別率高、抗噪聲性能好的優(yōu)點。相比于單一圖像特征,采用特征融合的方法能將調(diào)制信號的識別準(zhǔn)確率提高約30%。
信號的幅度、頻率及相位是較為完善的特征組合,足夠?qū)⒉煌恼{(diào)制樣式區(qū)分。如圖1 所示,高階累積量通過計算信號的高階矩,凝練信號的幅度和相位信息,而時頻分布能很好地反映信號的頻率信息。在基帶信號和中頻信號兩個不同的維度下,提取高階累積量特征和時頻圖像特征,能完整地體現(xiàn)信號的頻率、幅度及相位特征。
圖1 特征選擇示意
高階累積量(High-Order Cumulant,HOC)體現(xiàn)信號調(diào)制的特征,且高斯白噪聲二階以上的高階累積量為0,可以有效地抑制噪聲的影響。零均值復(fù)隨機信號X(t)的p+q 階混合矩:
其高階累積量定義為:
其中,cum 表示累積計算。本文提取兩個HOC 特征參數(shù)作為BPSK、QPSK、16QAM、64QAM 識別的依據(jù),其理論值為如表1 所示。
表1 高階累積量理論值
魏格納威利分布[13](WVD)由魏格納(Wigner)提出,被威利(Ville)首次用于信號處理。在此基礎(chǔ)上進(jìn)一步提出把WVD 與平滑函數(shù)進(jìn)行卷積的方法得到,接收信號x(t)的SPWVD 分布定義式為:
其中,h(τ)和g(s-t)表示窗函數(shù),分別用于時域和頻域的平滑;t 和v 分別表示時間和頻率。分布消除交叉項的效果較好,并保持了良好的時頻特征。本文采用獲取不同信號的時頻圖,如圖2 所示。
圖2 不同信號的時頻圖
為將三維圖像特征進(jìn)行降維,從而與數(shù)值特征進(jìn)行匹配,還需用卷積神經(jīng)網(wǎng)絡(luò)[14](CNN)對圖像特征進(jìn)行提取。CNN 擅長圖片空間特性的提取,可用于對信號時頻圖像的分類識別,包含輸入層、卷積層、池化層、全連接層和輸出層。
卷積層是通過滑動卷積核來對輸入的圖像做卷積操作。卷積的計算就是用卷積核與窗口矩陣對應(yīng)位置的值相乘,再加上偏置值得到卷積后的值,可表示為Y=WX+b。
池化層原理是對卷積得到的較大特征圖進(jìn)行下采樣,可以有效地縮小矩陣尺寸和緯度,進(jìn)一步減少全連接層中的參數(shù)。池化層分為最大池化層和平均池化層,最大池化層取指定矩陣內(nèi)參量的最大值,平均池化層取矩陣內(nèi)所有參量的平均值。
全連接層位于輸出層之前,卷積層和池化層之后。作用是綜合之前學(xué)習(xí)到的所有特征,并再映射到最后的樣本空間。具體來說就是將所有的神經(jīng)元與上一層的所有神經(jīng)元相連,輸出1×N 的二維矩陣形式。全連接層得到的一維特征向量就是所需要的圖像特征。
激活函數(shù)(activation function)是非線性函數(shù),將神經(jīng)元的信息激活并傳入下一層,為解決非線性問題提供支撐。本文在卷積層后采用了ReLU 函數(shù),分類時采用了Softmax 函數(shù)。
ReLU 函數(shù)可以用來解決梯度消失問題。當(dāng)輸入為非正數(shù)時,輸出值全部為0;當(dāng)輸入為正數(shù)時,輸出值等于輸入值,與卷積層搭配使用提高了神經(jīng)網(wǎng)絡(luò)的稀疏表達(dá)能力。其表達(dá)式為:
其中,max 表示取二者中的最大值。Softmax 函數(shù)通常放在CNN 的最后一層,用于對多種調(diào)制信號的分類。它的定義域是全體實數(shù),值域是分布在0~1 之間。其表達(dá)式為:
其中,xi為函數(shù)輸入,xj為函數(shù)輸出。AlexNet[15]網(wǎng)絡(luò)是在2012 年的ImageNet 競賽中取得冠軍的一個模型。本文以AlexNet 網(wǎng)絡(luò)圖像為基礎(chǔ)設(shè)計特征提取的卷積神經(jīng)網(wǎng)絡(luò)。圖像特征提取部分的網(wǎng)絡(luò)包含5 個卷積層、3 個最大池化層和3 個全連接層,經(jīng)過最后一個全連接層后得到256×1 的圖像特征向量。改造后的圖像特征提取網(wǎng)絡(luò)如表2 所示。
表2 圖像特征提取的網(wǎng)絡(luò)結(jié)構(gòu)
如圖3 所示,特征融合步驟為:
圖3 特征融合示意圖
(1)對接收信號進(jìn)行高階累積量計算,獲取一維數(shù)值特征向量;
(2)采用時頻分析方法畫出接收信號的時頻圖;
(3)將圖像輸入卷積神經(jīng)網(wǎng)絡(luò)提取其一維圖像特征向量;
(4)在全連接層將兩類特征向量相聯(lián)得到一維融合特征向量;
(5)融合后的特征向量經(jīng)過全連接網(wǎng)絡(luò)進(jìn)一步運算后通過分類器輸出。
其中時頻圖由中頻信號提取,高階累積量由基帶信號獲取,因此還需將中頻信號進(jìn)行正交下變頻處理得到復(fù)基帶調(diào)制信號。在實際發(fā)射和接收時其信號為實信號,首先通過希爾伯特變換得到接收信號s(t)的解析信號:
其中,fc為信號的載頻,可通過分析頻譜的峰值得到。經(jīng)過時頻分析和參數(shù)計算后,會得到兩種不同的特征。其中時頻圖經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)的特征提取后得到256×1的圖像特征向量。數(shù)值特征參數(shù)僅有兩個,其長度遠(yuǎn)小于圖像特征向量的長度,因此不能將這兩類特征直接串聯(lián)融合。為此提出了等權(quán)重特征融合的方法,將數(shù)值特征擴容,每類特征參數(shù)取100位,組成200×1 的數(shù)值特征向量。在全連接層,圖像特征向量與數(shù)值特征向量融合,形成456×1 的融合特征。
特征提取與融合后,還需進(jìn)行模型與分類器的訓(xùn)練。融合后的特征經(jīng)過一個256×1 和一個6×1 的全連接層以及Softmax 分類器得到分類的輸出。給出該調(diào)制識別系統(tǒng)的模型,如圖4 所示。此外要使算法具備調(diào)制識別的功能,還需借助數(shù)據(jù)集進(jìn)行訓(xùn)練,該網(wǎng)絡(luò)模型的輸入包含三維的圖像數(shù)據(jù)與一維的高階累積量數(shù)值數(shù)據(jù),在輸出端計算損失函數(shù)后,統(tǒng)一對特征提取層與全連接層的權(quán)值進(jìn)行更新。本算法在網(wǎng)絡(luò)訓(xùn)練時采用了Adam[16](Adaptive Moment Estimation)優(yōu)化算法,利用梯度的一階矩估計和二階矩估計動態(tài)調(diào)整每個參數(shù)的學(xué)習(xí)率。
圖4 特征融合后神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖
本文所采用的信號數(shù)據(jù)集均由MATLAB 生成,信號的頻率為10 kHz,采樣率為40 kHz,信號長度為512。為了測試本文算法是否有提高識別率的效果,同樣使用網(wǎng)絡(luò)對信號變換后的時頻圖直接進(jìn)行訓(xùn)練和測試,此外提取5 個高階累積量特征參數(shù)對這7 種調(diào)制信號進(jìn)行識別,得到不同信噪比下融合前后的平均識別率對比,如圖5所示??梢钥闯觯? dB 條件下,經(jīng)過特征融合平均識別率提高了10%~30%。
圖5 融合前后識別率對比
為更加清晰地看出模型對于每一類調(diào)制信號的識別效果,引入混淆矩陣?;煜仃嚨目v列表示數(shù)據(jù)真實類型,橫排表示預(yù)測類型,對角線的數(shù)據(jù)即為預(yù)測準(zhǔn)確率。通過混淆矩陣可以直觀地看出算法預(yù)測的準(zhǔn)確率,以及錯判到哪些類型,作為特征選取的依據(jù)。首先給出單一圖像特征和單一高階累積量特征在1 dB 識別的混淆矩陣,如圖6 和圖7 所示。
圖6 時頻圖預(yù)測混淆矩陣
圖7 高階累積量預(yù)測混淆矩陣
可以看出,時頻圖方法雖然對ASK、FSK 類信號識別率高,但是對PSK 和QAM 類識別效果不理想,預(yù)測準(zhǔn)確率不到30%,而高階累積量的方法對PSK 和QAM的識別效果較好,因此融合高階累積量特征以提高其整體的識別率。
圖8 為經(jīng)過特征融合后在1 dB 時的混淆矩陣,可以看出本文提出的特征融合的方法相比于單一圖像特征對PSK 和QAM 類的預(yù)測平均準(zhǔn)確率大幅提升,從不足50%提高到了70%以上,相比于單一數(shù)值特征,對FSK和ASK 類的識別率提高到了100%。也由于區(qū)分16QAM和64QAM 的特征參數(shù)區(qū)分度不足,導(dǎo)致QAM 類的識別率較低,這也是下一步需要改進(jìn)的方向。實驗證明本文算法在利用圖像特征保持對ASK、FSK 類信號較高水平的識別率的同時,通過加入高階累積量特征進(jìn)行特征融合,有效地提高了對PSK 與QAM 類信號的識別率。
圖8 特征融合后預(yù)測混淆矩陣
本文對接收數(shù)字信號基于高階累積量計算提取了兩種特征參數(shù),并通過時頻分布獲取時頻圖像并利用卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征,基于這兩類特征的融合實現(xiàn)了對7 種調(diào)制信號的識別。與僅使用時頻圖進(jìn)行分類的算法對比,該算法具有結(jié)構(gòu)清晰、區(qū)分度高以及抗噪聲性能強的優(yōu)點,在保持對FSK 和ASK 信號的高區(qū)分度的同時,明顯地提高了低信噪比時的PSK 與QAM 類信號識別成功率,整體識別率提高了10%~30%,在1 dB 的條件下部分調(diào)制的識別準(zhǔn)確率達(dá)到了100%。