向 建,高 勇
(四川大學 電子信息學院,成都 610065)
自動調制識別是頻譜感知、電子對抗和防御等領域中的重要技術之一[1-2]。傳統(tǒng)的基于人工提取特征的調制識別算法分類精度不如預期。近年來,研究人員采用基于深度學習(Deep Learning,DL)的自動調制識別(Automatic Modulation Recognition,AMR)算法極大地提高了對輸入數據提取高維特征的能力,從而使通信系統(tǒng)能夠以更高的精度識別復雜多樣的調制方式[3]。
業(yè)界學者已經提出了許多基于DL的AMR方法。文獻[4]對調制信號的同相和正交分量(IQ)數據進行仿真實驗,展示了卷積神經網絡、殘差網絡(ResNet)等網絡結構進行調制分類的性能,得出分類精度不受網絡深度的限制的結論。隨著基于深度學習的AMR方法的發(fā)展,研究人員開始從數據預處理和深度學習模型改進兩方面來提高分類性能。文獻[5]提出將IQ數據轉換為振幅和相位信息,在使用長短期記憶網絡(Long Short-Term Memory,LSTM)模型的試驗中取得了相對于IQ數據更好的效果,突出了數據預處理和適當的數據表示的重要性。文獻[6]提出用二值星座圖表示調制信號,并用灰度圖像和三通道圖像優(yōu)化星座的表示。文獻[7]采用星座圖對難以區(qū)分的調制方式如16QAM和64QAM進行分類,提出用密度窗來捕獲這兩種調制模式的數據分布差異。實踐中僅使用單一網絡進行調制分類對提高分類精度有一定限制,文獻[8]提出了卷積神經網絡(Convolutional Neural Network,CNN)和LSTM神經網絡并聯(lián)的網絡結構,將原始IQ數據直接送入,可在較低信噪比下取得較好的識別率。
本文提出一種新的基于并聯(lián)GRU-CNN神經網絡的AMR方法。首先,對IQ數據進行極坐標轉換,同時對IQ數據做自相關處理;然后,將極坐標下的數據送入GRU網絡,自相關序列送入CNN網絡;而后將兩個網絡的輸出拼接起來,最后進行調制方式分類。經實測信號測試,本文所提方法在低信噪比下對8種相位調制或正交振幅調制信號都能取得較高的識別率。
本文主要討論目前通信過程中常見的相位調制和正交振幅調制信號,包括BPSK、QPSK、8PSK、π/4-DQPSK、16QAM、32QAM、64QAM和128QAM。信號的基帶波形可以表示為
(1)
式中:sn表示發(fā)送端所發(fā)送的第n個符號,g(t)表示等效濾波器,w(t)表示零均值的加性高斯白噪聲。不同的調制方式,符號序列呈現的樣式也不同。
對于PSK類信號,有
(2)
對于QAM類信號,有
sn=an+jbn。
(3)
本文在接收端得到的符號序列表示為
X(n)=I(n)+jQ(n) ,
(4)
因此,
(5)
(6)
那么IQ采樣信號就可以表示成一個2行L列的實值矩陣:
(7)
門控循環(huán)單元(Gated Cycle Unit,GRU)是循環(huán)神經網絡(Recurrent Neural Network,RNN)的一種,能使每個循環(huán)單元適應性地捕獲不同時間范圍的依存關系。與LSTM一樣,GRU也是為了解決RNN長期記憶和反向傳播中的梯度消失與梯度爆炸問題而提出的。如圖1所示,類似于LSTM,GRU也具有門控單元,用來調節(jié)單元內部的信息流,但是它比LSTM少了單獨的存儲單元。
圖1 門控循環(huán)單元
(8)
(9)
式中:σ是Sigmoid函數。在現有狀態(tài)和新計算的狀態(tài)之間進行線性求和的操作類似于LSTM,但是GRU不采用任何機制來控制其狀態(tài)暴露的程度,而是每次都會暴露整個狀態(tài)。在傳統(tǒng)循環(huán)單元中,其隱層單元可用如下公式計算:
ht=g(Wxt+Uht-1) 。
(10)
(11)
(12)
這些單元之間共享的最顯著特征是它們從t更新到t+ 1的加性成分,這是傳統(tǒng)循環(huán)單元所缺乏的。傳統(tǒng)的循環(huán)單元始終使用根據當前輸入和先前的隱藏狀態(tài)計算出的新值來替換激活的數值或單元的內容。
另一方面,GRU保留現有內容并在其之上添加新內容(見式(8))。這種加性具有兩個優(yōu)點:首先,很長一段時間,每個單元很容易記住輸入流中存在的特定特征,由GRU的更新門決定的任何重要功能都不會被覆蓋,而是保持原樣;第二,也更重要的是,這樣的操作只取本時刻和前一時刻的值就可將單元更新,使誤差容易反向傳播,而不會由于通過多個有界非線性單元而過快地消失,從而降低了由于梯度消失造成的困難[9-10]。
GRU神經網絡在調制識別中面臨的問題在于其只考慮到信號的時序關系而沒有考慮到星座點的空間結構。
基于CNN的AMR是近年來發(fā)展起來的一種新的調制分類算法[11-13]。一個簡單的CNN模型由輸入層、池化層、完全連接層和輸出層組成。卷積層主要用于提取輸入數據的特征,并在下一步進行處理。池化層可以在一定程度上降低特征維數,避免過擬合。完全連接層在整個CNN模型中充當分類器,它利用前幾層的結果對輸入數據進行分類,實現CNN模型的功能。CNN中除輸入層外的每一層都需要一個合適的激活函數。本文中激活函數一律采用Mish:
f(x)=x×tanh(ln(1+ex)) 。
(13)
Mish上無邊界(即正值可以達到任何高度)的特點避免了由于封頂而導致的飽和,其理論上允許輕微負值梯度流的存在。同時,平滑的激活函數允許信息更好地深入神經網絡,從而得到更高的識別準確率和泛化能力。
CNN神經網絡在調制識別中面臨的問題在于只考慮了星座點的空間結構而沒有考慮到信號最主要的時序特點。
不同的神經網絡有著各自獨特的提取特征能力。CNN使用卷積核提取表示空間局部的特征,GRU更適合于處理時間序列數據。受文獻[5]、[8]和[14]啟發(fā),結合GRU和CNN各自的優(yōu)勢,具體而言,CNN用于提取空間局部相關特征,而GRU用于提取時間特征,本文將GRU與CNN并聯(lián),應用于調制識別的研究中,如圖2所示。
圖2 GRU-CNN并聯(lián)網絡結構
在CNN網絡模型中,我們使用了基于序列自相關的方法進行輸入信號預處理。
自相關描述的是一個信號在不同時刻的相似程度,所以是一個序列的前后樣值相關。對信號求其自相關序列,其局部也含有了整體的信息,這可以用來彌補以往認知中的CNN感受野(Receptive Field)不足,只針對局部信息而不包含總體信息的問題。自相關函數的定義如下:
(14)
將式(4)代入式(14)中得
[I(n+m)+jQ(n+m)]=
j[I(n)Q(n+m)-Q(n)I(n+m)],
(15)
則自相關序列的實部和虛部分別為
I(n)I(n+m)+Q(n)Q(n+m)′,
(16)
I(n)Q(n+m)-Q(n)I(n+m)。
(17)
容易證明
(18)
(19)
由式(14)~(19)可以得出,經過自相關函數,序列長度增加一倍,對于復數來說,其自相關函數是厄爾米特(Hermite)函數,即實部是偶對稱序列,虛部是奇對稱序列。所以IQ數據經過自相關函數后得到的序列中有一半是重復的信息,在本文中我們只取后半段。
將原始笛卡爾坐標系下的IQ數據轉換到極坐標下,作為GRU的輸入。極坐標下的極徑和極角[5]分別為
(20)
(21)
式中:R(n)和P(n)分別代表調制信號的幅度和相位。轉換坐標系的原因在于注意到時間記憶網絡的特點,其能夠在極坐標下更敏銳地察覺到PSK和QAM信號關于相位和振幅的變化規(guī)律。
網絡結構見圖2,其中GRU的輸入為2×200的原始IQ數據轉換到極坐標下的數據,極徑采用L2范數歸一化,極角歸一化到-1~1之間,采用的是兩層均為128 unit的GRU,后接一Dense層。輸入CNN的數據為IQ數據的自相關序列X′,格式為2×200的矩陣。采用兩層CNN,卷積核個數均為64,kernel size分別為2×7和1×7,步長都為4。兩個網絡的權值均采用Xavier初始化方法[15],其保證了各層的激活值和狀態(tài)梯度的方差在傳播過程保持一致,使得信息在網絡中更好地流動。
待識別信號集包括BPSK、QPSK、8PSK、π/4-DQPSK、16QAM、32QAM、64QAM和128QAM,實驗數據采集自一發(fā)一收的兩臺NI USRP-2930軟件無線電設備。如不作特殊說明,本文試驗中的訓練集為以上提到的8種調制信號,載頻915 MHz,成形濾波器采用滾降系數為0.35的根升余弦濾波器,碼速率500 ksymbol/s,IQ采樣率2 MHz,每種調制信號均含35 000個長度為200的樣本,信噪比為-10~20 dB范圍內的隨機帶內功率信噪比。測試信號集是與訓練信號集相獨立采集的,每種調制信號在-10~20 dB、間隔為2 dB的每個信噪比下采集1 000個長度為200的樣本,碼速率為500 ksymbol/s。
識別準確率(Pc)作為本文所提出方法分類識別性能的指標,定義為
(22)
式中:Tc為正確識別樣本量,TA為總測試樣本量。
3.3.1 預處理對GRU-CNN并聯(lián)網絡識別性能的影響
圖3是有預處理和使用原始IQ數據的GRU-CNN并聯(lián)網絡識別率曲線,可以看出經過本文采用的預處理方法,低信噪比下識別率有很高的提升,在-2 dB和0 dB時8種信號的統(tǒng)計平均識別率提升了25%以上。
圖3 GRU-CNN在原始IQ和預處理下的識別率
8種調制信號在不同信噪比下碼速率為500 ksymbol/s時的詳細的識別率如圖4所示。訓練好的網絡具有一定的泛化能力,可以適應碼速率為150 ksymbol/s、250 ksymbol/s、600 ksymbol/s的測試數據。測試結果表明,識別率與碼速率為500 ksymbol/s時相當,限于篇幅,此處不再列出結果。
圖4 GRU-CNN并聯(lián)網絡識別率
3.3.2 GRU-CNN并聯(lián)網絡與單個網絡的識別性能對比
圖5給出了GRU-CNN并聯(lián)網絡與GRU、CNN網絡各自單獨應用時的識別率曲線,三種網絡中的輸入數據都經過了自相關或極坐標轉換的預處理步驟。GRU用于提取時序特征,而CNN用于提取空間特征,并聯(lián)網絡結合兩個單獨網絡的優(yōu)勢,進一步提高了統(tǒng)計平均識別率。
圖5 并聯(lián)網絡與單種網絡的識別率
3.3.3 不同算法性能分析對比
圖6是本文提出的GRU-CNN并聯(lián)網絡與文獻[5]采用的LSTM和文獻[8]采用的CNN-LSTM并聯(lián)網絡的平均識別率對比。本文提出方法測試所用信號集大于文獻[5]采用的,總體上仍有一定提高。而文獻[8]使用仿真信號,將其所提方法應用于本文所用數據集時識別效果不佳。
圖6 GRU-CNN并聯(lián)網絡識別率
表1列出了不同算法所需的訓練時間。
表1 算法所需訓練時間
結合圖5、圖6和表1可知,本文提出的GRU-CNN并聯(lián)網絡訓練時間遠低于文獻[5]和文獻[8]算法。與經過預處理步驟的CNN對比,相對于其他算法,本文算法總體上只增加了少量訓練時間。
針對非合作通信中低信噪比下的信號調制類型難以識別的問題,本文提出了一種基于GRU-CNN并聯(lián)神經網絡的調制識別方法。實驗結果一方面驗證了預處理的有效性,另一方面驗證了并聯(lián)網絡對識別率進一步提高的可能性。算法經過了實測數據驗證,具有實際應用價值。