唐澤宇, 鄒小虎, 李鵬飛, 張 偉,2, 余佳奇, 趙耀東
(1. 電子信息控制重點實驗室, 成都 610036; 2. 電子科技大學 信息與通信工程學院,成都 611731; 3. 北京理工大學 計算機學院,北京 100091)
通信輻射源受制造、工藝、加工等影響,同一批次出廠的同型號設備的元器件也會存在個體差異,從而導致其發(fā)射信號中攜帶與硬件相關的細微特征,且這些特征不受信號具體傳輸?shù)膬热萦绊?基于此,采用通信輻射源個體識別技術,通過對電磁信號所攜帶的輻射源硬件特征進行分析,判斷電磁信號來源,以確定其用途、型號、威脅等信息,這是有針對性地跟蹤、監(jiān)視和干擾重要目標最基礎、最關鍵的環(huán)節(jié),在公共安全管理和國防軍事應用中具有重要意義[1].同時,由于正交頻分復用(OFDM)技術被廣泛應用于4G/5G移動通信網(wǎng)絡、無線局域網(wǎng)、數(shù)字音頻/視頻廣播、軍民用無線通信鏈路、軍民用無人機控制信號鏈路等領域,所以對OFDM通信輻射源的個體識別研究具有廣泛的應用意義.
通信輻射源個體識別本質上是一個機器學習分類與識別問題,通過對已知通信輻射源類別信息的訓練樣本,學習訓練特征提取器和分類器參數(shù),再對未知類別的樣本測試判斷其輻射源屬性[2-6].通信輻射源個體識別的關鍵在于提取出輻射源的有效特征,利用殘差網(wǎng)絡可以解決傳統(tǒng)識別方法中人工提取特征效率低下的問題,并保持較高的識別正確率[7-10].同時,結合輸入數(shù)據(jù)的特性,可對殘差網(wǎng)絡的結構進行適應性調整,以進一步提高識別的效果[11-12].
然而實際應用中,信號采集方無法主動控制信號背景的電磁環(huán)境或被采輻射源,使得目標電磁信號質量差、難截獲.在這種非合作條件下,可標注和可訓練的數(shù)據(jù)有限,容易造成過擬合導致分類精度下降,難以形成有效的識別模型,因此需要結合數(shù)據(jù)增強和小樣本識別方法,對通信輻射源個體目標進行識別[13-17].Liu等[18]針對輻射源個體識別可能會受到不穩(wěn)定特征干擾的問題,利用數(shù)據(jù)增強方法在訓練網(wǎng)絡時對數(shù)據(jù)進行擴充,降低預處理的復雜度,同時抑制功率變化、頻率偏移、相位偏移和信道噪聲的干擾.Zhou等[19]將生成對抗網(wǎng)絡引入電磁信號分類領域,利用生成對抗網(wǎng)絡的樣本增強能力構建半監(jiān)督學習框架,直接處理電磁信號的IQ數(shù)據(jù),一定程度上解決了電磁信號類型分類和輻射源個體識別中的過擬合問題.一個神經(jīng)網(wǎng)絡若能夠對不同狀態(tài)下的目標進行穩(wěn)健的分類,就被稱為具有不變性的屬性,更具體地說,卷積神經(jīng)網(wǎng)絡(CNN)對移位、旋轉、縮放、翻轉等操作具有不變性,這是數(shù)據(jù)增強的前提.為解決過擬合問題,可以采用數(shù)據(jù)增強的方式,通過少量可用的信號樣本生成更多的樣本,對訓練樣本進行擴充.
同時,針對數(shù)據(jù)不易獲取導致模型訓練難、泛化性差的問題,可采用在資源充足環(huán)境中學到的知識輔助另一領域的學習策略,即遷移學習的思想.大部分數(shù)據(jù)或任務都存在相關性,因此遷移學習將某個領域或任務上學習到的知識或模式應用到相關的領域或問題中,把訓練好的模型參數(shù)(也可理解為模型學到的知識)分享給新模型,從而避免網(wǎng)絡從零學習,加快并優(yōu)化模型的學習效率[20-21].Feng等[22]利用遷移學習方法篩除源域與目標域不同的部分,使源域的分布向目標域分布靠近,生成能夠支撐后續(xù)分類方法的新數(shù)據(jù)集, 解決了復雜電磁環(huán)境所導致的雷達輻射源目標域樣本標簽不足的問題.Kuzdeba等[23]針對環(huán)境、頻道、調試樣式、信號類型等因素導致的輻射源信號源域與目標域分布存在差異和樣本標簽缺失的問題,通過對網(wǎng)絡模型參數(shù)的遷移,實現(xiàn)對不同輻射源的個體識別.Liu等[24]針對輻射源細微特征會隨著時間、地點和條件的不同而變化,繼而使得訓練樣本和測試樣本分布不同的問題,通過遷移學習有效利用和轉移已標記源域數(shù)據(jù)中的知識,提高了通信輻射源的個體識別性能.由此可見,遷移學習可以更好地探索數(shù)據(jù)結構信息,將有價值的知識從源域轉移到目標域,在目標域樣本不足以支撐模型訓練的條件下,提高識別正確率.
針對小樣本條件下產(chǎn)生OFDM信號通信輻射源的目標識別問題,提出了基于相位、時域翻轉的數(shù)據(jù)增強和源領域實例遷移的方法,通過翻轉的數(shù)據(jù)增強方法擴充數(shù)據(jù)集,并引入遷移學習以強化識別模型的泛化能力,提高了個體目標的識別準確率.
以通信輻射源產(chǎn)生的OFDM信號為研究對象,研究在小樣本情況下的通信輻射源目標識別問題,實驗數(shù)據(jù)來源于最易獲取的手機OFDM信號,通過判斷當前發(fā)射OFDM信號的手機屬于華為暢享Z、小米Play4或vivo Y70s等中的哪個型號,進一步判定手機個體是屬于5部華為暢享Z或是5部小米Play4手機中的哪一部.對手機的個體識別有助于識別不法分子在頻繁更換用戶識別(SIM)卡的情況下使用的手機,進而對其身份進行判別,在公共安全管理方面有一定的應用價值.同時,手機的個體識別方法在同樣使用OFDM技術的無人機、數(shù)字廣播、通信電臺等領域中存在一定的共通性.
圖1給出了基于遷移學習的小樣本OFDM目標增強識別方法的總體流程.其中,(1, 2)表示步長,即每次卷積后,卷積核在縱向移動1個位置,橫向移動2個位置;1×7和3×3為卷積核的尺寸;64和128為該層輸出的通道數(shù),即卷積核的個數(shù);全連接層中的5表示輸出的維度,即識別模型最終輸出一個5維向量.首先通過數(shù)據(jù)預處理,對預先采集的手機OFDM信號進行分段篩選、歸一化和雙通道數(shù)據(jù)提??;其次,根據(jù)OFDM信號多載波的特點,修改卷積核結構,對殘差網(wǎng)絡進行適應性調整;再次,利用數(shù)據(jù)增強的方法,對數(shù)據(jù)樣本進行擴充;最后,在上述實驗基礎上采用遷移學習方法,利用源域數(shù)據(jù)訓練出舊模型,并使用舊模型的參數(shù)初始化新模型,從而構建目標域識別模型,完成目標識別任務,最終達到知識遷移的目的.
圖1 OFDM信號目標識別方法總體流程Fig.1 Overall process of OFDM target identification method
在對OFDM信號的采集中,每個數(shù)據(jù)文件采集時長100 ms.如圖2所示,每1 ms時長的數(shù)據(jù)包括14個OFDM符號和1個時隙號,數(shù)據(jù)分兩個時隙傳出,14個OFDM符號依次為3個有效信號、1個參考信號、6個有效信號、1個參考信號、3個有效信號.每個OFDM符號包含108個子載波,每個子載波由IQ兩路表示(2個short數(shù)據(jù)類型).
圖2 OFDM信號數(shù)據(jù)結構示意Fig.2 Data structure of OFDM signal
數(shù)據(jù)預處理分為數(shù)據(jù)分段篩選、歸一化和雙通道數(shù)據(jù)生成3部分.首先對每100 ms數(shù)據(jù)進行分割,每個數(shù)據(jù)文件中的信號分成有效信號、參考信號、時隙,選取其中有效信號;然后,由于輻射源個體指紋特征與信號的發(fā)射功率無關,為避免信號功率差異造成影響,對數(shù)據(jù)樣本進行歸一化處理;最后,將處理后的每100 ms數(shù)據(jù)分別按頻譜圖、IQ兩路實部和實部加虛部、IQ兩路模長單通道和模長加相位雙通道共5種方式,各生成一個信號數(shù)據(jù)樣本.
殘差網(wǎng)絡(ResNet)是一種卷積神經(jīng)網(wǎng)絡,通過使用殘差模塊,可以解決卷積神經(jīng)網(wǎng)絡深度增加引起的性能退化問題.其包含一個新的網(wǎng)絡塊,網(wǎng)絡塊輸入為x,輸出為Q(x),這個網(wǎng)絡塊將輸入特征x映射為Q(x)-x,將Q(x)-x記作F(x),即該網(wǎng)絡塊計算原映射Q(x)與輸入特征x的差值F(x),稱作“使得該網(wǎng)絡塊學習原網(wǎng)絡塊Q(x)與輸入特征x的殘差”,網(wǎng)絡塊結構如圖3所示.其中,ReLU為修正線性單元.
圖3所示為兩個權重層疊加而成的網(wǎng)絡塊完成從輸入特征x到殘差F(x)的映射,并將F(x)與右側的短路鏈接進行元素級別的加法操作,最終該網(wǎng)絡塊輸出為F(x)+x,即圖3 中通過所有權重層后的輸出仍為Q(x).
殘差塊結構不再讓權重層只輸出最終的特征圖,而是讓權重層輸出最終特征圖和輸入特征的差值F(x), 再將F(x)與輸入特征x進行元素級別加法操作得到最終特征圖.圖3的結構可表示為
y=σ(F(x, {Wi})+x)
(1)
式中:F=W2σ(W1x),σ為修正線性單元(ReLU);Wi為第i個權重層的權重矩陣.在完成F(x)和x的元素加法后,圖3中還進行了ReLU操作,即結構的最終輸出為σ(Q(x)).
圖3 殘差網(wǎng)絡塊結構Fig.3 Block structure of residual network
以ResNet-18(17個卷積層和1個全連接層的殘差網(wǎng)絡)作為基礎模型,其結構根據(jù)預處理后的數(shù)據(jù)進行調整.OFDM信號數(shù)據(jù)被預處理為3種形式:① 三通道的二維像素點的形式,對于這種數(shù)據(jù)形式,往往使用卷積神經(jīng)網(wǎng)絡建立模型;② 單通道一維數(shù)據(jù)形式,保存的數(shù)據(jù)為完整的IQ信號模長;③ 雙通道二維數(shù)據(jù)形式,增加了I路信號和Q路信號之間的相位信息,最大化保留了對分類有用的信息.對于后兩種數(shù)據(jù)形式,首先需要調整網(wǎng)絡輸入層,將原本支持彩色圖像RGB三通道的殘差網(wǎng)絡輸入層修改為能支持以幅值和相位雙通道數(shù)據(jù)作為輸入,同時對前兩個通道的權重進行拷貝,保證初始化權重與殘差網(wǎng)絡一致.然后,針對OFDM符號包含108子載波的特殊性質,對網(wǎng)絡結構進行適應性調整,優(yōu)化殘差網(wǎng)絡特征提取的方式,將原第一卷積層的卷積核由7×7降維至1×7,使其更加關注同一子載波所展現(xiàn)的特征.最終確定殘差網(wǎng)絡結構如圖4所示.
圖4 雙通道輸入下的殘差網(wǎng)絡結構Fig.4 Residual network structure with dual channel input
損失函數(shù)用來判定預測值和真實值的接近程度,有助于優(yōu)化神經(jīng)網(wǎng)絡的參數(shù),因此采用交叉熵作為損失函數(shù),衡量實際輸出與期望輸出的差值.此外,通過softmax分類器,讓分類預測值的和為1.損失函數(shù)定義如下:
Loss(p,q)=-∑p(x)logq(x)
(2)
式中:p為標簽值;q為預測值.
梯度下降法(SGD)是機器學習中常用優(yōu)化方法,采用小批量SGD方法,提升訓練速度,提高內存利用率并減少迭代次數(shù).SGD優(yōu)化方法設置動量參數(shù)為0.9,學習速率為0.01,批量大小為16,訓練迭代次數(shù)為100.
為了在小樣本條件下對輻射源信號進行個體識別,需要獲得更多的樣本數(shù)據(jù),因此對現(xiàn)有的數(shù)據(jù)集進行微小的改變,如旋轉、移位、翻轉等,以對樣本數(shù)據(jù)進行增強.針對OFDM信號的時頻域特征,結合信號的周期性特征,提出一種在相位域和時域上翻轉來進行數(shù)據(jù)增強的方法.
在相位域上,Hilbert變換是信號處理中一種常用的手段,通過對原信號的相位反轉,展現(xiàn)出信號不同的角度.采用Hilbert變換的方法,對信號進行卷積來構建目標的時頻解析信號,從而實現(xiàn)增強效果.
假設現(xiàn)有信號s(t),則定義信號s(t)的Hilbert變換為
(3)
由上式可知,H(s(t))是s(t)和1/(πt)的卷積.通過查表求解,求得:
(4)
式中:j為虛數(shù)單位;ω為角頻率.
因此,|H(s(t))|=1,令:
引入歐拉公式ejφ0n=cosω0n+jsinω0n,由歐拉公式可知,當cosω0n+jsinω0n=-j時,ω0n=-π/2,即φ(ω)=-π/2(ω>0).同理φ(ω)=π/2(ω<0),整理可得:
(5)
由上式可知,當頻率大于0時,相位向左移90°,反之,向右移90°,因而實現(xiàn)了在相位域上的信號翻轉.
在時域上,針對信號具有周期性特征,對 100 ms 原始信號數(shù)據(jù)中每個子載波所包含的 1 200個OFDM有效信號進行水平翻轉,并將翻轉后的子載波重新組合成包含108子載波的OFDM信號,形成新的訓練樣本,擴充訓練集,提升整體性能,從而達到數(shù)據(jù)增強目的.
電磁信號難以截獲,導致采集的信號較難覆蓋數(shù)量繁多的輻射源目標,因此當面對新目標信號出現(xiàn)時,需要對已有的個體識別模型進行遷移.為了更快實現(xiàn)模型遷移,達到較好的識別效果,通常需要大量的標注數(shù)據(jù),在小樣本條件下,充分利用已有的標注數(shù)據(jù)改進遷移模型的學習效果是必要的.因此,提出一種通過源領域數(shù)據(jù)進行基于實例的遷移學習方法.
采集同品牌同型號的5部手機樣本數(shù)據(jù),在擬定分類識別方法下完成模型訓練.在出現(xiàn)了不同品牌或同品牌同型號的新手機樣本后,利用已訓練完成的模型,初始化新手機識別任務的模型參數(shù),即從源領域中選出與目標域相似的數(shù)據(jù)作為新任務預訓練模型的訓練集.因此,新舊識別任務的數(shù)據(jù)來源有一定相似性,相當于擴充了新任務訓練集,充分利用了電磁信號數(shù)據(jù)特征.該方法提高了模型的魯棒性、加快了網(wǎng)絡參數(shù)擬合速度,能夠更快達到較好的識別準確率.
如圖5所示,利用同源的舊數(shù)據(jù)在共享網(wǎng)絡上訓練出舊模型,再利用舊模型的模型參數(shù)初始化目標任務的訓練,從而達到知識遷移的目的.
圖5 遷移學習方法架構Fig.5 Architecture of transfer learning method
實驗數(shù)據(jù)采集自共用一張SIM卡的手機個體目標的聯(lián)通4G OFDM信號,共有5個品牌的30部手機,且每個品牌下的手機型號相同.隨機選取其中5部手機作為目標域樣本,包含2部華為、2部iqoo和1部小米,每部手機為識別模型中的一類,各部手機有效信號樣本數(shù)分別為62、54、60、60、49,將5部手機的信號樣本按照4∶1劃分為訓練集和驗證集,用于訓練實驗中進行適應性調整后的殘差網(wǎng)絡模型.利用剩余手機目標數(shù)據(jù)構建2個源域,每個源域5部同品牌同型號手機,每部手機為識別模型中的一類,有效信號樣本40~60個,保持與目標域一致,作為遷移學習舊模型的訓練數(shù)據(jù).每組實驗均重復訓練10次,計算平均識別準確率和標準差.其中,識別準確率定義為:
識別準確率=
(6)
實驗通過對手機個體目標識別結果的對比,依次分析不同數(shù)據(jù)輸入方式、數(shù)據(jù)增強方法以及遷移學習方法對識別模型的影響,從而研究小樣本下OFDM通信輻射源目標識別的效果.
在數(shù)據(jù)預處理中將數(shù)據(jù)保存為單通道和雙通道的形式,單通道數(shù)據(jù)的維度為(108, 1200, 1),雙通道數(shù)據(jù)的維度為(108, 1200, 2).分別用圖像、單通道實部、雙通道實部及虛部、單通道幅值和雙通道幅值及相位共5種輸入方式的數(shù)據(jù),訓練修改通道數(shù)后的殘差網(wǎng)絡,實驗結果如圖6.
如圖6和表1所示,對比5種數(shù)據(jù)輸入方式:以圖像方式輸入會導致不同子載波疊加相互影響,效果最差,平均識別準確率僅有32.23%;以實部、實部和虛部組合形式輸入,一定程度上損失了IQ兩路信號的內在聯(lián)系,平均識別準確率約為51%;以幅值、幅值和相位組合形式輸入,平均識別準確率分別為66.16%、67.28%.以幅值和相位組合方式識別準確率最高,這表明幅值和相位組合雙通道方式不僅包含了信號的幅度和相位信息,還最大程度保留IQ兩路數(shù)據(jù)的內在聯(lián)系.
表1 5種數(shù)據(jù)輸入方式比較Tab.1 Comparison of 5 data input methods %
圖6 5種數(shù)據(jù)輸入方式的單次訓練結果對比Fig.6 Comparison of single training results of 5 data input methods
在幅值和相位組合雙通道輸入的基礎上,調整了殘差網(wǎng)絡的結構,以改變其特征提取的方式,將卷積核降至一維,同時修改步長,與原殘差網(wǎng)絡進行對比實驗,實驗結果如圖7所示.
如圖7和表2所示,對比不同網(wǎng)絡結構:原7×7卷積核的網(wǎng)絡結構平均識別準確率較低,且波動較大難以快速收斂,而調整后的卷積核大小為1×7,平均識別準確率為69.83%,能夠保持模型識別準確率較為平穩(wěn).這表明調整后的殘差網(wǎng)絡能夠使模型更加關注同一子載波所展現(xiàn)的特征,模糊子載波間可能存在的干擾信息,使得模型能夠快速收斂,提高識別準確率.
圖7 網(wǎng)絡結構調整前后單次訓練結果對比Fig.7 Comparison of single training results before and after network structure adjustment
表2 網(wǎng)絡結構調整前后比較Tab.2 Comparison before and after network structure adjustment %
以上一節(jié)調整后的殘差網(wǎng)絡結果為基線,進行4種數(shù)據(jù)增強方法效果對比實驗:① 子載波調序的數(shù)據(jù)增強,生成9組0~108的隨機序列,調整各個原始樣本中子載波的順序,擴充訓練集為原來的10倍;② 添加高斯噪聲,設定方差系數(shù)為0.01.在每一輪中,隨機為1/4的數(shù)據(jù)添加高斯噪聲;③ 相位域翻轉,將時域信號實部進行Hilbert變換,構建解析信號,將復數(shù)結果幅值和相位作為雙通道輸入;④ 時域翻轉,對每一個訓練集樣本中所有子載波進行水平翻轉,合成新的樣本,擴充訓練集為原來的2倍.訓練結果如圖8.
圖8 小樣本數(shù)據(jù)增強單次訓練結果對比Fig.8 Comparison of single training results of data augmentation methods for few-shot learning
如圖8和表3所示,4類數(shù)據(jù)增強方法與不使用數(shù)據(jù)增強相比識別準確率增加8%~9%,有明顯提升;提出的基于相位域和時域翻轉的數(shù)據(jù)增強方法取得了較好的效果,其平均識別準確率分別為78.48%、79.35%.這表明采用相位域和時域翻轉的數(shù)據(jù)增強方法構建的解析信號數(shù)據(jù),具有更好的特征表現(xiàn)能力,使得模型更加穩(wěn)定.同時,也證明數(shù)據(jù)增強策略,對小樣本下的OFDM通信輻射源目標識別準確率有較大提升,具有良好的效果.
表3 小樣本數(shù)據(jù)增強方法比較Tab.3 Comparison of data augmentation methods for few-shot learning %
通過對比實驗,研究模型加入遷移學習的效果,以上述實驗的5部手機(包含華為、iqoo、小米)數(shù)據(jù)作為目標域,再利用剩余手機目標中5部小米同型號手機和5部vivo同型號手機的數(shù)據(jù)分別構建2個源域,用源域目標樣本數(shù)據(jù)做預訓練,生成2個源域識別模型,并在各自向目標域進行遷移時,使用源域模型的參數(shù)對目標域的模型訓練進行初始化.
目標域和源域中存在一部分公共的特征,但也存在一定的差異,主要表現(xiàn)為:一是兩類域中雖然包含了同品牌同型號的手機,但手機個體不同,如源域與目標域中的小米手機在硬件特征上有細微差異,使得兩類域分布存在一定差異性,訓練結果如圖9(a);二是兩個域之間手機為不同品牌,這些手機由不同品牌廠家設計、生產(chǎn)、組裝,從硬件上來看,兩類域分布有較大的差異,訓練結果如圖9(b).這樣構建源域和目標域的目的是讓兩者既保持了差異性,又避免了差異過大產(chǎn)生負遷移,因此可以很好地作為遷移學習的實驗對象.
圖9 遷移學習單次訓練結果對比Fig.9 Comparison of single transfer learning training results
圖9(a)中,由于源域和目標域中均包含小米品牌手機,雖然手機個體不同,但是預訓練模型能夠較好的區(qū)分目標域中其他品牌和小米品牌手機的區(qū)別,因此,預訓練模型初始目標識別率較高.圖9(b)中,源域和目標域包含不同品牌的手機,預訓練模型初始目標識別率與無遷移學習對照組保持一致,但其收斂速度更快.
如表4所示,兩個不同源域的遷移學習識別準確率雖較無遷移學習對照組有所下降但相差不大,且目標識別率的波動較為穩(wěn)定, 這表明遷移學習的加入,提高了OFDM通信輻射源識別模型的泛化性和魯棒性.同時,由圖9所示,預訓練后的模型較無遷移學習對照組收斂速度更快,說明遷移學習能夠加快網(wǎng)絡參數(shù)擬合速度,更快達到較好的識別準確率.
表4 遷移學習加入前后的比較Tab.4 Comparison before and after adding transfer learning %
針對非合作條件下,通信輻射源信號數(shù)據(jù)稀缺難以有效進行目標識別的問題,利用雙通道方式提取子載波信號復雜特征,采用翻轉的數(shù)據(jù)增強方法擴充數(shù)據(jù)樣本集,再基于適應性調整的殘差網(wǎng)絡和實例的遷移學習方法,對通信輻射源目標進行識別和模型構建,實現(xiàn)了小樣本條件下通信輻射源的模型遷移和目標識別.實驗結果表明,以幅值及相位雙通道方式作為輸入能更好地保留信號數(shù)據(jù)特征,結合相位域、時域翻轉等數(shù)據(jù)增強方法,能夠一定程度解決樣本稀缺的問題,顯著提升適應性調整后的殘差網(wǎng)絡的識別性能.此外,遷移學習方法能夠加快網(wǎng)絡參數(shù)擬合速度,利用少量數(shù)據(jù)快速構建可適應新目標的識別模型,在不降低分類性能的條件下,有效提高模型魯棒性和泛化性.
在實際應用中,待識別輻射源目標不僅存在樣本稀缺的問題,甚至沒有任何數(shù)據(jù),對這類未知輻射源目標的識別將是下一階段的研究方向.