国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)增強的小樣本輻射源個體識別方法

2024-04-02 08:32王藝卉閆文君段可欣于楷澤
雷達科學與技術(shù) 2024年1期
關鍵詞:振幅損失準確率

王藝卉,閆文君,段可欣,3,于楷澤,3

(1.海軍航空大學,山東煙臺 264001;2.31401部隊,山東煙臺 264001;3.91423部隊,山東煙臺 264001)

0 引 言

輻射源個體識別(Specific Emitter Identification,SEI)在通信對抗、頻譜資源監(jiān)測與管理、無線電干擾檢測與定位、無線電設備管理與維護等領域應用廣泛[1],通過準確識別輻射源個體可以鎖定惡意信號或入侵個體[2],提高頻譜利用率與無線電設備管理的有效性,確保通信系統(tǒng)的干擾沖突最小化。

在現(xiàn)實通信場景中,常常由于信號遮擋、長距離傳輸、電磁干擾、不良天氣影響、信號加密等原因出現(xiàn)樣本數(shù)據(jù)難以獲取、捕捉樣本類別不全面等樣本數(shù)目不足的小樣本困境。

近年來,小樣本問題愈受關注,其問題的解決掣肘于數(shù)據(jù)量的缺乏。數(shù)據(jù)增強技術(shù)在圖像分類、目標檢測、自然語言處理等領域應用廣泛且表現(xiàn)突出,為小樣本困境的解決提供了可能。目前,較為主流的小樣本學習方法有基于度量學習、基于模型改進和基于數(shù)據(jù)增強三種方法[3]。

基于度量學習的方法是通過距離度量樣本間的相似性,具有代表性的有構(gòu)造正樣本、負樣本和錨點來計算樣本對間距離的共享網(wǎng)絡參數(shù)孿生網(wǎng)絡、利用雙向長短時記憶的元學習匹配網(wǎng)絡、以類別均值為中心的原型網(wǎng)絡,其受限于缺乏數(shù)據(jù)而易受離群樣本和錯誤標注樣本的影響?;谀P透倪M的代表性方法有借助附加的記憶模塊保存支持集中提取的特征信息進行學習的記憶增強的神經(jīng)網(wǎng)絡算法[4]、跨任務訓練尋優(yōu)的參數(shù)優(yōu)化方法[5]、引入掩碼變換網(wǎng)絡使得任務參數(shù)具體對應子空間的高維網(wǎng)絡參數(shù)元學習算法[6]、引入注意力機制和互信信息的權(quán)重生成小樣本算法[7],顯然地,使用附加記憶模塊會提高計算成本和內(nèi)存間的需求,優(yōu)化模型或參數(shù)的方法使得難以平衡識別精度與學習速度。三者之中,數(shù)據(jù)增強策略更為直接。

數(shù)據(jù)增強(data augmentation)是一種通過擴充樣本數(shù)量而直接有效解決樣本不足問題的方法。在圖像處理時常采用翻轉(zhuǎn)[8-9]、旋轉(zhuǎn)[10]、移位[11]、縮放[12-13]、噪聲擾動[14]等實現(xiàn)數(shù)據(jù)擴充的方法可以借鑒延用到無線電信號領域[15],這些微小的改動雖然沒有直接增加特征信息,但使得擴充數(shù)據(jù)集在特征空間的覆蓋范圍變大,細微差別的存在使神經(jīng)網(wǎng)絡將其視為不同的樣本,是更加有助于分類面的選擇和魯棒性的提高。

基于此,本文提出基于數(shù)據(jù)增強的小樣本輻射源個體識別算法。首先,通過時域翻轉(zhuǎn)、振幅反轉(zhuǎn)、振幅縮放和噪聲處理等方法對小樣本數(shù)據(jù)集進行數(shù)據(jù)集擴充;其次,將噪聲序列和類別標簽輸入生成器進一步生成“以假亂真”的生成樣本,提高生成樣本的多樣性并通過輔助分類器同步完成真假樣本判別和類別預測;最后,根據(jù)判別器動態(tài)反饋漸進式調(diào)整損失函數(shù)權(quán)值,重點關注高質(zhì)量樣本進一步優(yōu)化網(wǎng)絡,提高識別準確性。

1 數(shù)據(jù)預處理

1.1 數(shù)據(jù)特點

本文采用ADS-B 1090 MHz S 模式擴展電文數(shù)據(jù)鏈進行分析,其最大下行數(shù)據(jù)長度達112 位,數(shù)據(jù)率可達1 Mbit∕s。如圖1 所示,ADS-B 消息主要由前導脈沖(preamble)部分和數(shù)據(jù)(data block)部分組成,消息的前導脈沖位置在消息的前端即信號的前8 μs 時間,是信息頭部分,總共有4 個脈沖。數(shù)據(jù)部分共112 位,表征下行鏈路格式、通信能力、飛機唯一標識符、地表位置、空中位置和速度等信息。

圖1 ADS-B 1090ES信息數(shù)據(jù)塊格式及數(shù)據(jù)位PPM調(diào)制

ADS-B 信號采用脈沖位置調(diào)制(PPM)實現(xiàn)數(shù)據(jù)位報文編碼后在數(shù)據(jù)鏈路中傳播,其基帶PPM信號為

式中,bm表示第m個二進制符號,p(t)表示一個脈沖寬度為Ts= 0.5 μs的矩形脈沖。

1.2 數(shù)據(jù)增強

聚焦樣本不足的核心問題,借鑒圖片分類算法中常用的翻轉(zhuǎn)、平移、拼接等方法對電磁信號進行時域翻轉(zhuǎn)、振幅反轉(zhuǎn)、振幅縮放和噪聲擾動實現(xiàn)數(shù)據(jù)擴充。

1.2.1 時域翻轉(zhuǎn)

由圖2可知,時域翻轉(zhuǎn)是將信號的時間軸進行翻轉(zhuǎn),對于ADS-B 信號這一離散信號S(n)而言,時域翻轉(zhuǎn)可表示為

圖2 時域翻轉(zhuǎn)處理

式中:N為信號長度;n為時間索引,取值范圍為[0,N-1]。

1.2.2 振幅反轉(zhuǎn)

由圖3可知,振幅反轉(zhuǎn)是將信號沿時間軸進行反轉(zhuǎn),對于ADS-B 信號這一離散信號S(n)而言,振幅反轉(zhuǎn)可表示為

圖3 振幅反轉(zhuǎn)處理

式中,n為時間索引,Sf(n)為振幅反轉(zhuǎn)后的信號。

1.2.3 振幅縮放

由圖4可知,振幅縮放是通過縮放因子調(diào)整信號的幅度特征,對于ADS-B 信號這一離散信號S(n)而言,振幅縮放可表示為

圖4 振幅縮放處理

式中,n為時間索引,Ss(n)為振幅縮放后的信號,α為縮放因子。當將超參數(shù)α設置為大于1 時振幅增大,小于1 時振幅縮小,但過小或過大的縮放因子會造成信號截斷等信號溢出或失真的影響,在后續(xù)實驗中選取α= 1.4。

1.2.4 加噪處理

對ADS-B 信號這一離散信號S(n)加入高斯噪聲可以表示為

式中:n為時間索引,Sn(n)為添加高斯噪聲后的信號,N是服從均值為0、方差為σ2的高斯分布的隨機數(shù),如圖5所示。

圖5 加噪處理

2 基于數(shù)據(jù)增強的輻射源個體識別方法

2.1 輔助分類生成對抗網(wǎng)絡

Augustus 等在文獻[16]中以GAN 為基礎提出了可同時實現(xiàn)樣本分類預測和真假樣本判別的輔助分類生成對抗網(wǎng)絡(Auxiliary Classifier GAN,ACGAN),其損失函數(shù)分為判別是否為真實樣本的損失LS和分類準確性的損失LC兩部分:

式中:x真實樣本對應類別標簽為yx,z和y為輸入生成器的噪聲序列和標簽,生成樣本為G(z,y);x~Pdata(x)表示樣本x服從真實樣本分布,將樣本x判別為真實樣本的概率為DS(x),將輸入的G(z,y)判別為真實樣本的概率為DS(G(z,y)),LD表示為分類損失,故而AC-GAN判別器損失為

生成器損失為

2.2 漸進式權(quán)值調(diào)整的AC-GAN

AC-GAN 在創(chuàng)造性地實現(xiàn)樣本真假判別和分類雙重任務的同時,可通過輔助分類器有效控制生成樣本的類別,聯(lián)合生成器損失、判別器損失和分類器損失加強模型訓練穩(wěn)定性,但在實際應用中仍存在以下不足:

1)AC-GAN 在訓練數(shù)據(jù)較少時易引發(fā)生成樣本多樣性不足的問題。

2)AC-GAN 平等地關注判別結(jié)果參差不同的樣本,限制了模型的識別能力。

基于此,本文提出漸進式動態(tài)調(diào)整損失函數(shù)權(quán)重的輔助分類生成對抗網(wǎng)絡(PW-ACGAN)的輻射源個體識別算法,合理利用1.2 節(jié)中對原始樣本進行時域翻轉(zhuǎn)、振幅反轉(zhuǎn)、振幅縮放及噪聲擾動等方法產(chǎn)生的擴充樣本提高原數(shù)據(jù)集的特征覆蓋情況,使得模型能更好地獲得數(shù)據(jù)的分布,提高生成樣本的多樣性;根據(jù)反饋動態(tài)調(diào)整損失函數(shù)的權(quán)重,更加關注將輸入的生成樣本G(z,y)判別為真實樣本和將輸入真實樣本x判別為假的“顛倒是非”的理想欺騙狀態(tài),有效降低低質(zhì)量生成樣本對模型的影響[17-18],具體步驟如下:

1)定義權(quán)值調(diào)整因子與權(quán)重初始化:定義介于0到1之間的權(quán)值調(diào)整因子γ以控制生成器的損失函數(shù)權(quán)重,表示生成器損失函數(shù)的相對權(quán)重。起初,將生成器和鑒別器損失函數(shù)的權(quán)重設置為相等的值,實現(xiàn)初始權(quán)重平衡。

2)關注判別結(jié)果動態(tài)調(diào)整γ:在訓練過程中記錄生成樣本被判別為真實樣本(DS(G(z,y)) →1)和真實樣本被判別為生成樣本(DS(x) →0)的判別概率,在理想情況下,每次判別器輸出的概率值為1∕2,即判別器無法區(qū)分真實數(shù)據(jù)和生成數(shù)據(jù)。

故以1∕2為界,當PDS(G(z,y))→1大于1∕2或PDS(x)→0的判別概率小于1∕2 時,將判別概率與權(quán)值調(diào)整因子γ比較大小,若判別概率P大于γ則將P賦值給γ,調(diào)整并更新?lián)p失函數(shù)。

PW-ACGAN判別器損失為

PW-ACGAN 生成器損失函數(shù)保持不變,判別器損失函數(shù)為

3)權(quán)值平衡與穩(wěn)定:過度重視生成樣本的逼真程度會降低生成樣本的多樣性,過強的生成器會造成模型崩潰,過強的判別器會引起梯度消失。通過以1∕2 為界,γ= max(γ,P)將權(quán)值調(diào)整因子限制在0.5 至1 之間,保持生成樣本多樣性與逼真性的平衡。

2.3 實現(xiàn)步驟

如圖6所示,信號樣本經(jīng)過數(shù)據(jù)增強處理后形成擴充數(shù)據(jù)集,按設置比例劃分成訓練集和測試集,隨機抽取m個訓練樣本x;在PW-ACGAN 中,隨機生成m個滿足正態(tài)分布的噪聲序列z和生成樣本標簽y經(jīng)過生成器G輸出生成樣本G(z,y)。將樣本x和G(z,y)一同送入判別器D 判別,并通過反向傳播調(diào)整優(yōu)化生成器與判別器。

圖6 PW-ACGAN整體結(jié)構(gòu)

3 仿真實驗

3.1 仿真條件

3.1.1 數(shù)據(jù)采集及數(shù)據(jù)集設置

為采集ADS-B 信號架設工作頻率設置為20 MHz,采樣頻率2 MHz, 接收增益為80 的USRPB210 作為信號接收裝置采集1 090 MHz ADS-B S模式響應信號,信號采集過程如圖7所示。在航班密集程度不同的時間段和地點采集ADS-B 射頻信號并進行抗混疊濾波和步進增益,將信號解調(diào)至中頻,經(jīng)轉(zhuǎn)換與解碼處理后得到ADS-B 報文,其中部分ADS-B信號如圖8所示。

圖7 數(shù)據(jù)采集場景

圖8 部分ADS-B采集信號

為分析類別數(shù)目與樣本數(shù)目對識別結(jié)果的影響,現(xiàn)設置多個數(shù)據(jù)集,其中訓練集與測試集比為3∶1。DATA 設置類別數(shù)量為8,單類別樣本數(shù)為32,時域翻轉(zhuǎn)和振幅反轉(zhuǎn)根據(jù)真實樣本最多只能1∶1 生成,故而依1.2 節(jié)中數(shù)據(jù)增強方法擴充數(shù)據(jù)集時,人為將擴充樣本比例設定為1倍。

3.1.2 實驗設置

實驗基于TensorFlow 的keras框架網(wǎng)絡模型的設計與訓練過程采用Pycharm 軟件完成,硬件配置為Intel(R)Core(TM)i9-9900K CPU,運行內(nèi)存16 GB,主頻3.6 GHz。輸入判別器數(shù)據(jù)尺寸統(tǒng)一為1×1 000 格式,模型訓練過程采用Adam 優(yōu)化器進行權(quán)值優(yōu)化,每次迭代樣本數(shù)為32,訓練次數(shù)設置為30,學習率為0.01。

3.1.3 網(wǎng)絡模型搭建

深度卷積生成對抗網(wǎng)絡(Deep Convolution GAN,DCGAN)的提出創(chuàng)造性地將卷積神經(jīng)網(wǎng)絡引入了生成對抗網(wǎng)絡[19],優(yōu)化了模型的生成質(zhì)量和穩(wěn)定性。PW-ACGAN 以DCGAN 網(wǎng)絡結(jié)構(gòu)為基礎,生成器和判別器網(wǎng)絡模型設計如表1和表2所示。

表2 PW-ACGAN判別器網(wǎng)絡模型

3.2 實驗結(jié)果分析

3.2.1 不同數(shù)據(jù)增強方法對識別效果的影響

為驗證不同增強方法對識別效果的影響,選用與PW-ACGAN 的判別器結(jié)構(gòu)相同但去除輸出層判別概率分支的CNN 網(wǎng)絡模型為識別網(wǎng)絡。不同的增強方法在訓練樣本時取8 種類型的信號樣本各32 個,分別將未經(jīng)增強的原始樣本記為None、Time domain flipping、Amplitude reversal、Gaussian noise 與組合使用增強方法的混合增強樣本Mix 在不同信噪比條件下進行識別效果比較。

由圖9可知,不同增強方法的識別準確率在不同信噪比條件下均有不同程度的提高,在信噪比較低的情況下,識別準確率穩(wěn)步提升,在達到8 dB時識別準確率趨于穩(wěn)定;單一增強方法中時域翻轉(zhuǎn)的增強方法表現(xiàn)最佳,加噪處理的增強方法表現(xiàn)最為遜色,振幅縮放增強方法的識別準確率稍微優(yōu)于振幅反轉(zhuǎn);而混合增強方法優(yōu)于單一增強方法,為優(yōu)化實驗效果后續(xù)實驗采用混合增強方法產(chǎn)生增強樣本。

圖9 不同增強方法的識別準確率比較

3.2.2 小樣本條件下識別效果分析

為對比CNN、ACGAN 及PW-ACGAN 在小樣本條件下的識別效果,在SNR=2 dB 條件下對混合增強樣本Mix 進行20 次蒙特卡羅實驗并記錄識別準確率,繪制盒子圖可知其最大最小值、上下四分位數(shù)和中位數(shù)及分布情況。

由圖10 可知,以圖中紅色橫線標注的中位線為標準,PW-ACGAN 的識別準確率明顯優(yōu)于CNN和ACGAN 算法;PW-ACGAN 的識別準確率分布最為集中,表明其平衡了生成樣本的穩(wěn)定性與多樣性,更好地突破了訓練集數(shù)目少易引發(fā)的測試集易過擬合的小樣本限制,進一步證明了PW-ACGAN算法的有效性。

圖10 不同識別方法的識別準確率

3.2.3 不同識別方法比較

為進一步說明本文算法在小樣本輻射源個體識別中的優(yōu)勢,采用通過對比實驗進行分析。其中,Augmented data with screening 是以文獻[20]中基于粗細粒度篩選的生成對抗網(wǎng)絡數(shù)據(jù)增強方法;Meta Learning 是以文獻[21]中基于元學習的跨任務信號識別方法;LDCGAN+SVM 是以文獻[22]中基于深度卷積生成對抗網(wǎng)絡擴充樣本后利用支持向量機進行分類識別方法。

由圖11 可知,本文所提識別算法在不同的信噪比條件下均優(yōu)于其他三種對比算法,尤其在-10~-2 dB 低信噪比條件下,不同識別算法的識別效果差異顯著,本文所提基于混合數(shù)據(jù)增強和PW-ACGAN 較將LDCGAN 生成數(shù)據(jù)映射到高維特征空間利用支持向量機分類識別的方法提高了15%左右,表明本文算法對低信噪比環(huán)境有較好的適應性。

圖11 不同算法的識別準確率

3.2.4 樣本數(shù)量對識別效果的影響

小樣本學習旨在解決樣本不充足、不全面的條件限制問題,但訓練樣本數(shù)量仍在一定程度上影響識別結(jié)果。首先在信噪比為8的條件下,設置不同的每個類別樣本數(shù)量進行識別準確率比較,查看數(shù)據(jù)增強在不同數(shù)量的小樣本條件下的作用效果。由圖12 橫向?qū)Ρ瓤芍S著每個類別樣本數(shù)目的增加,識別準確率明顯提升,表明充足的訓練樣本對模型的擬合能力至關重要;縱向來看,在樣本數(shù)目較少的情況下,數(shù)據(jù)增強通過擴充樣本數(shù)量提高樣本的特征覆蓋率,更好地使模型學習數(shù)據(jù)特征,從而實現(xiàn)了小樣本條件下識別準確率的躍升,但當樣本數(shù)量較為充足并能夠支撐分類器獲得較好的分類面時,數(shù)據(jù)增強的作用效果微弱。

圖12 不同數(shù)量樣本的識別準確率

為進一步驗證小樣本條件下增強樣本數(shù)量對識別準確率的影響,取不同數(shù)量的增強樣本進行多次實驗,取平均識別準確率進行比較。由表3可知,隨著增強樣本數(shù)量的增加,識別準確率穩(wěn)步提升,當達到增強樣本數(shù)量與原始樣本一致時,識別準確率提升近23%。

表3 各類增強樣本在不同數(shù)量下的識別準確率

4 結(jié)束語

針對復雜電磁環(huán)境中缺少高質(zhì)量、數(shù)量充足訓練樣本的困境,提出基于數(shù)據(jù)增強的小樣本輻射源個體識別方法。首先,通過數(shù)據(jù)增強擴充樣本集,提高原數(shù)據(jù)集的特征覆蓋情況,使得模型能更好地獲得數(shù)據(jù)的分布;然后,將噪聲序列和類別標簽輸入生成器進一步生成“以假亂真”的生成樣本,提高生成樣本的多樣性并通過輔助分類器同步完成真假樣本判別和類別預測;最后,根據(jù)判別器動態(tài)反饋漸進式調(diào)整損失函數(shù)權(quán)值,重點關注高質(zhì)量樣本進一步優(yōu)化網(wǎng)絡,提高識別準確性。實驗結(jié)果表明,本文算法在不同數(shù)量樣本下和不同信噪比條件下均表現(xiàn)出較為穩(wěn)定的識別能力,尤其對低信噪比條件具有較好的適應性,為復雜信道條件下的小樣本輻射源個體識別提供了可能。

猜你喜歡
振幅損失準確率
胖胖損失了多少元
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產(chǎn)品質(zhì)量檢驗分析
玉米抽穗前倒伏怎么辦?怎么減少損失?
高速公路車牌識別標識站準確率驗證法
十大漲跌幅、換手、振幅、資金流向
十大漲跌幅、換手、振幅、資金流向
十大漲跌幅、換手、振幅、資金流向
滬市十大振幅
科技| 黄平县| 汽车| 伊吾县| 遵义市| 雷山县| 安仁县| 肃南| 亳州市| 广河县| 湖州市| 怀化市| 崇礼县| 巢湖市| 井冈山市| 旬阳县| 嘉义市| 五寨县| 绍兴县| 东乌珠穆沁旗| 开平市| 石首市| 启东市| 肥乡县| 马龙县| 神农架林区| 梓潼县| 德化县| 阿图什市| 古丈县| 无为县| 横山县| 固镇县| 乌恰县| 阜南县| 石棉县| 苗栗县| 乐亭县| 肃南| 扬中市| 青州市|