李 晨,楊俊安,劉 輝
(國防科技大學(xué),安徽 合肥 230037)
調(diào)制識別是指在不了解接收信號的情況下,確定其調(diào)制類型的一種技術(shù)手段[1]。它在軍事通信和民用通信領(lǐng)域都有廣泛的應(yīng)用,例如認(rèn)知無線電、頻譜監(jiān)視和電子戰(zhàn)系統(tǒng)[2-4]。傳統(tǒng)的調(diào)制識別算法可以分為兩大類[5]:基于決策理論的方法和基于統(tǒng)計(jì)模式識別的方法。決策論方法基于概率論和假設(shè)檢驗(yàn)原理[6],計(jì)算量大且難處理。相比之下基于統(tǒng)計(jì)模式識別的方法比較簡單,它首先提取調(diào)制信號的調(diào)制特征,然后使用特定的分類器完成識別。由于決策論方法的突出缺陷以及機(jī)器學(xué)習(xí)相關(guān)理論發(fā)展如火如荼,現(xiàn)有的調(diào)制識別算法大多數(shù)是基于模式識別的方法。然而,模式識別方法的性能絕大程度上取決于所提取的人工特征,這些人工特征是研究者根據(jù)經(jīng)驗(yàn)以及大量實(shí)驗(yàn)所得出來的,不一定是最佳的,因此需要尋求一種通過機(jī)器自動(dòng)尋找和提取最優(yōu)特征的方法。
近年來,深度學(xué)習(xí)在圖像識別領(lǐng)域中取得了廣泛的應(yīng)用[7-9],它從圖像中自動(dòng)提取特征,在訓(xùn)練樣本充足的條件下能獲得很高的識別率。由于深度學(xué)習(xí)不需要提取人工特征,有越來越多的學(xué)者將其引入調(diào)制識別的研究當(dāng)中[10-15],文獻(xiàn)[11]提出了一種基于循環(huán)譜圖和深度稀疏濾波卷積神經(jīng)網(wǎng)絡(luò)(AN-SF-CNN)的調(diào)制識別算法,對7種調(diào)制信號進(jìn)行識別,在0 dB時(shí)識別率大于90%,但是這種方法存在訓(xùn)練樣本量過大、訓(xùn)練時(shí)間長的問題,實(shí)用性較差。文獻(xiàn)[12]提出了一種基于一維相位特征和卷積神經(jīng)網(wǎng)絡(luò)(CNN)的調(diào)制識別算法,在0 dB下識別率能達(dá)到99%,這種算法的缺點(diǎn)是只能識別相移鍵控(PSK)信號和正交幅度調(diào)制(QAM)信號,需要人工提取特征作為CNN輸入,且同樣存在訓(xùn)練樣本多和訓(xùn)練時(shí)間長的問題。研究表明,深度學(xué)習(xí)方法具有很高的識別性能,能夠挖掘出調(diào)制信號的內(nèi)在特性,但是缺點(diǎn)也很明顯,模型復(fù)雜、參數(shù)眾多、數(shù)據(jù)量大、訓(xùn)練時(shí)間長等問題亟待解決。2015年黃廣斌等在極限學(xué)習(xí)機(jī)的基礎(chǔ)上受CNN思想的啟發(fā),提出了基于局部感受野的極限學(xué)習(xí)機(jī)。它僅有一個(gè)隱含層(包含一個(gè)卷積層和一個(gè)池化層),模型參數(shù)和訓(xùn)練時(shí)間均較CNN大大減小[16],分類精度也很高。
受到局部感受野的極限學(xué)習(xí)機(jī)(ELM-LRF)訓(xùn)練速度快的啟發(fā),本文提出了一種基于循環(huán)譜和ELM-LRF的調(diào)制識別算法,下面分別從循環(huán)譜理論、ELM-LRF原理、算法過程設(shè)計(jì)和實(shí)驗(yàn)分析進(jìn)行介紹。
首先,假設(shè)有一個(gè)帶寬為fx的調(diào)制信號x(t),它的自相關(guān)函數(shù)是一個(gè)隨時(shí)間變化的周期函數(shù):
Rx(t,τ)=Rx(t+T0,τ)
(1)
式中:T0為一個(gè)符號的持續(xù)時(shí)間。
則自相關(guān)函數(shù)的傅里葉級數(shù)展開如下:
(2)
(3)
式中:α為信號x(t)的循環(huán)頻率;傅里葉系數(shù)RF,x(α,τ)稱為循環(huán)自相關(guān)函數(shù),它可以進(jìn)一步表示為:
(4)
這里需要注意的是,RF,x(α,τ)具有時(shí)間τ和循環(huán)頻率α2個(gè)參數(shù)。從公式(4)中可以發(fā)現(xiàn),當(dāng)α=0時(shí),有:
RF,x(0,τ)=Rx(t,τ)
(5)
此時(shí)循環(huán)自相關(guān)函數(shù)變成了信號的自相關(guān)函數(shù)??梢园l(fā)現(xiàn),RF,x(α,τ)在本質(zhì)上是x(t)x*(t-τ)做傅里葉級數(shù)展開時(shí)的系數(shù)。一個(gè)循環(huán)平穩(wěn)信號存在零循環(huán)頻率和非零循環(huán)頻率,它的零循環(huán)頻率部分僅表現(xiàn)出信號的平穩(wěn)性,只有非零循環(huán)頻率部分表征出信號的循環(huán)平穩(wěn)特性。
對公式(4)做時(shí)間τ的傅里葉變化,然后得到了循環(huán)譜密度函數(shù):
(6)
為了獲得循環(huán)譜密度SF,x(α,f),國內(nèi)外學(xué)者提出了許多循環(huán)譜估計(jì)的方法,常用的循環(huán)譜估計(jì)方法有基于時(shí)域平滑的方法和基于頻域平滑的方法,本文中采用的方法為快速傅里葉變換(FFT)累加法(FAM),它是一種基于快速傅里葉變換的時(shí)域平滑方法。
超限學(xué)習(xí)機(jī)于2004年由黃廣斌等人提出[17],它的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 ELM網(wǎng)絡(luò)結(jié)構(gòu)
由圖1可知,ELM的網(wǎng)絡(luò)結(jié)構(gòu)與傳統(tǒng)的單隱層前饋神經(jīng)網(wǎng)絡(luò)(SLFNs)一樣,它包括輸入層、隱含層和輸出層3層。因此,隱含層的輸出函數(shù)為:
(7)
式中:β=[β1,β2,…,βL]T,為輸出層到隱層的權(quán)值向量;h(x)=[h1(x),h2(x),…,hL(x)]T,為輸入樣本x在隱層的輸出向量。
事實(shí)上,h(x)將輸入數(shù)據(jù)從d維的輸入空間映射到L維的隱層特征空間。ELM的訓(xùn)練過程實(shí)際上是最小化訓(xùn)練誤差和輸出權(quán)重的范數(shù):
(8)
式中:C為一個(gè)調(diào)整經(jīng)驗(yàn)風(fēng)險(xiǎn)和結(jié)構(gòu)風(fēng)險(xiǎn)的尺度參數(shù);T為訓(xùn)練樣本的標(biāo)簽;H為隱含層的輸出權(quán)值,可以表示為:
(9)
前面介紹了ELM的基本原理,相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需要通過不斷迭代來調(diào)整權(quán)值,ELM不需要進(jìn)行迭代,顯著提高了前饋型神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度。然而,傳統(tǒng)的ELM是在單隱層前饋神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上提出來的,它是一種模仿人腦神經(jīng)元信息傳遞過程的全連接結(jié)構(gòu),但是生物學(xué)研究表明,人的神經(jīng)元還可以通過局部連接來傳遞信息。黃廣斌等人在文獻(xiàn)[16]中指出,雖然傳統(tǒng)ELM在很多應(yīng)用方面都具有良好的泛化性能,但是涉及到圖像處理和語音識別等具有局部相關(guān)性的問題時(shí),ELM由于僅具有全連接結(jié)構(gòu)而不足以解決這些復(fù)雜問題。因此他受到卷積神經(jīng)網(wǎng)絡(luò)的啟發(fā),引入了局部連接的思想,提出了一種基于局部感受野的超限學(xué)習(xí)機(jī),它的輸入層和隱層之間是通過連續(xù)概率分布連接的,因此具有局部連接的能力。相比于僅具有全連接結(jié)構(gòu)的傳統(tǒng)ELM,包含了局部連接結(jié)構(gòu)的ELM-LRF更為合理。
根據(jù)文獻(xiàn)[16]中關(guān)于ELM-LRF的介紹,可以得出它的網(wǎng)絡(luò)結(jié)構(gòu)主要由4層組成:輸入層,隱含層(又可以稱為特征層),組合層和輸出層。ELM-LRF的結(jié)構(gòu)如圖2所示。
圖2 ELM-LRF網(wǎng)絡(luò)結(jié)構(gòu)圖
下面根據(jù)以上網(wǎng)絡(luò)結(jié)構(gòu)圖,按照從輸出到輸入的順序介紹ELM-LRF算法的機(jī)理和實(shí)現(xiàn)過程。
(1) 輸入層到隱含層
i,j=1,…,(d-r+1)
(10)
(2) 特征層到組合層
ELM中可以用多個(gè)節(jié)點(diǎn)或者節(jié)點(diǎn)構(gòu)成的子網(wǎng)絡(luò)來表示一個(gè)節(jié)點(diǎn),通常稱之為組合節(jié)點(diǎn),因此不同的節(jié)點(diǎn)里面可能會包含部分相同的特征,這使得ELM-LRF網(wǎng)絡(luò)具有了平移和旋轉(zhuǎn)不變性,它的優(yōu)點(diǎn)是增強(qiáng)了網(wǎng)絡(luò)學(xué)習(xí)局部特征能力。這種組合節(jié)點(diǎn)的方式其實(shí)就是一種池化過程,因此,組合層又可以稱為池化層。這里采用平方根池化的方法,從圖中可以發(fā)現(xiàn),池化圖和特征圖具有一樣的尺寸,大小都為(d-r+1)×(d-r+1),且他們的數(shù)量都為K個(gè)。這里采用hp,q,k表示第k個(gè)池化圖中的節(jié)點(diǎn)(p,q)的取值:
(11)
式中:p,q=1,2,…,(d-r+1)。
此時(shí)需要注意的是,在腳標(biāo)i和j小于零的情況下,令Ci,j,k=0。
(3) 組合層到輸出層
由圖2可知,組合層到輸出層是一個(gè)全連接的結(jié)構(gòu),此時(shí)的輸出權(quán)值可以通過傳統(tǒng)的ELM訓(xùn)練得到,即采用正則化最小二乘法的方法。假設(shè)有N個(gè)輸入圖像的訓(xùn)練樣本,可以得到組合層的輸出矩陣H∈RN×K×(d-r+1)2,則β的計(jì)算公式為:
(12)
本文提出的基于循環(huán)譜圖和ELM-LRF的調(diào)制識別算法屬于模式識別方法,整個(gè)識別過程如圖3所示。
圖3 識別流程圖
首先需對輸入數(shù)據(jù)進(jìn)行歸一化處理,然后提取11種調(diào)制信號的循環(huán)譜。這里需要對循環(huán)譜進(jìn)行歸一化處理并將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。接著是ELM-LRF網(wǎng)絡(luò)的訓(xùn)練過程,傳統(tǒng)的基于模式識別的調(diào)制識別算法需要提取人工特征,而本文所用網(wǎng)絡(luò)是基于深度學(xué)習(xí)的思想,可以自動(dòng)從數(shù)據(jù)中提取特征,代替了人工提取特征的過程,因而自動(dòng)化程度更高。在訓(xùn)練好網(wǎng)絡(luò)之后,用測試集進(jìn)行測試,得到識別結(jié)果。
本文對11種調(diào)制信號進(jìn)行識別,包括二進(jìn)制振幅鍵控(2ASK)、四進(jìn)制振幅鍵控(4ASK)、二進(jìn)制頻移鍵控(2FSK)、四進(jìn)制頻移鍵控(4FSK)、二進(jìn)制相移鍵控(2PSK)、四進(jìn)制相移鍵控(4PSK)、十六進(jìn)制正交調(diào)幅(16QAM)、三十二進(jìn)制正交調(diào)幅(32QAM)、調(diào)幅(AM)、調(diào)頻(FM)、調(diào)相(PM)。其中,調(diào)制信號的參數(shù)設(shè)置為:載波頻率fc=2 kHz,采樣頻率fs=20 kHz,數(shù)字信號符號速率為RS=1 250 B,信號長度為L=2 048。調(diào)制信號的信噪比從-2 dB到16 dB。將生成的數(shù)據(jù)集分為訓(xùn)練集和測試集,每隔一個(gè)信噪比,訓(xùn)練集有5 500個(gè)樣本,測試集有1 100個(gè)樣本。因此,每種調(diào)制類型的信號在每2個(gè)信噪比間隔下共生成600個(gè)樣本。
在每個(gè)信噪比下進(jìn)行了100次仿真實(shí)驗(yàn),對實(shí)驗(yàn)結(jié)果取平均后,得到了每個(gè)調(diào)制信號的平均識別率如表1所示,算法的總體識別率如圖4所示。對表1分析可以發(fā)現(xiàn),當(dāng)信噪比低于0 dB時(shí),2ASK,4ASK和32QAM的識別率最差,2FSK,4FSK和FM的識別率最好,均能準(zhǔn)確識別出來。隨著信噪比的提升,識別效果逐漸改善,在4 dB時(shí),除了2ASK和4ASK,大部分調(diào)制信號的識別率都得到了改善。由圖4可知,隨著信噪比的提升,算法的總體識別率也不斷提高,當(dāng)信噪比大于4 dB時(shí),算法的平均識別率超過了96%,說明ELM-LRF網(wǎng)絡(luò)從循環(huán)譜中自動(dòng)學(xué)習(xí)出的特征是有效的,實(shí)驗(yàn)結(jié)果驗(yàn)證了本文算法的有效性。
表1 總體識別率
圖4 GA-ELM總體識別率
為了找到2ASK,4ASK和32QAM這3類信號在低信噪比下識別率低的原因,我們構(gòu)建了-2 dB、0 dB、4 dB、6 dB、10 dB和16 dB下的混淆矩陣圖,如圖5所示。
由圖5可以清晰地看到,在低信噪比下,2ASK和4ASK信號產(chǎn)生了嚴(yán)重的混淆,16QAM和32QAM同樣產(chǎn)生了嚴(yán)重的混淆。隨著信噪比的不斷提高,16QAM和32QAM識別率逐漸提高不再產(chǎn)生混淆,而2ASK和4ASK識別率提升不明顯,且混淆依然嚴(yán)重。直到16 dB,在其他調(diào)制樣式識別率收斂到100%時(shí),2ASK和4ASK依舊存在識別錯(cuò)誤的情況。分析原因,可能是因?yàn)樵谘h(huán)譜估計(jì)的過程中,調(diào)制信號的部分信息丟失,導(dǎo)致2ASK和4ASK之間區(qū)分困難。
文獻(xiàn)[16]中指出,ELM-LRF具有非常快的訓(xùn)練速度。為了驗(yàn)證本文算法的運(yùn)行速度,在訓(xùn)練集和測試集上進(jìn)行100次試驗(yàn),分別對總的訓(xùn)練時(shí)間和測試時(shí)間取平均。表2為在1臺CPU為I7-9 700 kHz,內(nèi)存48 GB的電腦上本文算法的實(shí)際運(yùn)行時(shí)間情況。
表2 算法運(yùn)行時(shí)間
由表2可知,相比于深度學(xué)習(xí)少則十幾個(gè)小時(shí)、多則好幾天的學(xué)習(xí)時(shí)間,ELM-LRF具有極快的訓(xùn)練速度,在幾分鐘以內(nèi)就能學(xué)習(xí)到數(shù)據(jù)的內(nèi)在特性。
本文提出了一種基于循環(huán)譜和ELM-LRF的調(diào)制識別算法,所用的ELM-LRF網(wǎng)絡(luò)是一種基于CNN架構(gòu)的網(wǎng)絡(luò),具有深度學(xué)習(xí)的功能,因此它能夠自動(dòng)地從循環(huán)譜圖中提取特征,避免了人工提取特征的過程。同時(shí)本文對11種調(diào)制信號進(jìn)行了分類識別,在0 dB時(shí)的識別率達(dá)到了95%,驗(yàn)證了算法在低信噪比下對模擬調(diào)制和數(shù)字調(diào)制信號都具有較高的識別率,同時(shí),算法對于16QAM和32QAM等高階調(diào)制樣式具有很高的識別效果。此外通過實(shí)驗(yàn)驗(yàn)證了ELM-LRF具有極快的訓(xùn)練速度。與文獻(xiàn)[10]中的方法進(jìn)行對比,本文使用的樣本量更小,獲得的識別率更高,而且相對于傳統(tǒng)深度學(xué)習(xí)方法,本文算法還具有極快的訓(xùn)練速度、較大的應(yīng)用潛力。下一步工作將對64QAM、128QAM和256QAM等高階調(diào)制樣式進(jìn)行實(shí)驗(yàn)。
圖5 算法在-2 dB、0 dB、4 dB、6dB、10 dB和16 dB下的混淆矩陣圖