白 釗
(上海光古電子有限公司,上海 201612)
短波數(shù)字信號調制識別在短波頻譜監(jiān)測等工作中具有重要作用,它不僅能為后續(xù)的信號處理工作提供基礎,而且還能從調制的層面對信號進行歸類,支撐大數(shù)據(jù)應用和發(fā)射源識別。現(xiàn)有研究調制識別方法一般分為最大似然法和模式識別法,一些文章比較詳盡地歸納了不同的調制分類算法。其中,基于信號瞬時統(tǒng)計參數(shù)和功率譜特征的識別方法具備受信號調制參數(shù)變化影響小、對調制先驗信息的依賴少等優(yōu)點,因此使用范圍較廣。對調制分類器來說,傳統(tǒng)的決策樹分類器存在自適應能力不足、擬合能力不夠強等弱點,而近年來新興的基于神經網絡的分類器具有較強的自學習能力和容錯性,在很大程度上彌補了判決樹分類器自適應能力不足的缺點,而且神經網絡集成還可以降低識別的錯誤率、提高識別系統(tǒng)的泛化能力。
針對BPSK、QPSK、8PSK和8QAM這4種常規(guī)短波數(shù)字調制信號,首先該文從瞬時信息中提取1組特征參數(shù)。其次,使用一種基于最優(yōu)權重的神經網絡集成分類器對其進行分類,以完成調制識別工作。最后,將算法應用在真實數(shù)據(jù)集上,取得了約90%的調制類型識別正確率,驗證了該算法的有效性和可靠性。
在調制識別算法中,先要獲取特征,再對特征進行分類,因此特征參數(shù)的選擇和提取對識別效果有較大的影響。一般要求特征之間相互獨立,能夠反映調制類型的本質差異,具有穩(wěn)定性并具備一定抗干擾能力,根據(jù)分類器不同和實際工作經驗,選擇3~5種特征參數(shù)為宜。在該算法中,選擇信號帶寬、離散譜線分量、功率譜形狀(梳狀譜特征)和參數(shù)這4種特征進行參數(shù)提取。
實際短波通信基本都是突發(fā)模式,通聯(lián)過程中并不是時刻都有信號存在。在進行特征參數(shù)提取前,要先檢測信號是否存在,僅提取真正有信號的部分而非噪聲。為此,在特征參數(shù)提取之前有預處理過程,以完成信號檢測工作。
過程包括將信號樣本分割為固定長度片段,再根據(jù)頻域能量集中度進行篩選,去除不包括效信號的噪聲部分。將采集的樣本數(shù)據(jù)分割成長度為106.67 ms的數(shù)據(jù)段,前后數(shù)據(jù)段有50%的重疊。
引入頻域能量集中度的概念。頻域能量集中度指一個數(shù)據(jù)段的信號在頻率上的平均功率除以功率最強的一個頻率點上的功率,如公式(1)所示。
式中:()為第個采樣點的幅值;()為個采樣點中幅值最大值(絕對值最大);為幀內采樣點個數(shù)。
對提取的各個信號數(shù)據(jù)段來說,先計算其頻域能量集中度,如果連續(xù)數(shù)個均高于設定的閾值,則說明其在信號內部而非噪聲,再對提取的信號進行特征參數(shù)提取。
由于不同的數(shù)字調制信號的調制類型、調制速率以及滾降濾波等參數(shù)不同,因此其具有不同的帶寬,帶寬是用于識別數(shù)字調制信號調制類別的重要特征。因為帶寬內信號的功率或幅度很大,而帶寬外信號的功率或幅度很小,所以可以根據(jù)信號功率或幅度槽邊沿的變化在頻域估算信號的帶寬。
為減少實際信道中突發(fā)噪聲等因素對信號帶寬的影響,使用時域分段平滑的方法來計算帶寬。選取合適的分段長度對信號功率譜進行平滑,再對平滑后的功率譜搜索極值點,找到功率槽上升、下降邊沿,確定其信號的起始、截止頻率,即可得到信號帶寬。
平滑功率譜如公式(2)、公式(3)所示。
式中:()為第個采樣點的信號幅度;為該段信號的總長度;為信號樣點位置;()為()傅里葉變換的值;()為()的共軛。
在公式(2)中,=1,…,/且滿足<<、可以整除的條件,得到的P()即為平滑后的頻譜上第點的功率。
對P()進行差分運算,結果如公式(4)、公式(5)所示。
式中:F為采樣頻率;為帶寬。
考察高次方譜,在BPSK經過平方變換、QPSK和8QAM經過四次方變換以及8PSK經過八次方變換后,在對應的倍頻位置上存在較強的離散譜線。另外,對不同協(xié)議的信號來說,為方便開展測量載頻、估算多普勒頻移以及信號捕獲等工作,往往會在信號前導位置或頻譜一端設計1段單載波。例如HFDL等信號,突發(fā)起始位置有固定的單載波。因此,信號的離散譜線特征也對信號調制類型識別有重要意義。如何有效檢測各階功率譜上的單頻譜線、準確估算譜線數(shù)目,從而得到信號的離散譜線特征,是識別工作的重要步驟。由于短波信道通常都不是白噪聲信道,因此該文基于色噪聲功率補償?shù)牟罘止β势交―SC)算法提出了色噪聲中的離散譜線分量。
根據(jù)DSC算法,經過處理后可以用來搜索離散譜線的信號功率譜,如公式(6)所示。
式中:為數(shù)據(jù)長度,須滿足⊕=+mod;P()為原始信號功率譜;diff(·)為差分運算。
通過搜索P()在相應頻率范圍的局部極值點即可完成單頻檢測。
部分信號在通聯(lián)過程中存在明顯的譜線或多個譜峰,即梳狀譜特征。多音并行和單音串行調制、相位調制以及頻率調制等都會形成梳狀譜特征的差異。
公式(6)給出了色噪聲中的功率譜計算公式及單音頻率檢測算法。對存在梳狀譜特征的LINK-11 CLEW信號來說,同樣可利用公式(6)計算并判決是否存在梳狀譜特征。下面,將引入梳狀譜檢測公式。
通過基于分段平均思想的帶寬估計算法可得信號功率幅度譜帶寬為,k處所對應的信號幅值為Pn(k),對∈ [-,+]且≠k,其平均幅值為Pn(),為設定的鄰域寬度。如果滿足Pn(k)/Pn()>,則確定該點為次方譜的離散譜線分量FE,為根據(jù)信號幅值比值所設定的門限值。同時,峰值序列PS的定義如公式(7)所示。
由定義可知,如果信號存在梳狀譜,則峰間距離PS可準確描述梳狀譜中各譜峰間距離并給出判決。
參數(shù)反映信號包絡的變化程度, 部分信號包絡變化較小,部分信號包絡變化則相對較大,例如多音并行調制信號的包絡比單音串行信號更穩(wěn)定,QAM類調制信號比PSK類調制更穩(wěn)定,而PSK類調制的又比FSK類調制的包絡更穩(wěn)定。由此可以用參數(shù)表達這種信號特征,如公式(8)所示。
式中:、分別為信號包絡平方的均值和方差。
分類器集成分為級聯(lián)和并聯(lián)2種方式。前一級分類器輸出作為后一級分類器輸入信息的稱為級聯(lián)方式;各分類器獨立輸入、輸出,各輸出通過適當?shù)慕M合方式綜合得到總輸出結果的稱為并聯(lián)方式。
由于前面描述的信號特征參數(shù)各不相同,是從不同角度對信號進行描述的,不具備串行級聯(lián)的條件,而且不同的特征參數(shù)各自對信號調制也具備一定的分類識別能力,因此該文采用了并聯(lián)分類器級聯(lián)的方式。為使各個分類器具有更好的融合效果,該文采用多分類器加權平均的組合方式來進行信號調制類型識別,不同特征通過各自的分類器獨立識別,根據(jù)求解得到的最優(yōu)權重系數(shù)給出加權平均輸出,得到最終的分類識別結果。分類器結構如圖1所示。
在倡導全球經濟一體化的今天,經濟交流的逐漸密切會帶動文化的融合交流,在此形勢下,“異化”翻譯是緩沖文化差異沖突的有效方法之一,這種作用的發(fā)揮也是兩方面的,一方面可以向外國宣傳該國的歷史文化;另一方面也為該國人民群眾對外國的歷史文化、民土風情的學習了解提供一個平臺,從而促進文化交流融合的局面的維護。
圖1 基于神經網絡集成的分類器結構
要使集成分類器能達到最優(yōu),就需要各分類器的錯誤是不相關的。對神經網絡分類器來說,文獻[5]指出,各分類器采用不同特征向量與不同訓練集能充分保證各分類器間的差異性,這在該文所提出的條件下完全能夠滿足。
在分類器的選擇上,因為決策樹結構分類器的識別能力無法滿足實際識別工作的需求,所以該文采用神經網絡作為調制識別的分類器。
在具體的網絡類型上,這里選取徑向基函數(shù)(RBF)神經網絡,它是一種三層前饋網絡,由輸入層、隱含層和輸出層構成,隱含層單元數(shù)決定了該神經網絡可識別區(qū)分的類別數(shù)目。隱含層單元的傳遞函數(shù)為徑向基函數(shù),采用徑向對稱高斯函數(shù),如公式(9)所示。
式中:u為第個隱層節(jié)點的輸出;為輸入樣本,=(,,…,x);C為高斯函數(shù)的中心值;σ為標準化常數(shù);為隱含節(jié)點的個數(shù)。
徑向基函數(shù)(RBF)神經網絡具有訓練時間短、收斂速度快等優(yōu)點,并且沒有陷入多個局部極值點的缺陷。被集成的各成員分類器輸入層神經元數(shù)目由特征參數(shù)數(shù)量決定,隱含層神經元數(shù)量為5,對應待識別調制方式數(shù)量(包括“未知”類別),輸出層神經元數(shù)目為5;各分類器均采用模糊C-均值算法確定隱含單元數(shù)目,網絡權值訓練采用梯度下降法。
式中:S為某個模式分類器輸出的最小均方誤差,S=(||-||);S為各個模式分類器輸出的最小均方誤差的均值。
試驗數(shù)據(jù)來源于從天空接收采集的真實信號樣本:HFDL 8PSK(8PSK調制,信噪比約為6 dB~12 dB,有衰落)、HAM PSK220F(BPSK調制,信噪比約為6 dB~10dB,有衰落)、LINK-11 CLEW(16tone-QPSK調制,信噪比約為4 dB~8 dB,有衰落)以及MS110B 8QAM(8QAM調制,信噪比約為4 dB~10 dB,有衰落),實際的樣本語圖如圖2、圖3所示(橫坐標為時間,s;縱坐標為頻率,Hz)。
圖2 HFDL 8PSK語圖
圖3 LINK-11 CLEW語圖
采樣率為9 600 Hz,精度為16位,存儲格式為wav格式。每個信號塊分割長度為106.67 ms,每塊有50%的重疊。在通過預處理準確獲取信號突發(fā)部分后,將估算和提取的帶寬、離散譜線分量、功率譜形狀以及參數(shù)等分別作為1組特征向量輸入各神經網絡分類器,經過前述算法得到最終的識別分類結果,見表1。
表1 該文算法識別效果
其總體識別正確率約為90%,結果表明該文所采用的算法是有效的。具體來講,對BPSK(HAM PSK220F)這類較簡單的調制規(guī)格以及LINK-11 CLEW(16tone-QPSK)這類調制特征明顯(與其他信號差異大的規(guī)格)來說,識別效果較好;對8QAM(MS110B 8QAM)這類高效調制(特別是在包絡、高次方譜等與8PSK等類似高效調制難以區(qū)分的情況下)來說,識別效果稍差,這符合以往的識別經驗,但也達到了比傳統(tǒng)算法更高的正確率。
該文結合短波數(shù)字調制信號特點,通過預處理機制消除干擾,實現(xiàn)有效提取信號的目標。該文提出了2個新的頻域特征參數(shù)來構造時域、頻域相結合的特征參數(shù)向量,這些參數(shù)具有良好的抗噪性能和廣泛的適用性。設計實現(xiàn)了基于最優(yōu)權重求解的神經網絡集成方法,實際測試結果表明該方法的識別正確率較高。