馬強(qiáng),鄭文秀,盧光躍
(西安郵電大學(xué) 通信與信息工程學(xué)院,陜西 西安 710061)
基于雙譜LLE降維的PUE攻擊檢測
馬強(qiáng),鄭文秀,盧光躍
(西安郵電大學(xué) 通信與信息工程學(xué)院,陜西 西安 710061)
針對認(rèn)知無線電中的主用戶仿冒攻擊檢測問題,給出了基于矩形積分雙譜的局部線性嵌入降維算法,用于識別主用戶(PU)和仿冒用戶(SU)。選擇矩形積分雙譜作為識別特征參數(shù),利用局部線性嵌入算法(LLE)進(jìn)行特征數(shù)據(jù)約簡,通過基于核函數(shù)的支持矢量機(jī)(SVM)進(jìn)行個體識別。實(shí)驗(yàn)結(jié)果表明,該方法具有較高的識別率,并能夠較好解決PUE攻擊檢測問題。
通信輻射源;矩形積分雙譜;局部線性嵌入算法;支持矢量機(jī);PUE攻擊檢測
由于認(rèn)知無線電技術(shù)不僅可以提高頻譜利用率,而且具有感知能力,其應(yīng)用范圍不斷擴(kuò)大。但認(rèn)知無線電存在一些安全問題,其中危害最大的是主用戶仿冒攻擊(Primary User Emulation Attack,PUEA)即仿冒用戶(SU)仿冒主用戶(PU)從而達(dá)到長時間占用信道的目的。
現(xiàn)有的PUE攻擊檢測方法主要有以下幾類:基于無線定位和卡爾曼濾波的檢測方法,需要預(yù)先定位和跟蹤主用戶的物理目標(biāo)位置和運(yùn)動信息,以區(qū)分主用戶和攻擊者。但是這樣的條件限制使其無法工作在主用戶移動規(guī)律(如速度等)或者位置信息不可知的授權(quán)網(wǎng)絡(luò)中?;谀芰恐讣y匹配的檢測方法,依賴于感知節(jié)點(diǎn)和主用戶的相對位置。當(dāng)相對位置改變時,能量指紋也隨之而改變。這種方法只適用于靜態(tài)的認(rèn)知網(wǎng)絡(luò)?;诩用懿呗缘臋z測方法是通過增加用戶的密碼認(rèn)證機(jī)制來實(shí)現(xiàn)區(qū)分主用戶和仿冒用戶。這種方案勢必會增加認(rèn)知網(wǎng)絡(luò)的時間開銷和授權(quán)復(fù)雜度。所以,現(xiàn)有的PUE攻擊檢測方法對于移動認(rèn)知網(wǎng)中認(rèn)知用戶的動態(tài)識別表現(xiàn)不佳。
SU的信號調(diào)制方式、碼速率、載波頻率等信號參數(shù)會模仿PU的信號參數(shù),但信號終究是由不同輻射源發(fā)出,信號波形中勢必會存在不同程度的差異特征,如交叉調(diào)制、寄生調(diào)制、器件的非線性特征等。本文通過輻射源識別進(jìn)行PUE攻擊檢測,采取了一種基于積分雙譜[1-4]和局部現(xiàn)行嵌入算法(LLE)[5]的通信輻射源識別算法,仿真結(jié)果表明該算法能夠很好地降低SIB的冗余信息,對通信輻射源有較高的識別率。
高階譜由于具有時移不變性、尺度變化性和相位保持性,還可以抑制高斯噪聲,因此在輻射源識別中應(yīng)用廣泛。雙譜是階數(shù)最低的高階譜,處理方法最為簡單而且運(yùn)算量較小。
假設(shè)通信輻射源穩(wěn)態(tài)信號為x(t),則其三階累量為:
式中,上標(biāo)*表示復(fù)共軛。雙譜定義為:
信號的雙譜變換將數(shù)據(jù)量從一維變換成為二維,從而帶來了數(shù)據(jù)量的復(fù)雜化。雙譜的冗余信息若直接作為信號特征會使得識別概率降低,不僅增加運(yùn)算量,識別效率也會隨之降低。因此,必須考慮進(jìn)行數(shù)據(jù)降維。
采用矩形積分雙譜(SIB)的方法進(jìn)行信號雙譜積分降維[6,7],定義為:
式中,sl為積分路徑。SIB同時滿足尺度變化性、相位保持性和時移不變性,信號所有的雙譜值全部參與運(yùn)算,并且沒有重復(fù)使用,從而能夠獲取目標(biāo)識別中的重要信息。對計(jì)算出的信號雙譜進(jìn)行矩形積分計(jì)算,如對雙譜平面上矩形積分采用l條積分路徑,于是信號樣本所對應(yīng)的信號雙譜特征向量的維數(shù)為l維。
SIB在實(shí)際計(jì)算時需要計(jì)算整個雙譜平面的雙譜值,不僅得到的數(shù)據(jù)量較大,而且增加了分類器的規(guī)模,并影響分類的準(zhǔn)確性、降低了分類器的魯棒性。為了能夠提取分類能力強(qiáng)的低維本質(zhì)特征,本文采用局部線性嵌入算法(Locally Linear Embedding,LLE)對SIB特征參數(shù)進(jìn)行降維。
LLE是Roweis和Saul[8]于2000年提出的一種非線性降維方法,將全局的非線性轉(zhuǎn)換成局部的線性,并且重疊的局部區(qū)域能夠體現(xiàn)全局結(jié)構(gòu)的信息。它可以使降維后的數(shù)據(jù)充分保持原有數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)。LLE方法主要包括3步:①用歐氏距離計(jì)算高維空間的每個樣本點(diǎn)的K個近鄰點(diǎn);②根據(jù)樣本點(diǎn)的近鄰點(diǎn)計(jì)算該點(diǎn)和其他點(diǎn)之間的局部重建權(quán)值矩陣;③根據(jù)樣本點(diǎn)的局部重建權(quán)值和其近鄰點(diǎn)計(jì)算出該樣本點(diǎn)的輸出值。LLE算法所需輸入的參數(shù)很少,其最重要的參數(shù)就是近鄰參數(shù)K和本征維數(shù)d。K的選取對LLE算法的映射質(zhì)量影響很大,K過大會造成整體流形結(jié)構(gòu)消除,K過小使連續(xù)的流形結(jié)構(gòu)成為分離的流形結(jié)構(gòu)。本征維數(shù)d的選取經(jīng)常是通過經(jīng)驗(yàn)來獲得,本征維數(shù)d過大就會將較多的噪聲包含進(jìn)來,相反d較小則會使得降維后的數(shù)據(jù)包含較多的重疊信息。
2.1 改進(jìn)的樣本點(diǎn)距離計(jì)算方法
傳統(tǒng)的LLE降維方法是通過計(jì)算每個樣本近鄰點(diǎn)的歐式距離,但是由SIB得到的高維雙譜特征數(shù)據(jù)往往是非線性分布的,依然采用歐氏距離來計(jì)算樣本近鄰點(diǎn)的距離不是十分合理。這會造成我們重建權(quán)值矩陣和樣本點(diǎn)的輸出值不能很好地反映出通信信號雙譜的拓?fù)涮卣鳌?/p>
本文將采用測地距離[9-11]來替代歐氏距離,測地距離能夠反映非線性數(shù)據(jù)樣本點(diǎn)之間的位置關(guān)系。由于測地距離加入了樣本空間分布形狀的先驗(yàn)信息,當(dāng)樣本分布為曲面形狀時,測地距離更能真實(shí)地度量樣本之間的相似性程度。流形上的樣本點(diǎn)xi與近鄰點(diǎn)的歐氏距離如圖1所示;xi與近鄰點(diǎn)的測地距離如圖2所示;所以在利用測地距離時就可以將“遠(yuǎn)點(diǎn)”排除在外。
圖1 樣本點(diǎn)xi與近鄰點(diǎn)的歐氏距離
圖2 樣本點(diǎn)xi與近鄰點(diǎn)的測地距離
具體計(jì)算步驟如下:
①在取樣本點(diǎn)xi的近鄰點(diǎn)時,先用歐氏距離‖‖計(jì)算xi與近鄰點(diǎn)之間的距離Dij;
②將Dij按由小到大的順序排列,取前K2個點(diǎn);
③用測地距離重新計(jì)算這K2個點(diǎn)的距離,K<<N。當(dāng)xi與近鄰點(diǎn)的距離足夠近時可以用歐氏距離逼近;當(dāng)xi與近鄰點(diǎn)的距離較遠(yuǎn)時,可以用歐氏距離的疊加來代替兩點(diǎn)之間的測地距離;即:
xi與相離較遠(yuǎn)點(diǎn)之間的測地距離可用疊加的方法計(jì)算,設(shè)t=1,2,…,K2,則通過如下迭代計(jì)算所有的Dij:
根據(jù)求得的Dij按由小到大排列,取前K個點(diǎn)近鄰點(diǎn)。由得到的K個近鄰點(diǎn)可以計(jì)算局部最優(yōu)化重建權(quán)值矩陣,將所有樣本點(diǎn)映射到低維空間中時映射條件滿足下式:
式中,ε(Y)為損失函數(shù)值,yi是xi的輸出向量,yij(j= 1,2,…,K)是yi的K個近鄰點(diǎn),且滿足以下約束條件:
式中,M是一個N×N的對稱矩陣,表達(dá)式為:
如果要使得損失函數(shù)ε(Y)達(dá)到最小,則取Y為M的最小d個非零特征值所對應(yīng)的特征向量作為輸出維數(shù)。
2.2 輸出維數(shù)d算法
輸出維數(shù)d的取值對低維空間的映射結(jié)果有很大影響:d取值過大使映射結(jié)果含有過多噪聲;d取值過小使得本來不同的點(diǎn)在低維空間中可能會彼此交疊,這都不利于通信信號偵查。傳統(tǒng)的d值估計(jì)主要有映射方法、幾何學(xué)習(xí)方法和統(tǒng)計(jì)學(xué)習(xí)方法等。但是這三類方法計(jì)算過于復(fù)雜。對局部線性低維流形可以采用線性的分析手段,通過其主要特征的維數(shù)來表征局部數(shù)據(jù)的維數(shù)。根據(jù)這種思想,采用主元分析法(PCA)來對局部數(shù)據(jù)進(jìn)行維數(shù)約簡,根據(jù)局部數(shù)據(jù)約簡后主元的個數(shù)取其均值,從而得到輸出維數(shù)d。
實(shí)現(xiàn)步驟如下:
③令k=k+1,如果k≤N,那么重復(fù)步驟②;否則,執(zhí)行步驟④;
④令DIM={d1,d2,…,dN},統(tǒng)計(jì)DIM中各維數(shù)數(shù)目,確定一個一致的輸出維數(shù)估計(jì)值
通信輻射源識別中所獲取的信號樣本數(shù)量有限,計(jì)算信號樣本的矩形積分雙譜,對雙譜值進(jìn)行LLE降維,從而得到約簡后的信號特征,此時由于得到的特征數(shù)目比較少,而支持矢量機(jī)(SVM)[12]只需少量樣本就可以構(gòu)成最優(yōu)分類器,故本文采用SVM進(jìn)行分類識別。SVM思想是通過某種事先選擇的非線性映射將輸入矢量映射到一個高維特征空間,在這個空間中構(gòu)造最優(yōu)分類超平面。
SVM對于線性訓(xùn)練樣本的決策函數(shù)為:
式中,sgn(·)為符號函數(shù);q為支持向量的個數(shù); ωi(i=1,2,…,q)為權(quán)系數(shù);K(xi,xj)為核函數(shù)。只要滿足Mercer條件的實(shí)對稱函數(shù)都可以作為核函數(shù),不同的核函數(shù)會產(chǎn)生不同的識別效果。本文采用高斯徑向基函數(shù)K(xi,x)=exp(-‖x-xi‖2/σ2)是局部性較強(qiáng)的核函數(shù),其中xi為核函數(shù)中心,σ為函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍。通過多次試驗(yàn)不同的參數(shù)σ得到不同的識別率,如圖3所示。
由圖3可知,當(dāng)高斯核函數(shù)參數(shù)σ=2時分類識別的效果最好,具有較高的正確識別率。因此,本文選擇σ=2。
SVM的本質(zhì)是二分類,通常做法分為2類:一對一方法(One Against One,OAO)和一對多方法(One Against All,OAA)。一對多方法在調(diào)制集合元素?cái)?shù)目較少時,識別率較高,但是易產(chǎn)生誤判或無法判別的情況;一對一的方法識別率在低信噪比下仍較高,解決分類數(shù)目較少的識別問題,性能優(yōu)良。所以,本文采用OAO的分類方法,對M個輻射源進(jìn)行識別,則總共需要M(M-1)/2個分類器。
圖3 不同參數(shù)σ時SVM識別率
綜上所述,通信輻射源個體識別的步驟如下:
①對通信輻射源信號進(jìn)行采樣并做幅度歸一化和零均值化的處理;②對預(yù)處理后的信號應(yīng)用前面所述方法進(jìn)行雙譜計(jì)算,再按照矩形積分路徑對雙譜結(jié)果進(jìn)行圍線積分計(jì)算;③根據(jù)改進(jìn)的LLE降維算法對矩形積分雙譜值進(jìn)行非線性降維,降維后的雙譜特征分為2部分,一部分用于訓(xùn)練,一部分用于分類測試,如圖4所示。
圖4 基于SIB-LLE的通信輻射源識別原理圖
本實(shí)驗(yàn)是在Matlab2012b平臺上完成,實(shí)驗(yàn)一為模擬在認(rèn)知無線電網(wǎng)絡(luò)中的主用戶仿冒攻擊,對PU和仿冒用戶進(jìn)行識別;實(shí)驗(yàn)二為實(shí)測信號的識別實(shí)驗(yàn)。
4.1 實(shí)驗(yàn)一
實(shí)驗(yàn)所用信號數(shù)據(jù)為一組BPSK信號,其載波頻率為fc=2 700 Hz,碼速率為fb=300 B,采樣頻率fs=15 kHz。將生成的BPSK信號首先進(jìn)行幅度歸一化處理,然后通過中心頻率為fc,帶寬為3fb的FIR帶通濾波器生成通信輻射源S1。將源S1再次通過中心頻率為fc,帶寬為3fb的IIR帶通濾波器生成通信輻射源S2。在S1和S2上疊加3倍碼速率的高斯色噪聲,噪聲能量為0.3。對每個源分別取60個樣本信號,前20組信號用于對SVM進(jìn)行訓(xùn)練,后40組信號用于測試。
對2種采取相同調(diào)制方式的通信輻射源信號分別采用SIB、SIB/LLE和SIB/改進(jìn)LLE的識別率與主分量特征維數(shù)的關(guān)系如圖5所示。實(shí)驗(yàn)結(jié)果如表1所示,當(dāng)采用特征維數(shù)為50時,SIB/LLE方法的識別率優(yōu)于直接利用目標(biāo)的積分雙譜進(jìn)行識別,通過改進(jìn)后的SIB/LLE可以進(jìn)一步提高識別率。
圖5 信噪比30dB時不同特征維數(shù)的識別率
表1 不同方法的正確識別率/(%)
4.2 實(shí)驗(yàn)二
實(shí)驗(yàn)用信號樣本從同型號、同批次的兩部ASK電臺采集,分別標(biāo)記為T1和T2。使用的信號采樣頻率為250 MHz,采樣點(diǎn)大小為1 024,并在使用前進(jìn)行幅度歸一化處理。每個電臺提供60組樣本信號,分別取其特征維數(shù)為50,前20個信號用于訓(xùn)練SVM分類器,其余的信號用于分類測試。通過電臺的多次分類實(shí)驗(yàn)表明,基于改進(jìn)的SIB/LLE方法提取的特征矢量能夠較好地反映同型號、同批次的通信電臺個體的細(xì)微差異,具有較好的分類能力,如表2所示。
表2 實(shí)測信號的正確識別率/(%)
現(xiàn)有的PUEA檢測方法有基于無線定位和卡爾曼濾波的檢測方法,但其無法工作在主用戶移動規(guī)律(如速度等)或者位置信息不可知的授權(quán)網(wǎng)絡(luò)中。基于能量指紋匹配的檢測方法只適用于靜態(tài)的認(rèn)知網(wǎng)絡(luò),基于加密策略的檢測方法會增加認(rèn)知網(wǎng)絡(luò)的時間開銷和授權(quán)復(fù)雜度。故針對以上識別方法的缺陷,通過雙譜LLE降維后通過SVM的方法對主用戶(PU)和仿冒用戶(SU)進(jìn)行識別,從而解決PUE攻擊檢測問題。由于積分雙譜中包含了許多對個體識別貢獻(xiàn)率不大的成分,利用LLE對積分雙譜數(shù)據(jù)集用局部線性低維流形來逼近,充分保持了雙譜的拓?fù)浣Y(jié)構(gòu),對通信輻射源有較高的識別率。
通過仿真試驗(yàn)和實(shí)測數(shù)據(jù)實(shí)驗(yàn),對仿真信號和實(shí)測信號的識別率均超過90%,從而驗(yàn)證了算法的有效性。表明文中提出的應(yīng)用矩形積分雙譜和局部線性嵌入算法得到的特征向量,可以作為主用戶和仿冒用戶的通信信號指紋特征用于PUE攻擊檢測。
[1]陳志偉,徐志軍,王金明,等.一種基于循環(huán)譜切片的通信輻射源識別方法[J].?dāng)?shù)據(jù)采集與處理,2013,28 (3):284-288.
[2]陳濤,姚文楊,林金秋,等.雷達(dá)輻射源個體特征的提取與識別[J].應(yīng)用科學(xué)學(xué)報(bào),2013,31(4):368-374.
[3]錢祖平,許淵,邵尉,等.基于高階譜和時域分析的電臺穩(wěn)態(tài)特征提取算法[J].電子與信息學(xué)報(bào),2013,35 (7):1599-1605.
[4]陶旺林,盧選民,劉李娟.基于局部圍線積分雙譜的通信輻射源個體識別[J].計(jì)算機(jī)工程與應(yīng)用2013,49 (1):131-133,136.
[5]屈治禮.LLE方法的分類與研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013(4):14-17,50.
[6]Xu Shu-hua,Huang Ben-xiong,Xu Zheng-guang,et al.A New Feature Vector Using Local Surrounding-line Integral Bispectra for Identifying Radio Transmitters[C]∥Signal Processing and Its Applications,2007.ISSPA 2007.9th International Symposium on,2007:1-4.
[7]徐書華,黃本雄,徐麗娜.基于SIB/PCA的通信輻射源個體識別[J].華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,36(7):14-17.
[8]Roweis S T,SAUL L K.Nonlinear Dimensionality Reduction by Locally Linear Embedding[J].Science(80-),2000,290(5500):2323-6.
[9]王和勇,鄭杰,姚正安,等.基于聚類和改進(jìn)距離的LLE方法在數(shù)據(jù)降維中的應(yīng)用[J].計(jì)算機(jī)研究與發(fā)展2006,43(8):1485-1490.
[10]魏萊,王守覺,徐菲菲.基于測地線距離的自適應(yīng)局部多維尺度變換[C]∥控制科學(xué)與工程全國博士生學(xué)生論壇,2007:198-205.
[11]楊慶,陳桂明,劉鯖潔,等.基于測地線距離的核主元分析在齒輪泵故障識別中應(yīng)用[J].上海交通大學(xué)學(xué)報(bào),2011,45(11):1632-1636.
[12]宋永東.支持向量機(jī)參數(shù)選擇的研究[D].武漢:華中師范大學(xué),2013:25-33.
PUE Attack Identification Based on Improved Bi-spectrum Dimension Reduction Using LLE
MA Qiang,ZHENG Wen-xiu,LU Guang-yue
(School of Communication and Information Engineering,Xi'an University of Posts&Telecommunications,Xi'an Shaanxi 710061,China)
To address the issue of primary user emulation attack identification in cognitive radio,an improved square integral bi-spectrum dimension reduction method using locally linear embedding algorithm is proposed for the identification of primary user(PU) and secondary user(SU).Square integral bi-spectrum(SIB)is used as the feature parameter,and local linear embedding(LLE)is utilized to reduce the feature dimension,then a support vector machine(SVM)based on kernel-function is used for individual identification.The experimental results demonstrate that the suggested technique has a high recognition rate,and it can solve the problem of PUE attack identification.
radio transmitter;square integral bi-spectrum(SIB);local linear embedding(LLE);support vector machine(SVM); primary user emulation attack identification
TN911.7
A
1003-3114(2015)05-29-4
10.3969/j.issn.1003-3114.2015.05.08
馬強(qiáng),鄭文秀,盧光躍.基于雙譜LLE降維的PUE攻擊檢測[J].無線電通信技術(shù),2015,41(5):29-32,45.
2015-05-11
國家自然科學(xué)基金面上項(xiàng)目(61271276);陜西省教育廳項(xiàng)目(14JK1668)
馬強(qiáng)(1988—),男,碩士研究生,主要研究方向:無線頻譜感知、信息融合。鄭文秀(1979—),女,副教授,主要研究方向:通信對抗、信號檢測。