王 星, 陳 相, 周一鵬, 陳 游, 肖冰松, 王洪迅
(空軍工程大學(xué)航空工程學(xué)院, 西安, 710038)
信息化條件下,電磁空間成為繼海、陸、空、天之后的第五維戰(zhàn)場空間,電子偵察系統(tǒng)通過截獲電磁空間中密集的信息流,為戰(zhàn)場態(tài)勢感知和輔助干擾決策提供情報支撐[1]。雷達信號分選是電子偵察系統(tǒng)的初始環(huán)節(jié),信號分選問題本質(zhì)上是將偵察接收機偵收到的不同雷達輻射源信號進行分離的過程,是電子戰(zhàn)得以成功實施的重要前提,對整個電子戰(zhàn)系統(tǒng)具有重要的影響。
從機器學(xué)習(xí)的角度來看,聚類過程是無監(jiān)督學(xué)習(xí)過程[2-3],聚類算法能夠在無標(biāo)記訓(xùn)練樣本的條件下將原始數(shù)據(jù)進行分組,從而發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。目前常用的無監(jiān)督聚類算法主要包括:基于層次、基于密度、基于劃分等幾大類。DBSCAN算法是一種密度聚類算法,它不需要先驗的聚類簇數(shù)量,并且能夠分選出各種形狀的聚類簇[4],算法復(fù)雜度低,適合于雷達信號的自分選。但該算法對聚類參數(shù)較敏感,且聚類參數(shù)是根據(jù)先驗知識人為設(shè)定的,可靠性不高;同時DBSCAN算法適合于處理密度相對比較均勻的數(shù)據(jù),當(dāng)不同簇的密度變化較大時,DBSCAN分選效果不佳。為了克服傳統(tǒng)DBSCAN算法的缺陷,李文杰等[5]提出的KANN-DBSCAN算法結(jié)合參數(shù)尋優(yōu)策略,利用數(shù)據(jù)集自身的分布特性尋找最優(yōu)分選參數(shù),無需人為賦值,便能夠?qū)崿F(xiàn)全過程無監(jiān)督聚類,但該算法復(fù)雜度較高,在處理數(shù)據(jù)量較大的數(shù)據(jù)集時效果不佳;OPTICS算法[6]是根據(jù)DBSCAN算法思想演化而來的一種基于層次密度的分選算法,最終得到帶有可達距離和核心距離的輸出數(shù)據(jù),該算法對參數(shù)不敏感,但仍然需要聚類參數(shù)的人為輸入,對于不同的輸入,聚類結(jié)果有較大差異;胡健等提出IABC-DBSCAN算法[7],利用人工蜂群算法強大的全局和局部優(yōu)化特征尋找DBSCAN算法中的最優(yōu)聚類參數(shù),可有效克服DBSCAN算法對聚類參數(shù)敏感問題,但并未完全解決DBSCAN算法全局參數(shù)設(shè)置問題。
隨著新體制雷達信號處理能力的不斷提高,波形參數(shù)捷變、數(shù)字波束合成等數(shù)字化技術(shù)普遍應(yīng)用,使得新體制雷達信號的變化方式日益復(fù)雜,同時雷達與偵察接收機在空間上的距離位置、雷達的不同工作狀態(tài)、以及雷達的不同工作體制等使得接收機偵收的雷達信號具有非均勻、多密度、脈沖數(shù)據(jù)量大、脈沖參數(shù)交疊嚴(yán)重等特點[8]。并且先進體制雷達如相控陣?yán)走_的工作模式多樣[9],往往集多種體制于一身,使得偵收到的信號具有很大的不確定性。在實際分選處理中,往往會將同一雷達的不同模式分選成多部雷達,造成分選“增批”問題,給雷達信號分選帶來了巨大挑戰(zhàn)。
針對上述問題,本文提出了一種CMDBSCAN算法,該算法首先結(jié)合距離曲線傾角突變的特點自適應(yīng)獲得鄰域半徑,并根據(jù)雷達信號在參數(shù)空間中的分布密度,相應(yīng)地調(diào)整密度點數(shù)閾值,進而能夠根據(jù)空間的密度分布特點自適應(yīng)生成分選參數(shù);之后結(jié)合多維云模型理論,利用逆向云發(fā)生器算法和三維正向高斯云算法[10],對DBSCAN分選結(jié)果進行有效性評估,利用反饋的判定結(jié)果,進一步優(yōu)化DBSCAN算法鄰域參數(shù),提高DBSCAN算法的分選準(zhǔn)確性和可靠性。
DBSCAN算法以數(shù)據(jù)的稠密程度作為劃分簇的依據(jù),分類效果主要由一組“鄰域”參數(shù)(Eps,MinPts)決定。給定數(shù)據(jù)集D={x1,x2,…,xm},給出幾個重要概念的定義:
定義1Eps鄰域。也稱為ε鄰域,對于數(shù)據(jù)點xj∈D,其Eps鄰域定義為樣本集D中與xj距離不大于Eps的樣本對象xi的集合,即NEps(xj)={xi∈D|dist(xi,xj)≤Eps}。其中,dist(xi,xj)表示2個樣本點之間的距離刻畫。
定義2核心對象。給定整數(shù)MinPts,若樣本xj的Eps鄰域范圍內(nèi)包含的樣本數(shù)量不小于MinPts,即滿足|NEps(xj)|≥MinPts,則稱xj為(Eps,MinPts)條件下的核心對象。
定義3密度直達。若樣本xj在核心對象xi的Eps鄰域范圍內(nèi),即滿足xj∈NEps(xi)且NEps(xi)≥MinPts,則稱xj是從xi密度直達的。
定義4密度相連。對于對象xj和xi,若存在一個對象xk,使得xj和xi與xk均滿足密度可達關(guān)系,則稱xj和xi是密度相連的。
圖1中直觀地顯示了以上定義,圖中虛線圓是Eps鄰域,設(shè)定MinPts=3。DBSCAN算法首先遍歷出樣本集D中所有核心對象,任意選擇其中一個作為初始樣本,然后找到這個核心對象最大密度相連樣本集作為一個聚類類別,最后剔除已分類的樣本,從剩余的核心對象中任選一個生成下一個聚類簇,重復(fù)以上步驟,直到核心對象集合為空。
圖1 DBSCAN定義示意圖
DBSCAN算法聚類準(zhǔn)確性與鄰域參數(shù)(Eps,MinPts)密切相關(guān),一般情況下鄰域參數(shù)Eps和MinPts是根據(jù)人工經(jīng)驗設(shè)定的,具有不確定性。因此,研究如何自適應(yīng)獲取鄰域參數(shù)對提高算法準(zhǔn)確度和穩(wěn)定性具有重要意義。
1.2.1 自適應(yīng)獲取鄰域參數(shù)Eps
為解決參數(shù)設(shè)置問題,文獻[11]采用K距離曲線法確定參數(shù)。根據(jù)文獻[1],實現(xiàn)成功分選雷達信號所需的脈沖數(shù)通常取4~7,首先假定參數(shù)MinPts=4,遍歷整個樣本集D,計算樣本xi與周圍點的距離,找到最近第MinPts個樣本點距離Dist(x),求出序列:{Dist(x1),Dist(x2),…,Dist(xm)};之后將序列按數(shù)值大小排序并繪成曲線,如圖2所示。將圖2中曲線開始快速上升處(即A點位置)的Dist值設(shè)置為Eps鄰域。
圖2 排序的Distmin曲線
上述方法尋找A點依然需要人為參與,本文對此方法進行改進,首先將序列{Dist(x1),Dist(x2),…,Dist(xm)}排序后記為{di|i=1,2,…,m},對序列{di}進行差分處理,得到差分序列{Δdi}:
Δdi=di+1-di
(1)
由于在A點距離曲線傾角變化最為顯著,因此以傾角的變化作為依據(jù)尋找A點,進一步求{Δdi}的反三角函數(shù),求得曲線在各點的傾角:
(2)
式中:α是縮放因子,避免由量級引起的Δdi的數(shù)值過大或過小。得到曲線各點的傾角后,再對角度進行差分處理,求出角度差分序列{Δθi}:
Δθi=θi+1-θi
(3)
最后尋找差分序列{Δθi}的最大值所在位置Pmax,Pmax所在的位置即對應(yīng)到圖2距離曲線傾角變化最為顯著的A點,從而確定出Eps值。
1.2.2 設(shè)定變密度點數(shù)閾值
在戰(zhàn)場環(huán)境中,偵察接收機偵收的雷達信號在參數(shù)空間中的分布具有非均勻、多密度的特點。這種非均勻、多密度分布的形成原因與雷達和偵察接收機的距離、雷達工作狀態(tài)以及雷達工作體制密切相關(guān)。
若采用全局參數(shù)(Eps,MinPts),聚類過程中的判別標(biāo)準(zhǔn)相對單一,對于非均勻、多密度的雷達信號分選效果不佳。因此,在自適應(yīng)求得鄰域半徑值之后,利用Eps值對雷達信號空間密度進行描述,增強算法對多密度雷達信號的適用性。
首先利用1.2.1中的方法自適應(yīng)獲得Eps值,之后計算數(shù)據(jù)集D中每一個樣本點的Eps鄰域范圍包含的雷達樣本點個數(shù),將該數(shù)值記為樣本點鄰域密度特征值K,按照降序的方式將數(shù)據(jù)點鄰域密度特征值K進行重新排序,數(shù)據(jù)排列的順序表明了樣本點所在簇密度大小。
信號參數(shù)由脈寬(PW)、載頻(RF)和達到角(DOA)3種特征組成。已知樣本空間中n個雷達信號組成的樣本集D={x1,x2,…,xn},其中xi=(PWi,RFi,DOAi),基于改進DBSCAN聚類算法具體流程如圖3所示。改進DBSCAN算法具體步驟:
輸入:雷達信號數(shù)據(jù)集D
步驟1利用K距離曲線法計算MinPts=4時的距離序列{Dist(x1),Dist(x2),…,Dist(xm)};
步驟2引入差分的方法,利用反三角函數(shù)對距離序列預(yù)處理,自動獲取鄰域參數(shù)Eps值;
步驟3計算數(shù)據(jù)集D中每一個樣本點的鄰域密度特征值K,即在Eps鄰域范圍包含的樣本點個數(shù),并按照逆序排列;
輸出:最終的簇劃分C={C1,C2,…,Ck}
云模型是一種可以實現(xiàn)在定性概念與定量數(shù)據(jù)之間不確定性轉(zhuǎn)換的模型,反映了概念中隨機性和模糊性[12]之間的關(guān)聯(lián)。云的數(shù)字特征用3個數(shù)值進行表征:期望值Ex、熵En、超熵He,它們反映了定性概念C在總體上的定量特征[14]。其中,Ex表示云滴在論域空間U上分布的期望值,是最能反映該定性概念的點;熵En表示對定性概念C的不確定性度量,反映總體的離散程度[15];超熵He是對熵的不確定性度量,反映數(shù)據(jù)的凝聚程度。
設(shè)U代表用精確數(shù)值表示的論域,U可以是一維或高維的,C(Ex,En,He)表示U上的一個定性概念,若定量數(shù)據(jù)x(x∈U)是定性概念C(Ex,En,He)的一次隨機實現(xiàn),則x在論域U上的分布是一個隸屬云,每個x是隸屬云上的一個云滴[13]。
將基于改進DBSCAN聚類算法的每個分類簇看作一種定性概念,設(shè)第m個簇的信號樣本n為xmnk,m=1,2,…,M,n=1,2,…,N,k=1,2,3,其中M代表分選簇的總數(shù)目,N代表每個簇中信號樣本的總數(shù),本文k=3,選取原始信號內(nèi)的特征參數(shù)PW、RF、DOA作為分選向量,并且設(shè)xmn1為信號樣本n的DOA參數(shù),xmn2為RF參數(shù),xmn3為PW參數(shù)。
改進DBSCAN算法聚類結(jié)果之間的相似度可以根據(jù)云模型隸屬度進行判定,云模型隸屬度均值計算原理如圖4所示,主要包括逆向云模型發(fā)生器算法和三維正向高斯云算法兩部分內(nèi)容。
圖4 云模型隸屬度均值計算流程
2.2.1 逆向云發(fā)生器原理
由于輸入樣本點數(shù)據(jù)不帶有確定度信息[16],無確定度逆向云發(fā)生器算法主要根據(jù)高斯云分布的數(shù)學(xué)性質(zhì)求出Exk,Enk和Hek3種數(shù)字特征[17],逆向云發(fā)生器如圖5所示。
圖5 逆向云模型發(fā)生器
根據(jù)樣本數(shù)據(jù)的一階絕對中心矩和二階中心矩逆向云發(fā)生器算法[18],求出樣本一階絕對中心矩和二階絕對中心矩,如式(5)、(6)所示:
(4)
(5)
(6)
利用高斯云分布的性質(zhì)[19]:在0 (7) (8) D(X)=Enk2+Hek2,k=1,2,3 (9) (10) 2.2.2 基于三維正向高斯云算法的隸屬度計算 根據(jù)逆向云發(fā)生器得到的數(shù)字特征,將分選信號的PW、RF、DOA三維特征參數(shù)進行整合,每一分選類的總體數(shù)字特征可以表示為(Ex1,Ex2,Ex3,En1,En2,En3,He1,He2,He3),根據(jù)云模型理論,每一分選類可以抽象為一個定性概念,分選結(jié)果的總體數(shù)字特征是每一分選類的定性概念在總體上的定量描述。 根據(jù)多維正向云發(fā)生器原理[20],見圖6,生成雷達輻射源信號的三維隸屬云模型。首先產(chǎn)生一個以三維數(shù)據(jù)(En1,En2,En3)為期望,(He12,He22,He32)為方差的三維高斯隨機數(shù)(En1′,En2′,En3′),其中每一維度的Enk′均是以Enk為期望,Hek2為方差生成的高斯隨機數(shù),其中k=1,2,3。 圖6 三維正向云模型發(fā)生器 根據(jù)云模型理論,鐘形隸屬函數(shù)對模糊概念的分析具有普遍性,生成三維隸屬云模型: μj(xil)= (11) 式中:μj(xil)代表分選簇i中的第l個信號對分選簇j構(gòu)成的三維云模型的隸屬度,其中i,j=1,2,…,M,l=1,2,…,N,xil代表第i個分選簇中第l個信號樣本,Exjk,k=1,2,3表示第j個分選簇信號的第k維特征期望值。 2.2.3 聚類結(jié)果隸屬度均值計算 式(11)表示其他分選簇中的三維信號樣本對某一分選簇構(gòu)成的云模型相似度。利用式(12)求出簇與簇間隸屬度均值Eμji進行分選簇之間的相似度判定: (12) 從多維云模型理論分析,每一個分選簇都被抽象成了三維云模型所代表的定性概念,隸屬度均值Eμji表示聚類結(jié)果i中所有三維信號樣本隸屬于某一定性概念程度的平均度量[21]。 利用基于三維云模型的隸屬度均值和目標(biāo)脈沖到達角參數(shù)實現(xiàn)改進DBSCAN分選結(jié)果有效性評估的CMDBSCAN分選模型如圖7所示。 圖7 CMDBSCAN分選模型 具體求解步驟如下: 步驟1首先結(jié)合距離曲線傾角突變的特點自適應(yīng)獲得鄰域半徑,并根據(jù)雷達信號在參數(shù)空間中的分布密度,相應(yīng)地調(diào)整密度點數(shù)閾值,進而能夠根據(jù)空間的密度分布特點自適應(yīng)生成分選參數(shù); 步驟2將基于改進DBSCAN算法分選簇抽象成定性概念,利用逆向云發(fā)生器算法和三維正向高斯云算法得到不同分選簇之間的隸屬度均值Eμji。 步驟3選取每個聚類結(jié)果的脈沖到達角DOA均值ExDOA作為該目標(biāo)輻射源的DOA參數(shù)。 步驟4利用如下規(guī)則進行評估判定: 1)若隸屬度均值Eμji,Eμij均小于自適應(yīng)閾值生成算法[22]求出的τμ,說明雷達輻射源信號間相似程度低,聚類分選結(jié)果正確度較高,符合分選結(jié)果有效性準(zhǔn)則,直接輸出分選結(jié)果,并將對應(yīng)類的雷達脈沖數(shù)據(jù)從數(shù)據(jù)集中刪除。 2)若聚類結(jié)果i與j相互之間的隸屬度均值Eμji,Eμij均大于τμ時,計算聚類結(jié)果間脈沖到達角均值ExDOA的差值ΔDOA=|ExDOA(a)-ExDOA(b)|: a.若差值ΔDOA小于設(shè)定閾值τDOA,說明2個聚類結(jié)果之間有著較大的聚類相似度,認為第i、j個分選簇為一部雷達的多種工作模式,將2個分選簇合并為一類,輸出分選結(jié)果,并將對應(yīng)類的雷達脈沖數(shù)據(jù)從數(shù)據(jù)集中刪除; b.若差值ΔDOA大于設(shè)定閾值τDOA,表示雖然2個聚類結(jié)果之間有著較大的聚類相似度,但并不屬于同一輻射源,將分選結(jié)果保留在數(shù)據(jù)集中。 3)當(dāng)隸屬度均值Eμji,Eμij只有其中一個大于設(shè)定閾值τμ時,說明第i類與第j類之間信號交疊嚴(yán)重,將分選結(jié)果保留在數(shù)據(jù)集中。 步驟5將評估結(jié)果反饋到DBSCAN算法中,優(yōu)化鄰域參數(shù)(Eps,MinPts),對數(shù)據(jù)集中剩余脈沖重新進行計算,使最終聚類符合分選結(jié)果有效性準(zhǔn)則。 步驟6輸出最終分選結(jié)果。 為了模擬實際戰(zhàn)場電磁環(huán)境,假設(shè)空域內(nèi)共有20個平臺參與作戰(zhàn)想定,我方偵察接收機部署于某一飛機平臺,通過仿真實驗?zāi)M平臺間的復(fù)雜對抗過程,仿真結(jié)束后導(dǎo)出偵察接收機幀收的信號全脈沖參數(shù)。 在仿真作戰(zhàn)過程中,不同作戰(zhàn)平臺的雷達裝備服務(wù)于不同作戰(zhàn)任務(wù),并且不同作戰(zhàn)平臺在整個作戰(zhàn)過程中的參與階段和介入時間根據(jù)作戰(zhàn)過程的演變而變化,其雷達的開關(guān)機時間也相應(yīng)變化,因此幀收到的雷達信號具有非均勻、多密度、數(shù)據(jù)量大等特點。 首先通過基于載頻和脈沖到達角分區(qū)方法[1]對海量脈沖數(shù)據(jù)進行稀釋,選取脈沖數(shù)據(jù)較豐富的第2分鐘內(nèi)的X波段,方位在80°~160°內(nèi)的941 312個脈沖作為實驗數(shù)據(jù),如圖8~10所示: 圖8 脈沖到達角-到達時間二維圖 圖9 載頻-脈沖到達時間二維圖 圖10 脈寬-脈沖到達時間二維圖 從稀釋數(shù)據(jù)中抽取10個信號片段,每個信號片段的脈沖數(shù)量為30 000條,對比本文算法、原始DBSCAN算法、KANN-DBSCAN算法的分選性能。本文算法的鄰域參數(shù)(Eps,MinPts)通過結(jié)合距離曲線傾角和鄰域密度特征值自適應(yīng)獲得,KANN-DBSCAN算法的分選參數(shù)通過參數(shù)尋優(yōu)策略確定[5],原始DBSCAN算法參數(shù)通過人工賦值。 聚類效果內(nèi)部指標(biāo)用Calinski-Harabasz分?jǐn)?shù)(CHI)表示,計算方法如下: (13) 式中:CHI表示k個聚類結(jié)果簇內(nèi)散度與簇間散度之比;其中Bk為分簇之間的協(xié)方差矩陣;Wk為分簇內(nèi)部的協(xié)方差矩陣。CHI指標(biāo)取值越高表示分簇之間距離越大,簇內(nèi)越緊密,聚類效果越好。 聚類效果外部指標(biāo)用V-測度衡量,V-測度(VM)由Andrew Rosenberg[23]等人提出,是基于條件熵衡量聚類結(jié)果與真實分簇的同質(zhì)性和完整性的指標(biāo),其定義為: (14) 本文V-測度的取值范圍為[0,1],取值越大說明分選效果越好。 表1~3為3種算法在各信號片段上的聚類分選結(jié)果,表4為3種算法聚類分選指標(biāo)平均值的對比結(jié)果。 表1 DBSCAN算法實驗結(jié)果 表2 KANN-DBSCAN算法實驗結(jié)果 表3 本文算法實驗結(jié)果 表4 3種算法實驗指標(biāo)平均值對比 從表1~4可以看出,CMDBSCAN算法的內(nèi)部指標(biāo)CHI遠大于原始DBSCAN和KANN-DBSCAN算法,因為DBSCAN算法結(jié)合多維云模型,利用聚類結(jié)果間隸屬度均值進行相似性判斷,可有效提高DBSCAN算法對多模雷達信號的分選能力,避免分選結(jié)果中的“增批”問題。CMDBSCAN算法的聚類結(jié)果通過云模型進行有效性評估,使得聚類結(jié)果簇間分離程度更大,同時簇內(nèi)數(shù)據(jù)聚合程度更好,內(nèi)部指標(biāo)CHI更高,分選效果有較大提高。 外部指標(biāo)VM反映了聚類結(jié)果與真實數(shù)據(jù)之間的相關(guān)性,與分選準(zhǔn)確率指標(biāo)具有相似性。利用抽取的10個仿真數(shù)據(jù)片段,從表1~3中可以觀察到本文算法在外部指標(biāo)VM、分選準(zhǔn)確率上都優(yōu)于原始DBSCAN算法和KANN-DBSCAN算法,可有效提高分選準(zhǔn)確率。 由于DBSCAN算法需要檢索每個雷達脈沖點鄰域內(nèi)所有數(shù)據(jù)點,時間復(fù)雜度為O(n2),其中n為全脈沖雷達數(shù)據(jù)點數(shù),由于KANN-DBSCAN算法結(jié)合參數(shù)尋優(yōu)策略,迭代計算復(fù)雜度與參數(shù)K密切相關(guān),時間復(fù)雜度為O(Knlbn),在文中雷達脈沖數(shù)據(jù)集條件下K=62。而本文采用K-d樹結(jié)構(gòu),可有效遍歷特定點給定距離內(nèi)的雷達脈沖點,時間復(fù)雜度變?yōu)镺(nlbn),同時本文引入云模型理論對分選結(jié)果進行有效性評估,三維云模型的時間復(fù)雜度為O(3n)。綜上CMDBSCAN算法的時間復(fù)雜度為O(nlbn)+O(3n)。在大數(shù)據(jù)量條件下,原始DBSCAN算法對2個分選參數(shù)敏感,需要一定時間調(diào)試,并且時間復(fù)雜度呈指數(shù)式增長,CMDBSCAN算法可有效解決上述問題。 以片段10為例,圖11~14分別展示了片段10中原始數(shù)據(jù)和3種算法的聚類結(jié)果分布,各參數(shù)取值范圍為[0,1],且各參數(shù)的單位取值為1。從圖中可以看出:原始的DBSCAN聚類算法結(jié)果存在明顯的聚類誤差,將4個輻射源的30 000條數(shù)據(jù)歸為了6類,由于原始的DBSCAN算法采用全局固定的鄰域參數(shù)(Eps,MinPts),對于密度分布不均勻的雷達信號,分選效果較差。KANN-DBSCAN算法結(jié)合參數(shù)尋優(yōu)策略,無需人為賦值,能夠?qū)崿F(xiàn)全過程無監(jiān)督聚類,如圖13所示,分選效果有較大改進,能夠?qū)崿F(xiàn)雷達信號的基本分選,但是在處理非均勻、多密度的雷達信號時仍然存在一定誤差,因為KANN-DBSCAN參數(shù)尋優(yōu)方法求出的分選參數(shù)(Eps,MinPts)依然是全局參數(shù),未能改變DBSCAN算法的固有缺陷。 圖11 片段10原始數(shù)據(jù)分布 圖12 原始DBSCAN聚類分選結(jié)果 圖13 KANN-DBSCAN聚類分選結(jié)果 圖14 CMDBSCAN聚類分選結(jié)果 從圖11~14幾種算法分選效果對比可以看出,CMDBSCAN算法的分選效果表現(xiàn)最好,除了部分離散點以外,其他數(shù)據(jù)均被正確聚類。由于CMDBSCAN算法能夠自適應(yīng)獲得鄰域半徑,并且根據(jù)不同雷達信號在參數(shù)空間中的分布密度,相應(yīng)地調(diào)整密度閾值,適用于非均勻雷達信號的分選,克服了傳統(tǒng)DBSCAN算法的固有缺陷。并且結(jié)合云模型理論對分選結(jié)果進行有效性評估,可有效避免傳統(tǒng)DBSCAN算法在多功能雷達信號分選中的“增批”問題,具有更強的信號分選能力。 電子對抗偵察中的雷達信號分選是將截獲的雷達信號分離的過程,具有非合作性,屬于無監(jiān)督學(xué)習(xí)問題,DBSCAN算法是一種無監(jiān)督的密度聚類算法,可自動分選任意形狀的聚類簇,符合實際戰(zhàn)場電子偵察需求。本文提出一種CMDBSCAN算法,首先從自適應(yīng)獲得Eps鄰域半徑和設(shè)置變密度點數(shù)閾值兩個方向針對傳統(tǒng)DBSCAN算法缺陷進行改進,仿真實驗表明,該算法可實現(xiàn)對非均勻、多密度、大數(shù)據(jù)量的雷達信號進行有效性分選;最后結(jié)合多維云模型理論,將改進算法分選結(jié)果送入評估模型,結(jié)合逆向云發(fā)生器算法和三維正向高斯云算法,對分選結(jié)果進行有效性評估,利用判定結(jié)果進一步優(yōu)化參數(shù)設(shè)置,仿真結(jié)果表明,DBSCAN算法結(jié)合云模型理論后可有效處理參數(shù)交疊嚴(yán)重、工作模式多樣的雷達脈沖信號,提高了DBSCAN聚類算法的分選準(zhǔn)確率。3 CMDBSCAN算法分選模型
4 仿真實驗分析
5 結(jié)語