龐菲菲,溫祥西,王曉華
(1.西安工程大學 電子信息學院,西安 710048;2.空軍工程大學 空管領航學院,西安 710051)
對水下目標的精確定位可以為水下目標的安全航行、打撈救生以及海洋資源開發(fā)提供基礎,成為當前研究的熱點[1-5]?;诜轿唤堑亩ㄎ环椒ǜ鶕?jù)多個節(jié)點估計的方位角對目標進行定位,是一種經(jīng)典的被動無源定位技術,廣泛應用于水聲傳感網(wǎng)絡中。受復雜多變的水聲環(huán)境、多徑效應、硬件失效、沖擊噪聲等的影響,節(jié)點測量的方位角可能會嚴重偏離真實的方位角,即出現(xiàn)異常值的情況,對目標定位精度造成嚴重影響[6]。
針對異常值出現(xiàn)的目標定位問題,現(xiàn)有的解決方法主要有兩種:一種是采用基于魯棒的統(tǒng)計估計方法以減小定位過程中異常值引起的負面影響;另一種是篩選出異常值并在定位時將其剔除,避免其對定位的影響。文獻[7]使用魯棒的統(tǒng)計估計方法,將lp范數(shù)最小化作為優(yōu)化目標函數(shù),然后采用迭代加權(quán)輔助變量估計方法進行求解。該方法需要迭代運算,不能得到解析解,運算量較大。文獻[8]使用魯棒最小二乘準則構(gòu)造目標函數(shù),通過求解廣義信賴域子問題得到準確解,以減輕異常值對定位偏差的影響。文獻[9]通過k-means聚類算法排除誤差較大的測距信息,最后利用剩余距離信息進行目標定位。該方法可在不增加通信開銷的前提下,得到更精確、容錯性更高的定位方法。文獻[10]認為異常值嚴重偏離了其余節(jié)點的觀測信息,結(jié)合幾何學和統(tǒng)計方法提出了到達時間差的異常信息檢測方法。文獻[11]利用長基線/超短基線組合系統(tǒng),并采用k-means聚類算法和決策融合對多種定位參量中的異常值進行檢測,通過識別并去除異常值保證了定位系統(tǒng)的可靠性。這種剔除異常值的方法可以從根源上避免異常信息對定位結(jié)果的影響。
文獻[12]指出:測向線所給信息是目標定位和分選的全部依據(jù);一條測向線說明目標可能在離線很近的地方,而很少可能在離線很遠的地方。因此,當所有節(jié)點測量的方位信息都較為準確時,方位交線產(chǎn)生的目標初始估計位置會緊密分布在目標真實位置附近;而當節(jié)點觀測的方位信息出現(xiàn)異常時,異常值對應的目標初始估計位置會遠離于其余初始位置。利用這一分布特征,本文針對異常值出現(xiàn)的情況,提出了基于支持向量數(shù)據(jù)描述(support vector data description,SVDD)的目標定位方法。該方法將目標定位與異常值識別有機結(jié)合,首先使用SVDD對方位交線方法所產(chǎn)生的目標初始估計位置進行一分類處理,然后利用位于超球面外的外點識別出異常值并將其剔除,最后利用剩余的方位信息對目標進行定位。本文方法可以有效篩選出異常值,避免異常值對定位精度的影響。
圖1 方位觀測模型
(1)
當有異常情況出現(xiàn)時,第i個節(jié)點觀測的方位信息利用高斯混合模型表示
(2)
式中:τi∈{0,1}為獨立同分布的Bernoulli隨機變量,代表是否有異常值出現(xiàn),若有異常值則τi=1,反之τi=0,假設異常值出現(xiàn)的概率為pi=Pr{τi=1};mi為在[-π,π]均勻分布的沖擊噪聲。
i,j=1,2,…,M且i≠j
(3)
(4)
式中,[xi,yi],[xj,yj]分別為第i,j個節(jié)點的坐標。
圖2 目標位置的初始估計分布
因此,可以根據(jù)目標位置初始估計值的分布特征篩選出異常值,將其剔除后再利用其余正常觀測方位信息對目標位置進行估計,這種方法可以從根本上避免異常信息對目標定位精度的影響。從所有初始估計值中篩選離散點(異常值引起的初始估計值)的過程可由單分類算法來實現(xiàn)。SVDD方法作為一種單分類器,可在給定的一個數(shù)據(jù)集周圍確定一個閉合的超球體,使該超球體能夠幾乎包含所有數(shù)據(jù)樣本的最小超球體,因此本文利用SVDD方法劃定類別邊界進行離散點檢測。
支持向量機由Vapnik[14]于20世紀90年代提出,最初用于解決二分類問題。隨后,Tax等[15]將統(tǒng)計學習理論通過支持向量機的形式擴展到無指導學習領域,提出了一種新的數(shù)據(jù)描述方法——SVDD方法。SVDD方法是一種單分類方法,其基本思想是:通過非線性變換將目標樣本映射到一個高維的特征空間,在高維空間建立一個封閉而緊湊的最小超球體,權(quán)衡超球體半徑和它所包含的樣本映像的數(shù)目,使其包含的樣本映像數(shù)量最多[16]。
由于異常值的影響,數(shù)據(jù)集的樣本特征不是集中分布的,而是存在離散的數(shù)據(jù)分布。這些樣本的分布存在以下三種可能:
(1)對應樣本Xi到超球體球心的距離小于R,即該樣本在球體內(nèi),稱為內(nèi)點;
(2)對應的樣本Xi位于超球面上,稱為支持向量;
(3)若Xi落在超球體外,稱為外點(即離散點)。
外點是由異常值引起的,由于每個樣本都對應了兩個節(jié)點的測量值(參見式(3)),因此可由外點反推出異常值。將異常值剔除后,使用剩余的方位信息求解得到最終的目標位置。
基于SVDD去除異常值的目標定位方法具體步驟為:
步驟1每個節(jié)點分別對目標進行方位估計,利用方位交線方法,得到N個交點X1,X2,…,XN,將其作為樣本集;
步驟2利用SVDD方法對樣本集進行分類,檢測出外點;
步驟3找出每個外點所對應的兩個方位信息序號,并統(tǒng)計序號的出現(xiàn)次數(shù);篩選出現(xiàn)次數(shù)大于等于t的所有序號,將這些序號對應的觀測值視為異常值,假設篩選出的異常值個數(shù)為n;
(5)
其中,
(6)
在所提的方法中,t起到了一個門限的作用,即:如果外點對應的方位統(tǒng)計次數(shù)大于等于t,則認為該方位信息為異常值。如果t的值越大,則認定某個方位信息為異常值的門限越高,即有可能識別不出異常值;反之,門限越低,意味著可能會將正常方位信息誤判為異常值,出現(xiàn)虛警的情況。在實際應用中,t的大小與異常值出現(xiàn)的概率pi、方位估計誤差的標準差σi有關。當pi增大時,外點的個數(shù)也會增加,t的值應該適當增大;反之,t的值應適當減小。另一方面,當正常方位估計誤差的σi比較大時,利用該方位信息得到的目標初始估計位置會越偏離目標真實位置,從而被SVDD方法識別為外點的概率也會增加,因此需要適當增加t的值,避免造成誤判;反之,可適當減小t的值,降低門限,提高異常值的識別概率。
本文分別采用LS估計方法、基于k-means聚類算法的定位方法與本文所提基于SVDD方法去異常值后使用LS(LS after removing unreliable measurements based on SVDD,SVDD-LS)定位方法進行定位精度比較。其中,LS估計方法是使用所有觀測值、利用LS估計方法得到目標位置;基于k-means聚類算法的定位方法是指先采用k-means聚類算法找出異常值并將其剔除,使用剩余觀測值、利用LS估計得到目標位置,簡稱為基于k-means聚類算法去異常值后使用LS(LS after removing unreliable measurements based on k-means,k-means-LS)定位方法。定位精度選取均方根誤差(root-mean-square error,RMSE)來衡量,計算公式為
(7)
假設M個節(jié)點隨機均勻分布在5 000 m×5 000 m的區(qū)域內(nèi);目標位于[2 500 m,2 500 m]。每個節(jié)點方位估計誤差ni的標準差σi都相等;每個節(jié)點出現(xiàn)異常的概率pi相等。SVDD方法中懲罰因子取0.2,選用高斯函數(shù)作為核函數(shù),核帶寬選取500。k-means聚類算法中聚類的個數(shù)為2,篩選類內(nèi)元素個數(shù)最少的聚類個數(shù)為1。蒙特卡洛仿真次數(shù)為1 000。
(1)pi對SVDD-LS方法定位精度的影響
當有10個節(jié)點,且每個節(jié)點方位估計誤差的標準差均σi為1°時,圖3比較了SVDD-LS方法在t的值分別為3,4,5,6時的RMSE隨異常值出現(xiàn)概率pi的變化情況。當t=3,pi≥0.03和t=4,pi=0.11時的RMSE均超過了1 000 m,所以在圖3中沒有顯示出來。
圖3 均方根誤差隨異常值出現(xiàn)概率的變化情況
3.2.2σi對定位精度的影響
本節(jié)討論方位估計誤差的標準差σi對LS、k-means-LS和SVDD-LS這三種方法定位精度的影響。假設每個節(jié)點出現(xiàn)異常的概率pi=0.01。當M=10時,圖4比較了LS、k-means-LS和SVDD-LS這三種方法的RMSE隨σi的變化情況。其中,σi的值由0.5°逐漸增加到7°,步長為0.5°,SVDD-LS的兩條曲線分別是在t的取值為4和6的情況下繪制的。本節(jié)將LS方法的定位精度作為對比基準,k-means-LS和SVDD-LS方法都與LS方法進行比較。
由圖4可以看出,隨著σi的增加,三種方法的RMSE都隨之增加。當σi≤3°時,k-means-LS方法的RMSE有所減小;但是隨著σi的進一步增大,k-means-LS的定位精度逐漸降低,其RMSE甚至超過了LS方法,這是由于σi越大時,目標初始估計位置會越來越偏離目標真實位置,使樣本愈加離散,k-means聚類算法在這種情況下不能很好地準確識別出異常值,導致k-means-LS方法的定位性能越來越差。對于SVDD-LS方法,當t=4時,其在方位估計誤差較小時(σi≤3°)的RMSE最低;在3<σi≤5的區(qū)間內(nèi),t=4和t=6兩條曲線幾乎重疊,此時定位精度接近;當定位誤差增加到更大的值時(σi>5°),目標初始估計位置的分布會更加分散,當門限t比較小時,容易出現(xiàn)誤判的情況,造成t=4對應的RMSE快速增加,當t增加到6時,SVDD-LS方法的RMSE最低,仍能表現(xiàn)出較好的定位性能。
圖4 均方根誤差隨方位估計誤差標準差的變化情況
3.2.3M對定位精度的影響
當pi=0.01時,圖5比較了LS、k-means-LS和SVDD-LS三種方法的RMSE隨節(jié)點個數(shù)M的變化情況,其中,圖5(a)中的參數(shù)設置為σi=1°,t=4,圖5(b)中的σi=4°,t=9。
圖5 均方根誤差隨節(jié)點個數(shù)的變化情況
由圖5可看出,當節(jié)點個數(shù)由5逐漸增加到17時,三種方法的RMSE都隨之下降,但是LS方法的RMSE仍然是最大的,這說明異常值的出現(xiàn)使LS方法的定位性能下降,而通過剔除異常值的辦法可以避免其對定位精度的影響,提高目標定位精度。在三種方法中,SVDD-LS方法的RMSE降幅最大,表明該方法可以有效提高定位性能。當異常值出現(xiàn)概率pi較小且一定時,M的增加意味著樣本個數(shù)和內(nèi)點個數(shù)的增加。如果σi較小,即使內(nèi)點個數(shù)增加,但是其依然會較緊密地圍繞在目標真實位置附近,SVMM-LS方法仍然可以較好地識別出外點,展現(xiàn)出較好的定位性能,見圖5(a);而當σi較大時,內(nèi)點數(shù)量的增加會使樣點分布更加分散,可通過適量調(diào)高門限t避免誤判,使SVMM-LS方法維持較低的RMSE,見圖5(b)。
本文針對異常值影響目標定位精度的問題,基于SVDD方法提出了去除異常值的目標定位方法。該方法利用“異常值產(chǎn)生的目標位置初始估計值遠離真實位置、正常觀測值產(chǎn)生的初始估計值接近真實位置”的分布特征,首先采用SVDD方法對外點進行檢測從而篩選出異常值,然后在使用LS估計方法計算目標位置時將異常值剔除、僅使用其余正常觀測值,因此可以從根源上避免異常值對定位精度的影響。仿真結(jié)果表明,該方法可以有效識別異常值,其定位精度優(yōu)于LS和k-means-LS定位方法。