張冠杰,陳建峰,李艷斌
(中國電子科技集團公司第五十四研究所,河北石家莊 050081)
單站無源定位跟蹤本質上是一個非線性估計問題,由于單站無源定位跟蹤系統(tǒng)狀態(tài)空間模型的非線性程度較高,以往的各種遞推濾波算法,包括擴展卡爾曼濾波(EKF)和修正增益的擴展卡爾曼濾波(MGEKF)等算法,雖然可以對運動目標進行定位跟蹤,但是因為經(jīng)過了近似的數(shù)學處理,引起了收斂精度低和收斂速度慢的問題。近幾年發(fā)展起來的粒子濾波算法是一種很好的解決非線性問題的算法,該算法基于蒙特卡洛方法和遞推貝葉斯估計,其基本思想是用一個帶權值的粒子集合來表示感興趣的后驗概率密度。可以處理非線性模型問題,相較于卡爾曼類濾波算法有較強的通用性,因而在導航、跟蹤和監(jiān)控方面得到了廣泛的應用。
建立運動單站無源跟蹤的系統(tǒng)模型,介紹粒子濾波算法的原理,并將其應用到單站無源定位跟蹤中,利用仿真試驗驗證了粒子濾波在運動目標單站無源跟蹤中的有效性。
針對空中觀測平臺對遠距離海面慢速目標的定位跟蹤問題,利用載機平臺上安裝的干涉儀測向天線陣對目標進行定位跟蹤。為了討論方便,將模型簡化為二維平面模型,如圖1所示。載機沿x軸飛行,并假定方位角和相位差變化率對目標進行定位跟蹤。目標沿不平行于x軸的直線運動。
圖1 目標—觀測器相對位置關系
根據(jù)運動學原理,目標在k時刻的狀態(tài)可由k-1時刻的狀態(tài)通過式(1)遞推得到。模型的離散系統(tǒng)方程如下:
式中,Xk=[xkyk;xk和yk為k時刻目標的位置分量;和為k時刻目標在x和y方向上相互獨立的速度分量;
v=[aXaY]T為協(xié)方差矩陣為Q的狀態(tài)噪聲。該無源定位跟蹤系統(tǒng)的觀測量包括目標的方位角和相位差變化率,其中相位差變化率可以通過測量目標的相位差而后差分濾波得到,此處認為相位差變化率信息為可直接觀測量。式 (2)為系統(tǒng)的觀測模型,其中nk=[ σφ˙σβ]T為量測噪聲,表示方位角和相位差變化率的測量誤差,其協(xié)方差矩陣為R。假設狀態(tài)噪聲與量測噪聲均為零均值高斯白噪聲序列且相互獨立,由于目前相位差變化率估計精度有限,根據(jù)某一時刻的觀測值直接對目標進行定位跟蹤的精度很低,尚不能滿足瞬時定位的要求,因此需要粒子濾波算法對觀測量進行數(shù)據(jù)融合濾波處理,獲得運動目標的軌跡信息。
假設動態(tài)系統(tǒng)描述如下:
式中,Xk∈Rnx為系統(tǒng)狀態(tài)向量;fk-1和 gk分別為系統(tǒng)的狀態(tài)更新函數(shù)和量測函數(shù);Zk為系統(tǒng)的觀測量。遞推貝葉斯最優(yōu)估計就是要求出狀態(tài)變量Xk的最小均方誤差估計,即Xk后驗分布的期望值。
在獲得測量值zk后,狀態(tài)更新:
其中歸一化常數(shù)為:
式(5)和式(6)構成了貝葉斯估計的基礎,但是通常情況下它們沒有解析解。對于非線性模型必須采用近似的數(shù)值方法來求解公式中的積分式。粒子濾波算法是一種基于貝葉斯原理的利用序貫蒙特卡洛方法生成加權粒子來描述后驗概率密度的方法。
序貫蒙特卡洛算法(SIS)是基本蒙特卡洛方法之一,是粒子濾波算法的基礎。假設是一組取樣于后驗概率密度p(x0:k|z1:k)的樣本點及其對應的權值,其中=1,則根據(jù)蒙特卡羅方法,k時刻的后驗密度p(x0:k|z1:k)可近似為:
式中,δ(·)為狄拉克函數(shù)。由于無法直接從真實后驗密度p(x0:k|z1:k)中抽取樣本點集。因此,經(jīng)常從重要密度函數(shù)q(x0:k|z1:k)中利用重要性采樣的方法生成一組樣本集合來描述后驗概率密度p(x0:k|z1:k),則其對應的粒子權值為:
然后權值歸一化為:
粒子濾波算法中選取重要性密度函數(shù)q(x0:k|z1:k)應該接近于后驗概率分布。
在實現(xiàn)SIR粒子濾波算法時,主要由以下3個步驟:產生粒子、計算粒子權重并歸一化和重采樣。
在產生k時刻的粒子后,相應的粒子權重則由每個粒子的似然概率決定,即
然后進行權值歸一化計算。
粒子濾波隨著一步一步的迭代計算,產生了粒子退化問題,因此引入重采樣算法。重采樣算法的基本思想是通過對后驗概率密度p(x0:k|z1:k)≈(x0:k-)重采樣N次,產生新的粒子集,使得p(=)=。由于重采樣是獨立同分布的,權值被重新設置為=1/N。重采樣的步驟為:
SIR粒子濾波算法的的偽代碼歸納如下:
為了驗證SIR粒子濾波算法的跟蹤效果,首先建立目標與觀測載機的運動模型。假設運動目標的初始狀態(tài)為:(100 km,20 m/s,100 km,-25 km/s),觀測載機的初始狀態(tài)為(0 km,200 m/s,0 km,0 m/s),為了保證載機的可觀測性,觀測載機與運動目標不做平行運動。濾波器的初始估計狀態(tài)設定為:(100 km,0 m/s,100 km,0 m/s),測量周期為 Ts=1 s,系統(tǒng)狀態(tài)噪聲的協(xié)方差矩陣為:Q=diag([0.250.25]),量測噪聲的協(xié)方差矩陣為 R=diag([0.017 0.006]),粒子數(shù) N=3000 。進行50 次蒙特卡洛實驗。在上述條件下得到EKF濾波的跟蹤軌跡、粒子濾波的跟蹤軌跡與真實運動軌跡的比較如圖2所示。
圖2 粒子濾波估計值和真實值的比較
由圖2(a)和圖2(b)可知,由于EKF對非線性模型采用線性化處理方法。因此,其在上述給定條件下,x方向和y方向上的位置狀態(tài)量收斂速度要比粒子濾波慢,并且定位的精度也比粒子濾波低。由圖2(c)和圖2(d)可知,EKF算法在x方向和y方向上的速度狀態(tài)量的收斂速度也要比粒子濾波慢。
為了對PF算法和EKF算法在估計偏差方面的性能進行更加嚴格的比較,二者關于目標位置狀態(tài)分量的均方根誤差(RMSE)如圖3所示。
圖3 PF與EKF估計的RMSE比較
RMSE的估計式定義為:
式中,Nm為Monte Carlo仿真次數(shù)。由圖3可以看出,PF算法收斂快,位置狀態(tài)分量可以很快地收斂到一個平穩(wěn)的值。相反EKF算法的收斂偏差較大,而且收斂的速度比較慢。雖然PF與EKF均是有偏估計,但是EKF的估計偏差是遠遠高于PF算法的。圖3更好地顯示了PF算法在估計偏差方面的優(yōu)越性。
基于蒙特卡洛思想的粒子濾波算法完全突破了卡爾曼濾波理論框架,對模型的非線性不敏感,既不用對非線性模型本身進行任何近似處理,也無需計算模型的雅克比矩陣,并且對系統(tǒng)的過程噪聲和量測噪聲沒有任何限制,因此粒子濾波比EKF有更好的適應性。粒子濾波是用足夠數(shù)目的加權粒子來直接近似狀態(tài)量的后驗概率密度,計算簡單,其在高斯噪聲假設下是漸進最優(yōu)的,因此粒子濾波可以獲得比EKF更高的定位精度和更快的收斂速度。 ■
[1]單月暉.空中觀測平臺對海面慢速目標單站無源定位跟蹤及其關鍵技術研究[D].長沙:國防科學技術大學博士學位論文,2002.
[2]ARULAMPALAM M S,MASKELL S.A Tutorial on Particle Filters for Online Nonlinear/Non-Gaussian Bayesian Tracking [J].IEEE Transactions of Signal Processing,2002,50(2):174 -188.
[3]GORDON N J,SALMOND D J,SMITH A F M.Novel Approach to Nonlinear/Non-Gaussian Bayesian State Estimation[J].IEE Proc.Inst.Elect.Eng.,F(xiàn),1993,140(2):107-113.
[4]GUSTAFSSON F,GUNNARSSON F.Particle Filters for Positioning,Navigation, and Tracking [J]. IEEE Transactions on Signal Processing,2002,50(2):425-436.
[5]程水英,張劍云.基于無味高斯粒子濾波的空-海BOTMA 的研究[J].現(xiàn)代雷達,2007,29(8):68 -71.
[6]ARULAMPALAM S,RISTIC B.Comparison of the Particle Filter with Range Parameterized and Modified polar EKF’s for Angle – only Tracking[J].IEE Proc.SPIE,2000(40):288-299.