徐瑞陽,馮新喜,孔云波,鹿傳國
(1.空軍工程大學(xué)信息與導(dǎo)航學(xué)院,陜西西安710077;2.95806部隊,北京100086)
目標(biāo)跟蹤是傳感器系統(tǒng)的一項重要功能,當(dāng)使用多只傳感器對目標(biāo)進(jìn)行跟蹤時,由于傳感器的能量有限,不能時刻使用所有的傳感器進(jìn)行觀測和跟蹤,需要根據(jù)不同的情況調(diào)用傳感器資源,同時,傳感器與目標(biāo)的分配管理也是一個至關(guān)重要的問題。
Nash M[1]提出使用線性規(guī)劃確定傳感器對目標(biāo)的分配,使用卡爾曼濾波器中的誤差協(xié)方差矩陣的跡作為目標(biāo)函數(shù)中的代價系數(shù);Bier SG 和 Rothman P L[2,3]使用布爾矩陣定義了一種以傳感器能力和有效性為準(zhǔn)的傳感器與目標(biāo)配對方法。童俊和單甘霖[4]提出了一種基于目標(biāo)跟蹤精度Cramér-Rao下限的多傳感器跟蹤資源協(xié)同分配方法。楊小軍和馬祥[5]提出了一種基于條件后驗克拉美—羅下界(CPCRLB)的傳感器網(wǎng)絡(luò)節(jié)點管理方法?;谀繕?biāo)信號強度(RSS)推導(dǎo)了目標(biāo)狀態(tài)估計均方誤差的CPCRLB。利用粒子濾波器逼近目標(biāo)狀態(tài)并估計CPCRLB,實現(xiàn)傳感器節(jié)點在線選擇。
本文在上述研究工作的基礎(chǔ)上,首先推導(dǎo)了粒子濾波下無源傳感器后驗CPCRLB的計算公式,然后以目標(biāo)跟蹤后驗CPCRLB的相反數(shù)作為選擇的適應(yīng)值進(jìn)行遺傳迭代,同時計算目標(biāo)的區(qū)分度增量,通過合理分配傳感器資源降低整個跟蹤過程中的能耗。
假定有m只傳感器和n個目標(biāo),進(jìn)行傳感器管理就是通過分配矩陣將傳感器分配給不同的目標(biāo),分配矩陣中的元素為0或1,行數(shù)為傳感器數(shù)量,列數(shù)為目標(biāo)數(shù)量
其中,0為該傳感器u這一時刻的量測不分配給目標(biāo)ν,1為傳感器u這一時刻的量測分配給目標(biāo)ν。
以 C={C1,C2,…,C2m×n-1}來表示傳感器的分配方案,其中,Ci為不同的傳感器分配矩陣,假設(shè)每個傳感器最多可以跟蹤ki(i=1,2,…,n)個目標(biāo),設(shè)定某種度量方法P(x)作為代價的衡量,所以,傳感器管理的模型為
約束條件為
對一個二維目標(biāo)進(jìn)行跟蹤,目標(biāo)的狀態(tài)方程和量測方程分別為
其中,wk為零均值高斯白噪聲,vk為量測噪聲并獨立于狀態(tài)噪聲wk。
根據(jù)文獻(xiàn)[5]可得,在k+1時刻對目標(biāo)狀態(tài)估計的條件下界滿足
其中,L-1(xk+1|z1∶k)為 CPCRLB。
文獻(xiàn)[6]提出了一種直接計算CPCRLB的計算方法
目標(biāo)跟蹤的量測方程為非線性方程
其中,θk=是在無源傳感器下,傳感器對目標(biāo)的量測,(ak,bk),(a0,b0)分別為目標(biāo)位置預(yù)測與傳感器的橫縱坐標(biāo)。
在加性高斯量測噪聲假設(shè)下,量測數(shù)據(jù)的對數(shù)似然度為
初始迭代條件為
在式(4)和式(8)確定的狀態(tài)方程和量測方程下,計算CPCRLB所需的式(8)~式(10)中的數(shù)學(xué)期望為
對非線性量測模型,B22,bk通常沒有解析表達(dá)式。為計算B22,bk,假設(shè)目標(biāo)狀態(tài)服從一階Markov過程,采用重要性重采樣粒子濾波器進(jìn)行濾波,重要性函數(shù)選為通常使用的狀態(tài)轉(zhuǎn)移函數(shù),此時權(quán)值可由似然函數(shù)獲得,在重采樣后,目標(biāo)的概率密度函數(shù)可近似為
由式(11)~式(14)可得,基于無源量測數(shù)據(jù)的條件FIM可以迭代逼近計算如下
矩陣B22,bk的元素如下
當(dāng)目標(biāo)之間的距離過近時,需要依據(jù)目標(biāo)之間的區(qū)分度制定傳感器資源分配策略。根據(jù)文獻(xiàn)[8],假設(shè)k時刻獲得的量測為zk,在第k次觀測后,目標(biāo)的區(qū)分度由下式計算獲得
其中,p(xk|zk)為k時刻獲得第k次觀測后的后驗概率密度函數(shù),第k次觀測之后所得的期望區(qū)分度增量為
在觀測方程為非線性時,需要用采樣粒子對結(jié)果進(jìn)行近似,近似后的結(jié)果為
當(dāng)E[D|zk]小于某個門限值時,就需要調(diào)用更多的傳感器資源對目標(biāo)進(jìn)行更精確的跟蹤。
計算采用矩陣遺傳算法作為優(yōu)化算法,計算每次跟蹤的條件后驗CPCRLB的相反數(shù)作為適應(yīng)值,并計算每一時刻的目標(biāo)區(qū)分度增量。算法的具體過程如下:
1)隨機產(chǎn)生初始的分配矩陣種群,設(shè)定交叉和變異概率,設(shè)定區(qū)分度增量門限值;
2)用初始種群中的個體對目標(biāo)進(jìn)行跟蹤,計算CPCRLB的相反數(shù)作為適應(yīng)值進(jìn)行選擇,規(guī)定分配矩陣中如果有任意一列為全0(該目標(biāo)沒有被跟蹤),則適應(yīng)值為無窮;
3)進(jìn)行交叉和變異;
4)計算目標(biāo)的區(qū)分度增量;
5)當(dāng)區(qū)分度增量小于設(shè)定的門限時,增加傳感器的數(shù)目;
6)反復(fù)進(jìn)行步驟(1)~(5),根據(jù)不同的情況確定不同的傳感器分配矩陣對傳感器進(jìn)行分配。
設(shè)定仿真環(huán)境為使用5只傳感器對目標(biāo)進(jìn)行跟蹤,傳感器為無源傳感器,初始目標(biāo)為3個,運行傳感器數(shù)為2只,之后又出現(xiàn)2個目標(biāo),目標(biāo)間距變小。濾波算法采用粒子濾波算法,關(guān)聯(lián)算法采用最近鄰算法,選擇算子采用輪盤賭算子,種群數(shù)量為7個,交叉和變異概率分別設(shè)置為pc=0.2,pm=0.3,進(jìn)行50次蒙特—卡洛仿真。目標(biāo)航跡和跟蹤效果如圖1、圖2所示。
圖1 目標(biāo)航跡圖Fig 1 Target trajectories
圖2 跟蹤效果圖Fig 2 Tracking effect diagram
圖1 中從(1,20),(4,30),(6,40)m 起始的三個目標(biāo)為初始目標(biāo);圖2中觀測站1,2為最初使用的傳感器,觀測站3,4,5為新目標(biāo)出現(xiàn)后新調(diào)用的傳感器,從圖2中可以看出:當(dāng)新出現(xiàn)目標(biāo)使得目標(biāo)間距減小時,該算法通過增加傳感器數(shù)量保證了目標(biāo)之間的區(qū)分和對目標(biāo)的跟蹤。
目標(biāo)跟蹤過程中的區(qū)分度增量變化如圖3所示。
圖3中由于傳感器數(shù)目帶來的跟蹤精度影響,目標(biāo)區(qū)分度增量在跟蹤初始階段波動比較大,在20 s時刻新目標(biāo)出現(xiàn),目標(biāo)間距減小導(dǎo)致區(qū)分度增量減少,調(diào)用更多傳感器進(jìn)行跟蹤后,區(qū)分度增量逐步增大,并趨于穩(wěn)定。
圖3 跟蹤過程中區(qū)分度增量變化情況Fig 3 Change of discrimination gain during tracking process
整個跟蹤過程中傳感器能量消耗如圖4所示。
圖4 不同算法跟蹤過程能量消耗對比Fig 4 Contrast of energy consumption of tracking process of different algorithms
圖4顯示了引入?yún)^(qū)分度增量的傳感器管理算法和一般傳感器管理算法在跟蹤過程中能量消耗對比情況,假設(shè)傳感器在工作時每秒耗能5 W,初始跟蹤時只使用了2只傳感器對目標(biāo)進(jìn)行跟蹤,新目標(biāo)出現(xiàn)后才調(diào)用了其他傳感器,整個過程中能量消耗950 W,相比于使用全部傳感器進(jìn)行跟蹤消耗的1250 W減少了300 W。
跟蹤過程中7個個體的適應(yīng)值變化情況如圖5所示。
圖5 跟蹤過程中個體適應(yīng)值變化情況Fig 5 Change of individual fitness value during tracking process
本文基于區(qū)分度增量和條件后驗CPCRLB提出了一種傳感器資源分配算法,這種算法以CPCRLB的相反數(shù)作為遺傳算法的適應(yīng)值,同時引入目標(biāo)區(qū)分度增量作為判斷目標(biāo)區(qū)分度的標(biāo)準(zhǔn),相比于用固定數(shù)量傳感器跟蹤目標(biāo)降低了整個傳感器系統(tǒng)的能耗。接下來需要深入研究對異類傳感器進(jìn)行管理和將目標(biāo)的優(yōu)先級與算法結(jié)合起來。
[1]Nash M.Optimal allocation of tracking resource[C]∥Proceedings of the IEEE Conference on Decision and Control,1977:1177-1180.
[2]Rothman P L,Bier S G.Eva1uation of sensor management systems[C]∥Proceedings of the NAECON,1989:1747-1752.
[3]Bier SG,Rothman P L,Manske R A.Intelligent sensor management for beyond visual range air-to-air combat[C]∥Proceedings of the NAE2CON,1988:264-269.
[4]童 俊,單甘霖.基于Cramér-Rao下限的多傳感器跟蹤資源協(xié)同分配[J].宇航學(xué)報,2012,33(9):1314-1321.
[5]楊小軍,馬 祥,宋青松,等.基于條件后驗克拉美—羅下界的目標(biāo)跟蹤傳感器管理[J].控制理論與應(yīng)用,2013,30(5):543-548.
[6]Zuo L,Niu R,Varshney P K.Conditional posterior Cramer-Rao lower bounds for nonlinear sequential Bayesian estimation[J].IEEE Transactions on Signal Processing,2011,59(1):1-14.
[7]Zheng Y,Ozdemir O,Niu R,et al.New conditional posterior Cramér-Rao lower bounds for nonlinear sequential Bayesian estimation[J].IEEE Transactions on Signal Processing,2012,60(10):5549-5556.
[8]Cai Chenghui,F(xiàn)errari Silvia.Comparison of information-theoretic objective functions for decision support in sensor systems[C]∥Proc of the American Control Conference,2007:3559-3564.
[9]李 秉,王鳳山.區(qū)域防空多傳感器管理體系結(jié)構(gòu)與功能模塊研究[J].傳感器與微系統(tǒng),2009,28(3):117-120.
[10]張應(yīng)華,周 林,劉先省.基于測量方差時變的傳感器管理算法[J].傳感器與微系統(tǒng),2007,26(3):68-72.