安雷,李召瑞,吉兵
(陸軍工程大學(xué) 石家莊校區(qū),河北 石家莊 050003)
在以雷達(dá)等為代表的主動傳感器對空中目標(biāo)的跟蹤當(dāng)中,由于單傳感器的偵測范圍有限、冗余能力不足、靈活性差、易暴露等問題,通常難以滿足實際作戰(zhàn)任務(wù)需要。為此,通過采取多傳感器調(diào)度的方法,有針對性地分配傳感器資源、控制工作時間,可以有效達(dá)到提升跟蹤精度、降低使用代價、改善生存能力等優(yōu)化傳感器系統(tǒng)性能的目的[1]。
應(yīng)用中,傳感器調(diào)度一般基于實際任務(wù)的需要,通過優(yōu)化決策產(chǎn)生調(diào)度序列,在保證一定跟蹤精度的前提下,有效控制輻射風(fēng)險、頻繁切換、響應(yīng)延遲等使用代價。這其中,輻射風(fēng)險帶來的輻射代價是指主動傳感器在工作時,由于向外輻射電磁波,導(dǎo)致觀測信號存在被目標(biāo)的輻射告警接收機(jī)檢測、識別進(jìn)而鎖定位置的問題。要實現(xiàn)對輻射風(fēng)險的有效控制,首要的是對其進(jìn)行準(zhǔn)確的量化,文獻(xiàn)[2-3]以傳感器的工作時間作為輻射代價的衡量標(biāo)準(zhǔn),雖然能夠充分減少主動傳感器的對外輻射量,但由于未針對探測性能和輻射性能的差異進(jìn)行量化,在實際應(yīng)用中存在一定局限。文獻(xiàn)[4]則將傳感器一個工作時長內(nèi)的輻射代價量化為固定值,并通過目標(biāo)優(yōu)化函數(shù)決定調(diào)度序列,但由于輻射風(fēng)險的變化是非線性的,將其簡單地確定為固定值并不準(zhǔn)確。文獻(xiàn)[5]則基于敵我雙方傳感器的發(fā)射功率、脈沖寬度和采樣時間等參數(shù),計算我方傳感器被目標(biāo)截獲的概率,并將截獲概率與截獲代價的乘積定義為截獲風(fēng)險,以截獲風(fēng)險作為輻射風(fēng)險的衡量指標(biāo)。文獻(xiàn)[6]在調(diào)度中采取輻射度影響(emission level impact,ELI)模型量化傳感器輻射風(fēng)險,時變地描述輻射狀態(tài)變化情況,無需提前掌握目標(biāo)輻射告警設(shè)備的相關(guān)參數(shù),比較符合實際情況。
由于主動傳感器的固有特性,更高的跟蹤精度往往意味著更大的輻射風(fēng)險,這就要求調(diào)度策略必須能夠?qū)崿F(xiàn)多指標(biāo)的有效平衡。文獻(xiàn)[7]針對傳感器網(wǎng)絡(luò)多目標(biāo)跟蹤中的節(jié)點調(diào)度問題,在節(jié)點數(shù)和跟蹤精度雙重約束的前提下,以節(jié)點調(diào)度代價和網(wǎng)絡(luò)傳輸代價最小化為優(yōu)化目標(biāo),提出了一種基于單步代價的傳感器短時調(diào)度策略。但短時調(diào)度由于決策依據(jù)僅為單步收益,整體性能一般,雖然能夠?qū)崿F(xiàn)單指標(biāo)的最優(yōu)化,卻不能很好地滿足多指標(biāo)平衡的要求,而且還會導(dǎo)致頻繁切換的問題[8]。為此,文獻(xiàn)[9]針對空戰(zhàn)中飛行器跟蹤精度與輻射風(fēng)險的平衡問題,以多步累積發(fā)現(xiàn)概率、累積被截獲概率為決策依據(jù),實現(xiàn)了機(jī)載多類型傳感器的有效協(xié)同,對任務(wù)性能約束下的雷達(dá)射頻隱身性能作了進(jìn)一步優(yōu)化。文獻(xiàn)[10]以最小工作時長為調(diào)度方法的時間尺度基礎(chǔ),規(guī)定傳感器只有在達(dá)到最小工作時長后才決策是否進(jìn)行切換,有效降低了輻射代價和切換次數(shù),得到了調(diào)度方案的次優(yōu)解。文獻(xiàn)[11]以一段時域內(nèi)的目標(biāo)跟蹤精度和傳感器輻射代價為指標(biāo)建立目標(biāo)優(yōu)化函數(shù),并采取分支定界算法求解調(diào)度策略,實現(xiàn)了傳感器系統(tǒng)生存性和穩(wěn)定性的有效平衡。
同時,隨著無人機(jī)蜂群等作戰(zhàn)樣式的出現(xiàn),雜波環(huán)境下的多目標(biāo)跟蹤成為了研究的熱點,由于難以做到對多目標(biāo)的完全觀測,且觀測結(jié)果還包含了大量雜波干擾,導(dǎo)致跟蹤的不確定性進(jìn)一步增加[12]。對此,經(jīng)典的多目標(biāo)跟蹤方法如聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)算法[13](joint probabilistic data association,JPDA)和多假設(shè)跟蹤算法[14](multiple hypothesis tracking,MHT)等,采取數(shù)據(jù)關(guān)聯(lián)的方式來解決不確定性問題,導(dǎo)致調(diào)度方案求解變成了非確定性多項式難題,計算量大,反應(yīng)速度慢,無法滿足目標(biāo)跟蹤時效性的要求。針對這個問題,Mahler基于隨機(jī)有限集(random finite set,RFS)理論,首次提出了有限集統(tǒng)計學(xué)(fInite set statistics,FISST)[15],將目標(biāo)檢測和狀態(tài)估計整合為貝葉斯最優(yōu)步驟,依據(jù)各采樣時刻內(nèi)的多目標(biāo)狀態(tài)觀測集,遞推更新狀態(tài)概率密度函數(shù),形成了一種可適性好的多目標(biāo)多傳感器系統(tǒng)統(tǒng)計模型。在此基礎(chǔ)上,為簡化多目標(biāo)貝葉斯濾波器求解復(fù)雜性,相繼提出了概率假設(shè)密度[16](probability hypothesis density,PHD)濾波器、帶勢概率假設(shè)密度[17](cardinalized PHD,CPHD)濾波器、多伯努利[18](multi-Bernoulli,MB)濾波器及其改進(jìn)等多目標(biāo)跟蹤算法,在進(jìn)一步省去復(fù)雜的量測-航跡關(guān)聯(lián)環(huán)節(jié)的同時,實現(xiàn)了比經(jīng)典多目標(biāo)跟蹤方法更好的跟蹤性能。
進(jìn)一步,學(xué)者們將雜波環(huán)境下的多目標(biāo)跟蹤算法與傳感器調(diào)度相結(jié)合,文獻(xiàn)[19]針對單傳感器可移動平臺控制問題,以最優(yōu)子模式分配(optimal subpattern assignment,OSPA)距離為指標(biāo)創(chuàng)建目標(biāo)優(yōu)化函數(shù),采取標(biāo)簽多伯努利(labeled MB,LMB)濾波器實現(xiàn)多目標(biāo)狀態(tài)估計,顯著提高了目標(biāo)跟蹤性能,但未考慮多傳感器條件。文獻(xiàn)[20]在基于LMB濾波器提出多傳感器控制方法的基礎(chǔ)上,研究給出了LMB分布的后驗概率泛函,并利用該泛函作為約束條件,對控制策略求解過程進(jìn)行優(yōu)化,有效提高了運算速度。文獻(xiàn)[21]則選取柯西-施瓦茨散度作為傳感器系統(tǒng)的性能評價函數(shù),通過局部迭代搜索的方式求取控制策略次優(yōu)解,顯著減少了計算量,但由于其決策的時間尺度為固定時長,從而限制了可行解的范圍。文獻(xiàn)[22]采取高斯混合多目標(biāo)(Gaussian mixture multi-target,GM-MT)濾波器,利用不同高斯分布之間的巴氏距離求解GM之間的信息增益,提出了以單步OSPA距離最優(yōu)為準(zhǔn)則的傳感器控制策略,但該方法僅對基于傳感器跟蹤精度的優(yōu)化進(jìn)行了研究,未考慮使用代價因素,在實際應(yīng)用中存在不足。文獻(xiàn)[23]基于集中式處理結(jié)構(gòu),以傳感器能量損耗為約束條件,采取多目標(biāo)均方誤差界為代價函數(shù),將多目標(biāo)貝葉斯建模為δ-廣義標(biāo)簽多伯努利(generalized LMB,GLMB)RFS,采用子最優(yōu)算法求解調(diào)度方案,提出了一種約束條件控制下的多傳感器控制算法。
本文根據(jù)已有研究成果,結(jié)合截獲概率的思想,提出了一種基于RFS多目標(biāo)跟蹤理論的傳感器輻射控制的長時調(diào)度方法。首先創(chuàng)建傳感器調(diào)度模型,基于部分可觀馬爾可夫決策過程(partially observable Markov decision process,POMDP)[24]和RFS,對目標(biāo)的真實狀態(tài)和觀測結(jié)果進(jìn)行了數(shù)學(xué)描述;基于截獲概率的思想,提出了改進(jìn)的輻射風(fēng)險量化方法;并以跟蹤精度和輻射風(fēng)險的有效平衡為目標(biāo)創(chuàng)建了優(yōu)化函數(shù)。然后,基于高斯混合概率假設(shè)密度[25-27](Gaussian mixture PHD,GM-PHD)平滑濾波算法,提出了多目標(biāo)長時跟蹤精度的預(yù)測方法;結(jié)合目標(biāo)的輻射告警最大作用距離,提出了傳感器長時輻射代價的預(yù)測方法,并設(shè)計了傳感器的調(diào)度流程。最后進(jìn)行了仿真實驗,分別對本文所提調(diào)度方法的性能、輻射風(fēng)險量化方法的性能、目標(biāo)優(yōu)化函數(shù)系數(shù)對調(diào)度的影響、環(huán)境雜波對調(diào)度的影響進(jìn)行了分析,驗證了本文所提方法的有效性和可行性。
立足二維坐標(biāo)下的情況,定義k時刻多目標(biāo)運動狀態(tài)
(1)
即k時刻Mk個在狀態(tài)空間上取值的目標(biāo)狀態(tài),其中多目標(biāo)數(shù)目Mk是變化的。每個目標(biāo)的狀態(tài)則分別表示目標(biāo)m在x和y方向上的位置分量和速度分量。
Xk+1=Sk+1|k(Xk)∪Bk+1|k(Xk)∪Γk+1,
(2)
式中:Sk+1|k(Xk)為k+1時刻的存活目標(biāo)RFS;Bk+1|k(Xk)為由存活目標(biāo)Xk衍生的目標(biāo)RFS;Γk+1為n時刻的新生目標(biāo)RFS。
根據(jù)文獻(xiàn)[25],各目標(biāo)的運動特征服從線性高斯多目標(biāo)(linear Gaussian multi-target,LGM)模型,則目標(biāo)馬爾可夫轉(zhuǎn)移概率密度滿足:
(3)
多目標(biāo)的觀測模型可定義為
(4)
式中:Ok為k時刻傳感器系統(tǒng)在觀測多目標(biāo)時所得的量測值。由于存在目標(biāo)漏檢及雜波干擾情況,故無法與目標(biāo)的真實狀態(tài)一一對應(yīng)。
Ok=Dk(Xk)∪Kk.
(5)
由于傳感器量測模型也必須服從LGM,故多目標(biāo)量測似然為
(6)
式中:Hk為觀測矩陣;Rk為觀測噪聲協(xié)方差矩陣。
本文僅考慮主動傳感器,所以k時刻傳感器n對目標(biāo)m狀態(tài)的量測信息包括目標(biāo)斜距離和方位角,即
(7)
(8)
(9)
同時,由于截獲概率α的定義為[30]
(10)
式中:RI為目標(biāo)的輻射告警接收機(jī)能發(fā)現(xiàn)傳感器輻射信號的最大距離;Rk為k時刻傳感器探測到其與目標(biāo)間的距離。
(11)
定義傳感器系統(tǒng)在k時刻的調(diào)度動作為
(12)
考慮各傳感器工作性能的差異,規(guī)定最小工作時長為φ∈{φ1,φ2,…,φN},在此基礎(chǔ)上,構(gòu)建目標(biāo)優(yōu)化函數(shù):
(13)
(14)
(15)
為有效克服多目標(biāo)跟蹤中存在的雜波干擾和目標(biāo)漏檢情況,采取GM-PHD平滑濾波器進(jìn)行狀態(tài)估計,在此基礎(chǔ)上,以O(shè)SPA距離為衡量指標(biāo)實現(xiàn)多目標(biāo)跟蹤精度預(yù)測。
在LGM假設(shè)條件下,目標(biāo)生存概率和檢測概率與目標(biāo)的狀態(tài)無關(guān),即
(16)
同時,定義:
QS,k+1=1-PS,k+1為目標(biāo)消亡概率;
QD,k+1=1-PD,k+1為漏檢概率;
Jk為k時刻描述PHD函數(shù)υk(Xk)的高斯分量的數(shù)目;
(1) 預(yù)測
假設(shè)在n時刻,目標(biāo)后驗強(qiáng)度具有高斯混合的形式:
(17)
則k+1時刻的目標(biāo)預(yù)測強(qiáng)度也具有高斯混合形式:
(18)
(2) 更新
k+1時刻的目標(biāo)后驗強(qiáng)度也具有高斯混合的形式:
(19)
式中:k+1時刻的目標(biāo)量測強(qiáng)度為
(20)
(3) 后向平滑
對目標(biāo)濾波結(jié)果進(jìn)行平滑處理:
υk+1|l(Xk+1)=υk+1(Xk+1)Bk+1|l(Xk+1),
(21)
式中:Bk+1|l(Xk+1)為后向校正函數(shù),在高斯混合假設(shè)條件下,其值為
(22)
則平滑PHD函數(shù)υk+1|l(Xk+1)也為高斯混合形式,當(dāng)采取一步平滑的辦法,即l=k+2時,平滑PHD函數(shù)為
(23)
(4) 合并修剪
由于高斯分量的個數(shù)會隨著迭代的持續(xù)而無限增長,故采取合并修剪的辦法,抑制高斯分量數(shù)目。
首先設(shè)置合并門限U,減少分布接近的高斯分量。若分量i和分量j滿足:
(24)
則將2個分量合并,隨后通過剪枝的辦法舍去權(quán)值低于修剪閾值τ的分量,進(jìn)而控制高斯分量數(shù)目,提高運算效率。
(5) 狀態(tài)提取
采取GM-PHD平滑濾波算法進(jìn)行目標(biāo)跟蹤時,由于目標(biāo)狀態(tài)信息包含在υk+1|k+2(Xk+1)中,為進(jìn)行后續(xù)計算,則需要在其中提取目標(biāo)狀態(tài),通常選取υk+1|k+2(Xk+1)中權(quán)值大于0.5的高斯函數(shù)分量的均值進(jìn)行描述。
在基于RFS的多目標(biāo)跟蹤中,OSPA距離是一種重要的整體性能評價標(biāo)準(zhǔn),能夠較為全面、準(zhǔn)確地評價多目標(biāo)跟蹤的精度,其值越小,相應(yīng)濾波算法所對應(yīng)的位置估計精度或多目標(biāo)狀態(tài)估計性能也就越好[31]。在GM-PHD平滑算法的基礎(chǔ)上,利用OSPA距離,可以提出多目標(biāo)長時跟蹤精度的預(yù)測方法:
Step 1: 初始化
Step 2: 獲取目標(biāo)狀態(tài)
Step 3: 求取截止距離
(25)
式中:d(X,Y)為k+h-1時刻X和Y2條航跡的基準(zhǔn)距離。
Step 4: 計算OSPA距離
(26)
式中:ΩMm表示{1,2,…,k}上排列的集合。
Step 5: 循環(huán)
若h<φ,令h=h+1,轉(zhuǎn)到Step 2;若h=φ,循環(huán)結(jié)束,得到φ時長內(nèi)的平均OSPA距離預(yù)測值:
(27)
基于前文對傳感器輻射風(fēng)險的量化,為有效實現(xiàn)傳感器輻射狀態(tài)的實時更新,結(jié)合最小工作時長的思想,提出傳感器長時輻射代價的預(yù)測方法。
Step 1: 初始化
跟蹤步長與調(diào)度動作同2.2節(jié)Step 1一致。
Step 2: 獲取目標(biāo)狀態(tài)
(28)
Step 3: 計算距離
(29)
Step 4: 計算輻射代價
(30)
Step 5: 循環(huán)
若h<φ,令h=h+1,轉(zhuǎn)到Step 2;若h=φ,循環(huán)結(jié)束,求取φ時長內(nèi)輻射代價非0的各時刻值的平均值:
(31)
Step 1: 初始時刻
Step 2: 重新決策
至φ時刻,傳感器n0:φ-1已工作滿φ時長,此時決策是否切換傳感器。
Step 3: 預(yù)測跟蹤代價
Step 4: 預(yù)測輻射代價
Step 5: 代入目標(biāo)函數(shù)
將各傳感器的跟蹤代價和輻射代價代入目標(biāo)優(yōu)化函數(shù)式(13),得到下一時刻或下一時長內(nèi)的最優(yōu)傳感器nmin。
Step 6: 確定工作時長
Step 7: 循環(huán)
傳感器系統(tǒng)按照上述步驟循環(huán)決策,至H-1時刻,調(diào)度任務(wù)結(jié)束。
假設(shè)系統(tǒng)包含4個傳感器,在2維空間中跟蹤4個目標(biāo),傳感器的初始位置為N1(70,-70) m,N2(-70,-70) m,N3(-70,70) m,N4(70,70) m,采樣間隔t=1 s,最小工作時長φ=2 s,測量誤差δr=0.5 m,δφ=0.5 rad。
將觀測環(huán)境中雜波干擾的RFS建模成泊松分布,其強(qiáng)度Kk(Zk)=λcVu(Zk),其中u(·)為均勻分布概率密度函數(shù);V=(-150 m,150 m)×(-150 m,150 m)為傳感器監(jiān)測區(qū)域,λc=3為單位面積內(nèi)雜波的平均個數(shù)。目標(biāo)的輻射告警作用距離RI均設(shè)置為50 m。仿真總時間為70 s,仿真結(jié)果為200次蒙特卡羅實驗的平均。
為驗證本文所提調(diào)度方法的適用性和有效性,同時與單傳感器系統(tǒng)多目標(biāo)跟蹤,以及多傳感器系統(tǒng)無時長約束調(diào)度策略[3](non-timestep constrained scheduling policy,NCSP)、固定時長調(diào)度策略[4](fixed timestep scheduling policy,F(xiàn)TSP)進(jìn)行對比。
如圖1~3所示,相比基于多傳感器調(diào)度的目標(biāo)跟蹤,處于4個不同位置的單傳感器由于不進(jìn)行選擇優(yōu)化,得到的OSPA距離累計值、目標(biāo)數(shù)目標(biāo)準(zhǔn)差、輻射時長明顯最高,輻射距離最小,效果最差。
圖2 各采樣時刻目標(biāo)數(shù)目標(biāo)準(zhǔn)差和目標(biāo)數(shù)目標(biāo)準(zhǔn)差均值Fig.2 STD of the number of targets at each sampling time and STD of target numbers
圖3 各采樣時刻得到的輻射距離、輻射時長和 傳感器調(diào)度次數(shù)Fig.3 Radiation distance,radiation duration, and sensor switching times
本文所提方法(proposed scheduling method,PSM)由于是長時調(diào)度,相比于NCSP的短時調(diào)度方法,決策基礎(chǔ)為長時跟蹤效益,是一段時域內(nèi)優(yōu)化目標(biāo)的累計值,所以在跟蹤精度、輻射風(fēng)險以及切換次數(shù)的平衡優(yōu)化方面要明顯更優(yōu),傳感器調(diào)度次數(shù)、OSPA距離累計值、目標(biāo)數(shù)目標(biāo)準(zhǔn)差更低,整體性能突出。同時,本文所提方法在達(dá)到最小工作時長后,再依據(jù)預(yù)測結(jié)果決策是否進(jìn)行切換,相比FTSP中傳感器在滿足固定時長后即發(fā)生切換,丟失較多可行解的情況,求解覆蓋范圍更加全面,得到的調(diào)度方案更優(yōu),各項調(diào)度性能指標(biāo)均明顯好于FTSP。
總的來看,本文所提調(diào)度方法在保證了對輻射風(fēng)險有效控制的基礎(chǔ)上,進(jìn)一步改善了目標(biāo)跟蹤精度和傳感器切換代價,更加滿足多指標(biāo)平衡優(yōu)化的目的,調(diào)度性能最優(yōu)。
利用本文所提調(diào)度方法跟蹤目標(biāo),得到的調(diào)度序列和多目標(biāo)運動軌跡如圖4,5所示。
圖4 采取本文所提方法得到的傳感器調(diào)度序列Fig.4 Sensor scheduling sequence under scheduling with PSM
圖5 多目標(biāo)真實運動軌跡和采取本文所提方法 進(jìn)行調(diào)度得到的觀測軌跡Fig.5 Real motion trajectory of multi-target and observation trajectory obtained by PSM scheduling
為驗證本文基于截獲概率改進(jìn)的傳感器輻射風(fēng)險量化方法的實際效果,采取ELI的輻射風(fēng)險量化指標(biāo)作為對比,分別利用2種方法求取調(diào)度序列,并互相采用性能指標(biāo)對調(diào)度結(jié)果進(jìn)行評價。
仿真中,為排除目標(biāo)函數(shù)系數(shù)對調(diào)度效果的影響,區(qū)分僅對跟蹤代價進(jìn)行優(yōu)化和僅對輻射代價進(jìn)行優(yōu)化2種情況進(jìn)行實驗。ELI狀態(tài)真實值量化為(1,2,3),相對應(yīng)的瞬時觀測威脅度也為(1,2,3)。為保證2組實驗的對比性,規(guī)定4個傳感器的探測性能相同,則ELI狀態(tài)轉(zhuǎn)移矩陣也保持一致:
(32)
其余條件與3.1節(jié)相同,進(jìn)行200次蒙特卡羅仿真實驗。如表1所示,分別取2組實驗的OSPA距離累計值、目標(biāo)數(shù)目標(biāo)準(zhǔn)差、傳感器切換次數(shù)、輻射代價累計值、輻射時長和輻射距離6類調(diào)度性能指標(biāo)進(jìn)行對比,其中輻射代價累計值為采取ELI方法時輻射代價的描述指標(biāo)。
從表1中可以看出,當(dāng)目標(biāo)函數(shù)僅對跟蹤代價進(jìn)行優(yōu)化時,其實質(zhì)上變成了針對跟蹤精度的最優(yōu)化,應(yīng)用2類輻射代價量化方法進(jìn)行調(diào)度,所得結(jié)果的各項性能指標(biāo)基本一致。
表1 不同輻射風(fēng)險量化方法下的調(diào)度性能對比Table 1 Comparison of scheduling performance under different radiation risk quantification method
而只針對輻射代價進(jìn)行優(yōu)化時,由于本文所提方法限制了目標(biāo)的輻射告警作用距離,傳感器在作用距離之外工作時,不考慮輻射代價問題,只對跟蹤代價進(jìn)行優(yōu)化,所以得到的OSPA距離累計值、目標(biāo)數(shù)目標(biāo)準(zhǔn)差及傳感器切換次數(shù)更優(yōu)。輻射代價控制方面,采取本文所提輻射風(fēng)險量化方法進(jìn)行調(diào)度時,由于將輻射風(fēng)險同主動傳感器與目標(biāo)間的距離相關(guān)聯(lián),所以調(diào)度得到的輻射距離和輻射時長有了大幅改善,而ELI指標(biāo)由于只是將各時刻的輻射風(fēng)險量化為固定值,所以優(yōu)化效果有限。而由于4個傳感器的探測性能和輻射性能均相同,所以在2種輻射風(fēng)險量化方法下,調(diào)度序列的變化并不會讓累計輻射代價發(fā)生明顯降低。
由此可以認(rèn)為,相比于采用ELI指標(biāo)時將輻射代價量化為固定值,僅能反應(yīng)其非線性變化特征,而與實際工作情況無關(guān),且跟蹤全程都只針對唯一的優(yōu)化目標(biāo)進(jìn)行決策的情形,本文所提的輻射風(fēng)險量化方法,將輻射風(fēng)險與目標(biāo)處的發(fā)射功率密度相關(guān)聯(lián),能夠更加準(zhǔn)確地反映傳感器工作的實際特征,還可以根據(jù)探測所得的傳感器與目標(biāo)間的距離,實時對優(yōu)化目標(biāo)進(jìn)行調(diào)整,提高傳感器資源利用效率,進(jìn)而改善多目標(biāo)跟蹤精度,降低傳感器的切換代價和輻射信號被目標(biāo)截獲的風(fēng)險。
結(jié)合目標(biāo)優(yōu)化函數(shù)式(13)可知,系數(shù)α起到了調(diào)控調(diào)度系統(tǒng)優(yōu)化目標(biāo)的作用。由于跟蹤代價和輻射代價之間量綱上的差距,在3.1節(jié)仿真實驗中,設(shè)定的系數(shù)α=103。為進(jìn)一步分析系數(shù)α的選取對本文所提調(diào)度方法的影響,分別取α=0,102,5×102,103,5×103,104,進(jìn)行200次蒙特卡羅仿真實驗。如表2所示,為分別取不同的目標(biāo)優(yōu)化函數(shù)系數(shù)時,調(diào)度所得OSPA距離累計值、目標(biāo)數(shù)目標(biāo)準(zhǔn)差、傳感器切換次數(shù)、輻射距離和輻射時長的對比情況。
從表2中可以看出,隨著系數(shù)α的增大,衡量目標(biāo)跟蹤精度的指標(biāo)OSPA距離累計值和目標(biāo)數(shù)目標(biāo)準(zhǔn)差逐漸增加,說明隨著跟蹤代價在目標(biāo)優(yōu)化函數(shù)中占比的減少,目標(biāo)跟蹤精度在逐漸變差。而反映輻射風(fēng)險的指標(biāo)輻射距離逐漸增加、輻射時長逐漸減小,即當(dāng)輻射代價在目標(biāo)優(yōu)化函數(shù)中的占比增加時,調(diào)度方法針對輻射風(fēng)險的優(yōu)化效果將更加明顯,能夠?qū)崿F(xiàn)對輻射風(fēng)險的有效控制。
表2 不同優(yōu)化函數(shù)系數(shù)下的調(diào)度性能對比Table 2 Comparison of scheduling performance under different objective optimization function coefficients
同時,傳感器切換次數(shù)的減少,也進(jìn)一步驗證了本文所提方法的合理性和可適性。通過決策選擇,可以有效增大輻射距離,減少輻射時間和切換次數(shù),降低傳感器系統(tǒng)被目標(biāo)截獲的概率,以及由頻繁切換所帶來的伺服系統(tǒng)工作駐留、信號響應(yīng)延遲等一系列切換代價問題。本節(jié)仿真實驗同時也進(jìn)一步驗證了3.2節(jié)的仿真結(jié)果。
為克服環(huán)境雜波對目標(biāo)觀測的影響,本文采取GM-PHD平滑濾波算法進(jìn)行目標(biāo)狀態(tài)估計。在前節(jié)仿真條件設(shè)置中,我們將雜波干擾的RFS建模為單位面積內(nèi)雜波平均個數(shù)λc=3的泊松分布,為進(jìn)一步分析環(huán)境雜波對傳感器調(diào)度性能的影響,分別取λc=0,3,6,10,20,30,進(jìn)行200次蒙特卡羅仿真實驗。如表3所示,為不同雜波密度下,經(jīng)過調(diào)度后傳感器系統(tǒng)所得OSPA距離累計值、目標(biāo)數(shù)目標(biāo)準(zhǔn)差、傳感器切換次數(shù)、輻射距離和輻射時長的對比情況。
表3 不同雜波密度下的調(diào)度性能對比Table 3 Comparison of scheduling performance under different clutter densities
在傳感器調(diào)度的決策階段,由于預(yù)測長時跟蹤精度時采用的是目標(biāo)量測的預(yù)測值,不包括雜波干擾,所以如表3所示,雜波密度的變化不會對調(diào)度方案產(chǎn)生影響,系統(tǒng)經(jīng)過調(diào)度后得到切換次數(shù)、輻射距離、輻射時長保持穩(wěn)定。而多目標(biāo)跟蹤精度的變差,則是由于在調(diào)度方案執(zhí)行階段利用GM-PHD平滑濾波算法處理雜波干擾時,受算法處理能力的限制,隨著雜波密度的增大,得到的目標(biāo)狀態(tài)估計結(jié)果中包含的雜波數(shù)量增加,從而導(dǎo)致目標(biāo)數(shù)目標(biāo)準(zhǔn)差和OSPA距離增大。通過本節(jié)仿真,進(jìn)一步證明了本文所提調(diào)度方法的穩(wěn)定性,能夠有效避免環(huán)境雜波的干擾,實現(xiàn)對輻射代價和切換代價的有效控制。
本文針對多目標(biāo)跟蹤中的傳感器調(diào)度問題和輻射風(fēng)險量化問題進(jìn)行了研究。首先,基于RFS理論對多目標(biāo)狀態(tài)進(jìn)行了描述和定義;其次,利用GM-PHD平滑濾波算法實現(xiàn)了長時多目標(biāo)跟蹤精度的預(yù)測,基于截獲概率的思想提出了改進(jìn)的輻射風(fēng)險量化方法,并實現(xiàn)了長時輻射代價的預(yù)測;最后,結(jié)合最小工作時長確定調(diào)度策略,提出了一種可行的多傳感器多目標(biāo)跟蹤長時調(diào)度方法。仿真實驗表明,采取本文所提的輻射風(fēng)險量化方法實施調(diào)度,更加符合主動傳感器的工作特征,可以對輻射代價進(jìn)行有效控制,并基于傳感器與目標(biāo)間的觀測距離,自適應(yīng)地調(diào)整目標(biāo)優(yōu)化函數(shù),有利于傳感器資源的充分利用,進(jìn)一步優(yōu)化了各項調(diào)度性能指標(biāo);同時,通過與其他調(diào)度方法對比,本文所提調(diào)度方法在目標(biāo)跟蹤精度和輻射代價、切換代價等多指標(biāo)的平衡優(yōu)化方面效果更佳,驗證了其優(yōu)越性和可行性。