衛(wèi)楊勇,徐世友,辛玉林,陳曾平
(國防科技大學(xué)ATR國防科技重點實驗室,長沙410073)
基于分辨力增益的綜合識別傳感器管理方法?
衛(wèi)楊勇,徐世友,辛玉林,陳曾平
(國防科技大學(xué)ATR國防科技重點實驗室,長沙410073)
為提高目標(biāo)綜合識別的效能,需對綜合識別系統(tǒng)中多種傳感器資源進(jìn)行科學(xué)管理。在分析綜合識別中目標(biāo)優(yōu)先級和傳感器使用約束條件的基礎(chǔ)上,建立了利用分辨力增益作為傳感器資源管理優(yōu)化準(zhǔn)則的目標(biāo)函數(shù),提出了利用傳感器混淆矩陣的預(yù)測分辨力增益計算方法,并將粒子群優(yōu)化算法引入傳感器-目標(biāo)分配NP-hard問題的求解中。仿真結(jié)果表明該方法合理高效。
綜合識別;傳感器管理;分辨力增益;混淆矩陣;粒子群優(yōu)化
現(xiàn)代戰(zhàn)爭中,戰(zhàn)場態(tài)勢瞬息萬變,快速、精確、高效地識別目標(biāo)屬性是獲取戰(zhàn)場態(tài)勢的有力保證,采用單一傳感器很難實現(xiàn)對所有目標(biāo)的高置信度識別,需要充分利用多種傳感器各自的優(yōu)勢,建立目標(biāo)綜合識別系統(tǒng)。
為提高目標(biāo)綜合識別系統(tǒng)的目標(biāo)識別效能,需要對多傳感器的使用進(jìn)行科學(xué)合理的管理。當(dāng)前,傳感器管理方面的研究大多針對目標(biāo)檢測跟蹤問題[1-4],主要通過建立可量化的目標(biāo)函數(shù)對傳感器資源進(jìn)行管理,以使目標(biāo)檢測跟蹤的效能更優(yōu)。而目標(biāo)識別是較檢測跟蹤更高層次的信息處理,信息的不確定性及其合理描述使得綜合識別系統(tǒng)傳感器管理目標(biāo)函數(shù)的選取和量化更為困難,從而加大了傳感器管理的難度。文獻(xiàn)[5]針對目標(biāo)融合識別問題,提出了基于不確定性推理和模糊控制策略的傳感器管理方法,但方法均是基于傳感器觀測預(yù)測已知的情況,對于管理過程中預(yù)測信息的獲取問題沒有涉及。
本文針對目標(biāo)綜合識別系統(tǒng)多傳感器多目標(biāo)問題的特點,綜合考慮目標(biāo)優(yōu)先級和傳感器資源的使用約束條件,建立了基于分辨力增益的傳感器資源管理優(yōu)化模型;同時,利用混淆矩陣表征傳感器識別性能,給出了綜合識別系統(tǒng)中傳感器對目標(biāo)識別的預(yù)測分辨力增益量化計算方法;在此基礎(chǔ)上,針對傳感器-目標(biāo)分配的組合爆炸現(xiàn)象,采用粒子群優(yōu)化算法實現(xiàn)分配策略的快速求解;最后,通過設(shè)定綜合識別場景,對該方法的性能進(jìn)行了仿真分析。
傳感器管理是一個控制過程,其核心是依據(jù)一定的最優(yōu)準(zhǔn)則,建立一個易于量化的目標(biāo)函數(shù),而后在傳感器使用約束條件下通過優(yōu)化目標(biāo)函數(shù)來選擇工作傳感器及其模式和參數(shù)[6]。
假定某目標(biāo)綜合系統(tǒng)包含S個基本傳感器,所在區(qū)域中有T個待識別目標(biāo)??紤]同一時刻可能不止一個傳感器分配給相同目標(biāo),因此引入偽傳感器[4]的概念,這樣在同一時刻至多有一個傳感器(基本傳感器或偽傳感器)分配給一個目標(biāo)。傳感器(基本傳感器或偽傳感器)i(i=1,2,…,2S-1)分配給目標(biāo)j(j=1,2,…,T)記為eij=1,否則eij=0,則由eij構(gòu)成(2S-1)×T階分配矩陣。同時設(shè)基本傳感器i最大同時量測目標(biāo)個數(shù)為li(i=1,2,…,S),J(i)為包含基本傳感器i的所有傳感器組合(基本傳感器和偽傳感器)的編號構(gòu)成的整數(shù)集合,由此得到目標(biāo)綜合識別系統(tǒng)多傳感器資源管理分配模型的約束條件為
目標(biāo)綜合識別系統(tǒng)中采用多傳感器的目的就是不斷獲取目標(biāo)環(huán)境信息,以減少對目標(biāo)環(huán)境特性認(rèn)識的不確定性。分辨力[7]是表征信息不確定性的一種有效方法,與信息熵不同之處在于其本身可度量信息量的大小,具有描述容易且較直接等固有優(yōu)勢。設(shè)一有限離散集合,其元素k(k=0,1,…,K)互斥,P(k)和Q(k)是關(guān)于元素k的兩個概率分布,則P(k)和Q(k)間的分辨力為
顯然,可以通過計算目標(biāo)識別前后的分辨力來表征信息量的變化。具體地,對于某目標(biāo),通過計算第n次識別的Dn和第n+1次識別前其分辨力預(yù)測期望值E(Dn+1|n),計算得到預(yù)測分辨力增益為ΔD =E(Dn+1|n)-Dn。ΔD越大對應(yīng)的目標(biāo)更需要傳感器對它做進(jìn)一步識別,這就是基于分辨力增益的傳感器資源分配的基本原則。
同時,當(dāng)待識別目標(biāo)數(shù)目多,且傳感器資源有限時,在分配過程中還需要綜合考慮目標(biāo)的優(yōu)先級[8]。設(shè)目標(biāo)j的優(yōu)先級系數(shù)為Aj,傳感器i對目標(biāo)j的分辨力增益表示為ΔDij,則傳感器資源分配問題可描述為在滿足上述給出的約束條件下使目標(biāo)函數(shù)最大,即:
通過求取各傳感器與目標(biāo)分配組合所得的目標(biāo)函數(shù)值,從中選最大值所對應(yīng)的分配結(jié)果即為所求。
由第2節(jié)的分析可知,在利用分辨力增益構(gòu)造目標(biāo)函數(shù)的過程中,如何計算下一時刻傳感器i對目標(biāo)j的分辨力增益預(yù)測值是核心問題。假設(shè)目標(biāo)屬于不同類型的先驗概率P(h)已知,經(jīng)過n次量測后,各目標(biāo)屬于不同類型的后驗概率相對于先驗概率的分辨力為
注意到n-1次量測后,第n次量測的概率密度函數(shù)為
則分辨力一步預(yù)測的期望值為
因此,可得分辨力增益預(yù)測值為
容易看出,基于分辨力增益的傳感器資源分配求解是一個組合爆炸的NP-hard問題。雖然傳統(tǒng)的數(shù)學(xué)規(guī)劃方法在理論上能得到最優(yōu)解,但受到問題維數(shù)的制約往往不滿足實際要求。本文采用粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法[9]得到符合要求的滿意解。
PSO算法是由Kennedy和Eberhart在研究鳥類和魚類的群體行為基礎(chǔ)上于1995年提出的一種群智能算法,其基本思想是通過群體中個體之間的協(xié)作和信息共享來尋找最優(yōu)解。PSO算法同遺傳算法類似,是一種基于迭代的優(yōu)化工具,但沒有遺傳算法復(fù)雜的交叉以及變異過程。
在PSO中,每個優(yōu)化問題的解被抽象為N維空間中沒有質(zhì)量和體積的粒子,每個粒子都有一個由待優(yōu)化函數(shù)決定的適應(yīng)值(fitness value)來決定其移動方向及速度。每個粒子都有到目前為止本身找到的最優(yōu)解(pBest)和群體中所有粒子找到的最優(yōu)解(gBest),粒子通過跟蹤這兩個極值并采用如下公式來更新自己的位置[10]:
式中,Vid是粒子當(dāng)前速度,xid是粒子當(dāng)前的位置,pid是個體極值pBest,pgd是全局極值gBest,rand是(0,1)區(qū)間的隨機數(shù),c1和c2是學(xué)習(xí)因子,w是慣性
因子,表征了粒子上一次的速度對本次飛行速度的影響。粒子進(jìn)化過程中動態(tài)改變慣性因子的取值可以有效改善PSO陷入局部最優(yōu)。這里給出一種常用的改進(jìn)策略[10],即速度更新公式中的慣性因子由最大慣性因子wmax線性減小到最小慣性因子wmin,計算式為
式中,iter為當(dāng)前迭代數(shù),itermax為總的迭代次數(shù)。
每一維粒子的速度都會被限制在最大速度Vmax以內(nèi),如果某一維速度更新后超過Vmax,那么這一維的速度就被限定為Vmax。則基于PSO的多傳感器資源管理分配算法的步驟如下:
Step 1:綜合考慮各因素,確定目標(biāo)的優(yōu)先級系數(shù)值,建立基于分辨力增益的傳感器資源管理目標(biāo)函數(shù)及其約束條件;
Step 2:初始化PSO算法的各項參數(shù),在約束條件確定的搜索范圍內(nèi)隨機初始化粒子的位置xid和速度Vid,粒子的維數(shù)可視為可供選擇的傳感器數(shù)目,即2S-1;
Step 3:根據(jù)傳感器資源管理優(yōu)化目標(biāo)函數(shù)計算每個粒子的適應(yīng)值;
Step 4:將每個粒子當(dāng)前的適應(yīng)值與其歷史最好值pBest進(jìn)行比較,如果優(yōu)于pBest,則將當(dāng)前的適應(yīng)值作為新的個體最優(yōu)pBest;同理,比較每個粒子的個體最優(yōu)值pBest和群體最優(yōu)值gBest,選出新的gBest;
Step 5:根據(jù)速度更新公式和位置更新公式更新每個粒子的速度Vid和位置xid;
Step 6:如果沒有達(dá)到迭代終止的條件,則轉(zhuǎn)到Step 3繼續(xù)執(zhí)行。否則,保存gBest,算法結(jié)束。
假定由兩個基本傳感器{s1,s2}組成的綜合識別系統(tǒng),系統(tǒng)觀測區(qū)域中有5個目標(biāo)(tar1,tar2,…,tar5)待識別,各目標(biāo)的優(yōu)先級系數(shù)分別為(0.5,0.5,1.0,1.0,1.5)。假設(shè)每個基本傳感器最多可同時作用于3個目標(biāo)上。將基本傳感器擴展成包括偽傳感器在內(nèi)的3個傳感器,其中s1、s2是基本傳感器,s3={s1,s2}為偽傳感器。
假定有3種目標(biāo)類型A、B和C,由日常訓(xùn)練學(xué)習(xí)得到的各傳感器(含偽傳感器)識別各類型目標(biāo)的混淆矩陣為
前一時刻量測完畢,各目標(biāo)為不同類型(A、B、C)的概率如表1所示(上下為兩組)。
根據(jù)式(8)計算各傳感器對目標(biāo)的ΔD(ij)n,得到傳感器對目標(biāo)的一步預(yù)測分辨力增益值如表2所示(對應(yīng)表1中的兩組)。
由式(3)的目標(biāo)函數(shù),根據(jù)前一節(jié)基于PSO的多傳感器資源管理分配算法的步驟,在滿足約束條件下求得分配矩陣,進(jìn)而得到傳感器-目標(biāo)的分配結(jié)果。
根據(jù)問題的復(fù)雜程度,選擇粒子群優(yōu)化算法的初始化參數(shù)為:粒子群中粒子的個數(shù)為10,wmax為0.9,wmin為0.4,c1=c2=2.05,Vmax為3.0,itermax為30。最終得到傳感器-目標(biāo)的分配結(jié)果分別為:tar1
按照此結(jié)果進(jìn)行分配所獲取總的預(yù)測分辨力增益值分別為9.396 7和8.176 5。由表1可知,對于目標(biāo)為何種類型而言,第二組數(shù)據(jù)較第一組更明確,也即第二組數(shù)據(jù)對于目標(biāo)類型信息的不確定性較小,最后能獲取總的預(yù)測分辨力增益也比第一組的小,這也符合分辨力表征信息量的本質(zhì)。
從仿真結(jié)果可以看出,第一組中,傳感器s1分配給目標(biāo)tar1和tar3,而在第二組中分配給了tar2和tar3,兩組的偽傳感器s3均分配給了tar5,第二組中的傳感器s2分配給了目標(biāo)tar4,這些分配均能使同一目標(biāo)的傳感器-目標(biāo)分配組合中預(yù)測分辨力增益最大。第一組中傳感器s2分配給目標(biāo)tar2和tar4,第二組中分配給了目標(biāo)tar1,雖然只能獲取次大預(yù)測分辨力增益,但是能使各傳感器獲取各目標(biāo)總的預(yù)測分辨力增益最大,且傳感器資源也得到了充分利用??傊?,算法在滿足約束條件的前提下,總是試圖將傳感器分配給能得到更大預(yù)測分辨力增益的目標(biāo),也就是使之能得到更多的信息;同時能看到,性能最優(yōu)的偽傳感器s3均分配給了優(yōu)先級系數(shù)值最高的目標(biāo)tar5,即在一定程度上向優(yōu)先級高的目標(biāo)傾斜,這與實際要求也是一致的。
PSO算法進(jìn)化曲線如圖1所示,通過對100次仿真的每次迭代結(jié)果取平均可以看出,算法不失一般性且具有較快的收斂速度。同時仿真也表明,在更多傳感器和目標(biāo)的情況下,此方法也是高效可行的,是解決組合爆炸問題的有效手段。
針對多傳感器-多目標(biāo)綜合識別問題的特點,本文將分辨力增益概念引入目標(biāo)綜合識別系統(tǒng)中的傳感器管理,提出了基于傳感器混淆矩陣的目標(biāo)函數(shù)量化計算方法,并利用PSO算法較好地解決了傳感器-目標(biāo)分配的NP-hard問題。仿真結(jié)果表明該方法的合理性及高效性。對PSO算法的改進(jìn)以及其它期望分辨力增益計算方法的研究,是本文下一步的方向。
[1]Wegrzyn J,Kastella K.Intelligent Sensor Management to Minimize Detection Error[C]//Proceedings of SPIE.Orlando,F(xiàn)L:IEEE,2003:502-513.
[2]Maheswararajah S,Halgamuge S K,Premaratne M.Sensor Scheduling for Target Tracking by Suboptimal Algorithms[J]. IEEE Transactions on Vehicular Technology,2009,58(3):1467-1479.
[3]Aeron S,Saligrama V,Castanon D A.Efficient SensorManagement Policies for Distributed Target Tracking in Multihop Sensor Networks[J].IEEE Transactions on Signal Processing,2008,56(6):2562-2574.
[4]Nash JM.Optimal Allocation of Tracking Resources[C]//Proceedings of1977 IEEE Conference on Decision and Control including the 16th Symposium on Adaptive Processes and A Special Symposium on Fuzzy Set Theory and Applications. New Orleans,LA:IEEE,1977:1177-1180.
[5]王放.融合自動目標(biāo)識別系統(tǒng)中的傳感器管理策略研究[D].長沙:國防科技大學(xué),2004.
WANG Fang.Research on the Strategy of SensorManagement in Fusion Automatic Target Recognition System[D].Changsha:National University of Defense Technology,2004.(in Chinese)
[6]劉先省.傳感器管理方法研究[D].西安:西北工業(yè)大學(xué),2000.
LIU Xian-xing.Method′s Research of Sensor Management[D].Xi′an:Northwestern Polytechnical University,2000.(in Chinese)
[7]Kastella K.Discrimination Gain to Optimize Detection and Classification[J].IEEE Transactions on Systems,Man and Cybernetics(Part A:Systems and Humans),1997,27(1):112-116.
[8]鞠傳文,楊秀珍,王錫仁,等.多傳感器管理系統(tǒng)中的多目標(biāo)排序[J].電光與控制,2001(3):8-12.
JU Chuan-wen,YANG Xiu-zhen,WANG Xi-ren,et al.Sorting of Multi-target′s Threat in Multi-sensor Management System[J].Electronics Optics&Control,2001(3):8-12.(in Chinese)
[9]Kennedy J,Eberhart R.Particle Swarm Optimization[C]//Proceedings of the IEEE International Conference on Neural Networks.Piscataway,NJ:IEEE,1995:1942-1948.
[10]Shi Y,EberhartR.AModified Particle Swarm Optimizer[C]//Proceedings of the IEEE International Conference on Evolutionary Computation.Piscataway,NJ:IEEE,1998:69-73.
WEIYang-yong was born in Huangshi,Hubei Province,in 1986.He received the B.S.degree in 2009.He is now a graduate student.His research concerns sensor management for target integrated identification.
Email:gfcugwyy@163.com
徐世友(1978—),男,河北承德人,2008年獲博士學(xué)位,現(xiàn)為講師,主要研究方向為外輻射源雷達(dá)系統(tǒng)、雷達(dá)目標(biāo)識別;
XU Shi-you was born in Chengde,HebeiProvince,in 1978. He received the Ph.D.degree in 2008.He is now a lecturer.His research interests include opportunistic illuminator radar,and radar target recognition.
辛玉林(1982—),男,山東濰坊人,2005年獲碩士學(xué)位,現(xiàn)為博士研究生,主要研究方向為目標(biāo)綜合敵我識別;
XIN Yu-lin was born in Weifang,Shandong Province,in 1982.He received theM.S.degree in 2005.He is currentlyworking toward the Ph.D.degree.His research direction is target integrated identification friend or foe.
陳曾平(1967—),男,福建福清人,1994年獲博士學(xué)位,現(xiàn)為教授、博士生導(dǎo)師,主要研究方向為雷達(dá)目標(biāo)識別、電子系統(tǒng)中的信息獲取、處理與實現(xiàn)、電子系統(tǒng)可靠性等。
CHEN Zeng-ping was born in Fuqing,F(xiàn)ujian Province,in 1967.He received the Ph.D.degree in 1994.He is now a professor and also the Ph.D.supervisor.His research interests include radar target recognition,information acquisition,processing and implementation in electronic systems,the reliability of electronic systems,etc.
Integrated Identification Sensor Management Based on Discrim ination Gain
WEIYang-yong,XU Shi-you,XIN Yu-lin,CHEN Zeng-ping
(Automatic Target Recognition(ATR)National Defense Science and Technology Key Laboratory,National University of Defense Technology,Changsha 410073,China)
In order to improve the performance of integrated identification for targets,multi-sensor resources managementmay be needed in integrated identification system.In this paper the targetpriority and the restricted condition of sensors for integrated identification is analysed,and then an objective function regarding the discrimination gain as the rule ofmulti-sensor resourcesmanagement optimization is established.A computation method of discrimination gain utilizing sensor confusion matrix is proposed,and particle swarm optimization(PSO)algorithm is introduced into allocation NP-hard problem of sensor to target.The results show the rationality and efficiency of thismethod.
integrated identification;sensormanagement;discrimination gain;confusionmatrix;particle swarm optimization(PSO)
TP391;TP273
A
10.3969/j.issn.1001-893x.2011.11.003
衛(wèi)楊勇(1986—),男,湖北黃石人,2009年獲學(xué)士學(xué)位,現(xiàn)為碩士研究生,主要研究方向為目標(biāo)綜合識別中的傳感器管理;
1001-893X(2011)11-0011-05
2011-07-15;
2011-09-02