李龍順,彭冬亮,申屠晗,薛安克,劉俊
(杭州電子科技大學(xué)通信信息傳輸與融合技術(shù)國防重點學(xué)科實驗室,杭州310018)
基于多源沖突數(shù)據(jù)聚類的態(tài)勢估計方法*
李龍順,彭冬亮,申屠晗,薛安克,劉俊
(杭州電子科技大學(xué)通信信息傳輸與融合技術(shù)國防重點學(xué)科實驗室,杭州310018)
傳統(tǒng)調(diào)和式態(tài)勢估計方法在面對多源沖突數(shù)據(jù)時融合效果不佳。為此,提出一種基于沖突數(shù)據(jù)聚類的非調(diào)和式態(tài)勢估計方法。首先利用迭代自組織數(shù)據(jù)聚類方法(ISODATA)對多源沖突數(shù)據(jù)進行聚類,然后利用頻度和可信度對數(shù)據(jù)簇的重要性進行評估,最后得到態(tài)勢估計結(jié)果。仿真結(jié)果表明,與傳統(tǒng)態(tài)勢估計方法相比,所提方法在融合多源沖突數(shù)據(jù)時能夠得到可信度較高的態(tài)勢估計結(jié)果。
態(tài)勢估計,證據(jù)推理,沖突數(shù)據(jù)聚類
態(tài)勢估計[1]是在決策級上進行的一種推理行為,它接受一級融合的結(jié)果,并從中抽取對當(dāng)前軍事態(tài)勢盡可能準(zhǔn)確、完整的感知以逐步對敵方意圖和作戰(zhàn)計劃加以辨別,為指揮員決策提供直接的支持。由于態(tài)勢估計主要是對戰(zhàn)場上所收集的數(shù)據(jù)進行高層次關(guān)系特征的提取與處理,這個過程的實現(xiàn)需要系統(tǒng)具備學(xué)習(xí)人類專家推理的能力,導(dǎo)致它比一級融合處理問題更加復(fù)雜[2]。目前,應(yīng)用于態(tài)勢估計的主要方法有模糊推理[3-4]、貝葉斯網(wǎng)絡(luò)[5-8]、專家系統(tǒng)與知識推理[9]等,上述方法各自有其優(yōu)缺點。到現(xiàn)在為止,還沒有出現(xiàn)一套標(biāo)準(zhǔn)統(tǒng)一的處理態(tài)勢估計的方案和系統(tǒng)。
由于客觀存在的電磁干擾、性能不同的傳感器和復(fù)雜的戰(zhàn)場環(huán)境,導(dǎo)致態(tài)勢估計的方法需要具有高度不確定信息處理的能力。Dempster-shafer證據(jù)理論(以下簡稱D-S證據(jù)理論)[10]是一種經(jīng)典概率論的擴充形式,一方面它能夠解決由“不知道”引起的不確定性,另一方面能靈活處理知識模糊性引起的不確定性。因此,概率專家系統(tǒng)和態(tài)勢估計中廣泛使用D-S證據(jù)理論來處理此類問題[11]??紤]到D-S證據(jù)理論適合于解決高置信度、低沖突的情況,這一約束在態(tài)勢估計中有時很難滿足。
聚類分析[12]是在多元統(tǒng)計學(xué)中廣泛使用的方法,其核心思想是將數(shù)據(jù)相似度較高的分為一類,通過分類的手段達到分析各簇數(shù)據(jù)特征的目的。傳統(tǒng)沖突信息融合采用的調(diào)和式融合方法容易淹沒一些少量但關(guān)鍵的證據(jù)信息,通過對沖突證據(jù)信息聚類分簇后,不同相似度的證據(jù)會被分成不同的簇,從而有效利用了沖突證據(jù)中的少量重要信息[13-14]。
針對Dempster組合規(guī)則不能有效處理證據(jù)間的沖突問題,從而忽視了少量重要的態(tài)勢信息。本文在已有研究的基礎(chǔ)上,提出了一種基于聚類和證據(jù)理論共同處理戰(zhàn)場沖突數(shù)據(jù)的態(tài)勢估計方法。在原有證據(jù)的沖突系數(shù)k之上,引入Jousselme距離[15],綜合這兩個指標(biāo)衡量證據(jù)間的差異性。同時,利用迭代自組織數(shù)據(jù)分析聚類方法對不同相似度的證據(jù)進行聚類分組,利用頻度和可信度對數(shù)據(jù)簇進行重要性分析,最后得到態(tài)勢估計結(jié)果。
本文考慮在某段時間內(nèi)收集到多源沖突情報的戰(zhàn)術(shù)態(tài)勢估計問題,具體描述如下:
假定在t時刻,獲得的目標(biāo)集合為S,則:
其中,Pi=(i=1,2,…,n)為第i目標(biāo)的特征信息,可表示為一特征矢量:
本文的研究目標(biāo)是根據(jù)以上所獲得的證據(jù)信息,利用態(tài)勢估計的相關(guān)方法,得到可信度較高的態(tài)勢估計結(jié)果。
設(shè)Θ為一有限、獨立完備和互斥的非空集合,稱Θ為辨識框架,Θ的冪集空間可表示為2Θ。在該辨識框架下的基本信度分配函數(shù)(Basic Probability Assignment,BPA)m:2Θ→[0,1]需滿足以下的條件m(φ)=0,m(A)≥0和,m(A)代表證據(jù)對A的支持度。若m(A)>0,則稱A為m的焦元。定義對應(yīng)的信度函數(shù)(Bel)和似真函數(shù)(P1)為
設(shè)Bel1,Bel2,…,Beln是建立在同一辨識框架內(nèi)的信度函數(shù),且是分別與之相對應(yīng)的基本信度分配函數(shù),則
為解決在含有沖突證據(jù)情況下經(jīng)典D-S理論不能準(zhǔn)確推理出態(tài)勢意圖問題,提出了基于ISODATA聚類和D-S證據(jù)理論的態(tài)勢估計方法。核心思路為:①對所有態(tài)勢證據(jù)信息根據(jù)其相似度進行聚類,由于分類后的每個簇類內(nèi)部證據(jù)相似性較高,直接根據(jù)經(jīng)典D-S理論進行融合得到相應(yīng)的態(tài)勢結(jié)果;②各個簇類融合的態(tài)勢結(jié)果可能是互相矛盾的,將可能產(chǎn)生矛盾結(jié)果的證據(jù)根據(jù)不同的重要性評估后再進行融合。
3.1 證據(jù)相似性表征
為進一步反應(yīng)不同證據(jù)間的相似性,引入Jousselme等人定義的距離函數(shù)[15]。相關(guān)定義如下:
定義2Θ為一含N個兩兩各不相同命題完備的辨識框架,m1和m2是Θ上的兩個BPA,則m1和m2的距離表示為
考慮能影響證據(jù)相似度的不同因素,充分體現(xiàn)證據(jù)間的沖突性和非包容性,本文用兩個指標(biāo)共同衡量證據(jù)間的距離(相似度)。
式中,kij表示傳統(tǒng)沖突系數(shù)表示證據(jù)i和j之間的Jousselme距離。其中,0≤λ≤1,0≤μ≤1,λ+μ=1。
新的沖突證據(jù)表征公式考慮了造成證據(jù)間沖突的兩個因素,既能體現(xiàn)證據(jù)間的差異性,也能體現(xiàn)證據(jù)間非包容性。只有兩個因素都同時為零時,這兩個證據(jù)才不存在沖突;當(dāng)兩個因素同時都大時,兩個證據(jù)間沖突較大。所以改進的證據(jù)沖突評價函數(shù)避免了由單一指標(biāo)衡量所帶來的誤差。
相似度與沖突是相互對立的概念,兩個證據(jù)體相似度越高,它們的沖突就越低。定義mi,mj的相似度:
證據(jù)mi的支持度表示其他證據(jù)支持mi的程度,即
根據(jù)上述支持度,定義證據(jù)mi的絕對可信度
上式進行歸一化后得到相對可信度:
根據(jù)證據(jù)的絕對可信度,改正原始證據(jù)的模型:
3.2 多源沖突證據(jù)的聚類與合成
利用聚類分析對多源沖突證據(jù)進行相似性分類,對聚成一類的證據(jù)直接采用Dempster規(guī)則合成,然后利用頻度和可信度兩個指標(biāo)進行重要性評估,最后得到態(tài)勢估計結(jié)果。
3.2.1 ISODATA聚類算法描述
ISODATA與k均值算法有相同之處,但證據(jù)的聚類簇數(shù)事先未知,于是本文采用非監(jiān)督學(xué)習(xí)的動態(tài)聚類算法ISODATA,步驟如下:
Step 1:預(yù)置參數(shù)。設(shè)定初始參數(shù)。分類數(shù)預(yù)期為c;聚類的中心數(shù)Nc;為每類最小證據(jù)數(shù)θn取1;各聚類中心的最小距離若為θD;最多迭代I次;證據(jù)總數(shù)為N;證據(jù)維數(shù)為n。
Step 3:若類wj中證據(jù)數(shù)flag(j)<θn,則取消wj的中心zj,Nc=Nc-1,轉(zhuǎn)Step 2。
Step 4:計算每個證據(jù)類的中心
計算每個類中證據(jù)到該類中心的平均距離
計算每個證據(jù)到該類中心的平均距離總和
Step 5:根據(jù)已迭代次數(shù)Ip和Nc判斷,分裂、停止迭代或合并。
Step 6:每類證據(jù)到該中心平均距離的最大值。
Step 7:
Step 8:計算各個聚類中心之間的相互距離。
且Nc=Nc-1,Ip=Ip+1。當(dāng)滿足Ip=I,全部結(jié)束。
3.2.2 簇的信度評價
為保證聚類的準(zhǔn)確有效,按照簇內(nèi)證據(jù)相似度最大,簇間證據(jù)相似度最小的思想來評價聚類質(zhì)量。設(shè)n個多源沖突證據(jù)被分成c類,其中第j類中包含nj個證據(jù)。
定義簇內(nèi)距離準(zhǔn)則函數(shù)
定義簇間距離準(zhǔn)則函數(shù)
3.2.3 證據(jù)融合
首先對傳感器收集到的n個初始證據(jù)進行預(yù)處理,計算任意兩個證據(jù)之間的相似度Sim以及每個證據(jù)的可信度Crd。根據(jù)可信度對初始證據(jù)進行修正得到新的證據(jù)模型。然后對證據(jù)進行聚類(ISODATA算法),每一聚類中的證據(jù)相似度較大即證據(jù)間沖突較小,但不同的簇類證據(jù)之間沖突較大。對同一聚類簇內(nèi)的證據(jù)由Dempster規(guī)則進行融合,得到新的證據(jù),由于各個聚類合成后的證據(jù)之間一般相似度較小即沖突較大,不適合直接用Dempster規(guī)則進行合成。為解決這個問題,利用沖突證據(jù)中的重要信息,并根據(jù)不同的重要性采用文獻[22]的方法進行合成:
圖1 態(tài)勢估計流程圖
基于第2節(jié)和第3節(jié)的方法和結(jié)論,根據(jù)包含不同沖突程度證據(jù)的場景,采用經(jīng)典D-S證據(jù)理論方法和本文方法分別從2個初始證據(jù)的融合估計逐漸遞增到6個證據(jù)的融合估計實驗進行比較。具體場景如下:
仿真場景1:
假設(shè)某海域藍方艦隊在執(zhí)行偵查防御的任務(wù)時發(fā)現(xiàn)前方有紅方目標(biāo)靠近,要求藍方作戰(zhàn)指揮員根據(jù)采集到的傳感器情報證據(jù)信息對紅方的作戰(zhàn)意圖進行有效識別。假設(shè)根據(jù)領(lǐng)域?qū)<抑R得到紅方目標(biāo)的態(tài)勢類別可能為進攻(A)、防御(B)或撤退(C),即辨識框架Θ={A,B,C}。藍方傳感器反映紅方目標(biāo)運動的軌跡,不同的軌跡變化設(shè)為事件Ei,i=1,2,3…6。且相對應(yīng)的基本信度分配函數(shù)是mi。藍方6個獨立的傳感器所提供的證據(jù)如下:
圖2 基于D-S證據(jù)理論態(tài)勢估計結(jié)果
圖3 本文方法(沖突表征改進后)態(tài)勢估計結(jié)果
仿真場景2:
假設(shè)某海域藍方艦隊在執(zhí)行偵查防御的任務(wù)時發(fā)現(xiàn)前方有紅方目標(biāo)靠近,要求藍方作戰(zhàn)指揮員根據(jù)采集到的傳感器情報證據(jù)信息對紅方的作戰(zhàn)意圖進行有效識別。假設(shè)根據(jù)領(lǐng)域?qū)<抑R得到紅方目標(biāo)的態(tài)勢類別可能為進攻(A)、防御(B)或撤退(C),即辨識框架Θ={A,B,C}。藍方傳感器反映紅方目標(biāo)運動的軌跡,不同的軌跡變化設(shè)為事件Ei,i=1,2,3…6。且相對應(yīng)的基本信度分配函數(shù)是mi。藍方6個獨立的傳感器所提供的證據(jù)如下:
圖4 基于D-S證據(jù)理論態(tài)勢估計
圖5 本文方法(沖突表征改進后)態(tài)勢估計結(jié)果
在場景1中M3與其他的證據(jù)源存在沖突,當(dāng)對證據(jù)源應(yīng)用ISODATA算法進行聚類分析時,所有的證據(jù)源分裂為2類,即{M3}作為單獨一類,其他證據(jù)作為一類。從圖2可以看出,當(dāng)沖突證據(jù)出現(xiàn)時,基于D-S方法融合后的m(A)值變到幾乎為0,之后一直保持這個值,反應(yīng)過度敏感,出現(xiàn)了一票否決的現(xiàn)象。所以D-S方法不適合融合高沖突證據(jù),本文方法充分考慮不同沖突證據(jù)存在的情況,所得結(jié)果如圖3??梢钥闯瞿苊黠@地降低沖突證據(jù)對融合結(jié)果的影響,抗干擾能力較強,收斂速度快。
場景2中M2和M3與其他的證據(jù)源存在沖突,根據(jù)聚類算法將上述的證據(jù)分為兩類,即{M2,M3}作為單獨一類,其他證據(jù)作為一類。采用兩種不同的方法得到結(jié)果如圖4和圖5所示。僅從M1和M2兩證據(jù)融合來看,融合結(jié)果是撤退的。當(dāng)沖突證據(jù)M3出現(xiàn)時,直觀的融合結(jié)果應(yīng)當(dāng)也是撤退的。后續(xù)有支持進攻態(tài)的證據(jù)出現(xiàn),結(jié)果應(yīng)當(dāng)是進攻,而D-S證據(jù)理論沒能推理出此結(jié)果,本文方法得到了有效的結(jié)果。
本文針對在多源沖突證據(jù)的態(tài)勢估計中,直接應(yīng)用基于證據(jù)理論處理高沖突證據(jù)時,會得到反直覺的態(tài)勢估計結(jié)果。首先分析了沖突證據(jù)產(chǎn)生的主客觀原因和當(dāng)前對證據(jù)相似度衡量的指標(biāo)所在的不足,構(gòu)建了新的證據(jù)沖突表征公式;其次融合ISODATA聚類提出了多源沖突數(shù)據(jù)聚類的調(diào)和態(tài)勢估計算法。和傳統(tǒng)方法比較分析后,取得了可信度較高的態(tài)勢結(jié)果,解決了在沖突證據(jù)存在時融合所出現(xiàn)的反直覺現(xiàn)象。
[1]DAVID L H.An introduction to multisensor data fusion[C]// Proceedings of IEEE,1997.
[2]何友,王國宏,關(guān)欣.信息融合理論及應(yīng)用[M].北京:電子工業(yè)出版社,2010.
[3]權(quán)文,王曉丹,王堅,等.一種基于局部沖突分配的DST組合規(guī)則[J].電子學(xué)報,2012,40(9):1880-1884.
[4]熊彥銘,楊戰(zhàn)平,屈新芬.基于模型修正的沖突證據(jù)組合新方法[J].控制與決策,2011,26(6):883-887.
[5]彭冬亮,文成林,薛安克.多傳感器多源信息融合理論及應(yīng)用[M].北京:科學(xué)出版社,2010:183-229.
[6]李偉生,王寶樹.基于貝葉斯網(wǎng)絡(luò)的態(tài)勢評估[J].系統(tǒng)工程與電子技術(shù),2003,25(4):480-483.
[7]BLASCH E,DEZERT J,PANNETIERB.Overview of dempster-shafer and belief function tracking methods[J]. Signal Processing,Sensor Fusion and Target Recognition XXII,2013,8475(6):1-10.
[8]HUANG Y Q,PENG D L.A method of situation assessment based on ontology and bayesiannetwork[C]//2011 3rd IEEE International Conference on Information Management and Engineering 2011:179-182.
[9]韓德強,韓崇昭,鄧勇,等.基于證據(jù)方差的加權(quán)證據(jù)組合[J].電子學(xué)報,2011,39(3A):153-157.
[10]王連鋒,宋建社,朱昱,等.基于飛模糊聚類分析的證據(jù)組合[J].系統(tǒng)工程與電子技術(shù),2013,35(1):113-119.
[11]鄧勇,王棟,李齊,等.一種新的證據(jù)沖突分析方法[J].控制理論與應(yīng)用,2011,28(6):839-844.
[12]BIAN Z Q,ZHANG X G.Pattern recognition[M].Beijing: Tsinghua University Press,2000.
[13]XU L F,LI X R.Hybrid grid multiple-model estimation with application to maneuvering target tracking[C]//IEEE 13th Conference on Information Fusion,Edin-burgh,UK,July 26-29,2010:1-7.
[14]于紅娟,牛竹云,張春濤,等.基于變結(jié)構(gòu)多模型的機動目標(biāo)跟蹤算法[J].火力與指揮控制,2012,37(S1):36-39.
[15]JOUSSELME A L,GRENIER D,BOSSE E.A new distance berween two bodies of evidence[J].Information Fusion,2001(8):90-101.
Situation Assessment Method Based on Clustering of Multi Source Conflict Data
LI Long-shun,PENG Dong-liang,SHEN TU-han,XUE An-ke,LIU Jun
(Fundamental Science on Communication Information Transmission and Fusion Technology Laboratory,Key Lab for IOT and Information Fusion Technology of Zhejiang,Hangzhou Dianzi University,Hangzhou 310018,China)
The estimating results of traditional harmonic situation assessment methods will degrade when fusing multi-source conflict data.To this end,a new method of non-harmonic situation assessment is proposed based on conflicting data clustering in this paper.First,an iterative selforganizing data clustering method(ISODATA)is used to cluster the multi-source conflict data.Then,the importance of the data clusters is evaluated by its frequency and reliability.Finally the situation assessment results are achieved.The simulation results show that,compared with the traditional D-S evidences reasoning method,the proposed method can obtain higher confidence fusion results from multi-source conflict data.
situation assessment,evidences reasoning,conflict data,clustering
TP393
A
1002-0640(2017)04-0042-05
2016-02-24
2016-03-18
國家自然科學(xué)基金(61427808;61375078);國家“973”基金資助項目(2012CB821204)
李龍順(1989-),男,安徽六安人,研究生。研究方向:信息融合、信息處理。