李月武,劉長江,胡建旺,吉 兵
( 1.陸軍工程大學(xué)石家莊校區(qū),河北 石家莊 050000; 2.解放軍31697部隊(duì),遼寧 大連 116104)
數(shù)據(jù)融合技術(shù)越來越多地應(yīng)用于包括C4ISR系統(tǒng)和各種武器平臺在內(nèi)的軍事領(lǐng)域和許多民事領(lǐng)域[1]。但是對融合算法和系統(tǒng)性能的研究成果和應(yīng)用效果的評估國內(nèi)外研究都比較欠缺,主要原因是多傳感器信息融合的處理過程是多層次多級別的,融合系統(tǒng)所匯集和處理的信息種類繁多,信息源之間關(guān)系復(fù)雜,使得客觀、公正地評估融合系統(tǒng)成為該領(lǐng)域研究的重點(diǎn)和難點(diǎn)[2]。
目前針對分布式航跡融合系統(tǒng)的性能評估,雖然已有一些理論、方法研究及成果,但是針對不同的融合系統(tǒng)提出了不同的指標(biāo)體系以及不同的評估系統(tǒng),即使同一級別或?qū)哟?,也有不同的評估度量指標(biāo),尚未形成一套標(biāo)準(zhǔn)的分布式航跡融合系統(tǒng)性能評價(jià)指標(biāo)體系[3]。并且在目標(biāo)跟蹤與數(shù)據(jù)融合時(shí)可能出現(xiàn)虛警、丟點(diǎn)等情況,使得融合數(shù)據(jù)與真值數(shù)據(jù)無法一一對應(yīng)[4],常用的精度指標(biāo)位置均方根誤差(position root mean square error, PRMSE)、速度誤差、航向誤差[5]等無法正確評價(jià)融合精度,需要提出新的精度指標(biāo)對系統(tǒng)進(jìn)行評估。
針對目前分布式航跡融合系統(tǒng)尚未形成一套標(biāo)準(zhǔn)的性能評價(jià)指標(biāo)體系,以及常用精度指標(biāo)存在的問題,對分布式航跡融合系統(tǒng)評價(jià)指標(biāo)體系進(jìn)行優(yōu)化。
粗糙集理論是一種處理不精確、不確定和模糊知識的軟計(jì)算工具[6-7]。本文采用粗糙集理論對初步構(gòu)建的指標(biāo)體系其進(jìn)行約簡優(yōu)化,剔除冗余指標(biāo),并確定指標(biāo)權(quán)重。下面簡單介紹一下粗糙集理論、基于粗糙集等價(jià)關(guān)系的指標(biāo)篩選模型以及屬性重要性計(jì)算。
知識約簡(knowledge reduction)是粗糙集理論的核心問題之一。所謂知識約簡,就是在保持知識庫分類能力不變的條件下,刪除其中不相關(guān)或不重要的信息,包括屬性約簡和對象約簡(或規(guī)則約簡),以使知識表示簡化,下面介紹一下屬性約簡的基本概念。
1) 近似域
定義1 粗糙集就是論域U上的一個(gè)等價(jià)關(guān)系R,?A?U,A的上、下近似集分別為:
(1)
(2)
2) 知識表達(dá)系統(tǒng)
定義2 知識表達(dá)系統(tǒng),可以被看為一個(gè)關(guān)系數(shù)據(jù)表,它的形式化定義為:S=〈U,C,D,V,f〉,其中U為論域,C為條件屬性,D為決策屬性,C∪D=R是屬性集合(等價(jià)關(guān)系集合),V=∪a∈AVa是全體屬性集的集合,Va表示了屬性a∈A的值域,f:U×A→V是一個(gè)映射,它指定U中的每個(gè)對象x的屬性值,則這種數(shù)據(jù)表為稱為知識表達(dá)系統(tǒng)。
3) 不可分辨關(guān)系
定義3 設(shè)S=〈U,A〉為一信息表,B?A,定義B在U上的不可分辨關(guān)系(等價(jià)關(guān)系)IND(B)為:
(3)
4) 知識約簡
定義4 知識約簡:對于給定的信息系統(tǒng)S和S中的一個(gè)等價(jià)關(guān)系族P?S,?R∈P,若IND(P)=IND(P-{R})成立,則稱R為P中不必要的,否則就是必要的。
根據(jù)指標(biāo)體系的每一個(gè)指標(biāo),可以對評價(jià)對象進(jìn)行一種劃分,將評價(jià)對象劃分為多個(gè)等價(jià)類,或根據(jù)多個(gè)指標(biāo)所構(gòu)成的指標(biāo)集,得到一個(gè)等價(jià)關(guān)系。如式(3)所示,IND(R)即代表對應(yīng)著指標(biāo)集R的等價(jià)關(guān)系,對于
即等價(jià)關(guān)系IND(R)為所有其子集的等價(jià)關(guān)系的交集。
假定R是一個(gè)等價(jià)關(guān)系族,r∈R,若IND(R)=IND(R-{r}),則稱r在指標(biāo)集R中可被約去,為冗余指標(biāo),否則r為指標(biāo)集R中絕對必要的,不可約去。若對于?r∈R都是不可約去的,則稱R是獨(dú)立的等價(jià)關(guān)系族。若P=R-{r}是獨(dú)立的,則P是R的一個(gè)約簡,記為RED(R)。
基于粗糙集等價(jià)關(guān)系的指標(biāo)篩選模型如下所示:
步驟1 記指標(biāo)體系為C={ai},i=1,2,…,m,求IND(C);
步驟2 對i=1,2,…,m,依次求IND(C-{ai});
步驟3 若IND(C-{ai})=IND(C),則ai為指標(biāo)體系C中可以約簡的冗余指標(biāo);否則ai為不可約去的必要指標(biāo);
步驟4 得到篩選后的指標(biāo)體系為RED(C)={ak|ak∈C,IND(C-{ak})≠INC(C)}。
粗糙集中屬性重要性是指去掉某個(gè)指標(biāo)后對系統(tǒng)分類情況的影響大小,反映了各個(gè)指標(biāo)對整個(gè)指標(biāo)體系的重要性,因此根據(jù)屬性重要性可以得到指標(biāo)權(quán)重。若去掉該屬性相應(yīng)的分類變化比較大,則說明該屬性的重要性高,即指標(biāo)權(quán)重大;反之,說明屬性的重要性低,即指標(biāo)權(quán)重小[7]。
假定一個(gè)信息系統(tǒng)為S=(U,A,V,f),P?A,U/IND(P)={x1,x2,…,xn},知識P的信息量為:
(4)
式(4)中,|Xi|為Xi元素個(gè)數(shù)。指標(biāo)體系中不同指標(biāo)所反映的信息量的大小不同,則指標(biāo)r∈R在指標(biāo)體系R中的重要性為:
SigR-{r}(r)=I(R)-I(R-{r})
(5)
由式(5)可以看出,由R刪除r之后所引起的信息量變化的大小來表示指標(biāo)r在指標(biāo)體系R中的重要性。由此可得,若R={r1,r2,…,rn},則指標(biāo)r∈R的權(quán)重為:
(6)
通過粗糙集屬性重要性得出的指標(biāo)權(quán)重是以實(shí)驗(yàn)數(shù)據(jù)為依據(jù),對數(shù)據(jù)本身進(jìn)行挖掘,從而找出事物間的內(nèi)在規(guī)律,與層次分析法或?qū)<覒{經(jīng)驗(yàn)得出的權(quán)重相比,粗糙集屬性重要性得出的權(quán)重更具有客觀性,提高了評價(jià)結(jié)果的真實(shí)性。
融合系統(tǒng)評估整體狀況的客觀反映構(gòu)成了指標(biāo)體系,在進(jìn)行融合系統(tǒng)性能評估時(shí),依據(jù)不同的評估對象和評估目的,建立評價(jià)指標(biāo)體系,體系是否科學(xué)合理,決定了評估工作成功與否[8]。
目前構(gòu)建的指標(biāo)體系基本是基于專家咨詢或歷史經(jīng)驗(yàn)等方法,從不同研究角度建立相應(yīng)的指標(biāo)體系,并沒有理論方法去指導(dǎo)設(shè)計(jì)指標(biāo)體系,但大都依據(jù)全面性、客觀性、獨(dú)立性、層次性等原則。構(gòu)建指標(biāo)體系的步驟如圖1所示。
本文通過分析評估對象,發(fā)現(xiàn)常用評價(jià)指標(biāo)存在的問題,對指標(biāo)進(jìn)行優(yōu)化,提出新的指標(biāo),并根據(jù)已有文獻(xiàn)中指標(biāo)體系整理總結(jié)初步構(gòu)建指標(biāo)體系,然后基于粗糙集屬性約簡理論對指標(biāo)體系進(jìn)行篩選優(yōu)化,最終構(gòu)建一套較為完整、合理的分布式航跡融合指標(biāo)體系。
圖1 構(gòu)建指標(biāo)體系流程Fig.1 Build an indicator system process
2.1.1問題描述
常用的航跡融合精度指標(biāo)基本包括位置誤差、速度誤差、航向誤差等,計(jì)算方法基本是通過融合估計(jì)狀態(tài)與真值狀態(tài)進(jìn)行比較,求得均方根誤差。當(dāng)目標(biāo)狀態(tài)一一對應(yīng)時(shí),PRMSE指標(biāo)可以精確地反映融合系統(tǒng)的位置精度誤差,但是在目標(biāo)跟蹤和數(shù)據(jù)融合時(shí),由于環(huán)境變化、噪聲干擾等問題容易出現(xiàn)虛警、漏警、丟點(diǎn)和野值的情況,并且由于跟蹤中斷和雷達(dá)重新編批的情況,此時(shí)融合估計(jì)狀態(tài)與真值狀態(tài)很難一一對應(yīng),無法使用傳統(tǒng)的計(jì)算方法計(jì)算精度問題,常用的精度指標(biāo)便不能正常評價(jià)融合系統(tǒng)的性能,需要對精度指標(biāo)進(jìn)行改進(jìn),使得新精度指標(biāo)可以在任何情況下正確評價(jià)融合系統(tǒng)的精度問題。
當(dāng)目標(biāo)跟蹤估計(jì)位置和真實(shí)位置不能一一對應(yīng)時(shí),將融合估計(jì)結(jié)果和真實(shí)目標(biāo)狀態(tài)看成兩個(gè)集合進(jìn)行測量,通過測量兩個(gè)集合之間的差異來反映融合結(jié)果與真值之間的精度誤差,不僅考慮距離誤差,還考慮集合之間的勢誤差。測量集合距離的Hausdorff距離和Wasserstein距離[9]雖然可以度量兩個(gè)集合之間的差異,但是前者對集合勢誤差不敏感,后者對集合勢誤差過于敏感。文獻(xiàn)[10]提出的最優(yōu)子模型分配距離(optimal subpattern assignment, OSPA)有效地彌補(bǔ)了兩者缺點(diǎn),但是經(jīng)過實(shí)踐研究發(fā)現(xiàn)OSPA距離也存在一定的局限性:若一個(gè)集合為空集時(shí),另一個(gè)集合為非空集時(shí),OSPA計(jì)算距離無法區(qū)分不同非空集合之間的不同;若兩個(gè)集合距離誤差為0,但集合勢不同,當(dāng)max(m,n)→時(shí),OSPA距離為0,不能正確評價(jià)結(jié)果;對于虛警和漏警OSPA距離懲罰是不一樣的。
針對OSPA距離存在的局限性,文獻(xiàn)[11—12]提出了最佳基數(shù)線性分配(cardinalized optimal linear assignment,COLA)度量標(biāo)準(zhǔn),有效解決了OSPA度量標(biāo)準(zhǔn)的局限性,并證明了其有效性。但將COLA度量標(biāo)準(zhǔn)作為精度指標(biāo)還面臨一個(gè)問題,由于截止距離的存在,COLA指標(biāo)中的距離誤差總小于或等于1,無法正常評價(jià)距離誤差,本文對其做一定的改進(jìn),將改進(jìn)后的度量標(biāo)準(zhǔn)作為精度指標(biāo)評價(jià),可以有效評價(jià)融合系統(tǒng)的精度問題。
2.1.2精度指標(biāo)改進(jìn)
假設(shè)真實(shí)狀態(tài)估計(jì)和融合狀態(tài)估計(jì)兩個(gè)集合分別為X={x1,x2,…,xm}和Y={y1,y2,…,yn},則這兩個(gè)集合之間的COLA距離定義為[11-12]:
若n≥m,則:
(7)
若n≤m,則:
(8)
COLA度量標(biāo)準(zhǔn)有效彌補(bǔ)了OSPA距離作為評價(jià)指標(biāo)的不足之處:
1) 若一個(gè)集合為空集時(shí),另一個(gè)集合為非空集,元素個(gè)數(shù)為n時(shí),COLA計(jì)算距離為n1/p,可以有效測量不同非空集合的勢誤差;
2) 若兩個(gè)集合距離誤差為0,但集合勢不同,當(dāng)
max(m,n)→時(shí),COLA計(jì)算距離為(n-m),可以有效評價(jià)兩個(gè)集合之間的誤差;
相比OSPA度量標(biāo)準(zhǔn),COLA距離可以更加合理、準(zhǔn)確地計(jì)算兩個(gè)集合之間的差異,但是根據(jù)式(7)可以得:
(9)
由式(9)可以看出,其中距離誤差始終小于或等于1,無法正常評價(jià)距離誤差,因此本文將COLA距離改成如式(10)所示:
(10)
將改進(jìn)后的COLA指標(biāo)作為精度指標(biāo),若要評價(jià)位置誤差,X,Y分別為兩個(gè)狀態(tài)的位置向量;若要評價(jià)速度誤差,X,Y便為速度向量。融合COLA精度指標(biāo)不僅考慮狀態(tài)之間的距離誤差,還考慮之間的勢誤差,可以更加合理有效地評價(jià)系統(tǒng)的精度問題。
本文首先通過分析評估對象,發(fā)現(xiàn)已有指標(biāo)體系中精度指標(biāo)存在的問題,提出了新的精度指標(biāo),即融合COLA精度指標(biāo),然后根據(jù)已有文獻(xiàn)[5,8,13-17]所提出的指標(biāo)體系進(jìn)行經(jīng)驗(yàn)總結(jié),并根據(jù)分布式航跡融合系統(tǒng)的特點(diǎn)和指標(biāo)構(gòu)建原則,初步構(gòu)建指標(biāo)體系如圖2所示。
圖2 初步構(gòu)建指標(biāo)體系Fig.2 Preliminary construction of the index system
初建的指標(biāo)體系由兩級指標(biāo)構(gòu)成,5個(gè)一級指標(biāo),22個(gè)二級指標(biāo),分別從系統(tǒng)處理能力、融合COLA精度、目標(biāo)識別能力、航跡質(zhì)量以及航跡相關(guān)度五個(gè)方面對系統(tǒng)進(jìn)行性能評估,每個(gè)指標(biāo)的具體定義以及計(jì)算方法現(xiàn)有文獻(xiàn)已經(jīng)給出,這里便不再詳細(xì)介紹,重點(diǎn)研究指標(biāo)體系約簡。
由于指標(biāo)體系中指標(biāo)數(shù)量過多,使得評估計(jì)算過于繁瑣,因此本節(jié)通過對分布式航跡融合系統(tǒng)進(jìn)行仿真實(shí)驗(yàn),獲得實(shí)驗(yàn)數(shù)據(jù),根據(jù)粗糙集約簡理論對初步構(gòu)建的評價(jià)指標(biāo)體系進(jìn)行約簡,剔除冗余指標(biāo),完成指標(biāo)體系的構(gòu)建。
2.3.1實(shí)驗(yàn)條件
根據(jù)粗糙集屬性約簡理論,通過設(shè)計(jì)相同的劇情對7種不同分布式航跡融合系統(tǒng)進(jìn)行Monte Carlo實(shí)驗(yàn),獲得實(shí)驗(yàn)數(shù)據(jù),使用基于粗糙集等價(jià)關(guān)系的指標(biāo)篩選模型,對初步構(gòu)建的指標(biāo)體系進(jìn)行篩選優(yōu)化。實(shí)驗(yàn)數(shù)據(jù)如表1所示。
2.3.2實(shí)驗(yàn)結(jié)果
現(xiàn)以一級指標(biāo)航跡質(zhì)量為例進(jìn)行指標(biāo)約簡。此評估指標(biāo)體系中,各屬性均為條件屬性,不包含決策屬性,因此是一個(gè)非決策系統(tǒng),指標(biāo)體系中各個(gè)指標(biāo)屬性值都是連續(xù)性屬性,因此需要對指標(biāo)數(shù)值進(jìn)行離散化處理,以各屬性的中間值為閾值對指標(biāo)進(jìn)行離散化,然后根據(jù)基于粗糙集等價(jià)關(guān)系的指標(biāo)篩選模型進(jìn)行指標(biāo)約簡,步驟如下:
1) 記指標(biāo)體系C4={C41,C42,C43,C44,C45},論域U={U1,U2,U3,U4,U5,U6,U7},求得IND(C4)={{U1,U6},U2,U3,U4,U5,U7};
2) 依次求得:
IND(C4-C41)={{U1,U6},{U2,U4},U3,U5,U7},
IND(C4-C42)={{U1,U6},U2,U3,U4,U5,U7},
IND(C4-C43)={{U1,U6},U2,U3,{U4,U5},U7},
IND(C4-C44)={{U1,U3,U6},U2,{U4,U7},U5},IND(C4-C45)={{U1,U6},U2,U3,U4,U5,U7};
3) 由步驟2)求得的結(jié)果可知,IND(C4-C42)=IND(C4-C45)=IND(C4),則C42和C45為指標(biāo)體系C中可以約簡的冗余指標(biāo);
同理使用此模型對其他一級指標(biāo)進(jìn)行約簡,可得其他一級指標(biāo)的約簡結(jié)果為:
則約簡后的指標(biāo)體系由5個(gè)一級指標(biāo)和15個(gè)二級指標(biāo)構(gòu)成,指標(biāo)體系如圖3所示。
圖3 融合系統(tǒng)性能評估指標(biāo)體系Fig.3 Fusion system performance evaluation index system
由于粗糙集屬性重要性得出的權(quán)重更具有客觀性,因此使用指標(biāo)屬性重要性對指標(biāo)權(quán)重進(jìn)行賦值,實(shí)現(xiàn)系統(tǒng)的綜合評估。
以約簡前的一級指標(biāo)為例,對其二級指標(biāo)進(jìn)行權(quán)重計(jì)算。假定信息系統(tǒng)為S=(U,C4,V,f),步驟如下:
1) 首先計(jì)算指標(biāo)的不可分辨關(guān)系,則
U/IND(C4)={{U1,U6},U2,U3,U4,U5,U7},
U/IND(C4-C41)={{U1,U6},{U2,U4},{U3,U5},U7},
U/IND(C4-C42)={{U1,U6},U2,U3,U4,U5,U7},
U/IND(C4-C43)={{U1,U6},{U2,U3},{U4,U5},U7},
U/IND(C4-C44)={{U1,U3,U6},{U4,U7},U2,U5},
U/IND(C4-C45)={{U1,U6},U2,U3,U4,U5,U7}。
2) 由式(4)計(jì)算指標(biāo)體系中各個(gè)指標(biāo)的信息量,I(C4)=40/49,I(C4-C41)=36/49,I(C4-C42)=40/49,I(C4-C43)=36/49,I(C4-C44)=34/49,I(C4-C45)=40/49;
3) 由式(5)計(jì)算各二級指標(biāo)在一級指標(biāo)航跡質(zhì)量中的重要性,則sigC4-C41(C41)=4/49,sigC4-C42(C42)=0,sigC4-C43(C43)=4/49,sigC4-C44(C44)=6/49,sigC4-C45(C45)=0;
4) 由式(6)計(jì)算航跡質(zhì)量指標(biāo)中各二級指標(biāo)的權(quán)重,為:w41=0.285 7,w42=0,w43=0.285 7,w44=0.428 6,w45=0 。
則約簡前的航跡質(zhì)量指標(biāo)中二級指標(biāo)的權(quán)重分別為w4=[0.285 7,0,0.285 7,0.428 6,0],同理,根據(jù)粗糙集屬性重要性得其他一級指標(biāo)中二級指標(biāo)的權(quán)重分別為w1=[0.263 1,0.315 8,0,0.421 1],w2=[0.2,0.2,0.4,0.2],w3=[0.25,0.25,0.25,0.25],w5=[0.5,0.5,0,0,0]。
本實(shí)驗(yàn)通過設(shè)計(jì)劇情,使用本文構(gòu)建的指標(biāo)體系對甲乙兩個(gè)分布式航跡融合系統(tǒng)進(jìn)行Monte Carlo測試求得指標(biāo)均值,并采用本文根據(jù)屬性重要性計(jì)算的權(quán)重對兩個(gè)系統(tǒng)進(jìn)行綜合評估,驗(yàn)證指標(biāo)體系的有效性,其中甲融合系統(tǒng)最多處理100批目標(biāo),乙融合系統(tǒng)最多處理60批目標(biāo)。
假設(shè)有10批目標(biāo)勻速直線運(yùn)動(dòng),目標(biāo)均以vx=100 m/s,vy=0 m/s的速度平行勻速直線運(yùn)動(dòng),初值狀態(tài)橫坐標(biāo)均為1 000 m,縱坐標(biāo)分別為[1 000,2 000,3 000,4 000,5 000,6 000,7 000,8 000,9 000,1 000] m,目標(biāo)軌跡如圖4所示。
經(jīng)對甲乙兩個(gè)系統(tǒng)進(jìn)行Monte Carlo測試后,得到的實(shí)驗(yàn)數(shù)據(jù)如表2所示。
圖4 目標(biāo)軌跡Fig.4 The target tracks
表2 實(shí)驗(yàn)數(shù)據(jù)2
本節(jié)根據(jù)上小節(jié)由屬性重要性得出較為客觀的指標(biāo)權(quán)重系統(tǒng)進(jìn)行綜合評價(jià)。
1) 計(jì)算各融合系統(tǒng)的指標(biāo)歸一化得分。根據(jù)指標(biāo)越小越優(yōu)型與越大越優(yōu)型計(jì)算方法計(jì)算各指標(biāo)得分S,計(jì)算方法參考文獻(xiàn)[18],結(jié)果為:
S1=[1,0.2,0.76,0.51,0.37,0.14,0.5,0.31,0.24,0.49,0.58,0.1,0.24,0.1,0.38,0.45];
S2=[0,0.3,0.7,0.78,0.53,0.5,0.4,0.57,0.58,0.45,0.54,0.55,0.46,0.45,0.41,0.46]。
2) 計(jì)算指標(biāo)權(quán)重。為簡便起見視一級指標(biāo)同等重要,即w=[0.2,0.2,0.2,0.2,0.2],則每個(gè)二級指標(biāo)對分布式航跡融合系統(tǒng)的權(quán)重為[0.052 6,0.063 2,0.084 2,0.04,0.04,0.08,0.04,0.05,0.05,0.05,0.05,0.057 1,0.057 1,0.085 7,0.1,0.1]。
3) 綜合評估。根據(jù)步驟1)和步驟2)計(jì)算的指標(biāo)歸一化得分和指標(biāo)權(quán)重,綜合評估得分E分別為:E1=0.387 6,E2=0.476 5,則根據(jù)評估值得出優(yōu)劣次序?yàn)榧仔∮谝?,則乙分布式航跡融合系統(tǒng)得分最高,綜合性能最好。
通過仿真實(shí)驗(yàn)與評估計(jì)算表明,約簡的評價(jià)指標(biāo)體系可以客觀、全面、有效地對分布式航跡融合系統(tǒng)進(jìn)行評價(jià),具有較強(qiáng)的適用性。
本文對分布式航跡融合系統(tǒng)指標(biāo)體系進(jìn)行優(yōu)化,使用最佳基數(shù)線性分配度量標(biāo)準(zhǔn)代替原有的精度指標(biāo),對精度指標(biāo)進(jìn)行優(yōu)化,提出了融合COLA精度指標(biāo),并通過分析評估對象,依據(jù)構(gòu)建原則初步構(gòu)建評價(jià)指標(biāo)體系,然后通過仿真實(shí)驗(yàn)獲得的實(shí)驗(yàn)數(shù)據(jù)和粗糙集屬性約簡的性質(zhì)對指標(biāo)體系進(jìn)行篩選,最終構(gòu)建了一套較為完整、客觀公正的評價(jià)指標(biāo)體系。仿真實(shí)驗(yàn)結(jié)果表明,優(yōu)化后的指標(biāo)體系可以有效以及更加適用地評價(jià)分布式航跡融合系統(tǒng)性能。