宋香鵬,肖建于,吳克鳳,伏明蘭
(淮北師范大學 計算機科學與技術學院,安徽 淮北 235000)
證據(jù)理論由Dempster提出[1],之后其學生Shefer在原有的基礎上進一步補充擴展,并在《證據(jù)的數(shù)學理論》(A Mathematical Theory of Evidence)中將證據(jù)理論的思想推廣開來,證據(jù)理論也因此被眾多學者探討研究,所以又被稱為D-S證據(jù)理論[2].近些年,信息融合研究領域備受關注.是因為研究傳感器信息融合可以更好地利用傳感器資源,并且通過對多源信息的組合與優(yōu)化,可以推導出更多的有效信息.而D-S證據(jù)理論就是在解決多源信息不確定性度量上更接近人的思維習慣,并且推理機制相對簡便.被廣泛應用到軍事指揮[3]、信號處理[4]、狀態(tài)識別[5-6]、故障診斷、采礦冶金、智能決策、情感識別等領域.
為解決沖突證據(jù)的合成問題,國內外學者提出了許多方法來解決此類問題.較早時期的Lefevre等[7]提出將全局沖突按照相應的比例重新分配的統(tǒng)一信度函數(shù)組合方法,但是當證據(jù)高度沖突時,風險系數(shù)無法計算.Sun等[8]提出利用平均化沖突系數(shù)對證據(jù)體的權重進行優(yōu)化分配,然后根據(jù)改進的合成規(guī)則進行計算,與實際聯(lián)系存在一定的不足.張歡等[9]提出結合皮爾遜相關系數(shù)來修改證據(jù)體權重和BPA中零因子的修正,但是皮爾遜相關系數(shù)在只有一個重疊項時,無法滿足數(shù)學規(guī)則.其實,研究人員對改進沖突證據(jù)的組合方法大體上分為兩種,一種是對原始證據(jù)源的修正,另一種是對組合規(guī)則框架修改.對原始證據(jù)源修正這種方法雖然保留了D-S證據(jù)理論的優(yōu)良數(shù)學性質,但是卻忽略了證據(jù)體間的相關性;對組合規(guī)則框架修改這種方法可以很好地處理證據(jù)融合,但是在實際運用中卻存在著一定的局限性.
本文首先具體分析了D-S證據(jù)理論的基本性質及其無法解決的悖論問題,總結出沖突問題的產生是因為在證據(jù)合成時,無法將交集為空的焦元的信任函數(shù)處理恰當.在實際多傳感系統(tǒng)中,考慮到各傳感器得到的證據(jù)存在著相關關系.本文提出一種結合斯皮爾曼等級相關系數(shù)的證據(jù)合成方法,首先計算出證據(jù)之間的相關系數(shù)并且得到相關性矩陣,通過相關性矩陣構造修正系數(shù)來折扣基本可信度分配函數(shù),較大程度上減少分配整體非相關證據(jù)體的權重.最后,利用改進的D-S證據(jù)理論組合規(guī)則對修正后的證據(jù)進行合成計算.
識別框架:設Θ為識別框架,且識別框架Θ中各個元素互相獨立,其中識別框架Θ的所有子集組成的集合稱為Θ的冪集,常用2Θ表示,它的元素個數(shù)記為2|Θ|.
基本概率分布:其中基本信任分配函數(shù)m表示是從一個集合2Θ到[0,1]的映射,A表示識別框架Θ的任一子集,記作A?Θ,滿足以下條件[10]:
(1)
組合規(guī)則:設m1,m2,…,mn是同一個識別框架Θ下的n個基本信任分配函數(shù),其中焦元表示為Ai(i=1,2,…,N),則D-S的合成規(guī)則為[10]:
(2)
在所有研究改進的D-S證據(jù)理論合成規(guī)則的前提條件下,須滿足以下四個基本性質[11]:
性質1 交換律
m1⊕m2=m2⊕m1.
(3)
滿足交換律的意義是當證據(jù)合成時,合成計算得到的結果并不會因為證據(jù)排列順序變化而變化.
性質2 結合律
m1⊕m2⊕m3=(m1⊕m2)⊕m3=m1⊕(m2⊕m3).
(4)
滿足結合律的意義是當多組證據(jù)合成時,可以任意組合證據(jù)的合成且每個證據(jù)的參與合成順序不影響合成的結果.
性質3 極化性
極化性的意義是假設在m元素識別框架下n個相同證據(jù)合成后,單元素焦元總的信任分配值增加,m元素焦元的信任分配值減小,且m越大越明顯.
性質4 魯棒性
魯棒性是指在多個證據(jù)合成時,基本信任分配函數(shù)的變化引起合成結果變化的幅度,其中這變化幅度即是魯棒性的量化體現(xiàn)[12].
因為信息具有多源和復雜的特點,所以在D-S證據(jù)理論合成時出現(xiàn)多種沖突證據(jù)合成的負面問題[13],主要有分為以下四類.
1) “一票否決”問題:證據(jù)合成時,若其中某條證據(jù)與其他證據(jù)完全不一致時,則此條完全不一致的證據(jù)會完全否定合成結果,即出現(xiàn)一票否決的結果.
2) “證據(jù)失效”問題:即證據(jù)體在合成中不起作用.
3) “置信沖突”問題:在證據(jù)的信任函數(shù)嚴重矛盾時,會導致不合情理的結果出現(xiàn).
4) “魯棒性”問題:得到的合成結果會因為焦元的基本信任函數(shù)發(fā)生微小變化而產生較大的變化.
例1 完全沖突,多傳感器系統(tǒng)收集的多個證據(jù),得到的焦元如表1所示.
表1 完全沖突證據(jù)的BPATab.1 BPA of complete conflict evidence
完全沖突:此識別框架下,計算出沖突系數(shù)K=1,但是在D-S證據(jù)理論合成公式中分母為0,不滿足數(shù)學規(guī)則,故此現(xiàn)象稱為完全沖突,完全沖突下會造成信息的損失.
例2 0信任沖突,多傳感器系統(tǒng)收集的多個證據(jù),得到的焦元如表2所示.
表2 信任沖突證據(jù)的BPATab.2 BPA without trust evidence of conflict
0信任沖突:此識別框架下,計算出K=0.955,雖然m1和m3都支持A,但是m2(A)=0,完全否定了A,合成的結果為0,導致融合失敗,出現(xiàn)一票否決的問題,傳感器系統(tǒng)中則會因為少數(shù)傳感器檢測結果異常,導致整個系統(tǒng)無法正常運轉.
例3 1信任沖突,多傳感器系統(tǒng)收集的多個證據(jù),得到的焦元如表3所示.
表3 1信任沖突證據(jù)的BPATab.3 BPA of absolute trust conflict evidence
1信任沖突:此識別框架下,計算出K=0.999,合成后的結果為m(B)=1,但是給出的三個證據(jù)對B的支持很小,顯然違背常理,產生置信沖突問題,傳感器系統(tǒng)中則會因為對低支持度的信息產生過多信任,導致整個傳感系統(tǒng)準確性降低.
例4 沖突系數(shù)失效,多傳感器系統(tǒng)收集的多個證據(jù),得到的焦元如表4所示.
表4 沖突系數(shù)失效的BPATab.4 BPA with conflict coefficient failure
沖突系數(shù)失效:此識別框架下,計算出K=0.882,表明證據(jù)是高度沖突的,但是這是三個完全相同的證據(jù).造成沖突系數(shù)K失效,不能很好的描述此種識別框架下的關系.
斯皮爾曼等級相關系數(shù)(Spearman’s rank correlation coefficient)又稱為秩相關系數(shù),用希臘字母ρ表示.此相關系數(shù)是衡量統(tǒng)計變量X,Y的依賴性的非參數(shù)指標(衡量分級定序變量間的相關程度),并且還可以通過利用單調方程來具體量化統(tǒng)計變量間的相關性.其中ρ的取值范圍是[-1,1],ρ的公式為:
(5)
di=xi-yi,1≤i≤n.
(6)
兩個統(tǒng)計變量X,Y(或者是兩個集合),它們的元素個數(shù)均為n,兩個統(tǒng)計變量取的第i個值分別用Xi、Yi表示,其中i的取值范圍是1≤i≤n.對X,Y進行排序,得到兩個元素排行集合x、y,其中元素xi、yi分別為Xi在X中的排行以及Yi在Y中的排行.di即為元素間的排行差.
設m1,m2,…,mn是同一識別框架Θ下的n個基本信任分配函數(shù),焦元分別為Ai(i=1,2,…,N).對mi按照mi(Ak)從大到小排序,其中降序序列中的每個mi(Ak)在原始序列中的位序標記為ri(Ak);對mj按照mj(Ak)從大到小排序,其中降序序列中的每個mj(Ak)在原始序列中的位序標記為rj(Ak).若m(Ak)中有值相同的數(shù)據(jù),則其位序值取相同數(shù)據(jù)在降序序列位序的平均值.將mi,mj看作成統(tǒng)計變量中的X,Y.故其秩次差為:
dk=rj(Ak)-ri(Ak).
(7)
則mi與mj的斯皮爾曼等級相關系數(shù)即為:
(8)
利用式(7)和式(8)計算出各個證據(jù)體間的斯皮爾曼等級相關性系數(shù),然后構造證據(jù)相關性矩陣Simij,即為:
其中ρmimj為證據(jù)體mi與mj的斯皮爾曼等級相關系數(shù)(1≤i≤n,1≤j≤n).
由于斯皮爾曼等級相關系數(shù)的計算僅使用了數(shù)據(jù)的秩值,并未使用原始數(shù)據(jù),故可將相關系數(shù)結果ρ小于等于0的賦值為0.001,以控制非正相關的證據(jù)體在識別框架中的可信度和權重占比計算,從而降低非正相關的證據(jù)體對于整體識別框架的基本概率分布的影響,同時可以克服組合規(guī)則中的置信問題.
(9)
在2.2中通過計算斯皮爾曼等級相關系數(shù)得到相關性矩陣,并且優(yōu)化ρ的取值,計算得到修正系數(shù)cre.現(xiàn)將得到的修正系數(shù)cre對原始的基本可信度分配函數(shù)進行修正.公式如下:
mi′(Ai)=cre(mi)×mi,
(10)
mi′(Θ)=cre(mi)×mi(Θ)+(1-cre(mi)).
(11)
最后,利用D-S證據(jù)理論的組合規(guī)則進行合成,計算出融合結果.歸納總結,本文的算法步驟如下.
1)利用公式(7)和(8)計算出證據(jù)體m1,m2,…,mn間的相關系數(shù)ρmimj.
2)根據(jù)計算出的相關系數(shù)得到證據(jù)相關性矩陣:
3)將相關性矩陣中相關性值小于等于0的值賦值為0.001.
4)利用式(9)計算出歸一化后的修正系數(shù)cre(mi).
5)利用式(10)和式(11)計算出修正后的基本可信分配函數(shù)mi′(Ai).
6)根據(jù)D-S證據(jù)理論合成規(guī)則計算,得到融合結果.
例5 某傳感系統(tǒng)中的識別框架下,給出的命題P={{A},{B},{C},{D}},相應的證據(jù)體如表5.
表5 基本算例Tab.5 Basic example
計算的詳細步驟如下所示.根據(jù)式(7)和式(8)計算證據(jù)體之間的斯皮爾曼等級相關系數(shù).首先計算m1和m2的斯皮爾曼等級相關系數(shù)如表6.
表6 證據(jù)體間的斯皮爾曼等級相關系數(shù)Tab.6 Spearman rank correlation coefficient between evidence bodies
由表6可知秩次差平方將其代入式(8),計算出m1和m2的斯皮爾曼等級相關系數(shù)為:
依次類推,分別計算出證據(jù)體間的相關系數(shù).得到的相關性矩陣為:
將相關性矩陣中相關性值小于等于0的值賦值為0.001,得到的新矩陣為:
計算修正向量為:
將其進行歸一化處理:
由式(10)和式(11)得到修正后的基本可信度分配函數(shù)為:
P′={{A′},{B′},{C′},{D′}},
m′={0.523 0,0.188 2,0.157 1,0.131 7}.
最后利用D-S證據(jù)理論的組合規(guī)則計算出最終結果為:
P={{A},{B},{C},{D}},
m={0.971 4,0.016 9,0.007 8,0.003 9}.
本章節(jié)利用傳感系統(tǒng)中經典的算例,通過對比分析結果,表明本文提出的改進算法在解決沖突證據(jù)時符合客觀實際,并且有良好的收斂性和魯棒性.
經典算例如表7所示.不同算法對此經典算例的計算結果如表8所示.
表7 經典算例Tab.7 Classical example
表8 不同算法對不同數(shù)量證據(jù)體的融合結果Tab.8 The fusion results of different algorithms on different numbers of evidence bodies
通過結合D-S證據(jù)理論基本性質以及實驗對比分析,得到的結論如下:
傳統(tǒng)的D-S證據(jù)理論合成方法,其缺陷就是無法合成高沖突的證據(jù).當高沖突證據(jù)合成時,其中此條高沖突證據(jù)會完全否定合成結果,即出現(xiàn)“一票否決”的結果.
Yager[14]合成方法,此方法是把存在的沖突證據(jù)部分分配給識別框架全集,但是隨著證據(jù)體數(shù)目增加,m(Θ)也逐漸增加,造成合成的結果不確定性增加,無法有效的辨識出目標結果.
胡昌華等[15]提出的基于修改證據(jù)的權重系數(shù)處理證據(jù)沖突,雖然收斂速度較快,但是當證據(jù)體數(shù)目逐漸增加時,該方法的目標辨識率僅達到80.07%,顯然合成結果的準確性并不優(yōu)良.
鄧勇等[16]提出的處理沖突證據(jù)的方法,雖然結果符合常理,但是與本文算法進行比較,明顯得出此方法準確性不高.
孟晨晨等[17]提出可信度和虛假度兩個概念,并且引入證據(jù)間的距離公式,得到修正系數(shù).通過折扣轉換計算出合成結果,該方法能很好保護D-S證據(jù)理論優(yōu)良的數(shù)學特性.但是其收斂速度并不理想,與本文提出的算法相比,本文方法的收斂性更好,收斂速度更快,并且目標辨識率提高到了91.08%,證據(jù)數(shù)目不斷增加,本文的辨識率越高.
張歡等[9]提出的基于皮爾遜相關系數(shù)的改進D-S證據(jù)理論方法,在證據(jù)數(shù)目為3時,本文的目標辨識率達到了79.24%,在證據(jù)數(shù)目增加時,張歡提出的改進算法得到的效果最好,但是其忽略了皮爾遜相關系數(shù)的限制條件.皮爾遜相關系數(shù)的限制條件數(shù)據(jù)必須是連續(xù)數(shù)據(jù),并且分布方式為高斯分布才能使用此相關系數(shù).在例4中運用此方法是無效的,因為皮爾遜相關系數(shù)無法計算此類證據(jù)體,分母為0是其核心矛盾點.在與本文算法對比可知,本文算法適用性更廣,對證據(jù)體的要求沒有文獻[9]中嚴格.
在3組對比實驗中,本文提出的利用斯皮爾曼相關系數(shù)構造的修正系數(shù)算法得到m(A)的融合結果普遍高于其他學者改進的算法如圖1所示;伴隨著證據(jù)體數(shù)量增加,此方法表現(xiàn)出更高的合理命題信任度.并且在證據(jù)量較少時,本文算法有著很高的目標辨識率.
其中此實驗對焦元B和C合成結果變化趨勢如圖2、圖3所示.
圖3 不同算法對不同數(shù)量證據(jù)體下焦元C 合成結果的變化趨勢Fig.3 The trend of different algorithms to the results of coke C synthesis in different numbers of evidence bodies
本文通過利用斯皮爾曼相關系數(shù)求出證據(jù)體間的相關性矩陣,將相關性矩陣中相關性值小于等于0的值進行優(yōu)化賦值,然后構造修正系數(shù)來修正證據(jù)間的沖突.最后,利用D-S證據(jù)理論組合規(guī)則對修正后的證據(jù)進行合成.通過實驗對比分析,得到該算法特點如下:
引入統(tǒng)計學三大相關系數(shù)之一的斯皮爾曼等級相關系數(shù)來計算證據(jù)體間的相關性,有效簡化了構造距離公式的過程,收斂速度更快.
通過利用相關性矩陣構造的修正系數(shù),合理優(yōu)化折扣基本可信度分配函數(shù),同時可以克服組合規(guī)則中存在的置信問題,提高了目標辨識的準確性.
在處理高度沖突證據(jù)時,該算法在低數(shù)量的證據(jù)下,對目標辨識率很高,伴隨著證據(jù)量的增加,本文算法較其他算法有一定的提高,并且在應用范圍上更加廣泛,能夠處理不同數(shù)學分布的證據(jù)體.