張 堃, 張振沖, 劉澤坤, 李 珂, 劉培培
(1. 西北工業(yè)大學(xué)電子信息學(xué)院, 陜西 西安 710072; 2. 光電控制技術(shù)重點(diǎn)實(shí)驗(yàn)室, 河南 洛陽(yáng) 471000)
當(dāng)今航空科技發(fā)展迅速,作戰(zhàn)過程的系統(tǒng)化、協(xié)同化、智能化程度逐步提高。在高動(dòng)態(tài)空戰(zhàn)場(chǎng)景中,準(zhǔn)確把握敵我態(tài)勢(shì)信息,有針對(duì)性地作出合理的指揮決策,有利于我方占據(jù)空戰(zhàn)優(yōu)勢(shì)地位,提高對(duì)抗生存率和成功率[1]。空戰(zhàn)過程中的多目標(biāo)威脅評(píng)估作為指揮、決策、控制系統(tǒng)的核心組成單元,具有非常重要的應(yīng)用價(jià)值和軍事意義,長(zhǎng)期被國(guó)內(nèi)外相關(guān)機(jī)構(gòu)進(jìn)行重點(diǎn)研究。傳統(tǒng)的空戰(zhàn)目標(biāo)威脅評(píng)估方法有層次分析法(analytic hierarchy process,AHP)[2-3],貝葉斯網(wǎng)絡(luò)法[4-7],逼近理想排序法[8-11]、改進(jìn)多準(zhǔn)則排序法[12-14]等,但上述方法均未考慮到空戰(zhàn)態(tài)勢(shì)信息變化帶來的影響。基于此,有學(xué)者提出了動(dòng)態(tài)逼近理想排序法[15],動(dòng)態(tài)改進(jìn)多準(zhǔn)則排序法[16],直覺模糊多屬性決策法[17]等,但是這些方法并未考慮到空戰(zhàn)態(tài)勢(shì)信息的不完全性。在評(píng)估與決策領(lǐng)域,有學(xué)者將算法與直覺模糊數(shù)[18]或三角模糊數(shù)[19]進(jìn)行了關(guān)聯(lián),但是并未考慮到由信息復(fù)雜多變導(dǎo)致的信息模糊多樣性,即難以解決多種數(shù)據(jù)類型同時(shí)存在的情況。另外,現(xiàn)有的威脅評(píng)估方法主要基于客觀態(tài)勢(shì)數(shù)據(jù)進(jìn)行處理,難以體現(xiàn)決策者個(gè)體行為差異的影響。針對(duì)上述問題,本文在交互式多準(zhǔn)則決策法(interactive multi-criteria decision-making,TODIM)[20-23]的基礎(chǔ)上,針對(duì)空戰(zhàn)過程中多目標(biāo)威脅評(píng)估問題中存在的“狀態(tài)失衡”現(xiàn)象,結(jié)合變權(quán)理論建立空戰(zhàn)態(tài)勢(shì)多屬性權(quán)重解算模型,對(duì)目標(biāo)屬性的權(quán)重進(jìn)行了二次優(yōu)化,考慮敵我態(tài)勢(shì)的時(shí)變性,結(jié)合基于正態(tài)累積分布生成時(shí)間序列權(quán)重的算法對(duì)多時(shí)刻態(tài)勢(shì)信息進(jìn)行了處理;進(jìn)一步考慮空戰(zhàn)態(tài)勢(shì)信息的模糊多樣性,建立了基于模糊動(dòng)態(tài)交互式多準(zhǔn)則決策(fuzzy dynamic interactive multi-criteria decision-making,FD-TODIM)算法的混雜空戰(zhàn)多目標(biāo)威脅評(píng)估模型,綜合考慮混雜態(tài)勢(shì)信息,提高了評(píng)估結(jié)果的真實(shí)性和合理性。
在空戰(zhàn)目標(biāo)威脅評(píng)估中,若僅僅基于傳統(tǒng)常權(quán)進(jìn)行分析,會(huì)出現(xiàn)與實(shí)際問題相悖的不合理結(jié)果,即“狀態(tài)失衡”問題,變權(quán)理論可依據(jù)屬性值動(dòng)態(tài)調(diào)整其權(quán)重[24-25]。采用變權(quán)思想不僅能夠考慮目標(biāo)各個(gè)屬性的相對(duì)重要程度,也能均衡狀態(tài),緩解傳統(tǒng)常權(quán)“狀態(tài)失衡”的問題。在對(duì)敵方目標(biāo)與我方的空戰(zhàn)過程進(jìn)行分析時(shí),目標(biāo)某一屬性較小會(huì)導(dǎo)致此屬性權(quán)重較大,并造成此目標(biāo)對(duì)我方的威脅度整體較低;反之,若目標(biāo)某一屬性較大,會(huì)造成此屬性權(quán)重較小,也會(huì)導(dǎo)致此目標(biāo)對(duì)我方威脅度整體較高。因此,需要依據(jù)目標(biāo)屬性值對(duì)權(quán)重進(jìn)行優(yōu)化調(diào)整[26],分別對(duì)屬性值較低的高權(quán)和屬性值較高的低權(quán)進(jìn)行懲罰和激勵(lì)。獨(dú)立分析各個(gè)目標(biāo)的威脅程度,發(fā)現(xiàn)較高的屬性值造成的影響比較低的屬性值造成的影響大,故懲罰力度應(yīng)大于激勵(lì)力度?;诖?建立變權(quán)權(quán)重解算模型如下:
Wtk(Y)=
(1)
(2)
空戰(zhàn)態(tài)勢(shì)環(huán)境會(huì)隨著時(shí)間動(dòng)態(tài)變化,通過機(jī)載傳感器所采集的空戰(zhàn)態(tài)勢(shì)信息同樣也會(huì)發(fā)生相應(yīng)的變化,威脅評(píng)估的結(jié)果受當(dāng)前時(shí)刻空戰(zhàn)態(tài)勢(shì)信息的影響是最大的,越接近當(dāng)前時(shí)刻的態(tài)勢(shì)數(shù)據(jù)越為重要,但是僅僅依靠當(dāng)前時(shí)刻的數(shù)據(jù)進(jìn)行評(píng)估決策,忽略歷史信息的隱含影響,將會(huì)導(dǎo)致評(píng)估結(jié)果失去時(shí)空關(guān)聯(lián)性,合理程度大打折扣。因此,需要深入分析連續(xù)多個(gè)時(shí)刻空戰(zhàn)態(tài)勢(shì)與威脅評(píng)估之間的關(guān)聯(lián)。本文建立基于正態(tài)累積分布的時(shí)間序列權(quán)重解算模型,采用正態(tài)分布的累積分布函數(shù)算法[27-28]解析時(shí)間權(quán)重序列。具體計(jì)算如下所示。
引入正態(tài)累積分布函數(shù),定義如下:
F(tk;μp,σp)=
(3)
用誤差函數(shù)的特殊函數(shù)表示正態(tài)分布的累積分布函數(shù):
(4)
式(3)和式(4)中,p為連續(xù)時(shí)刻的數(shù)目;μp為集合{1,2,…,p}的均值,σp(σp>0)為標(biāo)準(zhǔn)差,即其滿足:
(5)
(6)
可得到基于正態(tài)分布的累積分布函數(shù)的時(shí)間序列權(quán)重:
η(tk)=
(7)
式中:η(tk)是第tk時(shí)刻的權(quán)重。
空戰(zhàn)態(tài)勢(shì)信息存在動(dòng)態(tài)性、模糊性等特點(diǎn),作為決策者的飛行員的個(gè)人行為存在差異性,上述因素都會(huì)對(duì)空戰(zhàn)威脅評(píng)估結(jié)果產(chǎn)生不同影響。因此,本文綜合考慮空戰(zhàn)態(tài)勢(shì)信息的動(dòng)態(tài)性、模糊性及個(gè)體行為差異性,結(jié)合測(cè)量設(shè)備的特點(diǎn),生成混雜態(tài)勢(shì)信息,并對(duì)傳統(tǒng)TODIM算法進(jìn)行改進(jìn),提出了FD-TODIM算法,具體步驟如下。
(1) 基于直覺模糊數(shù)的空戰(zhàn)態(tài)勢(shì)信息處理方法
效益型屬性:
(8)
成本型屬性:
(9)
(10)
(2) 基于區(qū)間數(shù)的空戰(zhàn)態(tài)勢(shì)信息處理方法
(3) 基于語(yǔ)言變量的空戰(zhàn)態(tài)勢(shì)信息處理方法
表1 直覺模糊數(shù)和語(yǔ)言變量之間的關(guān)系
步驟2結(jié)合時(shí)間序列目標(biāo)多屬性權(quán)重解算模型,構(gòu)造多時(shí)刻加權(quán)動(dòng)態(tài)決策矩陣。
(11)
(12)
由于變權(quán)計(jì)算需要精確的目標(biāo)屬性決策信息,因此分別將區(qū)間數(shù)、直覺模糊數(shù)、語(yǔ)言變量轉(zhuǎn)化為滿足態(tài)勢(shì)評(píng)估解算的數(shù)據(jù)形式。
(1) 區(qū)間數(shù)態(tài)勢(shì)信息的轉(zhuǎn)化
(13)
根據(jù)決策者對(duì)待風(fēng)險(xiǎn)的不同態(tài)度,可以確定BUM函數(shù)ρ,通常取ρ(y)=yt,t>0。t值與決策者的風(fēng)險(xiǎn)厭惡程度存在反比關(guān)系。t=1時(shí),決策者對(duì)風(fēng)險(xiǎn)保持中立態(tài)度,取ρ(y)=yt,t>0,可得
(14)
(2) 直覺模糊數(shù)態(tài)勢(shì)信息的轉(zhuǎn)化
根據(jù)直覺模糊數(shù)和區(qū)間數(shù)之間的對(duì)應(yīng)關(guān)系,具體計(jì)算過程如下。
(15)
(3) 語(yǔ)言變量態(tài)勢(shì)信息的轉(zhuǎn)化
綜合考慮各個(gè)語(yǔ)言變量之間的差異,并給出了語(yǔ)言變量和直覺模糊數(shù)之間的對(duì)應(yīng)關(guān)系?;诖?可依據(jù)直覺模糊數(shù)轉(zhuǎn)化為精確數(shù)模型,進(jìn)行相應(yīng)轉(zhuǎn)化,在此不再贅述。
在上述轉(zhuǎn)化模型的基礎(chǔ)上,結(jié)合本文空戰(zhàn)態(tài)勢(shì)信息的數(shù)據(jù)形式,依據(jù)變權(quán)解算模型,可得到各個(gè)時(shí)刻下的相對(duì)綜合權(quán)重。
步驟4解算目標(biāo)yi相對(duì)于目標(biāo)yz的優(yōu)勢(shì)度。
δ(yi,yz)=
(16)
φj(yi,yz)=
(17)
(18)
步驟 6各目標(biāo)威脅排序調(diào)整。
根據(jù)各目標(biāo)的綜合優(yōu)勢(shì)度進(jìn)行最終目標(biāo)調(diào)整,綜合優(yōu)勢(shì)度越大,對(duì)應(yīng)的目標(biāo)威脅程度越大。
設(shè)我方與敵方遭遇,經(jīng)目標(biāo)識(shí)別后,獲知敵方6架3種型號(hào)殲擊機(jī),且這6架飛機(jī)均在我機(jī)的火控雷達(dá)跟蹤距離之內(nèi),我機(jī)飛行速度為320 m/s,雷達(dá)最大跟蹤距離為120 km,掛載導(dǎo)彈的最大射程為60 km。因目標(biāo)的具體機(jī)型未知,需要結(jié)合專家經(jīng)驗(yàn),由專家評(píng)價(jià)各個(gè)目標(biāo)的空戰(zhàn)能力。取前正序連續(xù)時(shí)刻t1,t2,t3時(shí)的目標(biāo)屬性決策矩陣信息,t3為當(dāng)前時(shí)刻,各時(shí)刻目標(biāo)信息數(shù)據(jù)如表2~表4所示。其中,νi為目標(biāo)的飛行速度,ri為目標(biāo)距我機(jī)的距離,φk為目標(biāo)進(jìn)入角,θk為目標(biāo)前置角。
表2 t1時(shí)刻空戰(zhàn)態(tài)勢(shì)指數(shù)
表3 t2 時(shí)刻空戰(zhàn)態(tài)勢(shì)指數(shù)
表4 t3時(shí)刻空戰(zhàn)態(tài)勢(shì)指數(shù)
具體過程如下所示。
(1) 確定目標(biāo)為1,2,3,4,5,6。目標(biāo)屬性分別為{空戰(zhàn)能力,速度,角度,距離},由于機(jī)載傳感器自身性能的限制和空戰(zhàn)態(tài)勢(shì)信息的復(fù)雜性,角度信息存在誤差,采用區(qū)間數(shù)的形式表示。目標(biāo)速度信息存在模糊性,采用直覺模糊數(shù)表示,取速度威脅因子下的pi,qi分別為0.7和0.3。依據(jù)威脅評(píng)估體系,結(jié)合直覺模糊數(shù)和語(yǔ)言變量之間的轉(zhuǎn)換關(guān)系,可以確定t1,t2和t3時(shí)刻下目標(biāo)屬性決策矩陣H1,H2和H3。
(2) 采用正態(tài)累積分布算法可得到時(shí)間序列權(quán)重如下:η(t1)=0.069 8,η(t2)=0.333 3,η(t3)=0.596 9。
(3) 將目標(biāo)多時(shí)刻威脅屬性決策矩陣進(jìn)行融合,得到H如下所示:
(4) 結(jié)合AHP權(quán)重解算模型,計(jì)算每個(gè)時(shí)刻下的常權(quán),各個(gè)時(shí)刻下的判斷矩陣分別如下所示:
式中:P1,P2,P3分別代表t1時(shí)刻,t2時(shí)刻和t3時(shí)刻的判斷矩陣。分別進(jìn)行一致性檢驗(yàn),均滿足一致性檢驗(yàn),可得到基于AHP算法的各個(gè)時(shí)刻的權(quán)重,得到t1時(shí)刻,t2時(shí)刻和t3時(shí)刻的權(quán)重為wAHP1=0.119 8,0.168 2,0.383 5,0.328 4,wAHP2=0.103 8,0.165 3,0.409 1,0.321 9和wAHP3=0.095 2,0.160 5,0.406 5,0.337 8。
(5) 基于常權(quán)權(quán)重,結(jié)合時(shí)間序列權(quán)重解算模型和變權(quán)權(quán)重解算模型,可得到各個(gè)時(shí)刻的變權(quán)向量,具體如下所示:
基于相同的空戰(zhàn)態(tài)勢(shì)信息,采用改進(jìn)多準(zhǔn)則排序算法計(jì)算目標(biāo)威脅度的大小[16],可得到空戰(zhàn)威脅度為:0.284 9,0.000 0,0.977 6,1.000 0,0.752 1,0.143 7。取值越大,威脅度越小,得到空戰(zhàn)威脅評(píng)估排序結(jié)果為:目標(biāo)4<目標(biāo)3<目標(biāo)5<目標(biāo)1<目標(biāo)6<目標(biāo)2。與損失衰減因子取θ=1/3時(shí)的本文所提算法對(duì)比,兩者主要區(qū)別在于目標(biāo)2和目標(biāo)6、目標(biāo)1和目標(biāo)5的相對(duì)排序上。分析目標(biāo)2和目標(biāo)6的空戰(zhàn)態(tài)勢(shì)信息,雖然目標(biāo)6的空戰(zhàn)能力大于目標(biāo)2的空戰(zhàn)能力,但目標(biāo)6相對(duì)我方的距離為55 km,比目標(biāo)2相對(duì)我方的距離(70 km)小,且目標(biāo)6的飛行速度為335 m/s,比目標(biāo)2的飛行速度更大。分析目標(biāo)1和目標(biāo)5的空戰(zhàn)態(tài)勢(shì)信息,雖然目標(biāo)1的空戰(zhàn)能力大于目標(biāo)5,但目標(biāo)5的角度威脅隨時(shí)間增大,且在t3時(shí)刻的速度大小為330 m/s,比目標(biāo)1的速度大。因此,在該種情況下,本文所提算法綜合考慮多時(shí)刻態(tài)勢(shì)信息和飛行員個(gè)體差異,基于正態(tài)累積分布的時(shí)間序列權(quán)重生成算法,得出上述有效且合理的排序,解決了屬性參數(shù)與權(quán)值動(dòng)態(tài)匹配“狀態(tài)失衡”的問題。
空戰(zhàn)威脅評(píng)估在復(fù)雜空戰(zhàn)中發(fā)揮著極為重要的作用,是我方火力部署、武器分配、攻擊作戰(zhàn)的前提和基礎(chǔ),也是提高我方生存率的關(guān)鍵。隨著空戰(zhàn)作戰(zhàn)信息化進(jìn)程的推進(jìn),干擾因素日益增多(包括電磁干擾、人為決策失誤等),導(dǎo)致空戰(zhàn)態(tài)勢(shì)信息整體呈現(xiàn)出混雜性,即模糊性、動(dòng)態(tài)性和個(gè)體行為差異性。針對(duì)當(dāng)前空戰(zhàn)態(tài)勢(shì)信息的混雜性和傳統(tǒng)空戰(zhàn)態(tài)勢(shì)威脅評(píng)估存在“狀態(tài)失衡”的問題,提出基于變權(quán)理論的態(tài)勢(shì)權(quán)重解析方法,并結(jié)合基于正態(tài)累積分布生成時(shí)間序列權(quán)重的算法,處理多時(shí)刻下空戰(zhàn)態(tài)勢(shì)信息,解決屬性參數(shù)與權(quán)值動(dòng)態(tài)匹配的問題。針對(duì)決策者個(gè)體行為差異所帶來的決策結(jié)果影響問題,綜合考慮飛行員有限理性和個(gè)體行為差異的特點(diǎn),提出基于FD-TODIM算法的混雜空戰(zhàn)多目標(biāo)威脅評(píng)估方法。通過仿真驗(yàn)證和分析,表明本文所提方法可充分挖掘歷史信息影響,有效融合多個(gè)時(shí)刻混雜空戰(zhàn)態(tài)勢(shì)混雜信息,并根據(jù)不同飛行員個(gè)體差異,生成具有實(shí)際意義的空戰(zhàn)威脅態(tài)勢(shì)評(píng)估結(jié)果,證明了其對(duì)混雜空戰(zhàn)多目標(biāo)動(dòng)態(tài)威脅評(píng)估的有效性和適用性。