劉小平, 王 杰, 李 聰, 唐傳林
(1.內(nèi)江師范學(xué)院,四川 內(nèi)江 641112; 2.空軍工程大學(xué)航空航天工程學(xué)院,西安 710038)
無人作戰(zhàn)飛機(jī)作為一股新生力量,在越戰(zhàn)、海灣戰(zhàn)爭、阿富汗戰(zhàn)爭、伊拉克戰(zhàn)爭等局部戰(zhàn)爭中展現(xiàn)出的巨大作戰(zhàn)潛力,使其迅速成為世界各國的研究熱點,從理論到工程領(lǐng)域的研究熱度都在持續(xù)升溫,世界上各個軍事大國都在探索和發(fā)掘無人機(jī)在作戰(zhàn)方面的新用途和新技術(shù)[1]?,F(xiàn)階段對無人作戰(zhàn)飛機(jī)空戰(zhàn)的研究還主要局限于理論和技術(shù)領(lǐng)域,但隨著理論的逐漸成熟和技術(shù)的突破,研究重點必將逐漸轉(zhuǎn)向作戰(zhàn)應(yīng)用層面。
針對無人作戰(zhàn)飛機(jī)戰(zhàn)術(shù)決策問題,現(xiàn)階段常用的方法有微分對策[2]、粗糙集[3]、貝葉斯網(wǎng)絡(luò)[4]、群智能算法[5]、動態(tài)規(guī)劃[6]等方法。文獻(xiàn)[7]使用影響圖對一對一空戰(zhàn)條件下的飛行員決策進(jìn)行仿真和分析。在決策模型中,為每個改變空戰(zhàn)態(tài)勢的機(jī)動動作都賦予了概率和效用值,影響圖將總的效用值做概率分布,用來表示機(jī)動動作的成功概率,并給出一個合理的機(jī)動決策結(jié)果。文獻(xiàn)[8]對水下航行器規(guī)避魚雷的戰(zhàn)術(shù)決策問題進(jìn)行研究,闡述了一種基于模糊邏輯的戰(zhàn)術(shù)決策方法,并用Python語言對決策過程進(jìn)行腳本化,在工程應(yīng)用仿真平臺上進(jìn)行試驗。文獻(xiàn)[9]將粗糙集與貝葉斯網(wǎng)絡(luò)相結(jié)合,提出一種超視距條件下的空戰(zhàn)決策方法。首先基于粗糙集對態(tài)勢信息特征進(jìn)行約簡,然后利用貝葉斯網(wǎng)絡(luò)的概率推理能力,對超視距空戰(zhàn)戰(zhàn)術(shù)決策進(jìn)行概率推理。文獻(xiàn)[10]對空戰(zhàn)決策的方法進(jìn)行了綜述,比較了微分對策、影響圖、專家系統(tǒng)等方法在空戰(zhàn)決策中的應(yīng)用特點,預(yù)測了未來空戰(zhàn)決策方法的發(fā)展趨勢。文獻(xiàn)[11]用專家系統(tǒng)解決了無人機(jī)空戰(zhàn)決策的問題,其決策性能取決于基于專家經(jīng)驗構(gòu)造的規(guī)則庫的大小,但隨著考慮因素的增多,將會出現(xiàn)組合爆炸的問題。
在漫長的人腦決策機(jī)理探究過程中,具有深遠(yuǎn)影響的是認(rèn)知和社會心理學(xué)領(lǐng)域?qū)<姨岢龅碾p重加工理論。文獻(xiàn)[12]提出的雙重加工系統(tǒng)將推理決策過程分為2個階段:第1階段為內(nèi)隱無意識的啟發(fā)式加工階段;第2階段為受意識控制的分析加工階段。雙重加工系統(tǒng)既能支持“人類條件推理具有顯著的概率成分”這個特性,又能整合統(tǒng)一人類直覺推理和理性推理,為決策推理系統(tǒng)提供了很好的理論指導(dǎo)。針對無人機(jī)空戰(zhàn)決策的具體工程問題,本文提出了一種案例推理(啟發(fā)式加工階段)與MAX-MIN云推理機(jī)制(分析加工階段)相結(jié)合的雙層戰(zhàn)術(shù)決策方案。戰(zhàn)術(shù)決策過程中,當(dāng)給定輸入后,首先通過檢索、匹配案例庫中的案例,得到相應(yīng)的輸出。然而,在更多的輸入情況下,常常無法完全匹配一個典型案例,或者無法不同程度地同時激活幾個典型案例,無法覆蓋所有的可能。因此,本文提出了相似度閾值的概念,對案例推理的結(jié)果進(jìn)行評價,若是問題情景和源案例匹配度不高,則轉(zhuǎn)向云模型定性規(guī)則推理。云推理過程中,基于云理論對這些確定案例進(jìn)行抽象,生成用不同粒度的語言值表達(dá)的定性概念,并生成代表經(jīng)驗的規(guī)則集,構(gòu)成一條條粒度不同的定性規(guī)則。一旦有了這些變粒度的、足夠數(shù)量的定性規(guī)則集合,在一個確定輸入條件下就可以激活相應(yīng)的規(guī)則,通過云推理機(jī)制,產(chǎn)生不確定性輸出,最終實現(xiàn)無人作戰(zhàn)飛機(jī)空戰(zhàn)戰(zhàn)術(shù)決策。
飛行員在日常飛行訓(xùn)練和演習(xí)中獲得了大量寶貴的作戰(zhàn)經(jīng)驗,但因飛行員易于提供實際作戰(zhàn)案例而難以提供純粹的知識,故本文選用了只需將作戰(zhàn)經(jīng)驗以案例形式完全表達(dá)的案例推理方法以實現(xiàn)第一層的直覺決策。案例推理是利用目標(biāo)案例的提示而得到歷史記憶中的源案例,并由源案例來指導(dǎo)目標(biāo)案例求解的一種策略。案例推理的求解過程一般分為知識表示、案例檢索、案例修正以及案例庫的維護(hù)與更新。本文重點研究可提高推理效率的知識表示形式以及案例檢索方法。
案例推理的基礎(chǔ)——案例知識庫來源于專家在解決本領(lǐng)域難題時的一些具體做法,本文所使用的戰(zhàn)術(shù)決策案例庫則來自對飛行員實戰(zhàn)經(jīng)驗的提取和描述。知識表示是案例庫構(gòu)造的前提,文獻(xiàn)[13]對現(xiàn)階段幾種知識表示方法從認(rèn)知層面、本體層面、實現(xiàn)層面進(jìn)行了比較,結(jié)果如表1所示。
表1 知識表示方法比較
考慮到戰(zhàn)術(shù)決策知識的復(fù)雜、不確定特點等特性,根據(jù)表1所示的多種知識表示方法,綜合考慮3個層面的各項性能,本文在構(gòu)建戰(zhàn)術(shù)決策庫時選用面向?qū)ο蟮闹R表示方法,其具體表示方法描述如下。
CLASS |
<類名> |<類變量表>|
STRUCTURE
<案例靜態(tài)結(jié)構(gòu)描述>
METHOD
<案例的操作定義>
RESTRAINT
<限制條件>
END
類名為戰(zhàn)術(shù)決策案例在系統(tǒng)中的識別標(biāo)志,具有唯一性;類變量表則為應(yīng)用于戰(zhàn)術(shù)決策的特征屬性集合,如接近率、相對距離、敵方位和航向等屬性;案例靜態(tài)結(jié)構(gòu)描述則為態(tài)勢系統(tǒng)獲取的上述特征屬性的具體描述;案例操作定義則是給出了具體的戰(zhàn)術(shù)決策結(jié)果,如保持當(dāng)前飛行狀態(tài)、防御型或進(jìn)攻型機(jī)動、火力攻擊或電子戰(zhàn)等戰(zhàn)術(shù)行為;限制條件為UCAV自身性能如速度、高度和過載的極限值等。
根據(jù)前文所述的面向?qū)ο蠓ǖ闹R表示方法,案例推理過程中選用與之相匹配的最近鄰檢索策略,相似度計算時首先進(jìn)行結(jié)構(gòu)相似度計算,然后結(jié)合屬性相似度進(jìn)行全局相似度計算,從而得出源案例與問題情境的相似度,并與預(yù)先設(shè)定的相似度閾值進(jìn)行比較,以判斷是否進(jìn)行第二層基于云推理機(jī)制的分析決策過程。
1.2.1 結(jié)構(gòu)相似度計算
結(jié)構(gòu)相似度概念的提出及相似度數(shù)值的計算可有效解決關(guān)鍵特征屬性缺失的問題,提高了案例推理的效率,其算式為
(1)
式中:Jsim(Q,C)為問題案例Q和源案例C的結(jié)構(gòu)相似度;ωi表示Q和C交集中的第i個屬性的權(quán)重;ωj為Q和C并集中的第j個屬性的權(quán)重。
1.2.2 屬性相似度計算
根據(jù)空戰(zhàn)特征屬性的特點,屬性相似度計算可分為確定符號屬性和確定數(shù)屬性,計算如下所述。
1) 確定符號屬性。
(2)
問題案例與源案例的值均為0或1時,則Ssim(s0,sji)=1,其余情況則Ssim(s0,sji)=0。
2) 確定數(shù)屬性。
歐氏距離為
(3)
式中,zi表示第i個特征屬性的取值范圍。
1.2.3 全局相似度
(4)
式中:Ssim(Q,C)為Q和C的屬性加權(quán)相似度;WQ∩C為Q和C交集的權(quán)重之和;Ssim(s0,sji)表示Q和C之間第i個屬性的相似度。
利用式(1)~式(4)即可實現(xiàn)問題情境與案例庫中的源案例進(jìn)行相似度匹配,得到一定的相似度值。但是案例推理不是萬能的,其推理結(jié)果是否符合實際需求取決于案例庫的大小,案例庫中案例越豐富,則案例推理的效率越高。在案例庫大小一定的情況下,需要設(shè)置相似度閾值,以免得到相似度過低而不符合實際需求的推理結(jié)果。當(dāng)問題案例與源案例的相似度小于相似度閾值時,則第1層直覺決策失敗,遂進(jìn)行第2層分析決策,據(jù)此,可提出UCAV戰(zhàn)術(shù)總體決策框架,如圖1所示。
圖1 UCAV戰(zhàn)術(shù)總體決策框架Fig.1 Overall decision-making framework of UCAV tactics
2.1.1 云模型
設(shè)U為一個用精確數(shù)值表示的定量論域,C為U上的定性概念,若定量值x∈U,且x為定性概念C的一次隨機(jī)實現(xiàn),x對C的確定度μ(x)∈[0,1]是已有穩(wěn)定傾向的隨機(jī)數(shù)
μ:U→[0,1]?x∈Ux→μ(x)
(5)
則x在論域U上的分布稱為云,每一個x稱為一個云滴,如圖2所示。
圖2 云模型數(shù)字特征示意圖Fig.2 Digital features of cloud model
期望(Ex)是云滴在論域空間分布中的數(shù)學(xué)期望,是能夠代表定性概念的點[14];熵(En)是定性概念的不確定性度量,決定了論域空間中可被概念接受的云滴的不確定度;超熵(He)是熵的不確定性度量,對于一個常識性概念,被普遍接受的程度越高,超熵越小。
2.1.2 云發(fā)生器
云發(fā)生器可實現(xiàn)定性概念與定量數(shù)值之間的轉(zhuǎn)換。云發(fā)生器分為前件云發(fā)生器和后件云發(fā)生器,前件云發(fā)生器實現(xiàn)從定性概念到定量值的映射,后件云發(fā)生器實現(xiàn)定量值到定性概念的轉(zhuǎn)化[15]。本文主要用到的是前件云發(fā)生器。
對于精確量值論域中任意一個定量值a,通過正向云發(fā)生器得到屬于定性概念的確定度μ(a),稱為前件云發(fā)生器,如圖3所示。
Input:數(shù)字特征(Ex,En,He) Output:云滴drop(x,u)圖3 前件云發(fā)生器Fig.3 Forward cloud generator
前件云發(fā)生器的實現(xiàn)算法為:
基于MAX-MIN云推理的UCAV戰(zhàn)術(shù)決策方法如圖1所示。首先,在態(tài)勢獲取的基礎(chǔ)上,對推理所需的特征屬性利用前件云發(fā)生器進(jìn)行云模型轉(zhuǎn)換以生成屬性云滴;其次,結(jié)合空戰(zhàn)定性規(guī)則集,采用MAX-MIN云推理算法得到規(guī)則云滴,進(jìn)而得出戰(zhàn)術(shù)動作方案。
2.2.1 云模型轉(zhuǎn)換
將關(guān)鍵因素集合中的特征屬性進(jìn)行云化,從而構(gòu)建特征屬性云模型,是UCAV在空戰(zhàn)過程中利用基于自然語言描述的定性空戰(zhàn)規(guī)則進(jìn)行戰(zhàn)術(shù)決策的前提。以相對距離為例進(jìn)行說明,設(shè)定此特征屬性對應(yīng)的精確量值論域為[0,150],將其劃分為[0,30],[30,80]和[80,150](單位:km)3個子論域,并分別對應(yīng)近、中、遠(yuǎn);設(shè)定“近”語言值(CD1)的數(shù)字特征為(15,8,0.5),“中”語言值(CD2)的數(shù)字特征為(55,15,1),“遠(yuǎn)”語言值(CD3)的數(shù)字特征為(115,20,1),相對距離概念云族如圖4所示。
依據(jù)現(xiàn)代空戰(zhàn)常識,將關(guān)鍵因素集合中的特征屬性進(jìn)行論域劃分,并設(shè)置不同語言值的數(shù)字特征,以構(gòu)建所有特征屬性的云族用于后期推理過程。
圖4 相對距離云族Fig.4 Relative distance cloud family
2.2.2 MAX-MIN云推理方法
推理規(guī)則的形式為ifAthenB,A為規(guī)則的前件,即被觸發(fā)的前提,可以是單個條件或多個條件,B為規(guī)則的后件,表示具體的戰(zhàn)術(shù)決策方案,前件和后件中的概念都可能存在不確定性。
設(shè)定特征屬性的數(shù)量為m,Ti(vj)表示特征屬性i的語言值為vj,j=1,2,…,Ni,則推理算法可以形式化表示如下。
規(guī)則1ifT1(v1),T2(v1),…,Tm(v1) thena1
規(guī)則2ifT1(v1),T2(v1),…,Tm(v2) thena2
?
規(guī)則lifT1(vj),T2(vi),…,Tm(vk) thenal
?
其中,推理規(guī)則l中的下角標(biāo)j,i,k分別表示相應(yīng)的特征屬性的自然語言值序號,j=1,2,…,N1;i=1,2,…,N2;k=1,2,…,Nm;al表示戰(zhàn)術(shù)動作方案集中第l個戰(zhàn)術(shù)方案。
設(shè)態(tài)勢獲取系統(tǒng)提供的信息為q1,q2,…,qm,基于圖1,可得MAX-MIN云推理過程如下所述。
1) 將各個特征屬性的qi作為前件云發(fā)生器的輸入,求qi屬于特征屬性Ti的確定度μTi(qi),即
μTi(qi)=max{μTi(v1)(qi),…,μTi(vj)(qi),…},
j=1,2,…,Ni
(6)
式中,μTi(vj)(qi)為信息qi對特征屬性Ti各個論域的確定度。在μTi(qi)確定后,保存該特征屬性對應(yīng)的語言值以及其在戰(zhàn)術(shù)規(guī)則集中的位置。
2) 根據(jù)推理算法確定戰(zhàn)術(shù)規(guī)則,并得到該規(guī)則相對應(yīng)的確定度μ*。μ*滿足
μ*=min{μTi(Va)(qi),…,μTi(Vc)(qi),…}
(7)
其中,a,…,c表示各個特征屬性的語言值序號。μ*確定后,根據(jù){μT1(Va)(q1),…,μTi(Vc)(qi),…}對應(yīng)的語言值確定推理選定的規(guī)則位于規(guī)則集中的位置。至此,基于云推理的分析決策結(jié)束并得到了相應(yīng)的戰(zhàn)術(shù)決策方案。
基于Matlab GUI平臺對本文設(shè)計的基于案例推理和MAX-MIN云推理的雙層戰(zhàn)術(shù)決策策略進(jìn)行仿真分析驗證。UCAV關(guān)鍵因素集合中特征屬性的云模型設(shè)置如表2所示。
表2 云族數(shù)字特征
對于敵雷達(dá)是否鎖定,武器是否發(fā)射以及敵方是否電子干擾等態(tài)勢情況屬于0-1的二值特征屬性,不存在模糊屬性,不需要云化,云推理過程中直接進(jìn)行推理即可。
假設(shè)無人作戰(zhàn)飛機(jī)態(tài)勢獲取系統(tǒng)可以得到本文仿真中所需特征屬性的態(tài)勢值。仿真時設(shè)定空戰(zhàn)態(tài)勢如圖5所示。首先進(jìn)行第1層基于案例推理的直覺決策,案例推理過程中的相似度閾值預(yù)設(shè)為0.8。通過案例檢索,選取相似度最高的案例,相似度為0.935 65,大于預(yù)設(shè)的相似度閾值,因此不必進(jìn)行第2層分析決策過程,直接給出戰(zhàn)術(shù)決策結(jié)果為“電子干擾,拉起,前向超視距接敵”。
圖5 案例推理戰(zhàn)術(shù)決策方案Fig.5 Case-based tactical decision-making scheme
設(shè)定空戰(zhàn)態(tài)勢如圖6所示,經(jīng)過第1層基于案例推理的直覺決策可得問題情境與源案例的最大相似度僅為0.653 42,小于相似度閾值,不符合要求,遂進(jìn)行第2層基于MAX-MIN云推理機(jī)制的分析決策,通過MAX-MIN云推理得到與態(tài)勢最匹配的戰(zhàn)術(shù)定性規(guī)則為釋放箔條干擾彈,擺脫鎖定,機(jī)動規(guī)避電子干擾,并可得確定度為0.712 35,耗時為0.054 2 s,理論上滿足時間約束要求。通過分析可知,基于MAX-MIN云推理得到的戰(zhàn)術(shù)決策結(jié)果符合人在回路中參與決策的思維邏輯,證明了此種方法的有效性。
圖6 MAX-MIN云推理仿真結(jié)果Fig.6 MAX-MIN cloud reasoning simulation results
為了推進(jìn)UCAV在實戰(zhàn)中的應(yīng)用,本文提出了案例推理和MAX-MIN云推理機(jī)制相結(jié)合的雙層戰(zhàn)術(shù)決策策略。戰(zhàn)術(shù)決策過程中,首先進(jìn)行基于案例推理的啟發(fā)式?jīng)Q策過程,在預(yù)設(shè)的相似度閾值的指導(dǎo)下對案例推理的結(jié)果進(jìn)行評價。若是問題情境和源案例的匹配度低于相似度閾值,則轉(zhuǎn)向基于MAX-MIN云推理方法的分析決策過程。MAX-MIN云推理借助云模型實現(xiàn)了空戰(zhàn)規(guī)則定量與定性之間的轉(zhuǎn)化,并以關(guān)鍵屬性集合中的特征屬性為基礎(chǔ),引入MAX-MIN云推理方法實現(xiàn)了UCAV空戰(zhàn)戰(zhàn)術(shù)決策。仿真表明,決策結(jié)果符合專家經(jīng)驗,仿真時間滿足實時性需求。戰(zhàn)術(shù)決策方案為UCAV具體機(jī)動動作的規(guī)劃與執(zhí)行提供了依據(jù),關(guān)于具體機(jī)動動作的實現(xiàn)將是下一步的努力方向。
參 考 文 獻(xiàn)
[1] 劉大臣,賀晨光,王萬金.無人機(jī)的應(yīng)用與發(fā)展趨勢探討[J].航天電子對抗,2013,29(4):15-17,21.
[2] OSHMAN Y,ARAD D.Differential-game-based guidance law using target orientation observations[J].IEEE Tran-sactions on Aerospace and Electronic Systems,2006,42(1):316-326.
[3] 梅丹,吳文海,徐家義,等.決策影響圖在三維空戰(zhàn)決策中的應(yīng)用[J].電光與控制,2008,15(2):66-69,77.
[4] 王曉帆,王寶樹.基于貝葉斯網(wǎng)絡(luò)和直覺模糊推理的態(tài)勢估計方法[J].系統(tǒng)工程與電子技術(shù),2009,31(11):2742-2746.
[5] 鄒志剛,劉付顯,夏璐.從時間角度看作戰(zhàn)決策同步[J].電光與控制,2013,20(3):25-29.
[6] LINK C,MCGREW J S,HOW J P,et al.Air combat strategy using approximate dynamic programming[C]//AIAA Guidance,Navigation and Control Conference,2008:1-20.
[7] VIRTANEN K,RAIVIO T,HAMALAINEN R P.Decision theoretical approach to pilot simulation[J].Journal of Aircraft,1999,36(4):632-641.
[8] SON M J,KIM T W.Torpedo evasion simulation of underwater vehicle using fuzzy logic based tactical decision making in script tactics manager[J].Expert Systems with Applications,2012,39(9):7995-8012.
[9] 陳軍,高曉光,符小衛(wèi).基于粗糙集理論與貝葉斯網(wǎng)絡(luò)的超視距空戰(zhàn)戰(zhàn)術(shù)決策[J].系統(tǒng)仿真學(xué)報,2009,21(6):1739-1742.
[10] 傅莉,李偉.戰(zhàn)機(jī)空戰(zhàn)決策方法及分析[J].沈陽航空航天大學(xué)學(xué)報,2013,30(6):48-52.
[11] GUIERREZ L B,VACHTSEVANOS G,HECK B. An ap-proach to the adaptive mode transition control of unmanned aerial vehicle[C]//American Control Confe-rence,2003:3911-3912.
[12] SHAO G W,SANG N.Regularized max-min linear discriminant analysis[J].Pattern Recognition,2017,66(6):353-363.
[13] 馬創(chuàng)新.論知識表示[J].現(xiàn)代情報,2014,34(3):21-24,28.
[14] 李德毅,劉常昱,杜鹢,等.不確定性人工智能[J].軟件學(xué)報,2004,15(11):1583-1594.
[15] 李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學(xué),2004,6(8):28-34.