李 聰,王 勇,周 歡,王驍飛,王 淵
(空軍工程大學航空航天工程學院,西安 710038)
多無人機編隊作戰(zhàn)與單架無人機相比,可以提高無人機的突防能力、電子對抗能力、對目標搜索能力和識別能力以及攻擊效能等,提高任務(wù)完成的整體效率。現(xiàn)階段對多無人機編隊的研究還主要局限于理論和技術(shù)領(lǐng)域[1],但隨著理論的逐漸成熟和技術(shù)的突破,研究重點必將逐漸轉(zhuǎn)向作戰(zhàn)應(yīng)用層面。國內(nèi)外對無人機單機作戰(zhàn)戰(zhàn)術(shù)決策論述較多[4],但針對多無人機編隊作戰(zhàn)戰(zhàn)術(shù)決策問題則鮮有文獻進行研究討論。多無人機編隊空戰(zhàn)通??梢苑纸鉃椤岸σ弧薄ⅰ岸Χ焙汀耙粚σ弧钡然緦鼓J?,且“二對二”對抗模式在協(xié)同戰(zhàn)術(shù)的運用上仍然要積極創(chuàng)造“雙打單”局面,力爭以多打少。因而編隊空戰(zhàn)最終還將分解為“二對二”和“一對一”的基本對抗模式?!耙粚σ弧睂鼓J降臒o人機單機對抗已有大量文獻進行研究,并取得了一定成果[1],本文主要對現(xiàn)階段大多數(shù)論文尚未涉及的“二對一”對抗模式的戰(zhàn)術(shù)決策進行研究。
針對多無人作戰(zhàn)飛機編隊空戰(zhàn)中的戰(zhàn)術(shù)決策問題,有人機飛行員在空戰(zhàn)和訓練中形成的作戰(zhàn)經(jīng)驗為案例庫的構(gòu)建和規(guī)則推理機制提供了大量的樣本。在此基礎(chǔ)上,本文提出了基于框架結(jié)構(gòu)的戰(zhàn)術(shù)決策知識表示形式,并創(chuàng)新性地結(jié)合主觀專家賦權(quán)法和客觀云模型理論來確定屬性權(quán)重。此外,為了克服最近相鄰檢索算法中屬性缺失的問題,提出了雙層結(jié)構(gòu)的案例全局相似度計算方法。最后,利用規(guī)則推理對相似度小于閾值的情況進行修正。
飛行員在編隊空戰(zhàn)對抗過程中采取戰(zhàn)術(shù)方案時,通常先從記憶中尋找與當前空中態(tài)勢相似的經(jīng)歷,然后對記憶中的解決方法結(jié)合實際情況進行適當修正后再實施作戰(zhàn)行動。根據(jù)飛行員的這種思維活動以及進行案例推理時的需求,本文采用框架表示法對飛行員編隊空戰(zhàn)決策知識進行表示,并將每個知識元以案例的形式存儲在案例庫中。
框架表示是一種適應(yīng)性強、結(jié)構(gòu)靈活、推理方式靈活的知識表示方法,具有很強的通用性和靈活性??蚣鼙硎痉ǖ木唧w內(nèi)容參看文獻[2]。本文中,“槽”表示戰(zhàn)術(shù)決策案例的屬性,“側(cè)面”用來描述戰(zhàn)術(shù)決策案例屬性的不同方面。由于編隊空戰(zhàn)涉及到眾多因素,很難通過戰(zhàn)術(shù)決策案例完整地描述,故本文只選取了影響多無人機編隊空戰(zhàn)戰(zhàn)術(shù)決策的關(guān)鍵屬性對空戰(zhàn)態(tài)勢進行刻畫,最后的仿真結(jié)果驗證了表1中選取的關(guān)鍵屬性的合理性。本文所選取的關(guān)鍵屬性是在態(tài)勢分析的基礎(chǔ)上實現(xiàn)的,協(xié)同戰(zhàn)術(shù)的具體行為描述參見文獻[7-9]。
目前,案例檢索主要有最近相鄰、歸納推理和知識引導等幾種方法[10]。在研究多無人作戰(zhàn)飛機空戰(zhàn)戰(zhàn)術(shù)決策案例知識表示方法的基礎(chǔ)上,選用與之相配的最近相鄰檢索算法。
最近相鄰檢索算法的實現(xiàn)主要包括特征屬性權(quán)重的獲取,結(jié)構(gòu)相似度計算,屬性相似度計算和全局相似度計算等4個方面的內(nèi)容,現(xiàn)將本文中所使用的改進型最近相鄰檢索算法的各環(huán)節(jié)設(shè)計如下。
表1 編隊戰(zhàn)術(shù)決策關(guān)鍵屬性案例知識表示
檢索特征屬性的獲取過程在構(gòu)建案例庫時即已經(jīng)完成。“長機或僚機與敵機的相對態(tài)勢變量”,“敵機攻擊目標的選定狀態(tài)”等一系列重要的屬性不同,目標問題和源案例之間就無需進行匹配。這類特征屬性可定義為充要條件屬性。為了突出充要條件屬性,本文將充要條件屬性的權(quán)重取為1,也就是說,即只要充要條件特征屬性不同,則利用歐式距離公式求得的相似度值可以小于或者等于零,即目標問題和源案例就無需進行匹配。這樣案例庫可以在規(guī)模不變的情況下,由于不需要進行全庫搜索而使得檢索的速度大大加快。
對于其余的非充要條件屬性的權(quán)值,可采用專家打分法和云模型理論在量化多名專家對屬性與最后決策方案影響強度判斷的基礎(chǔ)上,使用云模型對權(quán)重知識進行啟發(fā)式層次尋優(yōu),從而確定其權(quán)值。具體的計算流程如圖1所示。
圖1 特征屬性權(quán)值獲取流程
下面,以“敵我相對速度差變量RV”屬性的權(quán)重確定過程為例進行說明。
表2所示為依次進行3次專家打分后,借助正向云發(fā)生器和逆向云發(fā)生器求取的關(guān)于“敵我相對速度差變量RV”屬性的云模型數(shù)字特征,并根據(jù)此利用正向云發(fā)生器生成的云圖如圖2所示。
表2 專家打分結(jié)果
圖2 權(quán)重獲取過程云圖
從圖2(a)結(jié)合表2分析可知,第1輪的打分結(jié)果熵值以及超熵值都偏大,云滴的離散度較大,表明專家對“敵我相對速度差變量RV”這一特征屬性未形成一致的看法,需要繼續(xù)進行打分。
圖2(b)是再次打分后通過正向云發(fā)生器所得的云圖,結(jié)合表2分析可知,熵值和超熵值均開始減小,云圖由霧狀開始向云凝聚,表示專家意見開始趨于統(tǒng)一。
然后,對評分結(jié)果處理后再次反饋給專家以指導其進行第3次打分,所得結(jié)果的數(shù)字特征為(0.655 1,0.123 3,0.032),熵和超熵進一步降低,生成云圖如圖2(c)所示,云圖凝聚性再次增強,表示專家意見趨于一致,則據(jù)此可設(shè)定“敵我相對速度差變量RV”特征屬性的權(quán)重為0.655 1。
重復上述計算步驟,則可分別求得“敵機與我編隊的飛行高度差變量DH”、“敵機相對我編隊的水平位置變量RPX”和“敵機相對我編隊的垂直位置變量RPY”等非充要條件屬性的權(quán)值。最終計算結(jié)果如表3所示。
表3 特征屬性權(quán)值
多無人機編隊空戰(zhàn)戰(zhàn)場環(huán)境態(tài)勢復雜,因自身探測器性能不足等原因往往會造成特征屬性值缺失的情況。為了克服上述不足,提出了結(jié)構(gòu)相似度和屬性相似度相結(jié)合的雙重結(jié)構(gòu)檢索策略。
2.2.1 結(jié)構(gòu)相似度
由于待解決問題與源案例的屬性可能不盡相同,故先要求取結(jié)構(gòu)相似度:
2.2.2 屬性相似度
在戰(zhàn)術(shù)決策案例中,屬性的類型有兩類[1]:一是確定符號屬性,長機或僚機與敵機的相對態(tài)勢、敵機攻擊目標的選定狀態(tài)、敵機與我編隊的飛行高度差、敵機相對我編隊的水平位置和垂直位置等;二是確定數(shù)屬性。本文特征屬性只有確定符號屬性,確定數(shù)屬性不予考慮。根據(jù)上述分析,利用混合相似性度量方法對屬性相似度進行計算。
確定符號屬性:
例如,若問題案例與源案例的敵機類型值均為0(主動)、1(均勢)或 2(被動)時,則,其余情況則
2.2.3 全局相似度
在進行全局相似度計算時,只能根據(jù)共有屬性進行計算,因此,需要對各共有屬性的權(quán)重重新進行歸一化處理,計算方法如下:
綜上所述,利用式(1)~式(3),便可求得問題案例和源案例之間的相似度。在案例檢索過程中,為了使檢索到的源案例對目標問題有很好的參考和指導意義,以保證源案例和目標問題描述盡可能相似,需要設(shè)置相似度閾值。當有多個相似度超過閾值的案例時,則選取相似度最大的案例;當目標問題與源案例的最大相似度小于設(shè)定的閾值時,則認為檢索失敗,需要進行案例修正以得到戰(zhàn)術(shù)方案。
當檢索后目標問題的案例與源案例的相似度不高甚至檢索失敗時,為了順利地進行戰(zhàn)術(shù)決策,則需要進行案例修正。案例修正一直是案例推理的難點之一,現(xiàn)采用的方法大多數(shù)是基于規(guī)則或者人機交互的方式。本文基于規(guī)則推理(RBR)設(shè)計了戰(zhàn)術(shù)決策案例的修正機制。規(guī)則推理的具體方法參見文獻[11]。
對于一個新問題,首先進行案例推理,當不存在滿足閾值的案例時,則轉(zhuǎn)向基于規(guī)則的推理。這種方式符合人在解決問題時,先采用經(jīng)驗求解,當無類似經(jīng)驗知識時則根據(jù)事物間的因果關(guān)系求解問題的思維模式。在此基礎(chǔ)上,可得戰(zhàn)術(shù)決策的流程如圖3所示。
圖3 戰(zhàn)術(shù)決策流程
戰(zhàn)術(shù)決策案例庫的擴充,一方面可以依靠飛行員在實戰(zhàn)或演習過程中獲得的經(jīng)驗的轉(zhuǎn)化,將經(jīng)驗提煉為案例庫中的案例;另一方面則可以依賴多無人機空戰(zhàn)過程中所獲經(jīng)驗的轉(zhuǎn)化。隨著案例庫中案例的增加,案例庫難免出現(xiàn)冗余,從而對戰(zhàn)術(shù)決策實時性產(chǎn)生不利影響。因此,當有新案例被添加進案例庫時,則需要檢查其冗余性,設(shè)計案例庫維護與更新的流程如下頁圖4所示。關(guān)于案例評估機制的研究將在后面的研究中進行。
對現(xiàn)有定性描述的“二對一”編隊空戰(zhàn)的協(xié)同攻擊戰(zhàn)術(shù)知識進行提取,量化表示如表4所示。
圖4 案例庫的更新
表4 編隊戰(zhàn)術(shù)決策知識
為了演示本文設(shè)計的戰(zhàn)術(shù)決策方法,采用以Intel Core i3-2100 CPU 3.1 GHz RAM 4G為硬件基礎(chǔ)的WIN7系統(tǒng)環(huán)境,在MATLAB軟件的基礎(chǔ)上建立可視化的GUI仿真界面,利用前文設(shè)計的改進型最近鄰檢索算法進行仿真分析。
以表4中所描述的編隊戰(zhàn)術(shù)決策規(guī)則為依據(jù),建立案例庫,設(shè)置案例匹配相似度閾值為0.8。當目標案例與源案例的相似度大于該閾值時,則認為待求解問題與源案例相似,選取相似度最大的源案例作為決策結(jié)果否則表示不相似,案例推理失敗,進行規(guī)則推理[11-16]。
假設(shè)兩機編隊所處的空戰(zhàn)態(tài)勢如下頁圖5所示。我方其中一機敵我態(tài)勢被動,而另一架敵我態(tài)勢主動,飛行高度差大,敵機處于我雙機兩側(cè)和前后之間,相對速度小且敵機尚未選定攻擊目標。通過案例檢索,選取最相似案例,其相似度為1,大于給定的閾值,因此,最匹配戰(zhàn)術(shù)為“戰(zhàn)術(shù)1:掩護攻擊”。仿真中決策時間為0.87 ms,決策時間滿足實時性的要求。
在圖6描述的空戰(zhàn)態(tài)勢中,我雙機的敵我態(tài)勢均為被動的情況下,當敵機未選定攻擊目標,相對速度大,與我編隊的高度差小且處于我雙機上下和前后之間時,通過案例搜索,得到最相似案例的相似度僅為0.631 2,小于給定的閾值,案例檢索失敗,遂進行規(guī)則推理。通過規(guī)則推理可得出最佳匹配戰(zhàn)術(shù)為“戰(zhàn)術(shù)7:水平防御分合反擊戰(zhàn)術(shù)”,當接近敵機火力范圍時,我雙機突然水平分開,若敵機跟蹤其中一架我機時,另一架我機迅速占位,實施反擊。仿真中決策時間為0.961 2 ms,決策結(jié)果與人在回路中參與決策的結(jié)果一致,決策時間滿足實時性的要求。
本文針對大多數(shù)論文中尚未涉及的多無人機編隊中“二對一”空戰(zhàn)戰(zhàn)術(shù)決策問題,提出了一種基于案例推理和規(guī)則推理的人工智能方法。在戰(zhàn)術(shù)決策知識結(jié)構(gòu)化表示的基礎(chǔ)上,利用專家賦權(quán)法和云模型理論確定空戰(zhàn)關(guān)鍵屬性的權(quán)重,并提出了結(jié)構(gòu)相似度和屬性相似度相結(jié)合的雙重結(jié)構(gòu)檢索策略以實現(xiàn)相似度計算,進行案例匹配。從仿真結(jié)果來看:編隊戰(zhàn)術(shù)決策案例知識表示過程中所選用的關(guān)鍵特征屬性比較合理,能較準確地描述空戰(zhàn)態(tài)勢,并據(jù)此選擇出合理的戰(zhàn)術(shù)方案;采用的案例檢索與維護機制能在保證檢索快速性的同時兼顧案例庫的完備性;決策時間短,足以滿足作戰(zhàn)的實時性要求。
圖5 案例推理結(jié)果
圖6 規(guī)則推理結(jié)果