陳 鑫 李立偉 侯立志 趙擎天 陳秋麗 孫 贇
(軍事科學(xué)院系統(tǒng)工程研究院 北京 100020)
2019 年美國(guó)戰(zhàn)略與預(yù)算評(píng)估中心發(fā)布《重奪制海權(quán)―美國(guó)海軍水面艦隊(duì)向決策中心戰(zhàn)轉(zhuǎn)型》報(bào)告,首次提出“決策中心戰(zhàn)”作戰(zhàn)概念,建議美國(guó)海軍通過(guò)“決策中心戰(zhàn)”重塑指揮架構(gòu)、調(diào)整兵力部署、保持決策優(yōu)勢(shì),為美國(guó)國(guó)防戰(zhàn)略提供支持[1]。2020 年戰(zhàn)略與預(yù)算評(píng)估中心發(fā)布《“馬賽克戰(zhàn)”:利用人工智能和自主系統(tǒng)實(shí)施決策中心戰(zhàn)》報(bào)告,指出“馬賽克戰(zhàn)”即是一種“決策中心戰(zhàn)”,軍事競(jìng)爭(zhēng)的下一主要領(lǐng)域?qū)⑹切畔⒑蜎Q策,通過(guò)利用新興人工智能和自主系統(tǒng)技術(shù)有望建立新的長(zhǎng)期優(yōu)勢(shì)[2]。決策中心戰(zhàn)概念著眼大國(guó)對(duì)抗的作戰(zhàn)需求,旨在推動(dòng)美軍從信息為中心作戰(zhàn)向決策為中心作戰(zhàn)轉(zhuǎn)變,從掌控信息優(yōu)勢(shì)向掌控決策優(yōu)勢(shì)轉(zhuǎn)變。這一作戰(zhàn)概念具有重大的理論和實(shí)踐價(jià)值。如果說(shuō)網(wǎng)絡(luò)中心戰(zhàn)概念開(kāi)啟了美軍向信息化軍隊(duì)轉(zhuǎn)型之路,決策中心戰(zhàn)概念則標(biāo)志著美軍信息化建設(shè)進(jìn)入了更高階段,也將成為美軍智能化轉(zhuǎn)型的重要牽引。對(duì)決策中心戰(zhàn)進(jìn)行仿真實(shí)驗(yàn),對(duì)于剖析其制勝機(jī)理具有十分重要的意義。
決策中心戰(zhàn)的制勝機(jī)理是使敵方陷入“決策困境”,實(shí)質(zhì)是以智能化輔助決策為支撐,創(chuàng)新作戰(zhàn)樣式,快速形成殺傷鏈的閉合。當(dāng)前的研究多是在理論層面對(duì)這一作戰(zhàn)概念進(jìn)行宏觀描述、對(duì)人工智能賦能的新型作戰(zhàn)體系功能特點(diǎn)進(jìn)行總結(jié),但對(duì)于它的內(nèi)在機(jī)理缺乏量化的科學(xué)分析和研究。平臺(tái)分解的粒度對(duì)作戰(zhàn)體系的能力有什么樣的影響?是不是分解程度越高,體系能力就越大、越穩(wěn)定呢?小型平臺(tái)在戰(zhàn)斗空間異構(gòu)組合快速形成能力的關(guān)鍵是什么?諸如此類的問(wèn)題尚未得到解決。但這些問(wèn)題都是汲取決策中心戰(zhàn)的經(jīng)驗(yàn)、科學(xué)布局智能化作戰(zhàn)體系的關(guān)鍵問(wèn)題。
決策中心戰(zhàn)機(jī)理仿真實(shí)驗(yàn)系統(tǒng)總體設(shè)計(jì)思想,是設(shè)置一個(gè)決策中心戰(zhàn)典型作戰(zhàn)場(chǎng)景,仿真以人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等科技支撐環(huán)境下的分布式自主并行作戰(zhàn)樣式,通過(guò)量化分析找到制勝機(jī)理。本實(shí)驗(yàn)選取了馬賽克作戰(zhàn)體系,作戰(zhàn)主體是將多能平臺(tái)分解后的動(dòng)態(tài)組成的專業(yè)化系統(tǒng)集合,即將體系中具有智能特征的各作戰(zhàn)實(shí)體抽象為多智能體,這樣馬賽克作戰(zhàn)體系即被抽象建模成一個(gè)MAS(Multi-agents System,多智能體系統(tǒng)),系統(tǒng)中的多智能體被賦予殺傷鏈中的發(fā)現(xiàn)、定位、跟蹤、瞄準(zhǔn)、打擊與評(píng)估六種能力包[3~4],在一定的作戰(zhàn)想定背景下,通過(guò)設(shè)計(jì)多智能體異構(gòu)規(guī)則,預(yù)設(shè)不同的變量,觀察系統(tǒng)運(yùn)行后自主決策、自主行動(dòng)等行為方式,統(tǒng)計(jì)關(guān)鍵變量對(duì)MAS 效能產(chǎn)生的影響,從實(shí)驗(yàn)結(jié)果中找到?jīng)Q策中心戰(zhàn)的制勝要素。決策中心戰(zhàn)機(jī)理仿真實(shí)驗(yàn)總體設(shè)計(jì)思路如圖1所示。
3.2.1 實(shí)驗(yàn)基本想定
1)基本想定內(nèi)容
本實(shí)驗(yàn)按照實(shí)驗(yàn)?zāi)康膶儆诩僭O(shè)檢驗(yàn)實(shí)驗(yàn),模型在不考慮藍(lán)方干擾的情況下,在范在互聯(lián)[5]的網(wǎng)信環(huán)境中,以紅方某型無(wú)人機(jī)群打擊藍(lán)方對(duì)象為作戰(zhàn)場(chǎng)景,紅方無(wú)人機(jī)具有發(fā)現(xiàn)能力、定位能力、跟蹤能力、瞄準(zhǔn)能力、打擊能力及評(píng)估能力六種可能能力的架構(gòu),應(yīng)對(duì)藍(lán)方的殺傷網(wǎng)需要這六種能力中的隨機(jī)幾種能力,將作戰(zhàn)雙方分別定義為兩類Agent,即紅方平臺(tái)Agent 和藍(lán)方目標(biāo)Agent。作戰(zhàn)開(kāi)始后雙方皆可實(shí)時(shí)獲取對(duì)方的位置和能力信息,當(dāng)藍(lán)方對(duì)象全部能力被紅方鎖定后,該對(duì)象將消失同時(shí)隨機(jī)產(chǎn)生一個(gè)新的需要隨機(jī)能力的目標(biāo)。
2)想定空間
本實(shí)驗(yàn)系統(tǒng)采取概念級(jí)抽象仿真,對(duì)戰(zhàn)場(chǎng)環(huán)境進(jìn)行簡(jiǎn)化,構(gòu)造可實(shí)現(xiàn)馬賽克戰(zhàn)典型戰(zhàn)場(chǎng)的降階模型。利用多主體仿真工具NetLogo,將戰(zhàn)場(chǎng)基本環(huán)境抽象為無(wú)邊界網(wǎng)絡(luò),紅、藍(lán)多智能體在一個(gè)環(huán)面曲面(圖2(a))的作戰(zhàn)空間中互相作用。在系統(tǒng)平面圖(圖2(b))中,如果一個(gè)智能體從左邊消失,就會(huì)在右邊出現(xiàn);如果在下方消失,就會(huì)在上方相應(yīng)的位置出現(xiàn),即多智能體在水平方向和豎直方向回繞[6]。為了簡(jiǎn)明洞察多智能體在虛擬戰(zhàn)場(chǎng)中的適應(yīng)、協(xié)作、異構(gòu)等特性,模型中沒(méi)有納入敵方干擾及指揮控制復(fù)雜性的影響,同時(shí)假設(shè)所有智能體都以相同的速度移動(dòng),且沒(méi)有納入損耗作為平臺(tái)的特征。
圖2 戰(zhàn)場(chǎng)空間示意圖、系統(tǒng)平面圖
3)關(guān)注范圍
一是檢驗(yàn)馬賽克戰(zhàn)是否比傳統(tǒng)的多能平臺(tái)系統(tǒng)作戰(zhàn)效率高。決策中心戰(zhàn)主張的是能力分解按需組合,因此本實(shí)驗(yàn)的重點(diǎn)在于:對(duì)馬賽克化的即不同能力分解度下的程序運(yùn)行結(jié)果進(jìn)行比較,分析得出平臺(tái)分解度是否比傳統(tǒng)的平臺(tái)作戰(zhàn)效能高。二是判定在決策中心中制勝的關(guān)鍵是什么。最優(yōu)方案是不存在的,因?yàn)檫@與數(shù)圖論中的旅行推銷員問(wèn)題相似,同屬于計(jì)算機(jī)科學(xué)中的NP-hard 問(wèn)題,即無(wú)法用一定數(shù)量的運(yùn)算來(lái)解決多項(xiàng)式時(shí)間內(nèi)可解決的問(wèn)題。通過(guò)為多智能體賦予行為規(guī)則,啟發(fā)式探索智能體異構(gòu)的較優(yōu)方案和沖突消除方法,探索一定的規(guī)律和要點(diǎn)。三是考慮復(fù)雜度對(duì)模型的影響。本實(shí)驗(yàn)規(guī)定攻擊目標(biāo)一旦被消滅,即在隨機(jī)位置被取代,從而在整個(gè)運(yùn)行過(guò)程中保持目標(biāo)的總體密度。在密度一定的情況下,如在具有六種能力類型的120 個(gè)能力目標(biāo)中,全部是一體化平臺(tái),模型有20 個(gè)平臺(tái);在完全分解的的情況下,最多有120 個(gè)平臺(tái)。所需要能力越多,復(fù)雜度越高,對(duì)規(guī)則的邏輯編排要求就越高,實(shí)驗(yàn)將會(huì)關(guān)注復(fù)雜度對(duì)結(jié)果的影響。
4)實(shí)驗(yàn)粒度
本實(shí)驗(yàn)采用基于多智能體抽象仿真方法,屬于粗粒度實(shí)驗(yàn),將馬賽克戰(zhàn)中最核心的參數(shù)進(jìn)行抽象。被簡(jiǎn)化的內(nèi)容主要有戰(zhàn)場(chǎng)環(huán)境和作戰(zhàn)單元。將殺傷鏈的能力分散抽象為具有或需要隨機(jī)能力的智能體,通過(guò)人為制定行為規(guī)則,觀察運(yùn)行結(jié)果,分析研究馬賽克戰(zhàn)的運(yùn)行機(jī)理。建模涉及六個(gè)變量,一是紅方無(wú)人機(jī)數(shù)量;二是藍(lán)方攻擊目標(biāo)數(shù)量;三是紅方無(wú)人機(jī)可支配的能力數(shù)量;四是藍(lán)方攻擊目標(biāo)所需要的能力數(shù)量;五是平臺(tái)分解度;六是效能指數(shù)MoE(Measrue of Effectiveness)(本實(shí)驗(yàn)中設(shè)定為每分鐘產(chǎn)生的能力數(shù))。仿真結(jié)果的有效性通過(guò)效能指數(shù)來(lái)計(jì)算。
3.2.2 實(shí)驗(yàn)運(yùn)行
1)初始化
紅藍(lán)雙方智能體坐標(biāo)隨機(jī)地布撒于作戰(zhàn)空間,紅方智能體為紅色飛機(jī),藍(lán)方智能體為藍(lán)色方塊,通過(guò)滑塊可以選擇紅方無(wú)人機(jī)數(shù)量num_guns,藍(lán)方攻擊目標(biāo)數(shù)量num_goals,紅方無(wú)人機(jī)可支配的能力數(shù)量capacity_gun,藍(lán)方攻擊目標(biāo)所需要的能力數(shù)量capacity_goal。如圖3 所示為一個(gè)初始化界面,滑塊從上到下依次表示紅方無(wú)人機(jī)40 架,藍(lán)方目標(biāo)40 個(gè),紅方每臺(tái)無(wú)人機(jī)具備3 種能力,藍(lán)方每個(gè)目標(biāo)需要3 種能力。能力以不放回的方式分配給各平臺(tái),將發(fā)現(xiàn)、定位、跟蹤、瞄準(zhǔn)、打擊與評(píng)估6種能力設(shè)置為列表(0 1 2 3 4 5),不同平臺(tái)分別具有列表中的任意3 種能力,例如某平臺(tái)可能具有能力0、2 和4,另一個(gè)平臺(tái)可能具有能力1、2 和3。每個(gè)平臺(tái)能力不重復(fù),例如不會(huì)配備能力1、1和2,但在整個(gè)部隊(duì)中可以重疊,比如藍(lán)方中的任意幾個(gè)平臺(tái)可能都需要能力2。拖動(dòng)滑塊可實(shí)現(xiàn)對(duì)參數(shù)在范圍內(nèi)的任意調(diào)節(jié),即可生成任意想要的初始化界面。
圖3 初始化界面
2)規(guī)則設(shè)置
本實(shí)驗(yàn)采取啟發(fā)式設(shè)計(jì),將能力隨機(jī)分配給攻擊對(duì)象,但這并不是為了解決最優(yōu)的問(wèn)題,而是通過(guò)規(guī)則設(shè)計(jì)后在運(yùn)行中發(fā)現(xiàn)的問(wèn)題,來(lái)找到在最低限度的復(fù)雜環(huán)境中,啟發(fā)式算法帶來(lái)的某些困難。最基本的啟發(fā)式規(guī)則是純貪婪算法,且有兩個(gè)可以選擇的規(guī)則。圖4是部分規(guī)則代碼。
圖4 部分規(guī)則代碼
基本規(guī)則:在每個(gè)時(shí)間步,所有平臺(tái)都試圖按照?qǐng)D4 中概述的過(guò)程,來(lái)選擇一個(gè)要應(yīng)對(duì)的攻擊對(duì)象,所有具有與紅方飛機(jī)的能力1 個(gè)或者多個(gè)能力的藍(lán)方目標(biāo)都是該飛機(jī)的潛在目標(biāo),那些已經(jīng)有歸屬平臺(tái)來(lái)提供其所需要能力的攻擊對(duì)象將被忽略。首要的決策為取捷徑,即紅方Agent 將選擇距離自己最近的藍(lán)方Agent目標(biāo),向目標(biāo)前進(jìn),抵達(dá)該目標(biāo)所在位置,等待仍然需要的其他能力的平臺(tái)趕來(lái),當(dāng)全部能力被滿足,就認(rèn)為藍(lán)方該目標(biāo)已經(jīng)得到應(yīng)對(duì)。它將在從仿真中移除,并用另一個(gè)隨機(jī)生成的攻擊對(duì)象代替。所有已經(jīng)分配給正在尋找目標(biāo)的平臺(tái)開(kāi)始再次行動(dòng),并進(jìn)行能力匹配來(lái)應(yīng)對(duì)。
遞歸瞄準(zhǔn)規(guī)則:如果離一個(gè)需要應(yīng)對(duì)的藍(lán)方平臺(tái)最近的紅方攻擊對(duì)象已經(jīng)被距離該攻擊對(duì)象更近的另一個(gè)平臺(tái)所覆蓋,則第一個(gè)平臺(tái)檢查下一個(gè)最近的目標(biāo),對(duì)所有攻擊對(duì)象進(jìn)行探測(cè),以確定是否有一個(gè)攻擊對(duì)象可以使用其進(jìn)行應(yīng)對(duì),并且還沒(méi)有被更近的某個(gè)平臺(tái)所覆蓋。
需求檢查規(guī)則:當(dāng)各平臺(tái)最初觀察到潛在攻擊對(duì)象時(shí),所有平臺(tái)已經(jīng)分配的能力都從最初的攻擊對(duì)象需求中扣除,這減少了分配給同一攻擊對(duì)象的冗余平臺(tái)。
圖5 中第五、六張展示了攻擊對(duì)象分配和沖突消除的規(guī)則,包括“卡住”的目標(biāo),即一個(gè)正在進(jìn)行中但尚未得到完全應(yīng)對(duì)的攻擊對(duì)象。在代碼編寫過(guò)程中,對(duì)“卡住“的目標(biāo)采取的調(diào)整方法是:先記住“卡住”的目標(biāo),運(yùn)行中讓平臺(tái)在此目標(biāo)以外的目標(biāo)群中進(jìn)行選擇,選擇的原則是決策最快(但不一定是距離最短的)能夠解決的目標(biāo)。
圖5 攻擊對(duì)象分配和沖突消除的方法
3)運(yùn)行結(jié)果
實(shí)驗(yàn)運(yùn)行了平臺(tái)從簡(jiǎn)單到復(fù)雜(能力從單一到全部6 種)、攻擊對(duì)象從簡(jiǎn)單到復(fù)雜(需要單一能力到需要全部6 種能力)的各情形,平臺(tái)和目標(biāo)在不同分解度下的結(jié)果統(tǒng)計(jì)如表1。
表1 不同馬賽克配置下模型的MoE
這一統(tǒng)計(jì)結(jié)果與蘭德公司對(duì)馬賽克戰(zhàn)仿真實(shí)驗(yàn)結(jié)果不同,但從中得出的結(jié)論相似[6]。對(duì)于紅藍(lán)雙方的能力復(fù)雜度,呈現(xiàn)為表中的目標(biāo)需求和平臺(tái)能力,在匹配情況不同時(shí)每分鐘產(chǎn)生的能力數(shù)MoE形成了一定的規(guī)律,紅色越深,效能越差;綠色越深,效能越好。
由表1可以看出:
1)按行看,目標(biāo)需求為1,即目標(biāo)完全馬賽克化時(shí),平臺(tái)的作戰(zhàn)效能最好。
此時(shí)當(dāng)平臺(tái)越復(fù)雜時(shí),MoE 值越低,因?yàn)槠脚_(tái)越復(fù)雜,對(duì)于單個(gè)的目標(biāo),平臺(tái)能力浪費(fèi)越多;當(dāng)目標(biāo)需求為6,即目標(biāo)最復(fù)雜時(shí),使用簡(jiǎn)單的平臺(tái)或復(fù)雜的平臺(tái)效果較好,而平臺(tái)能力為3 或4 時(shí)效果較差。
2)按列看,平臺(tái)能力為6時(shí),表現(xiàn)較好,因?yàn)榇藭r(shí)平臺(tái)可以任意選擇目標(biāo),但是如果目標(biāo)需求為1,則造成平臺(tái)能力的浪費(fèi),此時(shí)效率偏低;當(dāng)平臺(tái)能力為1,即完全馬賽克化時(shí),對(duì)簡(jiǎn)單和復(fù)雜的目標(biāo)表現(xiàn)較好(決策都更簡(jiǎn)單),對(duì)于中間目標(biāo)(需求為2,3,4,5)則表現(xiàn)較差。
3)當(dāng)平臺(tái)能力為2,3,4,5時(shí),對(duì)簡(jiǎn)單的目標(biāo)能取得較好的結(jié)果,對(duì)復(fù)雜的目標(biāo)則結(jié)果較差。
綜上可得出,在知己知彼、使用恰當(dāng)規(guī)則的前提下,智能化作戰(zhàn)體系的戰(zhàn)斗力會(huì)有好的表現(xiàn),這些是體系中涌現(xiàn)新質(zhì)戰(zhàn)斗力的必要條件。本實(shí)驗(yàn)?zāi)J(rèn)在作戰(zhàn)空間的理想態(tài)勢(shì)感知,在實(shí)踐中,通信、態(tài)勢(shì)感知是決策的前提,利用智能科技可以擴(kuò)大戰(zhàn)場(chǎng)偵察感知的范圍[7],輔助態(tài)勢(shì)感知與態(tài)勢(shì)評(píng)估快速準(zhǔn)確開(kāi)展;規(guī)則的設(shè)計(jì)在本實(shí)驗(yàn)中占據(jù)了很大比例,在復(fù)雜的戰(zhàn)場(chǎng)環(huán)境中還需更靈巧、更貼切的任務(wù)規(guī)則、任務(wù)分配和編組優(yōu)化等設(shè)計(jì)。
本實(shí)驗(yàn)分析了雙方實(shí)力相當(dāng)時(shí)的理想情況,通過(guò)MAS 抽象建模的方式,對(duì)典型決策中心戰(zhàn)進(jìn)行了啟發(fā)式仿真實(shí)驗(yàn),結(jié)果表明分布作戰(zhàn)在一定情況下較傳統(tǒng)的平臺(tái)作戰(zhàn)具有優(yōu)勢(shì),但并不是所能力分解的情況都具有好的戰(zhàn)斗力,這與雙方平臺(tái)分解程度有很大的關(guān)聯(lián)。實(shí)驗(yàn)結(jié)果推翻了當(dāng)前分布式作戰(zhàn)具有絕對(duì)優(yōu)勢(shì)的臆斷認(rèn)知,人工智能與相關(guān)技術(shù)的融合發(fā)展將戰(zhàn)爭(zhēng)形態(tài)推向高級(jí)階段[8~9],制勝機(jī)理發(fā)生了一定變化[10]。可以得出,智能化指揮信息系統(tǒng)獲取決策優(yōu)勢(shì)的前提是全維態(tài)勢(shì)感[11],要想讓決策中心戰(zhàn)發(fā)揮積極作用,須以智能賦能態(tài)勢(shì)感知、任務(wù)規(guī)劃和編排規(guī)則,營(yíng)造決策優(yōu)勢(shì)。從信息化作戰(zhàn)向智能化作戰(zhàn)的轉(zhuǎn)變過(guò)程中,智能裝備的發(fā)展須能接入體系殺傷網(wǎng),且注重裝備互聯(lián)互通互操作功能,以便其功能隨時(shí)被調(diào)用,邊緣指控[12]、人機(jī)結(jié)合是發(fā)展的過(guò)程性選擇。