李曉婷,賈 婧,孟云霞
(北方自動控制技術(shù)研究所,太原 030006)
巡飛彈是集無人機(jī)技術(shù)和彈藥技術(shù)為一體的一種新概念彈藥,不僅能夠?qū)崿F(xiàn)戰(zhàn)場偵察與毀傷評估,還能實現(xiàn)高精度打擊、目標(biāo)指示、空中警戒等多種作戰(zhàn)功能,巡飛彈獨特的巡飛能力不僅對于攻擊坦克集群、運輸車等動態(tài)目標(biāo)具有很強(qiáng)的戰(zhàn)場靈活性和適應(yīng)性,還可根據(jù)戰(zhàn)場需求大大縮短從發(fā)現(xiàn)到摧毀目標(biāo)的時間,提高作戰(zhàn)效能,而且對敵方機(jī)場、指揮所、港口、供應(yīng)站等靜態(tài)目標(biāo)也具有十分重要的作用[1]。如何將自組織態(tài)勢感知與決策系統(tǒng)變得“會理解、會思考、會決策”,實現(xiàn)自主化、智能化是未來戰(zhàn)爭中巡飛彈武器充分發(fā)揮其作戰(zhàn)能力的關(guān)鍵所在。因此,推進(jìn)目標(biāo)識別、自主決策等關(guān)鍵技術(shù)研究,是自組織態(tài)勢感知與決策系統(tǒng)建設(shè)面臨的重要問題。
本文結(jié)合以深度學(xué)習(xí)技術(shù)為代表的人工智能最新研究成果,研究基于巡飛彈武器平臺的自組織態(tài)勢感知與決策系統(tǒng)組成和應(yīng)用模式,提出基于深度學(xué)習(xí)的目標(biāo)識別模型、任務(wù)自主決策模型和任務(wù)分配模型,實現(xiàn)協(xié)同作戰(zhàn)任務(wù)自主決策和智能規(guī)劃。提高復(fù)雜環(huán)境下情報信息的獲取、處理、分析以及可視化能力;提高自組織態(tài)勢感知與決策系統(tǒng)復(fù)雜環(huán)境下的作戰(zhàn)任務(wù)決策速度以及任務(wù)規(guī)劃能力,從而提高系統(tǒng)數(shù)據(jù)化快速決策及協(xié)同作戰(zhàn)能力,最大限度地發(fā)揮巡飛彈武器平臺協(xié)同作戰(zhàn)效能。
自組織態(tài)勢感知與決策系統(tǒng),由協(xié)同目標(biāo)識別子系統(tǒng)、態(tài)勢感知子系統(tǒng)、作戰(zhàn)任務(wù)自主決策子系統(tǒng)、協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng)、線下深度學(xué)習(xí)子系統(tǒng),以及決策支撐模型算法庫和數(shù)據(jù)支撐專業(yè)數(shù)據(jù)庫組成。
協(xié)同目標(biāo)識別子系統(tǒng)依賴深度學(xué)習(xí)目標(biāo)識別模型完成光測/雷測影像預(yù)處理、目標(biāo)特征提取、特征融合、目標(biāo)識別、目標(biāo)定位,以及目標(biāo)融合等功能。態(tài)勢感知子系統(tǒng)完成戰(zhàn)場態(tài)勢感知、態(tài)勢綜合等功能。作戰(zhàn)任務(wù)自主決策子系統(tǒng)依賴作戰(zhàn)任務(wù)自主決策模型完成目標(biāo)威脅分析、目標(biāo)動向預(yù)測,以及作戰(zhàn)任務(wù)自主決策等功能。協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng)依賴于作戰(zhàn)任務(wù)方案模型及任務(wù)規(guī)劃模型庫等,采用分布式架構(gòu),進(jìn)行態(tài)勢數(shù)據(jù)驅(qū)動的協(xié)同部署、目標(biāo)數(shù)據(jù)驅(qū)動的協(xié)同任務(wù)分配、數(shù)據(jù)驅(qū)動的時域/空域協(xié)同沖突檢測及規(guī)劃動態(tài)調(diào)控等功能,并生成多巡飛彈武器平臺協(xié)同作戰(zhàn)任務(wù)指令。當(dāng)感知到戰(zhàn)場情況發(fā)生較大變化時,態(tài)勢感知可將戰(zhàn)場態(tài)勢信息及動態(tài)環(huán)境反饋輸入至協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng),協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng),根據(jù)戰(zhàn)場實時態(tài)勢及動態(tài)環(huán)境進(jìn)行實時任務(wù)重分配和規(guī)劃調(diào)控。態(tài)勢可視化子系統(tǒng)對敵我力量部署、戰(zhàn)場形勢,以及彈載編隊的任務(wù)分工等進(jìn)行直觀的展現(xiàn)。決策支撐模型庫包括知識庫、深度學(xué)習(xí)目標(biāo)識別模型庫、作戰(zhàn)任務(wù)自主決策模型庫、任務(wù)規(guī)劃模型庫,主要為復(fù)雜環(huán)境下深度目標(biāo)識別、基于深度學(xué)習(xí)的作戰(zhàn)任務(wù)自主決策,以及多巡飛彈武器平臺協(xié)同作戰(zhàn)任務(wù)規(guī)劃[2]提供模型算法支撐。數(shù)據(jù)支撐專業(yè)數(shù)據(jù)庫包括目標(biāo)特征樣本庫、光測/雷測影像庫、巡飛彈武器平臺毀傷效能庫、訓(xùn)練樣本庫以及綜合業(yè)務(wù)數(shù)據(jù)庫,主要為態(tài)勢數(shù)據(jù)驅(qū)動的協(xié)同部署、目標(biāo)數(shù)據(jù)驅(qū)動的協(xié)同任務(wù)分配,以及數(shù)據(jù)驅(qū)動的時域/空域協(xié)同沖突檢測提供數(shù)據(jù)支撐?;谏疃葘W(xué)習(xí)的自組織態(tài)勢感知與決策系統(tǒng)的組成如圖1 所示。
自組織協(xié)同態(tài)勢感知與決策系統(tǒng)的若干個子系統(tǒng)配合工作,自組織地完成多項任務(wù)[3]?;谘诧w彈的自組織算法如下:
圖1 自組織態(tài)勢感知與決策系統(tǒng)組成圖
設(shè)集群中有N 個成員,各個巡飛彈的動力學(xué)模型有如下矩陣表達(dá)形式:
則基于自組織方法的協(xié)同控制問題有如下定義:在每個周期tc=t0+δc內(nèi),求解每個巡飛彈的理想速度矢量,其表達(dá)式如下:
權(quán)值應(yīng)滿足如下關(guān)系:
Ct代表追擊目標(biāo)的權(quán)重系數(shù),追尋不同的目標(biāo)。Ct的表達(dá)式如下:
本文將目標(biāo)價值和摧毀概率引入對目標(biāo)攻擊的權(quán)值。設(shè)每個目標(biāo)都有一個給定的價值Mp以及攻擊時被摧毀的概率Pkp。令:
系統(tǒng)應(yīng)用模式分為線下訓(xùn)練與線上應(yīng)用兩種模式,線下訓(xùn)練主要是指在戰(zhàn)前,通過線下深度學(xué)習(xí)工具(包括樣本訓(xùn)練管理工具與模型訓(xùn)練工具),依次完成訓(xùn)練樣本的導(dǎo)入、目標(biāo)識別/自主決策/任務(wù)規(guī)劃模型訓(xùn)練、模型入庫等過程,使訓(xùn)練后的目標(biāo)識別/自主決策/任務(wù)規(guī)劃模型可以直接應(yīng)用于線上巡飛彈武器平臺。而線上應(yīng)用主要是指巡飛彈武器平臺的應(yīng)用,具體包含以下幾個階段:
在目標(biāo)識別與態(tài)勢感知階段,指揮員通過態(tài)勢感知子系統(tǒng)觀察在該階段生成的戰(zhàn)場態(tài)勢信息,對態(tài)勢進(jìn)行分析與理解。
在作戰(zhàn)任務(wù)決策階段,區(qū)別于傳統(tǒng)輔助決策模式,指揮員不需要依次進(jìn)行選定目標(biāo)、確定作戰(zhàn)任務(wù)、確定攻擊條件、選定關(guān)鍵目標(biāo)和選定目標(biāo)關(guān)鍵點等多個過程的決策。通過作戰(zhàn)任務(wù)自主決策子系統(tǒng),將自動生成針對每個目標(biāo)的作戰(zhàn)任務(wù),指揮員的工作只需要對生成作戰(zhàn)任務(wù)進(jìn)行確認(rèn)與調(diào)整。
在任務(wù)規(guī)劃階段,區(qū)別于傳統(tǒng)指揮員需要進(jìn)行任務(wù)規(guī)劃的模式,指揮員不需要編制作戰(zhàn)方案的每個細(xì)節(jié)。通過協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng)將自動生成作戰(zhàn)方案,指揮員的工作只需要對生成的作戰(zhàn)方案進(jìn)行調(diào)整與確定。
在作戰(zhàn)執(zhí)行與評估階段,指揮員主要對任務(wù)執(zhí)行以及毀傷評估進(jìn)行監(jiān)控。
根據(jù)上述內(nèi)容,將自組織態(tài)勢感知與決策系統(tǒng)應(yīng)用于巡飛彈武器平臺,使指揮員從繁瑣的制定作戰(zhàn)任務(wù)及方案的細(xì)節(jié)中解脫出來,而將精力專注于更高層面的頂層決策上。
自組織態(tài)勢感知與決策系統(tǒng)應(yīng)用視圖如下頁圖2 所示。
通過在地面線下應(yīng)用深度學(xué)習(xí)技術(shù)[4-5]訓(xùn)練協(xié)同態(tài)勢感知與決策模型,然后將訓(xùn)練好的模型部署到彈載線上系統(tǒng)中,分別完成深度目標(biāo)識別[6]、任務(wù)自主決策[7]與任務(wù)規(guī)劃。
在深度目標(biāo)識別模型地面線下學(xué)習(xí)階段,深度學(xué)習(xí)技術(shù)所需的訓(xùn)練樣本,主要來自歷史采集的巡飛彈圖像數(shù)據(jù)與模擬生成的典型圖像數(shù)據(jù),包括紅外傳感器[8]、可見光探測器[9]、雷達(dá)所探測的影像[10],并通過大數(shù)據(jù)集成引擎完成多源異構(gòu)訓(xùn)練數(shù)據(jù)集的集成與規(guī)格化。傳統(tǒng)用于目標(biāo)識別所需的知識庫與目標(biāo)特征庫用于對目標(biāo)識別模型建模,形成初始目標(biāo)識別模型。目標(biāo)識別主要依據(jù)其識別對象的類型而獨立建模的,例如指揮所、雷達(dá)站等目標(biāo)都需要建立其各自獨立的目標(biāo)識別模型,因此,在對目標(biāo)識別模型進(jìn)行訓(xùn)練時,其訓(xùn)練集是依據(jù)其識別對象的類型而選取的,例如在對指揮所目標(biāo)識別模型進(jìn)行訓(xùn)練時,需要選取所有包含了指揮所的影像訓(xùn)練集。其次,需要對模型中的神經(jīng)元的初始參數(shù)進(jìn)行設(shè)置,并且選擇合適的訓(xùn)練算法,以保證識別誤差達(dá)到理想狀態(tài),并且訓(xùn)練過程可以快速收斂。在目標(biāo)識別模型訓(xùn)練后,訓(xùn)練后的模型可以直接應(yīng)用于對目標(biāo)的識別。
在任務(wù)自主決策模型[11]地面線下學(xué)習(xí)階段,深度學(xué)習(xí)技術(shù)所需的訓(xùn)練樣本,主要來自巡飛彈的歷史作戰(zhàn)任務(wù)決策數(shù)據(jù)與典型仿真場景中的作戰(zhàn)任務(wù)決策數(shù)據(jù),并通過大數(shù)據(jù)集成引擎完成多源異構(gòu)訓(xùn)練數(shù)據(jù)集的集成與規(guī)格化。作戰(zhàn)任務(wù)決策最終需要確定對目標(biāo)的監(jiān)視、跟蹤、打擊等作戰(zhàn)任務(wù)[12],因此,任務(wù)決策模型是依據(jù)其作戰(zhàn)任務(wù)的類型建立的,例如,監(jiān)視決策模型、跟蹤決策模型等[13]。因此,在對任務(wù)決策模型進(jìn)行訓(xùn)練時,其訓(xùn)練集也是依據(jù)其決策任務(wù)的類型而選取的,例如,在對監(jiān)視決策任務(wù)模型進(jìn)行訓(xùn)練時,需要選取所有包含了監(jiān)視決策任務(wù)的訓(xùn)練集。其次,需要對模型中神經(jīng)元的初始參數(shù)進(jìn)行設(shè)置,并且選擇合適的訓(xùn)練算法,以保證識別誤差達(dá)到理想狀態(tài),并且訓(xùn)練過程可以快速收斂。在任務(wù)決策模型訓(xùn)練后,訓(xùn)練后的模型可以直接應(yīng)用于任務(wù)決策,將目標(biāo)數(shù)據(jù)、敵情數(shù)據(jù)、我情數(shù)據(jù)及戰(zhàn)場態(tài)勢信息作為任務(wù)決策模型的輸入,可以得到該目標(biāo)采取某種任務(wù)決策的概率,最終實現(xiàn)作戰(zhàn)任務(wù)自主決策。
圖2 自組織態(tài)勢感知與決策系統(tǒng)應(yīng)用模式
在任務(wù)規(guī)劃模型[14]地面線下學(xué)習(xí)階段,深度學(xué)習(xí)技術(shù)所需的訓(xùn)練樣本,主要來自巡飛彈的歷史作戰(zhàn)任務(wù)方案與典型仿真場景中的作戰(zhàn)任務(wù)方案,并通過大數(shù)據(jù)集成引擎完成多源異構(gòu)訓(xùn)練數(shù)據(jù)集的集成與規(guī)格化。作戰(zhàn)任務(wù)規(guī)劃最終需要確定我方裝備的作戰(zhàn)任務(wù),作戰(zhàn)任務(wù)包含了許多組成方面,其中最重要的是選擇最優(yōu)的武器/協(xié)同武器來獲取最佳的殺傷效果,因此,建立的任務(wù)規(guī)劃模型是依據(jù)我方裝備的類型建立的[15],其訓(xùn)練集也是依據(jù)我方裝備類型而選取的,例如,在對巡飛彈武器平臺任務(wù)規(guī)模模型進(jìn)行訓(xùn)練時,需要選取所有包含了該巡飛彈武器平臺與其對應(yīng)的態(tài)勢信息的訓(xùn)練集。其次,需要對模型中神經(jīng)元的初始參數(shù)進(jìn)行設(shè)置,并且選擇合適的訓(xùn)練算法,以保證識別誤差達(dá)到理想狀態(tài),并且訓(xùn)練過程可以快速收斂。在任務(wù)規(guī)劃模型訓(xùn)練后,訓(xùn)練后的模型可以直接應(yīng)用于任務(wù)規(guī)劃的武器裝備選擇。
自組織態(tài)勢感知與決策系統(tǒng)的總體設(shè)計,將為系統(tǒng)的技術(shù)突破、功能實現(xiàn)、產(chǎn)品設(shè)計奠定基礎(chǔ)。通過對基于深度學(xué)習(xí)的態(tài)勢感知與決策系統(tǒng)的深入技術(shù)研究與產(chǎn)品研制,可望使系統(tǒng)在如下幾個方面得到發(fā)展與應(yīng)用:一是向智能化、自主化發(fā)展,使系統(tǒng)變得“會理解、會思考、會決策”;二是向協(xié)同一體、精確作戰(zhàn)方向發(fā)展,有效縮短OODA 時間,提高作戰(zhàn)效能?;谏疃葘W(xué)習(xí)的協(xié)同態(tài)勢感知與決策系統(tǒng)的發(fā)展,不僅可提高巡飛彈武器的態(tài)勢感知能力和精確打擊能力,而且可推廣到其他武器協(xié)同態(tài)勢感知與決策系統(tǒng)的研制,具有很大的軍事、技術(shù)和經(jīng)濟(jì)效益。