劉詩(shī)瑤,王 明,習(xí)朝輝,程春陽(yáng),梁百川,姜明霞
(北方自動(dòng)控制技術(shù)研究所,太原 030006)
隨著人工智能技術(shù)在軍事領(lǐng)域廣泛應(yīng)用,世界軍事強(qiáng)國(guó)在地面無(wú)人自主系統(tǒng)裝備及技術(shù)領(lǐng)域保持高速發(fā)展[1],戰(zhàn)爭(zhēng)形態(tài)正在由機(jī)械化、信息化向智能化加速變革,智能無(wú)人系統(tǒng)作戰(zhàn)將成為一種新型作戰(zhàn)樣式主導(dǎo)未來(lái)戰(zhàn)場(chǎng)。無(wú)人戰(zhàn)車(chē)作為未來(lái)陸軍地面突擊的新質(zhì)戰(zhàn)斗力量,需要具備自主作戰(zhàn)能力,而目標(biāo)威脅評(píng)估是無(wú)人戰(zhàn)車(chē)完成自主作戰(zhàn)的重要環(huán)節(jié)。目標(biāo)威脅評(píng)估是對(duì)戰(zhàn)場(chǎng)環(huán)境中敵方目標(biāo)的威脅程度進(jìn)行科學(xué)合理的評(píng)估,并給出威脅等級(jí)排序[2]。目標(biāo)威脅評(píng)估具有復(fù)雜性、動(dòng)態(tài)性、不確定性等特點(diǎn),本質(zhì)上屬于不確定性決策范疇。對(duì)于傳統(tǒng)的有人裝甲戰(zhàn)車(chē),目標(biāo)威脅評(píng)估主要是依靠車(chē)炮長(zhǎng)乘員主觀評(píng)估,可能會(huì)由于作戰(zhàn)經(jīng)驗(yàn)、心理素質(zhì)和生理?xiàng)l件等方面的原因?qū)е略u(píng)估不準(zhǔn)確。對(duì)于未來(lái)的無(wú)人裝甲戰(zhàn)車(chē),目標(biāo)威脅評(píng)估迫切需要通過(guò)人工智能技術(shù)來(lái)實(shí)現(xiàn)。相比于空中戰(zhàn)場(chǎng)和海上戰(zhàn)場(chǎng),陸戰(zhàn)場(chǎng)地形更加復(fù)雜,環(huán)境不確定性更高。如何在高動(dòng)態(tài)環(huán)境、強(qiáng)博弈對(duì)抗條件下實(shí)現(xiàn)對(duì)無(wú)人戰(zhàn)車(chē)目標(biāo)威脅評(píng)估具有很大挑戰(zhàn)性。
目前,目標(biāo)威脅評(píng)估方法可以分為兩大類(lèi)[3]:一類(lèi)是基于數(shù)學(xué)解析模型的定量方法,如對(duì)策論、多屬性決策方法等,優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單[4],缺點(diǎn)是評(píng)估模型完全依靠人工構(gòu)建,受人為主觀因素影響大;另一類(lèi)是基于人工智能的推理方法,如人工神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)(BN)[5-6]等,優(yōu)點(diǎn)是適用于處理不確定性決策問(wèn)題,目前已有部分研究將貝葉斯網(wǎng)絡(luò)應(yīng)用于空中作戰(zhàn)目標(biāo)的威脅評(píng)估。對(duì)目標(biāo)威脅評(píng)估的研究主要集中于空中戰(zhàn)場(chǎng)[7-8]和海上戰(zhàn)場(chǎng),對(duì)陸戰(zhàn)場(chǎng)的目標(biāo)威脅評(píng)估研究較少,且大多是靜態(tài)目標(biāo)威脅評(píng)估。由于靜態(tài)目標(biāo)威脅評(píng)估方法受當(dāng)前時(shí)刻的觀測(cè)精確度影響較大,錯(cuò)誤的觀測(cè)信息會(huì)對(duì)評(píng)估結(jié)果造成較大誤差,因此,亟需研究動(dòng)態(tài)目標(biāo)威脅評(píng)估方法。
由于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)可以克服靜態(tài)評(píng)估帶來(lái)的主觀性和不確定性,更適用于高動(dòng)態(tài)、強(qiáng)對(duì)抗的無(wú)人戰(zhàn)車(chē)作戰(zhàn)環(huán)境,因此,本文提出一種基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的無(wú)人戰(zhàn)車(chē)目標(biāo)威脅評(píng)估方法。首先選取目標(biāo)特征并進(jìn)行模糊處理,其次基于靜態(tài)貝葉斯網(wǎng)絡(luò)(SBN)建立用于威脅評(píng)估的推理模型,然后根據(jù)動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBN)理論對(duì)推理模型在時(shí)間維上進(jìn)行擴(kuò)展,建立動(dòng)態(tài)推理模型,最后結(jié)合算例進(jìn)行仿真驗(yàn)證,并將仿真結(jié)果與SBN 推理結(jié)果進(jìn)行比較。
無(wú)人戰(zhàn)車(chē)目標(biāo)威脅評(píng)估是一個(gè)較為復(fù)雜的問(wèn)題,目標(biāo)的威脅程度主要由目標(biāo)進(jìn)行的作戰(zhàn)任務(wù)及目標(biāo)特性決定,在作戰(zhàn)過(guò)程中,根據(jù)傳感器提供的目標(biāo)信息,在目標(biāo)態(tài)勢(shì)感知的基礎(chǔ)上進(jìn)行威脅評(píng)估。威脅評(píng)估問(wèn)題的本質(zhì)是不確定性決策問(wèn)題,傳統(tǒng)的威脅評(píng)估方法由于對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)信息運(yùn)用不充分,隨意性較大,因而很難保證決策結(jié)果的正確性。貝葉斯網(wǎng)絡(luò)以概率理論與圖論為數(shù)學(xué)基礎(chǔ),能夠很好地解決不確定性問(wèn)題。
利用貝葉斯網(wǎng)絡(luò)進(jìn)行地面目標(biāo)威脅度評(píng)估的基本流程圖如圖1 所示。
圖1 基于貝葉斯網(wǎng)絡(luò)的威脅評(píng)估流程圖
首先對(duì)目標(biāo)進(jìn)行特征提取并對(duì)獲取的目標(biāo)特征進(jìn)行模糊劃分,其次根據(jù)獲取的目標(biāo)特征之間的關(guān)聯(lián)關(guān)系建立其SBN 模型;然后設(shè)計(jì)不同時(shí)間片間的轉(zhuǎn)移概率,將網(wǎng)絡(luò)擴(kuò)展為DBN;再次基于貝葉斯公式和聯(lián)結(jié)樹(shù)算法進(jìn)行推理;最后獲取觀測(cè)節(jié)點(diǎn)狀態(tài)的概率分布情況,根據(jù)判決規(guī)則,輸出目標(biāo)的威脅程度估計(jì)結(jié)果。
運(yùn)用貝葉斯網(wǎng)絡(luò)方法進(jìn)行目標(biāo)威脅評(píng)估,需要獲取合理的目標(biāo)特征信息以構(gòu)造貝葉斯網(wǎng)絡(luò)的證據(jù)節(jié)點(diǎn),并對(duì)目標(biāo)特征信息進(jìn)行模糊處理得到其對(duì)應(yīng)狀態(tài)的隸屬度。
目標(biāo)對(duì)無(wú)人戰(zhàn)車(chē)的威脅度主要取決于主觀上對(duì)我是否具有打擊意圖和客觀上具備的打擊能力兩方面。其中,目標(biāo)打擊意圖需要通過(guò)對(duì)目標(biāo)的類(lèi)型、所攜帶的武器種類(lèi)、武器性能、火力指向、打擊狀態(tài)等作出判斷;打擊能力由目標(biāo)自身的火力打擊能力、敵我相對(duì)距離、我方無(wú)人戰(zhàn)車(chē)的防護(hù)角度等決定。
基于上述分析,本文采取目標(biāo)類(lèi)型、武器種類(lèi)、火力指向、防護(hù)角度、攻擊狀態(tài)、目標(biāo)速度、目標(biāo)距離等7 個(gè)目標(biāo)特征信息來(lái)建立面向無(wú)人戰(zhàn)車(chē)的目標(biāo)威脅評(píng)估模型。
利用貝葉斯網(wǎng)絡(luò)進(jìn)行推理,需要將特征信息轉(zhuǎn)化為對(duì)應(yīng)的各個(gè)狀態(tài)變量的概率值。本文利用模糊數(shù)學(xué)的方法,對(duì)各個(gè)節(jié)點(diǎn)的狀態(tài)變量進(jìn)行模糊分類(lèi),并且利用隸屬度的方法對(duì)觀測(cè)證據(jù)進(jìn)行估算。例如,對(duì)于目標(biāo)速度v 將其劃分為高速、中速與低速3 種狀態(tài),其對(duì)應(yīng)的隸屬度函數(shù)為
圖2 目標(biāo)速度的模糊隸屬函數(shù)圖
運(yùn)用貝葉斯網(wǎng)絡(luò)進(jìn)行威脅評(píng)估的關(guān)鍵是構(gòu)造網(wǎng)絡(luò)結(jié)構(gòu),即根據(jù)目標(biāo)特征建立評(píng)估體系。本節(jié)首先建立SBN 結(jié)構(gòu),然后考慮時(shí)間特性,將其擴(kuò)展為DBN。
圖3 典型的SBN 圖
式中,
即α 為歸一化因子,由X 的父節(jié)點(diǎn)與子節(jié)點(diǎn)共同確定。
綜合分析各特征屬性,得基于SBN 的地面目標(biāo)的威脅評(píng)估模型結(jié)構(gòu)圖G 如圖4 所示。
SBN 未考慮連續(xù)時(shí)間因素的影響,難以準(zhǔn)確評(píng)估動(dòng)態(tài)作戰(zhàn)目標(biāo)的威脅度;而DBN 將SBN 在時(shí)間維上進(jìn)行拓展,能夠根據(jù)多個(gè)時(shí)刻的觀測(cè)值對(duì)某一具體時(shí)刻的狀態(tài)進(jìn)行評(píng)估,因此,評(píng)估結(jié)果更具合理性。
本節(jié)通過(guò)設(shè)計(jì)仿真算例來(lái)驗(yàn)證所提方法的有效性,并將DBN 評(píng)估結(jié)果與SBN 評(píng)估結(jié)果進(jìn)行對(duì)比分析。
本仿真以7 個(gè)敵方目標(biāo)為例,我方無(wú)人戰(zhàn)車(chē)對(duì)敵方目標(biāo)持續(xù)觀測(cè)了3 個(gè)時(shí)間段,得到了每個(gè)時(shí)刻的證據(jù),目標(biāo)觀測(cè)值如表1 所示。
根據(jù)建立的觀測(cè)特征指標(biāo)體系,確定各個(gè)節(jié)點(diǎn)的狀態(tài)集合如下頁(yè)表2 所示。
圖5 基于DBN 的威脅評(píng)估模型
表1 目標(biāo)觀測(cè)值
表2 節(jié)點(diǎn)狀態(tài)集合表
根據(jù)表2 的狀態(tài)集合,以及建立的DBN 結(jié)構(gòu)圖,并根據(jù)專(zhuān)家知識(shí),建立條件概率表(CPT)。本文以威脅度(T)、作戰(zhàn)能力(E)、目標(biāo)意圖(I)3 個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的條件概率表為例進(jìn)行說(shuō)明,如表3 所示。
表3 T、E、I 之間的條件概率表
設(shè)置相鄰時(shí)間片之間的轉(zhuǎn)移概率,以節(jié)點(diǎn)威脅度(T)為例,如表4 所示。
表4 節(jié)點(diǎn)T 不同時(shí)間片間的轉(zhuǎn)移概率表
以初始的條件概率表作為先驗(yàn)概率,利用聯(lián)結(jié)樹(shù)算法[9]進(jìn)行BN 推理,利用梯度下降法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并考慮不同時(shí)間片間的轉(zhuǎn)移概率,得到地面目標(biāo)的DBN 推理結(jié)果,見(jiàn)表5。
對(duì)于敵方目標(biāo)1,不同時(shí)間片的推理結(jié)果見(jiàn)圖6。
考慮使用SBN 進(jìn)行威脅評(píng)估推理,即不考慮相鄰時(shí)間片間的轉(zhuǎn)移概率,得到目標(biāo)1 的威脅評(píng)估推理結(jié)果如下頁(yè)表6 所示。對(duì)比兩種推理結(jié)果中威脅度評(píng)估為高的情況,見(jiàn)圖7 所示。
表5 地面目標(biāo)的DBN 推理結(jié)果
圖6 敵方目標(biāo)1 的威脅評(píng)估推理結(jié)果
針對(duì)目標(biāo)1 的兩次推理,依次采用了DBN 和BN 方法。從實(shí)驗(yàn)結(jié)果中可以看出,DBN 推理出的威脅評(píng)估判定為高的概率更大。通過(guò)對(duì)比可以發(fā)現(xiàn)利用DBN 進(jìn)行威脅評(píng)估推理可以提升推理結(jié)果的準(zhǔn)確率。
表6 目標(biāo)1 的BN 推理結(jié)果
圖7 敵方目標(biāo)1 的SBN 推理和DBN 推理的對(duì)比
從魯棒性的角度來(lái)說(shuō),如果目標(biāo)1 在第3 次觀測(cè)時(shí),出現(xiàn)錯(cuò)誤的觀測(cè)信息。得到目標(biāo)速度(V)的觀測(cè)值為(0.72,0.15,0.03),而實(shí)際情況是V=(0.32,0.61,0.07),這時(shí)根據(jù)DBN 的推理算法,得出的推理結(jié)果為(0.80,0.16,0.04),根據(jù)SBN 的推理算法,得出的推理結(jié)果為(0.73,018,0.09),雖然兩種推理方法得到的威脅評(píng)估推理結(jié)果都為高,但DBN 的推理結(jié)果表示威脅為高的概率更大,說(shuō)明DBN 推理能得到較正確的評(píng)估結(jié)論。這表明與SBN 相比,DBN 對(duì)錯(cuò)誤觀測(cè)信息有較強(qiáng)的濾波性能,魯棒性較高。
本文提出了一種地面無(wú)人作戰(zhàn)系統(tǒng)中評(píng)估地面目標(biāo)威脅的新方法,即充分考慮戰(zhàn)場(chǎng)作戰(zhàn)因素,選取目標(biāo)特征并進(jìn)行了模糊處理,使用BN 方法建立了針對(duì)地面作戰(zhàn)目標(biāo)的威脅評(píng)估模型,并根據(jù)DBN 理論對(duì)模型進(jìn)行拓展,建立了基于DBN 的威脅評(píng)估模型。最后結(jié)合算例進(jìn)行了仿真,將基于SBN 和DBN 兩種方法的推理結(jié)果進(jìn)行了比較,表明基于DBN 的威脅評(píng)估準(zhǔn)確率高、魯棒性強(qiáng),更適用于高動(dòng)態(tài)強(qiáng)對(duì)抗的地面作戰(zhàn)實(shí)際戰(zhàn)場(chǎng)環(huán)境。下一步的研究工作將進(jìn)一步優(yōu)化目標(biāo)特征信息的評(píng)價(jià)體系,并進(jìn)行目標(biāo)威脅評(píng)估的軟件實(shí)現(xiàn)以及與無(wú)人戰(zhàn)車(chē)的聯(lián)合仿真,實(shí)現(xiàn)目標(biāo)威脅評(píng)估方法的實(shí)際應(yīng)用。