代耀宗,沈建京,郭曉峰,廖 鷹
(信息工程大學(xué)理學(xué)院,鄭州 450001)
實(shí)兵對抗演習(xí)是檢驗(yàn)和提高部隊(duì)?wèi)?zhàn)斗力的重要手段[1],作戰(zhàn)效能評估作為實(shí)兵對抗演習(xí)的重要內(nèi)容,其目的是準(zhǔn)確掌握部隊(duì)?wèi)?zhàn)斗力現(xiàn)狀,爭取以最小代價(jià)實(shí)現(xiàn)最大預(yù)期目標(biāo)[2]。當(dāng)前,在實(shí)兵對抗演習(xí)訓(xùn)練中,裁決員直接根據(jù)作戰(zhàn)經(jīng)驗(yàn)對作戰(zhàn)效能進(jìn)行評分,本質(zhì)上是經(jīng)驗(yàn)驅(qū)動(dòng)的效能評估方法,人為因素較多,主觀性強(qiáng),且耗時(shí)長、成本高[3]。隨著高新技術(shù)在軍事領(lǐng)域的應(yīng)用,現(xiàn)代戰(zhàn)爭呈現(xiàn)出前所未有的復(fù)雜性,戰(zhàn)爭態(tài)勢瞬息萬變,戰(zhàn)場數(shù)據(jù)海量增長,要求效能評估有更高的速度和精度,經(jīng)驗(yàn)驅(qū)動(dòng)方法已無法適應(yīng)現(xiàn)代戰(zhàn)爭的要求。
近年來,在效能評估理論研究領(lǐng)域,有學(xué)者將機(jī)器學(xué)習(xí)算法應(yīng)用于作戰(zhàn)效能評估領(lǐng)域,如人工神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)和支持向量機(jī)等。文獻(xiàn)[4-5]將神經(jīng)網(wǎng)絡(luò)運(yùn)用于效能評估,通過仿真證明了方法的可行性,但神經(jīng)網(wǎng)絡(luò)對樣本數(shù)據(jù)量要求高,且需要根據(jù)經(jīng)驗(yàn)設(shè)定相關(guān)參數(shù),訓(xùn)練速度較慢,易陷入局部最優(yōu);文獻(xiàn)[6]針對影響作戰(zhàn)效能的不確定性因素,提出基于灰色模糊貝葉斯網(wǎng)絡(luò)的作戰(zhàn)效能評估模型,該方法需要多方面先驗(yàn)知識(shí)和后驗(yàn)知識(shí),在實(shí)際應(yīng)用中,需大量收集并實(shí)時(shí)更新領(lǐng)域?qū)<业闹R(shí)信息,評估過程較為復(fù)雜;文獻(xiàn)[7]建立了基于支持向量機(jī)的作戰(zhàn)效能評估模型,降低了人為因素的影響,但傳統(tǒng)支持向量機(jī)適用于解決小樣本數(shù)據(jù)問題,算法精度和速度有待提升。
針對經(jīng)驗(yàn)驅(qū)動(dòng)和上述機(jī)器學(xué)習(xí)算法的不足,本文提出數(shù)據(jù)驅(qū)動(dòng)的實(shí)兵對抗演習(xí)作戰(zhàn)效能評估方法,引入最小支持二乘支持向量機(jī)算法(Least Square Support Vector Machine,LS-SVM)構(gòu)建評估模型,評估過程無需人的參與,相關(guān)參數(shù)可以自動(dòng)尋優(yōu),可以有效解決傳統(tǒng)支持向量機(jī)面臨的“維數(shù)災(zāi)難”問題,避免陷入局部最優(yōu),使得訓(xùn)練速度和預(yù)測精度大大提高,最終實(shí)現(xiàn)效能自動(dòng)評估。
經(jīng)驗(yàn)驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)是一組相對的概念。經(jīng)驗(yàn)驅(qū)動(dòng)效能評估,核心是經(jīng)驗(yàn),主要依靠專家知識(shí)和經(jīng)驗(yàn)對作戰(zhàn)效能進(jìn)行評估。數(shù)據(jù)驅(qū)動(dòng)效能評估,核心是數(shù)據(jù),指利用實(shí)兵對抗演習(xí)產(chǎn)生的豐富歷史數(shù)據(jù)對機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練,從而建立效能指標(biāo)和作戰(zhàn)效能之間的非線性關(guān)系。簡單地說,數(shù)據(jù)驅(qū)動(dòng)即從數(shù)據(jù)中直接獲得作戰(zhàn)效能。
如何將專家經(jīng)驗(yàn)和效能通過數(shù)據(jù)聯(lián)系起來,是構(gòu)建數(shù)據(jù)驅(qū)動(dòng)評估模型的關(guān)鍵問題。在經(jīng)驗(yàn)驅(qū)動(dòng)模型中,專家評估效能的依據(jù)是主觀經(jīng)驗(yàn)和作戰(zhàn)數(shù)據(jù),作戰(zhàn)數(shù)據(jù)包括時(shí)間數(shù)據(jù)、兵力數(shù)據(jù)和武器裝備數(shù)據(jù),那么問題可轉(zhuǎn)化為建立作戰(zhàn)數(shù)據(jù)和指標(biāo)的關(guān)系,再通過算法建立指標(biāo)和作戰(zhàn)效能之間的關(guān)系。因此,實(shí)兵對抗演習(xí)效能評估模型有兩個(gè)重要步驟,一是指標(biāo)選擇和量化,二是算法選擇。
根據(jù)實(shí)兵對抗演習(xí)的特點(diǎn),選擇時(shí)間效能、兵力傷亡效能和武器損毀效能作為指標(biāo),并設(shè)計(jì)指標(biāo)量化方法,而后引入LS-SVM算法,通過大量歷史數(shù)據(jù)對算法進(jìn)行訓(xùn)練,當(dāng)輸入一組新的指標(biāo)時(shí),算法可以再現(xiàn)專家知識(shí)和經(jīng)驗(yàn),自動(dòng)評估作戰(zhàn)效能。圖1為經(jīng)驗(yàn)驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)原理圖。
指標(biāo)選擇是效能評估的前提。作戰(zhàn)效能評估和評估對象、評估目的緊密相關(guān),應(yīng)針對作戰(zhàn)效能評估過程中的關(guān)鍵問題選擇效能指標(biāo)[8]。根據(jù)作戰(zhàn)數(shù)據(jù)的特點(diǎn),將作戰(zhàn)效能(E)分為3個(gè)分量指標(biāo)——時(shí)間效能(T)、兵力傷亡效能(Y)和武器損毀效能(W)。圖2為實(shí)兵對抗演習(xí)作戰(zhàn)效能評估指標(biāo)及相關(guān)數(shù)據(jù)圖。相關(guān)數(shù)據(jù)是量化指標(biāo)的依據(jù)。
圖2 作戰(zhàn)效能評估指標(biāo)及相關(guān)數(shù)據(jù)
1.2.1 時(shí)間效能
時(shí)間效能是衡量作戰(zhàn)部隊(duì)是否在規(guī)定時(shí)間內(nèi)完成作戰(zhàn)任務(wù)的指標(biāo),作戰(zhàn)時(shí)間直接影響作戰(zhàn)單位下一步作戰(zhàn)行動(dòng),關(guān)系著戰(zhàn)爭的勝負(fù)[9]。實(shí)兵對抗演習(xí)過程中,分隊(duì)接受任務(wù)有時(shí)間要求,評估員會(huì)考量作戰(zhàn)單元是否在規(guī)定時(shí)間(即任務(wù)完成標(biāo)準(zhǔn)時(shí)間)內(nèi)完成作戰(zhàn)任務(wù)。
量化時(shí)間效能所需作戰(zhàn)數(shù)據(jù)包括任務(wù)持續(xù)時(shí)間記為Ra,標(biāo)準(zhǔn)時(shí)間Rb,接收任務(wù)時(shí)間和任務(wù)完成時(shí)間。其中Ra可由接受時(shí)的時(shí)間和完成任務(wù)時(shí)的時(shí)間計(jì)算而得,Rb由裁決員提前確定。時(shí)間效能量化標(biāo)準(zhǔn)見下頁表1。
表1 時(shí)間效能量化標(biāo)準(zhǔn)
在實(shí)兵對抗演習(xí)結(jié)束后,將任務(wù)實(shí)際完成時(shí)間同任務(wù)完成標(biāo)準(zhǔn)時(shí)間對比,對照表1中的規(guī)則,獲取時(shí)間效能的大小。表2所示實(shí)例中,Ra=25<30=Rb,適用于規(guī)則1,因此,T=1。
表2 時(shí)間效能量化舉例
1.2.2 兵力傷亡效能
兵力傷亡效能是衡量敵我雙方傷亡情況的指標(biāo),兵力傷亡效能不僅和交戰(zhàn)中傷亡比例有關(guān),還與雙方初始投入兵力比例有關(guān)[10]。量化方法見式(1)。
式(1)中,Yr為紅方兵力傷亡效能,Pr和 Pb分別表示紅方投入兵力和藍(lán)方投入兵力;Pbi、Pba、Pbd分別表示戰(zhàn)斗結(jié)束藍(lán)方受傷人數(shù)、健康人數(shù)和死亡人數(shù);Pri、Pra、Prd分別表示戰(zhàn)斗結(jié)束紅方受傷人數(shù)、健康人數(shù)和死亡人數(shù)分別表示戰(zhàn)前藍(lán)方和紅方占總?cè)藬?shù)的比重。
1.2.3 武器損毀效能
武器損毀效能是衡量敵我雙方武器裝備損毀程度的指標(biāo)?!皳p毀”包括武器裝備損傷和毀傷兩種狀態(tài),損傷的武器裝備經(jīng)過修復(fù)后還可以使用,而毀傷后的武器裝備無法修復(fù)。對武器裝備效能的量化,是根據(jù)敵我雙方武器裝備戰(zhàn)斗力消耗計(jì)算的[3]。
戰(zhàn)斗力亦稱作戰(zhàn)能力,是武裝力量遂行作戰(zhàn)任務(wù)的能力,武器裝備是形成部隊(duì)?wèi)?zhàn)斗力的物質(zhì)基礎(chǔ),武器裝備作戰(zhàn)能力是武器裝備的固有能力,是由武器裝備戰(zhàn)術(shù)性能指標(biāo)決定的、客觀的固有屬性。武器裝備戰(zhàn)斗力指數(shù)是對武器裝備作戰(zhàn)能力的一種指數(shù)描述方法,包括5個(gè)方面:打擊力、機(jī)動(dòng)力、防護(hù)力、信息力和保障力(通常被稱為“五力模型”,見圖3)。具體含義如下:
打擊力:射擊武器通過發(fā)射射彈(包括彈藥和定向能),直接作用于目標(biāo)所產(chǎn)生的殺傷力和破壞力。提供摧毀敵方作戰(zhàn)能力的可能。
機(jī)動(dòng)力:提供逃避敵摧毀或毀傷敵的可能,提供了運(yùn)動(dòng)的可能。
防護(hù)力:提供抗擊敵武器裝備軟、硬打擊的可能。
信息力:信息處理類裝備或設(shè)備具有的信息處理能力,提供信息處理能力。
保障力:作戰(zhàn)保障類裝備所具有的,直接對其他武器裝備支援、補(bǔ)給的能力,提供持續(xù)作戰(zhàn)和存在的可能。
圖3 武器裝備戰(zhàn)斗力構(gòu)成
根據(jù)武器裝備打擊力、機(jī)動(dòng)力、防護(hù)力、信息力和保障力數(shù)據(jù),首先計(jì)算單件武器戰(zhàn)斗力指數(shù),而后聚合為單位戰(zhàn)斗力指數(shù),通過分析在交戰(zhàn)過程中敵我雙方武器裝備損傷和毀傷的型號(hào)和數(shù)量,通過量化公式得到武器損毀效能[11-12]。
武器裝備損毀效能量化過程如下:
1)單件武器的戰(zhàn)斗力指數(shù)
式(2)中,Ij表示第 j種武器戰(zhàn)斗力指數(shù),Hj、Mj、Pj、Cj和Sj分別表示為第j種武器裝備的打擊力指數(shù)、機(jī)動(dòng)力指數(shù)、防護(hù)力指數(shù)、信息力指數(shù)和保障力指數(shù),通過大量的實(shí)驗(yàn)得出的相對固定值[1](本文武器裝備戰(zhàn)斗力所需相關(guān)指數(shù)可通過實(shí)兵對抗演習(xí)數(shù)據(jù)庫獲?。?/p>
2)作戰(zhàn)單位戰(zhàn)斗力指數(shù)
作戰(zhàn)單位戰(zhàn)斗力指數(shù)是由單件武器戰(zhàn)斗力指數(shù)自下向上聚合而來,計(jì)算方法如式(3)。
式(3)中,I表示作戰(zhàn)單位總戰(zhàn)斗力指數(shù),Ij表示第j種武器戰(zhàn)斗力指數(shù),n為第j種武器裝備的數(shù)量。
3)武器損毀效能
通過步驟1)和2),得到初始投入武器戰(zhàn)斗力指數(shù)和交戰(zhàn)結(jié)束后敵我雙方損傷和毀傷戰(zhàn)斗力指數(shù)。
式(4)中,Wr為紅方武器損毀效能,Iri和 Iru分別為紅方損傷武器戰(zhàn)斗力指數(shù)和毀傷武器戰(zhàn)斗力指數(shù),Ibi和Ibd分別為戰(zhàn)后藍(lán)方損傷武器戰(zhàn)斗力指數(shù)和毀傷武器戰(zhàn)斗力指數(shù)。Ir和Ib分別表示紅方和藍(lán)方初始戰(zhàn)斗力總指數(shù),和分別表示藍(lán)方戰(zhàn)斗力指數(shù)和紅方戰(zhàn)斗力指數(shù)在總戰(zhàn)斗力指數(shù)中所占比重。
首先通過戰(zhàn)斗力指數(shù)數(shù)據(jù)庫查找表中所列舉的武器裝備5種指數(shù),根據(jù)式(2),計(jì)算出單件武器裝備的戰(zhàn)斗力指數(shù),然后利用式(3)分別計(jì)算出紅方和藍(lán)方初始戰(zhàn)斗力指數(shù)、損傷武器裝備戰(zhàn)斗力指數(shù)和毀傷武器裝備戰(zhàn)斗力指數(shù),最終利用式(4)得到紅方武器裝備損毀效能。
根據(jù)上節(jié),可將實(shí)兵對抗演習(xí)產(chǎn)生的相關(guān)作戰(zhàn)數(shù)據(jù)量化為表3所示的作戰(zhàn)效能評估數(shù)據(jù),這樣便得到了作戰(zhàn)效能評估數(shù)據(jù),為算法的訓(xùn)練和測試做好數(shù)據(jù)準(zhǔn)備。
表3 作戰(zhàn)效能評估數(shù)據(jù)
LS-SVM[12]是由SuyKens J.A.K提出的SVM改進(jìn)算法,基本思想是通過非線性映射將輸入矢量映射到高維特征Hilbert空間,通過一個(gè)線性約束的二次規(guī)劃問題得到全局最優(yōu)解。引入最小線性系統(tǒng)作為損失函數(shù),將原來的不等式約束替換為等式約束,將二次規(guī)劃問題轉(zhuǎn)化為直接求解線性方程組,使其訓(xùn)練速度和預(yù)測精度大大提高。
支持向量機(jī)回歸函數(shù)表達(dá)式:
根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,將不等式約束變?yōu)榈仁郊s束,得到LS-SVM優(yōu)化問題:
式中,ei為樣本誤差項(xiàng),xi為輸入樣本分量,yi為輸出樣本分量,C為懲罰函數(shù),C>0。
引入拉格朗日函數(shù),化為Lagrange對偶問題:
式中,αi為拉格朗日乘子。利用最小二乘法求出α和b,最終得到LS-SVM回歸模型:
在實(shí)兵對抗演習(xí)過程中,效能的評估是專家根據(jù)作戰(zhàn)經(jīng)驗(yàn)評分而得,專家的評價(jià)依據(jù)是特定的作戰(zhàn)環(huán)境下、指揮員指揮戰(zhàn)斗表現(xiàn)和交戰(zhàn)結(jié)果,是一個(gè)整體評價(jià),因此,需要通過引入LS-SVM算法學(xué)習(xí)專家經(jīng)驗(yàn),最終自動(dòng)得出具體的評分結(jié)果。LS-SVM算法具有以下優(yōu)點(diǎn)[13]:
1)實(shí)兵對抗演習(xí)作戰(zhàn)效能評估是一個(gè)多維度、復(fù)雜、非線性評價(jià)問題,LS-SVM算法通過引入核函數(shù),將低維空間內(nèi)非線性的復(fù)雜問題轉(zhuǎn)化為高維空間內(nèi)線性問題,防止“維數(shù)災(zāi)難”的發(fā)生。
2)LS-SVM算法能夠在結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的基礎(chǔ)上有效控制經(jīng)驗(yàn)風(fēng)險(xiǎn)復(fù)雜度,避免過度學(xué)習(xí)現(xiàn)象,將裁決員評價(jià)思想蘊(yùn)含在支持向量上,提升了泛化能力,使評價(jià)模型更加穩(wěn)定。
3)在解決實(shí)際問題時(shí),LS-SVM本質(zhì)上是求解一個(gè)二次凸規(guī)劃問題,能夠在全局范圍求得唯一最優(yōu)解,避免陷入局部最優(yōu)。
從××實(shí)兵對抗演習(xí)數(shù)據(jù)庫中選擇了部分基礎(chǔ)數(shù)據(jù)進(jìn)行了整理,利用上節(jié)指標(biāo)量化方法,最終得到100組數(shù)據(jù),將其中80組作為訓(xùn)練集,其余20組作為測試集。
使用Matlab平臺(tái),構(gòu)建LS-SVM算法。設(shè)置初始參數(shù)α2=1=10,選擇RBF作為核函數(shù),進(jìn)行10次交叉驗(yàn)證,得到仿真結(jié)果,得到最優(yōu)參數(shù)α2=0.18,2.105。仿真輸出如下頁圖4所示,圖5為LS-SVM算法測試集絕對誤差。
圖4 LS-SVM仿真結(jié)果
圖5 LS-SVM測試集絕對誤差
BP神經(jīng)網(wǎng)絡(luò)是整個(gè)人工神經(jīng)網(wǎng)絡(luò)體系中的精華,具有實(shí)現(xiàn)復(fù)雜非線性映射的能力,適合求解內(nèi)部機(jī)制復(fù)雜的問題,為了進(jìn)行算法對比,構(gòu)建BP神經(jīng)網(wǎng)絡(luò)(Back Neural Network)。設(shè)置輸入層神經(jīng)元數(shù)量為3,隱含層為5,輸出層神經(jīng)元的數(shù)量為1,學(xué)習(xí)率η=0.1,最大迭代次數(shù)為15 000次,誤差e=0.015,因輸出值在0~1之間,選擇Singmoid函數(shù)作為傳遞函數(shù)。利用相同的訓(xùn)練集和測試集在Matlab平臺(tái)仿真,經(jīng)過13 s、2 541次迭代后收斂。圖6為訓(xùn)練過程曲線,圖7為BP神經(jīng)網(wǎng)絡(luò)仿真結(jié)果,圖8為BP神經(jīng)網(wǎng)絡(luò)測試集絕對誤差。
圖6 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程
圖7 BP神經(jīng)網(wǎng)絡(luò)仿真結(jié)果
圖8 BP神經(jīng)網(wǎng)絡(luò)測試集絕對誤差
表4 仿真結(jié)果對比
表4為兩種算法仿真結(jié)果對比,LS-SVM仿真期望輸出和實(shí)際輸出平均絕對誤差和平均相對誤差分別為0.034和5.20%,而BP神經(jīng)網(wǎng)絡(luò)平均絕對誤差和平均相對誤差分別為0.062和11.593%,LS-SVM算法精度更高,LS-SVM算法訓(xùn)練時(shí)間為為0.91 s,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間為13 s,顯然,LS-SVM算法具有更高的評估效率。實(shí)驗(yàn)表明,無論是精度還是速度,LS-SVM算法皆更勝一籌,對一場演習(xí)而言,效能誤差在5%左右是可以被接受的,證明基于LS-SVM算法的作戰(zhàn)效能評估方法更加有效。
本文構(gòu)建了數(shù)據(jù)驅(qū)動(dòng)效能評估模型,設(shè)計(jì)了數(shù)據(jù)驅(qū)動(dòng)的實(shí)兵對抗演習(xí)效能評估指標(biāo)及其量化方法,引入LS-SVM算法,通過仿真證明了算法的有效性,該方法可以極大地節(jié)省人力和物力,避免工作中不必要的錯(cuò)誤,提高了工作效率。下一步,將以數(shù)據(jù)驅(qū)動(dòng)效能評估理論為基礎(chǔ),開展作戰(zhàn)態(tài)勢分析和作戰(zhàn)行動(dòng)序列優(yōu)化問題的研究。