馬 駿, 楊鏡宇, 鄒立巖1,
(1. 國(guó)防大學(xué)研究生院, 北京 100091; 2. 國(guó)防大學(xué)聯(lián)合作戰(zhàn)學(xué)院, 北京100091)
作戰(zhàn)體系能力圖譜是在作戰(zhàn)仿真實(shí)驗(yàn)的基礎(chǔ)上,利用可視化技術(shù)對(duì)作戰(zhàn)體系某種能力的直觀表達(dá),是從整體分析作戰(zhàn)體系能力的有效方法。然而,作戰(zhàn)體系能力圖譜的生成,通常需要對(duì)海量實(shí)驗(yàn)方案空間進(jìn)行仿真,以生成不同約束條件下的仿真實(shí)驗(yàn)結(jié)果。同時(shí),作戰(zhàn)仿真系統(tǒng)已發(fā)展為模型逐漸完善、結(jié)構(gòu)日益復(fù)雜、行為不斷演化的復(fù)雜系統(tǒng)。在此基礎(chǔ)上,對(duì)大樣本空間進(jìn)行探索,需要耗費(fèi)巨大的計(jì)算資源,對(duì)某一問(wèn)題的仿真實(shí)驗(yàn)往往需要?dú)v時(shí)數(shù)天甚至數(shù)周。特別是在需要“即時(shí)”得到實(shí)驗(yàn)結(jié)果的緊迫形勢(shì)下,利用復(fù)雜的作戰(zhàn)仿真系統(tǒng)進(jìn)行作戰(zhàn)實(shí)驗(yàn)更是難以達(dá)到需求。
元模型也稱(chēng)代理模型,即“模型的模型”,是復(fù)雜物理模型的簡(jiǎn)化模型。通過(guò)建立元模型的方法,可以在保證實(shí)驗(yàn)精度的前提下,大量減少實(shí)驗(yàn)開(kāi)銷(xiāo)。本文所述的元模型是仿真元模型,通過(guò)獲取作戰(zhàn)仿真系統(tǒng)的輸入輸出,建立逼近仿真系統(tǒng)輸入輸出關(guān)系的映射函數(shù),并以此代替復(fù)雜的作戰(zhàn)仿真系統(tǒng)進(jìn)行實(shí)驗(yàn)分析和探索。
元模型廣泛應(yīng)用于產(chǎn)品設(shè)計(jì)、工業(yè)控制、風(fēng)險(xiǎn)分析等諸多領(lǐng)域。在軍事方面,文獻(xiàn)[3]為評(píng)估戰(zhàn)斗系統(tǒng)性能,建立了戰(zhàn)術(shù)仿真模型的元模型;文獻(xiàn)[4]通過(guò)建立神經(jīng)網(wǎng)絡(luò)元模型,替代了部分仿真模型,并分析了元模型在軍用仿真中的作用;文獻(xiàn)[5]使用神經(jīng)網(wǎng)絡(luò)元模型,提高了復(fù)雜系統(tǒng)仿真效率;文獻(xiàn)[6]使用元模型對(duì)海軍水雷探測(cè)模型進(jìn)行了驗(yàn)證;文獻(xiàn)[7]建立了裝備費(fèi)用評(píng)估元模型;文獻(xiàn)[8]在美空軍建模技術(shù)研究中,提出了綜合運(yùn)用元建模和因果推理技術(shù)的主動(dòng)元建模,用現(xiàn)象學(xué)知識(shí)改進(jìn)元模型質(zhì)量,開(kāi)啟了主動(dòng)元模型研究的新領(lǐng)域。在國(guó)內(nèi),文獻(xiàn)[9]提出了元模型多擬合方法和兩類(lèi)組合元模型,并應(yīng)用于雷達(dá)探測(cè)與跟蹤;文獻(xiàn)[10]建立了支持向量機(jī)主動(dòng)元模型,并應(yīng)用于導(dǎo)彈攻防對(duì)抗;文獻(xiàn)[11]面向作戰(zhàn)實(shí)驗(yàn)分析,提出了智能集成的元建模方法。仿真元模型技術(shù)的發(fā)展為提高復(fù)雜仿真系統(tǒng)效率、快速準(zhǔn)確生成作戰(zhàn)體系能力圖譜提供了有效途徑。
1.1.1 作戰(zhàn)體系能力圖譜
作戰(zhàn)體系能力圖譜,是通過(guò)可視化表現(xiàn)體系能力的方法。美軍認(rèn)為,能力是在特定的標(biāo)準(zhǔn)和條件下,通過(guò)各種方法和手段完成一組任務(wù)后,達(dá)到期望效果的本領(lǐng);效能是在一定條件下,實(shí)現(xiàn)預(yù)定功能、達(dá)成預(yù)定目標(biāo)的程度。相比較而言,能力是對(duì)完成任務(wù)內(nèi)在條件的度量,效能是對(duì)完成任務(wù)效果的度量。對(duì)于作戰(zhàn)體系而言,其能力是體系固有的屬性,以體系能力作為研究對(duì)象和目標(biāo),更能反應(yīng)作戰(zhàn)體系的整體性特點(diǎn)。在作戰(zhàn)體系的層面,能力和效能往往是不可分割的,能力評(píng)價(jià)的基礎(chǔ)是效能,能力通常難以用某些系統(tǒng)的量化的指標(biāo)來(lái)表達(dá),需要用體系效能對(duì)體系能力進(jìn)行描述。
由于作戰(zhàn)體系具有整體、動(dòng)態(tài)、對(duì)抗等特性,作戰(zhàn)體系的能力也隨作戰(zhàn)任務(wù)、環(huán)境、對(duì)手的變化而表現(xiàn)出不確定性,這使得在原理上無(wú)法用定量的方式準(zhǔn)確的描述其能力。體系能力圖譜的方法是基于探索性仿真的思想和數(shù)據(jù)耕耘的框架,針對(duì)體系的某種能力,通過(guò)多維度、大樣本采樣和仿真實(shí)驗(yàn),獲取不同環(huán)境下體系效能的多種度量,并綜合可視化分析技術(shù),以獲得體系該能力的全貌。
1.1.2 元模型
文獻(xiàn)[15]討論了元模型、仿真模型與真實(shí)系統(tǒng)三者之間的關(guān)系,如圖1所示。
圖1 元模型、仿真模型及真實(shí)系統(tǒng)之間關(guān)系Fig.1 Relationship among meta-model, simulation model and real system
真實(shí)系統(tǒng)經(jīng)過(guò)建模生成仿真模型,使用仿真模型的輸入輸出信息擬合產(chǎn)生元模型,然后應(yīng)用元模型對(duì)真實(shí)系統(tǒng)進(jìn)行分析。模型驗(yàn)證時(shí),通過(guò)真實(shí)系統(tǒng)對(duì)仿真模型進(jìn)行檢驗(yàn),通過(guò)仿真模型或真實(shí)系統(tǒng)對(duì)元模型進(jìn)行檢驗(yàn)。
從真實(shí)系統(tǒng)到仿真模型再到元模型的過(guò)程中,真實(shí)系統(tǒng)的輸入輸出關(guān)系得以逐步簡(jiǎn)化、計(jì)算開(kāi)銷(xiāo)逐步減小,但是也造成了對(duì)真實(shí)系統(tǒng)求解的精度損失逐步增大。因此,在應(yīng)用元模型時(shí),應(yīng)充分考慮計(jì)算開(kāi)銷(xiāo)與精度之間的均衡關(guān)系。
元模型的構(gòu)建過(guò)程可以表示為以下四元組:
Metamodel=(,,,)
(1)
式中:為實(shí)驗(yàn)設(shè)計(jì)的方法集合;為仿真實(shí)驗(yàn)的數(shù)據(jù)集合;為元模型類(lèi)型和結(jié)構(gòu)的集合;為元模型評(píng)估方法及標(biāo)準(zhǔn)的結(jié)合。
基于上述描述,元建模(meta-modeling)的基本過(guò)程可概括為:
選定∈,運(yùn)用該實(shí)驗(yàn)設(shè)計(jì)方法,選擇實(shí)驗(yàn)點(diǎn)并運(yùn)行仿真模型,得到仿真實(shí)驗(yàn)結(jié)果數(shù)據(jù);
將數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集;
選定∈,運(yùn)用該元模型類(lèi)型和結(jié)構(gòu),對(duì)進(jìn)行擬合,得到元模型meta-model;
利用中的評(píng)估方法和標(biāo)準(zhǔn),以及測(cè)試數(shù)據(jù)集,對(duì)meta-model進(jìn)行檢驗(yàn)。
1.1.3 集成學(xué)習(xí)
集成學(xué)習(xí)是機(jī)器學(xué)習(xí)的重要分支,通過(guò)構(gòu)建并結(jié)合多個(gè)學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù)。通常,一個(gè)集成學(xué)習(xí)器由多個(gè)基學(xué)習(xí)器組成,每個(gè)基學(xué)習(xí)器可以對(duì)數(shù)據(jù)集從不同角度進(jìn)行描述,形成互補(bǔ)。因此,集成多個(gè)學(xué)習(xí)器的建模方法可以有效提升模型的有效性、泛化性和可信度。
一般情況下,集成學(xué)習(xí)的構(gòu)建需要兩個(gè)步驟:一是訓(xùn)練基學(xué)習(xí)器。為取得較好的集成效果,通常需要基學(xué)習(xí)器盡可能達(dá)到準(zhǔn)確性和多樣性?xún)蓚€(gè)標(biāo)準(zhǔn);二是將基學(xué)習(xí)器按照一定方法結(jié)合起來(lái)。
常用的集成策略包括:均值法、投票法和學(xué)習(xí)法。但是,當(dāng)集成規(guī)模較大時(shí),加權(quán)、平均等方法易造成過(guò)擬合。學(xué)習(xí)法的基本思想是,以若干基學(xué)習(xí)器為一級(jí)學(xué)習(xí)器,將其輸出作為二級(jí)學(xué)習(xí)器的輸入特征,以原始樣本的標(biāo)記為新的標(biāo)記,以此新數(shù)據(jù)集訓(xùn)練二級(jí)學(xué)習(xí)器。通常,按照集成學(xué)習(xí)的結(jié)構(gòu),可以將集成學(xué)習(xí)算法分為Boosting方法、Bagging方法、Stacking方法。
Stacking是學(xué)習(xí)集成法的典型代表,該方法通過(guò)訓(xùn)練二級(jí)學(xué)習(xí)器來(lái)結(jié)合若干一級(jí)基學(xué)習(xí)器。Stacking可以看作是一種通用的集成框架,其結(jié)構(gòu)與Bagging相似,是一種并行集成的方法,與Bagging不同的是,其一級(jí)基學(xué)習(xí)器通常使用異質(zhì)學(xué)習(xí)器,集成策略使用學(xué)習(xí)法,即構(gòu)建二級(jí)學(xué)習(xí)器,如圖2所示。
圖2 Stacking集成算法流程圖Fig.2 Stacking integrated algorithm flow chart
傳統(tǒng)的仿真實(shí)驗(yàn)方法,通常難以處理作戰(zhàn)體系不斷演化的問(wèn)題,不能有效聚焦到影響體系能力的關(guān)鍵因素。作戰(zhàn)體系能力圖譜的生成方法,在大規(guī)模探索性仿真實(shí)驗(yàn)的基礎(chǔ)上,構(gòu)建了一個(gè)多重迭代、逐步聚焦的實(shí)驗(yàn)框架,主要包括線索提煉、數(shù)據(jù)栽培、數(shù)據(jù)收獲、綜合分析等步驟。
其中,線索提煉步驟包括對(duì)實(shí)驗(yàn)問(wèn)題的提煉、能力指標(biāo)的選取、實(shí)驗(yàn)范圍的剪裁、采樣方法的選擇等;數(shù)據(jù)栽培步驟主要包括模型開(kāi)發(fā)、想定部署、仿真樣本生成、仿真實(shí)驗(yàn)運(yùn)行等,通過(guò)該步驟得到生成圖譜所需的數(shù)據(jù)集;數(shù)據(jù)收獲步驟針對(duì)研究問(wèn)題對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行處理,通過(guò)選擇合理的可視化方式,構(gòu)建特定的能力圖譜;綜合分析步驟是根據(jù)生成的作戰(zhàn)體系能力圖譜,對(duì)作戰(zhàn)體系進(jìn)行整體分析,得出分析結(jié)論的過(guò)程。
基于元模型的作戰(zhàn)體系能力圖譜生成方法,是在數(shù)據(jù)栽培環(huán)節(jié),采用構(gòu)建元模型的方法,用元模型代替仿真模型,得到仿真實(shí)驗(yàn)數(shù)據(jù),如圖3所示。因此,構(gòu)建合理的元模型是基于元模型生成作戰(zhàn)體系能力圖譜的研究重點(diǎn)。
圖3 作戰(zhàn)體系能力圖譜生成步驟Fig.3 Generation steps of operational system of systems capability graph
使用元模型解決作戰(zhàn)體系能力圖譜的生成問(wèn)題時(shí),需要解決以下問(wèn)題:一是需要元模型有較高的精度,能有效反應(yīng)仿真模型的特征;二是需要元模型有較強(qiáng)的適應(yīng)性,能夠在不同應(yīng)用條件下有較強(qiáng)的魯棒性;三是需要元建模的過(guò)程有較高的效率,能快速對(duì)大量樣本空間做出探索。本文從以下角度出發(fā),解決上述問(wèn)題:
一方面,通過(guò)Stacking集成學(xué)習(xí)的方法解決元模型的問(wèn)題依賴(lài)性。Stacking集成元模型的構(gòu)建思路是將集成學(xué)習(xí)的基學(xué)習(xí)器由若干“基元模型”代替,而后按照集成學(xué)習(xí)的方法和策略對(duì)基元模型進(jìn)行結(jié)合,生成集成元模型。相比于其他方式,Stacking集成有以下優(yōu)點(diǎn):一是能有效集成多種異質(zhì)元模型,提高模型整體的準(zhǔn)確性和泛化性;二是該方式通過(guò)交叉驗(yàn)證的方法構(gòu)造次級(jí)學(xué)習(xí)器的訓(xùn)練數(shù)據(jù)集,避免了直接使用原始數(shù)據(jù)訓(xùn)練可能造成的過(guò)擬合風(fēng)險(xiǎn)。
另一方面,通過(guò)序貫采樣,平衡采樣次數(shù)和模型精度,可以提高能力圖譜生成效率。訓(xùn)練元模型樣本的規(guī)模和質(zhì)量,將直接影響建模的效率和精度。通常情況下,構(gòu)建元模型只用一次采樣,即一步法,然而,如果一次采樣點(diǎn)較多,則需要多次運(yùn)行仿真模型,降低構(gòu)建集成元模型的效率;如果采樣點(diǎn)較少,則會(huì)影響集成元模型的精度。通過(guò)序貫法逐步增加樣本點(diǎn),不斷更新集成元模型,當(dāng)集成元模型滿(mǎn)足收斂條件時(shí)停止抽樣,合理權(quán)衡模型精度與建模效率。
本文提出的基于序貫采樣策略的Stacking集成元模型構(gòu)建方法如圖4所示。
圖4 基于序貫采樣策略的Stacking集成元模型Fig.4 Stacking integrated meta-model based on sequential sampling strategy
根據(jù)體系能力圖譜生成所需的實(shí)驗(yàn)范圍,選擇適當(dāng)?shù)膶?shí)驗(yàn)設(shè)計(jì)方法,確定若干初始采樣點(diǎn)={,,…,};
使用仿真系統(tǒng),獲取初始采樣點(diǎn)對(duì)應(yīng)的仿真運(yùn)行結(jié)果={,,…,};
建立訓(xùn)練基元模型的初始數(shù)據(jù)集=∪={(,),(,)…(,)};
使用折交叉檢驗(yàn)訓(xùn)練個(gè)基元模型;
將組預(yù)測(cè)結(jié)果與其對(duì)應(yīng)的仿真結(jié)果合并生成二級(jí)模型數(shù)據(jù)集;
訓(xùn)練二級(jí)學(xué)習(xí)器;
用測(cè)試集對(duì)集成元模型的精確度進(jìn)行測(cè)試,達(dá)到要求則結(jié)束訓(xùn)練,否則進(jìn)入下一步;
判斷是否達(dá)到訓(xùn)練次數(shù)或訓(xùn)練時(shí)間的上限,若達(dá)到上限則結(jié)束訓(xùn)練,否則進(jìn)入下一步;
在初始采樣點(diǎn)的基礎(chǔ)上,運(yùn)用序貫采樣策略,確定新的采樣點(diǎn)′;
2.2.1 基元模型的選擇與構(gòu)建
選擇與構(gòu)建基元模型需要同時(shí)考慮各模型的準(zhǔn)確性和多樣性,本文通過(guò)集成多個(gè)異質(zhì)元模型提升模型的多樣性,主要使用多項(xiàng)式響應(yīng)面(polynomial response surface,PRS)模型、Kriging模型、支持向量回歸(support vector regression, SVR)模型、徑向量(radial basis function, RBF)神經(jīng)網(wǎng)絡(luò)模型等元模型,在建立基元模型時(shí),通過(guò)比較或優(yōu)化算法等方式保證其準(zhǔn)確性。
(1) PRS通過(guò)多項(xiàng)式的線性組合,擬合一個(gè)響應(yīng)面,以模擬真實(shí)狀態(tài)曲面。該模型有較好的透明性,在擬合中低維度、低非線性問(wèn)題時(shí)具有一定優(yōu)勢(shì)。當(dāng)數(shù)據(jù)維度較高,采用高階多項(xiàng)式模型時(shí),需要大量樣本才能計(jì)算出所有未知系數(shù)?;谏鲜鎏卣?本文采用探索式方法,分別建立不超過(guò)5階的PRS模型,各階模型中包含交叉項(xiàng)并通過(guò)折交叉驗(yàn)證建立,而后比較各階PRS模型的指標(biāo),選取其中最高的作為組成集成元模型的PRS基元模型。
(2) Kriging是一種基于距離加權(quán)的差值近似法,適用于中低維度的高非線性問(wèn)題,Kriging模型精度較高,可用少數(shù)樣本數(shù)據(jù)逼近真實(shí)模型,對(duì)低維問(wèn)題和高階函數(shù)有較好的性能,但Kriging模型構(gòu)造復(fù)雜,計(jì)算量較大。Jones等人對(duì)Kriging模型進(jìn)行了深入的研究,提出了Kriging模型的全局最優(yōu)化方法,通過(guò)給出的期望改善(expected improvement,EI)均衡全局和局部搜索能力,該方法目前在Kriging建模中應(yīng)用較為廣泛。本文使用基于上述算法的pyKiging工具包,以高斯函數(shù)為相關(guān)函數(shù),通過(guò)粒子群優(yōu)化(partical swarm optimization,PSO)算法對(duì)參數(shù)進(jìn)行優(yōu)化,建立Kriging基元模型。
(3) SVR是支持向量機(jī)(support vector machine,SVM)的一種實(shí)現(xiàn)方式,與傳統(tǒng)回歸模型相似,其基本思想是求解一個(gè)最優(yōu)的超平面,使所有樣本點(diǎn)到該超平面的誤差最小。SVR模型在解決小樣本高維問(wèn)題時(shí)有一定優(yōu)勢(shì)。在構(gòu)建SVR模型時(shí),選擇不同核函數(shù)會(huì)影響模型的精度,通常,選用核函數(shù)有兩種方式:一是對(duì)數(shù)據(jù)集的特征有一定先驗(yàn)知識(shí)的情況下,基于先驗(yàn)知識(shí)選擇核函數(shù);二是通過(guò)試用不同的核函數(shù),選擇使用誤差最小的核函數(shù)。在解決不同問(wèn)題時(shí),各數(shù)據(jù)集特征有較大差異,因此本文采用第二種方法,以線性核函數(shù)、多項(xiàng)式核函數(shù)、RBF核函數(shù)、Sigmoid核函數(shù)分別建立SVR模型,選擇指標(biāo)最好的核函數(shù),建立SVR基元模型。
(4) RBF神經(jīng)網(wǎng)絡(luò)模型相比于使用核方法的SVR更適合大樣本及高特征維度的數(shù)據(jù)情況。此外,文獻(xiàn)[22]證明了相比于BP神經(jīng)網(wǎng)絡(luò),RBF神經(jīng)網(wǎng)絡(luò)是連續(xù)函數(shù)的最佳逼近方式。在RBF神經(jīng)網(wǎng)絡(luò)中,常選擇高斯徑向基函數(shù),建立RBF神經(jīng)網(wǎng)絡(luò)需要求解基函數(shù)中心點(diǎn)、方差、隱含層到輸出層的權(quán)重等參數(shù),常用的求解方法有3種:一是自組織選取中心的學(xué)習(xí)方法,該方法首先通過(guò)無(wú)監(jiān)督學(xué)習(xí)求解中心點(diǎn)及方差,而后通過(guò)有監(jiān)督學(xué)習(xí)求解隱含層到輸出層的權(quán)重;二是直接計(jì)算法,通過(guò)隨機(jī)在樣本中選取中心點(diǎn),計(jì)算相關(guān)參數(shù),該方法通常用于數(shù)據(jù)分布有明顯代表性的場(chǎng)景;三是有監(jiān)督學(xué)習(xí)的方法,通過(guò)訓(xùn)練樣本獲取滿(mǎn)足要求的網(wǎng)絡(luò)參數(shù),與BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)原理相同,常采樣梯度下降等方法修正誤差。本文采取第3種方法建立RBF神經(jīng)網(wǎng)絡(luò)基元模型。
2.2.2 二級(jí)模型的選擇與構(gòu)建
二級(jí)學(xué)習(xí)器在很大程度上影響了Stacking集成學(xué)習(xí)的泛化能力,二級(jí)學(xué)習(xí)器的輸入特征,即一級(jí)基元模型的輸出特征,非常接近數(shù)據(jù)的真實(shí)標(biāo)記,使用簡(jiǎn)單的模型作為二級(jí)學(xué)習(xí)器可以降低過(guò)擬合風(fēng)險(xiǎn)。
文獻(xiàn)[23]建議使用線性回歸作為二級(jí)學(xué)習(xí)器的算法。線性回歸模型是最基礎(chǔ)的回歸模型,模型復(fù)雜度低,它通過(guò)連續(xù)的直線、平面或超平面擬合數(shù)據(jù)集,使得訓(xùn)練數(shù)據(jù)集的殘差最小,能高效解決數(shù)據(jù)間有線性相關(guān)特征的問(wèn)題。因此,本文選擇線性回歸模型建立二級(jí)學(xué)習(xí)器模型,對(duì)上述4個(gè)基元模型進(jìn)行組合。
Stacking集成方法以?xún)蓪咏Y(jié)構(gòu)在增強(qiáng)學(xué)習(xí)效果的同時(shí)確保模型不過(guò)于復(fù)雜冗余。本文基于Stacking的基元模型集成過(guò)程如圖5所示,其整體過(guò)程可分為兩步。
圖5 基于Stacking的元模型集成Fig.5 Meta-model integration based on Stacking
訓(xùn)練第1層共個(gè)基元模型,利用各基元模型生成組訓(xùn)練集預(yù)測(cè)值和測(cè)試集預(yù)測(cè)值。該步驟中,對(duì)每個(gè)基元模型的訓(xùn)練和預(yù)測(cè)都基于折交叉驗(yàn)證的思想,Stacking方法常用=5,該步驟具體過(guò)程如下:
取基元模型∈,執(zhí)行以下步驟;
將訓(xùn)練集劃分為份,記為,,…,,
使用至訓(xùn)練基元模型;
重復(fù)步驟1.1~步驟1.6,遍歷所有個(gè)基元模型。
訓(xùn)練第2層集成模型。
根據(jù)步驟1中個(gè)基元模型形成的訓(xùn)練集預(yù)測(cè)值{Train,Train,…,Train}和測(cè)試集預(yù)測(cè)值{Test,Test,…,Test},分別組合形成第2層模型的訓(xùn)練集和測(cè)試集;
使用上述數(shù)據(jù)集訓(xùn)練二級(jí)模型。
本節(jié)首先明確的集成元模型擬合不確定性檢驗(yàn)標(biāo)準(zhǔn),確定序貫采樣點(diǎn)的選擇方法;而后在初始采樣規(guī)模、方法、及序貫采樣步驟等方面明確集成元模型的序貫采樣策略。
2.4.1 集成元模型擬合不確定性檢驗(yàn)方法
通常,使用元模型的情況有兩種:一是預(yù)測(cè),通過(guò)建立元模型預(yù)測(cè)未知輸入情況下系統(tǒng)的響應(yīng);二是優(yōu)化,通過(guò)元模型快速分析使系統(tǒng)獲得最佳響應(yīng)的輸入條件。對(duì)應(yīng)上述情況,元模型的序貫采樣通常包括兩種思路:一是尋找元模型擬合精度較差的范圍,在該范圍內(nèi)增加采樣點(diǎn),以提高元模型整體擬合精度;二是在現(xiàn)有元模型取得的極值點(diǎn)的附近增加采樣點(diǎn),提高元模型在極值附近的擬合精度。
本文建立集成元模型的目的是生成作戰(zhàn)體系能力圖譜,需要對(duì)大量方案做出預(yù)測(cè),因此,需要提高模型在取值范圍內(nèi)的整體擬合精度。對(duì)于集成元模型而言,各基元模型的預(yù)測(cè)能力存在一定的差異,將這種差異定義為集成元模型的擬合不確定性(meta model uncertainty)。文獻(xiàn)[24]提出了用多個(gè)元模型在設(shè)計(jì)空間內(nèi)各點(diǎn)預(yù)測(cè)值的標(biāo)準(zhǔn)偏差來(lái)檢驗(yàn)擬合不確定性:
(2)
(3)
式(3)計(jì)算結(jié)果較大的區(qū)域表明各基元模型預(yù)測(cè)差異大,則在該區(qū)域增加采樣點(diǎn),以提高預(yù)測(cè)精度。
2.4.2 初始采樣規(guī)模
初始采樣規(guī)模影響直接影響初始模型構(gòu)建的效率和精度,關(guān)于采樣規(guī)模的研究越來(lái)越多。文獻(xiàn)[25]比較了不同采樣規(guī)模對(duì)元模型預(yù)測(cè)精度的影響。文獻(xiàn)[26]建議初始采樣規(guī)模應(yīng)是問(wèn)題維度的10倍,文獻(xiàn)[27]證明了該建議的可行性。文獻(xiàn)[28]建議采樣規(guī)模為2(+1),其中為問(wèn)題維度。文獻(xiàn)[29]通過(guò)對(duì)變量空間的角點(diǎn)進(jìn)行采樣,建議初始采樣規(guī)模為2。文獻(xiàn)[30]建議初始采樣規(guī)模應(yīng)設(shè)置為max{2(+1),01},其中為總評(píng)價(jià)次數(shù)。文獻(xiàn)[31]建議采樣規(guī)模不應(yīng)超過(guò)問(wèn)題維度的20倍。文獻(xiàn)[32]建議如果問(wèn)題維度小于20維,則采樣規(guī)模不應(yīng)超過(guò)500;如果問(wèn)題維度大于20維,則采樣規(guī)??纱笥?00。
綜合上述分析,由于在作戰(zhàn)實(shí)驗(yàn)想定方案探索時(shí),通常會(huì)聚焦于特定范圍,問(wèn)題維度不會(huì)過(guò)高,本文初始采樣規(guī)模選定為問(wèn)題維度的20倍。
2.4.3 初始采樣方法
常用的采樣方法有蒙特卡羅采樣、正交采樣、拉丁超立方采樣、均勻采樣等。其中,拉丁超立方采樣(Latin hypercube sampling,LHS)作為一種全空間的采樣方法,是一種以分層采樣為理論基礎(chǔ)并在此基礎(chǔ)上隨機(jī)均勻布置采樣點(diǎn)的采樣方法,能夠通過(guò)較少的樣本獲得較高的精度,是目前應(yīng)用最為廣泛的一種采樣方法。本文采用LHS建立初始訓(xùn)練樣本。
LHS的基本步驟如下。
確定采樣規(guī)模;
將維空間中每個(gè)變量(=1,2,…,)的取值范圍劃分為等大小、等概率的個(gè)分層;
在每個(gè)變量的各分層中隨機(jī)抽取一個(gè)數(shù)值;
將步驟3中各變量隨機(jī)選取的數(shù)值組合,即產(chǎn)生一個(gè)樣本點(diǎn);
重復(fù)步驟3和步驟4,產(chǎn)生個(gè)樣本點(diǎn)。
LHS在每個(gè)分層進(jìn)行采樣,在采樣規(guī)模較小的情況下,保證了樣本點(diǎn)能夠較全面的反應(yīng)空間的整體信息,此外,其隨機(jī)抽樣的方式無(wú)需對(duì)樣本點(diǎn)規(guī)模做出限制,有較強(qiáng)的通用性。
2.4.4 序貫采樣步驟
以擬合不確定性為檢驗(yàn)指標(biāo),指導(dǎo)集成元模型的序貫采樣和更新,其基本流程如下。
根據(jù)問(wèn)題維度確定初始采樣規(guī)模;
按照LHS方法,確定個(gè)初始樣本點(diǎn);
調(diào)用仿真系統(tǒng),獲取初始樣本集;
訓(xùn)練各基元模型和集成元模型;
利用LHS方法,產(chǎn)生個(gè)檢驗(yàn)點(diǎn);
利用式(3)計(jì)算個(gè)檢驗(yàn)點(diǎn)上集成元模型的擬合不確定性,尋找集成元模型不確定值最大的個(gè)檢驗(yàn)點(diǎn);
調(diào)用仿真系統(tǒng),獲取個(gè)點(diǎn)的仿真結(jié)果,并將該點(diǎn)集及仿真結(jié)果作為序貫采樣點(diǎn)加入原樣本集中,形成新的訓(xùn)練樣本集;
重復(fù)執(zhí)行步驟4~步驟7,直至滿(mǎn)足收斂條件。
收斂條件根據(jù)具體問(wèn)題,對(duì)集成元模型的精度、訓(xùn)練時(shí)間或訓(xùn)練次數(shù)做出限定,其判斷步驟如圖3所示。
3.1.1 實(shí)驗(yàn)想定
以紅方在某重點(diǎn)關(guān)注海域內(nèi)對(duì)藍(lán)方某型時(shí)敏目標(biāo)的指示能力、打擊能力的分析任務(wù)為背景,生成紅方作戰(zhàn)體系對(duì)該重點(diǎn)關(guān)注海域內(nèi)的作戰(zhàn)能力圖譜。實(shí)驗(yàn)依托“體系仿真試驗(yàn)床”系統(tǒng)進(jìn)行,紅方部署任務(wù)區(qū)域相關(guān)的作戰(zhàn)力量,主要包括相關(guān)天基預(yù)警裝備和通信裝備、對(duì)目標(biāo)實(shí)施打擊的遠(yuǎn)程打擊裝備,并建立完善的指揮控制體系;藍(lán)方主要包括活動(dòng)于紅方重點(diǎn)關(guān)注海域的艦艇目標(biāo)及相關(guān)探測(cè)和攔截裝備。
3.1.2 實(shí)驗(yàn)方案
紅方作戰(zhàn)體系對(duì)重點(diǎn)關(guān)注區(qū)域的目標(biāo)指示能力和打擊能力隨對(duì)抗環(huán)境的差異在三維物理空間內(nèi)有不同的分布,并隨作戰(zhàn)進(jìn)程的推進(jìn)不斷變化。對(duì)該區(qū)域按照熱圖與基于地理信息的可視化方法生成能力圖譜,將紅方重點(diǎn)關(guān)注區(qū)域分為×個(gè)區(qū)塊,通過(guò)對(duì)每個(gè)區(qū)塊進(jìn)行仿真,計(jì)算區(qū)塊內(nèi)能力指標(biāo)(如目標(biāo)指示能力)數(shù)值,根據(jù)數(shù)值大小對(duì)區(qū)塊進(jìn)行著色,形成該區(qū)域的能力圖譜,通過(guò)生成不同條件下的能力圖譜,分析體系的整體能力。圖6為生成體系能力圖譜的示意圖。
圖6 生成作戰(zhàn)體系能力圖譜示意圖Fig.6 Schematic diagram of generating operational system of systems capability graph
使用該分析方法,將本想定的關(guān)注區(qū)域,按照地理坐標(biāo)經(jīng)緯度每一定度數(shù)劃分為一個(gè)區(qū)塊,共劃分52×42個(gè)區(qū)塊,形成2 184組方案,每組方案進(jìn)行一次仿真實(shí)驗(yàn),實(shí)驗(yàn)時(shí)分別對(duì)目標(biāo)指示(target indicate,TI)能力、目標(biāo)打擊(target strike,TS)能力指標(biāo)進(jìn)行統(tǒng)計(jì)。
其中,目標(biāo)指示能力TI反映了紅方體系從發(fā)現(xiàn)目標(biāo)、正確判斷目標(biāo)直至將目標(biāo)信息發(fā)送到武器平臺(tái)的能力,本文采用一定時(shí)間段內(nèi)武器裝備接受到的有效目標(biāo)指示時(shí)長(zhǎng)計(jì)算該指標(biāo),具體方法為
(4)
式中:為有效的目標(biāo)指示時(shí)間段的時(shí)長(zhǎng);為有效的目標(biāo)指示總次數(shù);為作戰(zhàn)總時(shí)長(zhǎng)。
目標(biāo)打擊能力TS反應(yīng)了紅方體系對(duì)藍(lán)方目標(biāo)形成有效毀傷的能力,本文采用對(duì)藍(lán)方目標(biāo)的命中率計(jì)算該指標(biāo),具體方法為
(5)
式中:為紅方命中目標(biāo)的導(dǎo)彈數(shù)量;為紅方發(fā)射的導(dǎo)彈總數(shù)。
使用上述數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),建立集成元模型,對(duì)元模型的各項(xiàng)性能進(jìn)行評(píng)價(jià)。
313 評(píng)價(jià)指標(biāo)
在生成作戰(zhàn)能力體系圖譜的基礎(chǔ)上,分別從準(zhǔn)確性、魯棒性?xún)蓚€(gè)方面,評(píng)價(jià)該方法在生成作戰(zhàn)體系能力圖譜時(shí)的有效性。
(1) 準(zhǔn)確性指標(biāo)采用擬合優(yōu)度為評(píng)價(jià)指標(biāo),計(jì)算方法如下:
(6)
分析本文提出方法在生成作戰(zhàn)體系能力圖譜的應(yīng)用中相比于其他模型的預(yù)測(cè)精度。
(2) 魯棒性指標(biāo)計(jì)算
(7)
計(jì)算該模型對(duì)于目標(biāo)指示能力TI和目標(biāo)打擊能力TS兩種不同應(yīng)用時(shí)的魯棒性指標(biāo),分析模型對(duì)不同應(yīng)用環(huán)境的適應(yīng)性。
式(7)以方差衡量數(shù)據(jù)離散程度,在計(jì)算元模型對(duì)不同應(yīng)用場(chǎng)景的預(yù)測(cè)精度的基礎(chǔ)上,計(jì)算各精度值的方差,方差越小,說(shuō)明元模型對(duì)各場(chǎng)景預(yù)測(cè)精度的離散程度越小,則魯邦性越強(qiáng)。
針對(duì)TI和TS兩種能力,分別各取4種作戰(zhàn)態(tài)勢(shì)條件進(jìn)行分析,共形成8組測(cè)試數(shù)據(jù)。生成作戰(zhàn)體系能力圖譜如圖7所示。
圖7 作戰(zhàn)體系TI能力和TS能力圖譜Fig.7 Capability graph of TI and TS of operational system of systems
圖7中,第1行和第3行為不同案例下體系TI能力和TS能力的仿真實(shí)驗(yàn)結(jié)果,第2行和第4行分別為使用Stacking集成元模型對(duì)相應(yīng)案例的預(yù)測(cè)結(jié)果,實(shí)驗(yàn)時(shí)設(shè)定集成模型預(yù)測(cè)精度達(dá)到90%,或序貫抽樣次數(shù)達(dá)到10次停止訓(xùn)練。從圖7中可以看出,在不超過(guò)10次序貫抽樣的條件下,預(yù)測(cè)模型能有效反映出體系能力的整體趨勢(shì)。
為消除隨機(jī)誤差,對(duì)每組樣本各訓(xùn)練20次,統(tǒng)計(jì)在各組測(cè)試數(shù)據(jù)條件下,的均值、標(biāo)準(zhǔn)差,具體數(shù)據(jù)如表1所示。
表1 各元模型對(duì)不同應(yīng)用案例的預(yù)測(cè)準(zhǔn)確性
從表1中可知,本文提出的Stacking集成元模型在大多數(shù)情況下都能表現(xiàn)出最好的預(yù)測(cè)準(zhǔn)確性,在TI和TS種能力的案例3中,SVR元模型預(yù)測(cè)準(zhǔn)確度略高與Stacking集成元模型,但僅分別高出0.007 8和0.004 2,相差不大,且Stacking元模型在多次運(yùn)行中的方差較小。各元模型在不同應(yīng)用案例下的預(yù)測(cè)準(zhǔn)確性分布如圖8所示,可見(jiàn),在不同應(yīng)用案例下,Stacking集成元模型均有較好的表現(xiàn)。
圖8 各元模型對(duì)不同應(yīng)用案例的預(yù)測(cè)準(zhǔn)確性分布圖Fig.8 Prediction accuracy distribution of each metamodel for different application cases
根據(jù)式(7),分別計(jì)算各元模型在TI和TS兩種應(yīng)用下對(duì)4個(gè)不同方案預(yù)測(cè)準(zhǔn)確度的魯棒性,并綜合計(jì)算各元模型對(duì)8個(gè)方案的魯棒性,其值如表2所示。可知,本文提出的Stacking集成元模型對(duì)各數(shù)據(jù)集的預(yù)測(cè)準(zhǔn)確度的魯棒性最強(qiáng),說(shuō)明與其他模型相比,該模型在各場(chǎng)景的應(yīng)用中,預(yù)測(cè)精度較為穩(wěn)定。
表2 各元模型在不同案例中的魯棒性
作戰(zhàn)體系能力圖譜是通過(guò)可視化的方法對(duì)體系能力進(jìn)行整體分析的有效手段。生成作戰(zhàn)體系能力圖譜需要對(duì)海量實(shí)驗(yàn)方案進(jìn)行仿真,難以滿(mǎn)足時(shí)效性要求。本文提出了基于Stacking集成元模型的作戰(zhàn)體系能力圖譜生成方法,一方面通過(guò)Stacking集成學(xué)習(xí)解決元模型在不同應(yīng)用條件下魯棒性較差的問(wèn)題,另一方面通過(guò)使用序貫采樣策略解決精度與效率的矛盾問(wèn)題。通過(guò)實(shí)驗(yàn)分析,證明了方法的有效性,為快速準(zhǔn)確生成作戰(zhàn)體系能力圖譜,分析作戰(zhàn)體系能力提供了方法。