劉順利,陳亞生,陳 琳
(1防空兵指揮學(xué)院,鄭州 450052;2南京軍區(qū)軍訓(xùn)和兵種部,南京 210000)
空中目標(biāo)威脅度一般是指敵方對我方保衛(wèi)目標(biāo)侵襲成功的可能性及侵襲成功時可能造成的破壞程度。對敵空中目標(biāo)的威脅度評估和火力單元射擊有利度評估是指揮信息系統(tǒng)區(qū)分兵力、火力的基本依據(jù)。
目前對空中目標(biāo)威脅度的評估模型較多[1-2],為了使模型在設(shè)定的場合有很強(qiáng)的適應(yīng)能力,必須對一些因素作相應(yīng)簡化,因此限定了模型在其他場合的適用性;加之新空中目標(biāo)、新戰(zhàn)場情況等的不斷出現(xiàn),因此使得空中目標(biāo)威脅度評估模型總在不斷研究更新中。Agent[3-4]技術(shù)的發(fā)展為解決模型的適用性提供了有效方法。文中用Agent模型自下而上的建模方式把空中目標(biāo)威脅度評估劃分為多個具有高度自治能力的Agent實體,通過對這些實體和知識庫的維護(hù),實現(xiàn)空中目標(biāo)威脅度評估的通用化、智能化,使空中目標(biāo)威脅度評估更加精確、高效,且能適應(yīng)不同的戰(zhàn)場環(huán)境。
基于Agent的目標(biāo)威脅度評估模型通過和火力分配系統(tǒng)中其他Agent交互得到威脅度估計因素,并模擬人的思維方式對任務(wù)和進(jìn)度進(jìn)行分析,進(jìn)行威脅度評估。根據(jù)空中目標(biāo)威脅度評估的特點(diǎn),建立目標(biāo)威脅度評估模型體系結(jié)構(gòu)如圖1所示,在動態(tài)環(huán)境中,模型以環(huán)境事件作為Agent反應(yīng)的前提,在目標(biāo)支配下,利用強(qiáng)化學(xué)習(xí)方法進(jìn)行在線學(xué)習(xí),產(chǎn)生最優(yōu)動作策略集,也就是空中目標(biāo)威脅度。
空中目標(biāo)威脅度評估的Agent模型可分為感知模塊、意圖模塊、執(zhí)行模塊和知識庫模塊。其中:
態(tài)勢感知模塊負(fù)責(zé)獲取當(dāng)前環(huán)境以及自身內(nèi)部狀態(tài)的認(rèn)知,對目標(biāo)威脅度評估因素和自身任務(wù)、進(jìn)度的分析報告情況與火力分配系統(tǒng)中其他Agent進(jìn)行通信和交互;
意圖模塊主要從知識庫中獲取威脅度評估的因素,并根據(jù)空情和影響空中目標(biāo)威脅度的因素對空中目標(biāo)威脅度產(chǎn)生認(rèn)知,同時修正推理過程中相應(yīng)的權(quán)重;
知識庫模塊主要存儲影響空中目標(biāo)威脅度的因素知識,并通過自身學(xué)習(xí)改變各因素相應(yīng)權(quán)重;
執(zhí)行模塊將系統(tǒng)對目標(biāo)威脅度的認(rèn)知狀態(tài)按照威脅度評估的最優(yōu)化原則生成符合戰(zhàn)場環(huán)境的空中目標(biāo)威脅度評估策略,并對結(jié)果進(jìn)行反饋和修正,根據(jù)自身意圖、動作策略以及對當(dāng)前態(tài)勢的認(rèn)知采取相應(yīng)動作。
圖1 空中目標(biāo)威脅度評估的Agent模型體系結(jié)構(gòu)
1)天氣因素。天候?qū)δ繕?biāo)威脅度的影響主要是降雨、降雪及起霧等情況下。
2)被保衛(wèi)目標(biāo)情況。根據(jù)空襲兵器目標(biāo)選擇將其分為以下五個方面:領(lǐng)導(dǎo)機(jī)構(gòu)與相關(guān)系統(tǒng);關(guān)鍵的生產(chǎn)設(shè)施;與居民日常生產(chǎn)相關(guān)目標(biāo),包括供水系統(tǒng),生產(chǎn)用品供應(yīng)等;與防空力量相關(guān)的目標(biāo);與輿論相關(guān)的目標(biāo)。不同的空襲兵器對不同的被保衛(wèi)目標(biāo)威脅程度不同。
3)目標(biāo)類型。將來襲目標(biāo)按轟炸機(jī)、殲擊轟炸機(jī)、強(qiáng)擊機(jī)、武裝直升機(jī)、隱形飛機(jī)等類型層層細(xì)化到具體機(jī)型。
4)攜彈類型。目標(biāo)攜帶彈藥類型不同其威脅度也不相同。
5)目標(biāo)位置。目標(biāo)位置包括目標(biāo)高度、目標(biāo)距離、目標(biāo)相對于被保衛(wèi)目標(biāo)的航路捷徑投影,這些因素都屬于越小威脅度越大的參數(shù),即高度、距離、航路捷徑越小的目標(biāo)威脅度越大,但都有一個下限值。因此在接收目標(biāo)位置信息后,可以先行對其它因素加權(quán)求取威脅度。
6)目標(biāo)速度??罩心繕?biāo)速度大,則可射擊時間短,其射擊誤差大,目標(biāo)威脅度大;反之,空中目標(biāo)速度小,威脅度小。
7)目標(biāo)架數(shù)??罩心繕?biāo)架數(shù)越多,其威脅度越大;反之則越小。
空中目標(biāo)威脅度評估知識庫中知識為認(rèn)知模型的知識庫,作為初始知識使用,初始值由專家經(jīng)驗及其它權(quán)威數(shù)據(jù)源得出,知識庫中內(nèi)容還應(yīng)該包括在之后自學(xué)過程中產(chǎn)生的新知識。知識庫之間為并行關(guān)系。這里主要構(gòu)建天氣因素、被保衛(wèi)目標(biāo)類型、空中目標(biāo)相對位置知識庫。
2.2.1 空中目標(biāo)在不同天氣條件下威脅度知識庫
空中目標(biāo)在不同天氣條件下威脅度Wt[i]不同。將能見度較好、不影響空襲兵器作戰(zhàn)效能的天氣條件歸類為Wh1,將降雨、降雪、濃霧等能見度低、影響敵空襲兵器空襲效能的天氣條件歸類為Wh2;根據(jù)敵空襲兵器的不同作戰(zhàn)性能將其分為轟炸機(jī)Style1,戰(zhàn)斗機(jī)Style2,強(qiáng)擊機(jī)Style3,武裝直升機(jī)Style4,電子戰(zhàn)飛機(jī)Style5,從陸地或海面發(fā)射的巡航導(dǎo)彈Style6。由于目前戰(zhàn)斗機(jī)設(shè)計性能差距較大,將機(jī)型中具有全天候作戰(zhàn)能力的戰(zhàn)斗機(jī)、性能先進(jìn)載彈量大的轟炸機(jī)等加注A,具有隱身性能的飛機(jī)加注Y;巡航導(dǎo)彈中為多彈頭的加注D,帶核彈頭的加注H;飛機(jī)攜彈種類分為一般對地攻擊炸彈、火箭彈As1,精確制導(dǎo)炸彈或?qū)桝s2,集束炸彈As3,碳纖維彈As4,空對地導(dǎo)彈As5,從空中發(fā)射的巡航導(dǎo)彈為As6,反輻射導(dǎo)彈As7,核彈為As8。其詳細(xì)知識庫設(shè)計略。在這里天時、機(jī)型和彈藥類型由態(tài)勢感知A-gent中感知,經(jīng)過Agent間通信機(jī)制具體將其分類。
2.2.2 空中目標(biāo)對被保衛(wèi)目標(biāo)的威脅度知識庫
敵空襲兵器對被保衛(wèi)目標(biāo)的威脅度Wm[i]各不相同,目標(biāo)類型根據(jù)敵空襲重點(diǎn)的選擇分為國家領(lǐng)導(dǎo)指揮機(jī)構(gòu)Ob1;關(guān)鍵生產(chǎn)設(shè)施Ob2;居民生產(chǎn)設(shè)施Ob3;輿論通信設(shè)施Ob4;地面交通設(shè)施,其中公路、鐵路等地面設(shè)施為Ob5,機(jī)場為Ob6;軍事力量平臺,其中指揮機(jī)構(gòu)為Ob7,武器平臺為Ob8,雷達(dá)系統(tǒng)為Ob9。其詳細(xì)知識庫設(shè)計略。
2.2.3 空中目標(biāo)相對位置威脅度知識庫
空中目標(biāo)在空中點(diǎn)坐標(biāo)由空情報知獲得,其相對位置不同,威脅度Wp[i]也不相同。在這里主要考慮空中目標(biāo)的高度、航路捷徑的影響??紤]這些位置函數(shù)是一種連續(xù)函數(shù),因此,空中目標(biāo)相對位置威脅度也采用連續(xù)函數(shù)表示,而該連續(xù)函數(shù)的系數(shù)采用知識庫表示。這里首先采用模糊數(shù)學(xué)的方法,構(gòu)建威脅度的分布函數(shù),再由分布函數(shù)構(gòu)建出其隸屬函數(shù)。從分布函數(shù)角度而言,各種機(jī)型是一樣的,但它們有別于導(dǎo)彈。
1)空中目標(biāo)在不同高度的威脅度Wh[i]分布如圖2、圖3所示。
圖2 飛機(jī)的高度威脅度
圖3 巡航導(dǎo)彈的高度威脅度
圖中:H[i]為敵機(jī)相對保衛(wèi)目標(biāo)的高度,H[i]以百米為單位。根據(jù)現(xiàn)代空襲兵器的戰(zhàn)術(shù)技術(shù)性能,目標(biāo)高度小于或等于0的可能性較小。模型中,當(dāng)目標(biāo)高度小于或等于0時,認(rèn)為H[i]=0;a、b為系數(shù)。
由圖2和圖3可得高度威脅度Wh[i]為:
2)空中目標(biāo)航路投影捷徑威脅度Wd[i]的分布如圖4、圖5所示。
圖中:dj[i]為來襲敵機(jī)相對保衛(wèi)目標(biāo)的航路捷徑,以百米為單位;c、d為系數(shù)。
圖4 飛機(jī)的航路捷徑威脅度
由圖4和圖5可得航路捷徑威脅度Wd[i]為:
在這里根據(jù)空中目標(biāo)不同建立其高度和航路捷徑的系數(shù)相關(guān)的知識庫(略),同時在知識庫中加入空中目標(biāo)的飛行狀態(tài)和航路方向,其中飛行狀態(tài)分為水平飛行Fs1和俯沖Fs2,其中當(dāng)水平飛行時Fs1取0.3和俯沖時Fs2取0.8;航路方向劃分為臨近Course1和離遠(yuǎn)Course2,其中臨近時Course1取1和離遠(yuǎn)時Course2?。?。
圖5 巡航導(dǎo)彈的航路捷徑威脅度
知識庫的自學(xué)習(xí)采用自適應(yīng)神經(jīng)模糊推理系統(tǒng)[5](ANFIS),該系統(tǒng)是一種用來在給定的輸入輸出數(shù)據(jù)中產(chǎn)生模糊規(guī)則的系統(tǒng)方法。這里以空中目標(biāo)在不同天氣條件下威脅度知識庫為例,說明其工作過程,對其中輸入和輸出作了相應(yīng)的簡化,其工作過程如圖6所示。
第一層是輸入層。其輸入為飛機(jī)類型、攜彈類型和天氣情況,輸出為轟炸機(jī)(S1)、戰(zhàn)斗機(jī)(S2),一般炸彈(As1)、精確制導(dǎo)炸彈(As2),能見度較好(Wh1)、能見度不好(Wh2)。
圖6 空中目標(biāo)在不同天氣條件下威脅度知識庫學(xué)習(xí)算法
第二層為模糊化層。該層采用鐘形激活函數(shù)。
第三層為規(guī)則層。本例中共生成8個規(guī)則。
第四層為歸一化層。該層每個神經(jīng)元接收來自規(guī)則層所有神經(jīng)元的輸入,并計算給定規(guī)則的歸一化激活強(qiáng)度。
第五層是逆模糊層。
第六層表示總和神經(jīng)元。
ANFIS處理問題時,沒有必要給出規(guī)則后項參數(shù)的任何先驗知識,ANFIS會學(xué)習(xí)這些參數(shù)并調(diào)節(jié)成員函數(shù)。ANFIS采用混合學(xué)習(xí)算法,其學(xué)習(xí)的過程融合了最小二乘估算法和梯度下降法,可表示為一個P線性方程。
利用ANFIS學(xué)習(xí)算法,經(jīng)過學(xué)習(xí)可得到轟炸機(jī)攜帶精確制導(dǎo)炸彈在能見度較高的情況下威脅度最大,為0.788,其權(quán)重經(jīng)過學(xué)習(xí)后為0.7822;而戰(zhàn)斗機(jī)攜帶一般炸彈在能見度較低情況下的威脅度較小,為0.213,其權(quán)重經(jīng)過學(xué)習(xí)后為0.112。
評估空中目標(biāo)威脅度的Agent學(xué)習(xí)算法,采用神經(jīng)網(wǎng)絡(luò)方法。首先說明兩點(diǎn):1)由于在現(xiàn)代反空襲作戰(zhàn)中,敵空襲兵器可以全方位發(fā)起攻擊,而且判定目標(biāo)威脅度時,空中目標(biāo)并不處于攻擊段,所以在此模型中暫不考慮空襲兵器主攻方向的因素;2)計算空中目標(biāo)威脅度時,只考慮一批目標(biāo)中只有一架飛機(jī)或一枚巡航導(dǎo)彈,若需考慮一批目標(biāo)中有多個空襲兵器,可在一個空中目標(biāo)的基礎(chǔ)上計算。
圖7 目標(biāo)威脅度評估
第一層為歸一化層,共取3個節(jié)點(diǎn),輸入為各種機(jī)型在天氣、被保衛(wèi)目標(biāo)類型及空中目標(biāo)相對位置的威脅度估計,其輸入由評估因素知識庫輸出值提供;
第二層為BP網(wǎng)絡(luò)輸入層,相應(yīng)也取3個節(jié)點(diǎn);
第三層為隱層,此處取8個節(jié)點(diǎn),輸出特性函數(shù)取S型函數(shù);
第四層為輸出層,取1個節(jié)點(diǎn),輸出特性函數(shù)取S型函數(shù),輸出值即為空中目標(biāo)對被保衛(wèi)目標(biāo)的威脅程度,此處采用(0,1)區(qū)間的連續(xù)數(shù)。
設(shè)網(wǎng)絡(luò)中輸入層權(quán)值為ω1mj(m =1,2,3;j=1,2,…,8),輸入層節(jié)點(diǎn)為o1m(m=1,2,3);中間層的權(quán)值為ω2j(j=1,2,…,8),中間層的節(jié)點(diǎn)值為o2j(j=1,2,…,8),中間層的閥門值為θ2j(j=1,2,…,8);輸出層的閥門值為θ3,輸出層的節(jié)點(diǎn)值也即威脅度值為w。則節(jié)點(diǎn)值的數(shù)學(xué)表達(dá)式為:
威脅度計算主要是用于防空作戰(zhàn)指揮信息系統(tǒng)中對空中目標(biāo)的威脅度進(jìn)行排序,從而為防空兵群火力分配提供基本依據(jù)。為了驗證該模型的有效性,本例采用10個訓(xùn)練樣本(見表1),設(shè)定10個不同種類和不同飛行條件的目標(biāo),其期望威脅度值由專家確定。將表1中的樣本值輸入進(jìn)行BP神經(jīng)網(wǎng)絡(luò)模型的自學(xué)習(xí)訓(xùn)練,得出訓(xùn)練后的權(quán)值和閥門值(見表2)。
表1 樣本數(shù)據(jù)
表2 BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練后的權(quán)值和閥門值
在此選定4個檢驗樣本(見表3)。將表2中的經(jīng)過自學(xué)習(xí)得出的權(quán)值和閥門值代入BP神經(jīng)網(wǎng)絡(luò)模型,對4個檢驗樣本進(jìn)行威脅度計算,得出實際輸出威脅度值。該模型的輸出威脅度與期望威脅度排序一致且誤差均小于0.005,從而驗證了該模型的有效性。
表3 檢驗數(shù)據(jù)
Agent技術(shù)應(yīng)用正處于起步階段,對于一些概念和關(guān)鍵技術(shù)的理解還沒有達(dá)到共識。由于考慮因素的多樣性、全面性,以及自學(xué)習(xí)算法的復(fù)雜性等,實際上利用Agent評估空中目標(biāo)威脅度是非常復(fù)雜的過程,文中重在說明方法和過程,因此對一些情況進(jìn)行了必要的簡化。
[1] 劉己斌.城市防空作戰(zhàn)指揮自動化系統(tǒng)火力分配研究[D].鄭州:防空兵指揮學(xué)院,2001.
[2] 范勇,陳有偉,李為民.彈炮結(jié)合防空武器系統(tǒng)火力分配模型[J].火力與指揮控制,2004,29(3):46-48.
[3] 劉剛.基于智能Agent的動態(tài)協(xié)作任務(wù)求解機(jī)制及應(yīng)用研究[D].北京:鐵道科學(xué)研究院,2006.
[4] 石純一,張偉.基于Agent的計算[M].北京:清華大學(xué)出版社,2007.
[5] [澳大利亞]邁克·耐格納威斯基.人工智能智能系統(tǒng)指南[M].顧力栩,等譯.北京:機(jī)械工業(yè)出版社,2007.