劉戎翔, 吳 琳, 謝智歌, 劉虹麟
(1. 國防大學(xué)聯(lián)合作戰(zhàn)學(xué)院, 北京 100091; 2. 陸軍防化學(xué)院, 北京 102205;3. 軍事科學(xué)院, 北京 100091; 4. 中國人民解放軍海軍參謀部, 北京 100036)
信息化戰(zhàn)爭條件下,制空權(quán)的爭奪顯得越發(fā)重要,指揮員需要在動態(tài)對抗的戰(zhàn)場環(huán)境下,實時對敵方防空體系進行綜合分析。隨著參戰(zhàn)力量及裝備類型的不斷增多,戰(zhàn)場節(jié)奏不斷加快,人類指揮員很難站在體系視角,直接從淺層的態(tài)勢信息直接獲得高層的認知結(jié)果,對敵方防空體系進行綜合評估。因此,迫切需要科學(xué)高效的防空體系態(tài)勢輔助分析工具,輔助指揮員揭開態(tài)勢“迷霧”,在決策速度上搶占先機。
當前防空體系態(tài)勢輔助分析主要存在以下3個方面的問題:一是針對體系進行分析的較少。傳統(tǒng)方法中,一般采用貝葉斯學(xué)習(xí)、規(guī)則庫、隱馬爾可夫模型進行空情態(tài)勢分析,開展意圖識別工作。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,研究人員利用卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等進行態(tài)勢分析,并取得了較好的效果。但是,當前的模型研究大多針對單個平臺的意圖識別,對敵方防空體系能力進行態(tài)勢分析的較少。二是分析結(jié)果難以滿足需求。傳統(tǒng)的防空體系包絡(luò)線不能完整反映防空體系能力,同時基于深度學(xué)習(xí)的態(tài)勢分析模型大多基于數(shù)值標簽對分析結(jié)果進行標注,標簽的可解釋性難以滿足指揮員態(tài)勢分析的需要。三是分析速度有待提高。通常,研究人員基于仿真實驗床進行防空體系分析,分析速度難以滿足輔助指揮員實時指揮決策的需要。
生成對抗網(wǎng)絡(luò)是目前深度學(xué)習(xí)領(lǐng)域中最熱門的研究方向之一,目前已經(jīng)在圖像生成、圖像轉(zhuǎn)換、圖像-文本翻譯、異常檢測和定位等領(lǐng)域獲得了重大突破。生成對抗網(wǎng)絡(luò)包含生成器和判別器兩個部分,通過不斷地對抗訓(xùn)練使模型逼近納什均衡。作為一種生成式模型,生成對抗網(wǎng)絡(luò)可以得到兩個數(shù)據(jù)集間的聯(lián)合概率分布,為體系分析提供了新的思路。
通常,人類指揮員在對防空體系進行分析時,會依據(jù)掌握的武器平臺數(shù)據(jù)、部署位置以及組網(wǎng)情況等態(tài)勢信息,在頭腦中形成一個關(guān)于體系強點與弱點的分布,類似一種利用戰(zhàn)場態(tài)勢數(shù)據(jù)分布擬合態(tài)勢認知結(jié)果數(shù)據(jù)分布的過程。生成對抗網(wǎng)絡(luò)可以在有標簽的條件下實現(xiàn)各類樣本間的相互轉(zhuǎn)換,與人類通過態(tài)勢進行聯(lián)想推斷的機理有相似之處。
因此,為解決當前防空體系態(tài)勢輔助分析中存在的問題,本文基于體系視角,將整個防空體系作為研究對象,構(gòu)建防空體系態(tài)勢輔助分析模型;利用已有的仿真數(shù)據(jù),將防空體系的當前態(tài)勢以及體系能力進行圖形化描述,提高模型的可解釋性;利用生成對抗網(wǎng)絡(luò)模擬指揮員的聯(lián)想推理過程,從態(tài)勢信息直接生成防空體系能力熱圖,大幅提升模型的分析速度,降低指揮員的認知負載,輔助指揮員進行態(tài)勢分析并快速決策。
指揮員在對防空體系進行分析時,需要綜合考慮防空體系中的武器裝備、部署位置、指揮關(guān)系、氣象條件等因素。這些因素間關(guān)聯(lián)關(guān)系復(fù)雜,且信息量巨大,不便于指揮員在快速變化的戰(zhàn)場環(huán)境中準確分析態(tài)勢、定下決心。為此,本文從體系視角,構(gòu)建了防空體系態(tài)勢輔助分析模型,將底層高維的態(tài)勢信息轉(zhuǎn)化為中層低維的態(tài)勢認知產(chǎn)品,為指揮員提供直觀的分析結(jié)果(見圖1)。
圖1 模型應(yīng)用場景示意圖Fig.1 Application scenario of the model
本文將整個防空體系作為一個研究對象,定義防空體系當前態(tài)勢信息為,人類指揮員的態(tài)勢認知結(jié)果為,則人類指揮員基于當前態(tài)勢信息進行防空體系態(tài)勢分析的過程可以抽象為=(),式中,(·)為一個映射函數(shù),模擬了人類指揮員的抽象、推理過程。但是,由于直接從淺層態(tài)勢信息映射到高層認知結(jié)果過于復(fù)雜,(·)很難直接獲得,可以利用計算機輔助模型提供中間層結(jié)果,簡化人類指揮員的認知難度。因此,防空體系態(tài)勢輔助分析模型可以表示為
=′()
(1)
式中:′(·)為模擬人類指揮員的部分抽象、推理過程的映射函數(shù)。
為較準確地獲得′(·),需重點解決兩個問題:一是如何描述態(tài)勢信息及中間層認知結(jié)果,便于指揮員理解并具備可解釋性;二是如何選擇適當?shù)哪P?模擬人類指揮員的抽象推理過程。因此,本文的研究內(nèi)容重點包含兩個方面,即防空體系特征的圖形化描述方法和基于生成對抗網(wǎng)絡(luò)的防空體系能力熱圖生成模型,總體流程如圖2所示。
圖2 模型總體流程圖Fig.2 Working process of the model
防空體系特征描述是防空態(tài)勢輔助分析的基礎(chǔ),只有對防空體系特征進行合理描述,才能更加有利于模型進行防空態(tài)勢輔助分析。目前,研究人員通常采用向量化或圖形化兩種方式描述戰(zhàn)場態(tài)勢。向量化的態(tài)勢描述方法主要通過提取態(tài)勢特征指標,將各個指標拼接為一個1維向量,對當前態(tài)勢進行描述;圖形化的態(tài)勢描述方法主要通過將戰(zhàn)場態(tài)勢圖柵格化,可較好地描述各實體的位置關(guān)系。對比兩種方法,向量化的描述方法包含更多的態(tài)勢特征,但會丟失部分空間特征信息,如:相對位置、網(wǎng)絡(luò)連接關(guān)系等;圖形化的描述方法可以較準確地描述當前態(tài)勢的空間信息,且該種描述方法較向量化方法而言較容易解釋,便于人類指揮員理解。因此,本文綜合已有的向量化和圖形化態(tài)勢信息描述方法,提出一種多層的防空體系態(tài)勢信息圖形化描述方式,通過多個特征圖描述防空體系當前態(tài)勢以及防空體系能力。
令={,,,,,}。其中為戰(zhàn)場環(huán)境信息,包括地形、天氣、風向等特征信息;為實體能力范圍類信息,主要描述所有實體的探測范圍、打擊范圍等范圍信息;為實體能力指標類信息,如實體的反應(yīng)時間、速度等信息;為實體位置信息;為實體類別信息;為實體網(wǎng)絡(luò)拓撲類信息,主要描述防空體系中各實體的組網(wǎng)情況。
利用多層的柵格化圖形進行描述,具體方法為:首先將待分析區(qū)域劃分為×個方格;然后,針對每一個特征層,利用數(shù)值對方格內(nèi)的各類特征信息進行編碼,獲得能力矩陣;最后,將每個分別轉(zhuǎn)換為灰度圖并組合,獲得可以描述的多層灰度圖。部分描述結(jié)果如圖3所示。
圖3 部分特征圖形化描述結(jié)果Fig.3 Partial results of graphical feature
由于表示的是實體各類能力的范圍,其描述方法如下。
特征層直接利用待分析區(qū)域內(nèi)的實體組網(wǎng)情況圖表示,如圖4所示。
圖4 實體組網(wǎng)情況特征圖Fig.4 Feature map of entity networks
此外,其余的各特征層直接利用每個方格內(nèi)各特征信息進行描述,進行歸一化并轉(zhuǎn)換為灰度圖。所有特征圖的最終描述結(jié)果如圖5所示。
圖5 態(tài)勢信息圖形化描述結(jié)果示意Fig.5 Result of situation information graphical description
本文利用熱圖來描述防空體系對敵方飛行目標的攔截情況,用以表征防空體系的能力。相比常用的防空體系能力指標描述法而言,該種描述方式更便于指揮員掌握敵方防空體系能力強弱的空間分布,更有利于指揮員分析敵方防空體系的強點和弱點,進而快速開展指揮決策。防空體系的攔截情況可以通過仿真系統(tǒng)獲得。在獲得一個防空體系部署情況后,首先利用仿真系統(tǒng)進行大規(guī)模實驗,得到每次仿真實驗得到的攔截點分布情況;而后利用計算機圖像生成技術(shù),將該部署情況的攔截點分布轉(zhuǎn)換為能力熱圖,用RGB模式的熱力圖表示,如圖6所示。
圖6 防空體系能力圖形化描述結(jié)果Fig.6 Result of air defense system capability graphical description
生成對抗網(wǎng)絡(luò)作為一種典型的生成模型,可以實現(xiàn)兩個特征空間數(shù)據(jù)的相互轉(zhuǎn)換,例如將一幅圖像轉(zhuǎn)換為特定的風格。該過程可以看作是對人類抽象、聯(lián)想、推理過程的模擬,與指揮員看到態(tài)勢信息后,抽象、推理得到防空體系能力的機理相近似。因此,本文在生成對抗網(wǎng)絡(luò)的基礎(chǔ)上,構(gòu)建防空體系能力熱圖生成模型。以描述當前防空體系態(tài)勢的圖形化特征為輸入,經(jīng)模型分析推理后,直接獲得防空體系能力熱圖,提供態(tài)勢認知的中間層產(chǎn)品,輔助人類指揮員進行態(tài)勢認知。
模型中,生成器主要用于防空體系能力熱圖的生成。生成器的輸入為圖形化描述的防空體系態(tài)勢,特征維度為××,為所有特征的數(shù)量;輸出為防空體系能力熱圖,即態(tài)勢認知的中間層結(jié)果,特征維度為××3。由于≠3,因此生成器首先需要對進行壓縮,然后再進行樣本生成。此外,本文采用帶有跳躍連接的編碼器-解碼器模型U-NET構(gòu)造生成器,使模型在較高的層級可以共享低層級抽取的數(shù)據(jù)特征,防止低層級特征的丟失,進一步提高了輸出數(shù)據(jù)的質(zhì)量和精度。因此,生成器的工作流程為:首先利用1×1的卷積核將壓縮至3維;然后將壓縮后的特征向量輸入U-NET模型中,先進行下采樣后進行上采樣;最終生成防空體系能力特征圖。
定義conv(kn, st, nu)為卷積核大小kn×kn,步長為st,卷積核數(shù)量為nu的卷積層;同理,定義deconv(kn, st, nu)為反卷積層。因此,本文生成器的結(jié)構(gòu)可表示為
編碼器部分:conv(1,1,3)-conv(4,2,64)-conv(4,2,128)-conv(4,2,256)-conv(4,2,512)-conv(4,2,512)-conv(4,2,512)-conv(4,2,512)-conv(4,2,512)
解碼器部分:deconv(4,2,512)-deconv(4,2,512)-deconv(4,2,512)-deconv(4,2,512)-deconv(4,2,512)-deconv(4,2,256)-deconv(4,2,128)-deconv(4,2,64)-deconv(4,2,3)
生成器的結(jié)構(gòu)如圖7所示。
圖7 生成器結(jié)構(gòu)圖Fig.7 Architecture of generator
從圖7中可以看出,編碼器部分低層級的特征(藍色表示)通過跳躍連接與解碼器中對應(yīng)的高層級特征(紅色表示)拼合。此外,編碼器中,前8層采用Leaky-Relu激活函數(shù),最后一層采用tanh激活函數(shù);解碼器中,均采用Relu激活函數(shù)。生成器中,除第一層不采用批歸一化(batch-normalizion, BN)外,其余各層均采用BN處理。
判別器主要用于鑒別生成的是否由生成器生成。由于本文中需要在特定的條件下對應(yīng)的,因此判別器的輸入為與對應(yīng)的拼接,輸出為一個標量,用于判斷的真?zhèn)?。判別器首先也將進行壓縮,而后與相對應(yīng)的進行拼接,并送入一系列卷積層中進行判斷。
判別器的結(jié)構(gòu)可表示為conv(1,1,3)-conv(4,2,64)-conv(4,2,128)-conv(4,2,256)-conv(4,1,512)-conv(4,1,1)。判別器的結(jié)構(gòu)如圖8所示。
圖8 判別器結(jié)構(gòu)圖Fig.8 Architecture of discriminator
判別器中,各層均采用Leaky-Relu激活函數(shù),最后一層為sigmod層。除第一層外其余各層均采用BN處理。
模型的損失函數(shù)主要包含兩個部分:① 生成對抗網(wǎng)絡(luò)的損失函數(shù)L;② 生成器生成的和真實的之間的圖像損失函數(shù)L1。
生成對抗網(wǎng)絡(luò)的最終目標是通過不斷的訓(xùn)練,提高生成器與判別器的能力,使得在判別器能夠較準確地判別樣本真?zhèn)蔚那疤嵯?生成器生成的數(shù)據(jù)令判別器無法判別出數(shù)據(jù)的真?zhèn)?模型從整體上達到納什均衡。本文中,由于生成的與間存在對應(yīng)關(guān)系,因此生成對抗網(wǎng)絡(luò)的損失函數(shù)構(gòu)建參考條件生成對抗網(wǎng)絡(luò)(CGAN),其損失函數(shù)可表示為
L(,)=,[log(,)]+[log(1-(()))]
(2)
式中:前半部分為在真實樣本,的條件下,判別器的判別誤差;后半部分為在生成樣本,()的條件下,判別器的判別誤差。
因此,生成對抗網(wǎng)絡(luò)的目標函數(shù)可以看作
(3)
最終,模型的收斂條件為判斷模型整體是否達到納什均衡,即判別器的判別誤差逼近05。代表生成器生成的樣本愈發(fā)逼真,導(dǎo)致判別器無法準確判斷其真?zhèn)巍?/p>
為進一步提高圖像生成的精度,除生成對抗網(wǎng)絡(luò)的損失函數(shù)L外,還需考慮目標圖像與生成圖像間的圖像損失函數(shù)L1,L1的設(shè)計基于常用的1損失函數(shù),其定義為
(4)
將L與L1進行整合,得到模型整體的損失函數(shù)為
(5)
式中:、為損失函數(shù)的權(quán)值,可通過多次實驗尋找最優(yōu)的權(quán)值組合。
本文模型基于TensorFlow構(gòu)建,模型的訓(xùn)練及測試在Python 3.6,i7-4790 CPU@3.6 GHz,32 GB內(nèi)存,NVIDIA TITAN X配置的PC上進行。本文數(shù)據(jù)集通過武器裝備體系仿真實驗床獲得:首先利用想定生成工具自動生成3 000個以防空作戰(zhàn)為背景的想定,利用這些想定生成特征圖作為模型的輸入;然后,利用武器裝備體系仿真實驗床對防空體系的攔截情況進行仿真;最后,通過獲得的防空作戰(zhàn)攔截點生成熱圖,以表征防空體系的能力,作為模型的輸出。數(shù)據(jù)樣本劃分為訓(xùn)練集和測試集兩個部分,其中訓(xùn)練集為2 400條數(shù)據(jù)樣本,測試集為600條數(shù)據(jù)樣本。
實驗過程中,首先利用訓(xùn)練集數(shù)據(jù)對模型進行訓(xùn)練,而后利用測試集數(shù)據(jù)生成能力熱圖,并與仿真結(jié)果進行對比。實驗對比情況如圖9所示。
通過結(jié)果對比可以看出,本文提出的模型可以利用當前的防空體系態(tài)勢信息生成防空體系能力熱圖。利用歸一化的均方根誤差(normalized root mean square error, NRMSE)對比生成圖像與目標的差距,平均偏差為0.026 85,說明模型的生成結(jié)果與仿真平臺的實驗結(jié)果較為相似。
本節(jié)重點對不同損失函數(shù)條件下,模型的收斂情況進行分析。由生成對抗網(wǎng)絡(luò)的基本構(gòu)造原理可知,通過對抗訓(xùn)練,判別器的性能將變得越來越好,生成器也不斷能生成以假亂真的數(shù)據(jù),使得判別器分辨不出真?zhèn)?即在訓(xùn)練過程中,判別器的識別正確率先不斷上升,而后下降并不斷趨于0.5。實驗過程中,分別采用生成對抗網(wǎng)絡(luò)傳統(tǒng)的損失函數(shù)L和本文構(gòu)建的損失函數(shù)G構(gòu)建模型并進行實驗,獲得判別器的識別正確率變化情況如圖10所示。
圖10 判別器識別正確率變化情況對比Fig.10 Comparison of the accuracy of discriminator
通過圖10可以看到,采用G構(gòu)建的模型在迭代40萬次后,最終能夠較好地收斂,而采用L構(gòu)建的模型性能水平震蕩較嚴重,最終也無法獲得收斂。由此可見,在傳統(tǒng)生成對抗網(wǎng)絡(luò)損失函數(shù)的基礎(chǔ)上,添加1損失函數(shù)進行修正,可以較好地提高模型的收斂性能。
實驗過程中,為進一步檢驗?zāi)P托阅芩?對比特征描述方法對模型性能的影響情況,本文構(gòu)建了基于向量化特征和多層感知機的特征圖生成模型(V+MLP)、基于圖形化特征和多層感知機的特征圖生成模型(G+MLP),與本文所構(gòu)建的模型(GAN+1)進行對比。利用計算機圖形學(xué)中常用的3個指標:NRMSE、峰值信噪比(peak signal to noise ratio, PSNR)以及結(jié)構(gòu)相似性(structural similarity, SSIM),對3類模型的生成結(jié)果進行評估。其中,PSNR的單位為dB,PSNR和SSIM數(shù)值越大代表生成圖像的失真度越小。對比結(jié)果如表1所示。
表1 不同模型結(jié)果對比
由表1中結(jié)果可以看出,本文基于生成對抗網(wǎng)絡(luò)構(gòu)建的模型性能顯著高于基于多層感知機構(gòu)建的模型,3類指標至少提升34.1%。同時,對比V+MLP和G+MLP兩個模型可以發(fā)現(xiàn),采用圖形化的特征描述方法可以有效提高模型生成圖像的質(zhì)量。
此外,針對不同的損失函數(shù)權(quán)值、設(shè)置情況,對模型的性能進行對比,獲得結(jié)果如表2所示。
表2 不同參數(shù)條件下模型結(jié)果質(zhì)量對比
由對比結(jié)果可以看出,當=1,=0時,模型僅采用L作為損失函數(shù),模型的性能最差。而當=0,=100時,模型僅采用L1作為損失函數(shù),模型的性能有所提升,但不如=1,=100時模型的水平。同時,當=1時,設(shè)置分別為100,1 000,10 000,發(fā)現(xiàn)模型的性能水平并沒有隨著的增大而持續(xù)增加。當=1 000時模型生成圖像的效果最好。各個參數(shù)設(shè)置情況下,生成圖像的情況如圖11所示。
圖11 不同參數(shù)條件下模型結(jié)果對比Fig.11 Comparison of result in different parameters
當前,戰(zhàn)爭復(fù)雜性不斷提升、戰(zhàn)爭節(jié)奏日益加快,指揮員愈發(fā)難以從繁雜的態(tài)勢信息中有效開展防空體系態(tài)勢分析,快速指揮決策。本文提出一種基于生成對抗網(wǎng)絡(luò)的防空體系態(tài)勢輔助分析模型,將防空體系態(tài)勢信息和體系能力利用圖形化的方法進行描述,更加便于指揮員進行理解分析?;谏蓪咕W(wǎng)絡(luò)構(gòu)建能力圖生成模型,模擬人類指揮員體系分析的過程,有效提高了所生成能力圖的準確性。與傳統(tǒng)基于仿真實驗的方法相比,本文方法速度更快,可以有效提高指揮員的決策速度。通過實驗對比表明,本文模型結(jié)果準確率較其他模型至少提高341%。下一步研究過程中,可以進一步探討態(tài)勢信息、能力特征的描述方法,對能力圖生成模型進行改進,使得模型能夠更好地對復(fù)雜體系進行分析,提高指揮員態(tài)勢分析效率和指揮自動化水平。