李寧安 張 劍 周 倜
(武漢數(shù)字工程研究所 武漢 430205)
戰(zhàn)場目標(biāo)作戰(zhàn)意圖識別一直以來都是各級指揮員關(guān)注的重點,是決定下一步作戰(zhàn)行動的基本依據(jù),但近年來隨著戰(zhàn)場態(tài)勢演變速度加快,導(dǎo)致信息化技術(shù)的發(fā)展信息量大、環(huán)境比較復(fù)雜,使得指揮員在短時間識別目標(biāo)作戰(zhàn)意圖非常困難,因此需求智能化的作戰(zhàn)指揮系統(tǒng)輔助指揮員進(jìn)行下一步行動決策[1~2]。目前研究作戰(zhàn)意圖識別的方法主要有基于模板匹配[3]、專家系統(tǒng)[4]、貝葉斯網(wǎng)絡(luò)[5]、神經(jīng)網(wǎng)絡(luò)[6]等傳統(tǒng)的方法以及最近幾年興起的深度學(xué)習(xí)的方法。傳統(tǒng)的方法一般有以下幾個缺點,實現(xiàn)繁瑣且難度很大,實時性、容錯能力和學(xué)習(xí)能力較差,計算精度低以及泛化能力較弱。另外不易處理連續(xù)的屬性特征數(shù)據(jù)。
短記憶型神經(jīng)網(wǎng)絡(luò)[7](Long Short-term Memory)是一種 RNN(Recurrent Neural Network)特殊的類型[8],是常用的用于處理時序?qū)傩詳?shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型。本文主要針對問題時序的特點以及上述幾種方法的缺點,使用LSTM構(gòu)建深層的網(wǎng)絡(luò)結(jié)構(gòu),克服了實時性差、實現(xiàn)難度大以及學(xué)習(xí)能力弱的缺點。
目標(biāo)意圖的識別是一個通過在環(huán)境比較復(fù)雜、信息比較多的戰(zhàn)場上收集目標(biāo)信息進(jìn)行分類的一種問題。在作戰(zhàn)中目標(biāo)往往會隱蔽自己的作戰(zhàn)意圖,使得我方指揮人員識別時增加一定的難度,可能有一些誤判的行為,另外,偵查目標(biāo)的某一時刻的狀態(tài)屬性信息也不能得到有效的識別,因此作戰(zhàn)意圖識別會經(jīng)常偵查目標(biāo)的連續(xù)幾秒的狀態(tài)行為來進(jìn)行判斷它們的意圖[9~10],這有利于提高意圖識別的正確率。處理連續(xù)的屬性特征,LSTM網(wǎng)絡(luò)是一種目前比較流行的方法,其他模型相比容易實現(xiàn),效果相對較好。
基于LSTM神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)空中目標(biāo)作戰(zhàn)意圖的識別屬于分類問題。在先驗知識不充足和沒有領(lǐng)域?qū)<抑R的條件下,僅通過Tensorflow平臺構(gòu)建深層的LSTM神經(jīng)網(wǎng)絡(luò),并且訓(xùn)練學(xué)習(xí)空中作戰(zhàn)目標(biāo)的時序特征和意圖的對應(yīng)關(guān)系,然后用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對實時作戰(zhàn)目標(biāo)意圖進(jìn)行識別。LSTM網(wǎng)絡(luò)是一種具有記憶的神經(jīng)網(wǎng)絡(luò)模型,使得處理時序的屬性數(shù)據(jù)具有很好的效果。標(biāo)準(zhǔn)LSTM網(wǎng)絡(luò)架構(gòu)中的核心單元。主要通過輸入門,遺忘門以及輸出門這3個門達(dá)到了對網(wǎng)絡(luò)具有記憶效果?;镜腖STM網(wǎng)絡(luò)模型以及核心單元如下[7]。
圖1 展開標(biāo)準(zhǔn)的LSTM網(wǎng)絡(luò)模型
圖2 標(biāo)準(zhǔn)的LSTM的網(wǎng)絡(luò)架構(gòu)的核心單元(cell)
x0~xt表示時序的向量特征數(shù)據(jù),x0表示0時刻的向量特征數(shù)據(jù),x1表示下一時刻的向量特征數(shù)據(jù)。對應(yīng)的H0~Ht表示對應(yīng)的隱藏狀態(tài)輸出,Ct-1表示細(xì)胞狀態(tài),*表示矩陣的相乘,+表示矩陣的相加。圖2即為圖1中的A的部分,即標(biāo)準(zhǔn)LSTM的網(wǎng)絡(luò)架構(gòu)的核心單元。
LSTM的輸入數(shù)據(jù),一般分為兩部分:時刻t的Xt輸入數(shù)據(jù)以及t-1時刻的Ct-1細(xì)胞狀態(tài)數(shù)據(jù),作為時刻t的輸入數(shù)據(jù)。對輸入數(shù)據(jù)進(jìn)行處理使得滿足網(wǎng)絡(luò)以及得到更好的效果。σ為Sigmoid層,輸出0~1之間的數(shù)值,通過這個值進(jìn)而決定目前t時刻信息和t-1時刻信息的記憶量。
Zf表示遺忘門對t-1時刻細(xì)胞信息記憶的概率,即選擇Ct-1細(xì)胞信息有多少可以被記憶,有多少被遺忘,Zi表示輸入門對t時刻輸入信息的選擇的概率。t-1時刻細(xì)胞狀態(tài)信息與t時刻的輸入信息共同做出決定更新的細(xì)胞狀態(tài)。式(4)表示對細(xì)胞狀態(tài)信息狀態(tài)進(jìn)行更新,作為t+1時刻的輸入。
Zo表示輸出門對t時刻信息輸出的選擇的概率,Ht作為輸出由t時刻的細(xì)胞狀態(tài)信息和輸出門確定,yt通過Sigmoid層表示最終的輸出。Wf、Wo、W 表示對應(yīng)的權(quán)重值。
上述是對LSTM網(wǎng)絡(luò)模型的基本理論的描述,它是通過舊細(xì)胞信息與當(dāng)前輸入的新信息做出決定更新的當(dāng)前的細(xì)胞狀態(tài)。
2.3.1 目標(biāo)特征提取
目標(biāo)作戰(zhàn)意圖主要體現(xiàn)在戰(zhàn)場上敵方目標(biāo)的當(dāng)前的狀態(tài)特征中,通過觀察目標(biāo)的屬性的改變,可以實現(xiàn)對目標(biāo)的作戰(zhàn)意圖的識別,本文依據(jù)領(lǐng)域?qū)<抑R選取了與目標(biāo)作戰(zhàn)意圖關(guān)系緊密的特征[11],如飛行速度、高度、航向角、方位角、距離、飛行加速度、對空雷達(dá)頻段、對海雷達(dá)頻段、通信頻段、飛機(jī)類型共10維主要特征??罩心繕?biāo)作戰(zhàn)意圖本文主要考慮以下常見的8種意圖[12]:偵查、預(yù)警探測、佯動、突防、攻擊、電子干擾、誘敵和撤退。
2.3.2 樣本預(yù)處理
本文應(yīng)用的樣本預(yù)處理技術(shù)為歸一化、數(shù)值化、one-hot編碼,這些基本的預(yù)處理技術(shù)在神經(jīng)網(wǎng)絡(luò)中都能使得網(wǎng)絡(luò)訓(xùn)練更加準(zhǔn)確和快速以及增加網(wǎng)絡(luò)的穩(wěn)定性。由于LSTM神經(jīng)網(wǎng)絡(luò)模型只能處理數(shù)值數(shù)據(jù),戰(zhàn)場上傳感器獲取的飛行速度、高度、距離、飛行加速度、航向角、方位角為數(shù)值數(shù)據(jù),但由于不同類別數(shù)據(jù)間量級差別較大,需要進(jìn)行歸一化到0~1范圍之間。對于對海雷達(dá)頻段、對空雷達(dá)頻段、通信頻段為范圍數(shù)據(jù),飛機(jī)類型為類別數(shù)據(jù),均需要進(jìn)行數(shù)值化處理。對樣本數(shù)據(jù)和意圖標(biāo)簽進(jìn)行預(yù)處理,目的是滿足模型對數(shù)據(jù)的要求,消除量綱影響,從而增加網(wǎng)絡(luò)模型的健壯性。
LSTM神經(jīng)網(wǎng)絡(luò)模型輸入和輸出有很多種情況,一般是不同的情況組合對應(yīng)不同的場景,比如一對一,一對多,多對一,多對多等情況來針對不同的應(yīng)用[13]。本文研究的問題本質(zhì)上屬于分類問題,設(shè)計的輸入-輸出模型為多對一組合以及設(shè)計深層次的LSTM網(wǎng)絡(luò)模型。
圖3 深度LSTM網(wǎng)絡(luò)模型
在神經(jīng)網(wǎng)絡(luò)模型中,隱層數(shù)和節(jié)點數(shù)這2個參數(shù)非常重要,可以降低網(wǎng)絡(luò)誤差,提高精度,但不合理的設(shè)計可能使網(wǎng)絡(luò)復(fù)雜化、增加了網(wǎng)絡(luò)的訓(xùn)練時間和出現(xiàn)過擬合。因此選擇隱藏層的層次和節(jié)點的個數(shù)設(shè)計就很重要,這種參數(shù)設(shè)計只能在基本的理論和大量的實驗中確定。圖3是深度LSTM網(wǎng)絡(luò)模型,A表示核心單元,Yt+s-1表示通過SoftMax歸一化分類函數(shù)輸出結(jié)果,從而實現(xiàn)目標(biāo)意圖的識別。
2.5.1 Tensorflow平臺介紹
Tensorflow是谷歌在2015年開源的主流的深度學(xué)習(xí)框架,有很多比較好的優(yōu)秀的特點[14]。如下:
1)高度的靈活性。
2)強(qiáng)大的可移植性,支持CPU、GPU、IOS、安卓等多種計算平臺。
3)不需要通過反向傳播求解梯度,Tensorflow支持自動求導(dǎo)。
4)數(shù)據(jù)流式圖支持自由的算法表達(dá),可實現(xiàn)深度學(xué)習(xí)以外的機(jī)器學(xué)習(xí)算法。
5)多語言支持Python/c++。
6)性能最優(yōu)化,Tensorflow給予了線程、隊列、異步操作等以最佳的支持。
2.5.2 使用Tensorflow平臺構(gòu)建LSTM網(wǎng)絡(luò)模型
使用Tensorflow構(gòu)建2.4節(jié)中的深層的LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。在TensorFlow中提供了BasicLSTMCell函數(shù)來搭建基本的LSTM模型。BasicLSTMCel提供了輸入層、隱藏層、輸出層的數(shù)據(jù)的輸入,在其內(nèi)部封裝了LSTM隱藏層包含的遺忘門、輸入門和輸出門等結(jié)構(gòu),同時還可根據(jù)研究需要設(shè)置隱藏層結(jié)點個數(shù)。MultiRNNCell函數(shù)提供了多層的LSTM模型的搭建,MultiRNNCell中的內(nèi)容是其按時間展開圖,隱藏層用LSTMCell實現(xiàn),其中可以包含多個隱藏層??梢愿鶕?jù)自己研究問題進(jìn)行自定義網(wǎng)絡(luò)架構(gòu)如圖5。最后輸出的Yt+s-1通過SoftMax層的激活函數(shù),并用損失函數(shù)計算輸出與真實的標(biāo)簽的誤差。計算損失值后,使用Tensorflow提供的訓(xùn)練操作可以自動求Cost關(guān)于每個參數(shù)的微分導(dǎo)數(shù)并用梯度下降法對模型進(jìn)行訓(xùn)練。
實驗采用空中目標(biāo)作戰(zhàn)意圖數(shù)據(jù)集,數(shù)據(jù)集為空中目標(biāo)連續(xù)10s對應(yīng)的屬性特征仿真值,包括飛行速度、高度、航向角、方位角、距離、飛行加速度、對空雷達(dá)頻段、對海雷達(dá)頻段、通信頻段、飛機(jī)類型數(shù)據(jù),以及對應(yīng)的標(biāo)簽,偵查、預(yù)警探測、佯動、突防、攻擊、電子干擾、誘敵和撤退。數(shù)據(jù)集規(guī)模大小為100000,各個意圖類型對應(yīng)的比例為1/8,取80%作為訓(xùn)練集,20%作為測試集,訓(xùn)練模型。
表1 LSTM網(wǎng)絡(luò)模型參數(shù)設(shè)置
由2.4節(jié)可以知道神經(jīng)網(wǎng)絡(luò)的層次和節(jié)點不同會有不同的識別效果,因此需確定深度LSTM神經(jīng)網(wǎng)絡(luò)模型隱藏層層數(shù)和節(jié)點數(shù)量。學(xué)習(xí)率的選擇也對網(wǎng)絡(luò)的模型有影響,如果學(xué)習(xí)率設(shè)置過大,可能跳過最優(yōu)解得到不理想的效果,如果學(xué)習(xí)率設(shè)置過小,會使得訓(xùn)練的速度比較慢。調(diào)整和確定網(wǎng)絡(luò)架構(gòu)是用訓(xùn)練集確定的,不能用測試集,測試集是用來評判網(wǎng)絡(luò)的效果。本文使用Tensorflow平臺從仿真的訓(xùn)練集中抽出隨機(jī)順序的批次進(jìn)行訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型并且用來調(diào)整模型結(jié)構(gòu)。最終確定網(wǎng)絡(luò)模型的參數(shù)如表1。
在實驗過程中,把生成的10000的樣本數(shù)據(jù)隨機(jī)打亂,分為80%的訓(xùn)練集和20%的測試集。圖4和圖5是LSTM網(wǎng)絡(luò)模型的實驗結(jié)果,圖4為損失函數(shù)值,圖5為測試集的正確率。從圖4中可以看出損失函數(shù)值隨著迭代的次數(shù)而下降,而目標(biāo)意圖的準(zhǔn)確率隨著迭代的次數(shù)而上升,最終兩者的變化都將趨于平穩(wěn),這也符合神經(jīng)網(wǎng)絡(luò)模型的一般訓(xùn)練過程。從圖中可以得知,標(biāo)準(zhǔn)的LSTM網(wǎng)絡(luò)模型得到了比較好的準(zhǔn)確率。
圖4 (左側(cè))LSTM網(wǎng)絡(luò)模型訓(xùn)練集和測試集損失函數(shù)值隨迭代次數(shù)的變化
圖5 (右側(cè))LSTM網(wǎng)絡(luò)模型訓(xùn)練集和測試集準(zhǔn)確率隨迭代次數(shù)的變化
空中目標(biāo)意圖識別是軍事研究中重要的問題之一,由于空中目標(biāo)的屬性特征具有隱蔽性和欺騙性,根據(jù)單一時刻目標(biāo)特征識別目標(biāo)意圖比較難,因此采取根據(jù)一系列時刻的目標(biāo)特征識別意圖,目標(biāo)的屬性是有序列特征的,使得問題解決更加復(fù)雜。結(jié)合這些問題特征,本文基于LSTM神經(jīng)網(wǎng)絡(luò)模型設(shè)計,構(gòu)造深層次和合適的節(jié)點個數(shù)使得更加適合研究的問題,通過在復(fù)雜的作戰(zhàn)環(huán)境中采集10s內(nèi)連續(xù)的屬性特征,輸入到深層次的LSTM模型中進(jìn)行訓(xùn)練,實驗結(jié)果表明,驗證了LSTM神經(jīng)網(wǎng)絡(luò)模型取得比較好的效果。