国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智能制導(dǎo)律研究綜述

2020-12-30 08:32:54方洋旺鄧天博符文星
無人系統(tǒng)技術(shù) 2020年6期
關(guān)鍵詞:制導(dǎo)導(dǎo)彈神經(jīng)網(wǎng)絡(luò)

方洋旺,鄧天博,符文星

(1.西北工業(yè)大學(xué)無人系統(tǒng)技術(shù)研究院,西安710072;2.西北工業(yè)大學(xué)航天學(xué)院,西安710072)

1 引言

導(dǎo)彈制導(dǎo)系統(tǒng)是導(dǎo)彈的指揮官,承擔(dān)著決策指令生成的重要任務(wù),即結(jié)合外部信息(環(huán)境、目標(biāo)、干擾)和導(dǎo)彈自身的內(nèi)部信息按一定規(guī)律導(dǎo)引和控制導(dǎo)彈飛向目標(biāo)或預(yù)定軌跡。導(dǎo)引頭獲取的外部信息的準(zhǔn)確性從根本上決定了指揮官決策的準(zhǔn)確性,在信息準(zhǔn)確的基礎(chǔ)上,導(dǎo)引方法則極大地影響指揮官的決策質(zhì)量。

戰(zhàn)場環(huán)境日益復(fù)雜的發(fā)展趨勢對技術(shù)也提出了更多的要求,傳統(tǒng)的制導(dǎo)系統(tǒng)面臨挑戰(zhàn):對外,針對性地提升不同導(dǎo)引系統(tǒng)的信息獲取能力;對內(nèi),克服信息質(zhì)量問題實現(xiàn)精確制導(dǎo)。因此,導(dǎo)彈制導(dǎo)系統(tǒng)能力綜合提升對于實現(xiàn)單兵作戰(zhàn)效能最大化顯得尤為重要?,F(xiàn)代控制理論的工程應(yīng)用和智能控制理論的不斷發(fā)展為制導(dǎo)系統(tǒng)解決復(fù)雜環(huán)境下目標(biāo)探測、識別、跟蹤以及精確打擊提供多樣化選擇。

智能導(dǎo)彈是未來導(dǎo)彈的發(fā)展方向,智能制導(dǎo)系統(tǒng)是導(dǎo)彈智能決策的基礎(chǔ)。本文對導(dǎo)彈智能制導(dǎo)系統(tǒng)的應(yīng)用現(xiàn)狀進(jìn)行介紹,探討了智能制導(dǎo)系統(tǒng)的研究現(xiàn)狀并在此基礎(chǔ)上提出智能導(dǎo)彈集群、探測制導(dǎo)一體化等技術(shù)發(fā)展方向,旨在為未來智能制導(dǎo)系統(tǒng)的發(fā)展提供思路。

2 智能化導(dǎo)彈發(fā)展現(xiàn)狀

目前,伴隨著人工智能的熱潮席卷全球,世界各大軍事強國都在緊鑼密鼓地著手于智能導(dǎo)彈的研發(fā)。盡管從總體上來說真正意義上的智能導(dǎo)彈還沒有出現(xiàn),但已初具雛形,在導(dǎo)航制導(dǎo)、目標(biāo)識別、任務(wù)規(guī)劃等方面都呈現(xiàn)出了智能化的特點[1]。其中,最具代表的是以下三種型號[2-4]。

2.1 美國遠(yuǎn)程反艦導(dǎo)彈

2009年,美國國防預(yù)先研究計劃局與洛克希德·馬丁公司導(dǎo)彈和火控分公司簽訂了發(fā)展遠(yuǎn)程反艦導(dǎo)彈(Long Range Anti-Ship Missile,LRASM)的第一階段合同。遠(yuǎn)程反艦導(dǎo)彈項目由美國國防高級研究計劃局和美國海軍研究辦公室共同出資開展,承包商為洛克希德·馬丁公司和火控分公司負(fù)責(zé),旨在開發(fā)并驗證一種全所未有的遠(yuǎn)程反艦導(dǎo)彈。

在洛克希德·馬丁公司發(fā)布的關(guān)于LRASM 的宣傳片中,美國海軍航母編隊F-18 戰(zhàn)機(jī)掛載LRASM 起飛執(zhí)行作戰(zhàn)任務(wù)。在監(jiān)視衛(wèi)星發(fā)現(xiàn)敵方海上艦艇編隊目標(biāo)后,向指揮中心發(fā)送關(guān)于目標(biāo)的相關(guān)數(shù)據(jù)信息。艦上作戰(zhàn)指揮系統(tǒng)根據(jù)作戰(zhàn)需求,發(fā)射了兩枚艦載LRASM,通過數(shù)據(jù)鏈由艦艇向?qū)梻鬏斈繕?biāo)指示信息,隨后F-18 戰(zhàn)機(jī)發(fā)射一枚LRASM。LRASM 之間通過數(shù)據(jù)鏈進(jìn)行通訊,可在GPS 拒止條件下正常工作,并在線規(guī)劃路線。在飛行過程中,LRASM 可自主感知威脅,并對威脅自主進(jìn)行建模,實現(xiàn)在線路線規(guī)劃,繞過威脅。LRASM飛到末端時,首先使用被動遠(yuǎn)距離探測目標(biāo),完成虛假目標(biāo)剔除、高價值目標(biāo)識別和鎖定,并降低高度進(jìn)行超低空突防,在距離目標(biāo)較近時使用成像導(dǎo)引頭實現(xiàn)目標(biāo)薄弱部位識別,最終完成打擊任務(wù)。

LRASM 被美國海軍稱為人工智能導(dǎo)彈。其空射版已經(jīng)于2018年首先列裝了美國空軍第28轟炸機(jī)聯(lián)隊。LRASM 在自主感知威脅、自主在線航跡規(guī)劃、多彈協(xié)同、目標(biāo)價值等級劃分、目標(biāo)識別等方面的智能化水平極高。其中,自主在線航跡規(guī)劃、多彈協(xié)同等包含了智能制導(dǎo)律的相關(guān)理論和技術(shù)。

2.2 俄羅斯鋯石導(dǎo)彈

鋯石高超聲速反艦導(dǎo)彈(3M22)由俄羅斯戰(zhàn)術(shù)導(dǎo)彈集團(tuán)下屬的俄羅斯機(jī)械制造科研生產(chǎn)聯(lián)合體NPOM負(fù)責(zé)研制[5]。鋯石反艦導(dǎo)彈以超燃沖壓發(fā)動機(jī)為主要動力,根據(jù)飛行彈道的不同,其最遠(yuǎn)射程從350 km 到500 km 不等,飛行速度可達(dá)馬赫數(shù)5~10,具有很強的機(jī)動和突防能力。

鋯石反艦導(dǎo)彈智能化水平主要體現(xiàn)在制導(dǎo)系統(tǒng)作戰(zhàn)自主性和對抗水平方面。一組鋯石導(dǎo)彈在執(zhí)行打擊任務(wù)時會進(jìn)行“自我協(xié)調(diào)”,編組成一個整體的導(dǎo)彈打擊群,協(xié)同對目標(biāo)發(fā)起攻擊,使得目標(biāo)難以防御。在鋯石導(dǎo)彈的目標(biāo)引導(dǎo)程序中集成了人工智能數(shù)據(jù),使得導(dǎo)彈不僅能夠?qū)箶畴娮痈蓴_手段,而且還能夠自主規(guī)避敵防空火力的打擊。為了消除對目標(biāo)的誤判,在導(dǎo)彈的彈載計算機(jī)中預(yù)先儲存了現(xiàn)代主要艦艇的圖像,可供導(dǎo)引頭在選擇機(jī)動方式和攻擊指定目標(biāo)時進(jìn)行校正。此外,鋯石導(dǎo)彈還能夠按重要性對目標(biāo)進(jìn)行分類,然后根據(jù)預(yù)定的程序自主選定攻擊戰(zhàn)術(shù)和攻擊實施方案,攻擊其中最重要的目標(biāo)。

鋯石導(dǎo)彈上不僅可安裝雷達(dá)自導(dǎo)頭,還可安裝用于搜索和探測目標(biāo)的光電系統(tǒng),并可加裝數(shù)據(jù)鏈,具備了自主規(guī)避威脅能力。

其智能制導(dǎo)律算法主要體現(xiàn)在:能夠自主選擇目標(biāo),動態(tài)實時地選擇合適的、滿足規(guī)避威脅要求,且還能有效攻擊所選擇目標(biāo)的制導(dǎo)律。

2.3 挪威導(dǎo)彈

挪威導(dǎo)彈(Naval Strike Missile,NSM)號稱“全球唯一第五代反艦導(dǎo)彈”[6]。由美國雷錫恩公司與挪威康斯伯格海事公司聯(lián)合研發(fā)。2018年6月,美軍宣布其瀕海艦(Littoral Combat Ship,LCS)和新型護(hù)衛(wèi)艦將使用挪威研制的隱身反艦導(dǎo)彈NSM。這也意味著NSM 擊敗了波音公司提出的“魚叉”增程型方案和洛克希德·馬丁公司的LRASM 艦射型導(dǎo)彈。

NSM 采用成型彈體、正常氣動布局、折疊式上翼、4個尾舵的結(jié)構(gòu)布局,該導(dǎo)彈采用紅外隱身外形設(shè)計,末段可進(jìn)行三維迂回機(jī)動,有高達(dá)200 個途徑點的航路規(guī)劃能力。NSM 于2010年服役,主要用來裝備挪威海軍南森級護(hù)衛(wèi)艦和導(dǎo)彈快艇。

NSM采用了高清晰度紅外成像導(dǎo)引頭,能夠清晰分辨遠(yuǎn)處目標(biāo)的外輪廓,制導(dǎo)系統(tǒng)的目標(biāo)分類軟件可進(jìn)行自動目標(biāo)識別。這樣就可以通過發(fā)射前的程序設(shè)計,選擇目標(biāo)的薄弱部位或者關(guān)鍵部位進(jìn)行攻擊。當(dāng)導(dǎo)彈處于不利攻擊陣位時,智能軟件可以控制導(dǎo)彈通過戰(zhàn)術(shù)機(jī)動,占領(lǐng)有利攻擊陣位,對目標(biāo)實施最佳效果的攻擊。在對目標(biāo)實施多彈攻擊時,可對每枚導(dǎo)彈的攻擊飛行路線進(jìn)行設(shè)定,并可設(shè)定不同的攻擊部位,可使一枚或幾枚導(dǎo)彈從對方攔截的盲區(qū)對目標(biāo)艦發(fā)起攻擊。這種攻擊方法,可使導(dǎo)彈達(dá)成一定意義的協(xié)同,互相配合,達(dá)到最好的攻擊效果。

其智能制導(dǎo)算法主要體現(xiàn)在:一是智能改變末端彈道和進(jìn)入角度以滿足攻擊目標(biāo)的薄弱部位或者關(guān)鍵部位的要求;二是將協(xié)同制導(dǎo)和智能制導(dǎo)相結(jié)合實時規(guī)劃出有利的飛行彈道實現(xiàn)多枚導(dǎo)彈同時攻擊目標(biāo)的不同部位,提高打擊效果。

3 智能制導(dǎo)律研究現(xiàn)狀

隨著人工智能技術(shù)的不斷發(fā)展及其在武器裝備上的應(yīng)用,武器的智能化逐漸改變著未來戰(zhàn)爭的面貌。為滿足未來戰(zhàn)爭“智能、快速、精確、高效”的作戰(zhàn)需求,現(xiàn)有導(dǎo)彈需加快智能化步伐。而導(dǎo)彈智能化可概括為兩個特征:一是電子對抗和智能抗干擾,即在復(fù)雜戰(zhàn)場環(huán)境下,可對敵方發(fā)出的大量干擾信號進(jìn)行有效識別而不被干擾信息打斷、誘騙;二是智能打擊目標(biāo),即能夠自主根據(jù)目標(biāo)當(dāng)前情況控制發(fā)射與否,并檢測目標(biāo)狀態(tài)做出積極響應(yīng)。其中前者可理解為導(dǎo)引頭的智能識別技術(shù),而后者即為基于可觀測信息的智能制導(dǎo)技術(shù)。下面將圍繞智能制導(dǎo)技術(shù)中所涉及的智能制導(dǎo)方法進(jìn)行綜述。

3.1 基于人工智能算法的局部智能制導(dǎo)律

(1)基于神經(jīng)網(wǎng)絡(luò)求解的局部智能制導(dǎo)律

最優(yōu)制導(dǎo)律設(shè)計問題本質(zhì)上是最優(yōu)控制問題,而最優(yōu)控制問題只有在很少的情況下能獲得解析表達(dá)式;最優(yōu)制導(dǎo)律所涉及的彈目運動模型通常是非線性的,只有進(jìn)行大量的假設(shè)簡化之后才能給出解析表達(dá)式,這些假設(shè)不但會影響制導(dǎo)律的適應(yīng)范圍,而且會影響制導(dǎo)律的精度。特別是在實際工程應(yīng)用中存在各種約束條件,如過載約束、角度約束、速度約束等都會影響最優(yōu)制導(dǎo)律表達(dá)式的求解。為了求解帶有各種約束條件的彈目運動模型的最優(yōu)制導(dǎo)律,研究人員開始將神經(jīng)網(wǎng)絡(luò)理論應(yīng)用到制導(dǎo)律的求解中。Song 等[7]通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)建立了最優(yōu)制導(dǎo)律表達(dá)式與彈目相對狀態(tài)之間的函數(shù)關(guān)系。盡管無法獲取精確的制導(dǎo)方程,但通過設(shè)定一些終止條件,制導(dǎo)律仍可通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)獲得。張汝川等[8]利用Hopfield 神經(jīng)網(wǎng)絡(luò)在線實時求解最優(yōu)制導(dǎo)問題,同時為了在攔截有界機(jī)動目標(biāo)時視線角速率趨于0,將滑??刂评碚撘氲街茖?dǎo)律的設(shè)計中,并利用Lyapunov穩(wěn)定性理論對該制導(dǎo)律的穩(wěn)定性進(jìn)行了證明。

基于有限滾動時域的最優(yōu)制導(dǎo)律本質(zhì)上是局部最優(yōu)制導(dǎo)律,主要是解決各種約束條件下非線性最優(yōu)制導(dǎo)律難以在整個優(yōu)化時間求解的難題而提出來的。其主要思想是將整個優(yōu)化時間區(qū)域劃分為一系列時間片,然后在每個時間片上滾動地求解局部最優(yōu)制導(dǎo)律。雖簡化了計算難點,但解析仍然難以獲得。因此,基于模型的魯棒預(yù)測控制理論,Li 等[9]研究了導(dǎo)彈的攔截問題,在有限滾動時域上使用基于線性變分不等式的原始-對偶神經(jīng)網(wǎng)絡(luò)來求解約束二次規(guī)劃(Quadratic Programming,QP)問題,利用多參數(shù)QP問題的在線解,實時做出有約束的最優(yōu)控制決策。

(2)基于神經(jīng)網(wǎng)絡(luò)參數(shù)估計的局部智能制導(dǎo)律

由于滑模制導(dǎo)律不受彈目運動模型的限制而且易于獲得解析表達(dá)式,因此獲得廣泛的應(yīng)用。然而,滑模制導(dǎo)律的不足之處在于存在抖振現(xiàn)象,而且對外部干擾包括目標(biāo)機(jī)動的處理,通常將其當(dāng)作干擾項,采用魯棒的方式進(jìn)行處理,從而影響制導(dǎo)精度。為了解決上述問題,人們將神經(jīng)網(wǎng)絡(luò)引入滑模制導(dǎo)中,要么解決抖振問題,要么解決干擾項的估計問題。Shao 等[10]利用徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)實時估計目標(biāo)運動信息,減少三維運動模型中的耦合干擾。從而使制導(dǎo)律能夠自適應(yīng)參數(shù)的變化,提高了制導(dǎo)律的魯棒性。Li 等[11]提出了一種用于攔截具有落角和橫向加速度指令約束的非機(jī)動目標(biāo)的制導(dǎo)律,該制導(dǎo)律將滑??刂品椒ㄅc小波神經(jīng)網(wǎng)絡(luò)相結(jié)合,提高了系統(tǒng)的魯棒性,減小了系統(tǒng)的抖振。Lai等[12]基于Lyapunov穩(wěn)定性理論,提出了一種基于非線性擴(kuò)張狀態(tài)觀測器的神經(jīng)自適應(yīng)快速終端滑模動態(tài)面控制方法,保證了系統(tǒng)的穩(wěn)定性。李解等[13]為提高末制導(dǎo)精度,根據(jù)滑模變結(jié)構(gòu)理論推導(dǎo)了一種基于零化視線角速率的滑模制導(dǎo)律,利用RBF神經(jīng)網(wǎng)絡(luò)對切換項增益進(jìn)行在線估計,并將所設(shè)計的RBF滑模制導(dǎo)律與滑模制導(dǎo)律、比例導(dǎo)引律進(jìn)行仿真對比。佟廷帥等[14]為了解決滑模制導(dǎo)律在攔截高速、大機(jī)動目標(biāo)存在視線角速率抖振現(xiàn)象以及忽略自動駕駛儀動態(tài)特性等問題,結(jié)合變結(jié)構(gòu)控制理論和神經(jīng)網(wǎng)絡(luò),提出一種基于RBF 神經(jīng)網(wǎng)絡(luò)調(diào)節(jié)增益的滑模制導(dǎo)律。

(3)基于模糊參數(shù)估計的局部智能制導(dǎo)律

滑模制導(dǎo)律存在抖振現(xiàn)象,以及對外部干擾包括目標(biāo)機(jī)動的處理(通常將其當(dāng)作干擾項處理)難以滿足工程應(yīng)用要求。對于此方面的問題,除了用神經(jīng)網(wǎng)絡(luò)進(jìn)行估計補償之外,還可以采用模糊推理進(jìn)行逼近,其優(yōu)點是模糊神經(jīng)網(wǎng)絡(luò)隱層少,結(jié)構(gòu)簡單。針對滑模變結(jié)構(gòu)制導(dǎo)律難以避免的抖動問題,溫先福等[15]提出用模糊神經(jīng)網(wǎng)絡(luò)去逼近滑模制導(dǎo)律的抖振項,從而達(dá)到消除抖動的目的,但遺憾的是,該文未給出詳細(xì)的模糊規(guī)則,而且也未給出收斂性證明。針對空中高速、大機(jī)動目標(biāo)的攔截問題,周德云等[16]在變結(jié)構(gòu)控制理論的基礎(chǔ)上,提出了三維自適應(yīng)變結(jié)構(gòu)制導(dǎo)律,將目標(biāo)加速度視為外界干擾,設(shè)計了一種快速趨近律,并利用模糊RBF網(wǎng)絡(luò)的高效自學(xué)習(xí)能力對變結(jié)構(gòu)項的增益進(jìn)行了在線估計,實現(xiàn)對變結(jié)構(gòu)項的自適應(yīng)調(diào)節(jié),從而減小了抖振項。Wang 等[17]針對空中高速、大機(jī)動目標(biāo)的攔截問題,在考慮加速度約束和自動駕駛儀動態(tài)特性的情況下,設(shè)計了滑模變結(jié)構(gòu)制導(dǎo)律,并通過構(gòu)建五條模糊規(guī)則獲得模糊基函數(shù),設(shè)計模糊控制器逼近變結(jié)構(gòu)項,并設(shè)計徑向基網(wǎng)絡(luò)估計目標(biāo)加速度項,同時給出了基于上述逼近項的滑模制導(dǎo)律收斂性證明。

(4)基于強化學(xué)習(xí)參數(shù)估計的局部智能制導(dǎo)律

由于一般制導(dǎo)律設(shè)計都是在彈目運動模型確定的情況下獲得的,目標(biāo)及外部環(huán)境一旦產(chǎn)生一些不確定的變化,制導(dǎo)律就難以適應(yīng)此變化,從而導(dǎo)致制導(dǎo)精度下降。而強化學(xué)習(xí)正好具有學(xué)習(xí)外部環(huán)境不斷變化的能力。張秦浩等[18]以傳統(tǒng)的比例制導(dǎo)律為基礎(chǔ),提出基于強化學(xué)習(xí)的方法學(xué)習(xí)比例系數(shù),實現(xiàn)自適應(yīng)變比例系數(shù)的制導(dǎo)算法。該算法以視線角變化率作為狀態(tài),依據(jù)脫靶量設(shè)計獎勵函數(shù),并設(shè)計離散化的行為空間,為導(dǎo)彈選擇正確的制導(dǎo)指令。該算法雖然具有學(xué)習(xí)的功能,但由于只考慮改變比例導(dǎo)引律的比例系數(shù),仍無法解決目標(biāo)機(jī)動以及各種干擾條件下的精確制導(dǎo)問題,而且,比例制導(dǎo)律的最優(yōu)比例系數(shù)就是最優(yōu)制導(dǎo)律的比例系數(shù),因此,即使再自適應(yīng)的改變,理論上也不會好于最優(yōu)制導(dǎo)律。

(5)基于強化學(xué)習(xí)模型的局部智能制導(dǎo)律

強化學(xué)習(xí)還可以動態(tài)的學(xué)習(xí)一些帶有不確定因素和隨機(jī)因素的模型。Liang 等[19]提出了一種基于模型的深度強化學(xué)習(xí)方法,首先基于模型預(yù)測控制(Model Predictive Control,MPC)制導(dǎo)律結(jié)構(gòu),然后利用深度神經(jīng)網(wǎng)絡(luò)逼近制導(dǎo)動力學(xué)的預(yù)測模型,并將其納入模型預(yù)測路徑積分控制框架,利用元學(xué)習(xí)技術(shù)使深層神經(jīng)動力學(xué)模型能夠在線適應(yīng)不同的目標(biāo)機(jī)動、其他擾動和執(zhí)行器故障等情況,并在此基礎(chǔ)上設(shè)計了變速攔截器在執(zhí)行器失效情況下攔截機(jī)動目標(biāo)的制導(dǎo)律。此方法的優(yōu)點是MPC 制導(dǎo)律容易處理各種約束,用于求解;而且采用深度強化學(xué)習(xí)方法可以學(xué)習(xí)不確定情況下制導(dǎo)動力學(xué)的預(yù)測模型,從而,確保所設(shè)計的制導(dǎo)律具有適應(yīng)各種復(fù)雜環(huán)境的能力。

3.2 全局智能制導(dǎo)律

(1)全局神經(jīng)網(wǎng)絡(luò)智能制導(dǎo)律

對于在各種復(fù)雜干擾環(huán)境和目標(biāo)作大機(jī)動情形下,彈目運動模型不但是高度非線性,而且是不確定的、隨機(jī)的模型,同時受到各種狀態(tài)和終端約束,因此,很難基于常規(guī)的控制方法設(shè)計制導(dǎo)律。只能使用具有學(xué)習(xí)、推理能力,且能處理隨機(jī)性、不確定性問題的神經(jīng)網(wǎng)絡(luò)來設(shè)計制導(dǎo)律??紤]到神經(jīng)網(wǎng)絡(luò)強大的近似能力,一些國外學(xué)者用其取代傳統(tǒng)制導(dǎo)律以提高制導(dǎo)律計算效率。其中,Rajagopalan 等[20-21]詳細(xì)地分析了使用神經(jīng)網(wǎng)絡(luò)設(shè)計制導(dǎo)律的可行性及優(yōu)勢。徐洋[22]針對紅外空空導(dǎo)彈在目標(biāo)機(jī)動和紅外誘餌干擾情況下利用長短期記憶(Long-Short Term Memory,LSTM)網(wǎng)絡(luò)設(shè)計具有抗干擾能力的智能制導(dǎo)律。Filici 等[23]考慮到擾動的隨機(jī)性,設(shè)計了一款在線神經(jīng)網(wǎng)絡(luò)制導(dǎo)律。一旦擾動出現(xiàn),神經(jīng)網(wǎng)絡(luò)就會進(jìn)行在線補償。

(2)全局模糊智能制導(dǎo)律

模糊推理可以單獨用來設(shè)計控制器,因此也可以用來單獨的設(shè)計模糊制導(dǎo)律。針對地空導(dǎo)彈攔截攻擊彈的制導(dǎo)問題,Wang 等[24]首先將攔截彈的制導(dǎo)問題轉(zhuǎn)化為攔截彈跟蹤地面雷達(dá)探測目標(biāo)視線的問題,然后設(shè)計一種模糊神經(jīng)網(wǎng)絡(luò)(Fuzzy Neural Network,F(xiàn)NN)控制器,用于逼近攔截彈跟蹤控制器,仿真結(jié)果表明:所設(shè)計的控制器能夠完成導(dǎo)彈制導(dǎo)任務(wù),且計算量遠(yuǎn)小于使用小腦模型神經(jīng)網(wǎng)絡(luò)控制器(Cerebellar Model Articulation Controller,CMAC)。Lin[25]同時考慮了目標(biāo)機(jī)動、轉(zhuǎn)彎延時、控制系統(tǒng)延時、閃爍噪聲等一系列影響因素后,通過三種不同的神經(jīng)網(wǎng)絡(luò)優(yōu)化器,設(shè)計了一種模糊神經(jīng)網(wǎng)絡(luò)制導(dǎo)律,最終的脫靶量、過載以及攔截時間都要低于傳統(tǒng)制導(dǎo)律。

(3)全局強化學(xué)習(xí)智能制導(dǎo)律

強化學(xué)習(xí)通過狀態(tài)集、動作集、獎賞函數(shù)以及外部環(huán)境可以形成一個閉環(huán),通過不斷的學(xué)習(xí),最終就能獲得最優(yōu)的結(jié)果,因此,完全可以將制導(dǎo)過程轉(zhuǎn)化為強化學(xué)習(xí)的閉環(huán)模型,通過強化學(xué)習(xí)方法,可以獲得基于強化學(xué)習(xí)的制導(dǎo)律?;趶娀瘜W(xué)習(xí)方法,Gaudet 等[26]設(shè)計了制導(dǎo)律,并能夠保證其最優(yōu)性,文章表明該制導(dǎo)方法要明顯優(yōu)于傳統(tǒng)比例導(dǎo)引法。在此基礎(chǔ)上,Gaudet 等[27]又提出了一種只需要導(dǎo)引頭視線角及其變化率組成的觀測值,不再需要估計距離的制導(dǎo)律。該制導(dǎo)律使用強化元學(xué)習(xí)進(jìn)行了優(yōu)化,優(yōu)化后在不同的目標(biāo)加速度情況下都可以穩(wěn)定視線角速率,同時文中說明在能獲得較為完善的目標(biāo)加速度信息的情況下,此制導(dǎo)律比增強型零控脫靶量制導(dǎo)律具有更好的性能。Lee等[28]研究了導(dǎo)彈-目標(biāo)追逃問題,其中導(dǎo)彈采用純比例導(dǎo)引方法,而目標(biāo)則利用強化學(xué)習(xí)算法以實現(xiàn)躲避策略。

自適應(yīng)最優(yōu)控制方法也可以看作是一種特殊的強化學(xué)習(xí)方法,它是一種有模型的強化學(xué)習(xí)。目前,已將該方法應(yīng)用到最優(yōu)制導(dǎo)律設(shè)計中,解決非線性最優(yōu)制導(dǎo)律無法求解的難題。孫景亮等[29]對自適應(yīng)最優(yōu)控制方法在制導(dǎo)律設(shè)計中的應(yīng)用進(jìn)行了綜述研究。Han 等[30]在導(dǎo)彈輸入受約束情況,引入自適應(yīng)評價網(wǎng)絡(luò)設(shè)計了制導(dǎo)律以保證導(dǎo)彈可在最短時間內(nèi)由初始馬赫數(shù)增長到終端馬赫數(shù);又利用自適應(yīng)評價網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)行了中段制導(dǎo)律的設(shè)計。

4 智能制導(dǎo)律研究方向和展望

導(dǎo)彈作為強有力的攻擊手段,在攻守雙方的博弈中起著不可或缺的作用,未來的戰(zhàn)爭是智能化的戰(zhàn)爭,導(dǎo)彈的智能化勢在必行,制導(dǎo)系統(tǒng)因其指揮官的核心作用連接著外部環(huán)境和導(dǎo)彈自身,與人工智能技術(shù)的結(jié)合勢必對作戰(zhàn)效能的提高起著決定性的作用。人工智能技術(shù)的不斷發(fā)展對武器研制有極強的推動作用,必將深刻影響制導(dǎo)理論的發(fā)展。因此,未來智能制導(dǎo)律的可能發(fā)展方向和發(fā)展趨勢如下。

4.1 單智能體的智能制導(dǎo)律

(1)分布式多源異構(gòu)信息融合條件下的單智能體局部智能制導(dǎo)律

在復(fù)雜戰(zhàn)場環(huán)境下單一模式的探測裝置受到物理屬性、干擾因素的限制,其探測、識別能力都有限,無法滿足作戰(zhàn)需求,如遠(yuǎn)程空空導(dǎo)彈中制導(dǎo)階段,載機(jī)雷達(dá)探測目標(biāo)特別是隱身目標(biāo)距離難以滿足要求,需要位于不同空間位置的多源異構(gòu)多傳感器協(xié)同探測,進(jìn)行分布式多源異構(gòu)信息融合后獲得制導(dǎo)系統(tǒng)所需要的目標(biāo)信息。由于復(fù)雜戰(zhàn)場環(huán)境下即使通過多傳感器探測并利用信息融合處理獲得的目標(biāo)信息,仍然不可避免地存在目標(biāo)識別準(zhǔn)確率不高、目標(biāo)估計信息精度下降和不穩(wěn)定、目標(biāo)信息傳輸延時和丟包等問題,對于此類復(fù)雜目標(biāo)信息情況下,現(xiàn)有的制導(dǎo)律難以適用,需要設(shè)計針對上述復(fù)雜多變目標(biāo)信息的制導(dǎo)律。對于此類問題,可以考慮根據(jù)所獲取的目標(biāo)信息的質(zhì)量、完整性進(jìn)行分類,對不同的信息采用不同的制導(dǎo)律,然后進(jìn)行切換或加權(quán)。至于分類方法和加權(quán)系數(shù)的處理,可以考慮充分利用人工智能強大的學(xué)習(xí)推理能力如神經(jīng)網(wǎng)絡(luò)或強化學(xué)習(xí)的方法來處理,從而獲得多源信息融合條件下的智能制導(dǎo)律。也可以直接基于分布式多源異構(gòu)信息融合下目標(biāo)復(fù)雜多變信息對制導(dǎo)影響的主要特征參數(shù),構(gòu)建合適的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),通過離線和在線學(xué)習(xí)的方法獲得智能制導(dǎo)律。

(2)多約束和不確定條件下的單智能體智能制導(dǎo)律

復(fù)雜的作戰(zhàn)環(huán)境和作戰(zhàn)需求及飛行器探測和動力配置方式的多樣化等給飛行器制導(dǎo)控制帶來一系列的約束問題。如為了保證殺傷效果,通常要求飛行器以特定的彈道和特定角度攻擊目標(biāo),即對速度方向和終端交匯角產(chǎn)生約束;同時,由于受到自身物理屬性和發(fā)動機(jī)推力的限制,其過載也受到約束;另外,對于空中目標(biāo),還會受到目標(biāo)機(jī)動和釋放干擾等不確定因素的影響,這顯然是一個多約束和不確定條件下的制導(dǎo)問題。如果是高超飛行器,對攻角、飛行速度、飛行航跡和飛行姿態(tài)有更嚴(yán)格的約束以及熱流造成飛行器的彈性變形等隨機(jī)不確定因素等。因此,需要深入研究滿足多約束和不確定條件下的制導(dǎo)律問題??赡艿乃悸肥窍确艑捈s束條件和建立粗略的不確定模型,利用現(xiàn)有的控制理論設(shè)計帶有約束變量和不確定參量的制導(dǎo)律;然后,構(gòu)建仿真系統(tǒng),在遍歷所要約束條件和不確定環(huán)境下進(jìn)行大量的制導(dǎo)仿真,獲得帶有標(biāo)簽的樣本;接著利用人工智能中神經(jīng)網(wǎng)絡(luò)或強化學(xué)習(xí)等強大學(xué)習(xí)和推理能力,自適應(yīng)的估計出約束變量和不確定的參量,從而獲得多約束和不確定條件下的智能制導(dǎo)律。也可以直接基于約束條件和不確定環(huán)境下對制導(dǎo)影響的主要特征參數(shù),構(gòu)建合適的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),通過離線和在線性學(xué)習(xí)的方法獲得智能制導(dǎo)律。

4.2 多智能體的智能制導(dǎo)律

(1)多智能體協(xié)同智能制導(dǎo)律

近年來,集群智能作為人工智能的一個主要方向獲得快速發(fā)展,并被廣泛應(yīng)用到無人機(jī)編隊、機(jī)器人編隊等協(xié)同制導(dǎo)控制中。對于多飛行器協(xié)同制導(dǎo)來說,目前主要基于多智能體一致性理論設(shè)計協(xié)同制導(dǎo)律,解決的主要是網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、通信和防碰撞等多智能體相互之間的制導(dǎo)影響以及一致性條件是否滿足的問題,沒有將上述的多源信息融合條件下或多約束不確定條件下的實際影響因素與協(xié)同制導(dǎo)設(shè)計問題結(jié)合。因此,需要對此進(jìn)行深入研究,可能的研究方向包括:分布式多維多源異構(gòu)信息融合下的多飛行器協(xié)同智能制導(dǎo)律研究;帶有通信延時和防碰撞條件下的多無人飛行器協(xié)同智能制導(dǎo)律研究;基于強化學(xué)習(xí)的多飛行器非線性協(xié)同智能制導(dǎo)律研究等。

(2)目標(biāo)和任務(wù)變化下的多智能體智能制導(dǎo)律

當(dāng)多智能體在攻擊目標(biāo)特別是集群目標(biāo)時,由于距離較遠(yuǎn)且目標(biāo)群無法分開,一開始分配給多智能體的目標(biāo)可能是一個粗略的目標(biāo),等到多智能體能清楚探測、識別具體目標(biāo)時,需要實時調(diào)整任務(wù)和再次分配目標(biāo)。在此過程中,如何進(jìn)行智能自主制導(dǎo)將是需要研究的問題,即目標(biāo)和任務(wù)動態(tài)變化情況下的制導(dǎo)問題??梢钥紤]采用以下兩種思路:一是將目標(biāo)和任務(wù)分類組合,針對每一種組合設(shè)計相應(yīng)的制導(dǎo)律,再采用人工智能中神經(jīng)網(wǎng)絡(luò)或強化學(xué)習(xí)等方法構(gòu)建學(xué)習(xí)推理模型,自主地識別目標(biāo)和任務(wù)的分類,學(xué)習(xí)相應(yīng)的制導(dǎo)律參數(shù),實現(xiàn)自主智能制導(dǎo);二是構(gòu)建仿真環(huán)境,在遍歷目標(biāo)和任務(wù)情況下,進(jìn)行大量的制導(dǎo)仿真獲取樣本,然后構(gòu)建神經(jīng)網(wǎng)絡(luò)或強化學(xué)習(xí)模型,采用離線學(xué)習(xí)和動態(tài)調(diào)整相結(jié)合的方法,實現(xiàn)智能自主制導(dǎo)。

5 結(jié)束語

智能制導(dǎo)律代表了未來制導(dǎo)律的發(fā)展方向,智能化導(dǎo)彈能夠在戰(zhàn)場上發(fā)揮指揮官的作用,對戰(zhàn)場全面統(tǒng)籌、監(jiān)控戰(zhàn)場態(tài)勢,做出相應(yīng)決策,對戰(zhàn)局有舉足輕重的影響。國外發(fā)達(dá)國家已經(jīng)在智能化導(dǎo)彈的研制上取得建樹,因此研究新型智能制導(dǎo)律的意義重大。面對當(dāng)今世界科學(xué)技術(shù)高速發(fā)展和新軍事變革的迅猛推進(jìn),加速導(dǎo)彈智能化技術(shù)的研究,是鞏固我國大國地位,實現(xiàn)“能打仗,打勝仗”的關(guān)鍵所在。

猜你喜歡
制導(dǎo)導(dǎo)彈神經(jīng)網(wǎng)絡(luò)
導(dǎo)彈燃料知多少
軍事文摘(2020年14期)2020-12-17 06:27:16
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
正在發(fā)射的岸艦導(dǎo)彈
兵器知識(2019年1期)2019-01-23 02:20:44
攔截那枚導(dǎo)彈
導(dǎo)彈轉(zhuǎn)運
基于MPSC和CPN制導(dǎo)方法的協(xié)同制導(dǎo)律
基于在線軌跡迭代的自適應(yīng)再入制導(dǎo)
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
帶有攻擊角約束的無抖振滑模制導(dǎo)律設(shè)計
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
饶河县| 大兴区| 曲靖市| 瑞丽市| 顺昌县| 海城市| 洱源县| 讷河市| 江孜县| 朝阳市| 济源市| 云林县| 巴林左旗| 柯坪县| 黄浦区| 准格尔旗| 沈阳市| 浑源县| 抚远县| 西平县| 兴山县| 龙南县| 卢龙县| 昂仁县| 乐安县| 台东县| 虞城县| 调兵山市| 潞西市| 呼伦贝尔市| 尚志市| 东城区| 上蔡县| 锦屏县| 宽甸| 多伦县| 江山市| 株洲县| 南澳县| 繁昌县| 丰宁|