王 楠,許蘊(yùn)山,夏海寶,王俊迪
(1 空軍工程大學(xué)航空機(jī)務(wù)士官學(xué)校,河南信陽(yáng) 464099;2 空軍工程大學(xué), 西安 710038)
在空戰(zhàn)中,形成空中優(yōu)勢(shì)與奪取制空權(quán)是現(xiàn)代空戰(zhàn)主要的兩大任務(wù),其中,增大作戰(zhàn)體系的最大同時(shí)攻擊目標(biāo)數(shù)目與最大同時(shí)跟蹤目標(biāo)數(shù)目是作戰(zhàn)體系的關(guān)鍵需求[1],機(jī)載傳感器作為獲取戰(zhàn)場(chǎng)信息的關(guān)鍵裝備,能否對(duì)其進(jìn)行有效管理以滿足作戰(zhàn)體系攻擊與跟蹤需求,成為多機(jī)協(xié)同作戰(zhàn)體系信息獲取的關(guān)鍵所在[2]。文中針對(duì)典型的多機(jī)協(xié)同作戰(zhàn)傳感器系統(tǒng)應(yīng)用問題進(jìn)行研究,為完成多機(jī)協(xié)同作戰(zhàn)任務(wù)提供支持。在多機(jī)協(xié)同作戰(zhàn)傳感器管理中,首要問題便是根據(jù)具體的作戰(zhàn)任務(wù)分解出機(jī)載傳感器的具體任務(wù)[3],傳感器任務(wù)主要包含:
1)達(dá)到待攻擊目標(biāo)的跟蹤精度要求;
2)存在威脅目標(biāo)的穩(wěn)定跟蹤精度要求;
3)保持對(duì)新生目標(biāo)的及時(shí)發(fā)現(xiàn)。
多機(jī)協(xié)同作戰(zhàn)傳感器管理是多傳感器系統(tǒng)管理的一個(gè)重要應(yīng)用,在現(xiàn)代空戰(zhàn)環(huán)境中綜合管理各個(gè)傳感器并使之形成高效的傳感器系統(tǒng)是該應(yīng)用的重要研究?jī)?nèi)容。文獻(xiàn)[4]研究了傳感器管理的結(jié)構(gòu)與微觀傳感器管理,就形成了當(dāng)前比較常用的宏觀/微觀式雙層結(jié)構(gòu),但并未給出總體的管理框架。文獻(xiàn)[5]針對(duì)傳感器資源有限的問題,建立了傳感器目標(biāo)的代價(jià)函數(shù)矩陣,進(jìn)而利用線性規(guī)劃的方法對(duì)所跟蹤目標(biāo)進(jìn)行傳感器資源的最優(yōu)分配,缺乏分配完成后傳感器自身的資源管理。
文中將傳感器管理的輸入信息,即當(dāng)前狀態(tài)劃分為平臺(tái)狀態(tài)和傳感器信息狀態(tài),并根據(jù)兩類狀態(tài)輸入,結(jié)合線性規(guī)劃以及MAB模型的UCB算法進(jìn)行傳感器的協(xié)同控制,最終給出基于當(dāng)前狀態(tài)的傳感器管理優(yōu)化算法。
圖1 系統(tǒng)管理框架
Alfred O. Hero III在文獻(xiàn)[6]中指出,用控制論的觀點(diǎn)可以將傳感器管理看作是在優(yōu)化控制一個(gè)狀態(tài),通過選擇測(cè)量策略,選擇出離散信息以及傳感器組合,把控制對(duì)象分割為物理動(dòng)態(tài)和信息動(dòng)態(tài)。如圖2所示。
圖2 動(dòng)態(tài)控制
文中借鑒該思想,將傳感器平臺(tái)的運(yùn)動(dòng)變化考慮為物理動(dòng)態(tài),傳感器與目標(biāo)之間的信息交互看作信息動(dòng)態(tài)。著眼于兩類動(dòng)態(tài)的巨大差異,才相應(yīng)的提出了該雙層優(yōu)化管理方法。
兩個(gè)層次其內(nèi)涵分別是空時(shí)劃分與資源管理,其中空時(shí)劃分是基于當(dāng)前空中各平臺(tái)的位置或運(yùn)動(dòng)狀態(tài)即物理動(dòng)態(tài)進(jìn)行劃分的,相較于文獻(xiàn)[7]分配對(duì)象增加了時(shí)間資源的劃分,由于平臺(tái)狀態(tài)的變化相對(duì)較慢,因此劃分是在靜態(tài)狀態(tài)下完成優(yōu)化的;而傳感器資源管理是建立在當(dāng)前傳感器與目標(biāo)的信息交互狀態(tài)上的,其管理時(shí)間往往是毫秒級(jí)的,因此在資源管理的時(shí)間維度上,可以認(rèn)為空時(shí)劃分是靜態(tài)的,在獲得空時(shí)劃分結(jié)果后,再進(jìn)行相應(yīng)的資源管理。
首先對(duì)與傳感器管理相關(guān)場(chǎng)景所包含的各類變量進(jìn)行說明,如表1。
表1 變量說明
假設(shè)條件:
1)將區(qū)域邊緣劃分為若干個(gè)檢測(cè)單元,只考慮目標(biāo)可能出現(xiàn)在邊緣檢測(cè)單元的檢測(cè)問題,通常區(qū)域內(nèi)的檢測(cè)性能肯定好于邊界;
2)在物理動(dòng)態(tài)更新的周期T內(nèi),新目標(biāo)始終在一個(gè)檢測(cè)單元之中;
3)只考慮傳感器獲取信息功能,未考慮隱蔽與抗干擾問題。
2.2.1 任務(wù)需求
根據(jù)傳感器自身任務(wù)需求,傳感器必須在滿足攻擊或跟蹤目標(biāo)的精度要求的條件下,保持較高的新生目標(biāo)發(fā)現(xiàn)性能。在一個(gè)物理動(dòng)態(tài)周期內(nèi),目標(biāo)或檢測(cè)單元的信息增益與傳感器在周期內(nèi)耗費(fèi)在其上的時(shí)間成正比。優(yōu)化模型可以表示為下式:
y= min(ζn)
2.2.2 控制策略
通過調(diào)整傳感器與目標(biāo)之間的信息交互時(shí)間來(lái)完成最優(yōu)化目標(biāo)信息獲取水平。下面就是算法步驟:
輸入:L,S,G,A,K。
步驟:1)確定pij,qin;2)根據(jù)任務(wù)K,確定各個(gè)目標(biāo)的跟蹤精度要求ρ0;3)優(yōu)化得到當(dāng)前物理?xiàng)l件下的傳感器,目標(biāo)區(qū)域的空時(shí)劃分。
輸出:分配結(jié)果τij,τik。
算法的主要部分在于第三步的優(yōu)化部分,該優(yōu)化問題可以看作線性優(yōu)化問題:
可以將該線性優(yōu)化問題轉(zhuǎn)化為標(biāo)準(zhǔn)的線性規(guī)劃問題。
根據(jù)當(dāng)前的物理狀態(tài),優(yōu)化獲得了傳感器與目標(biāo)的空時(shí)分配,得到了各個(gè)傳感器在一個(gè)物理狀態(tài)周期內(nèi)的時(shí)間任務(wù)分配結(jié)果,下面就是要根據(jù)該結(jié)果來(lái)完成各個(gè)傳感器的資源管理。圖3就是總體的傳感器管理流程圖。
圖3 傳感器管理流程
關(guān)于傳感器資源管理部分,文獻(xiàn)[8-9]都進(jìn)行了一些研究。文中主要利用MAB模型[10-11]對(duì)波束控制進(jìn)行描述,進(jìn)而采用UCB指數(shù)方法[12]完成模型的應(yīng)用。在完成雷達(dá)目標(biāo)搜索時(shí),首先將待探測(cè)空域劃分為m個(gè)波束位置,進(jìn)行一輪均勻搜索,據(jù)此得到初始的波位UCB指數(shù),然后根據(jù)UCB指數(shù)進(jìn)行波束的控制,根據(jù)UCB指數(shù)的策略,波束會(huì)傾向于回波幅度較高的位置,最終穩(wěn)定在回波幅度最高的波位[13-14],根據(jù)脈沖積累原理[15],雷達(dá)會(huì)在目標(biāo)存在的地方獲得更強(qiáng)的回波信號(hào),從而積累得以發(fā)現(xiàn)目標(biāo)。
設(shè)置傳感器與目標(biāo)之間的單位時(shí)間探測(cè)信息交互量(表2),即pij。并且目標(biāo)1~3的任務(wù)設(shè)置為穩(wěn)定跟蹤目標(biāo),目標(biāo)4為待攻擊目標(biāo)。
表2 傳感器目標(biāo)信息交互 s/km2
根據(jù)任務(wù)得到單位時(shí)間目標(biāo)的任務(wù)需求見表3。
表3 目標(biāo)任務(wù)設(shè)置 1/km2
根據(jù)線性規(guī)劃得到傳感器目標(biāo)在單位時(shí)間內(nèi)的劃分結(jié)果見表4。
在空時(shí)劃分層,各個(gè)傳感器得以在其最佳區(qū)域發(fā)揮優(yōu)勢(shì),在二者性能所差無(wú)幾的目標(biāo)則共同完成其探測(cè)。
表4 優(yōu)化結(jié)果
設(shè)置目標(biāo)回波水平在雜波為高斯分布條件下,圖4是目標(biāo)回波歸一化幅度為1~2時(shí),雷達(dá)發(fā)現(xiàn)目標(biāo)時(shí)刻目標(biāo)出現(xiàn)波位與其他波位更新次數(shù)的比值(除去首次均勻搜索的一次)。
圖4 波束更新時(shí)間比
由此可見在未發(fā)現(xiàn)目標(biāo)之前,雷達(dá)將波束控制在目標(biāo)存在區(qū)域的時(shí)間大約是其他波位的5倍,這與波束搜索策略的目的要求是一致的。接下來(lái)按照表5設(shè)置雷達(dá)工作環(huán)境與參數(shù)。
表5 參數(shù)設(shè)置
下面在雷達(dá)的目標(biāo)發(fā)現(xiàn)概率和目標(biāo)發(fā)現(xiàn)效率兩個(gè)方面,將該方法與其他方法進(jìn)行對(duì)比,主要是貪婪算法[16]和UCB-V指數(shù)[17]方法。文中的貪婪算法的具體設(shè)置是,僅僅更新探測(cè)當(dāng)前目標(biāo)回波幅度最高的若干個(gè)搜索單元,而不采用UCB指數(shù)。N=1代表每次更新僅僅檢測(cè)回波幅度最高的一個(gè)波位單元,N=2表示每次更新檢測(cè)回波幅度最高的前兩個(gè)檢測(cè)單元,該方法屬于無(wú)隨機(jī)探索的貪婪算法。結(jié)合文獻(xiàn)[17]提出的帶方差信息的UCB-V方法進(jìn)行對(duì)比。
圖5 目標(biāo)搜索情況
在基于信息動(dòng)態(tài)的資源管理中,各個(gè)傳感器不斷根據(jù)當(dāng)前回波信息調(diào)整搜索策略,將更多資源配置于目標(biāo)存在概率大的區(qū)域,使得雷達(dá)目標(biāo)發(fā)現(xiàn)概率明顯提升,獲得同樣的目標(biāo)發(fā)現(xiàn)概率,文中提供方法較原先的均勻掃描方法對(duì)目標(biāo)回波幅度的要求更低,降低幅度至少為噪聲標(biāo)準(zhǔn)差的3倍。在功率上,該值對(duì)應(yīng)的信噪比水平約為10 dB。
文中針對(duì)多機(jī)協(xié)同傳感器系統(tǒng)的工作方式進(jìn)行研究,結(jié)合物理動(dòng)態(tài)與信息動(dòng)態(tài)將多機(jī)協(xié)同傳感器管理劃分為兩個(gè)層次:空時(shí)劃分層與資源管理層。從而將系統(tǒng)管理問題轉(zhuǎn)化為兩級(jí)數(shù)學(xué)優(yōu)化問題,有效降低了系統(tǒng)的復(fù)雜度。仿真結(jié)果表明傳感器可以協(xié)同有效完成任務(wù),并通過資源管理提升傳感器應(yīng)用水平,在搜索狀態(tài)下,發(fā)現(xiàn)目標(biāo)功率信噪比較原先降低10 dB以上。