楊慶培,尚朝軒,董 健,王 韓
(1.陸軍工程大學(石家莊校區(qū)) 電子與光學工程系,石家莊 050003;2.中國電子科技集團公司第五十四研究所,石家莊 050003)
雷達波形通常與探測的目標類型、環(huán)境特性以及雷達的用途有關,好的波形能夠提高雷達的檢測性能和目標參數(shù)估計精度。傳統(tǒng)波形設計方法通常假設目標是先驗知識已知的準確量,并且不去考慮干擾機的相互干擾,這與實戰(zhàn)環(huán)境相去甚遠,會使波形設計性能降低,同時給波形參數(shù)優(yōu)化帶來較大的挑戰(zhàn)。因此,研究雷達與干擾機相互博弈條件下的波形優(yōu)化方法,提高雷達的檢測、跟蹤、識別性能,是當前研究的重要課題。
對于隨機目標,可將其沖激響應建模為復寬平穩(wěn)隨機過程。依據這一模型,Bell[1]研究了最大化接收信號和高斯目標之間最大互信息量(Mutual Information,MI)的波形設計方法,Leshem[2]將基于MI的波形設計方法用于多個擴展目標,Romero[3]分析了雜波條件下由MI準則進行波形設計在認知雷達系統(tǒng)中的應用。文獻[4]證明基于最大化互信息準則設計的最優(yōu)波形相較于正交波形,性能有明顯提升。文獻[5]基于MI和信噪比(Signal-to-Noise Ratio,SNR)準則對確定目標和隨機擴展目標波形設計相關理論進行了闡述和論證。文獻[6]以互信息最大為設計指標,建立統(tǒng)一信號模型,解決了頻譜受限多輸入多輸出(Multiple-Input Multiple-Output,MIMO)雷達波形設計問題。文獻[7]首先對MIMO雷達與干擾機間的相互博弈現(xiàn)象進行了研究,針對Stackelberg博弈模型提出了基于MI準則的波形優(yōu)化策略。 文獻[8]采用極大極小方法,對雷達與干擾機分層博弈模型進行了建模與仿真,通過將目標頻譜建模為上下限已知的條帶模型,得到了最不利條件下的魯棒波形,有效提高了雷達的參數(shù)估計性能,但是并沒有論證條帶范圍的選取準則,也沒有證明相關模型的優(yōu)越性。文獻[9]基于最大信干噪比準則,推導論證了彈載雷達與目標相互博弈過程中波形設計納什均衡解的存在性,并通過多次迭代注水的方法進行了求解,其方法更接近帕累托最優(yōu)。但是該算法需要對雙拉格朗日乘子進行搜索,計算較復雜。文獻[10]研究了單基地雷達和干擾機的博弈策略設計問題,推導并驗證了平衡策略的有效性。但是在問題建模時,并沒有考慮信號相關雜波的影響。文獻[11]應用拉格朗日乘數(shù)法和粒子群(Particle Swarm Optimization,PSO)算法得到了Stackelberg平衡,仿真證明了相關算法的有效性,但是同樣未考慮信號相關雜波的影響?;谏鲜鲅芯浚疚挠懻摿穗s波條件下雷達與干擾機均衡博弈策略,考慮到注水法對拉格朗日乘子初值設定以及搜索過程要求較高,采用最大邊緣分配(Maximum Marginal Allocation,MMA)算法進行求解,并設計了仿真實驗進行驗證。
本文的創(chuàng)新工作主要是:將MMA算法引入雷達博弈過程,相較于傳統(tǒng)迭代注水算法,該算法不需要對拉格朗日乘子進行搜索,并且避免了乘子初值對波形的影響,大大減少了計算量;基于最大互信息準則建立了認知雷達與干擾之間的非合作博弈模型,迭代求解了納什均衡時雷達波形的能量譜分布,并將均衡策略與maxmin策略以及minmax策略和隨機策略進行了對比,仿真實驗驗證了均衡策略的有效性。
定義在時間間隔為[0,Th]內平穩(wěn)隨機目標模型為一廣義平穩(wěn)隨機過程,在該區(qū)間外為0。圖1[12]是有限持續(xù)時間的隨機目標信號的產生過程,其中g(t)是一個具有確定功率譜密度的復廣義平穩(wěn)隨機過程,a(t)是持續(xù)時間Tk的矩形窗函數(shù),由此可得輸出h(t)=a(t)?g(t)是一個僅在[0,Th]有效的有限時間隨機過程,且由于g(t)廣義平穩(wěn),故h(t)在[0,Th]上也是平穩(wěn)隨機過程[13]。
圖1 有限時間隨機目標模型[12]
該隨機過程的能量譜密度(Energy Spectral Density,ESD)可定義為
ξH(f)=E[|H(f)|2] 。
(1)
若隨機過程的傅里葉變換函數(shù)的均值表示為
μH(f)=E[|H(f)|] ,
(2)
則該過程傅里葉變換H(f)的方差為
(3)
圖2給出了適用于基于MI波形設計方法的信道模型,其中,單一或擴展隨機目標為g(t),其傅里葉變換為g(f);n(t)是具有功率譜密度為Snn(f)的零均值接收機噪聲過程,假設Snn(f)是一個雙邊帶功率譜密度,頻帶范圍為[-W/2,W/2];雜波分量c(t)也是一個零均值隨機過程,PSD為Scc(f),且在帶寬范圍內有效;x(t)為復值基帶發(fā)射信號,其傅里葉變換為X(f);干擾信號為j(t),其PSD為J(f)。
圖2 基于MI波形設計方法的信道模型
雷達接收回波為
y(t)=s(t)*g(t)+s(t)*c(t)+n(t)+j(t)。
(4)
用頻域相乘代替時域卷積過程:
Y(f)=S(f)G(f)+S(f)C(f)+N(f)+J(f)。
(5)
將帶寬W劃分為M個等寬的小頻段Δf,每個子頻段Fk=[fk,fk+Δf],其間信號頻譜近似為常數(shù),在時寬t∈[0,T]內對每個子頻段的時域采樣,則互信息[14]為
(6)
對于一個時間有限的隨機目標g(t),它的原始熵是有限的,因此并不存在功率譜密度。
用ESV代替PSD,得到
I(y(t);x(t)/s(t))=
(7)
考慮理想情況,雷達與干擾機均可以根據獲得的信息自適應改變發(fā)射波形。對于雷達來說,通過改變發(fā)射波形的能量譜使得雷達所獲得的互信息最大,用數(shù)學表示即為
(8)
式中:Ep為發(fā)射機能量限制,Ej為干擾機能量限制,BW為頻帶范圍[-W/2,W/2]。
對于干擾機來說剛好相反。干擾機想通過優(yōu)化干擾波形J(f)使得雷達所獲得的互信息最小,數(shù)學表示為
(9)
由于目標完全對立,雷達與干擾機構成了二元零和博弈,一方策略的改變將直接影響另一方的策略。在電子戰(zhàn)中,雷達處于領先地位,干擾機會根據偵測信息改變策略,以匹配當前環(huán)境,使雷達所獲得的互信息最小。雷達偵測到干擾機的變化,也會自適應改變發(fā)射波形來提高互信息,兩者相互博弈直至達到納什均衡。文獻[9]和文獻[15]推導論證了納什均衡解的存在性和收斂性,在此不再贅述,直接引用結論。
MMA算法其實是解決固定資源分配問題,它是在單約束或多約束條件下將固定數(shù)量的資源投入給不同的活動,以達到最有效的效果。
假設給定式子
(10)
(11)
(12)
式中:
(13)
(14)
文獻[16-17]仿真驗證了MMA算法與拉格朗日乘子算法所得的波形能量譜幾近重合,前者因為突破了乘子復雜搜索過程,只與最小能量分配單元有關,運行時間極大縮短。
將上述MMA算法原理運用在基于MI最大的博弈波形設計問題上。將MI離散化后得
(15)
式中:Δf=W/N;k=1,2,3,…,N;fk=kΔf。同時,將能量約束離散化,公式可寫為
(16)
(17)
令
u(k)=|S(fk)|2,
(18)
(19)
(20)
則最大化互信息可簡寫成
(21)
(22)
將umax離散等分成M份,最小單元為Δ,umax=MΔ,u(k)的取值范圍為{0,Δ,2Δ,…,MΔ}。該算法每一次都把Δ單位的能量分配給可以獲得最大互信息的頻段,當所有的能量都分配完,獲得的目標與回波之間互信息最大[18]。即:對所有k值,均選擇D(u(k),k)中的最大值D(u(kmax),kmax),將Δ的能量分配給u(kmax),在下一次能量分配之前更新D(u(k),k),直至整個能量分配過程結束,此時得到的結果即為目標與回波之間的最大互信息量,且對不同的k值,在各頻段分配的能量u(k)就是最優(yōu)發(fā)射波形的能量譜。
本文利用MMA算法對納什均衡解進行求解,將大大縮短運算時間。均衡博弈波形設計MMA算法流程如下:
Step5 更新干擾波形:|J(fk)|=|J(fk)|1。
Step6 重復Step 2~5,直至互信息不再變化。
某型雷達發(fā)射信號總能量限定為E=1,信號頻率范圍為[0,1],最小能量分配單元Δ設為0.2,則能量分配份數(shù)也即該算法步驟數(shù)M=500,采樣點數(shù)為100。設高斯白噪聲功率譜密度為Pnn(f)=0.05,觀測時間T=1。針對隨機目標,此時的目標雜波比為-4.8 dB,目標噪聲比為5.2 dB。
首先仿真固定能量干擾的博弈策略。干擾能量設置為0.8,圖3顯示了雷達與干擾機波形能量分配情況。能夠發(fā)現(xiàn),當雷達處于主導地位時,雷達與干擾機相互博弈的結果是傾向于將能量分配在目標沖激響應最強烈的頻段。圖4是兩者相互博弈過程中互信息的變化情況。可知經過六次博弈,互信息達到平衡,之后兩者的策略均不再對互信息有明顯的影響。
圖3 固定能量干擾機波形
圖4 博弈過程中互信息變化情況
接下來對干擾機的變功率情況進行仿真。設定干擾能量變化范圍0.6~1,仿真結果如圖5和圖6所示。由圖5可以發(fā)現(xiàn),干擾能量越強,干擾機與雷達的策略越接近。圖6給出了變功率情況的互信息變化情況,可見干擾機的能量越強,互信息的整體變化趨勢是減少,雷達所獲得的有效信息將減少。
(a)干擾能量為0.6
(b)干擾能量為0.7
(c)干擾能量為0.8
(d)干擾能量為1圖5 變功率干擾機與雷達博弈波形
圖6 變功率干擾機與雷達博弈互信息變化情況
圖7~10給出了變能量雷達與變能量干擾機相互博弈時互信息的變化情況。為了驗證均衡博弈策略的有效性,圖9和圖10給出了maxmin策略和minmax策略時雷達和干擾機能量變化時互信息變化情況的三維圖,能夠發(fā)現(xiàn)幾種策略較為接近,但是并不相同。
圖7 雷達主導時均衡策略互信息變化情況
圖8 干擾機主導時均衡策略互信息變化情況
圖9 maxmin策略互信息變化情況
圖10 minmax策略互信息變化情況
為了定量分析,圖11則對幾種策略進行了直觀對比。該對比實驗固定了雷達能量,可以發(fā)現(xiàn),無論干擾機能量如何變化,均衡博弈策略互信息要始終高于其他策略,性能最優(yōu)。
圖11 幾種策略對比
本文通過對雷達與干擾機相互博弈過程的建模,研究了雷達與干擾機的策略設計問題。首先將認知雷達和干擾機之間的關系建模為Stackelberg博弈,然后基于MI效用函數(shù)分析推導了平衡策略。仿真實驗表明,當雷達處于主導地位時,雷達與干擾機互相博弈的策略都傾向于在目標ESV較大的頻率上分配更多的能量,盡管干擾機設計的干擾波形會降低雷達系統(tǒng)的性能,但當雷達處于主導地位時,基于均衡策略設計的發(fā)射波形最終可以保證雷達系統(tǒng)的估計性能,為解決干擾條件下提高雷達性能問題提供了有益的指導。