程瑞鋒劉衛(wèi)東 高立娥 康智強(qiáng)
1)(西北工業(yè)大學(xué)航海學(xué)院,西安 710072)
2)(西北工業(yè)大學(xué),水下信息與控制重點(diǎn)實(shí)驗(yàn)室,西安 710072)
3)(西安建筑科技大學(xué)機(jī)電工程學(xué)院,西安 710055)
(2017年5月24日收到;2017年10月11日收到修改稿)
相比空中追蹤,水下追蹤以海水為工作介質(zhì),受水聲物理場的制約[1],水下聲自導(dǎo)裝置獲取目標(biāo)參量的周期相對較長.同時(shí)由于實(shí)際海洋環(huán)境隨時(shí)空變化的特性[2]和海洋自噪聲、艦船噪聲、生物發(fā)聲等環(huán)境噪聲[3]的存在,聲自導(dǎo)探測的目標(biāo)信號(hào)通常伴有一定的混響和干擾[4].這些混響和干擾隨水文、環(huán)境條件及航行深度和追蹤相對距離等的改變會(huì)發(fā)生隨機(jī)變化,使水下追蹤器自導(dǎo)裝置對目標(biāo)的探測精度受到嚴(yán)重影響,極易造成目標(biāo)信號(hào)的丟失與誤判,實(shí)時(shí)、有效獲取目標(biāo)參量成為水下追蹤導(dǎo)引面臨的首要難題.雖然微分對策通過“最壞”情況下的“最佳”控制性能設(shè)計(jì),能有效處理動(dòng)態(tài)對抗問題,但受實(shí)際追蹤系統(tǒng)中存在的非線性、時(shí)變、模型失配、干擾等因素影響[5],當(dāng)目標(biāo)機(jī)動(dòng)頻繁時(shí),剩余航行時(shí)間的估計(jì)誤差較大[6],且微分對策僅考慮了對抗時(shí)間與能耗的最優(yōu)原則,無法保證動(dòng)態(tài)對抗的過程約束.預(yù)測控制中的廣義預(yù)測控制(GPC)算法能有效處理過程約束,并結(jié)合辨識(shí)與自校正機(jī)理對機(jī)動(dòng)目標(biāo)進(jìn)行實(shí)時(shí)監(jiān)測,具有魯棒性強(qiáng)、能有效克服系統(tǒng)滯后等優(yōu)點(diǎn)[7].但由于微分對策t的引入,對策現(xiàn)象或規(guī)律在連續(xù)變量空間呈現(xiàn)動(dòng)態(tài)結(jié)構(gòu)[8],阻礙了離散時(shí)間設(shè)計(jì)方法的應(yīng)用,且廣義預(yù)測算法中離散時(shí)間的選取受采樣周期的影響較大,而水下追蹤器的自導(dǎo)探測無法保證在廣義預(yù)測的每個(gè)檢測周期都能俘獲目標(biāo)信息,對目標(biāo)探測周期的不合理選擇可能導(dǎo)致目標(biāo)的漏檢和系統(tǒng)的不穩(wěn)定[9].連續(xù)時(shí)間廣義預(yù)測控制(CGPC)算法屬于模型預(yù)測控制的一員,通過模型的泰勒級數(shù)展開得到預(yù)測模型,不需要進(jìn)行模型的離散化,在采樣時(shí)間的選擇上較為靈活,不但繼承了GPC算法的眾多優(yōu)點(diǎn),而且擁有和GPC算法類似的調(diào)節(jié)參數(shù),對外界擾動(dòng)和參數(shù)攝動(dòng)具有更強(qiáng)的魯棒性和自適應(yīng)能力[10,11].
在水下追蹤博弈過程中,如果追蹤方能夠快速、準(zhǔn)確地俘獲機(jī)動(dòng)目標(biāo)信息,便可在微分對策中處于優(yōu)勢地位.因此,在追蹤器發(fā)現(xiàn)目標(biāo)后,本文利用連續(xù)時(shí)間廣義預(yù)測算法,對自導(dǎo)俘獲的目標(biāo)運(yùn)動(dòng)信息要素進(jìn)行解算、預(yù)測,通過滾動(dòng)優(yōu)化反饋校正的學(xué)習(xí)預(yù)測功能,實(shí)施對自導(dǎo)探測有利提前角的快速調(diào)整控制,并利用滾動(dòng)優(yōu)化,將微分對策的初始時(shí)刻隨整個(gè)預(yù)測時(shí)段向前推移,實(shí)現(xiàn)對微分對策導(dǎo)引的實(shí)時(shí)補(bǔ)償校正,有效避免剩余時(shí)間的估計(jì)誤差.在確保復(fù)雜海洋環(huán)境下追蹤器獲得對機(jī)動(dòng)目標(biāo)最大概率俘獲的同時(shí),將追蹤時(shí)間不確定情形的微分對策控制轉(zhuǎn)化為多個(gè)有限時(shí)域的微分對策滾動(dòng)優(yōu)化.通過動(dòng)態(tài)規(guī)劃與預(yù)測優(yōu)化的優(yōu)勢互補(bǔ),克服微分對策在對抗過程約束和隨機(jī)干擾方面的不足.在保證微分博弈追蹤全局漸近穩(wěn)定的同時(shí),解決了不確定性因素影響下如何平衡控制器設(shè)計(jì)的魯棒性與保守性的難題.
將復(fù)雜海洋環(huán)境下的追蹤博弈描述為一類具有干擾的非線性連續(xù)動(dòng)態(tài)系統(tǒng):
式中x∈X?Rn為狀態(tài)變量,X為狀態(tài)空間;y∈Rm為輸出狀態(tài)變量. 追蹤博弈雙方的決策控制變量u∈[?umax,umax]∈Uγ和v∈[?vmax,vmax]∈Vl,且γ≤n.f(x)∈Rn;g(x)∈Rn×γ;l(x)∈Rn×l;z(x)∈Rn×q為內(nèi)部系統(tǒng)模型,h(x)∈Rn×m為輸出函數(shù).初始狀態(tài)x(t0)=ζ,服從高斯分布N(m0,R0),R0為非負(fù)定矩陣;隨機(jī)干擾ω屬于給定概率空間(?,?,P),且與初始值x0互不相關(guān)[12].
將追蹤博弈考慮為生存型微分對策,相應(yīng)二次型性能指標(biāo)為
則(2)式中相關(guān)性能指標(biāo)可進(jìn)一步表示為
式中μ=(μ1,μ2,···,μl)T∈Rl為待定系數(shù);L(t)為半正定時(shí)變矩陣,R1(t)和R2(t)為正定對稱時(shí)變矩陣. 設(shè)λ=(λ1,λ2,···,λn)T∈Rn是任意向量,利用文獻(xiàn)[14]哈密頓-雅可比方程對微分對策進(jìn)行求解,構(gòu)造系統(tǒng)((1)式)的哈密頓函數(shù):
由于正規(guī)合成鞍點(diǎn)的每個(gè)策略都能充分考慮當(dāng)前t時(shí)刻的狀態(tài)信息,使博弈雙方根據(jù)當(dāng)前的對策局勢制定與調(diào)整策略,適用于對策局勢不斷變化的博弈問題.因此將水下追蹤問題轉(zhuǎn)化為尋找微分對策值?,使其滿足[15]
對應(yīng)的正規(guī)合成鞍點(diǎn)為[u?(t,x),v?(t,x)]∈Uγ×Vl,由正規(guī)合成鞍點(diǎn)存在滿足的協(xié)態(tài)方程和橫截條件:
應(yīng)用伴隨原理,定義追蹤過程中系統(tǒng)不加控制經(jīng)有限時(shí)間即能達(dá)到零脫靶的狀態(tài)為零控追蹤狀態(tài)z(t)[16],推導(dǎo)可得相應(yīng)的最優(yōu)控制策略函數(shù)為
式中下標(biāo)A與T分別表示追蹤器與機(jī)動(dòng)目標(biāo)對應(yīng)的相關(guān)參數(shù),NA,NT分別為追蹤器與機(jī)動(dòng)目標(biāo)微分對策最優(yōu)導(dǎo)引對應(yīng)的制導(dǎo)增益,x?為相應(yīng)于正規(guī)合成鞍點(diǎn)的軌跡.
對策區(qū)間[t0,t]進(jìn)行任意剖分:t0<t1<t2<···<tn=t記為I,且將每個(gè)區(qū)間記為Ij=(tj?1,tj](j=1,2,···,n). 選取任意變量δ>0,假設(shè)博弈雙方在任意t時(shí)刻均可以完全了解t?δ以前對方的全部信息,但不了解其對手在未來的行為,為了獲得各自的最優(yōu)局部目標(biāo),博弈雙方將采用u?(t,x?)與v?(t,x?)在x?對應(yīng)的界柵上展開最激烈的爭奪、對抗[17].因此,對于相同環(huán)境下性能相近的水下追蹤博弈,打破對抗均衡態(tài)勢的條件為:追蹤器在博弈中占有信息優(yōu)勢地位,即追蹤器可獲知自身和機(jī)動(dòng)目標(biāo)過去所采取過的全部策略u(t)∈Uγ與v(t)∈Vl,而機(jī)動(dòng)目標(biāo)只能獲知t?δ時(shí)對策雙方的機(jī)動(dòng)選擇u(t?δ)∈Uγ與v(t?δ)∈Vl.
由于海洋環(huán)境的復(fù)雜性和水聲物理場及水下智能體結(jié)構(gòu)等因素的制約,在實(shí)際追蹤過程中,通常對抗雙方均不能獲得準(zhǔn)確的狀態(tài)信息,博弈雙方具有不同的信息模式.雖然通過各自有限的觀測器和相應(yīng)的濾波算法能實(shí)現(xiàn)狀態(tài)估計(jì),但采用估計(jì)器估計(jì)系統(tǒng)狀態(tài)時(shí),真實(shí)狀態(tài)的界是動(dòng)態(tài)不確定的[18].為此,將連續(xù)時(shí)間廣義預(yù)測優(yōu)化作為更新真實(shí)狀態(tài)界的方法,通過隨機(jī)干擾下系統(tǒng)輸出與追蹤器俘獲約束的實(shí)時(shí)預(yù)測調(diào)整,對追蹤器的最優(yōu)控制進(jìn)行滾動(dòng)優(yōu)化校正.
從非線性零和微分博弈的基本思想可以看出,由于各類不確定因素存在于整個(gè)追蹤過程中,單一的控制器無法調(diào)節(jié)復(fù)雜環(huán)境下的有效追蹤.具有顯式處理約束能力的連續(xù)時(shí)間廣義預(yù)測控制能對追蹤過程中的系統(tǒng)狀態(tài)輸出變量實(shí)施滾動(dòng)預(yù)測優(yōu)化,并對微分對策控制器進(jìn)行實(shí)時(shí)補(bǔ)償校正,使追擊方在零和博弈中處于信息優(yōu)勢地位.具有連續(xù)廣義預(yù)測校正的非線性追蹤博弈控制結(jié)構(gòu)如圖1所示.
圖1 具有預(yù)測校正的非線性追蹤博弈控制結(jié)構(gòu)Fig.1.Nonlinear tracking differential game control structure with CGPC corrector.
圖1中Tp為預(yù)測時(shí)域;yE(t)為滾動(dòng)時(shí)域期望輸出;e(t,Tp)為預(yù)測時(shí)域?qū)嶋H輸出與期望輸出之間的偏差;Δu(t)為滾動(dòng)時(shí)域的控制補(bǔ)償修正.假定系統(tǒng)輸出y(t)光滑連續(xù),且其任意階導(dǎo)數(shù)存在,為滿足連續(xù)空間微分對策需要,采用CGPC對t+Tp時(shí)刻的追蹤博弈輸出狀態(tài)y(t,Tp)與最大目標(biāo)俘獲期望輸出yE(t,Tp)的偏離進(jìn)行補(bǔ)償校正[19].
由于CGPC算法的預(yù)測輸出計(jì)算以系統(tǒng)輸出信號(hào)的k階導(dǎo)數(shù)的仿真運(yùn)算為基礎(chǔ),因此先利用截?cái)郙aclaurin級數(shù)進(jìn)行模型預(yù)測計(jì)算:
式中t1為最小預(yù)測時(shí)域,t2為最大預(yù)測時(shí)域,Q∈Rm×m為正定矩陣,ρ為控制加權(quán)系數(shù);
式中
將水下追蹤博弈雙方近似為同一水平面內(nèi)的點(diǎn)質(zhì)量模型,水下追蹤的相對運(yùn)動(dòng)關(guān)系可表示為
式中VA與VT分別為追蹤器和機(jī)動(dòng)目標(biāo)的速度;R與˙R分別為相對運(yùn)動(dòng)的距離和徑向速度;ηA與ηT為提前角,ηT=φT?q,ηA=φA?q;p=VT/VA;φA與φT分別為追蹤器的偏航角和機(jī)動(dòng)目標(biāo)的航向角;q與˙q分別為視線角和視線角速度.令VR=˙R,Vq=R˙q,取x=[R VRVq]為狀態(tài)向量,由(16)式求導(dǎo)并簡化處理可得
式中u=[uRuq]T,v=[vRvq]T分別為追蹤器和機(jī)動(dòng)目標(biāo)加速度沿視線方向與視線法向的對應(yīng)分量.只考慮視線法向控制時(shí)當(dāng)前t時(shí)刻對應(yīng)的零控追蹤狀態(tài)z(t)可表示為
式中tf為追蹤終止時(shí)間,tgo為剩余航行時(shí)間.由于目標(biāo)機(jī)動(dòng)和干擾的影響,準(zhǔn)確估計(jì)剩余航行時(shí)間十分困難[21].而滾動(dòng)預(yù)測控制對終止時(shí)間不確定情形的最優(yōu)控制具有良好的適應(yīng)性,取超前預(yù)測時(shí)域?yàn)棣?則對有利提前角進(jìn)行廣義預(yù)測與補(bǔ)償校正的同時(shí),相應(yīng)期望狀態(tài)?x?(t+δ)和零控估值?z(t+δ)的求解為
考慮到水下追蹤博弈控制的目的是保證相對距離減小的同時(shí)使視線角速率盡可能小,選取為系統(tǒng)的狀態(tài)轉(zhuǎn)移矩陣.由(9)式可得當(dāng)前t時(shí)刻追蹤器具有預(yù)測估計(jì)的微分對策最優(yōu)控制為
式中
滾動(dòng)預(yù)測應(yīng)用有效避免了微分對策導(dǎo)引對剩余航行時(shí)間的估計(jì)[22],但無法保證對目標(biāo)的實(shí)時(shí)最大俘獲.而在追蹤博弈的過程中,抗除干擾、實(shí)時(shí)俘獲是追蹤器追蹤與命中目標(biāo)的首要條件門.為實(shí)施有效追蹤,水下追蹤器采用自動(dòng)調(diào)整提前角導(dǎo)引算法對機(jī)動(dòng)目標(biāo)進(jìn)行實(shí)時(shí)俘獲.由于水下追蹤器的自導(dǎo)裝置與殼體固連,水下追蹤瞄準(zhǔn)的過程實(shí)際對應(yīng)追蹤器的姿態(tài)調(diào)整.水下追蹤器自導(dǎo)裝置波束的配置如圖2所示.
圖2 自導(dǎo)裝置波束配置Fig.2.Beam configuration of underwater acoustic homing device.
設(shè)追蹤器自導(dǎo)裝置的水平波束由7個(gè)波瓣組成,開始導(dǎo)引時(shí)零聲軸位于中間波瓣,當(dāng)水平波瓣“抓住”目標(biāo)后,先以中間波瓣對準(zhǔn)目標(biāo).傳統(tǒng)的自動(dòng)調(diào)整提前角算法只分析目標(biāo)是否進(jìn)入基準(zhǔn)軸扇區(qū)后又離開,由于追蹤器運(yùn)動(dòng)的慣性作用,這種調(diào)整方法容易產(chǎn)生提前角超前現(xiàn)象[23].為消除此現(xiàn)象,在追蹤博弈過程中,根據(jù)廣義預(yù)測控制理論,采用ηA(t)與期望提前角ηE(t)的變化趨勢對不確定干擾下的ηA(t)進(jìn)行補(bǔ)償校正,實(shí)現(xiàn)追蹤器姿態(tài)的及時(shí)調(diào)整.
由于目標(biāo)機(jī)動(dòng)、模型時(shí)變或干擾等不確定性因素的影響,追蹤的輸出不可能始終保證追蹤器具有最大俘獲概率,因此需要在實(shí)測輸出上加上誤差補(bǔ)償對自導(dǎo)俘獲進(jìn)行反饋校正.由(16)式推導(dǎo)可得目標(biāo)方位角輸出為
考慮自導(dǎo)搜索扇面俘獲約束,當(dāng)自導(dǎo)扇面半角為θ時(shí),ηA(t)應(yīng)滿足
由于目標(biāo)機(jī)動(dòng)未知,追蹤器航行過程中的有利提前角實(shí)際上是一個(gè)角度范圍,在此范圍內(nèi),通過對相應(yīng)時(shí)刻有利提前角的滾動(dòng)預(yù)測調(diào)整,使追蹤器保持對機(jī)動(dòng)目標(biāo)的最大發(fā)現(xiàn)概率.根據(jù)概率論原理,參考圖3,t時(shí)刻追蹤器對機(jī)動(dòng)目標(biāo)俘獲概率最大的條件為:追蹤器的自導(dǎo)搜索扇面遮蓋的正負(fù)誤差絕對值相等,即將追蹤器自導(dǎo)搜索扇面中心線的前端點(diǎn)指向機(jī)動(dòng)目標(biāo)預(yù)定點(diǎn)所處的位置.
圖3 聲自導(dǎo)追蹤器有利提前角Fig.3.Optimal advance angle of acoustic homing tracker.
假定自導(dǎo)的單個(gè)波瓣扇面角不大于10°,由文獻(xiàn)[24]可知t時(shí)刻攔截器的有利提前角可近似為
式中ηE(t)為t時(shí)刻追蹤器的期望有利提前角;R(t)為當(dāng)前時(shí)刻水下追蹤博弈雙方的相對距離;q(t)為當(dāng)前時(shí)刻的目標(biāo)舷角;VA為攔截器的速度;VT為機(jī)動(dòng)目標(biāo)速度;r為聲自導(dǎo)最大作用距離.將自導(dǎo)探測的目標(biāo)方位角ηA(t)所處自導(dǎo)扇區(qū)的編號(hào)標(biāo)記為目標(biāo)位置NT(t);有利提前角ηE(t)所處的扇區(qū)編號(hào)標(biāo)記為基準(zhǔn)軸NB(t)[25].目標(biāo)位置與基準(zhǔn)軸偏差為ξ(t),則下一有限時(shí)段δ的基準(zhǔn)軸變化趨勢為
式中Δη為對應(yīng)δ時(shí)段內(nèi)廣義預(yù)測控制Δu?(t)對自導(dǎo)扇面的調(diào)整角度.
為配合處于連續(xù)變量空間的微分對策控制,采用CGPC算法對t+δ時(shí)刻的追蹤博弈狀態(tài)與具有約束的當(dāng)前時(shí)刻的有利提前角ηE(t+δ)的偏離進(jìn)行滾動(dòng)反饋補(bǔ)償校正.由(10)—(15)式推導(dǎo)可得
由此可得,含有t+δ預(yù)測信息的微分對策最優(yōu)控制為
可見,在水下追蹤博弈過程中,對于任意給定的對策控制集(Uγ,Vl),由于采用了連續(xù)時(shí)間廣義預(yù)測控制,追蹤器可根據(jù)自身和機(jī)動(dòng)目標(biāo)在過去一段時(shí)域內(nèi)所采取的所有控制策略和過程俘獲約束所預(yù)測的對手的額外信息,對未來t+δ時(shí)刻的狀態(tài)進(jìn)行超前補(bǔ)償控制Δu(t),使追蹤器實(shí)現(xiàn)快速姿態(tài)調(diào)整,將機(jī)動(dòng)目標(biāo)鎖定在最大俘獲扇面之內(nèi),并在t時(shí)刻控制時(shí)可以惟一構(gòu)造出追蹤博弈雙方的控制函數(shù)[uδ(t),vδ(t)],其中uδ(t)為追擊方的上δ控制策略,vδ(t)為目標(biāo)的下δ控制策略,使追蹤器在追蹤博弈中處于信息優(yōu)勢地位,為追蹤器迅速精準(zhǔn)的追蹤提供有力保障.
為了驗(yàn)證該導(dǎo)引策略的有效性,對水下具有未知機(jī)動(dòng)能力的目標(biāo)追蹤進(jìn)行仿真分析.根據(jù)水聲物理場特性和自導(dǎo)裝置的測量精度,假定水下智能體對徑距和徑向速度的測量誤差為5%,對機(jī)動(dòng)目標(biāo)方位角的測量誤差為±2°.水下智能體速度為40 kn(1 kn=1.852 km/h),初始航向角為55°,機(jī)動(dòng)目標(biāo)的航速為35 kn,初始視線角為30°,初始相對距離為210 m.廣義預(yù)測控制器的參數(shù)為δ=0.3 s,t1=0,t2=1.5 s,Tp=3 s,為了驗(yàn)證CGPC-NDG(微分對策控制算法)性能,將輸出量近似解耦為有利提前角偏差輸出與相對距離,比較輸出量隨時(shí)間的變化趨勢與微分對策控制算法的仿真結(jié)果,如圖4所示.
由圖4(a)目標(biāo)方位角與有利提前角之間的偏差隨時(shí)間的變化趨勢可以看出,由于CGPC-NDG導(dǎo)引能對有利提前角偏差趨勢進(jìn)行預(yù)測補(bǔ)償,在較短時(shí)間俘獲調(diào)整后,追蹤器可將機(jī)動(dòng)目標(biāo)鎖定在較小偏差范圍內(nèi),對目標(biāo)機(jī)動(dòng)實(shí)施超前校正,實(shí)現(xiàn)追蹤狀態(tài)的迅速調(diào)整,從而保證對機(jī)動(dòng)目標(biāo)的有效俘獲.圖4(b)相對距離變化趨勢表明,在目標(biāo)機(jī)動(dòng)改變時(shí),NDG導(dǎo)引的相對位移變化緩慢.兩種算法下的追蹤軌跡仿真結(jié)果如圖5所示.
圖4 相關(guān)輸出隨時(shí)間的變化趨勢 (a)有利提前角偏差隨時(shí)間的變化趨勢;(b)相對距離隨時(shí)間的變化趨勢Fig.4.Variation trend of correlation output values with time:(a)Variation trend of the optimal advance angle;(b)variation trend of relative distance.
圖5 追蹤博弈軌跡Fig.5.Tracking trajectory of different guidance control.
由圖5可知,NDG導(dǎo)引算法的追蹤軌跡受目標(biāo)機(jī)動(dòng)的影響形成蛇形航跡.原因在于NDG導(dǎo)引只能對追蹤器自導(dǎo)俘獲的極值范圍進(jìn)行約束,在追蹤中容易導(dǎo)致Bang-Bang控制,出現(xiàn)提前角超調(diào)現(xiàn)象,這不僅容易導(dǎo)致目標(biāo)漏檢,而且造成部分航程的浪費(fèi).采用CGPC-NDG導(dǎo)引算法時(shí),由于對目標(biāo)機(jī)動(dòng)具有預(yù)見性,不僅能對軌跡進(jìn)行及時(shí)調(diào)整,使追蹤運(yùn)動(dòng)軌跡平滑,而且能有效提高追蹤器控制的穩(wěn)定性,縮短追蹤導(dǎo)引航程,更快達(dá)到追蹤目的.由上述分析可知,相比NDG導(dǎo)引追蹤,由于CGPC算法的引入,實(shí)施CGPC-NDG導(dǎo)引控制時(shí),追蹤器通過滾動(dòng)反饋預(yù)測校正,能對未來時(shí)域目標(biāo)機(jī)動(dòng)的軌跡方向進(jìn)行預(yù)判,并在滿足約束的條件下,控制智能體以幾乎零延遲的速度調(diào)整追蹤姿態(tài),在確保精準(zhǔn)追擊的同時(shí),有效提高了控制系統(tǒng)的響應(yīng)速度.
對基于連續(xù)時(shí)間框架設(shè)計(jì)的CGPC算法與離散廣義預(yù)測算法在水下微分博弈中的應(yīng)用效果進(jìn)行分析.設(shè)定GPC算法的采樣時(shí)間T=0.3 s,兩種預(yù)測算法對應(yīng)的提前角偏差變化趨勢和調(diào)節(jié)追蹤器姿態(tài)變化的控制量隨時(shí)間的變化如圖6所示.
圖6 基于不同預(yù)測控制算法的有利提前角偏差變化趨勢(a)CGPC算法;(b)GPC算法Fig.6.Variation of the optimal advance angle for different predictive control algorithms:(a)CGPC algorithm;(b)GPC algorithm.
由圖6可知,由于采用了預(yù)測控制算法,追蹤器的有利提前角均能在短時(shí)間內(nèi)被鎖定在較小的偏差范圍之內(nèi),但相比GPC導(dǎo)引,CGPC導(dǎo)引控制能在1 s內(nèi)快速完成最佳有利提前角的調(diào)整,并在導(dǎo)引末端控制有利提前角偏差在零位附近微小波動(dòng),而GPC導(dǎo)引則需2 s才能完成調(diào)整,且在末端有利提前角偏差有發(fā)散趨勢.因此,CGPC導(dǎo)引具有更快的響應(yīng)速度,能快速跟蹤機(jī)動(dòng)目標(biāo)變化和抑制干擾,更有利于精準(zhǔn)追蹤導(dǎo)引的實(shí)現(xiàn).分析兩種算法對應(yīng)的控制量曲線,如圖7所示.
由圖7可知,CGPC導(dǎo)引的采樣時(shí)間選擇靈活,不受采樣周期的影響,能在較快的采樣時(shí)間條件下反映時(shí)間常數(shù)的變化過程.結(jié)合具有一致性的微分對策性能指標(biāo)的滾動(dòng)優(yōu)化反饋控制,通過連續(xù)時(shí)間的有效控制,使導(dǎo)引末端的控制量逐漸趨于零位.而GPC控制性能受采樣時(shí)間的影響較大,不僅在初始段的調(diào)整力度大,而且在導(dǎo)引末端無法實(shí)現(xiàn)較好的收斂,不利于攔截器的控制穩(wěn)定性.
圖7 不同預(yù)測控制算法對應(yīng)的控制量變化曲線Fig.7.Variation of the control value for different predictive control algorithms.
將NDG,GPC-NDG與CGPC-NDG算法分別應(yīng)用于終端交會(huì)角約束為零的水下追蹤博弈導(dǎo)引,并通過終端交會(huì)角偏差、脫靶量與交會(huì)時(shí)間進(jìn)行導(dǎo)引性能分析與比較,結(jié)果見表1.
表1 不同導(dǎo)引律的追蹤博弈結(jié)果Table 1.Results of different tracking game guidance laws.
從追蹤博弈結(jié)果來看,采用CGPC-NDG算法的終端脫靶量和交會(huì)時(shí)間明顯優(yōu)于其他兩種導(dǎo)引律.雖然GPC-NDG算法通過選取合適的檢測周期,對機(jī)動(dòng)目標(biāo)參數(shù)進(jìn)行延遲補(bǔ)償與預(yù)判,其終端脫靶量和交會(huì)時(shí)間能夠滿足水下追蹤博弈要求,但檢測周期的選擇需要一定的先驗(yàn)信息,而CGPCNDG算法克服了檢測周期選取造成的目標(biāo)漏檢,通過連續(xù)時(shí)間滾動(dòng)優(yōu)化與反饋校正,推進(jìn)水下微分對策動(dòng)態(tài)博弈,使追蹤器實(shí)時(shí)保持對機(jī)動(dòng)目標(biāo)的最大發(fā)現(xiàn)概率,從而獲得優(yōu)于GPC-NDG的追蹤博弈結(jié)果.
由性能分析和追蹤導(dǎo)引結(jié)果可知,GPC-NDG導(dǎo)引算法可靈活選擇采樣時(shí)間,對非最小相位系統(tǒng)也無需控制加權(quán),能有效克服GPC設(shè)計(jì)方法的固有缺陷和微分對策導(dǎo)引的保守性,實(shí)現(xiàn)不確定干擾環(huán)境下探測方式受限時(shí)對水下機(jī)動(dòng)目標(biāo)的高精度最優(yōu)在線追蹤與預(yù)測校正.
提出了一種應(yīng)用于不確定水聲環(huán)境,在自導(dǎo)裝置探測周期長的情況下,實(shí)現(xiàn)對機(jī)動(dòng)未知目標(biāo)的高精度最優(yōu)在線追蹤與預(yù)測校正的CGPC-NDG算法.該算法利用微分博弈動(dòng)態(tài)對抗,使追蹤器對機(jī)動(dòng)目標(biāo)追蹤實(shí)施“最壞”情況下的“最佳”控制,有效克服目標(biāo)機(jī)動(dòng)難以預(yù)測的情形.同時(shí),利用CGPC算法對目標(biāo)機(jī)動(dòng)偏離趨勢進(jìn)行預(yù)測,并進(jìn)行在線校正補(bǔ)償,將目標(biāo)鎖定于追蹤器的最大俘獲自導(dǎo)扇面范圍之內(nèi),使追蹤器在微分博弈對抗中處于信息優(yōu)勢地位,為提高追蹤的精準(zhǔn)性與快速性提供必要保障.動(dòng)態(tài)對抗與預(yù)測控制兩種算法的有效融合,使追蹤器以幾乎零延遲的速度,根據(jù)機(jī)動(dòng)目標(biāo)的運(yùn)動(dòng)軌跡調(diào)整自身姿態(tài),實(shí)現(xiàn)對機(jī)動(dòng)目標(biāo)的有效追蹤.對不同算法控制下追蹤航跡和導(dǎo)引性能的仿真比較表明所提算法有效、可靠,對外界干擾具有強(qiáng)的魯棒性,具有一定的工程應(yīng)用價(jià)值.
[1]Dong Z P,Wan L,Li Y M,Liu T 2015Int.J.Nav.Arch.Ocean7 817
[2]Qin J X,Katsnelson B,Li Z L,Zhang R H,Luo W 2016Acta Acustica41 145(in Chinese)[秦繼興,Boris Katsnelson,李整林,張仁和,駱文2016聲學(xué)學(xué)報(bào)41 145]
[3]Hu Z G,Li Z L,Zhang R H,Ren Y,Qin J X,He L 2016Acta Phys.Sin.65 014303(in Chinese)[胡治國,李整林,張仁和,任云,秦繼興,何利2016物理學(xué)報(bào)65 014303]
[4]Chen Y F,Li G J,Wang Z S,Zhang M W,Jia B 2013Acta Phys.Sin.62 084302(in Chinese)[陳云飛,李桂娟,王振山,張明偉,賈兵2013物理學(xué)報(bào)62 084302]
[5]Shojaei K,Dolatshahi M 2017Ocean Eng.133 244
[6]Zhang P,Fang Y W,Zhang F M,Xiao B S 2012Chinese J.Aeronaut.25 739
[7]Zhang Y,Xu Q,Sun M W,Chen Z Q 2015Acta Phys.Sin.64 010502(in Chinese)[張園,徐琦,孫明瑋,陳增強(qiáng)2015物理學(xué)報(bào)64 010502]
[8]Yu G F,Li D F,Qiu J M,Ye Y F 2016Control Decis.31 2013(in Chinese)[余高鋒,李登峰,邱錦明,葉銀芳2016控制與決策31 2013]
[9]Wei H,Gao F,Wang D K,Wen G H,Pan L D 2007J.Syst.Sim.19 27(in Chinese)[魏環(huán),高峰,王東凱,聞光輝,潘立登2007系統(tǒng)仿真學(xué)報(bào)19 27]
[10]Yong K H,Farouq S M,Hark K Y 2012Chem.Eng.84 479
[11]Oksendal B,Sulem A 2014J.Optimiz.Theory Appl.161 22
[12]Kamel O,Tou fik R,Mohand O 2014ISA Trasac.53 76
[13]Chen Y,Zhang R M,Zhao X Y 2016Ocean Eng.15 123
[14]Zhang H G,Wei Q L,Liu D R 2011Acta??????47 207
[15]Fu Y,Chai Y 2015Control Theory Appl.32 196(in Chinese)[富月,柴佑2015控制理論與應(yīng)用 32 196]
[16]Liu X D,Li K,Sun J,Fu X L,Zhang C H 2015Control Theory Appl.32 1640(in Chinese)[劉旭東,李柯,孫靜,符曉玲,張承慧2015控制理論與應(yīng)用32 1640]
[17]Zhang P,Fang Y W,Hui X B 2013Acta Automatica Sin.39 391(in Chinese)[張平,方洋旺,惠曉濱 2013自動(dòng)化學(xué)報(bào)39 391]
[18]Ping X B,Ding B C,Han C Z 2012Acta Automatica Sin.38 31(in Chinese)[平續(xù)斌,丁寶蒼,韓崇昭 2012自動(dòng)化學(xué)報(bào)38 31]
[19]Krid M,Benamar F,Lenain R 2017Int.J.Control Autom.15 303
[20]Yan Z P,Liu Y B,Zhou J J,Zhang W,Wang L 2017Chin.Phys.B4 79
[21]Sarkar M,Nandy S,Vadal S R K 2016Math.Comput.Simulat.121 34
[22]Li H P,Yan W S,Shi Y 2017Syst.Control Lett.75 144
[23]Gao J,Liu C X 2015J.Northwest Polytechnical Univ.33 861(in Chinese)[高劍,劉昌鑫 2015西北工業(yè)大學(xué)報(bào)33 861]
[24]He J Z,Fu T P,Wu X H 2011Comput.Dig.Eng.39 21(in Chinese)[何建忠,傅調(diào)平,吳曉海 2011計(jì)算機(jī)與數(shù)字工程39 21]
[25]Fan H,Zhang Y W,Li W Z 2008J.Northwest Polytechnical Univ.26 743(in Chinese)[范輝,張宇文,李文哲2008西北工業(yè)大學(xué)學(xué)報(bào)26 743]