魏鐵濤,王劍薇,屈香菊
(北京航空航天大學(xué)航空科學(xué)與工程學(xué)院,北京 100191)
基于分層規(guī)劃的思想,飛行器的航跡規(guī)劃一般可分為離線航跡規(guī)劃和在線航跡規(guī)劃兩個階段[1]。其中,離線航跡規(guī)劃通常在起飛前進(jìn)行,根據(jù)當(dāng)時已知的環(huán)境和任務(wù)信息,生成折線形式的參考航跡,飛行器沿此參考航跡在安全走廊內(nèi)飛行[2]。但由于離線航跡規(guī)劃通常沒有考慮飛行器的機(jī)動性約束,所以得到的航跡不可直接使用,還需要進(jìn)一步進(jìn)行更細(xì)致的規(guī)劃,即分層規(guī)劃的第二層——在線航跡規(guī)劃。
在線航跡規(guī)劃的任務(wù),是在飛行過程中利用較細(xì)致的實(shí)時環(huán)境與任務(wù)信息,在以參考航跡為中線的安全走廊內(nèi)規(guī)劃出一條安全可飛的可行航跡??尚泻桔E在飛行器的控制中起到導(dǎo)引的作用,飛控系統(tǒng)以此為指令信息引導(dǎo)飛行器按預(yù)定航跡飛行,通常也被稱為指令航跡。指令航跡應(yīng)該盡量貼近參考航跡,使得兩者間的偏差盡可能小,并滿足飛行器的機(jī)動性能約束。因此,在線航跡規(guī)劃屬于帶約束的最優(yōu)控制問題。當(dāng)飛行器在動態(tài)環(huán)境下執(zhí)行任務(wù)時,環(huán)境信息的改變有可能導(dǎo)致預(yù)先規(guī)劃得到的參考航跡不可用,需要重新規(guī)劃出新的參考航跡才能滿足環(huán)境約束。在這種情況下,在線航跡規(guī)劃需要兼顧快速性與精確性,在較短的時間內(nèi)為飛行器生成新的指令航跡,引導(dǎo)飛行器安全飛行。
大多數(shù)軍用和民用的在線航跡規(guī)劃問題都是采用固定時域的優(yōu)化方法,單純以指令航跡與參考航跡之間的航跡偏差最小為優(yōu)化目標(biāo)。由于飛行器的在線航跡規(guī)劃是在不斷運(yùn)動中規(guī)劃前方航跡段的,采用固定時域的搜索尋優(yōu)方法,指令航跡的實(shí)時性將會比較差[3-5]。參考航跡的突然變化,容易引起指令航跡與參考航跡之間的航跡偏差急劇增大,甚至飛出安全走廊,導(dǎo)致任務(wù)失敗。文獻(xiàn)[6]提出了一種偏差微分綜合控制方法,在性能指標(biāo)中引入偏差微分項(xiàng),能夠抑制解的振蕩,得到合理有效的控制律,該方法在靜態(tài)和已知環(huán)境中的應(yīng)用具有較好的性能,但對于動態(tài)或未知的環(huán)境卻有很大的局限性。模型預(yù)測控制(Model Predictive Control,MPC)算法對于處理動態(tài)環(huán)境中的航跡規(guī)劃問題具有一定的優(yōu)勢,滾動時域的在線優(yōu)化能更好地適應(yīng)系統(tǒng)參數(shù)以及環(huán)境的動態(tài)變化[7]。然而,傳統(tǒng)MPC的計算量較大,限制了它在很多動態(tài)系統(tǒng)中的應(yīng)用。過去十年中,許多學(xué)者提出了許多改進(jìn)的方法來解決MPC算法的精度和速度之間的矛盾。James和 Vesna[8]簡化了有限域MPC優(yōu)化算法,使用末端懲罰來提高算法的解算速度。David等[9]基于MPC算法,引入一個勢函數(shù)(Potential Function),該函數(shù)將可能運(yùn)動障礙物或其它飛行器的狀態(tài)信息反映到代價函數(shù)中,計算量較小,可用于直升機(jī)的在線航跡規(guī)劃。文獻(xiàn)[10]用Gradient-Descent方法解決最小化問題,可以將計算量減少到一定程度以用于RUAV的實(shí)時航跡規(guī)劃。文獻(xiàn)[11]應(yīng)用擾動分析理論將系統(tǒng)的非線性模型在標(biāo)準(zhǔn)軌跡(Nominal Trajectory)的基礎(chǔ)上線性化,將有限時域最優(yōu)控制問題變?yōu)橐粋€易處理的凸優(yōu)化問題。
以上幾種改進(jìn)的MPC方法在一定程度上降低了計算量,可應(yīng)用于低速飛行器的在線航跡規(guī)劃問題。但是,在飛行速度較大,或參考航跡的航向改變較大的情況下,上述方法的精度可能變低。針對此問題,本文提出一種動態(tài)環(huán)境下在線航跡規(guī)劃的滾動優(yōu)化方法,通過引入一個新的終端懲罰項(xiàng),使得指令航跡的性能指標(biāo)能夠更好地反映飛行器在未來飛行段指令航跡與參考航跡發(fā)生偏差的趨勢。有助于飛行器對前方變化后的航跡方向提前作出反應(yīng),以提高動態(tài)環(huán)境下的在線航跡規(guī)劃性能。
在平面笛卡爾坐標(biāo)系內(nèi)建立飛行器的運(yùn)動學(xué)模型。飛行器的運(yùn)動用其位置(ξ,η)、速度(V)和偏航角(χ)描述。飛行器的運(yùn)動學(xué)離散模型為:
式中,χk為偏航角;(ξk,ηk)為飛行器在采樣時刻 k的位置;ρH為水平航跡的曲率半徑。飛行器協(xié)調(diào)轉(zhuǎn)彎飛行,χk+1是經(jīng)歷時間間隔Δt后的偏航角,相對于k時刻的增量為Δχk。圖1顯示了上述變量的幾何關(guān)系。
圖1 變量幾何關(guān)系圖
飛行器在采樣時刻k+1的狀態(tài),包括χk+1,ξk+1和ηk+1,可以通過下述公式計算:
模型預(yù)測控制是一種滾動的、有限時域內(nèi)的優(yōu)化控制算法,使用被控對象的預(yù)測模型來預(yù)測其未來的響應(yīng)和狀態(tài)。在滿足輸入和狀態(tài)限制約束下,在有限時域內(nèi)對控制量進(jìn)行滾動優(yōu)化[4]。
模型預(yù)測控制在每一個采樣時刻,將系統(tǒng)的當(dāng)前狀態(tài)作為初始條件,計算在有限控制時域內(nèi)系統(tǒng)的未來響應(yīng),再根據(jù)該優(yōu)化對象的性能指標(biāo),求解一個開環(huán)最優(yōu)化問題,得到一個控制量的輸入序列,并將該控制序列的第一項(xiàng)作用于被控對象。在下一采樣時刻,用新的飛行器狀態(tài),重復(fù)求解上述優(yōu)化問題,從而形成閉環(huán)控制。圖2直觀地顯示了模型預(yù)測控制的基本思想。
圖2 模型預(yù)測控制基本思想
首先,為了使飛行器的指令航跡盡可能貼近參考航跡,應(yīng)該尋求最優(yōu)控制使指令航跡與參考航跡之間的偏差最小。所以,在建立性能指標(biāo)函數(shù)時,首先考慮到在性能指標(biāo)中對控制域內(nèi)的航跡偏差進(jìn)行加權(quán),即按航跡偏差最小確定性能指標(biāo)。該指標(biāo)為:
在按航跡偏差最小確定性能指標(biāo)時,控制變量往往會出現(xiàn)劇烈振蕩。為了抑制解的振蕩,可以在性能指標(biāo)中增加一個偏差微分項(xiàng),對變化過程進(jìn)行控制[5]。增加微分項(xiàng)后的性能指標(biāo)可表示為:
基于模型預(yù)測控制的動態(tài)環(huán)境下在線航跡規(guī)劃方法包含以下步驟:
(1)更新預(yù)測時域內(nèi)的環(huán)境信息和參考航跡。(2)在每個采樣點(diǎn)k,計算未來有限控制時域內(nèi)可能的飛行器狀態(tài)。
(5)從時刻k+1開始,重復(fù)上述步驟,直到任務(wù)完成。
假定某型飛行器執(zhí)行動態(tài)環(huán)境下的飛行任務(wù),參考航跡會根據(jù)前方環(huán)境的變化而實(shí)時更新,最終執(zhí)行的參考航跡如圖3所示。要求在線航跡規(guī)劃能夠及時精確地跟蹤調(diào)整后的參考航跡,生成合理的指令航跡。
分別采用傳統(tǒng)的固定域內(nèi)的在線航跡規(guī)劃方法和本文提出的動態(tài)環(huán)境下的在線航跡規(guī)劃方法,對此航跡規(guī)劃問題進(jìn)行仿真計算。飛行器采用式(1)的運(yùn)動學(xué)模型,可得指令航跡與參考航跡之間的航跡偏差(e)隨時間變化情況如圖4所示。仿真結(jié)果表明,采用模型預(yù)測控制進(jìn)行在線航跡規(guī)劃時,指令航跡與參考航跡的偏離程度要比傳統(tǒng)的固定時域的控制方法明顯改善。
圖3 參考航跡
圖4 指令航跡偏離誤差對比
控制時域長度Tc的選擇對指令航跡偏離程度和計算時間有很大影響。經(jīng)過多次試算,取預(yù)測時域長度Tp=6 s,對3.1節(jié)提出的航跡規(guī)劃任務(wù)進(jìn)行仿真。圖5和圖6分別給出了在速度為150 m/s,125 m/s,100 m/s,85 m/s 時,采用不同控制域長度情況下的指令航跡偏差和計算時間t。在預(yù)測時域給定的前提下,控制時域選得越小,意味著對未來飛行器狀態(tài)的控制能力越弱,反映在性能指標(biāo)中效果也就越差。同時較大的控制時域長度將使計算量增加,影響在線航跡規(guī)劃的實(shí)時性。故控制時域長度的選取要在算法的快速性和精確性之間綜合權(quán)衡,根據(jù)具體的飛行任務(wù)來確定。
在本例中,綜合考慮航跡偏差程度和計算時間的大小,控制時域長度選為4 s時綜合性能最好。
圖5 不同控制域的航跡偏離誤差
圖6 不同控制域的計算時間
綜合考慮間隔時間ΔT和性能指標(biāo)對優(yōu)化結(jié)果的影響,取ΔT=1 s,根據(jù)多次的試算,取各項(xiàng)權(quán)重G1=0.6,G2=0.3,G3=0.1,對 3.1 節(jié)提出的在線航跡規(guī)劃任務(wù)進(jìn)行仿真。當(dāng)在預(yù)測時域內(nèi)發(fā)生前方參考航跡的方向變化時,才給G4賦值,G4分別取為0.1,0.3,0.6 和 0.9。
圖7表示在不同權(quán)重G4條件下,指令航跡與參考航跡之間的航跡偏差;圖8為不同G4條件下,在參考航跡轉(zhuǎn)折點(diǎn)附近的指令航跡細(xì)節(jié)圖??梢钥闯?,G4越大,在預(yù)測時域內(nèi)發(fā)生參考航跡的轉(zhuǎn)折時,飛行器對前方參考航跡的方向改變能夠更早作出相應(yīng)反應(yīng),使得指令航跡與參考航跡的偏差更小。
圖7 航跡偏差情況
圖8 參考航跡航向變化點(diǎn)附近指令航跡細(xì)節(jié)圖
假設(shè)飛行器進(jìn)入一個如圖9所示的存在若干需要規(guī)避的障礙物(用陰影表示)的未知區(qū)域,由于探測能力的限制,飛行器只有在接近障礙物時才能發(fā)現(xiàn)并對其當(dāng)前參考航跡作出調(diào)整。要求為飛行器在線規(guī)劃一條滿足機(jī)動性能約束的指令航跡,并保證其與不斷更新的參考航跡之間的偏差盡可能小,各參數(shù)的取值如表1所示。
表1 各參數(shù)取值
采用本文提出的在線航跡規(guī)劃滾動優(yōu)化方法和傳統(tǒng)的固定時域規(guī)劃方法分別進(jìn)行仿真計算,規(guī)劃結(jié)果如圖9所示。其中傳統(tǒng)固定時域的規(guī)劃方法耗時245.6 s,平均航跡偏差42.8 m;而滾動優(yōu)化方法耗時175.5 s,平均航跡偏差13.9 m。
圖9 在線航跡規(guī)劃結(jié)果
在動態(tài)環(huán)境下,由于飛行器是在不斷運(yùn)動中規(guī)劃前方可行航跡的,這時如果采用傳統(tǒng)的規(guī)劃方法,在線規(guī)劃的實(shí)時性將比較差,參考航跡的突然變化,容易引起飛行器指令航跡的航跡偏差急劇增大,甚至偏離出安全走廊的范圍導(dǎo)致任務(wù)失敗,如圖9中的A點(diǎn)所示。而采用在線航跡規(guī)劃的滾動優(yōu)化方法,在參考航跡方向發(fā)生突然改變時,能夠迅速作出相應(yīng)反應(yīng),航跡偏離程度有了很大改善,規(guī)劃速度與固定時域的規(guī)劃方法相比也有所提高。
本文以平面內(nèi)的固定翼飛行器為例進(jìn)行研究,但提出的動態(tài)環(huán)境下在線航跡規(guī)劃的滾動優(yōu)化方法可以擴(kuò)展應(yīng)用于更廣泛的領(lǐng)域,包括三維空間內(nèi)、水下、空間及地面交通工具的航跡規(guī)劃等。但是,三維空間內(nèi)的航跡規(guī)劃問題對規(guī)劃速度的要求將會更高,并且滾動優(yōu)化方法的影響因素也呈現(xiàn)出一些特點(diǎn),這些需要進(jìn)一步的研究。
[1] Shim D H,Kim H J,Sastry Shankar.Hierarchical control system synthesis for rotorcraft-based unmanned aerial vehicles[C]//AIAA Guidance,Navigation and Control Conference.Denver,CO,2000.
[2] 魏鐵濤,屈香菊.多機(jī)協(xié)同與多目標(biāo)分配任務(wù)規(guī)劃方法[J].北京航空航天大學(xué)學(xué)報,2009,35(8):917-920.
[3] Ross IM,F(xiàn)ahroo F.Pseudo spectral knotting method for solving non-smooth optimal control problems[J].Journal of Guidance,Control,and Dynamics,2004,27(3):397-405.
[4] Schouwenaars Tom,How Jonathan,F(xiàn)eron Eric.Receding horizon path planning with implicit safety guarantees[C]//Proceeding of the 2004 American Control Conference.Boston,2004.
[5] 王忠俊.非線性飛行控制方法研究概述[J].飛行力學(xué),1995,13(3):24-28.
[6] 何佩,屈香菊,武哲.航跡跟蹤的優(yōu)化方法研究[J].北京航空航天大學(xué)學(xué)報,2003,29(7):599-601.
[7] Wang Liu-ping.Model predictive control system design and implementation using MATLAB [M].London:Springer,2008.
[8] Primbs JA,Nevistic V.A new approach to stability analysis for constrained finite receding horizon control without end constraints[J].IEEE Transactions on Automatic Control,2000,45(8):1507-1512.
[9] Shim D H,Kim H J,Sastry Shankar.Decentralized nonlinear model predictive control of multiple flying robots[C]//IEEE Conference on Decision and Control.Hawaii,2003.
[10] Kim H J,Shim D H,Sastry Shankar.Nonlinearmodel predictive tracking control for rotorcraft-based unmanned aerial vehicles[C]//American Control Conference.Anchorage,AK,2003.
[11] Singh Leena,F(xiàn)uller James.Trajectory generation for a UAV in urban terrain,using nonlinear MPC [C]//Proceedings of the IEEE American Control Conference.Arlington,VA,2001:2301-2308.