馮耀暄,薄學(xué)綱
(1.中北大學(xué)機(jī)電工程學(xué)院,太原,030051; 2.江蘇永豐機(jī)械有限責(zé)任公司,南京 210014)
【信息科學(xué)與控制工程】
基于動態(tài)RBF網(wǎng)絡(luò)辨識和模糊控制的彈道落點預(yù)測導(dǎo)引研究
馮耀暄1,薄學(xué)綱2
(1.中北大學(xué)機(jī)電工程學(xué)院,太原,030051; 2.江蘇永豐機(jī)械有限責(zé)任公司,南京 210014)
針對目前遠(yuǎn)程彈道修正火箭彈中,濾波外推落點預(yù)測導(dǎo)引法存在導(dǎo)引系數(shù)確定難、導(dǎo)引精度低、自適應(yīng)性與魯棒性差的問題,提出了一種基于動態(tài)RBF神經(jīng)網(wǎng)絡(luò)在線辨識與帶自調(diào)整因子模糊控制相結(jié)合的落點預(yù)測導(dǎo)引律。具體在傳統(tǒng)濾波外推落點預(yù)測導(dǎo)引法的基礎(chǔ)上,將預(yù)測落點偏差與偏差變化率作為模糊控制器輸入量,通過RBF神經(jīng)網(wǎng)絡(luò)在線整定模糊控制的權(quán)重因子和比例因子,實現(xiàn)導(dǎo)引指令的自適應(yīng)調(diào)整。仿真結(jié)果表明,同常規(guī)方法相比,在充分考慮隨機(jī)擾動和測量誤差情況下,具有更強(qiáng)的自適應(yīng)性與魯棒性,保持了較高的導(dǎo)引精度。
修正彈;濾波外推; RBF神經(jīng)網(wǎng)絡(luò);模糊控制;落點預(yù)測
隨著火箭推進(jìn)技術(shù)的發(fā)展,遠(yuǎn)程彈道修正火箭彈已經(jīng)表現(xiàn)出在射程上的強(qiáng)大競爭優(yōu)勢。同時,彈道特征也更加復(fù)雜化,飛行時間長、飛行速度涵蓋范圍更廣、飛行高度涵蓋了稠密大氣層到稀薄大氣層的更大空域,彈道過程中受到的隨機(jī)擾動更加明顯,系統(tǒng)誤差的積累更大。這就要求火箭彈制導(dǎo)控制方法在確保導(dǎo)引精度的同時,對隨機(jī)擾動和系統(tǒng)誤差的調(diào)整具有更高的魯棒性和自適應(yīng)性。
濾波外推落點預(yù)測導(dǎo)引法,是目前彈道修正火箭彈廣泛應(yīng)用的一種制導(dǎo)方法。其工作原理為:彈載傳感器實時測量彈體運(yùn)動參數(shù),后經(jīng)濾波處理代入線性化彈道方程外推得到落點位置偏差及偏差變化率,進(jìn)而再通過線性導(dǎo)引方程形成舵機(jī)控制指令[1]。彈道末端修正效果與落點預(yù)測精度有關(guān),還與導(dǎo)引方程密切相關(guān)。在提高預(yù)測精度方面,國內(nèi)外學(xué)者進(jìn)行了大量研究:李興隆等提出了線性彈道模型預(yù)測法,提高了六自由度彈道落點預(yù)測精度和解算速度[2];李超旺等將攝動理論應(yīng)用到火箭彈落點預(yù)測中,分析了擾動情況下的彈道解算方法[3];Leonard 等提出了通過修正線性理論進(jìn)行快速彈道預(yù)測的方法,減小了彈道方程線性化造成的預(yù)測誤差[4]。目前,在導(dǎo)引方程設(shè)計方面,將先進(jìn)控制理論與落點預(yù)測導(dǎo)引法相結(jié)合的相關(guān)研究還不深入。
火箭彈末端修正為高動態(tài)過程,且實際存在各種隨機(jī)擾動和測量誤差。此外,為了有效地打擊低速機(jī)動目標(biāo),要求彈道落點滿足設(shè)定落角等多種角度約束,因此,要求設(shè)計的制導(dǎo)算法具備良好精度的同時,還應(yīng)兼具一定的自適應(yīng)性和魯棒性。而目前,濾波外推落點預(yù)測導(dǎo)引中,通常導(dǎo)引方程為關(guān)于落點位置偏差及偏差變化率的線性方程:
(1)
為了減小導(dǎo)引精度對衛(wèi)星測量精度的依賴程度,文獻(xiàn)[2]提出了利用一定時間內(nèi)的落點偏差量的加權(quán)平均值代替某時刻瞬態(tài)值,以提高導(dǎo)引算法的魯棒性,并給出了加權(quán)算法:
(2)
除此之外,通常上述方法中導(dǎo)引系數(shù)需要經(jīng)過一系列的仿真計算、試驗和采用經(jīng)驗公式計算確定,通過記錄樣本數(shù)據(jù)進(jìn)行插值擬合得到近似的導(dǎo)引系數(shù)與擾動關(guān)系,作為彈體飛行導(dǎo)引系數(shù)在線調(diào)整的依據(jù)。但是,這種方法得到的樣本數(shù)據(jù)涵蓋范圍小,且一經(jīng)確定不能改變,導(dǎo)引效果不理想,過程復(fù)雜且不通用,自適應(yīng)性與魯棒性較差。
模糊控制是一種非線性智能控制方法,因無需對被控對象建立數(shù)學(xué)模型、構(gòu)造容易、實現(xiàn)簡單而得到廣泛應(yīng)用。帶自調(diào)整因子的模糊控制器,通過優(yōu)化算法在線調(diào)整輸入量的權(quán)重因子改變控制規(guī)則,增強(qiáng)控制器的自學(xué)能力和自適應(yīng)性,從根本上提高模糊控制性能。動態(tài)RBF神經(jīng)網(wǎng)絡(luò)具有對非線性系統(tǒng)動態(tài)尋優(yōu)逼近的能力,可作為帶自調(diào)整因子模糊控制器控制參數(shù)在線調(diào)整的依據(jù)。二者結(jié)合可以對常規(guī)濾波外推落點預(yù)測導(dǎo)引法的導(dǎo)引方程進(jìn)行優(yōu)化,增強(qiáng)自適應(yīng)性和魯棒性,同時保持導(dǎo)引精度。因此,本文提出了一種基于模糊控制理論和動態(tài)RBF神經(jīng)網(wǎng)絡(luò)在線辨識理論的落點預(yù)測導(dǎo)引法。
2.1 導(dǎo)引控制器總體設(shè)計
圖1 基于RBF網(wǎng)絡(luò)辨識和模糊控制的預(yù)測導(dǎo)引原理圖
2.2 自調(diào)整模糊控制器設(shè)計
帶自調(diào)整模糊控制原理如圖2所示,具體控制器解析表達(dá)式為[5]:
膨潤土礦床類型分為火山巖型、火山-沉積型、沉積型、侵入巖型四種,以沉積(含火山沉積)型為最多,儲量占全部儲量的70%以上。膨潤土礦的顏色有白色、乳酪色、淡灰色、淡黃綠色、淡紅色、褐紅色以及黑色、斑雜色等,具有油脂光澤、蠟狀光澤或土狀光澤,斷口常為貝殼狀或鋸齒狀。采出原礦有塊狀、微層紋狀、角礫狀、土狀及斑雜狀等,微細(xì)結(jié)構(gòu)以泥質(zhì)結(jié)構(gòu)為主,也有變余火山碎屑、角礫凝灰及粉砂狀結(jié)構(gòu)等。
U=-〈αE+(1-α)EC〉·Ku(0≤α≤1)
(3)
其中,α為權(quán)重因子,e為系統(tǒng)誤差,E、Ec為模糊化后的系統(tǒng)誤差和誤差變化率,Ku為輸出控制量的比例因子,通過調(diào)整α和Ku可以改變模糊控制器輸出。根據(jù)模糊控制原理,取E、Ec、U論域均為{-6 6}[5],E的模糊子集{NB,NM,NS,NO,PO,PS,PM,PB},Ec和U的子集為{NB,NM,NS,ZO,PS,PM,PB}。隸屬度函數(shù)曲線分別如圖3、圖4所示,形成的模糊規(guī)則如表1所示。
圖2 帶自調(diào)整因子的模糊控制原理圖
圖3 輸入量E的隸屬函數(shù)曲線
圖4 輸入EC和輸出U的隸屬函數(shù)曲線
ECENBNMNSNOPOPSPMPBNBPBPBPBPBPBPMPSZONMPBPBPMPMPMPSZONSNSPBPBPMPSPSZONMNMZOPBPMPSPSZONSNMNMPSPMPMZOZONSNMNBNBPMPSZONSNMNMNMNBNBPBZOPSNMNBNBNBNBNB
具體參數(shù)在線調(diào)整準(zhǔn)則:當(dāng)誤差較大時,控制器主要任務(wù)是減少誤差,提高響應(yīng)速度,應(yīng)該增大誤差權(quán)重和比例因子系數(shù)。相反,誤差減小時,控制器主要任務(wù)是盡快進(jìn)入穩(wěn)態(tài),減小超調(diào),應(yīng)該增大誤差變化率的權(quán)重,減小比例因子系數(shù)。因此,參數(shù)調(diào)整的一種線性表達(dá)式為:
(4)
Ku(k)=Ku(k-1)+kupE(k-1)+
(5)
其中,N為輸入誤差的量化等級,kup、kui、kud為比例因子計算的比例、積分、微分系數(shù)。
由式(3)~(5)能夠?qū)崿F(xiàn)控制量在一定程度上的自適應(yīng)調(diào)整,但是由于參數(shù)在線調(diào)整算法相對簡單,模糊控制器適應(yīng)范圍小、對誤差變化敏感度低、控制性能不高。因此,引入RBF神經(jīng)網(wǎng)絡(luò)辨識算法提高參數(shù)在線調(diào)整能力。
2.3 動態(tài)RBF神經(jīng)網(wǎng)絡(luò)辨識器設(shè)計
常規(guī)的RBF神經(jīng)網(wǎng)絡(luò)雖然能夠以任意精度逼近任意非線性函數(shù),具有強(qiáng)大的非線性映射能力,但須事先確定隱層節(jié)點個數(shù),網(wǎng)絡(luò)結(jié)構(gòu)固定,適應(yīng)性差。 基于最近鄰聚類學(xué)習(xí)算法的RBF神經(jīng)網(wǎng)絡(luò),無須事先確定隱層節(jié)點個數(shù),網(wǎng)絡(luò)結(jié)構(gòu)動態(tài)改變,完成聚類所得隱層節(jié)點個數(shù)最少,結(jié)構(gòu)最優(yōu)[7,8]。
基于RBF神經(jīng)網(wǎng)絡(luò)的模糊控制器工作原理如圖5所示。其中參數(shù)α0、αs、α、ku整定公式推導(dǎo)具體如下:
圖5 基于RBF和模糊控制的制導(dǎo)原理圖
動態(tài)RBF網(wǎng)絡(luò)輸入向量為:
(6)
式中δc為模糊控制器輸出的舵偏指令,動態(tài)RBF網(wǎng)絡(luò)辨識的輸出向量為:
Y=[α0αsku]T
(7)
離散化系統(tǒng)輸入輸出為:
Xk=[Δx(k-1),Δx(k-2)…Δx(k-m1),
δc(k-1),δc(k-2)…δc(k-n1)]T
(8)
(9)
式中,n1、m1為輸入量延時步數(shù),n為k時刻動態(tài)RBF神經(jīng)網(wǎng)絡(luò)隱單元個數(shù)。
動態(tài)RBF神經(jīng)網(wǎng)絡(luò)辨識器對模糊控制參數(shù)進(jìn)行在線辨識,獲得Jacobian信息計算控制參數(shù)并送往模糊控制器,以調(diào)節(jié)模糊輸入權(quán)重系數(shù),Jacobian矩陣為:
(10)
式中ωi,Ci均為輸入量每次在線更新的權(quán)值;RBF網(wǎng)絡(luò)的性能指標(biāo)為:
(11)
采用增量公式計算模糊控制參數(shù):
Y(k)=Y(k-1)+Δy
(12)
(13)
已知α0、αs∈[0,1],則需要對輸出α0(k),αs(k)進(jìn)行歸一化:
(14)
然后利用式(2)計算α(k),并向模糊控制器輸出參數(shù)向量[α,ku]。
為了對比本文方法與傳統(tǒng)濾波外推導(dǎo)引法在隨機(jī)擾動和系統(tǒng)誤差存在的情況下的導(dǎo)引效果,以某型遠(yuǎn)程火箭彈彈道末段為導(dǎo)引控制條件,以GPS/地磁陀螺為導(dǎo)航方式,以單通道控制的“十”字氣動鴨舵提供所需修正力,取基于卡爾曼濾波的落點預(yù)測導(dǎo)引法為仿真對比導(dǎo)引法。兩種導(dǎo)引法均選擇在彈目縱向距離為6~0.1 km階段,且只考慮縱向平面導(dǎo)引控制。起控點彈道初始條件見表2。為了突出體現(xiàn)導(dǎo)引算法的特性,分析了彈道末段對制導(dǎo)控制系統(tǒng)影響較大的幾類隨機(jī)擾動和誤差值,極限大小如表3所示。
表2 起控點彈道初始條件
表3中列出的初始擾動可以通過修改仿真初始彈道條件實現(xiàn);陣風(fēng)擾動在仿真開始后施加在彈道模型中;控制誤差和測量誤差服從正態(tài)分布,存在于整個末制導(dǎo)過程,通過生成隨機(jī)數(shù)的形式疊加到仿真模型中。
表3 隨機(jī)擾動和誤差量極限值
仿真條件一:在誤差范圍內(nèi),改變陣風(fēng)風(fēng)速進(jìn)行仿真,以驗證RBF網(wǎng)絡(luò)辨識輸出權(quán)重因子α和比例因子Ku的自適應(yīng)性;仿真條件二:所有干擾和誤差均取極大值,相同條件下與傳統(tǒng)濾波外推落點預(yù)測導(dǎo)引律進(jìn)行仿真對比,以驗證極限條件下新導(dǎo)引法的導(dǎo)引效果。
由圖7、圖8可知,當(dāng)擾動施加時,預(yù)測落點偏差增大,RBF神經(jīng)網(wǎng)絡(luò)辨識器輸出的模糊控制權(quán)重因子α和比例因子Ku均取較大值;隨著控制時間的積累,二者逐漸減小并趨于穩(wěn)定。不同風(fēng)速的陣風(fēng)干擾下,RBF網(wǎng)絡(luò)辨識器均可通過改變輸出系數(shù)大小,有效地實現(xiàn)輸出的自適應(yīng)調(diào)整。
由圖9可知,在擾動和誤差存在下,濾波外推導(dǎo)引法彈道曲率變化較大,落點距目標(biāo)點縱向偏差為56.23 m;新導(dǎo)引法彈道平直,落點縱向偏差12.13 m??梢?,在隨機(jī)擾動和測量誤差極限情況下仍可獲得更好的彈道軌跡,較高的導(dǎo)引精度。
圖7 權(quán)重因子α自調(diào)整曲線
由圖10、圖11可知,存在測量誤差和控制誤差的前提下,擾動施加后濾波外推法計算的舵偏角發(fā)生突變,致使彈體所受過載發(fā)生長時間振蕩;新導(dǎo)引法舵機(jī)控制指令并未發(fā)生突變,彈體所受過載很快趨于穩(wěn)定,變化平穩(wěn)。而且,擾動施加時新導(dǎo)引法響應(yīng)更快,通過增大輸出舵偏角迅速減小干擾造成的偏差,使系統(tǒng)盡快趨于穩(wěn)定;進(jìn)入穩(wěn)定后,通過逐漸減小指令舵片角,以進(jìn)一步減小落點預(yù)測偏差??梢?,基于RBF神經(jīng)網(wǎng)絡(luò)辨識和模糊控制的導(dǎo)引法提高了導(dǎo)引系統(tǒng)的魯棒性。
圖8 比例因子Ku的自調(diào)整曲線
圖10 指令舵偏角對比
圖11 彈體過載對比
為了提高傳統(tǒng)濾波外推落點預(yù)測導(dǎo)引法自適應(yīng)性和魯棒性,提出了一種基于模糊控制理論和動態(tài)RBF神經(jīng)網(wǎng)絡(luò)在線辨識理論的落點預(yù)測導(dǎo)引律。將濾波外推預(yù)測得到的落點偏差與偏差變化率作為帶自調(diào)整因子模糊控制器輸入量,通過動態(tài)RBF神經(jīng)網(wǎng)絡(luò)在線整定模糊控制的權(quán)重因子和比例因子,實現(xiàn)制導(dǎo)指令的自適應(yīng)調(diào)整。仿真表明,在隨機(jī)擾動和測量誤差極限情況下仍可獲得較高的導(dǎo)引精度,導(dǎo)引指令自適應(yīng)性、魯棒性更強(qiáng)。
[1] 楊俊,錢宇.基于預(yù)測落點導(dǎo)引律的制導(dǎo)炸彈中制導(dǎo)律設(shè)計[J].計算機(jī)仿真,2011,28(8):87-91.
[2] 薄學(xué)綱,韓晶,焦國太等.基于落點預(yù)測的火箭彈變系數(shù)末制導(dǎo)律[J].探測與控制學(xué)報,2015,37(5):84-88.
[3] 李超旺,高敏,宋衛(wèi)東等.基于攝動原理的火箭彈實時預(yù)預(yù)測[J].兵工學(xué)報,2014,35(8):1164-1171.
[4] HAINZ L C,COSTELLO M.Modified projectile linear theory for rapid trajectory prediction[J].Journal of Guidance,Control,and Dynamics,2005,28(5):1006-1014.
[5] 王曉侃,王蕾,孫忠良等.基于自調(diào)整因子模糊控制器的設(shè)計與研究[J].機(jī)電一體化,2009(12):35-37.
[6] WANG Xiao-kan,SUN Zhong-liang,Design and Research Based on Fuzzy PID-parameters Self-tuning Controller with MATLAB;2008 International Conference on Advanced Computer Theory and Engineering (ECACTE 2008)[C].Phuket Thailand:IEEE CPS,2008:996-999.
[7] 李紹銘,劉寅虎.基于改進(jìn)型RBF神經(jīng)網(wǎng)絡(luò)辨識的PID控制[J].自動化與儀表,2006(6):40-43.
[8] 劉鐵男,段玉波,劉志德等.帶優(yōu)選聚類算法的RBF網(wǎng)絡(luò)辨識器及應(yīng)用[J].控制與決策,2003,18(2):233-236
(責(zé)任編輯 楊繼森)
Research on Trajectory Prediction Guidance Law Based on Dynamic RBF Network Identification and Fuzzy Control
FENG Yao-xuan1, BO Xue-gang2
(1.College of Mechatronic Engineering,North University of China,Taiyuan 030051,China;2.Jiangsu Yongfeng Mechanical Liability Co., LTD., Nanjing 210014, China)
Aiming at the problem that guidance coefficient is difficult to determine, and guidance precision is low, and poor adaptability and robustness, a target prediction guidance law based on dynamic RBF neural network on-line identification and fuzzy control theory with self adjustment factor was presented. Specifically, on the basis of the extrapolation filter upload target prediction guidance method, we took the impact point deviation and deviation change rate as the fuzzy controller input. Through the RBF neural network, the weights of the fuzzy control and the proportion of the whole set of fuzzy control, we achieved the adaptive adjustment of the guidance commands. The simulation shows that high accuracy of the measurement error can be obtained, and the guidance instruction is more adaptive and robust compared with the conventional method, considering the random disturbance and the measurement error,.
correction projectile; filter extrapolation algorithm; RBF neural network; fuzzy control; target prediction
2016-10-19;
2016-11-15
馮耀暄(1995—),男,碩士研究生,主要從事制導(dǎo)與控制技術(shù)研究。
10.11809/scbgxb2017.02.025
馮耀暄,薄學(xué)綱.基于動態(tài)RBF網(wǎng)絡(luò)辨識和模糊控制的彈道落點預(yù)測導(dǎo)引研究[J].兵器裝備工程學(xué)報,2017(2):108-112.
format:FENG Yao-xuan, BO Xue-gang.Research on Trajectory Prediction Guidance Law Based on Dynamic RBF Network Identification and Fuzzy Control[J].Journal of Ordnance Equipment Engineering,2017(2):108-112.
TP273
A
2096-2304(2017)02-0108-05