王琛, 周洲
(西北工業(yè)大學(xué) 無人機(jī)特種技術(shù)國家重點(diǎn)實(shí)驗(yàn)室, 陜西 西安 710065)
基于Markov的察打無人機(jī)數(shù)據(jù)鏈時(shí)延建模與補(bǔ)償研究
王琛, 周洲
(西北工業(yè)大學(xué) 無人機(jī)特種技術(shù)國家重點(diǎn)實(shí)驗(yàn)室, 陜西 西安 710065)
為了改善在數(shù)據(jù)鏈時(shí)延情況下察打無人機(jī)的性能,對(duì)造成時(shí)延的因素及影響進(jìn)行了分析,在此基礎(chǔ)上對(duì)數(shù)據(jù)鏈時(shí)延進(jìn)行了合理的假設(shè)和簡化。并對(duì)無人機(jī)整個(gè)控制回路的各個(gè)節(jié)點(diǎn)的響應(yīng)方式,提出了一種時(shí)間-事件-事件-時(shí)間驅(qū)動(dòng)方式,使得無人機(jī)數(shù)據(jù)鏈的時(shí)延序列具有Markov性,同時(shí)給出了狀態(tài)轉(zhuǎn)移矩陣的求取方法。為了改善無人機(jī)的響應(yīng)特性,采用最優(yōu)控制的方法對(duì)時(shí)延進(jìn)行了補(bǔ)償,并基于某無人機(jī)平臺(tái)驗(yàn)證了補(bǔ)償方法的有效性。仿真結(jié)果表明,該方法的引入使得無人機(jī)的動(dòng)態(tài)響應(yīng)特性有了顯著提高。
察打無人機(jī); Markov鏈; 時(shí)延建模; 最優(yōu)控制; 操縱性
隨著戰(zhàn)爭中對(duì)于打擊高時(shí)間敏感性目標(biāo)的需求以及作戰(zhàn)人員安全的要求越來越高,偵察打擊一體化無人機(jī)應(yīng)運(yùn)而生,且越來越受到各國的重視[1]。2003年“捕食者”無人機(jī)在阿富汗擊斃“基地”組織頭目的戰(zhàn)斗就展示了其巨大的戰(zhàn)場效力。然而,與飛行員實(shí)時(shí)進(jìn)行操控的飛機(jī)不同,察打無人機(jī)需要借助數(shù)據(jù)鏈路來完成控制指令以及機(jī)載設(shè)備信息的傳輸,因而數(shù)據(jù)鏈路中存在的不可避免的時(shí)延就成為制約察打無人機(jī)性能的一大因素。如何精確描述數(shù)據(jù)鏈時(shí)延并對(duì)其進(jìn)行補(bǔ)償也隨之成為一項(xiàng)重要的課題[2]。
國內(nèi)對(duì)于無人機(jī)數(shù)據(jù)鏈時(shí)延的研究很少,并且都是把隨機(jī)分布的時(shí)延轉(zhuǎn)化為固定的時(shí)延從而進(jìn)行性能分析和補(bǔ)償研究[3],這樣處理對(duì)于無人機(jī)數(shù)據(jù)鏈系統(tǒng)存在的隨機(jī)時(shí)延無法準(zhǔn)確地描述和補(bǔ)償。本文創(chuàng)新性地在分析了數(shù)據(jù)鏈時(shí)延的物理誘因后引入一種新型數(shù)據(jù)驅(qū)動(dòng)方式,并利用Markov理論對(duì)時(shí)延進(jìn)行數(shù)學(xué)建模,得到了時(shí)延的數(shù)學(xué)模型后采用最優(yōu)控制方法對(duì)時(shí)延進(jìn)行了補(bǔ)償研究,并得到了滿意的效果。
現(xiàn)今偵察打擊一體化無人機(jī)的指揮是包含地面控制站的大回路控制模式,通過上行數(shù)據(jù)鏈將控制指令發(fā)送到無人機(jī),再經(jīng)過飛控計(jì)算機(jī)的計(jì)算、舵機(jī)的執(zhí)行完成指令;通過下行數(shù)據(jù)鏈將無人機(jī)的狀態(tài)以及采集到的信息送給地面控制站進(jìn)行決策。系統(tǒng)示意圖如圖1所示。
圖1 偵察打擊一體化無人機(jī)任務(wù)規(guī)劃系統(tǒng)示意圖
無人機(jī)數(shù)據(jù)鏈時(shí)延產(chǎn)生的因素分為4個(gè)部分:通信時(shí)延、執(zhí)行時(shí)延、數(shù)據(jù)時(shí)延和擾動(dòng)時(shí)延。其中影響最大的是通信時(shí)延和執(zhí)行時(shí)延,通信時(shí)延是由電磁信號(hào)在空間的傳輸造成的;執(zhí)行時(shí)延是由于解釋、計(jì)算、執(zhí)行控制指令等造成,包括傳感器的時(shí)延、計(jì)算機(jī)運(yùn)算時(shí)延等[2]。
如果將無人機(jī)大控制回路的數(shù)據(jù)鏈時(shí)延簡化為上行時(shí)延和下行時(shí)延并用時(shí)延環(huán)節(jié)e-δt1s和e-δt2s來表示,且將飛控系統(tǒng)和無人機(jī)模型用C(s)和G(s)表示,簡化回路如圖2所示。
圖2 無人機(jī)控制回路
無人機(jī)數(shù)據(jù)鏈加入時(shí)延后的傳遞函數(shù)將會(huì)變?yōu)?
(1)
回路中特征多項(xiàng)式的改變,導(dǎo)致系統(tǒng)的零極點(diǎn)發(fā)生變化,通過以上的分析可以看出數(shù)據(jù)鏈時(shí)延對(duì)無人機(jī)的操縱性有影響,而不僅僅是無人機(jī)響應(yīng)的滯后[3]。
2.1 數(shù)據(jù)鏈的信息傳遞機(jī)理和簡化
無人機(jī)的主要控制節(jié)點(diǎn)間數(shù)據(jù)流向及主要時(shí)延因素如圖3所示。
圖3 數(shù)據(jù)鏈信息流向與主要時(shí)延圖
數(shù)據(jù)表明,通信和執(zhí)行時(shí)延影響占整個(gè)時(shí)延影響的90%以上[3],因此可以合理地假設(shè)在建模中只存在通信和執(zhí)行時(shí)延,并在此基礎(chǔ)上作如下假設(shè):
(1)只考慮下行鏈路中的無人機(jī)狀態(tài)信息而不考慮機(jī)載設(shè)備的數(shù)據(jù),數(shù)據(jù)量很小;
(2)數(shù)據(jù)鏈路沒有丟包;
(3)數(shù)據(jù)鏈路沒有時(shí)序混亂。
基于以上假設(shè),對(duì)于傳感器、地面控制系統(tǒng)、飛控計(jì)算機(jī)、舵機(jī)分別采用時(shí)間-事件-事件-時(shí)間的驅(qū)動(dòng)方式,所有控制節(jié)點(diǎn)采用等周期同步T采樣方式,定義在k-n時(shí)刻傳感器產(chǎn)生的控制量為uk-n,那么整個(gè)回路中的信息傳輸時(shí)序如圖4所示。
圖4 無人機(jī)數(shù)據(jù)鏈信息傳輸時(shí)序圖
時(shí)間驅(qū)動(dòng)指節(jié)點(diǎn)在時(shí)鐘周期的作用下定時(shí)采樣信號(hào),將信號(hào)進(jìn)行處理后通過數(shù)據(jù)鏈送至下一節(jié)點(diǎn)的驅(qū)動(dòng)方式;事件驅(qū)動(dòng)指信息一旦到達(dá),控制器立即對(duì)信息進(jìn)行處理,并將處理信息送出的驅(qū)動(dòng)方式。
設(shè)k時(shí)刻的數(shù)據(jù)鏈時(shí)延為dk, 規(guī)定若k時(shí)刻到達(dá)舵機(jī)的傳感器信號(hào)為uk-n,則dk=k-(k-n)=n,即時(shí)延為nT個(gè)時(shí)鐘周期。在k時(shí)刻沒有新的信號(hào)到達(dá),控制量仍沿用uk-2,所以時(shí)延為2T。并且每一時(shí)刻的時(shí)延是在最大時(shí)延和最小時(shí)延之間以某概率分布,并且此概率依一定規(guī)律變化。經(jīng)過以上假設(shè)建模后,利用Markov理論便可以找出時(shí)延序列概率變化。
2.2 Markov鏈模型的建立
Markov性是指事件“未來”的狀態(tài)只與“現(xiàn)在”有關(guān),而和“過去”狀態(tài)獨(dú)立的性質(zhì)[4]?;?.1節(jié)的假設(shè)和簡化后,傳感器的信號(hào)是按照傳感器產(chǎn)生信息的先后順序到達(dá)舵機(jī),且在同一個(gè)采樣周期內(nèi)舵機(jī)只能執(zhí)行一個(gè)控制信號(hào),所以“未來”的時(shí)延分布可以由“現(xiàn)在”的分布決定,即由k時(shí)刻時(shí)延的概率分布就可以推得k+1時(shí)刻時(shí)延的概率分布,這樣無人機(jī)數(shù)據(jù)鏈的多步隨機(jī)傳輸時(shí)延序列dk(k=0,1,2,…)形成Markov鏈。dk為采樣周期的倍數(shù),且dk∈{m,m+1,…,n},m=tmin/T,n=tmax/T,其中tmin,tmax分別為最大和最小時(shí)延。設(shè)π(k)為dk的概率分布函數(shù),dk服從如下分布[5]:
dk~π(k)=
(2)
根據(jù)Markov鏈的性質(zhì)有:
π(k+1)=π(k)QM(k=0,1,2,…)
(3)
式中,QM為轉(zhuǎn)移矩陣。
定義轉(zhuǎn)移概率:
(4)
依據(jù)式(3),由初始時(shí)延概率分布π(0)和狀態(tài)轉(zhuǎn)移矩陣QM就可以知道之后任意采樣周期的時(shí)延概率分布π(k)。π(0)可以通過實(shí)驗(yàn)的方法獲得,將機(jī)載時(shí)鐘和基站時(shí)鐘同步,給主機(jī)發(fā)送的數(shù)據(jù)打上時(shí)間戳,無人機(jī)接收時(shí)與機(jī)載時(shí)鐘比對(duì)就可以計(jì)算出上行時(shí)延,類似可得到下行時(shí)延,經(jīng)過多次實(shí)驗(yàn)就可以獲得π(0)。QM可以由圖2得出,下式是描述相鄰時(shí)刻間時(shí)延概率分布變化的重要公式[6]。
q(i-m)(j-m)=
(5)
3.1 無人機(jī)小擾動(dòng)模型
無人機(jī)有對(duì)稱平面,略去機(jī)體內(nèi)轉(zhuǎn)動(dòng)部件的陀螺力矩效應(yīng)?;鶞?zhǔn)運(yùn)動(dòng)中,對(duì)稱平面處于鉛垂方向且運(yùn)動(dòng)所在平面與飛機(jī)對(duì)稱平面重合。將無人機(jī)6自由度方程采用線性小擾動(dòng)簡化并橫縱分離,再將縱向小擾動(dòng)方程離散化,得到:
(6)
當(dāng)X=[ΔVΔαΔqΔθ]T時(shí),被控對(duì)象為縱向方程;當(dāng)X=[ΔβΔωxΔωyΔγ]T時(shí),被控對(duì)象為橫向方程。
3.2 時(shí)延補(bǔ)償方法研究
雖然k時(shí)刻到達(dá)舵機(jī)的控制量無法完全確定,但是由2.2節(jié)可以知道到達(dá)的ui時(shí)延具有Markov性,并可以得到k時(shí)刻時(shí)延的概率分布,且狀態(tài)變量方便可測,因此對(duì)系統(tǒng)采用全狀態(tài)反饋并應(yīng)用最優(yōu)控制理論設(shè)計(jì)控制律,使性能指標(biāo)
(7)
達(dá)到最小,令:
利用以上增廣的量將式(6)和式(7)改寫為:
(8)
(9)
并采用動(dòng)態(tài)規(guī)劃法得到滿足指標(biāo)式(7)的最優(yōu)控制律[7]為:
(10)
其中:
(11)
(12)
設(shè)式(11)中4個(gè)括號(hào)內(nèi)表達(dá)式為eq,則其期望值為:
利用式(10)可以求出每一時(shí)刻針對(duì)此刻時(shí)延進(jìn)行補(bǔ)償?shù)目刂屏看笮?由于在每一時(shí)刻時(shí)延序列是依概率分布的,無法精確補(bǔ)償,所以針對(duì)這一情況采用求期望的標(biāo)準(zhǔn)進(jìn)行補(bǔ)償,這也很好地結(jié)合了之前對(duì)數(shù)據(jù)鏈時(shí)延的Markov建模的結(jié)果。
3.3 仿真驗(yàn)證
為了驗(yàn)證本方法對(duì)時(shí)延建模和補(bǔ)償方法的有效性,以某型察打無人機(jī)為平臺(tái)進(jìn)行仿真驗(yàn)證:無人機(jī)的系統(tǒng)時(shí)鐘周期為0.02 s。無人機(jī)初始狀態(tài)為Ma=0.61,h=5 000 m的定直平飛狀態(tài),仿真結(jié)果如圖5所示。
圖5 未補(bǔ)償時(shí)無人機(jī)俯仰角響應(yīng)曲線
圖5表明加入時(shí)延后無人機(jī)的響應(yīng)特性明顯變差,驗(yàn)證了之前時(shí)延會(huì)對(duì)無人機(jī)動(dòng)態(tài)響應(yīng)特性產(chǎn)生影響的理論分析。并且表明隨著時(shí)延的增大,無人機(jī)的動(dòng)態(tài)特性會(huì)隨之變差??梢灶A(yù)見,時(shí)延繼續(xù)增大無人機(jī)會(huì)變得不可控制。
如果假定時(shí)延范圍為0.02~0.12 s,即1~6個(gè)時(shí)鐘周期。輸入階躍信號(hào),將不考慮時(shí)延、加入時(shí)延、時(shí)延補(bǔ)償3種情況下無人機(jī)響應(yīng)情況進(jìn)行比較,結(jié)果如圖6和圖7所示。對(duì)比圖中3種情況下無人機(jī)姿態(tài)角的響應(yīng)可以看出,隨著建立在Markov基礎(chǔ)上的數(shù)據(jù)鏈時(shí)延的建模和最優(yōu)控制法的引入,無人機(jī)的俯仰角超調(diào)量減小了47%,進(jìn)入穩(wěn)定的時(shí)間縮短了1.5 s;滾轉(zhuǎn)角響應(yīng)超調(diào)量減少了58%,進(jìn)入穩(wěn)定的時(shí)間縮短了1.2 s,有效地改善了無人機(jī)的動(dòng)態(tài)響應(yīng)特性,證明本文的建模和補(bǔ)償方法是有效可行的。
圖6 俯仰角指令為5°的響應(yīng)曲線
圖7 滾轉(zhuǎn)角指令為4°的響應(yīng)曲線
通過本文研究表明,隨著無人機(jī)時(shí)延的增大,無人機(jī)的動(dòng)態(tài)響應(yīng)特性逐漸變差,并且當(dāng)延時(shí)增大到一定程度,無人機(jī)將變得難以控制,因此在進(jìn)行數(shù)據(jù)鏈設(shè)計(jì)時(shí)應(yīng)盡量減小時(shí)延以保證無人機(jī)性能。經(jīng)過本文中的對(duì)于數(shù)據(jù)鏈時(shí)延的建模和補(bǔ)償后,無人機(jī)的動(dòng)態(tài)響應(yīng)特性明顯改善,說明了基于Markov的建模和采用最優(yōu)控制方法進(jìn)行補(bǔ)償是有效可行的。由于提高時(shí)延建模的精度對(duì)于補(bǔ)償方法的改進(jìn)至關(guān)重要,未來改進(jìn)時(shí)延的描述算法是非常有必要的。
[1] Mulder J A.Unmanned aircraft systems roadmap,2005-2030[R].Office of the Secretary of Defense of USA,2004:105-106.
[2] Paul G Fahlstrom,Thomas J Gleason.Introduction to UAV Systems[M].Maryland:Uavsystems Inc,2007:20-21.
[3] 陳占海.偵察打擊一體化無人機(jī)數(shù)據(jù)鏈延時(shí)影響研究[D].西安:西北工業(yè)大學(xué),2010.
[4] 張波,商豪.應(yīng)用隨機(jī)過程[M].北京:中國人民大學(xué)出版社,2009.
[5] 代雙鳳.網(wǎng)絡(luò)控制系統(tǒng)的Markov建模設(shè)計(jì)與分析[D].秦皇島:燕山大學(xué),2008.
[6] 于之訓(xùn),陳輝堂,王月娟.基于Markov延遲特性的閉環(huán)網(wǎng)絡(luò)控制系統(tǒng)研究[J].控制理論與應(yīng)用,2002,19(2):263-267.
[6] 吳受章.應(yīng)用最優(yōu)控制[M].西安:西安交通大學(xué)出版社,1986.
ResearchonmodelingandcompensationmethodfordatalinkdelayofRSIUAVbasedonMarkovtheory
WANG Chen, ZHOU Zhou
(National Key Laboratory of Science and Technology on UAV, NWPU, Xi’an 710065, China)
This paper improves the performance of RSIUAV while considering the datalink delay. At the beginning, this paper analyzes the factors which induce the delay, reveals the influence of the delay and makes reasonable assumption and simplification to datalink delay. Then, in order to get the datalink delay to observe Markov chain, the paper gives a brand new data-driven mode, the corresponding Markov state transition matrix is given also. Finally, for compensating the delay, this paper uses optimal control method and verifies the effect based on a kind of RSIUAV. The simulation result shows that the application of modeling and compensation method distinctly improves the dynamic corresponding characteristic of RSIUAV.
RSIUAV; Markov chain; modeling of time delay; optimal control; maneuverability
2011-10-06;
2011-12-20
王琛(1987-),男,陜西西安人,博士研究生,研究方向?yàn)轱w行力學(xué)與控制。
V279
A
1002-0853(2012)02-0147-04
(編輯:方春玲)