張紹杰 吳雪 劉春生
隨著技術(shù)的進(jìn)步,使得具有強(qiáng)非線性、大范圍變化的非線性動(dòng)力學(xué)系統(tǒng)越來(lái)越多.用精確的數(shù)學(xué)模型描述這類系統(tǒng)的動(dòng)態(tài)特性是不現(xiàn)實(shí)甚至是不可能的.人們?cè)趯?duì)這類系統(tǒng)進(jìn)行數(shù)學(xué)建模時(shí),通常在某確定點(diǎn)的微小變化范圍內(nèi)將非線性系統(tǒng)描述為線性系統(tǒng),或用低階系統(tǒng)代替高階系統(tǒng)等方法近似,這都會(huì)或多或少地使系統(tǒng)存在建模誤差及不確定性.除了模型不確定性外,環(huán)境的變化、內(nèi)部參數(shù)的變化、未知的外界擾動(dòng)以及未知執(zhí)行器故障也會(huì)造成被控系統(tǒng)的不確定性.如果對(duì)于系統(tǒng)的控制器設(shè)計(jì)及分析中沒(méi)有考慮這些不確定因素,所設(shè)計(jì)的控制系統(tǒng)將很難保持所期望的性能,甚至使系統(tǒng)失去穩(wěn)定性.因此,非線性系統(tǒng)的執(zhí)行器故障容錯(cuò)控制得到了廣泛的研究[1?13].基于故障檢測(cè)與隔離(Fault detection and isolation,FDI)的容錯(cuò)控制[7?9]和自適應(yīng)補(bǔ)償控制[10?13]是兩種典型的容錯(cuò)控制方案.基于FDI的方法需要確定系統(tǒng)故障信息并利用故障信息重構(gòu)控制器.基于自適應(yīng)補(bǔ)償控制方法設(shè)計(jì)的控制律不受故障診斷誤差的影響,不需要在系統(tǒng)故障時(shí)重新調(diào)整控制律的形式、結(jié)構(gòu)簡(jiǎn)單,且易于從理論上證明系統(tǒng)的穩(wěn)定性和跟蹤能力,因此這種方法得到了廣泛的研究.
文獻(xiàn)[10]提出了一種針對(duì)具有執(zhí)行器故障的多輸入單輸出(Multi-input single-output,MISO)非線性系統(tǒng)的反步自適應(yīng)補(bǔ)償跟蹤控制方法.文獻(xiàn)[2,11?13]將該方法擴(kuò)展到了多輸入多輸出(Multiinput multi-output,MIMO)系統(tǒng),其中文獻(xiàn)[12]考慮了更多的執(zhí)行器故障類型,文獻(xiàn)[13]進(jìn)一步考慮了系統(tǒng)的不確定性.但上述方法均未考慮容錯(cuò)控制系統(tǒng)的性能指標(biāo),不能從理論上表明所設(shè)計(jì)控制律的控制效果.文獻(xiàn)[14]考慮了系統(tǒng)的動(dòng)態(tài)性能,但不能保證性能指標(biāo)選取的最優(yōu)性能和合理性.
自適應(yīng)動(dòng)態(tài)規(guī)劃[15?20](Adaptive dynamic programming,ADP)是近年來(lái)得到廣泛關(guān)注的智能優(yōu)化控制方法,2002年,Murray等[21]提出了針對(duì)連續(xù)系統(tǒng)的迭代ADP算法.針對(duì)系統(tǒng)狀態(tài)調(diào)節(jié)問(wèn)題,Vamvoudakis等[22]采用神經(jīng)網(wǎng)絡(luò)構(gòu)造評(píng)價(jià)網(wǎng)絡(luò)和控制網(wǎng)絡(luò),通過(guò)在線自適應(yīng)的方式調(diào)節(jié)神經(jīng)網(wǎng)絡(luò)權(quán)值,使得評(píng)價(jià)網(wǎng)絡(luò)和控制網(wǎng)絡(luò)的輸出各自逐漸逼近最優(yōu)代價(jià)函數(shù)和最優(yōu)控制函數(shù).Dierks等[23]設(shè)計(jì)了一種新的ADP結(jié)構(gòu),該方案不需要控制網(wǎng)絡(luò),只通過(guò)評(píng)價(jià)網(wǎng)絡(luò)完成控制作用.少數(shù)文獻(xiàn)[24?29]針對(duì)系統(tǒng)的最優(yōu)跟蹤問(wèn)題進(jìn)行了研究,文獻(xiàn)[24?26]研究了系統(tǒng)的狀態(tài)跟蹤控制問(wèn)題,針對(duì)輸出跟蹤控制問(wèn)題,Zargarzadeh等[27]針對(duì)一類MISO非線性嚴(yán)反饋系統(tǒng),提出了一種通過(guò)構(gòu)造在線自適應(yīng)評(píng)價(jià)器,得到系統(tǒng)近似最優(yōu)解的控制方法.在此基礎(chǔ)上,文獻(xiàn)[28?29]考慮了系統(tǒng)動(dòng)態(tài)未知的MISO非線性嚴(yán)反饋系統(tǒng)的最優(yōu)輸出跟蹤問(wèn)題.
雖然采用ADP方法研究非線性系統(tǒng)的最優(yōu)控制已經(jīng)有了較多的研究成果,但是多數(shù)研究成果僅適用于嚴(yán)反饋系統(tǒng)等特殊的非線性系統(tǒng),相關(guān)控制方法較少考慮存在系統(tǒng)故障時(shí)的控制問(wèn)題;系統(tǒng)控制結(jié)構(gòu)通常由前饋控制和反饋控制兩部分組成,結(jié)構(gòu)復(fù)雜.針對(duì)現(xiàn)有研究成果的上述缺陷,本文針對(duì)一類具有不確定性的MIMO連續(xù)時(shí)間非線性系統(tǒng)的輸出跟蹤控制問(wèn)題,考慮執(zhí)行器失效、卡死以及兩者的組合故障,采用神經(jīng)網(wǎng)絡(luò)估計(jì)系統(tǒng)不確定性,設(shè)計(jì)基于ADP的最優(yōu)自適應(yīng)補(bǔ)償控制律.該方法不需要前饋控制項(xiàng),只采用評(píng)價(jià)網(wǎng)絡(luò)求解最優(yōu)跟蹤控制律,通過(guò)李雅普諾夫理論證明了系統(tǒng)的跟蹤誤差一致最終有界.
考慮一類如下描述的多輸入多輸出連續(xù)非線性系統(tǒng)[13]
其中,x∈Rn是系統(tǒng)的狀態(tài)向量;f(x)∈Rn,g(x)∈Rn×m和h(x)∈Rq是關(guān)于x的充分光滑的非線性函數(shù);u=[u1,···,um]T∈Rm是系統(tǒng)執(zhí)行器的控制輸入;?f(x)∈Rn為系統(tǒng)的不確定項(xiàng);y∈Rq(0 考慮執(zhí)行器失效、卡死及其組合故障,故障形式可表示為 其中,ui和uci分別是系統(tǒng)第i個(gè)執(zhí)行器的實(shí)際控制輸入和設(shè)計(jì)的控制輸入;λi(0≤λi≤1)和i是未知常數(shù),分別代表系統(tǒng)第i個(gè)執(zhí)行器發(fā)生失效故障時(shí)的有效比例以及卡死故障時(shí)的卡死位置;ti是代表故障發(fā)生時(shí)間的未知常數(shù). 當(dāng)發(fā)生如式(2)所示的執(zhí)行器故障時(shí),可以將系統(tǒng)控制信號(hào)u表示為 假設(shè)1.在系統(tǒng)(1)發(fā)生式(2)形式的執(zhí)行器故障時(shí),依然可以利用無(wú)故障或故障后仍可用的執(zhí)行器控制系統(tǒng)完成任務(wù). 假設(shè)1保證了系統(tǒng)容錯(cuò)控制律的存在性,是可以對(duì)系統(tǒng)進(jìn)行容錯(cuò)控制的必要條件. 為了處理執(zhí)行器冗余的問(wèn)題,將m個(gè)執(zhí)行器分在q(1≤q 上式表示dk(k= 1,···,q)個(gè)輸入uk1,uk2,···,ukdk分在第k組中,d1+d2+···+dq=m. 由執(zhí)行器分組結(jié)果,可將控制輸入記為 其中,w(t)=[w1(t),w2(t),···,wq(t)]T∈Rq×1是執(zhí)行器正常時(shí)待設(shè)計(jì)的控制律,wc(t)=[wc1(t),···,wcq(t)]T∈Rq是執(zhí)行器故障時(shí)的控制律表示形式.是控制分配矩陣,,其中,bj是用來(lái)調(diào)節(jié)對(duì)應(yīng)的系統(tǒng)執(zhí)行器對(duì)控制輸入影響的比例參數(shù).根據(jù)式(5),可將系統(tǒng)(1)改寫(xiě)為 取yr(t)=[yr1,yr2,···,yrq]T∈Rq為系統(tǒng)參考輸出,系統(tǒng)輸出跟蹤誤差記為 假設(shè)2.系統(tǒng)狀態(tài)可控,且在x=0時(shí),f(0)=0,非奇異. 假設(shè)2中系統(tǒng)狀態(tài)可控是設(shè)計(jì)不確定性估計(jì)器的前提,其他假設(shè)條件是系統(tǒng)可以求解最優(yōu)控制的前提. 定義系統(tǒng)(7)的代價(jià)函數(shù)為 其中,Q∈Rq×q,R∈Rq×q是正定常數(shù)矩陣,并且存在連續(xù)控制函數(shù)w(t)使得系統(tǒng)輸出跟蹤參考輸出. 把式(8)代入式(9),可得用x(t),w(t)和yr(t)表示的代價(jià)函數(shù) 本文的研究目標(biāo)為針對(duì)具有執(zhí)行器故障(2)的系統(tǒng)(1)設(shè)計(jì)最優(yōu)自適應(yīng)補(bǔ)償控制律,通過(guò)求解使代價(jià)函數(shù)(9)最小的近似最優(yōu)控制輸入,使得系統(tǒng)(1)能夠?qū)崿F(xiàn)對(duì)參考輸出信號(hào)yr的跟蹤. 由于系統(tǒng)動(dòng)態(tài)方程中含有不確定項(xiàng)?f(x)=[?f1(x),?f2(x),···,?fn(x)]T, 本文設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)估計(jì)器來(lái)估計(jì) ?fi(x)(i=1,2,···n),?fi(x)可以表示為 式中,θi(x):Rn→Rmi是基函數(shù),Wi∈Rmi是權(quán)值向量,εfi是估計(jì)器的估計(jì)誤差,滿足,.神經(jīng)網(wǎng)絡(luò)對(duì)不確定項(xiàng)?fi(x)的估計(jì)可以表示為 定義系統(tǒng)狀態(tài)xi(i=1,2,···,n)的估計(jì)為 設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)權(quán)值調(diào)整律為 其中,Γ3=diag{Γ31,···,Γ3n},Γ4=diag{Γ41,···,Γ4n}. 表明系統(tǒng)的狀態(tài)估計(jì)可以逼近實(shí)際系統(tǒng)狀態(tài),可實(shí)現(xiàn)對(duì)?f(x)的逼近. 其中,r(x,w)=(h(x(t))?yr(t))TQ(h(x(t))?yr(t))+wT(t)Rw(t),Vx(x)是V(x)對(duì)x的偏導(dǎo).因?yàn)槭勾鷥r(jià)函數(shù)(10)最小的最優(yōu)控制輸入也使哈密頓函數(shù)(16)最小,所以可以通過(guò)求解方程?H(x,w)/?w=0,得到最優(yōu)控制輸入,記為 式中,Q(x)=(h(x(t))?yr(t))TQ(h(x(t))?yr(t)).當(dāng)控制輸入為最優(yōu)控制輸入w?(t)時(shí),記系統(tǒng)的閉環(huán)動(dòng)態(tài)方程F(x)+g(x)Bw?滿足 其中,K?為常數(shù). 設(shè)計(jì)在線神經(jīng)網(wǎng)絡(luò)把代價(jià)函數(shù)(10)表示成 其中,Θ∈RL是在線神經(jīng)網(wǎng)絡(luò)的目標(biāo)權(quán)值向量,φ(·):Rn→RL是有N個(gè)隱層神經(jīng)元并滿足φ(0)=0的線性無(wú)關(guān)的基向量,ε(x)是在線估計(jì)器的重構(gòu)誤差,C是與x無(wú)關(guān)的常函數(shù),在控制律設(shè)計(jì)時(shí)不需求出其值.選擇合適的φ(x)滿足. 例如,如果,那么0.選擇激活函數(shù)構(gòu)造基向量使得 是漸近逼近的.根據(jù)Weierstrass高階逼近定理,只要V(x)足夠光滑這樣的基函數(shù)就是存在的.在線神經(jīng)網(wǎng)絡(luò)的目標(biāo)常值向量、重構(gòu)誤差及重構(gòu)誤差對(duì)x的偏導(dǎo)上界分別記為,. 把式(21)分別代入式(17)和式(18),可得: 根據(jù)式(14)以及g(x)B和?xε的上界,可得εHJB的上界. 把在線神經(jīng)網(wǎng)絡(luò)對(duì)(21)的估計(jì)值表示為 由式(24)和式(25)可得哈密頓函數(shù)的估計(jì)值 考慮執(zhí)行器故障的情況,控制律應(yīng)滿足 式中,l=1,···,m,Γ1=diag{Γ11,Γ12,···,Γ1m}∈Rm×m>0和Γ2∈Rm×m>0均為正定增益對(duì)角矩陣,需要根據(jù)系統(tǒng)的實(shí)際情況進(jìn)行設(shè)計(jì)和調(diào)節(jié).χ和分別是矩陣主對(duì)角線上絕對(duì)值最小的元素和與之對(duì)應(yīng)的導(dǎo)數(shù). 定理1.對(duì)于存在執(zhí)行器故障(2)的非線性系統(tǒng)(1),設(shè)計(jì)控制律(30),設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)權(quán)值更新律(27),自適應(yīng)參數(shù)調(diào)整律(31)和(32),閉環(huán)跟蹤控制系統(tǒng)穩(wěn)定,且跟蹤誤差和神經(jīng)網(wǎng)絡(luò)估計(jì)誤差一致最終有界. 證明.見(jiàn)附錄A.□ 以文獻(xiàn)[30]中的飛翼飛行器作為控制對(duì)象,來(lái)驗(yàn)證本文控制律的控制效果.該飛行器的縱向非線性運(yùn)動(dòng)方程為 其中,V是飛行速度;α是迎角;θ是俯仰角;q是俯仰角速率;輸入變量u1、u2表示兩個(gè)發(fā)動(dòng)機(jī)的油門(mén)開(kāi)度;輸入變量u3和u4分別為左右內(nèi)升降舵偏角,u5和u6分別為左右外升降舵偏角.f1,f2,f4,G1,G2,G4表達(dá)式詳見(jiàn)文獻(xiàn)[30].取V、α、θ、q分別為系統(tǒng)狀態(tài)x1、x2、x3、x4,系統(tǒng)輸入u=[u1,u2,u3,u4,u5,u6]. ?f1,?f2,?f4分別為關(guān)于f1,f2,f4的不確定項(xiàng),本文設(shè)定?f1=0.2f1,?f2=?0.2f2,?f4=?0.1f4. 系統(tǒng)輸出y=[x1,x3]T,參考信號(hào)分別為205+10sin(0.1t)和10sin(0.1t).給定系統(tǒng)的代價(jià)函數(shù)(9)中Q=[100,100],R=[100,1].系統(tǒng)和觀測(cè)狀態(tài)的初始狀態(tài)都設(shè)為x(0)=[200m/s,0,3?,0]T.神經(jīng)網(wǎng)絡(luò)權(quán)值初始值全部設(shè)為0,這就意味著不需要給系統(tǒng)設(shè)置一個(gè)容許范圍內(nèi)的初始控制輸入.選取代價(jià)函數(shù)在線估計(jì)神經(jīng)網(wǎng)絡(luò)基函數(shù)為,自適應(yīng)增益矩陣 Γ1=1000I6×6, Γ2=diag{0.001,0.001,0.1,0.1,0.1,0.1},在線神經(jīng)網(wǎng)絡(luò)調(diào)整參數(shù)α1=0.1,α2=1.設(shè)飛行器在t=100s時(shí),右側(cè)外升降舵u6發(fā)生卡死在u6=6?的故障;在t=200s時(shí),左側(cè)外升降舵u5發(fā)生λ5=0.4的失效故障;在t=300s,左側(cè)內(nèi)升降舵u3發(fā)生卡死在u3=?8?的故障,并且右側(cè)內(nèi)升降舵u4發(fā)生λ4=0.6的失效故障.將本文方法與文獻(xiàn)[13]中所述的指定性能邊界的方法比較,在進(jìn)行仿真時(shí)對(duì)比兩種方法的控制效果,仿真結(jié)果如圖1~6所示. 圖1 本文方法的y1和yr1Fig.1y1andyr1of the proposed method 圖2 文獻(xiàn)[13]方法的y1和yr1Fig.2y1andyr1of[13] 由圖1~圖4可知,在執(zhí)行器出現(xiàn)卡死或失效故障后,兩種控制方法均可以實(shí)現(xiàn)對(duì)給定參考信號(hào)跟蹤,而本文方法具有更好的跟蹤性能.圖5與圖6為在兩種控制方法下系統(tǒng)跟蹤誤差的對(duì)比圖,可以看出在當(dāng)前參數(shù)設(shè)置下,t=0s~100s系統(tǒng)無(wú)故障時(shí)前者對(duì)yr1的跟蹤效果比后者好,兩種方法對(duì)yr2的跟蹤效果差別不明顯.t=100s~400s故障發(fā)生后,前者跟蹤效果幾乎不受影響,而后者由于故障的原因則出現(xiàn)一定程度的跟蹤誤差增大.無(wú)論對(duì)于執(zhí)行器卡死故障(t=100s~200s)、失效故障(t=200s~300s)、以及卡死和失效組合故障(t=300s~400s),相比可以看出前者具有更好的容錯(cuò)性能. 圖3 本文方法的y2和yr2Fig.3y2andyr2of the proposed method 圖4 文獻(xiàn)[13]方法的y2和yr2Fig.4y2andyr2of[13] 圖5 本文和文獻(xiàn)[13]方法的y1跟蹤誤差e1,e11Fig.5 Tracking errorse1,e11ofy1by the proposed method and[13] 圖6 本文和文獻(xiàn)[13]方法的y2跟蹤誤差e2,e22Fig.6 Tracking errorse2,e22ofy2by the proposed method and[13] 圖7 系統(tǒng)狀態(tài)誤差估計(jì)2Fig.7Estimating error of system state2 圖8 不確定項(xiàng)估計(jì)神經(jīng)網(wǎng)絡(luò)權(quán)值W2Fig.8 WeightsW2of uncertainty estimating neural network 本文針對(duì)一類具有不確定項(xiàng)以及執(zhí)行器故障的MIMO仿射非線性系統(tǒng)的輸出跟蹤問(wèn)題,考慮系統(tǒng)的執(zhí)行器卡死、部分失效及其組合故障,提出了一種基于動(dòng)態(tài)規(guī)劃的最優(yōu)自適應(yīng)補(bǔ)償控制方案.在構(gòu)造系統(tǒng)狀態(tài)估計(jì)器估計(jì)系統(tǒng)不確定項(xiàng)的基礎(chǔ)上,設(shè)計(jì)了最優(yōu)自適應(yīng)補(bǔ)償跟蹤控制律.提出的控制方法能夠使閉環(huán)系統(tǒng)的所有狀態(tài)有界,并有效跟蹤參考信號(hào).仿真結(jié)果表明了本文設(shè)計(jì)方法的有效性. 附錄A 定理1證明. 選取系統(tǒng)Lyapunov函數(shù)為 求導(dǎo)得 那么若不等式(A5)成立,則式(A4)小于0. 若下列不等式(A6)成立,則式(A4)小于0. 不等式(A5)和(A6)保證了當(dāng)kek≥be,時(shí),其中,be=max(be0,be1),bΘ=max(bΘ0,bΘ1)是正常數(shù)并可以通過(guò)選擇合適的參數(shù)α1和α2來(lái)減小它們的值. 因此,根據(jù)李雅普諾夫推論[20],系統(tǒng)輸出跟蹤誤差e和在線神經(jīng)網(wǎng)絡(luò)估計(jì)誤差在兩種情況下都能保持一致最終有界.□2 容錯(cuò)控制律設(shè)計(jì)
2.1 不確定性估計(jì)器設(shè)計(jì)
2.2 最優(yōu)控制律設(shè)計(jì)
2.3 自適應(yīng)補(bǔ)償控制律設(shè)計(jì)
3 仿真算例
4 結(jié)束語(yǔ)