楊 波 王 哲
(北京航空航天大學(xué) 自動化科學(xué)與電氣工程學(xué)院,北京 100191)
舵面電動加載系統(tǒng)的自適應(yīng) CMAC復(fù)合控制
楊 波 王 哲
(北京航空航天大學(xué) 自動化科學(xué)與電氣工程學(xué)院,北京 100191)
針對無人機舵面電動加載系統(tǒng)具有非線性及多余力矩的特點,提出了一種自適應(yīng) CMAC(Cerebellar Model Articulation Controller)神經(jīng)網(wǎng)絡(luò)與自適應(yīng)神經(jīng)元控制器并聯(lián)構(gòu)成復(fù)合控制結(jié)構(gòu).該控制策略以系統(tǒng)的指令輸入和實際輸出作為 CMAC的激勵信號,以系統(tǒng)的當(dāng)前控制誤差作為 CMAC的訓(xùn)練信號.提出了利用誤差在線自適應(yīng)調(diào)整學(xué)習(xí)率的方法,消除了常規(guī)前饋型 CMAC的過學(xué)習(xí)和不穩(wěn)定現(xiàn)象.建立了無人機舵面電動加載系統(tǒng)的數(shù)學(xué)模型,給出了具體的控制結(jié)構(gòu)和算法.仿真結(jié)果表明:該方法有效抑制了加載系統(tǒng)的多余力矩,增強了系統(tǒng)的穩(wěn)定性,明顯改善了舵面電動加載系統(tǒng)的動態(tài)性能.
舵面電動加載系統(tǒng);多余力矩;小腦模型關(guān)聯(lián)控制器神經(jīng)網(wǎng)絡(luò);自適應(yīng)控制;自適應(yīng)神經(jīng)元;學(xué)習(xí)率
舵面電動加載系統(tǒng)用于實驗室條件下無人機舵機的負(fù)載模擬試驗,以檢測和考核舵機系統(tǒng)在實際負(fù)載條件下的控制律、動態(tài)性能、系統(tǒng)可靠性等.對于無人機而言,舵面載荷相對較小,所以通常采用電動加載系統(tǒng).
舵面電動加載系統(tǒng)存在著由于被加載系統(tǒng)的主動運動引起的多余力矩.多余力矩會影響加載系統(tǒng)的控制精度、帶寬和穩(wěn)定性,因此如何抑制乃至消除多余力矩是舵面電動加載系統(tǒng)必須解決的關(guān)鍵問題.工程中通常采用結(jié)構(gòu)不變性原理來抑制多余力矩,但在實際的舵面電動加載系統(tǒng)中,存在非線性(如摩擦、機械連接間隙等)以及參數(shù)變化問題,采用該方法往往達不到理想效果[1].
小腦模型關(guān)聯(lián)控制器(CMAC,Cerebellar Model Articulation Controller)是一種采用局部學(xué)習(xí)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),具有結(jié)構(gòu)簡單、有一定的泛化能力和學(xué)習(xí)速度快等優(yōu)點,適合于實時控制.但CMAC網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計目前理論指導(dǎo)較少,這給其設(shè)計和推廣帶來了難度.目前常用的是 CMAC的前饋控制和固定增益反饋 PD(Proportional-Derivative)控制器相結(jié)合的復(fù)合控制,但在跟蹤連續(xù)變化的信號時,誤差累積的影響會使 CMAC產(chǎn)生過學(xué)習(xí)現(xiàn)象,導(dǎo)致系統(tǒng)不穩(wěn)定[2].基于 CMAC的控制系統(tǒng)穩(wěn)定性與學(xué)習(xí)率取值密切相關(guān),如學(xué)習(xí)率選取不當(dāng),會導(dǎo)致控制系統(tǒng)不穩(wěn)定或者收斂速度很慢[3].而固定增益反饋控制器的大小也影響著系統(tǒng)的穩(wěn)定性和抗干擾能力[4].文獻[5]提出了采用線性神經(jīng)元控制器實現(xiàn)固定增益的自適應(yīng)調(diào)節(jié),使系統(tǒng)的品質(zhì)得到了改善.
本文根據(jù)舵面電動加載系統(tǒng)的實際應(yīng)用情況,提出了一種基于 CMAC神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制器,仿真結(jié)果表明了本方法的有效性.
為盡可能真實模擬飛機舵面在不同飛行任務(wù)中承受的載荷情況,舵面電動加載系統(tǒng)往往是多通道并行系統(tǒng),由于各通道之間彼此獨立,因此對單通道加載系統(tǒng)進行數(shù)學(xué)建模.力矩電機作為主要載荷模擬設(shè)備,通過聯(lián)軸器與力矩傳感器相連,再通過搖臂、拉桿和舵機搖臂將載荷施加到舵機軸上.
舵面電動加載系統(tǒng)是以轉(zhuǎn)矩為被控量的直流電機伺服系統(tǒng),采用脈沖寬度調(diào)制驅(qū)動裝置,產(chǎn)生大功率電流驅(qū)動直流力矩電機對被加載對象加載,加載系統(tǒng)通過連接機構(gòu)與承載舵機相連,對其加載并隨之在一定角度內(nèi)進行往復(fù)運動[6].
直流電機的電壓平衡方程為
電機反電勢為
其中
電磁轉(zhuǎn)矩可表示為
電機轉(zhuǎn)矩為
式中,Ua,Ea,Ia分別為力矩電機電樞電壓、反電動勢和電樞電流;KE,KT分別為力矩電機的反電動勢系數(shù)和轉(zhuǎn)矩系數(shù);Ra,La分別為電樞的電阻和電感;Ωm,θm分別為電機的角速度和角位移;Bm,Jm分別為電機的轉(zhuǎn)矩系數(shù)和轉(zhuǎn)動慣量.
由式(1)~式(5),可得電機的傳遞函數(shù):
不考慮轉(zhuǎn)矩傳感器的扭轉(zhuǎn)剛度,認(rèn)為電機軸和負(fù)載是剛性連接,承載對象可看成是慣性負(fù)載,其粘性阻尼系數(shù)近似為零.
系統(tǒng)的力矩平衡方程如下:
式中,JL為被加載對象端負(fù)載的轉(zhuǎn)動慣量;KL為被加載對象端負(fù)載的扭轉(zhuǎn)剛度;Ωf為被加載對象端的角速度;θf為被加載對象端的角位移.聯(lián)立式(6)~式(8)可得加載系統(tǒng)的傳遞函數(shù):
其中
由式(9)可以看出分子第 2項實際上是強位置干擾量產(chǎn)生的力矩,即所謂的多余力矩.
CMAC-PD復(fù)合控制器通過 CMAC實現(xiàn)前饋控制,確保系統(tǒng)的響應(yīng)速度,減少超調(diào)量.常規(guī) PD算法實現(xiàn)反饋控制,以保證系統(tǒng)的穩(wěn)定性,抑制擾動.
通過仿真實驗發(fā)現(xiàn),傳統(tǒng)的 CMAC-PD控制,系統(tǒng)在維持相當(dāng)長時間的穩(wěn)定后,會產(chǎn)生過學(xué)習(xí)現(xiàn)象導(dǎo)致突然崩潰.為了提高系統(tǒng)的穩(wěn)定性和抗干擾能力,對 CMAC神經(jīng)網(wǎng)絡(luò)控制器的結(jié)構(gòu)進行了改進,改進后的結(jié)構(gòu)如圖 1所示.
該控制器與常用的前饋-反饋復(fù)合控制結(jié)構(gòu)類似,但它采用二維輸入,以系統(tǒng)的給定信號r(k)和實際輸出信號 y(k)作為 CMAC的輸入.
圖1 自適應(yīng) CMAC神經(jīng)網(wǎng)絡(luò)復(fù)合控制器結(jié)構(gòu)
常規(guī)的復(fù)合控制采用 PID(Proportional Integral Differential)控制器的輸出作為調(diào)整權(quán)值學(xué)習(xí)的訓(xùn)練信號,CMAC學(xué)習(xí)的是被控對象的逆動態(tài)模型.而改進后的復(fù)合 CMAC-PD控制結(jié)構(gòu)采用的是系統(tǒng)的跟蹤誤差 e(k)作為調(diào)整權(quán)值學(xué)習(xí)的訓(xùn)練信號,因此 CMAC實現(xiàn)的不僅僅是被控對象的逆動態(tài)模型,而且是包括了常規(guī)反饋控制器在內(nèi)的整個系統(tǒng)的逆動態(tài)模型.另外在學(xué)習(xí)算法中,本文提出了一種變學(xué)習(xí)率的方法,根據(jù)誤差的大小進行自適應(yīng)在線調(diào)節(jié),可以有效地消除傳統(tǒng)的控制結(jié)構(gòu)中,由于 PD控制器和 CMAC在學(xué)習(xí)中產(chǎn)生沖突,導(dǎo)致系統(tǒng)不穩(wěn)定的現(xiàn)象.為了進一步提高系統(tǒng)的控制精度和穩(wěn)定性,用自適應(yīng)神經(jīng)元控制器取代常規(guī)的 PD固定增益控制器,它能根據(jù)控制系統(tǒng)的動態(tài)特性優(yōu)化 CMAC的自學(xué)習(xí)控制,使其能適應(yīng)各種系統(tǒng)工況的變化,從而提高系統(tǒng)的控制品質(zhì).
基于 CMAC自適應(yīng)控制器的控制算法如下:
1)設(shè)置聯(lián)想單元個數(shù)、泛化參數(shù)和量化參數(shù);
2)初始化參數(shù),CMAC聯(lián)想單元的權(quán)值均為零;
3)根據(jù)式(14)對 r(k)和 y(k)進行量化:
式中,round為取整函數(shù);xmax和 xmin分別為輸入 x的最大值和最小值;M為 xmax對應(yīng)的量化值;
4)在 CMAC中找到與之對應(yīng)的 C個單元,并將這 C個單元的權(quán)值相加,得到 CMAC的輸出:
式中,wi(k)為 CMAC第 k次的權(quán)值;ai(k)為二進制選擇向量;C為 CMAC網(wǎng)絡(luò)的泛化常數(shù);
5)將 CMAC輸出值和自適應(yīng)網(wǎng)絡(luò)神經(jīng)元控制器的輸出 un(k)相加,得到被控對象總的控制輸入,即
6)用 e(k)作為訓(xùn)練信號,調(diào)整聯(lián)想單元中的權(quán)值大小,進入學(xué)習(xí)過程,權(quán)值調(diào)整規(guī)則為
式中,η(1-e-α|e(k)|)為改進后的 CMAC神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,η為常數(shù)且 η∈(0,1),1-e-α|e(k)|為學(xué)習(xí)率比例因子.η(1-e-α|e(k)|)隨著 e(k)的減小呈指數(shù)衰減,當(dāng) e(k)較小時,較小的 η(1-e-α|e(k)|)可以抑制累積誤差的影響所導(dǎo)致系統(tǒng)的不穩(wěn)定性,而 e(k)較大時,較大的 η(1-e-α|e(k)|)可以加速系統(tǒng)的收斂.α為平衡常數(shù),用來協(xié)調(diào)系統(tǒng)的穩(wěn)定性和收斂速度.對于常規(guī)CMAC而言,固定學(xué)習(xí)率無法解決穩(wěn)定性和收斂速度之間的矛盾,而改進后的算法可以根據(jù)系統(tǒng)e(k)大小在學(xué)習(xí)過程中動態(tài)地調(diào)整 η(1-e-α|e(k)|),從而提高了系統(tǒng)的自適應(yīng)性,有效地增強了系統(tǒng)的穩(wěn)定性;
7)k=k+1,轉(zhuǎn)3).
常規(guī) CMAC復(fù)合控制中的 PID控制采用傳統(tǒng)的 PD算法而不是 PID算法,目的是使 CMAC的學(xué)習(xí)僅依賴于誤差當(dāng)時的測量值及變化值.為不改變原有常規(guī)固定增益控制器的結(jié)構(gòu),自適應(yīng)線性神經(jīng)元控制器的具體結(jié)構(gòu)如圖 2所示.
圖2 自適應(yīng)線性神經(jīng)元結(jié)構(gòu)
控制器的輸出為
式中,w1(k)和 w2(k)為神經(jīng)元的權(quán)重,分別對應(yīng)常規(guī) PD控制器的比例和微分調(diào)節(jié)系數(shù) Kp和 Kd;x1(k)和 x2(k)為神經(jīng)元輸入信號,分別對應(yīng)給定的誤差和誤差變化量.取性能指標(biāo)函數(shù):
用梯度下降法來修正網(wǎng)絡(luò)的權(quán)系數(shù),即按E(k)對加權(quán)系數(shù)的負(fù)梯度方向搜索調(diào)整:
綜上所述,本文提出的復(fù)合控制通過學(xué)習(xí)率自適應(yīng)調(diào)整的 CMAC來協(xié)調(diào)系統(tǒng)動態(tài)性能和穩(wěn)態(tài)性能之間的矛盾,它與自適應(yīng)神經(jīng)元控制器一同提高了系統(tǒng)的穩(wěn)定性和抗干擾能力,從而改善了系統(tǒng)的控制性能.
為了驗證自適應(yīng) CMAC控制器控制策略的有效性,需要進行對比仿真分析.將舵面電動加載系統(tǒng)的相關(guān)參數(shù) Jm=0.01kg·m2,La=4.3mH,Ra=3.5Ω,KT=1.754 N· m/A,KE=2.046 V/(r·min-1)等參數(shù)代入式(9),其中常規(guī)固定增益 PD控制器參數(shù)設(shè)定為 Kp=2,Kd=0.5;CMAC的參數(shù)設(shè)定為 w1(0)=2,w2(0)=0.5,η=0.05,α=1,C=20,給定信號和實際輸出信號的量化級數(shù) N均取 100.自適應(yīng)神經(jīng)元的學(xué)習(xí)速率為 β=0.001.取舵機的角速度干擾信號 yr=1.74sin(5· 2πt)rad時,未加 CMAC時多余力矩的峰值為 1.86N·m.
下面分別針對結(jié)構(gòu)不變性控制,CMAC與常規(guī)固定增益 PD復(fù)合控制以及本文提出的自適應(yīng)CMAC復(fù)合控制進行仿真比較.
取加載指令為 r(k)=10 sin(10· 2πt)N·m,對于無人機舵面電動加載系統(tǒng)而言,加載指令的頻率已為極限值,仿真時間取 2s.圖 3為采用結(jié)構(gòu)不變性控制的仿真結(jié)果,|e(k)|幅值為1.3N·m;圖 4為 CMAC與常規(guī) PD復(fù)合控制,圖5為自適應(yīng) CMAC控制,0.5 s后,|e(k)|幅值均收斂到 0.5 N·m左右.由此可見,采用基于CMAC控制策略的效果明顯優(yōu)于結(jié)構(gòu)不變性控制效果,多余力矩減小了 60%,從圖中可以看出,采用自適應(yīng) CMAC后,系統(tǒng)也能迅速收斂,且多余力矩等干擾對系統(tǒng)誤差的影響只有 5%.
圖3 基于結(jié)構(gòu)不變性原理跟蹤曲線
圖4 基于 CMAC與常規(guī) PD復(fù)合控制跟蹤曲線
圖5 基于自適應(yīng)CMAC復(fù)合控制跟蹤曲線
針對 CMAC和 PD復(fù)合控制相互作用,可能經(jīng)過相當(dāng)長的穩(wěn)定時間,最終導(dǎo)致系統(tǒng)發(fā)散的問題,有必要測試其穩(wěn)定性.
正弦波信號的取值同 3.1,將仿真時間延長為 500s,圖 6為常規(guī) CMAC和固定增益 PD復(fù)合控制的仿真結(jié)果.可見雖然系統(tǒng)一開始能夠迅速收斂,但經(jīng)過 85s后,就出現(xiàn)發(fā)散現(xiàn)象,而圖 7采用的自適應(yīng) CMAC復(fù)合控制在經(jīng)過 500 s仿真后,|e(k)|幅值仍保持在0.4N·m左右,沒有發(fā)散的趨勢.由此可見本文提出的自適應(yīng)控制器,通過自適應(yīng)神經(jīng)元 KP,Kd以及 CMAC控制部分學(xué)習(xí)率的在線調(diào)整,不僅使系統(tǒng)具有良好的動態(tài)響應(yīng)性能和跟蹤連續(xù)變化信號的能力,而且有效地提高了系統(tǒng)的穩(wěn)定性.
圖6 100s常規(guī) CMAC和固定增益PD復(fù)合控制跟蹤誤差
圖7 500s自適應(yīng)CMAC復(fù)合控制跟蹤誤差
另外,為了驗證本文提出的變學(xué)習(xí)率公式對于系統(tǒng)穩(wěn)定性的作用,將 1-e-α|e(k)|取為 1,η=0.05即為固定學(xué)習(xí)率,其他參數(shù)均保持不變,仿真結(jié)果如圖 8所示.雖然 500 s時由于自適應(yīng)神經(jīng)元控制器的作用使得系統(tǒng)并沒有崩潰,但它有發(fā)散的趨勢,而且時間一長對多余力矩的抑制效果不如圖 7穩(wěn)定.可見學(xué)習(xí)率的大小對系統(tǒng)的穩(wěn)定也起著很重要的作用,固定學(xué)習(xí)率時有時并不能達到理想的效果,而變學(xué)習(xí)率在線調(diào)整權(quán)值增強了系統(tǒng)的自適應(yīng)能力,它與自適應(yīng)神經(jīng)元一起有效地提高了系統(tǒng)的穩(wěn)定性.
圖8 500s固定學(xué)習(xí)率的自適應(yīng)CMAC復(fù)合控制跟蹤誤差
多余力矩嚴(yán)重影響舵面電動加載系統(tǒng)的動態(tài)加載性能,僅采用結(jié)構(gòu)不變性原理抑制多余力矩達不到理想的效果.本文針對無人機舵面電動加載系統(tǒng)的特點,在常規(guī) CMAC復(fù)合控制的基礎(chǔ)上,提出了一種自適應(yīng) CMAC神經(jīng)網(wǎng)絡(luò)控制器,該控制器以給定信號和實際輸出信號為 CMAC的激勵信號,以系統(tǒng)誤差作為訓(xùn)練信號,在線調(diào)整學(xué)習(xí)率的大小并與自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器相結(jié)合構(gòu)成系統(tǒng)的復(fù)合控制.仿真結(jié)果表明:該方法既彌補了結(jié)構(gòu)不變性原理的不足,明顯抑制了多余力矩,又能保證系統(tǒng)的長期穩(wěn)定性,從而有效地改善了系統(tǒng)的動態(tài)加載性能.相比于其他類型的神經(jīng)網(wǎng)絡(luò)控制,計算量小,非常適合于在線實時控制,對舵面電動加載系統(tǒng)的設(shè)計具有很大的參考價值.
References)
[1]任志婷,焦宗夏.小轉(zhuǎn)矩電動式負(fù)載模擬器的設(shè)計[J].北京航空航天大學(xué)學(xué)報,2003,29(1):91-94 Ren Zhiting,Jiao Zongxia.Design of motor-drive load simulator with smalltorque outputs[J].Journal of Beijing University of Aeronautics and Astronautics,2003,29(1):91-94(in Chinese)
[2]蔣志明,林廷圻,黃先祥.一種基于 CMAC的自學(xué)習(xí)控制器[J].自動化學(xué)報,2000,26(4):542-545 Jiang Zhiming,Lin Tingqi,Huang Xianxiang.A new self-learning controller based on CMAC neural network[J].Acta Automatica Sinica,2000,26(4):542-545(in Chinese)
[3]林旭梅,梅濤.一種基于自適應(yīng)遺傳算法的 CMAC的學(xué)習(xí)率優(yōu)化研究[J].系統(tǒng)仿真學(xué)報,2005,17(12):3081-3088 Lin Xumei,Mei Tao.A kind of optimization based on adaptive GA for cerebellar model articulation[J].Journal of System Simulation,2005,17(12):3081-3088(in Chinese)
[4]何超,徐立新,張宇河.CMAC算法收斂性分析及泛化能力研究[J].控制與決策,2001,16(5):523-529 He Chao,Xu Lixin,Zhang Yuhe.Convergence and generalization ability of CMAC[J].Control and Decision,2001,16(5):523-529(in Chinese)
[5]李輝.一種自適應(yīng) CMAC神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計與仿真[J].2005,17(9):2233-2235 Li Hui.Design and simulation of adaptive CMAC controller[J].2005,17(9):2233-2235(in Chinese)
[6]楊波,王俊奎.基于改進的 CMAC的電動加載系統(tǒng)復(fù)合控制[J].航空學(xué)報,2008,29(5):1315-1318 Yang Bo,Wang Junkui.Hybrid control based on improved CMAC for motor-driven loading system[J].Acta Aeronautica et Astronautica Sinica,2008,29(5):1315-1318(in Chinese)
(編 輯:劉登敏)
Adaptive CMAC hybrid control for rudder electric loading system s
Yang Bo Wang Zhe
(School of Automation Science and Electrical Engineering,Beijing University of Aeronautics and Astronautics,Beijing 100191,China)
Aiming at the nonlinearity and the surplus torque in rudder electric loading systems of unmanned aerial vehicle(UAV),aself-adaptive cerebellar modelarticulation controller(CMAC)was proposed,which was parallel to an adaptive neuron controller.This hybrid control strategy adopted the desired value and the actual out put as the incentive signals of CMAC,and put the current system error as the training signal of CMAC.The method was proposed by using the error to adjust the learning rate on line,which eliminated the excess self-learning phenomena.The mathematical model of rudder electric loading systems for UAV was established and the detailed control structure was put forward.Simulation results show that the proposed hybrid controller can effectively eliminate the surplus torque,enhance the control stability of the systems and fairly improve the dynamic loading performances of the systems,which is highly suitable for real-time control of nonlinear systems.
rudderelectric loading systems;surplus torque;neural cerebellar model articulation controller network;self-adaptive control;self-adaptive neurons;learning rate
TP 273
A
1001-5965(2010)03-0333-05
2009-03-02
楊 波(1972-),女,四川廣安人,副教授,boyang@buaa.edu.cn.