張宇涵,于瀟雁,2,陳力
(1.福州大學(xué)機(jī)械工程及自動化學(xué)院,福建 福州 350108;2.流體動力與電液智能控制福建省高校重點(diǎn)實(shí)驗(yàn)室(福州大學(xué)),福建 福州 350108)
空間技術(shù)的發(fā)展為人類開拓宇宙提供了極大的便利,而太空環(huán)境多變,工作風(fēng)險(xiǎn)極高,因此空間機(jī)器人代替宇航員進(jìn)行太空作業(yè)是目前的主要手段.目前為止,對高度自主的空間智能機(jī)器人的研究還在初步階段,因而遙操作技術(shù)依然是人類探索太空的重要手段和主流研究.對于空間機(jī)器人遙操作控制系統(tǒng)來說,天地間距離過大,信號在傳輸過程中會產(chǎn)生時間延遲(簡稱時延).如果控制系統(tǒng)對時延影響不予考慮,其控制精度將會大大受到影響甚至導(dǎo)致系統(tǒng)控制失效.目前針對時延環(huán)境下空間機(jī)器人展開的研究相對較少.張建宇,葉柄能等提出了基于時延估計(jì)法的控制力矩設(shè)計(jì)問題[1-3],但它們均是為解決機(jī)器人參數(shù)不確定問題而設(shè)計(jì)的控制手段,而并非解決時延問題,其實(shí)際動力學(xué)系統(tǒng)中并不存在時延;白碩等展開了網(wǎng)絡(luò)環(huán)境下工業(yè)機(jī)器人的時延預(yù)測研究,但地面網(wǎng)絡(luò)環(huán)境并不適用于太空遙操作環(huán)境[4-7];Chen等提出使用泰勒級數(shù)預(yù)測法來得到系統(tǒng)時延項(xiàng),但他們未在三角函數(shù)展開式部分進(jìn)行化簡,導(dǎo)致系統(tǒng)模型過于繁冗,也未在空間機(jī)械臂系統(tǒng)上展開相關(guān)工作[8-10];此外,上述研究均未對時延范圍進(jìn)行有效探討.因此對具有時延的空間機(jī)器人系統(tǒng)進(jìn)行研究,并給予良好的補(bǔ)償控制手段[11-16]是非常有必要的.
針對上述問題與不足之處,本研究利用基于泰勒級數(shù)展開的預(yù)測手段,對關(guān)節(jié)空間坐標(biāo)進(jìn)行時延項(xiàng)的提取,從而得到改進(jìn)的空間機(jī)器人動力學(xué)方程.與傳統(tǒng)動力學(xué)方程相比,改進(jìn)的動力學(xué)方程模擬了時延誤差,更加符合客觀實(shí)際情況;利用神經(jīng)網(wǎng)絡(luò)控制[14]對非線性函數(shù)項(xiàng)的逼近能力,彌補(bǔ)計(jì)算力矩法無法解決的時延誤差;在神經(jīng)網(wǎng)絡(luò)控制器的基礎(chǔ)上引入模糊和遞歸控制可有效降低系統(tǒng)的抖振并提升在線學(xué)習(xí)速度;同時對時延值的有效范圍進(jìn)行在線評估,在能提供良好品控的基礎(chǔ)之上確定時延范圍.利用本文所提出的控制器方案,可以實(shí)現(xiàn)對關(guān)節(jié)空間預(yù)設(shè)軌跡的精確跟蹤.數(shù)值仿真驗(yàn)證了所提出方法的有效性.
不失一般性,考慮做平面運(yùn)動的漂浮基空間機(jī)器人(三桿)結(jié)構(gòu)模型如圖1所示.
圖1 自由漂浮三桿空間機(jī)器人系統(tǒng)Fig.1 Free-floating space-based robot system
忽略微弱的重力梯度,空間機(jī)械臂系統(tǒng)為無外力作用的無根多剛體系統(tǒng),其重力勢能為0.將總動能T代入第二類拉格朗日方程,可以得到載體位置及姿態(tài)均不受控下欠驅(qū)動形式的系統(tǒng)動力學(xué)方程為
(1)
(2)
將含有時延的關(guān)節(jié)參數(shù)代入到三角函數(shù)中,并進(jìn)行簡化可得
(3)
從上式可以看出,計(jì)算誤差來源于對泰勒展開式高階項(xiàng)的省略.
(4)
(5)
將式(5)代入動力學(xué)方程式(1),可得到存在時延誤差下的改進(jìn)動力學(xué)方程為
(6)
其中:ΔE為擴(kuò)展后的剩余項(xiàng).即系統(tǒng)存在的時延誤差為
研究將用到以下假設(shè).
若不考慮時延誤差,一般情況下對于動力學(xué)模型(1),常規(guī)的計(jì)算力矩法反饋控制器τ可寫為
(8)
其中:Kp、Kv為正定常值矩陣(增益因子).在沒有時延誤差的情況下,常規(guī)反饋控制器下的追蹤誤差逐漸收斂為0.若將常規(guī)控制器應(yīng)用于改進(jìn)的泰勒級數(shù)展開下的動力學(xué)模型,即將式(8)代入式(6)得
(9)
由于時延誤差的存在,系統(tǒng)無法實(shí)現(xiàn)漸進(jìn)穩(wěn)定,需要引入補(bǔ)償控制f(·),使得在理想狀況下有
(10)
其中,時延項(xiàng)ΔE為未知的非線性函數(shù).因此,這里引入基于模糊遞歸神經(jīng)網(wǎng)絡(luò)控制算法來補(bǔ)償時延誤差.
神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性逼近能力及良好的在線學(xué)習(xí)能力,可以用其對非線性進(jìn)行補(bǔ)償;在此基礎(chǔ)上引入模糊與歸納推理,將神經(jīng)網(wǎng)絡(luò)與模糊控制結(jié)合起來,構(gòu)成具有推理歸納能力的模糊神經(jīng)網(wǎng)絡(luò),提升控制品質(zhì).其綜合性能更適用于非線性控制系統(tǒng).所設(shè)計(jì)的模糊遞歸神經(jīng)網(wǎng)絡(luò)控制算法為三輸入三輸出的層網(wǎng)絡(luò)結(jié)構(gòu),結(jié)構(gòu)如圖2所示.
圖2 模糊遞歸結(jié)構(gòu)Fig.2 Fuzzy recurrent neural structure
每一層的描述規(guī)則如下.
第一層接受輸入變量.同時也作為第二層的輸入變量.在姿態(tài)關(guān)節(jié)不受控前提下,設(shè)輸入變量為誤差函數(shù)s,有
(11)
第二層為隸屬函數(shù)值計(jì)算階段.采用高斯函數(shù)作為隸屬函數(shù),每一個節(jié)點(diǎn)都有一個隸屬度函數(shù),即
(12)
第三層為模糊推理層.由第二層得到的輸出量通過規(guī)律連乘(模糊過程)得到第三層的輸出量,且第三層上一時刻的輸出量φjp經(jīng)過bji的加權(quán)后反饋到第二層,構(gòu)成了遞歸結(jié)構(gòu),即
(13)
第四層為輸出層.其輸出表達(dá)式為
(14)
式中:fi為第四層輸出量;wji為模糊推理層與輸出層的連接權(quán)值,該值通過在線訓(xùn)練不斷地調(diào)整φj第三層第j個節(jié)點(diǎn)的輸出.將所有的輸出結(jié)果進(jìn)行整合,最終得到補(bǔ)償控制的形式為
f(·)=WTΦ
(15)
其中:W為網(wǎng)絡(luò)權(quán)值矩陣,Φ=[φ1φ2φ3…φn]T為最終的輸出變量.
在一致估計(jì)理論和假設(shè)1的前提下,對于連續(xù)函數(shù)f(·),對于任意給定的很小正數(shù)ε0,總是存在最優(yōu)網(wǎng)絡(luò)權(quán)值W*(f(·)的最佳逼近權(quán)值),使得
(16)
因此,定義逼近誤差η=ΔE-f*(s),并存在如下假設(shè).
假設(shè)4 逼近誤差η是有界的,即有
(17)
實(shí)際應(yīng)用中理想補(bǔ)償控制效果難以達(dá)到,因此設(shè)估計(jì)的補(bǔ)償控制(實(shí)際輸入控制)為
(18)
設(shè)理想網(wǎng)絡(luò)權(quán)值與估計(jì)(實(shí)際)網(wǎng)絡(luò)權(quán)值的誤差為
(19)
其網(wǎng)絡(luò)權(quán)值自適應(yīng)律在后續(xù)的李雅普諾夫證明中可得到.
綜合式(8)、(18),最終的控制器算法可寫為
(20)
其中:δ是為保持等式右端載體姿態(tài)角項(xiàng)的輸入控制力矩恒為0所設(shè).
(21)
結(jié)合式定義逼近誤差及式(19),可得
因此最終狀態(tài)方程可改寫為
(22)
對上述閉環(huán)系統(tǒng),做如下穩(wěn)定性分析,設(shè)計(jì)李雅普諾夫函數(shù)為
(23)
(25)
(26)
網(wǎng)絡(luò)取值誤差自適應(yīng)律為
(27)
將式(27)代入到式(26),可得
(28)
其中:λmin(Q)和λmax(P)分別為矩陣Q和P的最小特征值和最大特征值.
對圖1所示的空間機(jī)器人系統(tǒng)進(jìn)行數(shù)值仿真試驗(yàn).設(shè)計(jì)參數(shù)如下:m0=40.00 kg,m1=2.00 kg,m2=1.00 kg,m3=2.50 kg;J0=34.17 kg·m2,J1=1.50 kg·m2,J2=1.50 kg·m2,J3=0.75 kg·m2;L0=1.50 m,L1=3.00 m,L2=3.00 m,L3=3.00 m;d1=1.50 m,d2=1.50 m,d3=1.50 m;隸屬函數(shù)單元數(shù)為n=25;高斯基函數(shù)中心值c按間隔為0.5的均勻分布取值,基帶寬度σ取值為1.2,其余值均為1;Q=diag(60,60,60,60,60,60);Kp=diag(25,25,25);Kv=diag(30,30,30).
利用本文所提出的控制手段進(jìn)行數(shù)值仿真,其軌跡追蹤結(jié)果如圖3~5所示.為了突出本文所設(shè)計(jì)的控制方法(控制方法1)的優(yōu)越性,將式(8)計(jì)算力矩法(控制方法2)和文獻(xiàn)[14]所提出的常規(guī)RBF神經(jīng)網(wǎng)絡(luò)控制手段(控制方法3)與其進(jìn)行比對,其軌跡誤差e變化情況如圖6~8所示.
圖3 關(guān)節(jié)角1追蹤結(jié)果Fig.3 Joint angle 1 tracking results
圖4 關(guān)節(jié)角2追蹤結(jié)果Fig.4 Joint angle 2 tracking results
圖5 關(guān)節(jié)角3追蹤結(jié)果 Fig.5 Joint angle 3 tracking results
圖6 關(guān)節(jié)角1追蹤誤差對比Fig.6 Comparison of joint angle 1 tracking error
圖7 關(guān)節(jié)角2追蹤誤差對比 Fig.7 Comparison of joint angle 2 tracking error
圖8 關(guān)節(jié)角3追蹤誤差對比Fig.8 Comparison of joint angle 3 tracking error
從以上結(jié)果可以看到,用控制方法2根本無法保證系統(tǒng)的漸近穩(wěn)定性;控制方法3可以有效追蹤,但和本文所提出的控制方案1相比,收斂速度相對較慢,而且趨于穩(wěn)定后會出現(xiàn)抖振.仿真結(jié)果說明,融合模糊遞歸的神經(jīng)網(wǎng)絡(luò)控制器既可以有效補(bǔ)償時延誤差,也可以提高收斂速度并減緩抖振現(xiàn)象,擁有更高的控制精度.
圖9 關(guān)節(jié)角1追蹤誤差Fig.9 Joint angle 1 tracking error
圖10 關(guān)節(jié)角2追蹤誤差 Fig.10 Joint angle 2 tracking error
圖11 關(guān)節(jié)角3追蹤誤差Fig.11 Joint angle 3 tracking error
結(jié)果顯示,在L∈[0.1,2.6)范圍內(nèi),誤差在逐漸遞增,當(dāng)臨近范圍邊緣,最大誤差波動已經(jīng)超過了0.01,雖然仍符合軌跡追蹤效果,但是追蹤精度已經(jīng)不滿足要求,這勢必會影響控制品質(zhì),因此本文控制手段從理論上說延遲值在2.6 s以內(nèi)都可以滿足控制精度要求.