施光林 沈 偉
1.上海交通大學,上海,200240 2.上海海洋大學,上海,201306
氣動人工肌肉[1](pneumatic artificial muscle,PAM)是一種新型的氣動執(zhí)行器。當對氣動人工肌肉充氣時,其收縮產生的拉力與外力達到平衡,實現(xiàn)被連接物體的準確定位。由于結構原因,氣動人工肌肉只能產生拉力。與其他氣動執(zhí)行器相比,氣動人工肌肉具有柔順、結構簡單、經濟和拉力重量比大等眾多優(yōu)點,其應用也日益廣泛[2]。筆者著眼類人機器人腰部應用,設計了一種氣動人工肌肉三自由度并聯(lián)平臺[3]。3根氣動人工肌肉向下的拉力與中心立柱滑桿彈簧向上的推力共同作用于上平臺圓盤。當達到平衡時,可實現(xiàn)上平臺圓盤某一確定的姿態(tài),從而達到協(xié)調上下肢的目的。
常溫氣體的易壓縮性、閥口處氣體流動的強非線性以及氣體流動過程中常見的氣壓波動等導致氣動系統(tǒng)高精度控制有很大的難度。氣動人工肌肉的靜動態(tài)特性也具有極強的非線性和遲滯力等強不確定性因素,而且并聯(lián)平臺的3個驅動器之間也存在強烈的耦合。上述特性使得氣動人工肌肉并聯(lián)平臺的姿態(tài)控制難度更高。
眾所周知,智能系統(tǒng)在強非線性和強不確定性系統(tǒng)的控制策略設計中被廣泛采用。采用人工神經網絡、模糊系統(tǒng)在理論上可以對任意復雜的系統(tǒng)進行建模,且可以避免繁瑣的建模分析和控制器設計。小腦模型神經網絡(cerebellar model articulation controller,CMAC)是一種基于神經生理學且簡單快速的神經網絡[4],與BP網絡之類的全局逼近方法相比,它具有局部逼近能力、連續(xù)(模擬)輸入輸出能力和一定的泛化能力,而且結構簡單,學習速度快,特別適合于實時控制。模糊邏輯與CMAC兩者結合即構成模糊CMAC神經網絡[5],可進一步提高CMAC的逼近能力和自適應能力。
本文采用自適應模糊CMAC(adaptive fuzzy CMAC,AFCMAC)控制器對氣動人工肌肉并聯(lián)平臺進行姿態(tài)控制,通過合理規(guī)劃AFCMAC輸入空間的變量選擇,實現(xiàn)了AFCMAC對氣動人工肌肉遲滯力和氣壓波動等不確定因素以及耦合特性的感知。用離散抗飽和PID控制器并行監(jiān)督AFCMAC的運行。最后,采用定點轉動參考輸入信號,進行氣動人工肌肉并聯(lián)平臺的姿態(tài)控制實驗。
圖1所示為一種氣動人工肌肉三自由度并聯(lián)平臺。本文將CMAC神經網絡應用于該并聯(lián)平臺的姿態(tài)控制。下面以二維CMAC(圖2)為例說明一種模糊CMAC的結構原理。定義輸入矢量(a1,a2),分量a1、a2在其取值范圍上做7個等分劃分,每個劃分又有3層結構,每層又分成3個塊(block),每個塊最多包含3個劃分。設m是n維CMAC的層數(shù),Nb為每層所包含塊的數(shù)目,則每維的等分劃分數(shù)目為m(Nb-1)+1;每塊最多包含m個劃分。為了提高常規(guī)CMAC的逼近能力和自適應能力,本文設計出一種模糊CMAC,即在每層的各個塊中定義聯(lián)想度函數(shù)。本文中的聯(lián)想度函數(shù)為高斯基函數(shù)。
輸入變量(x1,x2,…,xn)∈Rn。第k層各輸入變量被激活的塊組合為聯(lián)想域ψk(k=1,2,…,m),每層的聯(lián)想度函數(shù)定義為
式中,j*為第k層中輸入變量xi被激活的塊的索引,j*=1,2,…,Nb。
ψkij(i=1,2,…,n;j=1,2,…,Nb)為輸入變量xi對應第k層中各塊的聯(lián)想度函數(shù):
式中,zij、aij分別為對應塊上的聯(lián)想度函數(shù)(此處為高斯函數(shù))的中心值和寬度。
與每個被激活的聯(lián)想域ψk相對應,存在一個存儲單元,每個存儲單元存儲一個權值wk,則模糊CMAC的輸出為
模糊CMAC的自適應能力主要體現(xiàn)為控制過程中不斷學習調整CMAC的網絡權值。CMAC的網絡權值也就是其存儲單元的數(shù)據(jù)。設第s時刻,模糊CMAC的實際輸出為ys,期望輸出為,則權值的調整量為
式中,e為位置跟蹤誤差;K為PID控制器的比例系數(shù),文中取為常數(shù)。
如果控制運行過程中的跟蹤誤差比較大,則很可能會引起劇烈的氣壓波動,導致CMAC的在線自學習效率極大地降低,甚至會使在線自學習無法收斂。為了保證控制運行初期不會出現(xiàn)較大的跟蹤誤差和氣壓波動現(xiàn)象,使模糊CMAC在線實時學習調整成為可能,本文將離散抗飽和PID控制器(discrete anti-Saturation PID,DASPID)作為并行監(jiān)督控制器。運行程序根據(jù)跟蹤誤差|e|的大小,決定采用DASPID還是AFCMAC作為主控制器:當|e|≥1mm時,采用DASPID;當|e|<1mm時,采用 AFCMAC。AFCMAC的結構如圖3所示。首先,被跟蹤的姿態(tài)信號通過一個逆解器,轉化為并聯(lián)平臺3根氣動人工肌肉的位置跟蹤信號;再由DASPID與AFCMAC的并聯(lián)結構實現(xiàn)并聯(lián)平臺的姿態(tài)跟蹤控制;經在線實時自學習調整,AFCMAC的控制性能逐步提高,單根氣動人工肌肉位置跟蹤誤差逐步減小,最終取代DASPID而完全過渡到AFCMAC控制。
AFCMAC的輸入空間變量如下:被控氣動人工肌肉的內壓為p(k);被控氣動人工肌肉長度為L1(k),另外兩根氣動人工肌肉的長度為L2(k)、L3(k);下一采樣時刻,被控氣動人工肌肉長度變化量ΔL1(k)=L1(k+1)-L1(k);當前采樣時刻,被控氣動人工肌肉長度變化量ΔL1(k-1)=L1(k)-L1(k-1);被控高速開關閥在采樣間隔內的充放氣時間ΔTon與采樣周期T之比為ΔTon/T。
p(k)、L1(k)、ΔL1(k)、ΔL1(k-1)這4個變量組合選擇的目的,在于有效感知氣動人工肌肉的遲滯特性。L1(k)與L2(k)、L3(k)組合選擇的目的,在于使AFCMAC控制器具有一定的解耦能力。在輸入空間中選取ΔTon/T的目的,在于感知開關閥流體脈沖控制特性所形成的氣體波動。
氣動人工肌肉的遲滯特性是氣動人工肌肉三自由度并聯(lián)平臺系統(tǒng)最重要的不確定因素,為了成功感知氣動人工肌肉這一獨特遲滯特性,每個AFCMAC采用2個模糊CMAC的并聯(lián)結構。2個并聯(lián)CMAC的切換以氣動人工肌肉的收縮方向為判斷依據(jù),如圖4所示。
為保證每個AFCMAC對強非線性強不確定系統(tǒng)控制器的逼近能力和控制性能,對輸入空間進行了適當?shù)丶毣?,即將每個模糊CMAC的輸入變量有7層結構,每層分成5塊。在采樣時刻t(k),自適應模糊CMAC輸入以上7個參數(shù)變量(p(k)、L1(k)、ΔL1(k)、ΔL1(k-1)、L1(k)、L2(k)、L3(k)),通過式(1)~ 式(3)產生輸出,輸出變量為下一采樣時刻氣動人工肌肉的內壓p(k+1)。將Δp、p、ΔL、L作為PWM信號生成器的輸入,由生成器輸出采樣周期內開關閥充氣或者放氣的開啟時間,實現(xiàn)對氣動人工肌肉的控制。
建立了一種氣動人工肌肉三自由度并聯(lián)平臺實驗系統(tǒng),如圖5中左側裝置所示。實驗系統(tǒng)的氣動回路、測量和控制回路如圖6、圖7所示。
在圖5所示的實驗平臺上進行姿態(tài)控制實驗。首先,將3根氣動人工肌肉同時充氣至某一氣壓值,達到初始平衡;然后,以初始平衡位置為參考起點,跟蹤參考輸入信號;實驗時長20s。實驗中,DASPID的比例系數(shù)取0.4,積分系數(shù)取0.3,微分系數(shù)取0。參考輸入信號取為定點轉動,即上平臺姿態(tài)的偏轉角α(°)的被跟蹤曲線為3sin(2πt/10),俯 仰 角 β(°)的 被 跟 蹤 曲 線 為3sin(2πt/10),中心立柱滑桿高L保持不變。
使用DASPID對實驗平臺進行姿態(tài)跟蹤控制實驗,并采集相關實驗數(shù)據(jù)。使用上述實驗數(shù)據(jù),采用離線辨識的方法,自適應算法初步確定了AFCMAC的結構參數(shù)。DASPID并行監(jiān)督的設計和離線辨識方法保證了控制運行初期不會出現(xiàn)較大的跟蹤誤差和氣壓波動,從而使AFCMAC的在線實時學習調整成為可能。
圖8~圖10所示為經離線辨識后,在DASPID的并行監(jiān)督作用下,AFCMAC控制運行10次,每次運行20s后,再一次運行的實驗結果。通過在線實時學習調整,AFCMAC的性能逐步提高,單根氣動人工肌肉的位置跟蹤誤差已經完全小于1mm。此時,DASPID不再啟動,氣動人工肌肉已經完全處于AFCMAC的控制之中。由圖8b、圖9b、圖10b可見,跟蹤誤差分布較為分散,沒有特別的明顯特征。偏轉角α和俯仰角β的跟蹤誤差基本都在±0.3°范圍之內;中心立柱滑桿高L的最大跟蹤誤差僅為±0.3mm。
并聯(lián)平臺實驗系統(tǒng)的上平臺質量為4.03kg。為了檢驗在干擾情況下AFCMAC神經網絡控制器的魯棒性和在線學習調整能力,通過改變上平臺質量的方式對實驗系統(tǒng)施加外在干擾。上平臺質量的改變采用以下方式:在跟蹤運行過程中,在靠近某一氣動人工肌肉一側突然放置一個質量為5.04kg的突變偏心質量塊。突變偏心質量塊的安放位置如圖11所示。由圖12~圖14可見,在大約4s的時刻施加一個突變偏心質量塊,使得俯仰角β和中心立柱滑桿高L的跟蹤誤差較之未加干擾時跟蹤誤差增加一倍多;俯仰角β的跟蹤誤差達到0.5°~0.6°;中心立柱滑桿高L 的跟蹤誤差達到了0.5~0.6mm;偏轉角α的跟蹤誤差增加20%左右,達到0.3°~0.4°。經過大約5~10s的在線學習調整,各個姿態(tài)參數(shù)的跟蹤誤差逐漸恢復到未加干擾的水平。體現(xiàn)出AFCMAC較強的在線學習調整能力。
本文針對一種氣動人工肌肉三自由度并聯(lián)平臺,首先介紹一種自適應模糊CMAC(AFCMAC);通過規(guī)劃輸入空間,實現(xiàn)了AFCMAC對氣動人工肌肉遲滯力和氣壓波動等不確定因素和耦合因素的感知;兩個并聯(lián)的CMAC神經網絡結構保證了對遲滯特性的把握;對輸入變量結構進行了合理細化,保證了AFCMAC的控制性能。離線辨識的方法和DASPID并行監(jiān)督的設計,避免了在控制運行初期出現(xiàn)較大的跟蹤誤差和氣壓波動,從而使AFCMAC在線實時的學習調整成為可能。隨著運行次數(shù)不斷增多,AFCMAC的控制性能逐步提高,最終使三自由度并聯(lián)平臺完全處于AFCMAC的控制之下。當參考輸入信號為定點轉動,并在AFCMAC控制下時,上平臺偏轉角α和俯仰角β的最大跟蹤誤差只有±0.3°,中心立柱滑桿高L的最大跟蹤誤差只有±0.3mm。當施加突變偏心干擾時,即上平臺質量由4.03kg突變?yōu)?.07kg,AFCMAC體現(xiàn)出較為出眾的快速在線學習調整能力,只經過大約5~10s就使跟蹤誤差達到未加干擾的水平。實驗結果表明了AFCMAC較好的姿態(tài)控制性能和在線學習調整能力。
[1]Festo Co.Festo Pneumatic[M].V.28.Esslingen,Germany:Festo KG,2000.
[2]陶國良,謝建蔚,周洪.氣動人工肌肉的發(fā)展趨勢與研究現(xiàn)狀[J].機械工程學報,2009,45(10):75-83.
[3]沈偉,施光林.一種三自由度氣動人工肌肉并聯(lián)平臺動態(tài)數(shù)學模型[J].上海交通大學學報,2011,45(2):219-224.
[4]Albus J S.A New Approach to Manipulator Control:the Cerebellar Model Articulation Controller(CMAC)[J].Journal of Dynamic Systems,Measurement and Control,1975,97(7):220-227.
[5]Chiang C T,Lin C S.CMAC with General Basis Functions[J].Neural Networks,1996,9(7):1199-1211.