陳 陽(yáng),黃衛(wèi)華,何佳樂,章 政
(武漢科技大學(xué)信息科學(xué)與工程學(xué)院,武漢 430081)
立方體機(jī)器人是一種具有全封閉或半封閉外殼的新型機(jī)器人[1],它通過安裝在立方體內(nèi)部某個(gè)面的動(dòng)量輪的旋轉(zhuǎn)產(chǎn)生重心偏移,基于動(dòng)量守恒等原理實(shí)現(xiàn)立方體機(jī)器人以單點(diǎn)或者棱邊為支點(diǎn)的自平衡與翻滾等運(yùn)動(dòng)。與傳統(tǒng)的輪式、腿式、履帶式等移動(dòng)機(jī)器人相比,立方體機(jī)器人具有獨(dú)特的機(jī)械結(jié)構(gòu)和運(yùn)動(dòng)方式,是一種控制理論研究與應(yīng)用的理想平臺(tái),在太空探索、編隊(duì)表演、橋梁修補(bǔ)等領(lǐng)域具有廣泛的應(yīng)用前景。
目前,立方體機(jī)器人的結(jié)構(gòu)設(shè)計(jì)大同小異[2-4],相關(guān)研究工作主要集中于立方體機(jī)器人的動(dòng)力學(xué)建模與控制系統(tǒng)設(shè)計(jì)。關(guān)于立方體機(jī)器人動(dòng)力學(xué)建模的研究一般是基于凱恩方程[5-6]或拉格朗日方程[7]建立立方體機(jī)器人的驅(qū)動(dòng)力矩與速度、角速度等運(yùn)動(dòng)量之間的關(guān)系。然后對(duì)所建立的立方體機(jī)器人動(dòng)力學(xué)模型,采用自抗擾控制[7]、PID控制[8]、模糊控制[9]及反饋線性化[10]等方法實(shí)現(xiàn)立方體機(jī)器人的自平衡穩(wěn)定控制。然而,立方體機(jī)器人是一種非線性、強(qiáng)耦合、欠驅(qū)動(dòng)及多變量的多自由度倒立擺系統(tǒng),復(fù)雜的結(jié)構(gòu)和特殊自平衡方式導(dǎo)致其機(jī)理模型存在動(dòng)態(tài)不確定性。
已有研究表明,模糊神經(jīng)網(wǎng)絡(luò)已被廣泛應(yīng)用于處理非線性、模糊性等問題[11]。目前對(duì)于立方體機(jī)器人建模的研究均采用機(jī)理建模方法,因此難以獲取立方體機(jī)器人精確的數(shù)學(xué)模型,從而影響了立方體機(jī)器人控制系統(tǒng)的性能。為了進(jìn)一步提高立方體機(jī)器人建模精度,提出一種基于粒子群算法優(yōu)化的T-S型模糊神經(jīng)網(wǎng)絡(luò),通過模糊神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí),粒子群算法優(yōu)化模型參數(shù),建立立方體機(jī)器人的動(dòng)力學(xué)模型。最后仿真與實(shí)測(cè)實(shí)驗(yàn)結(jié)果證明了所設(shè)計(jì)的基于粒子群模糊神經(jīng)網(wǎng)絡(luò)模型的可行性和有效性。
棱邊自平衡的立方體機(jī)器人機(jī)械結(jié)構(gòu)如圖1所示。外框由2個(gè)0.144×0.144 m2、2個(gè)0.142×0.144 m2和2個(gè)0.144×0.144 m2的環(huán)氧樹脂材料組裝而成;慣性輪獨(dú)立安裝在立方體的一面上,內(nèi)部集成了姿態(tài)傳感器模塊、主控模塊、電源模塊和電機(jī)驅(qū)動(dòng)模塊;電機(jī)自帶AB相編碼器,可以有效避免安裝外部編碼器造成不對(duì)稱問題。
1.自平衡立方體框架 2.主控板 3.永磁直流電機(jī)4.12 V鋰電池 5.電機(jī)固定件 6.法蘭聯(lián)軸器 7.慣性輪
立方體機(jī)器人的主要參數(shù)以及數(shù)據(jù)如表1所示。
表1 立方體機(jī)器人的主要參數(shù)表
立方體機(jī)器人系統(tǒng)為可等效為一個(gè)典型的多變量、高階、非線性、不穩(wěn)定的多自由度空間動(dòng)量輪倒立擺系統(tǒng)。建立如圖2所示系統(tǒng)坐標(biāo)系。
圖2 自平衡立方體機(jī)器人坐標(biāo)系定義
圖中,機(jī)體坐標(biāo)系為O-XYZ,Y軸為立方體機(jī)器人以棱邊為支點(diǎn)的所在邊,坐標(biāo)原點(diǎn)O為動(dòng)量輪所在面與Y軸相交處。立方體機(jī)器人的重心為G,立方體與地面接觸點(diǎn)等效為坐標(biāo)系原點(diǎn)進(jìn)行轉(zhuǎn)動(dòng);慣性輪轉(zhuǎn)過的角度為θ,慣性輪繞重心G;立方體相對(duì)于縱軸的偏轉(zhuǎn)角為α。
為了方便在數(shù)學(xué)上推導(dǎo)和處理問題,作出如下假設(shè):①立方體框架在運(yùn)動(dòng)中是不變形的剛體;②忽略空氣阻力。
立方體機(jī)器人系統(tǒng)的拉格朗日方程為:
(1)
式中,L為拉格朗日算子;q為系統(tǒng)的廣義坐標(biāo);T為系統(tǒng)的總動(dòng)能;V為系統(tǒng)的總勢(shì)能。
由此可得,立方體機(jī)器人的拉格朗日算子為:
(2)
立方體機(jī)器人系統(tǒng)的廣義力矩為:
(3)
式中,U為慣性輪的驅(qū)動(dòng)力矩。將式(2)、式(3)帶入拉格朗日方程中,則有:
(4)
由此可得,立方體機(jī)器人系統(tǒng)的動(dòng)力學(xué)方程為:
(5)
由此可得立方體機(jī)器人在俯仰方向上的動(dòng)力學(xué)模型的狀態(tài)方程為:
(6)
圖3 立方體機(jī)器人的模糊神經(jīng)網(wǎng)絡(luò)
立方體機(jī)器人的模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)描述如下:
(7)
式中,Ai、Bi、Ci為模糊子集;(Pj,Qj)是第j個(gè)立方體子系統(tǒng)相應(yīng)維數(shù)矩陣;xj為系統(tǒng)的第j個(gè)狀態(tài)變量。
(8)
式中,cij和σij分別是高斯隸屬度函數(shù)的中心和寬度;μAi就是Ai的隸屬函數(shù)值,表示α(t)屬于Ai的程度。
第2層計(jì)算每條規(guī)則的隸屬度:
ωj=μAi*μBi*μCi
(9)
第3層輸出為每條模糊規(guī)則推理所占的權(quán)重。其中第j個(gè)節(jié)點(diǎn)計(jì)算第j條規(guī)則的歸一化:
(10)
第4層計(jì)算模糊規(guī)則的輸出結(jié)果,其中每個(gè)節(jié)點(diǎn)都是一個(gè)自適應(yīng)節(jié)點(diǎn)。第j個(gè)節(jié)點(diǎn)具有輸出:
(11)
第5層輸出所有輸入信號(hào)之和,也就是模糊推理的結(jié)果:
M=∑iZjj=1,2,...,27
(12)
對(duì)于所建立的立方體機(jī)器人模糊神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程而言,主要是第二層的各模糊子集的隸屬函數(shù)中心、寬度和后件網(wǎng)絡(luò)連接權(quán)值的更新過程。通常采用誤差反向傳播算法實(shí)現(xiàn)模糊神經(jīng)網(wǎng)絡(luò)的參數(shù)辨識(shí)[12],易導(dǎo)致收斂速度會(huì)減慢以及陷入?yún)?shù)局部?jī)?yōu)化,從而影響了模糊神經(jīng)網(wǎng)絡(luò)的泛化能力。粒子群算法(particle swarm optimization,PS0)是一種通過模擬鳥群捕食行為來進(jìn)行群體迭代的全局隨機(jī)搜索算法,具有收斂速度快、易于實(shí)現(xiàn)、易于理解并且僅有少量參數(shù)需要調(diào)整等優(yōu)點(diǎn)[13]。針對(duì)此種問題,采用粒子群算法優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)中的參數(shù)。
設(shè)機(jī)器人模糊神經(jīng)網(wǎng)絡(luò)的粒子群由N維向量組成,用種群中微粒的坐標(biāo)矢量F表示模糊神經(jīng)網(wǎng)絡(luò)模型的高斯隸屬度的中心cij,寬度σij和后件網(wǎng)絡(luò)的連接權(quán)值。以每個(gè)粒子對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)在訓(xùn)練集上產(chǎn)生的均方差作為粒子的適應(yīng)度的目標(biāo)函數(shù),適應(yīng)度越小,E就越小,網(wǎng)絡(luò)對(duì)數(shù)據(jù)的擬合程度就越高。模糊神經(jīng)網(wǎng)絡(luò)的性能指標(biāo)為:
(13)
粒子群體的最佳位置對(duì)應(yīng)的便是立方體機(jī)器人模糊神經(jīng)網(wǎng)絡(luò)中各規(guī)則層節(jié)點(diǎn)最優(yōu)的隸屬度函數(shù)的中心值,寬度以及后件網(wǎng)絡(luò)的連接權(quán)值。粒子群算法中粒子速度和位置按式(14)進(jìn)行更新:
(14)
基于粒子群的模糊神經(jīng)網(wǎng)絡(luò)的算法步驟如下:
步驟1:首先初始化粒子群的起始參數(shù),粒子維度d等于立方體模糊神經(jīng)網(wǎng)絡(luò)中所有需要訓(xùn)練的參數(shù)數(shù)量,慣性權(quán)重λ,設(shè)其最大值為1,最小值為0,最大速度設(shè)為1,學(xué)習(xí)因子c1c2均設(shè)為2。然后再依據(jù)輸入數(shù)據(jù)集的特征搭建模糊神經(jīng)網(wǎng)絡(luò)模型,初始化模糊神經(jīng)網(wǎng)絡(luò)初始參數(shù),利用模糊聚類方法獲得最優(yōu)的隱層節(jié)點(diǎn)數(shù)目 ,并選擇合適的樣本輸入作為初始的數(shù)據(jù)中心cij,取聚類半徑為初始寬度σij;
步驟2:使學(xué)習(xí)訓(xùn)練樣本經(jīng)過模糊神經(jīng)網(wǎng)絡(luò)計(jì)算每條規(guī)則的適用度和每條模糊規(guī)則推理所占的權(quán)重。再計(jì)算模糊規(guī)則的輸出結(jié)果,其中每個(gè)節(jié)點(diǎn)都是一個(gè)自適應(yīng)節(jié)點(diǎn)。最后輸出所有輸入信號(hào)之和,也就是模糊推理的結(jié)果。以模糊神經(jīng)網(wǎng)絡(luò)模型的均方差表示粒子群算法的適應(yīng)度函數(shù)值,當(dāng)適應(yīng)度函數(shù)值在給定范圍之內(nèi),就停止計(jì)算,此時(shí)模糊神經(jīng)網(wǎng)絡(luò)可得最優(yōu);
步驟3:更新粒子位置和速度。隨機(jī)生成n個(gè)粒子個(gè)體,每個(gè)個(gè)體均由群體的位置矩陣和對(duì)應(yīng)粒子的速度矩陣兩部分組成,假設(shè)pbnd為第n個(gè)個(gè)體的最佳位置,那么初始化時(shí)便將第n個(gè)個(gè)體的當(dāng)前位置定義為該個(gè)體的最佳位置pbnd;
步驟4:確定適應(yīng)度函數(shù),計(jì)算每個(gè)粒子的適應(yīng)度值。選擇均方誤差最小作為粒子群算法的尋優(yōu)目標(biāo),因此將式(14)設(shè)置為粒子群算法的適應(yīng)度函數(shù),并由此計(jì)算出每個(gè)粒子的適應(yīng)度,并對(duì)其進(jìn)行評(píng)價(jià);
步驟5:判讀是否滿足終止條件,如果達(dá)到最大迭代次數(shù)或者適應(yīng)度達(dá)到預(yù)設(shè)精度,則停止尋優(yōu)迭代;否則返回步驟3,直到達(dá)到要求為止;
步驟6:迭代停止后,種群所經(jīng)歷的最佳位置pbnd的值就是全局最優(yōu)解,將其值賦予立方體模糊神經(jīng)網(wǎng)絡(luò)隸屬函數(shù)的中心和寬度以及連接權(quán)值。將更新后的最優(yōu)參數(shù)傳回到步驟2中,得到最優(yōu)的模糊神經(jīng)網(wǎng)絡(luò)模型。
分別采用T-S型模糊神經(jīng)網(wǎng)絡(luò)與基于粒子群優(yōu)化的T-S型模糊神經(jīng)網(wǎng)絡(luò)對(duì)立方體機(jī)器人系統(tǒng)的輸入、輸出數(shù)據(jù)進(jìn)行訓(xùn)練,系統(tǒng)的均方誤差曲線如圖4所示。通過表2可以看出粒子群模糊神經(jīng)網(wǎng)絡(luò)相較于模糊神經(jīng)網(wǎng)絡(luò)均方誤差值小,訓(xùn)練時(shí)間短,迭代次數(shù)少。
圖4 立方體機(jī)器人模糊神經(jīng)網(wǎng)絡(luò)均方誤差仿真圖
表2 模糊神經(jīng)網(wǎng)絡(luò)與粒子群模糊神經(jīng)網(wǎng)絡(luò)對(duì)比
取測(cè)試樣本中的200組數(shù)據(jù)用以測(cè)試粒子群模糊神經(jīng)網(wǎng)絡(luò)模型與立方體機(jī)理模型的預(yù)測(cè)輸出,如圖5~圖7所示,對(duì)比兩條曲線可以得出粒子群模糊神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)輸出相較于機(jī)理模型預(yù)測(cè)輸出的立方體角度值,立方體角速度值和慣性輪的角速度值數(shù)據(jù)輸出誤差小,精度高。圖8~圖10分別為粒子群模糊神經(jīng)網(wǎng)絡(luò)模型與機(jī)理模型的機(jī)體角度、機(jī)體角速度和慣性輪角速度的誤差輸出值,可以明顯看出粒子群模糊神經(jīng)網(wǎng)絡(luò)模型的輸出誤差均小于機(jī)理模型的輸出誤差。
圖5 立方體角度值輸出對(duì)比圖6 立方體角速度值輸出對(duì)比
圖7 慣性輪角速度值輸出對(duì)比圖8 立方體角度輸出誤差值
圖9 立方體角速度輸出誤差值圖10 慣性輪角速度輸出誤差值
對(duì)比結(jié)果如表3所示,立方體機(jī)器人粒子群模糊神經(jīng)網(wǎng)絡(luò)模型的機(jī)體角度輸出誤差、機(jī)體角速度輸出誤差和慣性輪角速度輸出誤差均小于立方體機(jī)理模型的輸出誤差。由此可見,粒子群模糊神經(jīng)網(wǎng)絡(luò)模型所得到的輸出數(shù)據(jù)相較于常規(guī)機(jī)理模型的精度更高。
表3 粒子群模糊神經(jīng)網(wǎng)絡(luò)模型與機(jī)理模型對(duì)比
為了驗(yàn)證所設(shè)計(jì)建模方法的實(shí)用性,將粒子群模糊神經(jīng)網(wǎng)絡(luò)模型和機(jī)理模型應(yīng)用到立方體機(jī)器人實(shí)物中對(duì)比,選用PID控制器進(jìn)行穩(wěn)定性控制,得到如圖11所示的實(shí)物運(yùn)行狀態(tài)。
圖11 實(shí)物運(yùn)行圖
當(dāng)立方體機(jī)器人處于穩(wěn)定狀態(tài),在T=0 s時(shí)采用兩種不同模型的立方體機(jī)器人同時(shí)工作在穩(wěn)定狀態(tài);T=3 s時(shí),給立方體機(jī)器人一個(gè)相同的風(fēng)力干擾;T=4 s時(shí),立方體機(jī)器人同時(shí)進(jìn)行穩(wěn)態(tài)調(diào)整;T=5 s時(shí),粒子群模糊神經(jīng)網(wǎng)絡(luò)模型的立方體機(jī)器人達(dá)到穩(wěn)定狀態(tài);T=7 s時(shí),采用機(jī)理模型的立方體機(jī)器人達(dá)到穩(wěn)定狀態(tài)。由表4可知,在相同大小的擾動(dòng)下,采用粒子群模糊神經(jīng)網(wǎng)絡(luò)模型的立方體機(jī)器人相較于機(jī)理模型的立方體機(jī)器人擺動(dòng)角度更小,回到穩(wěn)定狀態(tài)更快。實(shí)驗(yàn)證明了基于粒子群模糊神經(jīng)網(wǎng)絡(luò)模型的立方體機(jī)器人相較于機(jī)理模型的立方體機(jī)器人抗擾性更好,回到穩(wěn)態(tài)的時(shí)間更短,控制精度更高。
表4 粒子群模糊神經(jīng)網(wǎng)絡(luò)模型與機(jī)理模型實(shí)物運(yùn)行對(duì)比
以立方體棱邊為支點(diǎn)的立方體機(jī)器人,針對(duì)其具有非線性、欠驅(qū)動(dòng)、強(qiáng)耦合、多變量等復(fù)雜特性,設(shè)計(jì)并實(shí)現(xiàn)了一種基于粒子群模糊神經(jīng)網(wǎng)絡(luò)模型的立方體機(jī)器人系統(tǒng)。通過對(duì)立方體機(jī)器人機(jī)體的輸入輸出數(shù)據(jù)進(jìn)行學(xué)習(xí),由此建立立方體機(jī)器人的粒子群模糊神經(jīng)網(wǎng)絡(luò)模型。引入粒子群優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)參數(shù),增強(qiáng)了立方體機(jī)器人模型的泛化能力、提高網(wǎng)絡(luò)的收斂速度并避免出現(xiàn)局部?jī)?yōu)化的問題;使誤差收斂到設(shè)定值的速度更快。最后仿真與實(shí)物實(shí)驗(yàn)結(jié)果表明:針對(duì)立方體機(jī)器人具有非線性、欠驅(qū)動(dòng)、強(qiáng)耦合、多變量等復(fù)雜特性所設(shè)計(jì)的粒子群模糊神經(jīng)網(wǎng)絡(luò)模型,相較于基于機(jī)理模型的立方體機(jī)器人系統(tǒng)具有良好的穩(wěn)定性、抗干擾能力。