周 勇
(荊州學(xué)院 信息工程學(xué)院,湖北 荊州 434020)
倒立擺是一個(gè)高階次、多變量、非線性、自然不穩(wěn)定的快速系統(tǒng),其控制目的是實(shí)現(xiàn)各擺桿之間的穩(wěn)定平衡,它是檢驗(yàn)各種新的控制理論和方法的理想模型。RBF(徑向基函數(shù))神經(jīng)網(wǎng)絡(luò)是具有單隱層的一種三層前向神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單、學(xué)習(xí)速度快、逼近能力強(qiáng),在系統(tǒng)辨識(shí)、模式識(shí)別等領(lǐng)域得到了廣泛應(yīng)用。RBF神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)過(guò)程中,其性能主要取決于隱層神經(jīng)元基函數(shù)中心、寬度和隱層節(jié)點(diǎn)到輸出層之間連接權(quán)值的整定,許多學(xué)者對(duì)其優(yōu)化整定方法進(jìn)行了研究,如Bishop[1]提出的期望最大法、Chen等[2]提出的正交最小二乘法、基于敏感度分析和混合優(yōu)化策略的RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法、粒子群算法[3]、蟻群算法和遺傳算法等優(yōu)化算法。其中遺傳算法是一種高度并行的隨機(jī)優(yōu)化方法,具有很好的全局搜索能力和魯棒性,非常適用于RBF神經(jīng)網(wǎng)絡(luò)參數(shù)的優(yōu)化,也能較好地應(yīng)用于RBF參數(shù)優(yōu)化中[4]。但是,傳統(tǒng)遺傳算法在RBF神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化時(shí),由于其隨機(jī)搜索的特點(diǎn),常容易產(chǎn)生早熟(局部收斂),存在進(jìn)化速度慢和局部收斂等問題。本文設(shè)計(jì)了一種基于改進(jìn)遺傳算法的RBF神經(jīng)網(wǎng)絡(luò)控制器,并結(jié)合單級(jí)倒立擺系統(tǒng)進(jìn)行仿真實(shí)驗(yàn),以驗(yàn)證其有效性。
單級(jí)(一級(jí))倒立擺系統(tǒng)在忽略空氣阻力和各種摩擦之后,可將其抽象成由一個(gè)小車和勻質(zhì)桿組成,其系統(tǒng)結(jié)構(gòu)如圖1所示,參數(shù)如表1所示。
圖1 單級(jí)倒立擺系統(tǒng)
表1 單級(jí)倒立擺參數(shù)
倒立擺系統(tǒng)建模主要有拉格朗日和牛頓-歐拉兩種方法。由于單級(jí)倒立擺系統(tǒng)模型比較簡(jiǎn)單,故本文采用牛頓-歐拉方法建模。
對(duì)小車水平方向所受的合力以及擺桿水平方向的受力進(jìn)行分析,系統(tǒng)線性化后的動(dòng)力學(xué)方程組為:
(1)
其中:x為小車相對(duì)初始位置的位移;θ為擺桿與垂直方向的夾角;u為系統(tǒng)輸入。
(2)
其中:F(t)為輸入外力;Y為系統(tǒng)輸出;A為系統(tǒng)的狀態(tài)矩陣;B為系統(tǒng)的控制矩陣;C為系統(tǒng)的輸出矩陣。
取平衡位置,進(jìn)行泰勒級(jí)數(shù)展開,線性化處理后得到的系統(tǒng)狀態(tài)方程為:
(3)
(4)
RBF神經(jīng)網(wǎng)絡(luò)一般由三層構(gòu)成,即輸入層、隱含層和輸出層,如圖2所示。RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)包括兩部分:一是高斯函數(shù)中心和寬度的確定;另一個(gè)是輸出層權(quán)值的確定。給定網(wǎng)絡(luò)輸入X=(x1,x2,…,xn)T為n維向量,RBF神經(jīng)網(wǎng)絡(luò)的輸入層到隱含層實(shí)現(xiàn)x→h(x)的非線性映射,即隱含層的變換函數(shù)h(x)為一個(gè)徑向基函數(shù),其徑向基函數(shù)最常采用高斯函數(shù),則RBF神經(jīng)網(wǎng)絡(luò)隱含層第j個(gè)節(jié)點(diǎn)的輸出為:
(5)
其中:cj和bj分別為第j個(gè)隱含層節(jié)點(diǎn)的高斯函數(shù)中心和基寬參數(shù),bj為大于零的數(shù),它決定了該基函數(shù)曲線圍繞中心點(diǎn)的寬度;q為隱含層節(jié)點(diǎn)的個(gè)數(shù)。
圖2 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
假設(shè)wj為第j個(gè)隱含層節(jié)點(diǎn)到輸出層的加權(quán)系數(shù)(權(quán)值),則RBF神經(jīng)網(wǎng)絡(luò)的隱含層到輸出層實(shí)現(xiàn)h(x)→yk的線性映射,即:
(6)
其中:p為輸出層的節(jié)點(diǎn)數(shù);yk為第k個(gè)節(jié)點(diǎn)的輸出。
RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程是將采集到的數(shù)據(jù)樣本對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,不斷調(diào)整基函數(shù)中心c、寬度b和權(quán)值w使網(wǎng)絡(luò)總均方誤差為最小,即對(duì)于N個(gè)訓(xùn)練樣本,RBF神經(jīng)網(wǎng)絡(luò)的希望輸出為d,則總均方誤差函數(shù)為:
(7)
其中:dlk為第k個(gè)輸出節(jié)點(diǎn)在第l個(gè)樣本的希望輸出;ylk為第k個(gè)輸出節(jié)點(diǎn)在第l個(gè)樣本的實(shí)際輸出。
遺傳算法(Genetic Algorithm,GA)是美國(guó)Holland教授于1975年首先提出來(lái)的一種借鑒生物進(jìn)化理論和門德爾基因遺傳理論的高度并行、隨機(jī)的優(yōu)化方法[5]。遺傳算法雖然應(yīng)用廣泛,但在解決復(fù)雜問題時(shí)由于其自身的隨機(jī)搜索特點(diǎn)也帶來(lái)了收斂速度慢和算法局部收斂(早熟)等問題[6]。結(jié)合文獻(xiàn)[7]和文獻(xiàn)[8],本文引入一種改進(jìn)的遺傳算法,使算法的適應(yīng)度值、交叉率Pc和變異率Pm分別按平均適應(yīng)度、Sigmoid函數(shù)和進(jìn)化代數(shù)變化,增加算法種群的多樣性,提高算法的全局搜索能力和收斂速度。
改進(jìn)遺傳算法實(shí)現(xiàn)步驟如下:
(1) 參數(shù)編碼及初始化群體生成。由式(5)和式(6)可知,優(yōu)化參數(shù)分別為c、b和w。根據(jù)工程實(shí)際,優(yōu)化參數(shù)的初始范圍均設(shè)為[-2,2],采用實(shí)數(shù)編碼,進(jìn)化代數(shù)為G,種群規(guī)模為n,并根據(jù)種群規(guī)模隨機(jī)產(chǎn)生初始種群。
(2) 解碼,計(jì)算種群個(gè)體適應(yīng)度,確定適應(yīng)度函數(shù)F,評(píng)價(jià)是否滿足收斂條件。個(gè)體適應(yīng)度反映了個(gè)體在不同環(huán)境下的生存能力,為防止種群中個(gè)體適應(yīng)度過(guò)于偏大或偏小導(dǎo)致算法陷入局部收斂,改進(jìn)遺傳算法采用自適應(yīng)個(gè)體適應(yīng)度值改善算法性能。改進(jìn)的個(gè)體適應(yīng)度值調(diào)節(jié)公式為:
(8)
改進(jìn)遺傳算法的適應(yīng)度函數(shù)為f=1/J,J為均方誤差函數(shù)E,即f=1/E。
(3) 如果滿足要求(精度10-5或進(jìn)化代數(shù)T),輸出結(jié)果;否則繼續(xù)步驟(4)。
(4) 設(shè)計(jì)遺傳算子。本設(shè)計(jì)采用輪盤賭選擇、算術(shù)交叉和均勻變異的遺傳算子。遺傳算法中,交叉和變異算子是算法進(jìn)化的核心,其交叉率和變異率是算法收斂和穩(wěn)定的關(guān)鍵參數(shù)。為了防止遺傳算法的早熟和收斂較差的問題出現(xiàn),采用改進(jìn)的自適應(yīng)交叉概率和變異概率,將S曲線變化模式和進(jìn)化代數(shù)用于交叉概率和變異概率,使個(gè)體的變異和交叉分別受進(jìn)化代數(shù)和適應(yīng)度的約束。改進(jìn)的交叉率和變異率自適應(yīng)調(diào)節(jié)公式為:
(9)
(10)
其中:fmax為種群中最大的個(gè)體適應(yīng)度值;f′為要交叉的兩個(gè)個(gè)體中較大的適應(yīng)度值;k1為曲線平滑參數(shù),用來(lái)調(diào)節(jié)曲線的光滑程度;Pc max、Pc min分別為交叉率的最大和最小值;Gmax為最大進(jìn)化代數(shù);Pm1、Pm2和Pm3均為正實(shí)數(shù)。
(5) 根據(jù)favg、個(gè)體適應(yīng)度和進(jìn)化代數(shù),結(jié)合自適應(yīng)調(diào)節(jié)公式進(jìn)行交叉和變異操作。
(6) 返回步驟(2),如達(dá)到指定要求,算法結(jié)束;否則繼續(xù)執(zhí)行操作。
為研究單級(jí)倒立擺改進(jìn)遺傳算法RBF神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)性能,本文分別用線性二次型控制器(LQR)和改進(jìn)遺傳RBF神經(jīng)網(wǎng)絡(luò)對(duì)單級(jí)倒立擺系統(tǒng)進(jìn)行仿真分析。
搭建Simulink模塊,結(jié)合神經(jīng)網(wǎng)絡(luò)工具箱,將改進(jìn)遺傳算法得到的RBF神經(jīng)網(wǎng)絡(luò)基函數(shù)中心、寬度和權(quán)值加入到RBF神經(jīng)網(wǎng)絡(luò)模塊中,與單級(jí)倒立擺系統(tǒng)相結(jié)合進(jìn)行仿真,繪制曲線,并與LQR控制器設(shè)計(jì)的參數(shù)矩陣進(jìn)行對(duì)比,其階躍響應(yīng)曲線如圖3和圖4所示。從仿真結(jié)果可知:LQR方法在前2.7 s內(nèi),倒立擺擺桿在初始位置0 rad發(fā)生較大幅度的振蕩,2.7 s后達(dá)到穩(wěn)定;改進(jìn)遺傳算法優(yōu)化后的RBF神經(jīng)網(wǎng)絡(luò)控制,擺桿的穩(wěn)定時(shí)間為2.5 s,但超調(diào)更小,其超調(diào)和穩(wěn)態(tài)誤差都小于LQR方法,穩(wěn)定性能得到了較大的提高。
圖3 兩種控制方法的小車位置響應(yīng)曲線
圖4 兩種控制方法的擺桿角度響應(yīng)曲線
本文依據(jù)單級(jí)倒立擺的數(shù)學(xué)模型和RBF神經(jīng)網(wǎng)絡(luò)理論,在對(duì)一般RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行分析的基礎(chǔ)上設(shè)計(jì)了基于改進(jìn)遺傳算法的RBF神經(jīng)網(wǎng)絡(luò)控制器,利用改進(jìn)遺傳算法實(shí)現(xiàn)高斯函數(shù)的中心、基寬參數(shù)和連接權(quán)值的優(yōu)化選擇。通過(guò)仿真分析,基于單級(jí)倒立擺的改進(jìn)遺傳RBF神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)能更有效地減小系統(tǒng)超調(diào)和穩(wěn)定時(shí)間,較好地提高了單級(jí)倒立擺性能。