徐 鵬,向鳳紅,李江峰
(昆明理工大學(xué) 信息工程與自動化學(xué)院,云南 昆明 650500)
板球系統(tǒng)由于其自身的強(qiáng)耦合性、參數(shù)不確定性以及多變量等特性,常被用于檢驗各種控制算法的實驗平臺.針對板球系統(tǒng)存在的問題,國內(nèi)外學(xué)者進(jìn)行了大量的研究.Sergio 等[1]通過建立板球系統(tǒng)完整的非線性模型,提出一種帶非線性補償?shù)臐u進(jìn)穩(wěn)定雙比例微分(Proportional Derivative,PD)控制策略,實驗結(jié)果表明,所設(shè)計的控制器具有良好的性能.Kan 等[2]利用最小相位輸出對非簡化非線性模型設(shè)計跟蹤控制器,仿真實驗表明其跟蹤誤差指數(shù)收斂到零,驗證了所設(shè)計控制器的有效性.由于板球系統(tǒng)存在摩擦力,難以實現(xiàn)高精度控制,王永坤等[3]提出一種基于降階觀測器的線性控制器,實現(xiàn)了在既不需要精確的摩擦模型,也不需要估計具體特征參數(shù)的環(huán)境下對板球系統(tǒng)軌跡跟蹤控制,且具有良好的動態(tài)品質(zhì).為了實現(xiàn)板球系統(tǒng)高精度軌跡跟蹤,韓光信等[4]通過目標(biāo)狀態(tài)建立偏差系統(tǒng),并結(jié)合預(yù)測控制中的滾動優(yōu)化思想設(shè)計了滾動線性二次型控制器,所設(shè)計的控制器同樣具有良好的軌跡跟蹤性能和魯棒性能.此外,Backstepping 控制[5]、滑模變結(jié)構(gòu)控制[6]、切換控制[7]與自適應(yīng)控制策略[8]等方法在板球系統(tǒng)也得到了廣泛應(yīng)用,相比傳統(tǒng)比例積分微分(Proportional Integral Derivative,PID)控制,無論是動態(tài)性能還是穩(wěn)態(tài)性能都有顯著提升.
反步法(Backstepping)設(shè)計的基本原理是將復(fù)雜的非線性系統(tǒng)拆解為不超過系統(tǒng)階數(shù)的子系統(tǒng),并為每個子系統(tǒng)分別設(shè)計Lyapunov 函數(shù)與虛擬控制量,從后往前進(jìn)行反向推導(dǎo),直至完成系統(tǒng)的控制器設(shè)計.但傳統(tǒng)的反步法控制無法保證系統(tǒng)魯棒性,且容易出現(xiàn)微分爆炸現(xiàn)象.文獻(xiàn)[9]采用級聯(lián)嚴(yán)格反饋形式,分別用線性擴(kuò)展?fàn)顟B(tài)觀測器和跟蹤微分器估計模型的不確定性和虛擬控制的導(dǎo)數(shù),避免了微分爆炸現(xiàn)象的發(fā)生,設(shè)計了觀測器集成反步法控制,提升了系統(tǒng)的跟蹤性能,但穩(wěn)態(tài)性能有所欠缺.文獻(xiàn)[10]為了削弱對數(shù)學(xué)模型的依賴,同時防止微分爆炸現(xiàn)象的發(fā)生,引入動態(tài)面策略,提出了一種反演自適應(yīng)動態(tài)換??刂品椒?,提升了系統(tǒng)動態(tài)跟蹤性能,但其響應(yīng)速度較慢.文獻(xiàn)[11]將Backstepping 方法與H∞控制理論相結(jié)合,提出一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)H∞控制策略,改善了系統(tǒng)抗干擾能力,但其軌跡跟蹤精度仍然較低.文獻(xiàn)[12]為了改善系統(tǒng)抗干擾能力,采用全程快速微分器對帶有噪聲干擾的輸入信號進(jìn)行濾波處理,并基于反步法設(shè)計了非線性反饋控制器,有效提高了軌跡跟蹤精度,但其響應(yīng)速度較慢.
滑模變結(jié)構(gòu)控制本質(zhì)上是使系統(tǒng)按照預(yù)定“滑動模態(tài)”的狀態(tài)軌跡運動的一類特殊非線性控制,最大的優(yōu)點是對系統(tǒng)干擾與參數(shù)攝動具有完全自適應(yīng),但最突出的問題就是抖振.文獻(xiàn)[13]為了提高系統(tǒng)動態(tài)響應(yīng)與穩(wěn)態(tài)跟蹤精度,提出了變指數(shù)冪趨近律,并且將積分終端滑模面與互補終端滑模面相結(jié)合的策略,設(shè)計了一種基于滑??刂频姆蔷€性算法,通過實驗驗證了該策略的有效性,但抖振抑制效果不顯著.文獻(xiàn)[14]提出了一種級聯(lián)分?jǐn)?shù)階滑??刂破鳎纳屏税迩蛳到y(tǒng)的響應(yīng)速度,抑制了系統(tǒng)抖振,但跟蹤精度有所欠缺.文獻(xiàn)[15]將監(jiān)督模糊控制與滑??刂葡嘟Y(jié)合的控制方法,提高了小球軌跡跟蹤的精度,但抗干擾性較弱.李江峰等[16-17]先后提出了一種基于新型冪趨近律的滑動區(qū)域法滑模控制策略與基于遺傳算法優(yōu)化的組合趨近律滑??刂?,提高了軌跡跟蹤精度,但均未解決慣性所帶來的擾動.
針對上述存在的問題,本文將反步法與滑??刂葡嘟Y(jié)合,提出一種基于新型趨近律的反步滑模最優(yōu)控制策略.在反演過程中,首先,通過軌跡跟蹤誤差構(gòu)造Lyapunov 函數(shù),由此設(shè)計中間虛擬控制量;其次,通過軌跡跟蹤誤差與虛擬控制量設(shè)計動態(tài)滑模面,以增強(qiáng)系統(tǒng)魯棒性;然后,在系統(tǒng)滿足Lyapunov全局穩(wěn)定的前提下,設(shè)計一種新型趨近律,以提高系統(tǒng)收斂速度,同時保證系統(tǒng)抑制抖振的效果,并由此設(shè)計系統(tǒng)控制器;最后,引入粒子群算法尋找一組新型趨近律的最優(yōu)參數(shù),為防止算法陷入局部最優(yōu)解.本文將迭代次數(shù)分成前期中期與后期,分別賦予不同的速度慣性權(quán)重、自我學(xué)習(xí)因子與群體學(xué)習(xí)因子,以提高尋優(yōu)收斂精度與效率.通過仿真實驗驗證了所設(shè)計控制策略的可行性與有效性.
選取固高GBP2001 為本文研究實驗平臺,如圖1 所示.板球系統(tǒng)主要由小球、球盤、伺服電機(jī)、控制器、攝像頭、連桿機(jī)械系統(tǒng)與直流電源等構(gòu)成.
圖1 GBP2001 板球系統(tǒng)實物模型Fig.1 The physical model of the GBP2001 ball and plate system
由于板球系統(tǒng)為典型的多輸入多輸出非線性系統(tǒng),很難建立精確的數(shù)學(xué)模型,故本文在不影響系統(tǒng)性能的前提下,作出以下假設(shè):①小球與板面無摩擦力干擾;②小球與板面未發(fā)生脫離;③系統(tǒng)內(nèi)部機(jī)械結(jié)構(gòu)之間無摩擦損耗;④球盤對小球無界限約束.
選取板面中心為小球位置原點(0,0).板面x軸方向?qū)Φ貎A角為α1,y軸方向的傾角為α2,其動力學(xué)分析如圖2、3 所示[18].
圖2 系統(tǒng)x 軸物理模型Fig.2 The physical model of system x-axis
圖3 系統(tǒng)y 軸物理模型Fig.3 The physical model of system y-axis
由拉格朗日方程得到板球系統(tǒng)的微分方程組如式(1)所示,式中各參數(shù)意義如表1 所示[19].
表1 板球系統(tǒng)動力學(xué)方程參數(shù)Tab.1 Parameters of dynamics equation of the ball and plate system
當(dāng)小球在穩(wěn)定工作點附近時,其傾角很小,且兩個伺服電機(jī)也是固定的,故可作以下近似處理[16]:
由式(1)~(4),得到板球系統(tǒng)線性化數(shù)學(xué)模型:
由式(5)知,系統(tǒng)x軸方向與y軸方向?qū)ΨQ,故本文只分析x軸方向子系統(tǒng),y軸方向子系統(tǒng)原理相同,不再贅述.
選取平板對地傾角α1作為子系統(tǒng)輸入量ux,小球x軸方向所在位置與速度作為系統(tǒng)狀態(tài)x1與x2,得到x軸子系統(tǒng)的狀態(tài)空間方程:
為檢驗系統(tǒng)的魯棒性,引入干擾項d(t),|d(t)|≤D,D為常數(shù).令 g(x)=-γg,整理式(6)得:
反步法其本質(zhì)是將復(fù)雜的非線性系統(tǒng)拆解為不超過系統(tǒng)階數(shù)的子系統(tǒng),并為每個子系統(tǒng)分別設(shè)計Lyapunov 函數(shù)與虛擬控制量,從后往前進(jìn)行反向推導(dǎo),直至完成系統(tǒng)的控制器設(shè)計.但傳統(tǒng)的反步法控制無法保證系統(tǒng)魯棒性,且容易出現(xiàn)微分爆炸現(xiàn)象,為解決這一問題,本文通過引入滑模項,克服系統(tǒng)干擾,增強(qiáng)系統(tǒng)魯棒性,同時規(guī)避微分爆炸現(xiàn)象的發(fā)生.但滑模項的引入,會給系統(tǒng)帶來高頻抖振的弊端.為達(dá)到加快系統(tǒng)響應(yīng)速度、控制精度高、魯棒性強(qiáng)且能抑制系統(tǒng)抖振的目的,本文設(shè)計了基于新型趨近律的反步滑??刂破?
2.1 引入滑模項設(shè)x1為小球在x軸方向的實時位置,xd為小球在x軸方向的期望軌跡位置,定義小球x軸位置跟蹤誤差為:
選取Lyapunov 函數(shù)為:
顯然V1是連續(xù)正定函數(shù).
對式(10)進(jìn)行求導(dǎo)得:
為減小預(yù)定軌跡速度對系統(tǒng)影響,設(shè)計中間虛擬控制量為:
式中:c1>0.
將式(12)代入式(11)得:
為避免微分爆炸現(xiàn)象的發(fā)生,故引入動態(tài)滑模面S=0.設(shè)計切換函數(shù)為:
式中:k>0.
由于
故由式(14)與式(15)可得:
假設(shè) 1系統(tǒng)狀態(tài)進(jìn)入滑模面,即s=0時,由于k+c1>0,由 式(13)、(15)與(16)可 知,e1=0,e2=0,且1≤0,即保證了系統(tǒng)漸進(jìn)穩(wěn)定.為此需要進(jìn)行下一步設(shè)計以保證系統(tǒng)能到達(dá)滑模面.
選取Lyapunov 函數(shù)為:
顯然V2是連續(xù)正定函數(shù).
對式(17)求導(dǎo)得:
將式(8)代入式(18)得:
2.2 新型趨近律與控制器設(shè)計引入滑動模態(tài),可以使系統(tǒng)對系統(tǒng)部分結(jié)構(gòu)不確定性、參數(shù)變化以及外界干擾等因素具有不敏感性和魯棒性,而且還可獲得良好的動態(tài)性能[20],但由于其自身存在不連續(xù)開關(guān)的特性,使得滑模變結(jié)構(gòu)控制的抖振不能完全被消除.如若抖振問題不能很好地解決,可能會激發(fā)起系統(tǒng)的未建模高頻特性,引起系統(tǒng)性能變差,嚴(yán)重影響控制器的性能.
為解決抖振問題,國內(nèi)外學(xué)者設(shè)計了很多趨近律方法,但由于滑??刂频目箶_動與抗攝動機(jī)理,抖振是不可能完全被消除,只能根據(jù)需求削弱它.常用的傳統(tǒng)趨近律有等速趨近律、指數(shù)趨近律與冪次趨近律.基于等速趨近律的控制策略很難達(dá)到收斂速度與消除抖振最佳狀態(tài),收斂速度較快,會在切換面附近引起較大抖振,為抑制抖振,必須以犧牲響應(yīng)速度為代價;基于指數(shù)趨近律的控制策略雖然能在提高系統(tǒng)響應(yīng)速度的同時抑制系統(tǒng)抖振,但是其抖振抑制能力有限;基于冪次趨近律的控制策略有較好的抖振抑制效果,能實現(xiàn)平滑進(jìn)入滑模面,但是收斂速度有所欠缺.這幾種趨近律均不能實現(xiàn)保證趨近速度的同時很好地抑制抖振的目的,為此,本文設(shè)計了一個分段變速趨近律.
設(shè)計趨近律為:
式中:k1>0,1 >α >0,1 >β >0,k為滑模面系數(shù),f(x)為分段函數(shù):
式中:Δ為滑模面邊層厚度.
由式(20)和式(21)可知,本文設(shè)計的趨近律可保證系統(tǒng)狀態(tài)在遠(yuǎn)離滑模面邊層帶時,可以迅速趨近,且趨近速度隨著遠(yuǎn)離滑模面邊層帶的程度而呈現(xiàn)正相關(guān).當(dāng)系統(tǒng)狀態(tài)進(jìn)入邊層帶,即|s|<Δ時,由f(x)與 -k1|s|αsgn(s)可保證 系統(tǒng)能平滑且快 速地趨近滑模面.為增強(qiáng)所設(shè)計趨近律的通用性,在趨近律中增設(shè)1 /2k穩(wěn)定項,以適用不同滑模面的設(shè)計.指數(shù)趨近律、冪次趨近律與本文設(shè)計新型趨近律的相軌跡如圖4~6 所示.由圖4~6 可知,相較于指數(shù)趨近律與冪次趨近律,本文所設(shè)計新型趨近律能使系統(tǒng)快速進(jìn)入所設(shè)滑模面邊層內(nèi),使其收斂速度加快,且系統(tǒng)進(jìn)入邊層與切換面交點后,系統(tǒng)抖振明顯減弱,最終能平滑進(jìn)入滑模面.故本文所設(shè)計趨近律不僅能提高趨近速度,還能有效抑制系統(tǒng)抖振,且通用性較強(qiáng).
圖4 指數(shù)趨近律相軌跡Fig.4 Phase trajectory of exponential reaching law
圖5 冪次趨近律相軌跡Fig.5 Phase trajectory of power reaching law
由式(19)與式(20)可知,系統(tǒng)控制器為:
2.3 穩(wěn)定性分析將式(20)代入式(19)得:
粒子群算法(Particle Swarm Optimization,PSO)是James Kennedy 等于1995 年提出的一種基于智能的優(yōu)化算法[21].因其原理簡單、易編碼實現(xiàn),其提出后便廣泛應(yīng)用于各領(lǐng)域.但PSO 算法同許多智能優(yōu)化算法一樣,存在容易陷入局部最優(yōu)解的情況,為改善這一問題,本文對粒子群算法進(jìn)行改進(jìn),提出了分段式尋優(yōu)的PSO 策略.
3.1 優(yōu)化目標(biāo)為使系統(tǒng)能耗低和跟蹤精度高,本文以上述系統(tǒng)為對象,為新型趨近律尋找一組最優(yōu)參數(shù)以軌跡跟蹤誤差e1與系統(tǒng)控制器輸出ux作為指標(biāo),建立目標(biāo)函數(shù)如下:
3.2 PSO 算法改進(jìn)由于PSO 算法與許多智能優(yōu)化算法一樣,存在容易陷入局部最優(yōu)的缺陷,故本文提出了分段式權(quán)重分配方案.為增強(qiáng)本方案的通用性以及提高優(yōu)化速度的同時規(guī)避陷入局部最優(yōu)解,將粒子群全程迭代次數(shù)N分為3 個階段.每個階段賦予不同的權(quán)重,使其各個階段達(dá)到相應(yīng)目的,以保證最快搜尋速度找出全局最優(yōu)解.
在前N/3次迭代內(nèi),賦予較大速度慣性權(quán)重與自我學(xué)習(xí)能力,降低群體學(xué)習(xí)能力,以達(dá)到較快速度搜尋出個體粒子的最佳位置的目的.權(quán)重賦值如下所示:
式中:w是速度慣性權(quán)重,c1是自我學(xué)習(xí)因子,c2是群體學(xué)習(xí)因子,wmax是所設(shè)置最大速度慣性權(quán)重,c1max是所設(shè)置最大自我學(xué)習(xí)因子,c2min是所設(shè)置最小群體學(xué)習(xí)因子.
為充分進(jìn)行全局搜索,在中間N/3次迭代內(nèi),加入隨機(jī)策略,對速度慣性權(quán)重、自我學(xué)習(xí)因子和群體學(xué)習(xí)因子進(jìn)行隨機(jī)取值,使得粒子歷史速度對當(dāng)前粒子速度無影響,且能保證盡可能地進(jìn)行全局搜索,很好地規(guī)避陷入局部最優(yōu)解.并且由于隨機(jī)策略的引入,使得N的選擇更為靈活,增強(qiáng)了算法的容錯率.隨機(jī)取值如下所示:
式(28)~(30)中,N(0,1)為標(biāo)準(zhǔn)正態(tài)分布,rand(0,1)為0 到1 之間的隨機(jī)數(shù),w是速度慣性權(quán)重,c1是自我學(xué)習(xí)因子,c2是群體學(xué)習(xí)因子.
本文在后N/3次迭代內(nèi),增大群體學(xué)習(xí)因子,降低速度慣性權(quán)重與自我學(xué)習(xí)因子,以實現(xiàn)粒子群體最終能快速收斂于群體最佳位置的目的,快速地求解出最優(yōu)解.權(quán)重賦值如下所示:
式中:w是速度慣性權(quán)重,c1是自我學(xué)習(xí)因子,c2是群體學(xué)習(xí)因子,wmin是所設(shè)置最小速度慣性權(quán)重,c1min是所設(shè)置最小自我學(xué)習(xí)因子,c2max是所設(shè)置最大群體學(xué)習(xí)因子.
本文在Matlab 2018b 中進(jìn)行仿真實驗.設(shè)定板球系統(tǒng)預(yù)定軌跡為:
設(shè)定小球初始位置為(2,-1).防止中間虛擬控制量過大且要達(dá)到減小預(yù)定軌跡速度對系統(tǒng)影響的目的,因此本文選取c1=0.5. 由圖6 可知,Δ過大會減弱系統(tǒng)前期收斂速度,由式(21)知 Δ <1會影響進(jìn)入邊層與切換面交點后對系統(tǒng)抖振抑制的效果,故選取 Δ=1.考慮到粒子種群數(shù)目越多越易發(fā)現(xiàn)全局最優(yōu)解,但搜尋時間也會隨之變長,故綜合考慮選擇粒子群初始種群為100.根據(jù)實驗統(tǒng)計,當(dāng)?shù)螖?shù)選取為250 次及以下時,所得解不穩(wěn)定,為求解穩(wěn)定以及減少求解時間,因此在此基礎(chǔ)之上加20 次迭代余量,故選取迭代次數(shù)為270 次.經(jīng)過改進(jìn)PSO 算法對新型趨近律參數(shù)尋優(yōu)后選取k=1,k1=1.506 2,α=0.022 6,β=0.860 5,PSO 迭代曲線圖如圖7 所示,系統(tǒng)運行時間為4 s.本文進(jìn)行了與Backstepping 控制策略和基于冪次趨近律的滑模控制方案的對比仿真實驗.仿真結(jié)果如圖8~12 所示.
圖6 本文設(shè)計趨近律相軌跡Fig.6 Phase trajectory of reaching law designed by this paper
圖7 PSO 迭代曲線Fig.7 PSO iteration curve
圖8 軌跡跟蹤對比Fig.8 Comparison of trajectory tracking
由圖8~10 可知,本文提出控制策略的響應(yīng)速度與控制精度均優(yōu)于Backstepping 控制方法和冪次趨近律滑??刂品桨?Backstepping 控制方法雖然響應(yīng)速度比冪次趨近律滑??刂品桨缚?,但由圖8知,Backstepping 控制方法在抗擾動方面能力較弱,魯棒性較差.而本文提出控制策略與冪次趨近律滑??刂品桨妇泻芎玫聂敯粜裕矣蓤D9 可知,本文提出控制策略在x方向上第一次進(jìn)入并保持在穩(wěn)態(tài)值5%內(nèi)的調(diào)節(jié)時間為0.2 s,由于x軸和y軸是對稱的,故系統(tǒng)調(diào)節(jié)時間為0.2 s,系統(tǒng)響應(yīng)速度得到了很好地提高.由圖11~12 可知,本文提出控制策略能較好地抑制系統(tǒng)抖振.
圖9 x 軸軌跡跟蹤對比Fig.9 Comparison of x-axis trajectory tracking
圖10 y 軸軌跡跟蹤對比Fig.10 Comparison of y-axis trajectory tracking
圖11 x 軸冪次趨近律控制器輸出Fig.11 The output of the power reaching law controller in the x-axis direction
通過3 種控制策略的仿真實驗對比,可以看出本文提出控制策略無論是動態(tài)性能還是穩(wěn)態(tài)性能均較優(yōu)于其它兩者,且能較好地抑制系統(tǒng)高頻抖振,驗證了所提控制方案的有效性.
為了改善板球系統(tǒng)控制精度低、魯棒性差以及響應(yīng)慢等問題,本文提出了一種基于新型趨近律的反步滑模最優(yōu)控制方案.將反步法與滑??刂葡嘟Y(jié)合進(jìn)行了分析,本文設(shè)計切換函數(shù)與新型趨近律并進(jìn)行穩(wěn)定性證明,最后引入PSO 算法,并改進(jìn)PSO 算法進(jìn)行參數(shù)尋優(yōu).仿真實驗結(jié)果表明,提出的控制策略不僅改善了系統(tǒng)控制精度、魯棒性與響應(yīng)速度,而且控制器抖振問題得到了明顯改善,具有良好的動態(tài)性能與穩(wěn)態(tài)精度.下一步可以針對小球脫離板面的突變問題展開研究.