趙新宇,汪文濤,張麗麗,夏宏兵
(蚌埠學(xué)院 電子與電氣工程學(xué)院,安徽蚌埠,233030)
可重構(gòu)機器人由多個標準模塊組合而成,能夠根據(jù)任務(wù)或環(huán)境的變化而增刪模塊以改變自身構(gòu)形來適應(yīng)地形完成傳統(tǒng)機器人無法完成的復(fù)雜任務(wù)。由于其具有構(gòu)形重建,成本低廉,通用性等優(yōu)勢,近年來它在精密制造、災(zāi)難救援、高溫/壓環(huán)境等場景中發(fā)揮著重大作用[1]。
但長期工作在此類復(fù)雜惡劣的環(huán)境中,系統(tǒng)發(fā)生故障的可能性日益頻繁,尤其是執(zhí)行器故障問題,若不能有效地及時處理,系統(tǒng)整體的性能將會受到嚴重影響,同時也會帶來經(jīng)濟財產(chǎn)損失。近年來專家學(xué)者們提出了很多關(guān)于執(zhí)行器發(fā)生故障的容錯控制方案,以提高系統(tǒng)的可靠性。文獻[2],設(shè)計一種魯棒預(yù)測切換控制方案,解決了工業(yè)過程中經(jīng)常發(fā)生的未知擾動、不確定性的執(zhí)行器隨機故障問題。盡管諸如此類的方法使得系統(tǒng)具有良好的控制性能和穩(wěn)定性能,但忽略了容錯控制系統(tǒng)的最優(yōu)性能指標,即有效的簡化控制器的結(jié)構(gòu)設(shè)計和減少控制輸入的代價消耗。針對此類容錯優(yōu)化問題,往往采用自適應(yīng)動態(tài)規(guī)劃(ADP)算法進行求解,以獲取系統(tǒng)的近似最優(yōu)解。
ADP作為一種智能控制算法,被廣泛應(yīng)用于各領(lǐng)域中[3-4],由于其可以有效解決最優(yōu)控制問題且不產(chǎn)生“維數(shù)災(zāi)”現(xiàn)象。但在容錯控制方面,相關(guān)的研究方案較少。文獻[5]利用在線補償技術(shù),結(jié)合名義控制器與反饋控制器提出了一種故障補償控制策略。
值得指出的是,這些方案[5]大多都是利用補償控制技術(shù),而該技術(shù)實際也是被動容錯的一種范疇。自適應(yīng)觀測器是一種有效實現(xiàn)主動容錯的技術(shù)手段,可以在線估計故障信息值,并反饋給控制器進行容錯控制,無需進行故障檢測與隔離環(huán)節(jié),結(jié)構(gòu)設(shè)計簡單,因此該類方法被廣泛應(yīng)用研究[6]。另一方面,現(xiàn)在的大多研究采用的代價函數(shù)都是傳統(tǒng)的二次型函數(shù),而如何設(shè)計將觀測的故障信息考慮到系統(tǒng)的代價函數(shù)中,構(gòu)成一種新型的代價函數(shù),進而迭代求解近似最優(yōu)控制策略將是我們探索和研究的一個方向。
基于此,本文將觀測器技術(shù)與ADP算法相結(jié)合,針對執(zhí)行器發(fā)生突變故障的可重構(gòu)機器人系統(tǒng),為了有效處理故障引起系統(tǒng)的性能衰減,提出一種基于改進代價函數(shù)的容錯優(yōu)化控制方法。采用自適應(yīng)觀測器技術(shù),設(shè)計一種顯含故障值的代價函數(shù)。通過構(gòu)建評價神經(jīng)網(wǎng)絡(luò),利用策略迭代求解HJB方程得到反饋控制律,并結(jié)合標稱控制律,實現(xiàn)系統(tǒng)的安全優(yōu)化控制。該方法通過觀測器在線估計故障信息,無需進行故障檢測與隔離。并通過設(shè)計執(zhí)行器發(fā)生突變故障的形式進行了仿真實驗驗證。
由于HJB方程(8)求解難的特殊性,因此,接下來我們將建立自適應(yīng)觀測器與評價神經(jīng)網(wǎng)絡(luò),進而將容錯控制問題轉(zhuǎn)化為最優(yōu)控制問題處理。
為了驗證提出方法是否有效,采用構(gòu)形A的可重構(gòu)機器人模型(見文獻[5])進行數(shù)值實驗。
仿真結(jié)果如圖1~圖4所示。圖1表示的是設(shè)計的故障觀測器對執(zhí)行器故障的在線估計曲線,虛線和實線分別表示故障實際值和估計值??梢钥闯鲈谙到y(tǒng)運行初期,由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要時間,故兩條曲線存在較大偏差,估計值未能及時跟蹤上實際值。當t=20s和t=45s時系統(tǒng)發(fā)生故障后,由于觀測器的持續(xù)作用,兩條曲線在較短的時間內(nèi)就可以重疊,說明了所設(shè)觀測器可以準確的觀測故障信號,進而減少傳統(tǒng)故障檢測方法的故障診斷時間。圖2、圖3分別反映的是關(guān)節(jié)1、2的跟蹤性能曲線??梢钥闯觯词瓜到y(tǒng)在兩段時間內(nèi)遭遇故障,系統(tǒng)仍可以良好的運行,且保持系統(tǒng)原有的穩(wěn)定性能。說明了該方案具有良好的容錯性,能夠保證系統(tǒng)的安全可靠性。圖4是兩個關(guān)節(jié)的控制力矩。
圖1 故障估計曲線
圖2 關(guān)節(jié)1跟蹤曲線
圖3 關(guān)節(jié)2跟蹤曲線
圖4 控制力矩
本文融合故障觀測器與ADP算法,提出一種容錯優(yōu)化控制方法,有效地解決了系統(tǒng)發(fā)生執(zhí)行器突變故障的控制問題。根據(jù)在線觀測的故障值,改進傳統(tǒng)的二次型代價函數(shù)。構(gòu)建評價神經(jīng)網(wǎng)絡(luò),采用一種新型的自適應(yīng)學(xué)習(xí)律近似代價函數(shù),進而求解得到反饋控制律,結(jié)合標稱控制律,實現(xiàn)系統(tǒng)容錯控制。該方法利用觀測器技術(shù),規(guī)避了傳統(tǒng)檢測方法的故障檢測與隔離過程,大大減少了容錯時間。仿真實驗表明,該容錯方案可以很好地追蹤上系統(tǒng)的期望軌跡即使系統(tǒng)發(fā)生故障,具有良好的容錯性能,能夠保證系統(tǒng)的安全可靠性。