基于改進代價函數(shù)的可重構(gòu)機器人容錯優(yōu)化控制

2022-11-11 09:35:48趙新宇汪文濤張麗麗夏宏兵

電子測試 2022年19期

趙新宇，汪文濤，張麗麗，夏宏兵

（蚌埠學(xué)院電子與電氣工程學(xué)院，安徽蚌埠，233030）

0 引言

可重構(gòu)機器人由多個標準模塊組合而成，能夠根據(jù)任務(wù)或環(huán)境的變化而增刪模塊以改變自身構(gòu)形來適應(yīng)地形完成傳統(tǒng)機器人無法完成的復(fù)雜任務(wù)。由于其具有構(gòu)形重建，成本低廉，通用性等優(yōu)勢，近年來它在精密制造、災(zāi)難救援、高溫/壓環(huán)境等場景中發(fā)揮著重大作用[1]。

但長期工作在此類復(fù)雜惡劣的環(huán)境中，系統(tǒng)發(fā)生故障的可能性日益頻繁，尤其是執(zhí)行器故障問題，若不能有效地及時處理，系統(tǒng)整體的性能將會受到嚴重影響，同時也會帶來經(jīng)濟財產(chǎn)損失。近年來專家學(xué)者們提出了很多關(guān)于執(zhí)行器發(fā)生故障的容錯控制方案，以提高系統(tǒng)的可靠性。文獻[2]，設(shè)計一種魯棒預(yù)測切換控制方案，解決了工業(yè)過程中經(jīng)常發(fā)生的未知擾動、不確定性的執(zhí)行器隨機故障問題。盡管諸如此類的方法使得系統(tǒng)具有良好的控制性能和穩(wěn)定性能，但忽略了容錯控制系統(tǒng)的最優(yōu)性能指標，即有效的簡化控制器的結(jié)構(gòu)設(shè)計和減少控制輸入的代價消耗。針對此類容錯優(yōu)化問題，往往采用自適應(yīng)動態(tài)規(guī)劃(ADP)算法進行求解，以獲取系統(tǒng)的近似最優(yōu)解。

ADP作為一種智能控制算法，被廣泛應(yīng)用于各領(lǐng)域中[3-4]，由于其可以有效解決最優(yōu)控制問題且不產(chǎn)生“維數(shù)災(zāi)”現(xiàn)象。但在容錯控制方面，相關(guān)的研究方案較少。文獻[5]利用在線補償技術(shù)，結(jié)合名義控制器與反饋控制器提出了一種故障補償控制策略。

值得指出的是，這些方案[5]大多都是利用補償控制技術(shù)，而該技術(shù)實際也是被動容錯的一種范疇。自適應(yīng)觀測器是一種有效實現(xiàn)主動容錯的技術(shù)手段，可以在線估計故障信息值，并反饋給控制器進行容錯控制，無需進行故障檢測與隔離環(huán)節(jié)，結(jié)構(gòu)設(shè)計簡單，因此該類方法被廣泛應(yīng)用研究[6]。另一方面，現(xiàn)在的大多研究采用的代價函數(shù)都是傳統(tǒng)的二次型函數(shù)，而如何設(shè)計將觀測的故障信息考慮到系統(tǒng)的代價函數(shù)中，構(gòu)成一種新型的代價函數(shù)，進而迭代求解近似最優(yōu)控制策略將是我們探索和研究的一個方向。

基于此，本文將觀測器技術(shù)與ADP算法相結(jié)合，針對執(zhí)行器發(fā)生突變故障的可重構(gòu)機器人系統(tǒng)，為了有效處理故障引起系統(tǒng)的性能衰減，提出一種基于改進代價函數(shù)的容錯優(yōu)化控制方法。采用自適應(yīng)觀測器技術(shù)，設(shè)計一種顯含故障值的代價函數(shù)。通過構(gòu)建評價神經(jīng)網(wǎng)絡(luò)，利用策略迭代求解HJB方程得到反饋控制律，并結(jié)合標稱控制律，實現(xiàn)系統(tǒng)的安全優(yōu)化控制。該方法通過觀測器在線估計故障信息，無需進行故障檢測與隔離。并通過設(shè)計執(zhí)行器發(fā)生突變故障的形式進行了仿真實驗驗證。

1 問題描述

2 容錯控制器設(shè)計

2.1 問題轉(zhuǎn)化

由于HJB方程（8）求解難的特殊性，因此，接下來我們將建立自適應(yīng)觀測器與評價神經(jīng)網(wǎng)絡(luò)，進而將容錯控制問題轉(zhuǎn)化為最優(yōu)控制問題處理。

2.2 故障觀測器

2.3 評價神經(jīng)網(wǎng)絡(luò)

3 仿真研究

為了驗證提出方法是否有效，采用構(gòu)形A的可重構(gòu)機器人模型（見文獻[5]）進行數(shù)值實驗。

仿真結(jié)果如圖1～圖4所示。圖1表示的是設(shè)計的故障觀測器對執(zhí)行器故障的在線估計曲線，虛線和實線分別表示故障實際值和估計值?？梢钥闯鲈谙到y(tǒng)運行初期，由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要時間，故兩條曲線存在較大偏差，估計值未能及時跟蹤上實際值。當t=20s和t=45s時系統(tǒng)發(fā)生故障后，由于觀測器的持續(xù)作用，兩條曲線在較短的時間內(nèi)就可以重疊，說明了所設(shè)觀測器可以準確的觀測故障信號，進而減少傳統(tǒng)故障檢測方法的故障診斷時間。圖2、圖3分別反映的是關(guān)節(jié)1、2的跟蹤性能曲線?？梢钥闯觯词瓜到y(tǒng)在兩段時間內(nèi)遭遇故障，系統(tǒng)仍可以良好的運行，且保持系統(tǒng)原有的穩(wěn)定性能。說明了該方案具有良好的容錯性，能夠保證系統(tǒng)的安全可靠性。圖4是兩個關(guān)節(jié)的控制力矩。

圖1 故障估計曲線

圖2 關(guān)節(jié)1跟蹤曲線

圖3 關(guān)節(jié)2跟蹤曲線

圖4 控制力矩

4 結(jié)論

本文融合故障觀測器與ADP算法，提出一種容錯優(yōu)化控制方法，有效地解決了系統(tǒng)發(fā)生執(zhí)行器突變故障的控制問題。根據(jù)在線觀測的故障值，改進傳統(tǒng)的二次型代價函數(shù)。構(gòu)建評價神經(jīng)網(wǎng)絡(luò)，采用一種新型的自適應(yīng)學(xué)習(xí)律近似代價函數(shù)，進而求解得到反饋控制律，結(jié)合標稱控制律，實現(xiàn)系統(tǒng)容錯控制。該方法利用觀測器技術(shù)，規(guī)避了傳統(tǒng)檢測方法的故障檢測與隔離過程，大大減少了容錯時間。仿真實驗表明，該容錯方案可以很好地追蹤上系統(tǒng)的期望軌跡即使系統(tǒng)發(fā)生故障，具有良好的容錯性能，能夠保證系統(tǒng)的安全可靠性。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡