国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進神經(jīng)網(wǎng)絡的空間機械臂阻抗控制方法

2022-04-20 09:47戚毅凡賈英宏趙寶山鐘睿洪聞青
中國空間科學技術(shù) 2022年2期
關(guān)鍵詞:權(quán)值粒子矩陣

戚毅凡,賈英宏,趙寶山,鐘睿,洪聞青

1. 昆明物理研究所,昆明 650223

2. 北京航空航天大學 宇航學院,北京 100191

3. 天津航天機電設(shè)備研究所 天津市微低重力環(huán)境模擬技術(shù)重點實驗室,天津 300301

1 引言

在軌服務技術(shù)是航天領(lǐng)域的熱點研究問題之一,而空間機械臂是空間任務中不可或缺的裝備??臻g機械臂在執(zhí)行零件對接拆裝、維修、捕獲及釋放等操作時會與環(huán)境發(fā)生接觸,空間機械臂末端與環(huán)境會存在較大的接觸力。為了確保目標或機械臂本身不被損壞以及任務的順利進行,必須對空間機械臂進行柔順控制[1]。

機械臂柔順控制包括被動柔順控制和主動柔順控制[2]。被動柔順控制的力控制精度較低,對環(huán)境的適應能力有限,因而主動柔順控制是主要研究方向。主動柔順控制主要分為兩類:力/位混合控制和阻抗控制。力/位混合控制就是在一定規(guī)則下將力反饋與位置反饋相結(jié)合,以同時滿足任務中位置和力的約束條件。其原理是在笛卡爾坐標系下將機械臂末端的運動空間分解為約束空間和無約束空間,在不受約束空間上進行位置控制,在約束空間上進行力控制[3]。文獻[4]提出了阻抗控制算法,該算法建立了力、位置、速度的阻抗關(guān)系式,僅需要一個控制策略即可同時控制力和位置。阻抗控制將力和位置控制納入同一控制體系,相比力/位混合控制,阻抗控制計算量更小,控制更容易實現(xiàn),且研究的成熟度更高。故本文使用阻抗控制算法作為柔順控制方法。

使用阻抗算法實現(xiàn)精準的力控制要求獲得精確的環(huán)境信息,例如環(huán)境位置、環(huán)境剛度和環(huán)境阻尼等[5]。然而空間機械臂在執(zhí)行任務時環(huán)境復雜多變,環(huán)境信息難以準確測量或辨識,獲得精確的環(huán)境信息難以實現(xiàn),為此眾多學者針對該問題進行了研究。文獻[6]在傳統(tǒng)阻抗控制中引入了自適應控制方法,基于迭代思想彌補環(huán)境信息不確定所帶來的影響,使控制器對環(huán)境的適應能力增強。文獻[7]將魯棒控制與阻抗控制相結(jié)合,基于函數(shù)逼近技術(shù)設(shè)計了魯棒阻抗控制器,并在Puma560機器人上驗證了該控制器的有效性。

也有學者通過實時調(diào)整阻抗參數(shù),來解決環(huán)境信息不確定下的空間機械臂阻抗控制問題。阻抗參數(shù)的選擇決定了控制器的柔順特性,若阻抗參數(shù)能隨環(huán)境實時調(diào)整,則阻抗控制器的柔順控制效果會優(yōu)于阻抗參數(shù)固定的情況[8]。文獻[9]提出了一種在未知環(huán)境下模糊自適應阻抗控制,通過接觸力反饋調(diào)整阻抗參數(shù)來適應未知環(huán)境。絕大多數(shù)研究在解決環(huán)境信息不確定下的空間機械臂阻抗控制問題時,通常將碰撞模型假設(shè)為簡單的彈簧模型或是彈簧阻尼模型,而真實的碰撞模型是更復雜的、更難以解析的非線性模型[10]。若碰撞模型未知或建立不準確,以上研究中調(diào)整阻抗參數(shù)的自適應算法將失效,控制器的柔順控制效果無法得到保障。

神經(jīng)網(wǎng)絡憑借非線性擬合的特性被引入到自動化控制領(lǐng)域中,與傳統(tǒng)控制器相比,神經(jīng)網(wǎng)絡控制器不受被控對象模型建立的影響,其適應性和魯棒性均較強[11]。若能將神經(jīng)網(wǎng)絡引入到柔順控制系統(tǒng)中,并根據(jù)機械臂末端反饋信息對阻抗參數(shù)進行實時調(diào)整,則能避免由于碰撞模型未知及空間中環(huán)境的不確定因素對柔順算法產(chǎn)生的不利影響。當下已有許多學者將神經(jīng)網(wǎng)絡與阻抗算法相結(jié)合,對空間機械臂進行控制。文獻[12]提出了一種基于BP神經(jīng)網(wǎng)絡的自適應阻抗控制,BP神經(jīng)網(wǎng)絡根據(jù)環(huán)境剛度和位置的變化通過補償阻抗控制器的誤差來校正機械臂末端的位置。文獻[13]將RBF神經(jīng)網(wǎng)絡應用于改進后的阻抗關(guān)系,對系統(tǒng)的未知部分進行補充,提高了所設(shè)計控制器的跟蹤性能。

但將傳統(tǒng)神經(jīng)網(wǎng)絡應用于阻抗參數(shù)實時調(diào)整存在諸多問題,例如學習時間冗長、網(wǎng)絡參數(shù)選擇無具體參考公式等[14]。例如傳統(tǒng)BP神經(jīng)網(wǎng)絡通常使用逆梯度下降法完成訓練,收斂速度慢,易陷入局部最優(yōu)[15],故無法將阻抗參數(shù)實時調(diào)整到最優(yōu)數(shù)值。針對環(huán)境信息不確定、真實碰撞模型復雜且未知、傳統(tǒng)神經(jīng)網(wǎng)絡收斂速度慢且易陷入局部最優(yōu)等問題,本文將粒子群優(yōu)化算法(particle swarm optimization,PSO)與傳統(tǒng)神經(jīng)網(wǎng)絡結(jié)合,提出了一種基于改進神經(jīng)網(wǎng)絡的阻抗控制方法。該方法無需準確的環(huán)境信息,也不需要碰撞模型的先驗知識,利用粒子群優(yōu)化算法調(diào)整神經(jīng)網(wǎng)絡中的權(quán)值矩陣,改善傳統(tǒng)BP神經(jīng)網(wǎng)絡的尋優(yōu)性能。改進后的神經(jīng)網(wǎng)絡根據(jù)機械臂末端反饋的信息在線調(diào)整阻抗參數(shù),以獲得更好的控制性能和控制精度。所設(shè)計的粒子群優(yōu)化BP神經(jīng)網(wǎng)絡阻抗控制器(PSO-BP阻抗控制器)能有效降低最大接觸力,減小穩(wěn)態(tài)力控制誤差,提高控制系統(tǒng)的響應速度,且不依賴精確的環(huán)境信息,具有較強的抗干擾能力。

2 空間機械臂建模及阻抗控制

2.1 空間機械臂建模

本文以如圖1所示的平面二自由度機械臂系統(tǒng)作為研究對象,系統(tǒng)由衛(wèi)星基座與二自由度機械臂構(gòu)成。

圖1 二自由度機械臂系統(tǒng)Fig.1 2-DOF manipulator system

假設(shè)衛(wèi)星基座受控良好,位置與姿態(tài)保持固定狀態(tài)。此情況下,空間機械臂的柔順控制可以類比固定基座機械臂,即衛(wèi)星本體坐標系近似于慣性坐標系[16]。機械臂連桿視為細桿,連桿間由單自由度的旋轉(zhuǎn)關(guān)節(jié)連接,整個系統(tǒng)為二自由度系統(tǒng)。機械臂末端接觸衛(wèi)星基座上一平板,平板與衛(wèi)星基座固連且垂直于衛(wèi)星基座表面。如上機械臂系統(tǒng)的動力學方程可以寫為:

(1)

式中:τ為關(guān)節(jié)控制力矩;θ為關(guān)節(jié)轉(zhuǎn)角;D為正定對稱的質(zhì)量陣;H為離心力和哥氏力向量;Fe為機械臂末端與環(huán)境的接觸力;J為雅克比矩陣。機械臂正運動學即由各關(guān)節(jié)轉(zhuǎn)角計算獲得機械臂末端位置,其可通過幾何關(guān)系推導得到。將正運動學方程求導,便可獲得機械臂末端速度的計算式

(2)

2.2 阻抗控制算法及接觸過程分析

阻抗控制算法將環(huán)境與機械臂納入一個統(tǒng)一的控制體系,當機械臂未接觸環(huán)境時,可以根據(jù)位置誤差進行軌跡規(guī)劃。當機械臂與環(huán)境接觸產(chǎn)生接觸力時,阻抗算法就能響應該接觸力,使機械臂系統(tǒng)在位置控制和力控制之間達到一個平衡狀態(tài)。阻抗關(guān)系式通常使用二階形式[18]:

(3)

式中:Fd為機械臂末端期望接觸力;M、B、K為阻抗參數(shù),分別為慣性系數(shù)矩陣、阻尼系數(shù)矩陣和剛度系數(shù)矩陣,均為正定對角陣;位置誤差e=xd-x,x為機械臂末端位置,xd為機械臂末端期望位置。使用計算控制力矩法并結(jié)合空間機械臂逆動力學方程設(shè)計阻抗控制器[19],控制器輸出的關(guān)節(jié)控制力矩τm為:

(4)

若碰撞模型已知,則可根據(jù)式(1)~(4)分析空間機械臂與環(huán)境接觸過程中的動態(tài)響應性能。常用的碰撞模型包括K模型、Kelvin-Voigt模型(K-V模型)和Hunt-Crossley模型(H-C模型)[20]。K模型假設(shè)接觸力僅由碰撞物體的局部接觸形變導致,接觸力大小與形變量成正比;K-V模型將碰撞模型等效為彈簧阻尼模型;H-C模型假設(shè)碰撞模型為更復雜的非線性模型。K模型、K-V模型、H-C模型的復雜程度依次遞增,接觸力計算也越接近真實碰撞情況。在機械臂柔順控制領(lǐng)域中,由于更注重控制算法的研究,所以碰撞模型通常選用較簡單的K模型和K-V模型,計算得到的接觸力不能反映真實的碰撞過程。故本文使用更接近真實碰撞情況的H-C模型計算接觸力,其計算公式為:

(5)

式中:δ=x-xe,xe為環(huán)境位置;Khc和Bhc分別為環(huán)境剛度矩陣和環(huán)境阻尼矩陣,均為正定對角陣,表示接觸力可以在任意方向上解耦;指數(shù)n為模型的非線性度。H-C模型僅為仿真時計算空間機械臂末端接觸力使用,在控制過程中碰撞模型未知,可將式(5)表示為:

(6)

式中:函數(shù)g為一個未知的非線性函數(shù)。將式(3)(4)(6)代入式(2)即可獲得發(fā)生碰撞時機械臂系統(tǒng)的閉環(huán)方程

(7)

由式(7),機械臂末端穩(wěn)態(tài)位置xss滿足

(8)

穩(wěn)態(tài)接觸力Fss與穩(wěn)態(tài)位置xss存在非線性關(guān)系

(9)

由式(8)(9)可以計算穩(wěn)態(tài)力誤差EF為:

EF=Kxd-Kxss

(10)

若要使穩(wěn)態(tài)力誤差EF=0,則期望軌跡需要滿足

xd=xss

(11)

在碰撞模型未知、環(huán)境信息不確定的情況下機械臂末端穩(wěn)態(tài)位置xss不能求解。環(huán)境剛度的數(shù)值通常較大,期望軌跡較小的偏差就會導致較大的力控制誤差,這也是該情況下傳統(tǒng)阻抗控制難以實現(xiàn)精準力控制的原因。對于傳統(tǒng)阻抗控制,阻抗參數(shù)的選擇往往是根據(jù)經(jīng)驗決定,在整個控制過程中視為固定值。但阻抗參數(shù)的選擇與機械臂模型、環(huán)境模型有較強的依賴關(guān)系,所以傳統(tǒng)阻抗控制系統(tǒng)的穩(wěn)態(tài)誤差較大,而且系統(tǒng)的魯棒性較差。由式(10)(11)還發(fā)現(xiàn),若阻抗參數(shù)能進行合適的調(diào)整,則可以降低穩(wěn)態(tài)力誤差,實現(xiàn)精準的力控制。下文將使用改進后的神經(jīng)網(wǎng)絡對阻抗參數(shù)進行在線調(diào)整,以提高力控制精確度。

3 基于改進神經(jīng)網(wǎng)絡的阻抗控制

3.1 粒子群優(yōu)化算法

文獻[21]提出粒子群優(yōu)化算法,PSO算法初始化一群隨機粒子,通過迭代在隨機解中尋找最優(yōu)解。粒子群優(yōu)化的基本原理為[22]:假設(shè)在一個D維空間中存在一個由N個粒子組成的種群,在求解最優(yōu)值的過程中,每個粒子通過自身的歷史最優(yōu)位置和種群的歷史最優(yōu)位置,調(diào)整自身的位置和速度,使自身向全局最優(yōu)解靠近。定義第i個粒子的位置向量為xi=(xi1xi2…xiD),速度向量為vi=(vi1vi2…viD),歷史最優(yōu)位置為pi=(pi1pi2…piD),整個種群的歷史最優(yōu)位置為pg=(pg1pg2…pgD)。在迭代過程中,每一個粒子根據(jù)以下公式對自身的位置和速度進行更新:

(12)

(13)

式中:i=1,2,…,N;d=1,2,…,D;ω為慣性因數(shù);c1、c2為加速系數(shù),均為非負常數(shù),加速系數(shù)的合理選擇可以提高尋優(yōu)速度并且避免陷入局部最優(yōu);r1、r2分別為兩個[0,1]之間的隨機數(shù)。式(12)(13)表示第i個粒子由第k代進化到第k+1代速度和位置的更新規(guī)則。粒子速度通常被限制在一個范圍之內(nèi),vid∈[-vmax,+vmax],避免因其速度過大而搜索遠離最優(yōu)解或速度過小陷入局部最優(yōu)。同樣,粒子位置也被限制于一個范圍之內(nèi),xid∈[-xmax,+xmax]。xmax、vmax通常根據(jù)經(jīng)驗設(shè)定。粒子群優(yōu)化的結(jié)束條件一般為:達到最大迭代次數(shù)kmax或全局極值對應的適應度值小于目標適應度閾值[23]。

3.2 PSO-BP阻抗控制器設(shè)計

在碰撞模型未知、環(huán)境信息不確定的情況下,空間機械臂難以實現(xiàn)準確的力控制。傳統(tǒng)神經(jīng)網(wǎng)絡難以實現(xiàn)理想的自適應控制,其原因為:學習或訓練時間較長,無法滿足控制快速性的要求;控制結(jié)果與系統(tǒng)的穩(wěn)定性受權(quán)值矩陣初始值的影響較大;易陷入局部最優(yōu),無法找到滿足要求的全局最優(yōu)解?;谝陨显颍疚膶鹘y(tǒng)BP神經(jīng)網(wǎng)絡進行改進,引入PSO算法作為神經(jīng)網(wǎng)絡的學習算法,并將改進后的神經(jīng)網(wǎng)絡與阻抗控制結(jié)合,設(shè)計PSO-BP阻抗控制器,控制器結(jié)構(gòu)如圖2所示。

圖2 PSO-BP阻抗控制器結(jié)構(gòu)示意Fig.2 Structure of PSO-BP impedance controller

圖3 PSO-BP神經(jīng)網(wǎng)絡結(jié)構(gòu)示意Fig.3 Structure of PSO-BP neural network

1)隨機初始化輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout,設(shè)置神經(jīng)網(wǎng)絡各層節(jié)點個數(shù):輸入層神經(jīng)元數(shù)I=3、隱層神經(jīng)元數(shù)H=5、輸出層神經(jīng)元數(shù)J=3。神經(jīng)網(wǎng)絡的輸入信號xin、輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout的具體表達形式為:xin=[xi],win=[vih],wout=[whj]

其中,i=1,2,…,I;h=1,2,…,H;j=1,2,…,J。 2)由期望軌跡、期望力、機械臂末端軌跡和接觸力構(gòu)成神經(jīng)網(wǎng)絡的輸入信號:

3)將輸入信號傳遞給神經(jīng)網(wǎng)絡的輸入層,由輸入權(quán)值矩陣win計算隱層第h個神經(jīng)元的輸入αh:

αh=xivih

4)隱層將輸入信號αh輸入激活函數(shù)后輸出,隱層激活函數(shù)為tanh函數(shù),具體計算過程為:

5)將隱層輸出信號傳遞給輸出層,由輸出權(quán)值矩陣wout計算輸出層第j個神經(jīng)元的輸入βj:

βj=bhwhj

6)輸出層將信號βj輸入激活函數(shù)后輸出,輸出激活函數(shù)為sigmoid函數(shù),其具體算法為:

其中,z1=M,z2=B,z3=K。

7)根據(jù)PSO-BP神經(jīng)網(wǎng)絡輸出的阻抗參數(shù)計算關(guān)節(jié)控制力矩τm,并根據(jù)要求對其進行限幅,之后將關(guān)節(jié)控制力矩輸入到空間機械臂系統(tǒng)中。

8)粒子群開始尋優(yōu),粒子群維度由輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout中的元素個數(shù)決定,定義粒子的適應度函數(shù)f為:

9)根據(jù)位置和速度更新公式,得到下一代粒子群的位置和速度,并計算各粒子的適應度,更新個體極值與全局極值。

10)當全局極值大于或等于所設(shè)定的目標值時,返回步驟8)。若全局極值小于設(shè)定的目標值或達到迭代次數(shù)上限,尋優(yōu)結(jié)束,當前粒子位置即代表輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout中每一個元素的最優(yōu)解。

將輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout返回至PSO-BP神經(jīng)網(wǎng)絡中,重復步驟3)~7)計算最優(yōu)阻抗參數(shù),對空間機械臂系統(tǒng)進行柔順控制。

4 數(shù)值分析

圖4 機械臂末端x方向接觸力誤差Fig.4 Contact force error on tip of manipulator in x direction

圖5 機械臂末端x方向位置誤差Fig.5 Position error of tip of manipulator in x direction

圖6 慣性系數(shù)的變化Fig.6 Variations of inertial coefficient

圖7 阻尼系數(shù)的變化Fig.7 Variations of damping coefficient

圖9 PSO-BP阻抗控制器關(guān)節(jié)控制力矩Fig.9 Control torques of PSO-BP impedance controller

表1 接觸力動態(tài)響應

由仿真結(jié)果可見,相較于傳統(tǒng)阻抗控制器和BP阻抗控制器,本文提出的PSO-BP阻抗控制器的機械臂末端位置控制誤差和接觸力控制誤差最小(圖4、圖5),與傳統(tǒng)阻抗控制器相比降低了99.1%;此外,PSO-BP阻抗控制器實現(xiàn)了更小的最大接觸力和更短的調(diào)節(jié)時間(圖4、表1),與傳統(tǒng)阻抗控制器相比分別降低了41.7%和19.0%,柔順控制效果得到顯著提升。在初始階段,由于粒子群處于初始化階段,尋優(yōu)難度較大,在線調(diào)整的慣性系數(shù)、阻尼系數(shù)和剛度系數(shù)出現(xiàn)了幅值較大的調(diào)節(jié)過程(圖6~8),控制力矩也出現(xiàn)高頻振蕩(圖9);但當粒子群的速度和位置經(jīng)過較短時間的更新后,就能快速地尋找到全局最優(yōu)方向,優(yōu)化和控制效果隨之平穩(wěn)。為了考察PSO-BP阻抗控制器的抗干擾能力,在仿真中的接觸力反饋通道設(shè)置了一個正弦干擾信號Fint=0.15sin (180t),機械臂末端位置誤差及接觸力的仿真結(jié)果如圖10、圖11所示。

圖10 存在干擾情況下x方向的機械臂末端接觸力誤差Fig.10 Contact force error of tip of manipulator with interference in x direction

圖11 存在干擾情況下機械臂末端x方向的位置誤差Fig.11 Position error of tip of manipulator with interference in x direction

由圖10、圖11可見,在接觸力反饋存在干擾信號的情況下,BP阻抗控制器和PSO-BP阻抗控制器的機械臂末端接觸力和位置控制精度均顯著優(yōu)于傳統(tǒng)阻抗控制器,而PSO-BP阻抗控制器在力反饋信號受到干擾時位置誤差和接觸力誤差波動最小,位置控制和力控制更為穩(wěn)定,表現(xiàn)出較強的抗干擾能力。

5 結(jié)論

本文針對環(huán)境信息不確定和碰撞模型未知情況下的空間機械臂柔順控制問題,結(jié)合文獻[21-22]的粒子群優(yōu)化算法對神經(jīng)網(wǎng)絡進行改進,將文獻[18]的阻抗控制方法與改進后的神經(jīng)網(wǎng)絡相結(jié)合,提出了一種改進型神經(jīng)網(wǎng)絡阻抗控制方法,得到的結(jié)論如下:

1)針對傳統(tǒng)BP神經(jīng)網(wǎng)絡學習時間長、易陷入局部優(yōu)化等問題,利用PSO算法調(diào)整神經(jīng)網(wǎng)絡中的權(quán)值矩陣,改善傳統(tǒng)BP神經(jīng)網(wǎng)絡的尋優(yōu)性能。

2)將PSO-BP神經(jīng)網(wǎng)絡與阻抗控制相結(jié)合,設(shè)計了PSO-BP阻抗控制器。該控制器可在無碰撞模型先驗知識、不依賴環(huán)境信息的情況下,利用空間機械臂末端位置和力的信息反饋,在線調(diào)整阻抗參數(shù)。

3)數(shù)值仿真結(jié)果表明,相比傳統(tǒng)阻抗控制器和BP阻抗控制器,本文所設(shè)計的PSO-BP控制器對機械臂末端的位置控制和接觸力控制精度更高,最大接觸力更小,且對于力反饋干擾信號具有更強的抗干擾能力。

4)本文所提出的算法有效提升了控制器的柔順控制性能,但對硬件的計算能力要求較高。在后續(xù)研究中,可對算法進行邏輯優(yōu)化進而減少計算量,提高該方法的實用性能。

猜你喜歡
權(quán)值粒子矩陣
虛擬校園漫游中粒子特效的技術(shù)實現(xiàn)
一種用于抗體快速分離的嗜硫納米粒子的制備及表征
多項式理論在矩陣求逆中的應用
慣性權(quán)重動態(tài)調(diào)整的混沌粒子群算法
財務風險跟蹤評價方法初探
問:超對稱是什么?
矩陣
矩陣
矩陣
基于洪泛查詢的最短路徑算法在智能交通系統(tǒng)中的應用
邳州市| 镇坪县| 盐边县| 元阳县| 壤塘县| 桦南县| 西安市| 北票市| 曲阜市| 建始县| 砚山县| 沿河| 牙克石市| 珠海市| 东兰县| 沾益县| 登封市| 嵊州市| 卓资县| 阿克陶县| 吴旗县| 石渠县| 洪泽县| 宁强县| 平潭县| 宣威市| 孙吴县| 巴东县| 于田县| 资源县| 肃南| 讷河市| 新蔡县| 华宁县| 顺平县| 绥芬河市| 年辖:市辖区| 庄河市| 宜兰县| 米泉市| 临西县|