譚鶴毅
(南充職業(yè)技術學院 信息與管理工程系,四川 南充 637000)
一種新的雙足機器人模型設計與相關研究
譚鶴毅
(南充職業(yè)技術學院 信息與管理工程系,四川 南充 637000)
針對雙足機器人最簡模型在行走過程中出現(xiàn)擺動腿足部擦地的問題,提出了一種通過擺動腿膝關節(jié)彎曲達到擺動腿縮短的新模型;當擺動腿開始擺動時,擺動腿膝關節(jié)彎曲鎖定,擺動腿縮短;當擺動腿擺動到最大位置時,膝關節(jié)解鎖,擺動腿伸直再鎖定,此后擺動腿回擺,系統(tǒng)變?yōu)橹蓖饶P?。采用腳后跟沖擊控制,在擺動腿落地前,拖后的支撐腿與地面接觸處施加一指向髖關節(jié)的瞬時沖擊力,沖擊力可以減小擺動腿著地時能量的損耗,同時驅動被動機器人向前行走;設計了迭代學習控制算法,找到極限環(huán)與不動點,實現(xiàn)不同給定期望步長跟蹤的沖擊力的計算;仿真結果表明,迭代學習控制可以有效的實現(xiàn)不同期望步長的跟蹤,可以很快的找到機器人系統(tǒng)的不動點,通過收斂的相平面,得到穩(wěn)定的極限環(huán),保證了機器人行走過程穩(wěn)定。
雙足機器人模型;沖擊控制;不動點;迭代學習控制
機器人是近年來快速發(fā)展的綜合學科,是目前最熱門的研究領域之一。自從1969年,日本早稻田大學開發(fā)出第一臺雙足機器人后,機器人進入了“仿人”研發(fā)階段,并催生出本田公司的ASIMO與索尼公司的QRIO,成為了雙足機器人研發(fā)領域的典型代表和里程碑,這些機器人,均是依據(jù)ZMP理論與軌跡跟蹤方法實現(xiàn)穩(wěn)定性控制的[1]。傳統(tǒng)的機器人,驅動力和穩(wěn)定裝置是在所有的關節(jié)均要設置的,這就致使機器人的構造、設計均很冗雜,機器本身的靈活性和能量利用率都很小,這就使得該種機器人不能執(zhí)行和從事耗時長、任務重的任務[2-3]。被動行走概念是由加拿大學者T.McGeer于1989年首先提出,機器人可以僅靠自身重力勢能作為能量輸入就可以實現(xiàn)沿斜坡向下的穩(wěn)定行走[4]。為了實現(xiàn)機器人在平面上的行走,設計出半被動機器人,就需要加入主動驅動控制。D.Kuo使用最簡模型研究機器人在平面上的半被動行走,研究了能量消耗問題,以及速度和步長的關系,Kuo使用了兩種控制驅動方式:擺動腿撞擊前,支撐腿腳后跟作用一指向髖部的沖擊力;在支撐腿髖關節(jié)上直接使用轉矩控制。通過能量比較,得出腳后跟的沖力控制方法能量效率僅為髖關節(jié)直接轉矩控制的四分之一[5]。
由于Kuo使用機器人最簡模型在行走過程中,會出現(xiàn)擺動腿足部擦地的現(xiàn)象,為了避免這種現(xiàn)象,本文設計了一種通過擺動腿膝關節(jié)彎曲達到擺動腿縮短的模型,具體為:當擺動腿開始擺動時,擺動腿膝關節(jié)彎曲鎖定,擺動腿縮短;當擺動腿擺動到最大位置時,膝關節(jié)解鎖,擺動腿伸直再鎖定,此后擺動腿回擺,系統(tǒng)變?yōu)橹蓖饶P汀?/p>
本文使用腳后跟沖擊控制,具體方法:在擺動腿落地前,拖后的支撐腿與地面接觸處施加一指向髖關節(jié)的瞬時沖擊力,沖擊力可以減小擺動腿著地時能量的損耗,同時驅動被動機器人向前行走??刂茮_擊力的大小,可以實現(xiàn)半被動機器人在平面上穩(wěn)定行走。通過解析法找到系統(tǒng)初值估計,設計迭代學習控制算法,找到極限環(huán)與不動點,通過仿真實現(xiàn)不同給定期望步長跟蹤的沖擊力的計算。
1.1 擺動腿彎曲模型設計與分析
本文選用機器人最簡模型,質量集中于髖關節(jié)和足部,為了調整機器人行走的頻率,髖關節(jié)加入彈簧,作用于擺動腿擺動過程中。l為機器人腿長,g為重力加速度,θ為垂直方向與支撐腿之間的夾角,φ為支撐腿與擺動腿之間的夾角。如圖1所示,機器人在碰撞后瞬間,膝關節(jié)鎖定,擺動腿彎曲,擺動腿在擺動過程中,使用彈簧轉矩,建立系統(tǒng)的動力學方程:
圖1 擺動腿彎曲鎖定模型
支撐腿:
Mglsinθ-mglsinθ-mgl1sin(θ+a-θ)=0
(1)
擺動腿:
(2)
支撐腿:
(3)
擺動腿:
(4)
1.2 擺動腿伸直模型設計與分析
如圖2所示,當擺動腿擺動到最高點時,膝關節(jié)解鎖,擺動腿伸直再鎖定,此時擺動腿彎曲狀態(tài)機器人模型微分方程求解結束。如圖3所示,當擺動腿回擺,系統(tǒng)進入直腿模型的微分方程的求解。
圖2 擺動腿彎曲擺動到最高點
此時機器人系統(tǒng)的動力學方程為:
支撐腿:
(5)
擺動腿:
(6)
同上,無量綱化得:
支撐腿:
(7)
擺動腿:
(8)
圖3 擺動腿伸直鎖定后直腿模型 圖4 腳地碰撞理論模型
1.3 腳地碰撞切換設計與分析
機器人腳底與地面相碰接觸之后,地面會施加給腳部足夠強大的力的作用。碰撞過程中,機器人能量消耗,為了實現(xiàn)雙足機器人在平面上的行走,必須提供驅動力,對其能量補充。如圖所示,本文采用在腳地碰撞之前,使用腳后跟脈沖控制,具體方法:在擺動腿落地前,拖后的支撐腿處施加一指向髖關節(jié)的瞬時沖擊力,沖擊力可以減小擺動腿著地時能量的損耗,同時驅動被動機器人向前行走。控制沖擊力的大小,可以實現(xiàn)半被動機器人在平面上穩(wěn)定行走。
結合上面的模型,先假定在整個碰撞的環(huán)節(jié),認為模型主體在位置上不發(fā)生改變,并且其腿和地面接觸點之間滿足角動量守恒定律;同時認為在碰撞過程發(fā)生之前,機器人的支撐腿相對于髖關節(jié)也滿足角動量守恒的條件,附加規(guī)定機器人主體的各種速度能夠進行不連續(xù)的改變。由前面的假設和規(guī)定,能夠構建機器人主體在碰撞動作發(fā)生的前后瞬間具備的能量關系式,進一步求解可得:
(9)
(10)
1.4 擺動腿彎曲縮短對擺動腿速度的影響
由于腳底碰撞后瞬間,擺動腿膝關節(jié)鎖定,此時擺動腿縮短,根據(jù)擺動腿質心關于髖關節(jié)角動量守恒??傻孟リP節(jié)鎖定后,擺動腿角速度:
(11)
上角標與“+”與“-”分別代表膝關節(jié)鎖定,擺動腿縮短前、后時刻的狀態(tài)(假設擺動腿膝關節(jié)鎖定對支撐腿的狀態(tài)沒有影響)。
為了使機器人周期性行走,機器人在每一個周期開始時的條件應等于系統(tǒng)初始時設定的條件。即滿足:
(12)
當Km=0時,由式(3)、(4)、(7)、(8)可得線性化的近似方程:
(13)
(14)
McGeer證明了極限環(huán)的存在和穩(wěn)定性[6]??紤]腳后跟沖擊力驅動,解析線性化近似的運動方程(12)、(13), 結合碰撞切換方程(9)、(10),代入邊界條件(11), 可得到極限環(huán)存在時,γ,?,τ,ω,P必須滿足以下方程:
(15)
(16)
(17)
如果給定頻率ω值,由方程(15)可求的步態(tài)周期z的值。注意:利用方程(15)求τ時,可得τ的一個根為π/ω,這個根被稱為“短周期”,此時得不到穩(wěn)定的極限環(huán)。由于方程[]內非線性,無法求出解析解,可以使用數(shù)值方法計算方程的根。由于只關心最小根,所以可以使用Newton法求出(15)中“[]”內的最小根。將式(15)中得到的τ代入式(16),由于γ給定,故可以求的初始?的值,將給定步長γ,初始?代入(17)式,就可以得到所需的脈沖驅動力P的初值。
穩(wěn)定性能是衡量機器人功能的重要標準之一,如果驅動式機器人具備良好的穩(wěn)定性能,說明該機器人在完成數(shù)個步態(tài)指令之后,機器主體在該相圖中能夠保證始終處在同一個環(huán)線之內,而不發(fā)生越位,這條環(huán)線就是理論上的穩(wěn)定極限環(huán)[8],它上面的初始點均具備穩(wěn)定性,在動態(tài)系統(tǒng)理論里面起著重要作用。對于穩(wěn)定極限環(huán)上面的穩(wěn)定性求解問題,最基本的解法是按照龐加萊映射的理論步驟來計算[9-10]。龐加萊截面選擇在腳地碰撞,膝關節(jié)鎖定后,則一次龐加萊映射S(x)可表示為:
(18)
在動態(tài)系統(tǒng)理論里面,依據(jù)單個完整周期相對應的形態(tài)軌跡為研究對象和載體,文獻[9]中所述的映射理論重點對周期內的形態(tài)軌跡進行了求解證明,在此基礎上對回歸映射做出了如下定義:x*=S(x*,P),由式(9)、(10)、(16)得一個周期極限環(huán)上,不動點的值都可以用支撐腿角度γ表示。同時,最簡模型腳后跟沖擊力P是影響不動點值的唯一因素。所以周期軌跡上,龐加萊映射可以表示為:
(19)
由于實際機器人系統(tǒng)Km≠0,線性化方程(13)、(14) 無法得到精確滿足,實現(xiàn)理想步長跟蹤的精確沖擊力無法找到,系統(tǒng)存在誤差。由于雙足機器人行走具有周期重復特性,因此適合采用迭代學習控制,用于不斷重復的同一軌跡的控制方法。作為學習控制理論的一個重要分支,迭代學習控制是一類全新的學習控制策略理論,具有極好的控制效果。該方法在解決控制性問題時,是通過不斷校核控制律,確保有限時間內的實際軌跡與控制目標無誤差,此外還必須滿足快捷性的相關要求。使用該理論求解雙足機器人的穩(wěn)定性問題,具備很大的優(yōu)勢。首先具體要采用如下的P型閉環(huán)迭代學習控制規(guī)律:
(20)
其中,KP表示迭代學習因子,k表示離散時間變量,d表示期望值。e表示期望值與實際值之差,而第一周期的初始沖擊力P的初始值采用(17)式估計。
系統(tǒng)仿真流程圖如下圖5所示,在仿真中首先給定了ω的值(ω的值由彈簧彈性系數(shù)決定),使用Newton法可以求出(15)中的步態(tài)周期τ,由于支撐腿期望角度γd給定,可以通過(16),(17)式求的ω,P的初始值。設碰撞后膝關節(jié)鎖定彎曲時的狀態(tài)值為初值,將初值代入,設膝關節(jié)彎曲角度β=π/8,a=0.5,b=0.5,使用Runge-Kutta(RK4)法解彎腿模型微分方程(3)、(4)當檢測到擺動腿的無量綱角速度為零時,微分方程(3)、(4)求解結束。將得到的狀態(tài)值作為直腿模型的初值,使用RK4法解直腿模型的微分方程(7)、(8)當擺動腿的角度為支撐腿角度的2倍時,微分方程(7)、(8)求解結束,得到狀態(tài)值。通過脈沖力控制、腳地碰撞、膝關節(jié)的彎曲鎖定,得到下一個周期機器人運動的初始值。根據(jù)計算的得到的支撐腿角度與給定期望支撐腿角度間的誤差,使用迭代學習控制,修正脈沖驅動力P的值。
圖5 機器人系統(tǒng)仿真程序流程圖
設質量比Km=0.1,支撐腿初始值γ=π/8≈0.392 7,設機器人行走自然頻率ω=2可以計算出沖擊力P=0.239 8,仿真可得每一周期支撐腿的初始角度穩(wěn)定在0.406 7,如圖6虛線所示。誤差由式(3)、(4)、(7)、(8)得線性化的近似方程(13)、(14)時產生。圖6實線所示,通過戶型迭代學習控制校正,可以實現(xiàn)給定理想角度的跟蹤,設迭代學習因子KP=0.3,仿真可得支撐腿角度穩(wěn)定在給定0.392 7,脈沖驅動力校正為P=0.222 6。
圖6支撐腿在每一周期行走的初始角度
(ILC校正前后的比較,連續(xù)行走20個周期)
如圖7所示,通過迭代學習控制沖擊力P,可以實現(xiàn)支撐腿不同期望值的跟蹤。
圖7 支撐腿在每一周期的初始角度
(迭代學習因子KP= 0.3,質量比Km= 0.1,支撐腿初始值r=π/8≈0.392 7,機器人行走自然頻率ω= 2,支撐腿期望值:γd=0.35,γd=0.42,連續(xù)行走20個周期)。
圖8 擺動腿行走過程中的相平面軌跡
(迭代學習因子KP= 0.3,質量比Km= 0.1,支撐腿初始值r=π/8≈0.392 7,機器人行走自然頻率ω= 2,支撐腿期望值:γd= 0.505,連續(xù)行走100個周期)。
圖8所示為迭代學習控制機器人擺動腿相平面軌跡,可以看出,相平面軌跡很快的收斂到穩(wěn)定的極限環(huán),能夠實現(xiàn)機器人的穩(wěn)定行走。
本文對最簡行走模型進行了分析,研究了擺動腿加入膝關節(jié)彎曲縮短,以避免在擺動過程中擺動腿蹭地,在腳地碰撞前加入沖擊力驅動控制,保證了機器人在平面上實現(xiàn)行走,同時極大提高了能量利用率。使用迭代學習控制沖擊力的值,實現(xiàn)了給定期望步長(支撐腿角度)的跟蹤。通過仿真結果,迭代學習控制可以有效地實現(xiàn)不同期望步長的跟蹤,可以很快地找到機器人系統(tǒng)的不動點。通過收斂的相平面,得到穩(wěn)定的極限環(huán),機器人行走過程穩(wěn)定。本研究對下一步實驗設計被動行走機器人實物系統(tǒng)具有重要的指導意義。本文只通過仿真驗證了系統(tǒng)極限環(huán)穩(wěn)定性,關于極限環(huán)穩(wěn)定性的嚴格證明也是下一步需要研究的問題。
[1] 譚 民, 王 碩. 機器人技術研究進展[J]. 自動化學報, 2013, 39(07): 963-972.
[2] 王斌銳, 馮偉博, 駱浩華, 等. 曲面上雙足三自由度爬壁機器人設計與穩(wěn)定性分析[J]. 機器人, 2014, 36(3): 349-354.
[3] 閔偉偉, 劉國棟. 基于 A* 算法的雙足機器人足跡規(guī)劃[J]. 計算機測量與控制, 2013, 21(01): 157-159.
[4] McGeer T. Passive dynamic walking [J].International Journal of Robotics Research,1990,19(1):62-82.
[5] Kuo A D. Energetics of actively powered locomotion using the simplest walking model [J].Journal of biomechanical engineering,2012,124(1):113-120.
[6] 成 鈞, 廖世俊. 具有多個極限環(huán)非線性動力系統(tǒng)的解析近似[J].力學學報,2012,23(5):715-720.
[7] 劉麗梅,田彥濤,李建飛.被動行走機器人變路況切換控制[J]. 控制與決策,2011,26(8):1203-1208.
[8] 徐林森, 梅 濤, 宦 娟, 等. 雙足機器人水上行走機理研究及推進機構設計[J]. 機器人, 2013, 35(3): 257-262.
[9] Idowu B A, Vincent U E, Njah A N. Synchronization of chaos in non-identical parametrically excited systems[J].Chaos, Solitons & Fractals,2013,39(5):2322-2331.
[10] Nikkhah M, Ashrafiuon H, Fahimi F. Robust control of underactuated bipeds using sliding modes[J].Robotica,2012, 25(03):367-374.
[11] 趙九洲, 居鶴華. 雙足機器人步行動力學特性分析及簡單仿生控制[J]. 計算機測量與控制, 2013, 12: 027.
[12] 敬成林, 朱曉銘. 雙足機器人行走控制算法的三維仿真研究[J]. 計算機仿真, 2014, 31(3): 346-350.
A New Kind of Bipedal Robot Model Design and Related Research
Tan Heyi
(Information and Management Engineering Department, Nanchong Professional Technic College,Nanchong 637000, China)
When the simplest model of robot is in the process of walking, the feet of its swinging legs may brush the floor. In view of this problem, a model to shorten the swinging legs when the knees bend is proposed. When the swinging leg begins to swing, the knee of the swing leg bends and gets locked and the swing leg becomes shortened; when the swing leg swings to the largest position, the knee becomes unlocked and then locked after the swing leg unbends. In this condition, the swing leg swings back and the system becomes straight leg model. The heel impact control is adopted, so that before the swinging leg goes to the ground, an instantaneous wallop on to the hip can be applied at the place where the dragged support leg connect with the ground. The impact can reduce the energy loss of swinging leg landing on the ground, and can also drive the passive robot to walk forward. Iterative learning control algorithm is designed to find the limit cycle and the fixed point; through simulation, the impact forces under the tracking of different given expectation steps are calculated. The simulation results show that the iterative learning control can effectively implement the tracking of different expectation steps, quickly find the fixed points of robot system, and get a stable limit cycle through the convergence of the phase plane, to ensure the stable walking process of the robot.
bipedal robot model; impact control; fixed point;iterative learning control
2016-04-07;
2016-06-21。
譚鶴毅(1980-),男,四川南充人,碩士,講師,主要從事計算機軟件與理論方向的研究。
1671-4598(2017)02-0189-04
10.16526/j.cnki.11-4762/tp.2017.02.052
TP273
A