夏任司,孫容磊
(華中科技大學機械科學與工程學院數(shù)字制造裝備與技術(shù)國家重點實驗室,湖北 武漢 430074)
與輪式機器人相比,足式機器人在地形適應(yīng)性上有非常大的優(yōu)勢,但是非規(guī)則地形上的路徑規(guī)劃是其面臨的重要難題。目前,大多數(shù)研究局限于保證機器人自身平衡和機器人基本步態(tài)的研究上,缺乏對足式機器人總體路徑規(guī)劃的研究,限制了足式機器人在野外探險、外星勘測和核電站救援等諸多復雜環(huán)境的應(yīng)用[1]。
遺傳算法作為一種啟發(fā)式算法,具備搜索效率高,有自組織、自適應(yīng)和自學習性,算法簡便,易于實現(xiàn)的優(yōu)點。近年來有關(guān)遺傳算法的研究越來越活躍,進一步促進了遺傳算法在各個領(lǐng)域的應(yīng)用[2]。
四足機器人穿越非規(guī)則地形時,其四足按照運動需求以一定規(guī)律踩在地面。為保證機器人穩(wěn)定行走,機器人在運動過程中不可以翻到并需要保證足夠穩(wěn)定裕度[3],同時,機器人足底與踩踏地面不能存在相對滑動,因此非規(guī)則地形四足機器人路徑規(guī)劃是一個多因素影響下可行解求解問題[4]。提出了一種不規(guī)則地形下的智能路徑生成算法:基于遺傳算法的非規(guī)則地形上的四足機器人路徑規(guī)劃方法。綜合考慮了機器人自身穩(wěn)定性和機器人足與地面交互過程中的穩(wěn)定性,得出問題可行域上的較優(yōu)解,為非規(guī)則地形上的四足機器人的運動規(guī)劃提出了一種有效方法。
對于非規(guī)則地形,優(yōu)先采用靜步態(tài)。靜步態(tài)是各種步態(tài)中穩(wěn)定性最佳的,它使得機器人始終有3條腿跟地面接觸,而且它的慢速能為機器人贏取內(nèi)部控制系統(tǒng)對自身狀況、環(huán)境情況和自身與環(huán)境交互的分析控制時間,實現(xiàn)機器人的地形適應(yīng)性。
對于移動機器人來說,獲知環(huán)境信息是其進行各種活動的前提。為了獲取地形信息,現(xiàn)在比較成熟的就是雙攝像頭和激光雷達組合的地形探測系統(tǒng),通過地形探測系統(tǒng)來獲取地形的完整信息。由于重點在于路徑規(guī)劃,所以設(shè)定地形信息為已知,即知道地形的高度起伏。將地形信息通過高程圖表示,生成一個矩陣,矩陣每個元素的角標為位置,元素值為高度,這樣就可以建立模型如圖1所示。
圖1 高程圖
圖中地形用矩陣A表示,機器人從S出發(fā),目標為E點。這樣就完成了問題的建模,即尋找一條路徑,能讓四足機器人從S點出發(fā),順利到達E點。同時,如果有關(guān)于機器人耗能和機器人運動距離的優(yōu)化,也需要一并考慮進去。
四足機器人具體靜步態(tài)運動過程如圖2所示。
圖2 靜步態(tài)循環(huán)
從圖2中可以看出,機器人在靜步態(tài)運動的一個循環(huán)中,分出了6個步驟,先是一邊的腳擺動,然后身體調(diào)整來保證后面階段的運動,接著是另一邊的腳擺動,然后繼續(xù)身體調(diào)整,依次循環(huán)往復。在這個過程中,始終有不少于3只腳著地。
這樣就可以把機器人的運動看成從前一個矩形過渡到后一個矩形,實現(xiàn)機器人連續(xù)運動的離散化。實際上,為了提高機器人的穩(wěn)定性,一個運動循環(huán)中首尾四足著地狀態(tài),可以預設(shè)為平行四邊形,如圖3所示。
圖3 靜態(tài)模型
如此便將問題轉(zhuǎn)化為在高程圖上尋找一系列前后關(guān)聯(lián)的著地點,這些點需要滿足四足機器人運動的各種約束。
對于遺傳算法,如何將問題解編碼為種群個體,是算法使用過程中的關(guān)鍵問題。種群的設(shè)計直接影響到算法的工作效率和解的質(zhì)量。經(jīng)過多次試驗,得出如下的種群設(shè)置方式能實現(xiàn)種群的良好收斂和較高的計算效率。
取機器人中心在地面的投影點為機器人每個離散狀態(tài)的標記點,設(shè)定在標記點,機器人轉(zhuǎn)身位姿為該標記點與上一步運動標記點的連線方向。通過投影點的坐標就可求出機器人四只腳的坐標。
種群的個體顯然應(yīng)該為若干個相互關(guān)聯(lián)的標記點的集合,為了得到合理的路徑,個體中的各個標記點應(yīng)該首尾相接,同時從S點一次過度到E點。為此,把矩陣均勻劃分為N塊區(qū)域,如圖4所示。
圖4 問題建模
這樣算法的個體就為從S點依次連接各個區(qū)域的點直到E點的點的集合??梢钥闯觯袀€體的起點都是S點,終點都是E點,而且限制了機器人運動的步數(shù)為N+1步。
算法的優(yōu)化目標主要有2個。一是在路徑序列點上機器人都能穩(wěn)定;二是路徑要足夠順滑,因為四足機器人的運動能力跟自身四足的尺寸,運動方式有很大的關(guān)系,例如對于K點和K+1點,如果K+1點與K點在縱向的距離過大,超出了機器人的運動能力,使得機器人根本無法在K點通過靜步態(tài)運動到K+1點,那么這樣一條路徑就是無效的。
通過算法實驗發(fā)現(xiàn),如果將這個約束放在適應(yīng)度函數(shù)中考慮,種群的收斂性非常的差,幾乎無法得到可用的規(guī)劃路徑。因此,在種群初始化中就將這一條考慮進去,即在初始化種群時,對于一個個體,除了S點,其余點的生成都與前一個點有關(guān)系,具體如圖5所示。
圖5 可選區(qū)域
對于所涉及的問題,是很明顯的多目標優(yōu)化問題,選用分組進化方法。如圖6所示。將種群分為2組,按照2個適應(yīng)度來進行新種群的篩選,然后進行混合交配和隨機變異即可。至于新種群的篩選,選用輪盤法,實現(xiàn)適應(yīng)度值越大,存活概率越高的進化要求。
圖6 混合進化
適應(yīng)性函數(shù)的選擇也是遺傳算法的一個關(guān)鍵。對種群的選擇主要考慮2個方面。一是機器人在路徑序列點上要穩(wěn)定;二是路徑要足夠順滑。對于要求一,構(gòu)建了四足機器人靜態(tài)穩(wěn)定模型。
模型的具體參數(shù):
a.四只腳各自著地點地形的網(wǎng)格高度的偏差。
b.四只腳著地點之間的最大高度差。
c.機器人幾何中心對應(yīng)的地形高度與機器人身體的高度差。
對于要求二,關(guān)于路徑順滑性的要求,雖然在種群初始化中應(yīng)經(jīng)做了一定的考慮,但在進化過程中也需要考慮,做進一步的優(yōu)化。
上式為考慮靜步態(tài)穩(wěn)定性的適應(yīng)度計算公式。p1,p2,p3,p4為每只腳與地面接觸的區(qū)域的網(wǎng)格高度的公差即地形平整度;H為著地點的最大高度差;cenh為機器人中心即序列點對應(yīng)地形的高度。
采用exp指數(shù)函數(shù)是為了拉大各種地形情況的適應(yīng)度值,同時為了進一步拉大各類地形的適應(yīng)度值,提高進化效率,引入罰函數(shù)機制。
如果S>y,S=S+100,否則S=S。這樣可以很好地淘汰完全站不穩(wěn)的序列點。
對于第二點路徑順滑性,適應(yīng)度函數(shù)直接用前后兩點的縱向差的和的倒數(shù)。
這樣對于所涉及的問題,算法能夠?qū)崿F(xiàn)較好的進化,得到合適的結(jié)果。
在Matlab 6.0平臺上進行該算法的仿真,圖7為進化1 500代,耗時2 456s后搜索出的最優(yōu)解。圖中星點代表機器人的運動駐點,基本實現(xiàn)了路徑規(guī)劃的能力,讓機器人順利跨越可跨越障礙后,又避開了不可跨越高墻,使得算法基本實現(xiàn)了預定功能。
圖7 仿真結(jié)果
所述遺傳算法實現(xiàn)了一定的四足機器人路徑規(guī)劃的智能算法,較好的將四足機器人內(nèi)部相互作用與機器人四足與地面的交互系統(tǒng)的統(tǒng)一在了一起,實現(xiàn)了四足機器人運動的全局規(guī)劃。使得四足機器人擺脫了簡單的循環(huán)規(guī)律運動,真正實現(xiàn)了高地形適應(yīng)能力。但是目前該算法還存在耗時過長,效率過低,應(yīng)用不靈活,對實時地理勘測系統(tǒng)依賴性過高等缺點。未來有望通過馬爾可夫智能決策與遺傳算法的結(jié)合來實現(xiàn)高效,高智能化的路徑規(guī)劃方法,真正發(fā)揮出四足機器人的強地形適應(yīng)能力。
[1]孫明軒,黃寶健.迭代學習控制[M].北京:國防工業(yè)出版社,1999.
[2]Fang Z,Han Z G,Chen P N.Recent developments of iterative learning Control[J].Control Theory and Applications(S1672-6340),2002,19(2):161-166.
[3]李俊仁,韓正之,唐厚君.一類迭代學習控制的自適應(yīng)參數(shù)優(yōu)化[J].系統(tǒng)仿真學報,2005,17(8):1833-1836.
[4]吳 杰,許忠仁,詹習生,等.不確定性線性系統(tǒng)魯棒迭代學習控制器設(shè)計及應(yīng)用[J].自動化與儀表,2005,(5):1-4.