張晶 蔡志全 韓永成 牛彩霞
(唐山工業(yè)職業(yè)技術(shù)學院)
在智能化時代環(huán)境下,人工智能技術(shù)開始得到關(guān)注,而且在移動機器人這一領(lǐng)域也展開深入研究,將不同學科技術(shù)加以整合,應用在各個行業(yè)領(lǐng)域。機器人本質(zhì)上屬于新工具,不僅為行業(yè)發(fā)展提供了動力,還極大地增加了人們生活的便捷性,減輕工作與勞動壓力。因為移動機器人關(guān)系到不同技術(shù),整體質(zhì)量也直接決定了智能化程度,所以在路徑規(guī)劃階段,一般會通過2種路徑加強機器人科技科水平,為我國科技行業(yè)的進步添磚加瓦。這里提到移動機器人路徑規(guī)劃,需要運用到不同形式的傳感器影響機器人,并且按照環(huán)境感知,在評判標準作用下規(guī)劃出安全性最佳的運行路線。路徑規(guī)劃期間按照機器人功能,可使用不同的算法,得出機器人繞過一些障礙物的時間、效率。常見的路徑規(guī)劃算法有全局、局部和人工智能三種類型,在移動機器人路徑規(guī)劃中分別有不同的作用。下文圍繞移動機器人路徑規(guī)劃算法分別展開討論。
移動機器人路徑規(guī)劃屬于技術(shù)研發(fā)領(lǐng)域,常見的機器人路徑規(guī)劃技術(shù)是以任意參數(shù)指標為對象,從任務區(qū)域挑選出從起點到終點連接的最佳避障路徑,換言之,也可以理解為在若干個約束條件下所獲得的可行解。分析移動機器人的路徑規(guī)劃效果,通常會對機器人運行、任務完成實時結(jié)果帶來直接的影響[1]。
最初關(guān)注機器人路徑規(guī)劃的分析,可以追溯到20世紀,迄今為止世界上所有的機器人研發(fā)依然在持續(xù)進行,并且從技術(shù)上獲得了顯著成效。按照環(huán)境信息特征,將路徑規(guī)劃劃分為離散域范圍、連續(xù)域范圍兩種類型;按照路徑規(guī)劃算法被發(fā)現(xiàn)的順序,則有傳統(tǒng)算法和現(xiàn)代智能算法兩種類型。結(jié)合移動機器人理解的工作區(qū)域信息層次,路徑規(guī)劃主要有兩類,即全局路徑規(guī)劃、局部路徑規(guī)劃。其一,全局路徑規(guī)劃。按照掌握的全局環(huán)境信息可創(chuàng)建抽象全區(qū)域環(huán)境地圖模型,該模型中可以通過尋優(yōu)搜索算法,得出機器人運行的全局最優(yōu)、次優(yōu)路徑,對移動機器人朝目標點進行安全移動加以引導。該路徑規(guī)劃算法首先需要理解環(huán)境信息并構(gòu)建地圖模型,其次則涉及到全局路徑搜索、機器人引導。其二,局部路徑規(guī)劃。機器人完成任務期間,按照所攜帶傳感器獲取的局部環(huán)境信息,便可以展開實時動態(tài)路徑規(guī)劃,這一類型路徑規(guī)劃算法的靈活性、實時性非常強。但是在局部環(huán)境特點影響下,所得到的路徑有可能僅為局部最優(yōu),并非是全局最優(yōu),還有可能無法達到目標[2]。實際上對于移動機器人路徑規(guī)劃而言,可以將全局與局部兩種路徑規(guī)劃算法加以組合,通過前者獲得機器人的全局優(yōu)化路徑,再利用后者達到實時避障的效果。
1.圖搜索算法
圖搜索算法涵蓋了諸多不同類型的算法,如A*算法,針對移動機器人確定目標關(guān)鍵點,一般是機器人與障礙物,機器人環(huán)繞障礙物之后遵循“以點成線,以線成面”的原則直接構(gòu)圖即為可視圖??梢晥D目標點可見,點與點之間的頂點需要保證清晰度。圖搜索算法在運用中,可以得出最短路線,即起點和目標點之間的最短距離[3]。利用這種優(yōu)化算法,刪除一些多余的連線,可視圖得到簡化處理之后搜索時間也就隨之縮短。
2.快速隨機搜索樹
快速隨機搜索樹(Rapidexploration Random Tree,RRT)作為全局路徑規(guī)劃算法,是在采樣基礎(chǔ)上延伸而來的搜索算法,在高維非歐空間搜索中適用性極高。利用快速隨機搜索樹算法,針對多維度空間中不完整性約束問題能夠快速做出處理。路徑規(guī)劃起點作為搜索樹根節(jié)點,按照規(guī)定準則可以設(shè)定搜索樹的節(jié)點,再結(jié)合路徑規(guī)劃已知約束條件,已經(jīng)確定的節(jié)點再擴展之后可得出新節(jié)點,在搜索樹中儲存,隨之不斷重復上述流程,直至找到終點。通過此算法一方面可以展開隨機采樣,使機器人探索并未探查的空間,另一方面在探索期間也會優(yōu)化搜索樹[4]。
快速隨機搜索樹算法屬于快速搜索算法,具有探索速度快、搜索力強、地圖預處理操作便捷等優(yōu)勢,但是在搜索過程中比較盲目,特別是高維、動態(tài)環(huán)境下,可能增加探索的時間與計算復雜性,還有可能陷入死區(qū)中,導致局部最小值。面對此算法計算復雜的問題,建議將RRT算法和滾動路徑規(guī)劃算法結(jié)合,起到移動機器人在線避障的引導作用,可以降低RRT算法復雜程度,還加強了實時性。以此為基礎(chǔ)引入選擇性參數(shù),優(yōu)化傳統(tǒng)算法統(tǒng)一概率,可以提高RRT算法收斂效率,加強算法路徑規(guī)劃指向性。經(jīng)過改進之后的RRT算法,可以運用在滾動窗口改進路徑規(guī)劃算法中,既保證了原有RRT算法在隨機搜索方面的優(yōu)勢,又對估價收斂標準函數(shù)引導搜索樹生長進行了引導,縮短算法運算所花費的時間。面對局部最小問題,建議采用回歸分析法,篩選出新節(jié)點,保證算法智能趨近終點優(yōu)勢的基礎(chǔ)上,還可以對未知空間展開探索[5]。另外,快速隨機搜索樹基礎(chǔ)上還提出了高自由度關(guān)節(jié)移動機器人的方法,在高維空間中具有極高的適應性,按照路徑復雜性確定機器人主體,并且篩選出機器人關(guān)節(jié),也就是所謂的配置空間、采樣自適應維度路徑規(guī)劃。該路徑規(guī)劃與自適應快速隨機搜索樹算法結(jié)合之后,利用自適應選擇主體,可在自適應三維空間范圍內(nèi)循序漸進的增加RRT。因為傳統(tǒng)形式的快速搜索隨機樹算法在運用中收斂速度不高,建議與多約束條件改進算法加以融合,此算法同時涉及到環(huán)境約束、運動學約束,通過啟發(fā)方法采樣節(jié)點,極大地保證了路徑規(guī)劃速度[6]。
3.智能仿生算法
智能仿生算法的核心是對自然界所有動物進化的過程、昆蟲覓食捕獵行為等進行模擬,以此來規(guī)劃移動機器人運行路徑,常見的有蟻群算法、粒子群算法等。其一,蟻群算法。此算法是在螞蟻覓食行為基礎(chǔ)上延伸而來,一般螞蟻覓食期間會分泌出信息素,在已經(jīng)走過道路遺留痕跡,后續(xù)再有覓食的螞蟻便會根據(jù)遺留的信息素明確路線,搜索得出信息素濃度,一般濃度高即為最短路徑[7]?;诖耍伻核惴I(lǐng)域的全局路徑規(guī)劃,可以按照蟻群數(shù)量、啟發(fā)因子、信息素數(shù)量等確定移動機器人規(guī)劃路徑,經(jīng)過信息素改進后可以進一步提高算法收斂速度和搜索效率。
4.遺傳算法
遺傳算法(Genetic Algorithm,GA)屬于全局優(yōu)化搜索算法范疇,其是在達爾文進化思想基礎(chǔ)上延伸而來,以自然選擇與遺傳產(chǎn)生的交叉、變異、遺傳等現(xiàn)象,展開仿真模擬,遵循優(yōu)勝劣汰原則,并且結(jié)合結(jié)果獲得候選解,在所有候選解當中可以發(fā)現(xiàn)最優(yōu)解。遺傳算法具有迭代優(yōu)勢,并且組合其他算法,展現(xiàn)出自組織性、自學習性的特點,移動機器人路徑規(guī)劃最優(yōu)路徑的搜索性也非常強。遺傳算法的操作比較簡單,很少會受外部環(huán)境影響,但是實時運算和搜索效率不高,極易于陷入到局部最優(yōu)解。算法運行階段,不重要的種群存在則會增加計算難度,降低算法運行效率,在線路徑規(guī)劃的適用性不高。
1.模擬退火算法
模擬退火算法是目前移動機器人路徑規(guī)劃中,組合優(yōu)化問題最為有效地解決算法,處理算法期間金屬熱在算法有效退火,初期控制金屬環(huán)溫度,即使遇到突發(fā)性事件,也可以隨機搜索,快速地收集數(shù)據(jù)。結(jié)合路徑規(guī)劃現(xiàn)狀,使用模擬退火算法,具有操作簡單、有效性強、控制數(shù)據(jù)少以及彈性等諸多優(yōu)勢,但是也會出現(xiàn)一定概率,導致速度緩慢[8]。運用模擬退火算法進行移動機器人局部路徑規(guī)劃,使路徑擺脫原始路徑,探索出新目標點,找到最佳移動路徑。
2.人工勢場算法
人工勢場算法在移動機器人路徑規(guī)劃中運用,針對機器人所在環(huán)境展開規(guī)劃,在人工場范圍內(nèi)運動,其本質(zhì)上屬于抽象意義的人造受力場,利用目標點對輸出機器人形成引力與障礙物斥力,基于不同環(huán)境所形成的合力也可以明確機器人輸出。此算法的結(jié)構(gòu)比較簡單,在底層實時控制方面具有明顯的優(yōu)勢,最終規(guī)劃路徑也十分平滑,保證了移動機器人運行的安全性。但是人工勢場算法依然存在局部最優(yōu)、狹窄通道動蕩等問題[9]。如果環(huán)境要求過于嚴格,其虛擬合力即為零,此時會影響到移動機器人的運行,無法繼續(xù)執(zhí)行任務。通過人工勢場啟發(fā)函數(shù),便可達到全局最優(yōu),并規(guī)避局部最優(yōu)帶來的影響。面對人工勢場算法潛在問題,可以結(jié)合斥力模型,路徑規(guī)劃階段移動機器人規(guī)避局部極小點,使得路徑規(guī)劃面臨問題得到解決。
基于人工智能算法的路徑規(guī)劃表現(xiàn)最為突出的就是深度強化學習算法(Deep Reinforcement Learning,DQN),所謂深度強化學習,是深度學習感知能力、強化學習決策能力的融合,按照輸入圖像展開精準控制,其本質(zhì)上與人類的思維方式更為接近,是人工智能領(lǐng)域也得到了極大的關(guān)注。深度學習感知力較強,但決策力不高,強化學習本身有一定的決策力,面對感知問題卻無法得出有效的結(jié)論。將兩種算法結(jié)合后的深度強化學習具有自監(jiān)督學習能力,可在復雜的環(huán)境中可自主與周圍環(huán)境進行交互。同時其在決策與狀態(tài)分析也有很好的表現(xiàn)能力。深度強化學習在路徑規(guī)劃方面最主要的優(yōu)勢在于其不依賴人工標記軌跡,只需設(shè)置規(guī)劃原則如運行路徑最短、無障礙物碰撞和目標點等,然后在虛擬實驗平臺或者現(xiàn)實環(huán)境中訓練神經(jīng)網(wǎng)絡(luò)即可。但是深度強化學習在路徑規(guī)劃上仍也存在很多不足之處,如路徑規(guī)劃時效性差、遇障礙多次轉(zhuǎn)向等問題,需要從改進神經(jīng)網(wǎng)絡(luò)模型、獎勵函數(shù)和多算法融合方面進行探索改進,為移動機器人路徑規(guī)劃這種比較復雜的系統(tǒng)感知決策問題梳理思路。
DQN算法主要有神經(jīng)網(wǎng)絡(luò)、Q learning兩種,被稱作 Deep Q Network。該算法中包括記憶庫,記載著學習的所有經(jīng)歷。Q learning屬于off-policy 離線學習法,可以學習目前正在經(jīng)歷的內(nèi)容,也可以學習以往經(jīng)歷的內(nèi)容,整體范圍比較廣。因此,當DQN更新時便可以隨機抽取已有經(jīng)歷學習,有利于提高神經(jīng)網(wǎng)絡(luò)更新的效率。此外,F(xiàn)ixed Q-targets 的應用需要打亂相關(guān)性,若在移動機器人路徑規(guī)劃中應 用 fixed Q-targets,DQN所涉及到的2個結(jié)構(gòu)一致,但是參數(shù)存在差異的神經(jīng)網(wǎng)絡(luò),可以預估神經(jīng)網(wǎng)絡(luò)參數(shù),加強路徑規(guī)劃精準性。
如今移動機器人技術(shù)已經(jīng)非常先進,在計算機、傳感器、人工智能等各項技術(shù)的飛速發(fā)展下,路徑規(guī)劃也獲得了非常顯著的研究效果,但是路徑規(guī)劃算法之間的差異、限制,還需要在基礎(chǔ)理論與技術(shù)層面加以優(yōu)化。立足于移動機器人路徑規(guī)劃算法的發(fā)展現(xiàn)狀,路徑規(guī)劃算法今后的發(fā)展前景非常可觀,也為我國人工智能行業(yè)的發(fā)展夯實了基礎(chǔ)。為此,分析今后移動機器人路徑規(guī)劃算法的應用前景,主要表現(xiàn)在以下四方面:
第一,現(xiàn)有的路徑規(guī)劃算法將得到不斷改進與優(yōu)化。路徑規(guī)劃算法的應用,其中任意一種算法難免會遇到問題,特別是算法自身存在的局限性。在移動機器人路徑規(guī)劃中進行改進,有利于提高算法性能,將移動機器人面臨的問題予以解決。
第二,混合算法將得到廣泛應用。路徑規(guī)劃中采用混合算法,是將不同算法進行組合。獨立算法無法解決切實存在的路徑規(guī)劃問題,特別是交叉學科面臨的新問題??紤]到研發(fā)各種新算法具有很大難度,所以可以通過不同的路徑規(guī)劃算法優(yōu)勢,達到互補效果,為解決路徑規(guī)劃問題探索新思路。例如群體智能算法、強化學習算法和神經(jīng)網(wǎng)絡(luò)等,在移動機器人路徑規(guī)劃問題均得到了組合應用,通過這種互補混合算法,不僅加快了算法之間的融合,利用取長補短與優(yōu)勢互補,還會延伸出大量優(yōu)秀算法。人工智能、數(shù)理、仿生算法等經(jīng)過組合之后,在移動機器人路徑規(guī)劃中應用也呈現(xiàn)出可觀的發(fā)展前景。
第三,多種機器人協(xié)同合作。移動機器人的作業(yè)范圍近年來逐漸拓寬,加上作業(yè)任務難度增加、復雜程度更高,所以單一機器人無法快速完成規(guī)定的任務,此時便要多種機器人協(xié)同合作,既可以提高機器人的工作效率,又能夠杜絕因改變作業(yè)環(huán)境、機器人系統(tǒng)局部故障等原因造成的工作停滯事故。單一機器人處于某種關(guān)注環(huán)境下,有時并不能很好地達到使用要求,通過多機器人協(xié)同合作的方法可以解決該問題。另外,多機器人在運行期間也會出現(xiàn)一些故障,例如路徑規(guī)劃更加復雜,障礙物和機器人數(shù)量更多,也在路徑規(guī)劃階段面臨困難。所以,多種機器人協(xié)同運行將成為今后行業(yè)領(lǐng)域內(nèi)研究的重點。
第四,當移動機器人處在比較復雜的且多維環(huán)境下,移動機器人路徑規(guī)劃將成為關(guān)注要點。面對具體對象,移動機器人路徑規(guī)劃一般是以陸地作業(yè)機器人路徑規(guī)劃為對象,此條件下比較常用掃地機器人、反恐防爆機器人。面對空中飛行機器人、水下機器人,對比掃地機器人等生活中使用幾率比較高的設(shè)備,總體來說研究不夠深入。目前,空間探測對移動機器人提出的嚴格要求,所以移動機器人研究重點也開始轉(zhuǎn)移到崎嶇地形、障礙物比較多的復雜環(huán)境。立足于路徑規(guī)劃環(huán)境描述這一角度,二維平面環(huán)境下的路徑規(guī)劃工作量比較大,三維環(huán)境的路徑規(guī)劃相對較少。即便如此,仍然有一些移動機器人的工作環(huán)境為三維環(huán)境空間,例如飛行器。此外,陸地機器人一般是在相對穩(wěn)定的陸地環(huán)境中運行,飛行機器人和仿生魚類機器人的工作環(huán)境與之相比,其惡劣程度也有所增加,傳感器的使用也更加嚴格,還存在一些危險因素。為此,飛行器、仿生魚類機器人在研究過程中需要重點分析,全面總結(jié),從現(xiàn)實環(huán)境著手展開移動機器人路徑規(guī)劃。
綜上所述,移動機器人是在人工智能技術(shù)基礎(chǔ)上延伸而來的全新行業(yè)領(lǐng)域,融合了互聯(lián)網(wǎng)、人工智能等多項先進技術(shù)。機器人研究最為重要的是路徑規(guī)劃,在此環(huán)節(jié)需要使用大量算法,只有如此才能夠規(guī)劃最優(yōu)機器人行進路線,提高運行效率與質(zhì)量,以免因為路徑規(guī)劃不合理,導致出現(xiàn)延長行進時間的現(xiàn)象?;诒疚牡姆治觯瑘D搜索算法、快速隨機搜索樹、智能仿生算法、遺傳算法、模擬退火算法、人工勢場算法等均可以在路徑規(guī)劃中應用,除了單一算法的使用外,還可以將算法組合應用,進一步優(yōu)化路徑規(guī)劃效果。此外,工作人員對現(xiàn)有算法進行改進,還可以起到良好的優(yōu)化效果,提高移動機器人行進效率,也為我國移動機器人的研究積累經(jīng)驗。