中國科學院深圳先進技術研究院智能仿生研究中心歐勇盛研究團隊在機器人動態(tài)系統(tǒng)示教學習方面的研究取得進展。相應成果為“Duan JH, Ou YS, Hu JB, et al. Fast and stable learning of dynamical systems based on extreme learning machine[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49(6): 1175-1185(基于超限學習機的動態(tài)系統(tǒng)快速穩(wěn)定學習)”。
機器人操作的應用場景廣泛、潛力巨大,但無論是在常規(guī)環(huán)境中,如工廠中拾取工件或搬運貨物、家庭中協(xié)助取物或打掃衛(wèi)生,還是在特殊環(huán)境中,如海底進行沉船打撈、空間站從事在軌加注實驗,機器人都必須掌握復雜精巧任務的操作能力。但就現(xiàn)階段而言,大部分機器人仍然部署在結構化環(huán)境中,按照人工預定義的規(guī)則從事單一、重復和具有規(guī)律性的工作。對于許多人類能掌握的復雜技能,機器人仍然很難有效地掌握。因此,賦予機器人從人類的經(jīng)驗和習慣中學習控制策略的能力,實現(xiàn)對更復雜一類操作技能的掌握,是提高機器人智能化水平、降低機器人使用門檻和部署周期、促進產(chǎn)業(yè)升級的重要途徑。
該研究采用示教學習(Learning from Demonstrations)技術通過從人類示教的數(shù)據(jù)中建立動態(tài)系統(tǒng)模型,使機器人理解和學習點到點運動技能。具體地,提出一種機器人動態(tài)系統(tǒng)快速穩(wěn)定的學習方法——將機器人的點到點運動過程建模為一個自治的動態(tài)系統(tǒng),并使用超限學習機(Extreme Learning Machine)這種結構簡單、訓練快速的神經(jīng)網(wǎng)絡對模型進行訓練。同時,為保證訓練出的系統(tǒng)具有穩(wěn)定性,將李雅普諾夫穩(wěn)定性約束融入到機器人點到點運動學習的優(yōu)化過程中,確保到點運動既能最大程度地模仿人類示教的輪廓,也能穩(wěn)定收斂到期望的目標位置。
基于洛桑聯(lián)邦理工學院 LASA 實驗室開發(fā)的手寫運動數(shù)據(jù)集,將所提出的方法與現(xiàn)有方法進行對比實驗。結果顯示,所提出的方法在綜合考慮準確性、穩(wěn)定性和學習速度的情況下,與現(xiàn)有 SEDS 方法相比,精度提高了 17%~27%,訓練速度提高了 68%~84%。
該研究所提出的示教學習方法充分利用了前饋神經(jīng)網(wǎng)絡超限學習機的快速學習能力和李雅普諾夫理論對穩(wěn)定性的約束能力,構成了解決控制穩(wěn)定性、復現(xiàn)精度和學習效率三者矛盾的新方案,是傳統(tǒng)控制理論在智能機器人技術中的新突破。所提出的方法體現(xiàn)了機器人能夠在掌握人類控制策略或行為習慣的前提下,完成預期的任務目標,反映出一定的泛化性與實用性。
圖 1 基于動態(tài)系統(tǒng)的點到點運動學習流程圖
圖 2 20 組手寫運動學習后的復現(xiàn)運動軌跡