基于量子博弈論的多機(jī)器人路徑規(guī)劃分析

2019-12-01 23:23易嗣力華南師范大學(xué)

數(shù)碼世界 2019年4期

易嗣力華南師范大學(xué)

在當(dāng)代機(jī)器人應(yīng)用領(lǐng)域中，多機(jī)器人系統(tǒng)路徑規(guī)劃一直屬于關(guān)鍵性問題，不但要把單體機(jī)器人路徑規(guī)劃任務(wù)處理好，而且對(duì)多個(gè)機(jī)器人間的系統(tǒng)合作問題也需要處理。對(duì)此量子博弈論在其中就發(fā)揮了重要作用。

1 量子博弈論與多機(jī)器人路徑規(guī)劃概述

1.1 量子博弈論

對(duì)策率即所謂的博弈論，屬于運(yùn)籌學(xué)的重要分支，在現(xiàn)代教學(xué)中也屬重要教學(xué)內(nèi)容。博弈論主要對(duì)擁有個(gè)體競(jìng)爭(zhēng)特征的一些現(xiàn)象進(jìn)行研究，并且，把競(jìng)爭(zhēng)體之間的關(guān)系用公式的形式表述出來(lái)，判斷研究，并對(duì)其實(shí)際行為與理想行為等進(jìn)行優(yōu)化。通過在多機(jī)器人系統(tǒng)內(nèi)應(yīng)用，有著合作與競(jìng)爭(zhēng)的關(guān)系存在于機(jī)器人個(gè)體之間，所以，可以通過相互博弈的雙方來(lái)看待它，所以，我們可以從博弈論出發(fā)，規(guī)劃多機(jī)器人系統(tǒng)路徑。

1.2 多機(jī)器人路徑規(guī)劃

在當(dāng)代移動(dòng)機(jī)器人應(yīng)用中，路徑規(guī)劃屬于其中的一個(gè)重要的問題，到目前為止，研究成果在不斷增多，并且，多機(jī)器人可以在很多復(fù)雜的環(huán)境下進(jìn)行路徑規(guī)劃。按照多樣化的規(guī)劃內(nèi)容，進(jìn)行多途徑的設(shè)計(jì)規(guī)劃，例如，規(guī)劃局部路徑與規(guī)劃全局路徑，按照工作環(huán)境判斷能否跟著時(shí)間而改變，還可以分為動(dòng)態(tài)路徑規(guī)劃以及靜態(tài)路徑規(guī)劃。

而在增加了工作任務(wù)難度以及環(huán)境復(fù)雜度以后，在某種程度上擴(kuò)大了多機(jī)器人系統(tǒng)的應(yīng)用，而且，在當(dāng)前形勢(shì)下，多機(jī)器人系統(tǒng)的路徑規(guī)劃已經(jīng)成為了熱點(diǎn)研究問題。在動(dòng)態(tài)的空間中，要求集體與單個(gè)機(jī)器人間能夠互相合作，所以，多機(jī)器人簡(jiǎn)單的避障與協(xié)調(diào)前進(jìn)是多機(jī)器人路徑規(guī)劃的難點(diǎn)，在研究實(shí)施路徑規(guī)劃時(shí)期發(fā)展空間也很大

2 具體的規(guī)劃方法分析

我們從博弈論入手，制定規(guī)劃路徑的方案，我們可以用一個(gè)整體來(lái)看待多機(jī)器人系統(tǒng)，也就是想任務(wù)目標(biāo)點(diǎn)處發(fā)展所有機(jī)器人，這樣認(rèn)定為路徑規(guī)劃完全完成，只有部分或者一個(gè)完成，不可以視為完成了整體。在規(guī)劃路徑時(shí)，規(guī)定機(jī)器人間既不能和其他機(jī)器人相撞，也不能和障礙物碰撞到一起。因此，我們可以這樣定義最優(yōu)解，在有障礙物的環(huán)境內(nèi)規(guī)劃各個(gè)機(jī)器人的運(yùn)行路徑，規(guī)定每方間要系統(tǒng)工作，從而用最少的時(shí)間將機(jī)器人運(yùn)送到目的地。

我們可以按照以下步驟設(shè)計(jì)博弈模型：

第一、用博弈的N個(gè)參與者來(lái)定義數(shù)量為N的機(jī)器人。而且，是在參與游戲者之間形成的博弈關(guān)系，然而，我們應(yīng)該在整體的角度內(nèi)控制路徑的最優(yōu)解。所以，我們需要用博弈參與者來(lái)看待各個(gè)機(jī)器人，而不可用整體的眼光看待它。

第二、各個(gè)參與方都有屬于自身的方法空間，含有自身可行的方法行為。并且盡量選擇最短的路徑，幾乎不會(huì)有困難選擇的情況發(fā)生。就選擇困難而言指的是有太多的可以選擇策略，造成參與者有著較長(zhǎng)的選擇時(shí)間，或者在選擇的死循環(huán)內(nèi)無(wú)法掙脫從，從而造成無(wú)法正確的選擇。

第三、收益函數(shù)的建立。參與方選擇的策略行為和所獲取利益的映射關(guān)系即為收益函數(shù)，在向此問題內(nèi)深入，即為選擇的機(jī)器人可行性路徑和達(dá)到目標(biāo)任務(wù)時(shí)間大小的映射。

第四、參與方的自利情況。當(dāng)前我們所見到的機(jī)器人可以說(shuō)越來(lái)越智能化，所以，固化其路徑時(shí)也會(huì)變的也來(lái)越復(fù)雜，所以，對(duì)于機(jī)器人的自利性必須要認(rèn)真的進(jìn)行考慮，也就參與者總是按照本身最大的收益進(jìn)行執(zhí)行的。因此，對(duì)于參與方的自利因素必須要進(jìn)行充分的考慮。因?yàn)樽岳缘拇嬖诰蜁?huì)誘發(fā)相應(yīng)的沖突，造成最優(yōu)的個(gè)體沖突出現(xiàn)，這是要進(jìn)行展開相應(yīng)的博弈，然后將某個(gè)參與方的最優(yōu)放棄掉，從而將整體最優(yōu)創(chuàng)造出來(lái)。

第五、設(shè)立約束條件。因?yàn)樵谝?guī)劃路徑時(shí)不可將障礙物穿過，因此，可以清晰的界定可視圖內(nèi)的約束條件，而且，保證各個(gè)路徑不可從障礙物穿過，應(yīng)該及時(shí)避開。

第六、建立數(shù)學(xué)模型。為例在博弈問題基礎(chǔ)上規(guī)劃多機(jī)器人路徑，首先應(yīng)該將此博弈問題的數(shù)學(xué)模型建立起來(lái)。

建立環(huán)境地圖：

在平面直角坐標(biāo)系XOY中防止多機(jī)器人工作環(huán)境，然后利用坐標(biāo)標(biāo)準(zhǔn)出各個(gè)機(jī)器人的位置。用（x，y）表示工作環(huán)境中任意一個(gè)點(diǎn)的坐標(biāo)，然后坐標(biāo)變化第i個(gè)機(jī)器人的路徑，用xioiyi表示新的坐標(biāo)，其中，機(jī)器人的i的起始點(diǎn)用此坐標(biāo)原點(diǎn)表示，m為目標(biāo)點(diǎn)，其中，目標(biāo)點(diǎn)m和起始點(diǎn)i的連線用xi軸表示。平均劃分m，其中，xij（j＝1,2...m-1）為等分點(diǎn)坐標(biāo)，直線Lij經(jīng)過點(diǎn)Xij且與xi軸垂直，并且，把點(diǎn)pij設(shè)置在Lij軸上，并且用Yij記做該點(diǎn)和Xij的距離，這樣在整個(gè)工作環(huán)境中我們就可以通過（Xij，Yij）表示第i個(gè)機(jī)器人的第j個(gè)路徑點(diǎn)。

第七、注意的事項(xiàng)分析。在規(guī)劃多機(jī)器人路徑時(shí)，洪不會(huì)自利的智能體來(lái)看待機(jī)器人，刨除機(jī)器人的理性和自利性。在規(guī)劃的路徑中將理性智能化機(jī)器人作為嚴(yán)重重點(diǎn)，所以，必須要時(shí)刻關(guān)注它的自利性與理性特征，更多對(duì)個(gè)體意志進(jìn)行表達(dá)，從而就會(huì)導(dǎo)致有很多復(fù)雜的內(nèi)容出現(xiàn)在機(jī)器人路徑規(guī)劃工作中，不斷加大其協(xié)調(diào)難度，計(jì)算變的更加復(fù)雜。此種強(qiáng)烈表現(xiàn)個(gè)體意志性與理性的博弈參與方，將會(huì)把本身收益最大的策略行為選擇出來(lái)，從而更好的完成相應(yīng)的目標(biāo)任務(wù)。個(gè)體最優(yōu)表現(xiàn)在博弈中，并不能代表具有最優(yōu)化的集體，所以，應(yīng)該科學(xué)的在兩者之間展開權(quán)衡和選擇，然而因?yàn)椴┺膮⑴c者的自利性與理性存在，所以，往往在納什均衡中促使參與者運(yùn)行和工作，這樣更改起來(lái)也會(huì)比較困難，從而會(huì)產(chǎn)生較多的問題。為了實(shí)現(xiàn)集體與個(gè)體利益的統(tǒng)一，我們可以基于經(jīng)典博弈展開拓展，把相應(yīng)的量子博弈模型建立起來(lái)，從而達(dá)到集體利益與個(gè)體利益統(tǒng)一的目的，從而把經(jīng)典博弈內(nèi)無(wú)法處理的問題有效的解決掉。

3 結(jié)語(yǔ)