易嗣力 華南師范大學(xué)
在當(dāng)代機(jī)器人應(yīng)用領(lǐng)域中,多機(jī)器人系統(tǒng)路徑規(guī)劃一直屬于關(guān)鍵性問題,不但要把單體機(jī)器人路徑規(guī)劃任務(wù)處理好,而且對(duì)多個(gè)機(jī)器人間的系統(tǒng)合作問題也需要處理。對(duì)此量子博弈論在其中就發(fā)揮了重要作用。
對(duì)策率即所謂的博弈論,屬于運(yùn)籌學(xué)的重要分支,在現(xiàn)代教學(xué)中也屬重要教學(xué)內(nèi)容。博弈論主要對(duì)擁有個(gè)體競(jìng)爭(zhēng)特征的一些現(xiàn)象進(jìn)行研究,并且,把競(jìng)爭(zhēng)體之間的關(guān)系用公式的形式表述出來(lái),判斷研究,并對(duì)其實(shí)際行為與理想行為等進(jìn)行優(yōu)化。通過在多機(jī)器人系統(tǒng)內(nèi)應(yīng)用,有著合作與競(jìng)爭(zhēng)的關(guān)系存在于機(jī)器人個(gè)體之間,所以,可以通過相互博弈的雙方來(lái)看待它,所以,我們可以從博弈論出發(fā),規(guī)劃多機(jī)器人系統(tǒng)路徑。
在當(dāng)代移動(dòng)機(jī)器人應(yīng)用中,路徑規(guī)劃屬于其中的一個(gè)重要的問題,到目前為止,研究成果在不斷增多,并且,多機(jī)器人可以在很多復(fù)雜的環(huán)境下進(jìn)行路徑規(guī)劃。按照多樣化的規(guī)劃內(nèi)容,進(jìn)行多途徑的設(shè)計(jì)規(guī)劃,例如,規(guī)劃局部路徑與規(guī)劃全局路徑,按照工作環(huán)境判斷能否跟著時(shí)間而改變,還可以分為動(dòng)態(tài)路徑規(guī)劃以及靜態(tài)路徑規(guī)劃。
而在增加了工作任務(wù)難度以及環(huán)境復(fù)雜度以后,在某種程度上擴(kuò)大了多機(jī)器人系統(tǒng)的應(yīng)用,而且,在當(dāng)前形勢(shì)下,多機(jī)器人系統(tǒng)的路徑規(guī)劃已經(jīng)成為了熱點(diǎn)研究問題。在動(dòng)態(tài)的空間中,要求集體與單個(gè)機(jī)器人間能夠互相合作,所以,多機(jī)器人簡(jiǎn)單的避障與協(xié)調(diào)前進(jìn)是多機(jī)器人路徑規(guī)劃的難點(diǎn),在研究實(shí)施路徑規(guī)劃時(shí)期發(fā)展空間也很大
我們從博弈論入手,制定規(guī)劃路徑的方案,我們可以用一個(gè)整體來(lái)看待多機(jī)器人系統(tǒng),也就是想任務(wù)目標(biāo)點(diǎn)處發(fā)展所有機(jī)器人,這樣認(rèn)定為路徑規(guī)劃完全完成,只有部分或者一個(gè)完成,不可以視為完成了整體。在規(guī)劃路徑時(shí),規(guī)定機(jī)器人間既不能和其他機(jī)器人相撞,也不能和障礙物碰撞到一起。因此,我們可以這樣定義最優(yōu)解,在有障礙物的環(huán)境內(nèi)規(guī)劃各個(gè)機(jī)器人的運(yùn)行路徑,規(guī)定每方間要系統(tǒng)工作,從而用最少的時(shí)間將機(jī)器人運(yùn)送到目的地。
我們可以按照以下步驟設(shè)計(jì)博弈模型:
第一、用博弈的N個(gè)參與者來(lái)定義數(shù)量為N的機(jī)器人。而且,是在參與游戲者之間形成的博弈關(guān)系,然而,我們應(yīng)該在整體的角度內(nèi)控制路徑的最優(yōu)解。所以,我們需要用博弈參與者來(lái)看待各個(gè)機(jī)器人,而不可用整體的眼光看待它。
第二、各個(gè)參與方都有屬于自身的方法空間,含有自身可行的方法行為。并且盡量選擇最短的路徑,幾乎不會(huì)有困難選擇的情況發(fā)生。就選擇困難而言指的是有太多的可以選擇策略,造成參與者有著較長(zhǎng)的選擇時(shí)間,或者在選擇的死循環(huán)內(nèi)無(wú)法掙脫從,從而造成無(wú)法正確的選擇。
第三、收益函數(shù)的建立。參與方選擇的策略行為和所獲取利益的映射關(guān)系即為收益函數(shù),在向此問題內(nèi)深入,即為選擇的機(jī)器人可行性路徑和達(dá)到目標(biāo)任務(wù)時(shí)間大小的映射。
第四、參與方的自利情況。當(dāng)前我們所見到的機(jī)器人可以說(shuō)越來(lái)越智能化,所以,固化其路徑時(shí)也會(huì)變的也來(lái)越復(fù)雜,所以,對(duì)于機(jī)器人的自利性必須要認(rèn)真的進(jìn)行考慮,也就參與者總是按照本身最大的收益進(jìn)行執(zhí)行的。因此,對(duì)于參與方的自利因素必須要進(jìn)行充分的考慮。因?yàn)樽岳缘拇嬖诰蜁?huì)誘發(fā)相應(yīng)的沖突,造成最優(yōu)的個(gè)體沖突出現(xiàn),這是要進(jìn)行展開相應(yīng)的博弈,然后將某個(gè)參與方的最優(yōu)放棄掉,從而將整體最優(yōu)創(chuàng)造出來(lái)。
第五、設(shè)立約束條件。因?yàn)樵谝?guī)劃路徑時(shí)不可將障礙物穿過,因此,可以清晰的界定可視圖內(nèi)的約束條件,而且,保證各個(gè)路徑不可從障礙物穿過,應(yīng)該及時(shí)避開。
第六、建立數(shù)學(xué)模型。為例在博弈問題基礎(chǔ)上規(guī)劃多機(jī)器人路徑,首先應(yīng)該將此博弈問題的數(shù)學(xué)模型建立起來(lái)。
建立環(huán)境地圖:
在平面直角坐標(biāo)系XOY中防止多機(jī)器人工作環(huán)境,然后利用坐標(biāo)標(biāo)準(zhǔn)出各個(gè)機(jī)器人的位置。用(x,y)表示工作環(huán)境中任意一個(gè)點(diǎn)的坐標(biāo),然后坐標(biāo)變化第i個(gè)機(jī)器人的路徑,用xioiyi表示新的坐標(biāo),其中,機(jī)器人的i的起始點(diǎn)用此坐標(biāo)原點(diǎn)表示,m為目標(biāo)點(diǎn),其中,目標(biāo)點(diǎn)m和起始點(diǎn)i的連線用xi軸表示。平均劃分m,其中,xij(j=1,2...m-1)為等分點(diǎn)坐標(biāo),直線Lij經(jīng)過點(diǎn)Xij且與xi軸垂直,并且,把點(diǎn)pij設(shè)置在Lij軸上,并且用Yij記做該點(diǎn)和Xij的距離,這樣在整個(gè)工作環(huán)境中我們就可以通過(Xij,Yij)表示第i個(gè)機(jī)器人的第j個(gè)路徑點(diǎn)。
第七、注意的事項(xiàng)分析。在規(guī)劃多機(jī)器人路徑時(shí),洪不會(huì)自利的智能體來(lái)看待機(jī)器人,刨除機(jī)器人的理性和自利性。在規(guī)劃的路徑中將理性智能化機(jī)器人作為嚴(yán)重重點(diǎn),所以,必須要時(shí)刻關(guān)注它的自利性與理性特征,更多對(duì)個(gè)體意志進(jìn)行表達(dá),從而就會(huì)導(dǎo)致有很多復(fù)雜的內(nèi)容出現(xiàn)在機(jī)器人路徑規(guī)劃工作中,不斷加大其協(xié)調(diào)難度,計(jì)算變的更加復(fù)雜。此種強(qiáng)烈表現(xiàn)個(gè)體意志性與理性的博弈參與方,將會(huì)把本身收益最大的策略行為選擇出來(lái),從而更好的完成相應(yīng)的目標(biāo)任務(wù)。個(gè)體最優(yōu)表現(xiàn)在博弈中,并不能代表具有最優(yōu)化的集體,所以,應(yīng)該科學(xué)的在兩者之間展開權(quán)衡和選擇,然而因?yàn)椴┺膮⑴c者的自利性與理性存在,所以,往往在納什均衡中促使參與者運(yùn)行和工作,這樣更改起來(lái)也會(huì)比較困難,從而會(huì)產(chǎn)生較多的問題。為了實(shí)現(xiàn)集體與個(gè)體利益的統(tǒng)一,我們可以基于經(jīng)典博弈展開拓展,把相應(yīng)的量子博弈模型建立起來(lái),從而達(dá)到集體利益與個(gè)體利益統(tǒng)一的目的,從而把經(jīng)典博弈內(nèi)無(wú)法處理的問題有效的解決掉。
我們從路徑劃分入手對(duì)多機(jī)器人研究領(lǐng)域的重要性問題進(jìn)行了研究分析,并且對(duì)此問題的重要研究?jī)?nèi)容進(jìn)行了芻議,通過與發(fā)展現(xiàn)狀相結(jié)合,選擇出最優(yōu)的算取方式,與量子博弈論的學(xué)習(xí)研究相結(jié)合,在對(duì)大量文獻(xiàn)進(jìn)行閱讀的前提下,對(duì)量子博弈論下多機(jī)器人路徑規(guī)劃的內(nèi)容進(jìn)行了細(xì)致的剖析,并且,對(duì)理性與自利性下博弈論的發(fā)展內(nèi)容進(jìn)行了分析,從而為更好研究人員在實(shí)際工作中提供一定的理論與技術(shù)支撐。