何杏宇 王怡 楊桂松 賈明權(quán) 周玥 徐心玥
摘 要:現(xiàn)有多智能體系統(tǒng)網(wǎng)絡(luò)研究方法缺乏對(duì)局部網(wǎng)絡(luò)質(zhì)量與區(qū)域性任務(wù)需求之間的匹配分析,這將影響任務(wù)的完成效率和質(zhì)量,為此提出一種基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。首先,利用智能體移動(dòng)狀態(tài)分析系統(tǒng)網(wǎng)絡(luò)的間歇連通性;然后,結(jié)合任務(wù)需求以及系統(tǒng)的間歇網(wǎng)絡(luò)連通性構(gòu)建基于主從模式的多智能體子網(wǎng)集合,進(jìn)而從三個(gè)方面評(píng)估子網(wǎng)集合的連通質(zhì)量;最后,提出基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動(dòng)優(yōu)化模型,用最大的子網(wǎng)集合連通質(zhì)量表示多智能體網(wǎng)絡(luò)連通質(zhì)量,在智能體移動(dòng)距離和網(wǎng)絡(luò)連通質(zhì)量的約束下求解任務(wù)完成率最大化的多智能體移動(dòng)策略,通過該策略形成多智能體網(wǎng)絡(luò)以執(zhí)行任務(wù)。實(shí)驗(yàn)結(jié)果表明,該方法可以有效控制網(wǎng)絡(luò)連通質(zhì)量,維持任務(wù)完成率并提高智能體移動(dòng)效用。
關(guān)鍵詞:多智能體系統(tǒng);任務(wù)需求;網(wǎng)絡(luò)連通性分析;網(wǎng)絡(luò)連通質(zhì)量
中圖分類號(hào):TP393.03 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2023)10-037-3125-07
doi:10.19734/j.issn.1001-3695.2023.02.0042
Network connectivity quality control method based on matching task requirement
He Xingyu1a,1b,Wang Yi1a,Yang Guisong1a,Jia Mingquan2,Zhou Yue1b,Xu Xinyue1b
(1.a.School of Optical-Electrical & Computer Engineering,b.College of Communication & Art Design,University of Shanghai for Science & Technology,Shanghai 200093,China;2.Southwest China Institute of Electronic Technology,Chengdu 610036,China)
Abstract:The existing multi-agent network researches ignore the matching between qualities of local networks and the requirements of regional tasks,which influences task completion efficiency and quality.In view of this,this paper proposed a network connectivity quality control method based on matching task requirement.Firstly,this method analyzed the intermittent connectivity of multi-agent network by using states of agents.Secondly,it constructed a subnet set based on leader-follower model to execute tasks,according to the requirements of tasks and the intermittent connectivity of network,and it further evaluated the connectivity quality of the subnet set.Finally,this method designed a multi-agent mobility optimization model based on network connectivity quality,in which the maximum connectivity quality of subnet set represented to the network connectivity quality.Under the constraints of agents mobile distance and network connectivity quality,this model obtained multi-agent mobility strategy with optimal task completion rate.Experimental results verify that the proposed method can effectively control the network connectivity quality,maintain the task completion rate and improve the mobile utility of agents.
Key words:multi-agent system;task requirement;network connectivity analysis;network connectivity quality
0 引言
隨著通信控制、人工智能、工業(yè)制造等諸多領(lǐng)域的快速發(fā)展,多智能體系統(tǒng)已經(jīng)成為一個(gè)新的研究熱點(diǎn)。因具有低人力成本、快速處理大量數(shù)據(jù)、高效智能自主決策等優(yōu)點(diǎn),被廣泛應(yīng)用于軍事作戰(zhàn)[1]、環(huán)境監(jiān)測(cè)[2]、智能交通[3]和智慧工廠[4]等場(chǎng)景。在上述場(chǎng)景中,多智能體形成連通的網(wǎng)絡(luò)以交互信息從而協(xié)同完成任務(wù)。為了保證任務(wù)完成效率和質(zhì)量,如何調(diào)整多智能體網(wǎng)絡(luò)的連通性以匹配任務(wù)需求是多智能體系統(tǒng)中的一個(gè)關(guān)鍵問題。從網(wǎng)絡(luò)連通性的角度分析,現(xiàn)有的多智能體網(wǎng)絡(luò)可以分為持續(xù)連通網(wǎng)絡(luò)和間歇連通網(wǎng)絡(luò)。
持續(xù)連通的多智能體網(wǎng)絡(luò)在執(zhí)行任務(wù)時(shí)具有可靠性和穩(wěn)定性,現(xiàn)有研究的目標(biāo)可分為維持網(wǎng)絡(luò)持續(xù)連通性和連通性約束下優(yōu)化多智能體協(xié)同執(zhí)行任務(wù)的過程。前者通過同步、跟蹤的方式保證網(wǎng)絡(luò)持續(xù)連通[5,6];后者在全局連通性[7~9]或局部連通性[10]的約束下,改變多智能體的網(wǎng)絡(luò)連通性以協(xié)同執(zhí)行任務(wù)。但是在實(shí)際執(zhí)行協(xié)同任務(wù)的過程中存在智能體移動(dòng)性和惡劣環(huán)境等因素的限制,使多智能體網(wǎng)絡(luò)很難保持持續(xù)連通,同時(shí)持續(xù)連通網(wǎng)絡(luò)的部署維護(hù)成本高且智能體的移動(dòng)距離受限,將導(dǎo)致其無法高效執(zhí)行任務(wù)。
為克服持續(xù)連通網(wǎng)絡(luò)中存在的問題,現(xiàn)有研究利用網(wǎng)絡(luò)的間歇連通性執(zhí)行任務(wù)。間歇連通的多智能體能夠靈活地組網(wǎng)以完成任務(wù),現(xiàn)有研究的目標(biāo)可分為實(shí)現(xiàn)多智能體共識(shí)[11,12]和探索任務(wù)環(huán)境以協(xié)同執(zhí)行任務(wù)[13~15]。前者為了解決間歇連通多智能體的信息滯后問題,在某種共識(shí)下智能體之間及時(shí)通信并共享信息以協(xié)同完成任務(wù);后者放寬智能體移動(dòng)范圍,無須時(shí)刻保持多智能體的網(wǎng)絡(luò)連通性就能協(xié)同完成任務(wù)。但是,間歇連通的多智能體之間通信不穩(wěn)定,難以形成可靠的通信鏈路和穩(wěn)定的多智能體網(wǎng)絡(luò),這將影響任務(wù)完成效率。為了提高間歇連通網(wǎng)絡(luò)的穩(wěn)定性,現(xiàn)有研究提出了周期性間歇連通網(wǎng)絡(luò),該網(wǎng)絡(luò)通過控制網(wǎng)絡(luò)節(jié)點(diǎn)的移動(dòng)軌跡來實(shí)現(xiàn)。文獻(xiàn)[16]提出了具有彈性共識(shí)的多智能體時(shí)變通信方法,多智能體沿著路徑移動(dòng),在組內(nèi)或組間形成周期性的通信。文獻(xiàn)[17,18]對(duì)間歇連通智能體的移動(dòng)進(jìn)行約束,令智能體沿環(huán)形軌跡運(yùn)動(dòng),使智能體之間的通信具有周期性。
然而,現(xiàn)有的周期性間歇連通網(wǎng)絡(luò)研究大多關(guān)注的是全局網(wǎng)絡(luò)連通性,較少關(guān)注局部網(wǎng)絡(luò)連通性以及局部網(wǎng)絡(luò)連通性與任務(wù)的匹配情況,這將影響多智能體的任務(wù)完成效率和質(zhì)量。多智能體網(wǎng)絡(luò)與以數(shù)據(jù)傳輸為主要目的的網(wǎng)絡(luò)不同,后者通過關(guān)注全局網(wǎng)絡(luò)連通性充分利用整個(gè)網(wǎng)絡(luò)中存在的數(shù)據(jù)傳輸路徑以提高數(shù)據(jù)傳輸性能,而前者是面向任務(wù)需求實(shí)現(xiàn)組網(wǎng),任務(wù)的執(zhí)行情況與覆蓋該任務(wù)的局部子網(wǎng)密切相關(guān)。
鑒于現(xiàn)有研究中缺乏針對(duì)任務(wù)需求匹配的局部網(wǎng)絡(luò)性能分析方法,本文提出了基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。根據(jù)任務(wù)所在位置和任務(wù)所需智能體數(shù)量來調(diào)整智能體的移動(dòng)狀態(tài),令其形成匹配任務(wù)需求的多智能體子網(wǎng)集合以協(xié)同執(zhí)行任務(wù)。首先分析多智能體系統(tǒng)的間歇網(wǎng)絡(luò)連通性;然后,根據(jù)任務(wù)需求構(gòu)建基于主從模式的多智能體子網(wǎng)集合來執(zhí)行任務(wù),進(jìn)而從子網(wǎng)集合與任務(wù)需求的匹配度、子網(wǎng)集合的穩(wěn)定性和子網(wǎng)集合中智能體的負(fù)載三個(gè)方面評(píng)估子網(wǎng)集合的連通質(zhì)量;最后提出一種基于網(wǎng)絡(luò)連通質(zhì)量的多智能體移動(dòng)優(yōu)化模型,用最大的子網(wǎng)集合連通質(zhì)量表示多智能體網(wǎng)絡(luò)連通質(zhì)量,在智能體移動(dòng)距離和網(wǎng)絡(luò)連通質(zhì)量的約束下最大化任務(wù)完成率。本文為了匹配多智能體局部網(wǎng)絡(luò)的質(zhì)量和區(qū)域性任務(wù)的需求,根據(jù)任務(wù)所在位置和所需智能體數(shù)量構(gòu)造基于主從模式的子網(wǎng)集合,由子網(wǎng)中智能體協(xié)同執(zhí)行任務(wù);為了保證任務(wù)完成效率和質(zhì)量,提出了一種基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。
1 系統(tǒng)模型
本文構(gòu)建了一個(gè)多智能體系統(tǒng)模型,多智能體之間形成周期性間歇連通網(wǎng)絡(luò)以執(zhí)行平臺(tái)發(fā)布的任務(wù),其應(yīng)用場(chǎng)景如圖1所示。其中,平臺(tái)根據(jù)任務(wù)需求和智能體的當(dāng)前位置對(duì)智能體的移動(dòng)狀態(tài)進(jìn)行調(diào)整,以形成與任務(wù)需求匹配的周期性間歇連通子網(wǎng)集合。具體地,平臺(tái)從環(huán)境中收集任務(wù)信息和多智能體移動(dòng)狀態(tài),分析多智能體網(wǎng)絡(luò)的連通質(zhì)量,在智能體移動(dòng)距離和網(wǎng)絡(luò)連通質(zhì)量的約束下求解任務(wù)完成率最大化的多智能體移動(dòng)狀態(tài);平臺(tái)將該移動(dòng)策略傳遞給多智能體網(wǎng)絡(luò),多智能體網(wǎng)絡(luò)在執(zhí)行任務(wù)后向平臺(tái)反饋任務(wù)執(zhí)行結(jié)果。
1.1 智能體
系統(tǒng)中存在一組智能體,N個(gè)智能體構(gòu)成智能體集合為V={v1,v2,…,vi,…,vN}。其中,智能體的通信距離為Δ。這些智能體在時(shí)段Tk內(nèi)沿環(huán)形軌跡移動(dòng),形成周期性間歇連通的多智能體網(wǎng)絡(luò)。相比于在網(wǎng)絡(luò)中被視做一個(gè)隨機(jī)移動(dòng)的點(diǎn),沿環(huán)形軌跡移動(dòng)的智能體將獲取更多的連通機(jī)會(huì)和更廣的連通范圍。在時(shí)段Tk-1的初始時(shí)刻tk-1采樣智能體移動(dòng)狀態(tài)Sk-1,為匹配任務(wù)需求,在時(shí)刻tk智能體的移動(dòng)狀態(tài)調(diào)整為Sk。在時(shí)刻tk,多智能體移動(dòng)狀態(tài)的集合為Sk={sk1,sk2,…,ski,…,skN},其中,智能體vi的移動(dòng)狀態(tài)ski由其所處環(huán)形軌跡的圓心位置oki和軌跡上的移動(dòng)相位ωki組成,即ski={oki,ωki}。具體地,圓心位置oki∈L處于網(wǎng)格內(nèi)部,移動(dòng)相位ωki={0°,90°,180°,270°}有四種狀態(tài)。對(duì)于任意智能體,有相同的軌跡半徑r和軌跡上智能體移動(dòng)速度sp,且智能體沿順時(shí)針方向移動(dòng)。
1.2 任務(wù)
在時(shí)刻tk,系統(tǒng)中存在一系列任務(wù),M個(gè)任務(wù)的集合為A(k)={ak1,ak2,…,akj,…,akM}。其中,任務(wù)akj所在位置為apkj,且需要ankj個(gè)智能體協(xié)同完成。在時(shí)段Tk,多智能體組成網(wǎng)絡(luò)執(zhí)行任務(wù)集合A(k)中的任務(wù)。為了可靠地完成任務(wù),多智能體網(wǎng)絡(luò)需要保證穩(wěn)定通信,即智能體之間連通時(shí)長(zhǎng)超過τ。當(dāng)執(zhí)行任務(wù)akj的多智能體子網(wǎng)中存在圓心位置與任務(wù)位置重合的領(lǐng)隊(duì)智能體、與平臺(tái)直接連通的智能體,且子網(wǎng)中智能體的數(shù)量滿足任務(wù)需求時(shí)任務(wù)被完成。
1.3 平臺(tái)
本文搭建了集中控制平臺(tái),平臺(tái)調(diào)整智能體的移動(dòng)狀態(tài)以協(xié)同執(zhí)行任務(wù)。根據(jù)調(diào)整后多智能體的移動(dòng)狀態(tài)分析多智能體的網(wǎng)絡(luò)連通性,從所有智能體中選擇部分智能體組成子網(wǎng)以協(xié)同執(zhí)行任務(wù),并將任務(wù)執(zhí)行結(jié)果傳遞回平臺(tái)。在調(diào)整的過程中,關(guān)注智能體的移動(dòng)距離、任務(wù)完成率和網(wǎng)絡(luò)連通質(zhì)量以高質(zhì)量、高效率地完成任務(wù)。具體來說,為滿足時(shí)段Tk內(nèi)的任務(wù)需求,平臺(tái)在時(shí)刻tk調(diào)整智能體移動(dòng)狀態(tài)為Sk,智能體在時(shí)段Tk內(nèi)按調(diào)整后的軌跡移動(dòng)。另外,本文定義平臺(tái)所在位置為PPF,同時(shí)假設(shè)智能體調(diào)整移動(dòng)狀態(tài)的時(shí)間忽略不計(jì)。
舉個(gè)例子,假設(shè)網(wǎng)格的大小為6×6,平臺(tái)所在位置為(3,3),如圖2中藍(lán)色方形所示(參見電子版)。存在智能體集合V={v1,v2,v3,v4,v5},如圖2中綠色圓形所示,其移動(dòng)軌跡半徑為1個(gè)單位,軌跡上的移動(dòng)速度為1周/Δt。平臺(tái)未發(fā)布任務(wù)時(shí),智能體按照上一時(shí)段執(zhí)行任務(wù)的軌跡移動(dòng),如圖2(a)所示。在時(shí)刻tk,平臺(tái)發(fā)布任務(wù),為滿足任務(wù)需求,智能體移動(dòng)狀態(tài)由圖2(a)調(diào)整為圖2(b),在時(shí)段Tk,智能體按照?qǐng)D2(b)中的軌跡移動(dòng)以協(xié)同完成任務(wù)。調(diào)整智能體的移動(dòng)狀態(tài)時(shí),考慮任務(wù)完成率和智能體的移動(dòng)距離,關(guān)注執(zhí)行任務(wù)的子網(wǎng)的網(wǎng)絡(luò)連通質(zhì)量,形成滿足當(dāng)前任務(wù)需求的多智能體網(wǎng)絡(luò)。具體地,在時(shí)刻tk,平臺(tái)發(fā)布任務(wù)ak1,任務(wù)所在位置為(5,4),需要兩個(gè)連通的智能體協(xié)同完成,如圖中紅色三角形所示。分析圖2(a)中智能體與任務(wù)的距離,選擇智能體v2作為領(lǐng)隊(duì)直接執(zhí)行任務(wù)ak1。在時(shí)段Tk,為了滿足任務(wù)需求且減小智能體移動(dòng)距離,智能體v2和v4組成子網(wǎng)在整個(gè)時(shí)段內(nèi)保持連通且與平臺(tái)連通以執(zhí)行任務(wù),智能體v1、v3和v5保持原有移動(dòng)軌跡,如圖2(b)所示。此時(shí),每個(gè)智能體完成任務(wù)ak1的移動(dòng)距離分別為{0,1,0,2,0}。
為調(diào)整多智能體的移動(dòng)狀態(tài)以保證任務(wù)完成效率和質(zhì)量,本文分析多智能體組成網(wǎng)絡(luò)協(xié)同執(zhí)行任務(wù)的情況。主要變量符號(hào)及含義如表1所示。
2 多智能體系統(tǒng)的間歇網(wǎng)絡(luò)連通性分析
為分析多智能體網(wǎng)絡(luò)的連通性,平臺(tái)根據(jù)智能體的移動(dòng)狀態(tài)計(jì)算時(shí)段內(nèi)智能體之間的連通時(shí)長(zhǎng),篩選穩(wěn)定的智能體連通邊構(gòu)成穩(wěn)定通信的周期性間歇連通的多智能體網(wǎng)絡(luò),并獲得該網(wǎng)絡(luò)的連通矩陣。為執(zhí)行任務(wù),多智能體網(wǎng)絡(luò)中智能體移動(dòng)狀態(tài)如圖3(a)所示,對(duì)應(yīng)的網(wǎng)絡(luò)連通圖如圖3(b)所示。
a)根據(jù)智能體的移動(dòng)狀態(tài)Sk計(jì)算時(shí)段Tk內(nèi)智能體的位置。在時(shí)刻tk,智能體vi的環(huán)形軌跡圓心為oki、軌跡上移動(dòng)相位為ωki、智能體軌跡半徑為r且在軌跡上的移動(dòng)速度為sp。在時(shí)段Tk內(nèi)的任意時(shí)刻t,智能體vi的實(shí)時(shí)位置pti計(jì)算如下:
利用智能體的實(shí)時(shí)位置和智能體的通信距離判斷智能體之間的連通性。通過式(1)(2)計(jì)算時(shí)刻t智能體vi1和vi2的實(shí)時(shí)位置pti1和pti2。當(dāng)兩智能體之間的距離小于智能體的通信距離Δ,則認(rèn)為智能體vi1和vi2在該時(shí)刻連通,由此得到兩智能體連通的時(shí)刻。
b)本文定義了多智能體網(wǎng)絡(luò)的連通圖。在時(shí)段Tk,多智能體網(wǎng)絡(luò)的連通圖為Gk=(V,Ek),其中,節(jié)點(diǎn)集合V包含了N個(gè)多智能體,即V={v1,v2,…,vi,…,vN},邊集合Ek包含了任意兩節(jié)點(diǎn)之間的連通邊,即Ek={Ek1,2,Ek1,3,…,EkN-1,N}。其中,智能體vi1和vi2之間連通邊的集合為Eki1,i2={ei1,i2(ti1,i2,ti1,i2)},ti1,i2表示兩智能體開始連通的時(shí)刻,ti1,i2表示兩智能體結(jié)束連通的時(shí)刻。若兩智能體在一個(gè)時(shí)段內(nèi)多次連通,則集合中存在多條邊。
c)為了保證智能體之間通信的穩(wěn)定性,從多智能體網(wǎng)絡(luò)連通圖中篩選滿足智能體信息傳輸時(shí)長(zhǎng)的連通邊,獲得穩(wěn)定通信的多智能體網(wǎng)絡(luò)的直接連通性。因此,本文定義了多智能體網(wǎng)絡(luò)的直接連通矩陣如式(3)所示。
其中:c(1)i1,i2(k)表示智能體vi1和vi2在該時(shí)段內(nèi)是否具有穩(wěn)定的直接連通性。如式(4)所示,如果在兩智能體連通邊的集合Eki1,i2中,最大連通時(shí)長(zhǎng)的連通邊滿足智能體信息傳輸時(shí)長(zhǎng)τ的要求,認(rèn)為兩智能體之間具有穩(wěn)定的直接連通性。
其中:cglobali1,i2(k)表示智能體vi1和vi2在該時(shí)段內(nèi)是否具有連通性。通過多智能體網(wǎng)絡(luò)的直接連通矩陣C(1)(k)的自乘,計(jì)算h跳連通矩陣C(h)(k),累加多跳連通矩陣中兩智能體之間的連通性,判斷智能體之間的連通性,如式(6)所示。
另外,在多智能體網(wǎng)絡(luò)的連通矩陣中智能體不存在自連通性,即連通矩陣對(duì)角線的值為0。
3 基于任務(wù)需求匹配的子網(wǎng)連通性質(zhì)量分析
3.1 基于主從模式的子網(wǎng)構(gòu)建
利用上文中多智能體網(wǎng)絡(luò)的連通矩陣Cglobal(k),從智能體集合V中選擇部分智能體組成多智能體子網(wǎng)以協(xié)同執(zhí)行任務(wù)。為了提高多智能體組網(wǎng)效率,本文基于主從模式構(gòu)建子網(wǎng),子網(wǎng)中包含了領(lǐng)隊(duì)智能體和追隨者智能體。
在時(shí)段Tk內(nèi)存在任務(wù)akj,定義執(zhí)行該任務(wù)的多智能體子網(wǎng)為(Gsub)kj=(Vkj,Ekj)。其中,子網(wǎng)中智能體的集合為VkjV,子網(wǎng)中智能體之間連通邊的集合為EkjEk。在子網(wǎng)的智能體集合中,包含了領(lǐng)隊(duì)智能體leaderkj和追隨者智能體集合followerkj。此外,為執(zhí)行任務(wù)集合A(k),從智能體集合中選擇多組形成智能體子網(wǎng)集合(Gsub)k。
3.1.1 領(lǐng)隊(duì)智能體
在時(shí)刻tk,為穩(wěn)定地執(zhí)行任務(wù)akj,要求調(diào)整移動(dòng)狀態(tài)后領(lǐng)隊(duì)智能體leaderkj的圓心okleaderkj與任務(wù)位置apkj重合。因此,根據(jù)調(diào)整前智能體的位置pk-1i選擇調(diào)整距離最小的智能體作為領(lǐng)隊(duì)智能體,根據(jù)上一時(shí)段采樣的智能體移動(dòng)狀態(tài)Sk-1,計(jì)算在時(shí)刻tk-1智能體的實(shí)時(shí)位置pk-1i。
在時(shí)刻tk,為執(zhí)行M個(gè)任務(wù)A(k),選擇領(lǐng)隊(duì)智能體集合Leaderk,如式(7)所示。為提高任務(wù)完成率并保證任務(wù)完成質(zhì)量,智能體可在不同子網(wǎng)中執(zhí)行任務(wù),但不能同時(shí)作為領(lǐng)隊(duì)智能體執(zhí)行多個(gè)任務(wù),即領(lǐng)隊(duì)智能體集合中元素不重復(fù)。
3.1.2 追隨者智能體
為執(zhí)行任務(wù)akj,在確定領(lǐng)隊(duì)智能體leaderkj,后選擇追隨者智能體集合followerkj與其組成子網(wǎng)(Gsub)kj執(zhí)行任務(wù)。在選擇追隨者智能體時(shí),考慮子網(wǎng)中智能體之間的連通性、智能體的數(shù)量和追隨者智能體的多種選擇方式。
a)判斷子網(wǎng)的智能體集合Vkj中所有智能體是否具有連通性,如式(8)所示。對(duì)于子網(wǎng)智能體集合中任意智能體vi,利用式(4)判斷集合中是否有其他智能體v與其直接連通。
b)為了減少資源浪費(fèi)并最大限度滿足任務(wù)需求,多智能體子網(wǎng)(Gsub)kj中智能體的數(shù)量不超過任務(wù)需求ankj,即追隨者智能體的數(shù)量不超過ankj-1。
c)為匹配任務(wù)需求,存在多種追隨者智能體followerkj的選擇方式。如圖4所示,假設(shè)任務(wù)a12需要四個(gè)智能體協(xié)同完成,其中,智能體v2作為領(lǐng)隊(duì)智能體leader12存在兩種追隨者智能體集合可以滿足任務(wù)需求,即智能體v1、v3和v4作為追隨者智能體集合follower12,或智能體v3、v4和v5作為追隨者智能體集合follower12。選擇哪種追隨者集合組成子網(wǎng)以執(zhí)行任務(wù),需要匹配多任務(wù)需求,評(píng)估執(zhí)行多任務(wù)的子網(wǎng)集合的連通質(zhì)量,將在后文詳細(xì)闡述。
3.1.3 判斷子網(wǎng)是否成立
在匹配任務(wù)需求前需要判斷子網(wǎng)是否成立,具體地,除了子網(wǎng)中智能體之間具有連通性和子網(wǎng)中存在領(lǐng)隊(duì)智能體外,還要求子網(wǎng)中存在與平臺(tái)穩(wěn)定連通的智能體,將完成的任務(wù)傳遞回平臺(tái)。
在時(shí)段Tk內(nèi),為獲取平臺(tái)與智能體的穩(wěn)定連通性,利用式(1)(2)計(jì)算智能體vi的實(shí)時(shí)位置,當(dāng)智能體位置pti和平臺(tái)位置pPF的距離小于智能體通信距離Δ時(shí),智能體與平臺(tái)連通。據(jù)此可知,智能體與平臺(tái)在時(shí)刻tPF,i開始連通,在時(shí)刻tPF,i結(jié)束連通。為保證平臺(tái)與子網(wǎng)穩(wěn)定的連通性,要求智能體與平臺(tái)的連通時(shí)長(zhǎng)超過信息傳輸時(shí)長(zhǎng)τ。因此,在平臺(tái)與智能體穩(wěn)定的直接連通性(CPF,V)(1)(k)中,智能體vi與平臺(tái)穩(wěn)定的直接連通性(cPF,V)(1)PF,i(k)如式(9)所示。
綜上所述,從三個(gè)方面判斷多智能體子網(wǎng)(Gsub)kj是否能執(zhí)行任務(wù)akj,即子網(wǎng)中智能體具有連通性、存在領(lǐng)隊(duì)智能體leaderkj和與平臺(tái)穩(wěn)定連通的智能體vi,如式(10)所示。
3.2 基于任務(wù)需求匹配的子網(wǎng)連通性質(zhì)量評(píng)估
為分析局部網(wǎng)絡(luò)質(zhì)量與區(qū)域性任務(wù)需求之間的匹配情況,本文定義子網(wǎng)集合的連通質(zhì)量。子網(wǎng)集合的連通質(zhì)量除了與任務(wù)需求的匹配度有關(guān),子網(wǎng)的性能也對(duì)其有重要影響。具體地,網(wǎng)絡(luò)性能指標(biāo)包括網(wǎng)絡(luò)連通時(shí)長(zhǎng)[19]、負(fù)載均衡[20]和網(wǎng)絡(luò)穩(wěn)定性[21]等。本文從子網(wǎng)集合與任務(wù)需求的匹配度、子網(wǎng)集合的穩(wěn)定性、子網(wǎng)集合中智能體的負(fù)載三個(gè)方面評(píng)估子網(wǎng)集合的連通質(zhì)量。
具體地,在當(dāng)前智能體移動(dòng)狀態(tài)Sk下,子網(wǎng)集合(Gsub)k的連通質(zhì)量Q(Gsub)k受子網(wǎng)集合與任務(wù)需求的匹配度TND(Gsub)k、子網(wǎng)集合的穩(wěn)定性NS(Gsub)k以及子網(wǎng)集合中智能體的負(fù)載NL(Gsub)k的影響,子網(wǎng)集合的連通質(zhì)量越高,多智能體越能高質(zhì)量、高效率完成任務(wù)。參數(shù)α、β和γ調(diào)節(jié)上述三種因素對(duì)子網(wǎng)集合連通質(zhì)量的影響程度。
3.2.1 子網(wǎng)集合與任務(wù)需求的匹配度
子網(wǎng)集合與任務(wù)需求的匹配度TND(Gsub)k是指多智能體子網(wǎng)集合(Gsub)k滿足任務(wù)集合A(k)中任務(wù)需求的程度。其中,任務(wù)akj需要ankj個(gè)智能體協(xié)同完成,執(zhí)行該任務(wù)的多智能體子網(wǎng)(Gsub)kj中智能體數(shù)量為|Vkj|,任務(wù)需求和子網(wǎng)的匹配度為TND(Gsub)k,如式(12)所示。同時(shí),子網(wǎng)集合應(yīng)可執(zhí)行該任務(wù),如式(13)所示。
當(dāng)多智能體子網(wǎng)集合(Gsub)k執(zhí)行任務(wù)集合A(k)中所有任務(wù)時(shí),任務(wù)需求和子網(wǎng)集合的匹配度為TND(Gsub)k,如式(14)所示。
3.2.2 子網(wǎng)集合的穩(wěn)定性
子網(wǎng)的穩(wěn)定性NS(Gsub)k是指多智能體網(wǎng)絡(luò)中連通邊有一定的概率被破壞,在這種情況下子網(wǎng)集合執(zhí)行任務(wù)的情況。多智能體網(wǎng)絡(luò)中子網(wǎng)執(zhí)行任務(wù)時(shí),如果某條連通邊因障礙物或網(wǎng)絡(luò)傳輸?shù)仍虮黄茐?,可能無法維持原有的任務(wù)完成效率。當(dāng)智能體vi1和vi2之間的連通邊ei1,i2(ti1,i2,ti1,i2)被破壞,子網(wǎng)(Gei1,i2sub)kj是否能執(zhí)行任務(wù)akj用T(Gei1,i2sub)kj表示,通過式(10)判定子網(wǎng)是否能執(zhí)行任務(wù)。
多智能體網(wǎng)絡(luò)中任意連通邊有一定概率pd被破壞,在這種情況下,多智能體子網(wǎng)集合(Gsub)k執(zhí)行任務(wù)時(shí)的網(wǎng)絡(luò)穩(wěn)定性用NS(Gsub)k表示,如式(15)所示。其中,需要利用多智能體網(wǎng)絡(luò)的連通矩陣Cglobal(k),統(tǒng)計(jì)多智能體網(wǎng)絡(luò)中連通邊的數(shù)量Enk,如式(16)所示。
3.2.3 子網(wǎng)集合中智能體的負(fù)載
子網(wǎng)集合中智能體的負(fù)載NL(Gsub)k是指智能體所在子網(wǎng)的數(shù)量。如果一個(gè)智能體參與過多任務(wù),該智能體需要傳輸大量數(shù)據(jù),將難以維持任務(wù)完成質(zhì)量,因此規(guī)定智能體的最大負(fù)載為L(zhǎng)max。利用子網(wǎng)集合(Gsub)k計(jì)算智能體vi的負(fù)載L(Gsub)ki,進(jìn)而統(tǒng)計(jì)符合負(fù)載要求的智能體的比例NL(Gsub)k,如式(17)所示。
4 基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動(dòng)策略
4.1 基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動(dòng)優(yōu)化模型
本文對(duì)智能體的移動(dòng)過程進(jìn)行建模,在智能體移動(dòng)距離和多智能體網(wǎng)絡(luò)連通質(zhì)量的約束下最大化任務(wù)完成率。
本文用最優(yōu)的子網(wǎng)集合連通質(zhì)量表示多智能體網(wǎng)絡(luò)連通質(zhì)量。具體地,在當(dāng)前智能體移動(dòng)狀態(tài)Sk下,有多種子網(wǎng)集合的選擇方式,通過評(píng)估每種智能體子網(wǎng)集合的連通質(zhì)量求解連通質(zhì)量最優(yōu)的子網(wǎng)集合(Gsub)k。用該子網(wǎng)集合的連通質(zhì)量Q(Gsub)k表示多智能體網(wǎng)絡(luò)連通質(zhì)量Q(Gk)。
為執(zhí)行任務(wù)A(k),智能體的移動(dòng)狀態(tài)從Sk-1調(diào)整為Sk的移動(dòng)距離集合為D(Sk)={d(Sk)1,d(Sk)2,…,d(Sk)N}。在智能體的移動(dòng)狀態(tài)Sk下,從多智能體網(wǎng)絡(luò)Gk中選擇連通質(zhì)量最優(yōu)的多智能體子網(wǎng)集合(Gsub)k來完成任務(wù),利用式(14)計(jì)算該子網(wǎng)集合和任務(wù)需求的匹配度TND(Gsub)k,即當(dāng)前狀態(tài)下多智能體的任務(wù)完成率TCR(Sk)。
多智能體移動(dòng)優(yōu)化模型的優(yōu)化目標(biāo)是最大化任務(wù)完成率,得到最優(yōu)的多智能體移動(dòng)策略。在智能體移動(dòng)距離和網(wǎng)絡(luò)連通質(zhì)量的約束下求解任務(wù)完成率最優(yōu)的多智能體移動(dòng)狀態(tài)(Sk),優(yōu)化目標(biāo)如下:
其中:約束式(20)表示智能體的最大移動(dòng)距離為dmax,約束式(21)表示多智能體網(wǎng)絡(luò)連通質(zhì)量的閾值為Qthreshold,通過控制網(wǎng)絡(luò)連通質(zhì)量以保證任務(wù)完成質(zhì)量。
4.2 基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動(dòng)優(yōu)化模型求解
為保證任務(wù)完成效率和質(zhì)量,獲得網(wǎng)絡(luò)連通質(zhì)量控制下任務(wù)完成率最優(yōu)的多智能體移動(dòng)狀態(tài),本文設(shè)計(jì)了基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動(dòng)優(yōu)化模型,采用能處理高復(fù)雜度組合問題的模擬退火算法求解。在求解過程中,為獲取多智能體網(wǎng)絡(luò)連通質(zhì)量,采用遺傳算法求解。
a)多智能體移動(dòng)狀態(tài)編碼。采用實(shí)數(shù)編碼的方式對(duì)多智能體移動(dòng)狀態(tài)編碼,將調(diào)整前多智能體移動(dòng)狀態(tài)Sk-1編碼為Y(Sk-1),調(diào)整后多智能體移動(dòng)狀態(tài)編碼為Y,狀態(tài)由移動(dòng)軌跡圓心和移動(dòng)相位組成,編碼的長(zhǎng)度為3N,編碼方式為Y={(ok1(x),ok1(y),ωk1),…,(okN(x),okN(y),ωkN)}。具體如算法2所示。
b)初始化解狀態(tài)。為了加快收斂并提高算法效率,優(yōu)先選擇領(lǐng)隊(duì)智能體集合并固定領(lǐng)隊(duì)的圓心位置,在此基礎(chǔ)上形成多智能體的移動(dòng)狀態(tài)。
c)計(jì)算多智能體網(wǎng)絡(luò)連通質(zhì)量。為篩選符合約束條件的解狀態(tài),需要求解當(dāng)前多智能體移動(dòng)狀態(tài)下連通質(zhì)量最優(yōu)的子網(wǎng)集合和對(duì)應(yīng)連通質(zhì)量,即網(wǎng)絡(luò)連通質(zhì)量。詳細(xì)過程如算法1所示。
(a)子網(wǎng)集合編碼。采用0-1編碼的矩陣表示多智能體子網(wǎng)集合執(zhí)行任務(wù)的情況,矩陣X的行和列分別對(duì)應(yīng)N個(gè)智能體和M個(gè)任務(wù),矩陣中元素Xi,j為0或1。在矩陣X的第j列中,元素值為1的智能體的集合是執(zhí)行任務(wù)akj的多智能體子網(wǎng)。
(b)初始化種群。初始化種群是在搜索開始時(shí)生成一組染色體,種群規(guī)模為Popsize,其中染色體為X1~XPopsize。為執(zhí)行任務(wù)akj,根據(jù)當(dāng)前多智能體移動(dòng)狀態(tài)Y分析網(wǎng)絡(luò)連通性,從領(lǐng)隊(duì)智能體leaderkj連通的智能體中,選擇追隨者智能體集合組成子網(wǎng)(Gsub)kj,進(jìn)而得到執(zhí)行任務(wù)A(k)的子網(wǎng)集合(Gsub)k,子網(wǎng)集合(Gsub)k編碼后即為一條染色體Xps。
(c)適應(yīng)度函數(shù)。分析染色體Xps的連通質(zhì)量,網(wǎng)絡(luò)連通質(zhì)量越大,適應(yīng)度越好。因此染色體Xps的適應(yīng)度函數(shù)計(jì)算為
算法1 網(wǎng)絡(luò)連通質(zhì)量求解算法
輸入:多智能體移動(dòng)狀態(tài)集合Y。
輸出:當(dāng)前狀態(tài)下,最優(yōu)子網(wǎng)集合X,網(wǎng)絡(luò)連通質(zhì)量F1(X)。
1 初始化種群,產(chǎn)生滿足約束條件的染色體X1~XPopsize;
2 初始化迭代次數(shù),令iter=0;
3 根據(jù)式(23)計(jì)算種群中染色體的適應(yīng)度;
4 更新當(dāng)前最優(yōu)個(gè)體X;
5 采用輪盤賭方法選擇適應(yīng)度高的染色體;
6 對(duì)選擇的染色體進(jìn)行交叉操作;
7 對(duì)選擇的染色體進(jìn)行變異操作,即個(gè)體中的值有一定概率發(fā)生突變;
8 令iter=iter+1,達(dá)到閾值停止迭代,否則跳到步驟1;
9 輸出最優(yōu)子網(wǎng)集合X和對(duì)應(yīng)連通質(zhì)量,即網(wǎng)絡(luò)連通質(zhì)量F1(X)。
d)目標(biāo)函數(shù)。在求解最優(yōu)多智能體移動(dòng)狀態(tài)的過程中,關(guān)注多智能體的任務(wù)完成率,計(jì)算最優(yōu)子網(wǎng)集合的任務(wù)完成率。為評(píng)價(jià)新解和當(dāng)前解的優(yōu)劣,設(shè)計(jì)目標(biāo)函數(shù)F2(Y),目標(biāo)函數(shù)計(jì)算為
算法2 多智能體移動(dòng)優(yōu)化算法
輸入:任務(wù)集合A(k),調(diào)整前多智能體移動(dòng)狀態(tài)集合Y(Sk-1)。
輸出:調(diào)整后最優(yōu)多智能體移動(dòng)狀態(tài)集合Y。
1 根據(jù)式(7)選擇領(lǐng)隊(duì)智能體集合Leaderk,確定其調(diào)整后軌跡圓心;
2 初始化迭代溫度temp=temp(0),根據(jù)算法1計(jì)算網(wǎng)絡(luò)連通質(zhì)量,初始化滿足約束式(20)和(21)的解狀態(tài)Y;
3 初始化迭代次數(shù),令iter_temp=0;
4 對(duì)當(dāng)前解Y中部分元素進(jìn)行突變或交換,產(chǎn)生滿足約束式(20)和(21)的新解Y′,解的變換范圍滿足多智能體移動(dòng)狀態(tài)的約束;
5 根據(jù)式(24)中目標(biāo)函數(shù)計(jì)算新解的增量ΔF2=F2(Y)-F2(Y′ );
6 若ΔF2<0,接受Y′ 作為新的當(dāng)前解,否則以exp{-ΔF2/temp}的概率接受新的當(dāng)前解;
7 令iter_temp=iter_temp+1,達(dá)到閾值停止迭代,否則跳到步驟1;
8 更新溫度,令溫度按照一定的比例逐漸減少,temp=temp·;
9 輸出最優(yōu)解Y。
在算法1中,計(jì)算染色體適應(yīng)度函數(shù)的時(shí)間復(fù)雜度為O(N2M),求解網(wǎng)絡(luò)連通質(zhì)量的時(shí)間復(fù)雜度為O(N2M·Popsize)。其中,迭代次數(shù)iter為常數(shù)。在算法2中,選擇領(lǐng)隊(duì)智能體集合的時(shí)間復(fù)雜度為O(NM),計(jì)算目標(biāo)函數(shù)的時(shí)間復(fù)雜度為O(N+M),求解最優(yōu)多智能體移動(dòng)狀態(tài)集合的時(shí)間復(fù)雜度為O(N2M·Popsize·iter_temp)。其中,溫度temp更新到閾值的迭代次數(shù)為iter_temp,內(nèi)循環(huán)迭代次數(shù)iter_temp為常數(shù)。
5 實(shí)驗(yàn)分析
本文通過上述基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動(dòng)策略實(shí)現(xiàn)基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。為評(píng)價(jià)本文方法,在Python中對(duì)相關(guān)方法進(jìn)行實(shí)驗(yàn)仿真,相關(guān)參數(shù)如表2所示。
5.1 對(duì)比方法和實(shí)驗(yàn)指標(biāo)
本節(jié)將本文方法與現(xiàn)有的兩種方法進(jìn)行對(duì)比并進(jìn)行實(shí)驗(yàn)仿真。其中,方法1是文獻(xiàn)[9]采用多智能體保持持續(xù)連通以執(zhí)行任務(wù)的方法,方法2是文獻(xiàn)[15]利用多智能體的間歇連通以執(zhí)行任務(wù)的方法。為了分析網(wǎng)絡(luò)連通質(zhì)量控制對(duì)本文方法的影響,將對(duì)比不考慮網(wǎng)絡(luò)連通質(zhì)量控制的多智能體周期性間歇連通執(zhí)行任務(wù)的情況,即方法3。
為了設(shè)置本文方法中網(wǎng)絡(luò)連通質(zhì)量的閾值,對(duì)比不同閾值下任務(wù)數(shù)量的變化對(duì)任務(wù)完成率的影響;為了驗(yàn)證本文方法的有效性,從任務(wù)完成率、網(wǎng)絡(luò)連通質(zhì)量和多智能體移動(dòng)效用三項(xiàng)指標(biāo)對(duì)本文方法和對(duì)比方法進(jìn)行評(píng)價(jià),分析任務(wù)數(shù)量對(duì)實(shí)驗(yàn)指標(biāo)的影響。具體地,任務(wù)完成率是指多智能體組成網(wǎng)絡(luò)完成任務(wù)的程度,通過最優(yōu)子網(wǎng)集合中智能體的數(shù)量除以任務(wù)需求得出;網(wǎng)絡(luò)連通質(zhì)量綜合分析多智能體組成網(wǎng)絡(luò)執(zhí)行任務(wù)的情況,通過結(jié)合子網(wǎng)集合與任務(wù)需求的匹配度、子網(wǎng)集合的穩(wěn)定性和子網(wǎng)集合中智能體的負(fù)載得出;智能體移動(dòng)效用是指智能體移動(dòng)一個(gè)單位距離得到的任務(wù)完成率,通過任務(wù)完成率除以平均每個(gè)智能體移動(dòng)距離得出。
5.2 實(shí)驗(yàn)結(jié)果分析
5.2.1 網(wǎng)絡(luò)連通質(zhì)量閾值分析
通過控制網(wǎng)絡(luò)連通質(zhì)量以提高任務(wù)完成質(zhì)量,網(wǎng)絡(luò)連通質(zhì)量閾值對(duì)任務(wù)完成率的影響如圖5所示。在實(shí)驗(yàn)中,設(shè)置不同的網(wǎng)絡(luò)連通質(zhì)量閾值(即Q= 0.1、0.2、0.3、0.4、0.5、0.6)分別分析任務(wù)完成率,最終設(shè)置網(wǎng)絡(luò)連通質(zhì)量的閾值為0.6。
如圖5所示,隨著任務(wù)數(shù)量的增加,任務(wù)對(duì)智能體的需求增加,多智能體的任務(wù)完成率隨之降低。網(wǎng)絡(luò)連通質(zhì)量的閾值越高,多智能體網(wǎng)絡(luò)與任務(wù)需求的匹配度越高,任務(wù)完成率越高。當(dāng)Q=0.1時(shí),難以對(duì)多智能體網(wǎng)絡(luò)產(chǎn)生有效約束,因此任務(wù)完成率較低;當(dāng)Q=0.2、0.3、0.4、0.5時(shí),多智能體通過移動(dòng)達(dá)到連通質(zhì)量的閾值較為容易,因此任務(wù)完成率相近,使多智能體網(wǎng)絡(luò)性能的控制提高不明顯;當(dāng)Q=0.6時(shí),任務(wù)完成率有所提高。過低的網(wǎng)絡(luò)連通質(zhì)量使多智能體網(wǎng)絡(luò)的連通性無法滿足任務(wù)需求,任務(wù)完成率低;過高的網(wǎng)絡(luò)連通質(zhì)量要求多智能體網(wǎng)絡(luò)結(jié)構(gòu)穩(wěn)定,即智能體相對(duì)聚集執(zhí)行任務(wù),同時(shí)要求多智能體網(wǎng)絡(luò)滿足任務(wù)需求,但環(huán)境中智能體數(shù)量固定,而智能體聚集導(dǎo)致分散的任務(wù)無法執(zhí)行。因此,網(wǎng)絡(luò)連通質(zhì)量的閾值在達(dá)到0.6后難以提高。
5.2.2 不同方法的任務(wù)完成率
本文方法與三種對(duì)比方法的任務(wù)完成率如圖6所示。隨著任務(wù)數(shù)量增加,任務(wù)所在范圍更廣、對(duì)智能體的需求更大,使各方法的任務(wù)完成率逐步下降。由圖6可知,本文方法的任務(wù)完成率略低于方法1的任務(wù)完成率,因?yàn)橄啾扔诒疚姆椒?,方?的網(wǎng)絡(luò)連通性約束更強(qiáng),智能體在較大的范圍內(nèi)保持連通,更容易滿足任務(wù)需求;在方法2中,多智能體之間間歇連通,任務(wù)數(shù)量少時(shí)智能體靈活移動(dòng)以獲得較高任務(wù)完成率,隨著任務(wù)數(shù)量增加,智能體無法組成滿足任務(wù)需求的多智能體網(wǎng)絡(luò),使任務(wù)完成率下降明顯;本文方法和方法3均為周期性間歇連通網(wǎng)絡(luò),任務(wù)完成率的降低趨勢(shì)相似。該網(wǎng)絡(luò)擴(kuò)展多智能體連通范圍,因此相較于方法2,本文方法和方法3的任務(wù)完成率下降趨勢(shì)平緩,但方法3沒有控制網(wǎng)絡(luò)連通質(zhì)量,難以高效匹配多智能體網(wǎng)絡(luò)和任務(wù)需求,導(dǎo)致無法提高任務(wù)完成率。
5.2.3 不同方法的網(wǎng)絡(luò)連通質(zhì)量
本文算法與三種對(duì)比方法的網(wǎng)絡(luò)連通質(zhì)量如圖7所示。在任務(wù)數(shù)量較少時(shí),網(wǎng)絡(luò)連通質(zhì)量均大于0.6,隨著任務(wù)數(shù)量的增加,多智能體網(wǎng)絡(luò)難以在滿足任務(wù)需求的同時(shí)維持較高的網(wǎng)絡(luò)性能,因此本文算法和三種對(duì)比方法的網(wǎng)絡(luò)連通質(zhì)量不斷降低。由于本文方法設(shè)置網(wǎng)絡(luò)連通質(zhì)量的閾值為0.6,當(dāng)任務(wù)數(shù)量增加時(shí),本文方法的網(wǎng)絡(luò)連通質(zhì)量下降后趨于平穩(wěn),實(shí)驗(yàn)效果優(yōu)于對(duì)比方法。
在未控制網(wǎng)絡(luò)連通質(zhì)量時(shí),隨著任務(wù)數(shù)量的增加,網(wǎng)絡(luò)逐漸難以滿足任務(wù)需求,網(wǎng)絡(luò)的穩(wěn)定性下降。方法1中多智能體保持持續(xù)連通,當(dāng)任務(wù)數(shù)量達(dá)到25時(shí),多智能體網(wǎng)絡(luò)的穩(wěn)定性變化不明顯,智能體分布范圍相對(duì)變大,多智能體的負(fù)載更均衡,網(wǎng)絡(luò)連通質(zhì)量維持在0.45左右;方法2中多智能體之間間歇連通,當(dāng)任務(wù)數(shù)量達(dá)到20時(shí),網(wǎng)絡(luò)穩(wěn)定性不再明顯降低,相較于方法1,該方法的網(wǎng)絡(luò)穩(wěn)定性和任務(wù)完成率更低,網(wǎng)絡(luò)連通質(zhì)量維持在0.35左右;方法3中的多智能體周期性間歇連通,隨著任務(wù)數(shù)量增加,多智能體網(wǎng)絡(luò)可以維持一定的穩(wěn)定性,但相較于持續(xù)連通網(wǎng)絡(luò)仍有一定劣勢(shì),最終網(wǎng)絡(luò)連通質(zhì)量逐漸穩(wěn)定在0.4左右。
5.2.4 不同方法的智能體移動(dòng)效用
本文算法與三種對(duì)比方法的智能體移動(dòng)效用如圖8所示。由圖8可知,隨著任務(wù)數(shù)量的增加,本文方法的智能體移動(dòng)效用實(shí)驗(yàn)效果優(yōu)于對(duì)比方法。
在任務(wù)數(shù)量小于15時(shí),本文方法和方法1、3中的網(wǎng)絡(luò)具有一定的連通性,隨著任務(wù)數(shù)量的增加,智能體移動(dòng)相同距離可以執(zhí)行更多的任務(wù),從而使智能體移動(dòng)效用增加;在任務(wù)數(shù)量大于15時(shí),任務(wù)數(shù)量的增加導(dǎo)致任務(wù)完成率下降,智能體移動(dòng)效用隨之下降。相比于方法1,本文方法移動(dòng)更少的距離就可以組成子網(wǎng)執(zhí)行任務(wù),因此本文方法的智能體移動(dòng)效用略高;而在方法3中,初始任務(wù)完成率較低,導(dǎo)致初始移動(dòng)效用較低;在方法2中,任務(wù)數(shù)量較少時(shí)智能體移動(dòng)效用達(dá)到了0.9,隨著任務(wù)數(shù)量的增加,移動(dòng)效用不斷下降。由于間歇連通的智能體移動(dòng)靈活且沒有連通性約束,在任務(wù)數(shù)量少時(shí),靈活組網(wǎng)即可滿足任務(wù)需求,所以相較于本文方法有較高移動(dòng)效用,但隨著任務(wù)數(shù)量增加,多智能體為了滿足任務(wù)需求產(chǎn)生較大移動(dòng)成本,且因無連通性約束,多智能體移動(dòng)后組網(wǎng)的效率降低,所以智能體移動(dòng)效用降低。
6 結(jié)束語
為了保證任務(wù)完成效率和質(zhì)量,匹配多智能體局部網(wǎng)絡(luò)質(zhì)量和區(qū)域性任務(wù)需求,本文提出了一種基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。通過分析周期性間歇連通多智能體網(wǎng)絡(luò)的連通性,構(gòu)建基于主從模式的多智能體子網(wǎng)集合,進(jìn)而基于任務(wù)需求匹配評(píng)估子網(wǎng)集合的連通質(zhì)量。用最大的子網(wǎng)集合連通質(zhì)量表示多智能體網(wǎng)絡(luò)連通質(zhì)量,提出了基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動(dòng)策略。實(shí)驗(yàn)結(jié)果表明,本文方法有效保障了網(wǎng)絡(luò)連通質(zhì)量,維持了任務(wù)完成率,提高了智能體移動(dòng)效用。在未來的工作中,將考慮分布式的多智能體組網(wǎng)方式,在動(dòng)態(tài)變化的任務(wù)環(huán)境中使多智能體自適應(yīng)地組成子網(wǎng)以執(zhí)行任務(wù)。除此之外,為了對(duì)多智能體網(wǎng)絡(luò)連通質(zhì)量進(jìn)行更為準(zhǔn)確和全面的分析,還將考慮網(wǎng)絡(luò)異常流量[22]、網(wǎng)絡(luò)擁塞等其他因素對(duì)網(wǎng)絡(luò)連通質(zhì)量的影響。
參考文獻(xiàn):
[1]Basak A,Zaroukian E G,Corder K,et al.Utility of doctrine with multi-agent RL for military engagements[C]//Proc of Artificial Intelligence and Machine Learning for Multi-Domain Operations Applications IV.2022:1211323.
[2]Babic' A,Loncˇar I,Arbanas B,et al.A novel paradigm for underwater monitoring using mobile sensor networks[J].Sensors,2020,20(16):4615.
[3]Wang Yanan,Xu Tong,Niu Xin,et al.STMARL:a spatio-temporal multi-agent reinforcement learning approach for cooperative traffic light control[J].IEEE Trans on Mobile Computing,2022,21(6):2228-2242.
[4]Dornhfer M,Sack S,Zenkert J,et al.Simulation of smart factory processes applying multi-agent-systems:a knowledge management perspective[J].Journal of Manufacturing and Materials Processing,2020,4(3):89.
[5]Peng Zhouhua,Wang Dan,Li Tieshan,et al.Output-feedback cooperative formation maneuvering of autonomous surface vehicles with connectivity preservation and collision avoidance[J].IEEE Trans on Cybernetics,2020,50(6):2527-2535.
[6]Gu Nan,Wang Dan,Peng Zhouhua,et al.Observer-based finite-time control for distributed path maneuvering of underactuated unmanned surface vehicles with collision avoidance and connectivity preservation[J].IEEE Trans on Systems,Man,and Cybernetics:Systems,2021,51(8):5105-5115.
[7]Boldrer M,Bevilacqua P,Palopoli L,et al.Graph connectivity control of a mobile robot network with mixed dynamic multi-tasks[J].IEEE Robotics and Automation Letters,2021,6(2):1934-1941.
[8]Meng Shaofeng,Kan Zhen.Deep reinforcement learning-based effective coverage control with connectivity constraints[J].IEEE Control Systems Letters,2022,6:283-288.
[9]Afonso R J M,Maximo M R O A,Galvo R K H.Task allocation and trajectory planning for multiple agents in the presence of obstacle and connectivity constraints with mixed-integer linear programming[J].International Journal of Robust and Nonlinear Control,2020,30(14):5464-5491.
[10]Parasuraman R,Kim J,Luo Shaocheng,et al.Multipoint rendezvous in multirobot systems[J].IEEE Trans on Cybernetics,2020,50(1):310-323.
[11]Wang Cong,Liu Chenglin,Liu Shuai.Robust fixed-time connectivity-preserving consensus for second-order multi-agent systems with external disturbances[J].IET Control Theory & Applications,2020,14(17):2674-2681.
[12]Shang Yilun.Resilient consensus for robust multiplex networks with asymmetric confidence intervals[J].IEEE Trans on Network Science and Engineering,2021,8(1):65-74.
[13]Chapnevis A,Güven I,Njilla L,et al.Collaborative trajectory optimization for outage-aware cellular-enabled UAVs[C]//Proc of the 93rd IEEE Vehicular Technology Conference.Piscataway,NJ:IEEE Press,2021:1-6.
[14]Liu Zhiyu,Wu Bo,Dai Jin,et al.Distributed communication-aware motion planning for networked mobile robots under formal specifications[J].IEEE Trans on Control of Network Systems,2020,7(4):1801-1811.
[15]Dong He,Wu Nan,F(xiàn)eng Guangsheng,et al.Research on computing task allocation method based on multi-UAVs collaboration[C]//Proc of IEEE International Conference on Smart Internet of Things.Pisca-taway,NJ:IEEE Press,2020:86-93.
[16]Yu Xi,Saldaa D,Shishika D,et al.Resilient consensus in robot swarms with periodic motion and intermittent communication[J].IEEE Trans on Robotics,2021,38(1):110-125.
[17]Wei Cong,Yu Xi,Tanner H G,et al.Synchronous rendezvous for networks of active drifters in gyre flows[C]//Proc of the 14th International Symposium on Distributed Autonomous Robotic Systems.Cham:Springer,2019:413-425.
[18]Yu Xi,Hsieh M A.Synthesis of a time-varying communication network by robot teams with information propagation guarantees[J].IEEE Robotics and Automation Letters,2020,5(2):1413-1420.
[19]Piltyay S,Bulashenko A,Demchenko I.Wireless sensor network connectivity in heterogeneous 5G mobile systems[C]//Proc of IEEE International Conference on Problems of Infocommunications:Science and Technology.Piscataway,NJ:IEEE Press,2020:625-630.
[20]Wang Shaoqing,Yu Jiguo,Atiquzzaman M,et al.CRPD:a novel clustering routing protocol for dynamic wireless sensor networks[J].Personal and Ubiquitous Computing,2018,22(3):545-559.
[21]劉英杰,劉士虎,徐偉華.基于有效路徑拓?fù)浞€(wěn)定性的鏈路預(yù)測(cè)方法[J].計(jì)算機(jī)應(yīng)用研究,2022,39(1):90-95.(Liu Yingjie,Liu Shihu,Xu Weihua.Link prediction method based on topology stability of effective path[J].Application Research of Computers,2022,39(1):90-95.)
[22]Xia Yuanjun,Dong Shi,Peng Tao, et al.Wireless network abnormal traffic detection method based on deep transfer reinforcement learning[C]//Proc of the 17th International Conference on Mobility,Sensing and Networking.Piscataway,NJ:IEEE Press,2021:528-535.
收稿日期:2023-02-12;修回日期:2023-04-11基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(61602305,61802257);上海市自然科學(xué)基金資助項(xiàng)目(18ZR1426000,19ZR1477600);南通市科技局社會(huì)民生計(jì)劃資助項(xiàng)目(MS12021060);浦東新區(qū)科技發(fā)展基金產(chǎn)學(xué)研專項(xiàng)資助項(xiàng)目(PKX2021-D10);敏捷智能計(jì)算四川省重點(diǎn)實(shí)驗(yàn)室開放式基金資助項(xiàng)目
作者簡(jiǎn)介:何杏宇(1984-),女,湖南岳陽人,副教授,碩導(dǎo),博士,主要研究方向?yàn)槲锫?lián)網(wǎng)和移動(dòng)群智計(jì)算;王怡(1996-),女,湖北十堰人,碩士研究生,主要研究方向?yàn)闊o人自主系統(tǒng)和群智計(jì)算;楊桂松(1982-),男(通信作者),河南漯河人,副教授,碩導(dǎo),博士,主要研究方向?yàn)槲锫?lián)網(wǎng)與普適計(jì)算等(gsyang@ usst.edu.cn);賈明權(quán)(1982-),男,四川合江人,高級(jí)工程師,博士,主要研究方向?yàn)橄冗M(jìn)智能計(jì)算;周玥(1999-),男,山東菏澤人,本科生,主要研究方向?yàn)闊o人自主系統(tǒng);徐心玥(2001-),男,上海人,本科生,主要研究方向?yàn)闊o人自主系統(tǒng).