萬杭州
【摘要】 在無中心智能體、差通訊條件下的世界模型的更新一直都很困難,為了找到一種解決方案,我認(rèn)真對(duì)東南大學(xué)救援仿真小組的通訊模型進(jìn)行深入的分析研究,其中也參看了其他隊(duì)伍的代碼。本文首先提出一個(gè)有效的通訊模型,然后介紹一種相應(yīng)的通信協(xié)議,即信息的種類的選擇、消息的優(yōu)化、消息的壓縮,從而提高智能體的世界模型同步的效率。最后通過仿真實(shí)驗(yàn)和比賽驗(yàn)證了該通訊模型的有效性。
【關(guān)鍵詞】 通訊模型 救援仿真 通訊協(xié)議;智能體
一、引言
RoboCup Rescue 是多智能體仿真環(huán)境。在這個(gè)仿真環(huán)境里,消防員、救護(hù)車和警察協(xié)同工作以減少仿真環(huán)境下災(zāi)難所造成的損失。每一種智能體各司其職地工作[1],要盡可能協(xié)同合作。RoboCup Rescue 研究的主要目的是利用有限資源來實(shí)現(xiàn)救援效果的最大化,從而將該項(xiàng)技術(shù)應(yīng)用于人類社會(huì)突發(fā)事件的有效救援。救援的前提就是了解總體情況,更新世界模型,但地圖模擬的災(zāi)害情況越來越復(fù)雜,通訊很可能超負(fù)荷運(yùn)載[2],要出色完成救援,首先要解決通訊問題。在通訊狀況良好或者受限情況下已經(jīng)有很多的通訊模型[3][4][5],但是應(yīng)對(duì)壞消息或者無中心情況的模型還很少,本文創(chuàng)建一種有效的通信模型。并對(duì)其進(jìn)行分析和驗(yàn)證。
二、通訊模型
在救援仿真中,除去中心體外,有三種智能體,AT(救護(hù)隊(duì))、FB(消防員)、PF(警察),他們是仿真的核心,他們是異常情況(房屋著火,人被掩埋,道路堵塞)的發(fā)現(xiàn)者和終結(jié)者。有了通訊的幫助才能使世界模型及時(shí)更新,才能使智能體的決策更加明智[6]。
針對(duì)這三類智能體,我提出一個(gè)通訊模型如1,通訊的類型有兩種, SAY 和TELL[5]。SAY 的距離限制為30m,TELL則不受距離限制,但兩者都受帶寬、掉包等限制。
三、 通信協(xié)議
圖 1的模型很簡單,但由于是智能體監(jiān)聽信道的數(shù)目很小,如果不對(duì)發(fā)送的字節(jié)進(jìn)行壓縮,很難真正的發(fā)揮這一模型的作用。
在仿真過程中,一個(gè)仿真周期,先是處理視覺,處理聽覺,更新世界模型,然后執(zhí)行動(dòng)作(move、extinguish、rescue、load、unload、clear and so on)最后發(fā)送信息。在無中心差通訊條件下,發(fā)消息時(shí),SAY和TELL兩種通訊類型每周期都要發(fā)送,并且對(duì)消息的種類也做了優(yōu)先級(jí),確保重要消息的及時(shí)共享。處理消息時(shí),要結(jié)合自己的實(shí)際情況進(jìn)行過濾。
大部分消息都包含有道路或者房屋的ID,可是這道路或者房屋的ID非常大,就Kobe來說,道路數(shù)目1602,最大ID為36512,房屋數(shù)目757,最大房屋ID36476,直接用消息包含ID則需要很多字節(jié),而地圖初始化完成的時(shí)候我們就能獲得地圖所有道路和房屋的ID,我們可以給每一個(gè)ID根據(jù)種類匹配一個(gè)固定數(shù)字(label),這個(gè)數(shù)字最大就是這個(gè)種類的數(shù)目,這樣可以盡可能優(yōu)化消息。由于救援消息包含Damage、Buriedness、HP等變化的量,如果需要的精度不大的話,可以利用一個(gè)固定的數(shù)字進(jìn)行壓縮和解壓。對(duì)于其他變量也可以如此,這是一種靜態(tài)表示,有的時(shí)候可以根據(jù)這些變量的變化趨勢,做一些變量處理,就HP來說,HP只會(huì)下降,如果我能找出一個(gè)函數(shù)能模擬HP的大致效果,并根據(jù)這個(gè)函數(shù)的結(jié)果對(duì)變量進(jìn)行壓縮,消息的優(yōu)化會(huì)更好。
可是市民的ID在地圖的前期是不可獲知的,只有被智能體發(fā)現(xiàn)后,世界模型里才更新有這個(gè)市民,這就導(dǎo)致智能體了解到的市民不是相同的,所以也不能使用ID轉(zhuǎn)label的方法,但是可采取另一種方式來解決這個(gè)問題,我使用位置來表示有受傷的市民,位置的ID可以用label表示。
四、仿真實(shí)驗(yàn)及結(jié)果分析
本文仿真實(shí)驗(yàn)的仿真環(huán)境根據(jù)2014年國際賽仿真救援組委會(huì)的要求,采用Linux操作系統(tǒng)的Ubuntu12.04版本。
為了驗(yàn)證準(zhǔn)確性,我們對(duì)比智能體的世界模型有通訊和沒有通訊以及仿真真實(shí)的著火的房屋對(duì)比,如圖2。
通過以上的對(duì)比,發(fā)現(xiàn)沒有通訊的智能體了解著火房屋數(shù)目明顯少于有通訊的智能體,而且有通訊時(shí)智能體世界模型里著火房屋數(shù)目與仿真器中的著火房屋數(shù)目也很靠近。
五、結(jié)語
本文主要介紹了一種在仿真救援中的有效的通訊模型,該模型有效用于在無中心智能體、差通訊條件下,在很復(fù)雜的救援環(huán)境下,也能對(duì)智能體的是世界模型及時(shí)更新,這也對(duì)仿真救援的各種決策來說至關(guān)重要。該方法應(yīng)用到東南大學(xué)救援仿真隊(duì)伍的代碼中,并在2014年中國機(jī)器人大賽暨RoboCup中國公開賽中獲得仿真組的特等獎(jiǎng),驗(yàn)證了該通訊模型的有效性。
參 考 文 獻(xiàn)
[1] Task Allocation for the Police Force Agents in RoboCupRescue Simulation[J] A. Bredenfeld et al. (Eds.): RoboCup 2005, LNAI 4020, 656-664, 2006.
[2] Timotheou, S. and Loukas, G. (2009) Autonomous Networked Robots for the Establishment of Wireless Communication in Uncertain Emergency Response Scenarios. Proc. 24th ACM Symp. Applied Computing, Track on Intelligent Robotic Systems,Honolulu, HI, USA, pp. 1171-1175.
[3]. S. B. M. Post and M. L. Fassaert. A communication and coordinationmodel for ‘robocuprescue agents. Masters thesis, Universiteit van Amsterdam, June 2004.
[4] Stef B.M. Post, Maurits L. Fassaert, and Arnoud Visser. Reducing the communication for multiagent coordination in the robocuprescue simulator. In 7th RoboCup International Symposium, Padua, Italy, July 2003.
[5] S. B. M. Post, M. L. Fassaert, and A. Visser. The high-level communication model for multiagent coordination in the robocuprescue simulator. In D. Polani, B. Browning, A. Bonarini, and K. Yoshida, editors, RoboCup2003: Robot Soccer World Cup VII, volume 3020 of Lecture Notes in Artificial Intelligence, pages 503-509. Springer-Verlag, 2004.
[6] M.L. Fassaert, S.B.M. Post, A. Visser”The common knowledge model of a team of rescue agent”,1th International Workshop on Synthetic Simulation and Robotics to Mitigate Earthquake Disaster, Padova, Italy, 6 July 2003.