周韜瑒
(安徽工業(yè)大學(xué)管理科學(xué)與工程學(xué)院,馬鞍山 243032)
蜂窩移動(dòng)網(wǎng)絡(luò)已經(jīng)經(jīng)歷了2G、3G、4G通信,現(xiàn)在正往5G大步邁進(jìn)。由于極速增長(zhǎng)的通信速度,伴隨著各種各樣互聯(lián)網(wǎng)應(yīng)用的產(chǎn)生,使得人們進(jìn)入了互聯(lián)網(wǎng)時(shí)代。實(shí)時(shí)通信對(duì)人們帶來(lái)了極大便利,讓整個(gè)社會(huì)對(duì)網(wǎng)絡(luò)產(chǎn)生了極大的依賴。如果有一天通信中斷,所有與網(wǎng)絡(luò)有關(guān)的應(yīng)用都將停止,這無(wú)疑會(huì)對(duì)我們的生產(chǎn)生活產(chǎn)生嚴(yán)重的影響。所以對(duì)于應(yīng)急通信的研究成為移動(dòng)通信研究中重要的一部分。無(wú)人機(jī)網(wǎng)絡(luò)現(xiàn)場(chǎng)評(píng)估對(duì)于控制災(zāi)情、營(yíng)救受災(zāi)群眾以及災(zāi)后重建具有重大意義,無(wú)人機(jī)網(wǎng)絡(luò)可以幫助救災(zāi)指揮官識(shí)別、處理和掌握大型自然災(zāi)害或其他緊急情況中的關(guān)鍵因素。此外,因其網(wǎng)絡(luò)建構(gòu)價(jià)格便宜、對(duì)應(yīng)用場(chǎng)地要求低、易于快速部署以及擴(kuò)展性強(qiáng)等優(yōu)勢(shì),受到了越來(lái)越多研究人員的關(guān)注,因此,深入研究基于多無(wú)人機(jī)的無(wú)線應(yīng)急通信網(wǎng)絡(luò)具有重要的實(shí)際意義和應(yīng)用前景[1,2]。博弈論是研究具有競(jìng)爭(zhēng)或者合作性質(zhì)現(xiàn)象的理論與方法,它既是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論最大的特點(diǎn)是能夠?yàn)橄鄳?yīng)的博弈過(guò)程找到一個(gè)納什均衡,有時(shí)候這個(gè)找到的均衡點(diǎn)也正是最優(yōu)策略解,針對(duì)突發(fā)事件現(xiàn)場(chǎng)無(wú)線路由器自組織網(wǎng)絡(luò)的快速安置以及靈活組織,采用博弈論的理論與模型對(duì)以多無(wú)人機(jī)為中繼節(jié)點(diǎn)中的競(jìng)爭(zhēng)與合作進(jìn)行建模,使得我們對(duì)問(wèn)題的研究找到最優(yōu)策略。
博弈論起源于經(jīng)濟(jì)學(xué),它被用來(lái)模擬沖突或合作方的行為[3]。它提供了一種分析競(jìng)爭(zhēng)參與者之間相互作用的方法,該方法已成功應(yīng)用于進(jìn)化生物學(xué)、政治、控制系統(tǒng)、通信和許多其他學(xué)科的問(wèn)題。在博弈理論中,博弈的基本元素包括:參與人(Player)、策略(Strategy)、支付(或收益,Payoff)。博弈是由這些元素所組成的決策情況,當(dāng)中每個(gè)元素都必須清楚明確,下面給出這些基本元素的定義。
(1)參與人。參與人也稱局中人,是指博弈中選擇行動(dòng)最大化自己效用的決策主體。參與人是理性人,其目標(biāo)是通過(guò)選擇某種策略以使自己的收益最大化。在博弈論中,我們常用Γ={1,2,…,n}表示一個(gè)n人博弈的所有參與者的集合,用i∈Γ代表博弈中的任何一位參與者。
(2)策略集。策略集中包含了參與者能夠選擇的所有策略,策略和行動(dòng)是十分相似的兩個(gè)概念,策略可分為純策略和混合策略。策略是參與人在給定信息集的情況下選擇行動(dòng)的一種規(guī)則,它規(guī)定參與人在什么情境下選擇什么行動(dòng),是參與者的“行動(dòng)方案”。它是一項(xiàng)規(guī)則而非行動(dòng)本身,每個(gè)參與人均有可供其選擇的多種策略。在一個(gè)n人博弈中,可以用si∈Si表示第i位參與者的一個(gè)特定策略,而Si則表示第i位參與者所有可選擇的策略的集合或策略空間。n位參與者各選擇一個(gè)策略形成n維向量s={s1,s2,…,sn}稱為策略組合。
(3)收益。參與者選擇某個(gè)策略時(shí)所能獲得的效用,每個(gè)參與者從各種策略組合中獲得的收益,由于它是策略組合s的函數(shù),所以也稱為支付函數(shù)。一個(gè)n人博弈中,用 ui(s1,s2,….,si,….,sn)表示第 i位參與者的支付。博弈的基本特征是一位參與者的支付不僅取決于自己的策略選擇,而且取決于其他參與人的策略選擇。
在博弈中,一個(gè)均衡就是一個(gè)由所以參與者的最優(yōu)策略所組成的組合,即一個(gè)特殊的策略組合。給定其他參與人選擇的策略,每個(gè)理性參與人將選擇最大化自己的回報(bào)的策略。這就導(dǎo)致了一種平衡狀態(tài),沒(méi)有任何參與者偏離其選擇策略的動(dòng)機(jī);這樣的舉動(dòng)會(huì)減少該參與人的收益。這組選擇稱為納什均衡(NE)。Nash平衡是最流行的游戲解決方案概念。在理想的世界中,將有一套策略,每個(gè)玩家選擇一個(gè)動(dòng)作,所有玩家的最佳反應(yīng)都將重合。此狀態(tài)稱為“純策略納什均衡”(PSNE)。在真實(shí)情境中,并不總是有PSNE,但是在可能的策略范圍內(nèi)存在概率分布。這種類型的NE被稱為“混合策略納什均衡”(MSNE)。直覺(jué)上來(lái)說(shuō),PSNE是MSNE的特例,為此,每個(gè)玩家的選擇之一的概率為1。在一個(gè)n人博弈中,如果為每個(gè)參與者給一個(gè)編號(hào),那么便可以用si*表示第i位參與者的最優(yōu)策略。而s*=(s1*,s2*,…,sn*)則是由所有參與者的最優(yōu)策略所組成的策略組合,即是一個(gè)均衡。
在一個(gè)n人博弈中,參與人用集合N={1,2,…,n}來(lái)表示,而參與人在當(dāng)前情境下能夠選擇的行動(dòng)策略用集合S來(lái)表示,參與人i所選擇的策略用si來(lái)表示si∈S,那么 s*={s1*,s2*,…,sn*}為納什均衡,當(dāng)且僅當(dāng)對(duì)任意的 i∈N,存在:
其中,s-i*表示除了參與人i以外其他參與人所選擇的策略,ui為參與人的最后收益,收益的計(jì)算是這些博弈中的關(guān)鍵階段。在有的情況下,博弈不存在納什均衡,同時(shí),也在有的情境下,博弈可能存在不止一個(gè)納什均衡。
目前國(guó)內(nèi)比較成熟的應(yīng)急通信系統(tǒng)主要集中于移動(dòng)指揮車,如基于車載型移動(dòng)應(yīng)急指揮系統(tǒng)[4]。通過(guò)將移動(dòng)指揮車以及移動(dòng)接入點(diǎn)等部署到應(yīng)急區(qū)域,從而搭建臨時(shí)無(wú)線通信網(wǎng)絡(luò)。同時(shí),在國(guó)內(nèi)面向公共突發(fā)事件情景下的應(yīng)急機(jī)制的研究主要停留在傳統(tǒng)方法,如應(yīng)急物資調(diào)度、應(yīng)急設(shè)施選擇和路徑優(yōu)化等[5]。除此之外,衛(wèi)星網(wǎng)絡(luò)也是應(yīng)急通信的重要手段,但主要由于其用戶擴(kuò)展性差,這種通信主要用于指揮系統(tǒng)。眾多研究可以發(fā)現(xiàn),當(dāng)前研究成果不能適用于無(wú)基礎(chǔ)通信設(shè)備情景下用戶應(yīng)急通信的要求。由于無(wú)人機(jī)體積小、操作簡(jiǎn)單、成本低等特點(diǎn),國(guó)內(nèi)外眾多研究人員也提出基于多無(wú)人機(jī)的自組織網(wǎng)絡(luò)[6,7]。不同于傳統(tǒng)無(wú)線網(wǎng)絡(luò)或自組織網(wǎng)絡(luò),基于多無(wú)人機(jī)的無(wú)線應(yīng)急網(wǎng)絡(luò),一方面需要根據(jù)用戶信息(終端用戶數(shù)量、通信量、位置信息等)的變化改變其網(wǎng)絡(luò)拓?fù)?;另一方面,具有通信中轉(zhuǎn)功能的無(wú)人機(jī),根據(jù)其他無(wú)人機(jī)的飛行路徑和通信要求,也需要改變其位置以保持無(wú)人機(jī)與無(wú)人機(jī)之間的連通性;于此同時(shí),某些無(wú)人機(jī)還起到網(wǎng)關(guān)的作用,與原地基站建立通信鏈路,實(shí)現(xiàn)臨時(shí)網(wǎng)絡(luò)與外界網(wǎng)絡(luò)的聯(lián)系。
博弈論是研究參與人如何進(jìn)行策略選擇,以及這種決策如何達(dá)到均衡。博弈論最大的特點(diǎn)是可以為相應(yīng)的博弈過(guò)程找到納什均衡點(diǎn),有時(shí)候這個(gè)均衡點(diǎn)就是最優(yōu)解,這樣,博弈論就能夠指導(dǎo)和分析無(wú)線通信網(wǎng)絡(luò)中的眾多算法設(shè)計(jì)。博弈論在無(wú)線通信網(wǎng)絡(luò)的應(yīng)用已有大量的研究,其中主要的研究包括:功率控制、流量控制、擁塞控制、路由協(xié)議、網(wǎng)絡(luò)安全、協(xié)作中繼通信以及資源預(yù)留的競(jìng)價(jià)等[8]。本文探討了基于無(wú)人機(jī)的無(wú)線路由器自組織應(yīng)急通信網(wǎng)絡(luò)的關(guān)鍵技術(shù),針對(duì)突發(fā)事件現(xiàn)場(chǎng)無(wú)線路由器自組織網(wǎng)絡(luò)的快速安置以及靈活組織,搭建出一種面向緊急突發(fā)狀況的以無(wú)人機(jī)為中繼節(jié)點(diǎn)的無(wú)線應(yīng)急通信網(wǎng)絡(luò)體系結(jié)構(gòu),來(lái)滿足現(xiàn)場(chǎng)的應(yīng)急指揮調(diào)度需求并且努力恢復(fù)用戶通信。將博弈論思想引進(jìn),探討無(wú)人機(jī)在當(dāng)前體系下的移動(dòng)機(jī)制問(wèn)題。
如圖1所示的雙層無(wú)線網(wǎng)絡(luò):路由層網(wǎng)狀(mesh)網(wǎng)絡(luò)和無(wú)人機(jī)網(wǎng)絡(luò)。前者由K個(gè)路由器和一些終端用戶組成,這是一種傳統(tǒng)的無(wú)線路由器網(wǎng)狀網(wǎng)絡(luò)。后者由U個(gè)無(wú)人機(jī)和一個(gè)遠(yuǎn)程基站(例如:移動(dòng)通信車輛)組成。無(wú)人機(jī)可以從路由器或其他無(wú)人機(jī)轉(zhuǎn)發(fā)數(shù)據(jù),以實(shí)現(xiàn)災(zāi)區(qū)內(nèi)與外部終端用戶之間的通信。雙層網(wǎng)絡(luò)可以輕松快速地部署到災(zāi)區(qū),災(zāi)難避難所、現(xiàn)場(chǎng)救援中心等,為終端提供緊急通信服務(wù)。研究的范圍是在路由器能量有限的條件下,無(wú)人機(jī)以以最快的方式收集數(shù)據(jù),這是判定網(wǎng)絡(luò)性能的關(guān)鍵點(diǎn)。對(duì)于無(wú)人機(jī)而言,我們可以把無(wú)人機(jī)視為博弈中的參與人,無(wú)人機(jī)在飛行中共有8種可執(zhí)行動(dòng)作:東、西、南、北、東南、東北、西南、西北。無(wú)人機(jī)在某一位置的可飛行方向其實(shí)是圍繞自身360度方向,但我們只考慮8個(gè)方向的位置。那么這8個(gè)方向:東、西、南、北、東南、東北、西南、西北,便是無(wú)人機(jī)作為參與人的策略集。在這種情況下就變成了無(wú)人機(jī)與無(wú)人機(jī)之間的博弈,他們的收益就是無(wú)人機(jī)收集到的路由器的數(shù)據(jù),同時(shí),路由器都有能量的限制,無(wú)人機(jī)要在限制能量的條件下選擇最有利于自己的飛行路徑,即收益最大的策略,從而達(dá)到總體最優(yōu),即找到納什均衡點(diǎn),無(wú)人機(jī)作為參與人可采取合作博弈的方式,以達(dá)到總體最優(yōu)。
圖1
通過(guò)介紹基于無(wú)人機(jī)的無(wú)線路由器自組織網(wǎng)絡(luò),并對(duì)多無(wú)人機(jī)下如何以最快的方式收集數(shù)據(jù)。在利用博弈論解決該類問(wèn)題時(shí),要對(duì)如何達(dá)到一種均衡狀態(tài)進(jìn)行研究。博弈論在分析無(wú)人機(jī)的無(wú)線路由器自組織網(wǎng)絡(luò)在為了最大化數(shù)據(jù)收集時(shí)的無(wú)人機(jī)移動(dòng)選擇情況,為提出更加有效的策略選擇方案探索出有效且實(shí)用的方法。