張旭,錢志鴻,劉影,王雪
(1.吉林大學通信工程學院,吉林長春130012;2.遼寧工程技術大學電子與信息工程學院,遼寧葫蘆島125105)
在當今資訊發(fā)達的社會中,無線網(wǎng)絡已經(jīng)變得越來越重要。近年來眾多無線通信技術中,無線自組織網(wǎng)絡以其快速組網(wǎng)、自主性和互聯(lián)性獲得了科研工作者的青睞。該技術的典型應用有戰(zhàn)場通訊,災難重建和搜尋營救操作,與此同時更多的商業(yè)應用也已經(jīng)在開發(fā)中。在Ad hoc網(wǎng)絡中,通信是通過多跳無線連接而并沒有固定基礎設施如基站等,因此它是自治的移動用戶集合通過相對帶寬受限的無線鏈路組網(wǎng)。由于節(jié)點是移動的,網(wǎng)絡拓撲可能隨時間快速改變且不可預測,物理層、媒質(zhì)接入層和網(wǎng)絡層是相互依賴相互作用的,因此在一個動態(tài)改變的網(wǎng)絡中尋找一條鏈路去轉(zhuǎn)發(fā)數(shù)據(jù)是很重要的。博弈方法在無線網(wǎng)絡的應用中并不鮮見,主要集中應用于在用戶間相互作用的模型建立以減少自私節(jié)點和協(xié)作節(jié)點。拓撲控制問題被研究建模為一種非合作博弈[1]。Huang[2-3]研究了具有無線通信背景的大規(guī)模LQG博弈。文獻[4]介紹了一個基于納什議價博弈的博弈理論框架以解決轉(zhuǎn)發(fā)節(jié)點區(qū)域預留帶寬的自私節(jié)點問題。文獻[5]介紹了一種馬氏跳變大種群隨機多自主體系統(tǒng)的平均場博弈。文獻[6]中提出一種域間路由協(xié)同監(jiān)測激勵策略。文獻[7]介紹了一種基于博弈理論的無線傳感器網(wǎng)絡分布式節(jié)能路由算法。文獻[8]提出了一種分布式二級路由協(xié)議(distributed two-tier routing,DTTR)。文獻[9]介紹了基于非合作博弈的無線網(wǎng)絡路由機制??紤]到無線網(wǎng)絡的不穩(wěn)定性、分布性等特點,同時將博弈論應用于無線網(wǎng)絡研究時,博弈模型的收斂性也是需要考慮的一個關鍵問題,因此本文提出一種基于平均場均衡(mean field equilibrium,MFE)的方法,可以適當降低冗余信息產(chǎn)生的系統(tǒng)開銷并提高網(wǎng)絡效率。
網(wǎng)絡層的功能包括路由建立和更新以及沿途的數(shù)據(jù)包轉(zhuǎn)發(fā)。一些問題如網(wǎng)絡中的自私節(jié)點,不同路由技術對網(wǎng)絡拓撲改變的收斂,以及不同路由節(jié)點行為等,都可以使用博弈論進行分析。
在無線自組織網(wǎng)絡中,節(jié)點間的連接是通過數(shù)據(jù)包或控制包的泛洪建立的。在這2種情況下,泛洪或轉(zhuǎn)播是傳送數(shù)據(jù)包至目的節(jié)點或在源節(jié)點和目的節(jié)點間尋找路徑的最可靠技術。圖1顯示了無線自組織網(wǎng)絡中源節(jié)點S需要轉(zhuǎn)發(fā)數(shù)據(jù)給目的節(jié)點D,可目的節(jié)點在它的傳輸范圍以外。所有位于源節(jié)點S無線傳輸范圍內(nèi)的都是它的鄰居節(jié)點。通過簡單泛洪搜尋路由,S將廣播數(shù)據(jù)包并且這些數(shù)據(jù)將通過每一個S的鄰居節(jié)點和那些接收到這些S的鄰居節(jié)點數(shù)據(jù)包的節(jié)點轉(zhuǎn)發(fā),直到抵達目的節(jié)點。如果網(wǎng)絡密度很大,將會存在很多冗余的信息廣播包。
圖1 無線自組織網(wǎng)絡中節(jié)點轉(zhuǎn)發(fā)策略Fig.1 Node forwarding strategy in Ad hoc network
這些冗余信息不僅僅使得路由選擇復雜化,同時也會因共享信道的關系而降低網(wǎng)絡整體性能。在一個共享媒質(zhì)的環(huán)境里,大量的數(shù)據(jù)包開銷增加了網(wǎng)絡時延和碰撞的概率,因此最終導致較低的包投遞率和吞吐量。博弈論的發(fā)明提供了沖突和競爭數(shù)學推理的基礎。它已經(jīng)成為一個豐富的理論,強大的數(shù)學和計算工具,同時更為直觀。而使用該理論工具作為一個潛在的強大的路由分析工具另外2點原因:
1)路由協(xié)議可以被建模為一個網(wǎng)絡和路由之間的博弈;
2)博弈的平衡點可以量化性能度量。
博弈論也廣泛應用于經(jīng)濟學,社會科學,生物學和工程學科等[10-12]。采用一種博弈理論的包轉(zhuǎn)發(fā)模型在節(jié)點數(shù)較多的網(wǎng)絡中可以有效降低網(wǎng)絡的泛洪。
通過建立合理有效的模型對節(jié)點之間的相互行為進行分析,其中代理的數(shù)量假設為無限的,即“平均場”的模式。同時認為每個代理設置解決一個路由轉(zhuǎn)發(fā)問題,但收益依賴于其他代理的行為。模型中描述為演變和代理行為。文中的隨機博弈模型中,代理采取行動更新他們的狀態(tài),而且他們的收益和狀態(tài)的轉(zhuǎn)移可能受其余參與人的狀態(tài)影響。考慮一個擁有m個節(jié)點的博弈。一個隨機博弈是一個數(shù)組 Γ =(X,A,P,π,β),定義如下:
1)時間:時間 t是離散的,t∈{0,1,…}。
2)狀態(tài):在t時刻局中人i的狀態(tài)為 xi,t∈X,是緊致的。用符號x-i,t表示t時刻除了局中人i以外的其余人的狀態(tài)。
3)行為:行為的數(shù)量為n,它們分別對應于一個代理可以選擇在任何給定的時間的行動。假設節(jié)點行為的結果是二進制的,“轉(zhuǎn)發(fā)”對應的節(jié)點獲得一個單位的獎勵,“不轉(zhuǎn)發(fā)”對應的節(jié)點是零獎勵。
4)類型:在任何給定時間的代理有一個類型,由一個隨機變量a的值在[0,1]中給出。其中n個元素代表的是n個參數(shù)對收益分布的影響。代理的類型是不可觀測的,這些參數(shù)之間的代理必須通過學習獲取。在代理中a是獨立同分布的。a群體測度記為 W,其中 W(A)表示概率,a∈A?[0,1]。
5)貼現(xiàn)因子β:貼現(xiàn)因子取值在(0,1)。
6)群體策略:xt為t時刻的一個普通代理狀態(tài)隨機變量,均勻地在人群中隨機提取。然后在時間t的群體策略定義為以下的n維概率向量:ft=(E[σ (xt,1)],E[σ (xt,2)],…,E[σ (xt,n)])7)收益:單一階段t時刻局中人i的收益為π(x,a,f),本文認為回報是有條件獨立的,一個代理接收單位收益轉(zhuǎn)發(fā)的概率Q(θ(i),f(i)),類型是θ和群體策略是f。假設,對于每一個固定的θ和 i,Q(θ(i),·)是連續(xù)的。
8)狀態(tài)轉(zhuǎn)移:根據(jù)是否對應于所選擇的臂的收益變量是1或0,局中人的狀態(tài)對應的相應變量增加1。更準確地說,讓yi,ni為單位基本向量,對應的行為是轉(zhuǎn)發(fā)或不轉(zhuǎn)發(fā)。因此,如果當前狀態(tài)為x,更新到x+yi狀態(tài),如果是轉(zhuǎn)發(fā)的話,反之則為z+ni。現(xiàn)在可以定義使用策略σ的代理的轉(zhuǎn)移內(nèi)核K。假設一個通用的代理的當前類型是θ,狀態(tài)是x,群體策略為 f,那么
以上建立了平均場博弈模型,可以假設一個局中人的收益受其余人的經(jīng)驗分布影響,相同的假設應用于無線自組織網(wǎng)絡中。收益依賴于其余局中人的行為,代理之間動態(tài)不同質(zhì),每一個時間步其余局中人的有限子集相互作用。上述模型中,局中人通過狀態(tài)和收益函數(shù)相互作用,這種耦合是相互獨立的。匿名俘獲概念即是通過局中人狀態(tài)信息的聚合來相互作用。一個代理的目的是最大化他的收益:
當局中人數(shù)目比較大時,假設一個局中人只響應其他局中人的長期平均狀態(tài)分布f。則平均場預期的收益為
式中:μ是一個無視策略,僅依賴于xt。
定義1 給定類型分布W,回報函數(shù)Q,策略σ,平均場均衡為(μ,f),其中μ∈M是狀態(tài)和類型的聯(lián)合分布,f為群體策略,滿足以下2個條件:
1)平穩(wěn)性:對于任何狀態(tài)x和任何類型的集A:
2)一致性:對所有的i
第1個條件要求μ在動態(tài)狀態(tài),群體策略為f時是穩(wěn)態(tài)分布,代理策略為σ。第2個條件是f為μ完全穩(wěn)態(tài)分布。2個條件一起確保該系統(tǒng)處于平衡狀態(tài)。有以下的命題,建立存在的MFE。證明是通過拓撲不動點理論,根據(jù)假設,在群體策略中Q是連續(xù)的。
命題1 對于任何的策略σ,存在一個MFE(μ,f)。
證明:證明通過一系列引理進行,共分3個步驟:首先,給定的策略和固定的群體策略,產(chǎn)生的代理穩(wěn)態(tài)分布是群體連續(xù)的。其次,這表明如果固定該策略和群體策略,并計算新的穩(wěn)態(tài)分布引發(fā)的群體策略,初始群體策略的映射是連續(xù)的。該證明通過布勞威爾不動點理論完成[13-15]。
引理1 假設Pt(x|θ,f,σ)表示給定的代理狀態(tài)的條件分布,其中θ,f和σ是固定的。那么Pt在f中是連續(xù)的。
引理2 對于任何策略σ和群體策略f,存在一個唯一的分布Φ(σ,f)滿足條件1。此外,對于固定的σ,Φ(σ,f)在f中是連續(xù)的。
證明:當(σ,f)固定,轉(zhuǎn)移核Pt(·|θ,f,σ)表示一個馬爾科夫鏈狀態(tài)空間。由于幾何間隔更新的獨立性,Φ(σ,f)可以顯式的表示為更新間隔:
假設在歐幾里德范數(shù)下 fk→f,根據(jù)引理1,Pt(x|a,fk,σ)→ Pt(x|a,f,σ)。根據(jù)有界收斂性,這表示對于所有的狀態(tài)x和博雷爾幾何A,Φ(σ,fk)(x,a)→ Φ(σ,f)(x,a)。因此 Φ(σ,fk)弱收斂于Φ(σ,f)。
引理3 Fσ是連續(xù)的。
證明:在歐幾里德范數(shù)下序列fk→f,根據(jù)引理2,有Φ(σ,fk)→ Φ(σ,f)。因為X是可分離的,根據(jù)Skorokhod定理意味著擁有隨機變量(xk,ak)和相應的策略Φ(σ,fk),以及一個隨機變量(x,a)和相應的策略Φ(σ,f)使得(xk,ak)→ (x,a)。由于xk在一個離散空間,這表示存在一個ε,對于所有的k>ε,xk=x。因此對于任何的 i,σ(xk,i)→ σ(x,i)。根據(jù)有界收斂定理可以得到:
由于Fσ是連續(xù)的并且映射自身一個緊致集,使用布勞威爾定理,存在一個不動點f*滿足Fσ(f*)=f*。因此可以證明(σ,f*)可同時滿足條件1和2??紤]M總的全變差距離度量dTV,使用以下dTV的等價參數(shù)。
定義2 總的全變差距離有以下的等價定義:
1)讓 μ1,μ2∈M 是任意 2個測度,μ 是相對于μ1和 μ2絕對連續(xù)的任意測度。假設 ξ1,ξ2是 μ 的Radon-Nikodym導數(shù),則:
2)F為所有博雷爾可測子集,則:
3)以 Ω(ξ1,ξ2)表示 2 個隨機向量(x1,a1)和(x2,a2)的所有聯(lián)合概率測度使得 k=1,2時,(xk,ak)的邊緣分布為μk,則:
這里的K已經(jīng)在式(1)定義過。注意到如果μ*是映射 Tσ 的不動點,那么 μ*和f*=p(σ,μ*)是一個MFE。相反地,在任何MFE(μ,f)中,μ必須是Tσ的不動點,f=p(σ,μ)被唯一地確定。因此給定一個策略σ,唯一的MFE存在當且僅當映射Tσ存在一個唯一的不動點。其充分條件為Tσ是一個關于總的全變差距離度量的收縮映射。這種條件也表示如果初始化系統(tǒng)為一個任意的初始分布μ∈M,在映射Tσ下考慮系統(tǒng)的演化,最終將收斂至一個MFE。
本文提出的平均場均衡的無線自組織網(wǎng)絡AODV路由算法(mean field equilibrium AODV,MFEA)是基于按需平面距離矢量路由協(xié)議(Ad hoc on-demand distance vector routing,AODV)。在 AODV協(xié)議中,當源節(jié)點有數(shù)據(jù)要發(fā)送時,源節(jié)點需要廣播一個路由請求包,當中包含了最新節(jié)點的序列號。鄰居節(jié)點同樣廣播此分組,直到達到目的節(jié)點或者到達含有最新路由的中間節(jié)點為止。在節(jié)點轉(zhuǎn)發(fā)請求包的過程中,記錄經(jīng)過的上游節(jié)點的ID,建立一條從源節(jié)點到目的節(jié)點的反向路由。AODV路由協(xié)議的帶寬利用率高,并且是應用于變化的網(wǎng)絡拓撲,但是由于在Ad hoc網(wǎng)絡中節(jié)點移動頻繁,對AODV路由協(xié)議路由表的維護較困難、可靠性低,而且部分節(jié)點的能量消耗過快,也會造成路由中斷。
在AODV協(xié)議中,信息可周期性通過節(jié)點廣播并用于鏈路監(jiān)測,當節(jié)點M接收到來自節(jié)點N的信息,M意識到節(jié)點N在他的無線傳輸范圍內(nèi)并且是它的鄰居節(jié)點。相反的,如果不能正確接收到信息則表明這是一個無效的鏈路。如果采用MFEA算法用于轉(zhuǎn)發(fā)AODV路由協(xié)議,MFEA算法在源節(jié)點在發(fā)送廣播分組的過程中,中間轉(zhuǎn)發(fā)節(jié)點根據(jù)周圍鄰居節(jié)點的行為信息,通過計算出收益轉(zhuǎn)發(fā)概率,進而決定是否作為中間轉(zhuǎn)移節(jié)點進行數(shù)據(jù)分組轉(zhuǎn)發(fā),并且通過推算最大目的效益以及函數(shù)的迭代,更新中間節(jié)點的狀態(tài)信息,最終到達目的節(jié)點,同時形成反向的路由路徑。圖2介紹了MFEA的系統(tǒng)流程。
算法描述:
1)當一個源節(jié)點S要尋找到目的節(jié)點D的路徑時,首先要確定源節(jié)點S的當前時刻的狀態(tài),以及其余節(jié)點的狀態(tài)信息,最開始網(wǎng)絡上的節(jié)點是隨機
給定任何策略σ,推導出MFE(μ,f)存在的充分條件,并且MFE收斂??紤]映射Tσ:分布的,根據(jù)前向分組格式{源地址,目的地址,序列號,跳數(shù),行為,節(jié)點1,…節(jié)點N}初始化分組,執(zhí)行2)。
2)當數(shù)據(jù)分組傳送到下一個節(jié)點時,首先是判斷為目的節(jié)點還是中間節(jié)點。如果是中間節(jié)點,根據(jù)周圍節(jié)點的行為信息以及當前節(jié)點的類型θ,計算出節(jié)點的收益轉(zhuǎn)移概率Q(θ(i),f(i)),確定是否作為中間節(jié)點,同時根據(jù)轉(zhuǎn)移概率,通過式(2)計算出最大目的收益,用值迭代函數(shù)計算均衡,使用新策略尋找下一個分布,最后計算誤差及狀態(tài)的累積分布,并將舊狀態(tài)更新為新狀態(tài),重復執(zhí)行2)。如果當前節(jié)點沒有到下一跳的路由信息,則重新選擇上游節(jié)點,重新執(zhí)行2)。到達目的節(jié)點后,執(zhí)行3)。
3)當分組到達目的節(jié)點后,根據(jù)后向分組格式{源地址,目的地址,序列號,跳數(shù),行為,類型,轉(zhuǎn)移概率,節(jié)點1,..節(jié)點 N}更新數(shù)據(jù)分組格式。當分組到達目的節(jié)點后,更新周圍路由信息的同時,全局更新路徑上所有的鏈路信息,執(zhí)行4)。
4)沿著獲得的反向路徑信息發(fā)送數(shù)據(jù)分組,反向路徑上的中間節(jié)點根據(jù)行為信息以及收益轉(zhuǎn)移概率轉(zhuǎn)移數(shù)據(jù),重復執(zhí)行4)直至到達源節(jié)點S。
5)源節(jié)點根據(jù)返回信息更新原路由信息。
圖2 MFEA流程圖Fig.2 MFEA flow diagram
前面介紹了博弈轉(zhuǎn)發(fā)和納什平均場均衡,根據(jù)給定的狀態(tài)計算最優(yōu)策略,下一個狀態(tài)的計算主要根據(jù)公式遞歸求出。為了證明該方法對整體網(wǎng)絡性能提升的影響,在網(wǎng)絡模擬器NS-2中進行一系列試驗。在模擬試驗中,仿真參數(shù)見表1所示。
表1 仿真參數(shù)Table 1 Parameters for simulation
下面將分別對不同網(wǎng)絡環(huán)境下的算法性能進行分析。無線自組織網(wǎng)絡是一個動態(tài)的網(wǎng)絡,首先仿真環(huán)境假設在不同的節(jié)點移動速度下進行,節(jié)點的移動速度設定為10 m/s,2種路由協(xié)議分別根據(jù)端到端的時延、分組投遞率和系統(tǒng)歸一化開銷3種性能指標進行分析。
把網(wǎng)絡建模為一個無向圖G=(V,E),這里V代表節(jié)點集合,E代表連接節(jié)點之間的鏈路集合。每個節(jié)點都有一個唯一的識別以便于路由協(xié)議可以識別他。
端到端時延:由于網(wǎng)絡中鏈路可能被損壞以及節(jié)點隨時的移動性,任意鏈路e=(m,n)∈E都會存在相對應的時延D(e),鏈路的信道時延包括無線傳播時延、隊列時延及協(xié)議出路時間等。任意2個節(jié)點m和n之間的路徑設定為P(m,n)=(m,e(m,x),x,e(x,y),y,… e(z,n),n)??梢岳斫鉃槿我?個節(jié)點之間的路徑就是組成他們之間鏈路的所有可能節(jié)點的集合。一般來說,P(i,j)=P{P0,P1,…,Pn},此時的Pi代表節(jié)點m和n之間的路徑選擇。延時定義如下:
分組數(shù)據(jù)包投遞率:目的端接收到的數(shù)據(jù)包數(shù)目與網(wǎng)絡中實際發(fā)送數(shù)據(jù)包數(shù)目的比值,這個比率測量了發(fā)現(xiàn)路徑的效率。假設發(fā)送了100個數(shù)據(jù)包給目的節(jié)點,最后接收到了60個數(shù)據(jù)包,那么網(wǎng)絡中的數(shù)據(jù)包投遞率即為60%,該度量反映了發(fā)送數(shù)據(jù)的成功率。
歸一化開銷:每一個數(shù)據(jù)包成功被目的節(jié)點接收時候所需要的路由包數(shù)目。這個性能反映了網(wǎng)絡的擁塞程度以及節(jié)點的效率,開銷較大的協(xié)議擁塞的概率相對大一些,并且會延遲隊列中數(shù)據(jù)包的發(fā)送。
在節(jié)點數(shù)目由100~400變化的仿真實驗中,對協(xié)議的3種性能進行了分析。圖3比較了在不同節(jié)點數(shù)目情況下AODV路由協(xié)議和MFEA協(xié)議的平均端到端時延,可以看出MFEA方法中對于節(jié)點數(shù)目增加下的影響并不大,甚至在節(jié)點數(shù)目少的時候,AODV甚至延時低于MFEA協(xié)議可達0.05 s。不過當節(jié)點數(shù)目增加到150以上的時候,AODV的時延隨著節(jié)點數(shù)目的增加顯著增加。
這是因為在節(jié)點數(shù)目增加的情況下,網(wǎng)絡中的變化復雜起來,路由的可靠性不能保障,因此AODV協(xié)議的時延增加較快;而MFEA由于采取了均衡的方法,在數(shù)據(jù)包轉(zhuǎn)發(fā)的時候可以有效的進行轉(zhuǎn)發(fā),不受節(jié)點數(shù)目增多所引起的網(wǎng)絡拓撲變化加快的影響,因此網(wǎng)絡的延時并沒有劇烈的變化,在節(jié)點數(shù)量為400時,MFEA算法的時延較AODV算法有將近0.2 s的提高,可見在大規(guī)模的網(wǎng)絡中更加實用。
圖3 MFEA流程圖Fig.3 MFEA flow diagram
圖4為2種協(xié)議下的數(shù)據(jù)包投遞率的性能比較。
圖4 不同節(jié)點數(shù)目下包投遞率比較Fig.4 Packet delivery ratio vs.number of nodes
從圖中可以看出,MFEA方法在節(jié)點數(shù)目較少的時候投遞率性能與AODV相似,投遞率在85%~90%左右。隨著節(jié)點數(shù)目增加,MFEA協(xié)議性能明顯優(yōu)于正常的AODV協(xié)議,在節(jié)點數(shù)目較高的時候這種優(yōu)勢尤其顯著,最高可達8%。這是因為網(wǎng)絡規(guī)模較大的時候,AODV在拓撲變化頻繁的網(wǎng)絡下不能及時選擇適當?shù)穆窂揭詡鞑?shù)據(jù),同時在MAC層產(chǎn)生大量的數(shù)據(jù)碰撞也影響了整體的數(shù)據(jù)包投遞率,而MFEA協(xié)議采用了均衡的方法,更能有效地適應于變化的網(wǎng)絡拓撲。
從圖5中可以看出當節(jié)點數(shù)目在100~400,MFEA方法的路由協(xié)議的歸一化系統(tǒng)開銷均低于AODV協(xié)議,最大可達10。這是因為AODV在這種情況下需要不停的尋找新的可用路徑,從而產(chǎn)生大量的泛洪控制包,因此系統(tǒng)開銷也會增加很多。而MFEA算法是一種僅需要長期狀態(tài)平均的方法,它可以增加節(jié)點轉(zhuǎn)發(fā)請求包概率,同時也可以減少因為網(wǎng)絡拓撲變化帶來的鏈路斷開問題,降低了系統(tǒng)的開銷性能。
圖5 不同節(jié)點數(shù)目下歸一化開銷比較Fig.5 Normalized overhead vs.number of nodes
本文介紹了一種基于平均場均衡的無線自組織網(wǎng)絡路由協(xié)議,該方法對無線網(wǎng)絡路由中的轉(zhuǎn)發(fā)泛洪信息包求取平衡狀態(tài),最終達到減少冗余信息包,降低系統(tǒng)開銷的目的。在節(jié)點數(shù)目100~400進行的仿真結果表明,本方法能有效地減少網(wǎng)絡平均端到端時延,系統(tǒng)開銷,同時也能增加包投遞率,因此延長了網(wǎng)絡的使用時間,從而提高了網(wǎng)絡效率。
[1]EIDENBENZ S,KUMAR V S,ZUST S.Equilibria in topology control games for ad hoc networks[J].Mobile Networks and Applications,2006,11(2):143-159.
[2]HUANG M,MALHAM'E P R,CAINES P E.Nash certainty equivalence in large population stochastic dynamic games:connections with the physics of interacting particle systems[C]//Proceedings 45th IEEE Conference on Decision and Control.San Diego,USA,2006:4921-4926.
[3]HUANG M,CAINES P E,MALHAM'E R P.Large population costcoupled LQG problems with nonuniform agents:individual-mass behavior and decentralized ε-Nash equilibria[J].IEEE Trans Autom Control,2007,52(9):1560-1571.
[4]LU Bin,POOCH U W.A game theoretic framework for bandwidth reservation in mobile ad hoc networks[C]//Proceedings of the First International Conference on Quality of Service in Heterogeneous Wired/Wireless Networks(QSHINE’04).Dallas,USA,2004:234-241.
[5]王炳昌,張紀峰.馬氏跳變大種群隨機多自主體系統(tǒng)的平均場博弈[C]//Proceedings of the 29th Chinese Control Conference.Beijing,China,2010.WANG Bingchang,ZHANG Jifeng.Mean field games for large population stochastic multi-agent systems with Markov jumps[C]//Proceedings of the 29th Chinese Control Conference.Beijing,China,2010.
[6]郭毅,王振興,程東年.基于博弈的域間路由協(xié)同監(jiān)測激勵策略[J].中國科學:信息科學,2012,42(7):803-814.GUO Yi,WANG Zhenxing,CHENG Dongnian.A game-theory-based incentive strategy for inter-domain routing cooperative monitoring[J].Scientia Sinica Informationis,2012,42(7):803-814.
[7]楊寧,田輝,黃平,等.基于博弈理論的無線傳感器網(wǎng)絡分布式節(jié)能路由算法[J].電子與信息學報,2008,30(5):1230-1233.YANG Ning,TIAN Hui,HUANG Ping,et al.Distributed energy-economical routing algorithm based on game-theory for WSN[J].Journal of Electronics& Information Technology,2008,30(5):1230-1233.
[8]胡靜,沈連豐.基于博弈論的無線傳感器網(wǎng)絡分簇路由協(xié)議[J].東南大學學報,2010,40(3):441-446.HU Jing,SHEN Lianfeng.Clustering routing protocol of wireless sensor networks based on game theory[J].Journal of Southeast University,2010,40(3):441-446.
[9]汪洋,林闖,李泉林,等.基于非合作博弈的無線網(wǎng)絡路由機制研究[J].計算機學報,2009,32(1):54-68.WANG Yang,LIN Chuang,LI Quanlin,et al.Non-cooperative game based research on routing schemes for wireless networks[J].Chinese Journal of Computers,2009,32(1):54-68.
[10]AUMANN R J.Handbook of game theory with economic applications[M].Amsterdam:Elsevier,1994.
[11]OSBORNE M J,RUBINSTEIN A.A course in game theory[M].Cambridge:MIT press,1994.
[12]GIBBONS R.Game theory for applied economists[M].Princeton:Princeton University Press,1992.
[13]ADLAKHA S,JOHARI R.Mean field equilibrium in dynamic games with complementarities[C]//2010 49th IEEE Conference on Decision and Control(CDC).Atlanta,USA,2010:6633-6638.
[14]WEINTRAUB G Y,BENKARD C L,Van ROY B.Oblivious equilibrium:a mean field approximation for large-scale dynamic games[C]//Neural Information Processing Systems.Vancouver,Canada,2005.
[15]IYER K,JOHARI R,SUNDARARAJAN M.Mean field equilibria of dynamic auctions with learning[J].ACM SIGecom Exchanges,2011,10(3):10-14.