王丁 曹奇英 許洪云 沈士根
摘 要:為解決無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作策略的選擇影響協(xié)作效果的問題,考慮到節(jié)點(diǎn)數(shù)量有限及個(gè)體隨機(jī)性,基于模仿突變Wright-Fisher過程的隨機(jī)演化博弈,提出了WSNs節(jié)點(diǎn)協(xié)作隨機(jī)演化模型,并加入了與節(jié)點(diǎn)協(xié)作程度相關(guān)的懲罰機(jī)制。該模型彌補(bǔ)了復(fù)制子動(dòng)態(tài)不適用于節(jié)點(diǎn)數(shù)量有限的WSNs節(jié)點(diǎn)協(xié)作演化建模問題。經(jīng)過隨機(jī)動(dòng)力學(xué)分析,推導(dǎo)并證明了達(dá)到演化穩(wěn)定狀態(tài)的定理。最后通過實(shí)驗(yàn)驗(yàn)證定理并分析了選擇強(qiáng)度和懲罰力度對(duì)WSNs節(jié)點(diǎn)協(xié)作演化穩(wěn)定狀態(tài)的影響。
關(guān)鍵詞:無線傳感器網(wǎng)絡(luò);協(xié)作;Wright-Fisher過程;隨機(jī)演化博弈;模仿突變
中圖分類號(hào): TP393 文獻(xiàn)標(biāo)志碼: A 文章編號(hào):2095-2163(2016)01-
Abstract: To solve the problem of coordination decisions among WSNs nodes which affects the cooperation between nodes, considering limited numbers of nodes and individual stochastic effect, this paper constructs a stochastic evolutionary trust model of WSNs nodes based on imitated mutation Wright-Fisher process, and introduces a punishment mechanism related to the coordination level of nodes. The model compensated for the shortcoming of replicator dynamics where it was inapplicable to the WSNs having limited numbers of nodes. Theorems of arriving at the evolutionary stable state, through stochastic dynamics analysis, are deduced and proved. Experiments verify the conclusions and analyze the impacts of punishment levels and selection intensities toward the WSNs nodes coordination evolutionary stable state.
Keywords: Wireless Sensor Networks(WSNs); Coordination; Wright-Fisher Process; Stochastic Evolutionary Game; Imitated Mutation
0 引言
無線傳感器網(wǎng)絡(luò)(Wireless Sensor Networks, WSNs) [1]是由數(shù)量眾多的傳感器節(jié)點(diǎn)以自組織和多跳等方式組成的無線網(wǎng)絡(luò)。WSNs中傳感器節(jié)點(diǎn)采集的數(shù)據(jù)需要被多個(gè)節(jié)點(diǎn)連續(xù)轉(zhuǎn)發(fā)后才能到達(dá)目標(biāo)節(jié)點(diǎn)。如果一個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)協(xié)作,那么將會(huì)幫助其他節(jié)點(diǎn)轉(zhuǎn)發(fā)數(shù)據(jù)包,使協(xié)作任務(wù)的成功率提高,可認(rèn)為該節(jié)點(diǎn)獲得收益;但在轉(zhuǎn)發(fā)數(shù)據(jù)包的同時(shí),節(jié)點(diǎn)本身需要付出一定的成本,如消耗能量、自身任務(wù)延時(shí)傳輸?shù)?。由于獲得收益和付出成本是一個(gè)矛盾,因此若存在較多節(jié)點(diǎn)不和其他節(jié)點(diǎn)協(xié)作的情況,就會(huì)導(dǎo)致WSNs節(jié)點(diǎn)無法正常協(xié)作。因此,節(jié)點(diǎn)之間協(xié)作與否會(huì)直接影響到WSNs的穩(wěn)定性和協(xié)作任務(wù)的成功率。
近幾年來,已有許多學(xué)者使用演化博弈論的方法來分析網(wǎng)絡(luò)中的一些矛盾問題。文獻(xiàn)[2]分析了無限總體演化博弈的演化穩(wěn)定策略,并與復(fù)雜網(wǎng)絡(luò)博弈的演化穩(wěn)定策略進(jìn)行了比較,提出了一種適用于網(wǎng)絡(luò)演化博弈的演化穩(wěn)定策略新定義;文獻(xiàn)[3]將演化博弈應(yīng)用于延遲容忍網(wǎng)絡(luò)的非合作轉(zhuǎn)發(fā)控制方面,并分析了交互次數(shù)對(duì)演化均衡的影響。在WSNs研究領(lǐng)域,文獻(xiàn)[4]提出了一種基于演化博弈的資源控制協(xié)議,用于緩解WSNs內(nèi)部資源競(jìng)爭(zhēng)矛盾。文獻(xiàn)[5]將演化博弈與WSNs節(jié)點(diǎn)信任決策結(jié)合,建立了WSNs節(jié)點(diǎn)信任博弈模型,提出并證明了在不同的參數(shù)條件下達(dá)到演化穩(wěn)定策略的定理。文獻(xiàn)[6]和文獻(xiàn)[7]在文獻(xiàn)[5]的基礎(chǔ)上分別引入了節(jié)點(diǎn)的反思機(jī)制和模仿機(jī)制,并考慮了網(wǎng)絡(luò)不可靠因素對(duì)模型的影響。
上述文獻(xiàn)所用的演化博弈模型大都是針對(duì)無限總體的對(duì)象,而實(shí)際情況中的研究對(duì)象一般都是有限總體。針對(duì)這個(gè)問題,學(xué)者們將隨機(jī)過程應(yīng)用到演化博弈中,形成了以有限總體為研究對(duì)象的隨機(jī)演化博弈。文獻(xiàn)[8]研究了服務(wù)提供商面對(duì)軟硬件服務(wù)攻擊時(shí)的安全和可信機(jī)制,提出了一種適用于虛擬傳感器服務(wù)(Virtual Sensor Services)的安全、可信的隨機(jī)演化聯(lián)合博弈防御框架。文獻(xiàn)[9]針對(duì)網(wǎng)構(gòu)軟件中存在的服務(wù)問題,將網(wǎng)構(gòu)軟件的服務(wù)差異化,并把基于Wright-Fisher過程的兩策略博弈拓展到多策略,提出了一種博弈參與者具有多個(gè)策略的信任演化博弈模型。文獻(xiàn)[10]把Moran過程應(yīng)用到無線網(wǎng)絡(luò)的接入選擇中,并從多策略的角度改進(jìn)了局部更新機(jī)制。隨機(jī)演化博弈雖然在其他領(lǐng)域已有較廣的應(yīng)用,但是目前在WSNs中應(yīng)用還較少。
本文使用基于兩策略頻率相關(guān)、帶模仿突變的Wright-Fisher過程隨機(jī)演化博弈模型來分析無線傳感器網(wǎng)絡(luò)中存在的節(jié)點(diǎn)協(xié)作問題。數(shù)量有限的WSNs節(jié)點(diǎn)在選擇協(xié)作與否時(shí)體現(xiàn)出了重復(fù)性、有限理性等特征,而對(duì)于整個(gè)WSNs來說,其目標(biāo)是在達(dá)到總體收益較高狀態(tài)的同時(shí)也能夠保持足夠的穩(wěn)健性,這些特征恰好滿足隨機(jī)演化博弈的要求。據(jù)此,本文建立了WSNs節(jié)點(diǎn)協(xié)作演化模型,使節(jié)點(diǎn)在無外界干預(yù)的情況下動(dòng)態(tài)演化,各個(gè)節(jié)點(diǎn)根據(jù)模仿突變Wright-Fisher機(jī)制自行調(diào)整下一次博弈的策略,使WSNs逐漸演化到穩(wěn)定狀態(tài)。在到達(dá)演化穩(wěn)定狀態(tài)之后,WSNs中的絕大部分節(jié)點(diǎn)將會(huì)選擇協(xié)作策略并保持不變。在信任演化[5]的基礎(chǔ)上,通過考慮WSNs中有限節(jié)點(diǎn)數(shù)量的情況,引入懲罰因子和模仿機(jī)制來構(gòu)造協(xié)作博弈模型,并利用帶突變的Wright-Fisher過程來分析節(jié)點(diǎn)協(xié)作演化動(dòng)態(tài),使WSNs節(jié)點(diǎn)協(xié)作模型更趨近真實(shí)狀況,并得出到達(dá)演化穩(wěn)定狀態(tài)的定理,分析影響到達(dá)演化穩(wěn)定狀態(tài)的影響因子。
1 基于突變Wright-Fisher過程的隨機(jī)演化博弈模型
博弈論是分析博弈個(gè)體在進(jìn)行博弈時(shí)表現(xiàn)出的行為并研究博弈個(gè)體的博弈最優(yōu)策略的理論。一個(gè)標(biāo)準(zhǔn)的博弈由3個(gè)要素組成:博弈個(gè)體,策略集合和收益函數(shù)[11]。博弈個(gè)體是參與博弈的主觀個(gè)體,每個(gè)博弈個(gè)體分別從策略集合中選取一種策略與另一個(gè)博弈個(gè)體進(jìn)行博弈,收益函數(shù)是博弈個(gè)體依據(jù)其策略與對(duì)手博弈所獲得的收益。收益函數(shù)可由收益矩陣的形式給出。經(jīng)典博弈的博弈個(gè)體總是完全理性[11]的,也就是說,博弈個(gè)體總是選擇收益最大的策略與對(duì)手進(jìn)行博弈。
演化博弈論在經(jīng)典博弈的基礎(chǔ)之上,結(jié)合博弈分析理論和生物種群的演化過程,形成了一個(gè)新的博弈論分支。在演化博弈論中,博弈個(gè)體都是有限理性[12]的,它把所有博弈個(gè)體的總體視為一個(gè)種群,將種群作為基本的研究對(duì)象,研究博弈個(gè)體在多次動(dòng)態(tài)博弈中的策略演化狀況。
經(jīng)典的演化博弈的研究對(duì)象一般是無限總體,但在實(shí)際情況中,研究對(duì)象都是總體數(shù)量有限的,并且個(gè)體的隨機(jī)性在有限總體的博弈過程中起著非常重要的作用,因此基于隨機(jī)過程的隨機(jī)演化博弈成為了研究有限總體演化博弈的重要途徑,當(dāng)中較重要的三種模型是Moran過程[13]、Wright-Fisher過程[14]和隨機(jī)配對(duì)過程[15]。其中Wright-Fisher過程由于能夠在一次迭代內(nèi)進(jìn)行同步更新,相較于只能異步更新的其他兩種過程更具現(xiàn)實(shí)意義。
在Wright-Fisher過程中,總體中的個(gè)體在進(jìn)行策略更新時(shí),會(huì)依據(jù)策略的適應(yīng)性選擇適合自身的策略,之后每一個(gè)體都會(huì)產(chǎn)生多個(gè)后代個(gè)體,得到一個(gè)總數(shù)大于總體數(shù)量的后代集合,再?gòu)倪@個(gè)集合中隨機(jī)選出等于總體數(shù)量的新個(gè)體取代當(dāng)前個(gè)體。
在文獻(xiàn)[14]描述的Wright-Fisher過程博弈模型的基礎(chǔ)上引入模仿突變概率 , , 表示選擇 策略的個(gè)體在下一次博弈時(shí)依然選擇 策略的概率, 表示選擇 策略的個(gè)體在下一次博弈時(shí)突變?yōu)?策略的概率, 表示選擇 策略的個(gè)體在下一次博弈時(shí)突變?yōu)?策略的概率, 表示選擇 策略的個(gè)體在下一次博弈時(shí)依然選擇 策略的概率。易知,突變概率 存在如下關(guān)系:
, (1)
每個(gè)博弈個(gè)體在進(jìn)行策略更新時(shí),策略的選擇過程相當(dāng)于在個(gè)體后代的集合中進(jìn)行 次獨(dú)立的二項(xiàng)分布試驗(yàn),因此產(chǎn)生選擇 策略個(gè)體的過程就是概率為 的 重伯努利試驗(yàn),所以帶突變的Wright-Fisher過程是一個(gè)狀態(tài)空間為 的馬爾可夫鏈,系統(tǒng)從狀態(tài) 轉(zhuǎn)變到狀態(tài) 的轉(zhuǎn)移概率為:
(2)
2 WSNs節(jié)點(diǎn)協(xié)作演化模型
2.1 博弈模型
基于文獻(xiàn)[5]的研究,本文在WSNs節(jié)點(diǎn)協(xié)作博弈時(shí)加入了與節(jié)點(diǎn)協(xié)作程度相關(guān)的懲罰機(jī)制。在WSNs中,節(jié)點(diǎn)可以與鄰居節(jié)點(diǎn)進(jìn)行主動(dòng)式的交互,選擇協(xié)作策略與對(duì)方協(xié)作,或選擇不協(xié)作策略不與對(duì)方協(xié)作。在本文中并不涉及節(jié)點(diǎn)協(xié)作程度的計(jì)算或量化過程,而是在節(jié)點(diǎn)選擇不協(xié)作策略時(shí)給予一定的懲罰。
考慮兩個(gè)節(jié)點(diǎn)在交互時(shí)的協(xié)作狀況,記 表示當(dāng)前節(jié)點(diǎn)數(shù)據(jù)被協(xié)作節(jié)點(diǎn)成功轉(zhuǎn)發(fā)傳輸而帶來的收益; 表示當(dāng)前節(jié)點(diǎn)選擇與其他節(jié)點(diǎn)協(xié)作,成功轉(zhuǎn)發(fā)其他節(jié)點(diǎn)數(shù)據(jù)使任務(wù)的成功率提高帶來的收益; 表示當(dāng)前節(jié)點(diǎn)因選擇協(xié)作策略提升了自身在對(duì)方節(jié)點(diǎn)的信任度收益或因選擇不協(xié)作策略而降低自身在對(duì)方節(jié)點(diǎn)的信任度損失; 表示當(dāng)前節(jié)點(diǎn)選擇協(xié)作策略使路由可靠度提升而帶來的收益或因選擇不協(xié)作策略而使路由可靠度降低所帶來的收益損失; 表示因?qū)Ψ焦?jié)點(diǎn)不協(xié)作而導(dǎo)致自身數(shù)據(jù)傳輸失敗帶來的收益損失; 表示因選擇不協(xié)作策略節(jié)省能量從而延長(zhǎng)自身的生存周期所獲得的收益; 表示當(dāng)前節(jié)點(diǎn)向?qū)Ψ焦?jié)點(diǎn)發(fā)送自身的數(shù)據(jù)或轉(zhuǎn)發(fā)對(duì)方數(shù)據(jù)所產(chǎn)生的傳輸成本, 表示當(dāng)前節(jié)點(diǎn)因選擇了不協(xié)作策略而受到的懲罰損耗。
下面對(duì)各種可能發(fā)生的交互狀態(tài)分別進(jìn)行討論:
1)兩個(gè)節(jié)點(diǎn)在進(jìn)行交互時(shí)均選擇了協(xié)作策略。雙方節(jié)點(diǎn)的收益均為 。
2)兩個(gè)節(jié)點(diǎn)在進(jìn)行交互時(shí)有一個(gè)節(jié)點(diǎn)選擇了協(xié)作策略,而另一個(gè)節(jié)點(diǎn)選擇了不協(xié)作策略。此時(shí)選擇了協(xié)作策略的節(jié)點(diǎn)會(huì)幫助對(duì)方節(jié)點(diǎn)轉(zhuǎn)發(fā)傳輸數(shù)據(jù),而選擇不協(xié)作策略的節(jié)點(diǎn)則不會(huì)幫助對(duì)方轉(zhuǎn)發(fā)數(shù)據(jù),因此選擇協(xié)作策略的節(jié)點(diǎn)收益為 ,選擇不協(xié)作策略的節(jié)點(diǎn)收益為 。
3)兩個(gè)節(jié)點(diǎn)在進(jìn)行交互時(shí)均選擇了不協(xié)作策略。兩個(gè)節(jié)點(diǎn)的收益均為 。
定義1 無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作博弈是一個(gè)由四元組 表示的對(duì)稱博弈。其中參與者 為無線傳感器網(wǎng)絡(luò)中所有節(jié)點(diǎn)的集合; 為參與者的總體數(shù)量;策略集合為 , 為協(xié)作策略, 為不協(xié)作策略; 為無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)在一次兩人兩策略對(duì)稱博弈時(shí)的收益函數(shù),如表1所示。
2.2 模仿突變因子的確定
本文提出一種基于模仿策略的策略調(diào)整機(jī)制,使傳感器節(jié)點(diǎn)在協(xié)作博弈時(shí)若發(fā)現(xiàn)對(duì)方策略的收益大于自己的收益,就會(huì)模仿其策略或行為。模仿機(jī)制體現(xiàn)在博弈過程中具體表現(xiàn)為博弈個(gè)體在產(chǎn)生后代的過程中引入模仿突變因子,產(chǎn)生后代的過程中有一定的突變概率,將后代個(gè)體的策略調(diào)整為博弈對(duì)手的策略。
邏輯斯蒂方程(Logistic Equation)是研究生物學(xué)、社會(huì)學(xué)中種群增長(zhǎng)的一種模型,在生態(tài)學(xué)中,一個(gè)種群內(nèi)個(gè)體數(shù)量的變化動(dòng)態(tài)可以用邏輯斯蒂方程的微分形式表示:
(3)
其中, 為種群的瞬時(shí)增長(zhǎng)量, 為種群的個(gè)體增長(zhǎng)率, 為特定時(shí)間內(nèi)種群內(nèi)的個(gè)體數(shù)量, 為環(huán)境容納量,也就是該生態(tài)環(huán)境所能維持的種群內(nèi)個(gè)體最大數(shù)量。 為邏輯斯蒂系數(shù)。
在演化博弈過程中,突變因子在演化前期由于博弈次數(shù)較少或穩(wěn)定性的可信度不高,因此模仿突變因子具有較大的變化趨勢(shì),而隨著演化過程的演進(jìn),系統(tǒng)穩(wěn)定性的可信度逐漸增強(qiáng),因此模仿突變因子在演化后期的變化范圍較小,這個(gè)特性恰與邏輯斯蒂方程的增長(zhǎng)趨勢(shì)相符,因此本文使用基于邏輯斯蒂方程的變形微分方程來表示模仿突變因子。
令 ,則邏輯斯蒂方程變形為:
(4)
記 表示博弈總體內(nèi)每個(gè)個(gè)體可選的博弈策略集,向量 表示總體狀況,其中 表示選擇策略 的個(gè)體比例; 表示選擇策略 的個(gè)體和選擇策略 的個(gè)體在博弈時(shí)相遇,兩個(gè)個(gè)體在經(jīng)過博弈后,互相學(xué)習(xí),觀察對(duì)方的策略和收益,對(duì)自己當(dāng)前的策略和收益進(jìn)行調(diào)整,使個(gè)體產(chǎn)生的后代有一定概率突變?yōu)槠渌呗?,?表示選擇 策略的后代個(gè)體突變?yōu)?策略的概率,由于模仿突變概率與各策略的收益和選擇該策略的個(gè)體在總體中的比例有關(guān),引入邏輯斯蒂變形方程可得模仿突變概率為:
(5)
其中, 表示策略 與策略 在博弈過程中期望收益之差。
2.3 引入模仿突變Wright-Fisher過程
由于WSNs的節(jié)點(diǎn)數(shù)量是有限的,進(jìn)行博弈的節(jié)點(diǎn)可以看作出自一個(gè)種群的有限總體,因此在WSNs節(jié)點(diǎn)協(xié)作博弈中引入模仿突變Wright-Fisher過程,該模型既能體現(xiàn)WSNs節(jié)點(diǎn)協(xié)作博弈的總體有限性、離散性和隨機(jī)性等特征,也能體現(xiàn)出節(jié)點(diǎn)在博弈時(shí)的策略調(diào)整過程。
假設(shè)在WSNs節(jié)點(diǎn)協(xié)作博弈中,節(jié)點(diǎn)的總數(shù)為 ,有數(shù)量為 的節(jié)點(diǎn)選擇協(xié)作策略,則有 個(gè)節(jié)點(diǎn)選擇不協(xié)作策略。在進(jìn)行節(jié)點(diǎn)協(xié)作博弈時(shí),需剔除自己和自己博弈的情況,因此可得:
任選一個(gè)節(jié)點(diǎn)選擇協(xié)作策略的期望收益為: (6)
任選一個(gè)節(jié)點(diǎn)選擇不協(xié)作策略的期望收益為:
(7)
假設(shè)在演化博弈中,收益函數(shù)對(duì)該策略適應(yīng)度的影響因子為 , ,則在WSNs節(jié)點(diǎn)協(xié)作博弈中,協(xié)作策略的適應(yīng)度為: (8)
不協(xié)作策略的適應(yīng)度為: (9)
由于適應(yīng)度要求收益函數(shù)為非負(fù)數(shù),因此對(duì)策略的收益函數(shù)還應(yīng)加以修正,使其滿足適應(yīng)度的條件。選擇強(qiáng)度參數(shù) 的引入,使得Wright-Fisher過程具有了有限理性的特性。
定義2 在不考慮自身博弈情況的無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作博弈中,協(xié)作策略的適應(yīng)度為 ,不協(xié)作策略的適應(yīng)度為 ,其中 為選擇協(xié)作策略的節(jié)點(diǎn)數(shù)量, 為無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)在博弈時(shí)選擇協(xié)作策略的收益且:
(10)
為無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)在博弈時(shí)選擇不協(xié)作策略的收益且:
(11)
為收益對(duì)適應(yīng)度的選擇強(qiáng)度, 為常數(shù)使得收益函數(shù)為非負(fù)數(shù)。
定義3 在不考慮自身博弈情況的無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作博弈中,個(gè)體在每次博弈之后,產(chǎn)生的后代個(gè)體中,有一定的突變概率 使個(gè)體改變博弈的策略,個(gè)體的博弈策略從協(xié)作策略突變?yōu)椴粎f(xié)作策略的概率為:
(12)
則個(gè)體的博弈策略依然保持協(xié)作策略的概率為 ;個(gè)體的博弈策略從不協(xié)作策略突變?yōu)閰f(xié)作策略的概率為: (13)
則個(gè)體的博弈策略依然保持不協(xié)作策略的概率為 ,其中 , , , 為常數(shù)使得 , 。
在定義3中, 和 作為策略突變的概率,保證其大小與當(dāng)前節(jié)點(diǎn)的自身收益呈反向變化,與對(duì)方的收益呈正向變化。
WSNs的節(jié)點(diǎn)在進(jìn)行下一次博弈之前,會(huì)進(jìn)行以下步驟更新策略:
1)每個(gè)節(jié)點(diǎn)都會(huì)生成相同數(shù)量的多個(gè)選擇相同策略的后代,這些后代中,有一部分后代會(huì)以突變概率 突變,選擇對(duì)手策略,剩下的后代依然完全繼承父代個(gè)體選擇的策略,構(gòu)成一個(gè)數(shù)量為 的整數(shù)倍個(gè)后代的集合;
2)從這個(gè)后代集合里選出與總體數(shù)量相同的 個(gè)新一代后代,由于后代節(jié)點(diǎn)只有協(xié)作和不協(xié)作兩種策略,選擇每個(gè)節(jié)點(diǎn)的過程都是一次獨(dú)立伯努利試驗(yàn)過程,由定義2可得,選出一個(gè)信任策略的后代節(jié)點(diǎn)的概率為 ,因此新一代博弈后代節(jié)點(diǎn)的產(chǎn)生過程就是一個(gè)概率為 的 重伯努利試驗(yàn);
3)新一代后代完全替換上一代,完成節(jié)點(diǎn)的一代更新。
由定理1和定理2可知,要使整個(gè)無線傳感器網(wǎng)絡(luò)具有良好的穩(wěn)定性和節(jié)點(diǎn)協(xié)作性,需促使無線傳感器網(wǎng)絡(luò)的節(jié)點(diǎn)在協(xié)作博弈時(shí)選擇協(xié)作策略,因此在設(shè)計(jì)無線傳感器網(wǎng)絡(luò)協(xié)作機(jī)制時(shí)應(yīng)使其盡量符合定理2的條件。懲罰因子 的引入會(huì)使無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)在選擇不協(xié)作策略時(shí)受到一定的懲罰,產(chǎn)生更多的損失,當(dāng) 逐漸增大,懲罰力度也逐漸變大時(shí),會(huì)使無線傳感器網(wǎng)絡(luò)逐漸滿足定理2的條件,而逐漸偏離定理1的條件。當(dāng) 增大到一定程度,使得無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)信任博弈不滿足定理1,但是滿足定理2的條件時(shí),無線傳感器網(wǎng)絡(luò)將處于比較理想的穩(wěn)定狀態(tài),此時(shí)網(wǎng)絡(luò)內(nèi)的所有節(jié)點(diǎn)在經(jīng)過有限次博弈之后都會(huì)最終選擇協(xié)作策略。
3 實(shí)驗(yàn)分析
3.1 定理驗(yàn)證實(shí)驗(yàn)
在圖1中,當(dāng)WSNs節(jié)點(diǎn)協(xié)作博弈的條件滿足定理1時(shí),設(shè)定選擇協(xié)作策略的節(jié)點(diǎn)初始比例為0.999 9,經(jīng)過140次博弈,絕大部分節(jié)點(diǎn)都選擇不協(xié)作策略,達(dá)到了 的演化穩(wěn)定狀態(tài);當(dāng)WSNs節(jié)點(diǎn)協(xié)作博弈的條件滿足定理2時(shí),設(shè)定選擇協(xié)作策略的節(jié)點(diǎn)初始比例為0.000 1時(shí),經(jīng)過78次博弈,絕大部分節(jié)點(diǎn)都選擇協(xié)作策略,達(dá)到了 的演化穩(wěn)定狀態(tài)。此實(shí)驗(yàn)驗(yàn)證了定理1和定理2成立。
3.2 影響因子驗(yàn)證實(shí)驗(yàn)
實(shí)驗(yàn)中分別使用不同數(shù)值的懲罰因子 和選擇強(qiáng)度 來觀察其對(duì)無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作博弈的影響,并根據(jù)實(shí)驗(yàn)結(jié)果給出優(yōu)化無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作博弈的對(duì)策。本實(shí)驗(yàn)共設(shè)2組,第1組分析懲罰因子 對(duì)定理2的影響,第2組分析選擇強(qiáng)度 對(duì)定理2的影響。
3.2.1 懲罰因子 的影響
實(shí)驗(yàn)設(shè)定: , , , , , , , , ; 分別設(shè)定為16和15。兩組數(shù)據(jù)均滿足定理2,實(shí)驗(yàn)結(jié)果如圖2所示。
在圖2中,當(dāng)選擇協(xié)作策略的節(jié)點(diǎn)初始比例為0.000 1時(shí),兩組數(shù)據(jù)均使得WSNs節(jié)點(diǎn)經(jīng)過一定次數(shù)的協(xié)作博弈達(dá)到了 的演化穩(wěn)定狀態(tài)。在其他參數(shù)相同的情況下, 的一組節(jié)點(diǎn)只需78次博弈即可達(dá)到演化穩(wěn)定狀態(tài),比 的另一組節(jié)點(diǎn)收斂速度更快。由此可知,在滿足定理2的條件下,提高懲罰因子 能有效促進(jìn)WSNs節(jié)點(diǎn)在進(jìn)行協(xié)作博弈時(shí)更快地達(dá)到演化穩(wěn)定狀態(tài)。
在圖3中,當(dāng)選擇協(xié)作策略的節(jié)點(diǎn)初始比例為0.0001時(shí),三組數(shù)據(jù)均使得無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)經(jīng)過一定次數(shù)的協(xié)作博弈后達(dá)到了 的演化穩(wěn)定狀態(tài)。在其他參數(shù)相同的情況下, 的一組節(jié)點(diǎn)需要212次博弈才能達(dá)到穩(wěn)定狀態(tài), 的一組節(jié)點(diǎn)需要130次博弈才能達(dá)到穩(wěn)定狀態(tài),而 的一組節(jié)點(diǎn)只需78次即可達(dá)到穩(wěn)定狀態(tài)。由此可知,在滿足定理2的條件下,提高選擇強(qiáng)度 能有效促進(jìn)無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)在進(jìn)行協(xié)作博弈時(shí)更快地達(dá)到演化穩(wěn)定狀態(tài)。
4 結(jié)束語
節(jié)點(diǎn)間的協(xié)作問題是WSNs穩(wěn)定運(yùn)行的重要基礎(chǔ),促進(jìn)WSNs節(jié)點(diǎn)互相協(xié)作能夠促使整個(gè)無線傳感器網(wǎng)絡(luò)達(dá)到穩(wěn)定狀態(tài)。本文根據(jù)無線傳感器網(wǎng)絡(luò)中節(jié)點(diǎn)數(shù)量有限等特點(diǎn),引入與節(jié)點(diǎn)協(xié)作相關(guān)的懲罰機(jī)制,提出了基于模仿突變Wright-Fisher過程的無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作隨機(jī)演化模型,彌補(bǔ)了復(fù)制子動(dòng)態(tài)不適用于節(jié)點(diǎn)數(shù)量有限的無線傳感器網(wǎng)絡(luò)中的缺陷,使無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作博弈模型更符合實(shí)際情況。在此基礎(chǔ)之上,對(duì)隨機(jī)演化博弈模型進(jìn)行了動(dòng)力學(xué)分析,得出并證明了WSNs節(jié)點(diǎn)協(xié)作博弈達(dá)到演化穩(wěn)定狀態(tài)的定理。經(jīng)過分析與實(shí)驗(yàn)驗(yàn)證了結(jié)論:提高節(jié)點(diǎn)選擇不協(xié)作策略的懲罰力度和節(jié)點(diǎn)選擇協(xié)作策略的選擇強(qiáng)度均能有效促進(jìn)WSNs節(jié)點(diǎn)的協(xié)作程度,實(shí)現(xiàn)網(wǎng)絡(luò)的安全與穩(wěn)定。本文提出的基于模仿突變Wright-Fisher過程的WSNs節(jié)點(diǎn)協(xié)作隨機(jī)演化博弈模型,為無線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)協(xié)作問題研究提供了理論依據(jù)。
參考文獻(xiàn):
[1] YICK J, MUKHERJEE B, GHOSAL D. Wireless sensor network survey[J]. Computer networks, 2008, 52(12): 2292-2330.
[2] CHENG D, XU T, QI H. Evolutionarily Stable Strategy of Networked Evolutionary Games[J]. IEEE transactions on neural networks and learning systems, 2014, 25(7): 1335-1345.
[3] EL-AZOUZI R, De PELLEGRINI F, SIDI H B A, et al. Evolutionary forwarding games in delay tolerant networks: Equilibria, mechanism design and stochastic approximation[J]. Computer Networks, 2013, 57(4): 1003-1018.
[4] FARZANEH N, YAGHMAEE M H. An adaptive competitive resource control protocol for alleviating congestion in Wireless Sensor Networks: An evolutionary Game Theory approach[J]. Wireless Personal Communications, 2015,82(1): 123-142.
[5] 沈士根, 馬絢, 蔣華, 等. 基于演化博弈論的 WSNs 信任決策模型與動(dòng)力學(xué)分析[J]. 控制與決策, 2012, 27(8): 1133-1138.
[6] 李紫川, 沈士根, 曹奇英. 基于反思機(jī)制的 WSNs 節(jié)點(diǎn)信任演化模型[J]. 計(jì)算機(jī)應(yīng)用研究, 2014, 31(5): 1528-1531.
[7] LI Yuan-jie, XU Hong-yun, CAO Qi-ying, et al. Evolutionary game-based trust strategy adjustment among nodes in Wireless Sensor Networks[J]. International Journal of Distributed Sensor Networks, 2015,2015(818903):1-12.
[8] LIU J, SHEN S, YUE G, et al. A stochastic evolutionary coalition game model of secure and dependable virtual service in Sensor-Cloud[J]. Applied Soft Computing, 2015, 30: 123-135.
[9] 印桂生, 王瑩潔, 董宇欣, 等. 網(wǎng)構(gòu)軟件的 Wright-Fisher 多策略信任演化模型[J]. 軟件學(xué)報(bào), 2012, 23(8): 1978-1991.
[10] 馮光升, 王慧強(qiáng), 周沫, 等. 基于 Moran 過程的無線網(wǎng)絡(luò)接入選擇方法[J]. 北京郵電大學(xué)學(xué)報(bào), 2014, 37(4): 10-14.
[11] FUDENBERG D, TIROLE J. 博弈論[M].北京: 中國(guó)人民大學(xué)出版社,2002.
[12] 喬根 W.威布爾. 演化博弈論[M]. 王永欽,譯.上海:上海人民出版社,2006: 40-86.
[13] MORAN P. A. P. The Statistical Processes of Evolutionary Theory[M]. Oxford: Clarendon Press, 1962.
[14] TRAULSEN A, CLAUSSEN J C, HAUERT C. Coevolutionary dynamics: from finite to infinite populations[J]. Physical review letters, 2005, 95(23): 238701.
[15] TRAULSEN A, PACHECO J M, NOWAK M A. Pairwise comparison and selection temperature in evolutionary game dynamics[J]. Journal of theoretical biology, 2007, 246(3): 522-529.
[16] OHTSUKI H, PACHECO J M, NOWAK M A. Evolutionary graph theory: breaking the symmetry between interaction and replacement[J]. Journal of Theoretical Biology, 2007, 246(4): 681-694.