?
車聯(lián)網(wǎng)環(huán)境下基于時空類大數(shù)據(jù)分析的聯(lián)盟博弈
車聯(lián)網(wǎng)環(huán)境下,車輛、傳感器及執(zhí)行器等收到的信息有著容量大、變化多、速度快等特點,使得傳遞的信息具有時空特性。因此,數(shù)據(jù)的成功傳遞大部分依賴中繼節(jié)點的行為表現(xiàn)。采用合作和非合作貝葉斯聯(lián)盟博弈(BCGs)和自動學(xué)習(xí)機(jī)(LA)來分析中繼節(jié)點的行為表現(xiàn)。其中,LA安裝在每個車輛上充當(dāng)博弈者。最初,每個博弈者任意從策略空間選擇某一策略,且任意策略的選擇概率相同。隨著博弈的進(jìn)行,博弈者會繼續(xù)運(yùn)動(前進(jìn)、后退或保持不動)。每個自動學(xué)習(xí)機(jī)都定義了3個屬性Cid、V和PU。Cid是聯(lián)盟的id,V是由貝葉斯定理確定的條件概率,PU是博弈者使用的支付工具。
合作/非合作聯(lián)盟算法是每個博弈者選擇合作或非合作策略。博弈中,用有向非循環(huán)圖(ADG)來代表博弈者及博弈者與其它博弈者的關(guān)系。每個博弈者的屬性都搭配ADG邊緣,且支付工具由公式計算。支付工具會根據(jù)合作和非合作策略的選擇來進(jìn)行調(diào)節(jié)。兩種情況下,如果支付比率小于設(shè)定的門限值,則博弈者得到獎勵;否則得到處罰。支付工具由此不斷更新。最后,計算出每位博弈者的獎勵和懲罰數(shù)量比。篩選出比值最大的那個策略,這有助于建立納什均衡。
合作模式的分析。在使用合作路徑時,每個博弈者共享獎勵和控制策略,從而形成聯(lián)盟?;谄渌┺恼攉@取的信息,每個博弈者選擇控制策略。每個博弈者信息的交換取決于信息傳遞到車輛的概率時間和在中繼節(jié)點等待的概率時間。這些概率通過單位時間內(nèi)成功傳遞的信息占總發(fā)送信息的比值來計算得到。
非合作模式的分析。在非合作模式下,每個博弈者的策略目的是,根據(jù)置信概率和其它博弈者與行為概率向量有關(guān)的策略來獲取PU的最大值。置信度是使用各種動作執(zhí)行的條件概率來表示的。每個博弈者通過使用貝葉斯定理和其它博弈者行為表現(xiàn)來不斷更新置信度。在所提出的方案里,可以通過使用置信概率來獲得多納什均衡點,這些點可以控制3種信息的中轉(zhuǎn)傳遞。仿真結(jié)果表明,相比空間知識不完整策略,憑借空間知識完整的策略獲得納什均衡點的概率就會增加,而且吞吐量也會增加;所提出的方案在節(jié)點行為、商榷時間、學(xué)習(xí)率和行為數(shù)量等方面有較好的表現(xiàn)。
刊名:IEEE Internet of Things Journal(英)
刊期:2013年
作者:Neeraj Kumar et al
編譯:謝秀磊