国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

認知無線電網(wǎng)絡中基于博弈論的頻譜切換方法*

2021-08-30 05:58:18彭云飛盧春蘭
通信技術(shù) 2021年8期
關(guān)鍵詞:博弈論中斷步長

彭云飛,邵 尉,盧春蘭

(陸軍工程大學,江蘇 南京 210007)

0 引言

隨著5G 和物聯(lián)網(wǎng)(Internet of Things,IoT)技術(shù)的快速發(fā)展和無線設備數(shù)量的爆炸式增長,頻譜使用需求日益增長,頻譜資源日趨緊張。

認知無線電網(wǎng)絡[1](Cognitive Radio Networks,CRN)允許次用戶(Secondary User,SU)對許可頻譜進行機會性使用。當主用戶(Primary User,PU)到達時,SU 無論是切換至另一信道還是保持在當前信道,都將面臨潛在的頻譜占用沖突。一些研究工作將博弈論與認知無線電網(wǎng)絡相結(jié)合。例如,文獻[1]將空閑頻譜進行定價,并將PU 之間的價格競爭定義為博弈。文獻[2]研究了一種基于博弈論和拍賣理論的認知無線電車載網(wǎng)絡頻譜切換優(yōu)化方案,以及一種基于成本函數(shù)的多屬性決策方法,用于最優(yōu)信道選擇。文獻[3]提出了一套基于欺騙的防御策略,以保護CRN 免受欺騙性攻擊。認知干擾器和認知用戶的相互作用被建模為Stackelberg 博弈。在已有的各種頻譜切換方法中,優(yōu)化目標都不盡相同;文獻[4]的優(yōu)化目標是最小化信道接入時間;提高頻譜切換效率也是優(yōu)化目標之一[5];或者想提升系統(tǒng)總的吞吐量[6]。

在CRN 中,SU 必須競爭使用有限的頻譜資源,機會式地利用頻譜的SU之間是存在干擾的的特性。當累積干擾超過一定的閾值時,會對網(wǎng)絡的服務質(zhì)量(Quality of Service,QoS)產(chǎn)生影響。而博弈論是解決競爭優(yōu)化問題的方法之一,因此本文將博弈論運用于CRN 的頻譜切換問題。當PU 到達時,無論SU 選擇切換或等待,都將面臨潛在的頻譜占用沖突。因此,定義新的期望累積切換時延,將頻譜切換問題表征為Stochastic 博弈,并利用空間自適應博弈(Spatial Adaptive Play,SAP)算法找到問題的最優(yōu)解。

1 系統(tǒng)模型和問題表述

1.1 系統(tǒng)模型

在如圖1 所示的一個有N個SU 和M個信道的分布式CRN 中,N>M。許可信道歸PU 所有。當不被PU 占用時,SU 可以機會使用它們。由于不存在中心節(jié)點,SU 自主選擇切換時接入的信道。

圖1 CRN 中的頻譜切換場景

利用搶先恢復優(yōu)先級(Preemptive Resume Priority,PRP)M/G/1 排隊網(wǎng)絡模型[7]來描述不同信道中具有多次頻譜切換的PU 和SU 之間的頻譜使用行為。假設每個信道的隊列中PU 和SU 的到達過程均服從泊松分布。圖2 為SU1傳輸?shù)那袚Q過程。Ts為頻譜切換時延,T為SU1的整個數(shù)據(jù)傳輸時間。

圖2 活躍SU1 傳輸?shù)那袚Q過程

傳輸過程被中斷3 次,整個傳輸過程被分為4個部分。

該過程可描述如下。

(1)起初,SU1在初始信道1 上傳輸。當PU到達時,SU1根據(jù)切換時延最短的原則決定其目標信道。

(2)在第1 次中斷時,因為切換至信道2 的切換時延最短,SU1切換至空閑信道2 繼續(xù)傳輸。

(3)第2 次中斷時,因為停留在信道2 的切換時延最短,SU1選擇等待,待PU 傳輸完成后繼續(xù)傳輸。此時,Twait是信道2 被PU 占用的持續(xù)時間,也是SU1的等待時間。

(4)在第3 次中斷時,雖然此時信道3 處于忙的狀態(tài),但與SU1一起排隊等待服務的SU 少,即切換至信道3 的切換時延最短,等待當前PU或隊列之前的SU 均被服務后,SU1切換至信道3繼續(xù)傳輸。

(5)最后,SU1在信道3 上完成傳輸。

1.2 問題表述

SUi在傳輸過程中可能會多次中斷,設B為中斷次數(shù),bmax表示最大中斷次數(shù),當B>bmax時,SUi整個過程傳輸失敗,需要重新傳輸,則累積切換時延為:

定義期望累積切換時延為:

本文中以最小化SUi的期望累積切換時延(Expected Cumulative Handover Delay,ECHD)為優(yōu)化目標,可表述為優(yōu)化問題P:

優(yōu)化問題P是一個組合問題,也是一個典型的NP-hard 問題。考慮到信道條件是動態(tài)的實際情況,求解P變得更具挑戰(zhàn)性。

2 博弈模型和學習算法

由于考慮的CRN 中沒有設定基站,因此SU 將自適應地采用頻譜切換策略,可將切換問題公式化為一個Stochastic 博弈。下文提出了公式化的博弈模型,分析其性質(zhì)并利用SAP 算法,以在動態(tài)環(huán)境中找到問題的最優(yōu)解。

2.1 頻譜切換博弈

將SU 之間的相互作用建模為一個分布式頻譜切換Stochastic 博弈,表示為:

式中:N 為SU 集;Ai 為SUi的可用信道集;Ui是SUi的效用函數(shù)。

將效用函數(shù)Ui定義為ECHD 的相反數(shù):

在Stochastic 博弈中,每個SU 都希望最大化自身的效用函數(shù),意味著局部合作的頻譜切換博弈可以表示為:

從文獻[8]中可以得出結(jié)論:每一個有限的策略博弈至少存在一個混合策略NE 點。在博弈模型G中,可用信道數(shù)是有限的,所以G至少存在一個NE 點,即頻譜切換問題的最優(yōu)解。

2.2 學習算法

一般來說,SAP 是基于博弈論的方法中的代表性學習算法之一[9],可以達到最佳的Nash 均衡狀態(tài),同時也適用于動態(tài)網(wǎng)絡。考慮到認知無線電網(wǎng)絡的動態(tài)特性,本文采用SAP 算法找到問題的最優(yōu)解。

3 仿真分析

下面設計仿真實驗并對結(jié)果進行分析。

首先,設定N=15、M=3,在不同的學習步長參數(shù)條件下,對比所提方案的期望累積切換時延性能,結(jié)果如圖3 和圖4 所示。分別在4 種學習步長條件下開展仿真比較,找出合理的學習步長設定。由圖3 和圖4 可得出結(jié)論,學習步長等于迭代數(shù)是相對理想的學習步長設定。

圖3 不同學習步長條件下所提方案的期望累積切換時延對比

圖4 不同學習步長條件下收斂所需迭代次數(shù)對比

其次,在學習步長等于迭代數(shù)的條件下,固定N=15,并在可用信道數(shù)分別為2、3、4 的情況下將所提方案與最佳響應動態(tài)(Best Response Dynamics,BRD)算法[10]進行對比,結(jié)果如圖5、圖6 和圖7 所示。

圖5 M=2 時兩種算法收斂性能比較

圖6 M=3 時兩種算法收斂性能比較

圖7 M=4 時兩種算法收斂性能比較

從圖5、圖6 和圖7 可以看出,所提的方案在收斂速度和期望累積切換時延方面始終優(yōu)于BRD算法,且可用信道數(shù)越多。所提方案與BRD 算法的ECHD 的差距越大,說明所提方案在多策略的情況下找到的問題可行解比BRD 算法更優(yōu),即適用于更大規(guī)模的CRN。

4 結(jié)語

本文研究了CRN 中基于博弈論的頻譜切換方法,將該頻譜切換問題表征為一個Stochastic 博弈,分析其性質(zhì),并利用SAP 算法來實現(xiàn)NE 點,找到問題的最優(yōu)解。仿真結(jié)果表明,所提方案在收斂速度和期望累積切換時延方面方面的性能優(yōu)于BRD算法,有助于提高CRN 的頻譜利用效率和優(yōu)化頻譜切換時延。

猜你喜歡
博弈論中斷步長
基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
跟蹤導練(二)(5)
千里移防,衛(wèi)勤保障不中斷
解放軍健康(2017年5期)2017-08-01 06:27:44
博弈論視角下的自首行為分析
無知之幕與博弈:從“黃燈規(guī)則”看博弈論的一種實踐方案
樊畿不等式及其在博弈論中的應用
基于逐維改進的自適應步長布谷鳥搜索算法
一種新型光伏系統(tǒng)MPPT變步長滯環(huán)比較P&O法
電測與儀表(2014年2期)2014-04-04 09:04:00
博弈論視角下醫(yī)療糾紛解決方式選擇
一種新穎的光伏自適應變步長最大功率點跟蹤算法
东安县| 镇江市| 米林县| 余庆县| 呼图壁县| 双鸭山市| 香港 | 临朐县| 四会市| 宝清县| 元谋县| 张北县| 康乐县| 广宗县| 谷城县| 玛纳斯县| 镇赉县| 赤水市| 康乐县| 三穗县| 龙胜| 吉隆县| 大关县| 永州市| 武穴市| 卢氏县| 饶河县| 体育| 通海县| 驻马店市| 北辰区| 石棉县| 大石桥市| 日土县| 九台市| 揭阳市| 东乡族自治县| 沁阳市| 高青县| 瓮安县| 湟源县|