認知無線電網(wǎng)絡中基于博弈論的頻譜切換方法*

2021-08-30 05:58:18彭云飛盧春蘭

通信技術(shù) 2021年8期

彭云飛，邵尉，盧春蘭

（陸軍工程大學，江蘇南京 210007）

0 引言

隨著5G 和物聯(lián)網(wǎng)（Internet of Things，IoT）技術(shù)的快速發(fā)展和無線設備數(shù)量的爆炸式增長，頻譜使用需求日益增長，頻譜資源日趨緊張。

認知無線電網(wǎng)絡[1]（Cognitive Radio Networks，CRN）允許次用戶（Secondary User，SU）對許可頻譜進行機會性使用。當主用戶（Primary User，PU）到達時，SU 無論是切換至另一信道還是保持在當前信道，都將面臨潛在的頻譜占用沖突。一些研究工作將博弈論與認知無線電網(wǎng)絡相結(jié)合。例如，文獻[1]將空閑頻譜進行定價，并將PU 之間的價格競爭定義為博弈。文獻[2]研究了一種基于博弈論和拍賣理論的認知無線電車載網(wǎng)絡頻譜切換優(yōu)化方案，以及一種基于成本函數(shù)的多屬性決策方法，用于最優(yōu)信道選擇。文獻[3]提出了一套基于欺騙的防御策略，以保護CRN 免受欺騙性攻擊。認知干擾器和認知用戶的相互作用被建模為Stackelberg 博弈。在已有的各種頻譜切換方法中，優(yōu)化目標都不盡相同；文獻[4]的優(yōu)化目標是最小化信道接入時間；提高頻譜切換效率也是優(yōu)化目標之一[5]；或者想提升系統(tǒng)總的吞吐量[6]。

在CRN 中，SU 必須競爭使用有限的頻譜資源，機會式地利用頻譜的SU之間是存在干擾的的特性。當累積干擾超過一定的閾值時，會對網(wǎng)絡的服務質(zhì)量（Quality of Service，QoS）產(chǎn)生影響。而博弈論是解決競爭優(yōu)化問題的方法之一，因此本文將博弈論運用于CRN 的頻譜切換問題。當PU 到達時，無論SU 選擇切換或等待，都將面臨潛在的頻譜占用沖突。因此，定義新的期望累積切換時延，將頻譜切換問題表征為Stochastic 博弈，并利用空間自適應博弈（Spatial Adaptive Play，SAP）算法找到問題的最優(yōu)解。

1 系統(tǒng)模型和問題表述

1.1 系統(tǒng)模型

在如圖1 所示的一個有N個SU 和M個信道的分布式CRN 中，N>M。許可信道歸PU 所有。當不被PU 占用時，SU 可以機會使用它們。由于不存在中心節(jié)點，SU 自主選擇切換時接入的信道。

圖1 CRN 中的頻譜切換場景

利用搶先恢復優(yōu)先級（Preemptive Resume Priority，PRP）M/G/1 排隊網(wǎng)絡模型[7]來描述不同信道中具有多次頻譜切換的PU 和SU 之間的頻譜使用行為。假設每個信道的隊列中PU 和SU 的到達過程均服從泊松分布。圖2 為SU1傳輸?shù)那袚Q過程。Ts為頻譜切換時延，T為SU1的整個數(shù)據(jù)傳輸時間。

圖2 活躍SU1 傳輸?shù)那袚Q過程

傳輸過程被中斷3 次，整個傳輸過程被分為4個部分。

該過程可描述如下。

（1）起初，SU1在初始信道1 上傳輸。當PU到達時，SU1根據(jù)切換時延最短的原則決定其目標信道。

（2）在第1 次中斷時，因為切換至信道2 的切換時延最短，SU1切換至空閑信道2 繼續(xù)傳輸。

（3）第2 次中斷時，因為停留在信道2 的切換時延最短，SU1選擇等待，待PU 傳輸完成后繼續(xù)傳輸。此時，Twait是信道2 被PU 占用的持續(xù)時間，也是SU1的等待時間。

（4）在第3 次中斷時，雖然此時信道3 處于忙的狀態(tài)，但與SU1一起排隊等待服務的SU 少，即切換至信道3 的切換時延最短，等待當前PU或隊列之前的SU 均被服務后，SU1切換至信道3繼續(xù)傳輸。

（5）最后，SU1在信道3 上完成傳輸。

1.2 問題表述

SUi在傳輸過程中可能會多次中斷，設B為中斷次數(shù)，bmax表示最大中斷次數(shù)，當B>bmax時，SUi整個過程傳輸失敗，需要重新傳輸，則累積切換時延為：

定義期望累積切換時延為：

本文中以最小化SUi的期望累積切換時延（Expected Cumulative Handover Delay，ECHD）為優(yōu)化目標，可表述為優(yōu)化問題P：

優(yōu)化問題P是一個組合問題，也是一個典型的NP-hard 問題。考慮到信道條件是動態(tài)的實際情況，求解P變得更具挑戰(zhàn)性。

2 博弈模型和學習算法

由于考慮的CRN 中沒有設定基站，因此SU 將自適應地采用頻譜切換策略，可將切換問題公式化為一個Stochastic 博弈。下文提出了公式化的博弈模型，分析其性質(zhì)并利用SAP 算法，以在動態(tài)環(huán)境中找到問題的最優(yōu)解。

2.1 頻譜切換博弈

將SU 之間的相互作用建模為一個分布式頻譜切換Stochastic 博弈，表示為：

式中：N 為SU 集；Ai 為SUi的可用信道集；Ui是SUi的效用函數(shù)。

將效用函數(shù)Ui定義為ECHD 的相反數(shù)：

在Stochastic 博弈中，每個SU 都希望最大化自身的效用函數(shù)，意味著局部合作的頻譜切換博弈可以表示為：

從文獻[8]中可以得出結(jié)論：每一個有限的策略博弈至少存在一個混合策略NE 點。在博弈模型G中，可用信道數(shù)是有限的，所以G至少存在一個NE 點，即頻譜切換問題的最優(yōu)解。

2.2 學習算法

一般來說，SAP 是基于博弈論的方法中的代表性學習算法之一[9]，可以達到最佳的Nash 均衡狀態(tài)，同時也適用于動態(tài)網(wǎng)絡。考慮到認知無線電網(wǎng)絡的動態(tài)特性，本文采用SAP 算法找到問題的最優(yōu)解。

3 仿真分析

下面設計仿真實驗并對結(jié)果進行分析。

首先，設定N=15、M=3，在不同的學習步長參數(shù)條件下，對比所提方案的期望累積切換時延性能，結(jié)果如圖3 和圖4 所示。分別在4 種學習步長條件下開展仿真比較，找出合理的學習步長設定。由圖3 和圖4 可得出結(jié)論，學習步長等于迭代數(shù)是相對理想的學習步長設定。

圖3 不同學習步長條件下所提方案的期望累積切換時延對比

圖4 不同學習步長條件下收斂所需迭代次數(shù)對比

其次，在學習步長等于迭代數(shù)的條件下，固定N=15，并在可用信道數(shù)分別為2、3、4 的情況下將所提方案與最佳響應動態(tài)（Best Response Dynamics，BRD）算法[10]進行對比，結(jié)果如圖5、圖6 和圖7 所示。

圖5 M=2 時兩種算法收斂性能比較

圖6 M=3 時兩種算法收斂性能比較

圖7 M=4 時兩種算法收斂性能比較

從圖5、圖6 和圖7 可以看出，所提的方案在收斂速度和期望累積切換時延方面始終優(yōu)于BRD算法，且可用信道數(shù)越多。所提方案與BRD 算法的ECHD 的差距越大，說明所提方案在多策略的情況下找到的問題可行解比BRD 算法更優(yōu)，即適用于更大規(guī)模的CRN。

4 結(jié)語

本文研究了CRN 中基于博弈論的頻譜切換方法，將該頻譜切換問題表征為一個Stochastic 博弈，分析其性質(zhì)，并利用SAP 算法來實現(xiàn)NE 點，找到問題的最優(yōu)解。仿真結(jié)果表明，所提方案在收斂速度和期望累積切換時延方面方面的性能優(yōu)于BRD算法，有助于提高CRN 的頻譜利用效率和優(yōu)化頻譜切換時延。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡