彭云飛,邵 尉,盧春蘭
(陸軍工程大學,江蘇 南京 210007)
隨著5G 和物聯(lián)網(wǎng)(Internet of Things,IoT)技術(shù)的快速發(fā)展和無線設備數(shù)量的爆炸式增長,頻譜使用需求日益增長,頻譜資源日趨緊張。
認知無線電網(wǎng)絡[1](Cognitive Radio Networks,CRN)允許次用戶(Secondary User,SU)對許可頻譜進行機會性使用。當主用戶(Primary User,PU)到達時,SU 無論是切換至另一信道還是保持在當前信道,都將面臨潛在的頻譜占用沖突。一些研究工作將博弈論與認知無線電網(wǎng)絡相結(jié)合。例如,文獻[1]將空閑頻譜進行定價,并將PU 之間的價格競爭定義為博弈。文獻[2]研究了一種基于博弈論和拍賣理論的認知無線電車載網(wǎng)絡頻譜切換優(yōu)化方案,以及一種基于成本函數(shù)的多屬性決策方法,用于最優(yōu)信道選擇。文獻[3]提出了一套基于欺騙的防御策略,以保護CRN 免受欺騙性攻擊。認知干擾器和認知用戶的相互作用被建模為Stackelberg 博弈。在已有的各種頻譜切換方法中,優(yōu)化目標都不盡相同;文獻[4]的優(yōu)化目標是最小化信道接入時間;提高頻譜切換效率也是優(yōu)化目標之一[5];或者想提升系統(tǒng)總的吞吐量[6]。
在CRN 中,SU 必須競爭使用有限的頻譜資源,機會式地利用頻譜的SU之間是存在干擾的的特性。當累積干擾超過一定的閾值時,會對網(wǎng)絡的服務質(zhì)量(Quality of Service,QoS)產(chǎn)生影響。而博弈論是解決競爭優(yōu)化問題的方法之一,因此本文將博弈論運用于CRN 的頻譜切換問題。當PU 到達時,無論SU 選擇切換或等待,都將面臨潛在的頻譜占用沖突。因此,定義新的期望累積切換時延,將頻譜切換問題表征為Stochastic 博弈,并利用空間自適應博弈(Spatial Adaptive Play,SAP)算法找到問題的最優(yōu)解。
在如圖1 所示的一個有N個SU 和M個信道的分布式CRN 中,N>M。許可信道歸PU 所有。當不被PU 占用時,SU 可以機會使用它們。由于不存在中心節(jié)點,SU 自主選擇切換時接入的信道。
圖1 CRN 中的頻譜切換場景
利用搶先恢復優(yōu)先級(Preemptive Resume Priority,PRP)M/G/1 排隊網(wǎng)絡模型[7]來描述不同信道中具有多次頻譜切換的PU 和SU 之間的頻譜使用行為。假設每個信道的隊列中PU 和SU 的到達過程均服從泊松分布。圖2 為SU1傳輸?shù)那袚Q過程。Ts為頻譜切換時延,T為SU1的整個數(shù)據(jù)傳輸時間。
圖2 活躍SU1 傳輸?shù)那袚Q過程
傳輸過程被中斷3 次,整個傳輸過程被分為4個部分。
該過程可描述如下。
(1)起初,SU1在初始信道1 上傳輸。當PU到達時,SU1根據(jù)切換時延最短的原則決定其目標信道。
(2)在第1 次中斷時,因為切換至信道2 的切換時延最短,SU1切換至空閑信道2 繼續(xù)傳輸。
(3)第2 次中斷時,因為停留在信道2 的切換時延最短,SU1選擇等待,待PU 傳輸完成后繼續(xù)傳輸。此時,Twait是信道2 被PU 占用的持續(xù)時間,也是SU1的等待時間。
(4)在第3 次中斷時,雖然此時信道3 處于忙的狀態(tài),但與SU1一起排隊等待服務的SU 少,即切換至信道3 的切換時延最短,等待當前PU或隊列之前的SU 均被服務后,SU1切換至信道3繼續(xù)傳輸。
(5)最后,SU1在信道3 上完成傳輸。
SUi在傳輸過程中可能會多次中斷,設B為中斷次數(shù),bmax表示最大中斷次數(shù),當B>bmax時,SUi整個過程傳輸失敗,需要重新傳輸,則累積切換時延為:
定義期望累積切換時延為:
本文中以最小化SUi的期望累積切換時延(Expected Cumulative Handover Delay,ECHD)為優(yōu)化目標,可表述為優(yōu)化問題P:
優(yōu)化問題P是一個組合問題,也是一個典型的NP-hard 問題。考慮到信道條件是動態(tài)的實際情況,求解P變得更具挑戰(zhàn)性。
由于考慮的CRN 中沒有設定基站,因此SU 將自適應地采用頻譜切換策略,可將切換問題公式化為一個Stochastic 博弈。下文提出了公式化的博弈模型,分析其性質(zhì)并利用SAP 算法,以在動態(tài)環(huán)境中找到問題的最優(yōu)解。
將SU 之間的相互作用建模為一個分布式頻譜切換Stochastic 博弈,表示為:
式中:N 為SU 集;Ai 為SUi的可用信道集;Ui是SUi的效用函數(shù)。
將效用函數(shù)Ui定義為ECHD 的相反數(shù):
在Stochastic 博弈中,每個SU 都希望最大化自身的效用函數(shù),意味著局部合作的頻譜切換博弈可以表示為:
從文獻[8]中可以得出結(jié)論:每一個有限的策略博弈至少存在一個混合策略NE 點。在博弈模型G中,可用信道數(shù)是有限的,所以G至少存在一個NE 點,即頻譜切換問題的最優(yōu)解。
一般來說,SAP 是基于博弈論的方法中的代表性學習算法之一[9],可以達到最佳的Nash 均衡狀態(tài),同時也適用于動態(tài)網(wǎng)絡。考慮到認知無線電網(wǎng)絡的動態(tài)特性,本文采用SAP 算法找到問題的最優(yōu)解。
下面設計仿真實驗并對結(jié)果進行分析。
首先,設定N=15、M=3,在不同的學習步長參數(shù)條件下,對比所提方案的期望累積切換時延性能,結(jié)果如圖3 和圖4 所示。分別在4 種學習步長條件下開展仿真比較,找出合理的學習步長設定。由圖3 和圖4 可得出結(jié)論,學習步長等于迭代數(shù)是相對理想的學習步長設定。
圖3 不同學習步長條件下所提方案的期望累積切換時延對比
圖4 不同學習步長條件下收斂所需迭代次數(shù)對比
其次,在學習步長等于迭代數(shù)的條件下,固定N=15,并在可用信道數(shù)分別為2、3、4 的情況下將所提方案與最佳響應動態(tài)(Best Response Dynamics,BRD)算法[10]進行對比,結(jié)果如圖5、圖6 和圖7 所示。
圖5 M=2 時兩種算法收斂性能比較
圖6 M=3 時兩種算法收斂性能比較
圖7 M=4 時兩種算法收斂性能比較
從圖5、圖6 和圖7 可以看出,所提的方案在收斂速度和期望累積切換時延方面始終優(yōu)于BRD算法,且可用信道數(shù)越多。所提方案與BRD 算法的ECHD 的差距越大,說明所提方案在多策略的情況下找到的問題可行解比BRD 算法更優(yōu),即適用于更大規(guī)模的CRN。
本文研究了CRN 中基于博弈論的頻譜切換方法,將該頻譜切換問題表征為一個Stochastic 博弈,分析其性質(zhì),并利用SAP 算法來實現(xiàn)NE 點,找到問題的最優(yōu)解。仿真結(jié)果表明,所提方案在收斂速度和期望累積切換時延方面方面的性能優(yōu)于BRD算法,有助于提高CRN 的頻譜利用效率和優(yōu)化頻譜切換時延。