張新春,何世彪,葛利嘉,孫 江
(1.重慶通信學院,重慶400035;2.海軍航空工程學院,煙臺 264001)
隨著無線通信技術的不斷發(fā)展以及人們對無線通信需求的不斷增長,整個無線電頻譜空間被劃分得所剩無幾。然而,從一些研究調(diào)查可以看到,頻譜資源的缺乏更多是由于對不同無線接入技術的頻譜分配不合理造成的,認知無線電技術應運而生。它能夠主動檢測頻譜使用情況,自適應地改變自身通信參數(shù),擇機地選擇主用戶暫不使用的頻段進行通信,期望實現(xiàn)高可靠性的通信以及最大化頻譜利用率。
目前,認知無線電關鍵技術包括頻譜感知,頻譜分配,頻譜管理等。本文主要研究頻譜感知后的頻譜分配問題。把博弈理論引入認知無線電中的動態(tài)頻譜分配,是一個全新的研究方案,如Nie等人[1]提出了利用潛在博弈(potential game)的自適應信道分配算法,文獻[2]提出了多個主系統(tǒng)間頻譜價格博弈的伯川德(Bertrand)模型,以及動態(tài)博弈的斯坦克爾伯格(Stackelberg)博弈模型等,這些大都是構建特殊的博弈模型來解決頻譜分配。
本文在特殊博弈模型靜態(tài)古諾博弈模型基礎上,考慮了頻譜的水平差異以及信道容量狀況,對其提出了改進算法。
本文分析了有N個用戶端設備(customer premises equipment,CPE)的分布式無線通信系統(tǒng),用戶端設備也稱認知用戶(cognitive user,CU)。
各個認知用戶隨機的分布在一個網(wǎng)絡小區(qū)內(nèi),獨自地感知主網(wǎng)絡(primary network)頻譜使用狀況,相互間通過公共控制信道傳遞頻譜使用信息,然后在相互協(xié)商好的信道上進行通信鏈接,如圖1所示。由于博弈理論的特點是各個博弈玩家通過自身所掌握的可用信息選擇自己的策略,正是分布式網(wǎng)絡的特點。
圖1 認知無線電網(wǎng)絡模型Fig.1 Model of cognitive radio network
假設認知用戶系統(tǒng)采用自適應調(diào)制技術,傳輸速率基于信道質(zhì)量可以動態(tài)地調(diào)整。對于正交幅度調(diào)制采用矩形星座圖(如4QAM,16QAM),那么其單輸入單輸出系統(tǒng)在高斯噪聲信道的比特錯誤概率可以近似表示為
(1)式中:γ表示接收機的信噪比;k代表所用調(diào)制方式的頻帶利用率,且一般為非負值。為保證傳輸質(zhì)量,比特誤碼率應達到一定門限值(BERtari),則認知用戶i的頻帶利用率為
(2)式中,
通過1.1節(jié)的網(wǎng)絡模型描述,我們可以把認知無線電的動態(tài)頻譜分配問題用博弈過程進行描述。在這個博弈過程中,參與者是認知用戶,他們的行動(策略)是對傳輸信道的選擇,并且他們的效用和所選擇的信道質(zhì)量相聯(lián)系。信道質(zhì)量信息可由認知無線電用戶通過在不同的無線頻率上的測量來獲得(見1.2 節(jié))。
則頻譜分配問題的博弈論模型一般形式為
(4)式中:N是博弈者(也即認知用戶)的有限集;Si是相對于博弈者i的策略集,其策略空間為S=×Si,i∈N,則Ui:S→R是效用函數(shù)集。在博弈Γ中的每一個博弈者i,效用函數(shù)Ui是si和當前其對手的s-i的函數(shù),這里si是博弈者i選擇的策略,s-i是其對手的策略。
目前,認知無線電中常用的靜態(tài)博弈模型有伯川德博弈和古諾博弈2種。伯川德博弈[2]主要適用于主系統(tǒng)之間的交互,而古諾博弈[4]更適用于認知用戶之間的頻譜分配過程。
在1.1節(jié)所述的系統(tǒng)模型基礎上,一個古諾博弈模型表述如下:博弈方是認知用戶,每個博弈方的策略相應為分配的非零值的頻譜(用bi表示每個認知用戶i)。在與其他認知用戶以及主用戶共享的頻譜系統(tǒng)中每個博弈方的支付(payoff)是認知用戶的利益(比如收益減去花費,用pi表示)。
對于主系統(tǒng),假設定價函數(shù)(Pricing function)是向認知用戶收費,表示為
(5)式中:x,y是非零常數(shù);τ≥1確保定價函數(shù)為凸函數(shù);Β={b1,…,bN},代表所有認知用戶策略集。用ω代表對于主用戶來說頻譜的價值,于是為了確保主用戶愿意共享頻譜尺寸(spectrum size)b給認知用戶,條件是必要的。另外,主用戶向所有認知用戶收費是相同的價格。
認知用戶i的收益由ri×ki×bi獲得,ri表示每單位傳輸速率認知用戶的收益,而獲得頻譜分配的花費為bi c(b)。于是認知用戶i獲得的利益將可以表示為
通過(5)和(6)式,可以得到其效用函數(shù)為
2.1 節(jié)的定價函數(shù)是把頻譜統(tǒng)一進行定價,也即主用戶向所有認知用戶收費是相同的價格。然而頻譜是有區(qū)別的。頻譜有水平差異和垂直差異2種。水平差異性是指認知用戶對不同頻譜的偏好不同,也就是即使頻譜特性完全相同,也不能相互代替。而頻譜的垂直差異指的是頻譜的質(zhì)量差異,如空閑情況以及信道容量狀況等。由于頻譜的空閑狀況已經(jīng)感知,而信道容量通過認知用戶的接收信噪比獲得,故本文在考慮頻譜的水平差異以及信道容量狀況下,對定價函數(shù)(5)式改進如下
(8)式中:c為非負常數(shù),這里頻譜水平差異由頻譜相似度矩陣μ描述。μij表示對于認知用戶來說,把頻譜bj看成bi的相似程度,且 μij∈[-1,1],μij越小,說明兩頻譜的水平差異越大,當μij=0時,表示頻譜bi和bj完全不同,認知用戶不能隨意更換頻譜;μij越大,說明頻譜的差異程度越小,當μij=1時,頻譜bi和bj完全相同,主用戶的要價也就越高,也即文獻[4]提到的情況,而當μij<0時,表示頻譜bi需要bj的補充,也就是說,頻譜bi不足以滿足認知用戶的需要,需要從另一頻譜bj那里獲得補充(比如,一個用做上行鏈路,一個用做下行鏈路)??梢钥闯鱿嗨贫染仃嚘痰奶攸c是主對角線上元素為1,其余元素關于主對角線對稱。而信道容量由(2)式頻譜利用率體現(xiàn)。這樣通過(6)式和(8)式,其效用函數(shù)改進如下
根據(jù)納什均衡點原理[5],如果沒有一個參與者能夠靠自身行動的改變提高自身收益時,整個參與者集合對應的行動向量就稱為納什均衡。如果滿足以下條件,則本文博弈過程就能定性判斷納什均衡存在:
1)認知用戶集合是有限的;
2)認知用戶策略集Β={b1,…,bN}是封閉的、有界的凸集;
3)效用函數(shù)pi(Β)是在行動空間上的連續(xù)的擬凹函數(shù)。
可行性證明:對于條件1)和2),本文提出的基于頻譜差異的古諾博弈模型(spectrum difference based cournot game,SDCG)是顯然成立的,下面證明條件3)。
對效用函數(shù)進行二次求導有:
本文利用反應函數(shù)法[6]求解,反應函數(shù)法就是參與者根據(jù)給定的其他參與者的戰(zhàn)略,獲得自己的最佳戰(zhàn)略。
Β-i==1,…,N;j≠i}表示除了認知用戶i的所有策略集合,也即Β=Β-i∪{bi},于是,認知用戶i的最佳反應函數(shù)為
集合Β*={b*1,…,b*N}表示此博弈納什均衡解,當且僅當
當給定(13)式中所有參數(shù)值,求解該方程,即可得到納什均衡解b*i。
根據(jù)第1部分提出的網(wǎng)絡模型,本文考慮了2個認知用戶的共享頻譜。設定目標BERtari門限值為10-4,定價函數(shù)中的常數(shù)因子c=1,τ值根據(jù)實際測量環(huán)境獲得(比如線性模型時τ=1),主用戶的頻譜價值ω=1,每單位傳輸速率認知用戶的收益ri=10。其中一些參數(shù)在具體的仿真環(huán)境中可能發(fā)生變化。
圖2給出了2個認知用戶的反應函數(shù)曲線,2條曲線的交點就是納什均衡點。從圖2中可以看出,每個認知用戶的最佳反應是另一個認知用戶策略上的線性函數(shù)點,2個認知用戶的策略bi成逆向變動,當認知用戶1的頻譜尺寸減小時,認知用戶2的頻譜尺寸將會增大,反之亦然。當μ=1時,就是經(jīng)典古諾博弈模型,也就是說文獻[4]提出的方法是我們算法的特殊情況。
圖2 不同條件下的納什均衡Fig.2 Nash equilibrium in different conditions
由于2個認知用戶的效用函數(shù)相同,因此圖3只給出了1個認知用戶的價格(效用)隨頻譜尺寸變化的曲線。從圖3中可以看出,認知用戶的利益均在納什均衡點時達到最大,這與前面的分析是一致的。對比圖3中的幾條曲線發(fā)現(xiàn),當頻譜差異越大時,認知用戶的利益就越大,這是因為頻譜差異越大時,主用戶向認知用戶對該頻譜的要價就越低,認知用戶獲得更大的頻譜尺寸的同時,認知用戶能獲得更多利益。同樣當μ=1時,就是經(jīng)典的古諾博弈模型。
圖3 不同條件下的均衡效用Fig.3 Equilibrium utilities in different conditions
本文主要研究了認知無線電中基于博弈論的動態(tài)頻譜分配算法,重點描述了運用靜態(tài)古諾博弈模型算法。考慮到實際環(huán)境中頻譜的差異性,本文對頻譜進行了分級,用相似度矩陣進行表示,本文的仿真中已經(jīng)驗證,已有的古諾博弈算法是本文提出算法的一個特殊模式,對已有算法進行了完善和擴充,達到了一定的實際運用能力。
[1]NIE N,COMANIU C.Adaptive channel allocation spectrum etiquette for cognitive radio networks[J].Journal Mobile Networks and Applications,2006,11(6):779-797.
[2]NIYATO D,HOSSAIN E.Competitive Pricing for Spectrum Sharing in Cognitive Radio Networks:Dynamic Game,Inefficiency of Nash Equilibrium,and Collusion[J].IEEE Journal on Selected Areas in Communication,2008,26(1):192-202.
[3]GOLDSMITH A J,CHUA S G.Variable rate variable power MQAM for fading channels[J].IEEE Trans Commun,1997,45(10):1218-1230.
[4] NIYATO D,HOSSAIN E.A Game-Theoretic Approach to Competitive Spectrum Sharing in Cognitive Radio Networks[C]//IEEE Communications Society WCNC 2007.Kowloon:IEEE Press,2007:16-20.
[5] FUDENBERG D,TIROLE J.Game theory[M].Cambridge,MA:MIT Press,1991:23-26.
[6]OSBORNEM J.An Introduction to Game Theory[M].Oxford:Oxford University Press,2003.