竇彥智 王滿喜 白 鉑* 陳 巍 曹志剛
認知無線電(Cognitive Radio, CR)技術(shù)旨在允許次級用戶(Secondary User, SU)監(jiān)測當前頻譜環(huán)境,在避免對授權(quán)用戶(Primary User, PU)造成有害干擾的情況下利用空閑頻譜來傳輸信息,以達到大幅提高頻譜利用率,增加無線通信系統(tǒng)容量的目的。美國聯(lián)邦通信委員會(Federal Communications Commission, FCC)研究了美國境內(nèi)的頻譜利用情況,發(fā)現(xiàn)已經(jīng)注冊的頻譜并沒有被充分利用,提出將CR定位為未來通信的發(fā)展方向[1]。
基于認知無線電的頻譜共享主要探討SU與PU之間、SU之間協(xié)同接入可用信道的方式。采用的主要理論工具和研究方法包括圖論和競價拍賣理論[2,3]。功率控制則在經(jīng)典注水功率分配算法的基礎(chǔ)上,采用博弈論方法來優(yōu)化 SU的發(fā)射功率,避免對PU通信造成有害干擾[4,5]。然而,目前已有的認知無線網(wǎng)模型大多只包含一個 PU,如文獻[2]。同時,部分研究還規(guī)定每個頻譜子帶至多能被一個SU占用,如文獻[2,3]。文獻[4,5]要求每個SU都知道所有PU所受的干擾情況,來完成自身的功率控制過程。而文獻[6-11]則分別提出了利用其他不同的無線網(wǎng)絡(luò)模型進行動態(tài)頻譜分配的方法。與前述研究成果不同,本文針對多次級用戶和多主用戶并存的典型認知無線網(wǎng)絡(luò)場景,研究動態(tài)頻譜共享和功率控制問題。本文研究的認知無線網(wǎng)絡(luò)模型包含多個PU,且允許每個頻譜子帶被多個基于虛擬多天線技術(shù)的SU占用。這樣通過提供給SU更多的選擇性來進一步增加 SU的收益。針對該網(wǎng)絡(luò)模型,本文采用博弈論方法聯(lián)合優(yōu)化次級用戶的發(fā)射功率和子帶分配,以及主用戶的定價系數(shù),以同時最大化主用戶和次級用戶的收益。
本文的結(jié)構(gòu)如下:第2節(jié)提出認知無線網(wǎng)絡(luò)模型;第3節(jié)建立資源共享博弈模型,并將博弈均衡問題的求解分解為3個子優(yōu)化問題;第4節(jié)通過博弈分析,求解每一個子問題,并提出博弈均衡的求解算法;第5節(jié)通過仿真驗證所提出的理論;第6節(jié)是本文的結(jié)論。
考慮圖1所示的認知無線網(wǎng)絡(luò),其中,J個PU記為 P1,P2,… ,PJ; K個次級用戶對記為 (S1, D1),(S2,D2),… ,(SK, DK)。PU的授權(quán)頻帶分為M個子帶。在任何時刻,每個 SU只被允許使用至多一個子帶。假設(shè)子帶分配僅在 SU網(wǎng)絡(luò)里決定,對 PU不可見。
圖1 典型認知無線網(wǎng)絡(luò)模型,其中 L 1 ={S 1 , S 2}
lSk表示分配給 Sk的子帶, 并且 lSk∈{1,2,…,M }。那么,每種子帶分配策略可表示為向量 lS= [lS1lS2…lSK]。如圖1所示,模型允許不同的SU接入同一個子帶,并用 Lm表示共享子帶m的SU集合,即 Lm={Sk:lSk= m , k = 1 ,2,… , K }。 Lm為空集表示沒有 SU選擇子帶m。信道增益矩陣記為H。
ωSk表示 Sk的發(fā)射功率,K個 SU的發(fā)射功率可表示為向量 ωS= [ ωS1ωS2…ωSK]。 QP表示PU的干擾容限矩陣,即 QP=[QP1QP2… QPJ],則每個PU所受的干擾強度要小于其干擾容限,即
其中,“≤”對向量中的每個元素成立。
在認知無線電中,PU對頻帶有優(yōu)先使用權(quán)和出租定價權(quán)。SU只能根據(jù)PU提出的定價系數(shù)選擇最優(yōu)頻帶和最佳發(fā)射功率。本文的研究目標是同時最大化PU和SU的收益函數(shù),故PU可視為博弈的領(lǐng)導(dǎo)者(Leader),而 SU 則為跟隨者(Follower)。下面給出各參與者博弈行為的時序:
(1)PU同時選擇定價系數(shù)βj,得到定價系數(shù)向量 β= [ β1β2… βJ]。
(2)在SU網(wǎng)絡(luò)中確定子帶分配 lSk,得到子帶分配矩陣 lS=[lS1lS2… lSK]。
(3)SU決定其發(fā)射功率ωSk,得到發(fā)射功率矩陣ωS= [ ωS1ωS2… ωSK]。
根據(jù)文獻[12]的結(jié)論,該博弈模型是一種動態(tài)完全信息博弈。
SU的收益kSπ等于收入kR減去支出kC,即
其中, Rk為SU租用某條子帶時獲得的信道容量,Ck為SU支付給所有PU的租金之和。這里給每個PU的租金等于該PU的定價系數(shù)乘以該PU所受到來自各個SU的干擾,即
其中H·k表示H矩陣的第k列。式(3)中的收入和支出都乘以系數(shù)1轉(zhuǎn)化成價格,以統(tǒng)一量綱。考慮Lm個 SU共享子帶m的情況。假設(shè)在子帶m, SU網(wǎng)絡(luò)中發(fā)射端距離較近,故可視為Lm-輸入Lm-輸出的等效虛擬多輸入多輸出(Multiple-Input and Multiple-Output, MIMO)信道。根據(jù)文獻[13]的結(jié)論,子帶m上等效虛擬MIMO信道的容量為
其中, I ( Sk; Dl) 表示子帶m中 Sk和 Dl的互信息,λk[m]是中第k個非零特征值,而 G { Sk∈Lm} 是SU網(wǎng)絡(luò)中滿足 Sk∈Lm的收發(fā)端信道增益矩陣G的子陣。
基于比例公平原則(Proportional Fairness Criterion, PFC),本文將 Lm集合的總收入分配給每一個SU。根據(jù)文獻[14]的結(jié)論,如果收入分配滿足PFC,則合作博弈的納什議價解可保證整個系統(tǒng)達到帕累托最優(yōu)。
定理1 如果采用 PFC將 Lm集合總收入分配給每個SU,則每個SU的速率為
相應(yīng)收益為
每個PU的收益等于從所有SU收取的租金和,即
其中,j·H表示H矩陣的第j行。
本文已說明前述博弈模型屬于動態(tài)完全信息博弈,下面要求解該博弈模型的子博弈精煉納什均衡。根據(jù)文獻[12],本文有如下定義:
則 ( β*,)構(gòu)成子博弈精煉納什均衡。其中,分別代表在給定 βj, lSk(β*),ω (l*, β*)時的納什均衡。SkS
按照逆向歸納法[12],本文提出的博弈模型可以分解為3個子優(yōu)化問題。
(1)功率控制問題:PU定價系數(shù) β*、次級網(wǎng)絡(luò)子帶分配已知且固定。對 Sk求滿足納什均衡的發(fā)射功率的問題,可表示成式(11)所示的優(yōu)化問題
(2)子帶分配問題: PU 定價系數(shù) β*已知且固定,通過上一個功率控制問題可求最優(yōu)發(fā)射功率。對 S求滿足納什均衡的子帶選擇的問題,k可表示成式(12)所示的優(yōu)化問題:
(3)價格調(diào)整問題: 通過之前功率控制問題和子帶分配問題可求得最優(yōu)發(fā)射功率和最優(yōu)子帶分配。對 Pj求滿足功率約束式(1)和納什均衡的定價系數(shù)的問題,可表示成式(13)所示的優(yōu)化問題
對πSk求極大值點,且發(fā)射功率要大于0,得
把式(14)代入到式(6),得最大收益表達式為
在SU從一個子帶跳轉(zhuǎn)到另外一個子帶的過程中,需要考慮的參數(shù)有 λk[m]和hjk[m]。所以很難找到一個非窮舉搜索的算法求解納什均衡。本文則通過記錄已經(jīng)比較過的結(jié)果來減少將來的比較次數(shù)。
下面給出一個搜索子帶分配博弈納什均衡的算法流程。該算法分為兩個步驟,(1)計算所有子帶分配情況下每個SU的收益。對于M個子帶,K個SU,一共有K
M 種子帶分配方式。(2)比較響應(yīng)情況,如果某種子帶分配下所有 SU收益都高于“鄰近”情況,則可以判斷其為納什均衡?!班徑钡亩x是保持其他 1K- 個SU所選子帶不變,僅改變剩下的一個SU的占用子帶,共有 1M- 種情況。
定理2 如果PU選擇β=αc,其中c是一個常矩陣,α是一個正實數(shù),那么 SU最優(yōu)子帶分配是獨立于α的。
該定理表明如果定價系數(shù)jβ以一個固定速率增大或者減小,那么子帶分配博弈的納什均衡是固定的,這樣就可以把子帶分配問題從博弈模型中分離出來。
本節(jié)給出仿真結(jié)果,驗證前述理論推導(dǎo)和所提算法??紤]2個PU,2個子帶,2個SU的情形??芍訋Х峙湟还灿?種策略,分別為: S1和 S2共用子帶1,記為 { lS1= 1 , lS2= 1 }; S1占用子帶2,S2占用子帶1,記為 {lS1= 2 , lS2= 1 }; S1占用子帶1, S2占用子帶 2,記為 { lS1= 1 , lS2= 2 }; S1和 S2共用子帶 2,記為 { lS1= 2 , lS2= 2 }。把這4種策略分別標記為策略 1,策略 2,策略3,策略 4。
固定c,改變α,求解納什均衡策略,得到圖2??梢钥吹?,在 α ∈ [ 1,10],策略 2一直都是純戰(zhàn)略納什均衡,驗證了定理2。在α=4點之后,策略4也成為納什均衡策略。
圖2 固定c,改變α?xí)r的納什均衡
通過改變定價系數(shù)組合 c =(c1, c2),研究不同定價系數(shù)對于子帶分配的影響。如圖3,c1從0取到4,c2從0取到2, 2維平面被分成了3部分?;疑珔^(qū)域代表策略2是納什均衡的,黑色部分表示策略4是納什均衡的。白色區(qū)域表示因為定價太高,兩個SU都負擔不起租用子帶的費用,所以沒有納什均衡。
現(xiàn)在考慮2個PU, 2個子帶,5個SU的情形。令α從1取到200, c分別等于 c1和 c2,圖4給出了活躍用戶數(shù)量的曲線圖。這里活躍用戶定義為發(fā)射功率大于0的SU??梢钥闯觯S著α的增加,活躍用戶數(shù)量越來越少。但是對于不同的定價系數(shù)組合c,變化的情況是不同的。
圖5給出 α和c對PU所受干擾的影響。從圖中可以看出,α越高,則 PU所受干擾越小,所以PU可以通過修改定價系數(shù)來實現(xiàn)功率控制。
本文研究了多PU、多SU、多可用子帶的認知無線網(wǎng)絡(luò)中的頻譜分配和功率控制問題。首先構(gòu)建認知無線網(wǎng)絡(luò)的博弈模型,該模型將 SU網(wǎng)絡(luò)等效為虛擬 MIMO信道,并采用比例公平原則分配收益,從而允許不同的 SU通過共享子帶的方式收發(fā)數(shù)據(jù)。通過給出PU和SU的行為時序,證明了該模型是一種動態(tài)完全信息博弈,同時定義了該博弈的子博弈精煉納什均衡。隨后,基于逆向歸納法將上述博弈模型分解成3個子優(yōu)化問題,并逐一求解。在此基礎(chǔ)上,提出了一種搜索純戰(zhàn)略納什均衡的算法。理論分析證明了PU定價系數(shù)滿足固定的線性關(guān)系時,子帶分配結(jié)果穩(wěn)定不變,即子帶分配問題可獨立求解。因此,本文的理論分析和所提算法為未來認知無線網(wǎng)絡(luò)的設(shè)計提供了理論基礎(chǔ)。
圖3 不同的定價系數(shù)組合對子帶分配的影響
圖4 α和c對活躍用戶數(shù)量的影響
圖5 α和c對PU所受干擾的影響
[1] Federal Communications Commission. Spectrum policy task force report[R]. United States: FCC, 2002.
[2] Xiao Y, Bi G, and Niyato D. Distributed optimization for cognitive radio networks using Stackelberg game[C].Proceedings of IEEE International Conference on Communication Systems (ICCS), Singapore, 2010: 77-81.
[3] Xiao Y, Bi G, and Niyato D. A simple distributed power control algorithm for cognitive radio networks[J]. IEEE Transactions on Wireless Communications, 2011, 10(11):3594-3600.
[4] Ghasemi A and Sousa E S. Fundamental limits of spectrum-sharing in fading environments[J]. IEEE Transactions on Wireless Communications, 2007, 6(2):649-658.
[5] Hou Y T, Shi Y, and Sherali H D. Spectrum sharing for multi-hop networking with cognitive radios[J]. IEEE Journal on Selected Areas in Communications, 2008, 26(1): 146-155.
[6] Ni Q, Zhu R, Wu Z, et al.. Spectrum allocation based on game theory in cognitive radio networks[J]. Journal of Networks, 2013, 8(3): 712-722.
[7] Lam A, Li V O K, and Yu J J Q. Power-controlled cognitive radio spectrum allocation with chemical reaction optimization[J]. IEEE Transactions on Wireless Communications, 2013, 12(7): 3180-3190.
[8] Zhang Z, Long K, and Wang J. Self-organization paradigms and optimization approaches for cognitive radio technologies:a survey[J]. IEEE Wireless Communications, 2013, 20(2):36-42.
[9] Gardellin V, Das S K, and Lenzini L. Self-coexistence in cellular cognitive radio networks based on the IEEE 802.22 standard[J]. IEEE Wireless Communications, 2013, 20(2):52-59.
[10] Tachwali Y, Lo B F, Akyildiz I F, et al.. Multiuser resource allocation optimization using bandwidth-power product in cognitive radio networks[J]. IEEE Journal on Selected Areas in Communications, 2013, 31(3): 451-463.
[11] Treeumnuk D, Macdonald S L, and Popescu D C. Optimizing performance of cooperative sensing for increased spectrum utilization in dynamic cognitive radio systems[C].Proceedings of the IEEE International Conference on Communications (ICC), Budapest, Hungary, 2013:4656-4660.
[12] Robert G. A Primer in Game Theory[M]. 1st Edition, London:FT Prentice Hall Publisher, 1992: 122-129.
[13] Telatar E. Capacity of multi antenna Gaussian channels[J].European Transactions on Telecommunications, 1999, 10(6):585-595.
[14] Kelly F P, Maulloo A K, and Tan D K H. Rate control for communication networks: shadow prices, proportional fairness and stability[J]. Journal of the Operational Research Society, 1998, 49(3): 237-252.
[15] Debreu G. A social equilibrium existence theorem[J].Proceedings of the National Academy of Sciences of the United States of America, 1952, 38(10): 886.