黃麗亞,劉臣,王鎖萍
(南京郵電大學(xué) 電子科學(xué)與工程學(xué)院,江蘇 南京 210003)
頻譜在無線通信中是稀缺的資源。傳統(tǒng)的頻譜分配方式靜態(tài)地分配頻譜,頻譜利用率很低,很多時候,頻譜并沒有被完全利用[1],而近年來對無線服務(wù)的需求不斷增大,因此頻譜資源日益緊張。認(rèn)知無線電頻譜共享技術(shù)可以有效地解決頻譜資源緊張問題。在認(rèn)知無線電頻譜共享網(wǎng)絡(luò)中,主用戶擁有頻譜授權(quán),而次用戶沒有。具有頻譜認(rèn)知能力的次用戶可以利用主用戶尚未使用的頻譜,主用戶通過向次用戶出讓暫時不用的頻譜,能夠獲得額外收益[2]。
現(xiàn)有的頻譜共享方法大致分為兩類:一類是針對單個用戶進(jìn)行研究,不考慮用戶之間的關(guān)系;另一類則對多個用戶的合作或競爭關(guān)系進(jìn)行研究[3]。由于實際網(wǎng)絡(luò)中大多存在多個用戶,因此后一類的研究更有實際意義。在多用戶競爭的頻譜共享方法中,基于博弈論的頻譜共享方法是研究的熱點。比如Zhao等人提出部分可觀察馬爾可夫決策模型[4],Huang等人提出能夠限制參與者行為的拍賣競爭模型[5],Niyato等人提出基于 Cournot博弈的頻譜共享模型[6]等。
本文對基于Cournot博弈的頻譜共享模型進(jìn)行了改進(jìn)。探討改進(jìn)模型建立的前提,首先從主用戶獲得最大收益的角度分析主用戶制定最佳單位帶寬定價的方法,接著在給定主用戶頻譜帶寬定價的情況下,分析次用戶請求帶寬大小、次用戶相互間的競爭和頻譜效率等因素對次用戶的收益的影響,分析次用戶在靜態(tài)博弈、動態(tài)博弈和相互合作時,選擇最佳請求帶寬以獲得最大收益的方法,最后給出改進(jìn)模型的性能仿真結(jié)果。
基于Cournot博弈的頻譜共享模型適用于含有單個主用戶和多個次用戶、頻譜資源有限的認(rèn)知無線電網(wǎng)絡(luò)中,博弈存在于各個次用戶之間,博弈的結(jié)果是使每個次用戶的收益達(dá)到最大。模型給出的主用戶單位帶寬定價缺乏依據(jù),僅考慮次用戶的收益,并且每個次用戶的收益僅受到其向主用戶請求頻譜帶寬和頻譜效率的影響。
本文對該模型進(jìn)行改進(jìn),將研究的含有多個主用戶和多個次用戶的認(rèn)知無線電網(wǎng)絡(luò)進(jìn)行簡化。首先分析次用戶請求的頻譜帶寬對主用戶收益的影響,主用戶為獲得最大收益該如何選擇最佳單位帶寬定價,主用戶根據(jù)預(yù)測的次用戶可能的請求帶寬得出最佳單位帶寬定價具有可取性;接著在主用戶給定單位帶寬定價的前提下,分析次用戶收益除受到請求帶寬大小和頻譜效率的影響外,受到來自其他次用戶請求的頻譜帶寬的影響,分析表明,次用戶相互合作比相互競爭能夠使各方得到更大收益,說明考慮次用戶的收益受到次用戶間相互競爭的因素影響是有必要的;最后分析次用戶在靜態(tài)博弈、動態(tài)博弈和相互合作時選擇最佳請求帶寬以獲得最大收益的方法,分析表明,次用戶在靜態(tài)博弈、處于穩(wěn)定區(qū)間的動態(tài)博弈或相互合作時,都能使各自的請求帶寬達(dá)到納什均衡點,從而使收益達(dá)到最大。
認(rèn)知無線電網(wǎng)絡(luò)中大多存在多個主用戶和多個次用戶,主用戶擁有頻譜的使用權(quán),次用戶需要從某一主用戶租借頻譜帶寬。文獻(xiàn)[7]指出,多個主用戶整合各自的頻譜資源,作為一個整體向次級用戶提供帶寬時,主用戶會獲得更多的收益,次用戶得到的服務(wù)質(zhì)量將會提高,頻譜接入費用也會減少。因此,這里將所有主用戶視為一個合作的整體,稱之為主系統(tǒng),這樣認(rèn)知無線電網(wǎng)絡(luò)就簡化為由一個主系統(tǒng)和多個次用戶組成的系統(tǒng)。
主系統(tǒng)的單位帶寬定價受所有次用戶請求的總帶寬影響,主系統(tǒng)需要根據(jù)預(yù)測的次用戶請求的總帶寬來制定單位帶寬定價,以獲得最大收益。
所有次用戶的總收益與所獲得的總帶寬呈非線性關(guān)系。雖然次用戶得到帶寬越多,傳輸數(shù)據(jù)得到的收益越多,但是主系統(tǒng)會相應(yīng)提高單位帶寬定價,使得次用戶的頻譜接入費用提高。次用戶的收益一般是關(guān)于其獲得的帶寬的凸函數(shù)[8],這里假設(shè)次用戶的總收益函數(shù)為
其中,p為主系統(tǒng)的單位帶寬定價,b為所有次用戶請求的總帶寬,c為大于0的常數(shù),τ為取值區(qū)間為(0,1)的常數(shù),bmax為所有次用戶需要的最大帶寬。次用戶的收益不會小于0,因此Us(b)總是不小于0。
主系統(tǒng)向次用戶租讓帶寬獲得收益的同時,得到的服務(wù)質(zhì)量會下降。設(shè)服務(wù)質(zhì)量損失為每單位帶寬w,次用戶請求帶寬B,則主系統(tǒng)的收益函數(shù)為
對上式進(jìn)行一階求導(dǎo)得:
主系統(tǒng)確定單位帶寬定價后,向次用戶提供的總帶寬將保持不變。在這種情況下,每個次用戶請求帶寬的大小要受到其他次用戶請求帶寬大小的影響,這里用參數(shù)ν表示影響的程度[9]。ν取值范圍為[0,1],當(dāng)ν=0時,次用戶不會受其他次用戶請求帶寬的影響,ν=1時,次用戶受其他次用戶請求帶寬的影響達(dá)到最大。
作為數(shù)據(jù)發(fā)送方的次用戶i從主系統(tǒng)獲得帶寬bi后,調(diào)整數(shù)據(jù)傳輸速率,如果收益為每單位傳輸速率γi,則次用戶i的頻譜傳輸效率為
其中,K為由接收方誤碼率門限決定的常數(shù)[10]。
如果主系統(tǒng)采用最佳單位帶寬定價P,次用戶得到的帶寬間的保護(hù)帶寬忽略不計,則次用戶i的收益函數(shù)為
具體納什均衡算法見文獻(xiàn)[6],這里給出結(jié)論。從式(7)得到次用戶i的最佳請求帶寬為
其中,b由下式求得:
動態(tài)博弈開始時,次用戶嘗試請求比較少的帶寬,然后慢慢增加請求帶寬,同時,主系統(tǒng)不斷調(diào)整單位帶寬定價,最終,次用戶和主系統(tǒng)的收益都達(dá)到博弈時的最大點。
設(shè)bi[ t]為次用戶i在時刻t請求的帶寬,Ui[t]為次用戶i在時刻t獲得的收益,以下分2種情況討論。
完全信息動態(tài)博弈時,次用戶i根據(jù)在上一個時刻t其他次用戶請求的帶寬大小,計算得出時刻t的最佳請求帶寬,把它作為在 t+1時刻的請求帶寬,即:
不完全信息動態(tài)博弈時,次用戶i在時刻t試探性地對請求帶寬進(jìn)行略微變化,得到收益與請求帶寬的變化關(guān)系,在t+1時刻的請求帶寬為
其中,參數(shù)iα反映次用戶i對觀察到的收益與請求帶寬的變化關(guān)系的信任程度[6]。
下面分析不完全信息動態(tài)博弈時,次用戶請求的帶寬能夠收斂到穩(wěn)定狀態(tài)的穩(wěn)定區(qū)間。由式(11)得:
將式(12)、式(13)代入雅各布矩陣,得:
令矩陣J的所有特征值的絕對值小于1,得到iα(i=1,2,…,N)的相互關(guān)系,即為不完全信息動態(tài)博弈的穩(wěn)定區(qū)間[9]。
納什均衡中,次用戶是相互競爭的關(guān)系。當(dāng)次用戶相互合作,以總收益最大為目的時,所得到的結(jié)果為帕累托最優(yōu)。分析帕累托最優(yōu)的算法見文獻(xiàn)[9],這里給出結(jié)論。從式(7)得到帕累托最優(yōu)時次用戶i的請求帶寬為
其中,b由下式求得:
從式(8)和式(15)可以看出,次用戶在帕累托最優(yōu)時的請求帶寬比納什均衡時的請求帶寬更大。次用戶互相合作可以獲得更大收益。
本節(jié)在 MATLAB環(huán)境下,對改進(jìn)的認(rèn)知無線電頻譜共享模型的靜態(tài)博弈、動態(tài)博弈及其穩(wěn)定性和帕累托最優(yōu)進(jìn)行分析。參數(shù)設(shè)置:認(rèn)知無線電系統(tǒng)中有一個主系統(tǒng)和2個次用戶,主系統(tǒng)與次用戶共享的帶寬為20MHz,主系統(tǒng)服務(wù)質(zhì)量損失為每單位帶寬 1MHz,2個次用戶的誤碼率門限值為8MHz,每單位傳輸速率所獲得的收益為10dB,參數(shù)τ設(shè)為0.5,參數(shù)ν設(shè)為0.4。
圖1是在不同信道質(zhì)量條件下,2個次用戶最佳請求帶寬的關(guān)系。從圖中可以看出,納什均衡點的位置受信道質(zhì)量和參數(shù)ν的影響:信道質(zhì)量提高時,次用戶會請求更多的帶寬;參數(shù)ν增加時,次用戶間的影響變大,次用戶的最佳請求帶寬減少。次用戶數(shù)量大于2時,以上結(jié)論依然成立。當(dāng)系統(tǒng)存在3個次用戶時,每個次用戶的最佳請求帶寬函數(shù)可以表示為一個平面,3個平面的交點即為納什均衡點。
圖1 最佳請求帶寬和納什均衡點
主系統(tǒng)對參數(shù)τ的選取直接影響單位帶寬定價和次用戶請求的總帶寬。圖2反映不同信道質(zhì)量條件下,參數(shù)τ對主系統(tǒng)收益的影響。從圖中可以看出,存在參數(shù)τ,使主系統(tǒng)按此制定單位帶寬定價時,能獲得最大收益。信道質(zhì)量提高時,次用戶會請求更多的帶寬,從而主系統(tǒng)可以獲得更多的收益。
圖2 參數(shù)τ不同時主系統(tǒng)的收益
設(shè)動態(tài)博弈初始時刻次用戶的請求帶寬為1MHz,單位傳輸收益iγ分別為11dB、10dB,次用戶請求的帶寬隨時間的變化如圖3所示。從圖中可以看出,次用戶1和次用戶2穩(wěn)定時刻的請求帶寬大約分別為4MHz和3MHz。完全信息動態(tài)博弈時,次用戶請求的帶寬可以很快達(dá)到穩(wěn)定狀態(tài);不完全信息動態(tài)博弈時,次用戶請求帶寬的收斂速度依賴于參數(shù)iα:iα越大,收斂到穩(wěn)定狀態(tài)需要的時間越多,iα超過穩(wěn)定區(qū)間范圍時,請求帶寬將無法收斂。由于次用戶1的單位傳輸速率收益大,因此次用戶1請求的帶寬更大。
圖3 動態(tài)平衡收斂到納什均衡
圖4是不同信道質(zhì)量條件下,不完全信息動態(tài)博弈的穩(wěn)定區(qū)間。如果1α和2α取值位于穩(wěn)定區(qū)間內(nèi),則次用戶在不完全信息動態(tài)博弈時,請求的頻譜帶寬最終能夠收斂到穩(wěn)定狀態(tài),否則次用戶的請求帶寬將一直處于波動狀態(tài),無法收斂。信道質(zhì)量提高,會使穩(wěn)定區(qū)間變小。
圖4 不完全信息動態(tài)博弈的穩(wěn)定區(qū)間
圖5 納什均衡和帕累托最優(yōu)時的最佳請求帶寬
圖5反映在納什均衡和帕累托最優(yōu)時,次用戶1的最佳請求帶寬與參數(shù)ν的關(guān)系。從圖中可以看出,帕累托最優(yōu)時,由于次用戶進(jìn)行合作,相互間幾乎沒有影響,次用戶的請求帶寬隨參數(shù)ν的變化很?。欢{什均衡時,次用戶請求的帶寬隨著參數(shù)ν的增大迅速減??;在整個ν區(qū)間上,次用戶在帕累托最優(yōu)時請求的帶寬比納什均衡時請求的帶寬更大,因此次用戶相互合作比相互競爭時能夠獲得更多的收益。
本文對基于Cournot博弈的頻譜共享模型做了改進(jìn)。改進(jìn)模型將認(rèn)知無線電網(wǎng)絡(luò)中的多個主用戶視為一個主系統(tǒng),綜合考慮主系統(tǒng)與次用戶間的博弈關(guān)系和次用戶之間博弈關(guān)系,分析主系統(tǒng)該如何選擇頻譜帶寬定價才能獲得最大收益,次用戶該如何選擇請求頻譜帶寬才能獲得最大收益。對該博弈模型的靜態(tài)博弈、動態(tài)博弈及其穩(wěn)定性和帕累托最優(yōu)等特性的仿真結(jié)果說明改進(jìn)的博弈模型是合理的。改進(jìn)的模型適用于頻譜資源有限的認(rèn)知無線電環(huán)境中,前提假設(shè)是所有主用戶相互合作。下一步研究工作將致力于將模型擴(kuò)展到各個主用戶相互競爭,頻譜資源豐富的認(rèn)知無線電網(wǎng)絡(luò)環(huán)境中。
[1] AKYILDIZ I,LI W Y,VURAN M,et al.Next generation/dynamic spectrum access/cognitive radio wireless networks: a survey[J].Computer Networks Journal,2006,9(2): 2127-2159.
[2] BRUCE F.Cognitive Radio Technology [M].New York: Academic Press,2007.
[3] 李琳,曾志民,馮春燕等.認(rèn)知無線電網(wǎng)絡(luò)中的非合作頻譜分配算法研究[EB/OL].http://www.paper.edu.cn/downloadpaper.php? serial_number=20081-36,2008-12-1.LI L,ZENG Z M,FENG C Y,et al.Research on non-cooperation spectrum allocation algorithm in cognitive radio network[EB/OL].http://www.paper.edu.cn/downloadpaper.php?serial_number=20081-3 6,2008-12-1.
[4] ZHAO Q,TONG L,SWAMI A,et al.Decentralized cognitive MAC for opportunistic spectrum access in ad-hoc networks: a POMDP framework [J].IEEE Journal on Selected Areas in Communications,2007,25(3):589-600.
[5] HUANG J,BERRY R,HONIG M.Auction-based spectrum sharing[J].Mobil Networks and Applications,2006,11(3): 405-408.
[6] NIYATO D,HOSSAIN E.Competitive spectrum sharing in cognitive radio networks: a dynamic game approach[J].IEEE Transaction on Wireless Communications,2008,7(7): 2651-2660.
[7] ALIREZA A,SASWATI S,CHANDRAMANI S,et al.A coalitional game framework for cooperative secondary spectrum access[A].2008 46th Annual Allerton Conference on Communication,Control,and Computing [C].Urbana-Champaign,IL,USA,2008.1154-1160.
[8] 李廣久.博弈論基礎(chǔ)教程[M].北京: 化學(xué)工業(yè)出版社,2005.LI G J.The Basic Course of Game Theory[M].Beijing: Chemical Industry Press,2005.
[9] NIYATO D,HOSSAIN E.Competitive pricing for spectrum sharing in cognitive radio networks: dynamic game,inefficiency of nash equilibrium and collision[J].IEEE Journal on Selected Areas in Communications,2008,26(1): 192-202.
[10] GOLDSMITH A J,CHUA S G.Variable rate variable power MQAM for trading channels[J].IEEE Journal on Selected Areas in Communications,1997,45(10): 1218-1230.