徐昌彪,劉雪亮,鮮永菊
(重慶郵電大學(xué) 測(cè)控與信息傳輸實(shí)驗(yàn)室,重慶400065)
隨著無(wú)線通信技術(shù)的發(fā)展,尤其是隨著無(wú)線局域網(wǎng)WLAN(Wireless Local Area Network)及無(wú)線區(qū)域網(wǎng)絡(luò)WRAN(Wireless Regional Area Network)等技術(shù)的發(fā)展,人們對(duì)無(wú)線通信業(yè)務(wù)需求的不斷增加與無(wú)線頻譜資源的匱乏之間的矛盾越來(lái)越尖銳。針對(duì)頻譜資源的不足,認(rèn)知無(wú)線電網(wǎng)絡(luò)中的動(dòng)態(tài)頻譜分配技術(shù)能夠靈活地使用空閑頻譜[1],實(shí)現(xiàn)空閑頻譜的再利用,從而提高頻譜利用率。為了達(dá)到這一目的,認(rèn)知無(wú)線電需要擁有感知周圍環(huán)境以及根據(jù)周圍環(huán)境的變化自適應(yīng)地調(diào)整系統(tǒng)參數(shù)的能力,從而能夠感知到授權(quán)用戶的空閑頻譜并利用其進(jìn)行通信。然而,授權(quán)用戶和非授權(quán)用戶在授權(quán)頻段的和平共存是一個(gè)具有挑戰(zhàn)性的課題。目前,認(rèn)知無(wú)線電系統(tǒng)的頻譜分配研究方法很多,基于博弈論[2]的頻譜分配方法是研究的熱點(diǎn)。參考文獻(xiàn)[3,4]中用博弈論分析了主用戶相互競(jìng)爭(zhēng)提供頻譜的行為,主用戶根據(jù)次用戶的頻譜需求大小以及其他主用戶所采取的策略動(dòng)態(tài)調(diào)整自身的策略,從而使得自己的效用達(dá)到最大化,而對(duì)次用戶之間競(jìng)爭(zhēng)頻譜的博弈行為沒(méi)有考慮。參考文獻(xiàn)[5,6]中應(yīng)用寡頭市場(chǎng)模型來(lái)解決頻譜分配中授權(quán)用戶的博弈問(wèn)題,并用Bertrand均衡理論提出了授權(quán)用戶信道競(jìng)價(jià)的Bertrand博弈算法。參考文獻(xiàn)[7]中考慮了基于用戶業(yè)務(wù)需求的頻譜分配,根據(jù)用戶的業(yè)務(wù)等級(jí)不同進(jìn)行頻譜分配。參考文獻(xiàn)[8]中用博弈理論分析認(rèn)知網(wǎng)絡(luò)中多個(gè)策略主用戶與多個(gè)策略次用戶的博弈問(wèn)題,主用戶的頻譜價(jià)格是通過(guò)AP唯一確定的,但在實(shí)際的認(rèn)知無(wú)線電環(huán)境中,主用戶的頻譜價(jià)格是不斷變動(dòng)的。參考文獻(xiàn)[9]中提出基于Cournot博弈的次用戶頻譜分配模型,目前,有很多工作基于該文獻(xiàn)進(jìn)行改進(jìn),如在次用戶的頻譜分配中考慮了頻譜差異性對(duì)次用戶的影響[10],考慮頻譜拍賣的多買家、多賣家博弈模型[11]等。在以上模型中,都沒(méi)有考慮到主用戶的頻譜價(jià)格函數(shù)受到主用戶和次用戶之間的頻譜供需關(guān)系的影響。
本文用博弈論方法解決認(rèn)知無(wú)線電網(wǎng)絡(luò)中的動(dòng)態(tài)頻譜分配問(wèn)題,將次用戶的頻譜分配模型轉(zhuǎn)換為相應(yīng)的博弈論模型,在完全信息和不完全信息環(huán)境下,分別用靜態(tài)博弈和動(dòng)態(tài)博弈對(duì)次用戶的頻譜分配進(jìn)行分析,并考慮了頻譜可置換參數(shù)v對(duì)次用戶納什均衡以及動(dòng)態(tài)博弈穩(wěn)定性的影響,最后給出改進(jìn)博弈模型的仿真分析結(jié)果。
在認(rèn)知網(wǎng)絡(luò)中,認(rèn)知用戶能夠伺機(jī)利用授權(quán)用戶的空閑頻譜。當(dāng)授權(quán)用戶重新占用該頻譜時(shí),認(rèn)知用戶需要切換到其他授權(quán)用戶的空閑頻譜上進(jìn)行通信。文中考慮有M個(gè)授權(quán)用戶和N個(gè)次用戶的模型,每個(gè)授權(quán)用戶擁有一個(gè)授權(quán)頻譜,授權(quán)用戶的頻譜占用情況會(huì)隨著時(shí)間及其空間變化而發(fā)生變化。次用戶的行為是自私、理性的,次用戶為了最大化自己的效用相互競(jìng)爭(zhēng)并最終達(dá)到納什均衡。納什均衡點(diǎn)即為次用戶的最佳頻譜分配結(jié)果。如圖1所示,基站把所有主用戶的空閑頻譜匯聚成一個(gè)頻譜池,將頻譜池中的頻譜劃分為若干個(gè)子信道,子信道是頻譜分配的基本單位。主用戶以每單位帶寬價(jià)格p向次用戶收費(fèi),p是頻譜價(jià)格函數(shù),與主用戶提供的頻譜數(shù)量以及次用戶的頻譜需求數(shù)量有關(guān)。
通過(guò)采用自適應(yīng)調(diào)制編碼(AMC)技術(shù),次用戶可以根據(jù)信道質(zhì)量情況動(dòng)態(tài)調(diào)整傳輸速率從而適應(yīng)周圍的環(huán)境。采用正交幅度調(diào)制技術(shù)(如4-QAM和16-QAM),在單輸入單輸出高斯信道噪聲中誤碼率可以近似為:示接收機(jī)信噪比,k為所用調(diào)制方式的頻帶利用率。不失一般性,設(shè)頻帶利用率為非負(fù)實(shí)數(shù)。為了滿足特定的應(yīng)用需求,BER需要維持在一個(gè)目標(biāo)水平(即目標(biāo)誤碼率BERtar),次用戶i頻譜傳輸效率為:ki=log2(1+Kγ)。其中K為一個(gè)常
首先假定所有次用戶都知道其他次用戶在博弈中所采取的策略以及各自的效用函數(shù)信息,并用靜態(tài)博弈模型分析次用戶的行為。然而,由于在實(shí)際的認(rèn)知無(wú)線電網(wǎng)絡(luò)中,次用戶并不知道或只知道一部分次用戶的策略和效用信息,次用戶需要不斷調(diào)整自己的策略從而使自身的策略達(dá)到最優(yōu),因此,用動(dòng)態(tài)博弈模型對(duì)次用戶的策略調(diào)整行為進(jìn)行分析。
在上面的系統(tǒng)模型中,博弈的參與者是次用戶,策略是次用戶的頻譜請(qǐng)求大小,用bi表示,每個(gè)策略用戶的效用函數(shù)與它所獲得的總收益以及成本有關(guān),用Ui表示。對(duì)參考文獻(xiàn)[9]中的頻譜價(jià)格函數(shù)進(jìn)行改進(jìn),在主用戶對(duì)頻譜價(jià)格滿意的基礎(chǔ)上,考慮了頻譜價(jià)格受到頻譜供需關(guān)系的影響,即與主用戶空閑頻譜的數(shù)量以及次用戶的頻譜需求相關(guān)。頻譜價(jià)格函數(shù)為:
其中,w為主用戶單位頻譜的成本價(jià)格,N為次用戶的數(shù)量;M為主用戶的數(shù)量;τ為非負(fù)常數(shù),當(dāng) τ≥1時(shí),頻譜價(jià)格函數(shù)是凸的;bi為次用戶i的頻譜請(qǐng)求;qj為主用戶j的空閑頻譜。
次用戶的效用函數(shù)選擇不是唯一的,本文要保證頻譜分配算法能夠達(dá)到均衡收斂。根據(jù)參考文獻(xiàn)[10]中給出的二次效用函數(shù)做出適當(dāng)修改如下:
其中,ri為次用戶i單位傳輸速率獲得的收益,ki為次用戶i的頻譜傳輸效率,B為所有次用戶的策略集合,B={b1,b2,…,bN},c 為一常量。
效用函數(shù)中考慮了頻譜置換參數(shù) v,v∈(-1,1)。當(dāng)v=0時(shí),次用戶不能發(fā)生切換;當(dāng)v=1時(shí),次用戶可以在工作頻段自由切換;當(dāng)v<0時(shí),次用戶共享的頻譜是互補(bǔ)的,即當(dāng)一個(gè)次用戶使用一段頻譜時(shí),它需要同時(shí)購(gòu)買一個(gè)或多個(gè)額外的頻譜(也就是說(shuō),一段頻譜用于上行鏈路傳輸,另一段用于下行鏈路傳輸,這些頻譜可能來(lái)自同一個(gè)主用戶或不同主用戶的頻譜)。
根據(jù)式(3)中得到的效用函數(shù),將次用戶i的效用函數(shù)對(duì)bi求偏導(dǎo),即可得到次用戶i的邊緣收益函數(shù):
令邊緣收益函數(shù)等于0,即可求得次用戶i的最佳響應(yīng)函數(shù)為:
B-i表示除次用戶i之外所有次用戶的策略集合,當(dāng)且僅當(dāng)bi*=BRi(),?i,次用戶的博弈達(dá)到納什均衡,納什均衡解為 B*=,…,),表示除次用戶 i之外所有次用戶的最佳策略組結(jié)合。
其中,bi(t)為次用戶 i在時(shí)刻 t的頻譜請(qǐng)求,αi為次用戶i的速率調(diào)整參數(shù)(即學(xué)習(xí)速率)。當(dāng)bi(t+1)=bi(t)時(shí),次用戶的動(dòng)態(tài)博弈達(dá)到均衡,此時(shí),次用戶的策略不再發(fā)生變化。
由于在實(shí)際的認(rèn)知無(wú)線電環(huán)境中,次用戶只能觀察到主用戶的頻譜定價(jià)信息,并不知道其他次用戶所采取的策略以及它們的效用信息,所以每個(gè)次用戶只能根據(jù)歷史博弈信息選擇自己的策略。這意味著,次用戶采用分布式算法動(dòng)態(tài)調(diào)整自己的頻譜請(qǐng)求大小并最終達(dá)到納什均衡。在這種不完全信息的情況下,次用戶需要不斷調(diào)整自己的策略從而使得自身的策略達(dá)到最優(yōu)。次用戶的頻譜請(qǐng)求可以用動(dòng)態(tài)博弈來(lái)描述:
在動(dòng)態(tài)博弈算法中,次用戶之間的博弈最終將達(dá)到納什均衡,納什均衡的穩(wěn)定性與學(xué)習(xí)速率αi有關(guān)。通過(guò)使用雅克比矩陣和本征值的概念,可以研究文中提出的動(dòng)態(tài)博弈算法的穩(wěn)定性。當(dāng)所有的本征值(λi)都位于單位圓內(nèi)時(shí)(|λi|<1),博弈的結(jié)果是穩(wěn)定的。
雅克比矩陣定義如下:
假定有兩個(gè)次用戶存在的情況下,通過(guò)求解下面方程得到雅克比矩陣的本征值:
文中假設(shè)在一個(gè)認(rèn)知無(wú)線電系統(tǒng)中有4個(gè)空閑的主用戶頻譜和多個(gè)次用戶,每個(gè)主用戶擁有的頻譜為6 MHz。主用戶單位頻譜的成本價(jià)格w為5,目標(biāo)誤碼率BERtar為 10-4,采用線性定價(jià),參數(shù) τ設(shè)置為 1,c為 0.5,次用戶每單位傳輸速率所獲得收益為ri=10,?i。
圖2是兩個(gè)次用戶的最佳響應(yīng)函數(shù)曲線,一個(gè)次用戶的最佳響應(yīng)是其他次用戶策略的線性函數(shù),納什均衡點(diǎn)位于次用戶最佳響應(yīng)函數(shù)曲線的交叉點(diǎn)。
圖中納什均衡點(diǎn)的位置與信道質(zhì)量有關(guān),信道質(zhì)量越好,次用戶的效用越大,頻譜需求也越大。由于次用戶之間是自私的并相互競(jìng)爭(zhēng)頻譜,所以,一個(gè)次用戶的信道質(zhì)量的好壞會(huì)影響其他次用戶的策略。當(dāng)一個(gè)次用戶的信道質(zhì)量變好時(shí),它希望得到的頻譜更多。而在實(shí)際的認(rèn)知無(wú)線電系統(tǒng)中,主用戶的空閑頻譜是有限且隨時(shí)間發(fā)生變化的,所以,次用戶之間的頻譜競(jìng)爭(zhēng)會(huì)更加激烈從而影響它們所采取的策略。
圖3中顯示了在次用戶1的信道質(zhì)量一定的情況下,次用戶1和次用戶2的效用與次用戶2的信道質(zhì)量相關(guān),隨著次用戶2的信噪比不斷增加,次用戶2的信道質(zhì)量越好得到的頻譜會(huì)越多,因此次用戶的收益會(huì)隨著次用戶2的信噪比的增加而增加。由于次用戶1與次用戶2之間是競(jìng)爭(zhēng)的關(guān)系,次用戶2得到的頻譜越多,次用戶1得到的頻譜相應(yīng)就會(huì)減小,因此,次用戶1的收益會(huì)隨著次用戶2信噪比的增加而隨之減小。
在實(shí)際的認(rèn)知無(wú)線電中,由于次用戶的策略和效用等信息相互之間不知曉,次用戶根據(jù)歷史博弈信息動(dòng)態(tài)調(diào)整自己的策略并最終收斂到納什均衡。圖4顯示了次用戶策略的動(dòng)態(tài)調(diào)整過(guò)程。從圖中可以看出,動(dòng)態(tài)博弈算法的收斂性與學(xué)習(xí)速率αi有關(guān),設(shè)置合適的學(xué)習(xí)速率可以使博弈快速收斂到納什均衡,當(dāng)學(xué)習(xí)速率過(guò)大時(shí),次用戶的策略波動(dòng)很大,甚至不能達(dá)到納什均衡。當(dāng)α1=α2=0.15時(shí),次用戶1和次用戶2的策略能夠較快地收斂到納什均衡,而當(dāng)α1=α2=0.22時(shí),次用戶1和次用戶2的策略一直上下波動(dòng),不能較快收斂到納什均衡。圖5顯示了多個(gè)次用戶存在時(shí)動(dòng)態(tài)博弈的收斂情況,可以得出,當(dāng)次用戶的數(shù)量增加時(shí),每個(gè)次用戶得到的頻譜數(shù)量減少,博弈達(dá)到收斂的時(shí)間隨之增加。
圖6和圖7分別從頻譜利用率和次用戶收斂到納什均衡的時(shí)間與參考文獻(xiàn)[9]的博弈算法進(jìn)行比較,不難得出,本文提出的算法的頻譜利用率高于參考文獻(xiàn)[9]中的算法,并且能夠更快收斂到納什均衡。這里的頻譜利用率定義為認(rèn)知無(wú)線電系統(tǒng)中所有次用戶得到的總頻譜與所有主用戶的空閑頻譜之比。
根據(jù)式(7)中得到的雅克比矩陣本征值,可以得到α1與α2之間的關(guān)系。從圖8中可知頻譜置換型參數(shù)ν對(duì)穩(wěn)定區(qū)域的影響:ν值越大,次用戶動(dòng)態(tài)博弈的穩(wěn)定區(qū)間越小,穩(wěn)定區(qū)域指的是α1與α2之間的關(guān)系曲線和坐標(biāo)軸之間所圍成的區(qū)間。圖9顯示了穩(wěn)定區(qū)間還與信道質(zhì)量有關(guān),信道質(zhì)量越好,穩(wěn)定區(qū)域會(huì)越小。當(dāng)α1與α2在穩(wěn)定區(qū)間內(nèi)取值時(shí),次用戶間的頻譜共享是穩(wěn)定的并最終可以達(dá)到納什均衡,而在區(qū)間外取值時(shí),次用戶的策略會(huì)上下波動(dòng)進(jìn)而導(dǎo)致無(wú)法收斂到納什均衡。
文中提出了一種改進(jìn)的基于博弈論的動(dòng)態(tài)頻譜分配方案,考慮了存在多個(gè)主用戶和次用戶共享頻譜的情形,在保證不對(duì)主用戶產(chǎn)生干擾的前提下,利用Cournot博弈模型對(duì)次用戶間的競(jìng)爭(zhēng)頻譜行為進(jìn)行了分析。改進(jìn)了現(xiàn)有的頻譜定價(jià)函數(shù),并在次用戶的效用函數(shù)中考慮了頻譜置換參數(shù)v。最后分別用靜態(tài)博弈和動(dòng)態(tài)博弈分析了次用戶的頻譜分配行為。通過(guò)仿真驗(yàn)證證明,次用戶的策略能較快收斂到納什均衡,并且頻譜利用率有一定的提高。
[1]MITOLA J.Cognitive radio for flexible multimedia communications.in Proc.MoMuC’99,1999:3-10.
[2]FUDENBERG D,TIROLE J.GAME T.Mit Press,1991.
[3]MOHAMMADIAN H S,ABOLHASSANI B.Optimal quality competition for spectrum sharing in cognitive radio networks[C].Electrical Engineering(ICEE),2010:231-236.
[4]Zu Yunxiao,Li Peng.Study on spectrum allocation of primary users for cognitive radio based on game theory[C].in IEEE WiCOM.2010:1-4.
[5]譚學(xué)治,劉玉濤,魏守明.基于博弈理論的認(rèn)知無(wú)線電頻譜分配[J].華南理工大學(xué)學(xué)報(bào),2010(5):22-26.
[6]NIYATO D,HOSSAIN E.Competitive pricing for spectrum sharing in cognitive radio networks:dynamic game,inefficiency of nash equilibrium and collision[J].IEEE Journal on Selected Areas in Communications,2008,26(1):192-202.
[7]He Shibiao,Zhang Xinchun,Ge Lijia,et al.Research of dynamic spectrum allocation based on service demand[C].in IEEE NSWCTC,2010:348-351.
[8]Lin Peng,Jia Juncheng,Zhang Qia.Mounir ham di dynamic spectrum sharing with multiple primary and secondary users[J].in IEEE Transactions on,2011(60):1756-1765.
[9]NIYATO D,HOSSAIN E.Competitive spectrum sharing in cognitive radio networks:a dynamic game approach[J].IEEE Transaction on Wireless Transaction on Wireless Communications,2008,7(7):2651-2660.
[10]Zhang Xinchun,He Shibiao,Sun Jiang.A game algorithm of dynamic spectrum allocation based on spectrum difference[C].in IEEE WOCC,2010:1-4.
[11]NIYATO D,HOSSAIN E,HAN Z.Dynamics of multipleseller and multiple-buyer spectrum trading in cognitive radio networks:a game-theoretic moeling approach[J].Mobile Computing,IEEE Transactions on,2009,8(8):1009-1022.