劉愛(ài)民 曾凡仔 陳嘉貝
摘要:隨著認(rèn)知無(wú)線電(CR)技術(shù)的發(fā)展,協(xié)作認(rèn)知無(wú)線電網(wǎng)絡(luò)(CCRN)成為提高頻譜利用效率和解決頻譜稀缺問(wèn)題的有效途徑。而且,無(wú)線通信系統(tǒng)中的過(guò)度能量消耗已變得越來(lái)越重要。能量采集(EH)被認(rèn)為是緩解此類問(wèn)題的有效解決方案。然而,由于自然能量的隨機(jī)性和間斷性,從自然能源采集的能量不能保證EH網(wǎng)絡(luò)中令人滿意的服務(wù)質(zhì)量(QoS)?;旌夏茉垂?yīng)已經(jīng)成為解決不穩(wěn)定電力供應(yīng)問(wèn)題的一種新模式,這意味著,這樣的網(wǎng)絡(luò)是由固定電源能量和采集能量共同提供動(dòng)力。提出了一種新的混合能量供應(yīng)認(rèn)知無(wú)線電網(wǎng)絡(luò)協(xié)作頻譜租借方案。主用戶(PU)雇傭次用戶(SUs)作為協(xié)作中繼,SUs通過(guò)從PU的RF信號(hào)中采集的能量來(lái)幫助PU傳輸數(shù)據(jù),作為回報(bào),PU授予SU接入信道的權(quán)利。PU的目標(biāo)是通過(guò)與SUs合作來(lái)最大化其收益并節(jié)約自身能源,而SU旨在最大化其吞吐量和能源利用率。將此模式制定為Stackelberg博弈。最后,通過(guò)遺傳算法解決了PU和SU在定價(jià)和頻譜租借中的最優(yōu)策略問(wèn)題。
關(guān)鍵詞:認(rèn)知無(wú)線電;協(xié)作頻譜租借;斯坦克爾伯格博弈;能量采集;遺傳算法
中圖分類號(hào):TP393.1
文獻(xiàn)標(biāo)識(shí)碼:A
認(rèn)知無(wú)線電已經(jīng)作為非授權(quán)次用戶(SU)動(dòng)態(tài)地接入主用戶(PU)的授權(quán)頻譜以提高頻譜利用率的一種手段。它被設(shè)計(jì)成一個(gè)具有觀察,推理,決定和合作能力的智能無(wú)線電[1-2]。近年來(lái),協(xié)作認(rèn)知無(wú)線電網(wǎng)絡(luò)(CCRN)這樣一種新型認(rèn)知無(wú)線電模式被廣泛應(yīng)用[3]。在CCRN中,PU雇傭若干SU作為中繼幫助PU傳輸數(shù)據(jù)并且給他們部分頻譜資源接入時(shí)間作為回報(bào)。這樣的一種合作模式導(dǎo)致的結(jié)果就是,PU不僅可以獲得顯著的效益,SU也有機(jī)會(huì)傳輸自己的數(shù)據(jù),從而實(shí)現(xiàn)“雙贏”。
盡管傳統(tǒng)的CCRN框架既可以使PU和SU都受益,但仍然存在效率低等弊端。近年的研究主要考慮鏈路層頻譜租賃,并假設(shè)主網(wǎng)絡(luò)中只有一條鏈路,例如[3-4]。在現(xiàn)實(shí)世界的系統(tǒng)中,網(wǎng)絡(luò)通常由多個(gè)用戶和多個(gè)鏈路組成,頻譜租借在網(wǎng)絡(luò)層面上才能更好地進(jìn)行。并且,在未來(lái),動(dòng)態(tài)頻譜共享模式最有可能是具有多個(gè)PU和SU的二級(jí)頻譜市場(chǎng)。在同一地理位置,不同的PU在不同的授權(quán)頻段上運(yùn)行,并面臨越來(lái)越多的SU要求頻譜租借的事實(shí)。當(dāng)然,每個(gè)用戶都是理性和自私的,他們只關(guān)心自己的回報(bào),并始終遵循最佳策略,從而最大化他們的效用。
使用合作多樣性來(lái)提高認(rèn)知無(wú)線電網(wǎng)絡(luò)的性能引起了廣泛的關(guān)注。其中一類工作的重點(diǎn)在SU之間的合作以改善次級(jí)網(wǎng)絡(luò)(SN)的性能,如[5-6]。另一個(gè)CCRN的重點(diǎn)是PU和SU之間的合作溝通。
考慮具有一對(duì)主收發(fā)器和多對(duì)次收發(fā)器的CR系統(tǒng),其以時(shí)隙模式操作。文獻(xiàn)[7,8]均考慮了多中繼的合作模式,文中同樣采用文獻(xiàn)[7,8]提到的MRC技術(shù),最大比合并(MRC)是分集合并技術(shù)中的最優(yōu)選擇,相對(duì)于選擇合并和等增益合并可以獲得最好的性能。波束成形技術(shù)近年來(lái)在多天線、多用戶的網(wǎng)絡(luò)模型中應(yīng)用廣泛[9,10],其目的主要是通過(guò)編碼信號(hào)來(lái)防止信號(hào)之間的干擾,在本文中,我們同樣也用到這樣的技術(shù),使主用戶和次用戶之間信號(hào)傳輸不會(huì)相互影響。由于從自然能源收集的能量動(dòng)力和能量?jī)?chǔ)存能力有限,這種能源可能無(wú)法保證為SU提供足夠的電力供應(yīng)。在模型中,SU發(fā)射機(jī)主要從PU的相對(duì)穩(wěn)定的RF信號(hào)采集的能量供電,即,SU發(fā)射機(jī)具有混合電源。在這樣的網(wǎng)絡(luò)中,如果SU的電池中存儲(chǔ)了足夠的綠色能源,則SU采用采集的能源。最大限度地利用綠色能源來(lái)優(yōu)化這種網(wǎng)絡(luò)中的能源利用,從而節(jié)省固定能源的消耗。頻譜感知和SU的預(yù)期吞吐量之間的基本平衡已經(jīng)在[11]中進(jìn)行了深入分析,重點(diǎn)在時(shí)間維度上的資源分配以及研究最優(yōu)感知持續(xù)時(shí)間以最大化SU實(shí)現(xiàn)的吞吐量不低于預(yù)定義的檢測(cè)級(jí)別。受到了[11]的啟發(fā),本文中,主要關(guān)注PU和SU的吞吐量以及效用值。這項(xiàng)工作的主要工作總結(jié)如下:
1.提出了一種新型的CCRN系統(tǒng)架構(gòu)。研究一個(gè)PU和多個(gè)SU的情況。為了使SU能夠獲取更強(qiáng)的信號(hào),運(yùn)用了波束成形的設(shè)計(jì)。然后將這一模型放人在Stackelberg博弈框架下分析問(wèn)題。最優(yōu)策略也將由Stackelberg博弈均衡得到。
2.考慮如何用PU頻譜接人時(shí)間的一部分來(lái)激勵(lì)給SU,如何確定租賃價(jià)格以最大化其效用,如何激勵(lì)SU作為合作中繼,并確定最優(yōu)合作策略,以及如何為PU和SU節(jié)省能源。
3.由于直接求解最優(yōu)策略相對(duì)復(fù)雜,設(shè)計(jì)了一種遺傳算法求解博弈均衡,之后,還設(shè)計(jì)了一個(gè)迭代算法實(shí)現(xiàn)Stackelberg博弈的最優(yōu)策略。
其余部分安排如下。在第二節(jié)中,詳細(xì)描述了系統(tǒng)模型。在第三節(jié)中,確定了效用最大化問(wèn)題。第四節(jié)中將用Stackelberg博弈來(lái)獲得最優(yōu)策略。第五節(jié)中將會(huì)介紹本文中用到的兩個(gè)相關(guān)算法,數(shù)值仿真結(jié)果以及結(jié)果分析在第六節(jié)中給出。最后在第七節(jié)得出結(jié)論。
1 系統(tǒng)模型
考慮的認(rèn)知無(wú)線電網(wǎng)絡(luò),它由一對(duì)主收發(fā)器和多個(gè)次收發(fā)器組成,并且它們都以時(shí)隙模式工作。
在本文中考慮了協(xié)作頻譜租借模式,也就是說(shuō),只要有數(shù)據(jù)要發(fā)送,PU就優(yōu)先使用授權(quán)頻譜。假設(shè)在每個(gè)時(shí)隙中,都有一定數(shù)量的數(shù)據(jù)存儲(chǔ)在其緩沖區(qū)中。主傳輸完成后,授權(quán)頻譜的狀態(tài)變?yōu)榭臻e狀態(tài)。此外,PU知道SU的存在,并且為了從SU得到回報(bào),一旦許可信道空置,PU允許沒(méi)有頻譜資源的SU接入頻譜并且發(fā)送SU的數(shù)據(jù)。在這種情況下,為了贏得數(shù)據(jù)傳輸?shù)臋C(jī)會(huì),SU可以選擇等到主傳輸完成或作為中繼來(lái)縮短主傳輸時(shí)間。
由于自然能源的間歇性和動(dòng)態(tài)性,收集的能量并不穩(wěn)定,不夠支持整個(gè)傳輸過(guò)程,因此在的工作中,考慮混合能源供應(yīng)的網(wǎng)絡(luò)。在這個(gè)框架中,不是從動(dòng)態(tài)的自然能源采集能量,而是在PU正在傳輸其數(shù)據(jù)時(shí),SU從更穩(wěn)定的RF信號(hào)中采集能量。SU大量使用采集的能量,當(dāng)采集的能量太少以至不能支持整個(gè)通信過(guò)程時(shí),SU可以使用固定電源來(lái)確保穩(wěn)定的傳輸。我們還假定SU的收發(fā)器中只有一個(gè)天線,遵循save-then-transmit協(xié)議。在每個(gè)時(shí)隙中,次用戶首先使用一部分時(shí)間進(jìn)行能量采集,然后盡量使用采集的能量進(jìn)行中繼和自身數(shù)據(jù)傳輸,當(dāng)采集的能量不足以支持通信時(shí),則切換到固定電源。本文中PU和SU之間的協(xié)作通信采用了解碼轉(zhuǎn)發(fā)(DF)協(xié)議。
如圖1一圖4所示,文中無(wú)線通信過(guò)程共有四個(gè)步驟。也就是說(shuō),如圖5所示,我們模型中的一個(gè)時(shí)隙被分成四個(gè)部分用于兩種不同類型的用戶,具體描述如下:
1.時(shí)間段(0,pT):當(dāng)PU將其數(shù)據(jù)直接從主發(fā)射器( PT)發(fā)射到主接收器(PR)時(shí),ST,可以同時(shí)從PU的RF信號(hào)獲取能量。在此期間表示ST,收獲能量為:
其中,pT表示整個(gè)時(shí)間幀的一部分,0≤p≤1。PT在(0,pT]時(shí)間段內(nèi)將數(shù)據(jù)直接發(fā)送給PR,同時(shí),SU能從PT相對(duì)穩(wěn)定的RF信號(hào)中采集到能量。我們用來(lái)Xi表示STi的能量采集速率,即單位時(shí)間內(nèi)采集的能量,只從PU的RF信號(hào)中獲取能量,RF信號(hào)相對(duì)穩(wěn)定,所以可以假定在整個(gè)幀持續(xù)時(shí)間內(nèi)能量采集速率是恒定的,但是在不同幀內(nèi),不同的采集速率是不一樣的。假設(shè)PU數(shù)據(jù)率為,PU以功率直接傳輸其數(shù)據(jù)給PR。根據(jù)香農(nóng)定理,其功率與傳輸速率的關(guān)系可以表述如下:
PU和SU采用合作傳輸模式的前提條件是協(xié)作傳輸速率Pps(S)應(yīng)該大于直接傳輸速率Rpu,所以信道增益hps,i應(yīng)該大于hpp。在這種情況下,PU的數(shù)據(jù)采用直接傳輸本可以在一個(gè)時(shí)隙中完成,合作模式下有SUs作為中繼來(lái)轉(zhuǎn)發(fā)縮短了主數(shù)據(jù)的傳輸時(shí)間,這就確保了SU可以贏得傳輸機(jī)會(huì)。
一旦STi解碼了數(shù)據(jù),它就可以從其它STj的RF信號(hào)中獲取能量。每個(gè)STi所需要的接收解碼數(shù)據(jù)時(shí)間可以表示為:
3.時(shí)間段:在這段時(shí)間內(nèi)扮演中繼的角色,以最大功率轉(zhuǎn)發(fā)原始剩余數(shù)據(jù)到PR,其數(shù)據(jù)傳輸速率為。參考文獻(xiàn)[8]對(duì)多中繼SNR的處理方式,假設(shè)接收機(jī)在解碼信號(hào)之前利用最大比率組合(MRC),則PR處的有效SNR等于來(lái)自所有的SNR的總和。協(xié)作鏈路可達(dá)到的傳輸速率為:
2 問(wèn)題分析
在本節(jié)中,將介紹一種基于效用的合作頻譜租借機(jī)制。用戶在系統(tǒng)中的效用值與其吞吐量以及能效有關(guān)。一方面,PU雇傭SU作為中繼來(lái)最大化頻譜租借費(fèi)用并節(jié)約自身能量。另一方面,SU旨在通過(guò)與PU合作并通過(guò)從PU的RF信號(hào)收集能量來(lái)最小化固定能源消耗并盡可能提高其吞吐量。
3 最優(yōu)頻譜租借策略
根據(jù)以上分析,可以把該優(yōu)化問(wèn)題建模成斯坦科爾博格博弈。在系統(tǒng)模型中,主用戶是頻譜的授權(quán)使用者,對(duì)頻譜具有絕對(duì)的優(yōu)先使用權(quán),因此主用戶作為斯坦科爾博格博弈的領(lǐng)導(dǎo)者,次用戶作為跟隨者。目的就是要得到斯坦科爾博格博弈的均衡,即領(lǐng)導(dǎo)者與跟隨者均達(dá)到一個(gè)最優(yōu)狀態(tài),均不會(huì)試圖偏離這個(gè)均衡點(diǎn)[12]?;谝陨系姆治?,可以將最優(yōu)頻譜租借策略表述為:
4.1 遺傳算法
借鑒生物進(jìn)化理論,將遺傳算法需要解決的問(wèn)題建模為生物進(jìn)化過(guò)程,通過(guò)復(fù)制,交叉,變異等操作產(chǎn)生下一代解,逐步淘汰適應(yīng)度低的個(gè)體,遺傳適應(yīng)度高的個(gè)體。N代演化以后就能得到相應(yīng)的最優(yōu)個(gè)體。
在模型中,當(dāng)求解最優(yōu)策略ρ時(shí),使用八位二進(jìn)制數(shù)編碼ρ,因?yàn)閜的值范圍為[0,1],所以求得的ρ值可以精確到小數(shù)點(diǎn)后兩位,實(shí)驗(yàn)種群是由四組編碼的ρ組成。由于的目標(biāo)是找到PU的最大效用函數(shù)值,將適應(yīng)度函數(shù)設(shè)置為PU的效用值。當(dāng)適應(yīng)度值越大時(shí),下一代被遺傳下來(lái)的機(jī)會(huì)就越大。
同樣的,在計(jì)算SU,的最大效用值和相應(yīng)的ci時(shí),由于ci也是一個(gè)有限的值,同樣可以把ci編碼并且產(chǎn)生初始種群,然后進(jìn)行一系列的復(fù)制,交叉,變異等操作求得最優(yōu)效用值和對(duì)應(yīng)的ci。
4.2 迭代算法
該迭代算法包括多次用戶和主用戶之間的相互影響更新。緩存的初始狀態(tài)設(shè)置方法有許多方法,例如通過(guò)歷史經(jīng)驗(yàn)設(shè)置初始狀態(tài)值(ρ,c0,cl,…)或者設(shè)置為0然后主用戶和次用戶可以按照上述迭代算法進(jìn)行不斷更新最佳策略,直到收斂。
從圖中可以看出價(jià)格和頻譜接入時(shí)間分配策略對(duì)主次用戶的效用具有很大的影響。
圖9和圖10展示了SU的數(shù)量對(duì)PU和SU,效用的影響。圖9和圖10中的“非協(xié)作模式”意味著PU不會(huì)將頻譜租給任何SU,也就是說(shuō),這意味著p等于零,并且SU支付給PU的等于零。從數(shù)值仿真圖上可以看出,與非合作模式相比,合作模式下的PU和SUs獲得了更高的效用值。但是,隨著SU數(shù)量的增加,為了獲得更多的時(shí)間用于接入頻譜,SU的競(jìng)爭(zhēng)變大,導(dǎo)致每個(gè)SU的效用下降,但是PU和整個(gè)網(wǎng)絡(luò)的效用依舊增加。在非合作模式下,每個(gè)SU在整個(gè)過(guò)程中收集來(lái)自PT的RF信號(hào),并且在該模式下,PT以廣播的形式發(fā)送信號(hào),因此SU,的效用與SU的數(shù)量多少無(wú)關(guān)。
6 結(jié)論
提出了一個(gè)協(xié)作通信頻譜租借模型,通過(guò)定價(jià)和頻譜接人時(shí)間分配策略來(lái)最大化主用戶和次用戶的效用,該主用戶為了增加收益而將一些頻譜接入時(shí)間租用給次用戶,并且利用次發(fā)射機(jī)作為用于主數(shù)據(jù)傳輸?shù)闹欣^。將主用戶和次用戶之間的頻譜共享建模為Stackelberg博弈,并通過(guò)智能算法求解出頻譜接人時(shí)間分配和頻譜定價(jià)的最佳策略。數(shù)值分析表明,在這種合作頻譜租賃和能量采集方案下,存在一個(gè)最優(yōu)策略可以使PU和SUs的效用最大化。
參考文獻(xiàn)
[1]
HU S, YAO Y D,YANC Z.MAC protocol identification approachfor implement smart cognitive radio[C]//IEEE Intemational Con-ference on Communications, IEEE, 2012:5 608-5612.
[2] HU S,YAO Y D,YANG Z.MAC protocol identification usingsupport vector machines for cognitive radio networks [J]. IEEEWireless Communications, 2014, 21(1 ):52-60.
[3] SIMEONE 0,STANOJEV I, SAVAZZI S,et al.Spectrum leasingto cooperating secondary Ad Hoc networks[J].Selected Areas inCommunic ations IEEE Journal, 2008, 26(1):203-213.
[4] ZHANG J, ZHANG Q. Stackelberg game for utility-based cooper-ative cognitiveradio networks[C]//ACM Interational Symposiumon Mobile Ad Hoc NETWORKINC and Computing, MOBIHOC2009, New Orleans, La, Usa, May.DBIP, 2009:23-32.
[5] JIA J,ZHANC J,ZHANG Q.Relay-assisted routing in cognitiveradio networks[J]Inform.IEEE, 2009:1-5.
[6] JIA J, ZHANC J,ZHANG Q. Cooperative relay for cognitive radi。
networks[C]//INFOCOM. IEEE, 2009:2304-2312.
[7]
WANG X,WANG Y,ZHANG Y,et al.Approximate analysis onuplink sum rate with MRC receivers in massive MIMO systems[C]//International Symposium on Wireless Personal MultimediaCommunications,IEEE, 2017.
[8]
HO-VAN K.Exact outage probability analysis of proactive relayselection in cognitive radio networks with MRC receivers[J].Joumal of Communications&Networks, 2016,18(3):288-298.
[9]
SHENG Z, TUAN H D,DUONG T Q,etd.Optimal beamformingfor physical layer security in MISO wireless networks [J]. IEEETransactions on Signal Processing, 2018:12-20.
[10] BANERJEE S,DWIVEDI V V.Comparative analysis of adaptivebeamforming techniques [J]. Progress in Intelligent ComputingTechniques: Theory, Practice, and Applications, 2017: 357-364.
[11] LIANG Y C,ZENG Y,PEH E C Y,et al.Sensing-throughputtradeoff for cognitive radio networks [J]. Wireless Communica-tions IEEE Transactions on, 2008, 7(4):1326-1337.
[12] FAHIMI M,GHASEMI A.Joint spectrum load balancing andhandoff management in cognitive radio networks:a non-coopera-tive game approach[J]. Wireless Networks, 2016, 22(4):1161- 1180.
[13] SHENF, LID, LINPH,etd.Auction based spectrum sharing for hybrid access in macro -femtocell networks under QoS require-ments[C]//IEEE Intemational Conference on Cormuunications,IEEE, 2015:3335-3340.