李湘魯,侯 冬,田 杰
(1.中國(guó)工程物理研究院 電子工程研究所, 四川 綿陽(yáng) 621900;2.電子科技大學(xué) 自動(dòng)化工程學(xué)院,成都 611731)
數(shù)十年來(lái),無(wú)線(xiàn)網(wǎng)絡(luò)技術(shù)得到了空前發(fā)展,通信終端規(guī)模和無(wú)線(xiàn)數(shù)據(jù)業(yè)務(wù)量也呈現(xiàn)井噴式增長(zhǎng),頻譜資源日漸稀缺,頻譜分配飽和與頻譜利用率低下也亟待解決。認(rèn)知無(wú)線(xiàn)網(wǎng)絡(luò)(CRN,cognitive radio network)技術(shù)允許多個(gè)次用戶(hù)(SU,secondary user)通過(guò)頻譜感知來(lái)探測(cè)授權(quán)頻譜上主用戶(hù)(PU,primary user)的活動(dòng)性,利用動(dòng)態(tài)頻譜接入(DSA,dynamic spectrum access)來(lái)提高頻譜利用率,在保證PU通信的前提下增加SU網(wǎng)絡(luò)傳輸?shù)臉I(yè)務(wù)種類(lèi)和質(zhì)量[1-2]。其中,干擾管理的功率控制、吞吐量?jī)?yōu)化及能量?jī)?yōu)化問(wèn)題得到廣泛關(guān)注。
單跳認(rèn)知無(wú)線(xiàn)Ad hoc網(wǎng)絡(luò)(CRAHN,cognitive radio ad hoc network)并發(fā)通信場(chǎng)景由PU系統(tǒng)和SU系統(tǒng)組成。其中,PU對(duì)授權(quán)頻段具有絕對(duì)優(yōu)先使用權(quán),以一定概率隨機(jī)使用授權(quán)頻段信道;而各SU組成的分布式網(wǎng)絡(luò),缺乏中心設(shè)施的統(tǒng)一資源調(diào)度,各節(jié)點(diǎn)發(fā)射機(jī)的不同功率等級(jí)將對(duì)網(wǎng)絡(luò)系統(tǒng)帶來(lái)不同性能影響和網(wǎng)內(nèi)干擾效果。因此,多個(gè)SU節(jié)點(diǎn)需通過(guò)分布式功率控制方法在最大化提高頻譜效率(SE,spectrum efficiency)同時(shí)減輕網(wǎng)內(nèi)干擾。CRAHN中的SU主要采用交織(interweave)、覆蓋(overlay)和重疊(underlay)模式來(lái)訪(fǎng)問(wèn)授權(quán)頻譜[1]。在Underlay模式下,SU可使用不超過(guò)干擾閾值的功率與PU進(jìn)行數(shù)據(jù)并行傳輸[2]。在Overlay模式下假設(shè)PU與SU間存在良好合作關(guān)系,SU需要進(jìn)行頻譜感知并同時(shí)服務(wù)自己與PU的通信業(yè)務(wù)[3-4]。在Interweave模式下,SU同樣使用頻譜感知探測(cè)頻譜空洞,但SU網(wǎng)絡(luò)獨(dú)立通信、不需要將額外能量消耗在協(xié)助PU上[4]。
CRAHN中的SU系統(tǒng)一般包含多個(gè)ST(second-user transmitter)到SR(second-user receiver)的收發(fā)通信對(duì),且SU系統(tǒng)將在不影響PU業(yè)務(wù)QoS前提下,對(duì)多種業(yè)務(wù)數(shù)據(jù)進(jìn)行傳輸,這些SU數(shù)據(jù)業(yè)務(wù)和節(jié)點(diǎn)不區(qū)分優(yōu)先級(jí),得到各節(jié)點(diǎn)地位對(duì)等的CRAHN系統(tǒng)。由于可用頻譜資源受到限制,所有節(jié)點(diǎn)需要共享頻譜資源進(jìn)行并發(fā)通信,授權(quán)頻譜通過(guò)采用Interweave模式進(jìn)行共享。因此,SU系統(tǒng)所有節(jié)點(diǎn)需要先通過(guò)頻譜感知技術(shù)判斷PU是否占用頻譜,若信道為占用狀態(tài),則次用戶(hù)繼續(xù)等待;反之,次用戶(hù)對(duì)授權(quán)頻譜進(jìn)行利用。這種機(jī)制可確保SU系統(tǒng)在PU空閑時(shí)對(duì)授權(quán)頻譜加以利用,滿(mǎn)足SU系統(tǒng)數(shù)據(jù)傳輸?shù)男枨?,也可避免?duì)PU傳輸造成干擾影響;另一方面,在針對(duì)多目標(biāo)的遙測(cè)網(wǎng)絡(luò)數(shù)據(jù)傳輸中,SU可根據(jù)信道中干擾強(qiáng)度變化,發(fā)現(xiàn)和規(guī)避干擾。
目前,有大量CRN頻譜效率優(yōu)化研究的文獻(xiàn)[5-9]:1)一些方法針對(duì)Underlay頻譜共享方式下的CRN系統(tǒng)[10-13],該模式下PU和SU需要共存。針對(duì)Interweave模式的研究一部分聚焦于頻譜感知[14-15]、PU檢測(cè)率和虛警率的改善[16],但這類(lèi)性能討論并未與SU網(wǎng)絡(luò)容量掛鉤;另一部分基于感知-頻譜共享研究SU網(wǎng)絡(luò)遍歷容量最大化[17-20],但文獻(xiàn)[17-20]等僅針對(duì)單個(gè)SU用戶(hù)進(jìn)行鏈路容量?jī)?yōu)化,而文獻(xiàn)[19]需要SU基站進(jìn)行協(xié)同感知的信息融合和判決。因此,需要對(duì)多個(gè)CR用戶(hù)在Interweave模式下組成的次用戶(hù)網(wǎng)絡(luò)容量?jī)?yōu)化問(wèn)題及其功率控制方法進(jìn)行研究;2)在Interweave模式中,SU網(wǎng)絡(luò)可在PU空閑時(shí)占用授權(quán)頻譜進(jìn)行通信,且不用考慮對(duì)PU的干擾,在PU空閑時(shí)可將SU網(wǎng)絡(luò)近似看做無(wú)線(xiàn)Ad hoc網(wǎng)路。目前已有一些基于博弈理論以網(wǎng)絡(luò)容量最大化為目標(biāo)提出相應(yīng)功率控制算法的研究[21-26]。為簡(jiǎn)化分析難度,一些研究基于高SINR假設(shè)下將香農(nóng)容量進(jìn)行了近似[26],或針對(duì)特殊的網(wǎng)絡(luò)結(jié)構(gòu)(如正交多址NOMA等)進(jìn)行信道增益等參數(shù)的序列假設(shè)[21-22],缺乏對(duì)一般SINR條件下博弈模型相關(guān)性質(zhì)的深入分析。因此,需要考慮移動(dòng)設(shè)備所受硬件水平和處理速度的限制,控制各用戶(hù)間信息交互量并降低算法復(fù)雜度,對(duì)CRAHN的SU節(jié)點(diǎn)之間的干擾進(jìn)行補(bǔ)償、并達(dá)到SU網(wǎng)絡(luò)容量最大化目的。
本研究有3個(gè)主要貢獻(xiàn):1)根據(jù)約束條件建立CRAHN容量模型并轉(zhuǎn)化為等效博弈模型,利用KKT條件引入代表干擾代價(jià)的新變量;2)針對(duì)不同SINR和用戶(hù)數(shù)條件下的等效博弈模型進(jìn)行了等效博弈模型的超模性證明;3)提出該場(chǎng)景下基于Gradient Play方法的分布式資源分配算法,并在不同功率、干擾和QoS條件下進(jìn)行仿真,該算法所需交換信息少,相比Best Response方法具有更穩(wěn)健的收斂性保證。
設(shè)想一個(gè)由單個(gè)PU和SU網(wǎng)絡(luò)組成的通信應(yīng)用場(chǎng)景。SU網(wǎng)絡(luò)包含L={1, …,L}條收發(fā)通信鏈路,每條通信鏈路分別包含一個(gè)SU發(fā)射機(jī)STl和一個(gè)SU接收機(jī)SRl,SU網(wǎng)絡(luò)節(jié)點(diǎn)均采用Interweave方式與PU共享頻譜,在不影響PU業(yè)務(wù)QoS的前提下,對(duì)多SU數(shù)據(jù)業(yè)務(wù)進(jìn)行不區(qū)分優(yōu)先級(jí)的單跳并發(fā)傳輸,構(gòu)成由多個(gè)對(duì)等SU節(jié)點(diǎn)組成的單跳CRAHN系統(tǒng),如圖1所示。假設(shè)用戶(hù)位置均勻分布在可互相影響的同區(qū)域內(nèi),網(wǎng)絡(luò)中不存在中心設(shè)施,所有SU對(duì)一定帶寬的授權(quán)頻譜進(jìn)行共享。PU具有較高QoS要求,若主系統(tǒng)和次系統(tǒng)同時(shí)工作,則次系統(tǒng)將嚴(yán)重影響主系統(tǒng)傳輸性能,因此,主系統(tǒng)和次系統(tǒng)不能同時(shí)工作;另一方面,SU網(wǎng)絡(luò)中各用戶(hù)間的并發(fā)傳輸會(huì)不可避免地產(chǎn)生用戶(hù)間干擾(MUI,multi-user interference)。假設(shè)SU網(wǎng)絡(luò)內(nèi)各SU都可得到信道狀態(tài)信息(CSI,channel state information)完全知識(shí),以及所有信道遵循塊衰落(block fading)方式,即在數(shù)據(jù)幀周期內(nèi)信道增益(channel gain)為常數(shù),但不同時(shí)隙之間的信道增益可能不同。
圖1 4個(gè)用戶(hù)組成的CRAHN網(wǎng)絡(luò)架構(gòu)
根據(jù)CR技術(shù)的Interweave模式思想,每個(gè)數(shù)據(jù)幀(時(shí)隙)可分為2個(gè)階段:1)各SU首先進(jìn)行基于能量探測(cè)(energy detection)的頻譜感知,判斷頻譜占用情況;2)若頻譜被PU占用,則所有SU保持靜默;反之,SU網(wǎng)絡(luò)中所有節(jié)點(diǎn)利用分布式功率控制算法最大程度降低網(wǎng)內(nèi)干擾、提高SU網(wǎng)絡(luò)容量。假設(shè)頻譜空洞時(shí)間足夠SU網(wǎng)絡(luò)完成多個(gè)時(shí)隙的頻譜感知和數(shù)據(jù)傳輸操作,則系統(tǒng)時(shí)隙的組成見(jiàn)圖2。
圖2 CRAHN系統(tǒng)時(shí)隙結(jié)構(gòu)圖
其中,τ為頻譜感知時(shí)間,T-τ為數(shù)據(jù)傳輸時(shí)間??芍繋瑪?shù)據(jù)時(shí)隙包含:1)頻譜感知時(shí)間為τ,SU需完成PU狀態(tài)的確定;2)在T-τ數(shù)據(jù)傳輸時(shí)間內(nèi),SU基于頻譜感知結(jié)果,決定靜默或進(jìn)行基于功率控制的數(shù)據(jù)傳輸。由于SU硬件資源有限,系統(tǒng)中各SU采用能量檢測(cè)來(lái)進(jìn)行頻譜感知以降低運(yùn)算復(fù)雜度。假設(shè)所有SU間實(shí)現(xiàn)了同步且與PU間距離相近,PT發(fā)射功率足夠強(qiáng),使得所有SU對(duì)頻譜可用性判決一致,SUl感知到授權(quán)頻譜上PU存在性可由以下假設(shè)表示[23]
Hl0:rl(i)=nl(i),
(1)
Hl1:rl(i)=s(i)gslp+nl(i),
(2)
根據(jù)圖2所示系統(tǒng)時(shí)隙結(jié)構(gòu),系統(tǒng)以概率(1-Pf)進(jìn)行數(shù)據(jù)傳輸,使用鏈路香農(nóng)容量作為系統(tǒng)效用函數(shù)。在表示SUl所在鏈路的香農(nóng)容量時(shí),該函數(shù)是關(guān)于SUl接收信干噪比(SINR, signal to interference plus noise power ratio)的函數(shù),即使SINRl可表示為
(3)
式中:p=(p1,…,pL)是所有ST的發(fā)射功率矢量;hll表示從STl到SRl的信道增益;hlk表示從STk到STl的信道增益;n0為SRl的背景噪聲且其滿(mǎn)足高斯分布n0~(0,σ2),使用Il(p-l)來(lái)表示SUl所接收到的來(lái)自其他用戶(hù)干擾MUI的總和。
從式(3)中可以看出,由于次用戶(hù)網(wǎng)絡(luò)中自干擾的存在,各次用戶(hù)l的效用函數(shù)關(guān)于其他SUk的發(fā)射功率變量pk在分母具有強(qiáng)耦合性。因此,當(dāng)主用戶(hù)為空閑且沒(méi)有虛警發(fā)生時(shí),基于香農(nóng)公式可得到次用戶(hù)Ad hoc網(wǎng)絡(luò)效用函數(shù)——對(duì)數(shù)效用函數(shù)(logarithmic utility function),每個(gè)SUl所在鏈路的香農(nóng)容量cl(γl)可表示為
(4)
其中,B為多個(gè)SU所占用的總帶寬。在SINR遠(yuǎn)大于1的高SINR場(chǎng)景中,對(duì)數(shù)效用函數(shù)ul(γl)可根據(jù)1+γl(p)≈γl(p)將香農(nóng)容量近似為ul(γl)=θllog(1+γl)≈θllog(γl),θl為網(wǎng)絡(luò)系統(tǒng)的服務(wù)優(yōu)先級(jí)權(quán)重因子。換句話(huà)說(shuō),香農(nóng)容量可以近似用對(duì)數(shù)效用函數(shù)log(γl)進(jìn)行表示。而在低SINR場(chǎng)景,用戶(hù)數(shù)據(jù)率關(guān)于SINR呈近似線(xiàn)性的關(guān)系,即用戶(hù)效用函數(shù)與容量的對(duì)數(shù)值成比例變化。接著,綜合考慮次用戶(hù)的虛警和PU的活躍概率等因素,可以得到新的SUl所在鏈路的容量公式[23]
(5)
其中,θ1和θ0為常數(shù),分別為PU忙和空閑的概率。如前所述,次用戶(hù)系統(tǒng)當(dāng)且僅當(dāng)H0假設(shè)下次用戶(hù)l正確感知PU的空閑狀態(tài)時(shí)才有鏈路容量回報(bào)。假設(shè)在本場(chǎng)景中,PU的發(fā)射功率非常大,且頻譜感知時(shí)間足夠長(zhǎng),則虛警Pf可忽略且為常數(shù),假設(shè)在多個(gè)數(shù)據(jù)時(shí)隙內(nèi)PU均未出現(xiàn),則θ1=0,因此在后續(xù)的次用戶(hù)網(wǎng)絡(luò)容量最大化推導(dǎo)和分布式功率控制算法設(shè)計(jì)過(guò)程中,均不專(zhuān)門(mén)對(duì)Pf和θx進(jìn)行討論。SU分配的共享帶寬Bw也是常數(shù)。設(shè)θx(1-Pf)Bw=B,即效用函數(shù)可轉(zhuǎn)化為ul(γl)=cl(γl)=Blog(1+γl(p)),且頻譜效率為
(6)
根據(jù)網(wǎng)絡(luò)效用最大化(NUM,network utility maximization)的相關(guān)描述,系統(tǒng)需要在每個(gè)SUll∈L滿(mǎn)足發(fā)射功率約束條件的前提下,對(duì)SU發(fā)射功率矢量p進(jìn)行控制,以達(dá)到SU網(wǎng)絡(luò)內(nèi)所有SU效用值總和最大化的目的。需要對(duì)鏈路容量代表的網(wǎng)絡(luò)效用總和進(jìn)行優(yōu)化
(7)
從式(4)和式(7)可知,雖然OP1的約束條件是緊致凸集,但OP1的目標(biāo)函數(shù)由于多用戶(hù)決策pl之間的耦合性,造成函數(shù)ul關(guān)于變量p的非凸特性,則OP1是一個(gè)非凸優(yōu)化問(wèn)題(non-convex problem)。對(duì)于該問(wèn)題一般沒(méi)有顯示解,且其復(fù)雜度為NP-Hard[24]。為求解OP1,可定義一種等效的功率控制博弈模型[25]。
假設(shè)用戶(hù)從不交換任何信息且僅選擇發(fā)射功率來(lái)滿(mǎn)足自身效用最大化目標(biāo)的情況,可以得到一個(gè)非合作功率控制博弈(NPG,noncooperative power control game)模型,有如下定義
定義1:一個(gè)NPG模型可被定義為一個(gè)三元組
G=[L,{Pl}l∈L,{ul}l∈L],
(8)
定義2:當(dāng)滿(mǎn)足以下條件
(9)
利用KKT條件求得了代價(jià)函數(shù)表達(dá)式為[26]
(10)
其中,代價(jià)因子πj(pj,p-j)為STl向?qū)ζ洚a(chǎn)生干擾的SUj(j≠l)收取的價(jià)格,因此其值為負(fù)。為了精確表示代價(jià)函數(shù),類(lèi)似文獻(xiàn)[27],使用對(duì)數(shù)yl=logpl對(duì)用戶(hù)決策變量進(jìn)行代換,用yl表示分貝(decibel,單位dB),則可得到pl=eyl。這種變換是合理的,因?yàn)樵跓o(wú)線(xiàn)通信系統(tǒng)中一般使用分貝數(shù)來(lái)描述發(fā)射功率的相對(duì)強(qiáng)度。因此,代換得到的變量矢量y與原變量p是一一對(duì)應(yīng)的。經(jīng)過(guò)對(duì)變量y的變換,式(3)所表示的SINR表達(dá)式可重新寫(xiě)為
(11)
從式(10)和式(11)可得到代價(jià)因子πj(pj,p-j)的全新表達(dá)式為
(12)
其中,πj完全由用戶(hù)決策變量所確定。然后,可以得到新的收益函數(shù)為
(13)
將式(12)的結(jié)果代入式(13)中,可消除代價(jià)因子π繼續(xù)化簡(jiǎn)得到
(14)
其中,設(shè)Alj=(exp(yl)hji)/(exp(yj)hjj)。從式(14)可知,SUl需要最大限度提高其效用函數(shù)和代價(jià)函數(shù)間的差值,權(quán)重在數(shù)值上等于STl到SRk間信道增益。因此式(8)可變?yōu)镚=[L,{Pl}l∈L,{Ul}l∈L],并對(duì)此等效博弈模型的超模性、納什均衡、解的唯一性和相應(yīng)迭代算法的設(shè)計(jì)以及收斂性進(jìn)行分析和討論。
在等效博弈模型G中,每個(gè)STl被當(dāng)作博弈中的玩家制定各自功率策略,每個(gè)STl所付代價(jià)看作功率的函數(shù)。為了進(jìn)行分布式資源分配算法的設(shè)計(jì),需要討論博弈G的NE存在性和解的唯一性的條件,并對(duì)算法收斂性進(jìn)行證明。由于超模博弈在對(duì)NE解收斂性等方面有很多有用性質(zhì),因此首先得到如下定理。
定理1:若其他用戶(hù)策略y-l固定,則支付函數(shù)Ul是1個(gè)凹函數(shù)。
定義3:假設(shè)X?且T為某偏(有)序集,若函數(shù)f在(x,t)上滿(mǎn)足f:X×T→對(duì)任意x′≥x及t′≥t可滿(mǎn)足f(x′,t′)-f(x,t′)≥f(x′,t)-f(x,t),則稱(chēng)函數(shù)f具有差值遞增性(Increasing Differences),即超模性。超模函數(shù)具有以下性質(zhì):
a)當(dāng)t增加時(shí),選擇更高x的增量增益將更大。
b)差值遞增性具有對(duì)稱(chēng)性,即若t′≥t,則f(x,t′)-f(x,t)關(guān)于x為非遞減函數(shù)。
c)若函數(shù)f為二階連續(xù)可導(dǎo),則當(dāng)且僅當(dāng)對(duì)所有x,t′≥t時(shí)有f(x,t′)-f(x,t),或?qū)λ衳和t,有fxt(x,t)≥0,則稱(chēng)函數(shù)f具有差值遞增性。
定義4:若能滿(mǎn)足以下條件,則博弈模型G=[L,{Pl}l∈L,{ul}l∈L]可被稱(chēng)為超模博弈。
a)對(duì)任意給定p-l,策略空間Pl為某歐氏空間RN中的非空、凸的且緊致子格;
b)ul關(guān)于(pl,p-l)具有上半連續(xù)性(upper semicontinuous);
c)效用函數(shù)ul具有差值遞增性,即對(duì)用戶(hù)策略pl二階可導(dǎo)且滿(mǎn)足
定理3:若博弈模型G=[L,{Pl}l∈L,{Ul}l∈L]為超模博弈,則滿(mǎn)足下列性質(zhì):
a)NE集合始終存在,且為非空和緊致子格(Sublattice),可逐個(gè)搜索最小和最大的NE值;
b)若SUl從策略空間中最小(或最大)決策值更新策略,則策略值單調(diào)收斂到最小(或最大)NE;
c)SUl策略將位于有界區(qū)間內(nèi)。若G存在唯一NE,則策略更新可從初始值全局收斂到唯一NE。
性質(zhì)a)遵從文獻(xiàn)[31]中引理;b)遵從文獻(xiàn)[32]中定理;c)的證明詳見(jiàn)文獻(xiàn)[33]。針對(duì)不同SINR情況下不同用戶(hù)數(shù)的認(rèn)知無(wú)線(xiàn)網(wǎng)絡(luò)需要滿(mǎn)足超模性的基本條件進(jìn)行分析。證明以下定理。
證明:每個(gè)SUl策略空間非空,且策略空間為RN空間的子集,所以必為Sublattice子格,因此,必滿(mǎn)足定義3條件a)。Ul的函數(shù)形式顯然連續(xù)且二階可微。當(dāng)網(wǎng)絡(luò)用戶(hù)數(shù)L=2時(shí),SUl效用函數(shù)為
(15)
式(15)中2個(gè)效用函數(shù)式具有對(duì)稱(chēng)性,分別對(duì)兩式計(jì)算對(duì)策略y1和y2的交叉偏微分,省略計(jì)算過(guò)程可得
其中,式(17)即為L(zhǎng)= 2 時(shí),SU2收益函數(shù)U1二階交叉偏導(dǎo)。為區(qū)別以往研究?jī)H針對(duì)高SNR場(chǎng)景的情況,對(duì)一般SNR場(chǎng)景確定了滿(mǎn)足超模性的條件。
(18)
(19)
證明:首先證明博弈G的超模性,然后證明收益函數(shù)的凹凸性。已知多用戶(hù)的收益函數(shù)如式(14),分別計(jì)算關(guān)于yl的二階偏導(dǎo)(目標(biāo)函數(shù)Hessian矩陣的對(duì)角線(xiàn)項(xiàng))和關(guān)于yl與yi的交叉偏導(dǎo)(非對(duì)角線(xiàn)項(xiàng))如下(相關(guān)計(jì)算步驟從略)
(20)
(21)
a)證明收益函數(shù)凹凸性。
(22)
(23)
(24)
(25)
(26)
其中,θj為每個(gè)SUj為常數(shù)的優(yōu)先級(jí)權(quán)重,且γjAlj=Bj>0,由此可解得當(dāng)滿(mǎn)足Bj∈(0,1/2]∪[1,+∞)時(shí),Hll(y)<0,則支付函數(shù)為嚴(yán)格凹函數(shù)。
b)證明博弈模型超模性。
(27)
(28)
當(dāng)所表示的上述動(dòng)態(tài)模型達(dá)到穩(wěn)定狀態(tài),則該狀態(tài)一定是均衡點(diǎn)。然而,對(duì)一般形式的博弈模型,其收斂性能并不令人滿(mǎn)意。因此考慮另一種替代機(jī)制Gradient Play[34]。相比在前述每一步致力于尋找使性能最優(yōu)的“最優(yōu)響應(yīng)”機(jī)制,Gradient Play可看成一種“更優(yōu)響應(yīng)”的機(jī)制。在這種機(jī)制中,每個(gè)玩家基于對(duì)其他玩家所做決策的結(jié)果觀察,以梯度方向迭代地調(diào)整當(dāng)前決策。則每個(gè)SUl可根據(jù)下式更新其策略
(29)
(30)
表1 基于Gradient Play方法的分布式容量?jī)?yōu)化算法
針對(duì)表1,可看到為了實(shí)現(xiàn)系統(tǒng)策略狀態(tài)更新,在每個(gè)時(shí)隙t,每個(gè)用戶(hù)需要獲取的信息有:1)其他用戶(hù)的功率值pl(t)(每個(gè)用戶(hù)的發(fā)射機(jī)進(jìn)行周期性廣播);2)當(dāng)前信道增益hll(接收機(jī)處測(cè)量并反饋到發(fā)射機(jī))和臨近信道增益hjl(每個(gè)用戶(hù)的接收機(jī)進(jìn)行周期的信標(biāo)廣播);3)接收SINR值γl(t),l∈L(每個(gè)用戶(hù)的接收機(jī)周期廣播)。每個(gè)用戶(hù)基于以上信息,計(jì)算其他用戶(hù)的代價(jià)值并用于后續(xù)計(jì)算中。從定理3描述的超模博弈的性質(zhì)出發(fā),只要博弈模型滿(mǎn)足超模性且存在NE,即使是非增量式的最優(yōu)響應(yīng)算法也可以得到平衡,因此增量式的Gradient Play算法也可以收斂到NE。
定理6:等效超模博弈G=[L,{Pl}l∈L,{Ul}l∈L]可從任意初始值收斂到其N(xiāo)E點(diǎn)。
1)函數(shù)值為正(Positivity):f(x)>0;
2)單調(diào)性(Monotonicity):若x≥x′,則f(x)≥f(x′);
3)可伸縮性(Scalability):對(duì)所有a>1,均有af(x)≥f(ax)。
其中,x=(x1,x2,…,xN)為NE點(diǎn)。對(duì)于所定義的等效超模博弈模型,根據(jù)文獻(xiàn)[25],能容易證明最優(yōu)響應(yīng)函數(shù)BRl(y)滿(mǎn)足上述條件。相似地,對(duì)于Gradient Play更新函數(shù),對(duì)?yl∈Yl也可證明如下:
因此,等效超模博弈始終會(huì)向NE點(diǎn)收斂,定理得證,在仿真實(shí)驗(yàn)中選取0.001和0.01步長(zhǎng)分別在2用戶(hù)和30用戶(hù)上進(jìn)行了收斂性數(shù)值仿真驗(yàn)證。
在仿真實(shí)驗(yàn)中,假設(shè)多個(gè)SU已經(jīng)檢測(cè)到了頻譜空洞,基于Gradient Play的分布式容量?jī)?yōu)化資源分配算法分析SU網(wǎng)絡(luò)的性能,并假設(shè)算法運(yùn)行過(guò)程中PU不出現(xiàn),基于此假設(shè)進(jìn)行仿真實(shí)驗(yàn)并對(duì)結(jié)果進(jìn)行分析。首先設(shè)置仿真場(chǎng)景,相關(guān)參數(shù)如下:
1)模擬一個(gè)在50 m×50 m方形區(qū)域內(nèi)隨機(jī)生成的分布式網(wǎng)絡(luò),生成1~30對(duì)網(wǎng)絡(luò)用戶(hù)通信對(duì),每個(gè)用戶(hù)節(jié)點(diǎn)的相應(yīng)收發(fā)端隨機(jī)分布在15 m×15 m的方形區(qū)域內(nèi);
2)所有網(wǎng)絡(luò)用戶(hù)共享相同頻譜資源,信道帶寬B=64;
5)每個(gè)用戶(hù)選擇固定步長(zhǎng)為fl= 0.01,且假設(shè)θ0= 1和Pf虛警概率為0,將CRAHN近似為Ad hoc;
6)產(chǎn)生1到30個(gè)用戶(hù)傳輸對(duì),同時(shí)對(duì)用戶(hù)之間的距離單位和信號(hào)衰減因子等參數(shù)進(jìn)行設(shè)置。
如圖3所示顯示了30個(gè)網(wǎng)絡(luò)用戶(hù)的鏈路分布情況,其中藍(lán)色圓圈為發(fā)射機(jī),紅色方塊為相應(yīng)的接收機(jī),針對(duì)不同用戶(hù)數(shù)的每個(gè)場(chǎng)景,均通過(guò)均勻分布隨機(jī)生成20組拓?fù)浣Y(jié)構(gòu)進(jìn)行比較。
圖3 1~30個(gè)用戶(hù)通信收發(fā)對(duì)的網(wǎng)絡(luò)模型
圖4~圖6顯示了用戶(hù)收發(fā)對(duì)分別為2和30個(gè)的時(shí)候,網(wǎng)絡(luò)系統(tǒng)中各用戶(hù)發(fā)射功率分配和對(duì)其他用戶(hù)干擾代價(jià)值的典型收斂情況(每條線(xiàn)均代表一個(gè)用戶(hù)的發(fā)射功率值或干擾代價(jià)值的變化情況),所有場(chǎng)景均基于隨機(jī)的參數(shù)初始化。其中,用戶(hù)數(shù)不多時(shí)(圖4的2用戶(hù)網(wǎng)絡(luò))將發(fā)射功率和干擾代價(jià)在一張圖上顯示,當(dāng)用戶(hù)收發(fā)對(duì)增加到30個(gè),即通過(guò)圖5和圖6分別將發(fā)射功率值和干擾代價(jià)值的收斂情況進(jìn)行分開(kāi)顯示。
圖4 2用戶(hù)無(wú)線(xiàn)網(wǎng)絡(luò)Gradient Play算法的收斂效果仿真
圖5和圖6分別顯示了30用戶(hù)的網(wǎng)絡(luò)中各用戶(hù)發(fā)射功率和干擾代價(jià)值變化的過(guò)程。各用戶(hù)隨著分布式算法迭代次數(shù)的增加,根據(jù)其他用戶(hù)的策略狀態(tài)導(dǎo)致的反饋結(jié)果,以增量方式對(duì)各自的發(fā)射功率進(jìn)行調(diào)節(jié)。除了個(gè)別用戶(hù)達(dá)到了發(fā)射功率最大值1以外,其他大多數(shù)用戶(hù)都在pl=[0, 1]W范圍內(nèi)取得了發(fā)射功率值。該場(chǎng)景下,算法的收斂迭代次數(shù)在600次以?xún)?nèi)。
圖5 30個(gè)用戶(hù)無(wú)線(xiàn)網(wǎng)絡(luò)中Gradient Play算法對(duì)用戶(hù)功率分配的收斂效果
圖6 30個(gè)用戶(hù)無(wú)線(xiàn)網(wǎng)絡(luò)Gradient Play算法對(duì)干擾代價(jià)值的收斂效果
此外,圖6顯示了各用戶(hù)因發(fā)射功率更新所得到對(duì)其他用戶(hù)相應(yīng)的干擾代價(jià)值的變化趨勢(shì)。從圖中前40次左右的迭代中,幾乎所有用戶(hù)由于其自私性,都在盡力提高當(dāng)前鏈路上的發(fā)射功率,因此相應(yīng)地增大了各自的干擾代價(jià)。隨著分布式算法迭代次數(shù)的增加,根據(jù)其他用戶(hù)的策略狀態(tài)導(dǎo)致的反饋結(jié)果,以增量方式對(duì)各自的發(fā)射功率進(jìn)行調(diào)節(jié),干擾代價(jià)又降低了下來(lái),最終達(dá)到均衡點(diǎn)下的穩(wěn)定狀態(tài)。該場(chǎng)景下,算法的收斂迭代次數(shù)在600次以?xún)?nèi)。
最后,圖7展示了在CRAHN中的不同信噪比條件下,用戶(hù)收發(fā)對(duì)從1個(gè)提高到30個(gè)所帶來(lái)的網(wǎng)絡(luò)容量性能變化趨勢(shì)。從圖上可以看出:1)用戶(hù)數(shù)從1個(gè)到15個(gè)的增加過(guò)程中,3種信噪比場(chǎng)景下,網(wǎng)絡(luò)的總?cè)萘慷蓟咎幱谔岣唠A段,說(shuō)明在分布式算法的發(fā)射功率控制優(yōu)化是有效的,能使網(wǎng)絡(luò)總?cè)萘康玫教嵘?。其中SNR=30 dB和SNR=40 dB的情況比較類(lèi)似,而SNR=20 dB場(chǎng)景下的信噪比相比之下網(wǎng)絡(luò)總?cè)萘坎顒e較大,說(shuō)明分布式算法在這個(gè)SNR條件下,針對(duì)基于香農(nóng)容量對(duì)數(shù)近似公式的網(wǎng)絡(luò)容量的優(yōu)化效果并不明顯;2)用戶(hù)數(shù)從15個(gè)~25個(gè)左右時(shí),3種SNR場(chǎng)景的網(wǎng)絡(luò)總?cè)萘砍尸F(xiàn)一種保持中略有下降的趨勢(shì),直到用戶(hù)數(shù)從25個(gè)到30個(gè)變化過(guò)程中,3個(gè)SNR條件場(chǎng)景中的網(wǎng)絡(luò)總?cè)萘砍霈F(xiàn)較明顯的下降。這是因?yàn)殡S著網(wǎng)絡(luò)中用戶(hù)數(shù)的增多,網(wǎng)內(nèi)干擾的比重大大增加,且隨著用戶(hù)數(shù)增多造成了用戶(hù)策略的耦合性增強(qiáng),用戶(hù)依靠分布式算法進(jìn)行的功率調(diào)整不容量對(duì)網(wǎng)絡(luò)總?cè)萘坑刑嗟呢暙I(xiàn);3)在SNR=20 dB的場(chǎng)景中的網(wǎng)絡(luò)總?cè)萘肯啾容^強(qiáng)SNR條件下的網(wǎng)絡(luò)性能來(lái)說(shuō),更容易收到用戶(hù)數(shù)增加的影響,因?yàn)楦饔脩?hù)的最大發(fā)射功率不變,而網(wǎng)絡(luò)SNR偏低,則網(wǎng)內(nèi)干擾更容易收到各用戶(hù)發(fā)射功率的影響,用戶(hù)數(shù)的增多使得網(wǎng)絡(luò)內(nèi)的資源優(yōu)化共享更加難以協(xié)調(diào)。因此SNR越低的場(chǎng)景下,網(wǎng)絡(luò)總?cè)萘扛菀资艿接脩?hù)數(shù)的影響。
圖7 認(rèn)知無(wú)線(xiàn)網(wǎng)絡(luò)中用戶(hù)數(shù)和信噪比變化對(duì)網(wǎng)絡(luò)總?cè)萘康挠绊戧P(guān)系
基于超模博弈理論針對(duì)CRAHN網(wǎng)絡(luò)系統(tǒng)容量最大化問(wèn)題進(jìn)行了研究,解決了同頻點(diǎn)無(wú)線(xiàn)Ad hoc網(wǎng)絡(luò)容量和模型中用戶(hù)間策略的偶合性問(wèn)題。首先,根據(jù)相關(guān)約束條件對(duì)無(wú)線(xiàn)Ad hoc網(wǎng)絡(luò)吞吐量之和模型進(jìn)行了建立,轉(zhuǎn)化為等效博弈模型,并利用KKT條件引入代表干擾代價(jià)的新變量,且寫(xiě)出代價(jià)關(guān)于策略的精確表達(dá)式;然后,針對(duì)不同SINR條件下的等效博弈模型進(jìn)行了系統(tǒng)容量模型的超模性證明,后分別基于Best Response和Gradient方法得到分布式資源分配算法。仿真結(jié)果表明,在不同的功率、干擾和QoS需求條件下,該方法相比其他同類(lèi)算法所需要的信息交換更少,相比Best Response算法具有更穩(wěn)健的收斂性保證。主要貢獻(xiàn)在于:首先,根據(jù)相關(guān)約束條件對(duì)無(wú)線(xiàn)Ad hoc網(wǎng)絡(luò)容量和模型進(jìn)行了建立,然后轉(zhuǎn)化為等效博弈模型,利用KKT條件引入代表干擾代價(jià)的新變量;然后,針對(duì)不同SINR和用戶(hù)數(shù)條件下的等效博弈模型進(jìn)行了系統(tǒng)容量模型的超模性證明,后基于梯度法得到分布式資源分配算法。仿真結(jié)果表明,在不同的功率、干擾和QoS需求條件下,該方法相比其他同類(lèi)算法所需要的信息交換更少,相比最優(yōu)響應(yīng)方法具有更穩(wěn)健的收斂性保證。