董作霖
(河南工學(xué)院 教務(wù)處,河南 新鄉(xiāng) 453003)
?
多用戶MIMO系統(tǒng)中基于博弈論的魯棒性功率分配
董作霖
(河南工學(xué)院 教務(wù)處,河南 新鄉(xiāng) 453003)
針對(duì)多用戶多輸入多輸出(MU-MIMO)天線系統(tǒng),提出了一種基于非合作博弈論的功率分配方案。此博弈模型中,以用戶在系統(tǒng)中的信號(hào)泄漏噪聲比值(SLNR)作為用戶功率分配和公平性參數(shù)設(shè)置的依據(jù),保證用戶所期望的服務(wù)質(zhì)量和公平性,并證明了納什均衡的存在性。其次,考慮信道估計(jì)誤差的影響,提出了一種基于滑動(dòng)模型的迭代功率分配控制算法滿足所有用戶的最小通信質(zhì)量要求。仿真結(jié)果顯示此方案在信道誤差的情況下,相比現(xiàn)有方案可提高系統(tǒng)吞吐量。
多用戶多輸入多輸出;功率分配;博弈論;信號(hào)泄漏噪聲比;納什均衡
多用戶多輸入多輸出(Multi-UserMultiple-InputMultiple-Output,MU-MIMO)天線技術(shù)在提高系統(tǒng)容量和頻譜效率方面具有明顯的優(yōu)勢(shì),但它也存在用戶間同頻干擾(Co-ChannelInterference,CCI)的問題。如何抑制MIMO下行鏈路中的噪聲干擾和同頻干擾是多用戶MIMO技術(shù)的研究重點(diǎn)。
用戶功率分配和預(yù)編碼技術(shù)(例如:信號(hào)泄漏噪聲比值(Signal-to-Leakage-and-NoiseRatio,SLNR))能夠提升MIMO系統(tǒng)的性能,近幾年來已經(jīng)被廣泛地研究。文獻(xiàn)[1]提出了一種最大化用戶SLNR的功率分配算法。文獻(xiàn)[2]著重研究了在MU-MIMO下行鏈路中,基于SLNR預(yù)編碼動(dòng)態(tài)功率分配方案。為降低功率分配算法的復(fù)雜度,文獻(xiàn)[3]提出了一個(gè)次優(yōu)化的功率分配方案。文獻(xiàn)[4]提出了兩個(gè)功率分配方案,通過利用用戶的SLNR值和天線關(guān)聯(lián)性的信息,來設(shè)計(jì)最優(yōu)功率分配算法,進(jìn)而最大化系統(tǒng)吞吐量。此外,考慮接收濾波器和發(fā)射濾波器的功率分配,文獻(xiàn)[5]提出了一種基于修改SLNR預(yù)編碼準(zhǔn)則的方案,設(shè)計(jì)在用戶終端有效使用和評(píng)估接收機(jī)的子空間方法。然而,以上研究均未能考慮到信道估計(jì)誤差對(duì)MU-MIMO系統(tǒng)的影響,忽略了用戶間的最小通信質(zhì)量要求。
博弈論被越來越多人認(rèn)為是解決通信資源分配問題的一種有效數(shù)學(xué)工具。為在博弈論框架內(nèi)制定問題,考慮到信道的不確定性以及無法準(zhǔn)確地獲得信道狀態(tài)信息,文獻(xiàn)[6-7]提出了一種魯棒功率分配方案,該方案源于博弈論架構(gòu)思想,提供了兩種充分條件下的數(shù)學(xué)結(jié)構(gòu)來使系統(tǒng)的整體效率達(dá)到最大且保證納什均衡。博弈論解決資源分配的方案已被逐步應(yīng)用于MIMO系統(tǒng)中優(yōu)化資源管理。然而,以上文獻(xiàn)雖然能夠提高方案的魯棒性,但是卻忽略了用戶之間功率分配的公平性。
在非合作動(dòng)態(tài)控制博弈模型(NoncooperativeDynamicPowerGamePolicy,NPGP)中,本文通過利用各用戶的SLNR值被用于懲處價(jià)格的參考指標(biāo),以保證MU-MIMO系統(tǒng)中用戶之間的QoS和公平性。受信道評(píng)估誤差的影響,發(fā)射機(jī)不能精確分配可用資源來滿足用戶的服務(wù)質(zhì)量,納什均衡也無法得到有效保證。為了解決這一問題,在NPGP模型基礎(chǔ)上通過分析博弈理論在無線系統(tǒng)的應(yīng)用,本文提出一種基于SLNR預(yù)編碼MU-MIMO系統(tǒng)非合作博弈理論的動(dòng)態(tài)功率分配方案,并借用滑模型來增強(qiáng)系統(tǒng)的魯棒性,保證用戶的公平和通信質(zhì)量要求。
文中符號(hào)說明:E[·]表示期望;(A)H、det(A)和Tr(A)分別表示矩陣A的共軛轉(zhuǎn)置、行列式和矩陣A的跡;IMk表示Mk×Mk單位矩陣。
本文以同時(shí)存在N個(gè)發(fā)射機(jī)天線和K個(gè)用戶的MU-MIMO下行鏈路為系統(tǒng)模型。第k用戶用Mk為接收天線,系統(tǒng)模型如圖1所示。
圖1MU-MIMO下行鏈路系統(tǒng)模型
Fig.1MU-MIMOdownlinksystemmodel
xk=WkAksk。
(1)
式中:Wk=[wk,1,wk,2,…,wk,Mk]∈N×Mk是用戶k的預(yù)編碼矩陣;wk,j表示第k個(gè)用戶的第j個(gè)信息流的預(yù)編碼矢量。預(yù)編碼矢量是統(tǒng)一標(biāo)準(zhǔn)化的,即‖Wk‖2=1(k=1,2,…,K),那么)=Mk。所有用戶總的發(fā)射功率
對(duì)于移動(dòng)用戶k,Mk×1接收信號(hào)可以表示為
(2)
式中:第二項(xiàng)表示CCI;加性噪聲矢量nk被假定為獨(dú)立同分布(IndependentandIdenticallyDistributed,IID),其均值為零,方差為δ2,表示為CN(0,δ2)。
根據(jù)信號(hào)泄露的概念[1],從用戶k到其他所有用戶的平均信號(hào)泄露功率為
(3)
(4)
經(jīng)典SLNR方案給每個(gè)用戶設(shè)定等功率分配[2],源于以下通過每個(gè)用戶的最大SLRN的獨(dú)立優(yōu)化問題:
Wk=argmaxSLNRk=
(5)
(6)
因此,用戶k的SLNR可修改如下:
(7)
考慮到MU-MIMO系統(tǒng)中用戶之間的公平性,尋找一個(gè)最佳功率分配策略力求提高所有被服務(wù)用戶的通信質(zhì)量至關(guān)重要。基于以上需求本節(jié)提出一種可行的非合作博弈動(dòng)態(tài)功率控制方案解決功率控制問題。
3.1非合作功率控制博弈模型
本文用博弈論來分配在SLNR預(yù)編碼MU-MIMO系統(tǒng)中各用戶的功率,并且把SLNR值作為設(shè)置用戶價(jià)格因子的參考依據(jù)。通過將功率控制問題定義為非合作博弈來解決功率控制問題:
G={K,{Pk},{Uk(·)}} 。
式中:k= [1,2,3,…,K]是參加移動(dòng)用戶(選擇特定功率來發(fā)射的決策者);Pk表示用戶k的策略功率分配值;Uk(·)是策略中移動(dòng)用戶k的應(yīng)用功能。
每一個(gè)加入的移動(dòng)用戶可以在功率矢量空間P={p1,p2,p3,…,pK}選擇功率pk∈PK。所有移動(dòng)用戶通過選擇功率分配空間策略得到一組競(jìng)賽結(jié)果。用戶k實(shí)用功能是Uk(pk,P-k),P-k是除用戶k以外的所有用戶功率矢量,每個(gè)用戶的目標(biāo)僅僅是使自己的實(shí)用功能最大化。為選擇最佳的發(fā)射功率空間策略并增強(qiáng)其實(shí)用性,非合作博弈模型[3]可被定義為
(8)
式中:L和M′分別是信息比特?cái)?shù)和一個(gè)數(shù)據(jù)包的總比特?cái)?shù);Rk是用戶k的傳輸率;γk代表用戶k的信號(hào)泄漏噪聲比SLNRk。式(8)中,f(·)是效率函數(shù),假定呈sigma形狀函數(shù)[6],f()=1,f(0)=0以保證當(dāng)pk=0時(shí),Uk=0。效率函數(shù)f1(γk)=(1-e-γk/2)M,受sigmal函數(shù)啟發(fā),為降低實(shí)際執(zhí)行中復(fù)雜度,我們定義效率函數(shù)為f2(γk)=1/(1+e10-γk)。如果γk用在傳統(tǒng)的MIMO系統(tǒng)中,該函數(shù)將非常接近于f1(γk),它與用戶的信號(hào)泄漏噪聲比值有關(guān)并且可以忽略接入技術(shù)中的調(diào)整率。
式(8)表明SLNR值高的用戶在實(shí)用功率分配方案之前可能獲得更多的收益[7],但NPG的納什均衡點(diǎn)是無效的,這是由于用戶的自我優(yōu)化行為會(huì)降低系統(tǒng)性能。懲罰因子就是通過鼓勵(lì)用戶用更為有效的代價(jià)函數(shù)(分散決策適合整個(gè)系統(tǒng))來有效地使用系統(tǒng)資源,所以,非合作功率控制博弈模型提供了如下一種更好的功率分配控制方案:
(9)
式中:Ck:P→R+是第k個(gè)用戶的定價(jià)公式;ck(pk,P-k)=μλkepk,λk表示第k個(gè)用戶的懲處參數(shù),μ是懲處參數(shù)的價(jià)格權(quán)數(shù)。一般狀況下不同用戶依據(jù)其自身特性將會(huì)設(shè)定不同的價(jià)格懲處參數(shù),這點(diǎn)與其他研究中普通的定價(jià)方案不同,進(jìn)而NPGP定價(jià)模型可表示為
(10)
定價(jià)函數(shù)是接收功率的非線性函數(shù),這樣對(duì)其他用戶的干擾便能得到更好的吞吐性能。因此,我們采取自適應(yīng)定價(jià)方案,根據(jù)綜合干擾,不同用戶λk隨之改變。價(jià)格懲處參數(shù)λk可以表示為
(11)
式(10)和式(11)證明了擁有高效用水平的用戶具有更高的SLNR值(好的信道情況)且該類用戶接收了最大效用并被分配更低的發(fā)射效率,但擁有更低效用的用戶擁有更低的SLNR值(差的信道情況)并且使用更高的功率發(fā)送。為使效用達(dá)到最大,擁有更高SLNR值和干擾的用戶懲處參數(shù)應(yīng)該被嚴(yán)格控制,被收取高價(jià)的用戶將合理地降低其發(fā)射功率。
3.2納什均衡的存在性
根據(jù)帕爾提絲理論不動(dòng)點(diǎn)定理(Topkis Fixed Point Theorem),所有超模博弈游戲至少有一個(gè)納什均衡點(diǎn)[8-10],所以本節(jié)只需證明非合作博弈G=[K,{Pk},{uk(·)}]是一個(gè)超模博弈。根據(jù)文獻(xiàn)[8],超模博弈中所有實(shí)用功能的參與者應(yīng)該滿足以下兩個(gè)條件:一是所有參與者的策略空間集合;二是效用函數(shù)二次導(dǎo)數(shù)的值不小于零。
顯然G=[K,{Pk},{uk(·)}]滿足超模博弈的第一個(gè)條件,因?yàn)槊總€(gè)用戶的策略空間Pk∈[pmin,pmax]。本文提出的NPGP方案和文獻(xiàn)[5]相似,而文獻(xiàn)[5]已證明了該方案可以提高帕累托最優(yōu),所以,此處只需驗(yàn)證該方案滿足第二個(gè)條件。由公式(8)可得NPGP的二階功率導(dǎo)數(shù)為
(12)
γk的一階功率導(dǎo)數(shù)為
(13)
式中:Gk是用戶k從BS獲得的鏈路增益。
根據(jù)γk,效率函數(shù)f(γk)的二階SLNR導(dǎo)數(shù)為
(14)
為確保在信道估計(jì)誤差情況下所有用戶都享有QoS的最低要求,本節(jié)在NPGP方案中采用一種迭代算法的滑模模型為每個(gè)用戶分配總發(fā)射功率,進(jìn)而為保證所有用戶的最小QoS要求提出一種優(yōu)化算法。
4.1基于滑模模型的魯棒功率分配
步驟1n=0時(shí)以及最初的功率傳輸數(shù)組P(n)=(p1(n),p2(n),…,pK(n))。
步驟3使用滑動(dòng)模型,使傳輸功率控制器對(duì)信道的不確定性達(dá)到魯棒并且達(dá)到所有用戶的QoS要求。
(1)計(jì)算滑動(dòng)過程中用戶當(dāng)前的信號(hào)泄漏噪聲比和最小信號(hào)泄漏噪聲比之差Sk以及用戶的李雅普諾夫函數(shù)Vk:
(15)
(2)采取以下方程:
(16)
步驟4獲取通過NPGP方案的傳輸功率數(shù)組P(n)。
步驟5如果所有用戶滿足條件
然后停止算法或者返回至步驟2,獲取傳輸功率數(shù)組P(n)是所有用戶的最優(yōu)分配數(shù)組。
根據(jù)前文的證明過程,該算法可以得到最后的NE點(diǎn),并獲得分配數(shù)組中帶有不完全信息的P(n)信道估計(jì)誤差最優(yōu)功率。
4.2復(fù)雜度分析
如果按照傳統(tǒng)的注水迭代算法來更新功率,所需要的復(fù)雜度是O(L×M×N×K2),其中L是迭代次數(shù)。本文采用了滑窗模型的ε-最小門限迭代算法求解,其求解功率復(fù)雜度為O(M×N×K2·lb(ε-1))。可以看出本文提出的方案的復(fù)雜度和系統(tǒng)中發(fā)射接收天線有關(guān),而且用戶數(shù)目對(duì)其復(fù)雜度的影響較大。另外,迭代過程中ε的取值也影響著算法復(fù)雜度。
本節(jié)我們將通過仿真驗(yàn)證本文所提方案的性能,仿真中假設(shè)M1=M2=…=MK=M,即接收天線數(shù)和用戶數(shù)相同。用m表示每個(gè)用戶的數(shù)據(jù)流量且假定每個(gè)用戶數(shù)據(jù)流量相同。
通過以下4種方案對(duì)比驗(yàn)證本文方案的性能:
(1)文獻(xiàn)[3]中提出的基于SLNR預(yù)編碼功率分配(SLNR-PA)方案;
(2)文獻(xiàn)[4]中提出的最大SLNR預(yù)編碼功率分配(M-SLNR-PA)方案;
(3)信道估計(jì)誤差條件下的非合作功率控制博弈(SNLR-NPGP)基礎(chǔ)上提出的預(yù)編碼功率分配方案;
(4)本文在信道相關(guān)和信道評(píng)估誤差情況下基于非合作功率控制博弈(R-SLNR-NPGP)提出的SLNR預(yù)編碼功率分配方案。
本文中所有的仿真都在瑞利衰落信道環(huán)境中,且使用QPSK進(jìn)行調(diào)制。假定參數(shù)R=104b/s,M′=80 b,L=64 b,ε=10-2,μ=50 000,G=100,對(duì)所有用戶都適用。結(jié)果顯示平均超過5 000個(gè)信道都滿足該曲線,每個(gè)信道實(shí)現(xiàn)的相干時(shí)間包括每個(gè)用戶200符號(hào)周期。SNR定義為每個(gè)天線期望接收的功率和噪聲功率之比PT/δ2,信道評(píng)估誤差是高斯分布隨機(jī)生成的。
(a)BER
(b)吞吐量
圖24種方案的BER性能和吞吐量比較
Fig.2 Comparison of BER performance and throughput among four schemes
本文闡述了在SLNR預(yù)編碼MU-MIMO系統(tǒng)中存在信道估計(jì)誤差情況下的一種功率分配方案。該方案通過每位用戶的SLNR值作為懲處價(jià)參考進(jìn)而控制功率分配值來保證系統(tǒng)中用戶間的公正性,減少用戶之間的干擾。考慮信道不確定性帶來的影響后,提出采用滑動(dòng)模型的迭代算法來滿足用戶所要求的服務(wù)質(zhì)量。仿真結(jié)果說明該方案相比現(xiàn)有方案可提高系統(tǒng)的吞吐量。然而,本文所提出的方案是在小規(guī)模的MIMO系統(tǒng)中,且服務(wù)的用戶數(shù)目不是很多。在未來可以考慮到在第五代移動(dòng)通信系統(tǒng)中的較多用戶資源分配的問題,比如:在大規(guī)模MIMO系統(tǒng)和超多用戶的網(wǎng)絡(luò)中如何構(gòu)建低復(fù)雜度的功率博弈分配方案等。
[1]魏飛,楊震. 基于博弈論的MIMO認(rèn)知無線電波形自適應(yīng)算法[J].電子學(xué)報(bào),2011,39(10):2269-2276.
WEI Fei,YANG Zhen. An adaptive algorithm for MIMO cognitive radio based on Game Theory[J].Acta Electronica Sinica,2011,39(10):2269-2276.(in Chinese)
[2]ZHANG Bijun,ZHAO Songyi.A robust DL MU-MIMO algorithm and UE specific SINR compensation mechanis in LTE-A[J].電訊技術(shù),2015,55(9):984-992.
ZHANG Bijun,ZHAO Songyi.A robust DL MU-MIMO algorithm and UE specific SINR compensation mechanis in LTE-A[J].Telecommunication Engineering,2015,55(9):984-992.(in English)
[3]吳學(xué)文. 基于Khatri-Rao積的3D MU-MIMO預(yù)編碼方法[J].電訊技術(shù),2014,54(11):1510-1515.
WU Xuewen.3D MU-MIMO precoding method based on Khatri-Rao product[J].Telecommunication Engineering,2014,54(11):1510-1515.(in Chinese)
[4]WANG J J,XIE X Z. Dynamic power allocation based on SLNR precoding for multiuser MIMO downlink[C]//Proceedings of 4th International Conference on Wireless Communication,Networking and Mobile Computing.Dalian:IEEE,2008:1-4.
[5]李瑛,詹偉,王曉燕,等.多用戶MIMO系統(tǒng)廣播信道的連續(xù)塊對(duì)角化預(yù)編碼算法[J].電訊技術(shù),2014,51(4):40-43.
LI Ying,ZHAN Wei,WANG Xiaoyan,et al.Successive block diagonalization pre encoding algorithm for MU-MIMO broadcast channels[J].Telecommunication Engineering,2014,51(4):40-43.(in Chinese)
[6]CHEN J,SWINDLEHURST A L.Applying bargaining solutions to resource allocation in multiuser MIMO-OFDMA broadcast systems[J].IEEE Journal on Selected Areas in Communications,2012,6(2):127-139.
[7]蘭星,王興亮,李偉,等.基于Stackelberg博弈的多輸入多輸出雷達(dá)信號(hào)與目標(biāo)干擾優(yōu)化[J].計(jì)算機(jī)應(yīng)用,2015,35(4):1185-1189.
LAN Xing,WANG Xingliang,LI Wei,et al.Multi-input multi-output radar signal and target jamming optimization based on Stackelberg game[J].Journal of Computer Applications,2015,35(4):1185-1189.(in Chinese)
[8]PATCHARAMANEEPAKORN P,DOUFEXI A,ARMOUR S M D.Weighted sum capacity maximization using a modified leakage-based transmit filter design[J].IEEE Transactions on Vehicular Technology,2013,62(3):1177-1188.
[9]鐘衛(wèi),徐友云.多用戶MIMO系統(tǒng)中的一種基于博弈論的功率控制[J].電子與信息學(xué)報(bào),2006,28(8):1368-1372.ZHONG Wei,XU Youyun.Power control based on game theory for MIMO system[J].Journal of Electronics and Information Technology,2006,28(8):1368-1372.(in Chinese)
[10]KULKARNI V V,BISWAS J,LIU R P,et al.Robust power allocation for mimo beamforming under time varying channel conditions[C]//Proceedings of 2011 IEEE 73rd Vehicular Technology Conference.Budapest,Hungary:IEEE,2011:5-8.
董作霖(1970—),男,河南新鄉(xiāng)人,1992年于北京理工大學(xué)獲工學(xué)學(xué)士學(xué)位,2004年于西安交通大學(xué)獲工程碩士學(xué)位,現(xiàn)為河南工學(xué)院副教授,主要研究方向?yàn)橥ㄐ畔到y(tǒng)、無線傳感器網(wǎng)絡(luò)。
DONG Zuolin was born in Xinxiang,Henan Province,in 1970. He received the B.S. degree from Beijing Institute of Technology and the M.S. degree from Xi′an Jiaotong University in 1992 and 2004,respectively. He is now an associate professor. His research concerns communication system and wireless sensor network.
Email:dongzuolin@163.com
RobustPowerAllocationBasedonGameTheoryforMulti-userMIMOSystems
DONGZuolin
(OfficeofAcademicAffairs,HenanInstituteofTechnology,Xinxiang453003,China)
Thispaperpresentsapowerallocationschemebasedonnon-cooperativeGametheoryformulti-usermulti-inputmulti-output(MU-MIMO)antennasystems.Thegameschemeusesthesignal-to-leakage-and-noiseratio(SLNR)ofusersinthesystemasaguideofpowerallocationandfairnessparametersetting,furthermoreestablishesagamemodeltoensureusers’QualityofService(QoS)andfairness,aswellasprovestheexistenceofNashequilibrium(NE).Secondly,consideringtheinfluenceofchannelestimationerror,itproposesaniterativealgorithmbasedonslidingmodeltoupdateallocatedpowerinordertomeettheminimumQoSrequirementsamongallusers.Simulationresultsshowthattheschemecanimprovethesystemthroughputcomparedwiththeexistingschemesinthepresenceofchannelerror.Keywords:MU-MIMO;powerallocation;gametheory;signal-to-leakage-and-noiseratio;Nashequilibrium
10.3969/j.issn.1001-893x.2016.09.012
2015-12-08;
2016-05-16Receiveddate:2015-12-08;Reviseddate:2016-05-16
TN929.5
A
1001-893X(2016)09-1017-06
引用格式:董作霖.多用戶MIMO系統(tǒng)中基于博弈論的魯棒性功率分配[J].電訊技術(shù),2016,56(9):1017-1022.[DONGZuolin.Robustpowerallocationbasedongametheoryformulti-userMIMOsystems[J].TelecommunicationEngineering,2016,56(9):1017-1022.]
**通信作者:dongzuolin@163.comCorrespondingauthor:dongzuolin@163.com