張煜,張治,董曉岱
(1.北京郵電大學信息與通信工程學院,北京 100876;2.維多利亞大學電子與計算機工程學院,維多利亞 V8W 3P6)
作為5G 及未來移動通信網(wǎng)絡的主要技術(shù)之一[1-3],毫米波通信能夠提供較寬的帶寬,滿足高速數(shù)據(jù)傳輸需求。然而,高頻率、短波長的電磁波具有嚴重的路徑損耗和較差的繞射性能[4-5],導致通信范圍有限。幸運的是,多輸入多輸出(MIMO,multi-input multi-output)技術(shù)可以利用大規(guī)模天線陣列來補償嚴重的衰減,延長信號的傳輸距離。
傳統(tǒng)的全數(shù)字MIMO 架構(gòu)通常是基于數(shù)字預編碼器實現(xiàn)的,其中所需射頻(RF,radio frequency)鏈的數(shù)量等于天線的數(shù)量。射頻鏈通常由混頻器、功率放大器和數(shù)字-模擬轉(zhuǎn)換器等器件構(gòu)成。對于毫米波系統(tǒng),由于過高的功耗和硬件成本[6],部署全數(shù)字預編碼具有挑戰(zhàn)性。借助毫米波信道的稀疏特性,文獻[7]提出了一種混合數(shù)字-模擬預編碼架構(gòu),使用較少的射頻鏈實現(xiàn)低維數(shù)字預編碼器和高維模擬預編碼器的連接,其中模擬預編碼器采用模值恒定、相位可調(diào)的模擬移相器實現(xiàn);同時把混合預編碼等效為壓縮感知中的稀疏信號恢復問題,并使用正交匹配追蹤(OMP,orthogonal matching pursuit)算法求解,最終達到了降低功耗和硬件成本的目標。鑒于OMP 算法的計算復雜度較高,有些文獻提出了改進算法,包括并行索引選擇-忽略矩陣求逆的同步正交匹配追蹤(PIS-MIB-SOMP,parallel-index-selection matrix-inversion-bypass simultaneous OMP)算法[8]、基于順序迭代最小二乘的廣義正交匹配追蹤(ORLS-gOMP,order-recursive least squares-based generalized OMP)算法[9]、基于正交性的匹配追蹤(OBMP,orthogonality-based matching pursuit)算法[10]等。另外,文獻[11]根據(jù)天線陣列響應矩陣的相關(guān)性生成模擬預編碼矩陣備選集,有效降低了OMP 算法搜索空間的大小。針對碼字搜索問題,文獻[12]提出了基于傅里葉變換碼本的低復雜度碼本搜索方法,降低了搜索復雜度??傮w而言,文獻[7-11]所提算法都是基于碼本的混合預編碼方法,所實現(xiàn)的頻譜效率還有很大的提升空間[12]。
為了接近最優(yōu)的頻譜效率性能,學者們研究了非碼本的混合預編碼方案,將混合預編碼視作恒模約束下的矩陣分解問題,基于交替最小(AltMin,alternating minimization)算法迭代設計數(shù)字預編碼器和模擬預編碼器。具體地,數(shù)字預編碼器通過最小二乘準則計算,模擬預編碼器的最優(yōu)解則分別通過共軛梯度(CG,conjugate gradient)[13]、內(nèi)點法[14]、Barzilai-Borwein 梯度[15]、梯度投影(GP,gradient projection)[16]等算法獲得。盡管文獻[13-16]提出的非碼本混合預編碼方案在頻譜效率性能上接近全數(shù)字預編碼,但實現(xiàn)復雜度均較高。雖然文獻[13]也提出了一種通過求解正交Procrustes 問題(OPP,orthogonal Procrustes problem)獲得混合預編碼器的低復雜度算法,但需要假設數(shù)字預編碼器滿足比例酉性質(zhì)。由于該假設僅在數(shù)據(jù)流的數(shù)目等于射頻鏈的數(shù)目時有效[17],因此當射頻鏈的數(shù)目大于數(shù)據(jù)流的數(shù)目時,OPP 算法所實現(xiàn)的頻譜效率在一定程度上會有所降低。
上述研究主要針對單用戶場景。為了解決多用戶場景下的混合預編碼問題,文獻[18]提出了兩階段混合預編碼方案,即基站(BS,base station)首先和移動臺(MS,mobile station)聯(lián)合設計最優(yōu)的模擬預編碼器和組合器以使信道增益最大化,然后設計迫零(ZF,zero-forcing)數(shù)字預編碼器以減少MS間的干擾。文獻[19]提出了一種混合最小均方誤差(MMSE,minimum mean-squared error)預編碼方法,即每個MS 首先獨立配置模擬組合器,然后由BS為所有MS 設計模擬預編碼器和數(shù)字預編碼器。文獻[20]提出了一種混合塊對角化(BD,block diagonalization)預編碼方法,該方法首先設計模擬預編碼器和組合器以最大化陣列增益,然后在等效基帶信道上應用BD 方法設計數(shù)字預編碼器。然而,文獻[18-20]所提方案獲得的頻譜效率與全數(shù)字預編碼相比尚有很大的差距。另一方面,文獻[13-16]中的CG-AltMin、BB-AltMin、GP-AltMin 等非碼本混合預編碼方案同樣也可應用于多用戶場景,但復雜度較高的問題依然存在。
近年來,深度學習在混合預編碼問題中的應用受到了廣泛關(guān)注[21-28]。從所采用網(wǎng)絡模型的角度,基于深度學習的混合預編碼方案分為基于實數(shù)神經(jīng)網(wǎng)絡的混合預編碼[21]、基于復數(shù)反向傳播(BP,backpropagation)神經(jīng)網(wǎng)絡的混合預編碼[22]和基于復卷積神經(jīng)網(wǎng)絡的混合預編碼[23-28]三類,其中文獻[21]將實數(shù)神經(jīng)網(wǎng)絡應用于混合預編碼器的設計,文獻[22]提出了基于復數(shù)BP 神經(jīng)網(wǎng)絡的混合預編碼方案,文獻[23-28]分別提出了基于ComcepNet、等效信道-卷積神經(jīng)網(wǎng)絡(CNN,convolutional neural network)、CovNet、CNN-MIMO、HPNet 和深度學習量化相位網(wǎng)絡模型的混合預編碼機制。
進一步地,還可從學習方式的角度,將上述基于實數(shù)神經(jīng)網(wǎng)絡的混合預編碼和基于復卷積神經(jīng)網(wǎng)絡的混合預編碼歸納為線下學習方案,將基于復數(shù)BP 神經(jīng)網(wǎng)絡的混合預編碼歸納為在線學習方案。線下學習方案分為線下訓練和線上測試2 個階段,在線下訓練階段,隨機生成大量信道訓練樣本,以信道參數(shù)為網(wǎng)絡輸入,以每個信道條件下相應的最佳模擬預編碼器或組合器為網(wǎng)絡輸出,執(zhí)行訓練過程獲得網(wǎng)絡配置參數(shù);在線上測試階段,將信道測試樣本輸入配置好的網(wǎng)絡,獲得該信道條件下相應的最佳模擬預編碼器或組合器,然后,數(shù)字預編碼器通過對等效信道進行奇異值分解或運用ZF 準則獲得。
在訓練好網(wǎng)絡模型之后,線下學習方案能夠快速響應信道參數(shù),獲得相應的最佳模擬預編碼器或組合器。然而,為了獲得最佳的網(wǎng)絡配置參數(shù),線下訓練階段往往需要龐大的訓練樣本,以提高精確度。另外,訓練好的網(wǎng)絡模型往往針對具體的參數(shù)設置,在單用戶場景下是具體的發(fā)射和接收天線數(shù),在多用戶場景下是基站的天線數(shù)和用戶數(shù)。當天線數(shù)或用戶數(shù)發(fā)生變化時,需要重新訓練以保證網(wǎng)絡模型的準確性,這會造成較大的訓練開銷和較長的訓練時間,使算法效率降低[29]。
與線下學習方案形成鮮明對比的是,在線學習方案所需訓練樣本較少,能夠根據(jù)信道條件的變化實時地調(diào)整網(wǎng)絡權(quán)值,最佳的數(shù)字預編碼器和模擬預編碼器從網(wǎng)絡權(quán)值中提取。研究線下學習方案的文獻相對較少,以文獻[22]為主要代表,其針對多用戶場景,提出了基于復數(shù)BP 神經(jīng)網(wǎng)絡的混合預編碼方案,以最優(yōu)ZF 數(shù)字預編碼器和實際混合預編碼器之間的最小均方誤差為損失函數(shù),采用動量梯度下降(GDM,gradient descent with momentum)算法對網(wǎng)絡進行訓練,獲得的權(quán)值即混合預編碼矩陣的組成元素。然而,文獻[22]沒有考慮模擬預編碼器的恒模約束,通過訓練得到的和模擬預編碼器對應的權(quán)值沒有歸一化為統(tǒng)一的模值,這與實際的硬件設計不符。當考慮模擬預編碼器的恒模約束時,文獻[22]采用的算法收斂速度較慢。
受上述討論的啟發(fā),為了降低現(xiàn)有的傳統(tǒng)非碼本混合預編碼方案和在線學習方案的復雜度,本文針對毫米波大規(guī)模MIMO 系統(tǒng),分別提出適用于單用戶場景和多用戶場景的低復雜度在線學習混合預編碼方案,所需訓練樣本較少,訓練速度較快。本文所提混合預編碼方案具體如下:在單用戶場景下,提出一種新穎的等效神經(jīng)網(wǎng)絡架構(gòu),將數(shù)字預編碼器和模擬預編碼器的每個元素視為單隱藏層神經(jīng)網(wǎng)絡的參數(shù),并將混合預編碼器的求解視作該神經(jīng)網(wǎng)絡的參數(shù)訓練過程;進一步地,設計適用于該等效神經(jīng)網(wǎng)絡的參數(shù)訓練方法,提出一種基于自適應梯度反向傳播(AG-BP,adaptive gradient backpropagation)的混合預編碼算法,以最小化損失函數(shù)為目標,通過迭代最終獲得單用戶場景下的最優(yōu)混合預編碼器;最后將所提算法擴展至多用戶場景,獲得多用戶場景下的混合預編碼方案。仿真結(jié)果表明,在單用戶場景和多用戶場景下,所提算法實現(xiàn)的頻譜效率均接近全數(shù)字預編碼,且復雜度低于現(xiàn)有的基于交替最小算法的混合預編碼方案和基于GDM 的在線學習混合預編碼方案。
本節(jié)首先給出單用戶場景下的系統(tǒng)模型,多用戶場景下的系統(tǒng)模型將在3.5 節(jié)給出。考慮一個單用戶毫米波MIMO 系統(tǒng),設該系統(tǒng)中發(fā)射機配置Nt根天線、個射頻鏈,接收機配置Nr根天線、個射頻鏈,它們之間通過NS路數(shù)據(jù)流進行通信。
毫米波傳播過程中過高的路徑損耗造成散射體有限,毫米波信道通常采用基于擴展Saleh Valenzuela 模型的簇信道模型,信道矩陣H被描述為Ncl個簇的組合,每個簇包含Nray個射線[7]。因此,H可表示為
其中,λ為載波波長,d為相鄰天線間距離,ny=0,…,Ny-1和nz=0,…,Nz-1分別為天線單元在y軸和z軸的索引,N=Ny Nz為天線總數(shù)。
假設發(fā)送信號s服從高斯分布并且滿足,其中ρ為平均發(fā)送功率。則該毫米波通信系統(tǒng)的頻譜效率為
為使如上的系統(tǒng)頻譜效率最大化,可對FBB、FRF、WRF和WBB進行聯(lián)合優(yōu)化,即
然而,鑒于FRF和WRF的恒模約束,式(5)是不可解的。通過分開設計混合預編碼器和組合器,式(5)可以解耦為2 個可解的子問題[7]。最優(yōu)的模擬預編碼器和數(shù)字預編碼器可以通過求解以下問題獲得[13]
其中,F(xiàn)opt表示Nt×NS維無約束全數(shù)字預編碼器,由H的NS個最大奇異值對應的NS個右奇異向量組成。假設H可通過相應的信道估計方法[30]預先獲取,定義H的奇異值分解為H=UΣVH,則Fopt=V(:,1:NS)為V 的前NS列元素。
本節(jié)針對單用戶場景,首先提出一種描述混合預編碼的等效神經(jīng)網(wǎng)絡架構(gòu),分析其與傳統(tǒng)神經(jīng)網(wǎng)絡架構(gòu)的不同;然后給出訓練數(shù)據(jù)集的產(chǎn)生方法,并推導出損失函數(shù)的表達式;接著以最小化損失函數(shù)為目標,提出基于AG-BP 的混合預編碼機制;最后針對多用戶場景,將所提算法進行擴展,獲得多用戶場景下的混合預編碼方案。
重新考慮混合預編碼式(6),假設s經(jīng)過混合預編碼處理的信號為那么混合預編碼問題可以等效為確定s與y之間的映射關(guān)系,即M:s→y。
映射M包含2 個線性組合,即FBB和FRF。因此,混合預編碼架構(gòu)可視為一個單隱藏層神經(jīng)網(wǎng)絡,如圖1 所示。
圖1 混合預編碼的等效單隱藏層神經(jīng)網(wǎng)絡架構(gòu)
NS路發(fā)送信號、個射頻鏈、Nt根發(fā)射天線可分別類比成NS個輸入層神經(jīng)元、個隱藏層神經(jīng)元、Nt個輸出層神經(jīng)元,則輸出層信號可以重寫為
圖1 所示網(wǎng)絡的權(quán)值dq,u和ap,q(p=1,…,Nt,q=1,…,,u=1,…,NS)與FBB和FRF的每個元n素相對應,可通過訓練獲得。因此,可以利用神經(jīng)網(wǎng)絡的學習算法[31]來設計混合預編碼器。
神經(jīng)網(wǎng)絡的學習過程意味著調(diào)整相鄰神經(jīng)元之間的權(quán)值以及每個功能神經(jīng)元的閾值以使網(wǎng)絡最優(yōu)。但本文所提出的混合預編碼等效架構(gòu)與傳統(tǒng)的神經(jīng)網(wǎng)絡存在幾點不同:1)FBB和FRF的元素均為復數(shù);2) 在混合預編碼架構(gòu)下不存在功能神經(jīng)元;3) 偏置全為0 且激活函數(shù)為恒等函數(shù);4) 最重要的一點是隱藏層和輸出層之間連接權(quán)存在恒模約束,這使通用的神經(jīng)網(wǎng)絡訓練算法不適用于混合預編碼器的設計,因此有必要設計混合預編碼器專用的權(quán)值訓練算法。
在復數(shù)神經(jīng)網(wǎng)絡的訓練過程中,通常將復數(shù)的實部和虛部分別進行更新,然后合并[31]。用字母r和i分別表示復數(shù)的實部和虛部,則發(fā)送符號權(quán)值dq,u和ap,q可寫成
第p個輸出層神經(jīng)元的輸出為
累積平均誤差可重寫為
對于ap,q,其增量Δap,q可以寫為實部增量Δarp,q和虛部增量Δaip,q相加的形式,即
根據(jù)梯度下降法,Δarp,q和Δaip,q沿負梯度方向更新,即
其中,η表示學習率。
根據(jù)鏈式準則,有
將式(15)代入式(13)和式(14)可得
更新ap,q為
為了加速收斂,避免損失函數(shù)到達局部極小值,權(quán)值增量可基于自適應梯度(學習率)計算[32],沿負梯度方向的搜索步長與之前所有迭代的梯度值有關(guān),即
其中,δ>0為一個足夠小的數(shù)值以保證數(shù)值穩(wěn)定性。
考慮到ap,q的恒模約束,重構(gòu)ap,q為
其中,∠ap,q表示復數(shù)ap,q的相位。
FRF的每個元素與ap,q一一對應,即
dq,u也可采用與ap,q相似的更新規(guī)則。但為了降低計算復雜度,dq,u可直接根據(jù)最小二乘解獲得
對ap,q和dq,u迭代更新,直到滿足以下條件
其中,ε>0為一個足夠小的正值;或者當?shù)螖?shù)超過預定義的最大值tmax時,迭代更新也將停止。最后,更新FBB以滿足功率約束
基于AG-BP 的混合預編碼算法如算法1 所示。
算法1基于AG-BP 的混合預編碼算法
給定無約束全數(shù)字預編碼器Fopt、訓練數(shù)據(jù)集大小Nd、學習率η和最大迭代次數(shù)tmax
接下來,分析算法1 的復雜度。算法1 中每一步操作的復數(shù)乘法和除法個數(shù)如表1 所示,其中
表1 算法1 每步操作所需復數(shù)乘法和除法個數(shù)
表示利用初等行變換對m×m矩陣進行求逆所需的復數(shù)乘法和除法個數(shù)。算法1 和對比算法的計算開銷如表2 所示,其中,分別表示內(nèi)部迭代的總數(shù)和外部迭代的個數(shù)。對于CG-AltMin、BB-AltMin 和GP-AltMin,為所有外部迭代所需內(nèi)部迭代個數(shù)的累加值。
表2 算法1 與對比算法的計算開銷
其中,Wopt表示Nr×NS維無約束全數(shù)字組合器,由H的NS個最大奇異值對應的NS個左奇異向量組成,即Wopt=U(:,1:NS)。
顯而易見,除了功率約束,式(25)和式(6)有相同的形式。因此,可通過把Fopt、FRF和FBB替換成Wopt、WRF和WBB并運用算法1 對式(25)進行求解。
本節(jié)在上述工作的基礎上,將所提算法擴展至多用戶場景。設配置NBS根天線的BS 同時和U個MS 進行通信,每個MS 均具有NMS根天線。假設每個MS 僅采用模擬預編碼架構(gòu),即每個MS 僅有一路數(shù)據(jù)流,則BS 總共有NS=U路數(shù)據(jù)流。不失一般性,可假設BS 使用NRF個可用數(shù)據(jù)鏈中的U個數(shù)據(jù)鏈對這U個MS 進行服務,且NRF≥U。在BS 側(cè),U× 1維發(fā)送符號s=[s1,…,sU]T依次經(jīng)過U×U維數(shù)字預編碼器FBB=[fBB,1,…,fBB,U]和NBS×U維模擬預編碼器FRF的處理,其中,su表示發(fā)送給第u個MS 的信號,fBB,u表示與第u個MS 相對應的數(shù)字預編碼向量。第u個MS 經(jīng)過NMS× 1維模擬組合器wu處理后的接收信號可表示為
其中,Hu為NMS×NBS維信道矩陣,且與式(2)有相同的表達式;為NMS× 1維高斯噪聲向量。則第u個MS 可實現(xiàn)的速率為
其中,ρ表示平均發(fā)送功率。
與單用戶場景下類似,多用戶混合預編碼設計的優(yōu)化目標是最大化所有MS 的和速率,即其中,F(xiàn)和W分別表示模擬預編碼向量和模擬組合向量的可能取值所組成的碼本。式(28)是一個混整數(shù)規(guī)劃問題,它的解需要搜索整個FU×WU空間的所有FRF和的可能組合。因此,和速率最大化問題的直接解決方案既不實際也不可行。為此,本文提出一種兩階段法,將混合預編碼矩陣和模擬組合向量分開進行設計。
具體地,在第一階段,每個MS 設計各自的模擬組合向量,以最大化信道增益,即
本節(jié)使用MATLAB 軟件對所提算法的性能進行詳細的仿真與評估,所用處理器的型號為Intel(R)Core(TM) i5-4210M,主頻2.60 GHz,機帶RAM 8 GHz。首先考慮單用戶場景,設仿真中的發(fā)射機和接收機分別具有64 根和16根天線;發(fā)射機和接收機射頻鏈個數(shù)相等,統(tǒng)一用NRF表示;數(shù)據(jù)流個數(shù)NS=2。毫米波信道的實例依據(jù)式(2)和式(3)進行生成,其中簇個數(shù)Ncl=5,每個簇的中心到達角和離開角均勻分布在[0,2π)內(nèi);每個簇有Nray=10個射線,到達角和離開角服從角度擴展為10°的拉普拉斯分布;第i個簇中第 ? 個射線的復增益為,其中表示第i個簇的平均功率。設天線間距d為半波長,噪聲功率為1。信噪比(SNR,signal-to-noise-ratio)定義為。ε、δ和tmax分別設置為10-3、10-6和500。以下分析將在隨機產(chǎn)生1 000 個信道實例的情況下,將本文算法與傳統(tǒng)的OMP[7]、OPP[13]、CG-AltMin[13]、BB-AltMin[15]、GP-AltMin[16]等算法和基于GDM[20]的在線學習方案進行對比。在GDM 中,最大迭代次數(shù)和動量因子α分別設置為2 000 和0.9,為區(qū)別于本文算法,學習率用μ表示,另外,獲得的模擬預編碼器通過式(19)進行模值歸一化處理。
圖2 為NRF=4、SNR=0 時,不同學習率情況下本文算法和GDM 的可實現(xiàn)頻譜效率與訓練數(shù)據(jù)集大小Nd的關(guān)系。對于BP 神經(jīng)網(wǎng)絡,網(wǎng)絡輸出與輸入的映射關(guān)系為非線性函數(shù)。對于非線性函數(shù),訓練數(shù)據(jù)集越大,函數(shù)的擬合效果越好,訓練得到的網(wǎng)絡模型才最接近真實函數(shù)。
圖2 不同學習率情況下頻譜效率與訓練數(shù)據(jù)集大小的關(guān)系
從圖2 可以看到,頻譜效率隨著Nd的增加而增加,對于本文算法,Nd=3時頻譜效率趨于最大值;對于GDM,Nd=4時頻譜效率趨于最大值。由此可見,本文算法僅需較少的訓練數(shù)據(jù)集即可達到較滿意的結(jié)果。在本文算法中,每個權(quán)重的搜索步長與之前迭代的一階導數(shù)的平方和有關(guān),僅利用了一階導數(shù)信息即可起到與二階方法和模擬退火相同的性能,將會使頻譜效率收斂到一個穩(wěn)定值。因此,給定Nd和學習率時,本文算法的頻譜效率性能優(yōu)于GDM。,從圖2 中還可以看出,在給出的幾個學習率中,η=0.5時本文算法的頻譜效率最大,μ=0.9時GDM 的頻譜效率最大。
圖3 為Nd=3、SNR=0 時不同學習率的收斂情況對比。本文算法的收斂結(jié)束條件是式(6)和式(25)中的優(yōu)化目標趨于最小,等價于使優(yōu)化式(5)中的頻譜效率趨于最大,因此迭代次數(shù)會收斂于頻譜效率。對于本文算法,η=0.5時的收斂速度較快(平均迭代次數(shù)為192,平均收斂時間約為0.131 4 s),且實現(xiàn)的頻譜效率較高,平均約為14.58 bit/(s·Hz);對于GDM,μ=0.9時的收斂速度較快,且實現(xiàn)的頻譜效率較高。給定學習率時,本文算法的收斂速度遠遠快于GDM。從圖2 和圖3 可以看到,當Nd=3、η=0.5時,本文算法性能最好;當Nd=4、μ=0.9時,GDM 性能最好。因此在后續(xù)仿真中,對于本文算法,均令Nd=3、η=0.5;對于GDM,均令Nd=4、μ=0.9。
圖3 不同學習率的收斂情況對比
圖4 為NRF=4時不同算法的性能對比。根據(jù)式(4),隨著SNR 的增加,所有算法可實現(xiàn)的頻譜效率均增加。在給定SNR 的前提下,本文算法可實現(xiàn)的頻譜效率均高于參與對比的算法,最接近無約束全數(shù)字預編碼的性能。在本文算法中,經(jīng)過收斂,模擬預編碼矩陣與數(shù)字預編碼矩陣的乘積FRFFBB接近無約束全數(shù)字預編碼矩陣Fopt,模擬組合矩陣和數(shù)字組合矩陣的乘積WRFWBB接近無約束全數(shù)字組合矩陣Wopt,因此所實現(xiàn)頻譜效率會接近無約束全數(shù)字預編碼。
圖4 NRF=4時不同算法的性能對比
圖5 為不同算法可實現(xiàn)的頻譜效率隨NRF的變化情況。隨著NRF的增加,本文算法、OMP、CG-AltMin、BB-AltMin、GP-AltMin 和GDM 可實現(xiàn)的頻譜效率均增加。在給定NRF的條件下,本文算法可實現(xiàn)的頻譜效率高于其他算法,且在NRF=4時接近無約束全數(shù)字預編碼的性能。文獻[33]證明,在混合預編碼架構(gòu)下,NRF≥2NS是實現(xiàn)無約束全數(shù)字預編碼性能的充分條件,圖5 的仿真結(jié)果也證實了這一結(jié)論。盡管OPP 相比上述算法具有較低的復雜度,但可實現(xiàn)的頻譜效率隨著NRF的增加幾乎不發(fā)生變化。這是由于OPP 假設FBB滿足比例酉性質(zhì),但這一假設僅在NRF=NS時成立。因此,當NRF>NS時,OPP 所實現(xiàn)的頻譜效率在一定程度上會有所降低。
圖5 不同算法可實現(xiàn)的頻譜效率隨NRF的變化情況
為了比較不同算法的復雜度,表3 列出了本文算法、CG-AltMin、BB-AltMin、GP-AltMin 和GDM在不同NRF時的平均迭代次數(shù)。將表3 的數(shù)據(jù)代入表2 的公式中,得到不同算法的計算開銷隨NRF的變化曲線,如圖6 所示。從圖6 中可以看出,本文算法的復雜度明顯低于CG-AltMin、BB-AltMin、GP-AltMin 和GDM,且在NRF>3時隨著NRF的增加而降低。因為表3 的數(shù)據(jù)顯示,當NRF>3時,隨著NRF的增加,本文算法的迭代次數(shù)Niter不斷降低,將Niter代入表2 的公式中,Niter降低的幅度大于復雜度僅在NRF作用下增加的幅度,Niter和NRF的聯(lián)合作用造成復雜度的降低。而參與對比的交替最小算法和GDM 算法的迭代次數(shù)盡管也隨著NRF的增大而減小,但減小的程度遠不如本文算法,因此沒有出現(xiàn)復雜度隨NRF增加而降低的情況。
圖6 不同算法的計算開銷隨NRF的變化曲線
表3 不同算法的平均迭代次數(shù)
最后,評估多用戶場景下不同算法的性能。設配置64 根天線的基站同時和U個用戶進行通信,每個用戶均具有16 根天線。每個用戶與基站間毫米波信道實例的產(chǎn)生方式與相應參數(shù)的設置與單用戶場景一致。以下在隨機產(chǎn)生1 000 個信道實例的條件下,將本文算法與 ZF[18]、MMSE[19]、CG-AltMin[13]和GDM[22]進行對比分析。
圖7 為U=4時不同算法的和速率與SNR 的關(guān)系。根據(jù)式(27),隨著SNR 的增加,所有算法可實現(xiàn)的和速率均增加。從圖7 中可看出,本文算法實現(xiàn)的和速率高于其他算法,這是因為本文算法設計的混合預編碼矩陣最接近理想情況下的ZF 全數(shù)字預編碼矩陣。
圖7 U=4時不同算法的和速率與SNR 的關(guān)系
圖8 為SNR=0 時不同算法的和速率與U的關(guān)系。隨著U的增加,所有算法實現(xiàn)的和速率均增加,但U的增加會造成每個用戶所受干擾的增大,因此和速率增長的趨勢會變緩。在給定U的前提下,本文算法實現(xiàn)的和速率與GDM 基本相同,且均高于ZF 和MMSE。與CG-AltMin 相比,當U≤ 4時,本文算法實現(xiàn)的和速率與之相同;當U>4時,本文算法實現(xiàn)的和速率更高;且隨著U的增加,本文算法和CG-AltMin 所實現(xiàn)和速率的差值不斷增大。
圖8 SNR=0 時不同算法的和速率與U 的關(guān)系
綜上所述,在單用戶場景和多用戶場景下,本文算法可實現(xiàn)的頻譜效率均高于現(xiàn)有的算法,接近全數(shù)字預編碼的性能。而在算法復雜度方面,與基于交替最小的次優(yōu)算法和基于GDM 的在線學習方案相比,本文算法的復雜度明顯降低。
本文針對毫米波大規(guī)模MIMO 系統(tǒng),分別提出了適用于單用戶場景和多用戶場景的低復雜度混合預編碼方法。首先針對單用戶場景,提出了一種等效的單隱藏層神經(jīng)網(wǎng)絡架構(gòu),將混合預編碼的設計問題等效為該網(wǎng)絡架構(gòu)下的權(quán)值訓練過程。然后以最小化損失函數(shù)為目標,提出了基于AG-BP 算法的混合預編碼機制。最后將所提算法擴展至多用戶場景。仿真結(jié)果表明,所提算法可實現(xiàn)的頻譜效率高于現(xiàn)有的算法,接近全數(shù)字預編碼的性能,且復雜度低于基于交替最小的次優(yōu)算法和基于動量梯度下降的在線學習方案。