鄒翔宇 黃崇文 徐勇軍 楊照輝 曹 越
①(東南大學(xué)國家移動重點實驗室 南京 210096)
②(浙江大學(xué)信息與電子工程學(xué)院 杭州 310007)
③(重慶郵電大學(xué) 重慶 400065)
④(倫敦大學(xué)學(xué)院 倫敦 WC1E7JE)
⑤(武漢大學(xué) 武漢 430072)
可重構(gòu)智能表面(Reconfigurable Intelligent Surfaces, RIS)是未來無線通信網(wǎng)絡(luò)最有前途的技術(shù)之一。由大量低成本無源反射單元[1–4]組成的RIS可以通過3種方式實現(xiàn):常規(guī)反射陣列[1–5],液晶超表面[6]和軟件定義的超材料[7]。與傳統(tǒng)的中繼系統(tǒng)不同,RIS中每個反射單元的相移可單獨調(diào)節(jié)。此外,RIS的反射單元都是無源的,沒有發(fā)射和接收噪聲。RIS可以調(diào)整無線信道來使得系統(tǒng)的頻譜和能效增加。但是,將RIS部署用于無線通信還面臨一些挑戰(zhàn),例如信道估計和RIS部署位置。
文獻(xiàn)[4,8–30]中已經(jīng)研究與RIS的部署相關(guān)的工作,對無線通信性能的優(yōu)化。文獻(xiàn)[8]中,作者介紹了RIS輔助無線網(wǎng)絡(luò)的相關(guān)知識,特別介紹了應(yīng)用程序、硬件架構(gòu)、波束成形設(shè)計、信道估計、網(wǎng)絡(luò)部署等。文獻(xiàn)[9]最小化了單用戶和多用戶RIS輔助的多輸入單輸出(Multiple Input Single Output,MISO)系統(tǒng)的用戶傳輸功率。文獻(xiàn)[4,9]通過在RIS輔助的多用戶MISO通信系統(tǒng)中優(yōu)化基站(Base Station, BS)的發(fā)射功率和RIS的相移,研究了核速率和能效最大化問題。但是,大多數(shù)現(xiàn)有研究[4,8,9]都集中在優(yōu)化RIS的連續(xù)相移上,不能用于RIS離散相移的優(yōu)化。由于很難實現(xiàn)RIS的連續(xù)相移,因此RIS的離散相移通常用于實際應(yīng)用中。文獻(xiàn)[11]研究了針對單用戶和多用戶MISO系統(tǒng)的RIS離散相移的優(yōu)化。最近,文獻(xiàn)[12]研究了RIS輔助通信系統(tǒng)的安全性能。RIS的典型應(yīng)用場景是安全傳輸,RIS可以設(shè)計反射向量,以減少竊聽者接收的信號。但是,尚未研究在RIS輔助正交頻分復(fù)用(Orthogonal Frequency Division Multiplexing,OFDM)通信系統(tǒng)中的安全通信。OFDM技術(shù)具有易于實現(xiàn)、易于與MIMO系統(tǒng)結(jié)合以及抵抗符號間干擾的優(yōu)點,因而被廣泛用于無線通信系統(tǒng)中。此外,文獻(xiàn)[4,8–11]中的這些現(xiàn)有工作都沒有優(yōu)化RIS反射單元的數(shù)量。實際上,由于每個RIS單元在實際中都會消耗一定程度的能量,因此RIS單元的數(shù)量將極大地影響RIS輔助通信系統(tǒng)的性能。但是,增加RIS單元的數(shù)量可以更精確地控制反射信號的主方向,從而形成更窄、方向更定向的反射波束。
為了解決此優(yōu)化問題,本文探索了深度學(xué)習(xí)(Deep Learning, DL)方法的優(yōu)勢。使用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)的DL方法已廣泛應(yīng)用于各個領(lǐng)域,例如計算機(jī)視覺、自然語言處理等領(lǐng)域。具體而言,對于通信領(lǐng)域,DL已被廣泛用于物理層和網(wǎng)絡(luò)層的各個方面,例如功率分配[12]和信道估計[13]。最近,DL已用于設(shè)計室內(nèi)通信環(huán)境中RIS單元的最佳反射矩陣[14]。然而,沒有一項現(xiàn)有工作研究了將DL應(yīng)用于RIS輔助無線通信系統(tǒng)的安全性能優(yōu)化。相較于其他的學(xué)習(xí)算法,比如強(qiáng)化學(xué)習(xí),DL方法應(yīng)用在RIS輔助無線通信系統(tǒng),具有收斂性能優(yōu)越、性能好的特點。
考慮一個單輸入單輸出(Single Input Single Output, SISO)上行鏈路系統(tǒng)。該系統(tǒng)由1個單天線用戶,1個單天線接入點(Access Point, AP),1個RIS和1個竊聽者(Eve)組成。室外建筑物的墻壁中部署帶Mmax個 反射單元的RIS??紤]具有K個子載波的正交頻分復(fù)用(OFDM)上行傳輸系統(tǒng)。RIS控制器可以在兩種操作模式之間切換,即用于感測信道環(huán)境的接收模式,例如,信道狀態(tài)信息(Channel State Information, CSI)估計和用于散射來自用戶的入射信號反射模式[14–15]。
圖1 系統(tǒng)模型圖
多層感知機(jī)(MultiLayer Perceptrons, MLP)網(wǎng)絡(luò)用于預(yù)測安全能效。MLP網(wǎng)絡(luò)是一個通用的函數(shù)逼近器,因此我們可以使用MLP網(wǎng)絡(luò)來擬合環(huán)境描述符和RIS反射向量之間的函數(shù)關(guān)系。所提出的MLP網(wǎng)絡(luò)模型的組件定義如下。
3.1.1 網(wǎng)絡(luò)輸入
將神經(jīng)網(wǎng)絡(luò)模型的輸入定義為用戶、AP, Eve與RIS之間,以及用戶與AP/Eve之間的信道增益
3.1.3 網(wǎng)絡(luò)輸出
MLP模型由1個輸入層,Q-1個隱藏層和1個輸出層組成。如圖2所示,各層完全連接。網(wǎng)絡(luò)中的第q層具有Nq個神經(jīng)元,每個神經(jīng)元都可以獲取前一層中所有神經(jīng)元的輸出。隱藏層中的所有神經(jīng)元均使用整流線性單位(ReLU)作為激活函數(shù)。
圖2 多層感知器(MLP)網(wǎng)絡(luò)
所提Deep-RIS算法分為兩個階段,即訓(xùn)練階段(1)和預(yù)測階段(2)。表1中給出了實施Deep-RIS算法的詳細(xì)步驟。
表1 基于深度神經(jīng)網(wǎng)絡(luò)的DeepRIS(算法1)
在訓(xùn)練階段,RIS系統(tǒng)獲得每個通道相干塊的CSI作為樣本數(shù)據(jù),然后為RIS反射向量碼本中的每個碼字計算相應(yīng)的安全能效。這些安全能效構(gòu)成了安全能效向量,它是樣本數(shù)據(jù)的標(biāo)簽,而與最大安全能效相對應(yīng)的碼字就是最佳RIS反射向量。然后將樣本數(shù)據(jù)和標(biāo)簽輸入到MLP中進(jìn)行訓(xùn)練。同時,RIS使用最佳反射向量進(jìn)行數(shù)據(jù)傳輸。
MLP訓(xùn)練完成后,可以使用MLP來預(yù)測RIS反射向量。RIS系統(tǒng)獲得每個信道相干塊的信道狀態(tài)描述符,然后將其輸入到訓(xùn)練后的MLP中。MLP可以輸出安全能效向量,并在向量的元素中選擇最大的安全能效,其對應(yīng)的碼字是最優(yōu)的RIS反射向量。然后,RIS可以使用此最佳反射向量來傳輸數(shù)據(jù)。
本節(jié)先介紹仿真的相關(guān)參數(shù)設(shè)置和數(shù)據(jù)集,然后介紹仿真結(jié)果。
4.1.1 系統(tǒng)模型參數(shù)
仿真采用第2節(jié)中給出的系統(tǒng)模型,該模型具有1個RIS,可以反射從發(fā)射器(用戶)到接收器(AP/Eve)的信號。如圖3所示,接收器AP和Eve固定,發(fā)射器(用戶)在指定的x-y網(wǎng)格中隨機(jī)部署。使用深度 MIMO數(shù)據(jù)集的室外射線跟蹤場景“O1”[16]來實現(xiàn)此系統(tǒng)模型的設(shè)置。如圖3所示,在“O1”場景中選擇BS 3作為RIS;在R850行中部署AP和Eve,其中第90列的用戶作為AP,第100列的用戶作為Eve;用戶候選部署位置的x-y網(wǎng)格范圍包括從R1000行到R1200行(每行包括181個點)的36200個點。假設(shè)發(fā)送器(用戶)和接收器接收器(AP/Eve)均具有單個天線,系統(tǒng)已知發(fā)射器/接收器與RIS之間的全部信道狀態(tài)信息。RIS在3.5 GHz載波頻率下進(jìn)行工作,仿真所采用的RIS天線數(shù)有:8×8(M=64) ,10×10(M=100),12×12(M=144) ,14×14(M=196 ) ,16×16(M=256),18×18(M=324 ),20×20(M=400),22×22(M=484 ),24×24(M=576)。天線單元的增益為3 dBi,發(fā)射功率為35 dBm[31–33]。表2總結(jié)了基于“O1”場景所采用的系統(tǒng)及Deep MIMO數(shù)據(jù)集參數(shù)。
表2 系統(tǒng)及深度MIMO數(shù)據(jù)集參數(shù)
圖3 室外射線跟蹤場景“O1”
4.1.2 信道狀態(tài)信息
4.1.3 反射向量碼本歸一化的采樣信道,其中KDL≤K,則神經(jīng)網(wǎng)絡(luò)輸入向量的長度為 2MKDL。全連接神經(jīng)網(wǎng)絡(luò)架構(gòu)由1個輸入層、3個隱藏層和1個輸出層組成。各層的節(jié)點數(shù)分別為 2MKDL,M,4M,4M,M,其中M為RIS天線數(shù)。神經(jīng)網(wǎng)絡(luò)輸出向量的長度為|P|=M。發(fā)射器(用戶)候選部署位置的x-y網(wǎng)格范圍,深度學(xué)習(xí)的數(shù)據(jù)集共有36200個數(shù)據(jù)。將此數(shù)據(jù)集分成訓(xùn)練集和測試集兩組,分別獲得30000個和6200個的數(shù)據(jù)。設(shè)定訓(xùn)練批次大小為500個樣本和50%的輟學(xué)(dropout)率。在每個ReLU層之后添加1個輟學(xué)層。
當(dāng)對MLP進(jìn)行迭代訓(xùn)練時,將每次迭代(iteration)輸入的帶標(biāo)簽的樣本數(shù)據(jù)集稱為一個batch。在這里,本文設(shè)置了500個樣本數(shù)據(jù)以形成1個batch。本文訓(xùn)練樣本數(shù)據(jù)集共有30000個樣本數(shù)據(jù),因此需要60次迭代才能將整個訓(xùn)練樣本數(shù)據(jù)集輸入到MLP。本文使用整個訓(xùn)練樣本數(shù)據(jù)集并執(zhí)行MLP的完整訓(xùn)練的操作稱為epoch,因此1個epoch包含60次迭代。本文執(zhí)行了1200次迭代,因此在訓(xùn)練MLP的整個過程中有20個epoch。
本節(jié)中評估了提出的深度 RIS算法的RIS反射向量設(shè)計方案的可達(dá)安全能量效率。將這些安全能量效率與理想算法的上限安全能量效率進(jìn)行比較,假設(shè)理想的算法也已知全部信道狀態(tài)信息。在圖4中,RIS單元個數(shù)分別采用了10×10,14×14,18×18和22×22。仿真時的信道僅包括最強(qiáng)的信道路徑,即L=1。圖4顯示了所提出的深度學(xué)習(xí)(DL)解決方案的安全能量效率在經(jīng)過訓(xùn)練之后可以接近最佳上限。
圖4給出了不同RIS單元個數(shù)下genie-aided算法、DL-RIS算法對應(yīng)的可達(dá)安全能量效率曲線圖,其中DL-RIS算法的數(shù)據(jù)均取自由30000個樣本訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)的可達(dá)安全能量效率。如圖4所示,在每種RIS單元個數(shù)下,DL-RIS算法的可達(dá)安全能量效率均接近于genie-aided算法的上限安全能量效率。此外,在現(xiàn)有與信號交互的RIS單元個數(shù)(M)范圍內(nèi),genie-aided算法與DL-RIS算法的安全能量效率均隨著M的增加而增大。由于計算機(jī)性能限制,仿真時設(shè)置M的范圍較小,未能找出安全能量效率最大化的最優(yōu)解MDL。
圖4 基于不同RIS單元個數(shù)的DL算法與理想的算法的安全能量效率對比
本文研究了RIS輔助的無線通信系統(tǒng)的物理層安全性,旨在通過共同設(shè)計相位反射向量和反射單元的數(shù)量來最大化系統(tǒng)的安全能效。 特別提出了一種基于DL的算法來獲得近似最優(yōu)解,而這通常是傳統(tǒng)方法無法解決的。仿真結(jié)果表明,提出的DL-RIS算法以較低的計算復(fù)雜度實現(xiàn)了最佳的安全能效。在仿真中提出的RIS數(shù)量范圍內(nèi),本文發(fā)現(xiàn)優(yōu)化RIS的反射向量可以提高安全能效。通常,安全能效隨著RIS數(shù)量的增加而增加,但是隨著反射單元數(shù)量的變化,能源效率并不總是提高。