雷繼兆,李瀟楠,秦 浩
(1.中國航天科技集團(tuán)東方紅衛(wèi)星移動通信有限公司,北京 100086;2.西安電子科技大學(xué) 綜合業(yè)務(wù)網(wǎng)國家重點實驗室,西安 710071)
隨著第5代移動通信系統(tǒng)(5G)的發(fā)展,大量應(yīng)用場景不斷涌現(xiàn),基于位置服務(wù)(Location Based Service,LBS)的技術(shù)[1]受到了研究人員的廣泛關(guān)注。例如,在5G低時延高可靠、干擾異常復(fù)雜的場景下,每個用戶的干擾情況主要取決于用戶的位置分布以及資源調(diào)度,準(zhǔn)確獲取用戶的位置信息將有助于基站在資源調(diào)度和數(shù)據(jù)傳輸過程中有意識地規(guī)避或者抑制干擾,從而降低傳輸差錯概率,提高系統(tǒng)容量[2]。因此,基站準(zhǔn)確獲取用戶的位置信息不僅是5G多種應(yīng)用場景的基本功能需求,還能對基站的資源調(diào)度過程起到積極作用。
通??梢越柚l(wèi)星來進(jìn)行定位,如“北斗”衛(wèi)星導(dǎo)航系統(tǒng)、全球定位系統(tǒng)等。該方法盡管定位精度很高,但是屬于終端自主定位,與基站無關(guān)。通過基站與終端的信息交互,使基站能夠獲取終端位置也有著廣泛的應(yīng)用需求。現(xiàn)有技術(shù)主要分為兩類:基于測距的定位技術(shù)與基于位置指紋的定位技術(shù)[2]。常用的測距技術(shù)包括基于到達(dá)時間(Time of Arrival,ToA)[4]、到達(dá)時間差(Time Difference of Arrival,TDoA)[5-7]、到達(dá)角度(Angle of Arrival,AoA)[8-9]等方法。文獻(xiàn)[4]提出的基于能量值檢測的最大似然估計方法聯(lián)合了ToA和AoA技術(shù),降低了對收發(fā)機(jī)時間同步的要求。文獻(xiàn)[5]進(jìn)而提出利用異步到達(dá)時間差技術(shù)來改進(jìn)TDoA對時間同步的要求。此外,文獻(xiàn)[9]提出了基于最小二乘的估計器,有效降低了AoA定位對設(shè)備精度的要求。上述基于測距的方法雖然在一定程度上減輕了收發(fā)機(jī)無法完全同步對定位精度的影響,但是測距信息的獲取會消耗大量的計算資源,增加了計算復(fù)雜度,同時易受非視距環(huán)境的影響。另一類基于位置指紋信息的定位技術(shù)[10-13]則是先收集用戶的位置指紋信息構(gòu)建指紋庫,然后將實時測得的位置指紋信息和指紋庫進(jìn)行匹配,從而實現(xiàn)定位。位置指紋信息主要由該位置處的信道狀態(tài)構(gòu)成。常見的位置指紋信息有信道狀態(tài)信息(Channel State Information,CSI)和接收信號強(qiáng)度(Received Signal Strength,RSS)。其中RSS是對接收信號質(zhì)量的粗粒度反映,無法精確反映信號的瞬時變化,而CSI是物理層的一個細(xì)粒度值,能夠反映不同頻率上的幅度增益和相位偏移,穩(wěn)定性和靈敏度相比RSS更高,可以有效降低定位誤差。文獻(xiàn)[12]提出將每個用戶的波束RSS作為指紋信息并利用機(jī)器學(xué)習(xí)手段對用戶進(jìn)行定位,實現(xiàn)了平均定位誤差2 m的定位精度。文獻(xiàn)[13]進(jìn)一步結(jié)合5G毫米波與波束賦形技術(shù)將輻射到每個接收設(shè)備上的信號功率時延分布(Power Delay Profile,PDP)采集作為指紋并通過時間卷積網(wǎng)絡(luò)的短序列,實現(xiàn)了室外平均定位誤差1.78 m的定位精度。上述指紋定位方法均以物理層信息為輸入,主要實現(xiàn)單用戶定位。
與上述兩類技術(shù)不同,本文提出了利用MAC層調(diào)度信息作為位置指紋,進(jìn)而結(jié)合深度學(xué)習(xí)技術(shù)來實現(xiàn)基站快速估計用戶位置信息。本文算法主要優(yōu)勢在于:一方面,利用調(diào)度過程中自然產(chǎn)生的諸如資源分配結(jié)果、真實傳輸后的調(diào)度效果等信息來完成定位,無需額外的信令開銷,大大降低了數(shù)據(jù)采集成本;另一方面,利用深度學(xué)習(xí)挖掘多個用戶之間的位置關(guān)系,從而可以同時實現(xiàn)多用戶定位。本文所提方法既可作為現(xiàn)有定位算法的有益補(bǔ)充,也可指導(dǎo)基站在資源調(diào)度[14]過程中有意識地規(guī)避或者抑制干擾,提高系統(tǒng)容量。
假設(shè)有N個相鄰基站記為集合B={b|b=1,2,…,N},M個隨機(jī)分布在N個基站下的用戶記為集合U={u|u=1,2,…,M},每個用戶u根據(jù)自己的接收信號強(qiáng)度選擇接入基站b(u)∈B。每個基站的可用資源塊集合表示為C={c|c=1,2,…,G},其中G為系統(tǒng)劃分的資源塊組(Resource Block Group,RBG)的總數(shù)。例如在FR1頻段下,子載波間隔Δf=15 kHz,系統(tǒng)帶寬5 MHz時,系統(tǒng)劃分RBG的總數(shù)G=25;Δf=60 kHz,系統(tǒng)帶寬100 MHz時,G=135。
在移動通信的下行調(diào)度過程中,基站以傳輸時間間隔(Transmission Time Interval,TTI)為調(diào)度周期,每個TTI都要根據(jù)用戶業(yè)務(wù)請求以及信道質(zhì)量信息按照某種調(diào)度算法為用戶分配不同的RBG,常用的調(diào)度算法有最大載干比算法(Maximum C/I,MaxC/I)[15]、輪詢算法(Round Robin,RR)[16]以及比例公平算法(Proportional Fair,PF)[17]等。調(diào)度算法針對用戶u的資源分配結(jié)果可表示為
γu=(rbgu,1,rbgu,2,…,rbgu,G)T。
(1)
式中:rbgu,c∈{0,1}表示用戶u對基站b(u)的第c個資源塊的占用情況,0表示空閑,1表示占用。若某個TTI所有分配了資源的用戶(下文簡寫為有效用戶)記為集合A={a1,a2,…,am},則該TTI的資源分配結(jié)果可表示為
R=[γa1,γa2,…,γam]。
(2)
由于每個TTI下有效用戶數(shù)m不確定,因此不同的TTI中矩陣R的維度不同。
各基站根據(jù)以上分配結(jié)果,在相應(yīng)的RBG資源上為每個有效用戶傳輸相應(yīng)的業(yè)務(wù)數(shù)據(jù)。由于信道條件不同以及相互之間可能存在的同頻干擾,不同用戶接收機(jī)處將測得不同的信道狀態(tài)信息,數(shù)據(jù)傳輸可能成功或失敗。如果用戶本次數(shù)據(jù)傳輸能夠正確解調(diào)譯碼,則其將向基站上報ACK=1,否則上報ACK=0。需要說明的是,在5G這種干擾受限系統(tǒng)中,數(shù)據(jù)傳輸失敗主要由同頻干擾引起,因此傳輸差錯率反映了同頻干擾的強(qiáng)弱。此外,用戶還周期性地向基站上報當(dāng)前時刻的信道質(zhì)量指示(Channel Quality Indication,CQI)。CQI是用戶信干噪比(Signal-to-Interference plus Noise Ratio,SINR)的某種粗量化映射,也能夠反映信道質(zhì)量的好壞和同頻干擾的強(qiáng)弱。因此用戶u該次資源分配的效果可表示為向量eu=(ACKu,CQIu)T,系統(tǒng)中所有有效用戶的調(diào)度效果可表示為
E=[ea1,ea2,…,eam]。
(3)
綜上所述,調(diào)度效果矩陣E在一定程度上反映了本輪數(shù)據(jù)傳輸中用戶之間的干擾強(qiáng)度。換言之,ACK和CQI均為用戶SINR的函數(shù)。
SINR是有用信號功率、干擾信號功率以及噪聲功率相對關(guān)系的度量,在實際傳輸過程中,有用信號功率與干擾功率受路徑傳播損耗的影響,而路徑傳播損耗又取決于用戶與各基站的距離。具體來說,基站b(u)下用戶u的SINR可表示為
(4)
式中:Pu,k是用戶u收到的來自基站k的功率;Pu=Pu,b(u)是用戶u收到的來自基站b(u)的有用信號功率;Nu是用戶u的噪聲功率;Fu是與用戶u占用相同RBG的相鄰小區(qū)集合,即當(dāng)基站b(u)下的用戶u占用了rbgu,c的同時基站b(v)下的用戶v也占用了rbgv,c。換言之,基站b(v)是對用戶u有干擾的基站,所有對用戶u有干擾的基站集合即為Fu:
(5)
式中:<γu,γv>=γuT·γv表示用戶u與用戶v占用相同RBG的個數(shù)。Pu,k可進(jìn)一步表示為
(6)
式中:pk是基站k在每個RBG上的發(fā)射功率;du,k是用戶u到基站k的歐氏距離;μu,k是干擾基站k分得的資源中與用戶u占用相同RBG的總RBG個數(shù),可表示為
μu,k=∑v:b(v)=k<γu,γv>;
(7)
?(du,k)是基站k到用戶u的路徑損耗,可表示為
(8)
式中:d0為參考距離(單位m),f為載波頻率(單位Hz),l為系統(tǒng)損耗,n為路徑損耗指數(shù),c是光速。
以上分析表明,用戶SINR不僅取決于用戶位置,還取決于資源分配結(jié)果R=[γa1,γa2,…,γam]。也就是說在各用戶SINR已知的條件下,可以利用R來反推用戶位置。然而工程實現(xiàn)中基站無法獲得用戶的SINR,盡管終端能夠利用導(dǎo)頻信號估計出SINR,但是終端上報給基站的是CQI,CQI只是SINR的某種粗量化。換言之,基站只能獲取CQI,并不知道SINR的真實值。前文已經(jīng)指出,用戶SINR又進(jìn)一步?jīng)Q定了資源調(diào)度效果E,或者說E在一定程度上反映了用戶的SINR,其基本關(guān)系如圖1所示。對于基站來說,資源調(diào)度效果E、資源分配結(jié)果R都是可以直接得到的信息,因此本文提出在SINR未知的情況下,通過E和R來估計用戶位置的思路?;谠撍悸?,第2節(jié)詳細(xì)討論用戶定位方法。
圖1 用戶位置定位關(guān)系圖
對于基站來說,自身位置是已知的,只要求得用戶與基站之間的距離ρ及相對角度α就可以定位用戶的位置,如圖2所示。由于上行方向上采用了時間提前量TA技術(shù),所以每個用戶的距離ρ對于基站來說都是已知的,在ρ已知的條件下獲取角度α就成為定位用戶位置的關(guān)鍵。接下來詳細(xì)解釋如何通過E、R來估計每個用戶的角度α。
圖2 用戶定位示意圖
由第1節(jié)所述的多用戶定位原理可知,資源分配結(jié)果R、資源調(diào)度效果E等信息與用戶位置之間存在某種高度非線性的關(guān)系,而深度學(xué)習(xí)網(wǎng)絡(luò)具有自主學(xué)習(xí)能力,能夠動態(tài)感知環(huán)境,且適應(yīng)能力強(qiáng),非常適合用來擬合上述非線性關(guān)系。與此同時,考慮到同一時刻下所有發(fā)起請求的用戶的信息數(shù)據(jù)信息量大,數(shù)據(jù)維度較高,依靠傳統(tǒng)的定位技術(shù)無法高效地解決這個問題。深度學(xué)習(xí)作為處理高維海量數(shù)據(jù)強(qiáng)有力的技術(shù)手段在圖像、語音、視頻、自然語言處理等領(lǐng)域都取得了巨大的成功,所以本文利用深度學(xué)習(xí)來解決用戶定位問題,其基本框架如圖3所示。首先建立用戶定位數(shù)據(jù)集,并搭建深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN),然后利用有監(jiān)督的學(xué)習(xí)方法將數(shù)據(jù)集作為DNN網(wǎng)絡(luò)的輸入輸出來實現(xiàn)用戶定位。
圖3 用戶定位框架
由圖3可知,為了能夠利用深度學(xué)習(xí)技術(shù)進(jìn)行用戶定位,首先要建立一個高質(zhì)量的用戶定位數(shù)據(jù)集,其建立過程主要包括三個步驟,如圖4所示。
圖4 數(shù)據(jù)集搭建流程圖
首先利用網(wǎng)絡(luò)級模擬器NS3搭建仿真場景。在設(shè)定的區(qū)域內(nèi),設(shè)置N個位置固定的基站和M個隨機(jī)分布且以vmin~vmax的速度隨機(jī)游走的用戶,并設(shè)置基站按照某種調(diào)度算法為有業(yè)務(wù)請求的用戶分配資源,盡可能真實地模擬用戶和基站之間的數(shù)據(jù)通信過程。
之后在上述仿真場景下,提取每個TTI下的下行資源分配結(jié)果R、資源調(diào)度效果E、用戶與基站的距離ρ以及用戶的無線網(wǎng)絡(luò)標(biāo)識(Radio Network Tempory Identity,RNTI)和所屬基站等信息作為位置指紋信息。在這個過程中,那些未分配到資源的用戶不存在數(shù)據(jù)傳輸,既不會干擾其他用戶,也不會受到其他用戶干擾,也就說和E、R沒有關(guān)系,這些用戶對于定位算法來說是無效用戶,因此需要在數(shù)據(jù)處理過程中將其去除。
此外,E是基站在執(zhí)行了R后經(jīng)過一段時延才得到,如圖5所示,即在t時刻對用戶的資源分配需要經(jīng)過時延τ才能獲取到用戶的資源調(diào)度效果,因此在構(gòu)造數(shù)據(jù)集時還需要將t時刻的資源分配結(jié)果R和t+τ時刻的資源調(diào)度效果E進(jìn)行對齊操作。最終得到每個TTI下的用戶定位特征信息,可用矩陣D∈m×z表示:
圖5 對齊操作
(9)
式中:qm是由每個TTI下用戶m的身份標(biāo)識及其到接入基站的距離ρ構(gòu)成的,可表示為
qm=(am,b(am),ρm)T。
(10)
然而,如果以上述特征信息D直接作為神經(jīng)網(wǎng)絡(luò)的樣本特征建立數(shù)據(jù)集,樣本質(zhì)量并不好,主要是因為數(shù)據(jù)集樣本之間存在較多的冗余信息,具體表現(xiàn)為:一方面,由于TTI的時間間隔很短,用戶位置及有關(guān)特征變化并不明顯,如果將每個TTI下的D作為一個樣本,那么多個連續(xù)TTI對應(yīng)的樣本之間存在著強(qiáng)相關(guān)性,冗余信息太多;另一方面,用戶一般只在某個區(qū)域內(nèi)活動,這使得用戶的位置信息僅集中在設(shè)定區(qū)域的某個范圍內(nèi),從而導(dǎo)致提取出的用戶位置信息存在相關(guān)性強(qiáng),不具有普遍性。因此,為了解決數(shù)據(jù)樣本中存在高度相關(guān)性的問題,本文針對上述兩方面表現(xiàn)分別提出如下的數(shù)據(jù)去相關(guān)方法。
首先,將多個TTI的用戶特征信息進(jìn)行合并,作為神經(jīng)網(wǎng)絡(luò)的一個樣本,以此來解決單個TTI信息作為樣本時存在的強(qiáng)相關(guān)性。在合并多個TTI信息的時候,由于不同TTI發(fā)起請求的用戶數(shù)目以及分配資源的用戶數(shù)目是不同的,每個TTI的特征信息D維度是變化的,為此本文將每個樣本的維度固定為M,然后將n個TTI的特征信息進(jìn)行合并得到單個樣本的特征矩陣F∈M×z:
F=[Dt1T,Dt2T,…,DtnT]T。
(11)
其中超過M的部分直接去除。對于每個樣本的標(biāo)簽的處理也是通過仿真場景中獲取得到用戶和基站的坐標(biāo)信息,然后將其轉(zhuǎn)換為以基站為中心的極坐標(biāo)形式后提取角度α??捎镁仃嘗∈M×z來表示上述每個樣本特征矩陣所對應(yīng)的標(biāo)簽:
L=[lt1,lt2,…,ltn]T,
(12)
l=(α1,α2,…,αm)。
(13)
式中:l為一個TTI時刻下所有有效用戶的角度向量。所以用戶定位數(shù)據(jù)集中的一個樣本即可用符號S=[F,L]表示。
其次,為了解決由于用戶運(yùn)動區(qū)域較小帶來的數(shù)據(jù)相關(guān)性和不具有普遍性的問題,本文搭建了W個用戶初始分布不同的仿真場景,保證用戶在設(shè)定區(qū)域內(nèi)的位置分布足夠均勻,進(jìn)而分別使用前述方法采集樣本構(gòu)成數(shù)據(jù)集。
最后,利用數(shù)據(jù)去相關(guān)在上述W個場景中共取φ個樣本,建立用戶定位數(shù)據(jù)集J={S1,S2,…,Sφ}用于訓(xùn)練。
DNN網(wǎng)絡(luò)結(jié)構(gòu)由多層全連接層構(gòu)成。全連接層(FC)是將每一個結(jié)點與上一層的所有結(jié)點相連,用來把上一層提取的特征綜合起來,達(dá)到預(yù)測的目的。單層FC層有時無法解決非線性問題,而FC層數(shù)越多,每層神經(jīng)元個數(shù)越多,非線性表達(dá)能力越好,模型的學(xué)習(xí)能力越強(qiáng),但是也容易造成過擬合。同時FC中會設(shè)置激活函數(shù)來增加模型的非線性表達(dá)能力,常見的激活函數(shù)有Relu、tanh與sigmoid函數(shù)。其中tanh函數(shù)與sigmoid函數(shù)容易在輸入過大或很小出現(xiàn)梯度消失問題,而Relu則能夠較好解決梯度消失問題,且計算簡單,收斂較快。本文采用Relu,即
(14)
為了提高預(yù)測準(zhǔn)確率,本文采用的損失函數(shù)是均方誤差MSE,如下式所示:
(15)
式中:X為網(wǎng)絡(luò)的輸入,f(X)為網(wǎng)絡(luò)的輸出(預(yù)測的用戶角度),Y為實際的輸出(用戶的真實角度),ω為樣本個數(shù)。
最后通過調(diào)節(jié)學(xué)習(xí)率、神經(jīng)元個數(shù)、網(wǎng)絡(luò)層數(shù)等參數(shù)來提高模型的準(zhǔn)確率和泛化性。
根據(jù)第2節(jié)提出的深度學(xué)習(xí)指紋定位技術(shù),本文利用NS3網(wǎng)絡(luò)模擬器搭建了移動通信仿真場景,建立數(shù)據(jù)集,并通過深度學(xué)習(xí)DNN網(wǎng)絡(luò)進(jìn)行用戶定位的實驗。實驗過程仿真參數(shù)設(shè)置如表1所示。
表1 仿真參數(shù)設(shè)置
為了優(yōu)化網(wǎng)絡(luò)模型性能,提升定位精度,我們對網(wǎng)絡(luò)參數(shù)的設(shè)置進(jìn)行了分析,將DNN輸出的用戶位置和實際用戶位置之間的歐氏距離作為衡量定位精度的標(biāo)準(zhǔn)。
首先,對網(wǎng)絡(luò)層數(shù)和神經(jīng)元的個數(shù)分別進(jìn)行對比實驗,結(jié)果如圖6所示。當(dāng)各層神經(jīng)元個數(shù)均為1 024時,對比不同的網(wǎng)絡(luò)層數(shù)可以看出,4層的網(wǎng)絡(luò)結(jié)構(gòu)明顯優(yōu)于其他網(wǎng)絡(luò)層數(shù);在網(wǎng)絡(luò)層數(shù)同為4層時,每層1 024和2 048個神經(jīng)元條件下的準(zhǔn)確率幾乎相當(dāng)且都明顯優(yōu)于每層512或256個神經(jīng)元的情況,但是2 048個神經(jīng)元的網(wǎng)絡(luò)計算復(fù)雜度更高。基于表1的參數(shù)設(shè)置,結(jié)合定位準(zhǔn)確率和網(wǎng)絡(luò)復(fù)雜度考慮,在后續(xù)實驗中,本文采用了4層全連接、每層1 024個神經(jīng)元的DNN網(wǎng)絡(luò)結(jié)構(gòu)。
(a)不同網(wǎng)絡(luò)層數(shù)的準(zhǔn)確率對比
圖7分析了不同學(xué)習(xí)率下的定位精度及模型學(xué)習(xí)速度,可以看出,學(xué)習(xí)率為10-4的曲線在迭代8 000次后開始趨于穩(wěn)定,學(xué)習(xí)率為10-5的曲線在迭代1 000次后開始趨于穩(wěn)定,學(xué)習(xí)率為10-6的沒收斂,明顯看出10-4學(xué)習(xí)率下具有更快的收斂速度。同時,該曲線有著較高的準(zhǔn)確率。該曲線在學(xué)習(xí)過程初期出現(xiàn)明顯振蕩現(xiàn)象,在8 000次之后,振蕩減輕,說明此時的網(wǎng)絡(luò)模型已有較好的學(xué)習(xí)能力。
圖7 不同學(xué)習(xí)率下的定位準(zhǔn)確率比較
本文采用SGD作為網(wǎng)絡(luò)優(yōu)化器,將數(shù)據(jù)集中20%的數(shù)據(jù)作為驗證集,來評估網(wǎng)絡(luò)模型的收斂性,實驗結(jié)果如圖8所示。在9 000次迭代之后,網(wǎng)絡(luò)模型基本收斂,驗證集在7 200次和10 900次有輕微的振蕩。此外,本文分析了在不同精度下的用戶定位準(zhǔn)確率,如表2所示。在定位精度10 m時,所提方法可以實現(xiàn)90%以上的定位準(zhǔn)確率。
表2 不同的定位精度下用戶的定位準(zhǔn)確率
圖8 網(wǎng)絡(luò)模型收斂性分析
本文方法與文獻(xiàn)[13]的算法采用了完全不同的機(jī)理,定位目的也有所不同。文獻(xiàn)[13]利用物理層的PDP信息作為定位依據(jù),平均定位誤差在1.78 m,主要用于室外單用戶的精準(zhǔn)定位。而本文則利用資源調(diào)度信息,不需要占用額外的時間和計算資源即可完成多用戶的同時定位,獲得小區(qū)內(nèi)用戶位置的整體分布,可主要用于預(yù)測業(yè)務(wù)熱點,相應(yīng)指導(dǎo)基站在資源調(diào)度過程中有意識地規(guī)避或者抑制干擾,從而提高系統(tǒng)容量。
本文提出的利用MAC層調(diào)度信息的深度學(xué)習(xí)指紋定位技術(shù),一方面可實現(xiàn)基站在定位精度10 m內(nèi)對多用戶定位的準(zhǔn)確率達(dá)到90%以上的效果,可為現(xiàn)有定位算法提供有益補(bǔ)充;另一方面將有利于基站在干擾異常復(fù)雜的場景下合理高效進(jìn)行資源調(diào)度,從而提高系統(tǒng)容量。因此,本文算法在實際工程應(yīng)用中有著獨特的應(yīng)用價值,同時本研究內(nèi)容與結(jié)論可為今后優(yōu)化5G空口資源調(diào)度問題提供一定的借鑒和參考。