摘要:基于射線仿真評(píng)估是5G無線網(wǎng)規(guī)劃選址常用方法,但該方法的評(píng)估依據(jù)是射線傳播仿真結(jié)果,缺少實(shí)際數(shù)據(jù)來做建模驗(yàn)證,與實(shí)際覆蓋情況有較大偏差。該文研究人工智能技術(shù)在5G無線網(wǎng)規(guī)劃選址方面的創(chuàng)新應(yīng)用,提出了一種基于LightGBM算法的覆蓋預(yù)測(cè)方法,可以更準(zhǔn)確地預(yù)測(cè)小區(qū)柵格的覆蓋場(chǎng)強(qiáng),顯著提高5G無線網(wǎng)規(guī)劃選址的精準(zhǔn)度。
關(guān)鍵詞:人工智能;LightGBM算法;5G無線網(wǎng)規(guī)劃;覆蓋預(yù)測(cè)
doi:10.3969/J.ISSN.1672-7274.2024.09.013
中圖分類號(hào):TM 715;TN929.53;TP 18 文獻(xiàn)標(biāo)志碼:A 文章編碼:1672-7274(2024)09-00-03
Research on 5G Wireless Network Coverage Prediction Method Based on LightGBM Algorithm
CHEN Jian
(China Mobile Guangxi Co., Ltd., Nanning 530028, China)
Abstract: Based on ray simulation evaluation, it is a commonly used method for 5G wireless network planning and site selection. However, the evaluation of this method is based on the results of ray propagation simulation, which lacks actual data for modeling and verification, and has a significant deviation from the actual coverage situation. This article studies the innovative application of artificial intelligence technology in the planning and location selection of 5G wireless networks, and proposes a coverage prediction method based on the LightGBM algorithm, which can more accurately predict the coverage field strength of small grid cells and significantly improve the accuracy of 5G wireless network planning and location selection.
Keywords: artificial intelligence; lightGBM algorithm; 5G wireless network planning; coverage prediction
0 引言
基于射線仿真評(píng)估是當(dāng)前業(yè)內(nèi)常用的無線基站規(guī)劃選址方法,該方法是先確定選址范圍和選址位置,根據(jù)規(guī)則生成掛高、方向角和下傾角這三個(gè)工參信息,后通過生成的選址方案包括站址經(jīng)緯度、小區(qū)工參,對(duì)站址覆蓋場(chǎng)強(qiáng)進(jìn)行仿真[1],根據(jù)仿真的結(jié)果評(píng)估建站后的覆蓋情況,判斷選址方案是否可行,評(píng)估依據(jù)是射線傳播仿真結(jié)果,僅根據(jù)經(jīng)驗(yàn)?zāi)P蛠碜龈采w仿真,沒有通過實(shí)際數(shù)據(jù)來做建模驗(yàn)證,與實(shí)際覆蓋情況有較大偏差。因此,有必要研究通過人工智能手段,提升覆蓋預(yù)測(cè)準(zhǔn)確度以支撐無線站址精準(zhǔn)規(guī)劃工作的新方法。
1 技術(shù)原理
通過采集現(xiàn)網(wǎng)MDT/OTT等高精度定位的實(shí)際覆蓋數(shù)據(jù)、實(shí)際的小區(qū)工參以及柵格小區(qū)數(shù)據(jù),結(jié)合樓宇圖層數(shù)據(jù)以及高程數(shù)據(jù)衍生出包括高度衍生特征、距離衍生特征、角度衍生特征以及遮擋衍生特征等建模特征。其中,MDT代表移動(dòng)數(shù)據(jù)采集,OTT代表超時(shí)時(shí)延測(cè)試,它們都是高精度定位技術(shù)中用于收集數(shù)據(jù)的方法。MDT是一種通過網(wǎng)絡(luò)收集移動(dòng)設(shè)備位置和性能數(shù)據(jù)的技術(shù),可以提供更準(zhǔn)確的位置信息和網(wǎng)絡(luò)性能數(shù)據(jù)。OTT測(cè)試則是一種測(cè)試方法,用于測(cè)量移動(dòng)設(shè)備與網(wǎng)絡(luò)之間的響應(yīng)時(shí)間和延遲,以確定網(wǎng)絡(luò)性能和服務(wù)質(zhì)量。將衍生特征作為訓(xùn)練特征,柵格的平均覆蓋場(chǎng)強(qiáng)作為標(biāo)簽,構(gòu)建小區(qū)覆蓋場(chǎng)強(qiáng)預(yù)測(cè)模型。對(duì)規(guī)劃站點(diǎn)小區(qū)進(jìn)行覆蓋預(yù)測(cè),根據(jù)預(yù)測(cè)的覆蓋強(qiáng)度,智能評(píng)估規(guī)劃站點(diǎn)的方位角、掛高等最優(yōu)組合,實(shí)現(xiàn)智能規(guī)劃方案推薦[2]。智能覆蓋預(yù)測(cè)步驟如圖1所示。
1.1 采集覆蓋預(yù)測(cè)模型訓(xùn)練數(shù)據(jù)
采集現(xiàn)網(wǎng)MDT/OTT等高精度定位的實(shí)際覆蓋數(shù)據(jù)、實(shí)際的小區(qū)工參以及柵格小區(qū)數(shù)據(jù)作為小區(qū)覆蓋預(yù)測(cè)模型的訓(xùn)練數(shù)據(jù)。同時(shí)后續(xù)特征衍生需要采集樓宇圖層數(shù)據(jù)以及高程數(shù)據(jù)。根據(jù)小區(qū)理想覆蓋半徑(指在無線通信網(wǎng)絡(luò)中,每個(gè)小區(qū)的輻射范圍內(nèi)的信號(hào)質(zhì)量和性能能夠滿足設(shè)計(jì)要求的半徑距離。在移動(dòng)通信系統(tǒng)中,小區(qū)是基站提供服務(wù)的最小單位,小區(qū)理想覆蓋半徑是基站信號(hào)覆蓋范圍內(nèi)的一個(gè)重要參數(shù))將小區(qū)劃分為4種覆蓋場(chǎng)景,分別是:理想覆蓋半徑小于等于400 m;理想覆蓋半徑大于400 m小于等于800 m;理想覆蓋半徑大于800 m小于等于1 500 m;理想覆蓋半徑大于1 500 m。對(duì)每種覆蓋場(chǎng)景采集一定量小區(qū)的工參及柵格小區(qū)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。
1.2 訓(xùn)練數(shù)據(jù)預(yù)處理
完成現(xiàn)網(wǎng)大量小區(qū)工參以及柵格小區(qū)數(shù)據(jù)(20 m×20 m)和現(xiàn)網(wǎng)MDT/OTT等高精度定位的實(shí)際覆蓋數(shù)據(jù)采集后,需要對(duì)數(shù)據(jù)進(jìn)行清洗以及特征衍生操作。
(1)數(shù)據(jù)清洗:對(duì)于指標(biāo)異常數(shù)據(jù)(指標(biāo)值在正常取值范圍之外的數(shù)據(jù)記錄),以及指標(biāo)缺失數(shù)據(jù)(如小區(qū)柵格場(chǎng)強(qiáng)均值等缺失),進(jìn)行異常值清洗剔除及缺失值填充。數(shù)據(jù)采集異常以及數(shù)據(jù)同步異常可能是導(dǎo)致數(shù)據(jù)異常和缺失的原因。
(2)特征衍生:根據(jù)現(xiàn)網(wǎng)MDT/OTT等高精度定位的實(shí)際覆蓋數(shù)據(jù)、小區(qū)工參、高程數(shù)據(jù)以及樓宇圖層數(shù)據(jù)對(duì)覆蓋柵格數(shù)據(jù)做特征衍生,衍生特征主要包括高度衍生特征、距離衍生特征、角度衍生特征以及遮擋衍生特征。
1.3 LightGBM覆蓋預(yù)測(cè)模型構(gòu)建
將衍生的特征以及小區(qū)工參特征作為訓(xùn)練特征,柵格小區(qū)的平均覆蓋場(chǎng)強(qiáng)作為標(biāo)簽進(jìn)行訓(xùn)練。采用LightGBM(Light Gradient Boosting Machine)算法來構(gòu)建小區(qū)覆蓋預(yù)測(cè)模型。LightGBM是一個(gè)實(shí)現(xiàn)GBDT算法的框架,支持高效率的并行訓(xùn)練,并且具有更快的訓(xùn)練速度、更低的內(nèi)存消耗、更好的準(zhǔn)確率、支持分布式、可以快速處理海量數(shù)據(jù)等優(yōu)點(diǎn)。
LightGBM采用多棵樹串行的結(jié)構(gòu),每棵樹都會(huì)輸出一個(gè)預(yù)測(cè)值,將多棵樹結(jié)果累加得到最后的輸出值。訓(xùn)練過程中新的一棵樹的訓(xùn)練是為了擬合上一棵樹的殘差(residual)。即不完全信任每一個(gè)棵殘差樹,而是認(rèn)為每棵樹只學(xué)到了真理的一小部分,通過多學(xué)幾棵樹彌補(bǔ)不足,最后達(dá)到擬合訓(xùn)練樣本的效果。模型構(gòu)建主要有以下步驟:
(1)數(shù)據(jù)劃分。將每個(gè)場(chǎng)景小區(qū)的采集數(shù)據(jù)以6∶2∶2的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集以及測(cè)試集,驗(yàn)證集為模型效果驗(yàn)證的數(shù)據(jù)集,調(diào)優(yōu)等工作需在驗(yàn)證集上進(jìn)行。測(cè)試集為測(cè)試模型最終效果的數(shù)據(jù)集。
(2)模型參數(shù)配置。對(duì)模型參數(shù)進(jìn)行初始化配置,LightGBM模型分為分類模型和回歸模型,采用此模型目的為預(yù)測(cè)場(chǎng)強(qiáng)覆蓋值,所以屬于回歸模型,主要的參數(shù)包括objective、boosting_type、樹的最大深度max_depth等。
(3)模型訓(xùn)練。由于不同場(chǎng)景覆蓋特征可能存在差異,因此可分場(chǎng)景構(gòu)建小區(qū)覆蓋預(yù)測(cè)模型。分別構(gòu)建以下4個(gè)場(chǎng)景的模型:理想覆蓋半徑小于等于400 m;理想覆蓋半徑大于400 m小于等于800 m;理想覆蓋半徑大于800 m小于等于1 500 m;理想覆蓋半徑大于1 500 m。
分別將各場(chǎng)景訓(xùn)練集的小區(qū)柵格數(shù)據(jù)匯成一張寬表,以工參特征以及衍生的特征為訓(xùn)練特征、柵格平均覆蓋場(chǎng)強(qiáng)為訓(xùn)練標(biāo)簽來訓(xùn)練覆蓋場(chǎng)強(qiáng)預(yù)測(cè)模型。LightGBM采用多棵樹串行的結(jié)構(gòu),每棵樹都會(huì)輸出一個(gè)預(yù)測(cè)值,最好將多棵樹結(jié)果累加得到輸出值。
(4)模型優(yōu)化。模型優(yōu)化主要通過數(shù)據(jù)清洗、超參數(shù)優(yōu)化、特征優(yōu)化等方法實(shí)現(xiàn)。本項(xiàng)目主要優(yōu)化方法為對(duì)異常數(shù)據(jù)進(jìn)行清洗,清洗掉一些采樣點(diǎn)過少柵格。當(dāng)柵格采樣點(diǎn)過少時(shí),可能由于采樣點(diǎn)定位存在偏差,導(dǎo)致歸屬柵格出現(xiàn)偏差,則這些柵格覆蓋場(chǎng)強(qiáng)不可信。保留柵格采樣點(diǎn)數(shù)大于20的柵格,通過這種清洗方式,模型預(yù)測(cè)效果有了一些提升。
對(duì)超參數(shù)優(yōu)化通過隨機(jī)搜索尋優(yōu)法進(jìn)行。通過對(duì)每個(gè)超參數(shù)設(shè)置一定的搜索范圍,在驗(yàn)證集上驗(yàn)證每種隨機(jī)搜索到的超參數(shù)組合訓(xùn)練的模型效果,最后選擇模型效果最優(yōu)的超參數(shù)組合。
(5)模型存儲(chǔ)。模型優(yōu)化后需要保存最優(yōu)的4個(gè)場(chǎng)景模型,將模型保存為pkl模型文件。后續(xù)根據(jù)小區(qū)理想覆蓋半徑選擇對(duì)應(yīng)的場(chǎng)景,再加載此場(chǎng)景下的覆蓋預(yù)測(cè)模型,對(duì)小區(qū)的覆蓋情況進(jìn)行預(yù)測(cè),可以得到此小區(qū)每個(gè)覆蓋柵格的平均場(chǎng)強(qiáng)。
1.4 基于小區(qū)位置及工參進(jìn)行覆蓋預(yù)測(cè)
根據(jù)現(xiàn)網(wǎng)MDT/OTT等高精度定位的實(shí)際覆蓋數(shù)據(jù)、小區(qū)工參、高程數(shù)據(jù)以及樓宇圖層數(shù)據(jù)對(duì)覆蓋柵格數(shù)據(jù)做特征衍生,生成高度衍生特征、距離衍生特征、角度衍生特征以及遮擋衍生特征,根據(jù)理想覆蓋半徑,確定此小區(qū)屬于以下哪種覆蓋場(chǎng)景。根據(jù)覆蓋場(chǎng)景加載對(duì)應(yīng)的覆蓋場(chǎng)強(qiáng)預(yù)測(cè)模型,預(yù)測(cè)此小區(qū)柵格的平均場(chǎng)強(qiáng)[3]。根據(jù)規(guī)劃的小區(qū)經(jīng)緯度以及理想覆蓋半徑來生成小區(qū)柵格數(shù)據(jù),如表1所示。
根據(jù)小區(qū)工參、高程數(shù)據(jù)以及樓宇圖層數(shù)據(jù)對(duì)覆蓋柵格數(shù)據(jù)做特征衍生,生成高度衍生特征、距離衍生特征、角度衍生特征以及遮擋衍生特征,根據(jù)理想覆蓋半徑,確定此小區(qū)屬于哪種覆蓋場(chǎng)景。根據(jù)覆蓋場(chǎng)景加載對(duì)應(yīng)的覆蓋場(chǎng)強(qiáng)預(yù)測(cè)模型,預(yù)測(cè)此小區(qū)柵格的平均場(chǎng)強(qiáng) ,如表2所示。
2 應(yīng)用成效
對(duì)比現(xiàn)有基于射線仿真的選址方法,基于LightGBM算法的覆蓋預(yù)測(cè)更準(zhǔn)確,準(zhǔn)確率較射線仿真整體提升約20%以上。對(duì)比結(jié)果如表3所示。
通過采集現(xiàn)網(wǎng)MDT/OTT等高精度定位的實(shí)際覆蓋數(shù)據(jù)、小區(qū)工參以及柵格小區(qū)數(shù)據(jù),結(jié)合樓宇圖層數(shù)據(jù)以及高程數(shù)據(jù)衍生出包括高度衍生特征、距離衍生特征、角度衍生特征以及遮擋衍生特征等特征,通過實(shí)際覆蓋場(chǎng)強(qiáng)數(shù)據(jù)建模,可更加準(zhǔn)確地學(xué)習(xí)到特征與覆蓋強(qiáng)度之間的關(guān)系,因此預(yù)測(cè)結(jié)果比仿真結(jié)果會(huì)更加準(zhǔn)確。
3 結(jié)束語
將人工智能技術(shù)高效、智能特性應(yīng)用到5G無線網(wǎng)基站規(guī)劃選址工作中,本文提出了一種基于LightGBM算法的智能覆蓋預(yù)測(cè)方法,通過實(shí)際覆蓋場(chǎng)強(qiáng)大數(shù)據(jù)進(jìn)行建模,相比當(dāng)前業(yè)內(nèi)常用的射線仿真技術(shù),可以更準(zhǔn)確預(yù)測(cè)小區(qū)柵格的覆蓋場(chǎng)強(qiáng),有效提高5G無線網(wǎng)規(guī)劃選址的精準(zhǔn)度,具有較好的推廣應(yīng)用價(jià)值。
參考文獻(xiàn)
[1] 魯偉.機(jī)器學(xué)習(xí)公式推導(dǎo)與代碼實(shí)現(xiàn)[M].北京:人民郵電出版社,2022.
[2] 劉海紅.基于LTE系統(tǒng)的無線信號(hào)傳播特性及室外覆蓋預(yù)測(cè)的研究[D].北京:北京郵電大學(xué),2013.
[3] 程前.5G無線接入網(wǎng)多場(chǎng)景覆蓋模型預(yù)測(cè)分析[J].信息通信,2019(12):204-207.