朱曉榮,沈瑤
?
基于數(shù)據(jù)挖掘的RPMA低功耗廣域網(wǎng)網(wǎng)絡(luò)規(guī)劃方法
朱曉榮,沈瑤
(南京郵電大學(xué)江蘇省無線通信重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210003)
針對RPMA低功耗廣域網(wǎng)基站密度大、業(yè)務(wù)分布不均勻等特點(diǎn),提出了一種基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)規(guī)劃方法。首先,利用提升回歸樹算法建立了信號質(zhì)量預(yù)測模型,用于提取網(wǎng)絡(luò)的覆蓋分布空間模式;然后,針對覆蓋分布空間模式,采用加權(quán)k-centroids分簇算法得到適應(yīng)當(dāng)前模式的最優(yōu)基站部署;最后,根據(jù)總目標(biāo)函數(shù)判定得到最終的基站拓?fù)?。通過真實(shí)數(shù)據(jù)集的仿真實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的網(wǎng)絡(luò)規(guī)劃方法相比,所提的方法很好地提升低功耗廣域網(wǎng)網(wǎng)絡(luò)的覆蓋質(zhì)量。
低功耗廣域網(wǎng);提升回歸樹;加權(quán)k-centroids;基站部署
隨著物聯(lián)網(wǎng)的快速發(fā)展,聯(lián)網(wǎng)設(shè)備的數(shù)量將有望增長到500億,并且業(yè)務(wù)量將增加一千倍以上[1],傳統(tǒng)的短距離無線技術(shù)和蜂窩網(wǎng)技術(shù)已經(jīng)無法滿足多樣化的物聯(lián)網(wǎng)業(yè)務(wù)需求,因此,新的通信模式——低功耗廣域網(wǎng)(LPWAN ,low power wide area network)[2]應(yīng)運(yùn)而生。LPWAN主要滿足大連接、低速率的物聯(lián)網(wǎng)業(yè)務(wù),具有覆蓋范圍大、連接成本低、功耗低等特點(diǎn),主要包括NB-IoT(narrow band internet of things)、LORA(long range)、RPMA(random phase multiple access)等無線通信技術(shù),支持超大規(guī)模數(shù)量的設(shè)備接入網(wǎng)絡(luò)。
然而,在RPMA等LPWAN中基站密度大,覆蓋距離達(dá)到2~3 km,業(yè)務(wù)分布不均勻[3],導(dǎo)致基站部署難度大,因此,面對LPWAN網(wǎng)絡(luò)規(guī)劃帶來的挑戰(zhàn),需要針對其自身的特點(diǎn),對網(wǎng)絡(luò)進(jìn)行合理的部署與優(yōu)化,從而提高網(wǎng)絡(luò)服務(wù)質(zhì)量。在LPWAN的網(wǎng)絡(luò)規(guī)劃中,基站部署決定了網(wǎng)絡(luò)的整體性能,過密的部署會給基站帶來很大的干擾;過疏的部署會影響邊緣區(qū)域的覆蓋質(zhì)量或者造成覆蓋盲區(qū)[4]。此外,基站的選址也是影響網(wǎng)絡(luò)質(zhì)量的關(guān)鍵因素之一,不合理的選址會導(dǎo)致部分區(qū)域的信號覆蓋質(zhì)量差、容量不足等問題,造成網(wǎng)絡(luò)運(yùn)營困難,增加網(wǎng)絡(luò)建設(shè)的成本[5]。由此可見,合適的基站數(shù)量和站址規(guī)劃在網(wǎng)絡(luò)部署中起到了重要作用。然而,基站站址的確定屬于NP-hard問題[6],如果采用傳統(tǒng)的選址模型來分析站址問題的各種因素,就會導(dǎo)致所建模型中的變量與約束條件的維度災(zāi)難,此選址方法并不科學(xué)。網(wǎng)絡(luò)規(guī)劃不僅需要考慮覆蓋,還要考慮業(yè)務(wù)分布,需要處理和整合時(shí)空特性[7],這使網(wǎng)絡(luò)規(guī)劃問題更加復(fù)雜,需要設(shè)計(jì)出合理的網(wǎng)絡(luò)規(guī)劃方案。
目前,國內(nèi)外對網(wǎng)絡(luò)規(guī)劃已經(jīng)做了大量的研究。文獻(xiàn)[5]針對異構(gòu)網(wǎng)絡(luò)環(huán)境下,研究已安排預(yù)算的基站規(guī)劃問題,其目標(biāo)是在給定預(yù)算的條件下,最大化業(yè)務(wù)需求點(diǎn)的數(shù)量,同時(shí)也要滿足業(yè)務(wù)需求點(diǎn)的速率需求。文獻(xiàn)[8]認(rèn)為LTE(long term evolution)基站規(guī)劃的優(yōu)化任務(wù)是確定基站的數(shù)量和位置,基于這2個(gè)目標(biāo),結(jié)合規(guī)劃過程的2個(gè)重要約束——區(qū)域覆蓋約束和基站容量約束,提出了一種最優(yōu)的LTE無線規(guī)劃方法。文獻(xiàn)[9]認(rèn)為基站規(guī)劃策略不應(yīng)該只關(guān)注如何減少基站數(shù)目,能效也是一個(gè)重要的指標(biāo),所以考慮以最小的能量消耗為目標(biāo)來獲取最優(yōu)的基站數(shù)目和基站站址。文獻(xiàn)[10]認(rèn)為蜂窩網(wǎng)絡(luò)的核心目標(biāo)是能夠保證用戶的服務(wù)質(zhì)量(QoS,quality of service)和無縫覆蓋的吞吐量,基于這2個(gè)目標(biāo),采用區(qū)域劃分技術(shù)解決異構(gòu)網(wǎng)絡(luò)中的基站規(guī)劃問題,提出以負(fù)載均衡的方式部署基站,所提方案不僅能實(shí)現(xiàn)部署總成本達(dá)到最低(需要部署的基站數(shù)目最少),還能獲得更好的網(wǎng)絡(luò)性能。文獻(xiàn)[11]聯(lián)合所提出的基站定位算法和無線資源控制算法自動地規(guī)劃蜂窩網(wǎng)基站位置,實(shí)現(xiàn)以最少的基站數(shù)目提供必要的覆蓋和容量。
上述文獻(xiàn)主要針對蜂窩網(wǎng)絡(luò)進(jìn)行規(guī)劃,對LPWAN的技術(shù)進(jìn)行綜述,并未提出合理的規(guī)劃方案。另外,很多研究者都把基站規(guī)劃問題當(dāng)作優(yōu)化問題進(jìn)行處理,針對不同的研究場景,提出優(yōu)化目標(biāo)和約束,再采用合適的算法進(jìn)行解決。然而,這些文獻(xiàn)所提出的網(wǎng)絡(luò)規(guī)劃方法是以大量的假設(shè)為前提,算法模型有一定的局限性,沒有從本質(zhì)上提出有效的規(guī)劃方法來快速地規(guī)劃和部署大量的基站。
針對上述問題,本文將大數(shù)據(jù)的分析方法和網(wǎng)絡(luò)規(guī)劃相結(jié)合,以低功耗廣域網(wǎng)在通信系統(tǒng)中的應(yīng)用為背景,利用獲得的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行性能分析,將基站選址問題由傳統(tǒng)的模型驅(qū)動轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動,以海量的數(shù)據(jù)為分析主線,克服傳統(tǒng)網(wǎng)絡(luò)規(guī)劃模型的求解缺點(diǎn),并結(jié)合聚類算法探索以數(shù)據(jù)驅(qū)動的基站選址方法,從而提升站點(diǎn)選擇的合理化水平。
本文研究場景如圖1所示。RPMA網(wǎng)絡(luò)屬于典型的星形拓?fù)浣Y(jié)構(gòu),多個(gè)終端以無線的方式連接到鄰近的RPMA網(wǎng)關(guān),由網(wǎng)關(guān)負(fù)責(zé)接收來自終端的上行鏈路數(shù)據(jù),并將數(shù)據(jù)聚集到各自的回程連接,實(shí)現(xiàn)多路數(shù)據(jù)的收集和轉(zhuǎn)發(fā)。網(wǎng)絡(luò)服務(wù)器和網(wǎng)關(guān)之間通過4G/5G/以太網(wǎng)回傳建立通信鏈路,其中,網(wǎng)絡(luò)服務(wù)器主要負(fù)責(zé)介質(zhì)訪問(MAC,media access control)層處理,包括網(wǎng)關(guān)的管理和選擇、重復(fù)數(shù)據(jù)分組的消除、進(jìn)程的確認(rèn)等。
圖1 RPMA星形網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
針對RPMA網(wǎng)絡(luò)特點(diǎn),本文提出了一種基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)規(guī)劃方法,系統(tǒng)框圖如圖2所示。首先,考慮網(wǎng)絡(luò)規(guī)劃的覆蓋目標(biāo),采集RPMA網(wǎng)絡(luò)的實(shí)測數(shù)據(jù),主要包括基站基本信息數(shù)據(jù)、終端測試點(diǎn)數(shù)據(jù)、地理位置數(shù)據(jù)等。基于網(wǎng)絡(luò)規(guī)劃知識數(shù)據(jù)庫,對實(shí)測數(shù)據(jù)進(jìn)行初步清洗與分析,去除具有大量重復(fù)和缺省值的屬性,并且通過分析提取影響信號覆蓋質(zhì)量的相關(guān)特征,將其輸入到學(xué)習(xí)模型中進(jìn)行訓(xùn)練,從而獲得最終的基站部署,其中,學(xué)習(xí)模型分為預(yù)測模型和規(guī)劃模型,如圖2所示。本文中,基站站址的選定是根據(jù)每一次基站部署好后網(wǎng)絡(luò)的空間覆蓋情況進(jìn)行調(diào)整,由于每一次基站調(diào)整,會使整個(gè)網(wǎng)絡(luò)的信號覆蓋情況發(fā)生變化,因此,需要針對網(wǎng)絡(luò)信號覆蓋的變化,利用相應(yīng)的數(shù)據(jù)學(xué)習(xí)得到預(yù)測模型,對每一次的網(wǎng)絡(luò)拓?fù)湎碌母采w情況進(jìn)行預(yù)測。而規(guī)劃模型則是根據(jù)預(yù)測所得的覆蓋情況,確定合適的基站部署。整個(gè)規(guī)劃的總目標(biāo)是通過每一次基站調(diào)整逐漸縮小信號覆蓋差的區(qū)域,并且使區(qū)域中信號覆蓋質(zhì)量接近所要求的標(biāo)準(zhǔn)。
圖2 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)規(guī)劃系統(tǒng)框架
如圖2所示,本文首先從覆蓋目標(biāo)著手,針對無線網(wǎng)絡(luò)中弱覆蓋問題進(jìn)行分析,重點(diǎn)對覆蓋盲區(qū)和弱覆蓋區(qū)域進(jìn)行優(yōu)化,并且根據(jù)網(wǎng)絡(luò)覆蓋情況進(jìn)行基站位置的調(diào)整,使調(diào)整后的基站能滿足所要求的覆蓋效果。一般來說,區(qū)域弱覆蓋主要是因?yàn)榻邮盏降男盘枏?qiáng)度不足造成的,具體影響因素涉及以下三方面:1) 基站側(cè)影響覆蓋的因素,比如發(fā)射功率、天線方位角、天線掛高、天線增益等;2) 信號傳輸路徑影響覆蓋的因素,比如由于障礙物遮擋造成的路徑損耗、陰影衰落等;3) 干擾對覆蓋的影響,比如多個(gè)相鄰基站重疊覆蓋區(qū)內(nèi)產(chǎn)生的同頻干擾,以及建筑、山巒等地表物對電播反射造成的多徑干擾等。
綜合上述分析,可以知道網(wǎng)絡(luò)中某個(gè)位置的終端接收信號質(zhì)量,基本和上述三方面的因素相關(guān),是揉合了這些因素之后的結(jié)果,因此,本文考慮先得到信號質(zhì)量和這些因素之間的映射關(guān)系,即進(jìn)行信號質(zhì)量預(yù)測,用于輔助基站的站址確定。
信號質(zhì)量預(yù)測問題在機(jī)器學(xué)習(xí)任務(wù)中是屬于回歸問題,即運(yùn)用機(jī)器學(xué)習(xí)算法可以訓(xùn)練得到特定的某個(gè)函數(shù)將所輸入的一系列變量映射為一個(gè)連續(xù)輸出值,因此,可以先通過現(xiàn)有的路測數(shù)據(jù)來構(gòu)建出適應(yīng)當(dāng)前無線網(wǎng)絡(luò)環(huán)境的數(shù)據(jù)模型。當(dāng)需要對新規(guī)劃方案的覆蓋效果進(jìn)行預(yù)測時(shí),只要給出對應(yīng)的無線網(wǎng)絡(luò)特征,就可以預(yù)測出符合新規(guī)劃方案的信號覆蓋情況,然后根據(jù)預(yù)測結(jié)果,進(jìn)行基站站址的進(jìn)一步調(diào)整。
信號質(zhì)量預(yù)測是基于當(dāng)前部署網(wǎng)絡(luò)所獲取的基站側(cè)數(shù)據(jù)和測試點(diǎn)側(cè)數(shù)據(jù),如表1和表2所示。
表1 基站側(cè)屬性
表2 測試點(diǎn)側(cè)屬性
首先,需要對數(shù)據(jù)進(jìn)行初步清洗與分析,去除具有大量重復(fù)和缺省值的屬性,如UL PER、network state等。對于deploy region屬性,本文認(rèn)為經(jīng)緯度已經(jīng)代表了基站的位置差異特性,該屬性可以剔除。另外,結(jié)合上述所分析的三方面區(qū)域覆蓋影響因素,剔除last connect time、last connect address等無關(guān)屬性,最終選定基站位置B_loc(包括經(jīng)緯度)、基站高度B_alt、基站功率B_power、天線掛高A_height和終端位置P_loc(包括經(jīng)緯度)作為輸入特征,將這些輸入特征整合為一條記錄,如式(1)所示。
這些記錄的集合作為信號質(zhì)量預(yù)測模型的訓(xùn)練數(shù)據(jù)集。由于RPMA網(wǎng)絡(luò)采用功率控制,收到的上行信號強(qiáng)度總是在接收靈敏度附近,所以選定終端接收的下行RSSI(received signal strength indication)作為衡量信號質(zhì)量的指標(biāo),即輸出變量。建立無線網(wǎng)絡(luò)數(shù)據(jù)模型的過程,就是通過訓(xùn)練已有的數(shù)據(jù)集找到兩者之間的映射函數(shù)的過程,如式(2)所示。
本文采用提升回歸樹算法[12]來構(gòu)建式(2)所示的函數(shù)映射關(guān)系。提升回歸樹(BRT, boosting regression tree)算法屬于集成學(xué)習(xí)方法中的一種,通過集成多個(gè)基學(xué)習(xí)器共同完成學(xué)習(xí)任務(wù)。相比于單一的回歸算法,如線性回歸、對數(shù)幾率回歸算法等,BRT算法以組合多個(gè)決策樹的方式,能夠獲取更加優(yōu)越的泛化能力,從而提升了模型的預(yù)測精度。BRT模型可以用棵決策樹的加法模型,如式(3)所示。
其中,每棵樹表示為
BRT采用前向分步算法,按照從前向后的順序?qū)W習(xí)每一棵決策樹,即通過優(yōu)化如式(5)所示的損失函數(shù)學(xué)習(xí)每棵樹的參數(shù)。
式(5)中的損失函數(shù)采用平方誤差,即樣本的預(yù)測值和實(shí)際值差的平方和,如式(6)所示。
算法1 基于最小平方誤差代價(jià)函數(shù)的提升回歸樹算法
輸入 訓(xùn)練數(shù)據(jù)集合
end for
3) 得到回歸問題提升樹
本文所要研究的信號預(yù)測模型,不僅要求精確地預(yù)測出信號質(zhì)量,還希望能夠通過模型了解哪些變量是影響信號覆蓋質(zhì)量的主要因素。
在訓(xùn)練單棵決策樹時(shí),輸入的變量對響應(yīng)變量的影響程度不同,用J(T)表示第個(gè)輸入變量X對于響應(yīng)變量的相關(guān)性度量[12],如式(7)所示。
當(dāng)比較各個(gè)輸入變量對預(yù)測結(jié)果的影響力時(shí),一般先將式(8)結(jié)果進(jìn)行歸一化處理,即令所有輸入變量對結(jié)果的相對影響力之和為1,以百分?jǐn)?shù)的形式來表示每個(gè)變量的重要性。
典型的均值聚類算法是將數(shù)據(jù)集{1,...,x}中的點(diǎn)進(jìn)行劃分,把原來獨(dú)立的個(gè)點(diǎn)通過設(shè)定距離相似度劃分進(jìn)個(gè)簇當(dāng)中,簇集合{1,...,c}。一般會以兩點(diǎn)之間的歐式距離作為相似性度量,把數(shù)據(jù)點(diǎn)劃分進(jìn)距離較近的簇中心所在的簇中。算法一般是以最小化簇內(nèi)位置誤差平方和(SSE, sum of the squared error)為目標(biāo)函數(shù),如式(9)所示。
在經(jīng)典的K-means算法中,每個(gè)數(shù)據(jù)點(diǎn)對定位簇中心的位置有著同樣的重要性。然而,本文把基站位置的選擇當(dāng)作基于覆蓋分布空間模式的加權(quán)問題進(jìn)行處理,即認(rèn)為空間中的每一個(gè)點(diǎn)不再對簇中心有等價(jià)的影響,引入權(quán)重來衡量數(shù)據(jù)點(diǎn)對基站位置的影響度,從而提出加權(quán)K-centroids算法。
算法2 加權(quán)K-centroids分簇算法決定基站位置
輸出個(gè)簇的中心位置
1) 以現(xiàn)有的基站位置和數(shù)量作為初始的簇中心位置和簇?cái)?shù)量
2) repeat
end for
end for
由加權(quán)K-centroids算法得到的網(wǎng)絡(luò)拓?fù)?,已?jīng)針對當(dāng)前網(wǎng)絡(luò)覆蓋情況進(jìn)行了優(yōu)化,但是并不一定是最終的最優(yōu)結(jié)果,仍然需要對其進(jìn)行覆蓋預(yù)測分析,根據(jù)分析結(jié)果再次進(jìn)行基站位置優(yōu)化,直到滿足下述的總目標(biāo)函數(shù),得到最優(yōu)的網(wǎng)絡(luò)拓?fù)洹?/p>
整個(gè)規(guī)劃過程的總目標(biāo)函數(shù),如式(12)所示。
本實(shí)驗(yàn)數(shù)據(jù)來源于37個(gè)RPMA基站和經(jīng)過數(shù)據(jù)清洗后的131 454條測試點(diǎn)的路測數(shù)據(jù),包含基站基本信息數(shù)據(jù)、終端測試點(diǎn)數(shù)據(jù)以及相應(yīng)的地理位置數(shù)據(jù),用于驗(yàn)證本文所提出的網(wǎng)絡(luò)規(guī)劃方法的可行性,并且采用Python Matplotlib工具將實(shí)驗(yàn)結(jié)果可視化。
在應(yīng)用提升回歸樹算法之前,需要確定3個(gè)參數(shù)來調(diào)整BRT算法的學(xué)習(xí)過程。首先是基學(xué)習(xí)器數(shù)量。雖然其數(shù)量的增加,會提升BRT算法對訓(xùn)練數(shù)據(jù)的擬合效果,但是基學(xué)習(xí)器的數(shù)量超過一定的值,很有可能會造成過擬合,導(dǎo)致得到的模型對未知數(shù)據(jù)的預(yù)測效果差。其次是基學(xué)習(xí)器的大小,它表示了被BRT模型捕捉到的多個(gè)特征之間相互作用的程度,選用樹的深度來控制基學(xué)習(xí)器的大小。對于這2個(gè)參數(shù)的選取,本文采用了sk-learn中的GridSearchCV網(wǎng)格追蹤法,它能夠根據(jù)給定的數(shù)據(jù)集,遍歷需要優(yōu)化的參數(shù)的多種取值組合,通過交叉驗(yàn)證獲得最佳效果的參數(shù)取值,基學(xué)習(xí)器數(shù)量為530,樹的深度為11。最后,為了防止對訓(xùn)練數(shù)據(jù)的過度擬合,會引入正則化因子,即學(xué)習(xí)率LR(learning rate),來衡量每個(gè)基學(xué)習(xí)器對最終結(jié)果的影響程度,一般LR設(shè)置為一個(gè)低于0.1的較小常數(shù),本文中設(shè)定為0.1。
給定好參數(shù)之后,選取數(shù)據(jù)集的85%作為訓(xùn)練數(shù)據(jù)集,15%為測試數(shù)據(jù)集。圖3橫軸表示迭代次數(shù)(即基學(xué)習(xí)器數(shù)量),縱軸表示損失誤差值,圖中線條分別表示了每一次迭代的測試誤差和訓(xùn)練誤差。從圖中可以發(fā)現(xiàn),隨著迭代次數(shù)的增加,訓(xùn)練誤差和測試誤差都逐漸減少,訓(xùn)練誤差的減少說明模型在訓(xùn)練數(shù)據(jù)集上的擬合效果隨著迭代次數(shù)的增加逐漸提高。圖中顯示測試誤差要高于訓(xùn)練誤差,是由于測試集和訓(xùn)練集存在一定的差異性,使模型在未知數(shù)據(jù)集上的學(xué)習(xí)能力要弱于原訓(xùn)練數(shù)據(jù)集,屬于正?,F(xiàn)象。另外,2條曲線的趨勢也說明GridSearchCV得到的參數(shù)適當(dāng)。
圖3 損失誤差與基學(xué)習(xí)器數(shù)量的關(guān)系
圖4表示了預(yù)測變量的相對重要性。分析認(rèn)為測試點(diǎn)距離基站的距離diff與預(yù)測值RSSI的關(guān)系最為密切,其相對最重要性達(dá)到最高。其次是測試點(diǎn)位置和基站所處位置,其中經(jīng)度的相對重要性要小于緯度。天線掛高和基站高度的重要性稍低,最低的是基站發(fā)射功率,這是因?yàn)椴杉降腞PMA基站功率值只有30 dBm、31 dBm這2個(gè)值,即其取值變化較小,所以對預(yù)測值的影響作用不大。
圖4 預(yù)測變量的相對重要性
圖5為所采集到的初始基站位置和測試點(diǎn)分布情況,以星形點(diǎn)標(biāo)記基站的位置,圓點(diǎn)標(biāo)記測試點(diǎn)的位置,其中圓點(diǎn)的顏色深淺代表RSSI值的大小,顏色越深代表RSSI值越低,信號覆蓋情況越差,可見在初始的基站部署下,還是存在部分弱覆蓋區(qū)域,圖中RSSI單位為dBm。
圖5 初始基站位置及周圍測試點(diǎn)的RSSI值變化情況
本文中,采取基于覆蓋分布空間模式來部署基站,以RSSI作為衡量覆蓋強(qiáng)弱的權(quán)重值,結(jié)合加權(quán) K-centroids分簇算法,從而決定基站位置,并根據(jù)總目標(biāo)函數(shù)值來判定當(dāng)前基站部署是否達(dá)到最優(yōu)。表3為每一輪規(guī)劃迭代后,求得的總目標(biāo)函數(shù)值,由表3可知,隨著迭代次數(shù)的增多,總目標(biāo)函數(shù)值逐漸減少,即信號覆蓋情況逐漸得到改善,直到第10次迭代后終止,得到總目標(biāo)函數(shù)的最小值為535.41。圖6為最終基站位置及周圍測試點(diǎn)的RSSI值變化情況,可見深色區(qū)域相比于圖5有所減少,即應(yīng)用本文的規(guī)劃方法后,信號覆蓋情況得到改善。圖7為對應(yīng)的分簇結(jié)果,以黑色星形點(diǎn)標(biāo)記基站的位置,圓點(diǎn)標(biāo)記測試點(diǎn)的位置,同一顏色的點(diǎn)表示屬于離其最近的基站簇中。
表3 每輪迭代的總目標(biāo)函數(shù)值
圖7 分簇結(jié)果
為了驗(yàn)證本文所提方法的優(yōu)越性,將本文所提方法與基于k-means的優(yōu)化方法[14]進(jìn)行比較。利用同一組實(shí)測數(shù)據(jù),使用基于k-means的優(yōu)化方法進(jìn)行基站位置調(diào)整,圖8為應(yīng)用該方法得到的基站位置及周圍的測試點(diǎn)的RSSI值變化情況。相比于圖5,圖8中深色區(qū)域減少,但與圖6比較,深色區(qū)域依舊很多,可見應(yīng)用k-means優(yōu)化方法雖然能使信號覆蓋情況有所改善,但與本文所提的方法相比,信號覆蓋提升能力不足。同時(shí),可以利用式(12)計(jì)算每一輪迭代后的總目標(biāo)函數(shù)值,其迭代結(jié)果趨于584.22,大于本文所提方法的目標(biāo)函數(shù)最小值535.41。因此,從信號覆蓋率提升方面,本文所提的方法優(yōu)于基于k-means的優(yōu)化方法,能夠更好地提升信號覆蓋率。另外,從迭代次數(shù)上看,基于k-means的優(yōu)化方法只考慮了位置距離來調(diào)節(jié)基站,需要迭代16次才能收斂到最小值,而本文方法在調(diào)節(jié)過程中引入了覆蓋權(quán)重來協(xié)助調(diào)節(jié),可以加速收斂,僅需要表3中所示的10次迭代,收斂速度上具有一定的優(yōu)勢。
圖8 應(yīng)用基于k-means的優(yōu)化方法得到的基站位置及周圍測試點(diǎn)的RSSI值變化情況
針對RPMA網(wǎng)絡(luò)特點(diǎn),本文提出了一種基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)規(guī)劃方法。首先利用獲取的實(shí)測數(shù)據(jù)對整體網(wǎng)絡(luò)進(jìn)行初步分析,選取對覆蓋質(zhì)量的影響特征。然后,采用BRT算法和K-centroids分簇算法對網(wǎng)絡(luò)的覆蓋分布空間模式進(jìn)行提取,并且獲得最優(yōu)的RPMA網(wǎng)絡(luò)基站部署。最后,利用實(shí)測數(shù)據(jù)驗(yàn)證了本文所提方法的可行性,并與基于k-means的優(yōu)化方法相比較。實(shí)驗(yàn)結(jié)果表明,該方法能夠很好地提升低功耗廣域網(wǎng)網(wǎng)絡(luò)的覆蓋質(zhì)量,對網(wǎng)絡(luò)規(guī)劃具有一定的參考價(jià)值。
在實(shí)際網(wǎng)絡(luò)規(guī)劃中,基站部署需要考慮多方面的因素,而本文僅考慮了網(wǎng)絡(luò)規(guī)劃的覆蓋目標(biāo),因此,下一步的工作將會引入容量目標(biāo),結(jié)合兩方面的目標(biāo)進(jìn)行基站的最優(yōu)部署,使得網(wǎng)絡(luò)規(guī)劃更加完善。
[1] PATEL D, WON M. Experimental study on low power wide area networks (LPWAN) for mobile internet of things[C]// Vehicular Technology Conference. IEEE,2017:1-5.
[2] HERNANDEZ D M, PERALTA G, MANERO L, et al. Energy and coverage study of LPWAN schemes for Industry 4.0[C]// Electronics, Control, Measurement, Signals and their Application to Mechatronics .IEEE, 2017:1-6.
[3] KRUPKA L, VOJTECH L, NERUDA M. The issue of LPWAN technology coexistence in IoT environment[C]//International Conference on Mechatronics–Mechatronika. IEEE, 2016:1-8.
[4] YU G J, YEH K Y. A k-means based small cell deployment algorithm for wireless access networks[C]//International Conference on Networking and Network Applications. IEEE, 2016:393-398.
[5] WANG S, ZHAO W, WANG C. Budgeted cell planning for cellular networks with small cells[J]. IEEE Transactions on Vehicular Technology, 2015, 64(10):4797-4806.
[6] AMALDI E, CAPONE A, MALUCELLI F. Planning UMTS base station location: optimization models with power control and algorithms[J]. IEEE Transactions on Wireless Communications, 2003, 2(5):939-952.
[7] LEE C Y, KANG H G. Cell planning with capacity expansion in mobile communications: a tabu search approach[J]. IEEE Transactions on Vehicular Technology, 2000, 49(5):1678-1691.
[8] GHAZZAI H, YAACOUB E, ALOUINI M S, et al. Optimized LTE cell planning with varying spatial and temporal user densities[J]. IEEE Transactions on Vehicular Technology, 2016, 65(3):1575-1589.
[9] YANG Z H, CHEN M, WEN Y P, et al. Cell planning based on minimized power consumption for LTE networks[C]// IEEE Wireless Communications and Networking Conference. IEEE, 2016: 1-6.
[10] WANG S, RAN C. Rethinking cellular network planning and optimization[J]. IEEE Wireless Communications, 2016, 23(2):118-125.
[11] ISTV S, FAZEKAS P. An algorithm for automatic base station placement in cellular network deployment[C]// EUNICE/IFIP WG 6.6 Conference on Networked Services and Applications: Engineering, Control and Management. Springer-Verlag, 2010:21-30.
[12] FRIEDMAN J H. Greedy function approximation: a gradient boosting machine[J]. The Annals of Statistics, 2001, 29(5):1189-1232.
[13] WEN R, YAN W, ZHANG A N. Weighted clustering of spatial pattern for optimal logistics hub deployment[C]//IEEE International Conference on Big Data. IEEE, 2016:3792-3797.
[14] KANUNGO T, MOUNT D M, NETANYAHU N S, et al. An efficient k-means clustering algorithm: analysis and implementation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,40(7): 881-892.
RPMA low-power wide-area network planning method based on data mining
ZHU Xiaorong, SHEN Yao
Jiangsu Key Laboratory of Wireless Communications, Nanjing University of Posts and Telecommunications, Nanjing 210003, China
A network planning method based on data mining was proposed for RPMA low-power wide-area network with large density of base stations and uneven traffic distribution. First, a signal quality prediction model was established by using the boosting regression trees algorithm, which was used to extract the coverage distribution spacial pattern of the network. Then , the weighted k-centroids clustering algorithm was utilized to obtain the optimal base station deployment for the current spacial pattern. Finally, according to the total objective function, the best base station topology was determined. Experiment results with the real data sets show that compared with the traditional network planning method, the proposed method can improve the coverage of low-power wide-area networks.
low power wide area network, boosting regression trees, weighted k-centroids, base station deployment
TN915.81
A
10.11959/j.issn.1000?436x.2019050
2018?04?23;
2019?01?16
江蘇省研究生科研實(shí)踐創(chuàng)新計(jì)劃基金資助項(xiàng)目(No.KYCX17_0766);國家自然科學(xué)基金資助項(xiàng)目(No.61871237);江蘇省高校自然科學(xué)研究重大項(xiàng)目基金資助項(xiàng)目(No.16KJA510005)
The Post Graduate Research & Practice Innovation Program of Jiangsu Province (No.KYCX17_0766), The National Natural Science Foundation of China (No.61871237), The Natural Science Foundation of the Higher Education Institutions of Jiangsu (No.16KJA510005)
朱曉榮(1977? ),女,山東臨沂人,博士,南京郵電大學(xué)教授、博士生導(dǎo)師,主要研究方向?yàn)?G網(wǎng)絡(luò)、異構(gòu)網(wǎng)絡(luò)、無線傳感器網(wǎng)絡(luò)等無線資源管理、跨層優(yōu)化算法及協(xié)議設(shè)計(jì)、性能評估及建模分析等。
沈瑤(1994? ),女,江蘇常州人,南京郵電大學(xué)碩士生,主要研究方向?yàn)?G網(wǎng)絡(luò)優(yōu)化、無線大數(shù)據(jù)處理等。