金華濱
(福州數(shù)據(jù)技術(shù)研究院有限公司,福建 福州 350200)
根據(jù)全球移動通信系統(tǒng)協(xié)會發(fā)布的預(yù)測顯示, 未來五年內(nèi)低功耗廣域網(wǎng)將超過傳統(tǒng)的2G/3G/4G 移動網(wǎng)絡(luò)成為物聯(lián)網(wǎng)的主流連接方式。截至2018 年底,6.94億物聯(lián)網(wǎng)終端通過傳統(tǒng)移動網(wǎng)絡(luò)進行連接,僅0.66億通過低功耗廣域網(wǎng)方式進行連接。到2025年,這個局面將得到徹底的扭轉(zhuǎn),通過傳統(tǒng)移動網(wǎng)絡(luò)連接的物聯(lián)網(wǎng)終端數(shù)量將增加至13億,而通過低功耗廣域網(wǎng)連接的終端數(shù)量將突破18億。面對如此之快的增速,如何優(yōu)化低功耗廣域網(wǎng)的網(wǎng)絡(luò)拓撲,在建設(shè)最少低功耗廣域網(wǎng)基站的同時,提升其覆蓋面積和網(wǎng)絡(luò)質(zhì)量,是亟需研究的問題。低功耗廣域網(wǎng)按照工作在授權(quán)頻段和非授權(quán)頻段進行分類,NB-IoT、EC-GSM是工作在授權(quán)頻段的技術(shù),而Lora、SigFox是工作在非授權(quán)頻段的技術(shù)。總的來說,低功耗廣域網(wǎng)技術(shù)具有覆蓋廣、功率低的特點,單個基站的覆蓋范圍在幾千米至幾十千米之間,非常適合物聯(lián)網(wǎng)的發(fā)展場景[1]。
低功耗廣域網(wǎng)多以星型拓撲的形式呈現(xiàn),根據(jù)網(wǎng)絡(luò)的覆蓋情況,若干個物聯(lián)網(wǎng)終端連接至一個低功耗廣域網(wǎng)網(wǎng)關(guān),網(wǎng)關(guān)的作用是負責(zé)接收各個終端上傳的數(shù)據(jù),并負責(zé)指定各條鏈路的回程連接,最終達到多鏈路上傳和轉(zhuǎn)發(fā)的目的。傳統(tǒng)移動網(wǎng)絡(luò)仍需要負責(zé)服務(wù)器與網(wǎng)關(guān)之間的通信鏈路,服務(wù)器則主要負責(zé)介質(zhì)訪問層網(wǎng)關(guān)的路由選擇、連接進程確認等相關(guān)工作的處理。在低功率廣域網(wǎng)的組網(wǎng)過程中,首先需要對實際測量數(shù)據(jù)庫中的數(shù)據(jù)進行初級的篩選和分析,將那些包含大量重復(fù)或者含有缺省值的屬性剔除,并使用統(tǒng)計學(xué)模型找出影響低功耗廣域網(wǎng)網(wǎng)絡(luò)覆蓋質(zhì)量的主要特征,然后將數(shù)據(jù)輸入到人工智能學(xué)習(xí)模型中進行數(shù)據(jù)挖掘,最終獲得最為合理的低功耗廣域網(wǎng)基站布置圖。當(dāng)然這里所說的人工智能機器學(xué)習(xí)模型既包括預(yù)測模型,也包括規(guī)劃模型?;菊军c需要根據(jù)實際的覆蓋情況和網(wǎng)絡(luò)質(zhì)量進行調(diào)整,模型計算出來的位置較為理想,一些后期干擾因素并未完全排除[2]。
圖1 基于數(shù)據(jù)挖掘的低功耗廣域網(wǎng)組網(wǎng)規(guī)劃系統(tǒng)框架圖
低功耗廣域網(wǎng)組網(wǎng)最需要解決的問題是信號覆蓋范圍,重點解決信號覆蓋盲區(qū)以及個別位置信號覆蓋較差的問題。其中涉及到三方面比較重要的因素:一是基站自身的因素,如基站的功率額、天線的情況等;二是信號在傳輸過程中是否會受到干擾;三是干擾對覆蓋范圍的定量影響效果。
基站自身的屬性包括基站的經(jīng)度、維度和高度,還有其發(fā)射功率、天線掛高、基站名稱、部署地區(qū)編號、最后連接的時間和地址、上行鏈路的PDU誤碼率、信噪比、信噪比盈余、擴頻因子、信噪比與預(yù)定值之間的誤差和網(wǎng)絡(luò)狀態(tài)。測試點的屬性則包括下行鏈路接收信號強度指示器和傳輸一個SDU 的平均擴頻因子以及測試點的經(jīng)度和維度。在確定好需要提取的特征屬性后,需要對得到的數(shù)據(jù)進行初步的去除和分析,一些重復(fù)性的屬性需要被移除,比如經(jīng)緯度信息在地理位置中已有所體現(xiàn),不需要再單獨列出。
這里采用了人工智能機器學(xué)習(xí)中常用的BRT回歸算法來預(yù)測信息覆蓋范圍,該算法能同時組成多個決策樹,具有更加優(yōu)質(zhì)的泛化能力,能提高預(yù)測模型的精確度。BRT模型可以用N棵決策樹的加法模型,如式(1)所示:
對于低功耗廣域網(wǎng)信號覆蓋范圍規(guī)劃模型的建立,一般使用均值聚類算法,該算法將數(shù)據(jù)庫劃分成x個點,并按照等距相似度的劃分原則, 將原來的數(shù)據(jù)庫A={a1,...,ax}轉(zhuǎn) 變 為K個 簇 集 合B={b1,...,bk}。把最小化簇內(nèi)位置誤差平方和作為目標函數(shù),即可得到每個數(shù)據(jù)點對定位簇中心的位置,從而獲得基站建設(shè)的規(guī)劃位置。當(dāng)然數(shù)據(jù)挖掘的目的并不是簡單的數(shù)據(jù)轉(zhuǎn)換,而是需要在數(shù)據(jù)轉(zhuǎn)換的基礎(chǔ)上進行加權(quán)問題的處理,這樣得到的目標函數(shù)會更加精確。運用數(shù)據(jù)挖掘的算法需要的輸入包含若干個終端數(shù)據(jù)點的位置和所有基站初始點的位置信息數(shù)據(jù),把二者作為聚類目標函數(shù)的初始化值。首先需要通過對距離進行歸類來判定數(shù)據(jù)點的族類,待數(shù)據(jù)點分配完成后再通過迭代的方式實現(xiàn)對基站建設(shè)位置的調(diào)節(jié)。低功率廣域網(wǎng)信息覆蓋的范圍以能覆蓋位置到基站的距離為最大覆蓋半徑,期間會受到建木筑物阻擋、信號傳播干擾等多方面的影響。另外還需要考慮距離對于信號質(zhì)量的影響程度,所以對于本身覆蓋較差的終端會賦予其對基站建設(shè)位置影響更大的權(quán)重,這樣才能在多次的迭代過程中,讓基站完美的覆蓋這些信號盲點[3]。當(dāng)然在實際情況中,經(jīng)常出現(xiàn)通過加權(quán)算法仍然不能得到最佳組網(wǎng)結(jié)果的案例,就需要重復(fù)建立預(yù)測模型,并再次對基站的位置進行優(yōu)化,直到滿足最優(yōu)的目標函數(shù),從而得到覆蓋范圍最佳的網(wǎng)絡(luò)拓撲實踐。在完成最佳的網(wǎng)絡(luò)拓撲設(shè)計后,還應(yīng)通過仿真分析和性能評估的方法對其進行驗證,方可將模型投入到實踐中。
綜上所述,本文提出了一種基于數(shù)據(jù)挖掘技術(shù)實現(xiàn)的低功耗廣域網(wǎng)組網(wǎng)方法,其主要原理是通過機器學(xué)習(xí)的回歸算法提取和分析已獲得的數(shù)據(jù)值, 并通過均值聚類和多次迭代的方法找到目標函數(shù)的最優(yōu)解,從而獲得最佳的組網(wǎng)方案。在實際的組網(wǎng)過程中,每條鏈路的數(shù)據(jù)量均不相等,需要在今后的研究過程中加以考慮,以便能獲得更精確的組網(wǎng)方案。