国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)對(duì)運(yùn)營(yíng)商基站覆蓋中心點(diǎn)的預(yù)測(cè)及對(duì)比分析

2017-12-27 07:45:17唐忠林許盛宏譚志遠(yuǎn)
移動(dòng)通信 2017年22期
關(guān)鍵詞:預(yù)測(cè)出中心點(diǎn)中國(guó)電信

唐忠林,許盛宏,譚志遠(yuǎn)

基于大數(shù)據(jù)對(duì)運(yùn)營(yíng)商基站覆蓋中心點(diǎn)的預(yù)測(cè)及對(duì)比分析

唐忠林,許盛宏,譚志遠(yuǎn)

(中國(guó)電信股份有限公司廣東研究院,廣東 廣州 510630)

為深入了解運(yùn)營(yíng)商的網(wǎng)絡(luò)覆蓋程度,提升網(wǎng)絡(luò)資源投放效率,通過(guò)Mean-Shift算法對(duì)基站的MR數(shù)據(jù)做首次聚類分析,預(yù)測(cè)出局部最優(yōu)的基站覆蓋中心點(diǎn),再用DBSCAN算法預(yù)測(cè)出全局最優(yōu)的基站覆蓋中心點(diǎn)。在此基礎(chǔ)上分析三大運(yùn)營(yíng)商基站小區(qū)在地理位置上的部署密集程度,從而獲得每個(gè)運(yùn)營(yíng)商的網(wǎng)絡(luò)熱點(diǎn)區(qū)域分布,為網(wǎng)絡(luò)規(guī)劃和智慧網(wǎng)優(yōu)提供全方位的分析方法。

MR Mean-Shift DBSCAN 聚類算法

1 引言

隨著大數(shù)據(jù)時(shí)代的發(fā)展,人們對(duì)LBS(Location Based Services,基于位置服務(wù))的需求也快速增長(zhǎng),無(wú)線定位技術(shù)逐步得到重視,位置服務(wù)已經(jīng)成為一種熱門(mén)的技術(shù)。輔助GPS(AGPS)定位技術(shù)結(jié)合了GPS定位和蜂窩基站定位的優(yōu)勢(shì),借助蜂窩網(wǎng)絡(luò)的數(shù)據(jù)傳輸功能,可以快速精準(zhǔn)地定位,在移動(dòng)設(shè)備尤其是手機(jī)終端中被廣泛使用[1]。運(yùn)營(yíng)商通過(guò)更新4G網(wǎng)絡(luò)主設(shè)備網(wǎng)管,即新增輔助GPS和異網(wǎng)檢測(cè)功能,實(shí)現(xiàn)了基站MR(Measurement Report,測(cè)量報(bào)告)數(shù)據(jù)版本升級(jí)。在新的數(shù)據(jù)源中不僅能夠獲取到精確的GPS地理信息,同時(shí)異網(wǎng)檢測(cè)功能也可以針對(duì)其他運(yùn)營(yíng)商網(wǎng)絡(luò)覆蓋強(qiáng)度進(jìn)行周期測(cè)量,從而解決了當(dāng)前MR應(yīng)用過(guò)程中定位精度不足和只能評(píng)估本網(wǎng)絡(luò)覆蓋情況的局限[2]。通過(guò)本次研究,可以有效拓展MR的分析能力,針對(duì)三網(wǎng)(中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通)的覆蓋情況進(jìn)行對(duì)比分析。

本文通過(guò)對(duì)輔助GPS數(shù)據(jù)的挖掘分析,預(yù)測(cè)出運(yùn)營(yíng)商的基站覆蓋中心點(diǎn),可以實(shí)現(xiàn)運(yùn)營(yíng)商之間的網(wǎng)絡(luò)可持續(xù)化對(duì)比,為解決傳統(tǒng)三網(wǎng)對(duì)比測(cè)試樣本不充足、對(duì)比不全面的問(wèn)題提供一種有效解決方案。

2 運(yùn)營(yíng)商基站覆蓋中心點(diǎn)預(yù)測(cè)

以基站采集到的終端測(cè)量報(bào)告作為數(shù)據(jù)源,并將數(shù)據(jù)源按頻點(diǎn)和PCI(Physical Cell Identifier,物理小區(qū)標(biāo)識(shí))進(jìn)行分組,對(duì)分組后的每組數(shù)據(jù)用Mean-Shift(偏移均值向量算法)算法做首次密度聚類[3-4],找到局部最優(yōu)的基站覆蓋中心點(diǎn)。結(jié)合專業(yè)的業(yè)務(wù)背景知識(shí),對(duì)局部基站覆蓋中心點(diǎn)用DBSCAN算法做二次聚類,找到全局最優(yōu)的基站覆蓋中心點(diǎn)[5-8]。最后用本網(wǎng)的主覆蓋小區(qū)來(lái)驗(yàn)證所預(yù)測(cè)出來(lái)的基站覆蓋中心點(diǎn)的正確性。具體流程如圖1所示:

圖1 運(yùn)營(yíng)商基站覆蓋中心點(diǎn)預(yù)測(cè)流程

2.1 數(shù)據(jù)源提取及清洗

本模型采用中國(guó)電信全省MR的輔助GPS相關(guān)數(shù)據(jù),主要包括:各運(yùn)營(yíng)商的頻點(diǎn)、PCI、用戶個(gè)人上報(bào)的百度經(jīng)緯度、地市、中國(guó)電信主服務(wù)小區(qū)百度經(jīng)緯度等屬性,并對(duì)每條記錄中的異常數(shù)據(jù)、無(wú)效數(shù)據(jù)進(jìn)行了清洗。

為減少鄰區(qū)等干擾因素影響模型的準(zhǔn)確度,本模型只提取了室外且相距主服務(wù)小區(qū)1 km以內(nèi)的MR記錄。

2.2 Mean-Shift算法聚類過(guò)程

Mean-Shift算法是一個(gè)迭代的過(guò)程。對(duì)于d維空間的N個(gè)樣本點(diǎn),首先隨機(jī)選擇一個(gè)點(diǎn),并以這個(gè)點(diǎn)為圓心、以R為半徑做一個(gè)d維的高維球,落在這個(gè)球內(nèi)的所有樣本點(diǎn)和圓心都會(huì)產(chǎn)生一個(gè)向量,每個(gè)向量都以圓心為起點(diǎn)、以球內(nèi)的樣本點(diǎn)為終點(diǎn),計(jì)算出球內(nèi)所有向量的和,最終得出Mean-Shift向量。再以Mean-Shift向量的終點(diǎn)為圓心重復(fù)上述步驟。由同起點(diǎn)向量求和法則可知,Mean-shift向量最終將收斂到概率密度最大的區(qū)域[9]。

Mean-Shift向量的基本形式如下:

其中,x為空間中任意一點(diǎn);D表示在N個(gè)樣本點(diǎn)xi中有D個(gè)點(diǎn)落在SD區(qū)域中。

Mean-Shi ft算法的偽代碼思想如下:

(1)隨機(jī)選擇一點(diǎn)為中心點(diǎn),固定一個(gè)窗口,計(jì)算出Mean-Shift向量;

(2)判斷是否達(dá)到收斂,若收斂則終止,否則執(zhí)行第(3)步;

(3)以Mean-Shift向量的終點(diǎn)為新的中心,重復(fù)上述步驟[10]。

由于獲取到的用戶輔助GPS數(shù)據(jù)呈現(xiàn)出無(wú)規(guī)律分布,因此采用基于概率密度的Mean-Shift算法進(jìn)行聚類分析。該算法忽略了數(shù)據(jù)源中的異常值,每次只對(duì)窗口內(nèi)局部數(shù)據(jù)進(jìn)行計(jì)算,計(jì)算完成后再移動(dòng)窗口。

本模型首先以中國(guó)電信的數(shù)據(jù)作訓(xùn)練集,以頻點(diǎn)和PCI作為分組條件,分別把具有相同頻點(diǎn)和PCI的個(gè)人上報(bào)百度經(jīng)緯度進(jìn)行聚類。經(jīng)過(guò)多次模型訓(xùn)練并結(jié)合業(yè)務(wù)實(shí)際,本模型最終設(shè)置的Mean-Shift窗寬系數(shù)為0.02,聚類得到多個(gè)同一頻點(diǎn)和PCI下多個(gè)基站覆蓋中心經(jīng)緯度。

預(yù)測(cè)中國(guó)電信室外的基站覆蓋中心點(diǎn)有159 284個(gè),將預(yù)測(cè)出來(lái)的覆蓋中心點(diǎn)經(jīng)緯度與中國(guó)電信MR數(shù)據(jù)本身提供的小區(qū)百度經(jīng)緯度在百度地圖上作距離對(duì)比。結(jié)果表明,對(duì)于廣州市區(qū)統(tǒng)計(jì)出基站覆蓋中心點(diǎn)有80.3%落在主覆蓋小區(qū)對(duì)應(yīng)方向角附近150 m以內(nèi),但在同一頻點(diǎn)和PCI下有部分預(yù)測(cè)的基站覆蓋中心點(diǎn)相距較近。結(jié)合專業(yè)的業(yè)務(wù)知識(shí),運(yùn)用區(qū)域聚類算法DBSCAN進(jìn)行二次聚類,將屬于同頻點(diǎn)同PCI且相距較近的基站覆蓋中心點(diǎn)聚為一個(gè)新中心點(diǎn)。

2.3 DBSCAN二次聚類過(guò)程

DBSCAN是一種基于高密度連通區(qū)域的聚類算法,能夠?qū)⒕哂凶銐蚋呙芏鹊膮^(qū)域劃分為簇。該算法需要兩個(gè)核心的參數(shù):一個(gè)參數(shù)是半徑,表示以給定點(diǎn)P為中心的圓形鄰域的范圍;另一個(gè)參數(shù)是以點(diǎn)P為中心的鄰域內(nèi)最少點(diǎn)的數(shù)量[11]。

基于本模型需求和專業(yè)的業(yè)務(wù)知識(shí),模型設(shè)置的半徑為200 m,鄰域內(nèi)最少點(diǎn)數(shù)量設(shè)置為1,從而可以將具有相同頻點(diǎn)和PCI且距離較近的基站覆蓋中心點(diǎn)聚類成一個(gè)新的中心點(diǎn)。

將基站覆蓋中心點(diǎn)經(jīng)緯度與中國(guó)電信MR數(shù)據(jù)提供的小區(qū)經(jīng)緯度作距離核對(duì),該模型預(yù)測(cè)出中國(guó)電信室外共有155 244個(gè)基站覆蓋中心點(diǎn)。對(duì)于廣州市區(qū)統(tǒng)計(jì)出基站覆蓋中心點(diǎn)有83.6%落在主覆蓋小區(qū)對(duì)應(yīng)方向角附近150 m以內(nèi),符合實(shí)際業(yè)務(wù)規(guī)則。

DBSCAN算法的偽代碼思想如下:

(1)選取鄰域半徑為200 m,鄰域內(nèi)最少點(diǎn)數(shù)為1;

(2)隨機(jī)選取一點(diǎn)為中心點(diǎn),計(jì)算相同頻點(diǎn)和PCI下的主覆蓋小區(qū)中心點(diǎn)的距離,若滿足條件,則加入該鄰域,并以新加入的點(diǎn)為中心判斷其余點(diǎn)是否滿足條件,直到遍歷完所有點(diǎn),計(jì)算出該鄰域新的中心點(diǎn),并把屬于該鄰域的點(diǎn)從原數(shù)據(jù)中刪除;

(3)從剩余的點(diǎn)中隨機(jī)選取一點(diǎn)為新的中心,重復(fù)第(2)步直到原數(shù)據(jù)中所有點(diǎn)都被重新歸類完畢為止。

3 運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比分析

通過(guò)上述模型,采用相同的方法可以預(yù)測(cè)出異網(wǎng)基站覆蓋中心點(diǎn)的位置及其數(shù)量,預(yù)測(cè)出運(yùn)營(yíng)商A室外有231 948個(gè)基站覆蓋中心點(diǎn)、運(yùn)營(yíng)商B室外有92 668個(gè)基站覆蓋中心點(diǎn)。將三家運(yùn)營(yíng)商的基站覆蓋中心點(diǎn)預(yù)測(cè)結(jié)果顯示在百度地圖上,以廣州兩個(gè)區(qū)域Ⅰ、Ⅱ?yàn)槔?,具體如圖2和圖3所示:

圖2 區(qū)域Ⅰ運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比

圖3 區(qū)域Ⅱ運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比

其中,扇形表示運(yùn)營(yíng)商真實(shí)的主覆蓋小區(qū)所在的位置;圓形表示用模型預(yù)測(cè)出來(lái)的基站覆蓋中心點(diǎn)所在的位置;黃色表示運(yùn)營(yíng)商A、藍(lán)色表示運(yùn)營(yíng)商B、紅色表示運(yùn)營(yíng)商C。

從圖2和圖3可以看出,預(yù)測(cè)得到的基站覆蓋中心點(diǎn)跟真實(shí)的小區(qū)相距較近,能夠直觀地描繪出三家運(yùn)營(yíng)商的覆蓋區(qū)域及覆蓋密度。通過(guò)這種直觀的比較,不僅可以掌握異網(wǎng)的大致網(wǎng)絡(luò)分布,而且也易于了解哪些區(qū)域是本網(wǎng)盲區(qū)、哪些區(qū)域需要加強(qiáng)覆蓋,為網(wǎng)絡(luò)建設(shè)規(guī)劃和智慧網(wǎng)優(yōu)提供強(qiáng)有力的支撐。

4 結(jié)束語(yǔ)

本文通過(guò)對(duì)MR數(shù)據(jù)的挖掘分析,預(yù)測(cè)出運(yùn)營(yíng)商的基站覆蓋中心點(diǎn),可以全面掌握運(yùn)營(yíng)商主覆蓋小區(qū)的大致分布和覆蓋密度,為全面評(píng)估網(wǎng)絡(luò)覆蓋程度提供有力支撐,也為掌握異網(wǎng)的網(wǎng)絡(luò)規(guī)劃和發(fā)展規(guī)模提供理論依據(jù)。后續(xù)將對(duì)全集團(tuán)的MR數(shù)據(jù)做相同的挖掘分析,為全集團(tuán)的網(wǎng)絡(luò)規(guī)劃、智慧網(wǎng)優(yōu)、優(yōu)化布局提供全方位智能化分析方法,進(jìn)一步提升網(wǎng)絡(luò)資源投放效率。

[1] 左超,耿慶鵬,劉旭峰. 基于大數(shù)據(jù)的電信業(yè)務(wù)發(fā)展策略研究[J]. 郵電設(shè)計(jì)技術(shù), 2013(10): 1-4.

[2] 顧芳,劉旭峰,左超. 大數(shù)據(jù)背景下運(yùn)營(yíng)商移動(dòng)互聯(lián)網(wǎng)發(fā)展策略研究[J]. 郵電設(shè)計(jì)技術(shù), 2012(8): 21-24.

[3] Ester M, Kriegel H P, Sander J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[J]. Knowlegdge Discovety Data Mining, 1996: 226-231.

[4] 彭寧嵩,楊杰,劉志,等. Mean-Shift跟蹤算法中核函數(shù)窗寬的自動(dòng)選取[J]. 軟件學(xué)報(bào), 2005,16(9): 1542-1550.

[5] 何中勝,劉宗田,莊燕濱. 基于數(shù)據(jù)分區(qū)的并行DBSCAN算法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2006,27(1): 114-116.

[6] 熊忠陽(yáng),孫思,張玉芳,等. 一種基于劃分的不同參數(shù)值的DBSCAN算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2005(9): 2319-2321.

[7] 榮秋生,顏君彪,郭國(guó)強(qiáng). 基于DBSCAN聚類算法的研究與實(shí)現(xiàn)[J]. 計(jì)算機(jī)應(yīng)用, 2004,24(4): 45-46.

[8] 王桂芝. 基于密度聚類分析的相關(guān)算法研究[J]. 電腦知識(shí)與技術(shù), 2013(30): 6714-6716.

[9] D Comaniciu, P Meer. Mean shift: a robust approach toward feature space analysis[J]. Journal of Image and Signal Processing, 2002,24(5): 603-619.

[10] RT Collins. Mean-shift blob tracking through scale space[J]. Computer Vision and Pattern Recognition,2003: 234.

[11] 韓利釗,錢(qián)雪忠,羅靖,等. 基于區(qū)域劃分的DBSCAN多密度聚類算法[J/OL]. [2017-06-14]. http://www.arocmag.com/article/02-2018-06-047.html.★

Prediction and Comparative Analysis on Coverage Center of the Operator’ Base Station Based on Big Data

TANG Zhonglin, XU Shenghong, TAN Zhiyuan

(Guangdong Research Institute of China Telecom Co., Ltd., Guangzhou 510630, China)

In order to deeply acquaint operators’ network coverage level and enhance the deployment of network resources, the fi rst clustering analysis on MR data was done based on Mean-Shift algorithm to predict the locally optimal center of the base station coverage. Then, DBSCAN algorithm was used to predict the globally optimal center of the base station coverage. Based on this, the geographic deployment density of base stations for the major three operators was analyzed to obtain the network hotspot area distribution of each operator. It provides a comprehensive analysis method to the network planning and intelligent network optimization.

MR Mean-Shift DBSCAN clustering algorithm

10.3969/j.issn.1006-1010.2017.22.001

TP312

A

1006-1010(2017)22-0001-04

唐忠林,許盛宏,譚志遠(yuǎn). 基于大數(shù)據(jù)對(duì)運(yùn)營(yíng)商基站覆蓋中心點(diǎn)的預(yù)測(cè)及對(duì)比分析[J]. 移動(dòng)通信, 2017,41(22): 1-4.

2017-07-11

袁婷 yuanting@mbcom.cn

唐忠林:工程師,碩士畢業(yè)于華南理工大學(xué),現(xiàn)任職于中國(guó)電信股份有限公司廣東研究院,從事大數(shù)據(jù)挖掘、算法模型等工作。

許盛宏:工程師,學(xué)士畢業(yè)于重慶郵電學(xué)院,現(xiàn)任職于中國(guó)電信股份有限公司廣東研究院,從事核心網(wǎng)研究及支撐工作。

譚志遠(yuǎn):工程師,學(xué)士畢業(yè)于華南理工大學(xué),現(xiàn)任職于中國(guó)電信股份有限公司廣東研究院,從事大數(shù)據(jù)數(shù)據(jù)庫(kù)、數(shù)據(jù)平臺(tái)管理、云計(jì)算等技術(shù)研究及支撐工作。

猜你喜歡
預(yù)測(cè)出中心點(diǎn)中國(guó)電信
Scratch 3.9更新了什么?
如何設(shè)置造型中心點(diǎn)?
電腦報(bào)(2019年4期)2019-09-10 07:22:44
中國(guó)電信:IPv6在線用戶已超千萬(wàn) 年底將完成端到端服務(wù)能力
吸引力無(wú)法則
漢字藝術(shù)結(jié)構(gòu)解析(二)中心點(diǎn)處筆畫(huà)應(yīng)緊奏
尋找視覺(jué)中心點(diǎn)
大眾攝影(2015年9期)2015-09-06 17:05:41
中國(guó)電信載波聚合終端技術(shù)發(fā)展探討
量體薦衣
閱讀理解沙場(chǎng)點(diǎn)兵
軟實(shí)力,IBM軟件新名片
灵丘县| 调兵山市| 金昌市| 泰兴市| 邳州市| 昌江| 哈巴河县| 富宁县| 壶关县| 德昌县| 陵水| 平顺县| 洪湖市| 成都市| 吴忠市| 阳山县| 尉犁县| 定日县| 拜城县| 石棉县| 当阳市| 谷城县| 磐安县| 金门县| 宁波市| 闽侯县| 舒兰市| 罗平县| 鲁山县| 绍兴市| 噶尔县| 正镶白旗| 深泽县| 新郑市| 泗阳县| 宿迁市| 凭祥市| 科尔| 大兴区| 孟村| 大渡口区|