郭超+潘紅艷
【摘 ? ?要】分析了以TD-LTE基站的最近站間距、平均站間距、站高、第1層鄰區(qū)數(shù)作為分類的特征數(shù)據(jù),以每個(gè)基站實(shí)際測(cè)試的下載速率為優(yōu)化目標(biāo),構(gòu)建了決策樹(shù)算法,將基站類型分為5類。通過(guò)實(shí)際測(cè)試數(shù)據(jù)驗(yàn)證表明,該方法的精度較高,從而為TD-LTE建網(wǎng)初期新站規(guī)劃提供了參考。
【關(guān)鍵詞】TD-LTE ? ?決策樹(shù) ? ?平均站間距 ? ?緊密鄰區(qū)數(shù)
中圖分類號(hào):TN929.53 ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ?文章編號(hào):1006-1010(2014)-22-0022-04
Research on TD-LTE Base Station Planning Based on Decision Tree
GUO Chao1, PAN Hong-yan2
[Abstract]?The feature data of TD-LTE BS based on the nearest base station (BS) distance, the average BS distance, the BS height and the number of the adjacent cell of the first layer are analyzed in this paper. To optimize the actual download rate of BS, a decision-tree algorithm is built to classify BSs into five types. The actual test data validate that the proposed algorithm has high precision to provide a reference to new BS construction in the early stage of TD-LTE network.
[Key words]TD-LTE ? ?decision tree ? ?average base station distance ? ?number of adjacent cells
1 ? 引言
TD-LTE是我國(guó)企業(yè)主導(dǎo)并被全球廣泛認(rèn)可的4G技術(shù),它采用時(shí)分雙工方式,是TD-SCDMA的后續(xù)演進(jìn)技術(shù),在20M帶寬內(nèi)可實(shí)現(xiàn)下行峰值速率100Mbps、上行峰值速率50Mbps,目前中國(guó)移動(dòng)、中國(guó)電信和中國(guó)聯(lián)通都已獲得了TD-LTE商用牌照并正式商用。由于TD-LTE同頻組網(wǎng)[1],對(duì)于干擾的控制要求較高,因此需要對(duì)基站的覆蓋做合理的規(guī)劃和控制。根據(jù)香農(nóng)定理,干擾由信噪比決定,在TD-LTE網(wǎng)絡(luò)表征是SINR值。在網(wǎng)絡(luò)建設(shè)初期,網(wǎng)絡(luò)的干擾和基站的布局關(guān)系很大,基站的站間距控制、高度控制等因素都影響著網(wǎng)絡(luò)的干擾水平[2],所以必須因地制宜建站,考慮新選站址也是網(wǎng)絡(luò)建設(shè)中最大的難點(diǎn)之一。
本文提供了一種基于決策樹(shù)的算法,針對(duì)建網(wǎng)初期基站選址的合理性問(wèn)題,將TD-LTE基站的主要因素:平均站間距、最近站間距、站高、緊密鄰區(qū)數(shù)量這4個(gè)維度結(jié)合,參考實(shí)際路測(cè)下載速率的數(shù)據(jù),運(yùn)用決策樹(shù)的方法,對(duì)基站的站間距、高度合理性進(jìn)行了詳細(xì)的分析和歸類,以便更準(zhǔn)確地評(píng)估基站建設(shè)的選址問(wèn)題,達(dá)到在規(guī)劃階段控制好干擾的目的,打好網(wǎng)絡(luò)的結(jié)構(gòu)基礎(chǔ)。
2 ? 決策樹(shù)算法
決策樹(shù)算法是一種簡(jiǎn)單卻使用廣泛的分類技術(shù),它是一種構(gòu)建分類模型的非參數(shù)方法,由節(jié)點(diǎn)和有向邊組成層次結(jié)構(gòu)。它不需要任何先驗(yàn)假設(shè),也不需要假定類和其他屬性服從一定的概率分布。在決策樹(shù)中,每個(gè)葉節(jié)點(diǎn)都賦予一個(gè)類標(biāo)號(hào)。決策樹(shù)構(gòu)造采用的是自頂而下的遞歸劃分方法,沿著樹(shù)向下,記錄會(huì)越來(lái)越少。目前較為成熟的算法是Quinlan提出的著名的ID3算法[3]和C4.5算法[4],使用熵(Entropy)和Gini指標(biāo)。
決策樹(shù)算法具有分類精度高、支持語(yǔ)義數(shù)據(jù)、簡(jiǎn)單高效、噪聲抑制性能好等特點(diǎn)[5],因此在數(shù)據(jù)挖掘、圖像處理、市場(chǎng)營(yíng)銷等方面應(yīng)用非常廣泛。
3 ? 算法流程
決策樹(shù)方法的過(guò)程通常分為2部分:決策樹(shù)學(xué)習(xí)和決策樹(shù)分類。決策樹(shù)學(xué)習(xí)是通過(guò)對(duì)訓(xùn)練樣本進(jìn)行歸納學(xué)習(xí)(Inductive Learning),生成以決策樹(shù)形式表示的分類規(guī)則的機(jī)器學(xué)習(xí)(Machine Learning)過(guò)程[6],算法的輸入是由屬性和屬性值表示的訓(xùn)練樣本集,輸出是一棵樹(shù)形的分類結(jié)果。原則上講,給定的屬性集可以構(gòu)造的決策樹(shù)的數(shù)目達(dá)到指數(shù)級(jí),盡管如此,人們還是開(kāi)發(fā)了一些有效的算法能夠在合理的時(shí)間內(nèi)構(gòu)造出相對(duì)準(zhǔn)確的次最優(yōu)決策樹(shù),這些算法一般都采用貪心算法,流程如圖1所示。
4 ? 實(shí)驗(yàn)與分析
本算法的輸入屬性包括最近站間距、平均站間距、基站高度、第一層鄰區(qū)數(shù)量以及實(shí)際測(cè)試下載數(shù)據(jù)。其中,最近站間距描述的是距離樣本站點(diǎn)最近的一個(gè)基站的距離;平均站間距描述的是與樣本基站相鄰的第一層鄰區(qū)的平均距離;基站高度描述的是樣本基站的天線垂直距離水平面的高度;第一層鄰區(qū)數(shù)量描述的是與樣本基站切換關(guān)系最多的基站的數(shù)量;路測(cè)下載數(shù)據(jù)是LTE測(cè)試終端MiFi對(duì)所有基站的測(cè)試PDCP層的傳輸速率,單位為Mbps。
4.1 ?決策樹(shù)建立
移動(dòng)通信中的基站站間距描述的是網(wǎng)絡(luò)中基站的密集程度,通常站間距計(jì)算采用的是平均計(jì)算方法,即根據(jù)一定區(qū)域的基站數(shù)量和覆蓋面積計(jì)算出平均每個(gè)基站的覆蓋面積,然后根據(jù)標(biāo)準(zhǔn)的三扇區(qū)覆蓋模型計(jì)算出平均站間距。傳統(tǒng)的距離計(jì)算是按照標(biāo)準(zhǔn)的覆蓋面積進(jìn)行折算,這種算法對(duì)于統(tǒng)計(jì)的估算較為適用,但是對(duì)于精細(xì)的規(guī)劃缺乏依據(jù)和準(zhǔn)確性。同時(shí),站間距還必須考慮周邊站點(diǎn)的結(jié)構(gòu)和分布,因此在此結(jié)果上需要進(jìn)一步的修正才能合理地對(duì)站間距進(jìn)行評(píng)估。endprint
本文方法和傳統(tǒng)的距離計(jì)算法的區(qū)別是:本文直接計(jì)算基站的最近基站距離,然后根據(jù)周邊基站的方位角度和距離關(guān)系來(lái)判斷該基站的第一鄰區(qū)歸屬,并計(jì)算出第一鄰區(qū)平均距離,再根據(jù)最近基站距離、平均距離、站高以及第一層緊密鄰區(qū)數(shù)作為決策樹(shù)的主要因素構(gòu)建決策樹(shù)。
站間距的計(jì)算流程如圖2所示。
距離算子包括平均站間距和最近站間距,另外計(jì)算第一層緊密鄰區(qū)數(shù)量,緊密鄰區(qū)數(shù)是第一層鄰區(qū)數(shù)量,數(shù)據(jù)來(lái)自于OMC網(wǎng)管的切換統(tǒng)計(jì)數(shù)據(jù),根據(jù)切換占比超過(guò)總切換數(shù)15%的基站作為第一層鄰區(qū)基站,屬性數(shù)據(jù)模板如表1所示。
4.2 ?決策樹(shù)剪枝
在進(jìn)行決策樹(shù)分類時(shí),為防止決策樹(shù)和訓(xùn)練樣本集過(guò)分?jǐn)M合,特別是存在噪聲數(shù)據(jù)或不規(guī)范屬性時(shí)更為突出,需要對(duì)決策樹(shù)進(jìn)行剪枝[5]。剪枝算法通常利用統(tǒng)計(jì)方法決定是否將一個(gè)分支變?yōu)橐粋€(gè)結(jié)點(diǎn),通常采用預(yù)先剪枝方法(pre-pruning)和后剪枝方法(post-pruning)進(jìn)行決策樹(shù)剪枝。預(yù)先剪枝方法的優(yōu)點(diǎn)是在樹(shù)生長(zhǎng)的同時(shí)就進(jìn)行了剪枝,因此效率高,但是它可能產(chǎn)生“視覺(jué)界限”,即斷絕了其后繼節(jié)點(diǎn)進(jìn)行分支操作的任何可能性;后剪枝方法是當(dāng)決策樹(shù)的生長(zhǎng)過(guò)程完成后再進(jìn)行剪枝,該方法比預(yù)先剪枝方法計(jì)算時(shí)間長(zhǎng),但是可以獲得一個(gè)分類更準(zhǔn)確的決策樹(shù)。一個(gè)好的折中方法是預(yù)先剪枝也可以與后剪枝相結(jié)合,從而構(gòu)成混合剪枝方法。
4.3 ?結(jié)果與分析
本文采用的決策樹(shù)生成實(shí)驗(yàn)工具是Matlab7.0,訓(xùn)練樣本集為浙江TD-LTE某試商用城市先期開(kāi)通的401個(gè)TD-LTE室外站點(diǎn),檢驗(yàn)數(shù)據(jù)集為后期開(kāi)通的98個(gè)新TD-LTE站點(diǎn)。
本實(shí)驗(yàn)TD-LTE系統(tǒng)的主要參數(shù)設(shè)置為:系統(tǒng)帶寬20M,采用F頻段,上下行配比為1:3,特殊子幀配比為9:3:2,MIMO方式為2*2。運(yùn)用Matlab7.0自帶的決策樹(shù)算法,輸出結(jié)果如圖3所示,原始數(shù)據(jù)分為10個(gè)類,其中△表示根節(jié)點(diǎn),○表示葉子節(jié)點(diǎn),左向箭頭判斷為“是”,右向箭頭判斷為“否”。
為了更好地表征分類結(jié)果,本文采用了事后修剪方法,將之前決策樹(shù)建立的10個(gè)類按照結(jié)果速率的大小進(jìn)行了類的合并,最終形成了5個(gè)類,分別對(duì)應(yīng)低速率、較低速率、中等速率、較高速率和高速率,具體如表2所示。
運(yùn)用前面的決策樹(shù)分類依據(jù),對(duì)新建設(shè)的98個(gè)TD-LTE站點(diǎn)進(jìn)行了PDCP層下載速率預(yù)評(píng)估,在站點(diǎn)全部開(kāi)通后又采用MiFi測(cè)試終端進(jìn)行了拉網(wǎng)速率測(cè)試,然后將預(yù)測(cè)數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)進(jìn)行分類精度檢驗(yàn),結(jié)果如表3所示:
表3 ? ?分類檢驗(yàn)精度
類別 1 2 3 4 5
測(cè)試集數(shù)量 8 17 26 16 21
正確分類數(shù) 7 16 17 22 18
分類的精度/% 87.5 94.1 73.9 75.9 85.7
總精度/% 81.6
從測(cè)試結(jié)果來(lái)看,總體精度達(dá)到了81.6%,對(duì)低速率第1類和第2類的識(shí)別準(zhǔn)確性還是比較高,而對(duì)第3類和第4類的識(shí)別有些偏差,即存在規(guī)劃問(wèn)題的站點(diǎn)測(cè)試速率較差,但滿足高速率條件的規(guī)劃站點(diǎn)不一定達(dá)到高速率要求,這說(shuō)明還存在其他的因素影響實(shí)際測(cè)試速率。
5 ? 總結(jié)
本文以TD-LTE基站的最近站間距、平均站間距、站高、第一層緊密鄰區(qū)數(shù)作為分類的特征數(shù)據(jù),以每個(gè)基站實(shí)際測(cè)試PDCP層下載速率為優(yōu)化目標(biāo),構(gòu)建了決策樹(shù)算法,將基站類型分為5類。從分類的結(jié)果可以看出:
(1)在TD-LTE建網(wǎng)初期,平均站間距是影響速率的主要因素,必須保證站間距在一定的合理范圍之內(nèi),本試點(diǎn)區(qū)域的理想門限是415m。
(2)站高要合理。站間距較小時(shí),站高需要控制較低;而站間距較大時(shí),站高可以適當(dāng)高一些。
(3)最近站間距不能太小。
(4)緊密鄰區(qū)數(shù)在平均站間距不大時(shí)也需要進(jìn)行控制。
需要注意的是,不同城市的場(chǎng)景有所差異,本文所在城市環(huán)境得出的結(jié)果對(duì)相似環(huán)境的地區(qū)有參考意義,而對(duì)差別較大的區(qū)域則需要根據(jù)實(shí)地情況進(jìn)行決策樹(shù)分析。
此外,從后續(xù)的歸類錯(cuò)誤的站點(diǎn)問(wèn)題原因分析可知,要保證網(wǎng)絡(luò)的高速率,除了基站的規(guī)劃建設(shè)要求達(dá)標(biāo)之外,參數(shù)設(shè)置、PCI規(guī)劃、鄰區(qū)配置、終端性能都會(huì)帶來(lái)一定的影響,這也是后續(xù)繼續(xù)深入研究的方向。
參考文獻(xiàn):
[1] Iana Siomina1, Di Yuan. Analysis of Cell Load Coupling for LTE Network Planning and Optimization[A]. IEEE International Conference on Communications 2012 (ICC 2012)[C]. 2012: 1357-1361.
[2] E Amaldi, A Capone, F Malucelli, et al. Mannino, Optimization Problems and Models for Planning Cellular Networks[M]. In M Resende and P Pardalos, editors, Handbook of Optimization in Telecommunications. Springer Science, 2006: 917-939.
[3] Quinlan J R. Induction of Decision Tree[J]. Machine Learing, 1986,1(1): 81-106.
[4] Quinlan J R. Bagging, Boosting and C4.5[A]. Proceedings of the 13th International Conference on Artificial Intelligence[C]. Portland: AAI Press, 1996,9(2): 300-306.
[5] 申文明,王文杰,羅海江,等. 基于決策樹(shù)分類技術(shù)的遙感影像分類方法研究[J]. 遙感技術(shù)與應(yīng)用, 2007,22(3): 333-338.
[6] 李德仁,王樹(shù)良,李德毅,等. 論空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的理論與方法[J]. 武漢大學(xué)學(xué)報(bào): 信息科學(xué)版, 2002,27(3): 221-233.
[7] 楊學(xué)兵,張俊. 決策樹(shù)算法及其核心技術(shù)[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2007,17(1): 43-45.endprint
本文方法和傳統(tǒng)的距離計(jì)算法的區(qū)別是:本文直接計(jì)算基站的最近基站距離,然后根據(jù)周邊基站的方位角度和距離關(guān)系來(lái)判斷該基站的第一鄰區(qū)歸屬,并計(jì)算出第一鄰區(qū)平均距離,再根據(jù)最近基站距離、平均距離、站高以及第一層緊密鄰區(qū)數(shù)作為決策樹(shù)的主要因素構(gòu)建決策樹(shù)。
站間距的計(jì)算流程如圖2所示。
距離算子包括平均站間距和最近站間距,另外計(jì)算第一層緊密鄰區(qū)數(shù)量,緊密鄰區(qū)數(shù)是第一層鄰區(qū)數(shù)量,數(shù)據(jù)來(lái)自于OMC網(wǎng)管的切換統(tǒng)計(jì)數(shù)據(jù),根據(jù)切換占比超過(guò)總切換數(shù)15%的基站作為第一層鄰區(qū)基站,屬性數(shù)據(jù)模板如表1所示。
4.2 ?決策樹(shù)剪枝
在進(jìn)行決策樹(shù)分類時(shí),為防止決策樹(shù)和訓(xùn)練樣本集過(guò)分?jǐn)M合,特別是存在噪聲數(shù)據(jù)或不規(guī)范屬性時(shí)更為突出,需要對(duì)決策樹(shù)進(jìn)行剪枝[5]。剪枝算法通常利用統(tǒng)計(jì)方法決定是否將一個(gè)分支變?yōu)橐粋€(gè)結(jié)點(diǎn),通常采用預(yù)先剪枝方法(pre-pruning)和后剪枝方法(post-pruning)進(jìn)行決策樹(shù)剪枝。預(yù)先剪枝方法的優(yōu)點(diǎn)是在樹(shù)生長(zhǎng)的同時(shí)就進(jìn)行了剪枝,因此效率高,但是它可能產(chǎn)生“視覺(jué)界限”,即斷絕了其后繼節(jié)點(diǎn)進(jìn)行分支操作的任何可能性;后剪枝方法是當(dāng)決策樹(shù)的生長(zhǎng)過(guò)程完成后再進(jìn)行剪枝,該方法比預(yù)先剪枝方法計(jì)算時(shí)間長(zhǎng),但是可以獲得一個(gè)分類更準(zhǔn)確的決策樹(shù)。一個(gè)好的折中方法是預(yù)先剪枝也可以與后剪枝相結(jié)合,從而構(gòu)成混合剪枝方法。
4.3 ?結(jié)果與分析
本文采用的決策樹(shù)生成實(shí)驗(yàn)工具是Matlab7.0,訓(xùn)練樣本集為浙江TD-LTE某試商用城市先期開(kāi)通的401個(gè)TD-LTE室外站點(diǎn),檢驗(yàn)數(shù)據(jù)集為后期開(kāi)通的98個(gè)新TD-LTE站點(diǎn)。
本實(shí)驗(yàn)TD-LTE系統(tǒng)的主要參數(shù)設(shè)置為:系統(tǒng)帶寬20M,采用F頻段,上下行配比為1:3,特殊子幀配比為9:3:2,MIMO方式為2*2。運(yùn)用Matlab7.0自帶的決策樹(shù)算法,輸出結(jié)果如圖3所示,原始數(shù)據(jù)分為10個(gè)類,其中△表示根節(jié)點(diǎn),○表示葉子節(jié)點(diǎn),左向箭頭判斷為“是”,右向箭頭判斷為“否”。
為了更好地表征分類結(jié)果,本文采用了事后修剪方法,將之前決策樹(shù)建立的10個(gè)類按照結(jié)果速率的大小進(jìn)行了類的合并,最終形成了5個(gè)類,分別對(duì)應(yīng)低速率、較低速率、中等速率、較高速率和高速率,具體如表2所示。
運(yùn)用前面的決策樹(shù)分類依據(jù),對(duì)新建設(shè)的98個(gè)TD-LTE站點(diǎn)進(jìn)行了PDCP層下載速率預(yù)評(píng)估,在站點(diǎn)全部開(kāi)通后又采用MiFi測(cè)試終端進(jìn)行了拉網(wǎng)速率測(cè)試,然后將預(yù)測(cè)數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)進(jìn)行分類精度檢驗(yàn),結(jié)果如表3所示:
表3 ? ?分類檢驗(yàn)精度
類別 1 2 3 4 5
測(cè)試集數(shù)量 8 17 26 16 21
正確分類數(shù) 7 16 17 22 18
分類的精度/% 87.5 94.1 73.9 75.9 85.7
總精度/% 81.6
從測(cè)試結(jié)果來(lái)看,總體精度達(dá)到了81.6%,對(duì)低速率第1類和第2類的識(shí)別準(zhǔn)確性還是比較高,而對(duì)第3類和第4類的識(shí)別有些偏差,即存在規(guī)劃問(wèn)題的站點(diǎn)測(cè)試速率較差,但滿足高速率條件的規(guī)劃站點(diǎn)不一定達(dá)到高速率要求,這說(shuō)明還存在其他的因素影響實(shí)際測(cè)試速率。
5 ? 總結(jié)
本文以TD-LTE基站的最近站間距、平均站間距、站高、第一層緊密鄰區(qū)數(shù)作為分類的特征數(shù)據(jù),以每個(gè)基站實(shí)際測(cè)試PDCP層下載速率為優(yōu)化目標(biāo),構(gòu)建了決策樹(shù)算法,將基站類型分為5類。從分類的結(jié)果可以看出:
(1)在TD-LTE建網(wǎng)初期,平均站間距是影響速率的主要因素,必須保證站間距在一定的合理范圍之內(nèi),本試點(diǎn)區(qū)域的理想門限是415m。
(2)站高要合理。站間距較小時(shí),站高需要控制較低;而站間距較大時(shí),站高可以適當(dāng)高一些。
(3)最近站間距不能太小。
(4)緊密鄰區(qū)數(shù)在平均站間距不大時(shí)也需要進(jìn)行控制。
需要注意的是,不同城市的場(chǎng)景有所差異,本文所在城市環(huán)境得出的結(jié)果對(duì)相似環(huán)境的地區(qū)有參考意義,而對(duì)差別較大的區(qū)域則需要根據(jù)實(shí)地情況進(jìn)行決策樹(shù)分析。
此外,從后續(xù)的歸類錯(cuò)誤的站點(diǎn)問(wèn)題原因分析可知,要保證網(wǎng)絡(luò)的高速率,除了基站的規(guī)劃建設(shè)要求達(dá)標(biāo)之外,參數(shù)設(shè)置、PCI規(guī)劃、鄰區(qū)配置、終端性能都會(huì)帶來(lái)一定的影響,這也是后續(xù)繼續(xù)深入研究的方向。
參考文獻(xiàn):
[1] Iana Siomina1, Di Yuan. Analysis of Cell Load Coupling for LTE Network Planning and Optimization[A]. IEEE International Conference on Communications 2012 (ICC 2012)[C]. 2012: 1357-1361.
[2] E Amaldi, A Capone, F Malucelli, et al. Mannino, Optimization Problems and Models for Planning Cellular Networks[M]. In M Resende and P Pardalos, editors, Handbook of Optimization in Telecommunications. Springer Science, 2006: 917-939.
[3] Quinlan J R. Induction of Decision Tree[J]. Machine Learing, 1986,1(1): 81-106.
[4] Quinlan J R. Bagging, Boosting and C4.5[A]. Proceedings of the 13th International Conference on Artificial Intelligence[C]. Portland: AAI Press, 1996,9(2): 300-306.
[5] 申文明,王文杰,羅海江,等. 基于決策樹(shù)分類技術(shù)的遙感影像分類方法研究[J]. 遙感技術(shù)與應(yīng)用, 2007,22(3): 333-338.
[6] 李德仁,王樹(shù)良,李德毅,等. 論空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的理論與方法[J]. 武漢大學(xué)學(xué)報(bào): 信息科學(xué)版, 2002,27(3): 221-233.
[7] 楊學(xué)兵,張俊. 決策樹(shù)算法及其核心技術(shù)[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2007,17(1): 43-45.endprint
本文方法和傳統(tǒng)的距離計(jì)算法的區(qū)別是:本文直接計(jì)算基站的最近基站距離,然后根據(jù)周邊基站的方位角度和距離關(guān)系來(lái)判斷該基站的第一鄰區(qū)歸屬,并計(jì)算出第一鄰區(qū)平均距離,再根據(jù)最近基站距離、平均距離、站高以及第一層緊密鄰區(qū)數(shù)作為決策樹(shù)的主要因素構(gòu)建決策樹(shù)。
站間距的計(jì)算流程如圖2所示。
距離算子包括平均站間距和最近站間距,另外計(jì)算第一層緊密鄰區(qū)數(shù)量,緊密鄰區(qū)數(shù)是第一層鄰區(qū)數(shù)量,數(shù)據(jù)來(lái)自于OMC網(wǎng)管的切換統(tǒng)計(jì)數(shù)據(jù),根據(jù)切換占比超過(guò)總切換數(shù)15%的基站作為第一層鄰區(qū)基站,屬性數(shù)據(jù)模板如表1所示。
4.2 ?決策樹(shù)剪枝
在進(jìn)行決策樹(shù)分類時(shí),為防止決策樹(shù)和訓(xùn)練樣本集過(guò)分?jǐn)M合,特別是存在噪聲數(shù)據(jù)或不規(guī)范屬性時(shí)更為突出,需要對(duì)決策樹(shù)進(jìn)行剪枝[5]。剪枝算法通常利用統(tǒng)計(jì)方法決定是否將一個(gè)分支變?yōu)橐粋€(gè)結(jié)點(diǎn),通常采用預(yù)先剪枝方法(pre-pruning)和后剪枝方法(post-pruning)進(jìn)行決策樹(shù)剪枝。預(yù)先剪枝方法的優(yōu)點(diǎn)是在樹(shù)生長(zhǎng)的同時(shí)就進(jìn)行了剪枝,因此效率高,但是它可能產(chǎn)生“視覺(jué)界限”,即斷絕了其后繼節(jié)點(diǎn)進(jìn)行分支操作的任何可能性;后剪枝方法是當(dāng)決策樹(shù)的生長(zhǎng)過(guò)程完成后再進(jìn)行剪枝,該方法比預(yù)先剪枝方法計(jì)算時(shí)間長(zhǎng),但是可以獲得一個(gè)分類更準(zhǔn)確的決策樹(shù)。一個(gè)好的折中方法是預(yù)先剪枝也可以與后剪枝相結(jié)合,從而構(gòu)成混合剪枝方法。
4.3 ?結(jié)果與分析
本文采用的決策樹(shù)生成實(shí)驗(yàn)工具是Matlab7.0,訓(xùn)練樣本集為浙江TD-LTE某試商用城市先期開(kāi)通的401個(gè)TD-LTE室外站點(diǎn),檢驗(yàn)數(shù)據(jù)集為后期開(kāi)通的98個(gè)新TD-LTE站點(diǎn)。
本實(shí)驗(yàn)TD-LTE系統(tǒng)的主要參數(shù)設(shè)置為:系統(tǒng)帶寬20M,采用F頻段,上下行配比為1:3,特殊子幀配比為9:3:2,MIMO方式為2*2。運(yùn)用Matlab7.0自帶的決策樹(shù)算法,輸出結(jié)果如圖3所示,原始數(shù)據(jù)分為10個(gè)類,其中△表示根節(jié)點(diǎn),○表示葉子節(jié)點(diǎn),左向箭頭判斷為“是”,右向箭頭判斷為“否”。
為了更好地表征分類結(jié)果,本文采用了事后修剪方法,將之前決策樹(shù)建立的10個(gè)類按照結(jié)果速率的大小進(jìn)行了類的合并,最終形成了5個(gè)類,分別對(duì)應(yīng)低速率、較低速率、中等速率、較高速率和高速率,具體如表2所示。
運(yùn)用前面的決策樹(shù)分類依據(jù),對(duì)新建設(shè)的98個(gè)TD-LTE站點(diǎn)進(jìn)行了PDCP層下載速率預(yù)評(píng)估,在站點(diǎn)全部開(kāi)通后又采用MiFi測(cè)試終端進(jìn)行了拉網(wǎng)速率測(cè)試,然后將預(yù)測(cè)數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)進(jìn)行分類精度檢驗(yàn),結(jié)果如表3所示:
表3 ? ?分類檢驗(yàn)精度
類別 1 2 3 4 5
測(cè)試集數(shù)量 8 17 26 16 21
正確分類數(shù) 7 16 17 22 18
分類的精度/% 87.5 94.1 73.9 75.9 85.7
總精度/% 81.6
從測(cè)試結(jié)果來(lái)看,總體精度達(dá)到了81.6%,對(duì)低速率第1類和第2類的識(shí)別準(zhǔn)確性還是比較高,而對(duì)第3類和第4類的識(shí)別有些偏差,即存在規(guī)劃問(wèn)題的站點(diǎn)測(cè)試速率較差,但滿足高速率條件的規(guī)劃站點(diǎn)不一定達(dá)到高速率要求,這說(shuō)明還存在其他的因素影響實(shí)際測(cè)試速率。
5 ? 總結(jié)
本文以TD-LTE基站的最近站間距、平均站間距、站高、第一層緊密鄰區(qū)數(shù)作為分類的特征數(shù)據(jù),以每個(gè)基站實(shí)際測(cè)試PDCP層下載速率為優(yōu)化目標(biāo),構(gòu)建了決策樹(shù)算法,將基站類型分為5類。從分類的結(jié)果可以看出:
(1)在TD-LTE建網(wǎng)初期,平均站間距是影響速率的主要因素,必須保證站間距在一定的合理范圍之內(nèi),本試點(diǎn)區(qū)域的理想門限是415m。
(2)站高要合理。站間距較小時(shí),站高需要控制較低;而站間距較大時(shí),站高可以適當(dāng)高一些。
(3)最近站間距不能太小。
(4)緊密鄰區(qū)數(shù)在平均站間距不大時(shí)也需要進(jìn)行控制。
需要注意的是,不同城市的場(chǎng)景有所差異,本文所在城市環(huán)境得出的結(jié)果對(duì)相似環(huán)境的地區(qū)有參考意義,而對(duì)差別較大的區(qū)域則需要根據(jù)實(shí)地情況進(jìn)行決策樹(shù)分析。
此外,從后續(xù)的歸類錯(cuò)誤的站點(diǎn)問(wèn)題原因分析可知,要保證網(wǎng)絡(luò)的高速率,除了基站的規(guī)劃建設(shè)要求達(dá)標(biāo)之外,參數(shù)設(shè)置、PCI規(guī)劃、鄰區(qū)配置、終端性能都會(huì)帶來(lái)一定的影響,這也是后續(xù)繼續(xù)深入研究的方向。
參考文獻(xiàn):
[1] Iana Siomina1, Di Yuan. Analysis of Cell Load Coupling for LTE Network Planning and Optimization[A]. IEEE International Conference on Communications 2012 (ICC 2012)[C]. 2012: 1357-1361.
[2] E Amaldi, A Capone, F Malucelli, et al. Mannino, Optimization Problems and Models for Planning Cellular Networks[M]. In M Resende and P Pardalos, editors, Handbook of Optimization in Telecommunications. Springer Science, 2006: 917-939.
[3] Quinlan J R. Induction of Decision Tree[J]. Machine Learing, 1986,1(1): 81-106.
[4] Quinlan J R. Bagging, Boosting and C4.5[A]. Proceedings of the 13th International Conference on Artificial Intelligence[C]. Portland: AAI Press, 1996,9(2): 300-306.
[5] 申文明,王文杰,羅海江,等. 基于決策樹(shù)分類技術(shù)的遙感影像分類方法研究[J]. 遙感技術(shù)與應(yīng)用, 2007,22(3): 333-338.
[6] 李德仁,王樹(shù)良,李德毅,等. 論空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的理論與方法[J]. 武漢大學(xué)學(xué)報(bào): 信息科學(xué)版, 2002,27(3): 221-233.
[7] 楊學(xué)兵,張俊. 決策樹(shù)算法及其核心技術(shù)[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2007,17(1): 43-45.endprint