尹粵寧
【摘要】 近年來隨著寬帶市場的蓬勃發(fā)展,使得各類IP運營商對其城域網(wǎng)容量進行了不斷地擴充。然而這種擴充更多的具有盲目性,如何有效的對城域網(wǎng)各類流量進行充分評估,對業(yè)務(wù)進行精細(xì)化推廣成了擺在IP運營商面前的重點和難點。本文將重點討論如何利用最精簡的手段,通過采集分析城域網(wǎng)實際數(shù)據(jù),建立相關(guān)分析模型,并驗證模型的可行性。相關(guān)方法和結(jié)論對提高城域網(wǎng)網(wǎng)絡(luò)擴容的準(zhǔn)確性、降低擴容預(yù)算成本以及推進業(yè)務(wù)精細(xì)化管理具有現(xiàn)實的指導(dǎo)意義。
【關(guān)鍵詞】 IP運營商 寬帶遠(yuǎn)程接入服務(wù)器 數(shù)據(jù)采集 驗證 建模一、引言
寬帶遠(yuǎn)程接入服務(wù)器(Broadband Remote Access Server,簡稱BRAS,下同)是面向?qū)拵ЬW(wǎng)絡(luò)應(yīng)用的新型接入網(wǎng)關(guān)。各城域網(wǎng)中接入層設(shè)備匯聚后上聯(lián)到BRAS,BRAS上數(shù)據(jù)通過出口路由器再跟骨干或者其他的城域網(wǎng)進行通信。IP運營商可以BRAS為單位,分析獲取BRAS各業(yè)務(wù)類型的各類帶寬下的用戶平均流量,以此為基礎(chǔ)數(shù)據(jù),建立模型,如地域片區(qū)模型、鏈路模型、設(shè)備模型等,按照模型分析出地域片區(qū)、鏈路、設(shè)備等的流量狀況,形成網(wǎng)絡(luò)擴容,業(yè)務(wù)推廣的分析依據(jù)。
二、數(shù)據(jù)采集及分析
2.1通過在線用戶數(shù)分析
目前IP運營商的網(wǎng)管系統(tǒng)已經(jīng)實現(xiàn)了對BRAS上連中繼流量的周期性采集功能,假設(shè)采集周期為5分鐘。同時也實現(xiàn)了BRAS分業(yè)務(wù)類型的在線用戶數(shù)的采集功能,假設(shè)采集周期為10分鐘。兩者的采集時間點在10分鐘的整數(shù)倍重合,因此可以按照相同的采集時間點對兩者進行對應(yīng),作為分析樣本。
在對實際數(shù)據(jù)進行分析之前,經(jīng)過初步分析,認(rèn)為:
公眾互聯(lián)網(wǎng)及電視互動流媒體的在線用戶數(shù)對BRAS上連中繼流量(下行流量,以下提及的流量都是指BRAS上連中繼的下行流量)有較大影響,所以假定一個模型為:BRAS流量=a×公眾互聯(lián)網(wǎng)在線用戶數(shù)+b×電視互動流媒體在線用戶數(shù)+c,其中a和b分別表示公眾互聯(lián)網(wǎng)和電視互動流媒體的每用戶流量,c代表其他流量。
因為不同區(qū)域的用戶的上網(wǎng)行為可能存在較大差別,在不同區(qū)域,甚至不同BRAS上兩者的相關(guān)性可能存在較大不同,因此考慮建立區(qū)域模型,區(qū)域內(nèi)選擇多臺BRAS設(shè)備進行抽樣分析。
進行精細(xì)化的在線用戶數(shù)采集,預(yù)先采集城域網(wǎng)活躍用戶的帶寬情況(可參考抽樣采集各帶寬用戶流量方案),在每個采集周期中疊加上帶寬情況,即可得出在線用戶的帶寬分布情況,則上述的模型將變?yōu)椋?/p>
BRAS流量=a1×公眾互聯(lián)網(wǎng)在線用戶數(shù)+a2×公眾互聯(lián)網(wǎng)在線用戶數(shù)+a3×公眾互聯(lián)網(wǎng)在線用戶數(shù)+b1×電視互動流媒體在線用戶數(shù)+b2×電視互動流媒體在線用戶數(shù)+b3×電視互動流媒體在線用戶數(shù)+c。
其中a1,a2,a3代表各帶寬的公眾互聯(lián)網(wǎng)用戶平均流量,b1,b2,b3代表各帶寬的電視互動流媒體用戶的平均流量,c代表其他流量。
此模型可通過多點數(shù)據(jù)形成線性方程組,最終解出a1,a2,a3,b1,b2,b3等各帶寬下的平均用戶流量。
根據(jù)實際數(shù)據(jù)的采樣,經(jīng)過初步分析,可以發(fā)現(xiàn):
流量與總的在線用戶數(shù)存在明顯的線性關(guān)系。
如果綜合分析三者的關(guān)系,可以發(fā)現(xiàn)對公眾互聯(lián)網(wǎng)用戶數(shù)在絕大多數(shù)情況下都是正線性相關(guān)(a>0),對電視互動流媒體用戶數(shù)有時正相關(guān)(b>0)有時負(fù)相關(guān)(b<0)。
無論是對總用戶數(shù)還是公眾互聯(lián)網(wǎng)用戶數(shù),線性分析得到的截距都是負(fù)數(shù)(c<0),意味著用戶數(shù)為0的時候,是負(fù)流量??赡苁且驗槟承┯脩魭煸诰W(wǎng)上但是不占用流量。
2.2抽樣采集各帶寬用戶流量
采集公眾互聯(lián)網(wǎng)用戶帶寬
目前BRAS主流設(shè)備為華為的ME60,可在設(shè)備上執(zhí)行查看相應(yīng)業(yè)務(wù)類型的所有在線用戶,并獲取到用戶詳細(xì)的用戶名稱,帶寬,接入端口等信息。
隨機挑選在線的各種帶寬的用戶進行流量采集
針對要分析的BRAS, 每臺BRAS的指定業(yè)務(wù)類型上每種帶寬抽選用戶進行流量采集,將用戶按帶寬劃分帶寬等級,如2M:2,4M:4,6M-6,8M-8,10M-10,12M-12,20M及以上20,以10分鐘為一個粒度,設(shè)備內(nèi)按業(yè)務(wù)類型(公眾互聯(lián)網(wǎng)以及電視互動流媒體)以每個等級的帶寬隨機挑選100個用戶進行流量采集,排除掉中途下線以及掉線重新上線的用戶,每次進行采集時用戶不足100個時在同等級帶寬用戶中隨機補齊,采集到原始10分鐘粒度的用戶帶寬數(shù)據(jù)。
上述采集的是用戶流量計數(shù)器的值,以兩個采集點之間差值為采集點間的總流量,總流量/采集點時間差得出采集點間的平均流量,并且采集當(dāng)前公眾互聯(lián)網(wǎng)業(yè)務(wù)的總在線人數(shù)。
原始數(shù)據(jù)采集完成后進行數(shù)據(jù)的匯總:
將10分鐘原始數(shù)據(jù)按區(qū)域、帶寬類型、業(yè)務(wù)類型等十分鐘粒度時間點進行匯總,匯總出十分鐘粒度的地市帶寬平均上下行流速以及最大上下行流速;將10分鐘匯總數(shù)據(jù)按區(qū)域、帶寬類型、業(yè)務(wù)類型、小時粒度時間點進行匯總,匯總出小時粒度的區(qū)域帶寬平均上下行流速以及最大上下行流速。
三、數(shù)據(jù)分析驗證
3.1通過在線用戶數(shù)分析
經(jīng)過持續(xù)的數(shù)據(jù)采集以及分析,實際發(fā)現(xiàn)通過上述方法獲取的帶寬平均流量值的波動情況跟實際設(shè)備上聯(lián)整體流量的波動情況吻合,并且根據(jù)歷史數(shù)據(jù)推測的預(yù)測流量也較為準(zhǔn)確。
3.2抽樣采集各帶寬用戶流量
對上海地區(qū)某IP運營商的公眾互聯(lián)網(wǎng)用戶與電視互動流媒體用戶24小時流量實測,隨機選取了30臺BRAS測量2類用戶的上/下行平均流速,公眾用戶總數(shù)約30萬,電視互動流媒體用戶數(shù)約10萬。
公眾互聯(lián)網(wǎng)用戶流速測量:針對3類區(qū)域30臺BRAS流量進行24小時實測,采樣間隔為30分鐘(抽樣率5%,覆蓋20萬用戶)?;ヂ?lián)網(wǎng)用戶晚間峰值平均下行速率約908kbps,峰值平均上行速率約403kbps。
電視互動流媒體用戶流速測量:針對2類區(qū)域20臺BRAS中的20萬戶電視互動流媒體的用戶帳號進行24小時監(jiān)測,采樣間隔15分鐘。電視互動流媒體用戶晚間下行速率基本穩(wěn)定在3Mbps(為互聯(lián)網(wǎng)用戶的3倍),上行平均速率70kbps。
以上可以認(rèn)為兩種方法分析出來的結(jié)果基本可反應(yīng)現(xiàn)網(wǎng)實際的流量狀況,數(shù)據(jù)有一定參考價值。
四、流量模型建立
區(qū)域模型
區(qū)域模型的制定目的是分析區(qū)域內(nèi)業(yè)務(wù)類型下的帶寬分布狀況,以及各帶寬的平均流量狀況。以確定區(qū)域內(nèi)寬帶提速所帶來的區(qū)域流量變化影響,調(diào)整擴容指標(biāo)。
采集方案基于原有的按設(shè)備、業(yè)務(wù)類型、帶寬等方式采集,仍然是單獨設(shè)備上各業(yè)務(wù)類型的各帶寬的用戶隨機挑選100個左右,下線的用戶進行同業(yè)務(wù)類型同帶寬的用戶填補。并且需要獲取用戶賬號信息跟區(qū)域的對應(yīng)關(guān)系。
在采集數(shù)據(jù)完成后針對用戶確定其營銷中心,區(qū)域分公司,并且進行營銷中心,區(qū)域分公司的數(shù)據(jù)存儲,匯總時以業(yè)務(wù)類型、區(qū)域分公司、營銷中心進行帶寬匯總,在區(qū)域分公司為營銷中心的上層,匯總時增加按區(qū)域分公司的營銷中心方式匯總。在挑選設(shè)備時注意按設(shè)備分布挑選,每個中心大約挑選 2 -3 臺BRAS做采集。
鏈路流量模型
此模型需獲取用戶賬戶跟設(shè)備端口的綁定關(guān)系,并且前期做了一些分析,分析出綁定設(shè)備端口的賬號在所有用戶中的占比關(guān)系,下面是其中的一次分析:
設(shè)備IP 用戶總數(shù) 綁定用戶總數(shù) 綁定占比
1xx.xxx.xxx.xxx 4564 3579 78.42
在綁定占比較高的設(shè)備上做抽樣分析,獲取綁定用戶較多的端口:
設(shè)備IP 端口 端口用戶總數(shù) 端口用戶總數(shù)占比
1xx.xxx.xxx.xxx 1/0/2 479 13.38
1xx.xxx.xxx.xxx 1/0/3 38 1.26
1xx.xxx.xxx.xxx 1/0/4 17 0.47
1xx.xxx.xxx.xxx 2/0/2 1092 30.51
1xx.xxx.xxx.xxx 2/0/3 1065 29.76
1xx.xxx.xxx.xxx 2/0/4 881 24.62
從上表可知,設(shè)備端口綁定用戶數(shù)較多,綁定占比達到78%,可以挑選有代表性的設(shè)備下的端口1/0/2,2/0/2,2/0/3,2/0/4對應(yīng)的用戶。采集時跟蹤此批用戶,分析出用戶的帶寬分布情況,按帶寬類型分析各帶寬的平均流量,以統(tǒng)計出端口對應(yīng)鏈路的流量狀況,再按占比層層遞歸,遞歸出設(shè)備的流量狀況,統(tǒng)計出鏈路內(nèi)的帶寬平均流量、設(shè)備內(nèi)的帶寬平均流量,分析當(dāng)進行帶寬提速對鏈路的流量增加的影響。從網(wǎng)管系統(tǒng)獲取端口鏈路的相關(guān)信息,分析當(dāng)前流量利用率,根據(jù)帶寬擴容時鏈路的流量利用率推算,再按占比倒推出擴容對設(shè)備流量的需求。
五、結(jié)束語
從上述的分析可知,通過獲取BRAS上的成分流量,分析出公眾互聯(lián)網(wǎng)與電視互動流媒體等業(yè)務(wù)的各帶寬的平均流量狀況,以此數(shù)據(jù)為基礎(chǔ)建立各種應(yīng)用模型,可以反映出城域網(wǎng)流量整體流量狀況,并且可反映出城域網(wǎng)整體流量增長趨勢,也能體現(xiàn)出業(yè)務(wù)類型下各帶寬的用戶行為,可為寬帶大提速提供依據(jù)。區(qū)域設(shè)備鏈路流量模型符合精細(xì)化管理要求,可精細(xì)化的進行網(wǎng)絡(luò)調(diào)整以及業(yè)務(wù)推廣。此方法的成本較低,除了需要支撐系統(tǒng)的(PC)服務(wù)器之外,不需要額外購買設(shè)備,具有較好的推廣價值。