顏惠琴
摘 要:通過對(duì)網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測(cè),實(shí)現(xiàn)流量的宏觀調(diào)控和自適應(yīng)調(diào)節(jié),可避免網(wǎng)絡(luò)擁堵。傳統(tǒng)方法對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè)采用線性信號(hào)分析方法,而忽略了網(wǎng)絡(luò)流量的非線性耦合特性,對(duì)流量的預(yù)測(cè)精度不高。提出一種基于線性時(shí)間序列分析的網(wǎng)絡(luò)流量預(yù)測(cè)算法。仿真實(shí)驗(yàn)表明,采用該算法進(jìn)行網(wǎng)絡(luò)流量預(yù)測(cè),能有效提高預(yù)測(cè)精度,并具有較強(qiáng)的穩(wěn)定性和抗干擾性,具有較好的應(yīng)用價(jià)值。
關(guān)鍵詞:網(wǎng)絡(luò)流量;流量預(yù)測(cè);非線性時(shí)間序列分析
DOIDOI:10.11907/rjdk.1511026
中圖分類號(hào):TP393
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào)文章編號(hào):1672-7800(2015)012-0163-03
0 引言
隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大和網(wǎng)絡(luò)特性的變化,需要對(duì)網(wǎng)絡(luò)流量時(shí)間序列進(jìn)行定量分析和研究。通過對(duì)網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測(cè),實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)流量序列的宏觀調(diào)控。網(wǎng)絡(luò)流量是網(wǎng)絡(luò)中數(shù)據(jù)進(jìn)行上行和下行傳輸?shù)臄?shù)據(jù)和文件,網(wǎng)絡(luò)流量的預(yù)測(cè)即對(duì)這些數(shù)據(jù)通過信號(hào)處理方法實(shí)現(xiàn)未來趨勢(shì)的評(píng)估,以實(shí)現(xiàn)信號(hào)參量的估計(jì)和檢測(cè)。網(wǎng)絡(luò)流量從本質(zhì)上而言是一組線性和非線性組合的時(shí)間序列,是網(wǎng)絡(luò)終端用戶在下載和上傳數(shù)據(jù)信息資源時(shí)產(chǎn)生的時(shí)間序列采樣振蕩數(shù)據(jù)。因此,通過分析網(wǎng)絡(luò)流量序列的內(nèi)在特性,采用信號(hào)處理方法進(jìn)行更準(zhǔn)確的預(yù)測(cè)和控制,研究網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測(cè)算法,在進(jìn)行網(wǎng)絡(luò)監(jiān)控和網(wǎng)絡(luò)擁堵防治等領(lǐng)域具有較高的應(yīng)用價(jià)值[1]。
通過對(duì)網(wǎng)絡(luò)流量的準(zhǔn)確分析和控制,可提高網(wǎng)絡(luò)服務(wù)質(zhì)量,預(yù)防網(wǎng)絡(luò)擁堵。傳統(tǒng)方法中,對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè)主要采用ARMA模型算法、統(tǒng)計(jì)信號(hào)分析算法、Poisson模型算法和譜分析算法等[2,3]。其中文獻(xiàn)[4]提出一種基于遞歸率REC特征提取的網(wǎng)絡(luò)流量預(yù)測(cè)算法,采用相空間重構(gòu)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)流的多維特征分析,提高預(yù)測(cè)精度,但是該算法存在計(jì)算量大、抗干擾性不強(qiáng)的問題;文獻(xiàn)[5]提出一種基于粒子群優(yōu)化差分進(jìn)化的網(wǎng)絡(luò)流預(yù)測(cè)算法,提取高斯密度特征,通過粒子群進(jìn)化實(shí)現(xiàn)流量預(yù)測(cè),通過更新兩個(gè)“極值”來更新流量變化,減少預(yù)測(cè)誤差,但該算法無法有效把流量時(shí)間序列的初始聚類誤差收斂到有限域中,收斂性不好??梢?,傳統(tǒng)方法對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè)采用線性信號(hào)分析方法,而忽略了網(wǎng)絡(luò)流量的非線性耦合特性,對(duì)流量的預(yù)測(cè)精度不高。針對(duì)上述問題,本文提出一種基于線性時(shí)間序列分析的網(wǎng)絡(luò)流量預(yù)測(cè)算法。首先網(wǎng)絡(luò)流量的非線性時(shí)間序列分析模型,基于定量遞歸分析方法進(jìn)行網(wǎng)絡(luò)流量的非線性遞歸特征提取,以此為特征參量實(shí)現(xiàn)網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測(cè),實(shí)現(xiàn)算法改進(jìn),并通過仿真實(shí)驗(yàn)進(jìn)行性能測(cè)試和驗(yàn)證。仿真實(shí)驗(yàn)表明,采用該算法進(jìn)行網(wǎng)絡(luò)流量預(yù)測(cè)能有效提高預(yù)測(cè)精度,具有較強(qiáng)的穩(wěn)定性和抗干擾性,因此得出有效性結(jié)論。
1 問題描述和網(wǎng)絡(luò)流量非線性時(shí)間序列分析
1.1 網(wǎng)絡(luò)流量預(yù)測(cè)建模和信號(hào)模型構(gòu)建
定義網(wǎng)絡(luò)流量數(shù)據(jù)集為n個(gè)數(shù)據(jù)采樣點(diǎn)的非線性時(shí)間序列,流量序列的分簇向量之間的屬性矩陣為s,流量序列的特征表達(dá)式是n×n的矩陣,具體為:
D=0d(1,2)d(1,3)…d(1,4)d(2,1)0d(2,3)…d(2,n)d(3,1)d(3,2)0…d(3,n)0d(n,1)d(n,2)d(n,3)…0(1)
在局域中心網(wǎng)絡(luò)鏈路層中,使用Ei、etSi、erji和etik分別代表節(jié)點(diǎn)i的總能量、在場(chǎng)景Si中傳輸一個(gè)單元數(shù)據(jù)所需要的功率、節(jié)點(diǎn)i到節(jié)點(diǎn)j的接收功率消耗和節(jié)點(diǎn)i到節(jié)點(diǎn)k的傳輸功率流量,得到網(wǎng)絡(luò)流量時(shí)間序列的非線性特征的歐式距離為:
d(i,j)=(xi1-xj12+…+xid-xjd2)(2)
對(duì)于任意網(wǎng)絡(luò)流量采樣點(diǎn)xi和xj之間的定量遞歸距離為s(i,j),s(i,j)值越小,兩個(gè)網(wǎng)絡(luò)流量采樣點(diǎn)相似度則越大,非線性耦合程度越大;值越小,則網(wǎng)絡(luò)流量相似度越小。當(dāng)d(i,j)=d(j,i),d(i,i)=0,網(wǎng)絡(luò)流量信道結(jié)構(gòu)均衡,以此為原理進(jìn)行網(wǎng)絡(luò)流量預(yù)測(cè)。
1.2 網(wǎng)絡(luò)流量的非線性時(shí)間序列分析
本文以非線性時(shí)間序列分析為基礎(chǔ),進(jìn)行流量預(yù)測(cè),網(wǎng)絡(luò)流量的非線性三階自相關(guān)特征為:
Cor3=[(xn-x)(xn-d-x)(xn-D-x)][(xn-x)3](3)
其中,xn表示固定網(wǎng)絡(luò)流量的采樣時(shí)間序列,d表示相空間重構(gòu)實(shí)驗(yàn),D=2d,x表示互信息均值,[x(n)]代表對(duì)x(n)取方差,如式(4)所示。
[x(n)]=1/N∑Nn=1x(n)(4)
采用非線性時(shí)間序列分析方法,計(jì)算客戶機(jī)與服務(wù)器間的網(wǎng)絡(luò)流量的幅度和相位信息,如式(5)所示。
a(t)=x2(t)+y2(t),θ(t)=arctany(t)x(t)(5)
對(duì)于非線性高維空間中的流量序列特征任意一點(diǎn)Xn,采用相位隨機(jī)化處理,以實(shí)際采集的網(wǎng)絡(luò)流量時(shí)間序列{xn}作為非線性時(shí)間序列分析系統(tǒng)的輸入,如式(6)所示。
xn=h(zn)+ωn(6)
在高斯密度譜估計(jì)中,使用遞歸圖平面中遞歸點(diǎn)作為非線性特征,假設(shè)x1>x-1,則0位于[p0,p1]中,0則位于對(duì)角線平行線段區(qū)間[p-1,p0]中。由此可見,采用遞歸圖的遞歸率能有效反映網(wǎng)絡(luò)流量的非線性特征,通過高斯密度譜估計(jì),確定峰值所在區(qū)間,從而實(shí)現(xiàn)網(wǎng)絡(luò)流量的預(yù)測(cè)。
2 網(wǎng)絡(luò)流量預(yù)測(cè)算法實(shí)現(xiàn)
在上述網(wǎng)絡(luò)流量非線性時(shí)間序列分析的基礎(chǔ)上,針對(duì)傳統(tǒng)方法對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè)采用線性信號(hào)分析方法,忽略了網(wǎng)絡(luò)流量的非線性耦合特性,對(duì)流量的預(yù)測(cè)精度不高的問題,為了克服傳統(tǒng)方法的弊端,本文提出一種基于線性時(shí)間序列分析的網(wǎng)絡(luò)流量預(yù)測(cè)算法。首先網(wǎng)絡(luò)流量的非線性時(shí)間序列分析模型,基于定量遞歸分析方法進(jìn)行網(wǎng)絡(luò)流量的非線性遞歸特征提取,以此為特征參量實(shí)現(xiàn)網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測(cè),如果網(wǎng)絡(luò)流量時(shí)間序列中具有非線性成分存在,得到:
r(t)=sbu[s(t-τ0)]+αn(t)(7)
式(7)中,α為網(wǎng)絡(luò)流量非線性時(shí)間相空間重構(gòu)后的非高斯線性特征系數(shù),u為振幅,τ為流量數(shù)據(jù)采集時(shí)延,n(t)為非線性耦合干擾噪聲。以i為橫坐標(biāo)、j為縱坐標(biāo)的坐標(biāo)系采用定量遞歸分析方法,得到網(wǎng)絡(luò)流量預(yù)測(cè)應(yīng)度值:
f=αd11+βd2(8)d1=2∑ki=0∑kj=i+1d(ωi,ωj)k(k-1)(9)
其中,{ωi,ωij,mi}分別為定量遞歸特征空間中第i個(gè)流量的預(yù)測(cè)聚類中心,第j個(gè)數(shù)據(jù)元組和數(shù)據(jù)總數(shù)為{α,β}={1.3,2.6},考慮互相獨(dú)立的零均值的高斯白噪聲作為流量預(yù)測(cè)干擾因素,用u表示流量寬帶高斯密度函數(shù)的均值向量,ε為協(xié)方差矩陣,得到網(wǎng)絡(luò)流量預(yù)測(cè)的特征區(qū)間候選解為:
u(k+1)i=u(k+1)i1,u(k+1)i2,...,u(k+1)iD(10)
通過上述分析,得到網(wǎng)絡(luò)流量預(yù)測(cè)的特征信號(hào)模型表達(dá)為:
x(t)=Re∑ni=1ai(t)ejωi(t)=Re∑ni=1ai(t)ej∫ωi(t)dt (11)
上式反映了多分簇網(wǎng)絡(luò)流量的幅值、時(shí)間和頻率之間的關(guān)系,信號(hào)的幅值可以表示為時(shí)間t和瞬時(shí)頻率ω的函數(shù)H(ω,t),則此時(shí)每個(gè)路由器存儲(chǔ)器的命中率為h(x)=∑1≤i≤xNi-α/∑1≤i≤Ni-α→x1-α。 當(dāng) N→∞,粒子群時(shí)間-頻率聯(lián)合分布的集合為V={v1,v2,v3...vN},N為粒子群個(gè)數(shù),粒子群群路線的集合為E={e1,e2,e3...eM},M為幅值在整個(gè)頻率段上隨頻率的迭代步數(shù)。由此實(shí)現(xiàn)網(wǎng)絡(luò)流量預(yù)測(cè)算法的改進(jìn)。
3 仿真實(shí)驗(yàn)與性能測(cè)試
為了測(cè)試本文算法進(jìn)行網(wǎng)絡(luò)流量預(yù)測(cè)的性能,進(jìn)行仿真實(shí)驗(yàn),仿真軟件為Matlab7,算法運(yùn)行平臺(tái)為VC++6.0和SQLServer2005,網(wǎng)絡(luò)流量數(shù)據(jù)采用網(wǎng)絡(luò)Web數(shù)據(jù)集KDDCUP99和B400C20D40大型數(shù)據(jù)庫的網(wǎng)絡(luò)信息流量。數(shù)據(jù)采集服務(wù)器中有30個(gè)訪問點(diǎn),其中流量數(shù)據(jù)采集的訪問點(diǎn)1、2位于區(qū)域1,訪問點(diǎn)3、4位于區(qū)域2。在網(wǎng)絡(luò)流量的預(yù)測(cè)模型設(shè)計(jì)中,構(gòu)建網(wǎng)絡(luò)Web流數(shù)據(jù)采樣點(diǎn),共有10個(gè)簇,每個(gè)簇5個(gè)節(jié)點(diǎn),流量采集分為上行流量采集和下行流量采集,流量采集的帶寬為3.4 dB,采集時(shí)間為2015年5月30日~7月8日。以此為樣本,得到原始的流量序列時(shí)間序列波形如圖1所示。
圖1 流量序列時(shí)域波形
以上述流量數(shù)據(jù)為原始輸入,進(jìn)行流量預(yù)測(cè)。采用非線性時(shí)間序列分析方法,設(shè)置流量序列的初始相位容量為4 Mbps,流量數(shù)據(jù)采集延時(shí)20ms。基于定量遞歸分析方法進(jìn)行網(wǎng)絡(luò)流量的非線性遞歸特征提取,以此為特征參量實(shí)現(xiàn)網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測(cè),得到網(wǎng)絡(luò)流量預(yù)測(cè)非線性遞歸特征提取結(jié)果如圖2所示。
圖2 網(wǎng)絡(luò)流量預(yù)測(cè)非線性遞歸特征提取結(jié)果
由圖2可見,采用本文方法對(duì)流量進(jìn)行非線性時(shí)間序列分析,提取的非線性遞歸特征能有效反映流量序列的內(nèi)部細(xì)節(jié)譜特征,非線性成分的耦合特性得以有效展現(xiàn),特征聚焦性能較好,實(shí)現(xiàn)了流量的準(zhǔn)確預(yù)測(cè)。為了對(duì)比算法性能,將本文算法和傳統(tǒng)算法進(jìn)行比較,得到性能對(duì)比結(jié)果如圖3所示。由圖可見,采用本文算法進(jìn)行流量預(yù)測(cè)的執(zhí)行時(shí)間較短,預(yù)測(cè)精度較高,展示了較好的特性。
4 結(jié)語
網(wǎng)絡(luò)流量從本質(zhì)上而言是一組線性和非線性組合的時(shí)間序列,是網(wǎng)絡(luò)終端用戶在下載和上傳數(shù)據(jù)信息資源時(shí)產(chǎn)生的時(shí)間序列采樣振蕩數(shù)據(jù)。因此,通過分析網(wǎng)絡(luò)流量序列的內(nèi)在特性,采用信號(hào)處理方法,進(jìn)行更準(zhǔn)確的預(yù)測(cè)和控制,研究網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測(cè)算法,在進(jìn)行網(wǎng)絡(luò)監(jiān)控和網(wǎng)絡(luò)擁堵防治等領(lǐng)域具有較好的應(yīng)用價(jià)值。本文提出一種基于線性時(shí)間序列分析的網(wǎng)絡(luò)流量預(yù)測(cè)算法。首先網(wǎng)絡(luò)流量的非線性時(shí)間序列分析模型,基于定量遞歸分析方法進(jìn)行網(wǎng)絡(luò)流量的非線性遞歸特征提取,以此為特征參量實(shí)現(xiàn)網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測(cè),并實(shí)現(xiàn)算法改進(jìn)。仿真結(jié)果表明,采用本文算法對(duì)網(wǎng)絡(luò)預(yù)測(cè)精度較高,具有較好的性能。
圖3 預(yù)測(cè)性能對(duì)比
參考文獻(xiàn)參考文獻(xiàn):
[1] 楊雷,李貴鵬,張萍.改進(jìn)的Wolf一步預(yù)測(cè)的網(wǎng)絡(luò)異常流量檢測(cè)[J].科技通報(bào),2014.30(2):47-49.
[2] 李振剛.基于高斯過程回歸的網(wǎng)絡(luò)流量預(yù)測(cè)模型[J].計(jì)算機(jī)應(yīng)用,2014,34(5):1251-1254.
[3] CHANG Y C,LIN Z S,CHEN J L.Cluster based self organization management protocols for wireless sensor networks[J].IEEE Transactions on Consumer Electronics,2006,52(1):75-80.
[4] KOLHE J P,SHAHEED M,CHANDAR T S,et al.Robust control of robot manipulators based on uncertainty and disturbance estimation[J].International Journal of Robust and Nonlinear Control,2013,23(1):104-122.
[5] 陸興華,陳平華.基于定量遞歸聯(lián)合熵特征重構(gòu)的緩沖區(qū)流量預(yù)測(cè)算法[J].計(jì)算機(jī)科學(xué),2015,42(4):68-71.
[6] YUNTONG LIU.K-pruning algorithm for semantic relevancy calculating model of natural language[J].Journal of Theoretical and Applied Information Technology,2013,48(3):231-235.
(責(zé)任編輯:黃 健)