李慧敏
(福建交通職業(yè)技術學院信息技術與工程系,福建 福州 350007)
隨著計算機網絡的迅速發(fā)展,網絡規(guī)模日益龐大和復雜,發(fā)生各種故障的可能性也越大,為了給用戶提供優(yōu)質的服務,網絡的維護與管理顯得尤為重要.傳統(tǒng)的響應式網絡管理方法是在告警之后,解決潛在的問題,這時候網絡服務很可能已經受到影響.這就使得網絡流量預測技術備受關注,因為它使得提前發(fā)出預警成為可能.人們最初主要借鑒PSTN的流量模型,用Poisson模型來描述數據網絡的流量模型.隨著網絡的發(fā)展,Paxson V與Floyd S指出這種傳統(tǒng)的Poisson模型已經不適于Internet的流量描述與預測[1].大量研究表明,實際的網絡流量具有自相似性,是指統(tǒng)計意義下的自相似性,即它的統(tǒng)計特性獨立于時間范圍.在這方面國內很多學者進行了大量的研究工作.例如,叢鎖等給出了基于小波技術的網絡流量特性刻畫[2],并提出一種基于小波變換的網絡流量多重分形模型[3],用于分析網絡流量的自相似特征;很多學者也把人工神經網絡應用到流量預測中[4-5]并取得了一定預測效果.
如何提高預測的準確度一直是網絡流量預測的主要難題.本文就此問題展開研究.在本文的研究中,采用了從實際網絡上收集的實時網絡業(yè)務數據,實驗結果表明該模型與比傳統(tǒng)單一的預測模型相比有較高的預測精度.
小波變換理論[6]是上世紀80年代后期發(fā)展起來的應用數學分支,近年來被廣泛地應用于信號處理、圖像處理、模式識別等科學領域.它具有多分辨率(Multi-Resolution)即多尺度的特點,可以由粗及精地逐步觀察信號.小波變換能有效處理非平穩(wěn)時間序列,通過小波分解將時間序列一層一層分解到不同的頻率通道上,得到的結果在頻率成分上比原始信號單一,并且對時間序列做了平滑.小波包(waveletpacket)的概念是由M.V.Wiekerhauser,R.R.Coifman 等人在小波變換的基礎上進一步提出來的,小波包借助于小波分解濾波器在各個尺度上對每個子帶均進行再次降半劃分,從而得到比二進離散小波變換更精細的信號分解.
小波包的基本思想是對多分辨分析中的小波子空間也進行分解.令
式中g(k)=(-1)kh(1-k),即兩系數也具有正交關系,其等價表示為
對離散信號S,采用(2)式和(3)式構造的小波包序列進行3層分解,分解結構如圖1所示.
圖1 小波包的三層分解結構樹
信號f(t)的正交小波分解可以表示為
式中
正交小波的重建公式為
設
小波包系數的重構可表示為
式中g0(l-2k),g1(l-2k)分別為小波包重構的低通和高通濾波器組.
根據(10)式,信號可以通過小波包分解系數重構出各個子頻帶內的時域信號.重構后的時域信號可以表示為
其中 x(t)表示原始信號;x0(t),x1(t),…,x2j-1(t)表示經過小波包分解系數重構后在各個子頻帶內的時域信號.可見,小波包分解系數重構后的各個子頻帶時域信號的疊加和就是原始信號,分解的頻帶個數由分解尺度決定.
網絡流量[7]具有較高的復雜性、非線性、不平穩(wěn)性,可以通過小波包變換對其進行多尺度分解和單支重構獲得多個近似信號和細節(jié)信號.通過分解和重構可以使信號的平穩(wěn)性得到改善.近似信號和細節(jié)信號變換特點各不相同:近似信號保持了與原始流量完全相同的變化趨勢而且數值很接近,體現了它對原始序列長期的、根本性影響,較好地體現了流量的周期性,可以采用LMMSE估計方法來預測下一時刻網絡流量的近似信號;細節(jié)信號比較平穩(wěn),由于小波可以近似地去除流量過程的長相關,所以細節(jié)信號體現了短時間依賴關系,可以通過對細節(jié)信號先建立AR模型,然后再通過AR模型實現對下一時刻的細節(jié)信號的預測.最后,把各個預測的信號通過組合就可以生成流量的預測結果.
2.1.1 LMMSE 估計
文獻[8]中給出了一種基于線性最小平均平方誤差估計(LMMSE)的網絡流量預測方法.令預測值^f(n+1)為已測量的前n個流量值的加權和:
式中,R(n)是時間序列的協(xié)方差函數,一般可以通過經驗公式獲得,n是一個可變的參數,表示序列采樣數.
2.1.2 對近似信號的預測
由于近似信號有較強的周期性,屬于非平穩(wěn)信號,對逼近信號進行LMMSE估計必須滿足是零均值平穩(wěn)隨機過程的假設,可將待預測的原始信號序列進行零均值化處理.設x(t)表示原始序列,λ表示序列x(t)的均值,y(t)表示零均值化后的序列,則
通過上式處理后,y(t)可以看作近似平穩(wěn)序列,用LMMSE對序列y(t)進行預測的結果加上λ就可以得到原始序列的預測結果.
通過對原始序列進行小波包多尺度分解和重構可以得到一系列細節(jié)信號,這些信號比較平穩(wěn),而且表現為短時間依賴關系,可以采用經典的自回歸(AR)模型進行預測.
對模型參數的估計通常有矩估計、最小二乘估計、極大似然估計等.本文采用矩估計方法.
用AR模型進行預測分析時,通常要經過模型定階、參數估計、適應性檢驗、利用模型遞推法預測等幾個主要步驟.
對各序列分別進行分析和預測后,通過(11)式組合預測的各個近似信號和細節(jié)信號就可以生成原始流量的預測值.
基于小波包分析的網絡流量組合預測模型的實現過程描述如圖2所示.其中,LMMSE估計需要先采用AIC準則來確定模型的階數,再利用(12)~(14)式計算就可得到預測值.而使用AR模型對一個單獨序列進行預測的實現過程主要包括模型定階、參數估計、適應性檢驗、利用模型遞推法預測這4個階段.
圖2 基于小波包分析的網絡流量組合預測模型的實現過程
本文采用Cricket(基于SNMP協(xié)議的監(jiān)控網絡流量和主機資源的開放源代碼的管理工具)對中國教育科研網福建主節(jié)點上一臺高端路由器(Cisco 7609)某端口流出流量進行監(jiān)測,監(jiān)測時間為3天,采樣時間間隔為5分鐘,所得流量數據曲線如圖3所示.從圖3中可以看出它具有很強的不規(guī)則性,而同時又表現出一定的周期性因素.
圖3 實際流量曲線圖
對實際流量數據序列進行零均值化.采用雙正交小波bior6.8,用小波包分解算法對序列Y進行3層分解,并對近似部分和細節(jié)部分分別進行重構,得到的結果數據圖形如圖4所示.
圖4 D0~D7
其中,D0~D7分別是第3層各部分分別重構到原級別的序列.比較可以看出,近似部分的重構結果明顯比原序列平滑.對于這些分解重構后的各個序列,可以再次用其它的方法進行平穩(wěn)化,從而能得到更高的預測準確度.但是,為了體現出本文基于小波包變換的預測效果,我們不再對它們做其它平穩(wěn)化處理,而是直接通過建立組合模型進行預測.
對D0進行LMMSE估計預測,對D1~D7采用AR模型進行預測,所得預測結果如圖5所示.由圖5可以看出,這種預測方法對急劇變化的點掌握得不好(這些點的誤差較大,在定量誤差分析時會對誤差參數產生較大影響),并且可以看出雖然預測結果的趨勢跟實際流量一致,但隨著流量值的增大,誤差也相應變大.
圖5 預測圖和預測誤差
在分解層數2和3下,使用本文介紹的方法,對原始流量數據進行預測,預測結果的誤差數據如表1所示.其中,MAE(Mean Absolute Error)為平均絕對誤差,MRE(Mean Relative Error)為平均相對誤差.表1中數據表明,隨著分解層數的增加,預測誤差變小,即預測準確度提高,因為分解層數越多,分解后的各部分在頻率成分上越單一.這也在一定程度上反映了小波包變換在本文預測方法中所起的作用.
表1 變換層數為2和3時的預測誤差
表2 不同方案的預測誤差對比表
為了查看本文方法的預測效果,我們分別使用本文介紹的方法和文獻[8]介紹的方法對圖3所示原始流量數據進行預測,預測結果的誤差數據如表2所示.
由表2中數據可以看出,本文方法的預測誤差比另一種方案的預測誤差有了大幅減小,這表明小波包分解和重構在預測過程中的作用是非常明顯的.這個結果說明了,基于小波包分析的網絡流量組合預測模型,對網絡流量預測是可行、有效的,并且比常用的預測方法具有更高的預測準確度.
本文提出一種基于小波包分析的網絡流量組合預測模型,實驗結果表明,該方法比傳統(tǒng)的預測方法具有更高的預測精度,這表明小波包變換在網絡流量預測中的作用是顯著的.在對預測結果的分析中發(fā)現,本文的方法對急劇變化的點掌握得不好,并且可以看出雖然預測結果的趨勢跟實際流量一致,但隨著流量值的增大,誤差也相應變大.所以下一步的主要研究工作就是針對這一塊做改進.
[1]Paxson V,Floyd S.Wide-area traffic:the failure of poissonmodeling[J].IEEE/ACM Transactions on Networking,1995,3:226 -244.
[2]韓良秀,叢鎖.基于小波技術的網絡流量特性刻畫[J].小型微型計算機系統(tǒng),2001,2(9):1110 -1113.
[3]叢鎖,韓良秀.基于離散小波變換的網絡流量多重分形模型[J].通信學報,2003,24(5):3 -8.
[4]程光,龔儉.CERNET流量行為季節(jié)預測模型[J].小型微型計算機系統(tǒng),2002,23(11):1321 -1324.
[5]馮海亮,陳滌,林青家,等.一種基于神經網絡的網絡流量組合預測模型[J].計算機應用2006,26(9):2206 -2208,2228.
[6]楊建國.小波分析及其工程應用[M].北京:機械工業(yè)出版社,2005:17-63.
[7]李小航,劉淵,劉元珍.基于小波多尺度分析的網絡流量組合預測方法研究[J].微電子學與計算機,2008,25(1):130 -133.
[8]Gao Yuan,He Guanghui,Hou JC.On exploiting traffic predictability in active queue management[M].In Proc.of the INFOCOM 2002.New York:IEEE Communications Society,2002:1630 -1639.