黃正峰
摘要:我國網(wǎng)絡(luò)通信規(guī)模巨大,且隨著用戶對網(wǎng)絡(luò)服務(wù)質(zhì)量的要求不斷提高,導(dǎo)致網(wǎng)絡(luò)中存在大量類型各異的數(shù)據(jù),為了完成這些數(shù)據(jù)的傳輸任務(wù),網(wǎng)絡(luò)設(shè)備不得不耗費(fèi)更多的資源進(jìn)行計(jì)算與處理,這對網(wǎng)絡(luò)整體性能的穩(wěn)定造成了一定的影響。在此情況下,網(wǎng)絡(luò)性能維護(hù)工作必須加以改進(jìn)和完善,其重點(diǎn)就在于網(wǎng)絡(luò)異常點(diǎn)的確定與處理。該文提出了一種基于SVM的網(wǎng)絡(luò)異常點(diǎn)檢測技術(shù),并構(gòu)建了相關(guān)的同點(diǎn)時間序列模型,能夠?qū)W(wǎng)絡(luò)異常點(diǎn)實(shí)施動態(tài)檢測,具有一定的推廣價值。
關(guān)鍵詞:SVM;網(wǎng)絡(luò)性能;異常點(diǎn);檢測
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)13-0042-02
1概述
隨著網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,且用戶對數(shù)據(jù)服務(wù)的多樣化需求,使得我國網(wǎng)絡(luò)通信企業(yè)不得不面對更大規(guī)模的數(shù)據(jù)通信及更加復(fù)雜的數(shù)據(jù)分析處理任務(wù),這無疑會造成網(wǎng)絡(luò)額外的開銷與負(fù)荷,在這種大環(huán)境下,網(wǎng)絡(luò)設(shè)備異常的概率也大大增加了,從而導(dǎo)致用戶評價度的下跌,對企業(yè)的經(jīng)營與發(fā)展造成了不良影響。因此必須加強(qiáng)網(wǎng)絡(luò)運(yùn)維質(zhì)量,提高故障排查效率。目前在網(wǎng)絡(luò)異常點(diǎn)檢測工作中,使用較多的方法均為被動監(jiān)測法,即通過設(shè)置靜態(tài)閾值來監(jiān)測網(wǎng)絡(luò)流量是否超過設(shè)定的上限值,若超過則判定為有異常發(fā)生,此時向管理人員發(fā)出警告信息,否則即認(rèn)定網(wǎng)絡(luò)處于正常運(yùn)行狀態(tài)。但此方法存在較多的不足之處,如分析對象較為單一,只能針對某一局部網(wǎng)絡(luò)的總流量進(jìn)行監(jiān)控,在這種情況下,即使有個別設(shè)備處于異常狀態(tài),但只要總流量不超限,則監(jiān)控系統(tǒng)就無法識別,于是經(jīng)常造成某些用戶明顯覺察到網(wǎng)絡(luò)已無法提供良好的通信服務(wù),但運(yùn)維部門卻認(rèn)為網(wǎng)絡(luò)無故障發(fā)生的情況出現(xiàn),這對用戶體驗(yàn)度的影響是非常嚴(yán)重的。本文正是基于此趨勢展開研究,提出了一種基于支持向量機(jī)(Support Vector Machine,SVM)的主動性能監(jiān)測方法。
主動性能監(jiān)控技術(shù)將檢測對象具體到某個設(shè)備的端口,通過對某點(diǎn)異常信息的抓取和分析,實(shí)現(xiàn)對網(wǎng)絡(luò)異常點(diǎn)的快速定位。這里的異常點(diǎn)的判斷依據(jù)在傳統(tǒng)模式上做了一些改進(jìn),即不再僅根據(jù)流量的波形異常情況,而是設(shè)定一系列的性能指標(biāo),只要其中某一指標(biāo)的波動超限即可認(rèn)定異常發(fā)生,這種方法顯然極大地提高了系統(tǒng)識別異常點(diǎn)的反應(yīng)速度和收斂速度,從而達(dá)到避免嚴(yán)重故障發(fā)生或縮短故障發(fā)生時間的目的。
2支持向量機(jī)優(yōu)化機(jī)制
支持向量機(jī)SVM是一種自適應(yīng)能力較強(qiáng)的智能優(yōu)化算法,被廣泛地應(yīng)用在工業(yè)自動化控制、環(huán)境監(jiān)控和預(yù)測模型設(shè)計(jì)等領(lǐng)域。該算法尤其針對高維數(shù)的復(fù)雜問題具有良好的優(yōu)化效果,可在保障分析質(zhì)量的前提下,顯著降低計(jì)算的繁瑣程度,從而提高系統(tǒng)的響應(yīng)速度。該算法與其他智能優(yōu)化算法相比,其最大的特點(diǎn)就是具有較高的泛化性,這也是該算法使用范圍廣泛的重要原因之一。從本質(zhì)上看,SVM研究的對象為二元分類問題,現(xiàn)對其算法執(zhí)行過程進(jìn)行介紹:
計(jì)算得到的f(x)為+1時,表示x歸類為一類,f(x)為-1則表示x歸類為二類,將這種二元化的判斷方法應(yīng)用到網(wǎng)絡(luò)異常點(diǎn)的檢測上,就可得出某點(diǎn)是否存在異常的分析結(jié)果。3網(wǎng)絡(luò)性能異常檢測方案設(shè)計(jì)
3.1同點(diǎn)時間序列監(jiān)測模型的設(shè)計(jì)
本設(shè)計(jì)考慮到連續(xù)時間點(diǎn)監(jiān)測易導(dǎo)致的局部波動過大的問題,決定采用同點(diǎn)時間序列來構(gòu)建監(jiān)測模型,即訓(xùn)練集中的各個元素為不同日期的同一個時間點(diǎn)上鎖采集到的網(wǎng)絡(luò)性能參數(shù),并將這些序列匯集在以日期為單位的時間軸上,從而得到算法所需的訓(xùn)練集,如式(11)所示:
上式中,l為元素個數(shù);m為嵌入維數(shù);t為采樣時刻。式(12)給出了同點(diǎn)時間序列采樣的模型,可以看出,采樣時間點(diǎn)不再是連續(xù)的時刻,而是分散至一段連續(xù)的日期中:
由于主動分散了采樣點(diǎn)的時間段,因此有效的避免了分析結(jié)論受局部影響過大這一弊端,使得算法的抗干擾性和魯棒性都得到了明顯的提升,從而確保了檢測工作即具有足夠的靈敏度,又表現(xiàn)出良好的穩(wěn)定性。
3.2核函數(shù)及參數(shù)的確定
本文經(jīng)過綜合考慮,最終決定選取高斯徑向基函數(shù)為本方案中SVM的核函數(shù):
(13)
對于參數(shù)組的選擇,在傳統(tǒng)模式下,懲罰參數(shù)c和核函數(shù)參數(shù)γ的初始值通常采取隨機(jī)值,并在后續(xù)的執(zhí)行過程中逐步調(diào)整,這對算法的收斂速度乃至最終結(jié)果都構(gòu)成了一定的負(fù)面影響。針對這一情況,本文選擇采用在一定范圍內(nèi)離散取值的方式來找出最佳的c、γ。優(yōu)化后得到尋優(yōu)結(jié)果如圖1:
上圖中x、y軸分別表示c、γ取以2為底的對數(shù)后的值。=軸則是代表準(zhǔn)確度。采用LibSVM工具軟件中的SVMcgForClass-函數(shù)進(jìn)行選擇,將參數(shù)c的取值壓縮在了(2-2,24),參數(shù)γ的取值壓縮到(2-4,24),此時采用SVM優(yōu)化對訓(xùn)練集進(jìn)行二元化分類操作,其分類準(zhǔn)確率達(dá)到了96%以上。
4仿真實(shí)驗(yàn)
本實(shí)驗(yàn)采用CPU負(fù)荷這一常用的性能指標(biāo)來模擬監(jiān)控實(shí)驗(yàn),數(shù)據(jù)來源為某電信網(wǎng)絡(luò)服務(wù)器的監(jiān)控記錄,采樣周期為3d,采樣點(diǎn)接近300個。通過觀察監(jiān)控記錄發(fā)現(xiàn)存在15個異常點(diǎn),而其中12個異常點(diǎn)為連續(xù)集中型。就該樣本集分別采用基于連續(xù)時間序列和同點(diǎn)時間序列的SVM算法進(jìn)行預(yù)測,結(jié)果分別如圖2和圖3所示。
由以上兩圖的對比觀察可以發(fā)現(xiàn),在同點(diǎn)時間序列的檢測模式下,預(yù)測曲線具有更好的平滑度,并不會應(yīng)為網(wǎng)絡(luò)中出現(xiàn)的極短暫的波動而受到太大的影響,同時在網(wǎng)絡(luò)出現(xiàn)異常點(diǎn)的情況下,表現(xiàn)出了更高的預(yù)測準(zhǔn)確性,全部15個異常點(diǎn)均被檢測出來,且沒有出現(xiàn)任何的誤報警和漏報警。雖然在實(shí)驗(yàn)環(huán)境下去除了實(shí)際網(wǎng)絡(luò)通信中可能遇到的種種干擾,但仍舊可以肯定基于SVM技術(shù)的同點(diǎn)檢測方案具有更高的可靠性和準(zhǔn)確性,可滿足大規(guī)模網(wǎng)絡(luò)設(shè)備群體的持續(xù)監(jiān)測任務(wù)。
5結(jié)束語
隨著網(wǎng)絡(luò)數(shù)據(jù)規(guī)模的不斷擴(kuò)大和數(shù)據(jù)類型復(fù)雜程度的不斷提高,對于網(wǎng)絡(luò)性能實(shí)時監(jiān)測的需求也不斷上升,以往的被動式監(jiān)測模式已不能適應(yīng)新的網(wǎng)絡(luò)發(fā)展要求,網(wǎng)絡(luò)性能維護(hù)工作模式隨也必然要發(fā)生轉(zhuǎn)變。從目前的發(fā)展趨勢來看,主動監(jiān)控模式在未來將成為主要的網(wǎng)絡(luò)性能監(jiān)測方法,通過對異常點(diǎn)的及時發(fā)現(xiàn)及定位來有效的提高網(wǎng)絡(luò)運(yùn)維工作的響應(yīng)速度。本文提出了基于SVM優(yōu)化機(jī)制的網(wǎng)絡(luò)性能檢測機(jī)制,實(shí)現(xiàn)了核函數(shù)的參數(shù)尋優(yōu),同時選擇同點(diǎn)時間序列建立了被控對象模型。通過對仿真實(shí)驗(yàn)結(jié)果的對比發(fā)現(xiàn),無論是在對異常點(diǎn)的發(fā)現(xiàn)速度方面,還是在異常點(diǎn)的識別準(zhǔn)確性方面,本方案都明顯優(yōu)于以往傳統(tǒng)方法,從而驗(yàn)證了本檢測方案的有效性。