摘? 要: 分析計算機網(wǎng)絡安全態(tài)勢問題時,由于計算機網(wǎng)絡存在混沌性、非線性等特征,致使計算機網(wǎng)絡安全態(tài)勢分析誤差較大,未能保障計算機網(wǎng)絡安全。由此,構建一種基于小波支持向量機的計算機網(wǎng)絡安全態(tài)勢分析模型,獲取計算機網(wǎng)絡流量的原始變動軌跡,保障支持向量機的和為0;對預處理后的計算機網(wǎng)絡流量,采用基于小波分解和支持向量機的網(wǎng)絡流量預測模型,實現(xiàn)計算機網(wǎng)絡安全態(tài)勢分析。以某學校計算機網(wǎng)絡為例,將該模型的最優(yōu)時延值與最小嵌入維數(shù)依次設成4與7,基于該設定,使用該模型對其安全態(tài)勢分析后可知,該模型的分析結(jié)果和實際情況十分吻合,分析精度較高,且應用該模型后,計算機網(wǎng)絡安全性大大提升。
關鍵詞: 安全態(tài)勢分析; 計算機網(wǎng)絡; 網(wǎng)絡流量預處理; 模型構建; 支持向量機; 時延設定
中圖分類號: TN915.08?34; TP391? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)21?0068?04
Computer network security situation analysis based on wavelet
support vector machine
SHANG Yongqiang
(Xinyang Agriculture and Forestry University, Xinyang 464000, China)
Abstract: When the security situation of computer network is analyzed, there is a large error existing in security situation analysis of computer network because of the chaos and non?linearity of computer network, which may reduce the security of computer network. Therefore, a computer network security situation analysis model based on wavelet support vector machine is constructed. The original change trajectory of the computer network traffic is obtained to guarantee the sum of support vector machine to be 0. For the pretreated computer network traffic, the network traffic prediction model based on wavelet decomposition and support vector machine is adopted to realize the computer network security situation analysis. Taking a school′s computer network as an example, the optimal delay value and the minimum embedding dimension of the model are set as 4 and 7 respectively. According to the setting values, after security situation of the model is analyzed with the model, it can be seen that the analysis results of the model are very consistent with the actual situation, and its analysis accuracy is high. Moreover, the computer network security is greatly improved after the application of the model.
Keywords: security situation analysis; computer network; network traffic pretreatment; model construction; support vector machine; time delay setup
0? 引? 言
伴隨信息技術的逐漸發(fā)展,互聯(lián)網(wǎng)技術與計算機技術也得以優(yōu)化。此時,用戶需求量出現(xiàn)爆發(fā)性增長,在此環(huán)境中,計算機網(wǎng)絡安全態(tài)勢的準確分析愈發(fā)重要。當下計算機網(wǎng)絡安全事件出現(xiàn)數(shù)目逐漸增多,這對網(wǎng)絡多元化發(fā)展存在較大影響[1]。所以,想要高效處理網(wǎng)絡安全問題,確保計算機網(wǎng)絡系統(tǒng)可以安全正常工作,必須實現(xiàn)高精度、高效率的計算機網(wǎng)絡安全態(tài)勢分析[2]。
計算機網(wǎng)絡系統(tǒng)不屬于線性系統(tǒng),存在較高的混沌性與非線性,不能直接使用指定函數(shù)模式描述計算機網(wǎng)絡安全態(tài)勢,為了高精度分析計算機網(wǎng)絡安全態(tài)勢,國內(nèi)外專家使用神經(jīng)網(wǎng)絡、時間序列模型對其實施分析。而此類模型的預測精度不能滿足逐漸發(fā)展的計算機網(wǎng)絡系統(tǒng)的安全需求[3]。這是因為計算機網(wǎng)絡流量易遭到網(wǎng)絡用戶行為、經(jīng)濟等因素干擾,存在周期性、非線性變動等屬性,以往的預測模型不能全方位掌握網(wǎng)絡流量變動屬性,未能全方位分析網(wǎng)絡安全態(tài)勢,所以預測精度較低。為了實現(xiàn)高精度的計算機網(wǎng)絡安全態(tài)勢分析,本文構建一種基于小波支持向量機的計算機網(wǎng)絡安全態(tài)勢分析模型,對復雜的計算機網(wǎng)絡實現(xiàn)準確分析[4]。
1? 基于小波支持向量機的計算機網(wǎng)絡安全態(tài)勢分析模型
1.1? 計算機網(wǎng)絡流量的預處理
計算機網(wǎng)絡流量存在混沌性,所以必須對其實施相空間重構,將計算機網(wǎng)絡流量的原始變動軌跡描述出來,使用虛假最近臨點法獲取計算機網(wǎng)絡流量的最優(yōu)嵌入維[n],使用互信息法獲取時延[r],以此實現(xiàn)計算機網(wǎng)絡流量重構:
[Y0Y(1)?Y(M-1)=y1-ry1-2r…y1-nry2-ry2-2r…y2-nr????yM-ryM-2r…yM-nr] (1)
式中:重構后的計算機網(wǎng)絡流量集為[Y0Y(1)?Y(M-1)];[M]描述數(shù)量。為保障支持向量機的和是0,將計算機網(wǎng)絡流量數(shù)據(jù)實施下述預處理:
[Yn,r=yn,r-mean yjstd yjXn=xn-mean xstd x] (2)
式中:[mean yj],[std yj]依次描述輸入向量[Y]的第[j]列的算術均值與標準方差;[mean x],[std x]依次描述輸入向量[X]的算術均值與標準方差。
1.2? 基于小波分解和支持向量機的網(wǎng)絡流量預測模型
1.2.1? 計算機網(wǎng)絡流量的小波分析
1) 小波設定
假定一平方可積函數(shù)是[φh],則[φh∈K2S],則此函數(shù)的傅里葉變換[φ?]符合:
[Aφ=φ?2?d?<∞] (3)
式中:小波母函數(shù)是[φ?];[Aφ]描述變換條件;[?]描述權指數(shù)。
將[φh]實施伸縮與平移能夠得到:
[φβ,δh=1βφh-δββ] (4)
式中:平移因子與伸縮因子依次設成[δ],[β],[δ∈S],[β>0];[δ],[β]的小波基函數(shù)為[φβ,δh];[h]描述時刻。
2) 小波轉(zhuǎn)換的[α] Trous算法
計算機網(wǎng)絡流量屬于一個離散時間序列數(shù)據(jù),所以本文使用小波轉(zhuǎn)換的[α] Trous算法將它實施分解與重構[5?6]。假定得到的計算機網(wǎng)絡時間序列是[Y(h)],使用離散低通濾波器[t]能夠獲取計算機網(wǎng)絡流量分解尺度系數(shù)[ai+1h]:
[ai+1h=k=-∞+∞taih+2ik] (5)
按照[α] Trous算法離散小波轉(zhuǎn)換的屬性,計算機網(wǎng)絡流量每個尺度中的細節(jié)系數(shù)能夠描述為:
[bi+1k=aik-ai+1k] (6)
則網(wǎng)絡流量時間序列的分辨率[k]的小波轉(zhuǎn)換如下:
[B=b1,b2,…,bk,ak] (7)
式中:網(wǎng)絡流量每個尺度中的細節(jié)信號設成[b1,b2,…,bk];計算機網(wǎng)絡流量近似信號設成[ak]。
網(wǎng)絡流量時間序列[Yh]能夠通過細節(jié)信號與近似信號實施重構,則:
[Yh=a0h=akh+i=1kbih] (8)
3) 計算機網(wǎng)絡流量的小波分解流程
假定計算機網(wǎng)絡流量輸入信號是[Yh],[t(s)]描述小波轉(zhuǎn)換低通濾波器,將小波轉(zhuǎn)換高通濾波器設成[f(s)],[K]描述小波分解級數(shù)。則計算機網(wǎng)絡流量的小波分解流程如下:
第一步:計算機網(wǎng)絡流量初始化
[a0=Yh,? ?t1s=ts,? ?f1s=fs,? ?s=1] (9)
第二步:計算機網(wǎng)絡流量小波分解
[ais=ai-1s*ti-s] (10)
[bis=bi-1s*fi-s] (11)
式中“*”描述卷積計算。
第三步:將濾波實施插零操作
[ti+1s=tis2,? ? m是偶數(shù)0,? ? m是奇數(shù)] (12)
[fi+1s=fis2,? ? m是偶數(shù)0,? ? m是奇數(shù)] (13)
其中[m]代表不同的變量。
第四步:[i=i+1],若[i 基于上述設定可知,計算機網(wǎng)絡流量的小波分解步驟如圖1所示。 1.2.2? 計算機網(wǎng)絡流量的支持向量機建模 支持向量機屬于一個基于結(jié)構安全最大化原則的新型機器學習方法,能夠克服以往機器學習方法具有的弊端,非線性學習性能較好,泛化性能優(yōu),十分適用于存在時變性、非線性變動的復雜網(wǎng)絡安全態(tài)勢分析中[7]。計算機網(wǎng)絡流量通過小波分解,已有網(wǎng)絡流量序列里的低頻信息被分解,便得到網(wǎng)絡流量的周期性與長時間的趨勢規(guī)律,完美地去除已有網(wǎng)絡流量里的突變部分[8?9];高頻分量較好地表達了計算機網(wǎng)絡流量存在的隨機性,支持向量機選取十分合理的核函數(shù),之后將每個分量實施預測,最終將每個分量預測結(jié)果實施重構,獲取網(wǎng)絡流量的安全態(tài)勢分析結(jié)果[10]。假定得到的計算機網(wǎng)絡流量分量是[{yh}],[n]描述計算機網(wǎng)絡流量的嵌入維數(shù),則基于支持向量機的網(wǎng)絡流量一步預測模型是: [ak-1=akt+bif,? ?i=0,1,2,…,K]? ? ? ? ? (14) 式中,[t],[f]描述[t],[f]的對偶算子。 1.2.3? 計算機網(wǎng)絡流量建模預測步驟 1) 采集計算機網(wǎng)絡流量數(shù)據(jù),獲取原始計算機網(wǎng)絡流量時間序列[Y(h)]。 2) 將計算機網(wǎng)絡流量實施小波分解,設定小波分解尺度,把已有的計算機網(wǎng)絡流量分解為差異成分的網(wǎng)絡流量分量[11]。 3) 將計算機網(wǎng)絡流量分量實施歸一化,因為計算機網(wǎng)絡流量的每個分量變動區(qū)間不小,為了提升支持向量機學習效率與分析準確度,將它實施歸一化,則: [y′j=yj-yminymax-ymin] (15) 式中:[yj]描述原始網(wǎng)絡流量;歸一化后的計算機網(wǎng)絡流量是[y′j];計算機網(wǎng)絡流量的最大值與最小值依次是[ymax],[ymin]。 4) 模型初始化。把數(shù)據(jù)分為訓練樣本集與測試樣本集,設定各個分量嵌入維數(shù),之后按照嵌入維數(shù)設置支持向量機的輸入向量與輸出向量[12]。 5) 支持向量機核函數(shù)和參數(shù)設置。針對計算機網(wǎng)絡流量的高頻部分不出現(xiàn)突變,支持向量機核函數(shù)選取線性核函數(shù);針對計算機網(wǎng)絡流量的低頻部分而言,它存在明顯不平穩(wěn)性與非線性,支持向量機核函數(shù)選取高斯核函數(shù),其參數(shù)都使用粒子群算法優(yōu)化獲取[13]。 6) 支持向量機訓練與預測。使用以上方法獲取的參數(shù)對訓練集實施學習,構建預測模型,之后對測試集實施測試[14]。 7) 將每個分量預測結(jié)果實施反歸一化,反歸一化方法是: [yj=y′j?ymax-ymin+ymin] (16) 8) 將反歸一化后的計算機網(wǎng)絡分量使用小波轉(zhuǎn)換技術實施重構,獲取計算機網(wǎng)絡流量最終預測結(jié)果,完成計算機網(wǎng)絡安全態(tài)勢分析[15]。 2? 實驗結(jié)果與分析 使用計算機網(wǎng)絡流量監(jiān)測軟件獲取某校園網(wǎng)流量,共獲取了2 000個校園計算機網(wǎng)絡流量數(shù)據(jù),把前1 800個數(shù)據(jù)設成本文模型的訓練樣本,剩下200個數(shù)據(jù)設成測試樣本,將訓練完畢的數(shù)據(jù)實施測試,詳細見圖2。 實驗使用Matlab 7.1完成校園計算機網(wǎng)絡安全態(tài)勢分析。為了測試本文模型對校園計算機網(wǎng)絡安全態(tài)勢的分析結(jié)果,設定兩個對比模型:一是BP神經(jīng)網(wǎng)絡模型;二是小波神經(jīng)網(wǎng)絡模型。通過絕對誤差均值、絕對百分比誤差均值以及模型訓練時間等幾個評估指標測試三種模型的分析性能。在使用本文模型時,通過互信息法運算最優(yōu)時延,實驗結(jié)果如圖3所示。 通過虛假最近鄰點法獲取最小嵌入維數(shù),結(jié)果如圖4所示。由圖3,圖4可知,此校園計算機網(wǎng)絡流量數(shù)據(jù)的最優(yōu)時延值是4,最小嵌入維數(shù)是7。在此設定下實施校園網(wǎng)絡數(shù)據(jù)重構。 對重構后的訓練樣本實施學習。三種模型對該校園計算機網(wǎng)絡安全態(tài)勢分析結(jié)果依次如圖5~圖7所示。分析圖5~圖7可知,本文模型對該學校計算機網(wǎng)絡安全態(tài)勢分析后,其分析結(jié)果的絕對誤差均值最低,絕對百分比誤差均值最低,分析結(jié)果可信度最高,說明本文模型分析精度顯著優(yōu)于對比模型。 為了更直觀地分析本文模型對該學校計算機網(wǎng)絡安全態(tài)勢的分析精度,以圖2為例,本文模型對其分析結(jié)果如圖8所示。圖8中,斜線部分是本文模型分析結(jié)果,黑色部分屬于該學校計算機網(wǎng)絡安全態(tài)勢實際波動。由此可知,本文模型分析結(jié)果和實際情況十分吻合,證明本文模型分析精度較高。 為分析本文模型實際應用效果,測試該學校使用本文模型后,學校計算機網(wǎng)絡故障率。設定該學校計算機網(wǎng)絡易出現(xiàn)的入侵模式依次是拒絕服務攻擊(DoS)、遠程用戶沒有授權訪問攻擊(U2R)、沒有授權應用本地超級權限訪問攻擊(U2L)、掃描攻擊(Probe),分析該學校使用本文模型后,四種入侵模式的出現(xiàn)情況,結(jié)果如表1所示。分析表1可知,該學校計算機網(wǎng)絡使用本文模型前,四種入侵模式中DoS模式的出現(xiàn)率高達32.23%,使用本文模型后,該入侵模式的降低率高達31.00%,由此說明,本文模型能夠大大提升該學校計算機網(wǎng)絡的安全性。 3? 結(jié)? 語 計算機網(wǎng)絡安全自身存在多元化、壁壘化致使其存在大量的安全干擾因素,不但遭到計算機入侵病毒、網(wǎng)絡系統(tǒng)設計以及網(wǎng)絡結(jié)構等因素所影響,網(wǎng)絡機制的缺失以及黑客的侵襲均對其存在一定影響。目前,中國核心的網(wǎng)絡安全管理技術包含網(wǎng)絡數(shù)據(jù)加密方法、防火墻、數(shù)據(jù)備份恢復方法和入侵檢測方法。即使此類方法可以在一定程度中保護計算機不出現(xiàn)危險,而它在實際使用時具有的弊端也不可能忽視。 本文構建一種基于小波支持向量機的計算機網(wǎng)絡安全態(tài)勢分析模型,經(jīng)驗證,該模型不但分析精度高,而且應用性能好,該學校計算機網(wǎng)絡使用本文模型前,四種入侵模式中DoS模式的出現(xiàn)率高達32.23%,使用本文模型后,該入侵模式的降低率高達31.00%。由此可知,本文模型屬于一種高精度、可提升計算機網(wǎng)絡安全性的分析模型。 參考文獻 [1] 張金剛,陳永強,雷霞,等.基于小波分析的并行膜混合核支持向量機月度負荷預測[J].水電能源科學,2018,36(6):210?213. [2] 劉強,蔡志平,殷建平,等.網(wǎng)絡安全檢測框架與方法研究[J].計算機工程與科學,2017,39(12):2224?2229. [3] 王佳欣,馮毅,由睿.基于依賴關系圖和通用漏洞評分系統(tǒng)的網(wǎng)絡安全度量[J].計算機應用,2019,39(6):1719?1727. [4] 張杰,傅文博.網(wǎng)絡安全數(shù)據(jù)可視化融合的分析方法[J].微電子學與計算機,2019,36(6):101?104. [5] 潘鋒.海上艦船通信網(wǎng)絡防攻擊中的支持向量機模型分析[J].艦船科學技術,2017,39(18):183?185. [6] 和敬涵,羅易萍,羅國敏,等.基于小波多分辨分析和支持向量機的柔性直流系統(tǒng)單端保護方案[J].電網(wǎng)技術,2018,42(12):4022?4030. [7] 黃林生,劉文靜,黃文江,等.小波分析與支持向量機結(jié)合的冬小麥白粉病遙感監(jiān)測[J].農(nóng)業(yè)工程學報,2017,33(14):188?195. [8] 杜臻,馬立鵬,孫國梓.一種基于小波分析的網(wǎng)絡流量異常檢測方法[J].計算機科學,2019,46(8):178?182. [9] 洪翠,付宇澤,郭謀發(fā),等.改進多分類支持向量機的配電網(wǎng)故障識別方法[J].電子測量與儀器學報,2019,33(1):7?15. [10] 劉玉敏,趙哲耘.基于特征選擇與SVM的質(zhì)量異常模式識別[J].統(tǒng)計與決策,2018,34(10):47?51. [11] 華志穎,吳蒙,楊立君.基于四分之一超球SVM的WSN異常檢測[J].南京郵電大學學報(自然科學版),2019,39(4):47?54. [12] 程家根,祁正華,陳天賦.基于RBF神經(jīng)網(wǎng)絡的網(wǎng)絡安全態(tài)勢感知[J].南京郵電大學學報(自然科學版),2019,39(4):88?95. [13] 唐贊玉,劉宏.多階段大規(guī)模網(wǎng)絡攻擊下的網(wǎng)絡安全態(tài)勢評估方法研究[J].計算機科學,2018,45(1):245?248. [14] 錢斌,蔡梓文,肖勇,等.基于模糊推理的計量自動化系統(tǒng)網(wǎng)絡安全態(tài)勢感知[J].南方電網(wǎng)技術,2019,13(2):51?58. [15] 朱江,明月,王森.基于深度自編碼網(wǎng)絡的安全態(tài)勢要素獲取機制[J].計算機應用,2017,37(3):771?776. 作者簡介:尚永強(1982—),男,河南信陽人,碩士,講師,主要研究方向為信息技術、網(wǎng)絡信息安全。