国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于優(yōu)化K均值聚類的高校網(wǎng)絡(luò)異常流量分析方法研究①

2023-11-05 11:51:36商鴻發(fā)
關(guān)鍵詞:誤報率網(wǎng)絡(luò)流量均值

商鴻發(fā)

(浙江旅游職業(yè)學院,浙江 杭州 312231)

0 引 言

經(jīng)過多年的建設(shè)與發(fā)展,我國互聯(lián)網(wǎng)正逐漸轉(zhuǎn)變?yōu)橐环N大規(guī)模、高容量的創(chuàng)新型技術(shù),并滲透到人們生活的各個角落[1-2]。除了網(wǎng)絡(luò)對人民生活產(chǎn)生的影響外,“網(wǎng)絡(luò)+教育”的發(fā)展也是當前我國信息化教育的重點建設(shè)部分。高校作為培養(yǎng)大學生的主要陣地,其中互聯(lián)網(wǎng)的建設(shè)與發(fā)展受到了社會大眾的廣泛關(guān)注,其中校園網(wǎng)絡(luò)是我國大學校園網(wǎng)絡(luò)建設(shè)的一個重要環(huán)節(jié)。校園網(wǎng)為我國高校的信息發(fā)布以及教師自動化辦公提供了重要運行環(huán)境,但校園網(wǎng)也存在有功能發(fā)揮不充分的現(xiàn)象[3-4]。例如網(wǎng)絡(luò)建設(shè)薄弱,容易受到外來入侵;容量較小,不能同時容納所有師生登錄使用學校網(wǎng)站等問題。鑒于此,研究提出基于優(yōu)化K均值聚類的高校網(wǎng)絡(luò)異常流量分析方法,首先利用IRNN對校園網(wǎng)流量展開預測,接著融合到傳統(tǒng)K均值聚類算法中,構(gòu)建一種改進優(yōu)化K均值聚類算法,期待能夠有效地檢測校園網(wǎng)異常流量變化,促進高校網(wǎng)絡(luò)安全建設(shè)。

1 基于優(yōu)化K均值聚類的高校網(wǎng)絡(luò)異常流量分析方法研究

1.1 基于IRNN的流量預測方法

為了解決傳統(tǒng)RNN存在的數(shù)據(jù)梯度消失依賴問題,有學者提出使用基于時鐘驅(qū)動的循環(huán)神經(jīng)網(wǎng)絡(luò)模型(Clock-driven cyclic neural network, CW-RNN)。改進后的RCW-RNN神經(jīng)網(wǎng)絡(luò)模型如圖1。

圖1 RCW-RNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型

圖1中可以看出,為了提高檢測精度、改變激活標準原則以提高預測效率,該模型尤其著重于引入隨機權(quán)值。研究將RCW-RNN分成了不同的儲備池模塊,并保留生成的不同機制,為每一個儲備池分配同樣的時鐘周期[6]。如圖1所示,在t時刻,改進后的神經(jīng)網(wǎng)絡(luò)模型輸出表達如式(1)。

(1)

式(1)中,fout表示輸出層的激活函數(shù);Wout表示輸出層的連接矩陣;yh(t)表示在t時刻的隱藏層輸出(是g個隱藏層儲備池輸出構(gòu)成的向量)。隱藏層向量輸出如式(2)。

(2)

式(2)中,fh表示隱藏層激活函數(shù);Wh表示隱藏層連接矩陣;Win表示輸入層連接的矩陣;xin(t)則表示處于t時刻的輸出。yh(t′)是不同的儲備池對應的前一狀態(tài);γ表示前一狀態(tài)的儲備池在當前狀態(tài)中占據(jù)的主要比例,取值區(qū)間為[0,1]。由于儲備池的周期不同,對應的不同時期狀態(tài)也不同,因此計算方程也不盡相同,具體方程計算如式(3)。

(3)

式(3)中,利用CW-RNN的指數(shù)增長模型(表達為Tg=2g-1),可以在很短的時間內(nèi)利用少量的儲備來實現(xiàn)更大的時間范圍跨度。然而在當前網(wǎng)絡(luò)識別的方法中,通常使用機器學習算法對網(wǎng)絡(luò)流量數(shù)據(jù)集進行數(shù)據(jù)的采集與整理。因此研究引入K均值聚類算法對數(shù)據(jù)進行再處理。

1.2 優(yōu)化的K均值聚類算法設(shè)計

原始的K均值(K-means)聚類算法,主要利用數(shù)據(jù)間距離與數(shù)據(jù)指標間的相關(guān)系數(shù)表示數(shù)據(jù)的相似性。在實際計算過程中,當收斂速度與最小誤差平方值最優(yōu)時,算法結(jié)束運行,接著獲得最終分類結(jié)果。針對這一問題,研究提出了一種基于不同數(shù)據(jù)特征分布的初始聚類中心(K均值優(yōu)化)的方法,以避免產(chǎn)生局部最優(yōu)解。優(yōu)化K均值聚類算法實驗開展過程中,首先對特征值進行選取。校園網(wǎng)流量作為一種不確定的變量,一般利用信息熵對其進行表示,具體如式(4)。

HX=-∑x∈xp(x)logp(x)

(4)

利用式(4)求得的熵值,將網(wǎng)絡(luò)流量數(shù)據(jù)中差距較大的特征數(shù)據(jù)值作為實驗參數(shù)。研究選取流量數(shù)據(jù)集進行有效測試,該數(shù)據(jù)集包含有總數(shù)據(jù)500萬條,其中進行測試與訓練的子集各為50萬條。在實際實驗過程中,所有數(shù)據(jù)集都必須經(jīng)過預處理,保證輸入數(shù)據(jù)之間的差距較小。預處理表達式如式(5)。

(5)

式(5)中,max表示最大數(shù)據(jù)值;min表示最小數(shù)據(jù)值,X*表示標準化結(jié)果。為了更好地對算法的設(shè)計進行說明,研究假設(shè)有網(wǎng)絡(luò)數(shù)據(jù)集S(S=f1,f2,…,fn),n表示網(wǎng)絡(luò)數(shù)據(jù)流個數(shù)。在網(wǎng)絡(luò)數(shù)據(jù)集S當中,1表示向量的維度,而利用對應網(wǎng)絡(luò)流量的特征屬性數(shù)值表示向量中的每個元素。假設(shè)數(shù)據(jù)集合為S={xi|xi∈Rm,i=1,2,3,…,n},n代表一個集合中的所有數(shù)據(jù)對象總數(shù)量;m表示空間數(shù)據(jù)最終維度值。在優(yōu)化K均值聚類算法中,數(shù)據(jù)對象之間的測量與聚類收斂標準如式(6)。

(6)

式(6)中,x,y表示屬性向量;Cj={cj1,cj2,…,cjn}T表示聚類中心;k表示初始聚類數(shù)量;oj表示簇cj中所有數(shù)據(jù)點之間的平均值;cj表示分類簇。研究引入流量密度的概念到優(yōu)化K均值算法中,得到數(shù)據(jù)集合S中數(shù)據(jù)對象之間的平均距離,以及集合S中某一數(shù)據(jù)對象xi的密度,具體計算如式(7)。

(7)

(8)

(9)

(10)

式(10)中,din(k)表示簇內(nèi)距離。當din(k)越小,對應集合S中簇內(nèi)的數(shù)據(jù)對象間的相似性越高。為了滿足上述假設(shè),研究引入聚類效果判定函數(shù),表達如式(11)。

V(k)=din(k)/bds(k)

(11)

式(11)中,V(k)表示集合的簇間聚類。當集合的簇內(nèi)距離越小,簇間距離就越大,判別函數(shù)的值就越小。當判別函數(shù)有最小值時,數(shù)據(jù)集合S中的數(shù)據(jù)對象之間的相似性就有最大值,對應不同簇的數(shù)據(jù)對象之間的差異性也就有最大值。即可以選擇合適的k值,使得判別函數(shù)V(k)有最小值,進而將此k值作為最佳聚類效果所對應的簇的個數(shù)值。將優(yōu)化后的K均值聚類檢測流程繪制如圖2。

圖2 優(yōu)化后的K均值聚類檢測流程

2 高校異常流量分析檢測模型的仿真實驗

為了驗證研究所構(gòu)建方法能夠?qū)Ω咝.惓>W(wǎng)絡(luò)流量進行快速且準確的檢測識別,研究采用兩個不同的公開流量數(shù)據(jù)集進行流量預測的仿真實驗。兩個數(shù)據(jù)集分別為美國主干網(wǎng)絡(luò)流量數(shù)據(jù)與11個北美城市的流量數(shù)據(jù)集,兩個數(shù)據(jù)集涵蓋約兩個月內(nèi)每5min采集的匯集流量。所有實驗均在相同的設(shè)備環(huán)境中進行。首先對算法的檢測率與誤報率兩個指標進行性能對比,所得對比結(jié)果如圖3。

圖3 不同算法的檢測率與誤報率對比

圖3(a)與(b)中發(fā)現(xiàn),隨著K值的增加,所有算法的檢測率與誤報率均表現(xiàn)出明顯的增長趨勢。圖3(a)中,研究方法運行下檢測率顯著高于傳統(tǒng)K均值聚類算法。當K=60時,研究算法的檢測率開始趨于穩(wěn)定,此時的檢測率為98.21%;當K=70時,傳統(tǒng)K均值聚類算法的檢測率為93.92%。圖3(b)中,研究方法的誤報率顯著低于傳統(tǒng)K均值聚類算法。當K=70時,研究算法的誤報率為0.661%;傳統(tǒng)聚類算法的誤報率為0.812%。對比可知,優(yōu)化后的研究方法能夠同時擁有高檢測率與低誤報率,且有助于得到全局最優(yōu)解。

為擴大對流量變化曲線的觀察,研究對北美11個城市的流量數(shù)據(jù)進行收集,選取5.8×103到6.0×103min時間段內(nèi)的局部預測誤差曲線如圖4。

由圖4可知,在三種方法中,傳統(tǒng)的K均值聚類方法對整體的預測誤差影響較大,最大誤差在5882min附近,此時誤差約為2.210×108。而整體RCW-RNN與研究算法較為相似,預測誤差整體區(qū)間在[0.0~1.500×108]之間波動。其中RCW-RNN在所選時間段內(nèi)的最大誤差出現(xiàn)在5948min附近,對應預測誤差值為1.481×108。同時研究算法的最大誤差出現(xiàn)在5810min附近,對應預測誤差約為1.472×108。對比可知,研究算法的最大誤差均小于傳統(tǒng)K均值聚類誤差與RCW-RNN誤差。使用研究方法對網(wǎng)絡(luò)流量進行較好檢測,并且誤差率較低。為了更加直觀地觀察三種方法的差異,研究對不同算法進行網(wǎng)絡(luò)應用識別準確率與總體識別準確率的對比,具體如 圖5。

圖4 不同算法在北美11個城市的流量

數(shù)據(jù)集上的部分預測誤差結(jié)果從圖5(a)中可以看出,當研究方法沒有選取K值對準確率進行對比時,任意改變網(wǎng)絡(luò)應用,改進后研究算法的識別準確率仍然顯著高于傳統(tǒng)聚類算法,這表示研究所構(gòu)建方法對網(wǎng)絡(luò)流量分類的影響是積極的,優(yōu)化的效果能夠得到驗證。圖5(b)中可以發(fā)現(xiàn),被標記的流量數(shù)據(jù)占比越高(數(shù)量越多),相應的K均值算法在準確率和穩(wěn)定性上都有很大的提高。在15%的標記流量數(shù)據(jù)占比下,網(wǎng)絡(luò)流量的識別準確精度顯著高于90%,即研究所提出方法可以很好地滿足一般高校校園網(wǎng)流量數(shù)據(jù)變化的識別要求。

圖5 不同算法的識別準確率對比

3 結(jié) 語

為了讓學校管理人員能夠更全面地了解校園網(wǎng)絡(luò)流量變化,更準確地監(jiān)測網(wǎng)絡(luò)信號變化,研究對高校校園網(wǎng)絡(luò)的監(jiān)測問題展開了討論,亟待提升對網(wǎng)絡(luò)的檢測準確率。研究首先引入循環(huán)神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)K均值聚類算法相互結(jié)合,對樣本數(shù)據(jù)進行預處理;接著將處理后數(shù)據(jù)代入K均值聚類算法中,得到有效的結(jié)果。結(jié)果顯示,研究算法在聚類K值為60時,有最大檢測率98.21%,而傳統(tǒng)K均值聚類算法的檢測率較小;在聚類K值為70時,傳統(tǒng)算法與研究算法的誤報率分別為0.812%,0.661%;部分流量數(shù)據(jù)集預測結(jié)果中,運行時間在5810min附近時,研究算法有最大誤差1.472×108,傳統(tǒng)K均值聚類算法與RCW-RNN算法的最大誤差為2.210×108與1.481×108;當標記數(shù)據(jù)占比為15%時,網(wǎng)絡(luò)流量的識別準確率可達到90%以上。以上結(jié)果均表示研究所構(gòu)建優(yōu)化K均值算法的識別準確率高,穩(wěn)定性能好,并且具有高檢測率與低誤報率的優(yōu)秀性能。但是在將來,網(wǎng)絡(luò)攻擊的技術(shù)手段越來越多,為了更好地檢測到異常流量的變化,必須進行更多的試驗研究,以豐富研究結(jié)果。

猜你喜歡
誤報率網(wǎng)絡(luò)流量均值
基于GRU-LSTM算法的物聯(lián)網(wǎng)數(shù)據(jù)入侵檢測分析
基于SSA-SVM的網(wǎng)絡(luò)入侵檢測研究
基于多元高斯分布的網(wǎng)絡(luò)流量異常識別方法
家用燃氣報警器誤報原因及降低誤報率的方法
煤氣與熱力(2021年6期)2021-07-28 07:21:40
基于神經(jīng)網(wǎng)絡(luò)的P2P流量識別方法
AVB網(wǎng)絡(luò)流量整形幀模型端到端延遲計算
均值不等式失效時的解決方法
均值與方差在生活中的應用
神經(jīng)網(wǎng)絡(luò)技術(shù)在網(wǎng)絡(luò)入侵檢測模型及系統(tǒng)中的應用
關(guān)于均值有界變差函數(shù)的重要不等式
阿坝县| 萨迦县| 海淀区| 敦化市| 长海县| 玉龙| 胶南市| 嘉义市| 富阳市| 高要市| 景宁| 玉树县| 伊吾县| 鄯善县| 华亭县| 安新县| 滦平县| 灵丘县| 司法| 夏河县| 定边县| 宜昌市| 右玉县| 陆良县| 遂昌县| 历史| 大厂| 扬州市| 兴宁市| 河北区| 东海县| 兴义市| 探索| 新建县| 江安县| 平凉市| 玉龙| 旬阳县| 沐川县| 当阳市| 神池县|