摘? 要: 針對(duì)校園網(wǎng)網(wǎng)絡(luò)覆蓋面不廣、執(zhí)行功能相對(duì)單一、安全隱患較大的問(wèn)題,提出以數(shù)據(jù)挖掘?yàn)榛A(chǔ),以K?means算法作為主要分析算法的校園流量監(jiān)測(cè)系統(tǒng)。校園流量監(jiān)測(cè)系統(tǒng)在原有的校園網(wǎng)管理系統(tǒng)上做了更為完善的改進(jìn)與優(yōu)化,能夠隨時(shí)隨地監(jiān)測(cè)校園網(wǎng)流量的異常與否,同時(shí)對(duì)校園網(wǎng)系統(tǒng)的數(shù)據(jù)信息進(jìn)行收集,以分析其數(shù)據(jù)信息趨勢(shì)并做出決策。通過(guò)實(shí)驗(yàn)對(duì)比可知,以數(shù)據(jù)挖掘?yàn)榛A(chǔ)依據(jù)的校園流量監(jiān)測(cè)系統(tǒng)比以往校園網(wǎng)系統(tǒng)更具多樣性,系統(tǒng)穩(wěn)定性更高,應(yīng)用范圍更加廣泛,通過(guò)校園網(wǎng)系統(tǒng)對(duì)校園網(wǎng)絡(luò)進(jìn)行管理具有更好的執(zhí)行能力。
關(guān)鍵詞: 監(jiān)測(cè)系統(tǒng)設(shè)計(jì); 流量監(jiān)測(cè); 數(shù)據(jù)挖掘; 數(shù)據(jù)采集; 數(shù)據(jù)分析; 校園網(wǎng)
中圖分類(lèi)號(hào): TN99?34? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)21?0059?05
Design of campus traffic monitoring system based on data mining
ZHOU Kangle
(Nanchang Institute of Technology, Nanchang 330044, China)
Abstract: In view that the coverage of campus network is not wide, the executive function is relatively single and the security risks are large, a data mining based campus traffic monitoring system which takes K?means algorithm as the main analysis algorithm is proposed. The campus traffic monitoring system is improved and perfected on the basis of the original campus network management system, so it can monitor the campus network traffic at anytime and anywhere. At the same time, the data information of the campus network system is collected to analyze the trend of data information and make decisions. In comparison with the previous campus network system, the campus traffic monitoring system based on data mining has more diversity, higher system stability and wider application range. Moreover, the campus network system has better executive ability in the management of the campus network.
Keywords: monitoring system design; traffic monitoring; data mining; data acquisition; data analysis; campus network
0? 引? 言
在時(shí)代的發(fā)展進(jìn)程當(dāng)中,高校校園網(wǎng)的建設(shè)與發(fā)展已經(jīng)成為高校建設(shè)的關(guān)鍵組成部分[1]。校園網(wǎng)對(duì)于高校辦公、教學(xué)以及科研方面的應(yīng)用程度也越來(lái)越廣泛。面對(duì)復(fù)雜多變、危險(xiǎn)與安全并存的網(wǎng)絡(luò)現(xiàn)狀環(huán)境,校園網(wǎng)在實(shí)際應(yīng)用的過(guò)程當(dāng)中遇到的威脅與資源保護(hù)問(wèn)題越來(lái)越嚴(yán)峻[2]。校園網(wǎng)在其自身網(wǎng)絡(luò)限制與防護(hù)上往往存在薄弱環(huán)節(jié),極易受到網(wǎng)絡(luò)上如惡意站點(diǎn)、木馬程序等各種各樣的惡意攻擊。此類(lèi)網(wǎng)絡(luò)惡意攻擊的出現(xiàn),既使得高校校園網(wǎng)面臨不可預(yù)知的安全威脅,也讓其因網(wǎng)絡(luò)流量異常等問(wèn)題而運(yùn)行緩慢卡頓。對(duì)網(wǎng)絡(luò)數(shù)據(jù)流量進(jìn)行詳細(xì)的分析并理清其內(nèi)部關(guān)系,能夠幫助校園網(wǎng)管理人員更好地對(duì)校園網(wǎng)絡(luò)進(jìn)行管理[3]。通常來(lái)說(shuō),校園網(wǎng)設(shè)計(jì)應(yīng)用較少,規(guī)模相對(duì)不大,在實(shí)際管理上具備比其他網(wǎng)絡(luò)架構(gòu)更明顯的優(yōu)勢(shì)。但是隨著網(wǎng)絡(luò)的發(fā)展和網(wǎng)絡(luò)環(huán)境不斷的復(fù)雜化,校園網(wǎng)絡(luò)的規(guī)模和設(shè)計(jì)應(yīng)用數(shù)量在逐年增長(zhǎng),同時(shí),各類(lèi)網(wǎng)絡(luò)病毒和惡意攻擊的形式也在不斷發(fā)生變化[4]。校園網(wǎng)絡(luò)管理應(yīng)當(dāng)保證其具備對(duì)應(yīng)的可控性、可用性以及穩(wěn)定牢固的安全水平,是亟需解決的問(wèn)題。通過(guò)數(shù)據(jù)挖掘技術(shù),對(duì)校園網(wǎng)流量進(jìn)行進(jìn)一步的流量監(jiān)測(cè)和異常流量的預(yù)警以及分析,能夠幫助高校更好的運(yùn)行和維護(hù)校園網(wǎng)絡(luò)。
1? 數(shù)據(jù)挖掘技術(shù)
1.1? 數(shù)據(jù)挖掘的定義及其分類(lèi)
1.1.1? 數(shù)據(jù)挖掘的定義
隨著信息技術(shù)的不斷發(fā)展與成熟,互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)當(dāng)中的數(shù)據(jù)成倍增加。 面對(duì)日益龐雜的數(shù)據(jù)庫(kù)信息,人們需要找尋一種合適的數(shù)據(jù)索引以及分析工具,在數(shù)以萬(wàn)計(jì)的數(shù)據(jù)庫(kù)信息當(dāng)中進(jìn)行有效信息的提取,并且能夠從所提取信息當(dāng)中分析對(duì)應(yīng)的發(fā)展趨勢(shì)[5]。這時(shí)就用到了數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)起源于20世紀(jì)80年代,發(fā)展期間幾經(jīng)波折,但是隨著信息技術(shù)的發(fā)展和專(zhuān)家學(xué)者的研究與開(kāi)發(fā),數(shù)據(jù)挖掘技術(shù)發(fā)展至今已經(jīng)相對(duì)成熟,被廣泛應(yīng)用到生產(chǎn)生活的各個(gè)方面。
1.1.2? 數(shù)據(jù)挖掘的分類(lèi)
數(shù)據(jù)挖掘技術(shù)旨在從大量、不規(guī)則的大型數(shù)據(jù)庫(kù)當(dāng)中挖掘有效的、人類(lèi)所需要的數(shù)據(jù)信息[6]。同時(shí),依據(jù)這些信息做出進(jìn)一步的分析和關(guān)聯(lián),幫助人們發(fā)現(xiàn)其隱藏規(guī)則,做出更好的工作規(guī)劃和工作準(zhǔn)備。以數(shù)據(jù)挖掘技術(shù)所對(duì)應(yīng)的知識(shí)類(lèi)型為基礎(chǔ)依據(jù),可以將其大致劃分為以下幾類(lèi),即總結(jié)規(guī)則、時(shí)序規(guī)則、趨勢(shì)分析、關(guān)聯(lián)規(guī)則、分類(lèi)規(guī)則以及聚類(lèi)規(guī)則等;以其技術(shù)的不同為基礎(chǔ)依據(jù),可以分為規(guī)則歸納、決策樹(shù)、可視化技術(shù)以及人工神經(jīng)網(wǎng)絡(luò)等各種方法[7];以其不同的知識(shí)表達(dá)為基礎(chǔ)依據(jù),可以分為高層次挖掘、原始層次挖掘以及多層次挖掘等。
1.2? 數(shù)據(jù)挖掘過(guò)程
數(shù)據(jù)挖掘過(guò)程是從大量、龐雜的數(shù)據(jù)庫(kù)當(dāng)中進(jìn)行篩選和甄別的過(guò)程。數(shù)據(jù)庫(kù)當(dāng)中的數(shù)據(jù)龐大繁復(fù),直接進(jìn)行數(shù)據(jù)挖掘往往難以達(dá)到預(yù)期效果。在數(shù)據(jù)挖掘的實(shí)際應(yīng)用過(guò)程中,往往需要通過(guò)以下步驟逐步進(jìn)行,以獲得最佳效果[8]。
1) 進(jìn)行相應(yīng)的數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備階段需要以下三個(gè)細(xì)分步驟依次執(zhí)行:
① 進(jìn)行相應(yīng)的數(shù)據(jù)選擇,依據(jù)在實(shí)際應(yīng)用當(dāng)中的不同需求,進(jìn)行相應(yīng)的目標(biāo)數(shù)據(jù)集群選擇,縮小數(shù)據(jù)篩選范圍。
② 對(duì)數(shù)據(jù)做出篩選與凈化,依據(jù)實(shí)際情況通過(guò)對(duì)應(yīng)策略對(duì)數(shù)據(jù)噪聲進(jìn)行消除,以此減免數(shù)據(jù)庫(kù)當(dāng)中的數(shù)據(jù)信息可能發(fā)生的冗余。同時(shí),對(duì)數(shù)據(jù)信息進(jìn)行合理的推斷和預(yù)算,保證信息完整,避免其不完整性。
③ 對(duì)數(shù)據(jù)進(jìn)行一定的變換和壓縮,依據(jù)實(shí)際的數(shù)據(jù)處理任務(wù),將數(shù)據(jù)信息進(jìn)行對(duì)應(yīng)的分組,并且進(jìn)行離散與連續(xù)數(shù)據(jù)之間的相互轉(zhuǎn)換,同時(shí)對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的壓縮。
2) 進(jìn)行數(shù)據(jù)挖掘的方法以及算法的相關(guān)選擇,選擇的基本原則是方法與算法能夠與數(shù)據(jù)處理相互匹配,同時(shí)盡可能的使處理結(jié)果最優(yōu)。
3) 對(duì)數(shù)據(jù)挖掘的信息分析、評(píng)價(jià)與表達(dá)。在通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)海量的信息數(shù)據(jù)進(jìn)行甄別與篩選之后,數(shù)據(jù)結(jié)果應(yīng)當(dāng)能夠通過(guò)直觀明了的可視化圖表形式進(jìn)行表達(dá)。
數(shù)據(jù)挖掘的完整流程圖如圖1所示。
1.3? 數(shù)據(jù)挖掘與流量監(jiān)測(cè)的關(guān)系
在學(xué)校規(guī)模不斷擴(kuò)張,互聯(lián)網(wǎng)應(yīng)用程度越來(lái)越廣泛的過(guò)程當(dāng)中,校園網(wǎng)的數(shù)據(jù)流量越來(lái)越多。與此同時(shí)帶來(lái)的問(wèn)題是各種異常網(wǎng)絡(luò)行為的出現(xiàn),種種數(shù)據(jù)流量的異常情況隨之產(chǎn)生[9]。在大量數(shù)據(jù)流量信息當(dāng)中,應(yīng)當(dāng)通過(guò)相應(yīng)的分析手段,對(duì)其中異常的數(shù)據(jù)流量情況進(jìn)行甄別,并通過(guò)分析其異常數(shù)據(jù)情況,得到異常數(shù)據(jù)流量的隱藏特征,同時(shí)針對(duì)特征做出對(duì)應(yīng)的措施。在此過(guò)程當(dāng)中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用十分重要。通過(guò)數(shù)據(jù)挖掘技術(shù)能夠?qū)崿F(xiàn)異常數(shù)據(jù)流量的篩選,并且能分析出其中的抽象規(guī)則[10]。數(shù)據(jù)挖掘技術(shù)為異常數(shù)據(jù)流量的分析提供了極大便利,幫助網(wǎng)絡(luò)管理員在龐雜的數(shù)據(jù)當(dāng)中快速找到其不同特征并得以利用。
2? 校園流量監(jiān)測(cè)系統(tǒng)設(shè)計(jì)
2.1? 監(jiān)測(cè)系統(tǒng)整體框架
校園網(wǎng)流量的監(jiān)測(cè)系統(tǒng),主要是通過(guò)技術(shù)手段對(duì)校園網(wǎng)絡(luò)當(dāng)中的數(shù)據(jù)流量做出對(duì)應(yīng)的監(jiān)測(cè),并根據(jù)監(jiān)測(cè)數(shù)據(jù)進(jìn)行數(shù)據(jù)流量正常與否的判斷。校園網(wǎng)的流量監(jiān)控系統(tǒng)從結(jié)構(gòu)上看主要包括兩部分的內(nèi)容:一部分功能的實(shí)現(xiàn)位置為服務(wù)器端口,主要執(zhí)行的功能為對(duì)相應(yīng)正常的網(wǎng)絡(luò)流量做出分析與處理;另一部分功能的實(shí)現(xiàn)位置為客戶端口,可以對(duì)校園網(wǎng)出現(xiàn)異常的數(shù)據(jù)流量進(jìn)行分析[11]。在業(yè)務(wù)的具體計(jì)算、處理以及分析上,主要通過(guò)瀏覽器/服務(wù)器模式進(jìn)行對(duì)應(yīng)的操作。這一方法能夠使開(kāi)發(fā)難度盡可能降到最低,并減少對(duì)硬件的依賴(lài),在處理上更為簡(jiǎn)潔。其具體流程圖如圖2所示。
2.2? 監(jiān)測(cè)系統(tǒng)各模塊功能設(shè)計(jì)
2.2.1? 數(shù)據(jù)收集模塊
數(shù)據(jù)收集功能主要實(shí)現(xiàn)校園網(wǎng)使用的對(duì)應(yīng)數(shù)據(jù)流量信息的相關(guān)收集工作,收集數(shù)據(jù)將作為進(jìn)行校園網(wǎng)流量正常與否判斷的主要依據(jù)[12]。在數(shù)據(jù)收集功能當(dāng)中,其收集數(shù)據(jù)的方式主要是對(duì)經(jīng)由交換機(jī)端口的各類(lèi)數(shù)據(jù)包進(jìn)行收集。首先需要獲取客戶端的IP地址,在獲取IP地址之后,對(duì)各類(lèi)交換機(jī)當(dāng)中的網(wǎng)絡(luò)端口進(jìn)行相應(yīng)配置信息的收集以及統(tǒng)計(jì),在此過(guò)程當(dāng)中,同時(shí)能夠掌握網(wǎng)速以及相應(yīng)的網(wǎng)絡(luò)端口狀態(tài)。
2.2.2? 獲取知識(shí)模塊
獲取知識(shí)的功能是指通過(guò)一定的數(shù)據(jù)挖掘算法對(duì)所收集的數(shù)據(jù)組成的數(shù)據(jù)集合進(jìn)行特征挖掘,同時(shí)對(duì)這些數(shù)據(jù)結(jié)構(gòu)進(jìn)行分析。然后將學(xué)習(xí)的結(jié)果在對(duì)應(yīng)的日志文件當(dāng)中進(jìn)行儲(chǔ)存,便于進(jìn)行以后的學(xué)習(xí)工作。鑒于校園網(wǎng)的運(yùn)行是不間斷的,為了學(xué)習(xí)工作能夠跟隨最新的數(shù)據(jù)流量情況,需要及時(shí)對(duì)系統(tǒng)日志進(jìn)行更新。實(shí)際處理過(guò)程當(dāng)中,需要對(duì)收集數(shù)據(jù)進(jìn)行相應(yīng)的預(yù)處理工作,保證數(shù)據(jù)格式相對(duì)規(guī)范,能夠順利進(jìn)行知識(shí)獲取工作。數(shù)據(jù)挖掘流程圖如圖3所示。
2.2.3? 流量分組監(jiān)測(cè)模塊
對(duì)流量進(jìn)行分類(lèi)監(jiān)測(cè)的功能通過(guò)對(duì)應(yīng)的算法實(shí)現(xiàn)。首先應(yīng)當(dāng)建立對(duì)應(yīng)的分析及預(yù)測(cè)模型,其次對(duì)數(shù)據(jù)庫(kù)所收集到的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行對(duì)應(yīng)的分類(lèi)。在具體執(zhí)行上,首先在各網(wǎng)絡(luò)節(jié)點(diǎn)當(dāng)中輸入對(duì)應(yīng)的參數(shù)值,然后以分類(lèi)個(gè)數(shù)為基礎(chǔ)依據(jù)對(duì)整體網(wǎng)絡(luò)數(shù)據(jù)做出對(duì)應(yīng)的數(shù)據(jù)處理,從而得到不同的聚類(lèi)數(shù)組。在聚類(lèi)數(shù)組當(dāng)中計(jì)算各節(jié)點(diǎn)到中心節(jié)點(diǎn)的距離,并儲(chǔ)存對(duì)應(yīng)的中心點(diǎn)坐標(biāo)數(shù)據(jù),進(jìn)行相似度計(jì)算。
2.2.4? 網(wǎng)絡(luò)分析模塊
網(wǎng)絡(luò)分析模塊主要執(zhí)行的功能是對(duì)所篩選和甄別出的異常流量數(shù)據(jù)進(jìn)行分析,以便后期更進(jìn)一步地對(duì)網(wǎng)絡(luò)流量異常與否進(jìn)行辨別,這樣網(wǎng)絡(luò)管理員就能夠在工作時(shí)具備更高的工作效率。網(wǎng)絡(luò)分析模塊的流程圖如圖4所示。
3? 流量監(jiān)測(cè)系統(tǒng)的實(shí)現(xiàn)
3.1? 用戶登錄實(shí)現(xiàn)
在校園網(wǎng)的流量監(jiān)測(cè)系統(tǒng)當(dāng)中,主要分為兩類(lèi)常見(jiàn)的系統(tǒng)使用者:一類(lèi)是普通的校園網(wǎng)用戶;一類(lèi)是網(wǎng)絡(luò)管理員。無(wú)論是哪類(lèi)用戶,使用流量監(jiān)測(cè)系統(tǒng)的前提是通過(guò)合法的身份進(jìn)行系統(tǒng)登錄。在登錄程序啟動(dòng)之后,用戶會(huì)打開(kāi)對(duì)應(yīng)的登錄界面,將自己的登錄賬號(hào)以及密碼等登錄信息輸入登錄界面對(duì)應(yīng)的位置進(jìn)行登錄。信息輸入之后,系統(tǒng)會(huì)對(duì)其登錄信息進(jìn)行后臺(tái)驗(yàn)證。后臺(tái)驗(yàn)證的目的主要有兩個(gè):一是驗(yàn)證用戶輸入的登錄信息是否合法;二是檢驗(yàn)用戶登錄的信息是否滿足格式要求。當(dāng)后臺(tái)驗(yàn)證成功之后,允許用戶登錄,同時(shí)依據(jù)用戶登錄賬號(hào)對(duì)應(yīng)的身份憑證,為用戶匹配不同的操作權(quán)限,進(jìn)入與其身份相匹配的操作界面。具體的用戶登錄功能實(shí)現(xiàn)的流程圖如圖5所示。
3.2? 預(yù)警信息管理查詢
用戶在其對(duì)應(yīng)的操作界面當(dāng)中能夠通過(guò)預(yù)警查詢管理功能實(shí)現(xiàn)對(duì)應(yīng)的預(yù)警信息的瀏覽。預(yù)警信息管理查詢的功能主要是對(duì)各類(lèi)預(yù)警信息的檢索功能。用戶在對(duì)應(yīng)的預(yù)警信息管理界面能夠?qū)ο胍樵兊木唧w時(shí)間段、對(duì)應(yīng)的預(yù)警信息檢索類(lèi)型進(jìn)行選擇,然后通過(guò)查詢得到對(duì)應(yīng)的查詢結(jié)果。同時(shí),用戶也可以選擇性地將有效的查詢結(jié)果導(dǎo)出為對(duì)應(yīng)的查詢報(bào)告。通常預(yù)警信息管理查詢功能僅供管理員用戶使用。預(yù)警信息管理查詢的流程圖如圖6所示。
3.3? 網(wǎng)絡(luò)流量查詢
網(wǎng)絡(luò)流量的查詢主要是對(duì)網(wǎng)絡(luò)流量異常與否的查詢。在確定網(wǎng)絡(luò)流量異常時(shí),其對(duì)應(yīng)的異常流量情況又可以分為兩種,一種是未知網(wǎng)絡(luò)異常流量,另一種是已知網(wǎng)絡(luò)異常流量。已知網(wǎng)絡(luò)流量異常的情況主要通過(guò)相對(duì)應(yīng)的數(shù)據(jù)表完成;未知網(wǎng)絡(luò)流量異常的查詢主要是對(duì)當(dāng)前的網(wǎng)絡(luò)情況進(jìn)行監(jiān)測(cè)分析,進(jìn)行相應(yīng)的異常數(shù)據(jù)信息的篩選。具體的網(wǎng)絡(luò)流量監(jiān)測(cè)流程如圖7所示。
3.4? 網(wǎng)絡(luò)日志查詢
網(wǎng)絡(luò)日志的查詢通常是對(duì)操作記錄或者異常預(yù)警的查詢。系統(tǒng)在運(yùn)行過(guò)程中,相應(yīng)的系統(tǒng)操作在相應(yīng)的日志文件當(dāng)中進(jìn)行相應(yīng)的記錄。網(wǎng)絡(luò)管理員需要進(jìn)行信息調(diào)用時(shí),可以通過(guò)網(wǎng)絡(luò)日志查詢功能對(duì)相應(yīng)的信息進(jìn)行查詢。通過(guò)網(wǎng)絡(luò)日志查詢,網(wǎng)絡(luò)管理員可以對(duì)網(wǎng)絡(luò)異常信息以及各種用戶操作記錄進(jìn)行查詢,并在需要時(shí)發(fā)出預(yù)警。
3.5? 數(shù)據(jù)采集
校園流量監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)采集主要對(duì)在數(shù)據(jù)庫(kù)當(dāng)中儲(chǔ)存的網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行采集。數(shù)據(jù)采集是對(duì)交換機(jī)中通過(guò)的數(shù)據(jù)包以及校園網(wǎng)路由器的監(jiān)測(cè)[13]。在計(jì)算機(jī)采集到相應(yīng)的數(shù)據(jù)包時(shí),對(duì)其提取首位以及次位字符。通過(guò)所提取字符確定網(wǎng)絡(luò)設(shè)備對(duì)應(yīng)的版本號(hào)。在版本號(hào)確定之后對(duì)對(duì)應(yīng)的數(shù)據(jù)包做出處理,并進(jìn)行相應(yīng)的數(shù)據(jù)信息儲(chǔ)存。同時(shí),校園網(wǎng)監(jiān)測(cè)系統(tǒng)處理的數(shù)據(jù)包類(lèi)型應(yīng)當(dāng)是多樣化的。
3.6? 數(shù)據(jù)分析
對(duì)所收集到的流量數(shù)據(jù)信息進(jìn)行分析的方法為聚類(lèi)分析方法。在具體的分析過(guò)程當(dāng)中,主要通過(guò)出現(xiàn)過(guò)的流量異常數(shù)據(jù)以及收集到的流量數(shù)據(jù)信息進(jìn)行分析推理,判定現(xiàn)有收集流量數(shù)據(jù)是否異常。實(shí)際分析過(guò)程當(dāng)中,通過(guò)K?means聚類(lèi)算法進(jìn)行分析,主要的分析步驟如下:
1) 設(shè)置常數(shù)[m],在流量數(shù)據(jù)樣本當(dāng)中選擇隨機(jī)的[m]個(gè)樣本分為[m]個(gè)初始分類(lèi)簇。
2) 計(jì)算其他樣本到[m]個(gè)聚類(lèi)簇聚類(lèi)中心的相似度,依據(jù)其相似度的不同進(jìn)行不同的數(shù)據(jù)樣本歸類(lèi)。
3) 在各聚類(lèi)簇中加入新的流量數(shù)據(jù)時(shí),進(jìn)行聚類(lèi)中心的迭代更新,保證聚類(lèi)簇中心正確。
4) 通過(guò)評(píng)價(jià)函數(shù),判斷聚類(lèi)簇滿足要求與否,當(dāng)滿足要求時(shí),結(jié)束算法,若不滿足要求,則回到步驟2)。
設(shè)計(jì)中K?means算法的具體流程圖如圖8所示。
4? 測(cè)試結(jié)果及分析
4.1? 測(cè)試方法
在具體的系統(tǒng)測(cè)試當(dāng)中,主要通過(guò)靜態(tài)測(cè)試以及動(dòng)態(tài)測(cè)試兩種方法進(jìn)行相應(yīng)的程序測(cè)試。在靜態(tài)測(cè)試方法中,應(yīng)用程序不需要運(yùn)行,而是通過(guò)對(duì)程序當(dāng)中的代碼進(jìn)行分析,評(píng)估程序當(dāng)中對(duì)應(yīng)的錯(cuò)誤信息,進(jìn)而檢驗(yàn)其代碼結(jié)構(gòu)上是否存在不合理的嵌套或者是循環(huán)語(yǔ)句,以及其代碼編寫(xiě)是否存在語(yǔ)法錯(cuò)誤。在進(jìn)行動(dòng)態(tài)測(cè)試時(shí)需要運(yùn)行程序,在程序運(yùn)行過(guò)程當(dāng)中,輸入對(duì)應(yīng)的執(zhí)行語(yǔ)句并檢測(cè)是否能夠輸出預(yù)期結(jié)果,從而確定流量是否發(fā)生異常。動(dòng)態(tài)測(cè)試的方法進(jìn)行進(jìn)一步的分類(lèi)可以分為白盒測(cè)試以及黑盒測(cè)試。白盒測(cè)試即在了解計(jì)算機(jī)系統(tǒng)功能的基礎(chǔ)上所進(jìn)行的測(cè)試;黑盒測(cè)試則并不考慮程序內(nèi)部是何結(jié)構(gòu),主要是針對(duì)程序的功能接口進(jìn)行對(duì)應(yīng)的測(cè)試。
4.2? 測(cè)試結(jié)果及分析
在掌握對(duì)應(yīng)的測(cè)試方法之后,針對(duì)不同功能模塊對(duì)流量監(jiān)測(cè)系統(tǒng)進(jìn)行測(cè)試。測(cè)試之前,需要進(jìn)行相應(yīng)的特征數(shù)據(jù)準(zhǔn)備。準(zhǔn)備好對(duì)應(yīng)的特征數(shù)據(jù)之后,在對(duì)應(yīng)的功能模塊當(dāng)中測(cè)試對(duì)應(yīng)的輸出結(jié)果,檢驗(yàn)測(cè)試結(jié)果是否與預(yù)期結(jié)果一致,測(cè)試結(jié)果如表1所示。
在表1當(dāng)中,用戶登錄以及管理員登錄的賬號(hào)為7位數(shù)字,密碼為8位字母與數(shù)字的組合,經(jīng)驗(yàn)證測(cè)試通過(guò),能夠有效判別賬號(hào)正確與否以及賬號(hào)類(lèi)型。同時(shí)在預(yù)警信息查詢的過(guò)程當(dāng)中,能夠結(jié)合算法和數(shù)據(jù)挖掘技術(shù)進(jìn)行網(wǎng)絡(luò)流量是否異常的查詢工作。
5? 結(jié)? 語(yǔ)
良好的校園網(wǎng)流量監(jiān)測(cè)系統(tǒng)能夠幫助網(wǎng)絡(luò)管理員實(shí)現(xiàn)更好的網(wǎng)絡(luò)管理與維護(hù),同時(shí)能夠有效維護(hù)校園網(wǎng)絡(luò)的生態(tài)健康。本文設(shè)計(jì)以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),結(jié)合K?means算法,實(shí)現(xiàn)了對(duì)校園網(wǎng)絡(luò)數(shù)據(jù)流量的監(jiān)測(cè)以及對(duì)流量異常的甄別與篩選。經(jīng)過(guò)實(shí)踐驗(yàn)證,該設(shè)計(jì)系統(tǒng)切實(shí)可行。
參考文獻(xiàn)
[1] 趙東卓.網(wǎng)絡(luò)流量監(jiān)測(cè)與分析技術(shù)的研究[D].長(zhǎng)春:長(zhǎng)春工業(yè)大學(xué),2015:5?38.
[2] 王旭.網(wǎng)絡(luò)數(shù)據(jù)流量監(jiān)測(cè)技術(shù)的應(yīng)用與特征[J].硅谷,2015(4):138.
[3] 潘虎.網(wǎng)絡(luò)流量監(jiān)測(cè)技術(shù)研究[J].電子世界,2016(4):181.
[4] 劉海濤.恒虛警下異常網(wǎng)絡(luò)流量序列監(jiān)測(cè)技術(shù)仿真分析[J].計(jì)算機(jī)仿真,2016,33(8):244?247.
[5] 舒忠梅,徐曉東,屈瓊斐.基于數(shù)據(jù)挖掘的學(xué)生投入模型與學(xué)習(xí)分析[J].遠(yuǎn)程教育雜志,2015(1):39?47.
[6] 胡資聰.基于windows內(nèi)核的進(jìn)程網(wǎng)絡(luò)流量監(jiān)測(cè)與控制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].武漢:華中科技大學(xué),2015:2?3.
[7] 顧煒江.網(wǎng)絡(luò)流量監(jiān)測(cè)中在線數(shù)據(jù)融合方法設(shè)計(jì)[J].科學(xué)技術(shù)與工程,2016,16(13):239?243.
[8] 劉遠(yuǎn)超,彭兆軍.融合幀差循環(huán)控制的網(wǎng)絡(luò)流量監(jiān)測(cè)模型仿真[J].軟件導(dǎo)刊,2016,15(5):179?181.
[9] 王啟明,趙凱,時(shí)合生.基于改進(jìn)型決策樹(shù)算法的網(wǎng)絡(luò)流量監(jiān)測(cè)研究[J].微型電腦應(yīng)用,2015,31(8):31?33.
[10] AUSSEM A, MURTAGH F. Combining neural network forecasts on wavelet transformed time series [J]. Connection science, 1997, 9(1): 113?122.
[11] AGARWAL D, GONZALEZ J M, JIN Guojun, et al. An infrastructure for passive network monitoring of application data streams [C]// Proceedings of the 2003 Passive and Active Monitoring Workshop. Berkeley, California: Ernest Orlando Lawrence Berkeley National Laboratory, 2003: 1?8.
[12] VAN GESTEL T, SUYKENS J A K, BAESTAENS D E, et al. Financial time series prediction using least squares support vector machines within the evidence framework [J]. IEEE transactions on neural networks, 2001, 12(4): 809?821.
[13] KIM K H, YOUN H S, KANG Y C. Short?term load forecas?ting for special days in anomalous load conditions using neural networks and fuzzy inference method [J]. IEEE transactions on power systems, 2000, 15(2): 559?565.
作者簡(jiǎn)介:周康樂(lè)(1979—),男,江西進(jìn)賢人,碩士,講師,實(shí)驗(yàn)師,主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)。