李英杰
摘要:在計算機網(wǎng)絡病毒防御技術中,關于數(shù)據(jù)挖掘技術的應用能夠迅速將其所處范圍內的數(shù)據(jù)進行收集分類,從而為計算機病毒相關信息判定提供參考。本文則對數(shù)據(jù)挖掘技術在計算機網(wǎng)絡病毒防御技術中的應用分析。
關鍵字:數(shù)據(jù)挖掘技術;計算機;網(wǎng)絡;病毒防御技術
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2015)02-0001-02
Abstract: In the computer network virus prevention technology, with respect to the application of data mining technology can quickly within its geographical scope of the data collected classification, so as to provide a reference for computer virus-related information determination. In this paper, the analysis of data mining techniques in computer network virus defense techniques.
Key words: data mining technology; computers; networks; virus defense technology
隨著社會的進步,計算機技術迅速發(fā)展革新,人們已經(jīng)進入暫新的網(wǎng)絡時代,但與此同時,伴隨著計算機技術的發(fā)展,與計算機網(wǎng)絡一直都存在密切關系的計算機網(wǎng)絡病毒技術也保持著同步發(fā)展,甚至推進到更高水平,給計算機網(wǎng)絡系統(tǒng)安全造成極大的威脅,同時給廣大計算機網(wǎng)絡用戶帶來很大損失,因此,計算機網(wǎng)絡病毒防御技術一直是人們比較關注的問題。數(shù)據(jù)挖掘技術是一種新型計算機技術,用于計算機網(wǎng)絡病毒的防御系統(tǒng)中可以有效的解決目前發(fā)展猖獗的蠕蟲病毒,進一步保障計算機網(wǎng)絡系統(tǒng)的安全。
1 計算機網(wǎng)絡病毒特點
第一,計算機網(wǎng)絡病毒種類的多樣性。計算機網(wǎng)絡病毒的設計和開發(fā)沒有太大難度,簡單的幾個程序編寫指令就可以開發(fā)設計出各種各樣的網(wǎng)絡病毒,尤其是對于一些技術水平比較高的程序編寫員來講,很容易就可以完成計算機網(wǎng)絡病毒程序的編寫和修改,而且網(wǎng)絡病毒的種類增長和繁殖速度特別快[1]。
第二,計算機網(wǎng)絡病毒傳播形式的多樣性。計算機網(wǎng)絡系統(tǒng)的傳播形式有很多種,網(wǎng)絡病毒在網(wǎng)絡系統(tǒng)漏洞中的傳播就是常見的一種病毒傳播方式,計算機網(wǎng)絡病毒程序通過對Internet 遠程主機系統(tǒng)的搜索和掃描,利用系統(tǒng)漏洞到達控制對方計算機的控制。同時也有一種病毒通過對文件夾的搜索掃描,進行病毒復制,以到達入侵網(wǎng)絡系統(tǒng)的目的。
第三,計算機網(wǎng)絡病毒的針對性。在計算機網(wǎng)絡技術發(fā)展初期,計算機網(wǎng)絡病毒主要目標就是干擾網(wǎng)絡技術人員的程序編寫,隨著計算機技術的快速發(fā)展,計算機網(wǎng)絡病毒的開發(fā)技術和功能作用也發(fā)生了很多變化,如今,計算機網(wǎng)絡病毒的設計和開發(fā)已經(jīng)開始商業(yè)化,針對性的對計算機網(wǎng)絡系統(tǒng)實施破壞,如通過盜用網(wǎng)銀賬號和密碼等方式已到達非法獲取利益的目的。
2 數(shù)據(jù)挖掘技術的基本認識
數(shù)據(jù)挖掘技術是通過對所處一定范圍之內的所有數(shù)據(jù)進行數(shù)據(jù)收集、數(shù)據(jù)分類以及數(shù)據(jù)歸類,進而來判斷是否存在某種潛在的關系和數(shù)據(jù)規(guī)律,主要環(huán)節(jié)有3個:第一個是準備數(shù)據(jù);第二個是尋找數(shù)據(jù)存在的規(guī)律;第三個是表現(xiàn)數(shù)據(jù)規(guī)律。數(shù)據(jù)挖掘技術的基本應用結構如下圖所示:
數(shù)據(jù)挖掘模式設置好之后,技術系統(tǒng)中的挖掘引擎就會以數(shù)據(jù)庫中的要求為依據(jù),對準備好的數(shù)據(jù)進行數(shù)據(jù)分析和數(shù)據(jù)歸類,找出各個數(shù)據(jù)之間存在的關系和相應的數(shù)據(jù)規(guī)律,以便成為之后數(shù)據(jù)分析的有利依據(jù),數(shù)據(jù)挖掘步技術是比較全面的挖掘技術和數(shù)據(jù)應用技術,工作過程比較繁雜,工作操作步驟較多,其中存在很大部分的準備環(huán)節(jié)和規(guī)劃工作,數(shù)據(jù)挖掘技術的重點工作是對數(shù)據(jù)的預處理階段,對數(shù)據(jù)的預處理階段是數(shù)據(jù)挖掘技術的基礎,是后期的進行數(shù)據(jù)分析的必要條件[2]。
3 數(shù)據(jù)挖掘技術下的計算機網(wǎng)絡病毒防御技術
3.1 數(shù)據(jù)挖掘技術的構成分析
在計算機網(wǎng)絡病毒進行傳播的時候,為了給數(shù)據(jù)挖掘技術提供相應的數(shù)據(jù)依據(jù),需要對有關數(shù)據(jù)進行掃描,可以對網(wǎng)絡用戶方面數(shù)據(jù)進行掃描,也可以對系統(tǒng)數(shù)據(jù)進行掃描。數(shù)據(jù)挖掘技術在計算機網(wǎng)絡病毒防御中的應用過程比較復雜,步驟繁多,為了便于日常操作應用,掌握每個環(huán)節(jié)的基本特征,可以對預處理模塊、決策模塊、數(shù)據(jù)收集模塊、數(shù)據(jù)挖掘模塊以及規(guī)則庫模塊進行分模塊分析研究?;跀?shù)據(jù)挖掘技術的計算機網(wǎng)絡病毒防御流程如下圖所示:
3.1.1 數(shù)據(jù)預處理模塊分析
簡化數(shù)據(jù)挖掘技術中數(shù)據(jù)挖掘和數(shù)據(jù)分析之間的處理操作可以通過數(shù)據(jù)預處理模塊來實現(xiàn),利用數(shù)據(jù)預處理模塊可以整體上提高數(shù)據(jù)挖掘效果,提高數(shù)據(jù)辨識度和準確度。在完成數(shù)據(jù)收集后需要把數(shù)據(jù)導入到預處理模塊,實現(xiàn)數(shù)據(jù)的分析歸類和數(shù)據(jù)變換,通過這樣額方式把數(shù)據(jù)轉換成可以被系統(tǒng)識別和處理的數(shù)據(jù)內容。以目標 IP地址、源 IP地址、端口信息等這些據(jù)數(shù)據(jù)包當中所包括的信息內容為依據(jù),實施數(shù)據(jù)集合、數(shù)據(jù)歸納、數(shù)據(jù)處理等流程等[3]。
3.1.2 決策模塊分析
在數(shù)據(jù)挖掘技術中的決策功能模塊中,通過對數(shù)據(jù)的挖掘對數(shù)據(jù)庫進行構建,然后對數(shù)據(jù)進行匹配,同時數(shù)據(jù)庫還要和規(guī)則庫密切聯(lián)系起來。如果數(shù)據(jù)庫有與規(guī)則庫存在高度聯(lián)系的信息出現(xiàn),證明在決策模塊里有病毒特征存在,很可能會感染到計算機病毒。如果是結果數(shù)據(jù)庫的數(shù)據(jù)信息和規(guī)則庫的數(shù)據(jù)不能相互匹配,那也就是說該數(shù)據(jù)包中存在有帶有新型特征病的毒帶,也就是出現(xiàn)了新型的規(guī)則類,這樣的情況下就需要把該帶有新型特征的病毒導入到系統(tǒng)的規(guī)則庫當中,規(guī)則庫的一種較新型的規(guī)則類別也就形成了。
3.1.3 數(shù)據(jù)收集模塊分析
實現(xiàn)數(shù)據(jù)挖掘的基本要求是提供充分的數(shù)據(jù)信息,只有通過數(shù)據(jù)收集才能實現(xiàn)數(shù)據(jù)收集模塊的功能。數(shù)據(jù)收集模塊通過對計算機網(wǎng)絡中數(shù)據(jù)包的抓取和收集來實現(xiàn)數(shù)據(jù)信息,數(shù)據(jù)信息被收集后就會具有一定的數(shù)據(jù)結構和比較重要的功能信息。
3.1.4 數(shù)據(jù)挖掘模塊分析
數(shù)據(jù)挖掘技術的一個最關鍵部分就是數(shù)據(jù)挖掘模塊。數(shù)據(jù)挖掘模塊中的事件庫和數(shù)據(jù)挖掘算法是數(shù)據(jù)挖掘模塊的關鍵部分。數(shù)據(jù)挖掘對相關數(shù)據(jù)的收集構成了事件庫,通過對事件庫中數(shù)據(jù)的分類和數(shù)據(jù)整理,進而可以獲取較為準確的數(shù)據(jù)結構。
3.2 以數(shù)據(jù)挖掘技術為基礎的網(wǎng)絡病毒防御系統(tǒng)
3.2.1 數(shù)據(jù)挖掘技術中的關聯(lián)規(guī)則分析
數(shù)據(jù)挖掘技術的關聯(lián)規(guī)則就是指在同一類別的數(shù)據(jù)中有可以被發(fā)現(xiàn)的知識存在,通過對兩個或者超過兩個的變量進行取值,如果發(fā)現(xiàn)數(shù)據(jù)具體一定規(guī)律的話說明這些數(shù)據(jù)和數(shù)據(jù)之間存在著某種關聯(lián)性。因果關聯(lián)、及時序關聯(lián)以及簡單關聯(lián)是存在數(shù)據(jù)挖掘技術中的幾種主要關聯(lián)關系。要找到數(shù)據(jù)庫中的關聯(lián)網(wǎng),就需要進行關聯(lián)分析,然后結合數(shù)據(jù)和數(shù)據(jù)之間的關聯(lián)性進行數(shù)據(jù)挖掘,進而得到數(shù)據(jù)和數(shù)據(jù)存在的關聯(lián)規(guī)則。
3.2.2 數(shù)據(jù)挖掘技術中的聚類分析
根據(jù)數(shù)據(jù)的不同特點和類別,對所獲取的數(shù)據(jù)進行分解,把它們分成多個不同的組別,各組數(shù)據(jù)之間在特征上都存在不同程度的相似之處,而且每組數(shù)據(jù)同時又存在著各種不同特征。系統(tǒng)對所有數(shù)據(jù)進行聚類之后,就可以發(fā)現(xiàn)并識別出整個系統(tǒng)數(shù)據(jù)分布的疏密情況,這樣不僅可以呈現(xiàn)出組與組之間數(shù)據(jù)存在的聯(lián)系,同時也可以對全局的分布模式有所體現(xiàn)。
3.2.3 數(shù)據(jù)挖掘技術中的分類分析
對個體進行分類并歸類到預先設定的類別當中就是分類分析。分類的目的就是通過對各種各樣的機器學習方法和各種統(tǒng)計方法的利用,建立數(shù)據(jù)的分類模型,進而把數(shù)據(jù)庫中存在的所有數(shù)據(jù)按照一定的規(guī)律劃分成各個類別,然后依據(jù)這個分類規(guī)則結果實現(xiàn)對其他數(shù)據(jù)的分析和歸類。
4 結束語
計算機網(wǎng)絡已經(jīng)很大程度上滲透入人們的生活和工作當中,徹底改變了人們的生活和工作方式,同時也促進了計算機網(wǎng)絡技術的進一步發(fā)展,但面對無法徹底避免的計算機網(wǎng)絡病毒,大家一定要提高網(wǎng)絡系統(tǒng)安全意識,把這場抵制計算機網(wǎng)絡病毒入侵的持久戰(zhàn)堅持下去。
參考文獻:
[1] 李智勇. 數(shù)據(jù)挖掘在計算機網(wǎng)絡病毒防御中的應用探究[J]. 電子測試, 2014 (12): 46-48.
[2] 黃應紅, 孫發(fā), 張坤,等. 計算機網(wǎng)絡病毒檢測的數(shù)據(jù)挖掘技術應用[J]. 網(wǎng)絡安全技術與應用, 2014(11): 37, 39.
[3] 孫健, 陳浩.論數(shù)據(jù)挖掘在計算機網(wǎng)絡病毒防御中的應用[J]. 科學與財富, 2013 (12): 239-239.