梁雪霆
摘 要:隨著互聯(lián)網(wǎng)的快速發(fā)展和普及,信息傳播方式發(fā)生重大轉(zhuǎn)變,人們的生活、生產(chǎn)也更加便利。但是,不可否認的是,計算機網(wǎng)絡(luò)病毒同樣發(fā)展起來,嚴重威脅人們的信息安全。數(shù)據(jù)挖掘技術(shù)是一種新型的技術(shù),可以挖掘、出來、分析計算機網(wǎng)絡(luò)中的數(shù)據(jù),可用于防御計算機網(wǎng)絡(luò)病毒,從而進一步保障人們的信息安全。本文先簡單概述數(shù)據(jù)挖掘技術(shù),然后從數(shù)據(jù)挖掘技術(shù)的構(gòu)成、計算機網(wǎng)絡(luò)病毒防御系統(tǒng)兩個方面來研究計算機網(wǎng)絡(luò)病毒防御技術(shù),旨在為后續(xù)研究提供一定的參考。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);網(wǎng)絡(luò)病毒;計算機
在現(xiàn)代化技術(shù)的高速發(fā)展下,人們已經(jīng)進入一個嶄新的時代——網(wǎng)絡(luò)時代,人們的衣、食、住、行均與網(wǎng)絡(luò)息息相關(guān)。與此同時,計算機網(wǎng)絡(luò)病毒不斷增多,由于其種類、傳播方式均具有多樣性,嚴重威脅計算機網(wǎng)絡(luò)系統(tǒng)安全,也損害了廣大計算機網(wǎng)絡(luò)用戶的信息安全[1]。基于此,計算機網(wǎng)絡(luò)病毒防御技術(shù)越來越受到人們的關(guān)注,且成為該領(lǐng)域的研究熱點。
1 數(shù)據(jù)挖掘技術(shù)概述
所謂數(shù)據(jù)挖掘技術(shù),指的是以所處一定范圍之內(nèi)的所有數(shù)據(jù)為研究對象,對其進行收集、分類、歸類,根據(jù)數(shù)據(jù)處理結(jié)果,判斷是否存在某種潛在關(guān)系和數(shù)據(jù)規(guī)律的技術(shù)。它主要包含三個環(huán)節(jié):即準備數(shù)據(jù)、尋找數(shù)據(jù)存在的規(guī)律、表現(xiàn)數(shù)據(jù)規(guī)律,數(shù)據(jù)挖掘技術(shù)的工作流程如下:當(dāng)設(shè)置好數(shù)據(jù)挖掘模式后,挖掘引擎就會根據(jù)數(shù)據(jù)庫的相關(guān)要求展開工作,即對準備好的數(shù)據(jù)進行分析、歸類,利用相關(guān)技術(shù)找出各個數(shù)據(jù)之間存在的關(guān)系,或是數(shù)據(jù)規(guī)律,從而為后期的數(shù)據(jù)分析提供依據(jù)。在實際的應(yīng)用中,數(shù)據(jù)挖掘技術(shù)的過程比較繁雜,很大一部分屬于準備、規(guī)劃階段,但其重點在于對數(shù)據(jù)的預(yù)處理,它屬于基礎(chǔ)環(huán)節(jié),同時也是后續(xù)工作的必要條件[2]。數(shù)據(jù)預(yù)處理階段涉及的操作過程也比較多,比如數(shù)據(jù)的凈化過程、轉(zhuǎn)化過程、整合過程等。
2 數(shù)據(jù)挖掘技術(shù)的計算機網(wǎng)絡(luò)病毒防御技術(shù)
近年來,隨著人們對數(shù)據(jù)挖掘技術(shù)研究的深入,人們將其用于保障計算機信息安全中,即防御計算機網(wǎng)絡(luò)病毒。
(一)數(shù)據(jù)挖掘技術(shù)的構(gòu)成分析
計算機網(wǎng)絡(luò)病毒發(fā)展迅速,嚴重威脅計算機信息安全。在計算機網(wǎng)絡(luò)病毒進行傳播時,通過對有關(guān)數(shù)據(jù)進行掃描,比如系統(tǒng)數(shù)據(jù)、網(wǎng)絡(luò)用戶數(shù)據(jù),可以為數(shù)據(jù)挖掘技術(shù)提供依據(jù)。在計算網(wǎng)絡(luò)病毒防御中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用過程比較復(fù)雜,涉及的步驟也比較繁雜,為了有效掌握每個環(huán)節(jié)的特征,需要進行分模塊分析研究,包括預(yù)處理模塊、數(shù)據(jù)挖掘模塊等。
從數(shù)據(jù)挖掘技術(shù)的構(gòu)成來看,主要包括以下幾個成分:(1)數(shù)據(jù)預(yù)處理模塊,它主要是借助數(shù)據(jù)預(yù)處理模塊,可以對數(shù)據(jù)挖掘、分析操作進行簡化,并且還能整體提高數(shù)據(jù)挖掘效果,確保其準確度、辨識度。具體來講,其操作流程如下:完成數(shù)據(jù)收集后,對數(shù)據(jù)進行導(dǎo)入處理,將其傳輸?shù)筋A(yù)處理模塊,對數(shù)據(jù)進行分析、歸類,并且使其轉(zhuǎn)變成可被系統(tǒng)識別、處理的內(nèi)容,然后以數(shù)據(jù)包(比如目標(biāo)IP地址、端口信息等)所包含的信息為依據(jù),事實相關(guān)流程。(2)決策模塊,它主要是通過對數(shù)據(jù)的挖掘來構(gòu)建數(shù)據(jù)庫,實施匹配處理,并且將數(shù)據(jù)庫與關(guān)聯(lián)庫二者聯(lián)系起來,若二者之間出現(xiàn)高度聯(lián)系的信息,則提示可能感染計算機病毒。(3)數(shù)據(jù)收集模塊,它通過抓取、收集計算機網(wǎng)絡(luò)中的數(shù)據(jù)包,實現(xiàn)對數(shù)據(jù)信息的收集。通常情況下,當(dāng)數(shù)據(jù)信息被收集后,就會獲取比較重要的功能信息。(4)數(shù)據(jù)挖掘模塊,它是數(shù)據(jù)挖掘技術(shù)中最核心的部分。在數(shù)據(jù)挖掘模塊中,同樣包含多個部位,但比較關(guān)鍵的是事件庫和數(shù)據(jù)庫挖掘算法。通過數(shù)據(jù)挖掘,可以獲取較為準確的數(shù)據(jù)結(jié)構(gòu)。(5)規(guī)則庫模塊,它的作用在于幫助優(yōu)化數(shù)據(jù)挖掘信息庫。若網(wǎng)絡(luò)病毒出現(xiàn)在計算機系統(tǒng)中,啟動規(guī)則庫模塊,可以分析、識別數(shù)據(jù)信息。當(dāng)然,在實際的運行中,在數(shù)據(jù)挖掘時,網(wǎng)絡(luò)病毒屬性的獲取規(guī)則會被改變或調(diào)整,并且還會將其保留、使用于數(shù)據(jù)挖掘中,從而協(xié)助計算機系統(tǒng),分析潛在的網(wǎng)絡(luò)病毒。
(二)計算機網(wǎng)絡(luò)病毒防御系統(tǒng)分析
以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ)的計算機網(wǎng)絡(luò)病毒防御系統(tǒng)中,其主要包括三個主要的操作過程中,即關(guān)聯(lián)規(guī)則、聚類、分類。
(1)關(guān)聯(lián)規(guī)則分析
它指的是在同一類別的數(shù)據(jù)中,存在可以被發(fā)現(xiàn)的知識,以≥2個變量為對象,實施取值處理,若結(jié)果顯示數(shù)據(jù)存在一定的規(guī)律,則提示數(shù)據(jù)之間具有某種關(guān)聯(lián)。在數(shù)據(jù)挖掘技術(shù)中,主要的幾種關(guān)聯(lián)關(guān)系包括:簡單關(guān)聯(lián)、及時序關(guān)聯(lián)、因果關(guān)聯(lián)。在計算機網(wǎng)絡(luò)病毒防御中,要想找到數(shù)據(jù)庫中的關(guān)聯(lián)網(wǎng),關(guān)聯(lián)分析這一環(huán)節(jié)必不可少。
(2)聚類分析
在數(shù)據(jù)挖掘技術(shù)中,聚類操作同樣發(fā)揮著不可取代的作用,它主要是根據(jù)數(shù)據(jù)的不同類別、特點,分解所獲取到的數(shù)據(jù)信息。當(dāng)完成系統(tǒng)中所有數(shù)據(jù)的聚類操作后,就可以有效了解系統(tǒng)中數(shù)據(jù)分布的情況,主要是疏密情況,這樣一來,一方面,它可以呈現(xiàn)出組與組之間數(shù)據(jù)存在的關(guān)系;另一方面,還能體現(xiàn)出全局的分布模式。
(3)分類分析
所謂分類分析,它指的是對個體進行分類、歸類處理,使其處于預(yù)先設(shè)定的類別當(dāng)中。該操作的主要目的是利用多種機器學(xué)習(xí)方法、統(tǒng)計方法,并且采用相關(guān)計算機處理技術(shù),建立數(shù)據(jù)的分類模型,然后以數(shù)據(jù)庫中存在的數(shù)據(jù)為對象,實施分類出來,并以此為依據(jù),對其他數(shù)據(jù)進行分析、歸類處理。
3 結(jié)語
綜上所述,在互聯(lián)網(wǎng)的發(fā)展是一把雙刃劍,既給人們的生產(chǎn)、生活帶來極大便利,同時也給用戶的計算機信息安全帶來嚴重威脅。
參考文獻:
[1]王娜.數(shù)據(jù)挖掘技術(shù)在計算機網(wǎng)絡(luò)病毒防御中的應(yīng)用分析[J].計算機光盤軟件與應(yīng)用,2013(08):155,157.
[2]李英杰.數(shù)據(jù)挖掘技術(shù)的計算機網(wǎng)絡(luò)病毒防御技術(shù)研究[J].電腦知識與技術(shù),2015(02):1-2.