(安徽三聯(lián)學(xué)院計(jì)算機(jī)工程學(xué)院 安徽 合肥 230601)
互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,使其逐漸滲透至各個(gè)領(lǐng)域之中,尤其是在數(shù)據(jù)采集、處理與傳輸?shù)确矫妫ヂ?lián)網(wǎng)技術(shù)具有其他技術(shù)所無(wú)比擬的應(yīng)用優(yōu)勢(shì)。隨著互聯(lián)網(wǎng)技術(shù)在各個(gè)領(lǐng)域中的普及與應(yīng)用,互聯(lián)網(wǎng)安全問(wèn)題也已成為民眾關(guān)注的焦點(diǎn),而校園作為教書(shū)育人的重要場(chǎng)所,其校園安全更應(yīng)得到人們的重視。如何在校園中建立健全而完善的網(wǎng)絡(luò)安全保護(hù)機(jī)制,防范校園中重要數(shù)據(jù)的丟失與竊取,需要校園予以高度的重視。而機(jī)器學(xué)習(xí)在校園安全中更是發(fā)揮著至關(guān)重要的作用。
機(jī)器學(xué)習(xí)是人工智能技術(shù)中的核心內(nèi)容,其能夠?qū)θ祟愋袨檫M(jìn)行有效模擬,學(xué)習(xí)人類的行為來(lái)賦予計(jì)算機(jī)更多地功能,豐富計(jì)算機(jī)的數(shù)據(jù)庫(kù),使計(jì)算機(jī)變得更加智能,從而優(yōu)化計(jì)算機(jī)的結(jié)構(gòu)性能。機(jī)器學(xué)習(xí)可以看作是一種智能化的處理過(guò)程,其能夠使機(jī)器像人類一樣進(jìn)行學(xué)習(xí),但其是怎樣學(xué)習(xí)的呢,對(duì)于這一點(diǎn),許多學(xué)者都從不同角度進(jìn)行了研究,并且至今尚未形成一個(gè)統(tǒng)一的意見(jiàn)。不過(guò),總體來(lái)說(shuō),機(jī)器學(xué)習(xí)和推理過(guò)程之間具有十分密切的聯(lián)系,這也得到了許多專家和學(xué)者的肯定與認(rèn)同,因此,對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),可按照其策略性的不同將其劃分為以下幾類,包括事例學(xué)習(xí)、機(jī)械學(xué)習(xí)、類比學(xué)習(xí)以及傳授學(xué)習(xí)等,考慮到計(jì)算機(jī)有著復(fù)雜的功能,因此對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),其所涵蓋的范圍也比較廣泛,通過(guò)不同知識(shí)、不同技術(shù)的結(jié)合運(yùn)用,從而使機(jī)器具有學(xué)習(xí)能力,在這些知識(shí)和技術(shù)中,概率論、算法復(fù)雜度理論、凸分析以及統(tǒng)計(jì)學(xué)等都是機(jī)器學(xué)習(xí)所涉及到的專業(yè)學(xué)科,按照機(jī)器學(xué)習(xí)的類別,大致可將其劃分成五種,第一種是根據(jù)學(xué)習(xí)策略來(lái)進(jìn)行分類,如類比學(xué)習(xí)、歸納學(xué)習(xí)、示教學(xué)習(xí)、機(jī)械學(xué)習(xí)等,第二種是根據(jù)獲取到的知識(shí)來(lái)進(jìn)行分類,例如決策樹(shù)、形式邏輯表達(dá)式、過(guò)程編碼、產(chǎn)生式規(guī)則,計(jì)算機(jī)程序、代數(shù)表達(dá)式參數(shù)等,第三種是根據(jù)機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域來(lái)進(jìn)行分類,例如數(shù)據(jù)挖掘、自然語(yǔ)言、信息服務(wù)、專家系統(tǒng)等都是機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域,第四種是綜合性分類,例如遺傳算法、歸納學(xué)習(xí)、增強(qiáng)學(xué)習(xí)等都屬于綜合性分類,第五種是按照學(xué)習(xí)形式來(lái)進(jìn)行分類,例如監(jiān)督與非監(jiān)督式學(xué)習(xí)便是以學(xué)習(xí)形式來(lái)分類的。
面對(duì)校園網(wǎng)絡(luò)安全形勢(shì)愈發(fā)嚴(yán)峻的現(xiàn)狀,為了進(jìn)行有效應(yīng)對(duì),防止校園網(wǎng)絡(luò)安全問(wèn)題的頻繁發(fā)生,就必須要在計(jì)算機(jī)中應(yīng)用相應(yīng)的安全防護(hù)技術(shù),這對(duì)于確保校園安全具有非常重要的意義。機(jī)器學(xué)習(xí)是校園安全中的核心技術(shù)之一,其能夠有效保護(hù)校園網(wǎng)絡(luò)不會(huì)遭受到惡意攻擊,由于機(jī)器學(xué)習(xí)能力直接決定著校園網(wǎng)絡(luò)系統(tǒng)的安全防護(hù)能力,因此在應(yīng)用機(jī)器學(xué)習(xí)來(lái)對(duì)校園網(wǎng)絡(luò)進(jìn)行安全檢測(cè)時(shí),其功能模塊主要分為數(shù)據(jù)采集模塊、數(shù)據(jù)處理模塊和機(jī)器學(xué)習(xí)模塊,在此過(guò)程中,機(jī)器學(xué)習(xí)模塊在其中發(fā)揮著至關(guān)重要的作用,數(shù)據(jù)采集模塊能夠?qū)π@網(wǎng)絡(luò)的安全情況進(jìn)行實(shí)時(shí)動(dòng)態(tài)的追蹤與檢測(cè),判斷外部網(wǎng)絡(luò)中是否存在惡意信息或惡意攻擊,并通過(guò)TCP/IP來(lái)對(duì)網(wǎng)絡(luò)信息進(jìn)行截取與判斷,這也是大部分校園在網(wǎng)絡(luò)安全檢測(cè)中的基礎(chǔ)技術(shù)。數(shù)據(jù)處理模塊則能夠?qū)?shù)據(jù)采集模塊所截取到的信息進(jìn)行相應(yīng)的處理,使截取信息中含有的重復(fù)數(shù)據(jù)與錯(cuò)誤信息得到有效的過(guò)濾和篩選,以此確保校園網(wǎng)絡(luò)系統(tǒng)的運(yùn)行高效性,確保安全檢測(cè)功能的完善。對(duì)于機(jī)器學(xué)習(xí)模塊,其也是校園安全檢測(cè)系統(tǒng)中的核心模塊,該模塊發(fā)揮著至關(guān)重要的功能,通過(guò)該模塊可記憶和學(xué)習(xí)入侵與攻擊,從而實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)攻擊和非法入侵進(jìn)行有效檢測(cè)的目的。在校園安全檢測(cè)系統(tǒng)中,其主要由五個(gè)組成部分組成,分別是數(shù)據(jù)源、數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、機(jī)器學(xué)習(xí)和處理結(jié)果反饋。無(wú)論是在數(shù)據(jù)處理,還是在數(shù)據(jù)反饋,機(jī)器學(xué)習(xí)都表現(xiàn)出良好的兼容性,而且在安全檢測(cè)中有著巨大的應(yīng)用潛力,這也使機(jī)器學(xué)習(xí)成為校園網(wǎng)絡(luò)安全防護(hù)中的核心技術(shù),并得到了迅猛的發(fā)展。
在校園安全檢測(cè)中,決策樹(shù)作為機(jī)器學(xué)習(xí)中的一種關(guān)鍵應(yīng)用算法,其有著廣泛的使用范圍,并且應(yīng)用效果較好,并在校園安全檢測(cè)中得到了廣泛的應(yīng)用。以決策樹(shù)為核心算法的機(jī)器學(xué)習(xí),可使網(wǎng)絡(luò)中的惡意信息被有效攔截,然后以從根節(jié)點(diǎn)至葉子節(jié)點(diǎn)的原則來(lái)排列惡意信息,使其成為一個(gè)二叉樹(shù)式,對(duì)于后續(xù)可能產(chǎn)生的網(wǎng)絡(luò)入侵,可通過(guò)分支葉子節(jié)點(diǎn)來(lái)與之進(jìn)行逐一對(duì)應(yīng)。當(dāng)校園網(wǎng)絡(luò)受到攻擊或入侵時(shí),機(jī)器學(xué)習(xí)可評(píng)測(cè)入侵或攻擊的形式特征,掌握其后續(xù)發(fā)展,然后結(jié)合校園網(wǎng)絡(luò)的實(shí)際安全情況來(lái)測(cè)試節(jié)點(diǎn)的屬性,并將節(jié)點(diǎn)當(dāng)作根來(lái)進(jìn)行子樹(shù)重復(fù)。對(duì)于決策樹(shù)算法在1986年時(shí)便已經(jīng)提及,在那個(gè)時(shí)期所提出的ID3算法和現(xiàn)代所研究出的二叉樹(shù)算法總體上是比較接近的,其都是通過(guò)節(jié)點(diǎn)運(yùn)算來(lái)進(jìn)行安全檢測(cè)的算法,不過(guò),ID3算法則屬于決策樹(shù)中一種頗具代表性和典型性的算法,不過(guò)因ID3算法在安全檢測(cè)中難以滿足其數(shù)據(jù)規(guī)格的要求,并且所面臨的數(shù)據(jù)種類多種多樣,這也使人們?cè)贗D3算法的基礎(chǔ)上研究出C4.5算法,該算法可以看成是ID3算法的另一種延續(xù),并且其更能有效用于安全檢測(cè),現(xiàn)如今在許多校園中都已開(kāi)始應(yīng)用C4.5算法來(lái)進(jìn)行網(wǎng)絡(luò)安全檢測(cè)。
在互聯(lián)網(wǎng)與現(xiàn)代化信息技術(shù)的發(fā)展下,神經(jīng)網(wǎng)絡(luò)已經(jīng)成為校園安全中一種用于安全檢測(cè)的重要技術(shù)手段,其也是所有技術(shù)中復(fù)雜性最高的一種技術(shù)。神經(jīng)網(wǎng)絡(luò)可模擬人腦的部分功能,利用運(yùn)作單元對(duì)人腦中用于處理信息的神經(jīng)元進(jìn)行代替,通過(guò)對(duì)大量的運(yùn)作單元附加高度權(quán)值,以此形成相應(yīng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),考慮到神經(jīng)網(wǎng)絡(luò)中包含著海量的運(yùn)作單元,因此在對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行構(gòu)建時(shí),需要利用權(quán)值或邏輯關(guān)系將各個(gè)運(yùn)作單元連接起來(lái),這樣在應(yīng)用神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行安全檢測(cè)時(shí),神經(jīng)網(wǎng)絡(luò)能夠快速識(shí)別和預(yù)處理校園網(wǎng)絡(luò)中存在的各類信號(hào),從而在校園網(wǎng)絡(luò)出現(xiàn)安全事件時(shí)能夠做到迅速止損?,F(xiàn)如今,神經(jīng)網(wǎng)絡(luò)已經(jīng)成為校園安全中一種直觀而有效的方法。神經(jīng)網(wǎng)絡(luò)能夠利用誤差補(bǔ)償機(jī)制來(lái)發(fā)揮其有效性,當(dāng)校園安全檢測(cè)過(guò)程中發(fā)現(xiàn)存在惡意信息時(shí),會(huì)使神經(jīng)網(wǎng)絡(luò)對(duì)信息的輸入與輸出發(fā)生失衡,此時(shí)神經(jīng)網(wǎng)絡(luò)會(huì)自動(dòng)調(diào)節(jié)和運(yùn)作各個(gè)神經(jīng)單元,使節(jié)點(diǎn)網(wǎng)絡(luò)得到及時(shí)有效的補(bǔ)充。
支持向量機(jī)可以看成是一種分類器,需要在特征空間內(nèi)探尋對(duì)應(yīng)的超平面,利用超平面來(lái)對(duì)兩個(gè)類進(jìn)行分割,同時(shí)還要確保各個(gè)類有著最大的邊緣距離。一般來(lái)說(shuō),支持向量機(jī)屬于一種二分類模型,其機(jī)器學(xué)習(xí)的策略是進(jìn)行最大間隔,從而使復(fù)雜的問(wèn)題被轉(zhuǎn)化成凸二次規(guī)劃問(wèn)題,通過(guò)求解凸二次規(guī)劃問(wèn)題來(lái)達(dá)到間接解決復(fù)雜問(wèn)題的目的。支持向量機(jī)在進(jìn)行分類時(shí)所遇到的問(wèn)題主要包括三種,分別是線性不可分問(wèn)題、近似線性可分問(wèn)題以及線性可分問(wèn)題。其中,線性不可分問(wèn)題指的是無(wú)法利用單獨(dú)的線性分類器來(lái)對(duì)單個(gè)數(shù)據(jù)集進(jìn)行分類,在應(yīng)用支持向量機(jī)來(lái)進(jìn)行機(jī)器學(xué)習(xí)時(shí),往往會(huì)經(jīng)常產(chǎn)生線性不可分問(wèn)題,例如在利用支持向量機(jī)進(jìn)行人臉識(shí)別時(shí),便是非常典型的線性不可分問(wèn)題。在應(yīng)用支持向量機(jī)來(lái)解決問(wèn)題時(shí),核函數(shù)是其常用的解決方法,通過(guò)在高維空間中對(duì)樣例特征進(jìn)行映射,可能會(huì)出現(xiàn)因映射維度過(guò)高而造成計(jì)算過(guò)于復(fù)雜,而通過(guò)使用核函數(shù),則可對(duì)樣例特征進(jìn)行映射之前,對(duì)其進(jìn)行低維計(jì)算,然后在高維上來(lái)表現(xiàn)分類效果,這樣便可使計(jì)算復(fù)雜程度得到有效簡(jiǎn)化。相比于神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),支持向量機(jī)在機(jī)器學(xué)習(xí)中能夠?qū)?fù)雜問(wèn)題用凸優(yōu)化問(wèn)題進(jìn)行表示,然后通過(guò)現(xiàn)有的算法來(lái)對(duì)凸優(yōu)化問(wèn)題的目標(biāo)函數(shù)中存在的全局最小值進(jìn)行求解。而神經(jīng)網(wǎng)絡(luò)則是通過(guò)貪心學(xué)習(xí)的方式來(lái)對(duì)局部最優(yōu)解進(jìn)行求解的。在校園安全中應(yīng)用支持向量機(jī)時(shí),即使沒(méi)有豐富的先驗(yàn)知識(shí),支持向量機(jī)也能獲得良好的分類正確率,而且其推廣能力非常強(qiáng)。所謂推廣能力,是指結(jié)合以往的經(jīng)驗(yàn)可推斷出其規(guī)律,并根據(jù)學(xué)習(xí)到的規(guī)律來(lái)預(yù)測(cè)校園網(wǎng)絡(luò)中未知行為的發(fā)展。
相比于決策樹(shù)、神經(jīng)網(wǎng)絡(luò),貝葉斯理論并不依賴于硬件系統(tǒng)的檢測(cè)性能與算法的優(yōu)劣性,貝葉斯理論的應(yīng)用效果是由推理理論和概率手段所決定的,目前在校園安全檢測(cè)中已經(jīng)普遍采用貝葉斯理論來(lái)進(jìn)行假設(shè)和推理,這也使其成為機(jī)器學(xué)習(xí)中的一種非常重要的方法,并且為不同機(jī)器學(xué)習(xí)算法在校園安全中的有效應(yīng)用提供了大量的理論依據(jù)。考慮到貝葉斯理論在邏輯性上會(huì)有著一定的寬容性,這也使貝葉斯理論能夠在校園安全形勢(shì)不確定的情況下提供可靠的理論支撐。貝葉斯理論在機(jī)器學(xué)習(xí)中是一種不需要進(jìn)行監(jiān)督的理論體系,其能夠根據(jù)已發(fā)生的安全事件來(lái)按照相應(yīng)的序列進(jìn)行排列和分析,并對(duì)已知序列采取細(xì)致的分析和類比。在現(xiàn)代化信息技術(shù)不斷發(fā)展的今天,在校園安全問(wèn)題檢測(cè)中,貝葉斯理論有著其獨(dú)特的生存依據(jù)。
機(jī)器學(xué)習(xí)在校園安全中有效應(yīng)用于校園網(wǎng)絡(luò)的安全入侵檢測(cè),機(jī)器學(xué)習(xí)在應(yīng)用過(guò)程中不會(huì)對(duì)校園網(wǎng)絡(luò)的性能造成影響,也不會(huì)影響用戶對(duì)計(jì)算機(jī)的操作與使用,其能夠分析與檢測(cè)校園網(wǎng)絡(luò)中的安全日志與運(yùn)行數(shù)據(jù)等信息,進(jìn)而分析校園網(wǎng)絡(luò)的安全狀況,判斷是否存在安全威脅,從而使校園網(wǎng)絡(luò)得到實(shí)時(shí)的安全防護(hù)。機(jī)器學(xué)習(xí)具有智能化的特點(diǎn),將其應(yīng)用于安全入侵檢測(cè)中,可大大增強(qiáng)安全入侵檢測(cè)的準(zhǔn)確率與靈敏度,從而使系統(tǒng)能夠在很短的時(shí)間內(nèi)對(duì)潛在的安全威脅進(jìn)行準(zhǔn)確的檢測(cè),并針對(duì)安全威脅的危害程度進(jìn)行有針對(duì)性的防護(hù),從而最大限度的降低惡意攻擊給校園網(wǎng)絡(luò)造成的不利影響。在校園安全入侵檢測(cè)中,人們還普遍應(yīng)用神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)系統(tǒng)的入侵檢測(cè)功能,神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的適應(yīng)性,其能夠?qū)τ脩舻南到y(tǒng)操作行為進(jìn)行實(shí)時(shí)記錄,并能夠較好的檢測(cè)出校園網(wǎng)絡(luò)所面臨的入侵種類,然后及時(shí)向安全管理人員反饋檢測(cè)結(jié)果。因神經(jīng)網(wǎng)絡(luò)不會(huì)依賴于假設(shè)的已知數(shù)據(jù)類型,這也使其往往能夠在誤用檢測(cè)中進(jìn)行應(yīng)用,并取得較為理想的應(yīng)用效果。在應(yīng)用神經(jīng)網(wǎng)絡(luò)算法進(jìn)行校園安全入侵檢測(cè)時(shí),其能夠記錄和分類用戶行為所產(chǎn)生的各種基本特征,以此判斷用戶的行為特征是否具有合法性,如果用戶的行為特征不合法,則系統(tǒng)會(huì)自動(dòng)將該操作行為判定為非法行為,然后觸發(fā)入侵檢測(cè)。神經(jīng)網(wǎng)絡(luò)正是憑借該應(yīng)用機(jī)理,使其被廣泛應(yīng)用于校園安全入侵檢測(cè)工作中。除了神經(jīng)網(wǎng)絡(luò)之外,還可通過(guò)貝葉斯理論來(lái)對(duì)校園安全入侵行為進(jìn)行檢測(cè),其甚至還可檢測(cè)到與校園安全入侵行為有關(guān)聯(lián)的其他行為或事件。貝葉斯理論在機(jī)器學(xué)習(xí)中具有非常強(qiáng)的學(xué)習(xí)能力,這也使其同樣適用于校園安全入侵檢測(cè)。
在校園安全中,機(jī)器學(xué)習(xí)也可以應(yīng)用于垃圾郵件檢測(cè),機(jī)器學(xué)習(xí)對(duì)垃圾郵件的檢測(cè)可以當(dāng)作是一種分類問(wèn)題,其可將校園中的郵件在{-1,1}中進(jìn)行整體定義,其中垃圾郵件由1來(lái)進(jìn)行表示,而非垃圾郵件則由-1進(jìn)行表示,郵件檢測(cè)主要步驟如圖1所示:
圖1 郵件檢測(cè)主要步驟
針對(duì)垃圾郵件的文本分類問(wèn)題,可借助于相應(yīng)的數(shù)值來(lái)表達(dá)垃圾郵件中含有的文本信息,從而使不同消息能夠用來(lái)表示向量,對(duì)于垃圾郵件來(lái)說(shuō),其特征值通常在不同特征向量中進(jìn)行集中表現(xiàn),并且因?yàn)闄C(jī)器學(xué)習(xí)在檢測(cè)垃圾郵件時(shí)是通過(guò)在線檢測(cè)來(lái)實(shí)現(xiàn)的,因此通過(guò)機(jī)器學(xué)習(xí)來(lái)對(duì)郵件進(jìn)行分類與識(shí)別,可使校園網(wǎng)絡(luò)在檢測(cè)垃圾郵件時(shí)的效率大幅提升,有效減少了檢測(cè)錯(cuò)誤或無(wú)法檢測(cè)的現(xiàn)象出現(xiàn)。
在校園安全中,惡意域名檢測(cè)是機(jī)器學(xué)習(xí)的核心應(yīng)用之一,對(duì)于校園網(wǎng)絡(luò)來(lái)說(shuō),其域名系統(tǒng)往往會(huì)成為黑客的攻擊對(duì)象,也可能會(huì)充當(dāng)黑客的攻擊工具。這也使域名系統(tǒng)安全成為校園安全中的重要研究熱門(mén),在以往的惡意域名檢測(cè)中,主要是通過(guò)攔截名單或惡意域名黑名單來(lái)進(jìn)行檢測(cè)的,這種檢測(cè)方法非常容易被黑客繞過(guò)。隨后,人們又研究出查詢請(qǐng)求數(shù)來(lái)進(jìn)行檢測(cè)的方法,不過(guò)該方法不僅誤報(bào)率很高,而且一旦遇到未知的異常域名,便難以將其檢測(cè)出來(lái)。目前,通過(guò)機(jī)器學(xué)習(xí)的應(yīng)用來(lái)對(duì)惡意域名檢測(cè)的相關(guān)規(guī)則進(jìn)行構(gòu)建,已經(jīng)成為我國(guó)網(wǎng)絡(luò)安全領(lǐng)域的未來(lái)發(fā)展趨勢(shì)。在校園安全中,針對(duì)惡意域名的檢測(cè)問(wèn)題,在應(yīng)用機(jī)器學(xué)習(xí)時(shí),往往會(huì)將在線模型與離線模型進(jìn)行結(jié)合使用,其將所有域名當(dāng)作訓(xùn)練數(shù)據(jù)集,然后通過(guò)離線模型來(lái)進(jìn)行訓(xùn)練,并從中提取出域名的網(wǎng)絡(luò)特征、時(shí)間特征、區(qū)域特征、TTL特征以及DNS應(yīng)答特征等,然后通過(guò)X-Means聚類算法或決策樹(shù)算法來(lái)對(duì)相應(yīng)的訓(xùn)練模型進(jìn)行構(gòu)建,并通過(guò)malwareurl.com、NortonSafeWeb等已知域名來(lái)驗(yàn)證訓(xùn)練模型,使模型中的相關(guān)參數(shù)得到有效調(diào)整。在線檢測(cè)模型可以實(shí)時(shí)分析采集的域名流量,并通過(guò)被動(dòng)域名查詢來(lái)提取對(duì)應(yīng)的域名特征,判斷域名信息是否已知,如果是已知域名,則會(huì)利用在線檢測(cè)模型來(lái)進(jìn)行繼續(xù)訓(xùn)練,如果是未知域名,則在訓(xùn)練后的分類器中進(jìn)行輸入來(lái)判別該域名,以此分析該域名是否屬于惡意域名。例如,在惡意域名檢測(cè)中,可采用X-Means聚類算法來(lái)聚類域名的區(qū)域行為特征與網(wǎng)絡(luò)特征,以此獲得域名的特征向量,根據(jù)其證據(jù)特征向量,通過(guò)決策樹(shù)來(lái)評(píng)價(jià)新域名,域名評(píng)分通過(guò){0,1}來(lái)進(jìn)行表示,其中惡意域名由0進(jìn)行表示,正常域名則用1來(lái)進(jìn)行表示。網(wǎng)絡(luò)特征是模型建立的依據(jù),針對(duì)系統(tǒng)中可能存在的新地址空間映射的惡意域名,可以從所有已知域名中對(duì)短期域名、IP地址數(shù)量、共享IP數(shù)量、域名長(zhǎng)度、訪問(wèn)比例、TTL值等行為特征進(jìn)行提取,然后通過(guò)J4.8算法對(duì)決策樹(shù)進(jìn)行構(gòu)建,如果利用C4.5算法來(lái)對(duì)決策樹(shù)進(jìn)行構(gòu)建,則需要利用開(kāi)源機(jī)器學(xué)習(xí)軟件Weka,這種檢測(cè)方式不僅不需要構(gòu)建歷史惡意數(shù)據(jù)的訓(xùn)練模型,而且數(shù)據(jù)訓(xùn)練所消耗的訓(xùn)練時(shí)間以及訓(xùn)練的數(shù)據(jù)量都相對(duì)較少,此外還不會(huì)受到較多條件的限制。
總而言之,機(jī)器學(xué)習(xí)在校園安全中發(fā)揮著至關(guān)重要的作用,其能夠顯著提高校園網(wǎng)絡(luò)的安全管理水平,在校園中有著巨大的應(yīng)用前景。校園應(yīng)進(jìn)一步加強(qiáng)機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)安全中的應(yīng)用,高度重視校園安全管理中出現(xiàn)的各種安全問(wèn)題,確保機(jī)器學(xué)習(xí)的應(yīng)用策略具有針對(duì)性,以此保障校園網(wǎng)絡(luò)安全,最大限度的防范網(wǎng)絡(luò)安全事件的發(fā)生。