潘曉君
(安徽工商職業(yè)學(xué)院 信息工程學(xué)院,安徽 合肥 231100)
遺傳算法(Genetic Algorithm,GA)是模擬生物進(jìn)化的計(jì)算模型,是一種依據(jù)模擬自然生物進(jìn)化過程搜索近似解的算法.它是參照優(yōu)勝劣汰的原理,利用遺傳算子進(jìn)行變異和組合交叉等相關(guān)操作來產(chǎn)生出最新解集的種群,逐步演化得出最優(yōu)解[1].
粒子群(Particle Swarm Optimization,PSO)算法是一種進(jìn)化優(yōu)化算法,它是依據(jù)隨機(jī)解,通過不斷的迭代操作來尋找最優(yōu)解.相對(duì)于遺傳算法,它的操作更為簡單.雖然它也是按照適應(yīng)度來評(píng)價(jià)目標(biāo)解,但它沒有遺傳算法的一些相關(guān)操作,諸如交叉與變異,它是根據(jù)當(dāng)前搜索到的最優(yōu)解來搜尋全局最優(yōu)解[2-4].該算法具有收斂速度快、精度高等優(yōu)點(diǎn),在實(shí)際應(yīng)用中優(yōu)越性不斷凸顯[5,6].
入侵特征是否選中用0和1這兩個(gè)二進(jìn)制碼元來表示,如果特征未被選中就用0表示,特征被選中則用1表示.具體的網(wǎng)絡(luò)入侵特征碼數(shù)學(xué)模型定義如式子(1)所示:
(1)
其中,p表入侵特征維數(shù).如果希望進(jìn)一步提高入侵檢測的精準(zhǔn)率,就需要使相應(yīng)的特征維數(shù)盡可能的少.
為了使入侵特征維數(shù)盡可能少,最大程度提高入侵檢測的效率,這里的特征適應(yīng)度函數(shù)定義為
圖1 遺傳粒子群融合算法流程圖
(2)
其中,wa代表入侵特征數(shù)量的權(quán)重值,Nf表示入侵特征的總數(shù),R代表入侵檢測正確率,wf代表入侵狀態(tài)權(quán)重,fi代表入侵特征狀態(tài)選擇,于是有關(guān)系式
(3)
遺傳算法與粒子群算法雖然都有各自的優(yōu)點(diǎn),但同時(shí)也都存在一些缺陷,它們都是一種基于群體的演化計(jì)算技術(shù).遺傳算法具有很強(qiáng)的全局搜索能力,但局部的搜索能力較差,很難得到全局最優(yōu)解;而粒子群算法求解問題的速度是比較快,但很容易陷入局部最優(yōu).正是由于這兩種算法有著優(yōu)勢互補(bǔ)的特性,本文將它們結(jié)合起來,以此來獲得全局最優(yōu)解,算法流程如圖1所示.
為了檢測遺傳粒子群融合算法的性能,本文的實(shí)驗(yàn)平臺(tái)是基于Windows 7系統(tǒng),利用Matlab編程,選擇 KDD數(shù)據(jù)集進(jìn)行仿真.該KDD數(shù)據(jù)集除了包括4 種基本的入侵方式,分別為:未授權(quán)使用本地超級(jí)權(quán)限訪問攻擊(U2L); 掃描攻擊(Probe);遠(yuǎn)程用戶未授權(quán)訪問攻擊(U2R);拒絕服務(wù)攻擊( DOS),還包括未受攻擊的數(shù)據(jù)樣本集(Unassailed).具體的數(shù)據(jù)樣本分布情況如表1所示.
利用遺傳算法(GA)、粒子群算法(PSO)以及遺傳粒子群融合算法(GA-PSO)對(duì)網(wǎng)絡(luò)數(shù)據(jù)特征進(jìn)行抉擇,得到的最優(yōu)解如表2所示.從表中可以看出,入侵特征庫中存在大量冗余的數(shù)據(jù),利/用遺傳粒子群融合算法對(duì)其中的特征進(jìn)行最優(yōu)抉擇,可以大大減少這些冗余特征;特征數(shù)據(jù)的維數(shù)也大幅度減少,進(jìn)一步提高了入侵檢測的效率.
表1 數(shù)據(jù)樣本分布
表2 三種算法選擇的網(wǎng)絡(luò)特征維數(shù)
三種算法的入侵檢測結(jié)果如圖 2、圖3、圖4所示,經(jīng)過對(duì)比分析可以得出以下結(jié)論:
(1) 相對(duì)于遺傳算法和粒子群算法來說,遺傳粒子群融合算法的檢測時(shí)間大幅度減少,主要是因?yàn)檫z傳粒子群融合算法的特征子集的維數(shù)少于前兩種算法,也就使得它的訓(xùn)練時(shí)間大幅度減少,提高了網(wǎng)絡(luò)入侵檢測的速度.
(2) 遺傳算法和粒子群算法就其本身來說,很難在全局范圍內(nèi)找到最優(yōu)解.然而遺傳粒子群融合算法能較好提高網(wǎng)絡(luò)入侵檢測的正確率,漏報(bào)率、誤報(bào)率則相應(yīng)的大幅降低,該算法較好融合了遺傳算法和粒子群算法各自的優(yōu)點(diǎn).
圖2 檢測率比較
圖3 漏報(bào)率比較
圖4 誤報(bào)率比較
當(dāng)前,許多網(wǎng)絡(luò)入侵檢測系統(tǒng)都存在著大量冗余無效的特征,而且特征維數(shù)相當(dāng)高,致使入侵檢測的效率非常低.針對(duì)這種情況,本文結(jié)合遺傳算法和粒子群算法的優(yōu)點(diǎn),并將這兩種算法相互融合,以此來提高入侵檢測的精準(zhǔn)率.實(shí)驗(yàn)結(jié)果表明,該融合模型不僅可以大大減少無效的冗余特征,而且可以在最大程度上提高網(wǎng)絡(luò)入侵檢測的效率.
[1] 孟 軍,史貫麗.融合粒子群優(yōu)化和遺傳算法的基因調(diào)控網(wǎng)絡(luò)構(gòu)建[J].計(jì)算機(jī)應(yīng)用,2016,36(11):2 969-2 973.
[2] 劉春燕,楊巍巍.云計(jì)算基于遺傳粒子群算法的多目標(biāo)任務(wù)調(diào)度[J].計(jì)算機(jī)技術(shù)與發(fā)展,2017,27(2):56-59.
[3] 林海波, 柯晶晶,張 毅.結(jié)合粒子群尋優(yōu)與遺傳重采樣的RBPF算法[J].計(jì)算機(jī)工程,2016,42(11):295-299.
[4] 王 波,張曉磊.基于粒子群遺傳算法的云計(jì)算任務(wù)調(diào)度研究[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(6):84-88.
[5] 張 陶,于 炯, 楊興耀,等.基于改進(jìn)粒子群算法的云計(jì)算任務(wù)調(diào)度算法[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(19):68-72.
[6] 李 歡,虞慧群.云計(jì)算中基于進(jìn)化算法的任務(wù)調(diào)度策略[J].華東理工大學(xué)學(xué)報(bào):自然科學(xué)版,2015,41(4):556-562.