王巖雪 孫大躍
摘? 要: 針對(duì)常規(guī)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型存在的預(yù)測(cè)精度低、收斂速度慢等問題,給出一種蟻群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,用于政務(wù)云的網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)。同時(shí),對(duì)蟻群算法的信息素更新規(guī)則進(jìn)行改進(jìn),并將改進(jìn)后的蟻群算法應(yīng)用于BP神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值的優(yōu)化,得到BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的最優(yōu)權(quán)值和閾值,并將最優(yōu)權(quán)值和閾值用于BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè)。實(shí)驗(yàn)仿真結(jié)果表明,與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)安全預(yù)測(cè)模型相比,采用優(yōu)化后的模型進(jìn)行網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)時(shí),其收斂速度和預(yù)測(cè)精度都得到了明顯的提高。
關(guān)鍵詞: 政務(wù)云; 主動(dòng)防御; BP神經(jīng)網(wǎng)絡(luò); 蟻群算法; 態(tài)勢(shì)預(yù)測(cè); 預(yù)測(cè)精度
中圖分類號(hào): TN711?34? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)21?0072?04
Research on government cloud network situation prediction
based on ant colony algorithm optimized BP neural network
WANG Yanxue, SUN Dayue
(School of Information Engineering, Changan University, Xian 710064, China)
Abstract: In view of the low prediction accuracy and slow convergence speed of the conventional BP (back propagation) neural network prediction model, an ant colony algorithm optimized BP neural network prediction model is proposed for the network security situation prediction of government cloud. Meanwhile, the pheromone update rule of ant colony algorithm is improved, and the improved ant colony algorithm is used to optimize the weight and threshold value of BP neural network to get the optimal weight and threshold value of BP neural network prediction model, and the optimal weight and threshold value are used for the BP neural network training and prediction. The results of simulation experiment show that, in comparison with the traditional BP neural network security prediction model, the convergence speed and prediction accuracy of the network security situation prediction of the optimized model are improved significantly.
Keywords: government cloud; active defense; BP neural network; ant colony optimization; situation prediction; prediction accuracy
0? 引? ?言
政務(wù)云本質(zhì)是電子政務(wù)與云計(jì)算技術(shù)結(jié)合的產(chǎn)物,它通過云計(jì)算技術(shù)整合政府的資源數(shù)據(jù),構(gòu)建一個(gè)底層基礎(chǔ)架構(gòu)平臺(tái),在該平臺(tái)上進(jìn)行政府部門各種業(yè)務(wù)辦理和服務(wù),實(shí)現(xiàn)了各個(gè)政府部門之間的數(shù)據(jù)共享,有效地促進(jìn)政府部門服務(wù)水平和效率的提高。通過制定政務(wù)云統(tǒng)一標(biāo)準(zhǔn),避免了政府機(jī)構(gòu)基礎(chǔ)化設(shè)施的重復(fù)建設(shè),解決了傳統(tǒng)電子政務(wù)存在的“信息孤島”問題[1]。由于政務(wù)云平臺(tái)是將各個(gè)政府的信息資源數(shù)據(jù)進(jìn)行集中存儲(chǔ),這種大規(guī)模的數(shù)據(jù)資源更容易成為攻擊目標(biāo),而且由于政務(wù)云平臺(tái)存儲(chǔ)的信息數(shù)據(jù)多是機(jī)密信息這一特殊性,一旦政務(wù)云平臺(tái)被黑客入侵,所造成的后果和影響是遠(yuǎn)遠(yuǎn)不可想象的,因此對(duì)政務(wù)云的安全防護(hù)顯得尤為重要。而傳統(tǒng)的網(wǎng)絡(luò)安全防護(hù)技術(shù),如防火墻、殺毒軟件等是一種被動(dòng)的防御措施,只能描述過去和當(dāng)前的網(wǎng)絡(luò)安全狀態(tài),不能對(duì)未來的網(wǎng)絡(luò)安全態(tài)勢(shì)進(jìn)行預(yù)警,因此,建立有效的網(wǎng)絡(luò)態(tài)勢(shì)預(yù)測(cè)模型,并對(duì)未來的網(wǎng)絡(luò)狀態(tài)進(jìn)行預(yù)測(cè),使得政務(wù)云平臺(tái)在面對(duì)網(wǎng)絡(luò)攻擊時(shí),可以提前做出防御措施,降低網(wǎng)絡(luò)安全隱患給人們帶來不必要的損失,對(duì)政務(wù)云平臺(tái)的安全防護(hù)有著重要意義。
網(wǎng)絡(luò)安全態(tài)勢(shì)感知是Time Bass于1999年首次提出的,它主要通過采集影響網(wǎng)絡(luò)安全的威脅因素并進(jìn)行分析,然后將這些數(shù)據(jù)通過某種評(píng)估模型進(jìn)行一系列的數(shù)學(xué)方法處理,得到網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估值,利用態(tài)勢(shì)評(píng)估值對(duì)未來網(wǎng)絡(luò)安全狀態(tài)進(jìn)行預(yù)測(cè)[2]。而對(duì)網(wǎng)絡(luò)安全態(tài)勢(shì)進(jìn)行預(yù)測(cè)是網(wǎng)絡(luò)安全態(tài)勢(shì)感知的重要環(huán)節(jié),通過對(duì)網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè),可以及時(shí)預(yù)測(cè)到網(wǎng)絡(luò)中即將發(fā)生的安全事件,以便于管理者提前做出防御措施,進(jìn)行主動(dòng)防御。當(dāng)前網(wǎng)絡(luò)安全預(yù)測(cè)模型主要包括時(shí)間序列預(yù)測(cè)、灰度預(yù)測(cè)、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)、支持向量機(jī)預(yù)測(cè)[3]。
文獻(xiàn)[4]提出了一種基于改進(jìn)的粒子群算法優(yōu)化SVM參數(shù)網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)模型,模型預(yù)測(cè)精度高,能夠很好地實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)攻擊的主動(dòng)防御。文獻(xiàn)[5]利用威脅性、脆弱性、風(fēng)險(xiǎn)性、基礎(chǔ)運(yùn)行4個(gè)網(wǎng)絡(luò)運(yùn)行安全指標(biāo)建立一個(gè)網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估體系,然后通過層次分析法對(duì)該評(píng)估體系進(jìn)行計(jì)算,得出網(wǎng)絡(luò)安全運(yùn)行狀態(tài)的綜合安全指數(shù),并利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)。
本文中針對(duì)常規(guī)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型存在的易陷入局部最優(yōu)、學(xué)習(xí)效率較慢、預(yù)測(cè)精度較低等問題[6],利用蟻群算法具有全局尋優(yōu)強(qiáng)、搜索速度快、精度高等優(yōu)點(diǎn),對(duì)BP神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化,得到蟻群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型。仿真結(jié)果顯示,優(yōu)化后的模型收斂速度和預(yù)測(cè)精度都得到了提高,可以更好地對(duì)政務(wù)云的網(wǎng)絡(luò)安全態(tài)勢(shì)進(jìn)行預(yù)測(cè),有效促進(jìn)了對(duì)政務(wù)云系統(tǒng)的網(wǎng)絡(luò)安全防護(hù)。
1? BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)是典型的前饋神經(jīng)網(wǎng)絡(luò),通常由輸入層、隱含層、輸出層構(gòu)成,如圖1所示。
由于BP神經(jīng)網(wǎng)絡(luò)具有結(jié)構(gòu)簡(jiǎn)單、泛化能力強(qiáng)、非線性映射等優(yōu)點(diǎn),經(jīng)常被用在圖像處理、預(yù)測(cè)方面。由圖1可知,BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過程包括輸入信號(hào)的前向傳遞和輸出誤差反向傳播。當(dāng)輸入信號(hào)前向傳遞時(shí),樣本數(shù)據(jù)[xi]由輸入層輸入,經(jīng)由隱含層中的神經(jīng)單元處理后,傳遞到輸出層,得到輸出層的輸出結(jié)果[y],若輸出結(jié)果[y]與最初設(shè)定的期望值之間存在誤差,而且誤差較大,則BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練過程從信號(hào)前向傳遞變?yōu)檎`差反向傳播,將存在的誤差以一定的方式由輸出層向前反向逐層傳遞,通過不斷地調(diào)整輸入層和隱含層的連接權(quán)值[wij],輸出層和隱含層的連接權(quán)值[wj1],使得輸出誤差不斷減小,當(dāng)滿足誤差要求時(shí),得到模型各個(gè)層權(quán)值的確定值,將輸入數(shù)據(jù)集輸入訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行正向傳播,得到輸出結(jié)果。
2? 蟻群優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型
2.1? 蟻群算法
蟻群算法是一種在全局尋找最優(yōu)路徑的概率型算法,它是一種基于種群的啟發(fā)式仿生進(jìn)化系統(tǒng)。在蟻群尋找食物源時(shí),各個(gè)螞蟻是通過一定范圍內(nèi)其他螞蟻在路徑上釋放的信息素濃度來選擇行走路徑,并釋放信息素,提升該路徑上的信息素量。當(dāng)某條路徑上的信息素濃度越來越高時(shí),它被選擇的概率也越來越大,經(jīng)過一段時(shí)間后,最終整個(gè)蟻群就會(huì)沿著信息素濃度最高的路徑,即最優(yōu)路徑找到食物源[7]。
2.2? 模型建立
蟻群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型算法主要由以下兩部分組成:
1) 通過蟻群算法尋找BP神經(jīng)網(wǎng)絡(luò)最優(yōu)參數(shù)組合,即全局搜索BP神經(jīng)網(wǎng)絡(luò)的輸入層和隱含層的連接權(quán)值[wij],輸出層和隱含層的連接權(quán)值[wj1],隱含層閾值[bj],輸出層閾值[b]。輸入訓(xùn)練數(shù)據(jù)集,將搜索到的權(quán)值和閾值用于BP神經(jīng)網(wǎng)絡(luò),并計(jì)算出每一組搜索到的參數(shù)組合所對(duì)應(yīng)的BP神經(jīng)網(wǎng)絡(luò)實(shí)際輸出值和期望輸出值的誤差,找到最小誤差,更新信息素。如果誤差滿足蟻群算法要求或迭代次數(shù)達(dá)到設(shè)定要求,此時(shí),所對(duì)應(yīng)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值即為最優(yōu)權(quán)值和閾值。
2) 將最優(yōu)權(quán)值和閾值作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,不斷修正BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,直到誤差滿足設(shè)定誤差或迭代次數(shù)達(dá)到最大迭代次數(shù),輸入網(wǎng)絡(luò)安全態(tài)勢(shì)值測(cè)試數(shù)據(jù)集,利用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型做網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)[8]。
蟻群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的具體步驟如下所示:
步驟1:初始化。設(shè)置BP神經(jīng)網(wǎng)絡(luò)的參數(shù),即確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),訓(xùn)練誤差[ε],學(xué)習(xí)效率[η],最大迭代次數(shù)[Nmax]。設(shè)定蟻群算法時(shí)間為[t],迭代次數(shù)為[Nt=0],信息素初始值為[τ0],每條路徑的信息素初始濃度應(yīng)為相同的值,信息素?fù)]發(fā)系數(shù)為[ρ],最大迭代次數(shù)為[Nmax]等[9]。
步驟 2:將要被優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)的參數(shù)即所有權(quán)值和閾值總個(gè)數(shù)確定為[m]個(gè),將這些參數(shù)設(shè)為[pi1≤i≤m],每一個(gè)參數(shù)都有[N]個(gè)隨機(jī)非零值,形成集合[Spi]。
步驟3:有[k]只螞蟻位于蟻穴初始位置,啟動(dòng)全部螞蟻,其中,螞蟻[a]隨機(jī)從集合[Spi]選擇某一集合中的一組權(quán)值和閾值,然后按照下面的概率公式選擇下一個(gè)集合,隨機(jī)在下一個(gè)集合中選擇一組權(quán)值和閾值,直到每只螞蟻都在[m]個(gè)集合中各選擇了一組權(quán)值和閾值組合。其中,[τjSpi]為集合[Spi]中某[j]組權(quán)值和閾值組合的信息素值。
[PaτjSpi=τjSpij=1NτjSpi] (1)
步驟4:將每只螞蟻選擇的權(quán)值和閾值作為BP神網(wǎng)絡(luò)的權(quán)值和閾值,輸入訓(xùn)練樣本,計(jì)算BP神經(jīng)網(wǎng)絡(luò)實(shí)際輸出和期望輸出的誤差[ea],其中,[ea=e-eq],[e]為實(shí)際輸出,[eq]為期望輸出,對(duì)誤差[ea]進(jìn)行排序,找到最小誤差,它所對(duì)應(yīng)的螞蟻即為最優(yōu)解。若最優(yōu)解滿足蟻群算法結(jié)束條件,則最優(yōu)解對(duì)應(yīng)BP神經(jīng)網(wǎng)絡(luò)的最佳權(quán)值和閾值組合,跳轉(zhuǎn)到步驟7,否則,進(jìn)行步驟5。
步驟5:為了使信息素的分配更加合理,對(duì)信息素的更新規(guī)則進(jìn)行改進(jìn),改進(jìn)公式為式(2)。當(dāng)所有螞蟻完成全部集合的一次循環(huán)后,按照式(2),式(3)對(duì)信息素進(jìn)行更新。
[τjSpjt+1=1-ρτjSpjt+ρΔτjSpj] (2)
[ΔτjSpj=a=1kΔτajSpj+ΔτbestjSpj] (3)
式中:[ΔτajSpj=Qea],[Q]為常數(shù),通常取1;[ΔτbestjSpj=1eabest],[eabest]為最優(yōu)解對(duì)應(yīng)的最小誤差。
步驟6:重復(fù)步驟3~步驟5,直到蟻群算法的迭代次數(shù)[Na]滿足最大迭代次數(shù),結(jié)束循環(huán)。
步驟7:將得到的權(quán)值和閾值組合,作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,不斷調(diào)整BP神經(jīng)網(wǎng)絡(luò)連接權(quán)值和閾值,直到達(dá)到所設(shè)定的誤差要求或者最大迭代次數(shù),得到最佳BP神經(jīng)網(wǎng)絡(luò)模型。