◆何堅(jiān)安
(中國(guó)移動(dòng)通信集團(tuán)廣東有限公司 廣東 510623)
信息安全防御是當(dāng)前大數(shù)據(jù)時(shí)代的一項(xiàng)關(guān)鍵工作,保證政企單位或個(gè)人信息系統(tǒng)的安全成為許多學(xué)者的研究熱點(diǎn),誕生了許多著名的信息安全公司,比如奇虎360、卡巴斯基、瑞星殺毒、江民殺毒、騰訊安全管家,一定程度上提高了信息安全防御水平。但是,當(dāng)前的網(wǎng)絡(luò)病毒和木馬多采用更加先進(jìn)的脫殼技術(shù)或雙層水印技術(shù),導(dǎo)致常規(guī)的防御系統(tǒng)無法識(shí)別病毒,不能夠提高安全防御能力,為用戶帶來了不可估量的損失。
大數(shù)據(jù)是當(dāng)前互聯(lián)網(wǎng)及數(shù)據(jù)庫(kù)等計(jì)算機(jī)技術(shù)發(fā)展到一定階段的產(chǎn)物,由于各行業(yè)開發(fā)的分布式管理系統(tǒng)運(yùn)行產(chǎn)生了海量的數(shù)據(jù)資源,因此信息系統(tǒng)進(jìn)入到大數(shù)據(jù)時(shí)代。利用大數(shù)據(jù)資源開展各類型的工作就顯得非常重要。大數(shù)據(jù)具有占用空間大、使用數(shù)據(jù)量多等特點(diǎn),目前已經(jīng)在電子商務(wù)、文檔分類、在線學(xué)習(xí)、智能旅游、列車運(yùn)行、票務(wù)管理等多領(lǐng)域得到應(yīng)用,比如在電子商務(wù)領(lǐng)域,基于海量交易大數(shù)據(jù)挖掘潛在的客戶購(gòu)買喜好,從而可以積極地為客戶推薦相同類型或相似類型的商品,還可以挖掘客戶的購(gòu)買喜好和購(gòu)買潛力。另外,人們基于大數(shù)據(jù)構(gòu)建了強(qiáng)大的信息系統(tǒng)云存儲(chǔ)平臺(tái),比如百度公司、騰訊公司、華為公司均根據(jù)時(shí)代的發(fā)展需求,構(gòu)建了云存儲(chǔ)大數(shù)據(jù)中心,比如百度云、華為云和騰訊云,利用先進(jìn)的光纖網(wǎng)絡(luò)構(gòu)建了云存儲(chǔ)架構(gòu),進(jìn)一步滿足了云時(shí)代的大數(shù)據(jù)操作需求。云存儲(chǔ)可以部署許多應(yīng)用軟件,然后為用戶推送一個(gè)云桌面,用戶登錄云桌面即可實(shí)施各類型的操作,完現(xiàn)信息加工和處理功能。云存儲(chǔ)利用了先進(jìn)的虛擬技術(shù),可以擴(kuò)展實(shí)際物理存儲(chǔ)、CPU、內(nèi)存的大小,按照用戶的需求分配資源,提高系統(tǒng)資源的利用率。云存儲(chǔ)也引入了一些先進(jìn)的算法,比如深度學(xué)習(xí)和人工智能算法等,利用這些算法可以優(yōu)化云存儲(chǔ)的實(shí)際應(yīng)用狀態(tài),比如可以根據(jù)應(yīng)用軟件的優(yōu)先級(jí)或操作頻繁度,為應(yīng)用軟件分配更多的資源。這些云存儲(chǔ)大數(shù)據(jù)平臺(tái)承載著高清視頻、網(wǎng)絡(luò)游戲、金融證券等行業(yè)數(shù)據(jù),這也是大數(shù)據(jù)時(shí)代的一個(gè)重要應(yīng)用體現(xiàn)。
隨著用戶數(shù)量的增多,信息系統(tǒng)安裝和部署的設(shè)備越來越多,因此數(shù)據(jù)信息流量非常大。信息系統(tǒng)監(jiān)控采集層需要及時(shí)采集用戶信息、設(shè)備信息和網(wǎng)絡(luò)流量信息。信息系統(tǒng)還需要將這些信息進(jìn)行處理,以便能夠提高安全分析的效率。目前,雖然信息系統(tǒng)管理人員采取了很多的措施,但是由于信息系統(tǒng)攻擊的技術(shù)正不斷發(fā)展,目前信息系統(tǒng)安全依然存在一些問題,比如作業(yè)人員無法實(shí)時(shí)掌握系統(tǒng)運(yùn)行狀態(tài),不能夠有效分析網(wǎng)絡(luò)流量狀態(tài),導(dǎo)致信息系統(tǒng)不能安全運(yùn)行。本文為了提高信息安全防御系統(tǒng)響應(yīng)能力,實(shí)現(xiàn)安全防御的智能化、主動(dòng)化,提出利用人工智能算法和大數(shù)據(jù)建立一個(gè)信息安全防御系統(tǒng),這個(gè)系統(tǒng)可以采集網(wǎng)絡(luò)數(shù)據(jù),利用人工神經(jīng)網(wǎng)絡(luò)或者其他數(shù)據(jù)挖掘算法,分析網(wǎng)絡(luò)中的數(shù)據(jù)信息,識(shí)別和預(yù)測(cè)網(wǎng)絡(luò)安全攻擊威脅,從而提高響應(yīng)速度。具體地,基于人工智能和大數(shù)據(jù)的信息安全防御系統(tǒng)包括四個(gè)功能層次,分別是網(wǎng)絡(luò)信息采集層、大數(shù)據(jù)分析層、安全防御層和防御效果評(píng)價(jià)層,如圖1 所示。
圖1 基于大數(shù)據(jù)和人工智能的信息安全防御系統(tǒng)運(yùn)行流程
信息安全防御系統(tǒng)采用先進(jìn)的大數(shù)據(jù)分析技術(shù)構(gòu)建一個(gè)完善的、動(dòng)態(tài)的和可持續(xù)改進(jìn)的深度學(xué)習(xí)模型,能夠準(zhǔn)確識(shí)別網(wǎng)絡(luò)中的病毒威脅,以便能夠及時(shí)預(yù)判網(wǎng)絡(luò)病毒的走勢(shì),及時(shí)清除網(wǎng)絡(luò)病毒[4]。該模型采用了卷積神經(jīng)網(wǎng)絡(luò),可以將學(xué)習(xí)過程劃分為六個(gè)關(guān)鍵層次,分別是輸入層、卷積層C1、池化層S1、卷積層C2、池化層S2 和全連接層,詳細(xì)學(xué)習(xí)結(jié)構(gòu)如圖2 所示。
圖2 大數(shù)據(jù)分析的關(guān)鍵算法運(yùn)行流程
輸入層的主要作用就是對(duì)原始的信息數(shù)據(jù)進(jìn)行預(yù)處理。
卷積層一般包含兩個(gè)操作,分別是特征提取和特征映射,卷積層C1 為特征提取層,C1 與輸入層神經(jīng)元連接在一起,可以獲取數(shù)據(jù)的局部特征,同時(shí)確定特征之間的相對(duì)位置關(guān)系,從而減少參數(shù)設(shè)置的數(shù)量。卷積層C2 為特征映射層,可以將數(shù)據(jù)的特征映射到一個(gè)平面上,實(shí)現(xiàn)數(shù)據(jù)特征的壓縮,過濾器對(duì)局部的信息數(shù)據(jù)進(jìn)行計(jì)算,提高卷積準(zhǔn)確度。卷積層可以采用的核函數(shù)非常多,比如Sigmoid 函數(shù),適用于網(wǎng)絡(luò)安全防御。
池化層的主要作用是用來壓縮信息數(shù)據(jù)和參數(shù)的數(shù)量,減小過擬合。在卷積層提取的木馬或病毒特征基礎(chǔ)上,池化可以計(jì)算某一個(gè)局部的卷積特征平均值,也可以計(jì)算最大值或最小值,減小卷積層特征的維數(shù),這樣就可以持續(xù)降低分類器的計(jì)算復(fù)雜度,減輕分類器的負(fù)擔(dān),也可以避免分類器過度擬合。
全連接層可以輸出分類結(jié)果,起到了一個(gè)分類器的作用,能夠?qū)⒂?xùn)練好的模型輸出出來,這樣就可以提取木馬或病毒的特征。
信息安全防御是一項(xiàng)非常復(fù)雜的、動(dòng)態(tài)的工作,傳統(tǒng)信息安全防御采用被動(dòng)模式,無法滿足大數(shù)據(jù)時(shí)代的安全防御需求。因此,本文基于大數(shù)據(jù)和深度學(xué)習(xí)提出了一個(gè)人工智能安全防御模型,構(gòu)建一個(gè)防患于未然的安全防御模型,主動(dòng)發(fā)現(xiàn)信息系統(tǒng)中的病毒或木馬特征,從而及時(shí)地將這些數(shù)據(jù)清除。未來,信息安全防御模型還可以引入效果評(píng)估模型,發(fā)現(xiàn)殺毒是否徹底,如果不徹底可以持續(xù)訓(xùn)練深度學(xué)習(xí)模型,從而提高人工智能模型的分析準(zhǔn)確度。
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2020年7期