国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

自動(dòng)化滲透測(cè)試技術(shù)思考與展望

2022-11-15 08:27:48楊飛周晗曹京衛(wèi)趙通吳濤中訊郵電咨詢?cè)O(shè)計(jì)院有限公司北京00048安徽理工大學(xué)安徽合肥004中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司北京000
郵電設(shè)計(jì)技術(shù) 2022年9期
關(guān)鍵詞:信息熵漏洞增益

楊飛,周晗,曹京衛(wèi),趙通,吳濤(.中訊郵電咨詢?cè)O(shè)計(jì)院有限公司,北京 00048;.安徽理工大學(xué),安徽合肥 004;.中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司,北京 000)

1 概述

互聯(lián)網(wǎng)面臨的安全威脅與日俱增,高級(jí)可持續(xù)攻擊的出現(xiàn)使得網(wǎng)絡(luò)空間的安全問題更加嚴(yán)峻,網(wǎng)絡(luò)安全防護(hù)顯得更加重要。傳統(tǒng)的網(wǎng)絡(luò)防護(hù)手段僅僅站在防御者的角度,檢測(cè)網(wǎng)絡(luò)攻擊行為[1]。

滲透測(cè)試是一種安全測(cè)試和評(píng)估的方法,能夠從攻擊者角度,發(fā)現(xiàn)目標(biāo)系統(tǒng)的安全漏洞以及釣魚攻擊等社會(huì)工程學(xué)操作的脆弱點(diǎn)[2]。滲透測(cè)試所產(chǎn)出的結(jié)果都將以報(bào)告的形式輸出,根據(jù)滲透測(cè)試報(bào)告,有針對(duì)性地對(duì)網(wǎng)絡(luò)系統(tǒng)進(jìn)行完善,提高系統(tǒng)的安全性[3]。

2 滲透測(cè)試

當(dāng)前各種威脅網(wǎng)絡(luò)安全事件頻發(fā),滲透測(cè)試越來越多地被組織和企業(yè)用于保障系統(tǒng)和服務(wù)的安全。根據(jù)滲透測(cè)試過程中人工參與程度的不同,可以將滲透測(cè)試分為傳統(tǒng)滲透測(cè)試和自動(dòng)化滲透測(cè)試。

2.1 傳統(tǒng)滲透測(cè)試

傳統(tǒng)滲透測(cè)試技術(shù),主要依賴測(cè)試人員借助滲透測(cè)試工具。測(cè)試人員需要根據(jù)自己的經(jīng)驗(yàn)利用多種方法獲取目標(biāo)系統(tǒng)信息,探索并確定脆弱點(diǎn),進(jìn)行漏洞利用和后滲透測(cè)試。最后使用報(bào)告文檔來描述滲透測(cè)試的整個(gè)流程、分析系統(tǒng)存在的風(fēng)險(xiǎn)點(diǎn)以及提供修復(fù)建議。整個(gè)過程中對(duì)測(cè)試人員的經(jīng)驗(yàn)水平有很強(qiáng)的依賴,對(duì)相關(guān)知識(shí)的掌握有很高的要求,同時(shí)滲透操作復(fù)雜繁瑣,存在大量重復(fù)的操作,需要投入較大的時(shí)間和人力成本。

2.2 自動(dòng)化滲透測(cè)試

自動(dòng)化滲透測(cè)試在一定程度上克服了傳統(tǒng)滲透測(cè)試的弊端。自動(dòng)化滲透測(cè)試在整體流程上和傳統(tǒng)滲透測(cè)試相似,不同點(diǎn)在于自動(dòng)化滲透測(cè)試能夠自動(dòng)分析目標(biāo)系統(tǒng)所在網(wǎng)絡(luò)環(huán)境,發(fā)現(xiàn)并驗(yàn)證目標(biāo)系統(tǒng)潛在的漏洞點(diǎn)和脆弱性[4]。自動(dòng)化滲透測(cè)試的出現(xiàn),將安全專家從復(fù)雜重復(fù)的勞動(dòng)中解放出來,降低了滲透測(cè)試的成本。

2.2.1 自動(dòng)化滲透測(cè)試工具

當(dāng)前的自動(dòng)化滲透領(lǐng)域,主要依賴自動(dòng)化滲透工具。滲透測(cè)試領(lǐng)域的專家針對(duì)相關(guān)技術(shù)做了充分的研究和總結(jié),開發(fā)出多款自動(dòng)化滲透測(cè)試工具和框架。

APT2是集成在Kali Linux中的一款自動(dòng)滲透測(cè)試工具集。它可以利用NMAP 進(jìn)行掃描,也可以在獲取Nexpose、Nessus 和NMAP 等工具掃描結(jié)果的基礎(chǔ)上進(jìn)行滲透測(cè)試。在滲透測(cè)試過程中,它會(huì)自動(dòng)調(diào)用Metasploit、NMAP、SNMPwalk 等工具并獲取其執(zhí)行結(jié)果,應(yīng)用到系統(tǒng)運(yùn)行過程中。還可以進(jìn)行定向化的安全配置,保護(hù)被檢測(cè)的節(jié)點(diǎn)主機(jī)安全。

AutoSploit 是一款基于Python 開發(fā)的自動(dòng)化大規(guī)模漏洞利用工具,它可以利用Shodan、Quake 或Zoomeye 等網(wǎng)絡(luò)空間搜索引擎來篩選攻擊目標(biāo),可以選擇目標(biāo)并進(jìn)行利用[7]。選定攻擊目標(biāo)后,調(diào)用Metasploit中的相關(guān)模塊實(shí)現(xiàn)漏洞利用。正常情況下,AutoSploit具備300 多種Metasploit 基礎(chǔ)攻擊模塊,能夠利用它們?cè)诟鞣N系統(tǒng)服務(wù)、Web 應(yīng)用和IDS、IPS 等應(yīng)用設(shè)施上實(shí)現(xiàn)代碼執(zhí)行。還可以通過修改相關(guān)配置文件來為系統(tǒng)增加其他攻擊模塊。

滲透測(cè)試工具的出現(xiàn),降低了滲透測(cè)試的門檻,同時(shí)提高了滲透測(cè)試的效率。但是,這些滲透工具存在如下弊端。

a)大多數(shù)自動(dòng)化滲透測(cè)試工具的爬蟲技術(shù)無法解決通用性問題。

b)無法持續(xù)進(jìn)行攻擊載荷的更新。

c)對(duì)于多種漏洞數(shù)據(jù)無法綜合利用并進(jìn)行深層次化的攻擊。

d)無法整合各個(gè)滲透測(cè)試模塊之間的數(shù)據(jù),難以保證全流程滲透測(cè)試的精準(zhǔn)性。

2.2.2 基于人工智能的自動(dòng)化滲透測(cè)試

隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的發(fā)展,人工智能技術(shù)已經(jīng)應(yīng)用于各個(gè)領(lǐng)域。智能化、自動(dòng)化是滲透測(cè)試未來的方向。

2.2.2.1 基于網(wǎng)絡(luò)信息增益的自動(dòng)化滲透測(cè)試

NIG-AP 提出了一種基于網(wǎng)絡(luò)信息增益的自動(dòng)攻擊規(guī)劃算法[5],實(shí)現(xiàn)了攻擊路徑的自主發(fā)現(xiàn)。在該算法中,將滲透測(cè)試轉(zhuǎn)換為馬爾可夫決策形式,利用網(wǎng)絡(luò)信息增益引導(dǎo)Agent選擇最合適的Actor。

NIG-AP 提出了網(wǎng)絡(luò)信息增益的概念,通過重構(gòu)強(qiáng)化學(xué)習(xí)模型,根據(jù)網(wǎng)絡(luò)信息增益來指導(dǎo)攻擊路徑的發(fā)現(xiàn),不需要先驗(yàn)證網(wǎng)絡(luò)結(jié)構(gòu)、軟件配置等相關(guān)信息就可以發(fā)現(xiàn)攻擊路徑,提取滲透測(cè)試中必不可少的滲透信息。

a)網(wǎng)絡(luò)信息增益。滲透測(cè)試以攻擊者的角度,所采取使目標(biāo)網(wǎng)絡(luò)的信息熵最大化的行動(dòng),該信息熵由目標(biāo)主機(jī)系統(tǒng)信息熵和網(wǎng)絡(luò)環(huán)境信息熵2 個(gè)部分組成[6]。其計(jì)算公式如下:

在給定的網(wǎng)絡(luò)信息熵的情況下,采用網(wǎng)絡(luò)信息增益作為評(píng)價(jià)Agent行為的信號(hào)[7],其公式為:

H(Pbefore)為Action 前的網(wǎng)絡(luò)信息熵,H(Pafter)為Action 后的網(wǎng)絡(luò)信息熵。網(wǎng)絡(luò)信息增益會(huì)有3 種情況。

(a)在對(duì)目標(biāo)主機(jī)進(jìn)行操作系統(tǒng)識(shí)別,端口掃描等行為之后,不確定性并沒有消除,此時(shí)信息增益是2個(gè)概率分布的差值。

(b)目標(biāo)主機(jī)在Action 后被控制,信息增益是行動(dòng)前狀態(tài)的信息熵。

(c)Action 對(duì)目標(biāo)主機(jī)的狀態(tài)沒有影響,且Action后概率分布相同,此時(shí)信息增益為0。

b)深度強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種形式,目標(biāo)是Agent與Environment的交互中,根據(jù)積累的Reward,尋找最優(yōu)的決策序列[8],NIG-AP 將深度神經(jīng)網(wǎng)絡(luò)納入強(qiáng)化學(xué)習(xí),使之變成深度強(qiáng)化學(xué)習(xí)(DRL)[9],其網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。Action 的獎(jiǎng)勵(lì)由信息增益和行動(dòng)成本2個(gè)部分組成。相對(duì)于原來的恒定獎(jiǎng)勵(lì),信息增益更加靈活,用于引導(dǎo)Agent 選擇更好的Action,從而獲得更多的累積獎(jiǎng)勵(lì)。設(shè)置行動(dòng)成本是為了限制動(dòng)作的數(shù)量,避免出現(xiàn)無限循環(huán),同時(shí)為了引導(dǎo)Agent找到盡可能好的攻擊路徑。

圖1 深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)圖

c)基于網(wǎng)絡(luò)信息增益的自動(dòng)攻擊規(guī)劃算法。滲透測(cè)試過程可以看作馬爾科夫決策(Markov Decision Process,MDP)的過程。不同的策略會(huì)得到不同的獎(jiǎng)勵(lì),MDP 的目標(biāo)是找到使得累積獎(jiǎng)勵(lì)最大的最佳策略。

設(shè)定主機(jī)集合來保存檢測(cè)到的主機(jī),當(dāng)集合為空或Agent選擇的Action對(duì)信息獲取沒有影響時(shí),會(huì)通過掃描來發(fā)現(xiàn)新的可用主機(jī)。當(dāng)存在多個(gè)影響信息收益的Action時(shí),會(huì)選擇對(duì)累積收益貢獻(xiàn)最大的行為,采用蒙特卡羅方法來估計(jì)訓(xùn)練階段的狀態(tài)轉(zhuǎn)移概率。

2.2.2.2 Deep Exploit

Deep Exploit 是一款基于強(qiáng)化學(xué)習(xí)的自動(dòng)化滲透框架,其底層調(diào)用Metasploit 執(zhí)行滲透測(cè)試,采用強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)技術(shù)來提升滲透成功率及效率,實(shí)現(xiàn)了高度自動(dòng)化的滲透測(cè)試。Deep Exploit與Metasploit之間通過RPC協(xié)議通信,通過RPC接口發(fā)送指令,接收結(jié)果。

A3C(Asynchronous Advantage Actor-critic)是針對(duì)Actor-Critic 算法的優(yōu)化算法[10],引入多線程的處理方式,在每個(gè)線程中和環(huán)境進(jìn)行交互學(xué)習(xí),把每個(gè)線程的學(xué)習(xí)結(jié)果匯總并保存,定期地利用學(xué)習(xí)結(jié)果指導(dǎo)后續(xù)和環(huán)境的交互學(xué)習(xí)。Deep Exploit 的關(guān)鍵在于A3C算法,由訓(xùn)練和測(cè)試2個(gè)部分組成。

在訓(xùn)練階段,Deep Exploit 先進(jìn)行狀態(tài)空間的初始化,獲取可利用模塊列表,從中隨機(jī)選擇一個(gè)模塊。確定狀態(tài)后,A3C 算法會(huì)計(jì)算每個(gè)payload 的概率并選擇概率最大的payload,調(diào)用Metasploit 進(jìn)行漏洞利用。若失敗,會(huì)隨機(jī)更換target 并選擇針對(duì)該target 的概率最大的payload 進(jìn)行漏洞利用。若達(dá)到預(yù)先設(shè)定的次數(shù)仍未成功,Deep Exploit 會(huì)重新初始化狀態(tài)空間,選擇其他的模塊進(jìn)行嘗試。

在測(cè)試階段,Deep Exploit 會(huì)計(jì)算每個(gè)狀態(tài)空間中payload 的概率,按照payload 概率的大小,依次調(diào)用Metasploit 嘗試漏洞利用,成功之后,則進(jìn)行后滲透攻擊。

2.2.2.3 AutoPentest-DRL

AutoPentest-DRL 是一款自動(dòng)化滲透測(cè)試框架,核心思想是利用深度強(qiáng)化學(xué)習(xí)模型(DRL)智能規(guī)劃攻擊路徑,并調(diào)用其他滲透工具實(shí)現(xiàn)自動(dòng)化滲透測(cè)試。通過構(gòu)建DQN 決策引擎來根據(jù)目標(biāo)網(wǎng)絡(luò)環(huán)境和漏洞信息選擇正確的攻擊路徑。決策引擎接收攻擊樹的矩陣表示,輸出可行性最高的攻擊路徑。通過拓?fù)渖善鲃?chuàng)建網(wǎng)絡(luò)拓?fù)洌糜谔岣吣P偷倪m應(yīng)性,同時(shí)利用深度優(yōu)先搜索(DFS)算法簡(jiǎn)化輸入矩陣。

a)攻擊樹。AutoPentest-DRL 利用開源工具M(jìn)ul-VAL 生成攻擊樹。根據(jù)利用互聯(lián)網(wǎng)設(shè)備搜索引擎Shodan 建立的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),找到所有的攻擊路徑,并根據(jù)所發(fā)現(xiàn)的攻擊路徑構(gòu)建攻擊路徑矩陣,然后利用深度優(yōu)先搜索(DFS)算法優(yōu)化攻擊路徑矩陣。

b)DQN。DQN(Deep Q-learning)是Q-learning 的進(jìn)階版,是將強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)結(jié)合的產(chǎn)物,使用經(jīng)歷回放來實(shí)現(xiàn)損失函數(shù)?的收斂:

DQN網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

圖2 DQN模型的網(wǎng)絡(luò)結(jié)構(gòu)

AutoPentest-DRL 中,通過DQN 的訓(xùn)練得到?jīng)Q策模型,用來選擇可行性最大的攻擊路徑。模型的輸入為經(jīng)過深度優(yōu)先搜索(DFS)算法優(yōu)化的攻擊路徑矩陣,輸出為針對(duì)該目標(biāo)的最佳攻擊路徑。在訓(xùn)練過程中,每個(gè)攻擊者對(duì)應(yīng)DQN 中的一個(gè)Agent,攻擊者在攻擊矩陣中實(shí)現(xiàn)狀態(tài)轉(zhuǎn)移,最終達(dá)到攻擊樹的根節(jié)點(diǎn)。

3 傳統(tǒng)滲透測(cè)試與自動(dòng)化滲透測(cè)試對(duì)比

綜合上述傳統(tǒng)滲透測(cè)試和自動(dòng)化滲透測(cè)試,二者對(duì)比如表1所示。

表1 傳統(tǒng)滲透測(cè)試和自動(dòng)化滲透測(cè)試對(duì)比

4 自動(dòng)化滲透測(cè)試的總結(jié)和展望

傳統(tǒng)滲透測(cè)試需要滲透測(cè)試人員具備各方面的專業(yè)知識(shí)、熟悉漏洞機(jī)理、熟練運(yùn)用各種安全測(cè)試工具。因此,要擺脫滲透測(cè)試對(duì)人工的依賴,需要不斷推進(jìn)自動(dòng)化滲透測(cè)試技術(shù)的發(fā)展。

隨著人工智能技術(shù)的發(fā)展,會(huì)有更多更成熟的人工智能算法應(yīng)用到滲透測(cè)試的各個(gè)階段中?;跈C(jī)器學(xué)習(xí)和深度學(xué)習(xí)的指紋識(shí)別,智能識(shí)別測(cè)試目標(biāo)的端口服務(wù)、中間件、主機(jī)操作系統(tǒng)等指紋信息,能夠有效地提高滲透的效率;在滲透攻擊階段,通過知識(shí)推理,根據(jù)目標(biāo)的網(wǎng)絡(luò)環(huán)境,智能化選擇攻擊目標(biāo),優(yōu)先攻擊具備高滲透價(jià)值的目標(biāo),智能化選擇最合適的攻擊載荷,減少滲透嘗試的次數(shù),提高滲透測(cè)試的效率。智能化關(guān)聯(lián)漏洞挖掘過程中的漏洞,實(shí)現(xiàn)多個(gè)漏洞之間的聯(lián)合利用。針對(duì)整個(gè)滲透測(cè)試過程,通過優(yōu)先級(jí)調(diào)度算法對(duì)多線程滲透任務(wù)的各個(gè)線程進(jìn)行智能網(wǎng)絡(luò)資源分配,提高滲透效率。相信隨著人工智能技術(shù)的發(fā)展,會(huì)使得滲透測(cè)試的成功率,自動(dòng)化程度變得更高。

猜你喜歡
信息熵漏洞增益
漏洞
基于信息熵可信度的測(cè)試點(diǎn)選擇方法研究
基于增益調(diào)度與光滑切換的傾轉(zhuǎn)旋翼機(jī)最優(yōu)控制
基于單片機(jī)的程控增益放大器設(shè)計(jì)
電子制作(2019年19期)2019-11-23 08:41:36
基于Multisim10和AD603的程控增益放大器仿真研究
電子制作(2018年19期)2018-11-14 02:37:02
基于信息熵的實(shí)驗(yàn)教學(xué)量化研究
一種基于信息熵的雷達(dá)動(dòng)態(tài)自適應(yīng)選擇跟蹤方法
三明:“兩票制”堵住加價(jià)漏洞
漏洞在哪兒
基于信息熵的IITFN多屬性決策方法
新津县| 许昌县| 苗栗市| 当涂县| 阳信县| 旌德县| 长子县| 丹棱县| 福鼎市| 贺兰县| 原阳县| 兴和县| 孙吴县| 大荔县| 星子县| 镇原县| 静安区| 蓝山县| 河东区| 铜陵市| 南京市| 勃利县| 琼海市| 泸水县| 景泰县| 邯郸市| 大厂| 香格里拉县| 保山市| 夏邑县| 南康市| 海兴县| 施秉县| 光泽县| 长阳| 青浦区| 渭南市| 新乡市| 绵阳市| 拉萨市| 涪陵区|