安常青,劉玉家,王會(huì),鄭志延,喻濤,王繼龍,3
(1.清華大學(xué)網(wǎng)絡(luò)科學(xué)與網(wǎng)絡(luò)空間研究院北京信息科學(xué)與技術(shù)國(guó)家研究中心,北京 100084;2.鵬城實(shí)驗(yàn)室,廣東 深圳 518000;3.清華大學(xué)奇安信聯(lián)合研究中心,北京 100084)
全球互聯(lián)網(wǎng)的重要性日益提高,已成為人們生活各個(gè)方面所依賴(lài)的關(guān)鍵基礎(chǔ)設(shè)施之一,網(wǎng)絡(luò)的安全性是保證正常通信的基礎(chǔ)。
對(duì)于網(wǎng)絡(luò)拓?fù)?,目前區(qū)域或地區(qū)受到多方面的安全威脅。首先,各種類(lèi)型的惡意行為者針對(duì)網(wǎng)絡(luò)拓?fù)淙觞c(diǎn)破壞、攔截互聯(lián)網(wǎng)流量[1-2],通過(guò)對(duì)網(wǎng)絡(luò)進(jìn)行攻擊,實(shí)現(xiàn)各種政治、經(jīng)濟(jì)等目標(biāo)。
其次,已有研究發(fā)現(xiàn)部分區(qū)域或地區(qū)具有與互聯(lián)網(wǎng)斷開(kāi)的可能,Dyn 針對(duì)與國(guó)外互聯(lián)網(wǎng)服務(wù)提供商(ISP,Internet service provider)有直接聯(lián)系的國(guó)內(nèi)互聯(lián)網(wǎng)服務(wù)提供商進(jìn)行分析,發(fā)現(xiàn)只有30 個(gè)區(qū)域或地區(qū)沒(méi)有與全球互聯(lián)網(wǎng)脫鉤的風(fēng)險(xiǎn)。目前有專(zhuān)業(yè)的機(jī)構(gòu)進(jìn)行網(wǎng)絡(luò)斷網(wǎng)事件的監(jiān)測(cè)并實(shí)時(shí)報(bào)告,如千眼、互聯(lián)網(wǎng)健康報(bào)告。
除上述特定的惡意攻擊外,自然災(zāi)害對(duì)網(wǎng)絡(luò)設(shè)施的威脅也是巨大的[3],通常會(huì)影響特定地理區(qū)域的所有目標(biāo),即使是很發(fā)達(dá)的區(qū)域,也會(huì)由于自然災(zāi)害的原因受到影響,例如2012 年美國(guó)東海岸桑迪颶風(fēng)導(dǎo)致的斷網(wǎng)[4]。
學(xué)術(shù)界在網(wǎng)絡(luò)拓?fù)鋸椥?、安全性及抗毀性方面持續(xù)有相關(guān)研究。早期工作大致可總結(jié)為兩類(lèi),針對(duì)網(wǎng)絡(luò)拓?fù)浣2?duì)網(wǎng)絡(luò)特點(diǎn)開(kāi)展相關(guān)分析或是基于早期測(cè)量數(shù)據(jù)進(jìn)行抗毀性分析。Albert 等[5]通過(guò)隨機(jī)性刪除網(wǎng)絡(luò)節(jié)點(diǎn),分析了復(fù)雜網(wǎng)絡(luò)的錯(cuò)誤和攻擊容忍度,發(fā)現(xiàn)互聯(lián)網(wǎng)具有“意外程度的穩(wěn)健性”,甚至不切實(shí)際的高故障率也不會(huì)影響節(jié)點(diǎn)的通信能力。一些有關(guān)互聯(lián)網(wǎng)拓?fù)鋸椥缘墓ぷ鱗6]基于簡(jiǎn)化的拓?fù)鋱D,沒(méi)有加入路由策略的限制,從圖論的角度對(duì)拓?fù)溥M(jìn)行分析。
之后研究擴(kuò)展到具有路由策略的實(shí)際拓?fù)洌M(jìn)一步分析鏈路故障的位置如何影響互聯(lián)網(wǎng)。Wu 等[7]和Dolev 等[8]從破壞性角度分析網(wǎng)絡(luò)拓?fù)涞膹椥浴ombrowski 等[9]從圖論的角度分析云服務(wù)的拓?fù)溥B通性,模擬了隨機(jī)和有針對(duì)性的節(jié)點(diǎn)攻擊,并評(píng)估了云服務(wù)的相應(yīng)漏洞。Omer 等[10]提出了用于測(cè)量網(wǎng)絡(luò)彈性的模型,定義了網(wǎng)絡(luò)中斷前后的傳輸價(jià)值來(lái)衡量網(wǎng)絡(luò)的基本彈性,基于現(xiàn)有的容量和流量信息,分析光纜網(wǎng)絡(luò)的全局彈性。
學(xué)術(shù)界逐步由關(guān)注網(wǎng)絡(luò)整體變?yōu)殛P(guān)注于網(wǎng)絡(luò)中區(qū)域本身或某些重要組件的安全性。近期研究工作更多地集中在對(duì)區(qū)域整體以及區(qū)域間直連自治系統(tǒng)(AS,autonomous system)鏈路的分析,即邊界AS 鏈接。Leyba 等[11]定義國(guó)家關(guān)鍵點(diǎn)潛力(NCP,national chokepoint potential),通過(guò)NCP 評(píng)估邊界AS 在區(qū)域拓?fù)涞挠绊懥?。Alexander 研究傳輸運(yùn)營(yíng)商在區(qū)域?qū)用娴挠绊懥?,主要是每個(gè)區(qū)域中最具影響力的AS,以及那些嚴(yán)重依賴(lài)傳輸AS 的區(qū)域。CAIDA項(xiàng)目MapKit研究互聯(lián)網(wǎng)拓?fù)鋵?duì)區(qū)域/地區(qū)級(jí)連接中斷的敏感性。項(xiàng)目提案中提出構(gòu)建網(wǎng)絡(luò)的多層拓?fù)鋱D,涵蓋網(wǎng)絡(luò)層、鏈路層、物理層,識(shí)別并量化區(qū)域?qū)舻拿舾行?。針?duì)區(qū)域的拓?fù)浣Y(jié)構(gòu),上述研究并未定量分析區(qū)域的抗毀性差異。
本文主要貢獻(xiàn)如下,提出了區(qū)域抗毀性評(píng)估方法,定義了抗毀性度量,分別從內(nèi)部拓?fù)渚W(wǎng)絡(luò)和外部通信拓?fù)? 個(gè)方面對(duì)區(qū)域的抗毀性度量差異進(jìn)行評(píng)估。基于顯著性檢驗(yàn),分別從網(wǎng)絡(luò)整體水平和網(wǎng)絡(luò)特殊薄弱點(diǎn)2 個(gè)方面對(duì)抗毀性度量排名,該方法具有普適性,能給發(fā)現(xiàn)區(qū)域之間拓?fù)涞谋举|(zhì)差異。數(shù)據(jù)層面考慮到探測(cè)點(diǎn)的局限性,進(jìn)行區(qū)域之間直連鏈路預(yù)測(cè),完善拓?fù)鋽?shù)據(jù)。
本節(jié)描述本文涉及的主要定義及相應(yīng)的含義。
1) AS 抗毀性:一個(gè)事件發(fā)生后AS 與其他節(jié)點(diǎn)間通信情況的變化稱(chēng)為AS 對(duì)一個(gè)事件的抗毀性。AS針對(duì)多次破壞的抗毀性形成一維向量稱(chēng)為AS的抗毀性樣本。
2) 區(qū)域抗毀性:區(qū)域抗毀性是對(duì)區(qū)域內(nèi)AS 抗毀性的加權(quán)綜合度量。
3) 路由影響力:描述其他節(jié)點(diǎn)需要經(jīng)過(guò)該AS進(jìn)行轉(zhuǎn)發(fā)的依賴(lài)程度,即AS 在區(qū)域的路由影響。
4) 資源權(quán)重:描述節(jié)點(diǎn)在區(qū)域中持有的資源比例,即占該區(qū)域所有資源的比例。節(jié)點(diǎn)資源權(quán)重越高,被破壞后對(duì)區(qū)域的影響越大,用于量化破壞事件的影響。本文從用戶(hù)數(shù)量、域名等多個(gè)角度分析節(jié)點(diǎn)的資源權(quán)重,形成不同視角下的抗毀力評(píng)估。
6) 邊界AS:與其他區(qū)域有直接的拓?fù)滏溄印?/p>
7) 內(nèi)部AS:沒(méi)有與其他區(qū)域的直接拓?fù)滏溄印?/p>
8) 邊界AS 鏈接:不同區(qū)域邊界AS 之間的鏈接。
下面,詳細(xì)介紹節(jié)點(diǎn)抗毀性、路由影響力和區(qū)域抗毀性度量的含義和計(jì)算方法。
事件發(fā)生后AS 與其他節(jié)點(diǎn)間連通情況的變化稱(chēng)為節(jié)點(diǎn)對(duì)一次事件的抗毀性。針對(duì)多次破壞的抗毀性形成一維向量,即節(jié)點(diǎn)的抗毀性樣本,對(duì)樣本的綜合分析形成節(jié)點(diǎn)抗毀性度量。本節(jié)重點(diǎn)介紹節(jié)點(diǎn)抗毀性樣本的定義。
2.1.1 單次事件抗毀性
互聯(lián)網(wǎng)的核心是“互連”,學(xué)術(shù)界定義網(wǎng)絡(luò)破壞的度量中,常用且可解釋性好的就是連通性,可以直觀(guān)反映破壞后節(jié)點(diǎn)的通信情況。本文使用連通性來(lái)表征破壞的影響,即發(fā)生破壞性事件后,網(wǎng)絡(luò)間節(jié)點(diǎn)對(duì)的連通性變化程度。
對(duì)于區(qū)域中的某個(gè)AS,一次破壞事件可以使其與某些節(jié)點(diǎn)無(wú)法連通,而區(qū)域內(nèi)各個(gè)節(jié)點(diǎn)所持有資源的比例不同,如對(duì)于A(yíng)S 節(jié)點(diǎn),從用戶(hù)角度,擁有更多用戶(hù)的AS 資源比例更高。
破壞事件影響定義為破壞后該區(qū)域可與其連通的節(jié)點(diǎn)資源之和與該區(qū)域所有節(jié)點(diǎn)資源之和的比值,即
其中,eix表示對(duì)于節(jié)點(diǎn)i,第x次破壞事件的破壞影響;O表示區(qū)域節(jié)點(diǎn)集合;B表示這次破壞事件后可以與節(jié)點(diǎn)i通信的節(jié)點(diǎn)集合;r表示某個(gè)節(jié)點(diǎn)的資源,如用戶(hù)數(shù)量。
本節(jié)從不同角度出發(fā),實(shí)現(xiàn)了多種節(jié)點(diǎn)資源r的定義。在區(qū)域內(nèi)部,關(guān)注各個(gè)AS 節(jié)點(diǎn)的連通,在4.2.1節(jié)定義AS 節(jié)點(diǎn)的資源。在區(qū)域外部,關(guān)注各個(gè)區(qū)域之間是否連通,在4.3.1 節(jié)定義區(qū)域節(jié)點(diǎn)的資源。
2.1.2 抗毀性采樣
對(duì)于每個(gè)節(jié)點(diǎn)i,模擬破壞事件集合為[f i1,fi2,…,fim],計(jì)算節(jié)點(diǎn)i面對(duì)一次破壞事件fiq對(duì)應(yīng)的單次事件抗毀性為eiq,可以得到節(jié)點(diǎn)i的抗毀性采樣Ei=[ei1,ei2,…,eim]。
下面,只討論破壞節(jié)點(diǎn)的情況,破壞鏈接的情況類(lèi)似。區(qū)域內(nèi)節(jié)點(diǎn)數(shù)量為n,假設(shè)破壞一個(gè)節(jié)點(diǎn)的發(fā)生概率為p,則破壞x個(gè)節(jié)點(diǎn)的概率為px??偸录嗀={A1,A2,…,An},其中事件Ax為x個(gè)節(jié)點(diǎn)被同時(shí)破壞,事件Ax發(fā)生的期望為y=C(n,x)px,那么對(duì)于總事件A,所有破壞事件發(fā)生的期望為。
圖1 為y=C(n,x)px的分布。從圖1 中可以看到,首先隨著破壞數(shù)量x的增大,實(shí)際破壞事件的發(fā)生期望y也急劇增多,x=5 前就達(dá)到最高點(diǎn),之后y迅速減小。當(dāng)x≥10 時(shí),y均小于0.1;當(dāng)x≤6 時(shí),期望值是所有破壞數(shù)量下總期望值,而x≤8 時(shí)達(dá)到99.9%。
本文用分層概率采樣的方法,破壞節(jié)點(diǎn)數(shù)量x不同時(shí)采樣概率不同,當(dāng)破壞數(shù)量較大時(shí),實(shí)際發(fā)生次數(shù)y很小,采樣概率設(shè)為0。
路由影響力衡量具體的AS 節(jié)點(diǎn)在某個(gè)區(qū)域中為其他AS 提供的路由服務(wù),即其他的路由路徑有多大比例經(jīng)過(guò)該AS。
理想情況下,位于區(qū)域c的ASb對(duì)于內(nèi)部某個(gè)ASo的路由影響力可定義為,其中P(ASb,ASo)計(jì)算ASo路由經(jīng)過(guò)ASb的次數(shù),r(ASo)為ASo實(shí)際路由的次數(shù)。
但是,BGP 數(shù)據(jù)收集嚴(yán)重偏向探測(cè)點(diǎn)看到的數(shù)據(jù)。由于探測(cè)點(diǎn)在區(qū)域之間分布不均勻,而且許多區(qū)域和大多數(shù)AS 都沒(méi)有設(shè)置探測(cè)點(diǎn),獲得的數(shù)據(jù)均為通往探測(cè)點(diǎn)的路徑進(jìn)行過(guò)度采樣的結(jié)果。為了度量AS 在區(qū)域內(nèi)部的實(shí)際影響力,需要計(jì)算其在實(shí)際路徑中的出現(xiàn)比例,而探測(cè)點(diǎn)自身的有限性和偏見(jiàn)性對(duì)該結(jié)果有較大影響[12]。
本文設(shè)計(jì)了過(guò)濾器,通過(guò)對(duì)探測(cè)點(diǎn)進(jìn)行過(guò)濾,減輕計(jì)算結(jié)果受到探測(cè)點(diǎn)自身局限的影響。
位于區(qū)域c的ASb路由影響力wc(ASb)定義為
其中,O表示區(qū)域c內(nèi)所有AS 集合,URc(ASb,ASo)表示ASb對(duì)ASo的用戶(hù)影響力,θo表示區(qū)域c中ASo的用戶(hù)比例。以用戶(hù)比例作為權(quán)重,總路由影響力為ASb對(duì)區(qū)域內(nèi)所有AS用戶(hù)影響力的加權(quán)和。式(3)計(jì)算用戶(hù)影響力UR,其中R為一維向量,存儲(chǔ)所有探測(cè)點(diǎn)實(shí)際觀(guān)測(cè)到ASo經(jīng)過(guò)ASb的比例。式(4)計(jì)算觀(guān)測(cè)到經(jīng)過(guò)ASo的所有路徑中,ASb經(jīng)過(guò)ASo的路徑比例,其中Pi(ASb,ASo)為探測(cè)點(diǎn)i觀(guān)測(cè)到的ASo經(jīng)過(guò)ASb的路徑數(shù)量,ri(ASo)為探測(cè)點(diǎn)i觀(guān)測(cè)到ASo的數(shù)量。式(5)中,R存儲(chǔ)所有探測(cè)點(diǎn)的數(shù)據(jù),并按照ri(ASo)排序,函數(shù)fvp(R) 為探測(cè)點(diǎn)過(guò)濾器,過(guò)濾距離ASb過(guò)近和過(guò)遠(yuǎn)的探測(cè)點(diǎn)。
本文通過(guò)多次模擬破壞事件,獲得區(qū)域抗毀性采樣。設(shè)計(jì)顯著性檢驗(yàn)器,比較不同區(qū)域抗毀性采樣的差異,得到各個(gè)區(qū)域的抗毀性度量。
圖2 描述了區(qū)域抗毀性的計(jì)算流程。對(duì)于每個(gè)區(qū)域,選擇重要的AS 集合,并計(jì)算每個(gè)AS 的抗毀性采樣,在4.2.2 節(jié)和4.3.2 節(jié)分別說(shuō)明AS 的選擇標(biāo)準(zhǔn)。通過(guò)加權(quán)上采樣,將區(qū)域內(nèi)AS 的抗毀性采樣轉(zhuǎn)換為區(qū)域的抗毀性加權(quán)采樣。最后通過(guò)顯著性檢驗(yàn)器,比較不同區(qū)域抗毀性加權(quán)采樣的差異,得到區(qū)域抗毀性度量。
下面分別講述加權(quán)上采樣和顯著性檢驗(yàn)器的實(shí)現(xiàn),然后通過(guò)采樣實(shí)驗(yàn)和方法分析說(shuō)明抗毀性計(jì)算方法的合理性。
2.3.1 加權(quán)上采樣
通過(guò)加權(quán)上采樣,獲得區(qū)域的抗毀性采樣,輸入為區(qū)域中AS 的抗毀性采樣,輸出為區(qū)域的抗毀性加權(quán)采樣。
將AS 的路由影響力作為該AS 對(duì)應(yīng)的采樣權(quán)重。AS 的路由影響力越高,區(qū)域內(nèi)依賴(lài)其通信的AS 數(shù)量越多,且實(shí)際路由中需要經(jīng)AS 進(jìn)行路由轉(zhuǎn)發(fā)的次數(shù)越高,AS 的抗毀性直接影響這些依賴(lài)它的AS 的連通性。
加權(quán)上采樣思路如下,對(duì)于每個(gè)區(qū)域,輸入為[E1,E2,…,Em]和[w1,w2,…,wm],其中Ei和wi分別表示第i個(gè)AS 的抗毀性采樣和采樣權(quán)重,獲得輸入采樣權(quán)重的最小值wmin,抗毀性采樣結(jié)果Ei的采樣次數(shù)為,最后該區(qū)域抗毀性采樣長(zhǎng)度為表示iE的長(zhǎng)度。
2.3.2 顯著性檢驗(yàn)器
顯著性檢驗(yàn)器旨在發(fā)現(xiàn)區(qū)域抗毀性采樣的相對(duì)差異,排除隨機(jī)模擬破壞對(duì)抗毀性采樣結(jié)果造成的波動(dòng),發(fā)現(xiàn)不同區(qū)域抗毀性度量的真實(shí)差異。
本節(jié)從2 個(gè)角度出發(fā),設(shè)計(jì)2 個(gè)顯著性檢驗(yàn)器。第一個(gè)角度是破壞結(jié)果的整體水平,該角度反映多次隨機(jī)破壞下區(qū)域拓?fù)涞氖芷茐那闆r,經(jīng)典的統(tǒng)計(jì)量有平均值、中位數(shù)。第二個(gè)角度是破壞結(jié)果的波動(dòng)程度,波動(dòng)較大表明存在某些薄弱區(qū)域,經(jīng)典的統(tǒng)計(jì)量有方差。
顯著性檢驗(yàn)器的輸入輸出定義如下,輸入為n個(gè)一維向量,每個(gè)一維向量代表一個(gè)區(qū)域抗毀性采樣,輸出為 [ravg1,…ravgn,rstd1,…rstdn],ravgi表示第i個(gè)區(qū)域在整體水平的顯著性評(píng)估結(jié)果,該值也表示區(qū)域i在整體情況下的抗毀性排名,2 個(gè)差異性不顯著的區(qū)域有相同的抗毀性排名;rstdi表示第i個(gè)區(qū)域在波動(dòng)水平的顯著性評(píng)估結(jié)果,同時(shí)也表示區(qū)域i在波動(dòng)水平下的抗毀性排名。區(qū)域抗毀性度量不是確定值,而是經(jīng)過(guò)顯著性檢驗(yàn)器處理后的各個(gè)區(qū)域破壞結(jié)果的比較排名值。
顯著性檢驗(yàn)器實(shí)現(xiàn)思路如下。整體水平下的顯著性檢驗(yàn)器使用Kruskal-Wallis 檢驗(yàn)[13],該檢驗(yàn)判斷中位數(shù)是否具有顯著性差異,在有顯著性差異下,通過(guò)Steel-Dwass 事后檢驗(yàn)獲得兩兩比較的結(jié)果。根據(jù)2.3.3 節(jié)的模擬破壞數(shù)據(jù)和后續(xù)區(qū)域破壞數(shù)據(jù),通過(guò)K-S 正態(tài)檢驗(yàn)和方差齊性檢驗(yàn),發(fā)現(xiàn)抗毀性破壞結(jié)果滿(mǎn)足正態(tài)分布,而不同區(qū)域的破壞結(jié)果不滿(mǎn)足方差齊性,Kruskal-Wallis 檢驗(yàn)方法適用于破壞數(shù)據(jù)。通過(guò)方差齊性Hartley 檢驗(yàn)進(jìn)行波動(dòng)水平的比較,看兩兩方差的差值是否有顯著性差異。
2.3.3 采樣實(shí)驗(yàn)
為了驗(yàn)證隨機(jī)模擬采樣以及使用顯著性檢驗(yàn)比較的合理性,模擬分別隨機(jī)生成30、40 個(gè)節(jié)點(diǎn)的有向圖,鏈接的數(shù)量均為100,破壞鏈接數(shù)量設(shè)置為1、2、3,對(duì)應(yīng)的單個(gè)事件發(fā)生概率分別為p、p2、p3。所有破壞組合事件的數(shù)量為 166 750(C(100,3)+C(100,2)+C(100,1))。根據(jù)連通性計(jì)算所有破壞情況下的破壞影響,即網(wǎng)絡(luò)中無(wú)法連通的節(jié)點(diǎn)對(duì)的比例,計(jì)算每個(gè)破壞的結(jié)果,用破壞影響乘以發(fā)生概率,將所有破壞結(jié)果累積獲得結(jié)果向量。
隨機(jī)從結(jié)果向量中抽取部分樣本,比較樣本和結(jié)果向量在2 個(gè)角度下是否有顯著性差異,圖3 為采樣結(jié)果,縱坐標(biāo)格式為“節(jié)點(diǎn)數(shù)量?邊數(shù)量?檢驗(yàn)方法”,包括2 個(gè)圖的2 種檢驗(yàn)方法的結(jié)果。圖中用符號(hào)“+”表明有顯著性差異,發(fā)現(xiàn)在采樣樣本數(shù)量大于18 000 時(shí),即采樣概率超過(guò)11%時(shí),結(jié)果不存在顯著性差異。
該結(jié)果表明,采樣率超過(guò)11%時(shí)能反映完整的破壞結(jié)果的分布,采樣造成的信息損失并不大。
2.3.4 方法評(píng)價(jià)
已有大量工作針對(duì)網(wǎng)絡(luò)和節(jié)點(diǎn)的抗毀性進(jìn)行分析。其中部分工作根據(jù)節(jié)點(diǎn)的重要性和網(wǎng)絡(luò)的脆弱點(diǎn),提出一些量化指標(biāo)。一些工作定義度中心性[14]、介數(shù)中心性[15]來(lái)表征節(jié)點(diǎn)的中心性。許進(jìn)[16]和王梓行[17]分別提出核與核度、冗余度來(lái)表征系統(tǒng)節(jié)點(diǎn)的重要性。指標(biāo)具有可比性,但是僅針對(duì)復(fù)雜網(wǎng)絡(luò),并未加入互聯(lián)網(wǎng)的路由策略。
此外,大量工作研究復(fù)雜網(wǎng)絡(luò)和互聯(lián)網(wǎng)的抗毀性。設(shè)計(jì)不同的破壞角度和方法,包括隨機(jī)破壞、有針對(duì)性破壞、基于互聯(lián)網(wǎng)的層次結(jié)構(gòu)破壞等。定義衡量破壞的指標(biāo)主要包括連通度、破壞前后平均路徑長(zhǎng)度等。文獻(xiàn)根據(jù)網(wǎng)絡(luò)在不同破壞模擬下的結(jié)果進(jìn)行分析和討論。但是此類(lèi)工作并不能給出具體網(wǎng)絡(luò)的抗毀性的量化值,因此可比性較差。
目前也有針對(duì)區(qū)域進(jìn)行橫向比較的工作,但是這些工作均從某些特殊角度進(jìn)行切入。Leyba 定義NCP,通過(guò)NCP 評(píng)估邊界AS 在區(qū)域拓?fù)涞挠绊懥?,橫向?qū)Ρ? 個(gè)區(qū)域,分析NPC 的變化與差異。Alexander 研究傳輸運(yùn)營(yíng)商在區(qū)域?qū)用娴挠绊懥?,發(fā)現(xiàn)哪些區(qū)域的流量更不易被其他區(qū)域的傳輸運(yùn)營(yíng)商觀(guān)察和操控流量,具有更高的安全性。
目前尚未調(diào)研到有區(qū)域整體抗毀性定量比較的方法,本文根據(jù)區(qū)域抗毀性度量為區(qū)域進(jìn)行排名,排名方法設(shè)計(jì)的合理性是至關(guān)重要的。本文借鑒經(jīng)濟(jì)、社會(huì)等領(lǐng)域進(jìn)行量化排名的已有工作的思想,以量化和比較為目的,并增加互聯(lián)網(wǎng)資源的權(quán)重度量等因素,提出區(qū)域抗毀性度量,使排名具有多個(gè)角度和更大的靈活性。以下具體說(shuō)明本文方法考慮的因素及其合理性。
1) 從整體水平和波動(dòng)水平的角度來(lái)共同衡量區(qū)域抗毀性。具體原因如下,已通過(guò)K-S 正態(tài)檢驗(yàn)發(fā)現(xiàn)區(qū)域的破壞結(jié)果數(shù)據(jù)服從正態(tài)分布,而正態(tài)分布僅由均值和方差決定,所以整體水平和波動(dòng)水平一起能捕捉到正態(tài)分布數(shù)據(jù)完整特性。此外,均值和方差在統(tǒng)計(jì)學(xué)具有重要地位,也應(yīng)用于各個(gè)方面,如Markowitz 均值?方差模型用來(lái)求解最優(yōu)資產(chǎn)配置的比例,社會(huì)收入也會(huì)從整體水平和波動(dòng)水平(基尼系數(shù))來(lái)分別討論,此類(lèi)工作從不同分析角度出發(fā),評(píng)價(jià)區(qū)域的差異性,對(duì)本文工作具有借鑒意義。
2) 用分層概率破壞模擬破壞結(jié)果性。大量的文獻(xiàn)在研究網(wǎng)絡(luò)抗毀性時(shí)會(huì)使用隨機(jī)破壞的方法,由于隨機(jī)模擬的無(wú)差異性和宏觀(guān)性,對(duì)各個(gè)區(qū)域的模擬方法相同,使抗毀性比較更具有客觀(guān)性,抗毀性結(jié)果更具有可比性。本文在進(jìn)行破壞時(shí)充分考慮了事件發(fā)生的概率,根據(jù)事件發(fā)生概率模擬破壞事件,符合互聯(lián)網(wǎng)運(yùn)行規(guī)律。
3) 在區(qū)域抗毀性計(jì)算中包含多種權(quán)重的定義。通過(guò)定義區(qū)域節(jié)點(diǎn)的資源權(quán)重(2.1.1 節(jié)),衡量不同節(jié)點(diǎn)被破壞的差異性。多角度定義的權(quán)重支持了模型的可擴(kuò)展性,提供了多個(gè)角度的抗毀性結(jié)果,增加了說(shuō)服力,也讓抗毀性結(jié)果更加豐富。
4) 聚類(lèi)并進(jìn)行分組分析。利用整體水平和波動(dòng)水平下區(qū)域抗毀性的排名結(jié)果,對(duì)區(qū)域進(jìn)行聚類(lèi)分組。聚類(lèi)算法[18]應(yīng)用廣泛,如構(gòu)建用戶(hù)畫(huà)像、進(jìn)行惡意流量識(shí)別、搜索引擎流量推薦等。本文通過(guò)聚類(lèi)發(fā)現(xiàn)組內(nèi)區(qū)域之間的相似性和組間區(qū)域之間的差異性。
計(jì)算區(qū)域內(nèi)部的抗毀性度量時(shí),需要知道各個(gè)破壞事件下區(qū)域內(nèi)部所有AS 節(jié)點(diǎn)對(duì)之間的連通性變化,具有較高的復(fù)雜度O(n3),n為區(qū)域中AS 的個(gè)數(shù)。表1 列出了各區(qū)域的AS 數(shù)量和AS鏈接數(shù)量,數(shù)據(jù)去掉了沒(méi)有客戶(hù)的AS 節(jié)點(diǎn)。其中美國(guó)有2 119 個(gè)AS 節(jié)點(diǎn),并有25 個(gè)區(qū)域AS 的數(shù)量大于100,降低計(jì)算連通性的時(shí)間復(fù)雜度是很有必要的。
表1 各區(qū)域的AS 數(shù)量和AS 鏈接數(shù)量(除去沒(méi)有客戶(hù)的AS)
本文通過(guò)數(shù)據(jù)預(yù)處理來(lái)降低計(jì)算復(fù)雜度,將區(qū)域的抗毀性采樣轉(zhuǎn)化為區(qū)域中AS 的抗毀性采樣。
已有工作[19]提出了路由樹(shù)的構(gòu)建方法,以AS節(jié)點(diǎn)ASbase為基礎(chǔ),路由樹(shù)通過(guò)3 個(gè)步驟的廣度優(yōu)先算法,構(gòu)建出具有路由策略的連通關(guān)系樹(shù),后文稱(chēng)為ASbase的路由樹(shù)。網(wǎng)絡(luò)中可與ASbase進(jìn)行通信的AS 在且僅在A(yíng)Sbase的路由樹(shù)中。計(jì)算路由樹(shù)破壞的連通性復(fù)雜度最壞情況下為O(m+n),m為鏈接數(shù)量,n為AS 數(shù)量。本文首先構(gòu)建各個(gè)節(jié)點(diǎn)的路由樹(shù),從計(jì)算節(jié)點(diǎn)的兩兩連通性的O(n3)轉(zhuǎn)變?yōu)楦鱾€(gè)節(jié)點(diǎn)路由樹(shù)內(nèi)與其他節(jié)點(diǎn)的連通性,復(fù)雜度為O(n×(m+n))。
考慮到各個(gè)AS 的路由影響力不同,只選取重要AS 來(lái)構(gòu)造路由樹(shù)并模擬破壞,將復(fù)雜度降為O(m+n),得到更加輕量級(jí)的計(jì)算模型。
基于探測(cè)點(diǎn)收集的AS 路徑數(shù)據(jù),很容易缺失關(guān)鍵鏈路的信息。區(qū)域之間邊界AS 的鏈接對(duì)評(píng)估區(qū)域間通信的抗毀性至關(guān)重要。
本文通過(guò)發(fā)現(xiàn)隱藏鏈接之間的內(nèi)在相似性進(jìn)行缺失鏈接推斷。文獻(xiàn)[20]發(fā)現(xiàn)隱藏鏈接的存在,并發(fā)現(xiàn)部分隱藏鏈接的特點(diǎn)。對(duì)于只有一個(gè)探測(cè)點(diǎn)被觀(guān)察到的鏈接,將其稱(chēng)為單例鏈接。如果探測(cè)點(diǎn)發(fā)生更改,則可能觀(guān)察不到該鏈接,造成此類(lèi)鏈接的丟失。比如某個(gè)觀(guān)測(cè)點(diǎn)觀(guān)察到路由路徑為ASA?ASB1?…ASBn?ASC(n≥ 1),但是另一觀(guān)測(cè)點(diǎn)觀(guān)察到ASA和ASC也具有直接相連的鏈接,稱(chēng)為單例鏈接
考慮邊界AS 之間的鏈接,對(duì)n=1 時(shí)繞道而行的單例鏈接進(jìn)行預(yù)測(cè)。為了生成訓(xùn)練數(shù)據(jù)的負(fù)樣本,當(dāng)A 距離觀(guān)測(cè)點(diǎn)的跳數(shù)小于或等于1 時(shí),如果并未觀(guān)測(cè)到鏈接,則表示不存在該鏈接,稱(chēng)為負(fù)樣本。而實(shí)際觀(guān)測(cè)到的單例鏈接則稱(chēng)為正樣本。
針對(duì)邊界鏈接的特點(diǎn),表2 列出了輸入特征。本文分別使用K 近鄰回歸器、回歸樹(shù)、提升樹(shù)、隨機(jī)森林、極端森林、XGB 進(jìn)行分類(lèi)預(yù)測(cè),通過(guò)交叉驗(yàn)證發(fā)現(xiàn),所有算法的準(zhǔn)確率均高于91%,其中極端森林效果最好,準(zhǔn)確率高達(dá)98%。
表2 邊界AS 鏈接預(yù)測(cè)特征分類(lèi)及描述
本文通過(guò)該算法預(yù)測(cè)到261 條隱含邊界AS 鏈接。
3.3.1 IP 地理定位
IP 定位數(shù)據(jù)庫(kù)在區(qū)域精度上準(zhǔn)確度相對(duì)較精確,本文基于IP 定位數(shù)據(jù)庫(kù)實(shí)現(xiàn)IP 的地理定位。為了提高IP 定位結(jié)果的準(zhǔn)確率,使用Team Cymru、Maxmind、IP2location、RIPE IPmap 這4 個(gè)數(shù)據(jù)庫(kù)。這4 個(gè)數(shù)據(jù)庫(kù)用來(lái)對(duì)某個(gè)IP 地址查詢(xún),可能會(huì)發(fā)生錯(cuò)誤結(jié)果的數(shù)量大于正確結(jié)果的數(shù)量的情況,例如3 個(gè)一致的錯(cuò)誤結(jié)果與一個(gè)正確結(jié)果?;诤侠淼募僭O(shè),認(rèn)為該現(xiàn)象的發(fā)生是較少數(shù),設(shè)計(jì)基于投票的方法將4 個(gè)數(shù)據(jù)庫(kù)的結(jié)果進(jìn)行融合?;谕镀钡姆椒ú襟E如下。
步驟1計(jì)算4 個(gè)數(shù)據(jù)庫(kù)的一致性百分比
1) 對(duì)于每個(gè)數(shù)據(jù)庫(kù)Di,對(duì)每個(gè)IPi獲得定位結(jié)果Ci。
2) 用其他3 個(gè)數(shù)據(jù)庫(kù)對(duì)IPi進(jìn)行地理定位,確定4 個(gè)地理定位結(jié)果的多數(shù),并檢查4 個(gè)數(shù)據(jù)庫(kù)的定位結(jié)果是否與多數(shù)一致,即是否存在一致性。
3) 計(jì)算一致性出現(xiàn)的比例,獲得數(shù)據(jù)庫(kù)Di的一致性百分比DCRi。
步驟2根據(jù)一致性百分比進(jìn)行定位結(jié)果的投票1) 對(duì)于每個(gè)IPi,4 個(gè)數(shù)據(jù)庫(kù)結(jié)果分別為C1、C2、C3、C4。
2) 每個(gè)數(shù)據(jù)庫(kù)Di對(duì)自己的結(jié)果進(jìn)行投票,投票分?jǐn)?shù)為DCRi。
3) 獲得投票總分?jǐn)?shù)最多的結(jié)果即IPi的定位結(jié)果。
3.3.2 AS 地理定位
目前,沒(méi)有直接方法進(jìn)行AS 的地理定位。AS路徑進(jìn)行地理映射的最大難點(diǎn)在于存在跨越數(shù)個(gè)區(qū)域的AS,難以對(duì)其進(jìn)行地理定位。雖然地區(qū)性互聯(lián)網(wǎng)注冊(cè)機(jī)構(gòu)(RIS,regional internet registry)在為每個(gè)區(qū)域分配AS 號(hào)時(shí)登記了每一個(gè)AS 所屬的區(qū)域,但是登記的只是每個(gè)AS 法律意義上的所屬區(qū)域,實(shí)際上的AS 路徑可能實(shí)際經(jīng)過(guò)了其他的區(qū)域。結(jié)合IP 定位數(shù)據(jù)庫(kù)和Traceroute 數(shù)據(jù),本文提出AS 地理定位的快速方案。
本文處理思路如下。首先獲得AS 在各個(gè)區(qū)域的分布,IP 定位數(shù)據(jù)庫(kù)中將IP 地址定位到AS 和區(qū)域,以IP 為媒介,能夠獲得AS 和區(qū)域的對(duì)應(yīng)關(guān)系。其次,對(duì)于位于單個(gè)區(qū)域的AS,可以直接實(shí)現(xiàn)區(qū)域定位。計(jì)算發(fā)現(xiàn),僅有6.8%的AS 位于多個(gè)區(qū)域,對(duì)于這部分AS,結(jié)合該AS 的上下文環(huán)境(AS 路徑中該AS 的前后AS)進(jìn)行針對(duì)性計(jì)算。
借鑒Karlin 等[21]提出的區(qū)域路徑推測(cè)算法,本文設(shè)計(jì)了輕量級(jí)的匹配方法,對(duì)位于多個(gè)區(qū)域的AS 進(jìn)行地理定位。Traceroute 主動(dòng)測(cè)量能體現(xiàn)自治域內(nèi)路由的情況,首先將Traceroute 數(shù)據(jù)中IP路徑定位到AS 和區(qū)域,獲得AS 路徑和區(qū)域路徑的對(duì)應(yīng)關(guān)系數(shù)據(jù)庫(kù)。特別地,對(duì)于某個(gè)鏈接
1) 對(duì)于A(yíng)S 路徑P中需要地理定位的ASα。
2) 提取在Traceroute 數(shù)據(jù)中出現(xiàn)ASα的AS 路徑Q。
3) 對(duì)于每個(gè)AS 路徑iQ,將Qi和P進(jìn)行匹配,具體為,以ASα為起點(diǎn),向前向后獲得最長(zhǎng)匹配子串Mi。
4) 最長(zhǎng)的子串Mx中ASα的定位即AS 路徑P中ASα的定位。
本節(jié)首先介紹數(shù)據(jù)處理,目標(biāo)為構(gòu)建具有區(qū)域定位標(biāo)簽的全球AS 拓?fù)?,之后分別介紹區(qū)域內(nèi)部和外部的抗毀性度量的計(jì)算細(xì)節(jié),抗毀性計(jì)算的方法已在2.3 節(jié)介紹。
數(shù)據(jù)為從RIPE Atlas 平臺(tái)收集到的Traceroute數(shù)據(jù)以及從Routeview 平臺(tái)收集到的BGP 數(shù)據(jù),二者均為2020 年3 月平臺(tái)的全部數(shù)據(jù)。此外,由于探測(cè)點(diǎn)的局限,預(yù)測(cè)未發(fā)現(xiàn)的邊界AS 鏈路作為拓?fù)鋱D的補(bǔ)充。
在數(shù)據(jù)處理中,需要構(gòu)建具有區(qū)域標(biāo)簽的AS級(jí)拓?fù)鋱D。AS 拓?fù)鋱D中,以AS 為節(jié)點(diǎn),AS 間建立付費(fèi)關(guān)系P2C(provider to customer)或?qū)Φ汝P(guān)系P2P(provider to provider)為邊。
這一部分主要包括2 個(gè)步驟:第一,需要分別把Traceroute 和BGP 數(shù)據(jù)中的IP、AS 定位到具體的AS 和區(qū)域,形成拓?fù)鋱D中具有區(qū)域標(biāo)簽的AS節(jié)點(diǎn);第二,為了在后續(xù)分析中考慮加入路由策略的限制,需要給每個(gè)AS 鏈接打上關(guān)系標(biāo)簽,學(xué)術(shù)界普遍將鏈接的關(guān)系分類(lèi)為P2C 和P2P。
學(xué)術(shù)界有很多推測(cè)AS 關(guān)系的工作[22-24],并發(fā)布了對(duì)應(yīng)的數(shù)據(jù)集。利用已有的4 個(gè)AS 關(guān)系數(shù)據(jù)集(AS Rank、Problink、Toposcope、在Toposcope 中加入發(fā)現(xiàn)的隱藏鏈接后得到的數(shù)據(jù)集h-Toposcope)。
區(qū)域內(nèi)部關(guān)注區(qū)域內(nèi)部拓?fù)渲蠥S 之間的連通性。在計(jì)算AS 破壞事件度量時(shí),關(guān)注該AS 與其余AS 節(jié)點(diǎn)的連通。下面具體描述在區(qū)域內(nèi)部,AS節(jié)點(diǎn)資源的定義,以及區(qū)域內(nèi)需要計(jì)算抗毀性采樣的AS 的選擇。
4.2.1 節(jié)點(diǎn)資源定義
從3 個(gè)角度定義AS 節(jié)點(diǎn)i的資源權(quán)重ri。
1) 從連通性角度,ri恒為1。
2) 從用戶(hù)影響力角度,ri為ASi的用戶(hù)數(shù)量。
3) 從域名影響力角度,ri為ASi的域名重要性影響。
其中,連通性角度默認(rèn)各個(gè)AS 的資源權(quán)重相同,關(guān)注于連通的AS 數(shù)量。考慮到網(wǎng)絡(luò)中各個(gè)AS的用戶(hù)數(shù)量并不相同,用戶(hù)影響力角度計(jì)算AS 在全區(qū)域用戶(hù)數(shù)量。文獻(xiàn)[25]使用前綴頂級(jí)列表,將基于域的頂級(jí)列表聚合到網(wǎng)絡(luò)前綴中,獲得各個(gè)AS 基于域名重要性的影響度量。使用該工作的結(jié)果作為域名重要性影響。
4.2.2 重要AS 集合的選擇
根據(jù)區(qū)域節(jié)點(diǎn)AS cone 值選擇重要AS,AS cone定義為其直接和間接客戶(hù)AS 的數(shù)量。由于只希望選擇對(duì)本區(qū)域抗毀性表征力較強(qiáng)的節(jié)點(diǎn)AS 集合,這里只計(jì)算位于本區(qū)域的直接和間接客戶(hù)的AS 數(shù)量。
希望盡可能捕捉到本區(qū)域的整體情況,選擇方式如下,首先選擇AS cone 排名前5 的AS,之后按照AS cone 排名逐步添加AS,直到所有AS 的直接和間接客戶(hù)覆蓋區(qū)域90%的AS。
區(qū)域外部抗毀性關(guān)注本區(qū)域和其他區(qū)域的連通性。下面具體描述在區(qū)域外部中,區(qū)域節(jié)點(diǎn)資源的定義,以及需要計(jì)算抗毀性采樣的AS 的選擇。
4.3.1 節(jié)點(diǎn)資源定義
區(qū)域外部抗毀性關(guān)注本區(qū)域和其他區(qū)域的連通性,對(duì)于區(qū)域i,從3 個(gè)角度定義其資源權(quán)重ri。
1) 從連通性角度,ri恒為1。
2) 從區(qū)域經(jīng)濟(jì)影響力角度,ri為區(qū)域i人均GDP 的Zipf 權(quán)重。
3) 從域名影響力角度,ri為區(qū)域i的域名重要性影響。
其中,連通性角度默認(rèn)各個(gè)區(qū)域的資源權(quán)重相同,關(guān)注于連通的區(qū)域數(shù)量。從區(qū)域經(jīng)濟(jì)實(shí)力出發(fā),用區(qū)域人均GDP 度量區(qū)域資源大小。已知在互聯(lián)網(wǎng)中的大量事件流行遵循Zipf 分布[26-27],為了防止區(qū)域間人均GDP 數(shù)值差距過(guò)大,用Zipf 分布對(duì)人均GDP 數(shù)據(jù)重新處理,得到的Zipf 權(quán)重為區(qū)域的人均GDP 權(quán)重ri。與AS 資源權(quán)重類(lèi)似,從域名角度統(tǒng)計(jì)區(qū)域內(nèi)部所有AS 的資源權(quán)重作為ri。
4.3.2 重要AS 集合的選擇
選擇區(qū)域的所有邊界AS 作為重要節(jié)點(diǎn)集合,邊界AS 是本區(qū)域和其他區(qū)域通信的“出入口”,邊界AS 的抗毀性采樣結(jié)果能全面反映本區(qū)域和其他區(qū)域通信的情況。
本節(jié)展示抗毀性評(píng)價(jià)的結(jié)果,由于探測(cè)點(diǎn)地理分布的差異,有部分區(qū)域的測(cè)量數(shù)據(jù)很少。根據(jù)測(cè)量數(shù)據(jù),去除AS 鏈接數(shù)量太少的區(qū)域。本文研究48 個(gè)區(qū)域的抗毀性,其中歐洲區(qū)域24 個(gè),亞洲區(qū)域14 個(gè),非洲區(qū)域2 個(gè),北美洲區(qū)域3 個(gè),南美洲區(qū)域3 個(gè),大洋洲區(qū)域2 個(gè)。
實(shí)驗(yàn)具體設(shè)計(jì)如下,使用4.1 節(jié)提到的4 個(gè)AS關(guān)系數(shù)據(jù)集和算法,使用4.2 節(jié)提到的3 種節(jié)點(diǎn)資源權(quán)重。觀(guān)察區(qū)域內(nèi)部抗毀性結(jié)果受AS 關(guān)系和AS資源權(quán)重的影響。模擬破壞節(jié)點(diǎn)數(shù)量為1~6,破壞后該節(jié)點(diǎn)所有相連的鏈接被斷開(kāi)。
圖5(a)和圖5(b)分別描述整體水平和波動(dòng)水平下,各個(gè)區(qū)域內(nèi)部抗毀性度量的排名值。類(lèi)別1~類(lèi)別4 分別表示AS Rank、Problink、Toposcope、h-Toposcope 數(shù)據(jù),b、u、d 分別表示連通性、用戶(hù)數(shù)量、域名重要性。將區(qū)域抗毀性度量結(jié)果用灰度圖顯示,區(qū)域抗毀性度量即相對(duì)排名,排名越高,區(qū)域抗毀性越好,灰度越低?;叶葓D的橫坐標(biāo)表示48 個(gè)區(qū)域,用區(qū)域代碼表示,縱坐標(biāo)表示不同的AS 關(guān)系數(shù)據(jù)集和資源權(quán)重組合,按照第一個(gè)組合下區(qū)域抗毀性排名對(duì)區(qū)域排序展示。
首先分析圖5(a)在整體水平下區(qū)域抗毀性度量排名。在12 種組合下,巴西BR、美國(guó)US、俄羅斯RU 抗毀性度量排名并列第一。此外,德國(guó)DE、英國(guó)GB、荷蘭NL、法國(guó)FR、南非ZA、澳大利亞AU、意大利IT、加拿大CA、日本JP、烏克蘭UA、波蘭PL 抗毀性排名緊隨其后,除了以連通性作為資源權(quán)重的情況,其余組合中排名大多區(qū)域并列第一??梢园l(fā)現(xiàn),排名位于前列的區(qū)域大多位于歐洲,南非ZA 在非洲排名第一,日本JP 在亞洲排名第一,澳大利亞AU 在大洋洲排名第一。
圖5(b)展示各個(gè)區(qū)域在波動(dòng)水平下的區(qū)域抗毀性度量的排名。該排序和整體水平下的區(qū)域抗毀性度量排名相差很大,中位數(shù)和方差沒(méi)有明顯的相關(guān)關(guān)系,這也間接說(shuō)明2 個(gè)指標(biāo)聯(lián)合評(píng)價(jià)的合理性。
綜合2 個(gè)角度下的區(qū)域抗毀性度量,對(duì)區(qū)域進(jìn)行聚類(lèi),圖6 展示聚類(lèi)結(jié)果。
圖6(a)綜合2 個(gè)角度下的區(qū)域抗毀性度量排名(12 個(gè)組合),對(duì)區(qū)域進(jìn)行聚類(lèi),將結(jié)果分為六類(lèi)。橫縱坐標(biāo)分別是整體水平(中位數(shù))和方差角度在12 個(gè)角度下區(qū)域抗毀性度量的總和,每個(gè)類(lèi)別按照橫坐標(biāo)由小到大排序。
類(lèi)別1 在2 個(gè)角度下都表現(xiàn)較好,特別是俄羅斯RU、德國(guó)DE、英國(guó)GB、澳大利亞AU、烏克蘭UA,在整體水平和波動(dòng)水平下都有較高的抗毀性值。類(lèi)別2 和類(lèi)別3 有很好的整體水平,但是波動(dòng)水平下的抗毀性度量稍差。其中美國(guó)US 和巴西BR 平均水平最好,但是方差角度下抗毀性稍差,屬于類(lèi)別3。具體觀(guān)察圖6(b)方差結(jié)果,各個(gè)區(qū)域只有在連通性度量下有明顯的差異。這一類(lèi)的區(qū)域有部分關(guān)鍵鏈路,破壞后會(huì)影響部分節(jié)點(diǎn)的連通,但這些節(jié)點(diǎn)重要程度較小,導(dǎo)致對(duì)整體網(wǎng)絡(luò)影響很小。類(lèi)別4、類(lèi)別5 在48 個(gè)區(qū)域中抗毀性處于中等,其中類(lèi)別4 在波動(dòng)水平下抗毀性更好。最后類(lèi)別6表現(xiàn)較差,較之前面類(lèi)別的區(qū)域,受到破壞后對(duì)本區(qū)域通信的影響較大。
觀(guān)察到波動(dòng)水平的結(jié)果中,不同資源權(quán)重下的結(jié)果很不相同,進(jìn)一步用資源權(quán)重劃分結(jié)果。
圖6(b)展示了資源權(quán)重為連通性的聚類(lèi)結(jié)果,劃分為七類(lèi),該結(jié)果與12 個(gè)組合下的聚類(lèi)結(jié)果很相近。主要原因?yàn)?,在波?dòng)水平下,各個(gè)區(qū)域在其他度量下的排名基本相似,而在整體水平中,各個(gè)區(qū)域在其他度量下的差異也小于連通性資源權(quán)重的差異。
圖6(c)和圖6(d)分別展示了資源權(quán)重為用戶(hù)數(shù)量和域名重要性的聚類(lèi)結(jié)果,二者結(jié)果相近,且該結(jié)果與圖6(b)有較大差異。兩張圖中,所有區(qū)域的方差幾乎相同,基本依賴(lài)區(qū)域的整體水平進(jìn)行聚類(lèi)。其中,類(lèi)別1 表現(xiàn)最好,該集合數(shù)量也很多超過(guò)20 個(gè)。之后是類(lèi)別2 和類(lèi)別3,其抗毀性度量也較接近。前3 個(gè)類(lèi)別共涉及一半以上的區(qū)域,超過(guò)一半的區(qū)域抗毀性情況相近且均很優(yōu)秀。之后類(lèi)別4和類(lèi)別5 差異增加,抗毀性變差。
從不同度量下的聚類(lèi)結(jié)果可以看出,超過(guò)一半的區(qū)域有較優(yōu)秀的抗毀性能力,其中各個(gè)區(qū)域有一些細(xì)微差異而導(dǎo)致波動(dòng)水平下排名的區(qū)別,主要體現(xiàn)在一些區(qū)域有部分較脆弱的節(jié)點(diǎn)集合,在某些破壞事件下無(wú)法連通,但節(jié)點(diǎn)集合的總影響力很小。從多個(gè)資源權(quán)重評(píng)價(jià)結(jié)果是合理且很有意義的,連通性度量更能捕捉網(wǎng)絡(luò)的差異性,發(fā)現(xiàn)網(wǎng)絡(luò)的輕微變化,但也會(huì)導(dǎo)致一些影響結(jié)果的“誤判”,無(wú)法分辨破壞的真實(shí)影響力,將用戶(hù)數(shù)量、域名重要性作為資源度量參考有效避免了該問(wèn)題。
下面,講述在內(nèi)部抗毀性結(jié)果中的一些發(fā)現(xiàn)。
部分區(qū)域有抗毀性較差的外圍AS 集群。從圖6(a)發(fā)現(xiàn),AS 關(guān)系的變化對(duì)區(qū)域抗毀性排名影響很小,而不同資源權(quán)重下區(qū)域的抗毀性具有一定差異。在連通性度量中,各個(gè)區(qū)域差異性更大。其原因?yàn)閰^(qū)域外圍有部分AS 資源權(quán)重很小,被破壞后的影響很小。連通性度量認(rèn)為各個(gè)AS 重要性相同,更加受到該類(lèi)AS 的影響。從圖6 中可以發(fā)現(xiàn),意大利IT、加拿大CA、日本JP、烏克蘭UA、波蘭PL、印尼ID、印度IN 這些區(qū)域在用戶(hù)數(shù)量、域名重要度量下排名前列,但是在連通性角度下與巴西BR 等排名最前的區(qū)域差異增大,這些區(qū)域都具有抗毀性較高的區(qū)域內(nèi)核AS 集群,同時(shí)區(qū)域外圍一些資源權(quán)重較低的AS 更易被破壞。
資源權(quán)重較高的節(jié)點(diǎn)不會(huì)被某些破壞事件突然摧毀。圖6(b)中,只有在資源權(quán)重為連通性時(shí),各區(qū)域才出現(xiàn)明顯的差異,在其余的資源權(quán)重指標(biāo)下,各個(gè)區(qū)域排名極其接近。該數(shù)據(jù)說(shuō)明在各個(gè)破壞情況下,被破壞后無(wú)法通信的節(jié)點(diǎn)數(shù)量相差比較大,但是總體其在用戶(hù)數(shù)量和域名重要性角度下,相差很小,間接反映了各個(gè)區(qū)域有較高用戶(hù)數(shù)量和域名重要性的節(jié)點(diǎn)很少會(huì)因?yàn)槟承┨貏e的攻擊而受到直接的影響。
所有區(qū)域?qū)e的區(qū)域管理的AS 依賴(lài)性很小。對(duì)于每個(gè)區(qū)域,圖7 只破壞區(qū)域內(nèi)部由其他區(qū)域管理的AS,旨在發(fā)現(xiàn)是否有部分區(qū)域內(nèi)部拓?fù)浯蟠笠蕾?lài)于其他區(qū)域管理的AS。與圖5(a)相比,3 個(gè)資源權(quán)重下區(qū)域之間的差異減小,在資源權(quán)重為用戶(hù)數(shù)量和域名重要度下,大約30 個(gè)區(qū)域的排名均處于第一和第二,這些區(qū)域中非本區(qū)域管理的AS 對(duì)區(qū)域核心AS 集群影響很小。多數(shù)區(qū)域的排名均提高,其中澳大利亞AU、南非ZA、瑞士CH、印度IN 在資源權(quán)重為連通性時(shí)排名大大提高,整體排名也隨之得到提高。伊朗IR、馬來(lái)西亞MY 在資源權(quán)重為用戶(hù)數(shù)量和域名重要性下的提高很明顯,二者在圖5(a)中3 個(gè)度量下的排名均大于10,但在圖7中用戶(hù)數(shù)量和域名重要性中排名均上升到前兩名。說(shuō)明2 個(gè)區(qū)域雖然整體安全抗毀性較差,但其他區(qū)域管理的AS 在該區(qū)域重要性很低,該區(qū)域能較好地抵御其他區(qū)域管理AS 的針對(duì)破壞。
區(qū)域外部抗毀性觀(guān)察區(qū)域之間的連通,使用4.3 節(jié)提到的3 種區(qū)域節(jié)點(diǎn)資源權(quán)重。觀(guān)察抗毀性結(jié)果發(fā)現(xiàn),不同AS 數(shù)據(jù)集的結(jié)果差異很小,因此圖中只展示了使用AS Rank 數(shù)據(jù)集的結(jié)果。
從2 個(gè)角度出發(fā),圖8(a)描述各個(gè)區(qū)域外部抗毀性度量即排名值?;叶葓D橫坐標(biāo)表示48 個(gè)區(qū)域,縱坐標(biāo)b、g、d 分別表示連通性、經(jīng)濟(jì)影響力、域名重要性度量,var 表示方差角度,無(wú)標(biāo)注表示中位數(shù)角度。按照6 個(gè)組合下區(qū)域抗毀性排名的均值對(duì)區(qū)域排序。與區(qū)域內(nèi)部抗毀性結(jié)果圖5 相比,各區(qū)域的抗毀性差距拉大,很少存在并列排名,各區(qū)域的具體排名也有變化。從圖8 中可以發(fā)現(xiàn),不同資源權(quán)重下結(jié)果差距很小,分析原因是各區(qū)域邊界AS 數(shù)量有較大差異,所以資源權(quán)重對(duì)結(jié)果影響很小。
圖9 展示區(qū)域外部抗毀性在整體水平和波動(dòng)水平2 個(gè)角度下的聚類(lèi)結(jié)果,由于不同資源權(quán)重下結(jié)果差異很小,這里只展示了全部組合的聚類(lèi)結(jié)果。從聚類(lèi)結(jié)果可以看到,整體水平和波動(dòng)水平的結(jié)果高度正相關(guān),將各個(gè)區(qū)域劃分為5 個(gè)類(lèi)別,其中類(lèi)別1和類(lèi)別2 區(qū)域外部抗毀性較好,美國(guó)US、德國(guó)DE、英國(guó)GB、加拿大CA 和俄羅斯RU 屬于類(lèi)別1,抗毀性最好。不同于區(qū)域內(nèi)部抗毀性結(jié)果中大量區(qū)域集中在較好的類(lèi)別,區(qū)域外部抗毀性中大量區(qū)域集中在較差的類(lèi)別,其中超過(guò)80%的區(qū)域都在后3 個(gè)類(lèi)別中。
下面,講述在外部抗毀性結(jié)果中的一些發(fā)現(xiàn)。
不存在一些區(qū)域大量依靠其他區(qū)域管理的邊界AS 服務(wù)。考慮到區(qū)域外部抗毀性和邊界AS 抗毀性高度相關(guān),但是位于本區(qū)域的邊界AS 并不一定由本區(qū)域管理,本文只計(jì)算位于本區(qū)域且由本區(qū)域管理的邊界AS,圖8(b)展示該實(shí)驗(yàn)的抗毀性結(jié)果。和圖8(a)相比較,各個(gè)區(qū)域排名都很類(lèi)似,差距不大,所以不存在一些區(qū)域大量依靠其他區(qū)域管理的邊界AS 傳輸穩(wěn)定的服務(wù)。
各個(gè)區(qū)域邊界AS 數(shù)量差異明顯。表3 列出了各個(gè)區(qū)域邊界AS 的具體數(shù)量,用Mb表示該區(qū)域管理的邊界AS 集合,用Lb表示位于該區(qū)域的邊界AS 集合。表3 中數(shù)據(jù)證明,各個(gè)區(qū)域邊界AS 數(shù)量差距很大,美國(guó)US 有超過(guò)500 的邊界AS,而有5 個(gè)區(qū)域數(shù)量小于10。Mb&Lb表示二者交集,即位于本區(qū)域且由本區(qū)域管理的邊界AS;Mb?Lb表示二者差集,即位于本區(qū)域且不由本區(qū)域管理的邊界AS。這兩行數(shù)據(jù)可以得到區(qū)域內(nèi)部邊界AS 由本區(qū)域管理的比例,比較各個(gè)區(qū)域的數(shù)據(jù),除了邊界AS 數(shù)量較小的區(qū)域,約80%都由本區(qū)域管理,其中俄羅斯RU 的比例特別大,95%的邊界AS 均由自己管理。但是新加坡SG 有44%的AS 由其他區(qū)域管理。
表3 區(qū)域邊界AS 的數(shù)量情況
抗毀性排名和區(qū)域的邊界AS 數(shù)量排名接近。比較抗毀性排名和邊界AS 數(shù)量排名,發(fā)現(xiàn)二者趨勢(shì)相同,但也有部分區(qū)域不太一致,其中加拿大CA、日本JP 邊界AS 數(shù)量較少,但是抗毀性排名高,說(shuō)明該區(qū)域具有抗毀性排名較高的邊界AS,也有波蘭PL、保加利亞BG、印度IN,邊界AS 數(shù)量較多,但是抗毀性排名相對(duì)偏低,說(shuō)明該區(qū)域邊界AS 的通信質(zhì)量拖了后腿。進(jìn)一步探究原因,將所有區(qū)域所有邊界AS 的抗毀性采樣輸入顯著性檢驗(yàn)器,得到區(qū)域邊界AS 的抗毀性排名。圖10 繪制了7 個(gè)區(qū)域的邊界AS 抗毀性度量的排名分布。橫坐標(biāo)為邊界AS 抗毀性排名,縱坐標(biāo)為對(duì)應(yīng)AS 的路由影響力占比。從圖10 中可以發(fā)現(xiàn),加拿大CA 和日本JP 在第一名的路由影響力比例是最高的。
各個(gè)區(qū)域邊界AS 的抗毀性決定了全球通信的抗毀性,從抗毀性的角度出發(fā),分析各個(gè)區(qū)域管理的邊界AS 在全球通信服務(wù)的重要性,即該區(qū)域通信服務(wù)的影響力。
思路概括如下。對(duì)于每個(gè)區(qū)域,每次只破壞該區(qū)域管理的邊界AS,模擬破壞區(qū)域邊界AS 的數(shù)量為1~25,破壞一個(gè)邊界AS 即破壞該邊界AS 的全部邊界AS 鏈接。計(jì)算該破壞下全部區(qū)域所有邊界AS 的抗毀性采樣,匯總得到區(qū)域的通信服務(wù)影響力。
通信服務(wù)影響力和抗毀性排名差異很大。圖11繪制區(qū)域通信服務(wù)的影響力排名。橫坐標(biāo)為各個(gè)區(qū)域,縱坐標(biāo)為3 種資源權(quán)重。從圖11 中可以發(fā)現(xiàn),約一半的區(qū)域影響力都非常小,只破壞這些區(qū)域管理的邊界AS,對(duì)區(qū)域間的通信幾乎不造成任何影響。美國(guó)US 和德國(guó)GB 依舊排名靠前,其余與區(qū)域抗毀性排名很不一致,如法國(guó)FR、烏克蘭UA、奧地利AT 在區(qū)域抗毀性中都排名靠前,但是服務(wù)影響力排名靠后。相反,印尼ID、捷克CZ、新西蘭NZ 抗毀性排名較低,區(qū)域管理的邊界AS 數(shù)量Mb較少,但是服務(wù)影響力排名位于前列。
進(jìn)一步分析原因,表4 列出7 個(gè)區(qū)域的邊界AS 抗毀性度量排名前五級(jí)的數(shù)量。和服務(wù)影響力排名一致,美國(guó)有很強(qiáng)的影響力,抗毀性排名第一級(jí)的邊界AS 數(shù)量很多。法國(guó)FR、烏克蘭UA 和奧地利AT 抗毀性排名前五級(jí)的邊界AS 數(shù)量只有一個(gè)或2 個(gè),遠(yuǎn)不如其他區(qū)域。印尼ID、捷克CZ、新西蘭NZ 抗毀性排名前兩級(jí)數(shù)量很少,但是前五級(jí)的數(shù)量很多。法國(guó)FR、烏克蘭UA 和奧地利AT 的區(qū)域通信影響力低的原因在于它們的邊界AS 有很豐富的AS 鏈接,且該區(qū)域與周?chē)鷧^(qū)域也有豐富的AS 鏈接,導(dǎo)致破壞該區(qū)域管理的邊界AS 對(duì)互聯(lián)網(wǎng)破壞力很小。與之對(duì)應(yīng)的印尼ID、捷克CZ、新西蘭NZ 對(duì)一些區(qū)域有較高的通信影響。
表4 通信服務(wù)影響力下部分區(qū)域邊界AS 抗毀性排名數(shù)量
全球互聯(lián)網(wǎng)的重要性與日俱增,網(wǎng)絡(luò)拓?fù)涫腔ヂ?lián)網(wǎng)通信的基礎(chǔ)。本文采集多方數(shù)據(jù),建立了較完善的區(qū)域粒度的網(wǎng)絡(luò)拓?fù)洹A炕煌瑓^(qū)域網(wǎng)絡(luò)拓?fù)涞目箽?,定義顯著性檢驗(yàn)器,從內(nèi)部拓?fù)浜屯獠客ㄐ? 個(gè)方面對(duì)區(qū)域抗毀性進(jìn)行排名并發(fā)現(xiàn)區(qū)域差異。后續(xù)工作將重點(diǎn)考慮發(fā)現(xiàn)并定位拓?fù)渲斜∪觞c(diǎn),精準(zhǔn)給出區(qū)域拓?fù)鋬?yōu)化建議。