張 琪,李興華,姜 華
(1.北京交通大學 電子信息工程學院,北京 100044;2.工業(yè)和信息化部電信研究院 信息網(wǎng)絡(luò)部,北京 100037)
互聯(lián)網(wǎng)是當代信息社會的重要基礎(chǔ)設(shè)施,通過對互聯(lián)網(wǎng)進行測量和分析,可以使行業(yè)管理者了解網(wǎng)絡(luò)運行狀況,及時發(fā)現(xiàn)和處理網(wǎng)絡(luò)重大安全事件,對網(wǎng)間的互聯(lián)互通方案進行設(shè)計和評價。
本文根據(jù)工業(yè)和信息化部電信研究院互聯(lián)網(wǎng)優(yōu)化平臺項目所測量的相關(guān)數(shù)據(jù),通過對大量網(wǎng)絡(luò)性能數(shù)據(jù)的統(tǒng)計分析,發(fā)現(xiàn)了網(wǎng)絡(luò)時延的性能特征和不同運營商的性能差異,以及網(wǎng)絡(luò)互聯(lián)互通存在的問題。
當數(shù)據(jù)包到達一個路由器,經(jīng)過路由器的處理并發(fā)送到下一個路由器時,數(shù)據(jù)包經(jīng)歷的時延由具體的4部分組成[1]:傳輸時延,傳播時延,處理時延,排隊時延。
當相同時間間隔發(fā)送數(shù)據(jù)包時,在目的端收到數(shù)據(jù)包會出現(xiàn)不同時間間隔,即為時延抖動。時延抖動受很多因素影響,由于網(wǎng)絡(luò)中的路由擁塞,并且瞬間擁塞的時間和長度變化,導致各分組數(shù)據(jù)包的處理時延不同[2],TCP窗口行為的變化,時延抖動也是反映網(wǎng)絡(luò)負載特征的重要指標,網(wǎng)絡(luò)中存在的平均網(wǎng)絡(luò)負載周期性和非周期性變化會引起時延抖動,另外,路由更新也會引起時延抖動,即當路徑發(fā)生變化并收斂到新的路由路徑過程中,時延增加,會有大量的丟包,并伴隨劇烈的時延抖動。
評估時延抖動有多個方法[3],有前后參考,首包參考,平均值參考。平均值參考不具有實時性,是在一段時間測量結(jié)束后計算完成,但是平均值參考使用簡單,具有一定的代表性和普遍性。本文采用平均參考結(jié)合方差的計算,通過測得的往返時延,平均每6 h計算時延抖動。
本文實驗的測量從全國范圍內(nèi)的11個監(jiān)測點向93個分布在各省的運營商Ping和Traceroute,從測量數(shù)據(jù)中選取24552條往返時延和路由跳數(shù),再根據(jù)時延值計算時延抖動。對于自治域的統(tǒng)計信息是,位于各省市的11個監(jiān)測點分別屬于AS4808,AS9808,AS23724,AS24400,AS17621,AS4812。我國向外公告196個AS,實驗?zāi)軌蚪y(tǒng)計65個AS。
2.2.1 往返時延統(tǒng)計分析
Baek-Young Choi[4]等通過對Sprint US IP骨干網(wǎng)的點到點時延分析發(fā)現(xiàn),數(shù)據(jù)包經(jīng)歷的最大時延并不能代表網(wǎng)絡(luò)的性能;對經(jīng)常發(fā)生路徑變化和負載均衡的骨干網(wǎng),時延的平均值和中值并不能很好的表示這方面的性能;最小時延在較小的時間內(nèi)很穩(wěn)定,最小時延的變化能夠表示最短路徑的變化。將時延統(tǒng)計數(shù)據(jù)做概率統(tǒng)計圖如圖1,并將時延指標值制表如表1。
圖1 往返時延概率分布圖
表1 往返時延指標值統(tǒng)計表(續(xù))
從圖中可以看出,網(wǎng)絡(luò)時延狀況較好,大多集中在40 ms~70 ms之間,只有一小部分時延超過150 ms,對于時延值超過200 ms~300 ms 之間的路由,經(jīng)過對逐條路由分析發(fā)現(xiàn),這些路由多數(shù)發(fā)生在跨網(wǎng),并且目的節(jié)點在西藏和新疆地區(qū),這2地區(qū)的時延明顯大于其他地區(qū),原因是由于我國西部的網(wǎng)絡(luò)狀況較其他地區(qū)差,實驗的監(jiān)測點設(shè)置相對西部地區(qū)較遠。
由上表可以看出,各ISP內(nèi)部的路由時延明顯小于各ISP之間的路由時延,A網(wǎng)和B網(wǎng)之間的路由時延表現(xiàn)尤為明顯,這2個ISP之間的時延方差值為63.34,時延波動較大,均值和中值分別為98.88 ms和78.83 ms,較其他跨網(wǎng)的時延指標值大。
2.2.2 跳數(shù)的分析
端到端的跳數(shù)是指測量的數(shù)據(jù)包從源點出發(fā),到達目的地的過程中所經(jīng)過的路由器個數(shù)[5]。跳數(shù)在一定程度上體現(xiàn)了某一路徑的路由效率和傳輸質(zhì)量。跳數(shù)的大小和路由選擇策略以及物理距離有關(guān),通常將跳數(shù)作為源點和目的點距離的一種體現(xiàn)。從測量數(shù)據(jù)中選擇24552個跳數(shù)數(shù)據(jù)。將其進行跳數(shù)概率分布統(tǒng)計如圖2。圖的橫坐標是跳數(shù),縱坐標是跳數(shù)所占的比重概率。
圖2 ISP網(wǎng)內(nèi)跳數(shù)概率分布對比圖
由于監(jiān)測的目的點是分布在各省市的節(jié)點,因此ISP跳數(shù)之間的比較不存在距離遠近的問題,由圖2可知,最為Tier-1的A網(wǎng)和B網(wǎng)的選路策略較好,路由跳數(shù)集中在9跳和10跳,而C網(wǎng)內(nèi)的路由跳數(shù)分布稍向后移,進一步對逐條路由分析發(fā)現(xiàn),某些C網(wǎng)內(nèi)的路由要經(jīng)過A網(wǎng)或B網(wǎng)的骨干網(wǎng)節(jié)點進行傳輸,比如由上海C網(wǎng)監(jiān)測點到北京C網(wǎng)目的點,中間需要經(jīng)過B網(wǎng)骨干網(wǎng)節(jié)點進行轉(zhuǎn)發(fā)。從網(wǎng)內(nèi)和網(wǎng)間的角度分析,在ISP內(nèi)部的路由選擇策略較好,跳數(shù)集中在9跳~11跳,而在ISP之間的跳數(shù)則顯著增加,集中在12跳~14跳。同樣的,ISP內(nèi)部和ISP之間的比較不存在物理距離的遠近,那么影響跳數(shù)整體變大的原因是路由選擇策略。對網(wǎng)絡(luò)跳數(shù)進行整體統(tǒng)計可以看出,對跳數(shù)分布的影響主要來自ISP之間,因此,對于提高全國網(wǎng)絡(luò)性能應(yīng)加強各ISP之間的互聯(lián)互通,優(yōu)化跨網(wǎng)的路由選擇策略。
2.2.3 跳數(shù)與時延相關(guān)性分析
路由是指數(shù)據(jù)包在網(wǎng)絡(luò)傳輸過程中經(jīng)過的網(wǎng)絡(luò)節(jié)點的有序排列。路徑是數(shù)據(jù)包從源點到目的點的所有路由的集合。通常用跳數(shù)來衡量源端和目的端的距離,跳數(shù)大的一般情況下物理距離也大,延遲也會相應(yīng)變化。Aiguo Fei[6]等人通過對UCLA的主機隨機選擇3000遍布全世界的主機進行測量往返延遲和跳數(shù)分析,實驗結(jié)果表明US內(nèi)超過90%跳數(shù)是在18跳以內(nèi),90%的往返延遲小于153 ms,但是研究表明跳數(shù)和延遲之間沒有很強的相關(guān)性,盡管是平均時延大小會隨著跳數(shù)增加而增加。時延和跳數(shù)對比如圖3。
圖3 時延和跳數(shù)對比圖
圖3中的橫坐標是路由跳數(shù),縱坐標是某一跳數(shù)的時延分布,從圖中可以看出,隨著跳數(shù)的增加,時延會變大,但并不是很強的相關(guān)性,在11跳到15跳之間,時延呈現(xiàn)很大的分布。圖中的紅點表示固定跳數(shù)時延的中位值,從16跳開始,中位值不再呈單調(diào)上升趨勢?;谝陨?點不能單純的由給定跳數(shù)來預測時延大小,時延大小不僅僅由跳數(shù)決定,還會依賴很多其他因素,包括物理距離,到骨干網(wǎng)的距離,鏈路容量和當時某一鏈路的流量狀況,這也體現(xiàn)了網(wǎng)絡(luò)的復雜性。
分析目的是AS間路徑時延對整體時延的影響,由于平臺使用的工具是Traceroute,返回的數(shù)值是往返時延,因此,采用的數(shù)據(jù)是鏈路往返時延。將每條鏈路時延比重算出,做出概率分布圖如圖4。
圖4 AS間鏈路時延比重CDF圖(intra-ISP)
對于出現(xiàn)在intra-ISP的跨域鏈路時延比重,C網(wǎng)和B網(wǎng)的AS間鏈路時延比重并沒有占很多,在所有的路徑往返時延中,C網(wǎng)90%的跨域鏈路只占其所在路徑時延的不到10%,B網(wǎng)80%的跨域鏈路只占其所在路徑時延的不到10%,對這2個ISP,占整條路徑的大部分時延出現(xiàn)在自治域內(nèi)部,逐條對路徑時延分析發(fā)現(xiàn),路徑時延的主導時延鏈路大部分只有一條,也即端到端路徑中大部分只存在一條瓶頸鏈路,根據(jù)上述分析結(jié)論,可以推斷出瓶頸鏈路出現(xiàn)在AS內(nèi)部。這符合過去的研究結(jié)論。對于A網(wǎng),跨域的鏈路所占時延比重CDF圖近似為一條直線,表明跨域間鏈路和域內(nèi)鏈路的時延貢獻值差不多,瓶頸鏈路不能武斷的判斷在AS內(nèi)部[7]還是外部。
統(tǒng)計只采用8點和14點的時延抖動值做比較,8點的時延抖動是從2~8點的往返時延方差值,14點的時延抖動是從8~14點的往返時延方差值,2個IPDV都非常有代表性。通過3天取值來得到平均值,統(tǒng)計結(jié)果如圖5。
由圖5可知,從時間上,8點比14點的IPDV要明顯小的多,這表明凌晨2點到上午8點的網(wǎng)絡(luò)負載較輕,時延變化不大,比較穩(wěn)定,符合網(wǎng)絡(luò)的實際情況。而上午8點到下午14點的時延抖動值明顯變大,這時網(wǎng)絡(luò)負載較重,數(shù)據(jù)包往返時延不穩(wěn)定,會經(jīng)歷排隊時延,所以時延出現(xiàn)較大的波動。
圖5 8點-14點時延抖動比較
通過對不同運營商的網(wǎng)絡(luò)時延性能進行分析,從網(wǎng)內(nèi)網(wǎng)間以及組成的整體性能等不同角度,對運營商之間的性能差異進行了評估。通過對時延性能進行深入的挖掘,發(fā)現(xiàn)和驗證了時延的一些特性,證明了互聯(lián)網(wǎng)發(fā)展的地域不平衡性。
[1]Jun-ya Kato, Atsuo Shimizu, Shigeki Goto. Active Measurement and Analysis of Delay Time in the Internet [C]. ICPP '99 Proceedings of the 1999 International Workshops on Parallel Processing, 1999.
[2]Pucha H, Zhang Y, Mao Z M, et al. understanding network delay changes caused by routing events [C]. In proceedings of the 2007 ACM SIGMETRICS international conference on measurement and modeling of computer systems, 2007.
[3]黎文偉,王俊峰,謝高崗,張大方. 基于包對采樣的IP網(wǎng)絡(luò)時延變化測量方法[J]. 計算機研究與發(fā)展,2004,41(8):1352-1359.
[4]Baek-Young Choi, Sue Moon, Rene Cruz, Zhi-Li Zhang, Christophe Diot. Practical Delay Monitoring for ISPs [C]. Proceeding 2005 ACM Conference on Emerging network Experiment and Technology, Toulouse, France, Oct. 2005.
[5]馬建國,席明賢,等. 中國Internet路由級跳數(shù)測量與分析[J]. 計算機應(yīng)用研究,2008, 25(7):2112-2115.
[6]Aiguo Fei, Guangyu Pei, et al. Measurement on delay and hop-count of the internet[C]. IEEE GLOBECOM'98 - Internet Mini-Conference. 1998.
[7]畢經(jīng)平,吳 起,李忠誠. Internet延遲瓶頸的測量與分析[J]. 計算機學報,2003,26(4):406-416.