鄭愛媛
(福建商學(xué)院信息工程系, 福州 350012)
近年來,隨著大數(shù)據(jù)和云計算技術(shù)的部署應(yīng)用,網(wǎng)絡(luò)流量規(guī)模[1]呈現(xiàn)出指數(shù)級增長趨勢。為了順應(yīng)對數(shù)據(jù)流風(fēng)暴管理的需求,對網(wǎng)絡(luò)架構(gòu)做出合理規(guī)劃是必要的。緣于傳統(tǒng)網(wǎng)絡(luò)協(xié)議在應(yīng)對隨機(jī)突發(fā)數(shù)據(jù)流量重載風(fēng)險時,往往采取最短路由策略來實施突發(fā)載荷的分流管理,卻忽視了突發(fā)載荷自身對帶寬的實際需求。為了改善傳統(tǒng)網(wǎng)絡(luò)搜尋最短路由的固定模式,雖有相關(guān)多徑算法進(jìn)行了部署,使傳統(tǒng)網(wǎng)絡(luò)在面對突發(fā)載荷時支持多徑選擇,但變幻莫測的大數(shù)據(jù)流規(guī)模在網(wǎng)絡(luò)承載中引發(fā)的參數(shù)多變[2]情形,卻是這些算法無法掌控的。為此,一種能夠滿足突發(fā)數(shù)據(jù)流對網(wǎng)絡(luò)性能要求的數(shù)據(jù)中心網(wǎng)絡(luò)得以部署。該網(wǎng)絡(luò)所采用的多層次胖樹體系架構(gòu)自上而下依次分為核心層、聚合層、接入層、主機(jī)層。其中后三者可形成一定規(guī)模不同數(shù)量的集群。對于每個集群而言,其聚合層中的交換機(jī)向上可連至核心層的某些交換機(jī),向下可連接本集群內(nèi)的所有交換機(jī)。從而形成了任意一個集群與核心層交換機(jī)互聯(lián)互通的局面。此種以信息為中心的網(wǎng)絡(luò)布局演變在很大程度上有助于數(shù)據(jù)流多徑承載的實施。
同時,傳統(tǒng)網(wǎng)絡(luò)[3]在部署網(wǎng)元時將控制和轉(zhuǎn)發(fā)功能集網(wǎng)元于一體的做法在很大程度上增加了硬件的開銷代價,尤其在面對突發(fā)數(shù)據(jù)流風(fēng)暴情形時,往往因設(shè)備計算資源的耗竭而無法實時響應(yīng)數(shù)據(jù)流的局向計算請求,這勢必導(dǎo)致業(yè)務(wù)失效等風(fēng)險的產(chǎn)生。相比之下,主張控制轉(zhuǎn)發(fā)解耦設(shè)計的軟件定義網(wǎng)絡(luò)架構(gòu),部署在全網(wǎng)中能夠良好地降低系統(tǒng)在處理突發(fā)數(shù)據(jù)流計算請求期間對硬件資源的偏好。從邏輯層次上,軟件定義網(wǎng)絡(luò)結(jié)構(gòu)從下到上依次為:包含交換機(jī)在內(nèi)的大量網(wǎng)元組成的轉(zhuǎn)發(fā)層、用于實施數(shù)據(jù)流局向策略計算的控制層、以及用于部署大量功能的網(wǎng)絡(luò)應(yīng)用層。其中,控制層中的監(jiān)聽模塊可通過南向接口搜集到承載了突發(fā)數(shù)據(jù)流載荷的網(wǎng)絡(luò)實時參量,包含數(shù)據(jù)流特性、拓?fù)涞?。所以,將控制轉(zhuǎn)發(fā)解耦設(shè)計的軟件定義網(wǎng)絡(luò)結(jié)構(gòu)融合到數(shù)據(jù)中心[4]網(wǎng)絡(luò),可顯著地提升在全局視域下隨機(jī)突發(fā)業(yè)務(wù)失效風(fēng)險管理的效率。因此,在軟件定義胖樹數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)上實施隨機(jī)突發(fā)重載數(shù)據(jù)流局向風(fēng)險抗毀是一個行之有效的解決方案。
當(dāng)前,在軟件定義胖樹數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)上開展風(fēng)險評估的研究較多,其中主要以全局最先匹配策略[5]和等開銷多徑計算機(jī)制[6]為主。全局最先匹配策略的計算過程對網(wǎng)絡(luò)開銷的依賴度較低,算法在執(zhí)行過程中將對網(wǎng)絡(luò)當(dāng)前輕載鏈路的冗余帶寬和隨機(jī)突發(fā)重載數(shù)據(jù)流載荷帶寬展開對比,一旦遍歷到符合該重載流帶寬需求的選項時馬上對該流實施轉(zhuǎn)發(fā)。顯然這種未經(jīng)過多徑比較篩查的選項具備較強(qiáng)的局部性。對于等開銷多徑計算機(jī)制,其核心思想是在全網(wǎng)中計算出具有相同的最小權(quán)值的路由集合,然后在集合的可選項中均衡該數(shù)據(jù)流載荷。但此舉只能適應(yīng)固定模式的數(shù)據(jù)流,當(dāng)突發(fā)數(shù)據(jù)流的隨機(jī)特性引發(fā)全局鏈路參量發(fā)生變化時,該機(jī)制在數(shù)據(jù)流載荷比例調(diào)配方面顯得束手無策。顯然,該機(jī)制缺乏動態(tài)適應(yīng)性。
為應(yīng)對突發(fā)數(shù)據(jù)流隨機(jī)特性引發(fā)的重載流業(yè)務(wù),在疏導(dǎo)過程中因存在局向瓶頸導(dǎo)致流業(yè)務(wù)失效風(fēng)險的問題,本文從全局適應(yīng)性角度出發(fā)提出一種全局視域下約束性載荷感知局向瓶頸風(fēng)險抗毀算法。算法通過緊密結(jié)合多變的網(wǎng)絡(luò)狀態(tài)、流的隨機(jī)特性,遍歷全局網(wǎng)元局向的可用開銷資源,為重載突發(fā)流規(guī)劃出一條科學(xué)的局向,規(guī)避局向過程中潛在的瓶頸風(fēng)險。
局向瓶頸風(fēng)險抗毀方案依托軟件定義胖樹數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的優(yōu)勢,利用控制層的偵聽模塊經(jīng)由南向接口[7]為轉(zhuǎn)發(fā)層網(wǎng)元節(jié)點和局向資源依次開展分布式計算。首先,根據(jù)轉(zhuǎn)發(fā)層交換網(wǎng)元節(jié)點內(nèi)存中當(dāng)前的承載度和執(zhí)行轉(zhuǎn)發(fā)作業(yè)的門限[8]評估出該交換網(wǎng)元節(jié)點的剩余可用開銷資源,確保該交換轉(zhuǎn)發(fā)網(wǎng)元足以應(yīng)對隨機(jī)突發(fā)重載數(shù)據(jù)流的轉(zhuǎn)發(fā),并在交換轉(zhuǎn)發(fā)網(wǎng)元遭遇隨機(jī)突發(fā)重載數(shù)據(jù)流阻塞之前提前切換至其他交換轉(zhuǎn)發(fā)單元,以規(guī)避重載流在轉(zhuǎn)發(fā)過程中因網(wǎng)元節(jié)點資源耗竭而陷入二次局向失效的風(fēng)險。其次,根據(jù)轉(zhuǎn)發(fā)層信息代理單元所統(tǒng)計的局向最大帶寬和承載度評估出局向冗余帶寬,以規(guī)避重載流在轉(zhuǎn)發(fā)過程中遭遇鏈路瓶頸的二次局向失效的風(fēng)險。然后,結(jié)合前兩個步驟的評估結(jié)果,計算出任意兩個交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點之間的可用局向列表并形成集合。最后,對可用局向的瓶頸帶寬資源進(jìn)行評估,規(guī)劃出具有全局自適應(yīng)能力的最佳局向,從而實現(xiàn)抗毀隨機(jī)突發(fā)重載數(shù)據(jù)流載荷在局向過程中面臨的瓶頸風(fēng)險[9]。
作為部署全局視域下約束性載荷感知局向瓶頸風(fēng)險抗毀算法的重要平臺,設(shè)計算法前需先為該軟件定義胖樹數(shù)據(jù)中心網(wǎng)絡(luò)構(gòu)建適宜的數(shù)學(xué)模型以便求解抗毀局向方案。根據(jù)引言部分關(guān)于網(wǎng)絡(luò)架構(gòu)的描述,本次定義一個含有4個集群[10]的軟件定義胖樹數(shù)據(jù)中心用于輔助算法模型的設(shè)計,具體描述如下:
令主機(jī)層的主機(jī)集合為H,轉(zhuǎn)發(fā)層中的鏈路局向集合和交換轉(zhuǎn)發(fā)網(wǎng)元集合為R、LE。定義局向子集和交換轉(zhuǎn)發(fā)網(wǎng)元子集的帶寬資源為B(r)、B(le)。將部署在網(wǎng)絡(luò)中的某一條隨機(jī)突發(fā)數(shù)據(jù)流的固有帶寬定義為B(dfi),則部署在全網(wǎng)中的數(shù)據(jù)流載荷形成一個集合,記作DF=[df1,df2,df3,...dfi,dfj,...dfn]。根據(jù)上述參數(shù)可搭建交叉矩形陣列DF×R和DF×LE。陣列中的樣本(dfi,r)∈(0,1)和(dfi,le)∈(0,1)表示轉(zhuǎn)發(fā)層中的局向路由和交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點是否承載過第i條隨機(jī)突發(fā)數(shù)據(jù)流。
根據(jù)抗毀方案設(shè)計的第一步驟所述,算法為了避免轉(zhuǎn)發(fā)層中的交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點因處于重載狀態(tài)而無法響應(yīng)突發(fā)數(shù)據(jù)流轉(zhuǎn)發(fā)作業(yè),算法為交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點賦予一個作業(yè)門限Pth來評估該網(wǎng)元的最大開銷資源占用率。同時,轉(zhuǎn)發(fā)層中的局向管理功能通過分析當(dāng)前交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點的帶寬使用程度,將那些超出作業(yè)門限Pth的網(wǎng)元節(jié)點集合排除在外,再對其余交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點的可用帶寬資源展開計算,篩選出理想的交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點。鑒于軟件定義胖樹數(shù)據(jù)中心網(wǎng)絡(luò)上的突發(fā)數(shù)據(jù)流規(guī)模具有隨機(jī)特性,故此處引入RS來表征該隨機(jī)突發(fā)數(shù)據(jù)流規(guī)模的相對穩(wěn)定度。當(dāng)流途徑轉(zhuǎn)發(fā)層中的某一個交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點時,相對穩(wěn)定度符合:
RS=Mid{|(dfi,le)·B(dfi)
-Mid[(dfj,le)·B(dfj)]|}
由該式所求的參量RS值與隨機(jī)突發(fā)數(shù)據(jù)流的相對穩(wěn)定度呈反比關(guān)系。故,在此再定義一個調(diào)節(jié)變量θ用于動態(tài)管理交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點面臨資源耗竭的風(fēng)險。當(dāng)網(wǎng)絡(luò)在實時狀態(tài)下的RS值較大,該突發(fā)隨機(jī)數(shù)據(jù)流規(guī)模表現(xiàn)出的相對穩(wěn)定性較弱。此時,為了避免該交換轉(zhuǎn)發(fā)網(wǎng)元因隨機(jī)突發(fā)重載數(shù)據(jù)流的到來引發(fā)轉(zhuǎn)發(fā)失效的風(fēng)險,可通過動態(tài)[11]調(diào)節(jié)變量θ來適當(dāng)降低Pth值;反之,通過動態(tài)調(diào)節(jié)變量θ適當(dāng)增加Pth值。此調(diào)節(jié)行為可表征為:Pth(le)=1-θ·RS。
求出局向權(quán)重:
IB(r)=ψ·σ(r)·B(r)-
抗毀方案的第三步驟,是建立在一定約束條件下來實施該局向瓶頸風(fēng)險的抗毀算法。首先假設(shè)軟件定義胖樹數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)下的轉(zhuǎn)發(fā)層中,所有的交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點在承載隨機(jī)突發(fā)數(shù)據(jù)流載荷時,輸入流的規(guī)模及數(shù)量與輸出流的規(guī)模及數(shù)量無任何差異[13]。即:
其次,全網(wǎng)中途經(jīng)局向r的所有隨機(jī)突發(fā)數(shù)據(jù)流載荷總帶寬不得超過局向在實時狀態(tài)下的最大載荷資源。也就是:
本次選擇Mininet 2.2.1平臺搭建軟件定義4元胖樹數(shù)據(jù)中心網(wǎng)絡(luò)作為局向瓶頸風(fēng)險抗毀算法的評估環(huán)境[15]。全局設(shè)立4個Pod,Pod中的交換轉(zhuǎn)發(fā)網(wǎng)元采用Openswitch,控制單元采用Ryu。每個Pod包含4個主機(jī)、2個接入層交換機(jī)、2個聚合層交換機(jī)。核心層共4個核心交換機(jī)。同時由Iperf軟件每5秒鐘代為生成隨機(jī)突發(fā)數(shù)據(jù)流,往返于接入層和聚合層的交換網(wǎng)元對,且每間隔2秒對交換網(wǎng)元接口進(jìn)行一次流參數(shù)狀態(tài)偵聽[16]。接入層和聚合層網(wǎng)元集合中的交換資源均為300 Mbit/s,核心層的網(wǎng)元集合中交換資源均為1 Gbit/s,全網(wǎng)局向資源為100 Mbit/s。核心層網(wǎng)元集合到聚合層網(wǎng)元集合的局向最大承重度缺省為0.8,聚合層網(wǎng)元集合到接入層網(wǎng)元集合的局向最大承重度缺省為0.7,交換網(wǎng)元的轉(zhuǎn)發(fā)作業(yè)門限缺省為0.7。隨機(jī)突發(fā)數(shù)據(jù)流的重載和輕載規(guī)模分別遵循[10 Mbit/s,100 Mbit/s]和[10 Kbit/s,100 Kbit/s],且數(shù)據(jù)流規(guī)模呈指數(shù)級遞增態(tài)勢。
由引言可知,當(dāng)前在軟件定義胖樹結(jié)構(gòu)的數(shù)據(jù)中心網(wǎng)絡(luò)上對隨機(jī)突發(fā)數(shù)據(jù)流量載荷開展風(fēng)險評估的主流思想是全局最先匹配策略和等開銷多徑計算機(jī)制。前者策略實施過程效率較高,擺脫了傳統(tǒng)算法在計算復(fù)雜度簡化方面的困擾,降低了算法對網(wǎng)絡(luò)硬件的偏好程度。然而該決策僅僅收斂于當(dāng)前局向的統(tǒng)計結(jié)果,也就是當(dāng)算法第一次統(tǒng)計到某一條局向適合用于轉(zhuǎn)發(fā)當(dāng)前重載數(shù)據(jù)流時,便將該條局向視為最佳解決方案,后續(xù)將不再開展深度統(tǒng)計與對比。這樣的收斂結(jié)果勢必存在潛在的二次局向瓶頸風(fēng)險。后者計算機(jī)制的思想是在篩選出的等開銷局向集合中對當(dāng)前重載數(shù)據(jù)流實行均衡分流,這在固定模式的網(wǎng)絡(luò)狀態(tài)下較為適用。但網(wǎng)中隨機(jī)突發(fā)特征數(shù)據(jù)流呈現(xiàn)指數(shù)級增長態(tài)勢,這就決定了篩選出的等開銷局向集合中每一個局向的鏈路實時狀態(tài)均為多變。然而等開銷計算機(jī)制依舊以均衡分流重載數(shù)據(jù)流為目標(biāo),忽略了環(huán)境多變情形下等開銷局向集合中既有鏈路的閑置開銷資源是否足以應(yīng)對計算機(jī)制為其分配的分流作業(yè)。顯然,上述兩種主流思想均缺乏全局視域性[17]。因此本次評估[18]擬定網(wǎng)元重載頻率、局向時長、全局帶寬使用率三個測試指標(biāo)考察局向瓶頸風(fēng)險抗毀算法的性能。
對隨機(jī)突發(fā)重載數(shù)據(jù)流載荷實施局向,應(yīng)同時克服兩大瓶頸方可抗毀局向過程中面臨的二次局向風(fēng)險。其一,對于承載了多業(yè)務(wù)流的交換網(wǎng)元轉(zhuǎn)發(fā)節(jié)點而言,頻繁遭遇重載的處境將嚴(yán)重束縛該節(jié)點估算風(fēng)險抗毀局向的能力。其二,對于全局網(wǎng)絡(luò)中可用的路由集合而言,其剩余可用帶寬資源因全網(wǎng)鏈路狀態(tài)的實時性而有所變化,且大小不一。如果缺乏對剩余鏈路可用帶寬資源的合理比較和評估,直接用于執(zhí)行轉(zhuǎn)發(fā)作業(yè),在轉(zhuǎn)發(fā)過程中極有可能陷入轉(zhuǎn)發(fā)瓶頸進(jìn)而降低了全局帶寬使用率。未能經(jīng)過科學(xué)評估的交換轉(zhuǎn)發(fā)網(wǎng)元和路由局向,在實施載荷承載期間,局向時長總體較大。交換網(wǎng)元轉(zhuǎn)發(fā)節(jié)點遭遇重載的頻率、局向時長、全局帶寬使用率分別如圖1~圖3所示。
(1) 重載頻率
根據(jù)圖1記錄的數(shù)據(jù)顯示,在對軟件定義胖樹結(jié)構(gòu)的數(shù)據(jù)中心網(wǎng)絡(luò)實施算法部署后,交換轉(zhuǎn)發(fā)網(wǎng)元遭遇重載的頻率各異,其中,最為平穩(wěn)的便是本文設(shè)計的抗毀算法,而實施等開銷多徑計算機(jī)制下的網(wǎng)元呈現(xiàn)出最高的重載頻次。這意味著等開銷多徑計算機(jī)制無法結(jié)合全局鏈路實時承載參數(shù)科學(xué)地計算出隨機(jī)突發(fā)重載數(shù)據(jù)流載荷的轉(zhuǎn)發(fā)局向。相對而言,全局最先匹配策略下的交換轉(zhuǎn)發(fā)網(wǎng)元出現(xiàn)重載的頻率有所下降。但是終究因其缺乏深度計算與對比[19]而不具備長期優(yōu)勢。由于突發(fā)數(shù)據(jù)流的隨機(jī)特性呈現(xiàn)出指數(shù)級變化,當(dāng)網(wǎng)絡(luò)流量逐步飽和甚至超過算法的計算門限,三種評估方案下的重載頻率基本靠近。但在未超越計算門限的前提下,本文設(shè)計的抗毀算法始終表現(xiàn)出相對優(yōu)勢。
圖1 不同方案的重載頻率
(2) 局向時長
算法在開展風(fēng)險抗毀的局向計算之前需要先由控制層中的控制單元向轉(zhuǎn)發(fā)層的信息代理模塊發(fā)起代理請求,搜索全網(wǎng)參量并返回給控制單元。控制單元為隨機(jī)突發(fā)數(shù)據(jù)流計算出一個流表項后再寫入轉(zhuǎn)發(fā)層交換網(wǎng)元內(nèi)存的流表中,為該流提供轉(zhuǎn)發(fā)依據(jù)。繁瑣的初始化使得三種方案在應(yīng)對隨機(jī)突發(fā)數(shù)據(jù)流初期(即:10 Mbit/s)均消耗了較大的局向時間,如圖2所示。內(nèi)存中既存的流表資源足以應(yīng)對不斷增加的數(shù)據(jù)流(即:102Mbit/s)的轉(zhuǎn)發(fā)請求,三種方案下的局向時間相對初始化階段均有明顯縮短。但在隨后相當(dāng)長一段時間內(nèi),三種方案的局向時長開始呈現(xiàn)顯著的差異[20]。如:當(dāng)流的數(shù)量和規(guī)模持續(xù)增至103Mbit/s,面對忙碌的網(wǎng)絡(luò)狀態(tài),全局最先匹配策略依舊主張當(dāng)前待計算的局向只要符合最短路由就馬上作為轉(zhuǎn)發(fā)的最佳選項。這種極具偶然性的收斂思想在應(yīng)對長期指數(shù)級增長的數(shù)據(jù)流規(guī)模時,時長指標(biāo)優(yōu)勢保持的不太明顯。等開銷多徑計算機(jī)制主張在等權(quán)值的路由選項集合中開展多徑均衡,因不適應(yīng)復(fù)雜多變的數(shù)據(jù)流對載荷的動態(tài)需求,使其在局向時長方面收效甚微。相比之下,本文設(shè)計的抗毀算法因引入了重載阻塞估算機(jī)制,故表現(xiàn)的局向時長總體最短。
圖2 不同方案的局向時長
(3) 全局帶寬使用率
圖3統(tǒng)計了全局帶寬使用率在三種方案中的差異程度。當(dāng)網(wǎng)絡(luò)處于輕載,即低于10 Mbit/s時,全局充裕的閑置帶寬資源未能有效地區(qū)別算法的科學(xué)性,故圖中的3條曲線走勢較為接近。伴隨網(wǎng)絡(luò)載荷度的增加,三種方案下的全局帶寬使用率總體呈現(xiàn)遞增趨勢,同時出現(xiàn)算法的差異程度。當(dāng)增至103Mbit/s時,全網(wǎng)飽和的承載度對算法產(chǎn)生了考驗:缺乏網(wǎng)絡(luò)實時狀態(tài)感知的等開銷多徑計算機(jī)制終因有限的重疏導(dǎo)能力而無法促成良好的全局帶寬使用率;最先匹配策略因堅持首次即最佳的思想,故僅在短期內(nèi)具備有限的相對優(yōu)勢;本文設(shè)計的風(fēng)險抗毀算法通過綜合[21]考量全局多變的網(wǎng)絡(luò)、節(jié)點、路由、流等狀態(tài),對可選的動態(tài)路由集合展開動態(tài)評估,最終規(guī)劃出一條科學(xué)的轉(zhuǎn)發(fā)局向,有效抗毀了轉(zhuǎn)發(fā)過程中潛在的二次局向瓶頸風(fēng)險。因此使用本文算法表現(xiàn)的帶寬使用率最佳。
圖3 不同方案的帶寬使用率
綜合上述三組測試方案不難得知,算法的差異性只有在全局冗余帶寬資源不足以應(yīng)對隨機(jī)突發(fā)重載數(shù)據(jù)流轉(zhuǎn)發(fā)時才得以體現(xiàn)。在滿足系統(tǒng)吞吐量[22]低于算法計算門限的約束前提下,本文構(gòu)思的抗毀算法在三組測試中的表現(xiàn)均領(lǐng)先于當(dāng)前兩種主流的風(fēng)險評估算法[23]。