易昕昕,馬賀榮,曹暢,唐雄燕
1.中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司研究院,北京 100048
2.山東港口煙臺(tái)港股份有限公司礦石碼頭分公司,信息網(wǎng)絡(luò)中心,山東 煙臺(tái) 264000
隨著各行各業(yè)智能化程度的不斷提升,產(chǎn)業(yè)數(shù)字化、數(shù)字產(chǎn)業(yè)化已逐漸走向深入,這背后是算力的不斷提升在提供保障。同時(shí),在5G、AI、云計(jì)算和大數(shù)據(jù)等新技術(shù)的催化下,產(chǎn)生了海量數(shù)據(jù)交易、AI 模型訓(xùn)練等新場(chǎng)景需求,這也將催生更加豐富和復(fù)雜的信息數(shù)據(jù)。為了應(yīng)對(duì)數(shù)字經(jīng)濟(jì)發(fā)展的這些變化,算力網(wǎng)絡(luò)應(yīng)運(yùn)而生[1-2]。
算力網(wǎng)絡(luò)是指在計(jì)算能力不斷泛在化發(fā)展的基礎(chǔ)上,通過(guò)網(wǎng)絡(luò)手段將計(jì)算、存儲(chǔ)等基礎(chǔ)資源在云-邊-端之間進(jìn)行有效調(diào)配的方式,以此提升業(yè)務(wù)服務(wù)質(zhì)量和用戶(hù)的服務(wù)體驗(yàn)。算力網(wǎng)絡(luò)基于無(wú)處不在的網(wǎng)絡(luò)連接,將動(dòng)態(tài)分布的計(jì)算與存儲(chǔ)資源互聯(lián),通過(guò)網(wǎng)絡(luò)、存儲(chǔ)、算力等多維度資源的統(tǒng)一協(xié)同調(diào)度,使海量的應(yīng)用能夠按需、實(shí)時(shí)調(diào)用泛在分布的計(jì)算資源,實(shí)現(xiàn)連接和算力在網(wǎng)絡(luò)的全局優(yōu)化,提供一致的用戶(hù)體驗(yàn)[3-4]。
SDN 技術(shù)最初核心思想是基于Openflow 的轉(zhuǎn)發(fā)與控制分離,隨著技術(shù)不斷演進(jìn),業(yè)界也在擴(kuò)展SDN 的內(nèi)涵。目前,Openflow 雖然仍是轉(zhuǎn)控分離的核心所在,但已不再是必備條件,因此,網(wǎng)絡(luò)可編程能力慢慢地成為衡量SDN 架構(gòu)的重要標(biāo)準(zhǔn)之一[5]。算力網(wǎng)絡(luò)的最終目標(biāo)是為了使算力成為像水、電一樣,可“一點(diǎn)接入,即取即用”的社會(huì)級(jí)服務(wù)[6],從網(wǎng)絡(luò)的角度來(lái)說(shuō),提供靈活、按需、實(shí)時(shí)的一體化協(xié)同編排調(diào)度能力是必不可少的[7]。
隨著算力網(wǎng)絡(luò)的不斷發(fā)展,基于多級(jí)異構(gòu)算力資源的分布情況,網(wǎng)絡(luò)需要引入網(wǎng)絡(luò)編程的能力,來(lái)實(shí)現(xiàn)服務(wù)的一體化編排與調(diào)度,為用戶(hù)提供一致性的云網(wǎng)融合服務(wù)[8]。網(wǎng)絡(luò)編程的概念源于計(jì)算機(jī)編程,將網(wǎng)絡(luò)功能指令化,即將業(yè)務(wù)需求翻譯成有序的指令列表,由沿途的網(wǎng)絡(luò)節(jié)點(diǎn)去執(zhí)行,可在任何時(shí)間重新編排任意數(shù)據(jù)包的傳輸路徑,提高網(wǎng)絡(luò)的靈活性,實(shí)現(xiàn)網(wǎng)絡(luò)可編程。
算力網(wǎng)絡(luò)的可編程服務(wù)是基于算力服務(wù)度量、算力服務(wù)標(biāo)識(shí)等算力一體化的能力,再結(jié)合算力的計(jì)算類(lèi)型、服務(wù)類(lèi)型、資源占用情況等因素,來(lái)實(shí)現(xiàn)算力服務(wù)選擇、網(wǎng)絡(luò)路由等網(wǎng)絡(luò)層面的可編程、可控制能力,以此面向用戶(hù)提供最優(yōu)的業(yè)務(wù)服務(wù)。算力網(wǎng)絡(luò)可編程服務(wù)關(guān)鍵在于選擇哪個(gè)算力服務(wù)、如何到達(dá)該服務(wù),以及這兩者如何協(xié)同計(jì)算實(shí)現(xiàn)最優(yōu)。本文將基于算力網(wǎng)絡(luò)基本架構(gòu)詳解可編程服務(wù)路由策略的幾種實(shí)現(xiàn)機(jī)制,詳細(xì)分析各自特點(diǎn)及適用場(chǎng)景,并探討在未來(lái)算力網(wǎng)絡(luò)的持續(xù)發(fā)展中應(yīng)重點(diǎn)考慮哪些技術(shù)問(wèn)題。
業(yè)界對(duì)于算力網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)基本一致,中國(guó)聯(lián)通基于CUBE-Net3.0 網(wǎng)絡(luò)頂層架構(gòu),將算力網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)為服務(wù)提供層、網(wǎng)絡(luò)控制層、算力管理層、服務(wù)編排層,以及算力資源和網(wǎng)絡(luò)轉(zhuǎn)發(fā)層[9],中國(guó)移動(dòng)的算力網(wǎng)絡(luò)體系架構(gòu)分為算網(wǎng)運(yùn)營(yíng)、算網(wǎng)大腦、算網(wǎng)底座三層[10],中國(guó)電信則提出服務(wù)提供層、管理編排層、網(wǎng)絡(luò)控制層、資源層的架構(gòu)分層方案[11]。在這些架構(gòu)設(shè)計(jì)中,一般將算網(wǎng)一體管控、算網(wǎng)一體編排等智能化能力作為編排管控層面,計(jì)算資源、網(wǎng)絡(luò)設(shè)備等基礎(chǔ)設(shè)施作為算網(wǎng)基礎(chǔ)設(shè)施層。
本文秉持這一架構(gòu)設(shè)計(jì)理念,在分析算力網(wǎng)絡(luò)可編程服務(wù)體系時(shí)也遵循這一架構(gòu)思想,從編排管控層與算網(wǎng)基礎(chǔ)設(shè)施層的角色分工來(lái)闡述算力網(wǎng)絡(luò)可編程服務(wù)在路由策略方面的幾種實(shí)現(xiàn)機(jī)制。算力網(wǎng)絡(luò)可編程服務(wù)路由策略關(guān)鍵內(nèi)容包括算力信息通告、算力服務(wù)選擇及算力路由決策三個(gè)部分。
(1)算力信息通告。算力信息通告是指將網(wǎng)絡(luò)中算力節(jié)點(diǎn)的相關(guān)信息和狀態(tài)等進(jìn)行擴(kuò)散與同步,使得相應(yīng)的網(wǎng)元或者管控系統(tǒng)能夠感知算力節(jié)點(diǎn)。在傳統(tǒng)網(wǎng)絡(luò)場(chǎng)景中,信息通告的內(nèi)容是網(wǎng)絡(luò)信息,方式是通過(guò)BGP 等協(xié)議進(jìn)行發(fā)布,在算力網(wǎng)絡(luò)場(chǎng)景中,算力信息通告的具體實(shí)現(xiàn)方式還沒(méi)有完全統(tǒng)一且標(biāo)準(zhǔn)化的路線(xiàn)。
(2)算力服務(wù)選擇。算力服務(wù)選擇是在傳統(tǒng)網(wǎng)絡(luò)引入算力服務(wù)概念后,在算力網(wǎng)絡(luò)路由策略實(shí)現(xiàn)機(jī)制中最為關(guān)鍵、最為核心的部分,其目的是綜合考慮算力服務(wù)狀態(tài)、網(wǎng)絡(luò)狀態(tài)及用戶(hù)需求等多因素,選擇由哪個(gè)具體的算力資源來(lái)為用戶(hù)提供最終服務(wù)。算力服務(wù)選擇需要基于算力信息通告,在獲知了網(wǎng)絡(luò)中算力節(jié)點(diǎn)的信息及狀態(tài)后才能進(jìn)行相應(yīng)的算力服務(wù)選擇。
(3)算力路由決策。算力路由決策是指在明確了目的地址后流量轉(zhuǎn)發(fā)路徑的計(jì)算,在傳統(tǒng)網(wǎng)絡(luò)場(chǎng)景中基于SDN 控制器進(jìn)行網(wǎng)絡(luò)路徑計(jì)算來(lái)實(shí)現(xiàn)業(yè)務(wù)意圖驅(qū)動(dòng),構(gòu)建網(wǎng)絡(luò)可編程服務(wù)能力。在算力網(wǎng)絡(luò)場(chǎng)景中,算力路由決策和上述算力服務(wù)選擇是有機(jī)結(jié)合的。
結(jié)合算力網(wǎng)絡(luò)的基本架構(gòu),算力網(wǎng)絡(luò)可編程服務(wù)路由策略的設(shè)計(jì)方案可以根據(jù)上述內(nèi)容來(lái)進(jìn)行技術(shù)路線(xiàn)劃分。比如算力信息通告是分布式協(xié)議擴(kuò)展還是北向接口集中上報(bào),以及算力服務(wù)選擇和算力路由決策是在集中管控層完成還是交由網(wǎng)元設(shè)備完成,或是集中管控層和網(wǎng)元設(shè)備協(xié)同完成。本文將從這一角度給出三種實(shí)現(xiàn)機(jī)制示例,從實(shí)現(xiàn)流程、特點(diǎn)及適用場(chǎng)景等方面進(jìn)行詳細(xì)分析與探討。
算力網(wǎng)絡(luò)可編程服務(wù)路由策略集中式方式由集中編排管控層實(shí)現(xiàn)智能決策能力,網(wǎng)絡(luò)中的算力節(jié)點(diǎn)信息上報(bào)給編排管控層,由編排管控層完成算力服務(wù)選擇及算力路由決策。集中式實(shí)現(xiàn)方式中編排管控層除了集中的路由控制外,還應(yīng)包括算力度量、算力感知、服務(wù)標(biāo)識(shí)等算力服務(wù)管理能力[12-13]。算網(wǎng)基礎(chǔ)設(shè)施層的網(wǎng)元設(shè)備、算力服務(wù)資源則只需根據(jù)編排管控層的決策執(zhí)行流量轉(zhuǎn)發(fā)行為。
集中式可編程服務(wù)方式在具體應(yīng)用時(shí)又可以基于場(chǎng)景分為三種方式:
(1)整個(gè)網(wǎng)絡(luò)域由一套統(tǒng)一的編排管控層實(shí)現(xiàn)集中編排調(diào)度,所有算力服務(wù)及網(wǎng)絡(luò)信息都上報(bào)到該統(tǒng)一編排管控層,完成可編程服務(wù)編排之后,將指令下放到底層。
(2)根據(jù)網(wǎng)絡(luò)域的區(qū)域劃分設(shè)置分域管控系統(tǒng),再在分域管控系統(tǒng)上層設(shè)置統(tǒng)一的編排管控層實(shí)現(xiàn)端到端的編排調(diào)度。每個(gè)網(wǎng)絡(luò)域內(nèi)的算力服務(wù)和網(wǎng)絡(luò)信息上報(bào)給該域內(nèi)管控系統(tǒng),經(jīng)由域內(nèi)管控系統(tǒng)進(jìn)行數(shù)據(jù)處理后再上報(bào)給統(tǒng)一編排管控層,最上層統(tǒng)一編排管控層只關(guān)心各個(gè)網(wǎng)絡(luò)域之間的編排調(diào)度等,由域內(nèi)管控系統(tǒng)完成各自域內(nèi)的可編程管理。
(3)基于網(wǎng)絡(luò)域和云池分別設(shè)置網(wǎng)絡(luò)管控系統(tǒng)和云管控系統(tǒng),再在上層設(shè)置統(tǒng)一的編排管控層實(shí)現(xiàn)云網(wǎng)一體的端到端的編排調(diào)度。網(wǎng)絡(luò)管控系統(tǒng)負(fù)責(zé)網(wǎng)絡(luò)信息的收集與管理,云管控系統(tǒng)負(fù)責(zé)云池內(nèi)算力服務(wù)的算力度量、感知及管理,最上層統(tǒng)一編排管控層實(shí)現(xiàn)跨云網(wǎng)的編排調(diào)度。
這三種方式雖然在具體實(shí)現(xiàn)上是基于不同應(yīng)用場(chǎng)景的不同編排管控架構(gòu),但其本質(zhì)都是在基礎(chǔ)設(shè)施層之上設(shè)置獨(dú)立的管控體系,無(wú)論這一管控體系是一套或是分域設(shè)置,或是分云網(wǎng)設(shè)置,都是統(tǒng)一集中式的,管控體系都需要基于全局信息進(jìn)行端到端的編排調(diào)度,基礎(chǔ)設(shè)施層的網(wǎng)元設(shè)備只需要執(zhí)行上層系統(tǒng)的決策,完成流量轉(zhuǎn)發(fā),不參與任何可編程服務(wù)的管控。
本文基于算力網(wǎng)絡(luò)可編程服務(wù)的應(yīng)用場(chǎng)景,從算網(wǎng)信息通告、服務(wù)編排及業(yè)務(wù)流量轉(zhuǎn)發(fā)三個(gè)部分給出實(shí)現(xiàn)流程示意:
(1)算力服務(wù)及網(wǎng)絡(luò)信息通告:
圖1 集中式的三種架構(gòu)Fig.1 Three architectures of centralized
①編排管控層對(duì)算力服務(wù)的度量值、狀態(tài)信息、資源類(lèi)型、服務(wù)類(lèi)型、網(wǎng)絡(luò)位置等相關(guān)信息進(jìn)行采集(采集既可以是算力服務(wù)主動(dòng)上報(bào),也可以是上層系統(tǒng)按需拉取)。
②編排管控層對(duì)網(wǎng)絡(luò)相關(guān)信息進(jìn)行采集,包括網(wǎng)元設(shè)備、端口、鏈路等靜態(tài)信息,以及帶寬利用率、時(shí)延、丟包等動(dòng)態(tài)信息。
③編排管控層基于算力服務(wù)和網(wǎng)絡(luò)信息繪制全局網(wǎng)絡(luò)拓?fù)洹?/p>
(2)服務(wù)編排流程:
①用戶(hù)在上層系統(tǒng)輸入業(yè)務(wù)服務(wù)需求,比如需要何種類(lèi)型的業(yè)務(wù)服務(wù),需要何種網(wǎng)絡(luò)SLA 保障等。
②編排管控層根據(jù)用戶(hù)業(yè)務(wù)需求、算力服務(wù)狀態(tài)以及網(wǎng)絡(luò)信息等選取合適的算力服務(wù),并計(jì)算得到面向該業(yè)務(wù)請(qǐng)求的網(wǎng)絡(luò)轉(zhuǎn)發(fā)路徑。
③編排管控層將包含算力服務(wù)節(jié)點(diǎn)的網(wǎng)絡(luò)轉(zhuǎn)發(fā)路徑下發(fā)至用戶(hù)接入網(wǎng)關(guān)。
(3)業(yè)務(wù)流量轉(zhuǎn)發(fā)流程:
算網(wǎng)基礎(chǔ)設(shè)施層的網(wǎng)元節(jié)點(diǎn)及服務(wù)資源根據(jù)上層決策的路徑進(jìn)行流量轉(zhuǎn)發(fā),直至流量到達(dá)用戶(hù)所需的算力服務(wù)進(jìn)行請(qǐng)求處理。
傳統(tǒng)網(wǎng)絡(luò)場(chǎng)景實(shí)現(xiàn)網(wǎng)絡(luò)可編程是基于SDN 控制器進(jìn)行路徑計(jì)算,網(wǎng)絡(luò)設(shè)備按序完成流量轉(zhuǎn)發(fā),這屬于應(yīng)用較為廣泛的集中式管控方式,在傳統(tǒng)網(wǎng)絡(luò)SDN 架構(gòu)基礎(chǔ)上,算力網(wǎng)絡(luò)的算力路由采用集中式的方式,即將所有的感知、編排、管控能力集中在上層進(jìn)行,上層系統(tǒng)承擔(dān)算網(wǎng)大腦的角色,對(duì)于算力和網(wǎng)絡(luò)進(jìn)行精細(xì)化的編排和調(diào)度,面向用戶(hù)提供算網(wǎng)業(yè)務(wù)服務(wù)。目前來(lái)看,集中式路由策略從標(biāo)準(zhǔn)化、設(shè)備能力等方面都較為成熟。
集中式的方式需要上層系統(tǒng)掌握全網(wǎng)詳細(xì)信息,對(duì)于編排管控層的智能計(jì)算、存儲(chǔ)都有一定的要求;同時(shí),當(dāng)網(wǎng)絡(luò)或算力服務(wù)發(fā)生變化,或者當(dāng)用戶(hù)需求或接入位置發(fā)生變化時(shí),需要編排管控層收集相應(yīng)數(shù)據(jù),完成重新計(jì)算編排后再下發(fā)至網(wǎng)絡(luò)頭節(jié)點(diǎn),這一流程所需的時(shí)延在類(lèi)似于智能駕駛等業(yè)務(wù)場(chǎng)景中,會(huì)極大的影響業(yè)務(wù)體驗(yàn),甚至影響業(yè)務(wù)安全。因此,筆者認(rèn)為集中式方式不適用于時(shí)延敏感型業(yè)務(wù),更適用于傳統(tǒng)網(wǎng)絡(luò)中安全防護(hù)等對(duì)傳輸時(shí)延要求不高的應(yīng)用場(chǎng)景。
隨著網(wǎng)絡(luò)設(shè)備動(dòng)態(tài)計(jì)算、智能控制等能力的不斷演進(jìn),分布式技術(shù)路線(xiàn)也在逐漸成熟,算力網(wǎng)絡(luò)可編程服務(wù)路由策略也可以從分布式的角度進(jìn)行設(shè)計(jì),即由網(wǎng)元設(shè)備完成算力感知、算力度量、算力服務(wù)選擇、算力路由決策等能力,這一設(shè)計(jì)方案中,將可編程服務(wù)能力下沉至算網(wǎng)基礎(chǔ)設(shè)施層,由網(wǎng)絡(luò)節(jié)點(diǎn)基于在網(wǎng)計(jì)算能力指導(dǎo)流量轉(zhuǎn)發(fā)。
分布式可編程服務(wù)的服務(wù)編排是隨著用戶(hù)業(yè)務(wù)流量轉(zhuǎn)發(fā)動(dòng)態(tài)完成的,因此其實(shí)現(xiàn)流程可分為算網(wǎng)信息通告及業(yè)務(wù)流量轉(zhuǎn)發(fā)兩個(gè)部分,如圖2 所示。
(1)算力服務(wù)及網(wǎng)絡(luò)信息通告:
①算力云池網(wǎng)關(guān)節(jié)點(diǎn)完成對(duì)池內(nèi)算力服務(wù)信息的采集,包括算力服務(wù)的度量值、狀態(tài)信息、資源類(lèi)型、服務(wù)類(lèi)型、網(wǎng)絡(luò)位置等。
②算力云池網(wǎng)關(guān)節(jié)點(diǎn)將算力服務(wù)的相關(guān)算力信息發(fā)布到網(wǎng)絡(luò)中,同時(shí)應(yīng)攜帶池內(nèi)算力服務(wù)的路由尋址方式。
③網(wǎng)絡(luò)節(jié)點(diǎn)將各個(gè)算力服務(wù)的狀態(tài)及路由在全網(wǎng)進(jìn)行擴(kuò)散和同步,同時(shí)通告如鏈路帶寬、時(shí)延等網(wǎng)絡(luò)SLA 信息。
④網(wǎng)絡(luò)節(jié)點(diǎn)在本地生成各個(gè)算力服務(wù)的路由表項(xiàng),該表項(xiàng)應(yīng)包含每一個(gè)算力服務(wù)的算力狀態(tài)、網(wǎng)絡(luò)狀態(tài)及路由信息等。
(2)業(yè)務(wù)流量轉(zhuǎn)發(fā)流程:
①用戶(hù)業(yè)務(wù)流量進(jìn)入網(wǎng)絡(luò)頭節(jié)點(diǎn),發(fā)起對(duì)于某類(lèi)算力服務(wù)及網(wǎng)絡(luò)SLA 要求的業(yè)務(wù)請(qǐng)求。
②根據(jù)用戶(hù)的服務(wù)請(qǐng)求,網(wǎng)絡(luò)設(shè)備基于本地算力服務(wù)路由表項(xiàng)進(jìn)行算力服務(wù)選擇及路徑計(jì)算,綜合考慮算力服務(wù)和網(wǎng)絡(luò)狀態(tài)與業(yè)務(wù)需求的匹配情況,以及算力負(fù)載等實(shí)時(shí)狀態(tài)。
③后續(xù)網(wǎng)元節(jié)點(diǎn)及算力云池網(wǎng)關(guān)均可基于本節(jié)點(diǎn)收集的網(wǎng)絡(luò)和算力服務(wù)信息進(jìn)行路徑規(guī)劃和計(jì)算,重新編排指導(dǎo)流量轉(zhuǎn)發(fā)路徑。
④最終用戶(hù)業(yè)務(wù)流量到達(dá)目的算力服務(wù)進(jìn)行請(qǐng)求處理。
如用戶(hù)需求是一系列服務(wù)的編排組合,那么到達(dá)下一個(gè)算力服務(wù)的流程參照③、④步驟依序執(zhí)行。
分布式方式是在網(wǎng)絡(luò)和計(jì)算融合的大趨勢(shì)下,基于在網(wǎng)計(jì)算、網(wǎng)絡(luò)智能內(nèi)生等能力創(chuàng)新提出的,分布式可編程服務(wù)需要電信運(yùn)營(yíng)商網(wǎng)絡(luò)設(shè)備的分布式可編程能力為基礎(chǔ),結(jié)合網(wǎng)絡(luò)和云池對(duì)于現(xiàn)有控制協(xié)議的擴(kuò)展和支持,在基礎(chǔ)設(shè)施層實(shí)現(xiàn)算力度量、算力感知、服務(wù)標(biāo)識(shí)、路由決策等可編程服務(wù)能力,由網(wǎng)元設(shè)備基于這些能力綜合考慮用戶(hù)需求、網(wǎng)絡(luò)和算力服務(wù)資源實(shí)時(shí)狀況,進(jìn)行業(yè)務(wù)流量的編排與調(diào)度。
分布式可編程服務(wù)實(shí)現(xiàn)方式將算力服務(wù)與網(wǎng)絡(luò)靈活聯(lián)動(dòng),實(shí)現(xiàn)快速的服務(wù)感知與路由調(diào)度,適用于時(shí)延敏感型服務(wù)場(chǎng)景。典型的應(yīng)用場(chǎng)景如車(chē)聯(lián)網(wǎng)的自動(dòng)駕駛。具體的,行駛中的車(chē)輛自動(dòng)駕駛能力依賴(lài)的算力服務(wù)資源部署在某一個(gè)云資源池,當(dāng)車(chē)輛從一個(gè)區(qū)域快速行駛到另一個(gè)區(qū)域,車(chē)輛新的位置再基于原有網(wǎng)絡(luò)路徑到達(dá)原有算力服務(wù)資源很可能已不再是最優(yōu)算力節(jié)點(diǎn)及最優(yōu)轉(zhuǎn)發(fā)路徑,此時(shí)網(wǎng)絡(luò)節(jié)點(diǎn)則可根據(jù)車(chē)輛位置及網(wǎng)絡(luò)和算力狀態(tài)實(shí)時(shí)計(jì)算,將該車(chē)輛的自動(dòng)駕駛服務(wù)調(diào)度到最優(yōu)算力服務(wù)節(jié)點(diǎn)并計(jì)算最優(yōu)路徑。這樣基于網(wǎng)絡(luò)設(shè)備的分布式能力實(shí)現(xiàn)快速路由收斂,滿(mǎn)足如自動(dòng)駕駛、在線(xiàn)游戲等時(shí)延敏感型場(chǎng)景應(yīng)用的需求。
算力網(wǎng)絡(luò)可編程服務(wù)分布式路由策略的代表技術(shù)方案是CFN(Computing First Network,計(jì)算優(yōu)先網(wǎng)絡(luò))[14],CFN 協(xié)議通過(guò)將算力服務(wù)狀況和網(wǎng)絡(luò)狀態(tài)作為路由信息分布式地發(fā)布和擴(kuò)散到網(wǎng)絡(luò)各個(gè)節(jié)點(diǎn),由CFN 網(wǎng)絡(luò)設(shè)備將用戶(hù)業(yè)務(wù)流量調(diào)度到最合適的算力服務(wù)節(jié)點(diǎn),可實(shí)現(xiàn)用戶(hù)體驗(yàn)最優(yōu)、計(jì)算資源利用率最優(yōu)、網(wǎng)絡(luò)效率最優(yōu)的目的[15]。CFN 協(xié)議延續(xù)了傳統(tǒng)分布式路由協(xié)議的設(shè)計(jì)思路,但目前來(lái)看基于CFN 實(shí)現(xiàn)算力網(wǎng)絡(luò)可編程服務(wù)路由策略仍存在一定難度。一方面,分布式方式中網(wǎng)絡(luò)設(shè)備需要具備算力感知、標(biāo)識(shí)、服務(wù)編排、流量引導(dǎo)等多種智慧能力,對(duì)設(shè)備能力要求非常高;另一方面,網(wǎng)絡(luò)控制協(xié)議的擴(kuò)展和標(biāo)準(zhǔn)化工作也尚未完善,距離真正落地應(yīng)用還存在較大差距;其次,分布式方案將服務(wù)標(biāo)識(shí)、路徑計(jì)算等決策權(quán)交由網(wǎng)絡(luò)中分散的設(shè)備節(jié)點(diǎn),將導(dǎo)致業(yè)務(wù)流量被篡改、被攻擊的危險(xiǎn)性提高。
集中式的方式優(yōu)勢(shì)在于全局的統(tǒng)一管控和減少網(wǎng)絡(luò)設(shè)備的資源消耗,分布式的方式優(yōu)勢(shì)在于路徑重計(jì)算的時(shí)延小,業(yè)務(wù)路徑調(diào)整靈活高效,可以結(jié)合兩種方式根據(jù)網(wǎng)絡(luò)規(guī)模、區(qū)域劃分等具體情況,將集中和分布進(jìn)行協(xié)同實(shí)現(xiàn),面向用戶(hù)提供端到端的算網(wǎng)一體業(yè)務(wù)服務(wù)。
業(yè)界目前也有多種含義的算力網(wǎng)絡(luò)混合式路由策略,本文所描述的混合式是將算力路由決策功能基于全局集中、區(qū)域分布的思路進(jìn)行方案設(shè)計(jì)。在這一實(shí)現(xiàn)機(jī)制中,編排管控層的管控范圍是某些網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)(比如區(qū)域邊界節(jié)點(diǎn)或云池服務(wù)網(wǎng)關(guān)節(jié)點(diǎn)),這些關(guān)鍵節(jié)點(diǎn)基于自身的分布式路由能力,實(shí)現(xiàn)區(qū)域內(nèi)的自主選路等,總體架構(gòu)設(shè)計(jì)見(jiàn)圖3。
圖3 混合式的總體架構(gòu)Fig.3 Overall architecture of hybrid
為了更方便更直觀(guān)的說(shuō)明混合式路由策略的具體實(shí)現(xiàn)機(jī)制,本方案基于SRv6 協(xié)議從算網(wǎng)信息通告、服務(wù)編排及業(yè)務(wù)流量轉(zhuǎn)發(fā)幾個(gè)部分進(jìn)行闡述。
(1)算力服務(wù)及網(wǎng)絡(luò)信息通告流程如圖4:
圖4 混合式的算網(wǎng)信息通告流程Fig.4 Computing and network information notification process of Hybrid
①算力云池服務(wù)網(wǎng)關(guān)節(jié)點(diǎn)完成對(duì)算力服務(wù)信息的采集。
②編排管控層完成對(duì)算力服務(wù)信息的采集。
③算力云池網(wǎng)關(guān)節(jié)點(diǎn)將承載著算力服務(wù)狀態(tài)信息通告給網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn),例如圖中算力云池網(wǎng)關(guān)通過(guò)BGP 等網(wǎng)絡(luò)協(xié)議將算力服務(wù)狀態(tài)信息通告給關(guān)鍵節(jié)點(diǎn)R5。
④算力服務(wù)狀態(tài)信息在網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn)間進(jìn)行擴(kuò)散和同步,如圖中R0,R5 和算力云池網(wǎng)關(guān)之間進(jìn)行算力服務(wù)信息的發(fā)布和同步。
⑤編排管控層完成對(duì)網(wǎng)絡(luò)信息的采集,包括網(wǎng)元設(shè)備、端口、鏈路等靜態(tài)信息,以及帶寬利用率、時(shí)延、丟包等動(dòng)態(tài)信息。
⑥網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)基于算力服務(wù)信息及網(wǎng)絡(luò)信息生成本地路由表項(xiàng)。如表1 所示,以R0 設(shè)備為例,網(wǎng)絡(luò)設(shè)備的本地路由表項(xiàng)包括算力服務(wù)目的地址,以及對(duì)應(yīng)的算力服務(wù)信息及網(wǎng)絡(luò)信息。
表1 混合式網(wǎng)絡(luò)設(shè)備生成的本地路由表項(xiàng)Table 1 Local routing table entries generated by hybrid network devices
(2)服務(wù)編排流程:
①編排管控層根據(jù)用戶(hù)業(yè)務(wù)需求,結(jié)合網(wǎng)絡(luò)狀態(tài)和算力服務(wù)狀態(tài)進(jìn)行協(xié)同路由計(jì)算,選取合適的算力服務(wù),此處協(xié)同路由計(jì)算方法可根據(jù)部署需求進(jìn)行策略設(shè)置,如選擇算力節(jié)點(diǎn)負(fù)載最低的節(jié)點(diǎn),或者選擇網(wǎng)絡(luò)轉(zhuǎn)發(fā)路徑時(shí)延最小的算力節(jié)點(diǎn),或者設(shè)置算力負(fù)載和網(wǎng)絡(luò)時(shí)延的權(quán)重比例得到的最優(yōu)節(jié)點(diǎn)。如業(yè)務(wù)需求是多個(gè)算力服務(wù),則得出一組算力服務(wù)節(jié)點(diǎn)的集合。本例中結(jié)合算力服務(wù)狀態(tài)及網(wǎng)絡(luò)狀態(tài)等,編排管控層選擇了SF2 節(jié)點(diǎn)為該用戶(hù)提供服務(wù)。
②編排管控層基于算力服務(wù)節(jié)點(diǎn)或節(jié)點(diǎn)集合,以及網(wǎng)絡(luò)拓?fù)涞刃畔⑦M(jìn)行關(guān)鍵路徑計(jì)算。本例中基于SF2 的選定計(jì)算得到的關(guān)鍵路徑是(R5,SF2,R8)。
③編排管控層將關(guān)鍵路徑下發(fā)至用戶(hù)接入網(wǎng)關(guān)。
(3)業(yè)務(wù)流量轉(zhuǎn)發(fā)流程,如圖5:
圖5 混合式的業(yè)務(wù)流量轉(zhuǎn)發(fā)流程Fig.5 Service traffic forwarding process of hybrid
①頭節(jié)點(diǎn)R0 將上層系統(tǒng)下發(fā)的關(guān)鍵路徑進(jìn)行壓棧。
②R0 基于本地路由表項(xiàng)計(jì)算到達(dá)R5 的詳細(xì)路徑為(R1,R4,R5),并將其添加到路徑序列組,本域內(nèi)節(jié)點(diǎn)按這一序列組進(jìn)行流量轉(zhuǎn)發(fā)。
③同理,當(dāng)流量達(dá)到R5,則R5 設(shè)備基于本地路由表項(xiàng)計(jì)算達(dá)到SF2 的詳細(xì)路徑為(R6,SF2),本域內(nèi)再基于這一詳細(xì)路徑進(jìn)行流量轉(zhuǎn)發(fā)。
④用戶(hù)業(yè)務(wù)流量到達(dá)算力服務(wù)節(jié)點(diǎn)SF2 進(jìn)行請(qǐng)求處理,處理完成后到達(dá)終點(diǎn)設(shè)備。
可以看到,在服務(wù)編排及流量轉(zhuǎn)發(fā)的過(guò)程中,編排管控層完成了全局集中的關(guān)鍵路徑?jīng)Q策,網(wǎng)元設(shè)備完成了區(qū)域內(nèi)的詳細(xì)路徑?jīng)Q策,通過(guò)這種混合協(xié)同的方式,既可以滿(mǎn)足算力網(wǎng)絡(luò)跨域端到端的一體化管控,又可以實(shí)現(xiàn)快速路徑計(jì)算和調(diào)優(yōu)的能力。
混合式方式綜合了集中式和分布式的優(yōu)點(diǎn),可面向一些時(shí)延敏感且應(yīng)用性強(qiáng)的業(yè)務(wù)場(chǎng)景進(jìn)行應(yīng)用部署,同時(shí)可基于網(wǎng)絡(luò)規(guī)模按需設(shè)置區(qū)域范圍來(lái)靈活實(shí)現(xiàn)混合的維度。例如運(yùn)營(yíng)商網(wǎng)絡(luò)架構(gòu)分為全國(guó)骨干網(wǎng)和各省城域網(wǎng)等多層級(jí)多區(qū)域網(wǎng)絡(luò),則可以將各省城域網(wǎng)作為區(qū)域內(nèi)分布式部署范圍,城域網(wǎng)內(nèi)選定某一關(guān)鍵節(jié)點(diǎn)作為該區(qū)域的分布式計(jì)算節(jié)點(diǎn),上層系統(tǒng)負(fù)責(zé)編排骨干網(wǎng)路徑及到達(dá)某省關(guān)鍵節(jié)點(diǎn)的路徑,由該省關(guān)鍵節(jié)點(diǎn)進(jìn)行省內(nèi)路由計(jì)算及流量調(diào)度。以此降低上層系統(tǒng)的管控壓力,并實(shí)現(xiàn)區(qū)域內(nèi)快速路由的能力。
上述混合式路由策略的設(shè)計(jì)方案中,是由基礎(chǔ)設(shè)施層的關(guān)鍵節(jié)點(diǎn)完成分布式路徑計(jì)算,而算力服務(wù)選擇還是由編排管控層完成。而混合式其實(shí)細(xì)分了多種技術(shù)路線(xiàn),比如可以將算力服務(wù)選擇也下沉到網(wǎng)元節(jié)點(diǎn)或算力云池網(wǎng)關(guān)來(lái)實(shí)現(xiàn),即編排管控層不選定具體的算力服務(wù)節(jié)點(diǎn),由網(wǎng)元設(shè)備基于業(yè)務(wù)需求和算網(wǎng)信息及狀態(tài)進(jìn)行服務(wù)節(jié)點(diǎn)選擇,再將流量導(dǎo)入合適的網(wǎng)絡(luò)路徑中。因此,本文只是給出了混合式方案的一種實(shí)現(xiàn)機(jī)制,根據(jù)不同的服務(wù)需求及思路還可以設(shè)計(jì)更多更為豐富的混合式方案。
算力網(wǎng)絡(luò)可編程的實(shí)現(xiàn)可以有效提升網(wǎng)絡(luò)控制的粒度,快速靈活地編排調(diào)度網(wǎng)絡(luò)能力和算力服務(wù)資源,靈活建立滿(mǎn)足不同需求的業(yè)務(wù)路徑;同時(shí)可以有效提升算網(wǎng)資源的利用率,基于對(duì)算網(wǎng)資源狀態(tài)的實(shí)時(shí)感知,將流量調(diào)度到合適的節(jié)點(diǎn),以實(shí)現(xiàn)最大效能。因此發(fā)展可編程服務(wù)是算力網(wǎng)絡(luò)的有效推動(dòng)技術(shù)手段。
但其中也存在一些挑戰(zhàn):
(1)異構(gòu)算力與網(wǎng)絡(luò)的統(tǒng)一標(biāo)識(shí)和統(tǒng)一尋址
算力網(wǎng)絡(luò)的各個(gè)領(lǐng)域如承載網(wǎng)、云計(jì)算等在其發(fā)展演進(jìn)中形成了相對(duì)獨(dú)立的技術(shù)架構(gòu)和協(xié)議體系,要實(shí)現(xiàn)算力網(wǎng)絡(luò)可編程服務(wù)的一體化編排與調(diào)度,需要實(shí)現(xiàn)各個(gè)域的協(xié)議和技術(shù)底座的統(tǒng)一,如算力域內(nèi),存在多級(jí)(云/邊/端等)、異構(gòu)(CPU/GPU 等)算力之間的統(tǒng)一度量和標(biāo)識(shí)問(wèn)題;算力域和網(wǎng)絡(luò)域之間,則存在路由協(xié)議的統(tǒng)一問(wèn)題,否則無(wú)法實(shí)現(xiàn)算網(wǎng)一體的端到端的服務(wù)尋址。
(2)分布式可編程能力的安全機(jī)制
前文提到在分布式可編程方式中,是由路由節(jié)點(diǎn)分布式的實(shí)現(xiàn)服務(wù)標(biāo)識(shí)和路由決策等,雖然本文給出的混合協(xié)同方式可有效限制分布式?jīng)Q策的范圍,但仍然需要一部分底層設(shè)備來(lái)實(shí)現(xiàn)其管控權(quán),因此流量劫持、服務(wù)標(biāo)識(shí)篡改等安全問(wèn)題依舊存在。隨著算力網(wǎng)絡(luò)可編程服務(wù)的不斷發(fā)展和應(yīng)用,如何在可編程服務(wù)架構(gòu)中設(shè)置合理有效的安全機(jī)制,將是未來(lái)研究的重點(diǎn)之一。
(3)算力服務(wù)對(duì)于IPv6+技術(shù)的支持
算力網(wǎng)絡(luò)以網(wǎng)絡(luò)為核心,實(shí)現(xiàn)算力服務(wù)的一體化編排和調(diào)度,在這個(gè)過(guò)程中,網(wǎng)絡(luò)層面基于IPv6+,尤其是SRv6 技術(shù)在不斷發(fā)展其可編程能力,但是算力網(wǎng)絡(luò)的可編程服務(wù)需要算力服務(wù)的協(xié)同供給,目前來(lái)看,業(yè)界成熟的算力服務(wù)或應(yīng)用能支持SRv6 的非常少,這極大地限制了算網(wǎng)統(tǒng)一尋址和一體化編排調(diào)度,只能采用代理等方式進(jìn)行過(guò)渡。因此,算力網(wǎng)絡(luò)可編程服務(wù)需要產(chǎn)業(yè)界,尤其是服務(wù)供應(yīng)商來(lái)共同推進(jìn)發(fā)展。
算力網(wǎng)絡(luò)可編程服務(wù)前景廣闊,也將是算力網(wǎng)絡(luò)發(fā)展的關(guān)鍵方向之一,本文從可編程服務(wù)內(nèi)涵,算力網(wǎng)絡(luò)可編程路由的幾大模塊入手,分析和設(shè)計(jì)了三種面向不同場(chǎng)景的實(shí)現(xiàn)機(jī)制。集中式可編程服務(wù)路由策略是較為主流、實(shí)現(xiàn)較易的一種方式,隨著網(wǎng)元設(shè)備能力不斷提升,分布式方案也在不斷探索中,而將兩種方式結(jié)合進(jìn)行協(xié)同實(shí)現(xiàn)的混合式方案,可以適用于不同的應(yīng)用場(chǎng)景、算力網(wǎng)絡(luò)規(guī)模等,通過(guò)取長(zhǎng)補(bǔ)短來(lái)提供一種靈活有效的機(jī)制。算力網(wǎng)絡(luò)可編程服務(wù)路由策略的具體實(shí)現(xiàn)機(jī)制仍有非常廣泛的研究探索空間,后續(xù)隨著商業(yè)場(chǎng)景的逐步明確、技術(shù)體系標(biāo)準(zhǔn)的不斷推進(jìn),將進(jìn)一步深入開(kāi)展算力網(wǎng)絡(luò)可編程服務(wù)路由策略及其應(yīng)用方案的研究和落地。
致謝
本文得到了中國(guó)聯(lián)通研究院何濤高級(jí)工程師的幫助,同時(shí)也得到了中國(guó)聯(lián)通研究院王海軍專(zhuān)家的指導(dǎo),謹(jǐn)致謝意!
利益沖突聲明
所有作者聲明不存在利益沖突關(guān)系。