国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

算網(wǎng)感知能力與關(guān)鍵技術(shù)研究

2023-12-15 07:39:04蔡旭輝董曉荔趙宇顧明楊海馮圓媛周逸飛
中國信息化 2023年11期
關(guān)鍵詞:算力調(diào)度協(xié)同

文|蔡旭輝 董曉荔 趙宇 顧明 楊海 馮圓媛 周逸飛

一、算網(wǎng)感知概述

在當(dāng)前數(shù)據(jù)經(jīng)濟(jì)時代,算力已成為一種新型生產(chǎn)力,為各行各業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型提供動力。在應(yīng)對當(dāng)前社會大量信息處理的挑戰(zhàn)下,算力網(wǎng)絡(luò)將全網(wǎng)內(nèi)各方的算力通過網(wǎng)絡(luò)進(jìn)行匯聚從而更方便地進(jìn)行管理和調(diào)度,進(jìn)而為各類用戶提供服務(wù)。算力網(wǎng)絡(luò)的發(fā)展趨勢是將多方算力和網(wǎng)絡(luò)進(jìn)行融合,逐步形成算網(wǎng)一體化的過程。

算網(wǎng)感知是算網(wǎng)一體的前提,通過打通網(wǎng)絡(luò)領(lǐng)域、計算領(lǐng)域、應(yīng)用領(lǐng)域的信息邊界,為進(jìn)一步協(xié)同、調(diào)度、融合提供基礎(chǔ)。算網(wǎng)感知包括算力感知、網(wǎng)絡(luò)感知、應(yīng)用感知及多維資源協(xié)同感知,感知的數(shù)據(jù)包括算網(wǎng)性能數(shù)據(jù)、告警數(shù)據(jù)、日志等,資源數(shù)據(jù)包括算網(wǎng)各域物力資源、邏輯資源信息以及編排中心已有業(yè)務(wù)實例的資源信息。

當(dāng)前各領(lǐng)域內(nèi)都有相對成熟的數(shù)據(jù)感知體系,并且長時間獨立發(fā)展,自成一派,暫未打通融合。算力網(wǎng)絡(luò)中缺少統(tǒng)一、全局性的算網(wǎng)狀態(tài)實時采集、感知、呈現(xiàn)能力;亟須構(gòu)建算網(wǎng)感知能力,逐步融合、統(tǒng)一現(xiàn)有的算網(wǎng)感知體系,形成算網(wǎng)一體化的數(shù)據(jù)感知體系。

二、算網(wǎng)感知能力要求

面向未來的多樣化算力需求、任務(wù)式服務(wù)模式、算網(wǎng)智能調(diào)度,要實現(xiàn)跨專業(yè)領(lǐng)域的多樣化算力協(xié)同,需要將算力、網(wǎng)絡(luò)、動環(huán)等相關(guān)感知數(shù)據(jù)納入統(tǒng)一的算網(wǎng)數(shù)據(jù)感知體系,構(gòu)建統(tǒng)一的算網(wǎng)感知模型,實現(xiàn)算網(wǎng)關(guān)聯(lián)分析、算力算效分析等業(yè)務(wù)分析評估能力,支撐算網(wǎng)業(yè)務(wù)智能編排調(diào)度。

(一)數(shù)據(jù)感知能力

圍繞算力網(wǎng)絡(luò)“算力泛在、算網(wǎng)共生、智能編排、一體共生”的總體目標(biāo),對算網(wǎng)感知能力提出全覆蓋感知、面向需求即時感知、跨專業(yè)協(xié)同感知的能力要求面向未來,算網(wǎng)感知除向下感知資源,也需向上感知業(yè)務(wù)與事件,參與運行支撐算力即取即用。

全覆蓋感知:是算力網(wǎng)絡(luò)實現(xiàn)一體編排、智能調(diào)度的基礎(chǔ)。對于算力而言,實現(xiàn)自有中心云、邊緣云、端算力、社會算力、國家樞紐算力的全量感知。對于網(wǎng)絡(luò)而言,實現(xiàn)端到端網(wǎng)絡(luò)的全面感知,包括入云、云間網(wǎng)絡(luò)端到端的協(xié)同感知等。

即時感知:要求以更實時、更細(xì)粒度、更自動化的方式實現(xiàn)對算網(wǎng)資源狀態(tài)的動態(tài)感知,為算網(wǎng)業(yè)務(wù)提供數(shù)據(jù)支撐。對于算網(wǎng)資源信息需由傳統(tǒng)的定時采集演進(jìn)為變量實時感知;對于算網(wǎng)資源運營相關(guān)數(shù)據(jù)(如分配/回收、使用/占用數(shù)據(jù))實現(xiàn)實時感知同步;對于算網(wǎng)運行態(tài)勢數(shù)據(jù)(如利用率)實現(xiàn)低時間粒度的采集與分析。

協(xié)同感知:面向算網(wǎng)一體共生的目標(biāo),單域運維難以滿足要求,需要實現(xiàn)跨域的協(xié)同感知。對于算力而言,在橫向上實現(xiàn)多種算力的協(xié)同感知;在縱向上需實現(xiàn)物理層、虛擬層、容器層的協(xié)同感知;為滿足算力算效評估的要求,需對算力、動環(huán)、能耗信息等跨專業(yè)領(lǐng)域數(shù)據(jù)進(jìn)行協(xié)同感知。對于網(wǎng)絡(luò)而言,橫向上需要實現(xiàn)跨專業(yè)、端到端網(wǎng)絡(luò)的關(guān)聯(lián),協(xié)同跨專業(yè)網(wǎng)絡(luò)資源,并通過網(wǎng)絡(luò)去感知算力;縱向上需要實現(xiàn)業(yè)務(wù)與資源的關(guān)聯(lián)和協(xié)同。最終實現(xiàn)算網(wǎng)融合感知。

(二)模型構(gòu)建能力

面向算力網(wǎng)絡(luò)服務(wù)方式從資源式向任務(wù)式轉(zhuǎn)變,算網(wǎng)感知系統(tǒng)需具備將算、網(wǎng)資源信息向算力和網(wǎng)絡(luò)運力信息映射的能力;具備基礎(chǔ)算力、運力模型構(gòu)建與封裝能力,支撐算網(wǎng)業(yè)務(wù)的編排調(diào)度。

算網(wǎng)感知系統(tǒng)需要對接多種數(shù)據(jù)源,完成多源異構(gòu)數(shù)據(jù)的匯聚、存儲、處理等數(shù)據(jù)流轉(zhuǎn)環(huán)節(jié)。首先需要對各種異構(gòu)資源建立統(tǒng)一的數(shù)據(jù)模型、維護(hù)各類資源的模型列表、模型屬性等內(nèi)容;通過預(yù)置的數(shù)據(jù)模型,實現(xiàn)對不同來源資源數(shù)據(jù)的歸一化處理。然后再通過資源、狀態(tài)、能效等多維度數(shù)據(jù)統(tǒng)一分析當(dāng)前算力資源、網(wǎng)絡(luò)資源和存儲資源當(dāng)前狀態(tài)情況,并輸出各域資源可服務(wù)率。

(三)分析評估能力

在算網(wǎng)感知系統(tǒng)中,數(shù)據(jù)的分析評估能力也是其核心能力之一,通過采集各算力資源、性能數(shù)據(jù)以及數(shù)據(jù)中心的PUE指標(biāo)和能耗等進(jìn)行分析評估,其結(jié)果用來支撐編排與調(diào)度策略制定與執(zhí)行。

感知系統(tǒng)通過對各專業(yè)工作臺進(jìn)行采集,獲取各類算力模型數(shù)據(jù),以性能利用率指標(biāo)為例,可通過以下方面進(jìn)行分析:

對設(shè)備性能的監(jiān)測。通過監(jiān)控利用率指標(biāo)的情況,能夠及時發(fā)現(xiàn)設(shè)備中存在的如CPU過載等問題,方便運維人員進(jìn)行故障排查。

對設(shè)備容量與資源的分配。利用率可反映當(dāng)前設(shè)備對于不同任務(wù)或應(yīng)用程序的資源使用情況,有助于運維人員進(jìn)行設(shè)備容量與資源的規(guī)劃,確保設(shè)備能夠滿足預(yù)期要求。

對能耗的分析。當(dāng)利用率處于一個較高效且合理的水平時,設(shè)備能夠高效處理任務(wù),這表明該類設(shè)備能夠在相同的時間內(nèi)完成更多的工作量,從而減少任務(wù)執(zhí)行時間,在保證性能的同時降低能耗,從而實現(xiàn)節(jié)能減排的效果。

目前網(wǎng)絡(luò)的度量已經(jīng)比較成熟,算力的度量還缺乏統(tǒng)一標(biāo)準(zhǔn)。在算力網(wǎng)絡(luò)的場景中,需要提供算力和網(wǎng)絡(luò)的綜合服務(wù)。這時需要對算力也有一個方便的度量機(jī)制,這個機(jī)制一方面需要支持對用戶算力需求的描述,另一方面也需要支持對提供算力資源的能力描述。

三、算網(wǎng)感知關(guān)鍵技術(shù)研究

(一)數(shù)據(jù)感知的技術(shù)實現(xiàn)

算力網(wǎng)絡(luò)包含的資源類別和數(shù)量規(guī)模龐大,算網(wǎng)業(yè)務(wù)種類豐富,傳統(tǒng)的數(shù)據(jù)采集方式已無法滿足這種高度復(fù)雜性的需求。從算網(wǎng)感知的需求來看,在不同的業(yè)務(wù)場景中對各類感知數(shù)據(jù)的時效性要求不盡相同,因此在感知層面對于感知數(shù)據(jù)的同步要求也不同。

表1 算網(wǎng)感知數(shù)據(jù)的需求

為了滿足多樣化的數(shù)據(jù)感知需求,從數(shù)據(jù)量、時效性、數(shù)據(jù)準(zhǔn)確性、接口方式等方面綜合考慮,在算網(wǎng)應(yīng)用中可根據(jù)實際情況采用以下4種數(shù)據(jù)感知技術(shù),其適用場景基本可以涵蓋算網(wǎng)感知數(shù)據(jù)的業(yè)務(wù)特性范圍。

1.主動同步

主動同步適合于小批量數(shù)據(jù)即時獲取場景,采用主動請求方式,響應(yīng)快、精度高,一般用于查詢資源狀態(tài)數(shù)據(jù)、配置數(shù)據(jù)、服務(wù)清單等。

在主動同步中被感知系統(tǒng)構(gòu)建RESTful API接口程序,并能在合理時間范圍內(nèi)通過Response Body以JSON格式返回查詢數(shù)據(jù)結(jié)果;算網(wǎng)感知系統(tǒng)構(gòu)建可以調(diào)度RESTful API的服務(wù)程序,可向被感知系統(tǒng)API及時發(fā)起數(shù)據(jù)服務(wù)請求。

2.主動異步

主動異步適合于批量歷史數(shù)據(jù)延時獲取場景,采用主動請求方式,響應(yīng)較慢、數(shù)據(jù)精度較高,一般用于補(bǔ)采歷史一段時間內(nèi)的性能、告警等數(shù)據(jù)。如圖1所示。

圖1 延時響應(yīng)大批量數(shù)據(jù)獲取示意圖

被感知系統(tǒng)構(gòu)建RESTful API接口程序,并能在合理時間范圍內(nèi)通過Response Body以JSON格式返回鑒權(quán)、數(shù)據(jù)下載地址等信息;被感知系統(tǒng)構(gòu)建SFTP/FTP文件傳輸服務(wù),并能在合理時間范圍內(nèi)通過生成文件并上傳文件服務(wù)器;算網(wǎng)感知系統(tǒng)構(gòu)建可以調(diào)度RESTful API的服務(wù),可向被感知系統(tǒng)API及時發(fā)起數(shù)據(jù)請求;系統(tǒng)構(gòu)建可下載文件的服務(wù)程序,可通過SFTP/FTP協(xié)議下載數(shù)據(jù)文件。

3.被動實時

被動實時適合于大量數(shù)據(jù)流實時獲取場景,采用被動通知方式,響應(yīng)快、精度高,一般用于實時接收并需要進(jìn)行流處理海量的性能、告警等數(shù)據(jù)。如圖2所示。

圖2 實時大量數(shù)據(jù)獲取示意圖

被感知系統(tǒng)構(gòu)建適配KAFKA的消息生產(chǎn)程序,并能在合理時間范圍內(nèi)生產(chǎn)并上送信息數(shù)據(jù);被感知系統(tǒng)構(gòu)建KAFKA消息隊列服務(wù),能接收并存儲一段時間范圍內(nèi)的實時消息數(shù)據(jù);算網(wǎng)感知系統(tǒng)構(gòu)建可以消費KAFKA消息的服務(wù)程序,可及時消費消息隊列上的大量消息數(shù)據(jù)。

4.被動準(zhǔn)實時

被動準(zhǔn)實時適合于大批量周期性數(shù)據(jù)準(zhǔn)實時獲取場景,采用被動通知方式,響應(yīng)快,精度較高,一般用于周期性地獲取性能、資源、告警、工單數(shù)據(jù)等。如圖3所示。

圖3 準(zhǔn)實時大批量數(shù)據(jù)獲取示意圖

圖4 算網(wǎng)感知模型分類

被感知系統(tǒng)構(gòu)建數(shù)據(jù)訂閱通知程序,并能在合理時間范圍內(nèi)通過Http請求Body以JSON格式發(fā)送鑒權(quán)、數(shù)據(jù)下載地址等信息;被感知系統(tǒng)構(gòu)建SFTP/FTP文件傳輸服務(wù),并能在合理時間范圍內(nèi)通過生成文件并上傳文件服務(wù)器;算網(wǎng)感知系統(tǒng)構(gòu)建RESTful API服務(wù),接收被感知系統(tǒng)API及時發(fā)起數(shù)據(jù)訂閱通知;構(gòu)建可下載文件的服務(wù)程序,可通過SFTP/FTP協(xié)議下載數(shù)據(jù)文件。

(二)算網(wǎng)感知模型的構(gòu)建

雖然算網(wǎng)領(lǐng)域已經(jīng)有相對成熟的感知數(shù)據(jù)體系,但是對于不同的網(wǎng)管、云管系統(tǒng)支持的感知對象以及對象屬性存在較大差異,而且算網(wǎng)之間暫未打通融合,因此,構(gòu)建統(tǒng)一的算網(wǎng)感知模型,是將算力和網(wǎng)絡(luò)的數(shù)據(jù)納入統(tǒng)一的算網(wǎng)數(shù)據(jù)感知體系的前提。

聚焦典型算網(wǎng)業(yè)務(wù)場景梳理感知對象、對象屬性、對象關(guān)系,圍繞感知對象延伸現(xiàn)有的算網(wǎng)資源模型,從資源感知擴(kuò)展到算力節(jié)點感知、支撐算網(wǎng)業(yè)務(wù)開通;增加服務(wù)和業(yè)務(wù)感知維度,實時捕捉服務(wù)、業(yè)務(wù)的狀態(tài),為算網(wǎng)業(yè)務(wù)的動態(tài)調(diào)整能力提供數(shù)據(jù)支撐;區(qū)分靜態(tài)特性、動態(tài)特性,明確各類數(shù)據(jù)的感知時效性要求,構(gòu)建面向業(yè)務(wù)的敏捷、輕量化模型。

例如針對東數(shù)西存業(yè)務(wù),在算網(wǎng)業(yè)務(wù)開通階段,需要感知可用的算力資源、網(wǎng)絡(luò)資源,并根據(jù)策略選擇合適的資源進(jìn)行分配調(diào)度及配置;在業(yè)務(wù)運行階段,需要對業(yè)務(wù)相關(guān)的資源狀態(tài)、關(guān)鍵指標(biāo)進(jìn)行實時監(jiān)控,支撐算網(wǎng)業(yè)務(wù)質(zhì)量保障。

(三)算效評估技術(shù)研究

2022年全國信標(biāo)委發(fā)布了《計算中心有效算力評測體系白皮書》,提出了有效算力的概念、有效算力指標(biāo)CUE的定義和計量方法。傳統(tǒng)意義上,計算中心用計算芯片的規(guī)格算力進(jìn)行性能衡量,常用的計量單位是每秒執(zhí)行的浮點數(shù)運算次數(shù)。這種衡量方式較為簡潔,從宏觀與統(tǒng)計的角度實現(xiàn)算力整體的呈現(xiàn),但缺乏對整型數(shù)據(jù)、存儲等集群系統(tǒng)處理的能力。有效算力是對規(guī)格算力的補(bǔ)充,能夠更為直觀地反映計算系統(tǒng)在特定作業(yè)上的、用戶可獲得的計算能力,是計算計量方法的有力補(bǔ)充。

有效算力指標(biāo)(C U E:C o m p u t i n g U s a g e Effectiveness),是覆蓋計算中心全生命周期評估的指標(biāo)體系,包含了對應(yīng)的方法論、工具和測試數(shù)據(jù)集。可用于評價計算中心建設(shè)的綠色性、先進(jìn)性、實用性。有效算力指標(biāo)可用如下公式進(jìn)行計量:

其中Psi為測試集在基準(zhǔn)軟硬件系統(tǒng)上的實際性能;Pi為測試集在目標(biāo)軟硬件系統(tǒng)上的實際性能。ωi為測試集中不同實際應(yīng)用軟件的權(quán)重。α為調(diào)整系數(shù),建議該常數(shù)值為100。

CUE公式的設(shè)立,可以有效避免多個真實業(yè)務(wù)性能測試所帶來的單位不統(tǒng)一、描述過于復(fù)雜等局面。通過幾何加權(quán)平均的方式獲得一個單一數(shù)值,有助于進(jìn)行定量、對比性分析。

四、算網(wǎng)感知的發(fā)展趨勢

隨著算力網(wǎng)絡(luò)的不斷發(fā)展以及算網(wǎng)業(yè)務(wù)場景的持續(xù)豐富,對算網(wǎng)感知的要求會越來越高,未來算網(wǎng)感知的發(fā)展趨勢包括以下幾個方面:

1.隨著算力技術(shù)的不斷發(fā)展和應(yīng)用,需要持續(xù)完善針對新型算力(如GPU等)與網(wǎng)絡(luò)協(xié)議(如RoCE)的狀態(tài)感知方案,統(tǒng)一量化異構(gòu)算力節(jié)點可用性、連接可用性、網(wǎng)絡(luò)負(fù)載狀態(tài)等指標(biāo)。

2.人工智能算法也可以應(yīng)用于算網(wǎng)感知中,實現(xiàn)面向算力網(wǎng)絡(luò)的數(shù)據(jù)智能感知,算網(wǎng)資源及數(shù)據(jù)的采集和統(tǒng)計向算網(wǎng)智能態(tài)勢感知演進(jìn)。

3.感知數(shù)據(jù)隱私保護(hù):通過引入安全傳輸機(jī)制、數(shù)據(jù)加密算法實現(xiàn)對感知數(shù)據(jù)的保護(hù)。

4.算網(wǎng)感知在實際應(yīng)用中仍存在挑戰(zhàn),例如指標(biāo)算法的可擴(kuò)展性,傳遞的及時性等。未來研究還包括對算法的優(yōu)化、信息傳遞優(yōu)化和智能化等。

總之,算網(wǎng)感知是實現(xiàn)算網(wǎng)業(yè)務(wù)智能編排調(diào)度和一體化運維的重要基礎(chǔ),隨著算力網(wǎng)絡(luò)技術(shù)的不斷發(fā)展、算網(wǎng)業(yè)務(wù)的不斷創(chuàng)新,算網(wǎng)感知技術(shù)將會越來越成熟,為企業(yè)和用戶提供高質(zhì)量、高可靠、有保障的算網(wǎng)業(yè)務(wù)服務(wù)。

五、結(jié)束語

算力網(wǎng)絡(luò)建設(shè)是我國迎接5G時代的重要戰(zhàn)略部署,算力和網(wǎng)絡(luò)融合是未來信息革命的必經(jīng)之路,對各行各業(yè)的轉(zhuǎn)型具有重要意義。而在算力網(wǎng)絡(luò)中缺少對算網(wǎng)狀態(tài)實時采集感能力,本文提出的算網(wǎng)感知三項核心能力及對應(yīng)能力需求的技術(shù)實現(xiàn)旨在推動算網(wǎng)感知關(guān)鍵技術(shù)在算網(wǎng)業(yè)務(wù)中的應(yīng)用,為更好的構(gòu)建算網(wǎng)數(shù)據(jù)感知體系奠定基礎(chǔ),助力算力網(wǎng)絡(luò)建設(shè)。

猜你喜歡
算力調(diào)度協(xié)同
多方求解智能時代算力挑戰(zhàn)
新華月報(2024年7期)2024-04-08 02:10:56
這個第二不一般
都市人(2023年11期)2024-01-12 05:55:06
衛(wèi)星通信在算力網(wǎng)絡(luò)中的應(yīng)用研究
中國電信董事長柯瑞文:算力成為數(shù)字經(jīng)濟(jì)的主要生產(chǎn)力
蜀道難:車與路的協(xié)同進(jìn)化
《調(diào)度集中系統(tǒng)(CTC)/列車調(diào)度指揮系統(tǒng)(TDCS)維護(hù)手冊》正式出版
一種基于負(fù)載均衡的Kubernetes調(diào)度改進(jìn)算法
虛擬機(jī)實時遷移調(diào)度算法
“四化”協(xié)同才有出路
汽車觀察(2019年2期)2019-03-15 06:00:50
三醫(yī)聯(lián)動 協(xié)同創(chuàng)新
临沧市| 滕州市| 吴堡县| 谷城县| 乳山市| 乌拉特中旗| 文水县| 浦城县| 合水县| 含山县| 福贡县| 镇坪县| 中超| 汾西县| 常山县| 新余市| 夏邑县| 平原县| 无锡市| 灵石县| 土默特左旗| 石楼县| 石阡县| 武义县| 淳化县| 盱眙县| 拉萨市| 阿拉善右旗| 花莲县| 会昌县| 玉门市| 龙岩市| 略阳县| 盖州市| 仙居县| 濮阳县| 大关县| 徐水县| 英吉沙县| 建水县| 江城|