国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大模型融入云平臺(tái),信息化走向數(shù)智化

2024-02-26 01:43鄔賀銓
關(guān)鍵詞:算力模型企業(yè)

鄔賀銓

(中國(guó)工程院,北京 100088)

0 引 言

隨著人工智能[1](artificial intelligence,AI)技術(shù)的興起,大模型成為從信息化走向數(shù)智化的重要驅(qū)動(dòng)力。雖然基于大算力支持和超大規(guī)模語(yǔ)言數(shù)據(jù)作為訓(xùn)練樣本的大模型技術(shù)能夠支持自動(dòng)文摘、機(jī)器翻譯等基礎(chǔ)通用任務(wù),但在醫(yī)療、金融等專(zhuān)業(yè)領(lǐng)域中,由于缺乏行業(yè)知識(shí),無(wú)法滿(mǎn)足定制化、精細(xì)化和行業(yè)化的需求。因此,需要基礎(chǔ)大模型提供方與垂直行業(yè)的企業(yè)合作,共同開(kāi)發(fā)行業(yè)大模型。例如,百度的“文心一言” 大模型就與汽車(chē)、能源、醫(yī)療、金融等11個(gè)行業(yè)的企業(yè)合作,創(chuàng)造了國(guó)內(nèi)首個(gè)全面開(kāi)放的大型語(yǔ)言模型。這樣的合作主要發(fā)生在大型企業(yè)之間,對(duì)于中小型企業(yè)來(lái)說(shuō),直接應(yīng)用這種基礎(chǔ)大型模型仍然存在一定難度。

大模型的興起對(duì)云計(jì)算[2-3]的各個(gè)層面也產(chǎn)生了深遠(yuǎn)的影響,在基礎(chǔ)設(shè)施即服務(wù)(infrastructure as a Service,IaaS)領(lǐng)域,推動(dòng)了存算一體的算力架構(gòu)的出現(xiàn);在平臺(tái)即服務(wù)(platform as a service,PaaS)領(lǐng)域,促進(jìn)了AI PaaS的發(fā)展,支持了專(zhuān)業(yè)大模型的快速構(gòu)建和部署;在模型即服務(wù)(Model as a Service,MaaS)方面,提供了更靈活的模型定制,進(jìn)一步推動(dòng)了云端AI應(yīng)用;而對(duì)軟件即服務(wù)(software as a service,SaaS)而言,大模型通過(guò)創(chuàng)新解決了定制化、成本和服務(wù)質(zhì)量等問(wèn)題,提高了它的實(shí)踐價(jià)值。因此,若將大模型拆分成模塊,利用“IaaS + PaaS + MaaS + SaaS”的組合構(gòu)建全新的云智平臺(tái),將有利于中小型企業(yè)更容易地應(yīng)用AI大模型。

本文第1節(jié)介紹AI的發(fā)展歷程;第2節(jié)介紹大模型的構(gòu)建與應(yīng)用;第3節(jié)介紹MaaS及其工具鏈;第4節(jié)介紹大模型興起對(duì)云服務(wù)產(chǎn)生的影響;第5節(jié)介紹大模型對(duì)企業(yè)數(shù)字化轉(zhuǎn)型的影響;第6節(jié)介紹從云網(wǎng)協(xié)同到算網(wǎng)融合的過(guò)程;第7節(jié)介紹人工智能加速數(shù)智化發(fā)展的趨勢(shì)。

1 AI的演進(jìn)之路:從生成式AI到通用AI

人工智能正以前所未有的速度和規(guī)模發(fā)展,給人類(lèi)社會(huì)帶來(lái)巨大的變革。AI是指計(jì)算機(jī)系統(tǒng)通過(guò)模擬人類(lèi)智能、推理、學(xué)習(xí)、理解和創(chuàng)造等能力,實(shí)現(xiàn)自主決策和執(zhí)行任務(wù)的能力[1]。AI概念自1956年首次提出,經(jīng)過(guò)將近70年的演變與發(fā)展,在越來(lái)越多領(lǐng)域得到廣泛應(yīng)用。迄今為止,AI一共經(jīng)歷了兩代發(fā)展。

第1代AI基于邏輯表示的“符號(hào)主義”,即知識(shí)驅(qū)動(dòng)AI,旨在模仿人類(lèi)的推理和思考能力,例如由IBM開(kāi)發(fā)的“深藍(lán)”計(jì)算機(jī)。知識(shí)驅(qū)動(dòng) AI 的推理過(guò)程完全基于人類(lèi)的經(jīng)驗(yàn),由于缺乏數(shù)學(xué)基礎(chǔ),其推理僅限于數(shù)理邏輯等確定性推理,只能解決特定問(wèn)題。

第2代AI基于神經(jīng)網(wǎng)絡(luò)的“連接主義”,即數(shù)據(jù)驅(qū)動(dòng)AI,旨在利用統(tǒng)計(jì)方法將模型的輸入數(shù)據(jù)轉(zhuǎn)換為輸出結(jié)果。數(shù)據(jù)驅(qū)動(dòng)AI可以分為判別式、生成式以及養(yǎng)成式3種。判別式AI根據(jù)需求分辨內(nèi)容與需求是否匹配,從已有的數(shù)據(jù)中判斷出最符合要求的數(shù)據(jù),主要適用于圖像識(shí)別、推薦系統(tǒng)等,例如2016年的AlphaGo[4]。養(yǎng)成式AI[5]是DeepMind公司于2022年提出的,該AI模型具有類(lèi)似于人類(lèi)嬰孩的思維能力,當(dāng)簡(jiǎn)單物理規(guī)則被打破時(shí)會(huì)表現(xiàn)出驚訝,可以對(duì)集中視頻訓(xùn)練不同的對(duì)象和事件進(jìn)行概括,并且還可以通過(guò)在一個(gè)相對(duì)較小的動(dòng)畫(huà)上集中訓(xùn)練,不斷成長(zhǎng)。生成式AI[6]技術(shù)是近年來(lái)人工智能領(lǐng)域的一個(gè)重要分支,可以通過(guò)對(duì)現(xiàn)有數(shù)據(jù)集的訓(xùn)練來(lái)生成全新的、完全原創(chuàng)的內(nèi)容,主要適用于圖像與自然語(yǔ)言生成。近年來(lái),生成式AI技術(shù)獲得了顯著發(fā)展,2022年以ChatGPT為代表的生成式AI技術(shù)的火爆在全球引起了一股新的AI熱潮。

由2018年的GPT-1發(fā)展到2023年的GPT-4,大模型的參數(shù)(可學(xué)習(xí)的權(quán)重和偏置變量)已從初始的1.17億增長(zhǎng)到了10 000億,訓(xùn)練數(shù)據(jù)也從5 GB增長(zhǎng)到了100 TB,如表1所示。GPT模型參數(shù)量的提升,使得訓(xùn)練結(jié)果越來(lái)越精確,其突飛猛進(jìn)的增長(zhǎng)速度是驚人的。在2年的時(shí)間里,AI模型規(guī)模增長(zhǎng)了25倍,Transformer模型(一種深度學(xué)習(xí)模型框架)更是增長(zhǎng)了275倍。雖然大模型可以在數(shù)據(jù)中心進(jìn)行訓(xùn)練,但其高算力、高效率、低成本的特點(diǎn)將推動(dòng)其上云。在大多數(shù)應(yīng)用場(chǎng)景中,公有云的選用是一種合理的策略。

表1 GPT模型的各種數(shù)據(jù)

伴隨著生成式AI的飛速進(jìn)展,實(shí)現(xiàn)通用AI的曙光已然照入人們的視野。作為一個(gè)知識(shí)和數(shù)據(jù)雙引擎驅(qū)動(dòng)的模型,通用AI不僅滿(mǎn)足單向任務(wù)的處理,還通過(guò)輸入文本對(duì)大模型進(jìn)行訓(xùn)練,他更需要汲取視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等眾多感知信息,進(jìn)行多模態(tài)數(shù)據(jù)的融合,從而豐富其處理的復(fù)雜性和靈動(dòng)性。在應(yīng)對(duì)各項(xiàng)任務(wù)的過(guò)程中,通用AI尋求的是精準(zhǔn)和高效,只需激活模型中與任務(wù)有關(guān)的部分即可,而非全盤(pán)啟動(dòng),以此達(dá)成真正的通用AI的愿景。

2 大模型的構(gòu)建與應(yīng)用:自建與協(xié)作開(kāi)發(fā)的行業(yè)大模型

建設(shè)基礎(chǔ)大模型是企業(yè)實(shí)現(xiàn)數(shù)智化轉(zhuǎn)型不可或缺的一環(huán),這一任務(wù)不僅需要雄厚的計(jì)算力、豐富的數(shù)據(jù)和高級(jí)人才,還要應(yīng)對(duì)不同行業(yè)的獨(dú)特需求,特別是在處理敏感數(shù)據(jù)和遵循嚴(yán)格監(jiān)管的領(lǐng)域。為了應(yīng)對(duì)這一挑戰(zhàn),垂直類(lèi)企業(yè)通常需要與大型互聯(lián)網(wǎng)企業(yè)或?qū)I(yè)研究機(jī)構(gòu)展開(kāi)合作,以共同推動(dòng)特定行業(yè)大模型的開(kāi)發(fā)。

2.1 自建基礎(chǔ)大模型

構(gòu)建基礎(chǔ)大模型,如GPT系列,需要應(yīng)對(duì)多項(xiàng)挑戰(zhàn),包括強(qiáng)大的計(jì)算力、充足的數(shù)據(jù)、高水平的人才、適用的應(yīng)用場(chǎng)景以及完善的生態(tài)鏈。通常,這一任務(wù)由互聯(lián)網(wǎng)大型企業(yè)或?qū)嵙π酆竦难芯繖C(jī)構(gòu)來(lái)承擔(dān)。在垂直行業(yè)中,由于各種因素的制約,自建基礎(chǔ)大模型的實(shí)例相對(duì)較少,但中國(guó)的三大運(yùn)營(yíng)商卻是少數(shù)幾個(gè)擁有這類(lèi)模型的企業(yè)。目前,中國(guó)已經(jīng)擁有近200個(gè)大模型,然而,并非所有模型都具備執(zhí)行任務(wù)所需的充足算力、數(shù)據(jù)和人才資源。

垂直類(lèi)企業(yè)雖然很少擁有自建的基礎(chǔ)大模型,但在某些對(duì)市場(chǎng)監(jiān)管要求嚴(yán)格、對(duì)數(shù)據(jù)安全敏感的領(lǐng)域,核心企業(yè)通常不愿意使用外部大模型。對(duì)于頭部金融機(jī)構(gòu)而言,他們需要自行構(gòu)建大模型,以實(shí)現(xiàn)數(shù)據(jù)和模型的私有化,并在加密環(huán)境中使用私有數(shù)據(jù)進(jìn)行模型的訓(xùn)練和應(yīng)用。然而,創(chuàng)建金融大模型面臨多重挑戰(zhàn)。首先,金融行業(yè)對(duì)數(shù)據(jù)安全性和隱私合規(guī)性的要求非常嚴(yán)格,同時(shí)風(fēng)控對(duì)時(shí)效性和精準(zhǔn)性的要求也很高,一般的基礎(chǔ)大模型在透明性、可信性和專(zhuān)業(yè)性方面可能無(wú)法滿(mǎn)足這些要求,直接遷移為金融大模型的難度較大;其次,金融大數(shù)據(jù)在平衡成本與質(zhì)量時(shí),面臨著數(shù)據(jù)難以共享的問(wèn)題,導(dǎo)致數(shù)據(jù)規(guī)模無(wú)法與通用性語(yǔ)料匹敵,金融大模型難以產(chǎn)生“涌現(xiàn)”效果;最后,本地私有部署需要自建計(jì)算能力設(shè)施,對(duì)軟硬件產(chǎn)品有著嚴(yán)峻的創(chuàng)新性要求,加上大模型參數(shù)規(guī)模較大,這可能會(huì)導(dǎo)致輸入成本較高。

2.2 合作開(kāi)發(fā)行業(yè)大模型

基礎(chǔ)大模型通常通過(guò)通用語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,具備強(qiáng)大的通識(shí)能力,可用于聊天對(duì)話(huà)等多種應(yīng)用場(chǎng)景。然而,這類(lèi)模型缺少特定行業(yè)的專(zhuān)業(yè)知識(shí),因此需要大模型提供方與垂直行業(yè)合作開(kāi)發(fā)行業(yè)大模型,目前存在兩種主要的開(kāi)發(fā)模式。

1)中心化模式。在這種模式下,垂直類(lèi)企業(yè)將其數(shù)據(jù)提供給大模型提供方進(jìn)行再訓(xùn)練,并對(duì)模型進(jìn)行適應(yīng)性?xún)?yōu)化,如圖1所示。此后,進(jìn)行知識(shí)蒸餾、量化以及對(duì)特定場(chǎng)景遷移等操作以縮小模型。但是在這一模式下,大部分工作由基礎(chǔ)大模型的提供方完成,垂直類(lèi)企業(yè)無(wú)法全面掌握模型的開(kāi)發(fā)和優(yōu)化工作。此外,后續(xù)的模型微調(diào)和云邊端部署等工作仍需模型提供方提供支撐,可能存在數(shù)據(jù)在流轉(zhuǎn)過(guò)程中泄漏的風(fēng)險(xiǎn)。

圖1 中心化模式Fig.1 Centralization mode

2)非中心化模式。在這一模式下,大模型提供方會(huì)將訓(xùn)練后的模型提供給垂直行業(yè)的企業(yè),如圖2所示。企業(yè)可以在此基礎(chǔ)上根據(jù)具體的業(yè)務(wù)場(chǎng)景和專(zhuān)有數(shù)據(jù)對(duì)模型進(jìn)行微調(diào),采用自我微調(diào)、有監(jiān)督微調(diào)、指令調(diào)整等方式形成行業(yè)大模型或多個(gè)業(yè)務(wù)小模型。這種方式雖然避免了數(shù)據(jù)泄露的風(fēng)險(xiǎn),但對(duì)企業(yè)自身的技術(shù)能力有較高的要求。同時(shí),預(yù)訓(xùn)練由基礎(chǔ)大模型提供方完成,而微調(diào)由企業(yè)完成,兩者之間提供的數(shù)據(jù)可能存在矛盾。為解決這一問(wèn)題,可采用混迭方式進(jìn)行預(yù)訓(xùn)練與指令微調(diào),并且在預(yù)訓(xùn)練階段引入部分行業(yè)數(shù)據(jù),在微調(diào)階段引入部分通用數(shù)據(jù)。例如,度小滿(mǎn)金融的軒轅模型就是采用這種方式訓(xùn)練的,他們將預(yù)訓(xùn)練數(shù)據(jù)和指令數(shù)據(jù)隨機(jī)混合到一個(gè)訓(xùn)練數(shù)據(jù)中進(jìn)行混合微調(diào),通過(guò)多階段逐漸訓(xùn)練,緩解預(yù)訓(xùn)練和微調(diào)間數(shù)據(jù)不匹配的問(wèn)題,提高模型的表達(dá)、理解、遷移和泛化能力。

圖2 非中心化模式Fig.2 Decentralized mode

3 對(duì)MaaS及其工具鏈的探索

合作開(kāi)發(fā)行業(yè)大模型涉及到多個(gè)領(lǐng)域,如數(shù)字孿生/工業(yè)設(shè)計(jì)、藥物仿真、電網(wǎng)建模、視頻生成、動(dòng)漫渲染等。通常需要這些行業(yè)作為算力網(wǎng)業(yè)務(wù)消費(fèi)者連接到IPv6[7]網(wǎng)絡(luò),以實(shí)現(xiàn)云、網(wǎng)、邊的協(xié)同。IPv6作為統(tǒng)一承載協(xié)議,在打通云、網(wǎng)、邊之間發(fā)揮著重要作用。

互聯(lián)網(wǎng)數(shù)據(jù)中心(internet data center,IDC)作為算力網(wǎng)的業(yè)務(wù)提供者,通過(guò)提供計(jì)算能力成為IaaS的主要組成部分,即算力平臺(tái)。與此同時(shí),算法主要分布在PaaS和SaaS層上,而大模型為這兩個(gè)層級(jí)提供了重要支撐。垂直類(lèi)企業(yè)可以與大模型提供商合作,共同構(gòu)建行業(yè)大模型。然而,對(duì)于中小型企業(yè)來(lái)說(shuō),參與這一過(guò)程仍然是一項(xiàng)挑戰(zhàn)。因此,MaaS應(yīng)運(yùn)而生,它將大模型縮簡(jiǎn)為可以插入中小型企業(yè)本地設(shè)備或公有云的PaaS和SaaS之間的模塊。通過(guò)MaaS,中小型企業(yè)可以根據(jù)自身數(shù)據(jù)對(duì)模型進(jìn)行精細(xì)化調(diào)整,形成適用于企業(yè)的專(zhuān)有模型。

結(jié)合IaaS、PaaS、MaaS和SaaS ,可以構(gòu)建一種全新的云智平臺(tái),該平臺(tái)通過(guò)MaaS將大模型整合進(jìn)云平臺(tái),如圖3所示。MaaS由大模型平臺(tái)(例如基礎(chǔ)大模型、行業(yè)大模型和第三方模型)以及支持MaaS的工具鏈組成,向企業(yè)提供在大模型上再開(kāi)發(fā)和應(yīng)用所需的各項(xiàng)能力。MaaS工具鏈可以提供數(shù)據(jù)管理、模型訓(xùn)練、評(píng)估優(yōu)化、預(yù)測(cè)服務(wù)部署、提示工程以及插件應(yīng)用等功能。盡管基礎(chǔ)大模型在一般場(chǎng)景(如聊天對(duì)話(huà))下表現(xiàn)良好,但在工業(yè)應(yīng)用中,對(duì)確定性的敏感需求可能會(huì)暴露出其本身可信性的不足。因此,工業(yè)大模型需通過(guò)工具鏈引入有監(jiān)督學(xué)習(xí)思維鏈,使推理步驟可解析,并通過(guò)變換場(chǎng)景來(lái)增加遷移學(xué)習(xí)能力。此外,引入反事實(shí)數(shù)據(jù)測(cè)試可以提高模型泛化能力。

圖3 云智平臺(tái)Fig.3 Cloud intelligence platform

目前,國(guó)內(nèi)已涌現(xiàn)出一些提供MaaS工具鏈的平臺(tái),例如百度的“文心千帆”大模型服務(wù)平臺(tái)、華為的盤(pán)古工程、騰訊的混元大模型精調(diào)工具鏈以及阿里云的MaaS平臺(tái)(靈積平臺(tái))。這些平臺(tái)提供了各種控制和導(dǎo)向大模型方向的工具,幫助企業(yè)更好地發(fā)揮大模型的應(yīng)用價(jià)值。

4 大模型推動(dòng)云服務(wù)創(chuàng)新

大模型的崛起對(duì)云計(jì)算各個(gè)層面產(chǎn)生了深遠(yuǎn)的影響,在IaaS中推動(dòng)了存算一體的算力架構(gòu);在PaaS領(lǐng)域促進(jìn)了AI PaaS的發(fā)展,支持了專(zhuān)業(yè)大模型的快速構(gòu)建和部署; 為MaaS提供了更靈活的模型定制,進(jìn)一步推動(dòng)了云端AI應(yīng)用;對(duì)SaaS而言,大模型通過(guò)創(chuàng)新解決了定制化、成本和服務(wù)質(zhì)量等問(wèn)題,提升了實(shí)操價(jià)值。這一系列變革構(gòu)建了更智能、高效的云計(jì)算生態(tài)。

4.1 大模型時(shí)代對(duì)算力網(wǎng)絡(luò)的要求

在大模型時(shí)代,對(duì)算力網(wǎng)絡(luò)的要求將更加嚴(yán)格。

1)感知。算力網(wǎng)絡(luò)需要感知各種應(yīng)用需求,為不同的應(yīng)用提供差異化的服務(wù)水平(service level agreement,SLA)保障。此外,對(duì)于關(guān)鍵應(yīng)用,需要實(shí)時(shí)檢測(cè)性能,以確保用戶(hù)體驗(yàn)達(dá)到最佳水平。

2)實(shí)時(shí)。算力網(wǎng)絡(luò)需要支持對(duì)熱數(shù)據(jù)的即時(shí)計(jì)算,使網(wǎng)絡(luò)時(shí)延低于10 ms。具備低延遲和確定性的網(wǎng)絡(luò)連接有助于縮短服務(wù)器間的梯度同步數(shù)據(jù)的傳輸時(shí)間,從而降低計(jì)算資源的消耗。

3)無(wú)損。消除網(wǎng)絡(luò)數(shù)據(jù)包丟失,以減少由于服務(wù)器集群內(nèi)計(jì)算協(xié)同等待而產(chǎn)生的開(kāi)銷(xiāo)。根據(jù)實(shí)驗(yàn)統(tǒng)計(jì),0.1%的丟包會(huì)引起算力損失50%,因此無(wú)損傳輸是至關(guān)重要的。

4)彈性。提高海量小文件的加載速度,并提高AI大模型圖形處理器(graphics processing unit,GPU)的利用率。理想的網(wǎng)絡(luò)應(yīng)當(dāng)具備合理的存算比,并能夠迅速適應(yīng)對(duì)彈性吞吐量的需求。

5)按需。集成身份/目錄服務(wù)、防火墻、零信任網(wǎng)絡(luò)訪問(wèn)等安全服務(wù),提供可見(jiàn)性和流量管理功能,并支持網(wǎng)絡(luò)即服務(wù)(Network as a Service,NaaS)。

6)智簡(jiǎn)。針對(duì)大模型訓(xùn)練成本,優(yōu)化資源配置,為客戶(hù)提供最優(yōu)的算力接入和使用環(huán)境。

7)安全。確保數(shù)據(jù)能安全傳輸?shù)剿懔?jié)點(diǎn)并安全返回結(jié)果。需要提供算力租戶(hù)間的安全隔離,有效防御外部攻擊和數(shù)據(jù)泄露,實(shí)現(xiàn)終端的安全接入。

8)低碳。通過(guò)優(yōu)化調(diào)度策略、合理利用資源、使用綠色能源等手段,降低能耗,實(shí)現(xiàn)低碳計(jì)算的目標(biāo)。

4.2 大模型推動(dòng)IaaS創(chuàng)新發(fā)展

大模型的興起推動(dòng)了IaaS的創(chuàng)新發(fā)展。IaaS提供包括服務(wù)器、虛擬機(jī)、存儲(chǔ)、網(wǎng)絡(luò)和操作系統(tǒng)等基礎(chǔ)設(shè)施服務(wù),具有彈性伸縮、自助服務(wù)、按需付費(fèi)等特點(diǎn),適用于靈活可擴(kuò)展基礎(chǔ)設(shè)施資源的開(kāi)發(fā)測(cè)試、高性能計(jì)算和容災(zāi)備份等場(chǎng)景[8]。受到大模型對(duì)算力的高需求影響,企業(yè)更趨向于從自建數(shù)據(jù)中心向公有云遷移,從而進(jìn)一步促進(jìn)了IaaS的發(fā)展。盡管MaaS的出現(xiàn)暫時(shí)可能使人們忽視了IaaS的重要性,但實(shí)際上,MaaS在很大程度上仍然依賴(lài)于IaaS的支持。

IaaS主要有兩種模式:常規(guī)的存算分離模式和存內(nèi)計(jì)算模式,如圖4所示。

圖4 IaaS的兩種模式Fig.4 Two modes of IaaS

在大模型訓(xùn)練中,對(duì)帶寬的高需求通常會(huì)導(dǎo)致數(shù)據(jù)傳輸時(shí)延和響應(yīng)速度成為限制因素。無(wú)論是從外部?jī)?chǔ)存器向芯片搬運(yùn)數(shù)據(jù),還是芯片內(nèi)部的數(shù)據(jù)總線傳輸,其物理限速的提升每年僅約為10%,遠(yuǎn)低于芯片算力基于摩爾定律60%~70%的年均增速。這種“存儲(chǔ)墻”現(xiàn)象削弱了算力的利用率。因此,發(fā)展存算一體的算力架構(gòu)成為了一種解決問(wèn)題的方式,能夠減少數(shù)據(jù)搬運(yùn)帶來(lái)的時(shí)延。以阿里智算IaaS服務(wù)為例,其單集群可支持最大十萬(wàn)卡GPU,智算集群可同時(shí)承載多個(gè)萬(wàn)億參數(shù)的大模型進(jìn)行在線訓(xùn)練,并通過(guò)自研的遠(yuǎn)程直接數(shù)據(jù)存取(remote direct memory access,RDMA)網(wǎng)絡(luò)架構(gòu)為萬(wàn)卡規(guī)模的AI集群提供無(wú)擁塞通信,使AI訓(xùn)練效率提升10倍,推理效率提升6倍。

4.3 大模型催生AI PaaS創(chuàng)新發(fā)展

大模型的興起推動(dòng)了PaaS向AI PaaS的創(chuàng)新發(fā)展。PaaS提供了應(yīng)用程序開(kāi)發(fā)和部署的平臺(tái),包括操作系統(tǒng)、開(kāi)發(fā)工具、數(shù)據(jù)庫(kù)、中間件和運(yùn)行時(shí)環(huán)境等,具備自動(dòng)化擴(kuò)展、多租戶(hù)支持等特點(diǎn),適用于簡(jiǎn)化開(kāi)發(fā)過(guò)程、快速部署和擴(kuò)展的場(chǎng)景,如Web應(yīng)用開(kāi)發(fā)和移動(dòng)應(yīng)用開(kāi)發(fā)等。

大模型在性?xún)r(jià)比、可靠性、易用性等方面都面臨著落地的挑戰(zhàn),開(kāi)發(fā)人員迫切希望PaaS能夠增加對(duì)大模型的支持,以便快速構(gòu)建專(zhuān)業(yè)大模型、測(cè)試和部署相關(guān)應(yīng)用。為此,AI PaaS應(yīng)運(yùn)而生,它在PaaS的基礎(chǔ)上集成了AI功能,以支持大模型的端到端并行訓(xùn)練優(yōu)化、場(chǎng)景模型遷移和應(yīng)用集成等需求。同時(shí),AI PaaS也需要得到大模型的支撐。MaaS通過(guò)大模型可優(yōu)選小程序及配套的低代碼開(kāi)發(fā)和模型編排等工具,定制化補(bǔ)充或增強(qiáng)PaaS工具軟件的平臺(tái)能力。

舉例來(lái)說(shuō),阿里低代碼平臺(tái)(aPaaS)允許開(kāi)發(fā)人員創(chuàng)建大規(guī)模應(yīng)用程序,后續(xù)還進(jìn)一步推出了酷應(yīng)用(bPaaS)、連接平臺(tái)(iPaaS)、數(shù)據(jù)平臺(tái)(dPaaS),提供各類(lèi)模型調(diào)度平臺(tái)、模型訓(xùn)練平臺(tái)、插件開(kāi)發(fā)平臺(tái)等服務(wù),不斷細(xì)分深化服務(wù)層次,支持企業(yè)開(kāi)啟各種數(shù)字化的AI場(chǎng)景。此外,百度整合自研飛槳深度學(xué)習(xí)框架和百度文心大模型,打通了樣本中心、模型中心、AI開(kāi)發(fā)平臺(tái)和AI服務(wù)運(yùn)行平臺(tái),實(shí)現(xiàn)了從數(shù)據(jù)存儲(chǔ)到模型訓(xùn)練、生產(chǎn)、部署、測(cè)試的全鏈路、批量化生產(chǎn)。

4.4 大模型重新定義SaaS

大模型為SaaS帶來(lái)了全新的定義。SaaS作為一種將軟件應(yīng)用程序作為服務(wù)提供的模式,廣泛涵蓋了企業(yè)資源規(guī)劃(enterprise resource planning,ERP)、客戶(hù)關(guān)系管理(customer relationship management ,CRM)、協(xié)作工具和電子郵件等領(lǐng)域[9],具備即插即用、按需定制、資源共享等特點(diǎn),適用于降低部署和維護(hù)成本、快速獲取軟件功能的場(chǎng)景,例如辦公協(xié)作、客戶(hù)關(guān)系管理和人力資源管理等。

然而,B端應(yīng)用(面向企業(yè)用戶(hù)的互聯(lián)網(wǎng)產(chǎn)品)在模型專(zhuān)業(yè)深度、迭代效率、數(shù)據(jù)安全以及高算力成本等方面存在一系列問(wèn)題。企業(yè)個(gè)性化需求的增加使得SaaS長(zhǎng)期面臨著定制化要求高、使用頻率低、獲客成本高、異常消耗后期服務(wù)等挑戰(zhàn)。在這一背景下,大模型的出現(xiàn)有助于SaaS突破這些困境。只需對(duì)大模型進(jìn)行微調(diào)或精調(diào),就能生成面向特定場(chǎng)景的算法。這種“工廠模式”有助于避免過(guò)去“手工作坊定制算法”的高成本,解決了傳統(tǒng)SaaS在滿(mǎn)足客戶(hù)定制化需求、標(biāo)準(zhǔn)化產(chǎn)品和規(guī)?;g的難題。

大模型使自然語(yǔ)言成為使用APP的界面,客戶(hù)通過(guò)人機(jī)交互便能調(diào)用滿(mǎn)足業(yè)務(wù)需要的功能,顯著降低調(diào)用APP的門(mén)檻,節(jié)約學(xué)習(xí)成本。大模型形成的數(shù)字內(nèi)容孿生、編輯、創(chuàng)作三大能力及衍生的文本生成功能正好適應(yīng)SaaS辦公場(chǎng)景。盡管大模型的訓(xùn)練成本較高,但其部署范圍廣,入門(mén)門(mén)檻低,且邊際效應(yīng)呈遞增狀態(tài)。再加上公有云的規(guī)?;?yīng),可以在云上低成本獲取大模型,帶有天然的成本及可操作性?xún)?yōu)勢(shì)。因此,兩者的結(jié)合可以極大地優(yōu)化SaaS的交付方式,提升其實(shí)操價(jià)值。

5 大模型賦能企業(yè)數(shù)字化轉(zhuǎn)型

大模型常會(huì)與大寬帶、大連接、大平臺(tái)聯(lián)合應(yīng)用,如圖5所示。在離散制造現(xiàn)場(chǎng),5G客戶(hù)端終端設(shè)備(customer premise equipment,CPE)通過(guò)WiFi連接可編程邏輯控制器(programmable logic controller,PLC),再連接產(chǎn)線裝備以收集相關(guān)數(shù)據(jù)。在流程制造現(xiàn)場(chǎng),由于存在大量的危險(xiǎn)品,傳感器、工業(yè)模塊等設(shè)備不能采用交流供電,因此PLC控制器被替換為使用先進(jìn)物理層的控制器(advanced physical layer,APL)。APL通過(guò)單線式以太網(wǎng)實(shí)現(xiàn)遠(yuǎn)距離直流供電。

圖5 大模型與5G的聯(lián)合應(yīng)用Fig.5 Joint application of big models and 5G

數(shù)據(jù)通過(guò)5G信號(hào)從CPE傳輸?shù)交?然后再下沉到企業(yè)。大企業(yè)可以在其內(nèi)部構(gòu)建企業(yè)云,而中小型企業(yè)則可以通過(guò)5G連接到公網(wǎng),再利用互聯(lián)網(wǎng)訪問(wèn)人工智能平臺(tái)。5G的核心網(wǎng)具有控制面和用戶(hù)面分離的特征。用戶(hù)面功能(user plane function,UPF)可以下沉到企業(yè),在5G公網(wǎng)上建立虛擬的5G專(zhuān)網(wǎng)。企業(yè)級(jí)UPF可以進(jìn)一步下沉到網(wǎng)絡(luò)邊緣,通過(guò)IPv6的多歸屬特性實(shí)現(xiàn)數(shù)據(jù)的本地分流,保障敏感數(shù)據(jù)不外泄,滿(mǎn)足超低時(shí)延和超高帶寬的需求。

通過(guò)修改5G核心網(wǎng)的用戶(hù)數(shù)據(jù)庫(kù)(user data management,UDM),可以設(shè)定特定的一組終端,形成5G LAN,提供本地L2包(數(shù)據(jù)鏈路層的包,即第2層的包)轉(zhuǎn)發(fā)能力,以實(shí)現(xiàn)對(duì)WiFi更好的覆蓋和業(yè)務(wù)隔離。因此,企業(yè)僅需配備5G CPE,通過(guò)UPF下沉和IPv6上云(公有云、企業(yè)云、混合云或多云),就可以無(wú)需自建工業(yè)互聯(lián)網(wǎng)平臺(tái)及企業(yè)大腦,實(shí)現(xiàn)大數(shù)據(jù)分析與AI決策能力,有助于推動(dòng)數(shù)字化轉(zhuǎn)型。

6 從云網(wǎng)協(xié)同走向算網(wǎng)融合

當(dāng)前正處于網(wǎng)絡(luò)云化的不斷推進(jìn)階段,而向著云網(wǎng)協(xié)同和算網(wǎng)融合的目標(biāo)邁進(jìn)仍需經(jīng)歷一段漫長(zhǎng)而持續(xù)的發(fā)展歷程[10]。這一過(guò)程不僅為數(shù)字化轉(zhuǎn)型提供更為強(qiáng)大和高效的基礎(chǔ)設(shè)施支持,也為未來(lái)智能互聯(lián)時(shí)代的到來(lái)奠定了堅(jiān)實(shí)基礎(chǔ)。

網(wǎng)絡(luò)云化的核心技術(shù)包括軟件定義網(wǎng)絡(luò)(software defined network,SDN)和網(wǎng)絡(luò)功能虛擬化 (network functions virtualization,NFV)。SDN用于實(shí)現(xiàn)承載網(wǎng)的控制和轉(zhuǎn)發(fā)功能的分離[11],而NFV主要將網(wǎng)絡(luò)設(shè)備的軟硬件解耦,實(shí)現(xiàn)設(shè)備如UPF、基站、內(nèi)容分發(fā)網(wǎng)絡(luò)(content delivery network,CDN)、CPE、PLC等的云化[12]。此外,對(duì)IPv6的編程空間進(jìn)行開(kāi)發(fā)并拓展其功能也是必要的。

云網(wǎng)協(xié)同的實(shí)現(xiàn)主要是在數(shù)據(jù)中心引入SDN技術(shù),并利用IPv6對(duì)軟件定義廣域網(wǎng)絡(luò)(software-defined networking in a wide area network,SD-WAN)進(jìn)行賦能。通過(guò)這樣的方式,可以實(shí)現(xiàn)數(shù)據(jù)中心間以及數(shù)據(jù)中心與用戶(hù)間多云互聯(lián)或云邊互聯(lián)。采用基于IPv6轉(zhuǎn)發(fā)平面的段路由(segment routing IPv6,SRv6)和業(yè)務(wù)鏈技術(shù)(service function chain,SFC)可以?xún)?yōu)化流量路徑。云網(wǎng)協(xié)同的實(shí)現(xiàn)面臨著諸多挑戰(zhàn),如協(xié)議不一致、數(shù)據(jù)共享程度低、缺乏云網(wǎng)整體視圖、算力與路由分配脫節(jié)等。

算網(wǎng)協(xié)同將集中式的算力資源與分布式的邊緣計(jì)算相結(jié)合,使得SRv6能夠充分發(fā)揮其作為云網(wǎng)邊端統(tǒng)一承載協(xié)議的作用,是云計(jì)算的重要應(yīng)用之一。

算網(wǎng)融合的實(shí)現(xiàn)需要采用算力度量、算力標(biāo)識(shí)、算力感知、算力路由等技術(shù)?;贗Pv6的算力資源和網(wǎng)絡(luò)資源的統(tǒng)一管理,包括統(tǒng)一標(biāo)識(shí)、統(tǒng)一調(diào)度、智能編排、統(tǒng)一運(yùn)營(yíng)等,是實(shí)現(xiàn)算力和網(wǎng)絡(luò)深度融合的關(guān)鍵。

目前正處在網(wǎng)絡(luò)云化、云網(wǎng)協(xié)同、算網(wǎng)融合的技術(shù)發(fā)展過(guò)程中,這一過(guò)程并非一帆風(fēng)順,尤其在云網(wǎng)協(xié)同方面。據(jù)統(tǒng)計(jì),0.1%的丟包率可能導(dǎo)致算力損失高達(dá)50%,突顯了網(wǎng)絡(luò)性能對(duì)算力效率的重要性。網(wǎng)絡(luò)基于IPv6的能力與大模型的相互作用,將更好地推動(dòng)朝著云網(wǎng)協(xié)同和算網(wǎng)融合的目標(biāo)邁進(jìn)。

7 AI加速數(shù)智化發(fā)展

目前正處于第3次工業(yè)革命的浪潮之中,前兩次工業(yè)革命歷經(jīng)百年,因此我們有理由相信這一波工業(yè)革命將貫穿本世紀(jì),工業(yè)革命進(jìn)程如圖6所示。盡管有觀點(diǎn)認(rèn)為信息化已經(jīng)演進(jìn)了很長(zhǎng)一段時(shí)間,發(fā)展勢(shì)頭會(huì)有所減緩,但當(dāng)前芯粒和SIP技術(shù)為延續(xù)摩爾定律提供了新的動(dòng)力。大算力的崛起突破了算法演進(jìn)的瓶頸,人工智能憑借其強(qiáng)大的賦能能力驅(qū)動(dòng)著新一代IT創(chuàng)新,而大模型技術(shù)則迅速推動(dòng)著技術(shù)革命的進(jìn)程。

圖6 工業(yè)革命進(jìn)程Fig.6 Process of industrial revolution

當(dāng)下,數(shù)字經(jīng)濟(jì)的新時(shí)期已經(jīng)到來(lái),經(jīng)濟(jì)生產(chǎn)要素從農(nóng)業(yè)時(shí)代的土地和勞力、工業(yè)時(shí)代的技術(shù)與資本,轉(zhuǎn)變?yōu)樾畔⒒瘯r(shí)代的新生產(chǎn)要素—數(shù)據(jù)。當(dāng)前,國(guó)際經(jīng)濟(jì)正在經(jīng)歷調(diào)整,信息化正逐漸演化為數(shù)智化,同時(shí)網(wǎng)絡(luò)技術(shù)創(chuàng)新也在迅速發(fā)展。互聯(lián)網(wǎng)進(jìn)入了IPv6+主導(dǎo)期,光纖通信邁入了F5G的成長(zhǎng)期,移動(dòng)通信啟動(dòng)了5G-A的新周期,工業(yè)互聯(lián)網(wǎng)進(jìn)入攻堅(jiān)期,AI邁向通用式AI的過(guò)渡期,而云網(wǎng)融合、算網(wǎng)協(xié)同正經(jīng)歷著青春期。這一系列的變革推動(dòng)著大寬帶、大連接、大數(shù)據(jù)、大平臺(tái)、大模型、大智能的發(fā)展。

猜你喜歡
算力模型企業(yè)
多方求解智能時(shí)代算力挑戰(zhàn)
這個(gè)第二不一般
衛(wèi)星通信在算力網(wǎng)絡(luò)中的應(yīng)用研究
中國(guó)電信董事長(zhǎng)柯瑞文:算力成為數(shù)字經(jīng)濟(jì)的主要生產(chǎn)力
企業(yè)
企業(yè)
企業(yè)
重要模型『一線三等角』
敢為人先的企業(yè)——超惠投不動(dòng)產(chǎn)
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布