AI對智能算力的需求呈指數(shù)級上漲,國內(nèi)外算力進入到大爆發(fā)階段,各地都在加快智算中心建設(shè)。算力是數(shù)字經(jīng)濟時代的新質(zhì)生產(chǎn)力,是全球人工智能產(chǎn)業(yè)爭奪的焦點
從2022年ChatGPT的橫空出世到2024年Sora的驚艷亮相,通用人工智能的迅猛發(fā)展超乎人們的想象,各種新技術(shù)新產(chǎn)品層出不窮,例如谷歌Deepmind升級后的AlphaFold 3能夠以前所未有的原子精度預(yù)測所有生物分子的結(jié)構(gòu),蘋果發(fā)布顛覆性個人智能系統(tǒng)Apple Intelligence徹底改革Siri,華為首發(fā)的人形機器人可以下廚房、進工廠……這些人工智能產(chǎn)品能力不斷涌現(xiàn)的背后都離不開強大算力的支撐,AI對智能算力的需求呈指數(shù)級上漲,國內(nèi)外算力進入到大爆發(fā)階段,各地都在加快智算中心建設(shè)。算力是數(shù)字經(jīng)濟時代的新質(zhì)生產(chǎn)力,是全球人工智能產(chǎn)業(yè)爭奪的焦點。加快建設(shè)算力強省,亦是浙江省當(dāng)前階段的重要任務(wù)。
智能算力開啟算力新時代
智算地位越來越重
2023年全球計算設(shè)備的算力總規(guī)模達到1369EFlops,近年來算力結(jié)構(gòu)經(jīng)歷了革命性的變化,智能算力的占比已經(jīng)從10%左右增長至60%以上。我國高度重視算力發(fā)展,算力規(guī)模位居全球第二,工業(yè)和信息化部等6部門發(fā)布《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》等政策文件,提出到2025年算力規(guī)模超過300EFlops,智能算力占比達到35%,推進算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展。各地紛紛加快智算中心布局,廣東明確提出到2025年智能算力規(guī)模全國第一、全球領(lǐng)先的目標(biāo),上海在“算力浦江”智算行動中提出到2025年智能算力規(guī)模超過30EFlops、占比達50%以上,北京則強調(diào)到2027年具備100%自主可控智算中心建設(shè)能力。
智算芯片越來越快
在人工智能發(fā)展大背景下,傳統(tǒng)通用計算芯片已經(jīng)不能滿足大模型訓(xùn)練要求,智算芯片成為支撐人工智能大模型訓(xùn)練和推理的關(guān)鍵。智算芯片迭代更新速度非常驚人,國際芯片巨頭英偉達在數(shù)據(jù)中心GPU方面近乎壟斷地位,每年都發(fā)布新的GPU芯片,今年發(fā)布的芯片B200,AI性能為每秒20千萬億次浮點運算,是此前最強的H100的5倍,過去8年間將AI計算性能提高了1000倍。近年來中美科技博弈愈發(fā)激烈,美國不斷加強對中國出口尖端AI芯片的管制,國內(nèi)芯片公司奮起直追,以華為為代表的國內(nèi)龍頭廠商給出了替代方案,目前華為昇騰910B能力已經(jīng)基本做到可對標(biāo)英偉達A100,為世界構(gòu)建第二選擇。
集群規(guī)模越來越大
AI大模型的主戰(zhàn)場,萬卡已是標(biāo)配。Open AI的GPT—4在約2萬塊A100上訓(xùn)練了90—100天,Meta最新的兩個AI訓(xùn)練集群均集成了超2.4萬張H100。從大語言模型到音頻、視頻等多模態(tài)模型,未來模型訓(xùn)練對算力集群規(guī)模的要求越來越高,OpenAI/微軟、Meta、xAI等都在競相建立超10萬卡集群。萬卡集群搭建并不是簡單的算力堆疊,多卡互聯(lián)非??简炈憔W(wǎng)存系統(tǒng)級優(yōu)化的功力,可預(yù)見從萬張到十萬張演進還需進一步解決超大規(guī)模算力組網(wǎng)、集群效能提升、多元異構(gòu)算力生態(tài)等方面問題。國產(chǎn)芯片領(lǐng)域,華為去年7月宣布將昇騰AI擴張到1.6萬張卡,我國迎來“萬卡時代”,摩爾線程今年7月也官宣實現(xiàn)萬卡且兼容CUDA。
算力發(fā)展越來越綠
全球數(shù)據(jù)中心占用了全球3%的電力,綠色化發(fā)展成為重要趨勢,是響應(yīng)環(huán)境保護、降低能耗成本的有效途徑。美國科技巨頭開始實施綠色算力戰(zhàn)略,谷歌提出到2030年實現(xiàn)全天候使用無碳能源,亞馬遜計劃到2040年實現(xiàn)整個運營的凈零碳排放。通過建設(shè)在寒冷地區(qū)或利用自然冷源冷卻可以有效降低能耗,Meta靠近瑞典北部的北極圈數(shù)據(jù)中心PUE維持在1.1以下,微軟建在海底的數(shù)據(jù)中心PUE低至1.07。國內(nèi)的智算中心也在積極探索綠色發(fā)展之路。中國政府鼓勵采用液冷、高壓直流、余熱利用等節(jié)能技術(shù),推動數(shù)據(jù)中心向綠色、低碳轉(zhuǎn)型,部分智算中心已經(jīng)開始采用冷板式或浸沒式液冷技術(shù),大幅降低冷卻能耗。
我國算力競爭進入白熱化
芯片之爭是核心
美國長期占據(jù)芯片技術(shù)的領(lǐng)先地位,英偉達在美國政府對華芯片禁售令后斷供最高端芯片,發(fā)布特供的“H20”與國內(nèi)芯片爭搶市場份額。國內(nèi)芯片企業(yè)不斷崛起,除領(lǐng)頭羊華為外,海光、沐曦、壁仞、摩爾線程等企業(yè)主打GPU產(chǎn)品,寒武紀(jì)、燧原深耕神經(jīng)網(wǎng)絡(luò)芯片,兆芯和龍芯在CPU領(lǐng)域外持續(xù)開拓GPU產(chǎn)品。但在芯片產(chǎn)業(yè)不斷繁榮的同時,芯片行業(yè)投資巨大、人才爭搶嚴(yán)重,一定程度上也加劇了市場內(nèi)耗。芯片制造的競爭也異常激烈,各大企業(yè)都在努力提升芯片的集成度和性能,英偉達最新一代芯片預(yù)計采用臺積電3納米制程,華為采用了7納米制程,與國際最先進制程還有代際差距。
生態(tài)之爭是關(guān)鍵
英偉達早在2006年就推出CUDA平臺,完善覆蓋了軟件庫、AI框架和算子庫,CUDA生態(tài)成為英偉達最強護城河。國產(chǎn)AI芯片存在不同技術(shù)路線,一類以海光、摩爾線程等為代表,選擇類CUDA生態(tài)的路線,便于遷移適配;另一類以華為昇騰為主,試圖從底層邏輯到算法框架等全面開展自主研發(fā),打造全棧式AI生態(tài)。目前主流的技術(shù)范式尚未形成,業(yè)界也很難達成共識,國內(nèi)頂尖服務(wù)器廠商表示,不得不為各種芯片做服務(wù)器研發(fā)適配。此外,和美國TensorFlow、PyTorch等AI開發(fā)框架相比,百度飛槳等國內(nèi)開發(fā)人員只有國外的1/10,AI開發(fā)框架、AI芯片、AI應(yīng)用等各層之間未深度適配,生態(tài)合力尚未形成。
能源之爭是根本
算力發(fā)展中能源消耗巨大,有種說法是,AI的核心是算力,算力的盡頭是電力。智算中心每個環(huán)節(jié)都離不開電力支撐,包括GPU等硬件設(shè)備、數(shù)據(jù)的存儲和傳輸、模型訓(xùn)練推理、制冷設(shè)備及供配電系統(tǒng)等,ChatGPT每天處理2億個用戶請求會耗電50萬千瓦時,相當(dāng)于1.7萬個美國家庭一天的用電量。電力成本占到算力中心運營總成本的60%—70%,全國各地電價差異大,如何打造算力成本洼地成為各地政府吸引產(chǎn)業(yè)的關(guān)鍵。此外,服務(wù)器一旦開啟就要24小時不間斷運作,當(dāng)前我國IDC機柜平均上架率在58%左右,利用率還有提升空間,如果各地盲目無序建設(shè)智算中心可能導(dǎo)致服務(wù)器閑置風(fēng)險,造成大量能源浪費。
模式之爭定長遠(yuǎn)
建設(shè)模式方面,國內(nèi)投資建設(shè)主體多元,有政府、高校、科研機構(gòu)、電信運營商、央國企、互聯(lián)網(wǎng)巨頭及民營企業(yè)等;民營企業(yè)建設(shè)熱情高,平湖潤澤國際信息港已成為長三角區(qū)域單體規(guī)模最大的算力集群。運營模式方面,部分高校、科研機構(gòu)及民企采取自建自用模式,政府、國企對外提供普惠算力服務(wù)、會委托第三方機構(gòu)進行運營,互聯(lián)網(wǎng)巨頭則通常采取云服務(wù)方式對外提供算力。算力調(diào)度模式方面,政府、運營商、企業(yè)、行業(yè)機構(gòu)主導(dǎo)的算力調(diào)度平臺百花齊放,云計算平臺天生具有分布式、彈性擴展等特點,但在智能算力調(diào)度方面還有待技術(shù)突破,政府調(diào)度則在分配、定價、結(jié)算等問題上還需進一步探索。
浙江打造算力強省的對策建議
要技術(shù)跟隨,更要自主可控
短期模型訓(xùn)練、人工智能應(yīng)用仍需要用到國外先進芯片,但是不支持短視的盲目大量囤卡行為,避免芯片過時過剩風(fēng)險。長期堅定不移發(fā)展自主可控技術(shù)路線。建議從推理芯片切入,大模型訓(xùn)練需要大規(guī)模高性能芯片集群,且隨著企業(yè)AI應(yīng)用逐步成熟,企業(yè)的算力需求逐步轉(zhuǎn)向具體應(yīng)用場景的高能效、低延遲、低成本的推理需求,國產(chǎn)芯片目前完全可以滿足推理需求,可以從推理領(lǐng)域助力實現(xiàn)國產(chǎn)芯片的市占率提升。積極引入和培育高端芯片廠商,搭建好基礎(chǔ)公共服務(wù),讓芯片設(shè)計—制造—封測全流程都可以在浙江本地完成。聚焦基礎(chǔ)關(guān)鍵技術(shù)攻關(guān),依托高能級創(chuàng)新載體、上下游創(chuàng)新聯(lián)合體等開展聯(lián)合攻關(guān),突破多元異構(gòu)、存算一體、高速互聯(lián)、安全可信等計算技術(shù),不斷提升高端芯片性能。前沿布局量子計算、類腦計算、光計算等前沿非經(jīng)典計算技術(shù),多條技術(shù)路線并行爭取實現(xiàn)換道超車。
要自建生態(tài),更要開源開放
積極發(fā)展a88d1d8fb08e118521601461b5e23b3b自主生態(tài),逐步做到技術(shù)路線收斂,集中力量打造具有國際影響力的頭部生態(tài)。支持開源體系建設(shè),大力普及開源文化,加強國內(nèi)外交流合作,打造1—2個具有國際影響力的開源社區(qū)。圍繞芯片設(shè)計、服務(wù)器操作系統(tǒng)、數(shù)據(jù)庫等算力基礎(chǔ)軟硬件,鼓勵龍頭企業(yè)軟件開源、硬件開放,布局一批開源項目,支持符合條件的開源技術(shù)商業(yè)化創(chuàng)新項目列入省產(chǎn)業(yè)鏈協(xié)同創(chuàng)新項目計劃目錄,加快開源成果工程化、產(chǎn)業(yè)化。加大開源人才培養(yǎng)力度,支持龍頭企業(yè)與省內(nèi)高校聯(lián)合基于國產(chǎn)化基礎(chǔ)體系開設(shè)相關(guān)課程,通過基礎(chǔ)教育和實踐培訓(xùn)培養(yǎng)國產(chǎn)基礎(chǔ)研究人才和復(fù)合型高技能人才。積極推進開源文化進校園,研發(fā)開源貢獻價值評價體系,在職稱評價、畢業(yè)推免標(biāo)準(zhǔn)中納入開源項目貢獻,機制上激勵更多師生投入開源。做好公共服務(wù)平臺支撐,以創(chuàng)新大賽、研修班等形式,大力培養(yǎng)軟件開發(fā)、適配、遷移等方面專業(yè)人才。
要適度超前,更要綠色用能
統(tǒng)籌考慮存量算力中心和新增智算中心建設(shè),做到全省算力布局“一盤棋”。對全省算力設(shè)施供給和算力需求情況進行摸底,對存量老舊數(shù)據(jù)中心進行淘汰和改造。提升現(xiàn)有算力中心利用率,比如可通過云服務(wù)、算網(wǎng)一體化調(diào)度等方式,將分散的算力資源進行整合和優(yōu)化配置。對新增算力基礎(chǔ)設(shè)施進行合理規(guī)劃布局,參照合規(guī)指引進行嚴(yán)格審批,按照適度超前原則保障算力供給,優(yōu)先建設(shè)綠色集約高效能的算力中心。聚焦綠色算力技術(shù)創(chuàng)新,推進算力基礎(chǔ)設(shè)施全生命周期綠色設(shè)計,圍繞計算、存儲、網(wǎng)絡(luò)等關(guān)鍵環(huán)節(jié)加強綠色技術(shù)攻關(guān),推進綠色新技術(shù)、新產(chǎn)品、新解決方案。建設(shè)綠色能源替代,提升太陽能、風(fēng)能等可再生能源利用,探索突破可聚變核能,降低電力成本。加強綠色節(jié)能技術(shù)推廣應(yīng)用,短期率先推動冷板式液冷,長期持續(xù)發(fā)展浸沒式液冷,降低算力中心PUE。
要政府引導(dǎo),更要市場主導(dǎo)
政府主體建設(shè)的算力中心需要體現(xiàn)公共基礎(chǔ)設(shè)施的特點,提供普惠算力服務(wù);積極承擔(dān)重大國家任務(wù),建設(shè)基于多種國產(chǎn)芯片的萬卡高性能計算集群,建設(shè)基于國產(chǎn)指令集、國產(chǎn)芯片的服務(wù)器集群及其配套設(shè)施的融合算力平臺,提供通用算力、智能算力、超算等多種算力。政府要發(fā)揮引導(dǎo)作用,做好資源統(tǒng)籌,支持建設(shè)算力產(chǎn)業(yè)聯(lián)盟,鼓勵高校、科研機構(gòu)將自建算力開放使用,并聯(lián)合政府主導(dǎo)和聯(lián)盟內(nèi)伙伴的算力中心進行算力調(diào)度平臺建設(shè)與使用。發(fā)揮好市場主導(dǎo)的作用,鼓勵有能力有條件的市場化建設(shè)方積極拓展應(yīng)用渠道,提高算力使用效率和投入產(chǎn)出比;支持不斷深耕加強自身技術(shù)壁壘,鼓勵算力企業(yè)出海、拓展國際市場;鼓勵云計算廠商以云服務(wù)方式整合算力資源,實現(xiàn)多元異構(gòu)算力跨域調(diào)度編排。鼓勵算力中心與有技術(shù)、有經(jīng)驗的鏈主企業(yè)、龍頭企業(yè)合作進行市場化運營,引入算力產(chǎn)業(yè)上下游企業(yè),推動產(chǎn)業(yè)集群化發(fā)展。
(作者單位:浙江省數(shù)字經(jīng)濟發(fā)展中心)