郭 濤 徐 晶
GhatGPT 自發(fā)布以來,AI 大模型嶄露頭角,正加速催生大量“新物種”。為搶占AI 大模型發(fā)展機遇,贏得AI 科技的戰(zhàn)略制高點,2023 年4月,中共中央政治局會議明確強調(diào)要重視通用人工智能發(fā)展,國家網(wǎng)信辦等七部門也于今年正式印發(fā)《生成式人工智能服務管理暫行辦法》,將推動人工智能安全發(fā)展提上日程。為貫徹落實國家有關人工智能的決策部署,省委十二屆三次全會將人工智能列為戰(zhàn)略性新興產(chǎn)業(yè),作為新領域新賽道助力推動四川創(chuàng)新發(fā)展。然而,從實踐來看,傳統(tǒng)低水平、分割式、少生態(tài)的數(shù)據(jù)中心和算力中心根本無法滿足“大數(shù)據(jù)、大計算、大模型”人工智能應用需求,布局建設AI 公共算力平臺成為發(fā)展通用人工智能的關鍵,它將實現(xiàn)對通用計算、超算、智算等多元異構(gòu)算力的融合管理,大幅提升AI 模型訓練與推理服務效率,為發(fā)展新一代人工智能產(chǎn)業(yè)提供強大驅(qū)動力。
當前,AI 大模型的出現(xiàn)是人工智能發(fā)展進程中的一個重要里程碑事件,人工智能正快速邁入新的“未知”的階段,推動人類社會走向全面數(shù)字化、網(wǎng)絡化和智能化。
ChatGPT 是由谷歌研發(fā)團隊提出的Transformer 模型演化而來。根據(jù)其原理,只需將訓練好的大模型利用少量數(shù)據(jù)進行微調(diào),甚至不進行微調(diào)就可以完成多場景任務,由此逐漸形成了“大模型+微調(diào)”的訓練新范式。相較于傳統(tǒng)人工智能模型優(yōu)化方式,ChatGPT 的誕生促成了模型訓練由傳統(tǒng)“手工作坊”到規(guī)模化智能生產(chǎn)的轉(zhuǎn)變,成為了AI 大模型加速催生人工智能技術和產(chǎn)業(yè)落地的新引擎。目前,業(yè)界普遍認為,大模型將為產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型和智能化升級帶來新范式,帶動數(shù)字經(jīng)濟邁入新發(fā)展階段。
從應用實踐來看,AI 能夠幫助知識生產(chǎn)者更好地去理解、運用并形成新知識,而新知識又將反向助力訓練出更好的AI 模型,更好的AI 模型又能產(chǎn)生更多新知識。因此,一旦形成算力、算法、數(shù)據(jù)應用的邏輯閉環(huán),三者便可互相推動、良性循環(huán),進而不斷迭代升級產(chǎn)品和技術。目前,作為美國AI 領域的領先企業(yè),OpenAI 公司擁有微軟提供的巨量公共云算力,并在ChatGPT 算法以及海量用戶數(shù)據(jù)閉環(huán)的不斷迭代下,已經(jīng)坐上高速運轉(zhuǎn)的飛輪。而我國的公共算力平臺及其生態(tài)卻與之存在明顯差距,特別在AI 公共算力設施及部分AI 芯片上落后世界先進水平,多數(shù)市場份額為國外廠商占據(jù)。
ChatGPT 的興起掀起了國內(nèi)智算中心的建設熱潮,AI 算力及其服務市場“碎片化”的現(xiàn)象或?qū)⑷找嫱怀?。類似于GPT-4 各類大模型的研發(fā)競爭是基于AI+云計算的全方位競爭,不僅需要網(wǎng)絡、存儲和數(shù)據(jù)支撐,而且還高度依賴超大規(guī)模智算平臺。目前,各地建設或即將建設的低水平、小規(guī)模智算中心,根本無法支撐大模型的訓練任務,數(shù)據(jù)中心之間的帶寬也無法達到大模型訓練每秒TB 級別的傳輸速率。因此,各地若再投資建設不具備大模型訓練能力的算力中心,未來或?qū)⒊霈F(xiàn)“數(shù)字爛尾樓”的問題。
在大模型應用已成趨勢的情況下,單純硬件驅(qū)動模式下的低水平算力中心對發(fā)展通用AI 是不利的,不僅會造成區(qū)域算力及其服務市場的分割,同時也難以形成良好數(shù)字生態(tài)支撐通用AI 發(fā)展,從長遠戰(zhàn)略考慮,這也為我國在國際AI 市場中形成競爭優(yōu)勢增加了更大的難度。由此推斷,伴隨通用人工智能向縱深發(fā)展,高質(zhì)量算力平臺將逐漸成為人工智能時代最具代表性的新型公共算力基礎設施。
通用人工智能產(chǎn)業(yè)化、商業(yè)化將對高性能算力、多類型任務和多方法調(diào)度的服務產(chǎn)生巨大需求。根據(jù)國內(nèi)外實踐經(jīng)驗,目前只有AI 公共算力平臺才能提供高性能、低能耗、強拓展、靈活穩(wěn)定的服務。當然,AI公共算力平臺建設不是簡單的硬件堆砌,而是基于以CPU+GPU 為主要內(nèi)核的云數(shù)據(jù)中心,通過提供包括普惠算力、超算智算、算法模型和數(shù)據(jù)訓練等服務,實現(xiàn)“通用計算+超算+智算”的一體管理,在提高算力資源利用率的同時,滿足不同場景下的算力需求,讓算力更易得、管理更輕松、應用更聚焦。
傳統(tǒng)超算中心的計算能力依賴于專有硬件平臺,強調(diào)高精度的計算能力,追求數(shù)值計算的精確,適合必須嚴格把控精度的科學研究。因此,超算服務對象較為單一,多局限于如新材料、新能源、高端裝備制造、航空航天等領域的國家重大科研類工程項目。而AI 公共算力平臺可有效聚合“智算+超算+通用計算”的功能,跨區(qū)域、多領域融合調(diào)度算力資源,滿足不同群體、不同領域的多元需求,實現(xiàn)算力資源利用率和AI 訓練效率數(shù)倍提升的目標。
根據(jù)數(shù)據(jù)處理的延遲劃分,計算分為“實時計算”和“離線計算”。對于實時計算,比如智能駕駛、工業(yè)機器人、輔助醫(yī)療等行業(yè),延遲需求是毫秒級甚至微秒級的,可以通過AI 公共算力平臺實現(xiàn)近距離邊緣算力調(diào)度;對于離線計算,也就是對于延遲和時效要求不敏感的業(yè)務,可以通過AI 公共算力平臺實現(xiàn)遠程傳輸和模型深度訓練。按照“東數(shù)西算”工程的總體布局,國家對實時性要求不高的場景應用和模型訓練任務進行“西算”,使用AI 公共算力平臺顯然是具有可行性的,這將大量節(jié)約算力和能源資源。
AI 是數(shù)字經(jīng)濟與實體經(jīng)濟融合發(fā)展的產(chǎn)物,涉及大量實體制造,產(chǎn)業(yè)鏈長、波及面廣,成為具有數(shù)萬億市場潛力的新賽道。為搶占AI 產(chǎn)業(yè)發(fā)展先機,以北京、上海、深圳為代表的城市正加速布局AI 公共算力服務平臺。當前,全省上下正在著力構(gòu)建現(xiàn)代化產(chǎn)業(yè)體系,超前認識AI 公共算力服務平臺的重要性,提前布局新一代人工智能算力服務平臺,這在推動通用人工智能產(chǎn)業(yè)爭先競速發(fā)展中尤為重要。
一是研究制定《四川省加快發(fā)展新一代通用人工智能的實施意見》等系列政策文件,大力支持發(fā)展AI 公共算力平臺,有效整合多層級算力資源,逐步構(gòu)建起全省統(tǒng)一的算力調(diào)度服務機制。二是人才引育制度方面要支持更多數(shù)學、物理等科學領域科學家、研究人員投身于AI 算力技術、算法模型等領域的研究,大力培養(yǎng)與引進跨學科頂尖AI 研發(fā)團隊,為四川人工智能發(fā)展持續(xù)輸送高端人才。三是標準規(guī)范方面,針對政府、企業(yè)、居民不同服務對象,要構(gòu)建AI 公共算力標準化體系,特別是在科學、政務、教育、醫(yī)療、金融、交通、文旅等重點行業(yè)要加快探索突破。
一是與國內(nèi)知名云商合作,有序建立服務政府側(cè)和非政府側(cè)的AI 公共算力平臺,提供多元優(yōu)質(zhì)普惠算力,在邏輯上形成全省一體兩翼的高質(zhì)量AI 算力平臺體系,實現(xiàn)異構(gòu)算力統(tǒng)一管理、統(tǒng)一運營、統(tǒng)一調(diào)度的目標。二是科學統(tǒng)籌AI 公共算力空間布局,打造四川省級和重點區(qū)域邊緣AI 公共算力聯(lián)動的智能調(diào)度體系,推動天府數(shù)據(jù)中心集群與重慶算力集群在AI 公共算力的協(xié)同聯(lián)動,充分發(fā)揮好算力集群優(yōu)勢與集約化的成本優(yōu)勢,增強高性能算力資源的區(qū)域一體化調(diào)度能力。三是支持成都超算中心升級試點探索建設新一代人工智能公共算力開放創(chuàng)新平臺,支持“通用計算+超算+智算”異構(gòu)融合發(fā)展,構(gòu)建多元協(xié)同的算力供給體系,助力新一代人工智能技術在現(xiàn)代化產(chǎn)業(yè)體系中的規(guī)?;瘧?。
一是依托成都國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū),積極融入國家算力AI 芯片產(chǎn)業(yè)布局,突破關鍵核心技術,特別是提升GPU 等芯片國產(chǎn)化率,助推人工智能安全發(fā)展。二是突出基礎研究與應用研究協(xié)同,要大力引進龍頭數(shù)字科技企業(yè)研發(fā)基地落地四川,引導其牽頭推進以“公共云+AI”為驅(qū)動的算力技術體系發(fā)展,逐步主導全球新一代AI 公共算力軟硬件生態(tài),突破現(xiàn)有技術路徑的封鎖。三是以構(gòu)建AI 算力、算法和數(shù)據(jù)的邏輯閉環(huán)為導向培育上下游產(chǎn)業(yè)生態(tài),大力發(fā)展“模型即服務”新業(yè)態(tài),培育和推廣AI模型社區(qū),推動各行業(yè)訓練數(shù)據(jù)集資源開放流通,形成統(tǒng)一開放的AI 算力產(chǎn)業(yè)生態(tài)。
一是要在產(chǎn)業(yè)基礎好、創(chuàng)新能力強的地區(qū),優(yōu)選若干細分特色優(yōu)勢行業(yè),特別是突出在制造業(yè)的智能應用,打造AI 大模型應用標桿,提升AI 公共算力平臺資源的利用效率。二是要以發(fā)展戰(zhàn)略性新興產(chǎn)業(yè)為牽引,對需利用高性能算力的產(chǎn)業(yè)場景可優(yōu)先導入使用AI 公共算力服務平臺專區(qū),直接在云端調(diào)用算力開展AI 模型訓練和高性能計算等任務,服務現(xiàn)代化產(chǎn)業(yè)體系構(gòu)建。三是要降低中小企業(yè)算力使用門檻,深化以“算力券”的市場化舉措活躍算力消費,支持專精特新、小巨人、瞪羚等企業(yè)使用公共算力平臺資源,推動中小企業(yè)參與模型訓練和算法迭代,全面提升AI 公共算力設施的普惠服務能力,加速賦能千行百業(yè)。