高考期間,除了考場上奮筆疾書的莘莘學子和考場外的翹首以盼的家長,還有一個忙碌的身影,那就是各個大廠的大模型。押題,寫作,答題,它們忙得不亦樂乎,也讓大家看到一片欣欣向榮的景象。然而,這一表象的背后卻是暗流涌動,甚至硝煙四起。
產(chǎn)品之爭,價格往往首當其沖。
5月15日,字節(jié)對外宣布豆包大模型正式開啟對外服務,豆包通用模型pro-32k版、pro-128k版在企業(yè)市場的推理輸入價格僅為0.0008元/千tokens、0.005元/千tokens,比市場價格低了99.3%、95.8%,并聲稱已經(jīng)擊穿了大模型行業(yè)的底價。
也許是受到豆包大模型的價格刺激,5月21日,阿里云宣布通義千問GPT-4級主力模型Qwen-Long的API輸入價格降至0.0005元/千Tokens,直降97%。而隨后,百度通過官方微信發(fā)文稱,文心大模型兩款主力模型ENIRE Speed和ENIRE Lite全面免費。
隨著技術的進步和規(guī)模經(jīng)濟的實現(xiàn),大模型的開發(fā)和運維成本可能有所下降,這為廠商提供了降價的空間。而且降價是廠商用來激活市場和吸引用戶注意力的一種手段。通過降低價格門檻,廠商可以吸引更多的用戶試用其大模型服務,從而增加市場的認知度和接受度,在此基礎上進行商業(yè)模式的探索。
不管怎樣,價格大戰(zhàn)反映了我國大模型市場競爭的激烈程度,也反映了大模型技術在我國的商業(yè)化進程。這種價格大戰(zhàn)可能會為用戶帶來更多選擇和更具競爭力的產(chǎn)品和服務。然而,需要注意的是,價格大戰(zhàn)可能會導致一些問題,例如產(chǎn)品與服務質量的降低以及研發(fā)投入的減少。
我國大模型的價格大戰(zhàn)反映了市場競爭的激烈程度,也表明了我國大模型的商業(yè)化程度。近年來,我國始終高度重視人工智能發(fā)展機遇和頂層設計,發(fā)布多項人工智能支持政策。國務院于2017年發(fā)布《新一代人工智能發(fā)展規(guī)劃》,科技部等六部門于2022年印發(fā)《關于加快場景創(chuàng)新以人工智能高水平應用促進經(jīng)濟高質量發(fā)展的指導意見》對規(guī)劃進行落實。2024年《政府工作報告》中提出開展“人工智能+”行動。
伴隨人工智能領域大模型技術的快速發(fā)展,我國不少地方政府出臺相關支持政策,加快大模型產(chǎn)業(yè)的持續(xù)發(fā)展。當前,北京、上海、廣東、安徽、福建和深圳、杭州、成都等地均發(fā)布了AI大模型的相關產(chǎn)業(yè)政策。
以上海為例。為深入貫徹國家發(fā)展新一代人工智能的戰(zhàn)略部署,落實《上海市促進人工智能產(chǎn)業(yè)發(fā)展條例》,推動上海大模型創(chuàng)新發(fā)展,營造通用人工智能創(chuàng)新生態(tài),加快打造世界級人工智能產(chǎn)業(yè)集群,上海市經(jīng)濟信息化委、市發(fā)展改革委、市科委、市委網(wǎng)信辦、市財政局聯(lián)合制定了《上海市推動人工智能大模型創(chuàng)新發(fā)展若干措施(2023-2025年)》,提出要支持引進高水平創(chuàng)新企業(yè),支持本市創(chuàng)新主體打造具有國際競爭力的大模型,鼓勵形成數(shù)據(jù)飛輪,加速模型迭代,對取得重大成果的予以專項獎勵。
在技術趨勢和政策利好的驅使下,我國大模型產(chǎn)業(yè)蓬勃發(fā)展。根據(jù)相關統(tǒng)計,截至2024年3月,已有117個大模型在中央網(wǎng)信辦成功備案,顯示出我國大模型發(fā)展的迅速和激烈的競爭態(tài)勢。這些大模型來自不同的地區(qū)和企業(yè),其中北京、上海、廣東等地的大模型數(shù)量占據(jù)顯著位置,合計占全國大模型總數(shù)量的64%。所以,百模大戰(zhàn)是名副其實的。
在大模型的發(fā)展過程中,政府通過制定政策、優(yōu)化營商環(huán)境、支持大模型重大項目和創(chuàng)新平臺等方式,為產(chǎn)業(yè)發(fā)展提供全方位支撐。同時,企業(yè)也積極投入大模型的研發(fā),推出新品,探索產(chǎn)業(yè)發(fā)展新路徑,加快形成人工智能大模型產(chǎn)業(yè)競爭優(yōu)勢。但我國大數(shù)據(jù)產(chǎn)業(yè)仍面臨算力、數(shù)據(jù)、應用和能耗等多方面的挑戰(zhàn)。
算力瓶頸:隨著AI大模型規(guī)模的指數(shù)級增長,訓練大模型越發(fā)依賴高性能AI芯片。然而,國內AI高性能芯片市場受進口限制和國內技術瓶頸的雙重影響,導致大模型產(chǎn)業(yè)發(fā)展在算力層面受到制約。主流大模型架構消耗的算力資源較大,對存儲設備的要求也更高,這進一步加劇了算力挑戰(zhàn)。
數(shù)據(jù)質量與類型:國內AI大模型數(shù)據(jù)主要來自互聯(lián)網(wǎng)、電商、社交、搜索等渠道,存在數(shù)據(jù)類型不全面、信息可信度不高等問題??捎糜诖竽P陀柧毜闹形臄?shù)據(jù)庫體量嚴重不足,這影響了大模型的訓練效果和應用范圍。
應用場景與商業(yè)化:盡管大模型數(shù)量眾多,但目前我國大模型產(chǎn)業(yè)尚未出現(xiàn)爆款級應用。這主要是因為尚未找到明確的商業(yè)化思路,缺乏滿足客戶需求的個性化應用。
能耗問題:大模型對算力的巨大需求也帶來了能耗問題。人工智能服務器的功率較普通服務器高,訓練大模型所需的能耗是常規(guī)工作的數(shù)倍,這對能源供應和環(huán)境保護帶來了挑戰(zhàn)。
為了構建健康、可持續(xù)和創(chuàng)新的大模型產(chǎn)業(yè)生態(tài),我國應在技術創(chuàng)新、數(shù)據(jù)安全、應用落地、人才培養(yǎng)和國際合作等多個方面下功夫,不斷提升我國在大模型領域的競爭力和影響力。
持續(xù)推進技術創(chuàng)新是關鍵。大模型技術的發(fā)展日新月異,要想在國際競爭中保持領先地位,我們必須不斷加大在算法優(yōu)化、模型性能提升等方面的研發(fā)投入,推動技術創(chuàng)新和突破。同時,也要關注新興技術的發(fā)展趨勢,如量子計算、神經(jīng)形態(tài)計算等,以便將這些先進技術應用于大模型領域,進一步提升模型的性能和效率。
加強數(shù)據(jù)安全和隱私保護至關重要。大模型需要大量的數(shù)據(jù)進行訓練和優(yōu)化,因此數(shù)據(jù)安全和隱私保護問題不容忽視。我們應該建立完善的數(shù)據(jù)安全管理制度和技術防護措施,確保用戶數(shù)據(jù)安全和隱私得到充分保護。同時,也要加強相關法律法規(guī)的制定和執(zhí)行,為數(shù)據(jù)安全和隱私保護提供有力的法律保障。
推動大模型在各行業(yè)的應用落地。大模型技術的應用場景非常廣泛,可以應用于自然語言處理、計算機視覺、智能推薦等多個領域。我們應該積極與各行業(yè)合作,推動大模型技術在各個領域的應用落地,解決實際問題,提升行業(yè)的智能化水平。同時,也要關注不同行業(yè)的需求和特點,定制化開發(fā)適用于特定場景的大模型解決方案。
培養(yǎng)大模型領域的專業(yè)人才。大模型技術的發(fā)展需要大量的專業(yè)人才支持,包括算法工程師、數(shù)據(jù)科學家、產(chǎn)品經(jīng)理等。我們應該加強相關人才的培養(yǎng)和引進工作,建立完善的人才培養(yǎng)體系,為大模型領域的發(fā)展提供充足的人才保障。
最后,加強國際合作與交流。大模型技術的發(fā)展是全球性的,各國都在積極研究和應用相關技術。我們應該加強與其他國家在技術創(chuàng)新、人才培養(yǎng)、應用落地等方面的合作與交流,共同推動大模型技術的發(fā)展和應用。