王銳
當?shù)貢r間2023年2月7日,微軟正式發(fā)布了自己的“新必應”,一個集成ChatGPT 的新版搜索引擎?!靶卤貞弊钪档藐P注的技術突破就是它運行的是 OpenAI 專門為搜索服務定制的下一代大型語言模型,比ChatGPT 更強大。這個名叫“普羅米修斯”的模型可以提高回答的相關性,進一步注釋答案,更新搜索結果等等。
由人工智能研究實驗室OpenAI推出的ChatGPT橫空出世,在全球掀起了人工智能(AI)的新浪潮,開啟了AIGC(AI Generated Content,人工智能生成內(nèi)容)新紀元。
上線僅5天,ChatGPT就收獲了100萬用戶;推出不到兩個月,ChatGPT的用戶日活量就突破1000萬。而根據(jù)瑞銀集團研究報告顯示,ChatGPT在2023年1月末月活用戶已經(jīng)突破了1億,成為史上用戶增長速度最快的消費級應用程序。
2月1日,OpenAI推出ChatGPTPlus訂閱計劃,每月價格為20美元,增值服務包括高峰時段免排隊、快速響應、優(yōu)先獲得新功能訪問權等,訂閱計劃的推出進一步打開商業(yè)空間。同時,OpenAI仍將繼續(xù)向消費者提供ChatGPT免費試用。
與其他AI交互機器人不同,ChatGPT可以更好地理解人類意圖,并進行專業(yè)性回答,這得益于ChatGPT在GPT3.5的基礎上增加了人類反饋強化模型,引入“人工標注數(shù)據(jù)+強化學習”來反復訓練模型。
當前,微軟、谷歌、百度等國際國內(nèi)互聯(lián)網(wǎng)巨頭紛紛入局AIGC產(chǎn)業(yè),微軟CEO納德拉稱“AIGC堪比工業(yè)革命”,比爾·蓋茨評價ChatGPT的歷史意義重大甚至不亞于PC或互聯(lián)網(wǎng)誕生。隨著AI技術的迭代發(fā)展,AIGC在變革內(nèi)容產(chǎn)業(yè)的同時,將與搜索、辦公、教育、金融、醫(yī)療、工業(yè)、影視、游戲等行業(yè)結合,進一步拓寬AI應用場景,加速AI商業(yè)落地。
隨著AI與下游場景加快融合,同時疊加政策對行業(yè)支持,國內(nèi)AI市場規(guī)模有望持續(xù)高增。據(jù)工信部的相關數(shù)據(jù),截至目前,中國AI核心產(chǎn)業(yè)規(guī)模超過4000億元,企業(yè)數(shù)量接近4000家,帶動相關產(chǎn)業(yè)規(guī)模超數(shù)萬億元,并將持續(xù)快速增加。
招商證券表示,從ChatGPT的流行AIGC已經(jīng)成為AI技術發(fā)展的新趨勢,與傳統(tǒng)AI技術變現(xiàn)困難不同,ChatGPT采用SaaS訂閱的創(chuàng)新收費模式打破了人們對于AI技術大多應用于嵌入式項目的固有印象,拓寬了AI企業(yè)的商業(yè)模式。AIGC商業(yè)空間將進一步打開,不僅B端用戶對AIGC技術存在高需求,未來C端用戶對AIGC技術的付費有望成為常態(tài)化,產(chǎn)業(yè)鏈相關企業(yè)將迎來價值重估。
根據(jù)長江證券的研報,人工智能的發(fā)展經(jīng)歷了三次“浪潮”起伏。
第一次浪潮(20世紀50-70年代):人工智能起步階段,首次提出人工智能概念及少數(shù)成果,但由于算法理論薄弱及計算機性能缺陷導致無法支持應用推廣。
第二次浪潮(20世紀80-90年代):以專家系統(tǒng)和日本第五代計算機為代表,專家系統(tǒng)的出現(xiàn)推動人工智能從理論走向部分實際應用,例如醫(yī)療、氣象、地質(zhì)等領域。但由于專家系統(tǒng)推理方法單一、數(shù)據(jù)量匱乏導致人工智能發(fā)展受限,再度進入停滯。
第三次浪潮(2000年以后):信息技術的蓬勃發(fā)展帶來了行業(yè)數(shù)據(jù)量的爆發(fā)以及新型人工智能芯片的進階,為人工智能的發(fā)展提供基礎條件。同時理論算法不斷沉淀,以機器學習、深度學習為代表的算法,在互聯(lián)網(wǎng)、工業(yè)等領域取得了較好的應用效果,并且在圖像識別、語音識別、自然語言處理等細分領域取得巨大進步。
深究人工智能技術發(fā)展的驅動力,由算法、算力和數(shù)據(jù)三大要素構成,學習算法的設計,決定設計出的“大腦”夠不夠聰明(模型的革新);要有高性能的計算能力,可以訓練一個大的網(wǎng)絡(芯片的革新);必須要有大數(shù)據(jù)(信息技術的發(fā)展)。
而以ChatGPT為代表的AIGC興起,在內(nèi)容創(chuàng)作成本、創(chuàng)作效率、模型計算消耗、用戶流量基礎等維度實現(xiàn)了重大突破,有望推動AI商業(yè)化進程的大幅加速。
AIGC是繼專業(yè)生產(chǎn)內(nèi)容(PGC)、用戶生產(chǎn)內(nèi)容(UGC)之后誕生的,利用AI技術自動生成內(nèi)容的新型生產(chǎn)方式,其特點是高效性和自動化生產(chǎn)。隨著自然語言生成技術NLG和AI模型的成熟,AIGC開始受到大規(guī)模的關注,如微軟、谷歌、英偉達等多家科技巨頭紛紛布局AIGC技術和應用。
在AIGC場景下,AI可以靈活運用于寫作、編曲、繪畫和視頻制作等創(chuàng)意領域。據(jù)TBanicDate估計,到2025年人工智能生成數(shù)據(jù)占比將達到10%。目前AIGC技術可以自動生成文字、圖片、音頻、視頻,甚至3D模型和代碼,在搜索引擎、藝術創(chuàng)作、影音游戲,以及金融、教育、醫(yī)療、工業(yè)等領域的應用前景十分廣闊。
興業(yè)證券認為,AIGC反映出AI的角色正在改變,即從“效率工具”到“生產(chǎn)工具”的顛覆性變革。AIGC能夠以類似人類甚至優(yōu)于人類的知識水平、制造能力承擔信息挖掘、素材調(diào)用、復刻編輯等基礎性機械勞動,從技術層面實現(xiàn)以低邊際成本、高效率的方式滿足海量個性化需求。長期來看,AIGC在提高各行業(yè)內(nèi)容創(chuàng)作效率的同時,更有可能孕育出更多的新業(yè)態(tài)、新模式。
華西證券表示,盡管此前StableDiffusion、Midjourney等AI繪畫應用已經(jīng)落地,但注冊及使用門檻仍相對較高。而ChatGPT的對話機器人屬性及免費試用窗口期使其能夠廣泛觸達用戶,瑞銀數(shù)據(jù)顯示上線兩月用戶數(shù)已突破1億,系目前用戶增長最快的消費應用,2023年1月推出付費訂閱版,每月價格20美元。ChatGPT之于OpenAI,可以對標AlphaGo和AlphaFold之于DeepMind,開啟了AIGC認知普及的一大步,是AIGC內(nèi)容批量規(guī)?;a(chǎn)的起點。
ChatGPT是由人工智能研究實驗室OpenAI在2022年11月30日發(fā)布的全新一代聊天機器人模型,使用的模型與兩年前發(fā)布的GPT-3底層數(shù)據(jù)和參數(shù)規(guī)模一致。
華西證券認為,GPT-3是GPT系列第三代語言預測模型,ChatGPT是從Instruct GPT(GPT-3.5)系列中的一個模型進行微調(diào),相較于Instruct GPT,ChatGPT效果更加真實(擁有非常強的泛化能力和生成能力),模型的無害性實現(xiàn)些許提升(生成帶有有害、歧視、偏見等情況的有問題樣本的概率本身就會很低),編碼能力更強(在GPT-3積累的大量Coding代碼基礎上,部分OpenAI內(nèi)部員工參與了數(shù)據(jù)采集工作)。
數(shù)據(jù)來源:澎湃,中泰證券研究所
數(shù)據(jù)來源:Precedence Research,中泰證券研究所
相較于進一步擴大原有的數(shù)據(jù)規(guī)模,ChatGPT采取了升級訓練方式的辦法,利用人類反饋的知識,對模型進行強化修改,同時對原有數(shù)據(jù)略作改良,優(yōu)化語言模型,對AI的回答方式及答案存在的局限性進行更新,實現(xiàn)了計算機“數(shù)據(jù)”與人類“知識”的突破性結合。
ChatGPT可通過自然對話方式交互,也可完成生成文本、自動問答等復雜語言任務,在各類AI文字處理的任務中表現(xiàn)出色,體現(xiàn)出較高的實用價值。放眼未來,ChatGPT產(chǎn)品有望通過不斷迭代逐步實現(xiàn)人機協(xié)同,核心技術的投入、算力、算法的通用化、更專業(yè)的人為標注(行業(yè)know-how)可以使得新場景的應用更加快速,能夠加速各個行業(yè)的智能化升級,邊際效用實現(xiàn)增長。
中泰證券表示,ChatGPT的爆火一方面是AI經(jīng)歷多年技術沉淀后的里程碑式事件;另一方面它的影響力已經(jīng)滿足革命性技術的一個重要標志,可能引領大量的應用重做已經(jīng)生活方式的變革。如AI接入設備,釋放大量的生產(chǎn)力,或是改變使用傳統(tǒng)搜索引擎的習慣,對內(nèi)容產(chǎn)業(yè)進行革新。
OpenAI 首席執(zhí)行官稱,GPT-4有望成為多模態(tài)的人工智能,根據(jù)OpenAI 創(chuàng)始人Altman消息,參數(shù)預計更大,計算模型優(yōu)化有望實現(xiàn)更優(yōu)化,且GPT-4將是純文本模型(不是多模態(tài))。華西證券認為,GPT-4的推出潛在商業(yè)價值巨大,模型更具備“擬人化”的功能,文本生成和內(nèi)容創(chuàng)作有望更加豐富,并有望進入文字工作的相關領域,例如新聞、金融等相關行業(yè)。
根據(jù)目前學界的觀點,一個理想的語言模型,應該具備以下性質(zhì):具備強大的自主學習、消化知識的能力,其學習過程不需要人為介入;能夠很好地理解人類指令,習慣人類的表達方式;能夠正確、清晰地給出問題的回答。
可以說,ChatGPT在這三個方面的綜合水平上,相比它的前輩們,取得了突破性的成就。GPT-3模型誕生于2020年6月(Language Modelsare Few-ShotLearners),此前自然語言處理(NLP)領域的主流技術是深度學習模型。但是隨著GPT和BERT等兩階段預訓練模型誕生后,NLP領域的研究范式出現(xiàn)了快速切換,海內(nèi)外大量科技公司選擇了以BERT為代表的雙向預訓練+Fine-tuning的模式。但與此同時,還有另一條技術路線,那就是OpenAI選擇并堅持至今的自回歸預訓練語言模型+Prompting的模式。
ChatGPT成功的背后離不開數(shù)據(jù)、模型和算力。數(shù)據(jù)方面:從2018年的GPT到2020年的GPT-3,算法模型上沒有太大的改變,主要的改變在于參數(shù)量和數(shù)據(jù)量。模型的參數(shù)量從1.17億個增加到1750億個,預訓練數(shù)據(jù)量從5GB增加到45TB。
模型方面:ChatGPT在GPT-3.5的基礎上增加了人類反饋強化模型,引入“人工標注數(shù)據(jù)+強化學習”來訓練模型,可以更好地與人類進行專業(yè)性交流。
算力方面:GPT-3.5在AzureAI超算基礎設施上進行訓練,總算力消耗約3640PF-days(即每秒一千萬億次計算,運行3640個整日)。
興業(yè)證券認為,大模型的算法復雜度、高訓練成本造就較高的進入壁壘。模型是AI的靈魂,本質(zhì)上它是一套計算公式和數(shù)學模型,“參數(shù)”可以看做是模型里的一個個公式,這意味著,參數(shù)量越大、模型越復雜,做出來的預測就可能越準確,目前業(yè)界主流的AIGC模型都是千億級參數(shù)量的水平。據(jù)Gartner技術成熟度曲線,當前生成式AI仍處于技術萌芽期,新進入者若希望在類ChatGPT產(chǎn)品上做布局的話,在大模型設計、模型訓練、應用場景落地等維度均需要加大投入。
申萬宏源表示,相比小模型,首先大模型最核心區(qū)別在于參數(shù)量,例如GPT-3參數(shù)量達到了1750億個,是傳統(tǒng)深度學習小模型參數(shù)量的至少一萬倍以上。通過模型的擴大,可以帶來提升包括:
一是GPT-2等大模型舍棄了小模型中常見的調(diào)參Fine-Tuning過程,轉向容量更大、無監(jiān)督訓練。
二是在自然語言理解NLP中,常見任務包括翻譯、問答、文本填空等,常見小模型需要對不同的任務使用不同模型分別訓練解決,而GPT-3等大規(guī)模預訓練模型不再規(guī)定任務,而是對以上不同任務都有較好效果;可以理解為,一個飽讀詩書的人,應該會寫作、對話、閱讀理解等多種技能,而不需要對單獨技能訓練。
三是傳統(tǒng)的模型訓練方式是反向傳播算法,先對網(wǎng)絡中的參數(shù)進行隨機初始化(預訓練大模型中不是隨機初始化的),再利用隨機梯度下降等優(yōu)化算法不斷優(yōu)化模型參數(shù),這種方式下對數(shù)據(jù)需求量較大。GPT-3先使用海量數(shù)據(jù)預訓練大模型,得到一套模型參數(shù),然后用這套參數(shù)對模型進行初始化,再進行訓練。大幅降低后續(xù)對數(shù)據(jù)量的需求。
申萬宏源表示,小模型時代,商用模型開發(fā)會綜合考慮調(diào)參等研發(fā)投入量和帶來的商業(yè)價值,模型開發(fā)出來后能否復用以攤薄研發(fā)成本,同時對于部分訓練樣本量較少的場景,沒有很好的解決方法。
大模型可以在長尾場景應用落地,降低訓練成本、減少數(shù)據(jù)要求?;诖笠?guī)模預訓練思路,一方面大模型可以應對多個泛化任務,大模型+細分場景微調(diào),更適合長尾落地;另一方面,對于小樣本(fewshot)訓練,大模型也有較好提升。
OpenAI于2015年在舊金山成立,是一家非營利的人工智能研究公司,公司的目標是以最有可能造福全人類的方式推進人工智能,而不受財務回報需求的約束。OpenAI創(chuàng)始人背景深厚,由埃隆·馬斯克與硅谷孵化器Y? Combinator投資人山姆·阿爾特曼等人聯(lián)合創(chuàng)立。公司研究人員經(jīng)驗豐富,包括前Google? Brain研究科學家伊利亞·蘇茨凱弗與前Stripe首席技術官格雷格·布羅克曼等世界一流研究工程師與科學家。
2018年,隨著特斯拉對AI的應用深入,為避免潛在利益沖突,馬斯克主動離任董事會,僅保留捐資人和顧問的身份。由于AI訓練花費金額巨大,2019年公司從非營利性公司轉向部分盈利公司,成立了OpenAI LP利潤上限子公司,即任何對OpenAI LP投資的收益都將統(tǒng)一轉移至一家非盈利公司,回報達到投資的100倍后進行利潤分配。同年,OpenAI收到微軟注資10億美元,就Azure業(yè)務開發(fā)人工智能技術。2020年發(fā)布GPT-3語言模型,由微軟獲得獨家授權。2022年發(fā)布ChatGPT的自然語言生成式模型,帶來更大潛在應用空間。
2023年1月23日,微軟宣布向ChatGPT開發(fā)者OpenAI追加投資數(shù)十億美元,這也是人工智能領域史上規(guī)模最大的一筆投資,微軟將在消費者和企業(yè)產(chǎn)品中部署OpenAI的模型,并引入基于OpenAI技術的新型數(shù)字體驗。
微軟一直計劃將ChatGPT整合到旗下產(chǎn)品中。在Bing中加入ChatGPT模型,可以更精確地幫助用戶查果。微軟還可能會將ChatGPT整合到Word、PowerPoint、Outlook和其他應用程序中,方便用戶可以只通過簡單的提示自動生成文本。
微軟還發(fā)布了“2023PowerPlatform第一波”功能發(fā)布計劃,RPA產(chǎn)品內(nèi)置GPT3(ChatGPT基于該技術開發(fā)而成),對該平臺的PowerAutomate、PowerApps、PowerPages和PowerVirtualAgents產(chǎn)品矩陣進行了智能升級。
1月26日“美版今日頭條”BuzzFeed宣布和OpenAI合作,未來將使用ChatGPT幫助創(chuàng)作內(nèi)容。
為應對ChatGPT的爆火,谷歌計劃推出對話人工智能服務Bard。這項實驗性人工智能程序以對話應用語言模型(LaMDA)為基礎。Bard的最初版本和LaMDA的輕量級模型將同時發(fā)布,這意味著能夠運用更小的算力擴大受眾并且得到更多的反饋。谷歌也計劃把這些新技術融合進自身的傳統(tǒng)產(chǎn)品例如搜索引擎之中,它正在以最新的人工智能技術為基礎,例如LaMDA、PaLM、Imagen和MusicLM,研究全新的信息接觸方式,預計谷歌帶有人工智能功能的搜索引擎將很快問世。
國內(nèi)方面,2月7日,百度公布其類ChatGPT項目名為“文心一言”(英文名ERNIE Bot),預計將于3月完成內(nèi)測并向公眾開放。
百度表示,自己具備ChatGPT的相關技術。在人工智能領域深耕了數(shù)十年,百度已經(jīng)具備跨模態(tài)、跨語言的深度語義理解與生成的能力,擁有產(chǎn)業(yè)級知識增強文心大模型ERNIE。并且已經(jīng)全棧布局人工智能的四層架構,分為底層的芯片、深度學習框架、大模型以及最上層的搜索等應用。即將推出的文心一言位于模型層。
資料來源:德勤,浙商證券研究所
資料來源:德勤,浙商證券研究所
2月8日,據(jù)阿里巴巴一名資深技術專家爆料,阿里達摩院正在研發(fā)類ChatGPT的對話機器人,目前處于內(nèi)測階段。根據(jù)曝光截圖,阿里或將AI大模型技術與釘釘生產(chǎn)力工具深度結合。
同日,網(wǎng)易有道AI技術團隊被傳已投入ChatGPT同源技術AIGC在教育場景的落地研發(fā),該團隊正在AI口語老師、中文作文批改等細分學習場景中嘗試探索,將盡快推出相關demo產(chǎn)品。
科大訊飛亦有相關技術儲備。ChatGPT主要涉及的自然語言處理(NLP)相關技術,正是科大訊飛長期深耕的領域??拼笥嶏w在2022年12月份啟動生成式預訓練大模型的任務攻關,該技術有望率先落地于科大訊飛AI學習機中,并預計將于2023年5月6日進行產(chǎn)品級發(fā)布。
三六零亦稱,其在類ChatGPT、文本生成圖像等技術在內(nèi)的AIGC技術上有持續(xù)性的研發(fā)及算力投入,但目前所形成的全部成果均僅作為公司內(nèi)部自用的生產(chǎn)力工具使用,自家類ChatGPT技術的各項指標只能達到略強于GPT-2的水平,與當前ChatGPT相比尚有代差的落后。
京東集團副總裁何曉冬也回應了相關布局,稱京東在ChatGPT領域擁有豐富的場景和高質(zhì)量的數(shù)據(jù),例如京東云言犀每天和用戶進行1000萬次的交互。他認為,ChatGPT是令人興奮的前沿探索,言犀則是大規(guī)模商用的客戶服務系統(tǒng),未來京東也會不斷結合ChatGPT的方法和技術點,融入到產(chǎn)品服務中來,推動人工智能的產(chǎn)業(yè)落地。
此外,字節(jié)已經(jīng)開始對AI+內(nèi)容的布局,自動生成投稿、輔助寫作、生成短視頻。比如利用AIGC在今日頭條上自動生成內(nèi)容、在抖音上生成一些圖文類的短視頻。目前AIGC的生成內(nèi)容質(zhì)量好于普通的UGC,但相較于PGC還有所欠缺,整體而言質(zhì)量較好。
AIGC產(chǎn)業(yè)生態(tài)正在加速形成和發(fā)展,根據(jù)6pen預測,未來五年10%-30%的圖片都將由AI參與生成,有望創(chuàng)造超過 600億元以上的市場空間。據(jù)量子位報告統(tǒng)計,到2030年,AIGC的市場規(guī)模將超過萬億人民幣,在內(nèi)容生產(chǎn)領域和延伸應用領域都有著廣闊的空間。但由于AIGC目前產(chǎn)業(yè)化程度有限,大量業(yè)務場景尚未成功變現(xiàn),商業(yè)模式也還處于探索階段,未來幾年都將是AIGC商業(yè)化的探索期。
長城證券表示,作為AIGC其中的重點細分領域,ChatGPT的成功體現(xiàn)了AIGC產(chǎn)業(yè)的快速進展,基于AIGC的應用廣泛,預計ChatGPT的應用場景也多樣化,同時對計算機及通信行業(yè)均有所催化。
華泰證券表示,ChatGPT屬于AIGC的具體應用,相比過去的AI產(chǎn)品,在模型類型、應用領域、商業(yè)化等層面呈現(xiàn)出新的特點。技術方面:ChatGPT屬于自然語言處理領域,與早期的自然語言技術相比,ChatGPT采用大模型進行訓練,并加入人工反饋增強學習(RLHF)方法,實現(xiàn)了效果的明顯提升;應用方面:ChatGPT屬于生成式AI,相比于分析型AI,不局限于已有的內(nèi)容,已在文藝創(chuàng)作,代碼處理,營銷等多個創(chuàng)造性場景內(nèi)得到應用;商業(yè)化方面:ChatGPT在商業(yè)化方面彰顯出強于以往AI應用的潛力,一方面用戶數(shù)快速增長;另一方面得到了微軟為代表的科技巨頭的支持,應用有望快速推廣。
未來,ChatGPT應用場景將包括以下多個領域。
多元傳媒:實現(xiàn)智能新聞寫作,提升新聞資訊的時效?;谒惴ㄗ詣泳帉懶侣?,將部分勞動性的采編工作自動化,幫助媒體更快、更準、更智能化地生產(chǎn)內(nèi)容。
電商:打造虛擬客服,提供24小時無縫對接服務。虛擬客服能夠填補人工客服的休息間隙,實時為客戶提供服務,并且能快速了解客戶需求和痛點進行交互。此外,通過ChatGPT對虛擬客服的回答信息加以約束,可控性安全性更強。
影視:分析歸納海量劇本,開闊創(chuàng)作思路。通過對海量劇本數(shù)據(jù)進行分析歸納,并按照預設風格快速生產(chǎn)劇本,創(chuàng)作者再進行篩選和二次加工,以此激發(fā)創(chuàng)作者的靈感,開闊創(chuàng)作思路,縮短創(chuàng)作周期。
教育:ChatGPT便于實時答疑解惑,幫助快速生成教育資料。學生可以進行在線實時問答交流解決問題,便利了答疑解惑,提高學習的自主性。ChatGPT還可以幫助教育機構快速生成大量測試題目和課件等。
金融:ChatGPT助力實現(xiàn)降本增效,提供更有溫情的服務。通過ChatGPT實現(xiàn)金融資訊、產(chǎn)品介紹內(nèi)容的文本自動生成,提升金融機構內(nèi)容運營的效率,構建虛擬客服在線交互,讓金融服務更有溫度。
醫(yī)療:ChatGPT可通過對話交互生成文本,輔助電子病歷錄入,解放醫(yī)生精力。
東方證券認為,現(xiàn)階段AIGC的商業(yè)模式仍會以To B為核心,B端客戶基于對企業(yè)降本增效的要求,對 AIGC的需求和付費意愿是較為強烈的;面向C端用戶的商業(yè)化存在訂閱制和按次收費等模式,AIGC能夠大幅降低大眾用戶的創(chuàng)作門檻,未來隨著AIGC生態(tài)不斷完善,市場空間也十分可觀。
AI有望進入新紀元,對現(xiàn)有娛樂、傳媒、新聞、建模等應用具有顛覆性的創(chuàng)新。
華西證券認為,AIGC的出世會產(chǎn)生革命性的影響,同時有望賦能千行百業(yè),隨著AI寫作、AI作圖、AI底層建模、AI生成視頻和動畫技術逐漸成熟,AI有望進入新紀元,帶來空前藍海,同時對現(xiàn)有娛樂、傳媒、新聞、建模等應用具有顛覆性的創(chuàng)新。
華西證券表示,AIGC的受益廠商分為三類:AI處理器廠商;AI商業(yè)算法商業(yè)落地的廠商;AIGC相關技術儲備的應用廠商。
其中,具備自研AI處理器的廠商可以為AIGC的神經(jīng)網(wǎng)絡提供算力支撐。人工智能的本質(zhì)及數(shù)據(jù)的海量運算,相較于AI算法,數(shù)據(jù)才是重中之重。算力作為數(shù)據(jù)加速處理的動力源泉,其重要性不言而喻。AI處理器芯片可以支持深度神經(jīng)網(wǎng)絡的學習和加速計算,相比于GPU(圖形處理器)和CPU(中央處理器)擁有成倍的性能提升和極低的耗電水平。因此,人工智能芯片將發(fā)揮大量作用。
具備AI商業(yè)算法落地的廠商具備相關算法的領先性。 AI算法的龍頭廠商在自然語言處理、機器視覺、數(shù)據(jù)標注方面都具有先發(fā)優(yōu)勢。算法上,數(shù)據(jù)標注屬于AIGC算法的生成關鍵步驟,而在自然語言處理、機器視覺等方面,AIGC已經(jīng)對此方向應用產(chǎn)生深遠影響,例如已經(jīng)實現(xiàn)的虛擬人與自然人的對話、AI作圖、AI底層建模,隨著技術的進一步成熟,AIGC勢必對該方向應用產(chǎn)生革命性影響。
AIGC相關技術儲備的應用廠商有望打開海量市場。相關娛樂、傳媒、新聞、游戲、搜索引擎等廠商具備海量文本創(chuàng)作、圖片生成、視頻生成等需求,隨著AIGC的逐漸成熟,相關AI算法不斷成熟完善,并結合相關應用,相關廠商在降本增效的同時,有望提升其創(chuàng)作內(nèi)容的質(zhì)量、減少有害性內(nèi)容傳播等問題,實現(xiàn)創(chuàng)意激發(fā),提升內(nèi)容多樣性,AIGC有望極大推動相關廠商商業(yè)化的發(fā)展,從而打開海量空間。
東方證券表示,未來幾年是AIGC的快速發(fā)展窗口期,其涉及的相關底層AI模型算法、算力基礎設施以及下游行業(yè)應用都有望迎來加速增長。AI模型算法是AIGC的核心,是技術驅動層,需要投入高額的研發(fā)與訓練成本;算力基礎設施主要包括存儲和芯片等設施,是訓練大模型必需的基礎架構;下游行業(yè)應用則是以AIGC在不同場景中的落地為主,側重于滿足用戶的個性化需求,建立起AIGC產(chǎn)業(yè)生態(tài)。
長城證券認為,ChatGPT通過升級訓練方式攻關了原有模型局限,帶來出色的用戶體驗及較高的實用價值。科技巨頭的加入、商業(yè)形式的豐富或加速ChatGPT乃至AIGC行業(yè)的商業(yè)化進程。AIGC行業(yè)在AI文本生成、音頻生成及圖片生成等細分領域具備廣闊的應用空間,基于技術上的剛性需求,下游的應用落地刺激上游算力需求的提升。
ChatGPT技術方案最大的優(yōu)點就是單一模型,特點就是參數(shù)比較大,達到1750億個參數(shù),代價就是需要巨大的算力。并在算力中心的基礎上構建大模型;這是AI未來發(fā)展的大趨勢。這使得AI公司的進入門檻不斷提升,一方面要做出大模型,一方面還需要巨大投入去使用算力中心。
民生證券也表示,ChatGPT能夠實現(xiàn)當前如此強大的交互,離不開背后龐大的算力支撐。根據(jù)綠色節(jié)能數(shù)據(jù)中心官方公眾號,ChatGPT的總算力消耗約為3640PF-days。按近期在國內(nèi)落地的某數(shù)據(jù)中心為參照物,算力500P耗資30.2億元落成,若要支持ChatGPT的運行,需要7-8個這樣數(shù)據(jù)中心支撐,基礎設施投入需以百億元計。因此,隨著AI等新技術的發(fā)展,對高可靠、高性能、高安全算力需求更加突出,全球正掀起一場算力的“軍備競賽”,數(shù)據(jù)中心、AI芯片、服務器等環(huán)節(jié)作為算力基礎設施,有望被高度重視。
當前,存量已經(jīng)建立優(yōu)勢的AI公司具備資本實力,拉高了行業(yè)壁壘,但是未來AI應用場景廣泛,想象空間巨大,并且基于對數(shù)據(jù)安全保護的更加重視,未來中國龐大的市場較大概率是由中國公司來做,小型創(chuàng)業(yè)AI公司依舊存在生長空間。
隨著AI 等新技術的發(fā)展, 對高可靠、高性能、高安全算力需求更加突出,全球正掀起一場算力的“軍備競賽”。
算力增長推動基礎設施擴容,數(shù)據(jù)中心服務器、交換機、光模塊不斷迭代。AI對于算力最大的挑戰(zhàn)依然來自于核心數(shù)據(jù)中心的模型訓練,算力需要能耗、成本的堆砌,持續(xù)輸入數(shù)據(jù)耗電做存儲計算,能耗與投入成本密切相關。AI背后所需的算力支撐相較于之前的云計算、電商有成倍的增長,按照傳統(tǒng)速率升級、堆疊算力的方式已經(jīng)不能滿足當前商業(yè)化的發(fā)展需求。為了匹配高算力,未來需要對設備實行降本方案。CPO(共封裝光學)有望成為AI高算力下解決方案。
NPO(近封裝光學)及CPO是將網(wǎng)絡交換芯片和光模塊(光引擎)進行“封裝”的技術,用來替代目前的熱插拔式光組件。據(jù)Lightcounting預測,CPO未來可能成為大型數(shù)據(jù)中心的可插拔光收發(fā)器的替代方案。產(chǎn)品預計將從800G和1.6T端口開始放量,于2024-2025年開始商用,2026-2027年開始規(guī)模上量,主要應用于超大型云服務商的數(shù)通短距場景。CIR的預測指出,2026年全球CPO市場規(guī)模將達3.44億美元,2030年將達到23億美元。
AIGC的發(fā)展有望帶動CPO的需求進一步拓展。降能耗成本需要設備、光模塊、交換機的更新。衍生出的交換機和光模塊融合(COPACKAGE),以前的光模塊演進成光引擎,然后再和交換芯片貼在同一張PCB背板上,通過交換機搭載的液冷板進行物理冷卻和降溫。同時光引擎由于體積、集成度高,搭配硅光封裝規(guī)模化后會體現(xiàn)成本優(yōu)勢,有望替代高算力場景。當前很多大廠已經(jīng)出貨,其體量較小,未來在數(shù)據(jù)中心側有望規(guī)模性鋪開。
傳統(tǒng)市場的需求會被新方案替代,但由于算力激增,數(shù)通投資、光通信的需求量會大幅提升,特別是高算力場景下的出貨量增長前景較好。結構性創(chuàng)新帶來的彈性可能會在2023-2024年體現(xiàn)出來,目前切換新方案的糾結點在于成本和供應鏈是否穩(wěn)定,預計產(chǎn)品起量后供應鏈會所有突破。AI進度加速,ChatGPT爆火可能帶來光引擎、液冷服務器加速推進。
長江證券表示,ChatGPT的橫空出世以及國內(nèi)外巨頭紛紛投入大模型,意味著大模型有望帶領新一輪浪潮,當前投資共有兩條主線,一是圍繞人工智能三大要素布局,短期關注軟硬件配套的底層資源,二是中長期關注新一輪技術變革下新場景和新產(chǎn)品的創(chuàng)新落地。
復盤深度學習的發(fā)展歷程,長江證券發(fā)現(xiàn),其中有兩類企業(yè)伴隨此趨勢得到真正的商業(yè)化成長:第一類是底層資源企業(yè),以英偉達為代表。2012年,英偉達看到了GPU在圖形運算之外的潛力,自研出適合深度學習發(fā)展的 CUDA(通用冰箱計算平臺),GPU替代CPU成為AI訓練市場的首選,英偉達股價開始飆升,乘深度學習之東風,成為AI芯片領域的絕對霸主。后來不斷在下游進行深耕,除了優(yōu)勢游戲行業(yè),在智能駕駛的底層資源支持也得到了巨大的突破。
第二類為實現(xiàn)場景賦能的應用企業(yè)。首先是互聯(lián)網(wǎng)平臺廠商,在互聯(lián)網(wǎng)商業(yè)變現(xiàn)場景中,廣告變現(xiàn)占有主導地位。2012年,深度學習迅速席卷圖像、語音、NLP等領域,并逐步在互聯(lián)網(wǎng)商業(yè)化最成功的搜索、推薦和廣告領域獲得突破并成為主流,在此過程中,中國誕生了一系列火爆應用抖音、頭條、快手等,同時互聯(lián)網(wǎng)依托廣告變現(xiàn)的商業(yè)模式再上新臺階。
其次是將技術與傳統(tǒng)場景結合,實現(xiàn)商業(yè)化落地的人工智能技術廠商,但由于落地場景規(guī)模的不同,真正實現(xiàn)投入產(chǎn)出平衡的企業(yè)屈指可數(shù),其中科大訊飛依托本身在教育行業(yè)的數(shù)據(jù)優(yōu)勢,實現(xiàn)在教育行業(yè)的產(chǎn)品化落地。
因此,在大模型引領的新一波浪潮下,長江證券建議,短期關注軟硬件配套的底層資源,中長期關注新一輪技術變革下新場景和新產(chǎn)品的創(chuàng)新落地,其中可以實現(xiàn)規(guī)模化落地場景將誕生公司更大的成長機遇,其次是碎片化場景落地廠商。
在多重利好因素推動下,ChatGPT概念無疑成為A股市場上“最靚的仔”。Choice數(shù)據(jù)顯示, 2月以來ChatGPT概念指數(shù)漲幅已經(jīng)超過20%。不過,看到機會的同時,投資者也應該看到,這一技術的落地將會是長期而持續(xù)的過程,短期行情的過度火爆會讓板塊泡沫破裂的風險提升。
廣發(fā)證券認為,近期市場關注度較高的ChatGPT對A股計算機相關上市公司的實質(zhì)影響極為微小。交易性主題機會的屬性非常突出,基本面極不相稱。與美國公司相比,相關三大要素至少在數(shù)據(jù)質(zhì)量和商業(yè)化上有不小差距,且存在巨大挑戰(zhàn)。
廣發(fā)證券表示,ChatGPT對A股計算機更多是情緒意義。首先,從產(chǎn)業(yè)鏈現(xiàn)狀來看,A股計算機公司在AI產(chǎn)業(yè)鏈中基本屬于微小的從屬地位,只有算力環(huán)節(jié)的寒武紀比較突出。AI大模型方面領先者群體主要是百度、阿里、華為、騰訊等頭部互聯(lián)網(wǎng)公司或云計算公司,也包括商湯等獨立通用平臺公司。此外,訊飛在語音外的多樣性應用上仍有較多空間待實現(xiàn)。
其次,產(chǎn)業(yè)分工生態(tài)有較大差異,美國獨立中小科技公司被科技或互聯(lián)網(wǎng)巨頭以高估值購入的案例在中國不多見,國內(nèi)巨頭傾向于通過內(nèi)生垂直一體化的習慣留給獨立公司的成長空間較美國同類公司小。
再次,相關互聯(lián)網(wǎng)公司近三年資本開支增長放緩,在主營業(yè)務已過高速成長期,云計算業(yè)務依然虧損的背景下,資本開支的恢復力度可能短期相對有限。
廣發(fā)證券認為,AI主要是三大要素:數(shù)據(jù)、模型和算力。其中數(shù)據(jù)的數(shù)量和質(zhì)量的差異和影響更大。僅以數(shù)據(jù)質(zhì)量為例,最大的障礙和挑戰(zhàn)是數(shù)據(jù)來源的割裂。
在各領先公司或潛力公司之間,各自的數(shù)據(jù)來源較為割裂??萍脊靖鶕?jù)主營業(yè)務不同,其采集的數(shù)據(jù)范圍有限。例如,阿里采集的主要是消費者行為和決策數(shù)據(jù),騰訊通過微信采集的是社交類數(shù)據(jù),小紅書采集的主要是和生活方式相關數(shù)據(jù)。有限的數(shù)據(jù)采集方式在多維度層面影響了可用于模型訓練的數(shù)據(jù)質(zhì)量,進一步會影響到AI模型的泛化能力和不同場景的通用化效果。
而OpenAI獨立第三方的中立屬性和開放的風格更容易與產(chǎn)業(yè)鏈上下游形成合作,在開放的生態(tài)建設上更具優(yōu)勢,或者說遠遠優(yōu)于任何一個單一平臺公司的數(shù)據(jù)來源。其對谷歌的強大挑戰(zhàn)和壓力充分證明這一點。
廣發(fā)證券還認為,從商業(yè)化的對比來看,AI的投入巨大且持續(xù)性強,因此商業(yè)化成功與否極其關鍵。迄今為止,ChatGPT較有商業(yè)發(fā)展?jié)摿Φ牡湫桶咐俏④洀臑g覽器到OFFICE的全線融合應用。以Edge為例,其功能增強達到了質(zhì)變的程度。這極大提高其商業(yè)產(chǎn)品的門檻和附加值,對現(xiàn)有單一產(chǎn)品公司是降維競爭,可以預期其相關產(chǎn)品線的競爭優(yōu)勢會迅速擴大并能逐步新增體現(xiàn)在全球市場份額和財務回報上。
而此前的NLP在中國市場的商業(yè)應用更多存在于精準營銷等C端,已相對成熟。對于要求較高的B端IT應用無論產(chǎn)品還是生態(tài)合作、價值鏈均衡都有不小差距,廣發(fā)證券認為要達到類似效果有較長的路。
廣發(fā)證券表示,總體而言,ChatGPT相關主題對A股計算機相關標簽公司整體幾乎沒有實質(zhì)驅動,整個產(chǎn)業(yè)鏈的追趕都面臨較大挑戰(zhàn),積極意義主要體現(xiàn)在對市場關注度的貢獻。相關公司絕大多數(shù)基本面和主題標桿相去甚遠,且整體在產(chǎn)業(yè)鏈中處于相對邊緣的位置。