国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

新一代人工智能技術(shù)(AIGC):發(fā)展演進(jìn)、產(chǎn)業(yè)機(jī)遇及前景展望

2023-08-17 12:19:02許雪晨田侃李文軍
關(guān)鍵詞:產(chǎn)業(yè)發(fā)展數(shù)字經(jīng)濟(jì)

許雪晨 田侃 李文軍

關(guān)鍵詞:AIGC;新一代人工智能技術(shù);ChatGPT;產(chǎn)業(yè)發(fā)展;數(shù)字經(jīng)濟(jì)

DOI:10.19313/j.cnki.cn10-1223/f.20230705.001

一、引言

習(xí)近平總書記指出,“把新一代人工智能作為推動科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的驅(qū)動力量,努力實現(xiàn)高質(zhì)量發(fā)展?!苯?jīng)過60 多年的發(fā)展,人工智能發(fā)展進(jìn)入新的階段,相比于傳統(tǒng)人工智能,新一代人工智能呈現(xiàn)出深度學(xué)習(xí)、跨界融合、人機(jī)協(xié)同、群智開放、自主操控等新特征。大數(shù)據(jù)驅(qū)動知識學(xué)習(xí)、跨媒體協(xié)同處理等也成為人工智能的發(fā)展重點。近年來,通過無監(jiān)督學(xué)習(xí)條件下的“大數(shù)據(jù)+大模型”方式,自然語言處理、語音識別、計算機(jī)視覺等任務(wù)的性能均顯著提升,新一代人工智能的重要分支——人工智能生成內(nèi)容(Artificial Intelligence GeneratedContent,AIGC)迎來加速發(fā)展,正在催生全新的產(chǎn)業(yè)體系。

代表AIGC 最新進(jìn)展的是OpenAI 開發(fā)的聊天機(jī)器人——ChatGPT(Long 等,2022),通過大規(guī)模預(yù)訓(xùn)練模型,ChatGPT 具備理解自然語言和文本生成的能力,可以執(zhí)行文本翻譯、摘要生成、情感分析等任務(wù)。ChatGPT 以其強(qiáng)大的功能和廣泛的應(yīng)用場景,在推出僅兩個月后,就迅速發(fā)展壯大,月活用戶數(shù)量已超過1 億。如果說“阿爾法狗”刷新了普通大眾對人工智能技術(shù)的看法,那么ChatGPT 則使人工智能技術(shù)“飛入尋常百姓家”。這引起了業(yè)界和學(xué)界的廣泛關(guān)注。

2023 年2 月,微軟宣布在Bing 搜索引擎中引入ChatGPT,自集成ChatGPT 后,Bing 的日活量也首次突破1 億。作為人工智能領(lǐng)域的現(xiàn)象級應(yīng)用,ChatGPT 也開啟了中國人工智能行業(yè)新賽道,引發(fā)國內(nèi)科技巨頭競相涌入。在眾多互聯(lián)網(wǎng)公司中,百度最早官宣將在今年3 月上線百度版ChatGPT——“文心一言”。騰訊則表示,專項研究正在有序推進(jìn),針對類ChatGPT 對話式產(chǎn)品已成立“混元助手”項目組。此外,京東宣布將推出產(chǎn)業(yè)版ChatGPT—ChatJD。網(wǎng)易有道則對AIGC在教育場景的落地進(jìn)行布局。360 也對外公布,計劃推出類ChatGPT 的demo 版產(chǎn)品。

ChatGPT 是近年來人工智能領(lǐng)域的一項重大突破,但其突然火爆并非橫空出世,非一日之功,而是人工智能大模型從量變到質(zhì)變的一個華麗蛻變。

在過去幾十年里,由于機(jī)器學(xué)習(xí)算法、計算機(jī)處理能力、移動互聯(lián)網(wǎng)等方面的進(jìn)步,計算和人工智能相關(guān)的方法取得了長足進(jìn)展并引發(fā)了一系列突破,ChatGPT 的成功基于大模型、大算力、大訓(xùn)練數(shù)據(jù)。幾十年間,人工智能已成為包括中國在內(nèi)的許多國家經(jīng)濟(jì)發(fā)展的重要引擎。

2017 年7 月,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》(以下簡稱《規(guī)劃》)①,這是本世紀(jì)以來中國發(fā)布的第一個人工智能系統(tǒng)性戰(zhàn)略規(guī)劃,這一規(guī)劃提出了面向2030 年中國新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標(biāo)、重點任務(wù)和保障措施?!兑?guī)劃》指出,要重點突破跨媒體統(tǒng)一表征、關(guān)聯(lián)理解與知識挖掘、知識圖譜構(gòu)建與學(xué)習(xí)、知識演化與推理、智能描述與生成等技術(shù),實現(xiàn)跨媒體知識表征、分析、挖掘、推理、演化和利用,構(gòu)建分析推理引擎。AIGC 技術(shù)能力升級將為這一目標(biāo)的實現(xiàn)提供強(qiáng)力支撐。2023 年2 月13 日,北京市經(jīng)濟(jì)和信息化局發(fā)布《2022 年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》,該白皮書提到,今年北京市將引導(dǎo)企業(yè)、高校、科研院所、新型研發(fā)機(jī)構(gòu)、開源社區(qū)等,圍繞人工智能關(guān)鍵核心技術(shù)創(chuàng)新協(xié)同攻關(guān),持續(xù)推動建設(shè)具有全球影響力的人工智能創(chuàng)新策源地。同時,支持頭部企業(yè)打造對標(biāo)ChatGPT 的大模型,構(gòu)建開源框架和通用大模型的應(yīng)用生態(tài),形成人工智能產(chǎn)業(yè)發(fā)展新突破;加強(qiáng)人工智能算力基礎(chǔ)設(shè)施布局,加速人工智能基礎(chǔ)數(shù)據(jù)供給②。上海市經(jīng)信委表示,在全球科技競爭日趨白熱化的情況下,積極發(fā)展AIGC,加快構(gòu)筑活躍的產(chǎn)業(yè)生態(tài),將是上海人工智能發(fā)展的重要著力點。

目前,隨著政策面利好,疊加科技巨頭陸續(xù)入場,AIGC 的應(yīng)用場景不再單純局限于聊天機(jī)器人、文本生成等方面,更將為數(shù)字經(jīng)濟(jì)、產(chǎn)業(yè)發(fā)展甚至社會變革注入強(qiáng)大動力。由于AIGC 興起時間較短,對該領(lǐng)域相關(guān)內(nèi)容的梳理和綜述相對匱乏,因此,本文旨在全面、系統(tǒng)地對AIGC 相關(guān)的概念、技術(shù)和國內(nèi)外主要科技公司前瞻布局進(jìn)行系統(tǒng)梳理分析,并從產(chǎn)業(yè)視角深度剖析AIGC 產(chǎn)業(yè)本身及其與相關(guān)產(chǎn)業(yè)的融合。關(guān)注新一代人工智能技術(shù)AIGC 對產(chǎn)業(yè)和社會發(fā)展的影響,迫切且關(guān)鍵。

本文剩余內(nèi)容結(jié)構(gòu)是:首先對AIGC 概念和發(fā)展歷程進(jìn)行梳理,全面了解AIGC 發(fā)展?fàn)顩r;然后探討AIGC 帶來的產(chǎn)業(yè)機(jī)遇,分析其應(yīng)用場景及其可能帶來的風(fēng)險;最后在上述分析基礎(chǔ)上,提出中國針對AIGC 發(fā)展和治理的政策建議。

二、AIGC 概念梳理與發(fā)展歷程

(一)AIGC概念與內(nèi)涵

1950年,艾倫·圖靈在《計算機(jī)器與智能》中提出了著名的“圖靈測試”——判定機(jī)器是否“智能”的試驗方法(Turing,2009),即機(jī)器是否能夠模仿人類的思維方式來“生成”內(nèi)容,實現(xiàn)人機(jī)交互。因此,人工智能從圖靈開始就被寄予了用于內(nèi)容創(chuàng)造的期許。經(jīng)過半個多世紀(jì)發(fā)展,數(shù)據(jù)快速積累、算力性能提升和算法效力增強(qiáng),如今人工智能不僅實現(xiàn)了人機(jī)互動,還能夠進(jìn)行寫作、編曲、繪畫、視頻制作等創(chuàng)意工作。2018 年,由人工智能創(chuàng)作的肖像畫《埃德蒙·貝拉米畫像》拍賣43.25 萬美元,成為人類歷史上首次拍賣的AI 藝術(shù)品,引發(fā)各界關(guān)注。隨著人工智能越來越多地被應(yīng)用于內(nèi)容創(chuàng)作,AIGC 概念悄然興起。

目前,對AIGC 的定義尚無統(tǒng)一規(guī)范的界定。國內(nèi)產(chǎn)學(xué)研各界對于AIGC 的理解是“繼專業(yè)生成內(nèi)容(Professional Generated Content,PGC)和用戶生成內(nèi)容(User Generated Content,UGC)之后(Nosita 和Lestari,2019;Lobato 等,2011),利用人工智能技術(shù)自動生成內(nèi)容的新型生產(chǎn)方式”。在國際上對應(yīng)的術(shù)語是“人工智能合成媒體(AI-generated Media 或Synthetic Media)”(Pataranutaporn 等,2023),其定義是“通過人工智能算法對數(shù)據(jù)或媒體進(jìn)行生產(chǎn)、操控和修改的統(tǒng)稱”。因此,AIGC 是指從內(nèi)容生產(chǎn)者的角度對內(nèi)容進(jìn)行分類的一種內(nèi)容類型,同時也是一種自動化生成內(nèi)容的技術(shù)。

(二)AIGC 發(fā)展歷程

梳理人工智能的發(fā)展演進(jìn),AIGC 的發(fā)展基本可以劃分為三個時期:醞釀萌芽階段(20 世紀(jì)50年代至20 世紀(jì)90 年代中期)、穩(wěn)步推進(jìn)階段(20 世紀(jì)90 年代中期至21 世紀(jì)10 年代中期)以及迅猛發(fā)展階段(21 世紀(jì)10 年代中期至今)(三階段的相關(guān)總結(jié)見表1)。

1. 醞釀萌芽階段

20 世紀(jì)50 年代至20 世紀(jì)90 年代中期,受限于技術(shù)水平,AIGC 僅局限于小范圍實驗。1950年,圖靈提出“圖靈測試”能夠判定機(jī)器是否“智能”;1957 年,計算機(jī)首次創(chuàng)作完成弦樂四重奏《依利亞克組曲》;1966 年,世界上第一款可人機(jī)對話的機(jī)器人“伊莉莎(Eliza)”問世,主要通過關(guān)鍵字掃描與重組完成交互任務(wù)。20 世紀(jì)80 年代中期,國際商業(yè)機(jī)器公司(International BusinessMachines Corporation,IBM)創(chuàng)造了語音控制打字機(jī)“坦戈拉(Tangora)”,約能處理20 000 個單詞。

20 世紀(jì)80 年代末至90 年代中期,由于高昂的研發(fā)投入沒有實現(xiàn)預(yù)期的商業(yè)變現(xiàn),世界各國開始減少人工智能領(lǐng)域的投入,AIGC 沒有實現(xiàn)重大突破。但在此期間,圖靈測試、對話機(jī)器人以及語控打字機(jī)已經(jīng)孕育了AIGC 的雛形。

2. 穩(wěn)步推進(jìn)階段

20 世紀(jì)90 年代中期至21 世紀(jì)10 年代中期,AIGC 逐漸進(jìn)入穩(wěn)步推進(jìn)階段。2006 年起,一方面,圖形處理器和張量處理器等算力設(shè)備性能大幅提升,深度學(xué)習(xí)算力增強(qiáng),深度學(xué)習(xí)算法取得重大突破;另一方面,互聯(lián)網(wǎng)的推廣普及使得數(shù)據(jù)規(guī)模劇增,這為各類人工智能算法提供了海量訓(xùn)練數(shù)據(jù)。雖然算力的提升與數(shù)據(jù)的膨脹使人工智能取得了長足發(fā)展,但AIGC 仍受限于算法約束,創(chuàng)作任務(wù)依然沒有取得重大突破,應(yīng)用場景有限,應(yīng)用效果有待提升。2007 年,紐約大學(xué)的人工智能系統(tǒng)撰寫小說《1 The Road》——世界第一部完全由人工智能創(chuàng)作的小說,雖然小說可讀性不強(qiáng)、存在拼寫錯誤、邏輯混亂,但從AIGC 整個發(fā)展歷程來看,其突破性意義遠(yuǎn)高于文學(xué)價值。2012 年,微軟推出全自動同聲傳譯系統(tǒng),計算機(jī)能夠自動完成語音識別、英中機(jī)器翻譯,以及中文語音合成,效果非常流暢,這標(biāo)志著深度神經(jīng)網(wǎng)絡(luò)模型在語音識別和音頻生成領(lǐng)域獲得了巨大的成功,為AIGC 進(jìn)一步發(fā)展帶來希望。

在進(jìn)入21 世紀(jì)后,AIGC 從前期的技術(shù)實驗性向商業(yè)實用性轉(zhuǎn)變,但受限于算法瓶頸,其往往只能根據(jù)算法提供的模板生成內(nèi)容,開放性、包容性還有待提升,無法較好地完成創(chuàng)作。

3. 迅猛發(fā)展階段

21 世紀(jì)10 年代中期至今,AIGC 迎來新發(fā)展,生成內(nèi)容更加多元,生成效果更加逼真。自2014 年起,Goodfellow 等(2020)提出以生成式對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)為代表的深度學(xué)習(xí)算法,并不斷迭代更新,為AIGC 提供了強(qiáng)大的技術(shù)支撐。此后,2017 年,微軟人工智能少女“小冰”完成了世界首部完全由人工智能創(chuàng)作的詩集——《陽光失了玻璃窗》。2018年,英偉達(dá)發(fā)布可以實現(xiàn)自動生成圖片的模型——StyleGAN(Karras 等,2020),該模型目前已升級到第四代——StyleGAN-XL(Sauer 等,2022),其生成圖片的分辨率極高,人眼難以分辨真假。2019 年,DeepMind 發(fā)布DVD-GAN 模型(Clark 等,2019)可以生成高度逼真且連貫的視頻,該模型能夠通過學(xué)習(xí)和理解人類的語言,進(jìn)行對話、聊天互動。2021 年,OpenAI 推出DALL-E(Ramesh等,2021),主要用于文本與圖像的交互生成內(nèi)容,并于一年后推出升級版本DALL-E-2(Marcus等,2022)。 DALL-E-2 基于對主題、風(fēng)格、調(diào)色板和所需概念意義的“理解”,可以生成相應(yīng)的圖像,同時該模型還能夠根據(jù)原圖像進(jìn)行二次創(chuàng)作。至此,AIGC 技術(shù)基本成熟,有望成為改變商業(yè)模式和產(chǎn)業(yè)發(fā)展范式的重要驅(qū)動力。

總的來說,該階段深度學(xué)習(xí)算法快速發(fā)展,AIGC 生成效果逐漸逼真直至人類難以分辨。與此同時,市場受到較高關(guān)注,雖然距離大規(guī)模證明和體系化發(fā)展仍有差距,但從資本的加碼到應(yīng)用場景的探索,距離的縫隙有望逐步填補(bǔ)。

三、國內(nèi)外主要科技公司AIGC 布局現(xiàn)狀

2022 年下半年起,“AIGC”接棒“元宇宙”成為全球矚目的焦點和熱議話題,各個行業(yè)都在積極探尋AIGC 助力下的新方向,搶占新賽道。國內(nèi)外各大科技企業(yè)紛紛在AIGC 領(lǐng)域搶先布局,新興科技創(chuàng)業(yè)公司悄然興起。本節(jié)將對國內(nèi)外主要科技公司AIGC 布局進(jìn)行梳理,并以中美兩國為例,分析比較兩國AIGC 發(fā)展異同,明確中國AIGC 發(fā)展難點痛點與瓶頸環(huán)節(jié)。

(一)國外AIGC 發(fā)展現(xiàn)狀

國外AIGC 領(lǐng)域的相關(guān)企業(yè)既有谷歌、META、微軟等科技巨頭,也不乏Stability AI、Jasper、OpenAI 等新晉獨角獸企業(yè)。上述科技公司的項目不僅可以生成圖片,還能夠進(jìn)行視頻生成。例如,META 推出Make-A-Video 系統(tǒng)(Singer 等,2022),實現(xiàn)了由文本到視頻的飛躍;谷歌推出ImagenVideo(Saharia 等,2022)和Phenaki(Villegas 等,2022),可以從簡單的文本提示中生成高清視頻。AIGC 在海外市場發(fā)展迅速,目前具有參照意義的國外公司主要有:

1. 微軟

2019 年,微軟向OpenAI 投資10 億美元,試圖實現(xiàn)AI 的彎道超車。在關(guān)注技術(shù)研發(fā)的同時,微軟積極籌備OpenAI 的商業(yè)化落地,將OpenAI 的技術(shù)與自有產(chǎn)品進(jìn)行集成。2020 年,微軟將GPT-3 模型(Brown 等,2020)用于Office、Bing 和Microsoft design 等產(chǎn)品中;2021 年,在Azure中集中部署OpenAI 開發(fā)的GPT、DALLE、Codex 等各類工具,這也成為OpenAI 最早的收入來源。2023 年1 月,微軟向OpenAI 追加數(shù)十億美元的投資。2 月2 日,微軟宣布旗下所有產(chǎn)品均將整合ChatGPT,包括搜索引擎Bing、辦公全家桶Office。目前,微軟已發(fā)布4 款基于ChatGPT 的融合應(yīng)用,包括視頻會議Teams 智能概述功能,銷售應(yīng)用Viva Sales 生成郵件回復(fù),搜索引擎Bing 通過聊天獲取答案,瀏覽器Edge 聊天和編寫功能。微軟CEO 納德拉宣布將在云計算平臺Azure 中整合ChatGPT,宣告Azure OpenAI 服務(wù)全面上市,通過該服務(wù)可以訪問OpenAI 開發(fā)的AI 模型,屆時微軟的每個產(chǎn)品都將具備相同的AI 能力。

2. 谷歌

2021 年,谷歌推出大語言模型LaMDA(Thoppilan 等,2022),并在此基礎(chǔ)上開發(fā)了Bard,可以將信息知識和大語言模型的智能相結(jié)合,提供新鮮高質(zhì)量的回復(fù)。這意味著與ChatGPT 不同,Bard 可以基于實時網(wǎng)絡(luò)數(shù)據(jù),而ChatGPT 的信息獲取來源只局限于2021 年以前的數(shù)據(jù)。谷歌目前在文本、源代碼、音頻、圖像和視頻四個領(lǐng)域均開展了生成式模型研究。Wordcraft Writers Workshop可以幫助作家從大型語言模型中獲得寫作上的幫助。AudioLM(Borsos 等,2022)是音頻生成模型,該模型將音頻樣本輸入并繼續(xù)進(jìn)行創(chuàng)作,用以生成音樂和語音。此外,谷歌研究院還發(fā)布了AIGC工具Stable Diffusion(Rombach 等,2022)和Dreambooth(Ruiz 等,2022),借助上述工具,只需輸入幾張指定物體的照片和相應(yīng)的類名,即可通過文字描述讓被指定物體出現(xiàn)在用戶想要生成的場景中。

3. META

Meta 在AIGC 領(lǐng)域也有戰(zhàn)略安排。2022 年11 月,Meta 的人工智能實驗室Meta AI 發(fā)布了AI系統(tǒng)“Make-A-Video”,能夠根據(jù)輸入的自然語言文本生成一段5 秒鐘左右的短視頻。并且在語言生成視頻的基礎(chǔ)上,拓展到從圖像生成視頻以及從視頻生成視頻。此外,Meta 在AIGC 的其他方向也有布局。Meta A 提出了一個全新的文本到四維生成系統(tǒng)MAV3D(MakeA-Video3D),將自然語言描述作為輸入,并輸出一個動態(tài)的三維場景表示,可以從任意的視角進(jìn)行渲染。

4. 獨角獸企業(yè)

除了上述這三家企業(yè)之外,還包括Zyro、NVIDIA、OpenAI、Gliacloud 等人工智能企業(yè)與獨角獸企業(yè)同樣具備對標(biāo)AIGC 的技術(shù)能力(見表2 所示)。

(1)Zyro:一方面圍繞垂直業(yè)務(wù)場景,結(jié)合業(yè)務(wù)knowhow 組織相關(guān) AIGC 能力;另一方面,圍繞電商場景,通過AIGC 生成網(wǎng)站搭建過程中所需的各類素材,具體業(yè)務(wù)包括針對性生成公司介紹、企業(yè)價值、Slogan、自動提升圖片清晰度、自動生成logo 等。

(2)NVIDIA:通過構(gòu)建技術(shù)矩陣,使其最終服務(wù)于創(chuàng)作型工具平臺在視覺生成研究領(lǐng)域始終處于前沿,代表作品包括CycleGAN(Zhu 等,2017)、GauGAN(Park 等,2019)、EditGAN(Ling等,2021 等)、GANverse3D(Zhang 等,2020)、Instant NeRF(Müller 等,2022)等。

(3)OpenAI:通過客戶端付費訂閱模式,對外提供GPT 和ChatGPT 等模型能力,實現(xiàn)商業(yè)化盈利。

(二)國內(nèi)AIGC發(fā)展現(xiàn)狀

相比于國際先進(jìn)科技公司,雖然中國AIGC 產(chǎn)業(yè)尚處于起步階段,底層技術(shù)和商業(yè)化落地較國外仍有一定距離,但眾多國內(nèi)知名企業(yè)如百度、阿里巴巴、京東在AIGC 領(lǐng)域也進(jìn)行了布局,并嘗試將相關(guān)技術(shù)應(yīng)用于自身業(yè)務(wù)。代表性公司包括:

1. 百度

2022 年8 月,基于自主研發(fā)的產(chǎn)業(yè)級大模型ERNIE(Sun 等,2019),百度推出AI 藝術(shù)創(chuàng)意輔助平臺——文心一格。通過文心大模型準(zhǔn)確的語義理解和圖片生成能力,文心一格可以為用戶提供豐富多樣的創(chuàng)意,幫助創(chuàng)作者打破創(chuàng)作瓶頸。同年9 月,百度發(fā)布多款A(yù)IGC 應(yīng)用內(nèi)容生產(chǎn)領(lǐng)域的技術(shù)和產(chǎn)品,包括“創(chuàng)作者AI 助理”和“百度APP 數(shù)字人”等。值得一提的是,由百度推出的AI 數(shù)字人度曉曉,作答2022 年高考語文作文得分達(dá)到48 分,得分超過了75%的考生,這表明AIGC 創(chuàng)造的內(nèi)容具有較高的可讀性和創(chuàng)造性。

2. 阿里巴巴

2019 年初,阿里巴巴達(dá)摩院啟動通用性人工智能大模型M6 項目(Lin 等,2021),并于2021年3 月首次發(fā)布,參數(shù)量達(dá)到千億級,成為世界上最大的中文多模態(tài)模型。同年11 月,M6 成為全球首個突破10 萬億參數(shù)的AI 模型。M6 主打多模態(tài)、多任務(wù)能力,擅長寫作、對話等任務(wù),已在超40 個場景中實現(xiàn)商業(yè)化落地。目前,M6 模型已經(jīng)成為阿里重要的科技基礎(chǔ)設(shè)施,在電商領(lǐng)域的服裝設(shè)計和工業(yè)級文案生成以及支付寶的搜索推薦等業(yè)務(wù)中實現(xiàn)了產(chǎn)業(yè)化應(yīng)用。此外,阿里巴巴計劃在釘釘APP 中引入類ChatGPT 的對話機(jī)器人。

3. 京東

京東在AIGC賽道上的布局更加聚焦文本、數(shù)字人生成和通用型Chat AI 等技術(shù)。在文本生成領(lǐng)域,京東發(fā)布了商品文案生成模型K-PLUG(Xu 等,2021),幫助商家自動生成商品標(biāo)題、商品賣點文案、商品直播文案,人工審核通過率超過95%。在數(shù)字人生成領(lǐng)域,京東利用AI 虛擬數(shù)字人代替人工客服,數(shù)字人主播在6.18 場景中試播,改變了傳統(tǒng)的營銷模式。在2023 年2 月,京東宣布將推出ChatGPT 產(chǎn)業(yè)版——ChatJD,旨在打造高頻、剛需的產(chǎn)業(yè)版通用ChatGPT 類產(chǎn)品。

4. 創(chuàng)業(yè)公司

如表3 所示,國內(nèi)也涌現(xiàn)了一批成長迅速的創(chuàng)業(yè)公司,代表企業(yè)如下:

(1)小冰科技:最早提出AI Being(人工智能數(shù)字員工)定義,并開發(fā)了小冰框架,用于快速生成符合條件的虛擬人。目前,由小冰框架提供的數(shù)字人已活躍于眾多場景中,這其中包括萬科集團(tuán)年度優(yōu)秀員工“崔筱盼”、紅杉中國首位虛擬分析師“Hóng”等。作為賦予AI Being 創(chuàng)造力的重要部分,小冰布局AIGC 多年,并已形成穩(wěn)定商業(yè)落地與文本、聲音、圖像的產(chǎn)品化陣列。在文本方面,小冰金融文本生成產(chǎn)品覆蓋約90%的機(jī)構(gòu)投資人。在繪畫方面,“夏語冰”創(chuàng)作的水墨畫是唯一入選去年迪拜世博會中國館的人工智能繪畫作品。據(jù)不完全統(tǒng)計,由小冰創(chuàng)建并承載的人工智能交互主體,擁有全球范圍人工智能交互總流量約60%,超過主要同行業(yè)者亞馬遜、谷歌及蘋果同類產(chǎn)品的流量總和。

(2)聆心智能:基于生成式模型的情感對話系統(tǒng),為用戶打造不同類型的AI 心理陪伴人,并提供更科學(xué)、高效的精神健康服務(wù)。此外,聆心智能正致力于打造超擬人大模型,增加場景化、擬人化的風(fēng)格設(shè)定,讓AI 成為通用人工智能時代的智能體,具備個性、情感和成長能力。

(3)影譜科技:憑借數(shù)字孿生等關(guān)鍵技術(shù)優(yōu)勢以及3D 數(shù)字化場景、沉浸式體驗的營造能力,發(fā)布了國內(nèi)首個依托AIGC 技術(shù)的元宇宙活動平臺——影宙,將元宇宙和AIGC 相結(jié)合,探索元宇宙與各垂直行業(yè)的融合應(yīng)用。

(三)中美兩國

大模型及AIGC 發(fā)展對比大模型作為一種變革性技術(shù),已經(jīng)成為AIGC 及整個人工智能技術(shù)的制高點和基礎(chǔ)設(shè)施,中國和美國作為這個領(lǐng)域的主要玩家,正在圍繞AIGC 展開角逐。在本小節(jié),本文旨在對中美兩國大模型數(shù)量及參數(shù)量、論文及研究機(jī)構(gòu)和AIGC 創(chuàng)業(yè)公司及產(chǎn)業(yè)環(huán)境等方面進(jìn)行對比,深度解析中國和美國AIGC 賽道。

1. 預(yù)訓(xùn)練模型參數(shù)量

如表4 所示,在預(yù)訓(xùn)練語言模型的參數(shù)量排名前10 的機(jī)構(gòu)中,美國有6 個,中國擁有4 個。在部分評測基準(zhǔn)中,中國的大模型成績甚至更加優(yōu)異,特別表現(xiàn)在中文語言理解、閱讀理解等榜單中。但這一類大模型底層創(chuàng)新均來自于美國的研究機(jī)構(gòu)。國內(nèi)推出的大模型如百度文心、阿里M6、華為盤古(Zeng 等,2021)、智源研究院悟道(Yuan 等,2022)和浪潮源1.0(Wu 等,2021)等,均基于BERT(Devlin 等,2018)大模型架構(gòu)優(yōu)化而來,缺乏根技術(shù)上的創(chuàng)新。此外,現(xiàn)階段上述模型在問題回答的完整性和邏輯性等方面,仍無法與ChatGPT 抗衡。

2. AIGC 模型相關(guān)論文、研發(fā)機(jī)構(gòu)

過去五年,美國總共發(fā)表了98 篇與預(yù)訓(xùn)練模型相關(guān)的論文,中國則發(fā)表了240 篇。不難發(fā)現(xiàn),中國論文發(fā)表數(shù)量遙遙領(lǐng)先,但在論文引用情況方面,引用量排名前十的論文大都來自美國的研究者,可見美國的高質(zhì)量論文仍然處于領(lǐng)先地位。此外,如圖1 所示,在全球AIGC 模型研發(fā)機(jī)構(gòu)排名中,前十名中美國占據(jù)六席,中國機(jī)構(gòu)則占據(jù)四席。因此,中國研發(fā)機(jī)構(gòu)雖然起步較晚,但不遜色于美國。

3. AIGC 獨角獸數(shù)量和產(chǎn)業(yè)環(huán)境對比

由于技術(shù)發(fā)展不足,以及產(chǎn)業(yè)環(huán)境的影響,在中國,AIGC 大多被作為公司的部分業(yè)務(wù)乃至相對邊緣化的功能進(jìn)行研發(fā),獨立運(yùn)行的創(chuàng)業(yè)公司數(shù)量明顯少于美國,大部分細(xì)分賽道的初創(chuàng)玩家也都少于5 家。截至2022 年底,美國的AIGC 獨角獸數(shù)量是292 家,估值4.6 萬億美元,中國則有69 家,估值1.4 萬億美元。與美國相比,中國人工智能獨角獸的數(shù)量和估值差距仍然很大。此外,中國AIGC 布局最多的賽道是AI 寫作和語音合成領(lǐng)域,虛擬人賽道剛剛開始興起,基本均停留在內(nèi)容領(lǐng)域。而在美國,延展領(lǐng)域得到了更為充分的挖掘,例如個性化文本生成、合成數(shù)據(jù)等賽道均是重點布局領(lǐng)域。

通過上述對比分析可以發(fā)現(xiàn),中國AIGC 發(fā)展水平仍與美國存在一定差距,究其原因,可以歸結(jié)為以下三個方面:

(1)從算力層面來看,我國的數(shù)據(jù)中心多面向軟件應(yīng)用環(huán)境,真正面向AI 的算力非常少,又或者需求不高,而算力本身非常昂貴,模型越大,數(shù)據(jù)越多,數(shù)據(jù)訓(xùn)練AI 所要消耗的費用就越大。以ChatGPT 為例,訓(xùn)練一次的成本約140 萬美元,這是國內(nèi)大多公司不能負(fù)擔(dān)的。此外,高端GPU和AI 芯片缺乏也成為國內(nèi)AIGC 領(lǐng)域卡脖子問題。

(2)從數(shù)據(jù)層面來看,國內(nèi)數(shù)據(jù)的質(zhì)量普遍不高,一是數(shù)據(jù)積累量不夠,再者數(shù)據(jù)管理較為嚴(yán)格,部分?jǐn)?shù)據(jù)文本需要審批才可以被人工智能企業(yè)使用,減慢了數(shù)據(jù)價值的釋放。而美國擁有龐大的、高質(zhì)量的數(shù)據(jù)資源,這使得美國企業(yè)可以在大數(shù)據(jù)的支持下,快速開發(fā)AIGC 技術(shù),并提供更加準(zhǔn)確、多樣化的服務(wù)。

(3)從人才層面來看,美國擁有全球先進(jìn)的高等教育體系和吸引科技人才的激勵措施,這使得美國企業(yè)可以從世界范圍內(nèi)吸引最優(yōu)秀的人才來開發(fā)AIGC 技術(shù)。盡管中國擁有大量的科技人才,但在AIGC 領(lǐng)域的高端人才匱乏;我國AI 開發(fā)者有思維慣性,過度依賴開源內(nèi)容,對大模型缺乏探索創(chuàng)新。

綜上所述,大模型和AIGC 是新一代人工智能技術(shù)最主要的競爭領(lǐng)域,中美都將其作為戰(zhàn)略高地,傾注了大量的資源。總體上呈現(xiàn)出美國領(lǐng)先、中國追趕的局面。中國大模型發(fā)展迅速,但生態(tài)構(gòu)建和商業(yè)應(yīng)用還有很大發(fā)展空間。在保持總量、規(guī)模和速度的同時,需要提升質(zhì)量,實現(xiàn)大模型的高質(zhì)量發(fā)展。

四、AIGC產(chǎn)業(yè)發(fā)展機(jī)遇

隨著預(yù)訓(xùn)練大模型走向成熟并成為AIGC 應(yīng)用的技術(shù)底座,AIGC 相關(guān)產(chǎn)業(yè)有望迎來爆發(fā)期。本節(jié)將從AIGC 相關(guān)產(chǎn)業(yè)鏈和重點行業(yè)應(yīng)用領(lǐng)域角度分析AIGC 可能帶來的發(fā)展機(jī)遇。具體來說,AIGC 以大模型、大數(shù)據(jù)和大算力為基礎(chǔ)(鄭世林等,2023),AIGC 熱度持續(xù)提升,將帶動算力、芯片等相關(guān)產(chǎn)業(yè)鏈加速發(fā)展。此外,各行業(yè)對于數(shù)字內(nèi)容的需求正在爆發(fā)性增長,數(shù)字世界中內(nèi)容的消費和供給之間存在巨大差距,迫切需要加以彌合。AIGC 以其真實性、多樣性、組合性的特征,有望幫助企業(yè)提高內(nèi)容生產(chǎn)效率,解放生產(chǎn)力,提高相關(guān)數(shù)字化產(chǎn)品的智能度,從而更好地服務(wù)于傳媒、影視和電商等內(nèi)容需求豐富的行業(yè)。

(一)AIGC 相關(guān)產(chǎn)業(yè)鏈和數(shù)字經(jīng)濟(jì)或?qū)⒂瓉戆l(fā)展良機(jī)

AIGC算法復(fù)雜,模型訓(xùn)練需要海量數(shù)據(jù),對算力要求呈指數(shù)級提升,同時也需要快速高效的方式來處理數(shù)據(jù)集。在內(nèi)容生產(chǎn)過程中,AIGC 相關(guān)模型需要對海量的標(biāo)注數(shù)據(jù)進(jìn)行不斷的學(xué)習(xí),從而更好地學(xué)習(xí)人類的說話方式和想法,最終實現(xiàn)高質(zhì)量創(chuàng)作。以ChatGPT 為例,目前提供能力基于GPT-3.5 和RLHF(人類反饋強(qiáng)化學(xué)習(xí))訓(xùn)練獲得,與GPT 家族的其他模型(GPT-1、GPT-2)相比,模型結(jié)構(gòu)并沒有太大改變,但模型訓(xùn)練的參數(shù)量從1.7 億增加到1 750 億,預(yù)訓(xùn)練數(shù)據(jù)量從5GB 增加到45TB。隨著模型的迭代升級,預(yù)計數(shù)據(jù)量和算力需求都會繼續(xù)成幾何倍數(shù)增長。因此,AIGC 和相關(guān)產(chǎn)業(yè)互相促進(jìn),互相支撐。首先,隨著AIGC 在更多領(lǐng)域得到應(yīng)用,海量數(shù)據(jù)和流量將源源不斷地產(chǎn)生,以算力為代表的云計算等基礎(chǔ)設(shè)施或?qū)⒊掷m(xù)釋放。通信硬件設(shè)施將是AIGC 發(fā)展最先受益的環(huán)節(jié),包括運(yùn)營商為主的技術(shù)設(shè)施底座、承載算力的 IDC、服務(wù)器“東數(shù)西算”帶來的骨干網(wǎng)建設(shè)需求等各個產(chǎn)業(yè)鏈環(huán)節(jié);其次,從云計算、大數(shù)據(jù)、人工智能、邊緣計算等技術(shù)角度來講,未來應(yīng)用的高算力運(yùn)算需求,對基礎(chǔ)設(shè)施提出更高要求的基礎(chǔ)上也進(jìn)一步帶動對相關(guān)技術(shù)及算法的需求;最后,從應(yīng)用端角度來講,以工業(yè)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、云游戲以及AR/VR 等應(yīng)用漸行漸近,應(yīng)用場景的不斷落地,進(jìn)一步倒逼基礎(chǔ)設(shè)施建設(shè)的不斷加快升級。同時,隨著應(yīng)用場景的不斷豐富,也將進(jìn)一步拉動相關(guān)產(chǎn)業(yè)鏈環(huán)節(jié)需求進(jìn)一步提升。另一方面,隨著云計算等基礎(chǔ)設(shè)施的完善、數(shù)字經(jīng)濟(jì)應(yīng)用的落地和發(fā)展,數(shù)據(jù)等計算資源得以不斷增加,這為AIGC 的迭代優(yōu)化提供了寶貴的訓(xùn)練數(shù)據(jù),其算法得以更加精進(jìn),從而生成更符合人類語言和行為的內(nèi)容。

(二)AIGC 有望塑造數(shù)字內(nèi)容生產(chǎn)與交互新范式

數(shù)字內(nèi)容邁入強(qiáng)需求、視頻化、拼創(chuàng)意的螺旋式升級周期,AIGC 的發(fā)展恰好迎合了這一需要。AIGC 正在越來越頻繁地被應(yīng)用到數(shù)字內(nèi)容的創(chuàng)作工作中,成為未來互聯(lián)網(wǎng)的內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施。

近年來,AI 技術(shù)正被廣泛應(yīng)用于傳媒業(yè)的內(nèi)容生產(chǎn)、分發(fā)和管理等環(huán)節(jié)。AIGC 作為當(dāng)前新型的內(nèi)容生產(chǎn)方式,有助于進(jìn)一步降低相關(guān)企業(yè)的邊際成本,并賦能自動采編、作品自動生成、游戲建模及虛擬人輔助創(chuàng)造等環(huán)節(jié)。具體來說,在采編環(huán)節(jié),基于AI 算法可以快速自動化地批量生成文章,幫助新聞編輯人員更快、更準(zhǔn)、更智能化地生產(chǎn)內(nèi)容。比如中國地震臺網(wǎng)的寫稿機(jī)器人僅用25 秒便完成了《四川阿壩州九寨溝縣發(fā)生7.0 級地震》這一消息的準(zhǔn)確編發(fā),這則消息不僅包括速報參數(shù)、震中地形等8 項內(nèi)容,還配了4 張現(xiàn)場圖片。此外,AIGC 可以幫助從業(yè)者借助字幕生成和視頻錦集等工具,實現(xiàn)視頻智能剪輯,提升視頻內(nèi)容價值。如2022 年北京冬奧會期間,央視借助AI 智能內(nèi)容生產(chǎn)剪輯系統(tǒng),自動制作比賽項目的視頻集錦,高效節(jié)省了人力和時間成本,提高多類型內(nèi)容編發(fā)能力。

隨著影視行業(yè)的快速發(fā)展,高質(zhì)量劇本相對缺乏、制作成本高昂以及部分作品質(zhì)量等過程性問題逐漸顯現(xiàn),亟待進(jìn)行產(chǎn)業(yè)結(jié)構(gòu)升級,向信息化、數(shù)字化的方向發(fā)展。借助AIGC 技術(shù),可以激發(fā)影視劇本創(chuàng)作的思路,擴(kuò)展影視角色和場景的創(chuàng)作空間,從而在后期制作過程中大幅提升影視產(chǎn)品的質(zhì)量。這不僅有助于實現(xiàn)影視作品的文化價值與經(jīng)濟(jì)價值的最大化,同時也能夠有效應(yīng)對影視行業(yè)在創(chuàng)作和制作過程中所面臨的諸多挑戰(zhàn)。比如通過AI 合成人臉、聲音等相關(guān)內(nèi)容,實現(xiàn)“數(shù)字復(fù)活”已故演員、高難度動作合成等,擴(kuò)展角色和場景創(chuàng)作空間。此外,借助AIGC 合成虛擬物理場景,能夠創(chuàng)造無法實拍或成本過高的場景,極大拓展影視作品想象力的邊界,給觀眾帶來更優(yōu)質(zhì)的視聽體驗。長期來看,隨著模型參數(shù)和數(shù)據(jù)訓(xùn)練量的提升,AIGC 有望大幅提升影視內(nèi)容供給量及創(chuàng)作效率。

(三)AIGC 促進(jìn)電商發(fā)展模式的轉(zhuǎn)變

隨著數(shù)字技術(shù)的不斷創(chuàng)新和應(yīng)用,消費者的需求不斷升級和加速,沉浸式購物體驗已成為電商領(lǐng)域不可或缺的發(fā)展趨勢。AIGC 正加快商品3D 模型、虛擬主播乃至虛擬貨場的構(gòu)建,通過結(jié)合元宇宙技術(shù),實現(xiàn)視聽等多感官交互的沉浸式購物體驗。具體而言,在商品展示和試用環(huán)節(jié),借助AIGC 可以自動生成商品的3D 幾何模型和紋理,幫助消費者實現(xiàn)虛擬試用,提高商品銷售轉(zhuǎn)化率。積木易搭推出的3D 數(shù)字化解決方案,支持在分鐘級的時間內(nèi)完成商品的3D 拍攝和生成,精度可達(dá)到毫米級。相較于傳統(tǒng)電商商品展示采用圖文、短視頻的展現(xiàn)形式,3D 動態(tài)互動形式的商品對于消費者更有吸引力。同時生成出的3D 商品模型還可用于在線試穿,高度還原商品或服務(wù)試用的體驗感,從而更好地體驗其質(zhì)量和性能,有助于提高消費者的購買意愿。數(shù)據(jù)顯示,3D 購物的轉(zhuǎn)化率平均值為70%,較行業(yè)平均水平提升了9 倍,同比正常引導(dǎo)成交客單價提升超200%,同時商品退換貨率顯著降低。此外,AIGC 可以幫助打造虛擬主播,賦能直播帶貨。基于計算機(jī)視覺、CG渲染和動作捕捉等技術(shù),打造虛擬主播為觀眾提供24 小時不間斷的貨品推薦介紹以及在線服務(wù)能力,降低商家直播門檻。相比真人直播間帶貨,虛擬主播具備三大優(yōu)勢:一是虛擬主播能夠填補(bǔ)真人主播的空白時間,使直播間能不停輪播,既為用戶提供更靈活的觀看時間和更方便的購物體驗,也為合作商家創(chuàng)造更大的生意增量。二是虛擬品牌能加快店鋪或品牌年輕化進(jìn)程,拉近與新消費人群的距離。通過在元宇宙中建立虛擬形象,品牌主播可以更好地塑造品牌形象,吸引更多的消費者(鄭世林等,2022)。未來,虛擬品牌主播還可以延伸到元宇宙中的更多場景中,實現(xiàn)圈層傳播。AIGC 同樣能夠賦能線上商城和線下秀場加速演變,為消費者提供全新的購物場景。通過從二維圖像中重建場景的三維幾何結(jié)構(gòu),實現(xiàn)虛擬貨場快速、低成本、大批量的構(gòu)建,將有效降低商家搭建3D 購物空間的門檻及成本,為一些原本高度倚重線下門店的行業(yè)打開了線上線下融合的想象空間,同時為消費者提供線上線下融合的新消費體驗。

(四)AIGC 推進(jìn)數(shù)實融合,加快產(chǎn)業(yè)升級

AIGC 在工業(yè)、金融、教育、醫(yī)療等行業(yè)同樣也將快速滲透,助力產(chǎn)業(yè)升級。在工業(yè)領(lǐng)域,AIGC有助于提升產(chǎn)業(yè)效率和水平。主要體現(xiàn)在:一是融入計算機(jī)輔助設(shè)計,AIGC 將工業(yè)流程中低級重復(fù)、多耗時以及低層次的任務(wù)自動化,將數(shù)千小時的時間耗費縮短至幾分鐘,可最大程度縮短工程設(shè)計周期,提高效率;二是AIGC 支持生成衍生設(shè)計,為工程師提供更多靈感刺激;三是AIGC 能夠在設(shè)計中引入變化,實現(xiàn)動態(tài)模擬,提高產(chǎn)業(yè)適應(yīng)性和生動性;四是AIGC 推動加速構(gòu)建數(shù)字孿生系統(tǒng)。AIGC 將物理環(huán)境中的數(shù)字幾何圖形,參數(shù)化為3D 建模數(shù)據(jù),創(chuàng)建物理世界中的數(shù)字孿生系統(tǒng)。在金融領(lǐng)域,AIGC 助力實現(xiàn)降本增效。一方面AIGC 可實現(xiàn)金融資訊、產(chǎn)品介紹視頻的自動化生產(chǎn),提升金融機(jī)構(gòu)運(yùn)營的效率;另一方面,AIGC 可以塑造視、聽雙通道的虛擬數(shù)字人客服,讓金融服務(wù)內(nèi)容更加生動,方式更加多元。在教育領(lǐng)域,AIGC 賦予教育新活力。一方面,AIGC為教育工作者提供了新的工具,使平面抽象的課本立體化、具象化,以更加生動的方式向受教者傳遞知識;另一方面,相比于閱讀和講座等傳統(tǒng)方式,AIGC 可以合成虛擬人物,增強(qiáng)互動性與趣味性,給一場枯燥乏味的演講注入新的活力。在醫(yī)療領(lǐng)域,AIGC 賦能診療全過程。主要體現(xiàn)在:一是在輔助診斷方面,AIGC 可改善醫(yī)學(xué)圖像質(zhì)量、輔助錄入電子病歷等,最大限度解放醫(yī)生的智力與精力,使專業(yè)醫(yī)生專注到核心業(yè)務(wù)中,既能提高效率,又能實現(xiàn)專業(yè)醫(yī)生業(yè)務(wù)能力的提升;二是在康復(fù)治療方面,AIGC 可以為失聲者合成語言音頻,為殘疾者合成肢體投影,為心理疾病患者合成無攻擊感的醫(yī)護(hù)陪伴等,提供人性化康復(fù)治療,舒緩其情緒,加速患者康復(fù)??傊?,AIGC 正在發(fā)展成與其他各類產(chǎn)業(yè)深度融合的橫向結(jié)合體,其相關(guān)應(yīng)用正加速滲透到經(jīng)濟(jì)社會的方方面面。

五、AIGC 發(fā)展面臨的問題與挑戰(zhàn)

隨著人工智能技術(shù)發(fā)展步入快車道,AIGC 因為其迅速的反應(yīng)能力、生動的信息輸出、廣泛的應(yīng)用場景,加速滲透到社會生產(chǎn)和生活的方方面面。在滲透過程中,AIGC 的關(guān)鍵技術(shù)攻關(guān)水平有待提升,相關(guān)法律法規(guī)有待完善,圍繞公平正義、社會責(zé)任、國家安全的爭議日益增多,引發(fā)一系列亟待解決的經(jīng)濟(jì)與社會問題。

(一)AIGC 核心技術(shù)有待攻關(guān)

目前,國內(nèi)外AIGC 迭代升級,能夠進(jìn)一步釋放生產(chǎn)力,但核心技術(shù)方面尚有局限,阻礙產(chǎn)業(yè)發(fā)展進(jìn)程。一是AIGC 技術(shù)所依賴的人工智能算法存在固有缺陷。例如其透明度方面仍然存在尚未攻克的技術(shù)難題,由于算法模型的黑箱運(yùn)作機(jī)制,其運(yùn)行機(jī)制和因果邏輯無法清晰呈現(xiàn)出來,這一模型特點導(dǎo)致人們無法理解和解釋其傳導(dǎo)機(jī)制,若算法出現(xiàn)錯誤,將不利于糾偏除誤(李安,2021)。因此,算法的應(yīng)用存在問題。又如,算法運(yùn)行容易受到模型、數(shù)據(jù)、學(xué)習(xí)方法的影響,呈現(xiàn)出非穩(wěn)健的性質(zhì)。當(dāng)數(shù)據(jù)量不足時,其算法模型被隨機(jī)噪聲影響的可能性較大,容易得出錯誤結(jié)論;在算法投入應(yīng)用之后,在線數(shù)據(jù)內(nèi)容不斷更新,算法極有可能引致系統(tǒng)性能方面的偏差,進(jìn)而引發(fā)系統(tǒng)失靈;算法以數(shù)據(jù)為基礎(chǔ),若使用的初始數(shù)據(jù)有偏,這些有偏數(shù)據(jù)不會隨時間流逝而消失,反而會永久影響模型的運(yùn)行結(jié)果,最終導(dǎo)致人工智能算法生成內(nèi)容錯誤,引發(fā)用戶對于算法的公平性爭議(劉璇和朝樂門,2022)。二是AIGC 內(nèi)容創(chuàng)作技術(shù)仍不完善。例如,在文本生成方面,部分企業(yè)在自然語言理解技術(shù)方面沒有取得實質(zhì)性突破,往往只是簡單地機(jī)械化套用模板,導(dǎo)致生成的文本缺乏邏輯性,文本結(jié)構(gòu)雷同、千篇一律,可讀性不高。在語音合成方面,當(dāng)前基于AIGC 技術(shù)的語音表達(dá)不夠流暢、斷句存在錯誤、聲音具有較強(qiáng)的機(jī)械感。若進(jìn)一步提高生成語音的情感嵌入,不僅需要更高水平的模型,還需要大規(guī)模的數(shù)據(jù)量支持訓(xùn)練,對模型和數(shù)據(jù)的高要求使得難以控制成本,導(dǎo)致AIGC 技術(shù)使用復(fù)雜度提升,最終制約技術(shù)落地與推廣。

(二)行業(yè)發(fā)展規(guī)范有待完善

近年來,隨著人工智能技術(shù)的快速發(fā)展,人工智能產(chǎn)業(yè)規(guī)范也逐漸完善,治理體系初步形成,但由于科技進(jìn)步的加速,制度建設(shè)也未必能夠及時跟進(jìn),這導(dǎo)致了技術(shù)創(chuàng)新發(fā)展與政策支持、法律規(guī)制之間的不匹配問題(劉維,2021)。具體來說,AIGC 大量進(jìn)入市場對著作權(quán)法理論構(gòu)成巨大挑戰(zhàn)。當(dāng)前,中國《著作權(quán)法》中規(guī)定,著作權(quán)的指向?qū)ο鬄椤白髌贰?。僅從法律文本來看,我國現(xiàn)行知識產(chǎn)權(quán)法律體系均規(guī)定法律主體為享有權(quán)利、負(fù)有義務(wù)和承擔(dān)責(zé)任的人。因此,非人生產(chǎn)的智能化內(nèi)容難以通過“作品—創(chuàng)作—作者”的邏輯獲得著作權(quán)的保護(hù),這一觀點獲得了2019 年北京互聯(lián)網(wǎng)法院的判決支持。而在2020 年騰訊公司訴網(wǎng)貸之家網(wǎng)站轉(zhuǎn)載機(jī)器人自動撰寫的文章作品一案中,深圳南山區(qū)法院認(rèn)為在滿足獨創(chuàng)性要求的情況下,人工智能撰寫的文章屬于著作權(quán)保護(hù)的作品。法律概念的模糊引發(fā)司法裁判的翻轉(zhuǎn),導(dǎo)致AIGC 作品存在著作權(quán)歸屬不清的現(xiàn)實困境。這一問題不僅可能導(dǎo)致使用AIGC 技術(shù)創(chuàng)作的作品無法獲得著作權(quán)保護(hù),阻礙人工智能技術(shù)發(fā)揮其創(chuàng)作價值,還有可能因人工智能的海量摹寫行為稀釋既有作品權(quán)利人的獨創(chuàng)性,威脅他人的合法權(quán)益。

(三)良好行業(yè)生態(tài)構(gòu)建面臨挑戰(zhàn)

良好行業(yè)生態(tài)的構(gòu)建有賴于每個企業(yè)主體的努力。目前,健康行業(yè)生態(tài)面臨一系列挑戰(zhàn):一方面,當(dāng)前我國AIGC 技術(shù)仍處于發(fā)展初期,具有未知性和不穩(wěn)定性,大多企業(yè)尚沒有做好應(yīng)對與防范風(fēng)險的準(zhǔn)備,應(yīng)急處置能力有待提高,風(fēng)險治理理念尚未真正落實到技術(shù)研發(fā)與應(yīng)用中。這可能導(dǎo)致企業(yè)錯失把風(fēng)險攔截在萌芽狀態(tài)的機(jī)會,為行業(yè)生態(tài)埋下隱患,一旦遭受內(nèi)部威脅或外部攻擊,極易引發(fā)網(wǎng)絡(luò)信息內(nèi)容生態(tài)安全風(fēng)險。另一方面,近年來,各科技企業(yè)通過建立內(nèi)容審核機(jī)制,落實互聯(lián)網(wǎng)內(nèi)容治理主體責(zé)任,形成了“機(jī)審+人審”的基本審核方式。但在機(jī)審方面,受到審核類型、內(nèi)容違規(guī)變化繁雜、網(wǎng)絡(luò)黑灰產(chǎn)對抗手段加劇等因素影響,出現(xiàn)審核錯誤率偏高的情況;在人審方面,因不同人審團(tuán)隊在人員管理、業(yè)務(wù)流程、審核能力等方面表現(xiàn)各異,沒有形成統(tǒng)一的行業(yè)標(biāo)準(zhǔn),缺乏專業(yè)審核人員,導(dǎo)致包含虛假、錯誤、違法違規(guī)信息內(nèi)容流出,嚴(yán)重影響行業(yè)甚至整個網(wǎng)絡(luò)生態(tài)環(huán)境。

(四)企業(yè)技術(shù)管理能力建設(shè)不足

隨著數(shù)字技術(shù)的開源開放,AIGC 技術(shù)研發(fā)門檻、制作成本等不斷降低,致使市場上的企業(yè)魚龍混雜,多數(shù)企業(yè)核心能力不足,主要體現(xiàn)在企業(yè)技術(shù)管理能力不足。由于AIGC 技術(shù)具有動態(tài)性,且愈發(fā)復(fù)雜,這要求企業(yè)作為技術(shù)研發(fā)主體具備相應(yīng)的技術(shù)研發(fā)與管理能力。但是企業(yè)的商業(yè)屬性決定了其逐利性,當(dāng)資源有限時,企業(yè)會首先滿足自身盈利,而降低對技術(shù)研發(fā)和制度保障機(jī)制的投入。不同企業(yè)的核心能力差距巨大,表現(xiàn)為:投資積累“家底”厚實、發(fā)展時間長的企業(yè)可能有更高的技術(shù)研發(fā)和管理水平,反之水平較低。在廣闊的應(yīng)用場景吸引下,眾多初入市場的小型企業(yè)在技術(shù)管理能力不達(dá)標(biāo)的情況下,將AIGC 投入應(yīng)用,滋生了抄襲侵權(quán)、內(nèi)容造假、惡意營銷等灰黑產(chǎn)業(yè)鏈的溫床,阻礙了行業(yè)的健康和可持續(xù)發(fā)展。

六、發(fā)展建議與展望

AIGC 相關(guān)技術(shù)發(fā)展將為云計算、傳媒、影視、電商和醫(yī)療等行業(yè)帶來前所未有的發(fā)展機(jī)遇。與此同時,AIGC 發(fā)展也面臨商業(yè)化落地、版權(quán)確權(quán)、隱私保護(hù)等一系列挑戰(zhàn)。為此,本文從產(chǎn)學(xué)研用、法律法規(guī)、行業(yè)生態(tài)和政策引導(dǎo)等維度,對AIGC 的發(fā)展提出建議,并對未來發(fā)展方向進(jìn)行展望。

(一)發(fā)展建議

1. 鼓勵產(chǎn)學(xué)研用協(xié)同,推動科技攻關(guān)

鼓勵產(chǎn)學(xué)研用各主體基于開源共享平臺促成協(xié)同合作、加快技術(shù)創(chuàng)新與應(yīng)用創(chuàng)新。圍繞AIGC產(chǎn)業(yè)發(fā)展與治理需求,一是推動行業(yè)層面在算力能力、算法技術(shù)、技術(shù)落地等方面的聯(lián)合攻關(guān),聚焦算法透明度、穩(wěn)健性、偏見與歧視等技術(shù)攻關(guān),突破行業(yè)發(fā)展瓶頸;二是鼓勵超大規(guī)模神經(jīng)網(wǎng)絡(luò)模型的聯(lián)合研發(fā)與代碼開源,支持產(chǎn)學(xué)研各界通過合作構(gòu)建訓(xùn)練與標(biāo)準(zhǔn)測試數(shù)據(jù)集、搭建面向重點行業(yè)應(yīng)用的開發(fā)者協(xié)同平臺等方式,加快共性技術(shù)和基礎(chǔ)產(chǎn)品研發(fā)、降低AIGC 應(yīng)用門檻,促進(jìn)產(chǎn)業(yè)化繁榮發(fā)展;三是探索構(gòu)建行業(yè)級AIGC 參考實施框架,以生態(tài)協(xié)議、行業(yè)標(biāo)準(zhǔn)的互聯(lián)互通支撐內(nèi)容生態(tài)的共建共享;四是嘗試通過推廣制度模板、制定多邊議程、發(fā)揮市場工具等手段,積極參與AIGC 應(yīng)用與治理等領(lǐng)域的國際規(guī)則制定和全球發(fā)展合作,通過制度性輸出和影響力的擴(kuò)大,支持相關(guān)產(chǎn)業(yè)和重點企業(yè)增強(qiáng)海外競爭力、爭取更大國際市場與產(chǎn)業(yè)話語權(quán)。

2. 完善法律法規(guī),推進(jìn)監(jiān)管治理

統(tǒng)籌推進(jìn)“技術(shù)”監(jiān)管與“內(nèi)容”治理,逐步完善保障AIGC 良性發(fā)展的治理體系。近年來,我國相繼頒布《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》①《網(wǎng)絡(luò)數(shù)據(jù)安全管理條例(征求意見稿)》②《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》③和《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定(征求意見稿)》④等法規(guī)??傮w而言,劃清了AIGC 相關(guān)技術(shù)發(fā)展的紅線,但就細(xì)節(jié)而言,責(zé)任認(rèn)定與歸結(jié)、知識產(chǎn)權(quán)保護(hù)等問題尚處于起步階段。因此,仍然需要政府和相關(guān)研究機(jī)構(gòu)盡早前瞻布局,完善監(jiān)管與治理體系。針對AIGC 作品權(quán)屬認(rèn)定等方面的法律法規(guī)缺位問題,可以從法律法規(guī)層面進(jìn)一步明確AIGC 的應(yīng)用范圍,明晰AIGC 技術(shù)研發(fā)與孵化、內(nèi)容傳播等相關(guān)方面的主體責(zé)任;針對基于深度偽造技術(shù)的虛假內(nèi)容制作和散布問題,需要監(jiān)管部門對披露和標(biāo)注生成內(nèi)容、傳播媒介提高鑒別能力,并制定規(guī)范細(xì)化主體責(zé)任;針對模仿、抄襲或合理使用的認(rèn)定標(biāo)準(zhǔn)模糊的問題,探索侵權(quán)主體及侵權(quán)責(zé)任的認(rèn)定路徑,對AIGC 作品及其智力與經(jīng)濟(jì)投入、技術(shù)工具及作品所依賴的數(shù)據(jù)基礎(chǔ)等提供平衡的保護(hù),確保相關(guān)數(shù)字內(nèi)容的合規(guī)有序流通;針對AIGC 技術(shù)及應(yīng)用快速迭代的特點,探索形成法律法規(guī)動態(tài)評估、修改和廢止機(jī)制,確保法律法規(guī)和監(jiān)管治理的科學(xué)化、精細(xì)化、敏捷化。同時,謹(jǐn)遵包容審慎理念,鼓勵立法研究的多方參與、監(jiān)管手段的分級分類、行業(yè)治理的公私合作。

3. 鼓勵行業(yè)自治,共建發(fā)展生態(tài)

倡導(dǎo)在行業(yè)層面強(qiáng)化“倫理先行、自律自治”意識,共同打造AIGC 良性發(fā)展生態(tài)。鼓勵相關(guān)行業(yè)聯(lián)盟、龍頭企業(yè)、研究機(jī)構(gòu)以及標(biāo)準(zhǔn)組織等發(fā)揮資源整合優(yōu)勢,加強(qiáng)內(nèi)容識別、事實核查、問題感知、違法打擊、輿情治理、版權(quán)保護(hù)等治理技術(shù)能力研究,圍繞AIGC 的合法合規(guī)應(yīng)用和健康有序發(fā)展聯(lián)合制定公約、標(biāo)準(zhǔn)、指南、準(zhǔn)則等行業(yè)制度規(guī)范,建立完善爭議解決、行業(yè)黑名單、危機(jī)應(yīng)對聯(lián)動等行業(yè)自治機(jī)制,并積極開展制度宣傳、標(biāo)準(zhǔn)推廣、測試評估、標(biāo)桿塑造等活動;特別是針對“算法偏見”“算法黑箱”帶來的數(shù)字內(nèi)容不公正、責(zé)任主體難界定等問題,牽頭支持可解釋、可信賴的AIGC 技術(shù)框架、標(biāo)準(zhǔn)體系、評測機(jī)制等的研究和推廣。

4. 加強(qiáng)正向引導(dǎo),賦能數(shù)實融合

市場經(jīng)濟(jì)的逐利性推動了AIGC 的迅猛發(fā)展,然而,行業(yè)的健康、可持續(xù)發(fā)展卻需要主管部門的正確引導(dǎo),通過政策引導(dǎo)充分釋放AIGC 的正面應(yīng)用價值,賦能數(shù)字經(jīng)濟(jì)與實體經(jīng)濟(jì)深度融合。具體來說,一方面,地方政府和主管部門可以依托本地資源稟賦,結(jié)合發(fā)展需求,通過規(guī)劃指引、財政補(bǔ)貼、試點示范、揭榜掛帥等方式,引導(dǎo)數(shù)字內(nèi)容產(chǎn)業(yè)發(fā)展,支持AIGC 技術(shù)賦能影視傳媒、社交娛樂以及電商零售等領(lǐng)域,推動數(shù)字內(nèi)容產(chǎn)業(yè)跨界衍生,刺激信息消費;培育與AIGC 產(chǎn)業(yè)發(fā)展相匹配的內(nèi)容審核技術(shù)產(chǎn)品和服務(wù)體系。另一方面,加強(qiáng)引導(dǎo)數(shù)據(jù)整理、算力統(tǒng)籌、算法開源等平臺和企業(yè)基礎(chǔ)能力的合規(guī)建設(shè),堅持“以虛促實、以虛強(qiáng)實”基本導(dǎo)向,推動AIGC 技術(shù)參與生產(chǎn)和生活方式重構(gòu)。例如,基于AIGC 技術(shù)提供逼真在線服務(wù)體驗,在商貿(mào)服務(wù)、社會服務(wù)、醫(yī)療教育服務(wù)等領(lǐng)域催生新業(yè)態(tài)。又如,探索以AIGC 技術(shù)為基礎(chǔ),對現(xiàn)實世界進(jìn)行人機(jī)交互更為自然、環(huán)境細(xì)節(jié)更為逼真的虛擬空間模擬仿真,推動AIGC 賦能工業(yè)制造、城市規(guī)劃、科學(xué)研究、生產(chǎn)辦公等領(lǐng)域的效力提升和價值再造,從虛擬維度優(yōu)化物理世界發(fā)展。

(二)未來展望

1. 核心技術(shù)持續(xù)演進(jìn)

(1)從真實可控向多樣組合發(fā)展

當(dāng)前,AIGC 算法已經(jīng)可以產(chǎn)生高質(zhì)量的內(nèi)容,其模型在簡單場景表現(xiàn)出能與人類媲美的能力,然而,針對復(fù)雜場景生成的內(nèi)容依然不夠深入、缺少細(xì)節(jié)。例如,目前AIGC 生成的人臉圖像或數(shù)字人頭像已經(jīng)可以做到真假難辨。相比之下,由于視頻數(shù)據(jù)的復(fù)雜性和特征的多樣性,AIGC 尚無法較好地完成視頻創(chuàng)作任務(wù)。同時,單一模態(tài)的內(nèi)容生成無法滿足數(shù)字世界或元宇宙的需求??梢灶A(yù)見,AIGC 技術(shù)未來的發(fā)展方向?qū)⑹峭ㄟ^不同個體間的交互進(jìn)行內(nèi)容生產(chǎn)。通過對整體的、多模態(tài)的復(fù)雜場景創(chuàng)作,AIGC 有望實現(xiàn)更多數(shù)智內(nèi)容,進(jìn)而反哺核心及關(guān)聯(lián)領(lǐng)域,促進(jìn)共同發(fā)展。

(2)從本地化集中式向大規(guī)模分布式發(fā)展

作為數(shù)字經(jīng)濟(jì)和實體經(jīng)濟(jì)深度融合的新模式,AIGC 通過人工智能技術(shù)產(chǎn)生可交互的創(chuàng)新型、高質(zhì)量數(shù)字內(nèi)容,當(dāng)前與未來一段時間,新一代人工智能技術(shù)的研究重點將轉(zhuǎn)向大規(guī)模分布式AIGC 交互算法。主要有以下兩方面的原因:一方面,AIGC 離不開大規(guī)模分布式深度學(xué)習(xí)技術(shù)和多智能體強(qiáng)化學(xué)習(xí)技術(shù)。大規(guī)模分布式AIGC 能夠高效地管理和利用計算資源,將流程拆解,通過多設(shè)備分布式計算的方式,加快內(nèi)容生產(chǎn)流程,提高內(nèi)容生成效率和質(zhì)量。目前谷歌和微軟等人工智能頭部公司,已經(jīng)開始布局下一代超大規(guī)模人工智能模型的分布式計算平臺,以解決大模型訓(xùn)練面臨的算力緊缺、資源利用率低、模型制作效率低等難題。另一方面,大規(guī)模多智能體網(wǎng)絡(luò)在分布式計算的框架通過個體間的合作和競爭可以完成單體無法完成的任務(wù)。AIGC 作為促進(jìn)數(shù)實深度融合乃至元宇宙的重要生產(chǎn)工具,需要模擬物理世界各類復(fù)雜網(wǎng)絡(luò)系統(tǒng),包括動物群體、社交網(wǎng)絡(luò)、城市復(fù)雜體等。因此,深入探究大規(guī)模分布式多智能體算法,增強(qiáng)其拓展性、安全性、穩(wěn)定性、遷移性等,將是未來重點探索的方向之一。

2. 產(chǎn)品類型逐漸豐富

近年來,隨著第四次科技革命的興起,AIGC 應(yīng)用成為數(shù)字經(jīng)濟(jì)的一個重要細(xì)分賽道。其中,數(shù)字人作為鏈接物理世界與虛擬世界的主要媒介,通過其特有的接近人類的思維以及其可交互的能力,能夠打破物理及時空的邊界。例如,用戶通過XR 技術(shù)和新一代智能終端設(shè)備,可以獲得豐富的沉浸式體驗。而可以自主生成內(nèi)容的數(shù)字人或許可以成為構(gòu)建人機(jī)交融、數(shù)實深度融合的未來世界的最佳載體,同時也是未來人類構(gòu)建“自生成、自更新”的元宇宙新世界的必經(jīng)之路。隨著新一代人工智能技術(shù)的不斷發(fā)展、數(shù)字人開發(fā)難度和成本的降低,具有自主內(nèi)容生成能力的“智慧化”數(shù)字人可以進(jìn)行無限的內(nèi)容創(chuàng)作,元宇宙將為人類提供自由創(chuàng)造的空間。同時,基于AIGC 的元宇宙世界也無需依賴于自然宇宙的映射,而將脫離于現(xiàn)實世界自我生成、自我發(fā)展、自我更新。隨著通用生成式AI 技術(shù)的不斷演進(jìn),AIGC 模型不再僅僅生成文本、音頻、視頻等基本形態(tài)的作品,甚至可以創(chuàng)造具有情感感知和認(rèn)知能力的內(nèi)容。

3. 生態(tài)產(chǎn)業(yè)日益完善

隨著AIGC 的不斷迭代,以標(biāo)準(zhǔn)規(guī)范、技術(shù)研發(fā)、內(nèi)容創(chuàng)作、行業(yè)應(yīng)用、資產(chǎn)服務(wù)為核心的生態(tài)體系將日趨完善,賦能相關(guān)產(chǎn)業(yè)升級。標(biāo)準(zhǔn)規(guī)范為AIGC 生態(tài)構(gòu)建了從技術(shù)、內(nèi)容、應(yīng)用、服務(wù)到監(jiān)管的全過程一體化標(biāo)準(zhǔn)體系,促進(jìn)AIGC 在合理合規(guī)合法的框架下良性發(fā)展。同時,在核心技術(shù)持續(xù)演進(jìn)和關(guān)鍵能力顯著增強(qiáng)的背景下,性能更強(qiáng)大、邏輯更智能的AI 算法將被應(yīng)用于AIGC,技術(shù)研發(fā)的不斷創(chuàng)新將強(qiáng)有力地推動內(nèi)容創(chuàng)作,提高生成內(nèi)容質(zhì)量,使內(nèi)容更接近人類智力水平和審美標(biāo)準(zhǔn),同時應(yīng)用于各類行業(yè)各種場景。AIGC 的繁榮發(fā)展將促進(jìn)資產(chǎn)服務(wù)快速跟進(jìn),通過對生成內(nèi)容的合規(guī)評估、資產(chǎn)管理、產(chǎn)權(quán)保護(hù)、交易服務(wù)等構(gòu)成AIGC 的完整生態(tài)鏈,并進(jìn)行價值重塑,充分釋放其商業(yè)潛力。隨著5G、云計算、VR、AR 等前沿技術(shù)的快速發(fā)展和新一代智能終端設(shè)備的研發(fā)創(chuàng)新,完整的AIGC 生態(tài)鏈?zhǔn)俏磥磲尫艛?shù)據(jù)要素紅利、推動傳統(tǒng)產(chǎn)業(yè)升級、促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展、構(gòu)建數(shù)實融合一體最重要的推動力之一。

ChatGPT 自發(fā)布以來,在許多實際應(yīng)用場景中發(fā)揮重要作用,將AIGC浪潮推到新的高度。本文對AIGC 進(jìn)行了廣泛的概述,首先介紹了其發(fā)展演進(jìn),并梳理了每個階段的關(guān)鍵痛點堵點;隨后,本文分析了AIGC的產(chǎn)業(yè)機(jī)遇;最后,本文討論了AIGC及其應(yīng)用的未來挑戰(zhàn),并對其未來發(fā)展方向進(jìn)行展望。

猜你喜歡
產(chǎn)業(yè)發(fā)展數(shù)字經(jīng)濟(jì)
OECD國家數(shù)字經(jīng)濟(jì)戰(zhàn)略的經(jīng)驗和啟示
從數(shù)字經(jīng)濟(jì)視角解讀歐亞經(jīng)濟(jì)聯(lián)盟與絲綢之路經(jīng)濟(jì)帶對接
“互聯(lián)網(wǎng)+”成為產(chǎn)業(yè)發(fā)展新常態(tài)的思考
景德鎮(zhèn)陶瓷文化創(chuàng)意產(chǎn)業(yè)發(fā)展策略探析
科技資訊(2016年18期)2016-11-15 20:48:02
數(shù)字經(jīng)濟(jì)對CFC規(guī)則的沖擊探究
中國市場(2016年37期)2016-11-12 03:35:26
紅色旅游產(chǎn)業(yè)現(xiàn)狀分析及發(fā)展中管理問題研究
應(yīng)對數(shù)字經(jīng)濟(jì)下的BEPS現(xiàn)象
商(2016年25期)2016-07-29 22:05:59
荊州港口物流發(fā)展對策研究
余干县| 克拉玛依市| 集贤县| 遂昌县| 白城市| 禄丰县| 宜州市| 乡宁县| 衡阳县| 武清区| 长兴县| 云安县| 佛坪县| 马鞍山市| 贡嘎县| 张北县| 逊克县| 西峡县| 铜川市| 申扎县| 和静县| 东港市| 许昌县| 舒兰市| 赞皇县| 威远县| 诸暨市| 和政县| 达日县| 韶山市| 壶关县| 青川县| 双鸭山市| 柯坪县| 兖州市| 巴彦县| 剑阁县| 安新县| 图们市| 双辽市| 寿阳县|