童祁 曹穎
摘 要 我國(guó)出版業(yè)正處在關(guān)鍵時(shí)期,如何在蓬勃的技術(shù)變革下快速應(yīng)對(duì),促進(jìn)出版業(yè)內(nèi)容創(chuàng)新和高質(zhì)量發(fā)展,成為無(wú)法繞開(kāi)的關(guān)鍵性問(wèn)題。文章梳理大模型技術(shù)的發(fā)展歷史及對(duì)出版業(yè)的影響,對(duì)歐美領(lǐng)先企業(yè)應(yīng)用案例進(jìn)行洞察,重點(diǎn)分析大模型如何影響數(shù)字出版行業(yè)以及數(shù)字出版行業(yè)對(duì)大模型的反向助力。在此基礎(chǔ)上,提出大模型與數(shù)字出版行業(yè)互動(dòng)關(guān)系未來(lái)前景的展望。
關(guān)鍵詞 大模型;人工智能;數(shù)字出版;歐美產(chǎn)業(yè)實(shí)踐
以ChatGPT為代表的大語(yǔ)言模型(以下簡(jiǎn)稱“大模型”)技術(shù)正在以前所未有的態(tài)勢(shì)影響內(nèi)容生成和出版行業(yè)。業(yè)界矚目的“ARK投資”出品的2024年度研究報(bào)告指出,就內(nèi)容行業(yè)而言,創(chuàng)作書(shū)面內(nèi)容的成本在過(guò)去一個(gè)世紀(jì)一直都相對(duì)穩(wěn)定,但過(guò)去兩年,隨著大語(yǔ)言模型的寫(xiě)作質(zhì)量提升,內(nèi)容成本驟降[1]。本文對(duì)大模型的發(fā)展背景進(jìn)行回溯,對(duì)大模型在歐美領(lǐng)先企業(yè)的應(yīng)用案例進(jìn)行洞察,以此為基礎(chǔ),預(yù)判大模型在數(shù)字出版行業(yè)的發(fā)展趨勢(shì)。
1 背景
大模型是人工智能領(lǐng)域最前沿的數(shù)字技術(shù)創(chuàng)新,與內(nèi)容行業(yè)密切相關(guān)。它支持用戶以人類(lèi)日常語(yǔ)言交流,根據(jù)用戶提問(wèn)可以自動(dòng)生成文字、圖片、音視頻等多模態(tài)內(nèi)容,實(shí)現(xiàn)交互友好和便捷。作為內(nèi)容生成和信息處理器,它的訓(xùn)練離不開(kāi)出版內(nèi)容行業(yè)積累的高質(zhì)量語(yǔ)料和數(shù)字內(nèi)容。根據(jù)人工智能專(zhuān)家披露,書(shū)籍、期刊、維基百科等是GPT3進(jìn)行訓(xùn)練的重要數(shù)據(jù)來(lái)源,其中圖書(shū)分享網(wǎng)站Libgen是GPT最重要的數(shù)據(jù)庫(kù)[2]。換言之,大模型與數(shù)字出版天然具備緊密聯(lián)系,大模型的起源和發(fā)展得益于其數(shù)字出版基因。出版業(yè)也開(kāi)始進(jìn)入以大模型為核心驅(qū)動(dòng)的數(shù)字融合發(fā)展階段,大模型技術(shù)、語(yǔ)音合成技術(shù)、圖像視頻生成等技術(shù)聚合,引領(lǐng)有聲書(shū)、網(wǎng)絡(luò)出版、網(wǎng)絡(luò)音樂(lè)、網(wǎng)絡(luò)游戲等數(shù)字出版產(chǎn)業(yè)的生產(chǎn)力大幅提升。
我們從科技史的視角來(lái)回顧會(huì)發(fā)現(xiàn),出版業(yè)的發(fā)展史就是內(nèi)容形態(tài)和傳播方式在技術(shù)驅(qū)動(dòng)下不斷演變的歷史。進(jìn)入互聯(lián)網(wǎng)時(shí)代,隨著數(shù)字技術(shù)的快速變革,出版流程趨于智能化,移動(dòng)互聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等技術(shù)迭代對(duì)出版的影響也愈發(fā)顯著,數(shù)字出版應(yīng)運(yùn)而生。在數(shù)字技術(shù)助力下,編輯、印刷、儲(chǔ)運(yùn)、售后等出版全流程實(shí)現(xiàn)智能化。媒體與出版融合,增強(qiáng)互動(dòng)體驗(yàn),實(shí)現(xiàn)商業(yè)模式創(chuàng)新。比如新媒體方式營(yíng)銷(xiāo),即利用流媒體、社交媒體等新興媒體平臺(tái),對(duì)用戶數(shù)據(jù)進(jìn)行市場(chǎng)分析、用戶行為研究,利用搜索引擎優(yōu)化技術(shù)開(kāi)展個(gè)性化的內(nèi)容推薦,優(yōu)化出版物推廣策略。
大模型可以降低人機(jī)交互門(mén)檻,拓展數(shù)字內(nèi)容跨領(lǐng)域的應(yīng)用場(chǎng)景,廣泛提助力網(wǎng)絡(luò)游戲、網(wǎng)絡(luò)視聽(tīng)、有聲書(shū)等數(shù)字出版領(lǐng)域的提質(zhì)增效與轉(zhuǎn)型升級(jí),加快出版智能化生產(chǎn)??傮w來(lái)看,人工智能驅(qū)動(dòng)下的數(shù)字出版產(chǎn)業(yè)呈現(xiàn)媒介融合、開(kāi)放共享、交互感知和跨界共生4個(gè)特征:①媒介融合。即通過(guò)將不同媒介形態(tài)、功能、傳播技術(shù)和組織結(jié)構(gòu)等要素進(jìn)行融合形成全新閱讀體驗(yàn)和出版模式;②開(kāi)放共享。即提升出版物開(kāi)放性和包容性,通過(guò)開(kāi)放獲取、版權(quán)保護(hù)、共享平臺(tái)等,實(shí)現(xiàn)知識(shí)便捷獲取與流動(dòng)分享;③交互感知。通過(guò)感性化閱讀體驗(yàn)、內(nèi)容互動(dòng)性、個(gè)性化定制等實(shí)現(xiàn)內(nèi)容互動(dòng)的感知體驗(yàn)及知識(shí)生產(chǎn)與傳播的雙向互動(dòng);④跨界共生。數(shù)字化時(shí)代,產(chǎn)業(yè)邊界逐漸模糊,交叉融合成為趨勢(shì),數(shù)字出版與技術(shù)、教育、藝術(shù)、娛樂(lè)等融合,實(shí)現(xiàn)產(chǎn)業(yè)創(chuàng)新與升級(jí)。
2 現(xiàn)狀
自20世紀(jì)50年代以來(lái),人工智能技術(shù)發(fā)展起起伏伏,目前已進(jìn)入由大模型引領(lǐng)的第4次高潮。1956年,在美國(guó)漢諾斯小鎮(zhèn)寧?kù)o的達(dá)特茅斯學(xué)院,約翰·麥卡錫、克勞德·香農(nóng)等學(xué)者聚在一起討論著機(jī)器模擬智能的一系列問(wèn)題,雖然沒(méi)有達(dá)成共識(shí),卻為討論內(nèi)容起了一個(gè)名字:人工智能。自此,人工智能開(kāi)始出現(xiàn)在人們的視野,1956年也就成為普遍認(rèn)為的人工智能元年[3]。2017年,Google顛覆性地提出基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)——Transformer架構(gòu),這幾乎成為所有使用大語(yǔ)言模型的生成式AI公司的基礎(chǔ)[4]。2020年5月,OpenAI發(fā)布了GPT-3模型,成為當(dāng)時(shí)最大的語(yǔ)言模型。GPT-3擁有1 750億個(gè)參數(shù),預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到45 TB,訓(xùn)練數(shù)據(jù)包括多種文本類(lèi)型和數(shù)據(jù)庫(kù)資源[2],在許多自然語(yǔ)言(即人類(lèi)日常使用的語(yǔ)言)處理任務(wù)上表現(xiàn)出色,甚至在一些任務(wù)上超過(guò)了人類(lèi)水平,可以生成高質(zhì)量的文本,如回答問(wèn)題、翻譯語(yǔ)言等。2022年11月,搭載了GPT-3.5的ChatGPT橫空出世。ChatGPT能夠根據(jù)之前的輸入內(nèi)容,逐步生成連貫、合理的回復(fù),模擬人類(lèi)的對(duì)話方式。其憑借逼真的自然語(yǔ)言交互與多場(chǎng)景內(nèi)容生成能力以及友好便捷的交互方式,迅速引爆互聯(lián)網(wǎng)。之后GPT不斷迭代升級(jí),逐漸具備多模態(tài)理解和多類(lèi)型內(nèi)容生成能力。歐美一些代表企業(yè)率先將其與出版產(chǎn)業(yè)融合。
2.1 大模型正在滲透美國(guó)出版產(chǎn)業(yè)全流程
全球新冠疫情結(jié)束之后,數(shù)字加速(digital acceleration)帶來(lái)電子書(shū)、有聲書(shū)等的超預(yù)期增長(zhǎng),也帶來(lái)出版業(yè)與數(shù)字技術(shù)和生態(tài)的進(jìn)一步創(chuàng)新融合[5]。進(jìn)入2023年,人工智能技術(shù)在美國(guó)出現(xiàn)重大變革,技術(shù)的進(jìn)步重新塑造內(nèi)容形態(tài)、讀者偏好和市場(chǎng)趨勢(shì)。以O(shè)penAI為代表的美國(guó)AI大模型企業(yè)正在積極推動(dòng)產(chǎn)業(yè)應(yīng)用和落地,數(shù)字出版產(chǎn)業(yè)首當(dāng)其沖。
2.1.1 在內(nèi)容供給方面,大模型成為內(nèi)容生成的重要工具,輔助創(chuàng)作
亞馬遜上架海量ChatGPT輔助編撰各類(lèi)書(shū)籍,同時(shí)專(zhuān)門(mén)開(kāi)辟了AI作者書(shū)籍專(zhuān)欄。亞馬遜的自助出版平臺(tái)(Amazon Kindle Direct Publishing)為作者發(fā)布電子書(shū),提供了極大的便利。截至2024年4月,亞馬遜Kindle商店中有超過(guò)一千本電子書(shū)將ChatGPT列為作者或合著者,包括英語(yǔ)、意大利語(yǔ)、法語(yǔ)等不同語(yǔ)言圖書(shū),內(nèi)容涵蓋教育、文學(xué)、旅游、商業(yè)、個(gè)人成長(zhǎng)等多種題材,而且這個(gè)數(shù)字每天仍在上升(2024年4月15日,亞馬遜kindle商店的搜索結(jié)果并未顯示具體數(shù)字,這可能與很多作者沒(méi)有披露或者未將GPT列為作者有關(guān))。這里需要指出的是,大模型將取代革新后的出版創(chuàng)作流程中的部分環(huán)節(jié),但并非取代作者角色。作者仍是內(nèi)容創(chuàng)作核心,將與大模型共同參與創(chuàng)作。
除了傳統(tǒng)的文字內(nèi)容領(lǐng)域外,另一個(gè)受到巨大影響的領(lǐng)域是有聲書(shū)。據(jù)專(zhuān)業(yè)機(jī)構(gòu)預(yù)測(cè),全球有聲讀物市場(chǎng)預(yù)計(jì)到2030年將超過(guò)350億美元[6]。有聲書(shū)分為真人有聲書(shū)和人工智能AI有聲書(shū),后者主要由語(yǔ)音合成技術(shù)驅(qū)動(dòng)。隨著大模型技術(shù)的發(fā)展和AIGC的爆發(fā),通過(guò)AI語(yǔ)音工具模仿人類(lèi)語(yǔ)音輸出正在革新出版產(chǎn)業(yè)有聲閱讀制作。微軟研發(fā)的AI語(yǔ)音工具VALL-E,僅需3秒音頻即可模仿人說(shuō)話。該工具經(jīng)過(guò)60 000小時(shí)英語(yǔ)語(yǔ)音數(shù)據(jù)的訓(xùn)練并使用特定語(yǔ)音的3秒剪輯來(lái)生成內(nèi)容。與目前的許多人工智能工具不同,VALL-E可以復(fù)制說(shuō)話者的情緒和語(yǔ)氣,即使說(shuō)話者本人從未說(shuō)過(guò)的單詞也可以模仿。
2.1.2 在編輯審校方面,傳統(tǒng)的編輯流程因?yàn)榇竽P图夹g(shù)而提效增速
以美國(guó)公司Veristage為例,這家新興的技術(shù)公司由圖書(shū)出版業(yè)的幾位資深人士共同創(chuàng)立,他們的背景和經(jīng)驗(yàn)使得Veristage在出版與人工智能結(jié)合方面具有獨(dú)特優(yōu)勢(shì)和深入理解。其產(chǎn)品Insight平臺(tái)利用不同的大語(yǔ)言模型如ChatGPT和Claude來(lái)理解和處理文檔及書(shū)籍內(nèi)容。此外,Insight還特別重視內(nèi)容安全,其愿景是為出版業(yè)提供安全可靠的大模型服務(wù)。
2.1.3 在用戶交互方面,大模型幫助出版商優(yōu)化用戶的個(gè)性化體驗(yàn)
美國(guó)新聞業(yè)巨頭BuzzFeed使用ChatGPT來(lái)增強(qiáng)其用戶交互欄目“Quizze”的互動(dòng)體驗(yàn)。BuzzFeed首席執(zhí)行官喬納·佩雷蒂在一份給員工的備忘錄中表示,公司將利用這一技術(shù)創(chuàng)建面對(duì)用戶的個(gè)性測(cè)驗(yàn),同時(shí)根據(jù)用戶反應(yīng)生成個(gè)性化的文本內(nèi)容。例如,一項(xiàng)關(guān)于浪漫喜劇電影偏好的測(cè)試可能會(huì)提出“為你的浪漫喜劇選擇一個(gè)場(chǎng)景”和“告訴我們你一個(gè)可愛(ài)的缺點(diǎn)”等問(wèn)題。測(cè)試將根據(jù)每個(gè)人的回答生成一篇獨(dú)特的、可分享的文章。大眾出版商也在積極推進(jìn)AI應(yīng)用,全球知名的出版公司哈珀·柯林斯將AI技術(shù)用于進(jìn)行文本翻譯和插圖版圖書(shū)的生產(chǎn),這也對(duì)大眾出版行業(yè)提出了新的挑戰(zhàn),如何在保持內(nèi)容質(zhì)量的同時(shí),利用新技術(shù)提高生產(chǎn)效率,是出版行業(yè)需要考慮的問(wèn)題[7]。
2.2 英國(guó)傳統(tǒng)出版集團(tuán)加速嘗試大模型應(yīng)用
英國(guó)的技術(shù)進(jìn)步不如美國(guó)迅猛,監(jiān)管政策不如歐盟細(xì)致入微,但在靈活的框架下,英國(guó)數(shù)字出版業(yè)積極擁抱大模型技術(shù)并出現(xiàn)一些亮眼的應(yīng)用案例。大型出版機(jī)構(gòu)正在利用大模型革新教育出版流程。培生集團(tuán)正在建立自己的大模型應(yīng)用并開(kāi)始與大模型公司合作。大模型的應(yīng)用更多側(cè)重用戶端,而非改變出版社數(shù)字化工作流。培生集團(tuán)希望能為受教育者提供AI助手,讓AI協(xié)助回答學(xué)習(xí)相關(guān)問(wèn)題并根據(jù)受教育者的經(jīng)驗(yàn),提供教育課程推薦。教育出版是培生集團(tuán)非常重視的細(xì)分領(lǐng)域,培生集團(tuán)利用大模型識(shí)別全球職業(yè)技能趨勢(shì),調(diào)整教育出版產(chǎn)品規(guī)劃。在第24屆中國(guó)國(guó)際教育年會(huì)上,培生集團(tuán)展示自身在人工智能領(lǐng)域的多項(xiàng)前瞻性研究成果與應(yīng)用,英語(yǔ)語(yǔ)言測(cè)評(píng)工作可以利用人工智能迅速準(zhǔn)確地衡量考生的英語(yǔ)水平,在考試測(cè)評(píng)領(lǐng)域應(yīng)用人工智能技術(shù)確??荚嚬?;職業(yè)技能部門(mén)利用人工智能幫助組織預(yù)測(cè)內(nèi)部和外部的技能需求,使工作者的技能與不斷發(fā)展的就業(yè)市場(chǎng)技能需求保持一致[8]。
此外,大模型正在顯著提升市場(chǎng)營(yíng)銷(xiāo)和讀者體驗(yàn)。在大模型技術(shù)爆發(fā)之前,企鵝蘭登就已經(jīng)運(yùn)用人工智能預(yù)測(cè)重點(diǎn)地域的書(shū)刊需求,以減少書(shū)刊的退訂率[9]。Shimmr.ai是一家利用人工智能技術(shù)來(lái)革新書(shū)籍市場(chǎng)營(yíng)銷(xiāo)方式的英國(guó)創(chuàng)新公司,口號(hào)是“幫助你更高效地賣(mài)更多書(shū)”。通過(guò)其自動(dòng)化廣告平臺(tái),Shimmr.ai旨在利用持續(xù)自我優(yōu)化的廣告活動(dòng)來(lái)增強(qiáng)書(shū)籍的可發(fā)現(xiàn)性、銷(xiāo)售量和可擴(kuò)展性。這個(gè)過(guò)程從AI分析一本書(shū)的“DNA”——其流派、情節(jié)線、主題等開(kāi)始,以創(chuàng)建目標(biāo)營(yíng)銷(xiāo)活動(dòng),包括與受眾匹配的標(biāo)簽和關(guān)鍵詞。這種方法可能顯著改進(jìn)書(shū)籍的推廣方式,確保它們有效且高效地觸及正確的受眾。
2.3 歐盟專(zhuān)業(yè)出版巨頭引領(lǐng)大模型應(yīng)用
歐盟較早把大模型監(jiān)管提上日程,首要任務(wù)是確保歐盟使用的人工智能系統(tǒng)安全、透明、可追溯、非歧視和環(huán)境友好。在這種監(jiān)管背景下,歐洲的大型出版公司主導(dǎo)探索AIGC產(chǎn)品并且持續(xù)推出自研大模型工具,探索出版垂類(lèi)模型。在出版的細(xì)分領(lǐng)域,專(zhuān)業(yè)出版更加積極應(yīng)用AI工具。
大模型最先進(jìn)入專(zhuān)業(yè)出版領(lǐng)域。2023年10月18日,施普林格·自然向媒體發(fā)布信息稱,繼2019年出版世界上第一本由機(jī)器生成的科研圖書(shū)之后,施普林格·自然最新又授權(quán)作者使用GPT并將其作為集成工作流程的一部分,出版一本學(xué)術(shù)圖書(shū)。這項(xiàng)創(chuàng)新實(shí)驗(yàn)顯示,生成式AI在節(jié)省作者時(shí)間上有巨大潛力,但也凸顯人工指導(dǎo)的重要性。此外,施普林格·自然最新推出科技論文寫(xiě)作助手Curie,與通用的AI寫(xiě)作應(yīng)用程序不同,Curie專(zhuān)注于研究人員在專(zhuān)業(yè)寫(xiě)作中的獨(dú)有痛點(diǎn),為英文和英語(yǔ)語(yǔ)言潤(rùn)色,以處理非母語(yǔ)寫(xiě)作的語(yǔ)法錯(cuò)誤并改善措辭和選詞[10]。
基于專(zhuān)業(yè)數(shù)據(jù)庫(kù)內(nèi)容訓(xùn)練的出版AI應(yīng)運(yùn)而生。2024年1月16日,全球領(lǐng)先的科技出版與信息分析公司愛(ài)思唯爾正式發(fā)布Scopus AI。這款生成式人工智能工具經(jīng)過(guò)科研人員共同測(cè)試和開(kāi)發(fā)而成,結(jié)合了行業(yè)領(lǐng)先的科研文獻(xiàn)引文與索引數(shù)據(jù)庫(kù),將幫助研究人員和科研機(jī)構(gòu)快速、準(zhǔn)確地獲得文獻(xiàn)摘要和研究見(jiàn)解,從而推動(dòng)學(xué)術(shù)合作并促進(jìn)產(chǎn)生廣泛的社會(huì)影響力。Scopus AI以Scopus數(shù)據(jù)庫(kù)中涵蓋了全球7 000多家出版商旗下的超過(guò)27 000種學(xué)術(shù)期刊的可信內(nèi)容、累計(jì)超過(guò)18億的引用文獻(xiàn)和超過(guò)1 700萬(wàn)的學(xué)者檔案為基礎(chǔ),為用戶提供簡(jiǎn)明易讀的科研主題摘要。Scopus數(shù)據(jù)庫(kù)的內(nèi)容經(jīng)過(guò)獨(dú)立的內(nèi)容遴選與咨詢委員會(huì)嚴(yán)格審核與篩選,該委員會(huì)由代表主要科學(xué)學(xué)科的全球知名科學(xué)家和圖書(shū)館員
組成[11]。
AI出版平臺(tái)不斷提升用戶參與度。比如剛剛完成最新一輪融資的德國(guó)數(shù)據(jù)驅(qū)動(dòng)型出版公司Inkitt。Inkitt是一個(gè)利用AI技術(shù)幫助作者開(kāi)發(fā)和分發(fā)作品的自助出版平臺(tái)。這家公司的目標(biāo)是將用戶提交的故事轉(zhuǎn)化為暢銷(xiāo)書(shū)并以此為基礎(chǔ),構(gòu)建一個(gè)新世紀(jì)的“迪士尼”。Inkitt使用的AI技術(shù)旨在分析和預(yù)測(cè)哪些故事可能會(huì)成功,優(yōu)化內(nèi)容以增強(qiáng)讀者的參與度。Inkitt的平臺(tái)吸引了大量的關(guān)注和用戶參與,擁有3 300萬(wàn)用戶并從其服務(wù)中涌現(xiàn)出多部暢銷(xiāo)書(shū)。新融資將幫助公司擴(kuò)大內(nèi)容制作范圍,包括使用AI撰寫(xiě)故事、制作個(gè)性化小說(shuō)、涉足游戲和有聲讀物領(lǐng)域,以及制作更多視頻內(nèi)容[12]。
3 趨勢(shì)
大模型對(duì)于出版業(yè)而言是一項(xiàng)里程碑式的技術(shù),其發(fā)展過(guò)程與數(shù)字內(nèi)容產(chǎn)業(yè)有深刻內(nèi)在關(guān)聯(lián)。大模型影響數(shù)字出版業(yè)的全流程和各環(huán)節(jié),會(huì)帶來(lái)產(chǎn)業(yè)、價(jià)值、生態(tài)等一系列變化。一方面,大模型推動(dòng)出版業(yè)價(jià)值鏈發(fā)生根本性變革;另一方面,出版業(yè)作為以內(nèi)容為中心的產(chǎn)業(yè),語(yǔ)料豐富且質(zhì)量高,應(yīng)用場(chǎng)景豐富,也必然反向助力大模型迭代優(yōu)化。
3.1 大模型將全面助力歐美出版業(yè)態(tài)和商業(yè)模式創(chuàng)新
從產(chǎn)業(yè)角度來(lái)看,歐美大型出版機(jī)構(gòu)正在積極探索和應(yīng)用垂類(lèi)大模型,大模型也在全面革新和迭代傳統(tǒng)的內(nèi)容創(chuàng)作、分發(fā)流程,從而提高效率和創(chuàng)新能力。
在內(nèi)容創(chuàng)作方面,垂類(lèi)大模型的應(yīng)用日益廣泛。例如,通過(guò)AI生成的文本和圖像,出版機(jī)構(gòu)能夠快速生成新的內(nèi)容草案,為作者和編輯提供靈感和素材。此外,AI技術(shù)還能夠輔助創(chuàng)作者進(jìn)行創(chuàng)意拓展,通過(guò)分析大量數(shù)據(jù)和趨勢(shì),為新作品的構(gòu)思提供支持。以施普林格·自然為例,其科技論文寫(xiě)作助手Curie基于學(xué)術(shù)文獻(xiàn)進(jìn)行專(zhuān)門(mén)訓(xùn)練,涵蓋超過(guò)447個(gè)研究領(lǐng)域、2 000多個(gè)特定領(lǐng)域的課題,該訓(xùn)練還基于已發(fā)表論文中進(jìn)行的100多萬(wàn)次編輯,其中包括《自然》系列期刊上的論文[10]。
從編輯出版流程看,大模型智能化輔助編輯審校流程,特別是多模態(tài)大模型針對(duì)音視頻等數(shù)字出版內(nèi)容的審校能力,將極大提升編輯審校效率。以此為基礎(chǔ),大模型將重構(gòu)編輯流程,編輯需要將更多精力放在內(nèi)容價(jià)值層面,更深介入內(nèi)容生產(chǎn)環(huán)節(jié)。在傳統(tǒng)的編輯審校流程中,編輯人員需要投入大量時(shí)間和精力來(lái)檢查文本的語(yǔ)法、拼寫(xiě)、風(fēng)格一致性以及事實(shí)準(zhǔn)確性等問(wèn)題。而大模型技術(shù)的應(yīng)用可以自動(dòng)化這一過(guò)程,快速識(shí)別并糾正錯(cuò)誤,甚至提出改進(jìn)建議,極大地減輕了編輯的工作負(fù)擔(dān)。對(duì)于多模態(tài)大模型而言,其能力不僅限于文本,還能夠處理音頻和視頻等非文本內(nèi)容。在數(shù)字出版領(lǐng)域,這尤為重要,因?yàn)橐粢曨l內(nèi)容的審校往往比文本更復(fù)雜和更耗時(shí)。多模態(tài)大模型可以分析音視頻內(nèi)容中的語(yǔ)音、圖像和文本元素,識(shí)別不一致性、錯(cuò)誤信息或者版權(quán)問(wèn)題,從而確保內(nèi)容的質(zhì)量和合規(guī)性。此外,大模型還能夠提供個(gè)性化的編輯建議,根據(jù)出版機(jī)構(gòu)的風(fēng)格指南和品牌語(yǔ)言,對(duì)內(nèi)容進(jìn)行定制化的優(yōu)化。這種智能化的輔助編輯審校流程,不僅提升了編輯工作的效率,也保證了出版內(nèi)容的高質(zhì)量標(biāo)準(zhǔn),為讀者提供了更加豐富和精準(zhǔn)的閱讀體驗(yàn)。
在用戶體驗(yàn)環(huán)節(jié),大模型將在創(chuàng)建互動(dòng)內(nèi)容、提升多元化和沉浸式內(nèi)容體驗(yàn)方面發(fā)揮更大優(yōu)勢(shì),加速讀者體驗(yàn)全面升級(jí)?;诖竽P?,根據(jù)讀者偏好調(diào)整故事線的互動(dòng)式電子書(shū)、定制化的閱讀助手、圖書(shū)快速轉(zhuǎn)換為有聲書(shū)、音視頻、實(shí)時(shí)的閱讀反饋分析、VR/AR增強(qiáng)現(xiàn)實(shí)閱讀體驗(yàn)都有可能實(shí)現(xiàn),從而極大地拓展閱讀乃至數(shù)字出版的外延場(chǎng)景案例。2023年8月1日,OpenAI宣布公司有史以來(lái)的第一筆收購(gòu),收購(gòu)對(duì)象是一家成立了僅2年且只有8位員工的“虛擬游戲”公司Global Illumination。Biomes是Global Illumination最近推出的一款基于Web的沙盒類(lèi)大型多人在線角色扮演游戲(MMORPG),使用了Next.js、Typescript、React和Web Assembly等技術(shù),被稱為開(kāi)源版“我的世界”。玩家只需要打開(kāi)瀏覽器,就可以建造、覓食、玩小游戲以及進(jìn)行更多活動(dòng)。Biomes游戲利用AI技術(shù),根據(jù)玩家的行為和喜好,動(dòng)態(tài)地調(diào)整地形、植被、動(dòng)物、天氣等內(nèi)容,生成真實(shí)多變的游戲世界,帶來(lái)更有挑戰(zhàn)性、更刺激的游戲體驗(yàn)。在這樣的背景下,大家對(duì)于此次收購(gòu)也有另一種猜測(cè):OpenAI買(mǎi)下這個(gè)公司,目的是要在GPT-5上運(yùn)行多智能體文明模擬游戲。
3.2 數(shù)字出版產(chǎn)業(yè)將為大模型進(jìn)化提供多樣性的知識(shí)庫(kù)
決定大模型核心競(jìng)爭(zhēng)力的關(guān)鍵要素包含算力、算法與數(shù)據(jù),數(shù)字出版產(chǎn)業(yè)對(duì)大模型的影響更多落位在數(shù)據(jù)層面。出版機(jī)構(gòu)積累了大量的高質(zhì)量?jī)?nèi)容資源并具備持續(xù)的高質(zhì)量?jī)?nèi)容生產(chǎn)能力,為大模型訓(xùn)練提供高質(zhì)量語(yǔ)料庫(kù)。前文提到的GPT-3訓(xùn)練數(shù)據(jù)庫(kù),主要來(lái)源于圖書(shū)、期刊、網(wǎng)絡(luò)數(shù)據(jù)等。美聯(lián)社作為首家媒體機(jī)構(gòu)與OpenAI達(dá)成協(xié)議,授權(quán)OpenAI使用美聯(lián)社部分新聞存檔,以探索生成式人工智能在新聞?lì)I(lǐng)域的應(yīng)用。OpenAI的首席運(yùn)營(yíng)官布拉德·萊特卡普表示,美聯(lián)社的反饋意見(jiàn)以及OpenAI對(duì)其高質(zhì)量、真實(shí)文本存檔的訪問(wèn)將有助于提高OpenAI系統(tǒng)的能力和實(shí)用性[13]。而后,與OpenAI合作的媒體機(jī)構(gòu)范圍從美國(guó)逐步拓展至歐洲。2023年12月,德國(guó)數(shù)字傳媒出版集團(tuán)Axel Springer和OpenAI達(dá)成戰(zhàn)略合作,雙方的合作將推動(dòng)新聞出版業(yè)與人工智能更深入的整合,OpenAI將付費(fèi)使用施普林格旗下出版物的內(nèi)容,以填充ChatGPT的答案并訓(xùn)練其人工智能工具。Axel Springer將通過(guò)專(zhuān)業(yè)新聞內(nèi)容豐富ChatGPT用戶體驗(yàn)。通過(guò)這次合作,ChatGPT用戶將能夠接收到來(lái)自Axel Springer旗下媒體品牌的全球新聞內(nèi)容摘要。ChatGPT對(duì)用戶查詢的回答將包括對(duì)原始文章的引用和鏈接,以提高透明度和提供更多信息。OpenAI也將支持Axel Springer的AI驅(qū)動(dòng)計(jì)劃,合作還涉及使用Axel Springer旗下媒體品牌的優(yōu)質(zhì)內(nèi)容來(lái)推進(jìn)OpenAI的大型語(yǔ)言模型的訓(xùn)練。此外,出版機(jī)構(gòu)也將同時(shí)開(kāi)發(fā)新的收入模式。OpenAI的COO Brad Lightcap表示,這次合作將幫助人們通過(guò)AI工具以新的方式獲取高質(zhì)量、實(shí)時(shí)的新聞內(nèi)容,他們致力于與全球出版商和創(chuàng)作者合作,以此確保他們從先進(jìn)的AI技術(shù)和新的收入模式中獲益。
4 建議
目前,我國(guó)正處在出版業(yè)智能化、融合化升級(jí)的關(guān)鍵階段。通過(guò)對(duì)歐美數(shù)字出版業(yè)最新態(tài)勢(shì)的追蹤,可以看到中國(guó)應(yīng)該加強(qiáng)人工智能方向的前瞻性、針對(duì)性布局,推動(dòng)人工智能深度應(yīng)用,探索新的商業(yè)模式,更好與“Z世代”新興讀者群的閱讀習(xí)慣結(jié)合,從而促進(jìn)數(shù)字出版業(yè)的高質(zhì)量發(fā)展。在迅速變化的環(huán)境中,出版業(yè)面臨系列挑戰(zhàn)的同時(shí)也迎來(lái)了革新發(fā)展的歷史機(jī)遇。敏銳的市場(chǎng)洞察能力、持續(xù)的內(nèi)容與服務(wù)創(chuàng)新能力以及豐富的資源協(xié)同能力,正是出版業(yè)應(yīng)對(duì)動(dòng)態(tài)環(huán)境挑戰(zhàn)的關(guān)鍵能力。
4.1 洞察先行,持續(xù)關(guān)注國(guó)內(nèi)外行業(yè)動(dòng)態(tài)
近年來(lái),國(guó)際大型出版公司一直在探索前沿?cái)?shù)字技術(shù)在出版業(yè)的應(yīng)用。人工智能與出版業(yè)的結(jié)合并不是新鮮事物。早在兩年前,以DeepZen和Speechki為代表的新一代智能化音頻轉(zhuǎn)換技術(shù),已經(jīng)開(kāi)始撼動(dòng)傳統(tǒng)人工朗誦模式下的有聲書(shū)行業(yè)[5]。在數(shù)字出版時(shí)代,數(shù)字出版企業(yè)的數(shù)據(jù)其實(shí)已經(jīng)初步完成數(shù)據(jù)化、標(biāo)簽化、知識(shí)圖譜化、索引化、智能檢索化,所以比較容易在大模型時(shí)代脫穎而出。而傳統(tǒng)出版企業(yè)的大模型轉(zhuǎn)型則可能需要先完成以上步驟。由此可以看出,新興的數(shù)字出版產(chǎn)業(yè)特別是像有聲書(shū)、網(wǎng)絡(luò)文學(xué)、網(wǎng)絡(luò)游戲等產(chǎn)生于數(shù)字時(shí)代的產(chǎn)業(yè),相比于傳統(tǒng)出版企業(yè),在應(yīng)用大模型方面更具優(yōu)勢(shì),要緊跟技術(shù)發(fā)展,建立信息獲取和共享機(jī)制,培養(yǎng)和提升數(shù)據(jù)分析能力,捕獲市場(chǎng)和客戶需求。
4.2 攜手共進(jìn),提升內(nèi)外資源協(xié)同能力
外部協(xié)同是指出版機(jī)構(gòu)和技術(shù)企業(yè)加強(qiáng)合作,明確合作目標(biāo)與權(quán)責(zé)分配,出版機(jī)構(gòu)深度參與技術(shù)研發(fā)過(guò)程,雙方強(qiáng)化溝通和透明度,優(yōu)勢(shì)互補(bǔ)。內(nèi)部協(xié)同是指出版業(yè)內(nèi)部各機(jī)構(gòu)之間加強(qiáng)協(xié)同共享,搭建行業(yè)合作平臺(tái),可采用聯(lián)合研發(fā)、合作推廣、人才共培等方式來(lái)優(yōu)化資源配置。大模型技術(shù)在推動(dòng)出版業(yè)創(chuàng)新和提升用戶體驗(yàn)方面具備切實(shí)的能力和潛力,但需要出版社提供更多專(zhuān)業(yè)性內(nèi)容和語(yǔ)料來(lái)提升大模型對(duì)內(nèi)容的把控能力。
對(duì)于大模型訓(xùn)練而言,最重要的是解決數(shù)據(jù)、算法、算力的問(wèn)題。GPT的訓(xùn)練數(shù)據(jù)離不開(kāi)出版內(nèi)容行業(yè)積累的海量高質(zhì)量語(yǔ)料和數(shù)字內(nèi)容。目前,中文數(shù)據(jù)在GPT所用語(yǔ)料中的占比極低,所以,GPT的中文輸出能力與英文輸出能力相比相差較大。對(duì)于中國(guó)科技企業(yè)追趕大模型技術(shù)、參與國(guó)際競(jìng)爭(zhēng)角度而言,中文數(shù)據(jù)至關(guān)重要。雖然中文互聯(lián)網(wǎng)上有大量數(shù)據(jù),但其質(zhì)量參差不齊。如何深入發(fā)掘中文可訓(xùn)練語(yǔ)料,是下一步中文大模型訓(xùn)練的基礎(chǔ)。
5 結(jié)語(yǔ)
對(duì)于內(nèi)容行業(yè)而言,文本、語(yǔ)音、圖片、視頻等技術(shù)的疊加可能產(chǎn)生多種真假難辨的內(nèi)容,引發(fā)個(gè)人隱私、公眾認(rèn)知、數(shù)據(jù)安全等安全隱患。我們應(yīng)當(dāng)看到大模型可能帶來(lái)的技術(shù)風(fēng)險(xiǎn),但這些風(fēng)險(xiǎn)可以在適當(dāng)監(jiān)管的前提下預(yù)判和解決。有風(fēng)險(xiǎn)不等于要停止發(fā)展,特別是在全球范圍內(nèi)大模型技術(shù)研發(fā)日新月異、商業(yè)生態(tài)初見(jiàn)雛形、應(yīng)用市場(chǎng)如火如荼的當(dāng)下,我們要積極擁抱技術(shù),持續(xù)探索安全發(fā)展的新路徑。
技術(shù)和內(nèi)容從來(lái)不是二元對(duì)立的,而是緊密連接互相促進(jìn)。新的變革性技術(shù)到來(lái)之后,如何用于挖掘和擴(kuò)大文化內(nèi)容的價(jià)值并且賦能時(shí)代和未來(lái),是出版業(yè)和技術(shù)企業(yè)的共同議題。出版智能化、融合化升級(jí)的關(guān)鍵階段,數(shù)字出版業(yè)和人工智能業(yè)更應(yīng)該攜手合作共同應(yīng)對(duì)未來(lái),通過(guò)融合雙方的優(yōu)勢(shì)資源,共同促進(jìn)出版內(nèi)容的創(chuàng)新和價(jià)值最大化,同時(shí)助力中國(guó)大模型技術(shù)的發(fā)展,這才是中國(guó)特色數(shù)字出版產(chǎn)業(yè)發(fā)展的必由
之路。
(責(zé)任編輯:郭劍)
參考文獻(xiàn)
[1] Big Ideas 2024[EB/OL].[2024-03-15].https://www.ark-invest.com/big-ideas-2024.
[2] ALAN D T.What in my AI?[EB/OL].[2024-03-15].https://lifearchitect.ai/whats-in-my-ai/.
[3] 尼克.人工智能簡(jiǎn)史[M].2版.北京:人民郵電出版社,2021:6.
[4] 揭秘Transformer創(chuàng)始八子,聚是一團(tuán)火,散是滿天星[EB/OL].(2023-08-23)[2024-03-15].https://www.thepaper.cn/newsDetail_forward_24318491.
[5] 任翔.數(shù)字加速與新增長(zhǎng)周期:2021年歐美數(shù)字出版發(fā)展回顧[J].出版廣角,2022(1):50-55.
[6] Publishing Trends in 2024[EB/OL].(2023-12-05)[2024-03-15].https://publishingstate.com/publishing-trends-in-2024/2023/.
[7] 渠競(jìng)帆.AI“殺入”出版業(yè),國(guó)際出版商有何應(yīng)對(duì)之策[EB/OL].(2024-04-09)[2024-03-15].https://mp.weixin.qq.com/s?__biz=MzI3MzQ1MzI0NQ==&mid=2247531200&idx=1&sn=a53a649d7ff17bd17268a5f9eefab6c7&chksm=eb212312dc56aa04d91b2f957ce650984f18131888b7829d71127d404d6fa57544cba7326449&scene=27.
[8] 引領(lǐng)探索AI賦能教育新方向 培生亮相第24屆中國(guó)國(guó)際教育年會(huì)[EB/OL].(2023-10-27)[2024-03-15].https://edu.sina.com.cn/l/2023-10-27/doc-imzsptxk5069967.shtml.
[9] 有了這些高科技,出版行業(yè)和從前大不相同[EB/OL].(2021-05-23)[2024-03-15].https://www.fortunechina.com/keji/c/2021-05/23/content_390704.htm.
[10] 人工智能驅(qū)動(dòng) 全球知名學(xué)術(shù)出版機(jī)構(gòu)推出一款科技論文寫(xiě)作助手[EB/OL].(2023-10-17)[2024-03-15].https://new.qq.com/rain/a/20231017A08BMB00.
[11] 愛(ài)思唯爾正式發(fā)布Scopus AI,助力科研全流程增效提速[EB/OL].(2024-01-18)[2024-03-15].https://www.jiemian.com/article/10694804.html.
[12] Inkitt nets another 37 million for AI powered publishing[EB/OL].(2024-04-15)[2024-04-16].https://www.publishersweekly.com/pw/by-topic/international/international-book-news/article/94456-inkitt-nets-another-37-million-for-ai-powered-publishing.html.
[13] 美聯(lián)社與Open AI合作,探索生成式AI在新聞?lì)I(lǐng)域的應(yīng)用[EB/OL].(2023-07-14)[2024-04-16].https://www.thepaper.cn/newsDetail_forward_ 23849215.
Large Language Models and Digital Publishing Revolution—Experience and Lessons from Western Industry Practices
Qi Tong1Ying Cao2
1.School of Economics and Management,Tsinghua University,Beijing 100084,China;2.Research Institute of Tencent,Beijing 100101,China
Abstract China's publishing industry is at a critical historical moment. How to respond quickly under the vigorous technological revolution and promote content innovation and high-quality development in the publishing industry has become an unavoidable key issue. The article reviews the development history of large language models and its impact on the publishing industry. It provides insights into the application cases of leading companies in US、EU and UK, analyzing how large language models affect the digital publishing industry and how the digital publishing industry reciprocally supports large models. Based on this, the paper proposes prospects for the interactive relationship between large language models and digital publishing in the future, as well as suggestions for the publishing industry to respond to future challenges.
Keywords Large language models; Artificial intelligence; Digital publishing; Western Industry Practice