人工智能生成內(nèi)容（AIGC）及其在圖書出版中的應用探討

2023-05-31 01:27王峻峰

傳播與版權 2023年10期

［摘要］近年來，人工智能生成內(nèi)容（AIGC）隨著人工智能技術的發(fā)展而不斷發(fā)展完善，取得突破性進展，其生成的內(nèi)容愈發(fā)接近人類創(chuàng)作，而人工智能聊天機器人程序ChatGPT的出現(xiàn)再度引發(fā)AIGC技術討論和研發(fā)的熱潮。目前，AIGC在圖書出版各環(huán)節(jié)都具有廣闊的應用前景，其需要在實踐中不斷提高和完善，并加強技術研發(fā)和管理規(guī)范，從而更好地推動圖書出版的創(chuàng)新和發(fā)展。

［關鍵詞］AIGC；ChatGPT；圖書；出版

人工智能生成內(nèi)容（Artificial Intelligence Generated Content，AIGC）是人工智能領域中的一個重要分支。在數(shù)字世界與現(xiàn)實世界加速融合的大背景下，近年來AIGC技術發(fā)展迅速，而人工智能聊天機器人程序ChatGPT的出現(xiàn)再度引發(fā)AIGC技術討論的熱潮，其將重塑甚至顛覆數(shù)字內(nèi)容的生產(chǎn)方式和消費模式。盡管AIGC對圖書出版行業(yè)的影響至今仍未充分顯現(xiàn)，但其具有的顛覆性能力和廣闊的應用前景已受到業(yè)內(nèi)密切關注。

一、AIGC的概念與發(fā)展歷程

AIGC指利用人工智能技術生成內(nèi)容的新型生產(chǎn)方式，是相對專業(yè)生成內(nèi)容（Professional Generated Content， PGC）、用戶生成內(nèi)容（User Generated Content， UGC）而提出的概念，如AI作曲、AI繪畫、AI寫作等都屬于AIGC的分支。AIGC使用的技術主要包括機器學習、自然語言處理等，通過學習大量已有的文本、音頻、圖像等數(shù)據(jù)集，進而生成新的內(nèi)容，其所生成的內(nèi)容與人類創(chuàng)作的內(nèi)容極為相似。

AIGC伴隨計算機技術和人工智能技術的發(fā)展而不斷發(fā)展完善。早在1957年，萊杰倫·希勒和倫納德·艾薩克森就通過將計算機程序中的控制變量換成音符，完成了歷史上首支由計算機創(chuàng)作的音樂作品—Illiac Suite。但早期的AIGC只能依照指定的模板或規(guī)則進行簡單的內(nèi)容制作與輸出，并不具備學習能力，也不能理解數(shù)據(jù)，無法靈活地生成內(nèi)容。20世紀八九十年代，由于系統(tǒng)成本高昂、商業(yè)變現(xiàn)困難，各國政府在人工智能領域的投入不斷減少，因此AIGC未能取得重大突破。2006年，杰弗里·辛頓提出深度信念網(wǎng)絡概念，深度學習算法取得突破，加上此時計算機設備算力提升，互聯(lián)網(wǎng)數(shù)據(jù)膨脹提供海量訓練數(shù)據(jù)，因此人工智能發(fā)展取得顯著進步。但此時的AIGC仍受限于算法技術，創(chuàng)作能力有限且效果不佳，未能獲得廣泛應用。2007年，世界上首本完全由人工智能創(chuàng)作的小說1 The Road問世，但其整體可讀性不強，存在拼寫錯誤、辭藻空洞、缺乏邏輯等缺點［1］。自2012年起，深度學習時代到來，卷積神經(jīng)網(wǎng)絡、變分自編碼器、生成式對抗網(wǎng)絡、強化學習、流模型、擴散模型等深度學習算法的出現(xiàn)和應用，使得人工智能的學習能力和生成能力迅速提升。2016年后，深度殘差網(wǎng)絡和Transformer大模型等深度神經(jīng)網(wǎng)絡的結(jié)構(gòu)升級，使得模型參數(shù)量從數(shù)萬升級到數(shù)千億，深度學習網(wǎng)絡層數(shù)從幾層發(fā)展到成百上千層，模型規(guī)模的量變引起能力上的質(zhì)變，高質(zhì)量的文本、優(yōu)美靈動的曲調(diào)、超高清晰度的圖片和視頻等內(nèi)容的智能生成成為現(xiàn)實。AIGC開始應用在各類場景中，其所生成的內(nèi)容五花八門，內(nèi)容效果逐漸接近人類創(chuàng)作，讓人難以分辨［1］。例如，英偉達發(fā)布的StyleGAN可以自動生成與現(xiàn)實照片非常相似的圖片；OpenAI推出的DALL-E 2可根據(jù)用戶輸入的簡短描述性文字生成風格多樣、質(zhì)量極高的繪畫；DeepMind發(fā)布的DVD-GAN可以生成在草地、廣場等明確場景下的連續(xù)視頻。

2022年11月，OpenAI推出了基于Transformer大模型的人工智能聊天機器人程序ChatGPT（Chat Generative Pre-trained Transformer，即生成型預訓練變換模型）。它是一個專注于對話生成的大型語言模型，能夠與人即時對話，并自動生成流暢、連貫的自然語言文本。ChatGPT一經(jīng)上線便引起大量關注，開放試用的短短幾天就吸引了超100萬互聯(lián)網(wǎng)用戶，推出兩個月后其月活躍用戶數(shù)過億。從回答簡單問題到寫詩、寫故事、寫程序，從語言翻譯到文本歸納總結(jié)，從行業(yè)分析到撰寫商業(yè)計劃書，不論是用中文、英文還是用其他語言表達，ChatGPT幾乎無所不能。

ChatGPT采用了預訓練和微調(diào)的方式進行模型訓練［2］。在預訓練階段，模型使用大規(guī)模的未標注文本數(shù)據(jù)進行訓練，目標是學習文本序列的概率分布和詞語之間的關系。這使得模型能夠形成對人類知識和自然語言的理解和內(nèi)容生成能力。在微調(diào)階段，模型使用人類反饋強化學習（Reinforcement Learning from Human Feedback，RLHF）的方式進行訓練，即先用有標注的數(shù)據(jù)（指由人根據(jù)問題給出的高質(zhì)量答案）來微調(diào)預訓練模型，然后由模型根據(jù)問題給出多個答案，人工對答案滿意度進行打分、排序并建立獎勵模型，如此多次循環(huán)［3］。這使得模型生成的內(nèi)容更加貼合人類的認知、需求、價值觀。ChatGPT可以與其他AIGC模型聯(lián)合使用，獲得更加獨特、實用的功能。例如，我們在ChatGPT中輸入簡單文字描述，讓其生成一段詳細文字描寫，再將該段文字輸入AI繪圖軟件即可生成設計圖像。OpenAI計劃在未來的ChatGPT更新中引入多模態(tài)學習能力，即結(jié)合圖像、音頻、視頻等多種模態(tài)的數(shù)據(jù)進行學習。另外，微軟也在其New Bing中接入了ChatGPT，在一定程度上實現(xiàn)了智能搜索。這些方式都極大地提升了AIGC的實際應用能力，人工智能大規(guī)模落地未來可期。

ChatGPT再度引燃了人們對AIGC的關注熱情，其出現(xiàn)以來相關討論層出不窮。從簡單到復雜、從量變到質(zhì)變，雖然現(xiàn)今的AIGC離理想中的通用人工智能還有一定差距，但是無疑已經(jīng)邁出重要一步。隨著數(shù)據(jù)量的增加、算法的迭代升級，以及與現(xiàn)實世界交互功能的加強，多模態(tài)AIGC大模型將通過不斷的學習試錯以及自動總結(jié)客觀規(guī)律，幫助人類創(chuàng)造更美好的生活。

二、AIGC在圖書出版中的應用探討

在圖書出版領域，雖然各出版機構(gòu)對人工智能技術的應用情況和應用程度并不一致，但數(shù)字化、智能化是大勢所趨已成為出版界的共識。隨著ChatGPT的推出，AIGC技術的快速發(fā)展會給圖書出版帶來什么改變也在行業(yè)內(nèi)引發(fā)討論。目前，學界和業(yè)界已對人工智能在圖書出版中的應用進行了研究和探討，與人工智能相比，AIGC在數(shù)據(jù)挖掘、機器學習、自然語言處理等技術的基礎上，更注重應用場景的特定性，能通過針對特定領域的深入學習和優(yōu)化，實現(xiàn)更高效、更準確的數(shù)據(jù)分析、決策支持和智能服務。

（一）在圖書選題策劃中的應用

在圖書選題策劃環(huán)節(jié)，AIGC技術可以幫助出版社和編輯有針對性地對市場需求進行分析和預測，以更好地把握市場趨勢和讀者閱讀需求，為圖書選題策劃提供參考。第一，編輯可通過AIGC技術分析社交媒體、搜索引擎、圖書評論、圖書銷售數(shù)據(jù)等大數(shù)據(jù)，快速發(fā)現(xiàn)當前熱門的圖書話題，獲取有關某一類圖書的需求量、市場容量、競爭情況等信息，并自動生成文本、圖表等可視化內(nèi)容以供參考。第二，出版社可以利用AIGC技術分析和預測讀者的特征和偏好，包括年齡、性別、教育水平、興趣愛好等，自動生成讀者畫像，從而確定圖書的目標讀者。第三，出版社和編輯可以通過自然語言處理技術，對歷史圖書的內(nèi)容進行分析和比較，挖掘出與當前市場需求相符的主題和話題。第四，出版社可以利用AIGC技術比較同類圖書的市場表現(xiàn)和銷售情況，如銷售額、評價指數(shù)等，生成同類圖書的優(yōu)缺點分析報告，以便更好地制訂圖書營銷策略。第五，AIGC可以通過對大量的文本數(shù)據(jù)進行學習和分析，自動生成潛在的主題和創(chuàng)意，作者和編輯可據(jù)此拓展思路，增強圖書選題的創(chuàng)意性和多樣性。

（二）在圖書組稿和內(nèi)容創(chuàng)作中的應用

在圖書組稿環(huán)節(jié)，出版社和編輯可以利用AIGC技術來尋找合適的作者，如分析讀者的購買歷史和購買偏好，利用推薦算法為其推薦適合的作者；通過聯(lián)網(wǎng)直接搜索潛在作者的背景信息，包括教育背景、工作經(jīng)歷、專業(yè)領域等，自動生成其背景調(diào)查報告；挖掘社交媒體、博客、網(wǎng)站等平臺上的信息，分析潛在作者的知名度、影響力和粉絲數(shù)量等，以評估作者的潛在市場價值；分析潛在作者的寫作風格、主題偏好、寫作文筆等，以了解作者的文學風格和寫作特點；等等。AIGC可通過自然語言生成模型對大量文本進行學習和分析，自動生成圖書內(nèi)容的各個組成部分，包括章節(jié)、段落、句子等，或者為圖書的內(nèi)容創(chuàng)作提供靈感和素材［4］。通過AIGC的自動化生成，圖書的內(nèi)容創(chuàng)作可以更加高效，從而縮減圖書出版周期，降低出版成本。同時，AIGC也可以在一定程度上增強圖書內(nèi)容的創(chuàng)新性和個性化，使讀者更容易接受。此外，AIGC還可以在圖書創(chuàng)作過程中提供實時的語言糾錯和寫作風格建議，幫助作者減少寫作錯誤和提高文本質(zhì)量。

（三）在圖書編輯加工和審校中的應用

編輯加工和審校是圖書出版過程中的重要環(huán)節(jié)，需要耗費大量的時間和人力。一些自動化工具，如黑馬校對軟件、方正智能輔助審校系統(tǒng)等已經(jīng)應用于字詞、標點、敏感詞、知識、格式、邏輯等方面的輔助審校［5］，在一定程度上提高了圖書編輯加工和審校的工作效率和編校質(zhì)量。AIGC的發(fā)展大大提高了人工智能的語義分析和上下文聯(lián)系能力，知識庫構(gòu)建更完善、能夠與互聯(lián)網(wǎng)實時連接的AICG將能夠做到智能判斷各類知識點的正誤或存疑情況，其將在深層語法、語義邏輯等方面為編校人員提供更有益的參考。另外，AIGC能有效識別符號公式和插圖表格等，以及有效處理大小寫、正斜體、角標等格式規(guī)范問題，這可幫助編輯高效完成理工科類專業(yè)書籍或中小學理科教輔圖書的編校加工。

（四）在圖書美術設計中的應用

圖書的美術設計是吸引讀者注意的重要因素之一，AI繪圖工具比ChatGPT更早引起大眾關注，目前已有不少此類AIGC工具。例如，谷歌的AutoDraw可以根據(jù)用戶的手繪圖形自動識別并替換成更美觀的圖形。另外，還有Midjourney、Stable Diffusion、DALL-E 2、NovelAI等工具，能夠根據(jù)用戶的簡單文字描述自動生成或真實或具有想象力的圖片。此外，AIGC可通過對大量已出版的圖書封面和插圖進行學習和分析，自動識別各種元素之間的關系，如顏色、形狀、文字、圖片等，進而分析市場需求和讀者偏好，生成更具吸引力的圖書封面和插圖。

（五）在圖書營銷中的應用

在數(shù)字化出版時代，圖書營銷渠道和方式的多樣化給了出版社更多的選擇，而出版社應用AIGC可以進行精準營銷，提高營銷效率和銷售量。首先，AIGC可用于預測潛在讀者的閱讀喜好和閱讀興趣，從而增強圖書的推廣效果。例如，出版社可以通過AIGC分析社交媒體平臺上讀者的閱讀興趣和行為，以便更好地了解讀者的喜好和需求，并根據(jù)這些信息制訂相應的營銷策略。其次，AIGC還可用于圖書的個性化推薦。在數(shù)字化出版時代，越來越多的讀者選擇在線閱讀和購買電子書。通過對讀者的閱讀歷史和行為進行分析，AIGC可以為讀者推薦符合他們閱讀興趣和需求的圖書，從而提高圖書的銷售量。最后，AIGC還可用于制作圖書廣告和宣傳素材。通過對圖書內(nèi)容和讀者需求的分析，AIGC可以自動生成相關的營銷文案、海報、宣傳冊等內(nèi)容，助力出版社高效開展圖書營銷。

盡管AIGC可以分析數(shù)據(jù)、歸納總結(jié)信息，也可以模仿人類創(chuàng)作，生成各類文章、圖像、報表等，但其也存在一些不足。例如，AIGC主要依靠對已有數(shù)據(jù)的學習和模仿，難以創(chuàng)造出真正意義上的原創(chuàng)內(nèi)容，缺乏真正的創(chuàng)造性。第一，由于模型訓練數(shù)據(jù)存在局限性和片面性，AIGC在生成內(nèi)容時難以完全考慮文化差異和情感因素等，導致其在生成某些類型的內(nèi)容時可能失之偏頗［6］。第二，一些專業(yè)領域的問題需要更深入的領域?qū)I(yè)知識和經(jīng)驗以及更復雜的推理演算，而AIGC難以學習和模仿這些知識和經(jīng)驗，使得其處理復雜問題可能出現(xiàn)困難。第三，AIGC生成的內(nèi)容可能缺乏人類審美和主觀判斷的因素，難以滿足讀者的需求和興趣。第四，語言文字有時存在歧義和多義，AIGC在處理這些問題時可能出現(xiàn)偏差，導致生成的內(nèi)容不準確或不恰當。因此，從這些不足來看，AIGC應用于圖書出版離不開使用者的審核把關，在分析、決策、生成方面AIGC仍應扮演工具性的協(xié)助角色，以更好地發(fā)揮人工智能和人類雙方的優(yōu)勢。人機協(xié)同模式仍是未來相當長時間內(nèi)的主流［7］。

三、AIGC應用于圖書出版可能涉及的問題

AIGC應用于圖書出版可能涉及的問題主要有隱私保護、知識產(chǎn)權保護、算法歧視、信息準確度以及透明度。第一，出版社應用AIGC需要訪問和處理大量的用戶數(shù)據(jù)和個人信息，這就涉及隱私保護的問題，如果未經(jīng)充分授權和明確告知，用戶的個人數(shù)據(jù)和隱私信息則可能被泄露或濫用。第二，AIGC應用于圖書出版可能會涉及知識產(chǎn)權的保護問題，如在數(shù)據(jù)挖掘階段存在合理使用風險，在內(nèi)容生成階段存在可版權性和版權歸屬風險，在內(nèi)容生成后的使用階段存在流轉(zhuǎn)風險與侵權風險［8］。第三，由于AIGC的學習和決策是基于數(shù)據(jù)的，如果數(shù)據(jù)本身存在偏差，算法也可能出現(xiàn)歧視，如出現(xiàn)價格歧視、性別歧視等，從而影響信息推薦和決策結(jié)果。第四，AIGC的訓練數(shù)據(jù)庫過于龐大，且多來自互聯(lián)網(wǎng)，其中存在許多錯誤信息，因此其所生成的內(nèi)容并不能保證準確無誤，如果公眾長期使用AIGC來獲取信息而不加以仔細甄別，就容易導致錯誤信息傳播更泛濫。第五，由于算法透明度較低，其運行規(guī)律和因果邏輯難以解釋，一旦出錯則難以糾偏除誤，且訓練數(shù)據(jù)庫過于龐大、參數(shù)過于復雜，也難以審核其訓練原材料的公允性等因素，因此出版社應用AIGC進行的分析、決策可能不夠客觀和公正。

為了規(guī)范和管理AIGC的應用，保障知識產(chǎn)權和用戶權益，未來關于AIGC的一些措施有待研究與施行。例如，相關部門可制定相關的法律法規(guī)，明確AIGC在圖書出版中的應用范圍和限制條件，加強知識產(chǎn)權保護，防止AIGC在圖書出版中的應用侵犯知識產(chǎn)權。出版社可建立健全監(jiān)管和審查機制，對AIGC的應用進行審查和監(jiān)督，防止不當使用和濫用。業(yè)界應加強人工智能行業(yè)自律自治，強化“倫理先行”意識，制訂行業(yè)公約、標準、指南等，打造AIGC健康發(fā)展生態(tài)。社會層面要加強知識普及，提高公眾對AIGC的認識和理解，促進公眾對AIGC的應用與影響的理性思考和討論。

［參考文獻］

［1］中國信息通信研究院，京東探索研究院.人工智能生成內(nèi)容（AIGC）白皮書（2022年）［EB/OL］.（2022-09-02）［2023-02-28］.http：//www.caict.ac.cn/sytj/202209/P020220913580752910299.pdf.

［2］OpenAI.IntroducingChatGPT［EB/OL］.（2022-11-30）［2023-02-28］.https：//openai.com/blog/chatgpt.

［3］陳巍談芯.ChatGPT發(fā)展歷程、原理、技術架構(gòu)詳解和產(chǎn)業(yè)未來（收錄于GPT-4/ChatGPT技術與產(chǎn)業(yè)分析）［EB/OL］.（2023-02-27）［2023-02-28］.https：//zhuanlan.zhihu.com/p/590655677.

［4］王俊美.ChatGPT寫作：出版界怎么看［EB/OL］.（2023-02-24）［2023-02-28］.http：//cssn.cn/skgz/202302/t20230224_5598227.shtml.

［5］宋萃薇.人工智能在圖書出版的應用與編輯的轉(zhuǎn)型［J］.采寫編，2023（01）：134-136.

［6］王羽佳.AI與出版融合視角下圖書選題策劃與內(nèi)容生產(chǎn)的優(yōu)化路徑［J］.出版科學，2023（01）：44-49.

［7］胡嘉思.人工智能在出版行業(yè)融合傳播及運營模式中的應用與展望［J］.科技與出版，2023（01）：79-82.

［8］叢立先，李泳霖.聊天機器人生成內(nèi)容的版權風險及其治理：以ChatGPT的應用場景為視角［J/OL］.中國出版：1-6［2023-02-28］.http：//kns.cnki.net/kcms/detail/11.2807.G2.20230221.1908.002.html.

［作者簡介］王峻峰（1991—），男，重慶人，新世界出版社教育編輯部副主任。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

人工智能生成內(nèi)容（AIGC）及其在圖書出版中的應用探討