国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能生成內(nèi)容(AIGC)及其在圖書出版中的應用探討

2023-05-31 01:27王峻峰
傳播與版權 2023年10期
關鍵詞:出版圖書

[摘要]近年來,人工智能生成內(nèi)容(AIGC)隨著人工智能技術的發(fā)展而不斷發(fā)展完善,取得突破性進展,其生成的內(nèi)容愈發(fā)接近人類創(chuàng)作,而人工智能聊天機器人程序ChatGPT的出現(xiàn)再度引發(fā)AIGC技術討論和研發(fā)的熱潮。目前,AIGC在圖書出版各環(huán)節(jié)都具有廣闊的應用前景,其需要在實踐中不斷提高和完善,并加強技術研發(fā)和管理規(guī)范,從而更好地推動圖書出版的創(chuàng)新和發(fā)展。

[關鍵詞]AIGC;ChatGPT;圖書;出版

人工智能生成內(nèi)容(Artificial Intelligence Generated Content,AIGC)是人工智能領域中的一個重要分支。在數(shù)字世界與現(xiàn)實世界加速融合的大背景下,近年來AIGC技術發(fā)展迅速,而人工智能聊天機器人程序ChatGPT的出現(xiàn)再度引發(fā)AIGC技術討論的熱潮,其將重塑甚至顛覆數(shù)字內(nèi)容的生產(chǎn)方式和消費模式。盡管AIGC對圖書出版行業(yè)的影響至今仍未充分顯現(xiàn),但其具有的顛覆性能力和廣闊的應用前景已受到業(yè)內(nèi)密切關注。

一、AIGC的概念與發(fā)展歷程

AIGC指利用人工智能技術生成內(nèi)容的新型生產(chǎn)方式,是相對專業(yè)生成內(nèi)容(Professional Generated Content, PGC)、用戶生成內(nèi)容(User Generated Content, UGC)而提出的概念,如AI作曲、AI繪畫、AI寫作等都屬于AIGC的分支。AIGC使用的技術主要包括機器學習、自然語言處理等,通過學習大量已有的文本、音頻、圖像等數(shù)據(jù)集,進而生成新的內(nèi)容,其所生成的內(nèi)容與人類創(chuàng)作的內(nèi)容極為相似。

AIGC伴隨計算機技術和人工智能技術的發(fā)展而不斷發(fā)展完善。早在1957年,萊杰倫·希勒和倫納德·艾薩克森就通過將計算機程序中的控制變量換成音符,完成了歷史上首支由計算機創(chuàng)作的音樂作品—Illiac Suite。但早期的AIGC只能依照指定的模板或規(guī)則進行簡單的內(nèi)容制作與輸出,并不具備學習能力,也不能理解數(shù)據(jù),無法靈活地生成內(nèi)容。20世紀八九十年代,由于系統(tǒng)成本高昂、商業(yè)變現(xiàn)困難,各國政府在人工智能領域的投入不斷減少,因此AIGC未能取得重大突破。2006年,杰弗里·辛頓提出深度信念網(wǎng)絡概念,深度學習算法取得突破,加上此時計算機設備算力提升,互聯(lián)網(wǎng)數(shù)據(jù)膨脹提供海量訓練數(shù)據(jù),因此人工智能發(fā)展取得顯著進步。但此時的AIGC仍受限于算法技術,創(chuàng)作能力有限且效果不佳,未能獲得廣泛應用。2007年,世界上首本完全由人工智能創(chuàng)作的小說1 The Road問世,但其整體可讀性不強,存在拼寫錯誤、辭藻空洞、缺乏邏輯等缺點[1]。自2012年起,深度學習時代到來,卷積神經(jīng)網(wǎng)絡、變分自編碼器、生成式對抗網(wǎng)絡、強化學習、流模型、擴散模型等深度學習算法的出現(xiàn)和應用,使得人工智能的學習能力和生成能力迅速提升。2016年后,深度殘差網(wǎng)絡和Transformer大模型等深度神經(jīng)網(wǎng)絡的結(jié)構(gòu)升級,使得模型參數(shù)量從數(shù)萬升級到數(shù)千億,深度學習網(wǎng)絡層數(shù)從幾層發(fā)展到成百上千層,模型規(guī)模的量變引起能力上的質(zhì)變,高質(zhì)量的文本、優(yōu)美靈動的曲調(diào)、超高清晰度的圖片和視頻等內(nèi)容的智能生成成為現(xiàn)實。AIGC開始應用在各類場景中,其所生成的內(nèi)容五花八門,內(nèi)容效果逐漸接近人類創(chuàng)作,讓人難以分辨[1]。例如,英偉達發(fā)布的StyleGAN可以自動生成與現(xiàn)實照片非常相似的圖片;OpenAI推出的DALL-E 2可根據(jù)用戶輸入的簡短描述性文字生成風格多樣、質(zhì)量極高的繪畫;DeepMind發(fā)布的DVD-GAN可以生成在草地、廣場等明確場景下的連續(xù)視頻。

2022年11月,OpenAI推出了基于Transformer大模型的人工智能聊天機器人程序ChatGPT(Chat Generative Pre-trained Transformer,即生成型預訓練變換模型)。它是一個專注于對話生成的大型語言模型,能夠與人即時對話,并自動生成流暢、連貫的自然語言文本。ChatGPT一經(jīng)上線便引起大量關注,開放試用的短短幾天就吸引了超100萬互聯(lián)網(wǎng)用戶,推出兩個月后其月活躍用戶數(shù)過億。從回答簡單問題到寫詩、寫故事、寫程序,從語言翻譯到文本歸納總結(jié),從行業(yè)分析到撰寫商業(yè)計劃書,不論是用中文、英文還是用其他語言表達,ChatGPT幾乎無所不能。

ChatGPT采用了預訓練和微調(diào)的方式進行模型訓練[2]。在預訓練階段,模型使用大規(guī)模的未標注文本數(shù)據(jù)進行訓練,目標是學習文本序列的概率分布和詞語之間的關系。這使得模型能夠形成對人類知識和自然語言的理解和內(nèi)容生成能力。在微調(diào)階段,模型使用人類反饋強化學習(Reinforcement Learning from Human Feedback,RLHF)的方式進行訓練,即先用有標注的數(shù)據(jù)(指由人根據(jù)問題給出的高質(zhì)量答案)來微調(diào)預訓練模型,然后由模型根據(jù)問題給出多個答案,人工對答案滿意度進行打分、排序并建立獎勵模型,如此多次循環(huán)[3]。這使得模型生成的內(nèi)容更加貼合人類的認知、需求、價值觀。ChatGPT可以與其他AIGC模型聯(lián)合使用,獲得更加獨特、實用的功能。例如,我們在ChatGPT中輸入簡單文字描述,讓其生成一段詳細文字描寫,再將該段文字輸入AI繪圖軟件即可生成設計圖像。OpenAI計劃在未來的ChatGPT更新中引入多模態(tài)學習能力,即結(jié)合圖像、音頻、視頻等多種模態(tài)的數(shù)據(jù)進行學習。另外,微軟也在其New Bing中接入了ChatGPT,在一定程度上實現(xiàn)了智能搜索。這些方式都極大地提升了AIGC的實際應用能力,人工智能大規(guī)模落地未來可期。

ChatGPT再度引燃了人們對AIGC的關注熱情,其出現(xiàn)以來相關討論層出不窮。從簡單到復雜、從量變到質(zhì)變,雖然現(xiàn)今的AIGC離理想中的通用人工智能還有一定差距,但是無疑已經(jīng)邁出重要一步。隨著數(shù)據(jù)量的增加、算法的迭代升級,以及與現(xiàn)實世界交互功能的加強,多模態(tài)AIGC大模型將通過不斷的學習試錯以及自動總結(jié)客觀規(guī)律,幫助人類創(chuàng)造更美好的生活。

二、AIGC在圖書出版中的應用探討

在圖書出版領域,雖然各出版機構(gòu)對人工智能技術的應用情況和應用程度并不一致,但數(shù)字化、智能化是大勢所趨已成為出版界的共識。隨著ChatGPT的推出,AIGC技術的快速發(fā)展會給圖書出版帶來什么改變也在行業(yè)內(nèi)引發(fā)討論。目前,學界和業(yè)界已對人工智能在圖書出版中的應用進行了研究和探討,與人工智能相比,AIGC在數(shù)據(jù)挖掘、機器學習、自然語言處理等技術的基礎上,更注重應用場景的特定性,能通過針對特定領域的深入學習和優(yōu)化,實現(xiàn)更高效、更準確的數(shù)據(jù)分析、決策支持和智能服務。

(一)在圖書選題策劃中的應用

在圖書選題策劃環(huán)節(jié),AIGC技術可以幫助出版社和編輯有針對性地對市場需求進行分析和預測,以更好地把握市場趨勢和讀者閱讀需求,為圖書選題策劃提供參考。第一,編輯可通過AIGC技術分析社交媒體、搜索引擎、圖書評論、圖書銷售數(shù)據(jù)等大數(shù)據(jù),快速發(fā)現(xiàn)當前熱門的圖書話題,獲取有關某一類圖書的需求量、市場容量、競爭情況等信息,并自動生成文本、圖表等可視化內(nèi)容以供參考。第二,出版社可以利用AIGC技術分析和預測讀者的特征和偏好,包括年齡、性別、教育水平、興趣愛好等,自動生成讀者畫像,從而確定圖書的目標讀者。第三,出版社和編輯可以通過自然語言處理技術,對歷史圖書的內(nèi)容進行分析和比較,挖掘出與當前市場需求相符的主題和話題。第四,出版社可以利用AIGC技術比較同類圖書的市場表現(xiàn)和銷售情況,如銷售額、評價指數(shù)等,生成同類圖書的優(yōu)缺點分析報告,以便更好地制訂圖書營銷策略。第五,AIGC可以通過對大量的文本數(shù)據(jù)進行學習和分析,自動生成潛在的主題和創(chuàng)意,作者和編輯可據(jù)此拓展思路,增強圖書選題的創(chuàng)意性和多樣性。

(二)在圖書組稿和內(nèi)容創(chuàng)作中的應用

在圖書組稿環(huán)節(jié),出版社和編輯可以利用AIGC技術來尋找合適的作者,如分析讀者的購買歷史和購買偏好,利用推薦算法為其推薦適合的作者;通過聯(lián)網(wǎng)直接搜索潛在作者的背景信息,包括教育背景、工作經(jīng)歷、專業(yè)領域等,自動生成其背景調(diào)查報告;挖掘社交媒體、博客、網(wǎng)站等平臺上的信息,分析潛在作者的知名度、影響力和粉絲數(shù)量等,以評估作者的潛在市場價值;分析潛在作者的寫作風格、主題偏好、寫作文筆等,以了解作者的文學風格和寫作特點;等等。AIGC可通過自然語言生成模型對大量文本進行學習和分析,自動生成圖書內(nèi)容的各個組成部分,包括章節(jié)、段落、句子等,或者為圖書的內(nèi)容創(chuàng)作提供靈感和素材[4]。通過AIGC的自動化生成,圖書的內(nèi)容創(chuàng)作可以更加高效,從而縮減圖書出版周期,降低出版成本。同時,AIGC也可以在一定程度上增強圖書內(nèi)容的創(chuàng)新性和個性化,使讀者更容易接受。此外,AIGC還可以在圖書創(chuàng)作過程中提供實時的語言糾錯和寫作風格建議,幫助作者減少寫作錯誤和提高文本質(zhì)量。

(三)在圖書編輯加工和審校中的應用

編輯加工和審校是圖書出版過程中的重要環(huán)節(jié),需要耗費大量的時間和人力。一些自動化工具,如黑馬校對軟件、方正智能輔助審校系統(tǒng)等已經(jīng)應用于字詞、標點、敏感詞、知識、格式、邏輯等方面的輔助審校[5],在一定程度上提高了圖書編輯加工和審校的工作效率和編校質(zhì)量。AIGC的發(fā)展大大提高了人工智能的語義分析和上下文聯(lián)系能力,知識庫構(gòu)建更完善、能夠與互聯(lián)網(wǎng)實時連接的AICG將能夠做到智能判斷各類知識點的正誤或存疑情況,其將在深層語法、語義邏輯等方面為編校人員提供更有益的參考。另外,AIGC能有效識別符號公式和插圖表格等,以及有效處理大小寫、正斜體、角標等格式規(guī)范問題,這可幫助編輯高效完成理工科類專業(yè)書籍或中小學理科教輔圖書的編校加工。

(四)在圖書美術設計中的應用

圖書的美術設計是吸引讀者注意的重要因素之一,AI繪圖工具比ChatGPT更早引起大眾關注,目前已有不少此類AIGC工具。例如,谷歌的AutoDraw可以根據(jù)用戶的手繪圖形自動識別并替換成更美觀的圖形。另外,還有Midjourney、Stable Diffusion、DALL-E 2、NovelAI等工具,能夠根據(jù)用戶的簡單文字描述自動生成或真實或具有想象力的圖片。此外,AIGC可通過對大量已出版的圖書封面和插圖進行學習和分析,自動識別各種元素之間的關系,如顏色、形狀、文字、圖片等,進而分析市場需求和讀者偏好,生成更具吸引力的圖書封面和插圖。

(五)在圖書營銷中的應用

在數(shù)字化出版時代,圖書營銷渠道和方式的多樣化給了出版社更多的選擇,而出版社應用AIGC可以進行精準營銷,提高營銷效率和銷售量。首先,AIGC可用于預測潛在讀者的閱讀喜好和閱讀興趣,從而增強圖書的推廣效果。例如,出版社可以通過AIGC分析社交媒體平臺上讀者的閱讀興趣和行為,以便更好地了解讀者的喜好和需求,并根據(jù)這些信息制訂相應的營銷策略。其次,AIGC還可用于圖書的個性化推薦。在數(shù)字化出版時代,越來越多的讀者選擇在線閱讀和購買電子書。通過對讀者的閱讀歷史和行為進行分析,AIGC可以為讀者推薦符合他們閱讀興趣和需求的圖書,從而提高圖書的銷售量。最后,AIGC還可用于制作圖書廣告和宣傳素材。通過對圖書內(nèi)容和讀者需求的分析,AIGC可以自動生成相關的營銷文案、海報、宣傳冊等內(nèi)容,助力出版社高效開展圖書營銷。

盡管AIGC可以分析數(shù)據(jù)、歸納總結(jié)信息,也可以模仿人類創(chuàng)作,生成各類文章、圖像、報表等,但其也存在一些不足。例如,AIGC主要依靠對已有數(shù)據(jù)的學習和模仿,難以創(chuàng)造出真正意義上的原創(chuàng)內(nèi)容,缺乏真正的創(chuàng)造性。第一,由于模型訓練數(shù)據(jù)存在局限性和片面性,AIGC在生成內(nèi)容時難以完全考慮文化差異和情感因素等,導致其在生成某些類型的內(nèi)容時可能失之偏頗[6]。第二, 一些專業(yè)領域的問題需要更深入的領域?qū)I(yè)知識和經(jīng)驗以及更復雜的推理演算,而AIGC難以學習和模仿這些知識和經(jīng)驗,使得其處理復雜問題可能出現(xiàn)困難。第三,AIGC生成的內(nèi)容可能缺乏人類審美和主觀判斷的因素,難以滿足讀者的需求和興趣。第四,語言文字有時存在歧義和多義,AIGC在處理這些問題時可能出現(xiàn)偏差,導致生成的內(nèi)容不準確或不恰當。因此,從這些不足來看,AIGC應用于圖書出版離不開使用者的審核把關,在分析、決策、生成方面AIGC仍應扮演工具性的協(xié)助角色,以更好地發(fā)揮人工智能和人類雙方的優(yōu)勢。人機協(xié)同模式仍是未來相當長時間內(nèi)的主流[7]。

三、AIGC應用于圖書出版可能涉及的問題

AIGC應用于圖書出版可能涉及的問題主要有隱私保護、知識產(chǎn)權保護、算法歧視、信息準確度以及透明度。第一,出版社應用AIGC需要訪問和處理大量的用戶數(shù)據(jù)和個人信息,這就涉及隱私保護的問題,如果未經(jīng)充分授權和明確告知,用戶的個人數(shù)據(jù)和隱私信息則可能被泄露或濫用。第二,AIGC應用于圖書出版可能會涉及知識產(chǎn)權的保護問題,如在數(shù)據(jù)挖掘階段存在合理使用風險,在內(nèi)容生成階段存在可版權性和版權歸屬風險,在內(nèi)容生成后的使用階段存在流轉(zhuǎn)風險與侵權風險[8]。第三,由于AIGC的學習和決策是基于數(shù)據(jù)的,如果數(shù)據(jù)本身存在偏差,算法也可能出現(xiàn)歧視,如出現(xiàn)價格歧視、性別歧視等,從而影響信息推薦和決策結(jié)果。第四,AIGC的訓練數(shù)據(jù)庫過于龐大,且多來自互聯(lián)網(wǎng),其中存在許多錯誤信息,因此其所生成的內(nèi)容并不能保證準確無誤,如果公眾長期使用AIGC來獲取信息而不加以仔細甄別,就容易導致錯誤信息傳播更泛濫。第五,由于算法透明度較低,其運行規(guī)律和因果邏輯難以解釋,一旦出錯則難以糾偏除誤,且訓練數(shù)據(jù)庫過于龐大、參數(shù)過于復雜,也難以審核其訓練原材料的公允性等因素,因此出版社應用AIGC進行的分析、決策可能不夠客觀和公正。

為了規(guī)范和管理AIGC的應用,保障知識產(chǎn)權和用戶權益,未來關于AIGC的一些措施有待研究與施行。例如,相關部門可制定相關的法律法規(guī),明確AIGC在圖書出版中的應用范圍和限制條件,加強知識產(chǎn)權保護,防止AIGC在圖書出版中的應用侵犯知識產(chǎn)權。出版社可建立健全監(jiān)管和審查機制,對AIGC的應用進行審查和監(jiān)督,防止不當使用和濫用。業(yè)界應加強人工智能行業(yè)自律自治,強化“倫理先行”意識,制訂行業(yè)公約、標準、指南等,打造AIGC健康發(fā)展生態(tài)。社會層面要加強知識普及,提高公眾對AIGC的認識和理解,促進公眾對AIGC的應用與影響的理性思考和討論。

[參考文獻]

[1]中國信息通信研究院,京東探索研究院.人工智能生成內(nèi)容(AIGC)白皮書(2022年)[EB/OL].(2022-09-02)[2023-02-28].http://www.caict.ac.cn/sytj/202209/P020220913580752910299.pdf.

[2]OpenAI.IntroducingChatGPT[EB/OL].(2022-11-30)[2023-02-28].https://openai.com/blog/chatgpt.

[3]陳巍談芯.ChatGPT發(fā)展歷程、原理、技術架構(gòu)詳解和產(chǎn)業(yè)未來(收錄于GPT-4/ChatGPT技術與產(chǎn)業(yè)分析)[EB/OL].(2023-02-27)[2023-02-28].https://zhuanlan.zhihu.com/p/590655677.

[4]王俊美.ChatGPT寫作:出版界怎么看[EB/OL].(2023-02-24)[2023-02-28].http://cssn.cn/skgz/202302/t20230224_5598227.shtml.

[5]宋萃薇.人工智能在圖書出版的應用與編輯的轉(zhuǎn)型[J].采寫編,2023(01):134-136.

[6]王羽佳.AI與出版融合視角下圖書選題策劃與內(nèi)容生產(chǎn)的優(yōu)化路徑[J].出版科學,2023(01):44-49.

[7]胡嘉思.人工智能在出版行業(yè)融合傳播及運營模式中的應用與展望[J].科技與出版,2023(01):79-82.

[8]叢立先,李泳霖.聊天機器人生成內(nèi)容的版權風險及其治理:以ChatGPT的應用場景為視角[J/OL].中國出版:1-6[2023-02-28].http://kns.cnki.net/kcms/detail/11.2807.G2.20230221.1908.002.html.

[作者簡介]王峻峰(1991—),男,重慶人,新世界出版社教育編輯部副主任。

猜你喜歡
出版圖書
無障礙圖書聯(lián)盟
圖書推薦
歡迎來到圖書借閱角
班里有個圖書角
圖書推介
接龍小說“出版”,開學大家嗨起來!
眾籌出版是一種出版創(chuàng)新
民國時期老課本出版略探
瑪麗·安·伊萬斯小說在中國的出版與接受
從西方青年學者與翻譯家看中國出版“走出去”
临夏县| 汉阴县| 绩溪县| 临海市| 达拉特旗| 江都市| 安龙县| 枣强县| 阿克苏市| 垫江县| 军事| 抚顺县| 扬州市| 新沂市| 肇东市| 德化县| 尉氏县| 峨眉山市| 马公市| 安新县| 咸阳市| 浠水县| 广饶县| 彰武县| 元江| 通江县| 双流县| 桦川县| 镇远县| 巨野县| 石景山区| 湘潭市| 琼中| 鹤山市| 高清| 祁门县| 呈贡县| 芷江| 花莲市| 通辽市| 安达市|