国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

出版業(yè)人工智能大語言模型應(yīng)用管窺

2024-03-09 10:32:10秦艷華李一凡閆玲玲符家寧侯玉麗
中國傳媒科技 2024年1期
關(guān)鍵詞:出版業(yè)人工智能語言

秦艷華 李一凡 閆玲玲 符家寧 侯玉麗

摘要:【目的】探討人工智能大語言模型在出版業(yè)的應(yīng)用現(xiàn)狀和未來發(fā)展趨勢。【方法】通過搜集整理現(xiàn)有數(shù)據(jù)和資料,歸納分析大語言模型在出版業(yè)的具體應(yīng)用案例,分析應(yīng)用中隱藏的問題,并提出針對性解決策略?!窘Y(jié)果】研究發(fā)現(xiàn),大語言模型在出版業(yè)的應(yīng)用,既為出版業(yè)發(fā)展帶來了重大機遇,也可能導(dǎo)致“技術(shù)異化”的諸多問題?!窘Y(jié)論】大語言模型在出版業(yè)的應(yīng)用,從通用型轉(zhuǎn)向?qū)S没?、場景化,從高門檻轉(zhuǎn)向簡易化、輕量化,從數(shù)據(jù)分散轉(zhuǎn)向數(shù)據(jù)協(xié)同,將成為趨勢,出版業(yè)需要以更加開放包容的心態(tài)積極擁抱新技術(shù)。

關(guān)鍵詞:出版;人工智能;大語言模型;ChatGPT? ? ? ? ? ? ? 中圖分類號:G220? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A

文章編號:1671-0134(2024)01-034-07? ? ? ? ?DOI:10.19483/j.cnki.11-4653/n.2024.01.005

本文著錄格式:秦艷華,李一凡,閆玲玲,符家寧,侯玉麗.出版業(yè)人工智能大語言模型應(yīng)用管窺[J].中國傳媒科技,2024,31(1):34-40.

2022年11月30日,美國人工智能研究實驗室Open AI向全世界公開發(fā)布了ChatGPT。這是一款由人工智能技術(shù)驅(qū)動的自然語言處理工具,它實現(xiàn)了機器學(xué)習(xí)算法發(fā)展中自然語言處理領(lǐng)域的歷史性跨越。這一人工智能大語言模型可分析海量的數(shù)據(jù),基于特定輸入?yún)?shù)生成原創(chuàng)內(nèi)容且極其類似于人類創(chuàng)作的文本。大語言模型作為當(dāng)今人工智能技術(shù)的最新成果,給出版這一內(nèi)容產(chǎn)業(yè)帶來了深遠(yuǎn)影響和巨大沖擊。對大語言模型在出版業(yè)的應(yīng)用現(xiàn)狀進(jìn)行分析,探討這一技術(shù)為出版業(yè)發(fā)展帶來的重大機遇與挑戰(zhàn),提出積極應(yīng)對之策,并展望其未來前景,對于推動出版業(yè)數(shù)字化轉(zhuǎn)型升級、實現(xiàn)出版深度融合發(fā)展,具有重要的現(xiàn)實意義,也具有長遠(yuǎn)的戰(zhàn)略意義。

1.出版業(yè)大語言模型的應(yīng)用

2023年4月底,世界報業(yè)和新聞出版協(xié)會(WAN-IFRA)與施??死眨⊿chickler)咨詢公司聯(lián)手,針對全球100多位新聞媒體人進(jìn)行調(diào)研,評估新聞媒體使用大語言模型的情況。[1]調(diào)查顯示,截至2023年5月,約有一半的出版企業(yè)正在積極使用ChatGPT或類似工具,70%的人預(yù)計這些工具將對記者有極大幫助。目前,國內(nèi)外出版企業(yè)及與出版企業(yè)相關(guān)的科技公司正在積極探索使用大語言模型為出版業(yè)務(wù)賦能。

1.1? ?國外出版業(yè)大語言模型的應(yīng)用

1.1.1? ?科企研發(fā)

國外已開發(fā)的大語言模型不在少數(shù),目前在出版業(yè)使用較為廣泛的大語言模型如表1所示。

國外的一些大型出版企業(yè)紛紛加入到大語言模型開發(fā)、應(yīng)用行列,如美國霍頓·米夫林出版公司(Houghton Mifflin Harcourt)在其寫作練習(xí)和評估解決方案Writable中,集成OpenAI公司的生成式人工智能能力,為用戶提供了更個性化的寫作指導(dǎo)和評估;英國麥克米倫教育出版公司(Macmillan Learning)宣布與Packback公司達(dá)成合作,把人工智能能力與課程材料相結(jié)合;德國斯普林格自然出版公司(Springer Nature)在2023年夏收購了美國的人工智能平臺protocols.io,此后,又收購了荷蘭的人工智能創(chuàng)新公司Slimmer AI等。

1.1.2? ?行業(yè)應(yīng)用

在國外,ChatGPT參與圖書生產(chǎn),可以嵌入到內(nèi)容生成、選題策劃、創(chuàng)作編輯、插圖設(shè)計、有聲制作、圖書營銷等環(huán)節(jié)中。

內(nèi)容生成:截至2023年12月21日,在亞馬遜官網(wǎng)以“高級檢索”方式,檢索署名作者為“ChatGPT”的書籍,已有1051本,以“AI”為作者的書籍則更多。以ChatGPT為作者的書籍,主要有自我描摹類工具書,如《ChatGPT入門教程》等、故事小說、基礎(chǔ)教材等?!皻W洲刑警組織(Europol)”的一份報告預(yù)測,到2026年,互聯(lián)網(wǎng)上多達(dá)90%的內(nèi)容可能是由AI創(chuàng)建或編輯的。[2]這意味著AI將深刻影響出版的內(nèi)容生產(chǎn)。

選題策劃:大語言模型在選題策劃中的參與,是通過持續(xù)性對話,激發(fā)作者靈感,進(jìn)而協(xié)助圖書創(chuàng)作。以ChatGPT為代表的大語言模型為作者提供全面細(xì)致的選題素材,使作者節(jié)省大量案頭工作時間。亞馬遜kindle平臺上架了大量ChatGPT參與編著的書籍,其中不少書籍的選題策劃是由ChatGPT單獨完成的。選題策劃—文本創(chuàng)作—全文校對—編輯出版的全過程,傳統(tǒng)書籍或要歷時一年以上,但是ChatGPT將這一過程簡化,壓縮了生產(chǎn)時間,實現(xiàn)了快速上線。不過,需要指出的是,這樣的快速生產(chǎn),是以犧牲倫理與美學(xué)為代價的。大語言模型的技術(shù)邏輯不可避免地對圖書版權(quán)和藝術(shù)倫理造成威脅,對話式的交流也容易造成對人類思想與文化創(chuàng)造的隱形竊取。

編輯加工:Google團(tuán)隊在2023年2月發(fā)布的大語言模型LaMDA驅(qū)動的Bard,可以使用較少的計算能力,使其擴展到更多的人并提供反饋。Google首席執(zhí)行官Sundar Pichai在接受《紐約時報》播客采訪時表示,升級版的Bard基于更為強大的模型,在編程能力與邏輯推理能力上有進(jìn)一步的提升,并在數(shù)學(xué)運算上有一定突破。緊隨其后,Anthropic在3月發(fā)布類似ChatGPT的產(chǎn)品Claude,7月升級后的Claude 2的處理能力已經(jīng)提升到了100K個Token,這意味著它可以處理數(shù)百頁的技術(shù)文檔,甚至是整本書。

插圖設(shè)計:根據(jù)內(nèi)容進(jìn)行形象創(chuàng)作,設(shè)計圖書封面與插圖,常用的大語言模型有Midjourney AI、Adobe Firefly等。大語言模型對于插圖的創(chuàng)作,可以是具象的也可以是抽象的。Alice and Sparkle是作者阿瑪爾·雷希(Ammaar Reshi)使用ChatGPT、MidJourney等人工智能工具創(chuàng)作的一本兒童繪本。該書以AI工具繪圖被世界各地的媒體廣泛報道,但同時也引發(fā)了大量負(fù)面評論,一些讀者指出書中圖文不符的情況并不少見。

多語種有聲讀物制作:微軟公司在2023年3月18日發(fā)布了一款人工智能工具——VALL.E,它經(jīng)過了60 000小時英語語音數(shù)據(jù)的訓(xùn)練,只需3秒的音頻樣本,就可以模仿人的語音輸出。2023年6月,Meta公司聲稱研制出“迄今功能最強大的語音生成式人工智能Voicebox”,該工具使用了“流匹配”方法,其表現(xiàn)優(yōu)于當(dāng)前最先進(jìn)生成式語音系統(tǒng)使用的擴散模型。據(jù)悉,Voicebox能說6種語言:英語、法語、西班牙語、德語、波蘭語和葡萄牙語。[3]

營銷服務(wù):在圖書營銷方面,大語言模型可以更好地為讀者提供精準(zhǔn)服務(wù)。如英國的shimmr公司推出的Shimmr.AI突破了傳統(tǒng)的推薦算法,利用Trajectory推薦系統(tǒng)來使圖書內(nèi)容與讀者閱讀偏好雙向匹配,通過自動化流程將內(nèi)容和最合適的讀者之間聯(lián)系起來,強調(diào)“書發(fā)現(xiàn)讀者”的反向可發(fā)現(xiàn)性。[4]

1.2? ?國內(nèi)出版業(yè)大語言模型的應(yīng)用

1.2.1? ?科企研發(fā)

目前國內(nèi)眾多單位和企業(yè)都研發(fā)了符合自身發(fā)展目標(biāo)的大語言模型,包括通用、工業(yè)、科研、商業(yè)等多個類型。截至2023年12月21日,據(jù)不完全統(tǒng)計,我國共有189個單位研發(fā)出202個大語言模型,針對出版業(yè)應(yīng)用的、具有代表性的大語言模型主要有如下幾種(表2)。

就出版企業(yè)來看,有的引入了科技企業(yè)研發(fā)的通用大語言模型,有的則自主研發(fā)適用于出版業(yè)的專業(yè)大語言模型。前者如上海報業(yè)集團(tuán)旗下澎湃新聞成為百度“文心一言”的首批體驗官,力圖打造內(nèi)容生態(tài)人工智能全系產(chǎn)品及服務(wù);蘇州新聞出版集團(tuán)旗下新聞客戶端“引力播”也接入“文心一言”大語言模型,期望以此賦能出版流程、模式、內(nèi)容等眾多方面的創(chuàng)新;后者如蜜度公司發(fā)布的“蜜度文修”智能校對模型、中文在線集團(tuán)推出的“中文逍遙”內(nèi)容創(chuàng)作大語言模型等,在出版的不同環(huán)節(jié)促進(jìn)了業(yè)務(wù)創(chuàng)新。

1.2.2? ?學(xué)界探磧

近年來,學(xué)術(shù)領(lǐng)域?qū)Τ霭鏄I(yè)和大語言模型的耦合展開了豐富研究,通過在中國知網(wǎng)中輸入“人工智能”“出版”兩個關(guān)鍵詞,在2023年11月22日抓取2004~2023年間的相關(guān)文獻(xiàn),并將關(guān)鍵詞進(jìn)行聚類分析后,整理出結(jié)果如圖1所示。以“人工智能”“數(shù)字出版”“智能出版”為主題的文獻(xiàn)大量出現(xiàn),表明出版界、學(xué)術(shù)界對于人工智能技術(shù)在出版業(yè)應(yīng)用的重視。

隨著人工智能技術(shù)的不斷成熟以及出版業(yè)發(fā)展戰(zhàn)略、發(fā)展模式的持續(xù)更新,“智能出版”這個概念應(yīng)運而生。有學(xué)者認(rèn)為智能出版是以智能化的數(shù)字技術(shù)將作品編輯加工后,經(jīng)過復(fù)制進(jìn)行傳播的新型出版[5]。智能出版是強調(diào)數(shù)字智能技術(shù)并以此為依托作用于出版的整個流程,為內(nèi)部生產(chǎn)與外部使用提供定制化、自動化、智能化服務(wù)的出版新方向,是一個隨著技術(shù)的革新不斷擴充和發(fā)展的概念。

1.2.3? ?行業(yè)應(yīng)用

目前國內(nèi)出版業(yè)對人工智能大語言模型的應(yīng)用持慎重而樂觀的態(tài)度,雖然還未將大語言模型完全應(yīng)用于圖書出版全流程,但在部分圖書出版環(huán)節(jié),比如輔助內(nèi)容生產(chǎn)、編輯校對、發(fā)行營銷等方面已有大語言模型應(yīng)用的探索和實踐。

內(nèi)容生成:大語言模型通過大量語言樣本加上人工標(biāo)注的數(shù)據(jù)來訓(xùn)練,具有極強的文本生成創(chuàng)作能力,目前主要包括視覺產(chǎn)品創(chuàng)作和聽覺產(chǎn)品創(chuàng)作。2023年3月,華齡出版社出版了由人工智能大語言模型生成的圖書《ChatGPT:AI革命》。

專攻于聽覺方面的大語言模型,也是近年來一個創(chuàng)新性較強的領(lǐng)域,SALMONN就是大語言模型中一個典型的聽覺模型,它是清華大學(xué)聯(lián)合字節(jié)跳動解鎖通用聽覺人工智能的大語言模型,具有強大的技術(shù)功能和廣泛的應(yīng)用范圍,在輸入層面,能夠感知和理解各種類型的音頻內(nèi)容輸入,包括多語言語音識別和翻譯以及語音推理等功能;在輸出層面,能夠勝任英語語音識別、英語到中文的語音翻譯、情感識別、音頻字幕生成、音樂描述等重要的語音和音頻任務(wù),同時可以進(jìn)行基于音頻的故事生成、音頻問答、語音和音頻聯(lián)合推理等任務(wù)。

在喜馬拉雅的TTS(語音合成)技術(shù)支持下,2023年第一季度,喜馬拉雅AIGC專輯數(shù)同比增長354%,是2021年前總量的近3倍。全年,AIGC內(nèi)容用戶播放時長同比增長207%。

編輯校對:當(dāng)前,大語言模型在一定程度上可以替代人類編輯的部分功能,比如可以檢查語法、提供內(nèi)容摘要、創(chuàng)建通知、為新聞通訊或社交媒體平臺量身定制,并將書面內(nèi)容轉(zhuǎn)換為播客或視頻的腳本。尤其是在校對方面,大語言模型得到了較為完善的發(fā)展。例如2023年星圖比特與果麥文化聯(lián)合推出AI校審產(chǎn)品,提供對文章錯字、語法錯誤、敏感詞錯誤、網(wǎng)絡(luò)熱詞等進(jìn)行審校排查和分析的相關(guān)場景和服務(wù),結(jié)合“多審多?!惫δ苋轿惶嵘谋举|(zhì)量,降低差錯率。

營銷服務(wù):除了內(nèi)容生成、編輯校對環(huán)節(jié)外,大語言模型在直達(dá)用戶的營銷服務(wù)方面也取得了一些成就。通過大語言模型原理可全面認(rèn)識和深入學(xué)習(xí)圖書,向讀者進(jìn)行既權(quán)威全面、又有差異性和針對性的個性化推薦。讀者既可以快速得到一本書的簡介,也可以通過輸入特定要求獲取推薦的書目,從而縮短讀者觸達(dá)圖書的路徑,具有極大的應(yīng)用前景。AI大語言模型允許媒體組織為特定讀者群體定制內(nèi)容,可以顯著降低出版商的運營成本,簡化重復(fù)性手動任務(wù),減輕員工工作量。

雙向賦能:目前雖然大語言模型對出版行業(yè)發(fā)揮了較強的創(chuàng)新變革功能,但出版行業(yè)也反過來完善了大語言模型訓(xùn)練本身。出版行業(yè)有大量權(quán)威的文本信息和語料,可以為通用大語言模型訓(xùn)練提供高質(zhì)量的數(shù)據(jù)集。出版文本庫已經(jīng)成為眾多大語言模型自研單位訓(xùn)練“養(yǎng)料”的可靠來源之一,數(shù)量、質(zhì)量都有較高的保障。

2.新機遇:出版業(yè)大語言模型應(yīng)用引發(fā)產(chǎn)業(yè)變革

當(dāng)前,在我國,隨著大數(shù)據(jù)、人工智能等技術(shù)的不斷發(fā)展,出版業(yè)將更加深入地應(yīng)用這些技術(shù)以提高出版效率和質(zhì)量,同時拓展出版物的傳播渠道和消費群體。大語言模型引發(fā)出版產(chǎn)業(yè)變革,對于促進(jìn)出版深度融合發(fā)展具有引領(lǐng)和推動作用。

2.1? ?政策環(huán)境優(yōu)化

在“十二五”到“十四五”規(guī)劃期間,國家從宏觀層面對人工智能新技術(shù)和新產(chǎn)業(yè)給予了巨大支持。頂層設(shè)計從方向性引導(dǎo)轉(zhuǎn)變?yōu)閺娬{(diào)實際應(yīng)用和場景創(chuàng)新,并進(jìn)一步細(xì)化和深化。2016年起,人工智能作為熱門領(lǐng)域吸引了眾多企業(yè)布局。2017年國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,將人工智能提升至國家戰(zhàn)略層面的高度,指出到2025年人工智能基礎(chǔ)理論實現(xiàn)重大突破,到2030年我國人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。此后,在2021年《中華人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》、2022年《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場景的通知》等系列文件中,進(jìn)一步強調(diào)并支持人工智能在多行業(yè)、多領(lǐng)域的應(yīng)用發(fā)展。國家高度重視人工智能產(chǎn)業(yè)的安全可信和倫理秩序,強調(diào)規(guī)范科技倫理,趨利避害。2023年4月,面對ChatGPT類大語言模型的火熱出圈,國家互聯(lián)網(wǎng)信息辦公室及時出臺《大語言模型服務(wù)管理辦法(征求意見稿)》,進(jìn)一步促進(jìn)大語言模型的規(guī)范應(yīng)用和產(chǎn)業(yè)整體的高質(zhì)量發(fā)展。

新時代、新技術(shù)催生了新的出版生態(tài)。在出版業(yè),技術(shù)已經(jīng)滲透到出版全環(huán)節(jié)、全流程并且越來越發(fā)揮著重要作用,政策和規(guī)范條例紛紛出臺為出版產(chǎn)業(yè)善用技術(shù)提供了制度保障和方向指引。2022年4月,中宣部印發(fā)《關(guān)于推動出版深度融合發(fā)展的實施意見》中明確提出“加強前沿技術(shù)的探索應(yīng)用”“強化大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等技術(shù)應(yīng)用,創(chuàng)新驅(qū)動出版深度融合發(fā)展”。從對新型出版?zhèn)鞑ンw系的要求可以看出,我國融合出版要形成深度化、體系化、整體化的規(guī)模發(fā)展,就必須嵌入新媒介技術(shù)環(huán)境,以適應(yīng)國家發(fā)展需要和時代變革需求。無論是宏觀層面的規(guī)劃指導(dǎo)還是出版細(xì)分領(lǐng)域的實施意見,我國在社會層面營造了良好的政策環(huán)境,助力人工智能市場及在出版業(yè)應(yīng)用的健康發(fā)展。

2.2? ?催生出版新需求

在圖書編輯活動中運用AI技術(shù)已不鮮見,AI能夠高效完成圖書內(nèi)容的加工整理、圖片識別、輸出格式轉(zhuǎn)換、智能翻譯、內(nèi)容查重和語音交互等任務(wù)。[6]目前,大語言模型已經(jīng)嘗試運用于出版各流程中,大語言模型的突出能力與編輯日常工作緊密貼合,可以有效幫助編輯提高工作效率,提升編輯生產(chǎn)力,不僅能夠成為選題策劃的輔助手段,為編輯把握用戶需求、發(fā)掘適宜作者等提供更為準(zhǔn)確的參考,而且可以成為書稿審校的得力助手,還可以成為提升翻譯質(zhì)效的寶貴工具,產(chǎn)生比傳統(tǒng)機器翻譯更自然、準(zhǔn)確的回應(yīng)和比譯者更高的效率,有效幫助圖書編輯將外語圖書迅速轉(zhuǎn)換為本土語言出版。

大語言模型為出版業(yè)跨模態(tài)生產(chǎn)提供了進(jìn)一步的可能,有望提升出版產(chǎn)品創(chuàng)新力。在日常生活中,視覺和語言是最常見且重要的兩種模態(tài)。然而,大語言模型若只能生成單一模態(tài)的內(nèi)容,將使應(yīng)用場景極為有限,不足以推動內(nèi)容生成方式的革新。大語言模型產(chǎn)業(yè)生態(tài)當(dāng)前已經(jīng)在文本、音頻、視頻等多模態(tài)交互功能上持續(xù)演化升級,奠定了多場景的商用基礎(chǔ)。多款大語言模型具備了跨模態(tài)、跨語言的深度語義理解與生成能力,為出版業(yè)提供了更多的可能性。在大語言模型生成文本的基礎(chǔ)上,跨模態(tài)生成技術(shù)有望進(jìn)一步幫助出版方迅速打造以紙質(zhì)圖書為主、融合一種乃至多種媒體形式和技術(shù)形成的融媒圖書,增強圖書的趣味性和讀者沉浸感,真正實現(xiàn)出版的深度數(shù)字化轉(zhuǎn)型。

2.3? ?賦能營銷推廣

首先,大語言模型可充當(dāng)引流工具。大語言模型在國內(nèi)外已經(jīng)收割了相當(dāng)規(guī)模的流量,收獲了一定的關(guān)注熱度。其問答和多輪對話形式激發(fā)了大眾的熱情和創(chuàng)造力,許多網(wǎng)友嘗試使用ChatGPT并發(fā)文分享使用體驗,刷屏社交平臺。出版商可以將大語言模型技術(shù)整合融入自身產(chǎn)品中,提升用戶滿意度,還能夠?qū)⑵渥鳛橐鞴ぞ?,為用戶開辟大語言模型新的使用入口,增加自身品牌、產(chǎn)品的吸引力和曝光度。

其次,大語言模型可優(yōu)化營銷方案。大語言模型能夠利用其海量級的數(shù)據(jù)訓(xùn)練成果,預(yù)測出版商擬定的營銷方式將產(chǎn)生的實際效果,幫助出版商以低成本獲得營銷方案的最優(yōu)解,實現(xiàn)精準(zhǔn)有效的營銷。此外,出版商還可以通過輸入聚焦特定用戶的營銷與推廣的需求,借助大語言模型生成個性推廣文案,提高自身關(guān)注度。

最后,大語言模型可提升出版物的可發(fā)現(xiàn)性。大語言模型具備強大的問答服務(wù)與文本分析能力,通過分析提取出圖書文本的內(nèi)容關(guān)鍵詞等“DNA”,可以幫助出版商實現(xiàn)搜索引擎優(yōu)化(SEO),提升圖書搜索與讀者需求之間的適配度,從而增加讀者在網(wǎng)絡(luò)上發(fā)現(xiàn)該出版物的可能。這大大減輕了圖書營銷人員的推廣壓力,使他們能夠為長尾效應(yīng)中的作者與作品負(fù)責(zé),而非只專注于那些頭部熱門書籍,從而保持良好的出版發(fā)展生態(tài)。

2.4? ?提高媒介人性化

補償性媒介(Remedial Medium)是由保羅·萊文森提出的,認(rèn)為每一種媒介都是對前一種媒介的革新,這種革新都補償了其原先的不足。[7]媒介演化的歷史就是媒介補償?shù)臍v史。人工智能大語言模型以高精度、高流暢的文本響應(yīng)模擬了從“人—機”到“人—人”的對話情景,體現(xiàn)出媒介發(fā)展“以人為本”的底層邏輯,充當(dāng)了補償媒介的角色,主要體現(xiàn)在兩方面:一方面,提供情感需求補償。[8]例如,將大語言模型應(yīng)用于出版社的客服溝通環(huán)節(jié),可對讀者提問輸出內(nèi)容的語氣、情感進(jìn)行檢測,并以與人類高度相似的知識理解水平與語言表達(dá)反饋,增加交流感與信任感,可以給予讀者情感和心理層面的補償;另一方面,提供精細(xì)化信息分發(fā)補償。傳統(tǒng)的算法分發(fā)機制通過機器抓取用戶數(shù)據(jù)后描繪用戶畫像,進(jìn)而提供個性化內(nèi)容,但這種機制更多是針對某一類用戶進(jìn)行內(nèi)容分發(fā),而大語言模型則是以單個用戶為核心,在與特定讀者的交流過程中不斷學(xué)習(xí),提供更智能化的語義識別使其能夠提供精準(zhǔn)且流暢的回答,滿足讀者的使用需求與期望,增加讀者黏性。通過分析讀者閱讀習(xí)慣、閱讀要求等對圖書內(nèi)容進(jìn)行個性化解析,大語言模型可以幫助讀者理解龐大、復(fù)雜的文本結(jié)構(gòu),提高閱讀效率。

3.新挑戰(zhàn):出版業(yè)應(yīng)用大語言模型面臨的問題與對策

出版業(yè)大語言模型應(yīng)用展現(xiàn)出機遇與挑戰(zhàn)并存的態(tài)勢。大語言模型在圖書出版業(yè)的應(yīng)用已經(jīng)呈現(xiàn)出一些亟須解決的問題,需引起警惕與深思。

3.1? ?出版業(yè)應(yīng)用大語言模型存在的問題

在創(chuàng)作層面,創(chuàng)作者過分依賴技術(shù)可能帶來“異化”。“異化”的本意為疏遠(yuǎn)、脫離、轉(zhuǎn)讓、向他者轉(zhuǎn)化等,在一般意義上,異化是指人的活動及其產(chǎn)物對人的目的的背離。[9]大語言模型為出版業(yè)帶來深刻變革的同時,也有可能在一定程度上將創(chuàng)作者異化為“單向度的人”。這種異化主要體現(xiàn)在兩方面:自主性的剝奪和創(chuàng)新性的喪失。大語言模型幫助創(chuàng)作者在短時間內(nèi)獲取大量自己所需要的信息,這是其優(yōu)勢之處,但其提供的信息也具有它固有的思考邏輯,從而影響創(chuàng)作者的思維方式。同時,信息內(nèi)容甚至是寫作思路的“伸手即來”,容易在一定程度上加深創(chuàng)作者對機器人的依賴,久而久之將會使其懶于深度思考和創(chuàng)造新內(nèi)容,極大地限制了創(chuàng)作者的想象力。當(dāng)技術(shù)成為創(chuàng)作者實踐活動的主宰時,會潛移默化地操縱其行為與意識,使創(chuàng)作者不再自主自由,甚至甘愿成為技術(shù)的奴隸。異化是新技術(shù)發(fā)展過程中必須審慎看待的哲學(xué)問題和文化問題,創(chuàng)作者的異化將對以“內(nèi)容為王”的出版業(yè)產(chǎn)生巨大的負(fù)面影響。

在內(nèi)容生成層面,質(zhì)量參差不齊,藝術(shù)性存在隱憂。AI幻覺在學(xué)界并無明確的定義,其概念可理解為:人們過度信任與依賴人工智能所生產(chǎn)的信息,并未考慮其信息的正確性,AI產(chǎn)出的錯誤性信息流入大眾信息網(wǎng)絡(luò)造成的虛假信息與幻覺現(xiàn)象。提高AI模型的輸出真實性,避免AI“異想天開”,成為重要且緊迫的問題。同時人工智能是基于技術(shù)邏輯的內(nèi)容生成,生成的某些抽象派的作品只是色塊的拼接,不具有原創(chuàng)作品的一體化的風(fēng)格,也幾乎不可能具備很高的藝術(shù)意義和教養(yǎng)價值。該類“作品”在根源上背離了藝術(shù)創(chuàng)作的初衷。當(dāng)一個社會的藝術(shù)創(chuàng)作大多數(shù)是由冷冰冰的機器生成時,藝術(shù)市場將會迎來一場破壞性的變革,整個社會的文化發(fā)展亦存在隱憂。

在社會保障層面,相關(guān)法律亟待完善,應(yīng)用失衡將引發(fā)新的數(shù)字不平等。大語言模型產(chǎn)出的作品進(jìn)入市場后,版權(quán)問題突出。國外法律依據(jù)判例法,此前相關(guān)條文無法作為判定大語言模型創(chuàng)作產(chǎn)品版權(quán)糾紛的依據(jù)。而在我國,即使關(guān)于人工智能創(chuàng)作的作品依照相關(guān)文件精神判定,但是依舊缺乏體系成文的法律效力對人工智能創(chuàng)作的作品進(jìn)行標(biāo)準(zhǔn)化的保護(hù)與規(guī)范。此外,大語言模型的應(yīng)用失衡也帶來新的社會問題。以出版社為例,頭部出版社聚集著大量的優(yōu)質(zhì)資源,具備雄厚的資金支持,有助于促進(jìn)出版社工作人員的數(shù)字素養(yǎng)進(jìn)修和大語言模型的應(yīng)用。在技術(shù)參與的助力下,無論是出版內(nèi)容上的多樣性,還是出版過程的審核校對均具有層級性的提高,進(jìn)一步加大了出版社之間因技術(shù)而造成的生產(chǎn)力差距。

3.2? ?解決對策

和諧人機關(guān)系、加強審核監(jiān)管、完善法治建設(shè)等,是應(yīng)對新挑戰(zhàn)的有效對策。

3.2.1? ?明確人機主次,實現(xiàn)協(xié)同發(fā)展

大語言模型為創(chuàng)新出版業(yè)態(tài)、傳播方式和運營模式提供了良好契機。在知識生產(chǎn)方式的重大變革中,面對人機協(xié)同的模式,需要進(jìn)一步明確人與技術(shù)的主次關(guān)系。無論技術(shù)的更新還是社會的變遷,始終都是“以人為中心”的,人的各方面素養(yǎng)都亟須提升。面對人可能被大語言模型異化的困境,應(yīng)該回歸人的主體性,提高人在數(shù)智時代的媒介使用素養(yǎng),以平衡好人和機器之間的關(guān)系。

在政府層面,應(yīng)注重對全社會的人工智能普及教育,縮小大語言模型使用層面的數(shù)字鴻溝。近年來有學(xué)者提出了數(shù)智鴻溝的概念,比之前的“信息溝”和“數(shù)字鴻溝”更進(jìn)一步,認(rèn)為在當(dāng)前智能化背景下,存在著很多被邊緣化而不自知的隱形“數(shù)智難民”,他們無法享受大語言模型帶來的時代紅利。政府應(yīng)肩負(fù)起引領(lǐng)的責(zé)任,采取各種措施幫助弱勢群體縮小數(shù)字鴻溝,如頒布前瞻性政策法規(guī),加強出版行業(yè)從業(yè)者的職業(yè)培訓(xùn),完善數(shù)字基礎(chǔ)設(shè)施,加強對大語言模型知識的宣傳普及教育等。

3.2.2? ?加強審核監(jiān)管,提升編輯素養(yǎng)

智能技術(shù)應(yīng)用于出版,使得出版生態(tài)、出版產(chǎn)品形態(tài)等都發(fā)生了重大變化。大語言模型傳播錯誤信息,有可能使出版失去其基本功能。因此,ChatGPT類大語言模型不斷進(jìn)行技術(shù)發(fā)展與迭代更新的同時,也亟須監(jiān)管技術(shù)的研發(fā)。對大語言模型的產(chǎn)出進(jìn)行內(nèi)容審核與糾正把關(guān),對其可能涉及的個人隱私信息以及侵權(quán)內(nèi)容進(jìn)行攔截輸出,這在提升大語言模型產(chǎn)出質(zhì)量的同時,還能進(jìn)一步保護(hù)人的權(quán)利。以不侵犯他人權(quán)利為前提,在輸出內(nèi)容正確的基礎(chǔ)上,大語言模型的創(chuàng)作才更具有創(chuàng)造產(chǎn)出的價值意義。

大語言模型所產(chǎn)生的幻覺需要人來糾偏,出版業(yè)編輯的把關(guān)人位置顯得尤為重要,對編輯職業(yè)素養(yǎng)也提出了更高要求。智能時代的編輯職業(yè)素養(yǎng)既表現(xiàn)為對編輯基本素養(yǎng)如職業(yè)道德修養(yǎng)、文化知識水平、社會交往能力等的繼承和發(fā)揚光大,又表現(xiàn)為在面對和應(yīng)用智能技術(shù)時的科學(xué)精神、技術(shù)素養(yǎng)等。

大語言模型的高效輸出源于對數(shù)據(jù)庫中信息的人工標(biāo)記與智能標(biāo)記。在圖書出版業(yè)、有聲閱讀市場、影視制作行業(yè),加速研發(fā)大語言模型信息識別的標(biāo)記技術(shù),提升信息識別的準(zhǔn)確性,并進(jìn)行細(xì)致化的識別—分類—管理—應(yīng)用,為大語言模型提供信息明確的數(shù)據(jù)庫,也能進(jìn)一步提升創(chuàng)造產(chǎn)出質(zhì)量,避免不相關(guān)的信息元素混入以及虛假信息、垃圾信息、過時信息等不良信息的干擾。

3.2.3? ?完善法律保護(hù),增強權(quán)利意識

大語言模型由人類研發(fā),目的是便捷人類的生活,因此人始終是技術(shù)發(fā)展的核心。當(dāng)人的權(quán)利受到技術(shù)的侵犯時,必要的法律保護(hù)與相關(guān)完善完備的法制體系建設(shè)迫在眉睫。針對大語言模型的創(chuàng)作管理辦法,以及處理大語言模型產(chǎn)出作品的版權(quán)糾紛的法律依據(jù)等,都需要引起相關(guān)部門重視,并加速推進(jìn)立法。

大語言模型的問世在刺激人們的責(zé)任意識的同時,也刺激了人們的權(quán)利意識與專業(yè)意識的進(jìn)一步提升。一方面,重視人類主觀創(chuàng)造的權(quán)利意識。在大語言模型的智能威脅下,人類靈活應(yīng)用工具的同時,也更加注重人類思想的創(chuàng)新表達(dá)與傳播。另一方面,對自身專業(yè)領(lǐng)域的深入研究意識得到進(jìn)一步加強。大語言模型數(shù)據(jù)庫的繁雜和高密度的預(yù)訓(xùn)練,帶來的是廣泛的知識基礎(chǔ)而不是“專精深”的知識體系。因此,人類在使用ChatGPT類大語言模型時,更應(yīng)注重自身對細(xì)分領(lǐng)域?qū)I(yè)素質(zhì)的培養(yǎng)。[10]

4.新方向:出版業(yè)應(yīng)用大語言模型的未來趨勢

從通用型轉(zhuǎn)向?qū)S没鼍盎?。通用型是指適用于多領(lǐng)域和任務(wù)的大語言模型,專用型則是大語言模型被設(shè)計專用于特定領(lǐng)域或特定任務(wù)場景。未來,大語言模型將有望與出版業(yè)深度融合,增強專業(yè)性,實現(xiàn)通用型和出版專業(yè)型大語言模型并行發(fā)展,滿足出版多種場景需求。傳統(tǒng)模型往往只能針對性地支持單一類模態(tài),而在通用型大語言模型從“單模態(tài)”轉(zhuǎn)向“多模態(tài)”發(fā)展的基礎(chǔ)上,出版專用大語言模型通過預(yù)訓(xùn)練和專用預(yù)訓(xùn)練實現(xiàn)業(yè)務(wù)場景應(yīng)用,將能夠更好地滿足多樣化的出版形態(tài),促進(jìn)垂直領(lǐng)域進(jìn)一步發(fā)展。

從高門檻轉(zhuǎn)向簡易化、輕量化。大語言模型的簡易化發(fā)展將實現(xiàn)以最簡單便捷的操作實現(xiàn)數(shù)據(jù)的隨時提取與生成,滿足用戶需求。這意味著出版專用大語言模型將為作者提供更加直觀友好的創(chuàng)作工具,為編輯提供更多自動化功能,為用戶提供更多個性化定制服務(wù)。另一方面,成本壓力促使大語言模型朝輕量化發(fā)展。大語言模型的特點為大數(shù)據(jù)、大任務(wù)和大參數(shù),因此訓(xùn)練大語言模型需要較高計算資源和計算成本。大語言模型應(yīng)用于專業(yè)領(lǐng)域必須實現(xiàn)其輕量化,降低成本開銷。

從數(shù)據(jù)分散轉(zhuǎn)向數(shù)據(jù)協(xié)同。大語言模型已經(jīng)在技術(shù)上實現(xiàn)內(nèi)容的有效產(chǎn)出,但這一產(chǎn)出行為依賴龐大的數(shù)據(jù)資源。目前專門針對出版業(yè)的數(shù)據(jù)庫規(guī)模較小[11],這會使出版業(yè)在圖書推薦、精準(zhǔn)營銷等方面面臨“冷啟動”問題——因缺乏預(yù)訓(xùn)練所需的規(guī)模數(shù)據(jù)資源,無法讓出版專用大語言模型成功搭建并良好運轉(zhuǎn)。專用型大語言模型的發(fā)展是大勢所趨,這意味著在未來各個出版企業(yè)需要從數(shù)據(jù)分散轉(zhuǎn)向數(shù)據(jù)協(xié)同。通過集中數(shù)據(jù),可以獲得更多的數(shù)據(jù)樣本,從而提高模型的準(zhǔn)確性和可靠性。出版企業(yè)之間的合作和信息共享,會提高整個行業(yè)的效率和競爭力。基于數(shù)據(jù)協(xié)同、數(shù)據(jù)隱私和安全問題、數(shù)據(jù)格式和標(biāo)準(zhǔn)的統(tǒng)一性等問題也將得到重視與解決。

結(jié)語

大語言模型的出現(xiàn)為出版業(yè)帶來了重大發(fā)展機遇,其在出版實踐中的應(yīng)用,包括文本生成、自動翻譯、校對排版、營銷推廣等,已初顯成效,節(jié)省了大量的人力和物力成本。但不可否認(rèn),它也給傳統(tǒng)出版業(yè)帶來生成內(nèi)容過剩、加劇數(shù)字鴻溝等的負(fù)面沖擊。

出版業(yè)需要以更加開放包容的心態(tài)積極擁抱新技術(shù),將大語言模型與出版業(yè)務(wù)相結(jié)合,發(fā)揮各自的優(yōu)勢形成新的發(fā)展優(yōu)勢。此外,出版專用型大語言模型的搭建也為聚合開發(fā)者、高校、實驗室、出版企業(yè)等多方資源提供了契機,在促進(jìn)學(xué)術(shù)研究和技術(shù)應(yīng)用普及的同時,重塑新的出版生態(tài)。

參考文獻(xiàn):

[1] Dean Roper.Gauging Generative AIs Impact in Newsrooms[EB/OL].(2023-5-24)[2023-11-22].https://wan-ifra.org/insight/gauging-generative-ais-impact-in-newsrooms.

[2] 3年內(nèi)90%網(wǎng)絡(luò)內(nèi)容或由AI編制,科技大公司如何阻止虛假信息?[EB/OL].(2023-6-6)[2023-12-26].https://m.thepaper.cn/newsDetail_forward_23374311.

[3] 趙秋玥.迄今最復(fù)雜人工智能語音模型創(chuàng)建[EB/OL]. (2023-6-26)/[2023-12-26]. http://www.news.cn/tech/20230626/9e1a7807acc54f2c868a71b776d986b3/c.html.

[4] Artificial Intelligence:Threat,Opportunity,and Shimmr[EB/OL].(2023-7-31)[2023-11-22].https://publishingperspectives.com/2023/07/ai-building-shimmr-on-the-threat-opportunity-continuum.

[5] 張新新,齊江蕾.智能出版述評:概念、邏輯與形態(tài)[J].出版廣角,2021(13):21-25.

[6] 武菲菲.人工智能技術(shù)與出版行業(yè)的融合應(yīng)用[J].出版廣角,2018(1):26-28.

[7]? [美]保羅·萊文森.軟利器:信息革命的自然歷史與未來[M].何道寬,譯.上海:復(fù)旦大學(xué)出版社,2011:91.

[8] 秦艷華,閆玲玲,李一凡.媒介可供性視角下大語言模型ChatGPT應(yīng)用于出版業(yè)的對策研究[J].出版與印刷,2023(3):20-30.

[9] 何士清,徐勛.科技異化及其法律治理:基于以人為本的視角[M].北京:中國社會科學(xué)出版社,2010:45.

[10] 段佳宇,鄭汝可,李倩.人機協(xié)作背景下AI對新聞業(yè)人才培養(yǎng)帶來的改變與挑戰(zhàn)[J].中國傳媒科技,2023(8):14-19.

[11] 謝澤杭,李武.從賦能到融合:生成式AI出版的價值、困境與發(fā)展圖景[J]. 編輯學(xué)刊,2023(6):13-19.

作者簡介:秦艷華(1965-),女,山東煙臺,教授,博士生導(dǎo)師,國家新聞出版署重點實驗室“出版業(yè)用戶行為大數(shù)據(jù)分析與應(yīng)用重點實驗室”主任,北京師范大學(xué)新聞傳播學(xué)院,研究方向為新媒體研究、編輯出版;李一凡(1995-),女,山西陽泉,博士研究生,北京師范大學(xué)新聞傳播學(xué)院,研究方向為新媒體研究、編輯出版;閆玲玲(1995-),女,河北邯鄲,博士研究生,北京師范大學(xué)新聞傳播學(xué)院,研究方向為新媒體研究、編輯出版;符家寧(1997-),女,河南信陽,博士研究生,北京師范大學(xué)新聞傳播學(xué)院,研究方向為新媒體研究、編輯出版;侯玉麗(2001-),女,河南焦作,碩士研究生,北京師范大學(xué)新聞傳播學(xué)院,研究方向為新媒體研究、編輯出版。

(責(zé)任編輯:李凈)

猜你喜歡
出版業(yè)人工智能語言
以按需出版為抓手,推動出版業(yè)數(shù)字化轉(zhuǎn)型
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
讓語言描寫搖曳多姿
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
累積動態(tài)分析下的同聲傳譯語言壓縮
AR與VR技術(shù)在兒童出版業(yè)中的應(yīng)用
新聞傳播(2016年23期)2016-10-18 00:54:12
下一幕,人工智能!
對出版業(yè)供給側(cè)改革的思考
出版與印刷(2016年1期)2016-01-03 08:53:34
博湖县| 道孚县| 绥化市| 龙岩市| 简阳市| 和林格尔县| 新平| 利辛县| 楚雄市| 麻阳| 临沂市| 乐都县| 聊城市| 普安县| 客服| 西盟| 苗栗市| 和林格尔县| 马鞍山市| 海口市| 津市市| 岱山县| 浦城县| 尚义县| 团风县| 馆陶县| 双桥区| 呼玛县| 大渡口区| 竹山县| 原平市| 左贡县| 枞阳县| 防城港市| 高雄县| 芜湖市| 嘉禾县| 日土县| 千阳县| 营山县| 商南县|