摘 要:站在通用人工智能時代的前沿,科技編輯面臨前所未有的機遇。本文論述人工智能工具在圖書生產(chǎn)階段的關鍵作用,強調(diào)科技編輯應善用人工智能工具來提高出版工作的效率和效益,不斷探索和創(chuàng)新,真正掌握出版業(yè)的新質生產(chǎn)力。
關鍵詞:科技編輯 人工智能 大模型 智能體
在傳統(tǒng)出版流程中,編輯通常依賴項目管理策略及工具實現(xiàn)對各個出版環(huán)節(jié)的精細化管理,進而提高整體出版效率。隨著ChatGPT等人工智能(Artificial Intelligence,以下簡稱“AI”)工具的普及,編輯工作的效率提升迎來新的曙光。這類創(chuàng)新型工具能夠在翻譯、編輯加工、文字潤色等方面發(fā)揮重要作用。目前,AI工具在圖書編輯環(huán)節(jié)的應用尚處于早期探索階段。本文通過案例分析,探討科技編輯如何有效地利用AI工具提高出版效率,并給出注意事項及應對之法,以期為科技出版行業(yè)提供參考。
一、編輯面臨的效率困境與“圖書價值洼地”
圖書的生命周期可籠統(tǒng)地分為以下階段:確定選題 → 簽訂版權合同 → 成稿 → 出版流程(包括“三審三?!保?印制 → 上市銷售。因版權合同往往具有時限性,從簽訂版權合同之日起,圖書的生命周期就逐漸衰減。以一本版權時限為五年的引進版計算機圖書為例,若成稿(翻譯)階段和出版流程階段耗費一年,則待該書正式上市銷售時,其實際的生命周期只余4年。此外,考慮到計算機技術的更新速度,該書中的技術點可能已經(jīng)過時。
宏碁集團創(chuàng)辦人施振榮于1992年提出“微笑曲線理論”[1],用以說明產(chǎn)品的附加價值在其生命周期各階段(研發(fā)、制造、營銷)的分布情況。“微笑曲線”的兩端分別為研發(fā)階段和營銷階段,中間的制造階段則位于曲線的底端。從企業(yè)經(jīng)營角度看,產(chǎn)品的制造階段處于獲利低位。圖書作為一種產(chǎn)品,一方面,其制造階段(泛指成稿階段和出版流程階段)的附加價值符合“微笑曲線理論”,因處于獲利低位而容易受到忽視;另一方面,該階段作為保證圖書質量的核心環(huán)節(jié),又是編輯工作的重中之重。
受“微笑曲線”啟發(fā),本文提出“圖書價值洼地”模型(圖1),即彎曲的“笑臉”實為圖書的“價值洼地”,其處于獲利低位,卻是圖書生命力強盛的關鍵,也是提升圖書價值的發(fā)力點之一,應得到充分重視。如圖1所示,圖書A和圖書B的選題價值相同,并且二者同時進入“價值洼地”(圖中的陰影區(qū))。然而,由于圖書A相較于圖書B更早上市(圖書A的“價值洼地”更窄,生產(chǎn)階段耗時更短),因此最終價值更高。
圖1 “圖書價值洼地”模型
根據(jù)該模型,要提升圖書價值,編輯應當通過綜合運用多種手段和技術,在保證內(nèi)容質量的前提下,有效縮短圖書生產(chǎn)階段的時間長度。在傳統(tǒng)的編輯實踐中,提高生產(chǎn)效率的手段多限于將串行工作流程轉變?yōu)椴⑿泄ぷ髁鞒?,以及將編輯加工形式從以紙質文稿為基礎轉變?yōu)橐噪娮游母鍨榛A等。為進一步挖掘“圖書價值洼地”的潛力,除了采用這些傳統(tǒng)手段,AI工具的應用具有顛覆性意義。
二、AI賦能圖書生產(chǎn),助力編輯做到快、準、實
2024年《政府工作報告》中提出,要大力推進現(xiàn)代化產(chǎn)業(yè)體系建設,加快發(fā)展新質生產(chǎn)力。AI工具在圖書生產(chǎn)階段的應用符合新質生產(chǎn)力的三大特征:高科技、高效能、高質量。對科技編輯而言,踐行“AI+”賦能已迫在眉睫。
基于大模型的AI工具能夠理解和生成多語種文本,又因其接入了廣泛的知識庫,所以具備知識解釋能力和信息檢索能力。在圖書生產(chǎn)階段,科技編輯應利用AI工具的上述優(yōu)勢做到快、準、實。以下分別論述AI工具如何在三個方面助力科技編輯:多語種翻譯、修改和潤色文字、解釋知識和核查事實。
(一)快——迅速開展多語種翻譯
在引進版圖書的傳統(tǒng)出版流程中,試譯是必要步驟。為了找到專業(yè)背景和語言素養(yǎng)都不錯的譯者,編輯有時可謂大費周章。尤其是對于小語種引進版科技書,既懂技術又懂外語的譯者更是少之又少。引入AI工具后,這些問題迎刃而解。
多語種翻譯是AI工具提供的一項核心服務。2017年,谷歌公司的Ashish Vaswani等人在里程碑式論文“Attention Is All You Need”[2]中提出了Transformer架構,并進一步推廣了機器學習模型的注意力機制。Transformer架構包括編碼器和解碼器。ChatGPT正是基于Transformer架構的解碼器部分。這類AI工具能夠自動學習并掌握源語言與目標語言之間的復雜映射關系,在翻譯過程中采用注意力機制逐字預測出現(xiàn)概率最高的下一個詞,從而給出高質量、流暢的譯文。
與傳統(tǒng)翻譯軟件相比,AI工具在翻譯準確性方面展現(xiàn)出顯著優(yōu)勢。以“知識圖譜”(knowledge graph)一詞為例,一些傳統(tǒng)翻譯軟件采取字面譯法,將其直接譯為“知識圖”。相反,AI工具通過利用其語義理解能力,能夠識別專業(yè)術語,從而避免此類“低級錯誤”發(fā)生。
除了英漢互譯,當前流行的AI工具還支持包括法文、德文、西班牙文、意大利文、日文、俄文、阿拉伯文在內(nèi)的多種語言之間的相互翻譯。此外,基于ChatGPT模型,“風聲雨聲”等第三方工具已經(jīng)實現(xiàn)了對PDF文件或Word文檔的一鍵式翻譯功能。像“沉浸式翻譯”(Immersive Translate)這樣的瀏覽器插件能夠實時地翻譯用戶在瀏覽器中打開的PDF文件,極大地提升了用戶體驗和工作效率。
在這些AI工具的幫助下,編輯可以大幅壓縮一本書的翻譯時長,同時節(jié)省翻譯成本。以一本10萬字(100千字)的書為例,如果采用AI工具進行一鍵式翻譯,那么翻譯時長可以從三個月縮短為半小時,效率直接提升99.98%;假設人類譯者以80元/千字的常規(guī)翻譯標準收取翻譯費用,那么整本書的翻譯費用為8000元(100千字×80元/千字);而AI工具“風聲雨聲”對翻譯這本書僅收取55元,即不到人類譯者費用的0.7%。
注意事項及應對之法:在采用一鍵式翻譯形式進行長文翻譯時,AI工具對長文的理解能力欠佳,無法“記住”一些術語的全局含義,而僅關注該術語在局部上下文中的意思。舉例來說,對于“Transformer”一詞,若它出現(xiàn)在機器學習書中,應指Transformer架構,常見的處理方法是保留英文而不翻譯。筆者在使用AI工具翻譯機器學習書時發(fā)現(xiàn),它偶爾會將Transformer譯為“變壓器”,顯然缺乏人類編輯對稿件內(nèi)容的統(tǒng)一把握能力。因此,編輯不應照搬AI工具提供的譯文,而需按照編輯規(guī)范對AI譯文進行編輯加工,尤其注意統(tǒng)一術語。必要時,可邀請業(yè)內(nèi)專家審讀AI譯文,從專業(yè)角度進一步提高準確性。
(二)準——精準修改和潤色文字
基于大模型的AI工具擁有良好的“語感”,能夠快速理解文本,識別和修正語法錯誤,優(yōu)化句子結構。此外,AI工具還可以根據(jù)上下文語境進行智能推薦,提高文本的表達準確性和流暢度。
在用AI工具修改和潤色文字時,編輯應采用提示工程(Prompt Engineering)技巧。提示詞(prompt)是指人類在與AI工具交互的過程中輸入的語言內(nèi)容,也是AI工具理解和回應的基礎。若編輯僅輸入“修改以下句子”,AI工具無法準確理解編輯對任務的期望,可能給出不盡如人意的修改結果。相反,若編輯更詳細地描述修改需求,如“修改以下句子,使之用詞更優(yōu)美、語言更流暢”,AI工具便能根據(jù)具體需求執(zhí)行修改任務。通過精心設計提示詞,編輯能明確需求,引導AI工具準確回答,提升結果的準確性和實用性。
另一種技巧是使用智能體(Agent)。它是一種能夠自主學習和決策的程序,可根據(jù)編輯給定的任務和場景調(diào)整自己的決策和執(zhí)行路徑。[3]
以下舉例:
你是文采出眾的科技編輯(角色部分)。我給你提供一份關于機器學習技術的書稿(上下文部分)。請幫我潤色,使其語言表達更清晰、準確,邏輯更嚴謹(任務部分)。
下面展示AI工具的潤色效果。
原句:澆水是自變量,因為這是我們作為研究人員在實驗中控制的。植物的生長是因變量,因為我們假設,在自變量發(fā)生變化的情況下,植物的生長會發(fā)生變化。自變量通常首先被記錄。例如,植物首先被澆水,然后生長。
這段話存在邏輯問題,比如“澆水”是動作,而非自變量。我們先請智譜清言做初步修改。這里注意使用上述提示工程技巧和智能體技巧。
經(jīng)過智譜清言潤色的句子如下:在科學實驗中,我們作為研究人員,通過精心控制澆水的環(huán)節(jié)來觀察其對植物生長的影響。植物的生長作為實驗結果,受到我們調(diào)控的澆水量這一自變量的影響。我們假設,一旦自變量改變,植物的生長也會隨之發(fā)生變化。在實驗過程中,我們通常首先記錄自變量的具體變化情況。當植物首次接受澆灌時,它的生長過程便正式啟動。
可見,經(jīng)過AI工具潤色后,這段文字的邏輯更加清晰。如有需要,編輯可以進一步讓AI工具從文學角度潤色。當然,語言風格巨變并不一定符合編輯的需求。但不可否認,AI工具能夠從文學角度為編輯提供一些思路。
注意事項及應對之法:AI工具的確能夠在用詞方面為編輯提供思路,但編輯要注意保持全文的語言風格一致。AI工具在理解人類情感方面存在一定的局限性。因此,在處理一些主觀性較強的書稿時,AI工具可能會出現(xiàn)修改不當?shù)那闆r,也無法替代人類的創(chuàng)造力和判斷力。
此外,AI工具目前對出版行業(yè)的編校規(guī)范尚缺乏充分認識?!禖hatGPT在圖書編校中的應用測試與分析》[4]一文選取了《圖書編校質量差錯案例》中的200條典型編校差錯案例作為測試文本,與ChatGPT(GPT-3.5)的編校結果進行對比分析。結果顯示,ChatGPT能夠輔助糾正語法、字詞、標點符號和知識性錯誤,在字詞類錯誤編校處理上表現(xiàn)較好(糾錯率為44.0%),但在標點符號類錯誤處理上表現(xiàn)較差(糾錯率為22.0%)。可見,編輯應將AI工具作為輔助工具,而不應完全依賴它。
(三)實——解釋知識和核查事實
優(yōu)秀的編輯應具有廣泛的知識儲備,面對不同領域的稿件時都能做到游刃有余。然而,每個人都有局限性,難免遇到知識盲點。相比之下,大模型才是真正的“雜家”。以GPT-3為例,它的訓練數(shù)據(jù)集來自五大語料庫,其中Common Crawl含有近一萬億個單詞。[5]這意味著,如果需要查詢一個陌生的知識點,編輯只需用自然語言向大模型詢問關鍵詞即可。大模型能夠快速搜索其海量的“記憶庫”。因為它見多識廣,所以有極大概率遇見過這個關鍵詞,并能夠用人類語言進行解釋。
筆者對這一點深有體會。在編輯一本物理科普書時,筆者遇到“對易子”這個術語。作者僅在書稿中提及“對易子”,而未提供任何解釋或背景信息。為了核查后文的正確性,筆者需要首先理解這個概念。于是,筆者請教了文心一言。結果顯示,文心一言不僅言簡意賅地解釋了“對易子”,還提到這個概念主要出現(xiàn)在量子力學中。對于科技編輯而言,能夠通過單次查詢快速獲得關鍵信息是極為高效的。相比之下,傳統(tǒng)搜索引擎提供的結果通常是網(wǎng)頁鏈接列表,這要求編輯進行額外的步驟,即選擇網(wǎng)頁 → 點擊鏈接 → 閱讀網(wǎng)頁,才能獲取所需信息。這一對比突顯了AI工具在提升編輯效率方面的重要優(yōu)勢。
注意事項及應對之法:編輯應警惕AI幻覺問題,即大模型偶爾會“自信”地給出錯誤信息或誤導性信息。在使用AI工具核查涉及數(shù)值的事實內(nèi)容時,應當謹慎對待其輸出結果,并尋求額外的信息源進行交叉驗證。在這種情況下,傳統(tǒng)搜索引擎可以作為有效的輔助工具,用以驗證AI工具提供的信息的準確性。通過采用這種多源信息核實策略,編輯可以更有效地識別并糾正潛在的錯誤,確保書稿內(nèi)容的準確性和可靠性。
三、結語
不可否認,AI技術正在實實在在地改變出版業(yè)。在這個日新月異的時代,閉門造車、埋頭看稿已經(jīng)不能滿足行業(yè)發(fā)展的需求??萍季庉嬓枰蚤_放的心態(tài)和果敢的勇氣主動伸出觸手,去觸摸AI技術的前沿,用慧眼識珠的能力去探索和發(fā)現(xiàn)AI技術在出版業(yè)的應用場景。唯有如此,科技編輯才能站在時代的前沿,引領出版業(yè)的發(fā)展潮流,為實現(xiàn)科技強國、出版強國貢獻自己的力量。
(作者單位系人民郵電出版社)