——以圖書出版行業(yè)各編輯崗位工作為例"/>
趙曉晨
(機(jī)械工業(yè)出版社有限公司,北京 100000)
NLP 是人工智能的一個(gè)分支,它涉及計(jì)算機(jī)對(duì)人類語言的理解和生成。近年來,NLP 技術(shù)取得了長(zhǎng)足的進(jìn)展,且有很多發(fā)展趨勢(shì)。目前,NLP技術(shù)已經(jīng)從“聽”和“看”發(fā)展到“說”和“寫”,基本具備和人交流的能力。
深度學(xué)習(xí):深度學(xué)習(xí)技術(shù),特別是語言模型,在NLP 領(lǐng)域中取得了很多成功,可以解決多種NLP 問題,如語音識(shí)別、機(jī)器翻譯等。
語言生成:語言生成技術(shù)正在快速發(fā)展,并取得了很多進(jìn)展。例如,機(jī)器生成文本(GPT)技術(shù)已經(jīng)可以生成高質(zhì)量的文本內(nèi)容。
多語言處理:NLP 技術(shù)正在向多語言領(lǐng)域擴(kuò)展,以支持更多語言和文化。
智能客服:NLP 技術(shù)正在被廣泛應(yīng)用于智能客服,以提供快速、高效的客戶服務(wù)。
語音識(shí)別:語音識(shí)別技術(shù)正在快速發(fā)展,并逐漸普及,可以更方便地訪問信息和服務(wù)。
NLP 技術(shù)在過去幾十年里取得了長(zhǎng)足的發(fā)展,并且在近年來迎來了爆炸式增長(zhǎng)。
一方面,NLP 算法在語言理解方面取得了顯著的進(jìn)展,例如,在文本分類、情感分析、語義消歧等方面表現(xiàn)出了很高的準(zhǔn)確性。此外,NLP 還在語言生成方面取得了很大的進(jìn)展,例如自動(dòng)文本生成、對(duì)話生成等。
另一方面,大數(shù)據(jù)和人工智能的快速發(fā)展也加速了NLP 的發(fā)展。例如,深度學(xué)習(xí)技術(shù)的出現(xiàn)使得NLP 模型的語言表示能力大大提高,從而提高了NLP 模型的語言理解能力。同時(shí),云計(jì)算和大規(guī)模數(shù)據(jù)處理技術(shù)的發(fā)展也為NLP 提供了更多的計(jì)算資源和數(shù)據(jù)支持。
總的來說,NLP 技術(shù)正在快速發(fā)展,并且在各個(gè)應(yīng)用領(lǐng)域,如聊天機(jī)器人、文本摘要、情感分析等都有著廣泛的應(yīng)用。預(yù)計(jì)未來NLP 技術(shù)將繼續(xù)取得更多的突破,并在更多領(lǐng)域產(chǎn)生更大的影響,為人們帶來更好的體驗(yàn)和服務(wù)。
GPT(Generative Pretrained Transformer)是一種自然語言生成模型,是目前在自然語言處理(NLP)領(lǐng)域中最先進(jìn)的技術(shù)之一。
GPT 的發(fā)展方向主要有以下幾點(diǎn):
更大的模型:隨著計(jì)算資源的不斷提升,GPT 模型的尺寸也在不斷擴(kuò)大,更大的模型通常意味著更好的性能。
多任務(wù)學(xué)習(xí):GPT 可以在多個(gè) NLP 任務(wù)上訓(xùn)練,這將有助于提高 GPT 的通用性和靈活性。
增強(qiáng)學(xué)習(xí):GPT 可以通過強(qiáng)化學(xué)習(xí)策略來改進(jìn)其行為,從而提高 GPT 在復(fù)雜任務(wù)中的性能。
深度生成對(duì)話:GPT 在生成對(duì)話方面具有很高的潛力,與人工智能代理等技術(shù)結(jié)合將有助于實(shí)現(xiàn)更自然、更高效的人機(jī)對(duì)話體驗(yàn)。
多語言支持:GPT 可以擴(kuò)展到多種語言,從而支持全球范圍內(nèi)的 NLP 任務(wù)。
雖然編輯崗位是按照出版流程設(shè)定,且從內(nèi)容上來看環(huán)環(huán)相扣,但從實(shí)際業(yè)務(wù)操作來看,卻容易出現(xiàn)重疊和斷檔。
首先,由于目前供職于我國傳統(tǒng)出版社的策劃編輯大多從加工編輯轉(zhuǎn)化而來,或者同時(shí)兼任加工編輯,所以策劃編輯的工作思路不能擺脫加工編輯工作思路的限制。這就造成策劃編輯在策劃選題時(shí),會(huì)把稿件的加工難度設(shè)置為重點(diǎn)考量的項(xiàng)目之一,直接影響策劃編輯對(duì)選題的判斷,如圖1。很多符合市場(chǎng)需求且時(shí)效性很好的作品因?yàn)槲淖旨庸るy度較大——其中不僅包括語言的流暢性、文學(xué)性不高等文字難度,同時(shí)也存在專業(yè)性較強(qiáng)、觀點(diǎn)較新、對(duì)加工編輯水平要求較高等問題而被放棄。
圖1 目前圖書出版各崗位現(xiàn)狀
其次,營銷編輯雖然是順應(yīng)市場(chǎng)發(fā)展需求的不可或缺的崗位,但在曾經(jīng)“發(fā)行”工作的影響下,很多由“發(fā)行”轉(zhuǎn)化而來的營銷編輯并不能深度參與出版工作。究其原因還是工作思路的限制。營銷工作是“等”圖書印刷完成之后才開始的。與生產(chǎn)環(huán)節(jié)產(chǎn)生的時(shí)間差,讓營銷工作總有一種“游離”在出版工作之外的感覺,這也是很多營銷編輯在工作中的實(shí)際感受——拿到樣書或入庫信息才和產(chǎn)品第一次見面。即便是有重點(diǎn)選題提前與營銷編輯進(jìn)行了溝通,讓營銷工作可以稍微前置,也僅限于預(yù)售、新書預(yù)告等舉措,因?yàn)闀闯霭?,一切都是未知,營銷編輯無法掌握前期生產(chǎn)環(huán)節(jié)的任何一個(gè)節(jié)點(diǎn)。
策劃編輯的“想太多”和營銷編輯的“知道太晚”使出版效率大打折扣。要想破除這些“重疊”和“斷檔”需要對(duì)出版流程革新,重新梳理業(yè)務(wù)邏輯和分工。
NLP 的發(fā)展特別是GPT 技術(shù)的發(fā)展將對(duì)以文字為主要生產(chǎn)對(duì)象的出版工作產(chǎn)生重大影響,甚至變革。
經(jīng)過多年的轉(zhuǎn)型和出版行業(yè)市場(chǎng)化改革的深入,策劃編輯在出版行業(yè)中的作用越來越重要。一名好的策劃編輯不僅需要擁有對(duì)市場(chǎng)的敏感性,更需要有好的作者資源,擁有把好的選題轉(zhuǎn)化成產(chǎn)品的能力。除此之外,時(shí)效性也是其成功的關(guān)鍵。
由于某一個(gè)部門或某一個(gè)自然人對(duì)信息搜集、處理的能力、精力有限,因此,決策風(fēng)險(xiǎn)相對(duì)較大。加之目前出版行業(yè)運(yùn)用大數(shù)據(jù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行處理、分析的能力不足,導(dǎo)致決策過于主觀,容易忽視可行性。好的選題可能因?yàn)樽髡哔Y源不足等種種原因錯(cuò)過出版時(shí)機(jī),甚至失去出版機(jī)會(huì),甚至有一些選題受制于自身的能力或風(fēng)格,未能達(dá)到策劃編輯的要求而浪費(fèi)選題資源。
NLP 技術(shù)的發(fā)展正在逐步解決上述問題。由于NLP 的本質(zhì)還是大數(shù)據(jù)及算法,在學(xué)習(xí)樣本充足,邏輯逐步完善的前提下,根據(jù)要求“創(chuàng)作”已經(jīng)可以實(shí)現(xiàn)。ChatGPT 即典型應(yīng)用。
除可以滿足策劃編輯提出的內(nèi)容、風(fēng)格需求外,時(shí)效性也是其絕對(duì)優(yōu)勢(shì)。直接避免了因作者因素形成的創(chuàng)作風(fēng)險(xiǎn),讓整個(gè)創(chuàng)作過程變得可控。基于NLP 技術(shù)的特點(diǎn),其可以對(duì)文本進(jìn)行分析,了解讀者對(duì)內(nèi)容的偏好和興趣,從而提高內(nèi)容的受歡迎程度。
策劃編輯在選題策劃階段不需要過于擔(dān)心作者資源和創(chuàng)作風(fēng)險(xiǎn)問題,而是應(yīng)轉(zhuǎn)變思維,對(duì)選題進(jìn)行深入剖析,將工作重心轉(zhuǎn)移到如何更好呈現(xiàn)選題上。在人機(jī)交互上形成默契。目前已有BuzzFeed 和《運(yùn)動(dòng)畫刊》(Sports Illustrated)出版商在內(nèi)的媒體公司已經(jīng)宣布,計(jì)劃用ChatGPT 生成趣味問答和文章等內(nèi)容。
長(zhǎng)久以來,文字加工工作一直是圖書出版工作的核心,不僅體現(xiàn)在流程、時(shí)間上,更體現(xiàn)在質(zhì)量審查比重上。從形式到內(nèi)容,都是出版流程中的重中之重。目前加工編輯工作除一些敘事邏輯之外,大部分工作是對(duì)是非正誤的判斷與修改,校對(duì)工作的局限性更高。傳統(tǒng)的校對(duì)軟件,如黑馬校對(duì)、WPS 自帶校對(duì)插件等在出版社實(shí)踐中已經(jīng)被固定在流程中,對(duì)保證出版質(zhì)量發(fā)揮了不可或缺的作用,但受技術(shù)限制,軟件只能成為傳統(tǒng)出版流程中一個(gè)被增加的節(jié)點(diǎn),不能替代某一工作。
針對(duì)語言或文字處理技術(shù)精度較差,敏感詞識(shí)別效果不穩(wěn)定以及語言發(fā)展等問題,隨著大樣本分析、小樣本分析、機(jī)器學(xué)習(xí)等技術(shù)的發(fā)展,國內(nèi)已經(jīng)有研究者提出基于自然語言處理技術(shù)的敏感詞智能識(shí)別方法。以自然語言處理技術(shù)為基礎(chǔ),構(gòu)建處理模型;通過分析提取文字中包含的特征參數(shù),依靠決策樹方法,設(shè)計(jì)敏感詞識(shí)別算法;通過對(duì)文字敏感詞的敏感度計(jì)算,將敏感詞使用特殊字符標(biāo)注,實(shí)現(xiàn)最終識(shí)別、標(biāo)記和修改。
自然語言處理能力的完善將極大提高軟件在生產(chǎn)流程中的地位,加工編輯和校對(duì)人員的工作強(qiáng)度會(huì)被大大減輕,工作重點(diǎn)也會(huì)隨之發(fā)生改變,加工編輯可以從文字中抽離出來,站在更高的角度審視產(chǎn)品,更好地將自己的角色從加工人員轉(zhuǎn)變成產(chǎn)品生產(chǎn)人員。有更多的時(shí)間和精力,利用自己的專業(yè)優(yōu)勢(shì),與策劃編輯溝通從“作品”到“產(chǎn)品”的轉(zhuǎn)化與實(shí)現(xiàn)。
技術(shù)發(fā)展會(huì)導(dǎo)致部分社會(huì)崗位實(shí)現(xiàn)自動(dòng)化或被合并,也會(huì)產(chǎn)生出以前不存在的新崗位。
作為出版行業(yè)傳統(tǒng)意義上的“末端”工作,營銷工作長(zhǎng)期處于被動(dòng)局面——圖書產(chǎn)品的策劃與生產(chǎn)過程幾乎沒有營銷人員的參與。即便是流程相對(duì)完善的出版社,在營銷編輯拿到新書后第一個(gè)動(dòng)作也是翻看產(chǎn)品資料,迅速了解新書“賣點(diǎn)”“關(guān)鍵詞”等,然后根據(jù)經(jīng)驗(yàn),進(jìn)行受眾細(xì)分,制定營銷策略。
在前端工作已經(jīng)由NLP 技術(shù)“代勞”后,從作品到產(chǎn)品再到商品,出版工作的每一個(gè)關(guān)鍵點(diǎn)都將可控,圖書營銷工作將有可能前置到產(chǎn)品策劃階段,給營銷工作留足時(shí)間,并貫穿于出版全流程。
NLP 是人工智能和計(jì)算機(jī)語言學(xué)的交叉領(lǐng)域,可以讓計(jì)算機(jī)更好地理解、生成和分析人類語言。因此,自然語言處理技術(shù)在圖書營銷工作中有著重要的作用。
一方面,NLP 可以幫助圖書營銷人員更加有效地分析客戶的需求和閱讀偏好,從而更好地針對(duì)客戶推薦相應(yīng)的圖書。例如,通過文本分類和情感分析等NLP 技術(shù),可以快速識(shí)別出用戶對(duì)圖書類型、題材、作者等的喜好,從而更精準(zhǔn)地推薦圖書。
另一方面,NLP 還可以幫助圖書營銷人員提高營銷效率,從而節(jié)約時(shí)間和精力。例如,通過自動(dòng)文本生成等NLP 技術(shù),幫助圖書營銷人員快速生成營銷文案,而無須手動(dòng)編寫。雖然現(xiàn)在很多營銷編輯已經(jīng)可以使用AI 工具自動(dòng)生成營銷物料,但文本創(chuàng)作仍需耗費(fèi)大量精力進(jìn)行撰寫。主要癥結(jié)在于營銷編輯對(duì)圖書內(nèi)容的不了解和對(duì)受眾關(guān)注點(diǎn)的不確定。但隨著NLP 技術(shù)的發(fā)展,在其進(jìn)行自然語言學(xué)習(xí)的同時(shí),也可以根據(jù)一定的邏輯對(duì)冗長(zhǎng)的文字進(jìn)行提煉與濃縮。并根據(jù)需要識(shí)別其中關(guān)鍵點(diǎn),根據(jù)自然語言邏輯進(jìn)行編排,使受眾看到我們希望被看到的內(nèi)容,還可以根據(jù)讀者閱讀歷史和喜好,提供個(gè)性化的內(nèi)容推薦。
同時(shí),NLP 也可以幫助圖書營銷人員識(shí)別客戶可能存在的疑問,并通過語言生成系統(tǒng)快速生成回答,提高售后效率。
此次的技術(shù)革新并不是從提高工作效率入手,而是從業(yè)務(wù)邏輯的徹底改變。信息的收集和處理將會(huì)成為出版的重要環(huán)節(jié),并且會(huì)不止一次地出現(xiàn)。
長(zhǎng)久以來,出版的目的都是單一地傳播知識(shí)、思想、觀念或達(dá)到一種針對(duì)某一細(xì)分受眾的娛樂目的,方法都是通過大范圍的宣傳挖掘潛在讀者。但隨著大數(shù)據(jù)的發(fā)展以及數(shù)據(jù)處理能力的提高,這一目的將被更有針對(duì)性地實(shí)現(xiàn)。隨之而來的是對(duì)市場(chǎng)的敏感性要求的提高,換言之是編輯工作效率的提高。在了解了市場(chǎng)需求后,怎樣更高效地觸達(dá)用戶,成為NLP 在出版行業(yè)發(fā)展的目標(biāo)。
在形成完整的信息收集—策劃—信息二次收集—加工—出版—信息反饋這一完整閉環(huán)后,見圖2。每一次信息采集都可以自動(dòng)完成,形成信息看板,并根據(jù)未來市場(chǎng)預(yù)測(cè)情況提出營銷或策劃建議,甚至是文字內(nèi)容加工風(fēng)格的調(diào)整。編輯在其中的作用將變成根據(jù)出版社或品牌的風(fēng)格,設(shè)計(jì)這一系統(tǒng)中的思考權(quán)重,并在工作中不斷進(jìn)行調(diào)整。
圖2 圖書出版內(nèi)部流程
編輯的生產(chǎn)對(duì)象也將從一個(gè)作品、一本書,演變成一個(gè)出版系統(tǒng)。這個(gè)系統(tǒng)中至少要包含大語言模型、市場(chǎng)分析模型、社會(huì)心理學(xué)模型、成本計(jì)算模型等。此外,不必?fù)?dān)心機(jī)器在其中會(huì)出現(xiàn)“失控”的情況,進(jìn)而通過出版這一渠道影響讀者的認(rèn)知,技術(shù)將始終是輔助工具,避免編輯成為“人”的短板。這就要求編輯在工作中提高數(shù)據(jù)模型建立能力,并對(duì)數(shù)據(jù)保持敏感性。
新技術(shù)帶來變革,而新技術(shù)不是憑空生長(zhǎng)的,而是站在現(xiàn)有資源上的新產(chǎn)物。因此變革也應(yīng)該是螺旋向上的。
我們看到NLP 技術(shù)對(duì)出版行業(yè)的影響,但由于其轉(zhuǎn)換器需要大量的數(shù)據(jù),訓(xùn)練分為兩個(gè)階段:首先,在通用數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,這種數(shù)據(jù)更容易大量收集;然后,根據(jù)要執(zhí)行的具體任務(wù),利用定制的數(shù)據(jù)進(jìn)行微調(diào)。以ChatGPT 為例,其利用一個(gè)龐大的在線文本庫進(jìn)行預(yù)訓(xùn)練,以學(xué)習(xí)語言的規(guī)則和結(jié)構(gòu):通過對(duì)話記錄進(jìn)行微調(diào),以學(xué)習(xí)對(duì)話的特征??梢哉f,人類每使用它一次,它就更聰明一些。
基于此,“聰明”的對(duì)話將會(huì)使它更“聰明”和更快地“聰明”起來。經(jīng)過幾百年的發(fā)展,出版行業(yè)擁有浩如煙海的優(yōu)秀作品,這些作品經(jīng)過作者、編輯、市場(chǎng)的錘煉與檢驗(yàn),成為人類文明的精華,這將為機(jī)器學(xué)習(xí)提供優(yōu)質(zhì)“教材”。
經(jīng)過系統(tǒng)化訓(xùn)練的編輯人員對(duì)文字有著天然的敏感性,規(guī)范、簡(jiǎn)明、邏輯清晰的表達(dá)方式已經(jīng)融入其日常語言習(xí)慣。在專業(yè)書籍方面,雖然人學(xué)習(xí)、使用新技術(shù)的速度可能比不上機(jī)器學(xué)習(xí),但作為最終受益者,人的感受才是最重要的,提高使用滿意度,也是一切技術(shù)的終極目標(biāo),人的反饋對(duì)于機(jī)器學(xué)習(xí)來說至關(guān)重要。因此,將語言、文字作為生產(chǎn)對(duì)象的編輯人員,將成為NLP 的優(yōu)質(zhì)“老師”。
國內(nèi)已有不少研究室開始針對(duì)大語言模型進(jìn)行研發(fā),以復(fù)旦大學(xué)的大語言模型為代表的自然語言識(shí)別、輸出技術(shù)已經(jīng)在金融領(lǐng)域得到應(yīng)用。擁有海量客戶樣本及多樣化產(chǎn)品的出版業(yè),不僅可以為其提供語言文字方面的支持,更可以在客戶畫像方面提供準(zhǔn)確數(shù)據(jù)。
出版行業(yè)或?qū)⒃诮?jīng)過與NLP 不斷融合并長(zhǎng)期共存后徹底轉(zhuǎn)變身份,成為大數(shù)據(jù)技術(shù)中的一環(huán)。
鑒于目前對(duì)個(gè)人隱私保護(hù)的要求以及版權(quán)保護(hù)要求,NLP 的樣本收集將受到一定限制,通過GPT 的應(yīng)用場(chǎng)景也將被限制。加之各國、各地區(qū)之間的政策、監(jiān)管差異,如何適應(yīng)本地規(guī)則,并均衡發(fā)展,以保證其發(fā)揮最大效用,是技術(shù)發(fā)展與應(yīng)用的關(guān)鍵。即便如此,再合規(guī)的底層技術(shù)也會(huì)遭受野蠻生長(zhǎng),新應(yīng)用會(huì)不斷尋找監(jiān)管漏洞,對(duì)社會(huì)、經(jīng)濟(jì),甚至國家安全產(chǎn)生嚴(yán)重危害。因此,作為與之密切相關(guān)的出版行業(yè)更應(yīng)發(fā)揮自身優(yōu)勢(shì),積極參與應(yīng)對(duì)NLP 帶來的新風(fēng)險(xiǎn),使出版行業(yè)與技術(shù)共同發(fā)展。