【摘要】現(xiàn)階段,古籍文獻(xiàn)整理出版領(lǐng)域面臨技術(shù)應(yīng)用不足、技術(shù)迭代緩慢、技術(shù)壁壘突出等難題,將人工智能技術(shù)群落應(yīng)用于古籍文獻(xiàn)整理出版事業(yè)同樣存在技術(shù)挑戰(zhàn)和行業(yè)挑戰(zhàn)?;诋?dāng)下人工智能技術(shù)群落的特性與功能,可以構(gòu)建其在古籍文獻(xiàn)整理出版領(lǐng)域的三大未來應(yīng)用場(chǎng)景:面向整理出版工作的精準(zhǔn)高效服務(wù)場(chǎng)景、面向不同用戶群體的多元智慧服務(wù)場(chǎng)景、面向數(shù)字社會(huì)建設(shè)的深融創(chuàng)新服務(wù)場(chǎng)景。出版行業(yè)既要科學(xué)展望古籍文獻(xiàn)整理出版事業(yè)智能化、智慧化發(fā)展的前景,也要時(shí)刻警惕技術(shù)風(fēng)險(xiǎn)和行業(yè)挑戰(zhàn),做好萬無一失的準(zhǔn)備。
【關(guān)? 鍵? 詞】人工智能;古籍文獻(xiàn);整理出版;技術(shù)群落;應(yīng)用場(chǎng)景
【作者單位】段涵,解放軍新聞傳播中心出版社。
【中圖分類號(hào)】G239.2【文獻(xiàn)標(biāo)識(shí)碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2023.12.009
據(jù)不完全統(tǒng)計(jì),從1949年到2019年,我國(guó)共修復(fù)整理出版古籍文獻(xiàn)近38000種,其中既有《中國(guó)古籍總目》《續(xù)修四庫(kù)全書》等重大項(xiàng)目工程,也有《中華經(jīng)典古籍庫(kù)》鏡像版、網(wǎng)絡(luò)版、微信版、專業(yè)版等數(shù)字出版產(chǎn)品。然而,技術(shù)手段落后、內(nèi)容質(zhì)量良莠不齊、數(shù)字化程度較低一直是限囿古籍文獻(xiàn)整理出版事業(yè)高質(zhì)量發(fā)展的影響因素。隨著5G、人工智能、大數(shù)據(jù)、云計(jì)算、區(qū)塊鏈等新興技術(shù)的成熟運(yùn)用,數(shù)智化時(shí)代已經(jīng)到來。2022年4月,中共中央辦公廳、國(guó)務(wù)院辦公廳聯(lián)合印發(fā)了《關(guān)于推進(jìn)新時(shí)代古籍工作的意見》(以下簡(jiǎn)稱“《意見》”),這是繼1981年9月中共中央發(fā)布《關(guān)于整理我國(guó)古籍的指示》后,黨和國(guó)家又一次對(duì)古籍工作作出的重大指示?!兑庖姟分攸c(diǎn)指出要“發(fā)揮科技保護(hù)支撐作用,推動(dòng)古籍保護(hù)關(guān)鍵技術(shù)突破和修復(fù)設(shè)備研發(fā)”,“積極開展古籍文本結(jié)構(gòu)化、知識(shí)體系化、利用智能化的研究和實(shí)踐”,這對(duì)現(xiàn)階段古籍文獻(xiàn)整理出版工作積極應(yīng)用先進(jìn)技術(shù)手段,全面提升古籍文獻(xiàn)整理出版效率和質(zhì)量提供了新的指引。被譽(yù)為21世紀(jì)人類三大尖端技術(shù)之一的人工智能,對(duì)古籍文獻(xiàn)整理出版具有顯著的賦能作用。有學(xué)者指出,我國(guó)現(xiàn)存古籍文獻(xiàn)約有20萬種,若按現(xiàn)有速度全部整理出版,大概需要300年的時(shí)間,如果引入人工智能技術(shù)輔助整理與出版,大概只需二三十年就能完成[1]。
當(dāng)前,以生成式人工智能為代表的技術(shù)迭代升級(jí),為新時(shí)代古籍文獻(xiàn)整理出版提供了更強(qiáng)預(yù)期和信心,一些專家學(xué)者開始對(duì)以ChatGPT為代表的生成式人工智能在古籍文獻(xiàn)整理出版領(lǐng)域的應(yīng)用前景展開深入討論。
一、古籍文獻(xiàn)整理出版的技術(shù)難題
黨的十八大以來,受黨和國(guó)家的高度關(guān)注和政策引領(lǐng)、多行業(yè)主體的積極參與實(shí)踐,古籍文獻(xiàn)整理出版工作取得顯著成績(jī),發(fā)展現(xiàn)狀良好。然而,技術(shù)難題是現(xiàn)階段古籍文獻(xiàn)整理工作的核心問題之一。
一是技術(shù)應(yīng)用不足,古籍文獻(xiàn)整理出版速度有待提升。我國(guó)古籍文獻(xiàn)資源種類龐雜、內(nèi)容豐富,倘若僅靠人工整理出版,還需數(shù)百年時(shí)間才能勉強(qiáng)完成全部整理修復(fù)工作。目前古籍文獻(xiàn)整理出版主要采用影印技術(shù),由于資金、人才及技術(shù)限囿,對(duì)新興技術(shù)的研發(fā)、應(yīng)用普遍不足,多數(shù)數(shù)字化古籍文獻(xiàn)資源以微縮膠片轉(zhuǎn)換而成,需要專家人工錄入,不僅分辨率低,且操作周期長(zhǎng)、時(shí)間成本極高,嚴(yán)重影響了新時(shí)代古籍文獻(xiàn)整理出版速度。若引入新興技術(shù),尤其是人工智能和大數(shù)據(jù)技術(shù),古籍文獻(xiàn)整理出版速度必將大幅提升。
二是技術(shù)迭代不足,古籍文獻(xiàn)整理出版效率仍需強(qiáng)化。目前,古籍文獻(xiàn)整理出版領(lǐng)域大多使用的技術(shù)仍以計(jì)算機(jī)自動(dòng)化技術(shù)為主,主要應(yīng)用于古籍文獻(xiàn)文本的編輯校對(duì)環(huán)節(jié),不僅誤報(bào)率高,而且缺乏知識(shí)深度索引功能,導(dǎo)致古籍文獻(xiàn)整理出版的工作效率和資源利用率有待提高。胡佩等指出,以黑馬校對(duì)和方寸校對(duì)為代表的兩款產(chǎn)品是現(xiàn)階段中文校對(duì)領(lǐng)域的代表,盡管這些產(chǎn)品以人工維護(hù)的字詞庫(kù)或語法庫(kù)對(duì)古籍文獻(xiàn)數(shù)字化整理出版工作發(fā)揮了一定的積極作用,但也存在字詞庫(kù)擴(kuò)容以后誤報(bào)率上升的固有缺陷,具體表現(xiàn)為整句糾錯(cuò)能力差、校對(duì)能力不足等[2]。此外,僅憑計(jì)算機(jī)自動(dòng)化技術(shù)并不能對(duì)古籍文獻(xiàn)資源進(jìn)行精準(zhǔn)、全面、深度、高效的內(nèi)容索引,這也導(dǎo)致相關(guān)整理出版產(chǎn)品的知識(shí)服務(wù)功能和用戶使用體驗(yàn)不足。
三是技術(shù)壁壘突出,古籍文獻(xiàn)整理出版影響有限。盡管目前已有部分出版機(jī)構(gòu)、圖書館以及商業(yè)公司等利用新興技術(shù)打造古籍文獻(xiàn)整理出版平臺(tái)、數(shù)據(jù)庫(kù)等,但技術(shù)壁壘仍然突出,在一定程度上限囿了古籍文獻(xiàn)整理出版的影響力。一方面,技術(shù)內(nèi)部壁壘突出?,F(xiàn)有的古籍文獻(xiàn)數(shù)字資源庫(kù)大多注重資源數(shù)量與規(guī)模建設(shè),且主要以古籍文獻(xiàn)物理單元為對(duì)象進(jìn)行技術(shù)著錄、保存與服務(wù),由于古籍文獻(xiàn)物理單元的局限,同一主題的古籍資源往往被分散在多個(gè)文獻(xiàn)單元之中,不僅存在資源重復(fù)的現(xiàn)象,而且大大降低了古籍文獻(xiàn)整理出版的內(nèi)容效果和服務(wù)質(zhì)量。另一方面,技術(shù)外部壁壘突出。我國(guó)古籍文獻(xiàn)資源本就分散,加之不少機(jī)構(gòu)存在“各行其是”的傳統(tǒng)觀念,導(dǎo)致珍貴資源和核心技術(shù)并未實(shí)現(xiàn)共建共享目標(biāo)。如果各出版社單打獨(dú)斗,就會(huì)出現(xiàn)多個(gè)小型古籍?dāng)?shù)據(jù)庫(kù),難以形成規(guī)模優(yōu)勢(shì)[3]。
二、人工智能技術(shù)群落對(duì)古籍文獻(xiàn)整理出版的賦能作用
新一代信息技術(shù)的發(fā)展及應(yīng)用,尤其是人工智能技術(shù)群落的誕生和賦能,為古籍文獻(xiàn)整理出版事業(yè)的高質(zhì)量、高效率發(fā)展提供了重要機(jī)遇,人工智能技術(shù)的出現(xiàn)為古籍修復(fù)整理帶來革命性變化[4]。近年來,包括北京大學(xué)、中華書局的古聯(lián)(北京)數(shù)字傳媒科技有限公司(以下簡(jiǎn)稱“古聯(lián)公司”)、字節(jié)跳動(dòng)等在內(nèi)的不少高等院校、商業(yè)公司以及網(wǎng)絡(luò)平臺(tái)對(duì)古籍文獻(xiàn)整理出版的數(shù)字化、智能化發(fā)展付諸了巨大努力,打造了“識(shí)典古籍平臺(tái)”“古聯(lián)智能OCR系統(tǒng)”“匯典·古籍?dāng)?shù)字服務(wù)平臺(tái)”等系列尖端產(chǎn)品,以期通過人工智能技術(shù)群落的強(qiáng)勢(shì)賦能,實(shí)現(xiàn)古籍整理出版事業(yè)的理想目標(biāo)。具體來看,人工智能技術(shù)群落對(duì)古籍文獻(xiàn)整理出版的賦能作用主要有三點(diǎn)。
第一, 人工智能技術(shù)群落能快速識(shí)別和自主分析古籍文獻(xiàn)文本資源,給后續(xù)的整理出版系列工作提供更高效、更便捷的多元服務(wù)。長(zhǎng)期以來,在古籍整理出版領(lǐng)域,“一萬個(gè)小時(shí)”恐怕出不來一個(gè)熟手,“兩萬個(gè)小時(shí)”也未必能造就一個(gè)大師。人工智能技術(shù)群落應(yīng)用于古籍整理出版領(lǐng)域,對(duì)實(shí)現(xiàn)古籍原典從紙本到數(shù)據(jù)的一站式轉(zhuǎn)換具有顯著作用。2022年,古聯(lián)公司以“古聯(lián)智能OCR系統(tǒng)”為核心,在籍合網(wǎng)上線了古籍智能整理平臺(tái),將公司成立以來的一系列古籍整理AI技術(shù)如OCR、自動(dòng)斷句標(biāo)點(diǎn)、繁簡(jiǎn)轉(zhuǎn)換以及支持14萬個(gè)古籍整理用字的XML編輯器成功融入新平臺(tái)建設(shè),目前該平臺(tái)已初步實(shí)現(xiàn)了古籍文獻(xiàn)影像的數(shù)據(jù)挖掘和元素識(shí)別目標(biāo),大幅提升了識(shí)別和分析版刻本古籍文獻(xiàn)的速度,5分鐘便可達(dá)到人工錄入20個(gè)小時(shí)的工作量[5]。除了文本識(shí)別和數(shù)據(jù)轉(zhuǎn)換,隨著人工智能技術(shù)群落的迭代升級(jí),“古聯(lián)智能OCR系統(tǒng)”還能針對(duì)古籍文獻(xiàn)資源進(jìn)行更多元的開發(fā)利用,如給行文添加標(biāo)點(diǎn),對(duì)人名、地名、時(shí)間等內(nèi)容要素進(jìn)行詳細(xì)標(biāo)注,并提供智能校對(duì)與編輯服務(wù),從而達(dá)到古籍文獻(xiàn)整理出版的一站式、數(shù)字化發(fā)展目標(biāo),為后續(xù)古籍文獻(xiàn)的活化開發(fā)利用提供更多支撐。
第二,人工智能技術(shù)群落能對(duì)古籍文獻(xiàn)文本資源進(jìn)行精準(zhǔn)糾錯(cuò)和深度標(biāo)引、智能關(guān)聯(lián),為提升整理出版工作效率以及優(yōu)化用戶服務(wù)體驗(yàn)保駕護(hù)航。目前,“識(shí)典古籍平臺(tái)”“古聯(lián)智能OCR系統(tǒng)”“匯典·古籍?dāng)?shù)字服務(wù)平臺(tái)”都積極應(yīng)用了系列人工智能技術(shù),如OCR、NLP、ML等。借助上述技術(shù)群落賦能,古籍文獻(xiàn)整理出版效率得以大幅提升。例如:“古聯(lián)智能OCR系統(tǒng)”借助人工智能技術(shù)識(shí)別,誤報(bào)率降低了75%[5];利用人工智能技術(shù)賦能,北京大學(xué)數(shù)字人文中心在從先秦到明清跨時(shí)代的大規(guī)模古籍文獻(xiàn)文本語料整理方面實(shí)現(xiàn)了對(duì)古文本的自動(dòng)句讀,平均準(zhǔn)確率達(dá)到94%,并實(shí)現(xiàn)了對(duì)人名、地名、時(shí)代名、官職名等古籍原典要素的自動(dòng)識(shí)別,在中古史料上的準(zhǔn)確率接近98%[5];通過技術(shù)群落多重賦能,“人工智能+古籍文獻(xiàn)整理出版平臺(tái)”能進(jìn)一步實(shí)現(xiàn)全文檢索、圖片檢索等目標(biāo),并通過自然語言處理技術(shù)深度解析古籍文獻(xiàn)數(shù)據(jù)文本實(shí)現(xiàn)古籍文獻(xiàn)知識(shí)結(jié)構(gòu)化,重構(gòu)古籍文獻(xiàn)內(nèi)容服務(wù)形式,增強(qiáng)知識(shí)深度索引和智能服務(wù)能力。有學(xué)者指出:過去的古籍文獻(xiàn)整理出版目標(biāo)是把傳統(tǒng)紙本的古籍文獻(xiàn)資源整理出來再次出版,或以現(xiàn)代文的注釋便利大眾閱讀;現(xiàn)在的古籍文獻(xiàn)整理出版重在抽取古籍文獻(xiàn)中蘊(yùn)藏的歷史文化知識(shí),以先進(jìn)技術(shù)構(gòu)造成各種各樣的專業(yè)資源庫(kù),以知識(shí)圖譜的形式支撐互聯(lián)網(wǎng)前端應(yīng)用,以此實(shí)現(xiàn)資源利用高效便捷和知識(shí)服務(wù)專業(yè)權(quán)威的核心目標(biāo)[6]。
第三,人工智能技術(shù)群落對(duì)加快古籍文獻(xiàn)資源共建共享,進(jìn)一步打破古籍文獻(xiàn)整理出版邊界,實(shí)現(xiàn)活化開發(fā)利用目標(biāo),具有不容忽視的促進(jìn)作用。復(fù)旦大學(xué)張曉虹教授認(rèn)為,作為傳統(tǒng)史料的重要載體之一,古籍文獻(xiàn)因其表達(dá)方式的復(fù)雜性、精度的不確定性和收藏機(jī)構(gòu)的分散性,在開發(fā)利用上存在較大困難[4]。在此背景下,充分利用人工智能技術(shù)群落賦能加速古籍文獻(xiàn)資源一體化整合和平臺(tái)化共建,打破行業(yè)壁壘和數(shù)據(jù)孤島,對(duì)新時(shí)代古籍文獻(xiàn)整理出版事業(yè)具有重要意義,甚至能延伸出更大的“活化”空間?!白R(shí)典古籍平臺(tái)”作為古籍整理出版領(lǐng)域高等院校與網(wǎng)絡(luò)公司聯(lián)合打造的一站式智能服務(wù)平臺(tái),其通過雙方在技術(shù)上的優(yōu)勢(shì)互補(bǔ)和資源共享,進(jìn)一步打破并模糊了行業(yè)壁壘和邊界,讓古籍文獻(xiàn)資源得以在更大范圍內(nèi)被開發(fā)利用,真正實(shí)現(xiàn)“活起來”目標(biāo)。在人工智能技術(shù)群落的賦能與支撐下,古籍文獻(xiàn)整理出版邊界日趨模糊,行業(yè)壁壘逐漸消失,一體化跨界協(xié)同趨勢(shì)不斷增強(qiáng),這不僅有利于古籍文獻(xiàn)資源的深度開發(fā)利用和價(jià)值效益釋放,而且對(duì)古籍文獻(xiàn)于當(dāng)代“活起來”和“傳下去”具有重要意義。
三、人工智能技術(shù)群落在古籍文獻(xiàn)整理出版領(lǐng)域的應(yīng)用場(chǎng)景
基于人工智能技術(shù)群落的強(qiáng)大賦能,加之技術(shù)迭代速度不斷加快,古籍文獻(xiàn)整理出版事業(yè)迎來了新的機(jī)遇,呈現(xiàn)智能化甚至智慧化發(fā)展態(tài)勢(shì)?;诋?dāng)下人工智能技術(shù)群落的特性與功能,本文合理構(gòu)建了其在古籍文獻(xiàn)整理出版領(lǐng)域的三大未來應(yīng)用場(chǎng)景。
1.面向整理出版工作的精準(zhǔn)高效服務(wù)場(chǎng)景
在人工智能技術(shù)群落的強(qiáng)勢(shì)賦能下,未來古籍文獻(xiàn)整理出版領(lǐng)域的工作場(chǎng)景將得以重塑,呈現(xiàn)精準(zhǔn)高效的服務(wù)特色,為提升體量龐大的傳統(tǒng)整理出版速度發(fā)揮重要作用。
一是文本自動(dòng)識(shí)別與高效轉(zhuǎn)化?;谏疃葘W(xué)習(xí)、機(jī)器學(xué)習(xí)等人工智慧技術(shù)群落的強(qiáng)勢(shì)賦能,古籍文獻(xiàn)整理出版將不再依靠再生性保護(hù)方式進(jìn)行影印再造和人工轉(zhuǎn)換,而是通過OCR、AI句讀、智能掃描設(shè)備的使用,實(shí)現(xiàn)古籍文獻(xiàn)資源的自動(dòng)識(shí)別與高效轉(zhuǎn)化目的。例如,通過OCR技術(shù)應(yīng)用,僅需“掃一掃”古籍文獻(xiàn)原典,便可自動(dòng)錄入相應(yīng)內(nèi)容,同時(shí)生成數(shù)字文檔,為后續(xù)的編輯校對(duì)、整理分類以及出版發(fā)行等提供有效支撐。
二是內(nèi)容智能精校與深度索引。借助自然語言處理、大規(guī)模語言模型生成等人工智能核心技術(shù)賦能,可建成面向古籍文獻(xiàn)資源的大規(guī)模預(yù)訓(xùn)練數(shù)據(jù)庫(kù)和語料庫(kù),為智能精校古籍文獻(xiàn)數(shù)據(jù)資源并實(shí)現(xiàn)深層知識(shí)索引提供可能。例如,通過大規(guī)模古籍文獻(xiàn)文本語料整理,即大量古籍文本數(shù)據(jù)的學(xué)習(xí)模仿,可實(shí)現(xiàn)對(duì)數(shù)據(jù)文本的自動(dòng)精校,包括但不限于人名、地名、時(shí)代名等內(nèi)容元素的整理分類、智能標(biāo)注和深層檢索,并以此進(jìn)行智能知識(shí)索引,在協(xié)助編輯和作者更高效、便捷地處理文本的同時(shí),為古籍文獻(xiàn)資源的深度開發(fā)利用和多元用戶服務(wù)提供保障。
三是智能出版工具包及多元解決方案。通過人工智能技術(shù)群落的落地應(yīng)用,諸如版式自動(dòng)調(diào)節(jié)、一站式資源發(fā)布、繁簡(jiǎn)自動(dòng)轉(zhuǎn)換等系列工具包以及數(shù)據(jù)保護(hù)存儲(chǔ)、系統(tǒng)自查自檢、平臺(tái)定期維護(hù)等技術(shù)解決方案也將接踵而至,讓古籍文獻(xiàn)整理出版工作全部轉(zhuǎn)移至線上,且能實(shí)時(shí)操作,以此實(shí)現(xiàn)提質(zhì)增效目標(biāo)。
2.面向不同用戶群體的多元智慧服務(wù)場(chǎng)景
通過人工智能技術(shù)群落的強(qiáng)勢(shì)賦能,未來古籍整理出版領(lǐng)域的用戶群體及其服務(wù)場(chǎng)景將愈發(fā)多元、個(gè)性化。在人工智能技術(shù)群落的賦能作用下,根據(jù)不同用戶群體的個(gè)性需求提供相應(yīng)的智慧場(chǎng)景服務(wù),是新時(shí)代古籍文獻(xiàn)整理出版工作的核心目標(biāo)之一。
一是面向?qū)<覍W(xué)者及高校師生群體的智慧知識(shí)服務(wù)。隨著人工智能技術(shù)群落的飛速發(fā)展,尤其是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)技術(shù)的廣泛應(yīng)用,越來越多的古籍文獻(xiàn)資源得以問世,并能按照用戶指令提供精準(zhǔn)、專業(yè)、個(gè)性的智慧服務(wù),這對(duì)專家學(xué)者的學(xué)術(shù)科研和高校師生的知識(shí)學(xué)習(xí)提供了重要支撐。例如,針對(duì)不同專家學(xué)者和高校師生的知識(shí)需求,人工智能技術(shù)群落可實(shí)現(xiàn)對(duì)古籍文獻(xiàn)數(shù)據(jù)資源的智能檢索和自動(dòng)生成,幫助他們精確獲取內(nèi)容要點(diǎn),從而提高學(xué)術(shù)知識(shí)服務(wù)質(zhì)量。
二是面向一般大眾和古籍愛好者的智慧閱讀服務(wù)。通過人工智能技術(shù)群落的普及應(yīng)用,古籍文獻(xiàn)數(shù)據(jù)庫(kù)或平臺(tái)可研發(fā)自動(dòng)標(biāo)點(diǎn)、繁簡(jiǎn)轉(zhuǎn)換等多元工具,從而將古籍整理出版領(lǐng)域使用的技術(shù)工具擴(kuò)展成一般大眾或古籍愛好者觸手可及的智慧閱讀產(chǎn)品,加大古籍文獻(xiàn)資源在智能信息環(huán)境下深度開發(fā)、利用和傳播的力度。例如,借助人工智能技術(shù)群落研發(fā)并使用的知識(shí)標(biāo)引與檢索、繁簡(jiǎn)自主轉(zhuǎn)換等應(yīng)用工具,一般大眾和古籍愛好者可直接進(jìn)行古籍文獻(xiàn)閱讀活動(dòng),甚至能借助AIGC機(jī)制自動(dòng)生成個(gè)性閱讀和知識(shí)解決方案,幫助他們更好地理解和掌握晦澀難懂的古籍文化知識(shí)。此外,基于人工智能技術(shù)群落與AR/VR/MR等技術(shù)的融合創(chuàng)新,可將傳統(tǒng)的平面閱讀轉(zhuǎn)變?yōu)榱Ⅲw閱讀場(chǎng)景,給予用戶前所未有的沉浸式閱讀體驗(yàn)。
三是面對(duì)文化企業(yè)和商業(yè)公司的智慧供給服務(wù)。通過人工智能技術(shù)群落搭建的一站式共建共享平臺(tái),古籍文獻(xiàn)整理出版系統(tǒng)的上中下游合作關(guān)系將進(jìn)一步強(qiáng)化,以此形成閉合產(chǎn)業(yè)鏈,即上中游的古籍文獻(xiàn)整理出版系統(tǒng)通過資源開發(fā)與維護(hù)、內(nèi)容整理與出版,為下游文化企業(yè)、商業(yè)公司乃至古籍領(lǐng)域的跨界合作提供資源支撐,進(jìn)一步釋放古籍活化價(jià)值。
3.面向數(shù)字社會(huì)建設(shè)的深融創(chuàng)新服務(wù)場(chǎng)景
人工智能技術(shù)群落應(yīng)用于古籍文獻(xiàn)整理出版事業(yè),可實(shí)現(xiàn)古籍文獻(xiàn)資源數(shù)字化、智能化、智慧化發(fā)展目標(biāo),這不僅滿足國(guó)家文化數(shù)字化發(fā)展戰(zhàn)略的現(xiàn)實(shí)需要,而且對(duì)數(shù)字中國(guó)、數(shù)字社會(huì)建設(shè)起到重要的支撐作用。
一方面,通過人工智能技術(shù)群落賦能,蘊(yùn)藏在古籍文獻(xiàn)原典中的各類歷史文化知識(shí)、思想價(jià)值觀念將以數(shù)據(jù)形式被抽取和利用,再經(jīng)知識(shí)圖譜的自動(dòng)生成和古籍文獻(xiàn)內(nèi)容的智能化整理出版,為數(shù)字社會(huì)建設(shè)提供豐富多元、價(jià)值深厚的文化數(shù)字化資源。例如,經(jīng)過人工智能技術(shù)群落的實(shí)踐應(yīng)用,古籍文獻(xiàn)資源可以通過音、視、圖、文甚至立體閱讀形態(tài)加以檢索、關(guān)聯(lián)閱讀和深度挖掘利用,從而面向社會(huì)構(gòu)建一系列深融創(chuàng)新服務(wù)場(chǎng)景,助力全民數(shù)字閱讀事業(yè)的高質(zhì)量發(fā)展,以古籍文獻(xiàn)數(shù)字資源的智能化應(yīng)用為數(shù)字社會(huì)文化建設(shè)提供強(qiáng)勢(shì)動(dòng)力。
另一方面,借助人工智能技術(shù)群落的強(qiáng)勢(shì)賦能和開放服務(wù),古籍文獻(xiàn)數(shù)字資源還可被構(gòu)造成各種各樣的知識(shí)智庫(kù),為數(shù)字社會(huì)建設(shè)提供決策參考服務(wù),并以知識(shí)圖譜的形式支持?jǐn)?shù)字社會(huì)的各種前端應(yīng)用和場(chǎng)景開發(fā),如數(shù)字教育、數(shù)字文化等,切實(shí)實(shí)現(xiàn)古籍文獻(xiàn)整理出版工作效益最大化的目標(biāo)。
長(zhǎng)期以來,科學(xué)技術(shù)在人類社會(huì)發(fā)展進(jìn)程中都是一種起到推動(dòng)作用的、革命的力量。在人工智能技術(shù)群落的賦能下,古籍文獻(xiàn)資源的數(shù)字化轉(zhuǎn)換對(duì)社會(huì)各行各業(yè)人才培育具有不容忽視的作用,這也是數(shù)字社會(huì)建設(shè)的核心動(dòng)力。例如,通過人工智能技術(shù)賦能,古籍文獻(xiàn)蘊(yùn)含的中華優(yōu)秀傳統(tǒng)文化精神將擺脫以往專業(yè)化、小眾化傳播桎梏,借助技術(shù)優(yōu)勢(shì)打破時(shí)空隔閡,實(shí)現(xiàn)傳播效果最大化目標(biāo),即與不同行業(yè)、不同領(lǐng)域進(jìn)行不同程度的深度融合與創(chuàng)新,為培養(yǎng)“既有專業(yè)素養(yǎng),又有文化內(nèi)涵”的優(yōu)秀人才提供重要助力,這也是推動(dòng)數(shù)字社會(huì)建設(shè)的核心力量。
四、結(jié)語
綜上所述,數(shù)字信息技術(shù)的發(fā)展,尤其是人工智能技術(shù)群落的誕生和應(yīng)用,為古籍文獻(xiàn)整理出版工作帶來了全新機(jī)遇,是推動(dòng)古籍文獻(xiàn)整理出版事業(yè)轉(zhuǎn)型升級(jí)和智能化甚至智慧化發(fā)展的重要力量,也是未來古籍文獻(xiàn)資源活化利用和深度開發(fā)的有效支撐。然而,無論從技術(shù)層面還是行業(yè)層面來看,人工智能技術(shù)群落應(yīng)用于古籍文獻(xiàn)整理出版事業(yè),仍存在一些現(xiàn)實(shí)挑戰(zhàn)。
第一,技術(shù)挑戰(zhàn)。盡管以ChatGPT為代表的新一代人工智能技術(shù)群落已經(jīng)在部分行業(yè)領(lǐng)域率先落地應(yīng)用并推出了智能檢索、數(shù)據(jù)挖掘、自主生成等多元服務(wù),但在古籍文獻(xiàn)整理出版領(lǐng)域還處于理論探討階段。不少高等院校、商業(yè)公司以及網(wǎng)絡(luò)平臺(tái)陸續(xù)推出初步具備人工智能技術(shù)特性的先進(jìn)產(chǎn)品,但這些技術(shù)不夠成熟,對(duì)古籍文獻(xiàn)整理出版事業(yè)的智能化、智慧化發(fā)展助力有限,未能真正實(shí)現(xiàn)古籍文獻(xiàn)資源活化開發(fā)利用的理想目標(biāo)。因此,基于人工智能技術(shù)群落賦能的古籍文獻(xiàn)整理出版事業(yè)還需要深入探索實(shí)踐,尤其要注重對(duì)應(yīng)用場(chǎng)景、技術(shù)方案、知識(shí)服務(wù)的開拓創(chuàng)新。
第二,行業(yè)挑戰(zhàn)。目前,利用人工智能技術(shù)群落加快古籍文獻(xiàn)整理出版事業(yè)的高質(zhì)量發(fā)展和轉(zhuǎn)型升級(jí)正在成為現(xiàn)實(shí)中的生動(dòng)實(shí)踐,但也引發(fā)了新的行業(yè)挑戰(zhàn)。一是技術(shù)研發(fā)應(yīng)用及硬軟件設(shè)施建設(shè)需要投入大量的人力物力財(cái)力,這給古籍文獻(xiàn)整理出版事業(yè)造成了巨大壓力。無論是構(gòu)建古籍文獻(xiàn)大規(guī)模預(yù)訓(xùn)練數(shù)據(jù)庫(kù)或語料庫(kù),還是研發(fā)各種平臺(tái)系統(tǒng)和技術(shù)工具包,都需要投入大量資金、引進(jìn)相應(yīng)人才,這對(duì)本就缺乏資金和人才的古籍文獻(xiàn)整理出版機(jī)構(gòu)而言無疑難上加難。在古籍文獻(xiàn)整理層面,無論是學(xué)者專家,還是編輯工作人員,都要保證古籍文獻(xiàn)資源的準(zhǔn)確性,以確保更好地利用技術(shù)而不是被技術(shù)誤導(dǎo)。二是人工智能技術(shù)群落應(yīng)用于古籍整理出版領(lǐng)域?qū)㈤_辟全新的交叉業(yè)務(wù),需要進(jìn)行跨學(xué)科、跨環(huán)境、跨文化、跨地區(qū)、跨行業(yè)的深度合作,并培養(yǎng)大量復(fù)合型人才,這對(duì)現(xiàn)階段“各行其是”的古籍整理出版系統(tǒng)而言,同樣是一項(xiàng)現(xiàn)實(shí)挑戰(zhàn)。此外,諸如古籍文獻(xiàn)數(shù)據(jù)的保護(hù)與存儲(chǔ)、古籍文獻(xiàn)服務(wù)對(duì)象的信息收集與監(jiān)管、古籍文獻(xiàn)應(yīng)用場(chǎng)景的開發(fā)與維護(hù)以及古籍文獻(xiàn)服務(wù)機(jī)制的構(gòu)建與運(yùn)行等,都是人工智能技術(shù)群落應(yīng)用于古籍文獻(xiàn)整理出版事業(yè)后需要解決的諸多現(xiàn)實(shí)難題。
總之,人工智能技術(shù)群落的誕生與發(fā)展將為古籍文獻(xiàn)整理出版事業(yè)帶來一場(chǎng)深刻而廣泛的變革,危與機(jī)并存。我們既要科學(xué)展望古籍文獻(xiàn)整理出版事業(yè)智能化、智慧化發(fā)展方向與前景,也要時(shí)刻警惕技術(shù)風(fēng)險(xiǎn)和行業(yè)挑戰(zhàn),做好萬無一失的準(zhǔn)備。
|參考文獻(xiàn)|
[1] 黃洛鋒,陳艷芳,孔云. 高質(zhì)量做好新時(shí)代古籍文獻(xiàn)整理出版工作的思考[J]. 出版廣角,2022(23):61-64.
[2] 胡佩,李小青. “人工智能+校對(duì)”的應(yīng)用前景分析[J]. 現(xiàn)代出版,2019(2):59-61.
[3] 我國(guó)古籍藏量5000余萬冊(cè) 數(shù)字化不足一半[EB/OL]. (2016-06-23)[2023-06-02]. https://www.sohu.com/a/85361694_257321.
[4]張杰. 新技術(shù)為古籍整理注入活力[N]. 中國(guó)社會(huì)科學(xué)報(bào),2022-03-17.
[5]洪濤,陳必佳. 古籍?dāng)?shù)字出版領(lǐng)域的知識(shí)服務(wù)模式和場(chǎng)景分析:以古聯(lián)公司為例[J]. 出版廣角,2022(24):51-56.
[6]韓業(yè)庭. 當(dāng)古籍修復(fù)遇上人工智能[N]. 光明日?qǐng)?bào),2022-04-11.