隨著科學(xué)技術(shù)的快速發(fā)展,出版融合從傳統(tǒng)出版賦能走向全媒體融合階段,數(shù)字技術(shù)與出版行業(yè)的融合步伐逐漸加快[1]。傳統(tǒng)科技類出版社立足于專業(yè)學(xué)術(shù)出版,運用現(xiàn)有的內(nèi)容資源和社會資源,在做實傳統(tǒng)出版的同時,加快融合出版步伐[2]。落實到出版社具體的從業(yè)人員——傳統(tǒng)編輯,其出版融合意識還有待提高。高質(zhì)量發(fā)展是傳統(tǒng)出版和數(shù)字業(yè)務(wù)共同追逐的對象,知識服務(wù)不是單純地憑借紙質(zhì)圖書數(shù)字化的方式來實現(xiàn)對市場的占有,而是通過諸如優(yōu)質(zhì)內(nèi)容資源集聚、再加工、分類標引和知識挖掘等手段,實現(xiàn)了資源重組和增值服務(wù)。2020年,更多消費場景被開啟,尤其是線上產(chǎn)品的深度開發(fā)。作為書業(yè)從業(yè)者的核心人群——編輯,如何更加貼近產(chǎn)業(yè)行業(yè)縱深,將內(nèi)容與讀者做更為密切的連接,或許成為定義編輯未來職業(yè)走向的重要議題[4]。本文試圖從知識服務(wù)實踐的角度出發(fā),以青藏高原科學(xué)考察數(shù)據(jù)庫為例,主要探討內(nèi)容資源建設(shè)、人工標引技術(shù)和信息定制服務(wù)等在數(shù)據(jù)庫建設(shè)過程中的實際應(yīng)用場景,梳理科技出版企業(yè)開展知識服務(wù)的核心競爭力——優(yōu)質(zhì)內(nèi)容資源、專業(yè)化的編輯隊伍和作譯者團隊在出版融合背景下的結(jié)合點,以便為我國專業(yè)學(xué)術(shù)出版機構(gòu)數(shù)字化轉(zhuǎn)型提供借鑒。
青藏高原是地球的第三極,是“亞洲水塔”,其生境變化影響著我國乃至“一帶一路”沿線國家和地區(qū)超過20億人口的生存和發(fā)展,同時青藏高原也扮演著我國重要的生態(tài)安全屏障和戰(zhàn)略資源儲備基地的角色?;谄涮厥獾牡乩碣Y源環(huán)境,第二次青藏高原綜合科學(xué)考察項目的啟動,將有助于審視高原環(huán)境變化機理,優(yōu)化區(qū)域生態(tài)安全格局和體系,對推動青藏高原及周邊地區(qū)的可持續(xù)發(fā)展、推進國家生態(tài)文明建設(shè)等方面都具有十分重要的意義[3]?!暗诙吻嗖馗咴C合科學(xué)考察”項目的啟動,引起國內(nèi)外學(xué)界的高度重視,從國家到地方政府,以及相關(guān)科研院所均對相關(guān)科研成果、數(shù)據(jù)和項目的應(yīng)用有強烈需求。
本項目旨在利用知識組織、數(shù)據(jù)挖掘和語義出版技術(shù)深度聚焦和揭示“科考”相關(guān)科研發(fā)展態(tài)勢和產(chǎn)出情況等,實現(xiàn)科研成果發(fā)布的基本需求,提升科技成果對青藏高原地區(qū)發(fā)展的引領(lǐng)和支撐作用。在此基礎(chǔ)之上,以本項目構(gòu)建的平臺為抓手,基于精準畫像和大數(shù)據(jù)出版服務(wù),大力開展專業(yè)化、定制化科技決策支持服務(wù),將相關(guān)領(lǐng)域科技出版業(yè)務(wù)拓展至科學(xué)知識服務(wù)和科研解決方案服務(wù)。
依托“青藏高原科學(xué)考察”重大研究項目、科研機構(gòu)及專家信息,以及可獲取的數(shù)據(jù)信息,依托科學(xué)技術(shù)部、國家自然基金委等項目發(fā)布機構(gòu)和中國科學(xué)院等國家高端科技智庫,開展“青藏高原科學(xué)考察”相關(guān)科研項目信息發(fā)布、成果跟蹤等服務(wù)。在知識組織模式上,以大數(shù)據(jù)技術(shù)為基礎(chǔ),建立“青藏高原科學(xué)考察”相關(guān)科研項目、數(shù)據(jù)和信息采集、存儲、挖掘、分析、共享平臺。采取定向采集和合作收集科研、科考各類數(shù)據(jù)形成大數(shù)據(jù)池,支持采集和查詢結(jié)果的智能匹配與關(guān)聯(lián),實現(xiàn)統(tǒng)計學(xué)軟件智能交互分析,為“青藏高原科學(xué)考察”提供重要的信息支撐。
基于“青藏高原科學(xué)考察”科研成果形態(tài)的發(fā)布,在全媒體出版技術(shù)支持下開展內(nèi)容資源的碎片化拆分、體系化重組和智能化應(yīng)用,提升科研成果的傳播性和易用性。在知識組織模式上,建立基于“青藏高原科學(xué)考察”相關(guān)術(shù)語表、敘詞表等概念和屬性上的映射體系,確定每一類內(nèi)容資源的元數(shù)據(jù)規(guī)范形式和連接操作,對“青藏高原科學(xué)考察”相關(guān)專業(yè)領(lǐng)域內(nèi)多種類型資源進行描述、組織、集成和建設(shè),支持檢索、展示、關(guān)聯(lián)、推送等各種科研場景應(yīng)用。
依托“青藏高原科學(xué)考察”信息支撐平臺和資源共享平臺,對接科研成果轉(zhuǎn)化需求,為供需雙方搭建合作交流的平臺,提供資源開發(fā)、建設(shè)方案、技術(shù)創(chuàng)新等方面的咨詢研究。在平臺上利用語義技術(shù)發(fā)掘科技成果、項目、政策、需求間的顯性和隱性關(guān)聯(lián)關(guān)系,實現(xiàn)各類文本、圖像和多媒體資源對象及其知識內(nèi)容的多維標簽和語義描述,深入揭示多個維度中的語義關(guān)聯(lián),通過關(guān)聯(lián)數(shù)據(jù)構(gòu)建“青藏高原科學(xué)考察”科技信息和知識網(wǎng)絡(luò),實現(xiàn)需求和信息資源在語義層面的智能匹配,提升供需對接效率。
內(nèi)容資源基礎(chǔ)是專業(yè)出版社走向知識服務(wù)的第一步。傳統(tǒng)出版社數(shù)字化轉(zhuǎn)型都依托自身的優(yōu)勢資源,通過對紙質(zhì)出版物進行結(jié)構(gòu)化處理、內(nèi)容標引、數(shù)據(jù)集成和交互可視化表達等處理形成知識庫。通過合理地組織和使用內(nèi)容資源,有針對性地滿足用戶需求。專題數(shù)據(jù)庫的數(shù)據(jù)獲取方式包括三個方面,即自建數(shù)據(jù)庫的數(shù)據(jù)采集、深度挖掘已購數(shù)據(jù)庫資源以及通過采集外部的數(shù)字資源[5]。
青藏高原科學(xué)考察數(shù)據(jù)庫產(chǎn)品主要依托社內(nèi)專業(yè)出版積累的大量內(nèi)容資源,以支撐和滿足平臺的數(shù)字化、碎片化、系統(tǒng)化和規(guī)范化重組。其中,與“青藏高原科學(xué)考察”主題最直接相關(guān)的圖書資源為兩次科考的相關(guān)成果,主要包括“青藏高原科學(xué)考察叢書”(西藏部分),合計36部41冊2 300余萬字,以及正在陸續(xù)出版的“第二次青藏高原綜合科學(xué)考察研究叢書”(100冊)。青藏高原作為地球系統(tǒng)多圈同時存在并相互強烈作用的典型地區(qū),冰凍圈和水循環(huán)過程與影響成為這一地區(qū)最受關(guān)注的科學(xué)問題,建設(shè)主要依托地球系統(tǒng)科學(xué),相關(guān)圖書品種約1 000余種。這些選題資源和圖書出版成果可為數(shù)據(jù)庫的建立提供穩(wěn)定的內(nèi)容資源基礎(chǔ)。
在公共資源方面,可獲取的數(shù)據(jù)資源包括地理空間數(shù)據(jù)和相關(guān)的統(tǒng)計數(shù)據(jù)資料。目前,“國家青藏高原科學(xué)數(shù)據(jù)中心”“中國高寒區(qū)地表過程與環(huán)境觀測研究網(wǎng)絡(luò)”等可為數(shù)據(jù)庫提供豐富的數(shù)據(jù)資源。中國科學(xué)院青藏高原研究所、地理科學(xué)與資源研究所(包括網(wǎng)絡(luò)空間地理學(xué)實驗室)、西雙版納熱帶植物園、空天信息研究院、西北生態(tài)環(huán)境資源研究院等單位建成或在建科研數(shù)據(jù)平臺,與其合作對接能夠形成本產(chǎn)品的潛在數(shù)據(jù)源。同時,中國科學(xué)院A類戰(zhàn)略性先導(dǎo)科技專項“泛第三極環(huán)境變化與綠色絲綢之路建設(shè)”、第二次青藏高原綜合科學(xué)考察研究國家專項,“三極環(huán)境與氣候變化”國際大科學(xué)計劃等,都將助推知識服務(wù)平臺的建設(shè)。
在充分考慮資源規(guī)模、潛在受眾和產(chǎn)品導(dǎo)向的基礎(chǔ)上,打造以用戶需求為中心、實現(xiàn)“精準畫像”的知識服務(wù)模式。此外,由于青藏高原地域特殊性和地球系統(tǒng)科學(xué)的屬性,還需要加強圖表庫和視頻庫的建設(shè)工作,單獨建立視頻庫,與傳統(tǒng)資源實現(xiàn)互聯(lián)互動。
知識標引工作是實現(xiàn)優(yōu)質(zhì)內(nèi)容資源結(jié)構(gòu)化(數(shù)字化)的最重要工具。信息檢索是開展知識服務(wù)的第一步,而標引是實現(xiàn)信息檢索的必要前提。通過構(gòu)建適用于數(shù)據(jù)庫或知識服務(wù)平臺的標引體系,通過主題詞表的構(gòu)建和敘詞表的完善來實現(xiàn)全面標引,以便能夠更精準化地檢索。知識體系的構(gòu)建包括多維度主題分類、領(lǐng)域主題詞表及領(lǐng)域本體,而目前多數(shù)出版社傾向于采用領(lǐng)域主題詞表的方式來完成知識體系的建構(gòu)和知識服務(wù)的運行。選取領(lǐng)域主題詞表的構(gòu)建方式,由于主題詞的數(shù)量較為龐大,將會迫使開展知識服務(wù)的出版機構(gòu)投入更多的人力和財力[6]。
青藏高原科學(xué)考察的相關(guān)出版成果以區(qū)域案例分析研究為主,因而數(shù)據(jù)庫匯聚了大量結(jié)構(gòu)化的調(diào)查資料和一手統(tǒng)計數(shù)據(jù),它們可以為科研院所及專家學(xué)者提供豐富的一手資料和區(qū)域典型案例,也為學(xué)術(shù)研究以及現(xiàn)實成果轉(zhuǎn)化提供充足的可信依據(jù)。青藏高原科學(xué)考察數(shù)據(jù)庫項目以學(xué)科知識圖譜和專題標引體系為基礎(chǔ),對內(nèi)容資源進行細分,其標引需要有較強的學(xué)科背景,同時作為典型的區(qū)域主題類數(shù)據(jù)庫,其主題詞表的構(gòu)建和流程規(guī)范的建立也具有明顯的示范意義。
1)主題詞表的構(gòu)建。根據(jù)國家科技名詞審定委員會所發(fā)布的學(xué)科科技名詞,確定各學(xué)科領(lǐng)域的敘詞,整理成為專業(yè)敘詞表(主題詞表)。依據(jù)敘詞表確定各敘詞包含的語詞(詞匯),并參考《中國圖書館分類法》建立參照系統(tǒng),形成知識庫內(nèi)容標引、知識關(guān)聯(lián)功能實現(xiàn)的基礎(chǔ)。
2)專業(yè)編輯標引。由于先期語料庫和經(jīng)驗數(shù)據(jù)的缺乏,難以通過機器學(xué)習(xí)經(jīng)驗標引數(shù)據(jù),機器自動標引的準確率會相對較低。因而,在數(shù)據(jù)庫建立初期,由地學(xué)及相關(guān)學(xué)科背景的專業(yè)出版編輯和數(shù)字出版編輯根據(jù)主題詞表規(guī)則,對標引知識庫中的內(nèi)容資源進行編輯標引,包括內(nèi)容文本的來源、題目和作者、摘要和關(guān)鍵詞等要素,對已經(jīng)在庫的內(nèi)容文本作好分類[7]。
3)質(zhì)量審核。由于人工標引存在主觀認知的差異性,因而數(shù)字出版單位應(yīng)該指派具有一定專業(yè)背景的編輯來負責對已標引內(nèi)容的質(zhì)量進行審核,在此基礎(chǔ)之上,定期對所標引的內(nèi)容開展批量驗證和優(yōu)化,從而確保標引流程的規(guī)范性及標引結(jié)果的準確性。
4)標引規(guī)范和流程建設(shè)。在充分學(xué)習(xí)各類標準規(guī)范的基礎(chǔ)上,以國家科技名詞審定委員會所發(fā)布的學(xué)科科技名詞和中國圖書館分類法為基準做映射與關(guān)聯(lián),利用青藏科考數(shù)據(jù)庫的標引流程和方法,對區(qū)域主題類數(shù)據(jù)庫標引體系的建立和信息檢索的完善都具有極強的借鑒意義,也能夠在一定程度上對區(qū)域主題類數(shù)據(jù)庫產(chǎn)品的一貫性和質(zhì)量的穩(wěn)定性做出保障。同時,探索編輯標引規(guī)范和編輯標引質(zhì)量管理辦法,梳理優(yōu)化編輯標引工作流程,可為主題類數(shù)據(jù)庫編輯標引工作的規(guī)范化奠定基礎(chǔ)。
優(yōu)質(zhì)內(nèi)容資源集聚和標引體系的建立可以滿足知識服務(wù)的基本需求,而迅猛發(fā)展的信息科技水平和快節(jié)奏的工作生活壓力使得個人閱讀需求趨向個性化和碎片化的方式。在這種情形下,精準化讀者畫像并提供所需的數(shù)字化服務(wù),是融合出版時代背景下數(shù)字出版機構(gòu)重要的發(fā)展方向。加速由產(chǎn)品導(dǎo)向轉(zhuǎn)為用戶導(dǎo)向的思想轉(zhuǎn)變,模擬用戶的閱讀場景,把關(guān)注點更多的放在其閱讀體驗和閱讀習(xí)慣改變等方面,以最適合的出版方式來呈現(xiàn)優(yōu)質(zhì)的內(nèi)容資源,打造用戶定制需求服務(wù)方案,并且根據(jù)用戶體驗和反饋不斷地改進已有的服務(wù)模式欠缺的方面和完善現(xiàn)有的知識服務(wù)體系,進而達到數(shù)據(jù)庫的定制服務(wù)功能與讀者(用戶)的需求匹配的目的,而這種服務(wù)模式在目前比較適合學(xué)術(shù)性和專業(yè)性較強的專業(yè)出版社。
媒體融合發(fā)展背景下,出版社應(yīng)發(fā)揮自身內(nèi)容資源和社會資源等優(yōu)勢,探索和完善從內(nèi)容提供商到文化服務(wù)商的融合出版之路。而作為出版的中堅力量,圖書編輯在融合發(fā)展和知識服務(wù)轉(zhuǎn)型實踐的過程中,應(yīng)該堅持以市場需求為導(dǎo)向,充分利用自身優(yōu)勢資源,增強自身信息拓展與整合能力,找準知識服務(wù)轉(zhuǎn)型與傳統(tǒng)出版工作的結(jié)合點,推進出版業(yè)務(wù)同向發(fā)展。通過信息支撐平臺建設(shè),加大對內(nèi)容資源的采集和整理,及時收集領(lǐng)域內(nèi)的項目進展、科研機構(gòu)和專家信息等,讓編輯或者出版社更加貼近產(chǎn)業(yè)行業(yè)縱深,為圖書出版聚集了更多的選題和作者資源;通過資源共享平臺建設(shè),利用專業(yè)優(yōu)勢和對內(nèi)容資源的把控,建立主題標引范式和知識加工的規(guī)范流程,在圖書出版的審讀或者加工階段,就可以有意識地開展內(nèi)容資源的深度挖掘,這樣既能保障出版產(chǎn)品的質(zhì)量,又能縮短數(shù)字產(chǎn)品的生產(chǎn)周期;通過交互式服務(wù)平臺建設(shè),利用知識推薦和定制服務(wù),重構(gòu)編輯(圖書產(chǎn)品)與讀者的關(guān)系,實現(xiàn)出版社由產(chǎn)品生產(chǎn)商向服務(wù)提供商轉(zhuǎn)變。