国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識圖譜的古籍數(shù)字化研究前沿熱點及演化趨勢分析

2020-06-29 07:55范桂紅趙純洋
出版廣角 2020年11期
關鍵詞:古籍數(shù)據(jù)庫數(shù)字化

范桂紅 趙純洋

【摘要】? 文章利用Cite Space III軟件梳理CNKI數(shù)據(jù)庫中1998—2019年以古籍數(shù)字化為研究主題的314篇文獻,繪制關鍵詞共現(xiàn)知識圖譜及關鍵詞共現(xiàn)時區(qū)視圖,發(fā)現(xiàn)古籍數(shù)字化研究、古籍數(shù)字化與數(shù)字人文、特殊古籍數(shù)字化、古籍數(shù)據(jù)庫建立與維護、古籍數(shù)字出版與著作權(quán)維護是當前古籍數(shù)字化研究的五大前沿熱點。統(tǒng)籌規(guī)劃并制定統(tǒng)一標準、加強國際合作與交流、培養(yǎng)專業(yè)人才等將成為古籍數(shù)字化研究的未來研究趨勢。

【關? 鍵? 詞】古籍;古籍數(shù)字化;主題演化;文獻計量;Cite Space III

從商周甲骨到秦漢簡帛,從經(jīng)史子集到清人十三經(jīng)疏,從唐宋敦煌寫本到宋元明刻本古書,古籍傳承著中華優(yōu)秀文化所蘊含的精神血脈和道德規(guī)范。古籍數(shù)字化以現(xiàn)代信息技術為手段,將古籍中的語言文字或圖形符號轉(zhuǎn)化為電子數(shù)據(jù),分離了古籍的物質(zhì)形態(tài)和內(nèi)容,將古籍內(nèi)容制作成古籍書目、影像、數(shù)據(jù)庫等,為讀者提供古籍數(shù)字化閱讀及檢索服務。為探索1998—2019年古籍數(shù)字化領域的研究熱點及未來研究趨勢,本文綜合考慮查全率、查準率、可視化布局等相關因素,利用Cite Space III軟件對CNKI數(shù)據(jù)庫中古籍數(shù)字化研究相關的314篇文獻進行關鍵詞共現(xiàn)知識圖譜、關鍵詞共現(xiàn)時區(qū)視圖量化分析,以揭示該領域的研究熱點。

一、研究方法與文獻選取

1.研究方法

Cite Space III軟件能夠確保理論研究及實踐應用的針對性與可行性,避免因數(shù)據(jù)信息冗雜對研究結(jié)果的科學性與客觀性產(chǎn)生影響,可有效提升學術研究的專業(yè)性與實踐性,顯示與預測學科或某研究領域演進過程及前沿熱點,便于挖掘研究文獻所隱藏的知識信息及實現(xiàn)研究成果的數(shù)據(jù)分析與應用推廣。

2.文獻選取

筆者在中國知網(wǎng)高級檢索界面設置“主題=‘古籍并含‘數(shù)字化”或者“主題=‘典籍并含‘數(shù)字化”(精確匹配)檢索詞,作者及作者單位、發(fā)表時間及更新時間、文獻來源、支持基金均設置為不限或者模糊狀態(tài),期刊選擇“核心期刊”“CSSCI”“CSCD”以保證論文質(zhì)量,得到相關文獻共計561條,文獻數(shù)據(jù)采集時間為2020年2月1日。筆者通過閱讀過濾了領導致辭、會議通知、新聞宣傳、卷首語等非學術性文獻,獲得可供進行數(shù)據(jù)分析的有效文獻314篇,并點擊“導出/參考文獻”“Refworks”選項,將下載文獻以“.txt”格式導出。

二、研究結(jié)果與分析

關鍵詞是學術論文研究主題的精煉表達,為了挖掘古籍數(shù)字化研究文獻的主題聚類分布情況,筆者利用Cite SpaceⅢ軟件對314篇相關文獻進行關鍵詞共現(xiàn)知識圖譜分析,獲得網(wǎng)絡核心區(qū)域(N=550)、連接點(E=543)、網(wǎng)絡中間中心勢(Density=0.036),聚類Q值0.8303(>0.5)、S值0.7178(>0.5),得到聚類結(jié)構(gòu)顯著且信度較高的知識圖譜。由圖1可見古籍數(shù)字化研究的知識聚類主要集中在以下五個方面:一是古籍數(shù)字化研究,如出現(xiàn)古籍數(shù)字化(204,0)、數(shù)據(jù)標準(10,0)等關鍵詞詞頻;二是古籍數(shù)字化與數(shù)字人文,如出現(xiàn)古籍整理(82,0)、古籍保護(64,0)、數(shù)字人文(13,0)等關鍵詞詞頻;三是特殊古籍數(shù)字化,如出現(xiàn)中醫(yī)古籍(22,0)、農(nóng)業(yè)古籍(16,0)、少數(shù)民族古籍(10,0)、地方志(9,0)等關鍵詞詞頻;四是古籍數(shù)據(jù)庫建立與維護,如出現(xiàn)古籍數(shù)據(jù)庫(56,0)、自動檢索系統(tǒng)(11,0)、大數(shù)據(jù)(11,0)、古籍數(shù)字資源(8,0)、漢字處理(8,0)等關鍵詞詞頻;五是古籍數(shù)字出版與著作權(quán)維護,如出現(xiàn)數(shù)字出版(12,0)等關鍵詞詞頻??梢钥吹剑S著研究的深入,古籍數(shù)字化研究思路、研究角度、研究對象和研究方向逐漸拓展,研究內(nèi)容和研究技術更為全面和多樣。

1.古籍數(shù)字化研究

古籍數(shù)字化研究主要圍繞古籍數(shù)字化政策、定義、原則、對象、標準體系等方面展開闡述。其一,政策。國務院辦公廳印發(fā)了一系列文件指導古籍數(shù)字化建設工作,如2017年1月下發(fā)的《關于進一步加強古籍保護工作的意見》、《關于實施中華優(yōu)秀傳統(tǒng)文化傳承發(fā)展工程的意見》等。其二,定義。一些學者認為,“古籍數(shù)字化是以利用和保護古籍為目的,通過相關技術將傳世文獻中的語言文字或圖形符號轉(zhuǎn)化為能被計算機識別的數(shù)字符號,進而制成古籍書目、影像、全文數(shù)據(jù)庫的技術”[1]。其三,原則。數(shù)字化是古籍再生性保護的重要手段,應遵循利用保真和整理為主的原則。其四,對象。對象主要為漢文古籍、少數(shù)民族古籍、金石拓片、甲骨、輿圖、中國境內(nèi)發(fā)現(xiàn)的外族遺文、老照片、年畫、宣傳畫等。其五,標準體系。標準體系主要是由實現(xiàn)古籍數(shù)字資源高質(zhì)量管理的技術標準、連接數(shù)字化項目各個機構(gòu)環(huán)節(jié)的管理標準及開發(fā)高質(zhì)量古籍資源數(shù)據(jù)庫工作標準等標準體系構(gòu)成,具有目的性、層次性、協(xié)調(diào)性及比例性等特征。

2.古籍數(shù)字化與數(shù)字人文

數(shù)字人文是將高效計算網(wǎng)絡技術應用于人文學科領域,以實踐、建模、推論或者本體論等手段對傳統(tǒng)人文學科進行挖掘的方式。一些學者提出要將數(shù)字人文前沿實踐應用到古籍數(shù)字化工作中,利用文本挖掘技術提取事先未知、容易理解、有潛在價值的知識[2];借助GIS技術進行文獻知識與歷史進程的靜態(tài)與動態(tài)可視化分析;構(gòu)建基于網(wǎng)絡數(shù)據(jù)采集、專業(yè)數(shù)據(jù)庫獲取、詞頻分析的古籍文本信息可視化展示庫;在全文人工標注的基礎上,將大量電子化的文本集合為語料庫,構(gòu)建自動識別模型[3]?,F(xiàn)階段落地的數(shù)字人文項目有“名人手稿檔案關聯(lián)開放數(shù)據(jù)集”“唐宋文學編年地圖”“絲綢之路歷史地理信息系統(tǒng)建設”“館藏甲骨實物與拓片數(shù)字化資源庫”“敦煌遺珍數(shù)字化資源庫”等。

3.特殊古籍的數(shù)字化

一些特殊古籍如中醫(yī)古籍、農(nóng)業(yè)古籍、少數(shù)民族古籍等的數(shù)字化再生性保護工作值得關注。中醫(yī)古籍以圖文形式記載上古春秋至明清時期中醫(yī)學發(fā)展理論成果和實踐操作經(jīng)驗,具有珍貴的史學研究價值和臨床指導意義。中醫(yī)古籍數(shù)字化建設起到保護紙質(zhì)古籍、挖掘科學信息、傳承中醫(yī)文化與知識的作用,目前已取得多項研究成果,如“中華醫(yī)藥典籍資源庫(測試版)”“中醫(yī)藥珍善本古籍多媒體數(shù)據(jù)庫”“中醫(yī)古籍資源數(shù)據(jù)庫及閱覽系統(tǒng)”等[4]。

農(nóng)業(yè)古籍記錄了古代農(nóng)業(yè)生產(chǎn)過程,反映了我國傳統(tǒng)農(nóng)業(yè)歷史特征,涉及農(nóng)、林、牧、副、漁各個方面。農(nóng)業(yè)古籍數(shù)字化是一項復雜的系統(tǒng)工程,要充分利用專家學者在目錄學、文獻學、歷史學等方面研究成果,建立以古籍數(shù)據(jù)化元數(shù)據(jù)標準為標引,對書目數(shù)據(jù)進行切分、提煉、處理,便于實現(xiàn)信息資源共建共享的書目信息數(shù)據(jù)庫;構(gòu)建圖像、全文、圖文版類型數(shù)據(jù);建立專題農(nóng)業(yè)古籍全文數(shù)據(jù)庫;建立以書目檢索多樣化、參考咨詢服務、網(wǎng)絡連接、農(nóng)業(yè)古籍展示為特征的數(shù)字圖書館。比如《齊民要術》《農(nóng)政全書》《四民月令》《農(nóng)桑輯要》等農(nóng)業(yè)古籍的書目信息數(shù)據(jù)庫、圖文版類型數(shù)據(jù)、全文數(shù)據(jù)庫建設就是典型案例。

少數(shù)民族古籍數(shù)字化是指將蘊藏著少數(shù)民族情感的古籍文獻進行整理與修復、數(shù)字化預處理及轉(zhuǎn)換存儲模式,同時結(jié)合軟硬件平臺建設和特色數(shù)據(jù)庫內(nèi)容建設,以達到將少數(shù)民族傳統(tǒng)文化傳承下去的目的。少數(shù)民族古籍種類繁多,載體形式多樣,如紙質(zhì)、石刻、木刻等,表現(xiàn)形式多樣,如民族歌舞、風俗習俗、手工技藝等,利用數(shù)字化技術可使瀕危古籍孤本、善本、珍本通過平臺活態(tài)化展示。如楚雄州圖書館彝族文獻數(shù)據(jù)庫系統(tǒng)中的彝族古籍《彝族畢摩經(jīng)典譯注》《解冤經(jīng)》《祭龍經(jīng)》實現(xiàn)了彝族古籍書目信息數(shù)據(jù)庫、全文數(shù)據(jù)庫、電子圖書等數(shù)字化使用方式;西雙版納州民族宗教事務局的《西雙版納傣文傳統(tǒng)書法字體字庫》項目滿足了受眾傣族古籍數(shù)字化閱讀的需求。

4.古籍數(shù)據(jù)庫的建立與維護

古籍數(shù)據(jù)庫建設遵循創(chuàng)新、開放、共享的發(fā)展理念,以數(shù)字化技術手段將古籍與現(xiàn)代學者智慧成果進行整合,實現(xiàn)資源共享、知識增值、文化傳承,為讀者提供完整、可靠的史料文獻。當前,古籍數(shù)據(jù)庫建設存在信息處理技術與標準、數(shù)據(jù)資源平臺質(zhì)量、信息資源共享實現(xiàn)等問題[5]。針對以上問題,首先,應根據(jù)古籍選題設定數(shù)據(jù)庫建設目標、分析古籍資源狀況和形成數(shù)據(jù)庫建設基本思路與內(nèi)容;其次,應確定數(shù)據(jù)庫核心模塊,統(tǒng)一標準,實現(xiàn)內(nèi)容資源多維化,標引文獻資源、搜集特色資源、以技術串聯(lián)各類資源,形成目錄檢索型、全文檢索型、知識庫型、大數(shù)據(jù)型等,以呈現(xiàn)古籍的史料價值、專業(yè)特色和歷史文化價值;再次,挖掘特色數(shù)據(jù),優(yōu)化資源結(jié)構(gòu),如《年畫擷英》《文淵閣四庫全書》《中國譜牒庫》《中國金石庫》等數(shù)據(jù)庫的建立就是典型案例。

5.古籍數(shù)字出版與著作權(quán)維護

古籍數(shù)字出版順應“互聯(lián)網(wǎng)+”、大數(shù)據(jù)的技術潮流,積極探尋古籍數(shù)字出版中的著作權(quán)問題。古籍數(shù)字出版工作雖然成果突出,但在開發(fā)形式上以單一圖文采集方式為主,對全文檢索、數(shù)據(jù)統(tǒng)計等模塊功能開發(fā)不夠;在數(shù)據(jù)質(zhì)量上因字庫和字體識別技術存在缺陷,導致多種文字呈現(xiàn)方式并存且出現(xiàn)章節(jié)錯亂情況[6]。相關機構(gòu)在古籍數(shù)字出版過程中打破了傳統(tǒng)出版模式,發(fā)揮計算機處理技術優(yōu)勢,使用Unicode編碼字符集、OCR移動數(shù)據(jù)采集、自然語言處理與語義關聯(lián)、知識組織體系建設等方式實現(xiàn)古籍數(shù)字出版及數(shù)字資源合作。隨著古籍數(shù)字出版工作的開展,古籍數(shù)字出版過程中的著作權(quán)保護問題日益突出,包括古籍整理成果、古籍全文數(shù)據(jù)庫、古籍數(shù)字出版物等方面的保護等,對于這些問題,可以采用加密、水印、權(quán)限設置、終端認證、提升數(shù)字化出版人員著作權(quán)保護意識和構(gòu)建科學完善的古籍數(shù)字出版著作權(quán)保護機制等措施來解決[7]。比如《中華大典·農(nóng)業(yè)典》《明代科舉三錄》《茶書食經(jīng)》《明實錄》《清實錄》《永樂大典》等全文檢索版數(shù)字叢書在這些方面做得很好。

三、啟示與展望

為了更好地保護傳統(tǒng)經(jīng)典、傳承民族精神、弘揚優(yōu)秀歷史文化,相關機構(gòu)和從業(yè)人員致力于保護古籍原貌和內(nèi)容再現(xiàn)的古籍數(shù)字化研究。但這一領域研究尚存在項目規(guī)劃單調(diào)缺乏連續(xù)性、格式種類繁多缺乏統(tǒng)一性、專業(yè)人才匱乏導致數(shù)字化資源力量分散等問題。鑒于此,運用Cite Space III軟件繪制古籍數(shù)字化研究關鍵詞共現(xiàn)時區(qū)視圖(圖2)是解決相關問題的有效策略??偟膩碚f,把握古籍數(shù)字化的研究熱點和趨勢,應做到以下幾個方面。一是要統(tǒng)籌規(guī)劃并制定統(tǒng)一標準,組建國家級古籍資源共享數(shù)據(jù)庫。現(xiàn)有標準體系雖然多,但大多集中在元數(shù)據(jù)標準、著錄規(guī)則、格式轉(zhuǎn)化、文字編碼方面,與國際通用計算機識別兼容的標準存在差距,致使很多數(shù)字化后的古籍無法實現(xiàn)資源共享。二是要加強國際合作與交流。各國在古籍數(shù)字化過程中注重數(shù)據(jù)標準規(guī)范化、開發(fā)建設大量古籍數(shù)字資源,并注重對其他國家古籍數(shù)字化準則的學習,我國古籍數(shù)字化建設應借鑒其他國家在專門數(shù)據(jù)檢索標準的制定、開放資源獲取平臺的搭建、數(shù)據(jù)加工標準的制定等方面的先進經(jīng)驗。三是專業(yè)人才的培養(yǎng)。古籍數(shù)字化不僅是一個技術問題,也是一個文化問題和學術問題,因此,需要大量文獻學、目錄學、版本學、計算機科學與技術等專業(yè)復合型人才對傳統(tǒng)紙質(zhì)古籍進行??闭?、搶救、修復。總的來說,應充分利用古籍數(shù)字化研究成果,適時調(diào)整理論研究思路和研究方法,更新古籍整理思想觀念,逐步形成系統(tǒng)的古籍數(shù)字化整理體系。

|參考文獻|

[1]毛建軍. 古籍數(shù)字化的概念與內(nèi)涵[J]. 圖書館理論與實踐,2007(4):82-84.

[2]范佳. “數(shù)字人文”內(nèi)涵與古籍數(shù)字化的深度開發(fā)[J]. 圖書館學研究,2013(3):29-32.

[3]李娜,包平. 面向數(shù)字人文的館藏方志古籍地名自動識別模型構(gòu)建[J]. 圖書館,2018(5):67-73.

[4]曹霞,裴麗. 中醫(yī)古籍數(shù)字化建設實踐分析與應對策略[J]. 圖書館學研究,2016(13):42-44+66.

[5]陳奕驍,馬愛梅. 科技類古籍數(shù)據(jù)庫建設的創(chuàng)新思考與實踐——以《中國經(jīng)典水利史料數(shù)據(jù)庫》為例[J]. 科技與出版,2016(11):89-92.

[6]徐小濱. 中國古籍出版的探究—基于CNKI的考察[J]. 出版廣角,2016(20):47-49.

[7]畢翔,唐存琛. 本真與還原—古籍善本的數(shù)字化處理研究[J]. 高校圖書館工作,2018(6):47-50+55.

猜你喜歡
古籍數(shù)據(jù)庫數(shù)字化
中醫(yī)古籍“疒”部俗字考辨舉隅
家紡業(yè)亟待數(shù)字化賦能
關于版本學的問答——《古籍善本》修訂重版說明
高中數(shù)學“一對一”數(shù)字化學習實踐探索
高中數(shù)學“一對一”數(shù)字化學習實踐探索
關于古籍保護人才培養(yǎng)的若干思考
我是古籍修復師
數(shù)字化制勝
文水县| 阿鲁科尔沁旗| 墨江| 秦皇岛市| 兴隆县| 鄂托克旗| 旬邑县| 清丰县| 金溪县| 平利县| 襄城县| 中西区| 根河市| 桐乡市| 岳阳市| 安西县| 乳源| 耿马| 元朗区| 乐都县| 阿拉善左旗| 获嘉县| 青州市| 云和县| 泰来县| 澎湖县| 武定县| 嘉祥县| 定兴县| 赤水市| 长乐市| 介休市| 时尚| 梓潼县| 扎赉特旗| 玉门市| 齐齐哈尔市| 始兴县| 罗平县| 黄平县| 越西县|