国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向動(dòng)態(tài)數(shù)字出版的信息技術(shù)領(lǐng)域主題分類規(guī)范研究*

2016-02-12 18:56冉從敬涂文艷
圖書(shū)館論壇 2016年8期
關(guān)鍵詞:詞表主題詞表標(biāo)引

冉從敬,涂文艷

面向動(dòng)態(tài)數(shù)字出版的信息技術(shù)領(lǐng)域主題分類規(guī)范研究*

冉從敬,涂文艷

文章介紹數(shù)字出版時(shí)代傳統(tǒng)出版行業(yè)面臨的挑戰(zhàn),調(diào)查國(guó)內(nèi)外數(shù)字出版與信息技術(shù)領(lǐng)域主題詞表標(biāo)準(zhǔn)規(guī)范研究現(xiàn)狀。以我國(guó)信息技術(shù)領(lǐng)域主題詞表編制為例,介紹其技術(shù)路線、編制方法、編制原則以及詞表特點(diǎn),為科教領(lǐng)域動(dòng)態(tài)出版標(biāo)準(zhǔn)規(guī)范研究提供借鑒。

動(dòng)態(tài)出版數(shù)字出版信息技術(shù)主題詞表分類標(biāo)準(zhǔn)

引用本文格式冉從敬,涂文艷.面向動(dòng)態(tài)數(shù)字出版的信息技術(shù)領(lǐng)域主題分類規(guī)范研究[J].圖書(shū)館論壇,2016(8):60-64.

1 研究概述

1.1研究背景及概念

隨著數(shù)字時(shí)代的到來(lái),傳統(tǒng)的傳媒形態(tài)發(fā)生了巨大變化,出版物載體從紙介質(zhì)一統(tǒng)天下到音像、電子、多媒體、網(wǎng)絡(luò)出版和數(shù)字出版并起。數(shù)字出版使出版物內(nèi)容形式、編輯模式、生產(chǎn)流程、傳播介質(zhì)和管理模式等都有了創(chuàng)新。中國(guó)新聞出版研究院“第十二次全國(guó)國(guó)民閱讀調(diào)查”數(shù)據(jù)顯示:2014年數(shù)字化閱讀方式(網(wǎng)絡(luò)在線閱讀、手機(jī)閱讀、電子閱讀器閱讀、光盤閱讀、Pad閱讀等)的接觸率為58.1%,較2013年的50.1%上升了8.0個(gè)百分點(diǎn),首次超過(guò)了圖書(shū)閱讀率?!?014年新聞出版產(chǎn)業(yè)分析報(bào)告》指出,2014年中國(guó)共出版電子出版物11823種,較2013年增長(zhǎng)1.0%;數(shù)字出版實(shí)現(xiàn)營(yíng)業(yè)收入3387.7億元,較2013年增長(zhǎng)33.4%,占全行業(yè)營(yíng)業(yè)收入的17.0%,這表明我國(guó)數(shù)字出版繼續(xù)保持較高增速,行業(yè)地位繼續(xù)提升,傳統(tǒng)出版與新興出版的融合發(fā)展進(jìn)一步深入。

自20世紀(jì)90年代以來(lái),互聯(lián)網(wǎng)信息技術(shù)、數(shù)字化技術(shù)的不斷變革引發(fā)了出版行業(yè)的變革與創(chuàng)新,先后出現(xiàn)“桌面出版”“電子出版”“網(wǎng)絡(luò)出版”“全媒體出版”“數(shù)字出版”“復(fù)合動(dòng)態(tài)出版”等新出版形態(tài)和概念[1]。目前數(shù)字出版是我國(guó)出版界普遍接受和認(rèn)同的能夠比較全面總結(jié)和概括新時(shí)期出版業(yè)形態(tài)特點(diǎn)的概念。但是,對(duì)于如何定義“數(shù)字出版”仍存在不同看法。目前一般認(rèn)為,數(shù)字出版產(chǎn)品包括數(shù)字圖書(shū)、數(shù)字報(bào)紙、數(shù)字期刊、數(shù)據(jù)庫(kù)出版物、手機(jī)書(shū)、手機(jī)報(bào)、手機(jī)刊、手機(jī)音樂(lè)、電子書(shū)、動(dòng)漫和網(wǎng)絡(luò)游戲產(chǎn)品[2]。動(dòng)態(tài)出版是指采集和管理結(jié)構(gòu)化、可重用的數(shù)字內(nèi)容,并使之可以按需以任何媒體形態(tài)分發(fā)的新型數(shù)字出版形式。動(dòng)態(tài)出版與傳統(tǒng)出版的區(qū)別在于其信息來(lái)源渠道與發(fā)布平臺(tái)的多樣化、集成化、自動(dòng)化、個(gè)性化。

我國(guó)關(guān)于主題詞表的研究始于20世紀(jì)50年代,至今已編制修訂了上百部綜合性、專業(yè)性的主題詞表。主題詞表又稱敘詞表,是一種情報(bào)語(yǔ)言,目的是標(biāo)引文獻(xiàn),使用戶根據(jù)詞表提供的主題詞檢索出相關(guān)結(jié)果。隨著計(jì)算機(jī)技術(shù)的發(fā)展,其功能發(fā)生相應(yīng)的變化,被作為一種詞庫(kù)用于文獻(xiàn)數(shù)據(jù)庫(kù)的自動(dòng)標(biāo)引和組配工具[3]。目前尚未編制出比較系統(tǒng)完善的主題詞表供數(shù)字出版使用,因此,編制一部分類科學(xué)、體系完整、自動(dòng)化程度高、互操作性強(qiáng)的主題詞表顯得尤為重要。

1.2研究目標(biāo)及意義

為應(yīng)對(duì)新媒體、數(shù)字出版的挑戰(zhàn),科技部于2012年發(fā)布《動(dòng)態(tài)數(shù)字出版關(guān)鍵支撐技術(shù)研發(fā)與應(yīng)用示范》研究項(xiàng)目可行性報(bào)告,該研究項(xiàng)目投入資金龐大,參與研究主體多樣化,目標(biāo)是實(shí)現(xiàn)“一次制作,多元發(fā)布;深度標(biāo)引,多重應(yīng)用”的新型出版方式?;谠擁?xiàng)目,武漢大學(xué)于2012年申報(bào)“面向科技教育領(lǐng)域的動(dòng)態(tài)數(shù)字出版標(biāo)準(zhǔn)規(guī)范研究”課題,以期建立相應(yīng)的規(guī)范標(biāo)準(zhǔn)和完善的專業(yè)知識(shí)分類體系;研究面向信息技術(shù)領(lǐng)域的數(shù)字出版主題詞表編制方法,包括主題詞表的定位和范圍界定、主題詞表編制原則、分類方法和目錄體系編制原則以及編碼方法的確定、主題詞表及其間的相互關(guān)系的維護(hù)等方面,編制信息技術(shù)領(lǐng)域主題詞表;構(gòu)建以本體為基礎(chǔ)的知識(shí)庫(kù),并考察適用于動(dòng)態(tài)科教數(shù)字出版的本體元素間的相互關(guān)系。

敘詞表的構(gòu)建和使用是文本挖掘和信息檢索的基礎(chǔ)[4]。為此,編制《信息技術(shù)領(lǐng)域分類主題詞表》可以使我國(guó)出版行業(yè)擁有完善統(tǒng)一的數(shù)字內(nèi)同結(jié)構(gòu)化標(biāo)準(zhǔn),給內(nèi)容交換、重組再利用、面向不同載體發(fā)布等操作帶來(lái)便利。與此同時(shí),內(nèi)容提供商的出版單位可以適應(yīng)多渠道發(fā)行,避免因內(nèi)容轉(zhuǎn)化而出現(xiàn)大量不必要的內(nèi)容重復(fù)。此外,通過(guò)對(duì)相應(yīng)規(guī)范標(biāo)準(zhǔn)的建立,實(shí)現(xiàn)不同系統(tǒng)之間高品質(zhì)、個(gè)性化的多媒體體驗(yàn),為整體提升我國(guó)數(shù)字出版行業(yè)的生產(chǎn)力和競(jìng)爭(zhēng)力做出先導(dǎo)型貢獻(xiàn)。

2 動(dòng)態(tài)數(shù)字出版與主題詞表標(biāo)準(zhǔn)規(guī)范研究現(xiàn)狀

2.1國(guó)外數(shù)字出版與主題詞表標(biāo)準(zhǔn)規(guī)范研究現(xiàn)狀

20世紀(jì)90年代初,英美等發(fā)達(dá)國(guó)家的出版商開(kāi)始開(kāi)發(fā)在線數(shù)據(jù)平臺(tái),數(shù)字出版行業(yè)標(biāo)準(zhǔn)也得到充分發(fā)展,建立起完整的標(biāo)準(zhǔn)體系,包括標(biāo)識(shí)符類標(biāo)準(zhǔn)、元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)格式標(biāo)準(zhǔn)、數(shù)據(jù)交換標(biāo)準(zhǔn)。電子數(shù)據(jù)交換標(biāo)準(zhǔn)、版權(quán)類標(biāo)準(zhǔn)以及管理類標(biāo)準(zhǔn)[5]。出版資源利用上也有很多規(guī)范,如ISO頒布的ISO1951:2007標(biāo)準(zhǔn)、流行的DocBook(一些標(biāo)準(zhǔn)和工具的集合)、DITA(一個(gè)基于XML的體系結(jié)構(gòu),用于發(fā)布技術(shù)信息)等數(shù)字內(nèi)容描述規(guī)范。目前資源描述框架(Resource Description Framework,RDF)理念已廣泛應(yīng)用于美國(guó)、歐洲的數(shù)字出版與數(shù)字圖書(shū)館建設(shè),國(guó)際上根據(jù)資源描述框架標(biāo)準(zhǔn)進(jìn)行數(shù)字內(nèi)容資源聚合。在傳統(tǒng)的學(xué)術(shù)出版物編寫、著錄方面,國(guó)際標(biāo)準(zhǔn)規(guī)范有《ISO 690信息與文獻(xiàn)——書(shū)目參考——內(nèi)容、形式和結(jié)構(gòu)》《ISO 999信息與文獻(xiàn)——索引的內(nèi)容、組織和編排指南》等。在元數(shù)據(jù)著錄、電子數(shù)據(jù)交換、數(shù)字資源的標(biāo)識(shí)與鏈接等方面,國(guó)際標(biāo)準(zhǔn)有《都柏林核心元數(shù)據(jù)集》(Dublin Core Element Set)、《電子書(shū)元數(shù)據(jù)》(E-book Metadata)、《ISO 11179系列標(biāo)準(zhǔn)》(ISO 11179 Series Standard)、《電子資源國(guó)際標(biāo)準(zhǔn)書(shū)目著錄》(International Standard Bibliographic Description for Electronic Resources)、《機(jī)讀編目格式標(biāo)準(zhǔn)》 (MAchine-Readable Cataloging)、《圖書(shū)在線信息交換標(biāo)準(zhǔn)》(ON-line Information eXchangeFor Books)、《數(shù)字對(duì)象唯一標(biāo)識(shí)符標(biāo)準(zhǔn)》(ISO/DIS 26324Information and documentation-Digital object identifier system)。

在主題詞表編制上,國(guó)際上通用的主要有ISO2788《單語(yǔ)種敘詞表編制規(guī)則》、ISO5964《多語(yǔ)種敘詞表的編制規(guī)則》以及在ISO2788和ISO5964基礎(chǔ)上更新和擴(kuò)展的ISO25964標(biāo)準(zhǔn)。2008年7月ISO首先推出ISO WD25964-1,2008年底ISO推出ISO CD25964-1,并面向各國(guó)廣泛征求意見(jiàn)。盡管國(guó)外在出版資源利用及主題詞表編制標(biāo)準(zhǔn)上發(fā)展較為成熟,但是面向動(dòng)態(tài)數(shù)字出版的標(biāo)準(zhǔn)規(guī)范研究仍比較缺乏,尤其是在信息技術(shù)領(lǐng)域缺乏一個(gè)內(nèi)容專業(yè)化、體系科學(xué)化、標(biāo)準(zhǔn)規(guī)范化、操作可視化的面向動(dòng)態(tài)數(shù)字出版的主題詞表。為此,加強(qiáng)面向動(dòng)態(tài)出版的信息技術(shù)領(lǐng)域主題詞分類規(guī)范研究順應(yīng)科學(xué)技術(shù)發(fā)展的需要,能夠促進(jìn)科教領(lǐng)域數(shù)字出版業(yè)的健康有序發(fā)展。

2.2中國(guó)數(shù)字出版與主題詞表標(biāo)準(zhǔn)規(guī)范研究現(xiàn)狀

目前中國(guó)出版單位掌握了大量的內(nèi)容資源,如何最大化地利用這些資源,生產(chǎn)出滿足紙質(zhì)、網(wǎng)絡(luò)、手機(jī)、手持閱讀設(shè)備、戶外大屏、高清電視等各種媒體終端閱讀需求的多形態(tài)的內(nèi)容出版物,進(jìn)而實(shí)現(xiàn)從產(chǎn)品銷售到知識(shí)服務(wù)的轉(zhuǎn)變和升級(jí),是出版單位在應(yīng)對(duì)新媒體、數(shù)字出版面臨的最大挑戰(zhàn)。由于缺乏業(yè)務(wù)經(jīng)驗(yàn)和技術(shù)力量,各出版單位投入大量的人力物力制定格式規(guī)范,然而按照各自形成的存儲(chǔ)格式規(guī)范加工出來(lái)的數(shù)字內(nèi)容資源格式不盡相同,加工質(zhì)量參差不齊,可復(fù)用的程度相差很大,可交換性很低。雖然中國(guó)對(duì)國(guó)際上成熟的元數(shù)據(jù)體系的中文標(biāo)準(zhǔn)化工作取得了一定成效,但實(shí)際應(yīng)用仍然存在問(wèn)題。比如,內(nèi)容加工缺乏統(tǒng)一標(biāo)準(zhǔn),資源整合不當(dāng),數(shù)字出版技術(shù)標(biāo)準(zhǔn)不統(tǒng)一。數(shù)字內(nèi)容產(chǎn)品具有豐富性、結(jié)構(gòu)性、復(fù)雜性、動(dòng)態(tài)性、綜合性以及數(shù)字出版的文本格式多樣化等特點(diǎn),都是導(dǎo)致數(shù)字資源出版標(biāo)準(zhǔn)難以統(tǒng)一的重要原因。此外,數(shù)據(jù)交換、數(shù)字出版支撐平臺(tái)建設(shè)標(biāo)準(zhǔn)不一,技術(shù)架構(gòu)多樣化等也限制了中國(guó)數(shù)字出版產(chǎn)業(yè)的健康發(fā)展,造成人力物力財(cái)力等浪費(fèi)。

主題詞表編制主要有4個(gè)國(guó)家標(biāo)準(zhǔn):(1)GB/T 13190—1991《漢語(yǔ)敘詞表編制規(guī)則》,以ISO2788:1985《單語(yǔ)種敘詞表編制規(guī)則》為參照,結(jié)合《漢語(yǔ)主題詞表》等敘詞表的編制經(jīng)驗(yàn)。(2)GB/T15417—1994《文獻(xiàn)多語(yǔ)種敘詞表編制規(guī)則》,修改采用ISO5964:1985,規(guī)定以漢語(yǔ)為交換語(yǔ)言的多語(yǔ)種敘詞表的編制原則、詞間關(guān)系處理和語(yǔ)言處理原則。(3)GB/T19486—2004《電子政務(wù)主題詞表編制規(guī)則》。(4)GB/T 3860—1995《文獻(xiàn)敘詞標(biāo)引規(guī)則》,修改采用ISO5963:1985《文獻(xiàn)工作——文獻(xiàn)審讀、主題分析與選定標(biāo)引詞的方法》,通過(guò)對(duì)敘詞標(biāo)引過(guò)程進(jìn)行控制,規(guī)范標(biāo)引人員的敘詞標(biāo)引和提高檢索人員的檢索質(zhì)量。此外,相關(guān)行業(yè)標(biāo)準(zhǔn)有:(1)GJB1776A—1999《軍用主題詞表編制規(guī)則》,是國(guó)家軍用標(biāo)準(zhǔn),規(guī)定軍用敘詞表編制中應(yīng)遵循的原則、方法和要求。(2)GJB5098—2004《軍用電子敘詞表編制規(guī)范》,是國(guó)家軍用標(biāo)準(zhǔn),規(guī)定了編制軍用電子敘詞表的基本規(guī)則和應(yīng)遵循的技術(shù)規(guī)范,對(duì)軍用電子敘詞表的體系結(jié)構(gòu)、數(shù)據(jù)組織、功能要求、運(yùn)行環(huán)境、數(shù)據(jù)交換等主要內(nèi)容進(jìn)行規(guī)定[6]。由此可見(jiàn),中國(guó)在主題詞表的相關(guān)標(biāo)準(zhǔn)建設(shè)上相對(duì)成熟和完善,但面向動(dòng)態(tài)數(shù)字出版的相關(guān)標(biāo)準(zhǔn),在信息技術(shù)領(lǐng)域尚未建立比較完整的主題詞表,為此《信息技術(shù)領(lǐng)域分類主題詞表》的編制研究在依據(jù)和參考現(xiàn)有標(biāo)準(zhǔn)的基礎(chǔ)上,應(yīng)建立符合自己特點(diǎn)的分類主題詞表。

3 《信息技術(shù)領(lǐng)域分類主題詞表》編制實(shí)例

3.1技術(shù)路線設(shè)計(jì)

傳統(tǒng)的敘詞表構(gòu)建過(guò)程分為3個(gè)技術(shù)子過(guò)程。首先是概念和術(shù)語(yǔ)的收集,其次是概念和術(shù)語(yǔ)的形成和定義,最后是組織概念和術(shù)語(yǔ)[7]。綜合多種方法和標(biāo)準(zhǔn),該《信息技術(shù)領(lǐng)域分類主題詞表》采取的技術(shù)路線是“融合—改造—?jiǎng)?chuàng)新”思路。采用多種形式,組織各領(lǐng)域?qū)<已杏?,結(jié)合數(shù)字出版現(xiàn)狀和國(guó)家有關(guān)領(lǐng)域的總體要求,整合與組織各相關(guān)標(biāo)準(zhǔn),進(jìn)行補(bǔ)充完善和協(xié)調(diào)配合,編制符合現(xiàn)狀的動(dòng)態(tài)數(shù)字出版標(biāo)準(zhǔn)體系,通過(guò)應(yīng)用示范進(jìn)行工程化驗(yàn)證,并在后續(xù)應(yīng)用中不斷進(jìn)行完善和改進(jìn)。更具體而言,主要是按照構(gòu)建數(shù)字內(nèi)容類型定義規(guī)范和知識(shí)分類體系的路線進(jìn)行研究。

構(gòu)建動(dòng)態(tài)數(shù)字科教出版主題詞表的技術(shù)路線是數(shù)據(jù)采集分析與理論研究相結(jié)合的方式。首先將研究領(lǐng)域限定在科技出版中最活躍的信息技術(shù)出版物領(lǐng)域,調(diào)研和采集已有知識(shí)組織體系及其相關(guān)元數(shù)據(jù)集,從已有的數(shù)據(jù)庫(kù)中抽取的關(guān)鍵詞和用戶檢索詞等一起構(gòu)成來(lái)源素材;利用設(shè)計(jì)出的數(shù)字內(nèi)容類型規(guī)范(詞形規(guī)范、詞義規(guī)范)等遴選規(guī)范形成概念;在借鑒綜合性詞表和專業(yè)詞表概念語(yǔ)義關(guān)系的基礎(chǔ)上,借助詞共現(xiàn),建立概念間相關(guān)屬性關(guān)系;同時(shí)建立涵蓋全學(xué)科的范疇體系,并對(duì)概念進(jìn)行相應(yīng)范疇體系歸類,最終形成動(dòng)態(tài)數(shù)字科教出版相關(guān)領(lǐng)域主題詞表。

3.2詞表編制過(guò)程及特點(diǎn)

3.2.1詞表編制流程

(1)明確詞表的定位與范圍?!缎畔⒓夹g(shù)領(lǐng)域分類主題詞表》是用于電子工業(yè)出版社內(nèi)部使用的、面向信息技術(shù)領(lǐng)域的專業(yè)主題詞表,帶有主題詞范疇索引(即分類體系),因此又稱為分類主題詞表。《信息技術(shù)領(lǐng)域分類主題詞表》作為規(guī)范的、帶有范疇索引的主題詞表可以起到規(guī)范標(biāo)引用詞的作用。它給出版社所有的內(nèi)容編輯人員提供了一套統(tǒng)一的標(biāo)引參考標(biāo)準(zhǔn),保證了標(biāo)引用詞的規(guī)范性、一致性和科學(xué)性,可以有效防止自由標(biāo)引帶來(lái)的凌亂化,有利于文獻(xiàn)聚類和數(shù)據(jù)挖掘,同時(shí)也為未來(lái)實(shí)現(xiàn)自動(dòng)標(biāo)引奠定了基礎(chǔ)。

此分類主題詞表不僅適用于文本類信息分類標(biāo)引標(biāo)準(zhǔn),還適用于數(shù)據(jù)、圖片、聲視頻信息的分類和標(biāo)引;不僅適用于傳統(tǒng)出版物的分類標(biāo)引,還適用于電子書(shū)、數(shù)據(jù)庫(kù)等各種新型出版物和數(shù)字內(nèi)容資源的分類標(biāo)引,是出版社所有內(nèi)容資源的基礎(chǔ)性加工參考標(biāo)準(zhǔn)。

(2)確定主題詞來(lái)源及詞表結(jié)構(gòu)。主題詞來(lái)源豐富,包括最常用的分類工具書(shū)《中國(guó)圖書(shū)館分類法》(第五版)、《中國(guó)科學(xué)院圖書(shū)館圖書(shū)分類法》(第三版)、《中國(guó)人民大學(xué)圖書(shū)館圖書(shū)分類法》(第六版)以及信息技術(shù)領(lǐng)域的相關(guān)國(guó)家標(biāo)準(zhǔn),專業(yè)工具書(shū)、專業(yè)詞典、使用手冊(cè)。此外,還通過(guò)對(duì)信息技術(shù)領(lǐng)域文獻(xiàn)的關(guān)鍵詞、摘要進(jìn)行詞頻統(tǒng)計(jì),收集相關(guān)主題詞等。該詞表根據(jù)實(shí)際需要分為13個(gè)一級(jí)類,其中前7個(gè)一級(jí)類目主要針對(duì)內(nèi)容,稱為內(nèi)容類目;后6個(gè)一級(jí)類目主要針對(duì)非內(nèi)容要素,稱為非內(nèi)容類目。

(3)分類編碼方法的選擇。詞表中的每一級(jí)類目以及主題詞類均由類目編碼和類目詞組成。一級(jí)類目采用數(shù)字字符順序和字母順序編碼,如01、02,A、B等。二級(jí)類目、三級(jí)類目和四級(jí)類目分別采用兩位數(shù)字編碼,并采用順序編號(hào)法。與中圖法類似,編碼的長(zhǎng)度可以反映類目的等級(jí)和次序。內(nèi)容類目的一級(jí)類目編碼分別用01、02、03、04、05、06、07表示。非內(nèi)容類目的一級(jí)類目編碼分別用類目詞中具有代表意義的漢字的拼音首字母C(出)、D(度)、J(機(jī))、M(媒)、R(人)表示,并按字母順序排序。

(4)詞表的更新維護(hù)。隨著信息科學(xué)技術(shù)的發(fā)展,各種新型信息技術(shù)及理論都會(huì)不斷涌現(xiàn),新的主題和概念隨之產(chǎn)生。為能夠即時(shí)對(duì)這些新的內(nèi)容進(jìn)行主題標(biāo)引,就必須對(duì)《信息技術(shù)領(lǐng)域分類主題詞表》進(jìn)行周期性的更新和維護(hù),以保證該詞表能夠涵蓋信息技術(shù)領(lǐng)域最新的概念和主題。分類主題詞表的維護(hù)包括各類目下主題詞的增加、修改和刪除,類目的增加、修改和刪除。

3.2.2詞表編制特點(diǎn)

(1)準(zhǔn)確的主題定位。為科技教育領(lǐng)域最為活躍的信息技術(shù)專業(yè)領(lǐng)域編制主題詞表順應(yīng)時(shí)代發(fā)展潮流,符合日益增長(zhǎng)的市場(chǎng)需求。信息技術(shù)領(lǐng)域涵蓋的主題內(nèi)容豐富,涉及專業(yè)術(shù)語(yǔ)眾多,并且更新淘汰速度快。為此,編制該領(lǐng)域的主題詞表可以有效規(guī)范其在數(shù)字出版過(guò)程中的標(biāo)準(zhǔn)問(wèn)題,提高數(shù)字出版質(zhì)量,為其他專業(yè)領(lǐng)域標(biāo)準(zhǔn)規(guī)范的制定提供借鑒。

(2)科學(xué)的分類體系?!缎畔⒓夹g(shù)領(lǐng)域分類主題詞表》結(jié)合多種體系分類方法與主題分類法,如《中圖法》《科圖法》《人大法》《中國(guó)分類主題詞表》,并實(shí)現(xiàn)分類主題一體化顯示,建立起獨(dú)有的標(biāo)識(shí)系統(tǒng)。

(3)完善的詞表對(duì)應(yīng)系統(tǒng)。除建立了科學(xué)的中文簡(jiǎn)體分類主題詞表,本表的一大特點(diǎn)就是建立相應(yīng)主題詞的繁體與中英文的對(duì)照。繁體主題詞主要根據(jù)我國(guó)香港、澳門、臺(tái)灣地區(qū)的使用稱謂習(xí)慣,建立對(duì)應(yīng)詞匯。比如,“網(wǎng)絡(luò)”對(duì)應(yīng)繁體“網(wǎng)路”,對(duì)應(yīng)英文“net”或者“network”。

(4)高效的管理方式。主題詞來(lái)源文件是由人工進(jìn)行篩選并根據(jù)已有的分類體系確定《信息技術(shù)領(lǐng)域分類主題詞表》的類目體系。然后借助計(jì)算機(jī)技術(shù),開(kāi)發(fā)主題詞表自動(dòng)生成系統(tǒng),自動(dòng)處理主題詞各種形式的對(duì)應(yīng)關(guān)系,主題詞表與動(dòng)態(tài)數(shù)字出版軟件無(wú)縫連接。

(5)為建立本體知識(shí)庫(kù)奠定基礎(chǔ)。目前建立本體的主要方法是依據(jù)主題詞表,利用本體構(gòu)建工具來(lái)創(chuàng)建相應(yīng)的領(lǐng)域本體?!缎畔⒓夹g(shù)領(lǐng)域分類主題詞表》的編制完成幫助實(shí)現(xiàn)了該領(lǐng)域本體的形式化和可視化顯示,用戶可查找本體中的概念,瀏覽本體的等級(jí)結(jié)構(gòu)及查看概念間的關(guān)系,并具備文本自動(dòng)標(biāo)引、文獻(xiàn)信息的語(yǔ)義檢索與可視化檢索、術(shù)語(yǔ)服務(wù)等功能。

4 結(jié)語(yǔ)

主題詞表廣泛應(yīng)用在信息科學(xué)領(lǐng)域,可以幫助標(biāo)引工作者和搜索用戶準(zhǔn)確的找到某一知識(shí)領(lǐng)域的詞匯,標(biāo)準(zhǔn)化的詞匯可以提高檢索效率,保證檢索結(jié)果的準(zhǔn)確率。此次《信息技術(shù)領(lǐng)域分類主題詞表》的構(gòu)建為我國(guó)其他知識(shí)領(lǐng)域在主題詞表構(gòu)建研究上積累了一些經(jīng)驗(yàn)。比如處理主題詞中英文繁體拼音的對(duì)應(yīng)關(guān)系時(shí)由于語(yǔ)言習(xí)慣,很多繁體字并不能夠通過(guò)逐字翻譯,更有一些習(xí)慣性用法如“網(wǎng)絡(luò)”稱為“網(wǎng)路”“三連通分支”稱為“三連接組件”等。使用Excel自帶的函數(shù)計(jì)算語(yǔ)詞的出現(xiàn)頻次,可以提高主題詞采集的效率與準(zhǔn)確率。隨著互聯(lián)網(wǎng)、計(jì)算機(jī)技術(shù)發(fā)展,主題詞表的網(wǎng)絡(luò)化、自動(dòng)化、標(biāo)準(zhǔn)化是支撐數(shù)字出版行業(yè)健康有序發(fā)展的重要保障。主題詞表的構(gòu)建應(yīng)根據(jù)信息環(huán)境的本質(zhì)和需求來(lái)發(fā)展,這就意味著對(duì)信息環(huán)境、話語(yǔ)和語(yǔ)言的深入了解,通過(guò)多種方法對(duì)知識(shí)進(jìn)行采集分析。

[1]程維紅,任勝利,路文如,等.我國(guó)科技期刊由傳統(tǒng)出版向數(shù)字出版轉(zhuǎn)型的對(duì)策建議[J].中國(guó)科技期刊研究,2011(4):467-474.

[2]全國(guó)出版專業(yè)職業(yè)資格考試辦公室.數(shù)字出版與數(shù)字出版產(chǎn)品[M].上海:上海辭書(shū)出版社,2011:66-82.

[3]余豐民.國(guó)內(nèi)主題詞表研究脈絡(luò)初探[J].情報(bào)科學(xué),2014(5):12-17.

[4]Robert M.Losee.Decisions in thesaurus construction and use[J].Information Processing&Management,2007,43(4):958-968.

[5]華夏.數(shù)字出版標(biāo)準(zhǔn)建設(shè)發(fā)展研究[D].北京:北京印刷學(xué)院,2014.

[6]劉春燕,沈玉蘭,劉華.ISO25964的技術(shù)內(nèi)容分析及對(duì)我國(guó)敘詞表編制標(biāo)準(zhǔn)的修訂啟示[J].圖書(shū)情報(bào)工作,2009(8):25-29,38.

[7]Marianne Lykke Nielsen.Thesaurus Construction:Key Issues and Selected Readings[J].Cataloging&ClassificationQuarterly,2004,37:3-4,57-74.

(責(zé)任編輯:劉洪)

Research on Subject Classification of Information Technology during the Dynamic Digital Publishing Era

RAN Cong-jing,TU Wen-yan

This paper discusses the challenges facing traditional publishing industry in the digital publishing era,and studies current research on standard specification of digital publishing and information technologythesauri,at home and abroad.Taking Chinese information technology thesaurus as an example,the authorsgive an introduction of the techniques,methods,principles and characteristics of thesaurus compilation,thus providing referencesfor the research on standard specificationof dynamic publishing in the fields of science and education.

dynamic publishing;digital publishing;information technology;thesaurus;classification standard

*本文系國(guó)家科技支撐課題“面向科技教育領(lǐng)域的動(dòng)態(tài)數(shù)字出版標(biāo)準(zhǔn)規(guī)范研究”(項(xiàng)目編號(hào):2012BAH88F00)、博士后特別資助課題“基于信息可視化技術(shù)的知識(shí)產(chǎn)權(quán)學(xué)術(shù)演化規(guī)律研究”(項(xiàng)目編號(hào):2014T70199)部分研究成果之一

冉從敬,武漢大學(xué)信息資源研究中心、武漢大學(xué)信息管理學(xué)院教授;涂文艷,武漢大學(xué)信息管理學(xué)院碩士研究生。

2016-05-05

猜你喜歡
詞表主題詞表標(biāo)引
《漢語(yǔ)主題詞表》
編制受控詞表的著作權(quán)侵權(quán)風(fēng)險(xiǎn)及其應(yīng)對(duì)策略
《〈漢語(yǔ)主題詞表〉構(gòu)建研究》
《漢語(yǔ)主題詞表》
《〈漢語(yǔ)主題詞表〉構(gòu)建研究》
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱漢英對(duì)照詞表
檔案主題標(biāo)引與分類標(biāo)引的比較分析
關(guān)于關(guān)鍵詞標(biāo)引的要求
關(guān)于關(guān)鍵詞標(biāo)引的要求
常用聯(lián)綿詞表
平遥县| 商南县| 抚宁县| 阳曲县| 平安县| 隆回县| 宝坻区| 桃江县| 西青区| 仁寿县| 蒙城县| 南丰县| 得荣县| 突泉县| 庆安县| 睢宁县| 无棣县| 宁都县| 亳州市| 达拉特旗| 娄烦县| 晋州市| 黔西县| 舞阳县| 舞钢市| 司法| 增城市| 南京市| 三河市| 神农架林区| 通许县| 托克托县| 张掖市| 栖霞市| 万宁市| 射阳县| 重庆市| 三台县| 北碚区| 休宁县| 舒兰市|