国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國外敘詞表的應(yīng)用與發(fā)展趨勢探討*

2012-10-23 05:16中國科學技術(shù)信息研究所北京100080
圖書館建設(shè) 2012年3期
關(guān)鍵詞:詞表檢索語言

趙 捷 (中國科學技術(shù)信息研究所 北京 100080)

司 莉 周李梅 柴 源 鄧伊婷 (武漢大學信息管理學院 湖北 武漢 430072)

敘詞表作為信息組織的核心工具,是一種由術(shù)語與術(shù)語之間的各種關(guān)系組成的語義詞典。敘詞表自產(chǎn)生以來,主要用于文獻信息的主題標引與檢索,并提高了文獻檢索的查準率和查全率?,F(xiàn)在敘詞表已經(jīng)成為成熟的語義工具。在新的環(huán)境下,敘詞表的編制方法由手工轉(zhuǎn)為機器輔助,網(wǎng)絡(luò)敘詞表也應(yīng)運而生;敘詞表被用于網(wǎng)絡(luò)數(shù)據(jù)庫和搜索引擎的現(xiàn)象已較為普遍。當前,國外有關(guān)敘詞表的編制與應(yīng)用的研究成果頗豐,對我國的相關(guān)研究具有借鑒意義。

1 國外敘詞表的調(diào)查與分析

筆者調(diào)查了網(wǎng)上免費信息資源網(wǎng)站Taxonomy Warehouse[1]和國外一些收錄敘詞表的網(wǎng)站[2-3],共搜集了254部以英文為主的敘詞表。筆者統(tǒng)計并分析了其語種、編制單位、詞表結(jié)構(gòu)、學科分布、載體類型等基本信息,以提供國外以英文為主的敘詞表的概況,供業(yè)界同行參考。

1.1 敘詞表規(guī)模與學科分布

根據(jù)包含的敘詞的總數(shù)量可將敘詞表分為3種規(guī)模[4]:大型敘詞表(敘詞總量在10 000個及以上)、中型敘詞表(敘詞總量在1 000~10 000個之間)和小型敘詞表(敘詞總量在1 000個及以下)。在所調(diào)查的敘詞表中,大型敘詞表共62部,占總量的24.4%;中型敘詞表共119部,占總量的46.9%;小型敘詞表共73部,占總量的28.7%。

依據(jù)《中華人民共和國學科分類與代碼國家標準》(GB/T 13745-92)的相關(guān)規(guī)定,并參考侯漢清對網(wǎng)絡(luò)敘詞表的調(diào)查結(jié)果(即將被調(diào)查的敘詞表分為理工農(nóng)醫(yī)類、人文社科類[4]),統(tǒng)計得出:這254部敘詞表中,理工農(nóng)醫(yī)類敘詞表共126部,占總量的49.6%;人文社科類敘詞表共128部,占總量的50.4%。侯漢清調(diào)查了國內(nèi)130部詞表[4],發(fā)現(xiàn)社會科學類占23.85%,自然科學類占58.46%,綜合科學類占17.69%??梢钥闯觯瑖鴥?nèi)自然科學類敘詞表所占比例較大,而國外理工農(nóng)醫(yī)類敘詞表與人文社科類敘詞表比例相近。

通過本次調(diào)查發(fā)現(xiàn):學科范圍較小的敘詞表中的敘詞量偏小,但一些復(fù)雜科學(如地球科學和生物科學)除外,如《Gale地球科學敘詞表》(Gale Earth Sciences Thesaurus)、《水產(chǎn)科學與漁業(yè)敘詞表》(Aquatic Sciences and Fisheries Thesaurus)的敘詞數(shù)量達百萬之多。

1.2 敘詞表的語種情況

在所調(diào)查的敘詞表中,英文單一語種敘詞表共209部,德文單一語種敘詞表僅1部,即德國哥根廷州立大學圖書館編制的《哥廷根在線分類》(Goettinger Online-Klassifikation),其余44部為雙語或多語種敘詞表(其中43部有英文版本)。單一語種敘詞表占總數(shù)的82.7%,雙語或多語種敘詞表占總數(shù)的17.3%。除單一語種敘詞表外,其他敘詞表的語種從兩種到十幾種不等,其中,擁有語種較多的敘詞表有《多語言地質(zhì)敘詞表》(Multilingual Thesaurus of Geosciences)與《職業(yè)培訓多語言敘詞表》(Multilingual Thesaurus of Vocational Training),擁有英、法、德等7種語言;《歐洲財政瀏覽器敘詞表》(European Treasury Browser Thesaurus)擁有荷蘭、英、法、意大利等13種歐洲國家語言;《亞洲蔬菜敘詞表》(Asian Vegetables Thesaurus)擁有中、英、日、泰、德等16種語言;《綜合多語言環(huán)境敘詞表》(General Multilingual Environmental Thesaurus)則擁有挪威、希臘、捷克、葡萄牙、芬蘭、法語等18種語言。

由于英語被作為全球的通用語言,并且本次調(diào)查主要以歐美國家的敘詞表為主,因此,大多數(shù)敘詞表在擁有本國語言版本的基礎(chǔ)上同時編制了相應(yīng)的英文版,如由德國的FIZ技術(shù)公司 (Fachinformationszentrum Technik)編制的《工程管理詞庫》(Thesaurus Technik und Management),在德文版的基礎(chǔ)上編有英文版。此外,由機構(gòu)編制的敘詞表一般均以英文版為主。例如,歐美國家的Gale公司、NASA(National Aeronautics and Space Administration,美國國家航空航天局)、English Heritage、大英博物館等機構(gòu)編制的敘詞表僅有英文版本;由聯(lián)合國相關(guān)機構(gòu)編制的《水產(chǎn)科學與漁業(yè)敘詞表》、《ENVOC多語種環(huán)境術(shù)語敘詞表》(ENVOC Multilingual Thesaurus of Environmental Terms)和《國際難民術(shù)語詞庫》(International Thesaurus of Refugee Terminology)等敘詞表,在英文版的基礎(chǔ)上,根據(jù)實際需要編制了相應(yīng)語種的版本。

表1 敘詞表載體類型調(diào)查統(tǒng)計表

1.3 敘詞表的載體類型

敘詞表的載體經(jīng)歷了從印刷版到電子版再到網(wǎng)絡(luò)版的過程。當今,以網(wǎng)絡(luò)為載體的敘詞表已成為主流。一部分敘詞表在紙質(zhì)版的基礎(chǔ)上開發(fā)了網(wǎng)絡(luò)版,另一部分敘詞表直接以電子版或網(wǎng)絡(luò)版發(fā)行(具體數(shù)據(jù)見表1)。

在所調(diào)查的254部敘詞表中,僅有印刷版的敘詞表共11部。既有印刷版、也有其他版的敘詞表有107部。例如,劍橋科學文摘(Cambridge Science Abstract, 簡稱CSA)編制的《冶金術(shù)語敘詞表》(Thesaurus of Metallurgical Terms)以印刷版為主,而《國際原子能信息系統(tǒng)敘詞表》(International Nuclear Information System Thesaurus)在印刷版的基礎(chǔ)上制作了PDF版。

以提供查詢功能的公共網(wǎng)站為載體的敘詞表有66部,包括《人文社科類電子敘詞表》(Humanities and Social Science Electronic Thesaurus,簡稱HASSET)、英國遺產(chǎn)委員會(English Heritage Commission)編制的《NMR貨船敘詞表》(National Monuments Record Cargo Thesaurus,簡稱NMR 貨船敘詞表),等等。

此外,WAND公司編制的3部敘詞表及《教育、技能和兒童服務(wù)敘詞表》(Education, Skills and Children's Services Thesaurus)為單一、特定的電子版。Gale公司的69部敘詞表均為CSV/TXT、HTML、XML格式。部分敘詞表還有RDF/SKOS(資源描述框架/簡單知識組織系統(tǒng))、RDF/OWL(資源描述框架/網(wǎng)絡(luò)本體語言)、Word和Excel格式。由此可看出,受調(diào)查敘詞表的出版方式大多為HTML、XML和CSV/TXT。這一現(xiàn)象反映了敘詞表發(fā)展的網(wǎng)絡(luò)化趨勢。大部分編制敘詞表的機構(gòu)充分利用計算機等技術(shù),構(gòu)建利于檢索的敘詞表,并對敘詞表進行全方位的改造和升級,在進行網(wǎng)絡(luò)化轉(zhuǎn)變的同時,注重敘詞表的界面設(shè)計。

1.4 敘詞表編制機構(gòu)的類型

對所調(diào)查敘詞表的編制機構(gòu)進行分類統(tǒng)計,可將敘詞表的編制機構(gòu)分為聯(lián)合國等國際機構(gòu)、政府機構(gòu)、公司、學術(shù)團體、圖書館、大學、個人、其他等類型。每種機構(gòu)編制的敘詞表數(shù)量如圖1所示。

所調(diào)查的敘詞表中,由個人編制的為5部,由大學編制的為15部,以圖書館為單位編制的有19部,由聯(lián)合國等國際機構(gòu)編制的共19部,由學術(shù)團體編制的有29部,由政府機構(gòu)編制的有54部,由公司編制的有100部。敘詞表最初產(chǎn)生于圖書情報領(lǐng)域,編制方法為將自然語言轉(zhuǎn)化為受控語言。而現(xiàn)在的敘詞表的編制不再限于圖書館等信息機構(gòu),商業(yè)性機構(gòu)所占比重較大。在所有被調(diào)查的敘詞表中,有100部是由商業(yè)機構(gòu)編制的,這類敘詞表占總數(shù)的39.4%,其中Gale公司編有69部敘詞表。屬于政府機構(gòu)編制的有54部敘詞表(占總數(shù)的21.3%),英國遺產(chǎn)委員會(English Heritage Commission)編有8部敘詞表,為政府機構(gòu)中編制敘詞表數(shù)量最多的機構(gòu)。聯(lián)合國等國際性機構(gòu),如國際天文協(xié)會(International Astronomical Union)、國際勞動組織(International Labour Organization)、國際原子能機構(gòu)(International Atomic Energy Agency)和國際能源機構(gòu)(International Energy Agency)等也編制了與自身性質(zhì)相適應(yīng)的敘詞表,這類敘詞表共有19部,占總量的7.5%。將敘詞表嵌入到各種商業(yè)性機構(gòu)或政府機構(gòu)的檢索系統(tǒng)中,導致其編制機構(gòu)的范圍擴大,這是敘詞表編制在網(wǎng)絡(luò)環(huán)境下的重要特征。

1.5 敘詞表所屬的國家或地區(qū)(見圖2)

多國聯(lián)合編制的敘詞表共有87部。美國獨立編制了80部敘詞表。并且美國還與其他國家合作編制敘詞表,如Gale公司是由美國牽頭的,其編制的69部敘詞表則屬于多國聯(lián)合編制,涉及天文、農(nóng)業(yè)、生物、化學、通信、計算機等各種學科。由此可看出,美國在編制敘詞表領(lǐng)域處于牢固的領(lǐng)軍地位。在所調(diào)查的國家或地區(qū)中,除美國外,其它國家按所編制的敘詞表數(shù)量由高到低的順序為英國、澳大利亞、除英國之外的歐洲地區(qū)、加拿大,其編制敘詞表的數(shù)量分別是31部、21部、20部、10部。

1.6 敘詞表的結(jié)構(gòu)

敘詞表的結(jié)構(gòu)分為宏觀結(jié)構(gòu)和微觀結(jié)構(gòu),本文主要分析其微觀結(jié)構(gòu)。敘詞表的微觀結(jié)構(gòu)體現(xiàn)在詞間關(guān)系上。敘詞表中的詞間關(guān)系分為等級關(guān)系(Hierarchical relationship)、等同關(guān)系(Equivalence relationship)和相關(guān)關(guān)系(Associative relationship)。等級關(guān)系為顯示術(shù)語的上位概念和下位概念;等同關(guān)系為連接了術(shù)語的同義詞;相關(guān)關(guān)系為建立與術(shù)語相關(guān)的參照,結(jié)構(gòu)較為松散。被調(diào)查的敘詞表的等級結(jié)構(gòu)從2級到12級不等,其中《酒類和其他藥物敘詞表》(Alcohol and Other Drug Thesaurus,簡稱AOD)有12級。在所調(diào)查的敘詞表中,同時擁有等級關(guān)系、等同關(guān)系和相關(guān)關(guān)系的敘詞表共有215部,占到總量的84.6%。極少數(shù)敘詞表的詞間關(guān)系簡單,其主要為敘詞數(shù)量較少、非學術(shù)性的敘詞表。例如,《亞洲蔬菜敘詞表》僅以字順形式列出敘詞,詞間關(guān)系極為簡化,沒有等級關(guān)系、相關(guān)關(guān)系或等同關(guān)系。

另外,網(wǎng)絡(luò)環(huán)境下的敘詞表顯示方式更加立體。傳統(tǒng)敘詞表以字順方式排列敘詞,以“用”、“代”、“屬”、“分”、“參”等表示敘詞之間的關(guān)系,用戶查閱不便。在所調(diào)查的敘詞表中,相當一部分敘詞表中敘詞的上位詞、下位詞和相關(guān)詞都可通過超鏈接點擊查看,如《國際職業(yè)安全與健康信息中心敘詞表》(Occupational Safety and Health Thesaurus, 簡稱CIS)、《加拿大無線電視和通訊委員會敘詞表》(Canadian Radio-television and Telecommunications Commission Thesaurus,簡稱CRTC)、《弗羅里達環(huán)境網(wǎng)絡(luò)敘詞表》(Florida Environments Online Thesaurus)。

1.7 敘詞表的特征

部分網(wǎng)絡(luò)敘詞表面向大眾生活和商業(yè)貿(mào)易,如《廚師敘詞表》(Cook's Thesaurus)收納了有關(guān)廚房用品的敘詞,《亞洲蔬菜敘詞表》是為了亞洲蔬菜的出口,供外貿(mào)商查詢、檢索使用。這類敘詞表不僅沒有復(fù)雜的查詢方式,且附有圖片,能夠為用戶提供直觀的瀏覽方式??梢?,敘詞表的應(yīng)用領(lǐng)域更加廣泛。

另外,當前個人編制的敘詞表成為敘詞表家族中的新成員。其主要源自于特定領(lǐng)域的學者或從事某項事業(yè)多年的人員自身的經(jīng)驗總結(jié)。在所調(diào)查的敘詞表中,由個人編制的5部分別為《廚師敘詞表》、《藥草敘詞表》(Thesaurus for the Herb)、《寄生蟲學敘詞表》(Thesaurus of Parasitology)、《液晶研究與應(yīng)用敘詞表》(Thesaurus for Liquid Crystal Research and Applications)和《哈利波特敘詞表》(Harry Potter Thesaurus)。個人編制敘詞表能夠?qū)€人的隱性知識顯性表示,并促進個人知識的社會化。

2 國外敘詞表在新環(huán)境下的應(yīng)用

網(wǎng)絡(luò)環(huán)境下,敘詞表的應(yīng)用不再局限于傳統(tǒng)領(lǐng)域。聯(lián)機敘詞表是獨立于檢索系統(tǒng)而存在的網(wǎng)絡(luò)信息檢索工具,可同時供聯(lián)機編目人員和網(wǎng)絡(luò)信息用戶使用;網(wǎng)絡(luò)數(shù)據(jù)庫和搜索引擎也相繼使用敘詞表進行詞匯控制和瀏覽檢索;此外,敘詞表也被應(yīng)用于本體構(gòu)建等領(lǐng)域,充分發(fā)揮其受控詞表的優(yōu)勢。

2.1 利用敘詞表構(gòu)建本體(Ontology)

當前,本體是圖書情報領(lǐng)域的研究熱點。本體重在概念及其關(guān)系的體現(xiàn),它在術(shù)語表中定義了一系列有關(guān)對象和關(guān)系的類,其內(nèi)在的關(guān)系規(guī)則在表達不同詞匯之間的等同、從屬和相關(guān)關(guān)系的同時,也提供一種推理的機制。而敘詞表提供的術(shù)語詞匯列表及參照系統(tǒng)顯示出的詞間關(guān)系能夠為構(gòu)建本體提供一定的基礎(chǔ)。因此,應(yīng)充分利用敘詞表進行本體的構(gòu)建,將敘詞表轉(zhuǎn)化為本體等在網(wǎng)絡(luò)時代知識組織系統(tǒng)中發(fā)揮作用。聯(lián)合國糧農(nóng)組織的AOS(Agricultural Ontology Service)項目以糧農(nóng)敘詞表AGROVOC為原型,構(gòu)建了農(nóng)業(yè)本體服務(wù),促進了聯(lián)合國糧農(nóng)組織網(wǎng)站的電子資源信息檢索[5-6]。有學者比較了《國家農(nóng)業(yè)圖書館敘詞表》(National Agriculture Library Thesaurus)和一個“農(nóng)作物-昆蟲(crop-pest)”本體在國家農(nóng)業(yè)圖書館中的檢索效果,得出本體可以為領(lǐng)域知識提供更好的描述和基于知識描述的更深層次的邏輯推理,進而提高檢索質(zhì)量[7]。

2.2 利用敘詞表構(gòu)建知識分類表(Taxonomy)

知識分類表是由等級結(jié)構(gòu)和主題詞兩個基本元素組成、具有多種用途的一種知識組織工具。它的主要功能是將資源對象類聚到一個特定的知識等級。知識分類表可用于自動分類、鏈接資源、提供瀏覽等,也可用于優(yōu)化檢索提問和檢索結(jié)果。利用敘詞表分類法構(gòu)建知識分類表由來已久,如美國醫(yī)學協(xié)會(American Medical Association,簡稱AMA)利用MeSH(Medical Subject Headings,醫(yī)學主題詞表)建立了一個醫(yī)學知識分類表,該表在美國醫(yī)學協(xié)會網(wǎng)站上的應(yīng)用促進了其網(wǎng)絡(luò)期刊文獻的獲取;Saeed和Chaudhry兩位學者用DDC(Dewey Decimal Classification,杜威十進分類法)和IEEE(Institute of Electrical and Electronics Engineers,美國電氣和電子工程師協(xié)會)網(wǎng)頁敘詞表建立了知識分類表[8];王紅忠等用DDC和3個敘詞表建立了機構(gòu)知識分類表,這3個敘詞表分別為美國社會信息科學與技術(shù)敘詞表(American Society for Information Science and Technology,簡稱 ASIST&T)、圖書館與信息科學文摘詞表(Library and Information Science Abstracts, 簡稱LISA)及科教資源信息中心(Educational Resources Information Center, 簡稱ERIC)[9]。在構(gòu)建知識分類表的過程中,敘詞表的范疇索引可以用來構(gòu)建知識分類表的上位類目,其詞間等級關(guān)系可以用來確定下位類目,其詞間等同關(guān)系可以建立子目的代替關(guān)系,敘詞則可以提供子目的候選詞。

2.3 敘詞表用于網(wǎng)絡(luò)信息組織的優(yōu)化

敘詞表在知識組織方面的優(yōu)勢以及近年來網(wǎng)絡(luò)敘詞表的不斷發(fā)展,使得一些主題信息網(wǎng)關(guān)紛紛利用敘詞表對Web頁面和站點進行標引及檢索。例如,藝術(shù)、設(shè)計、建筑和媒介信息網(wǎng)關(guān)應(yīng)用《Getty藝術(shù)和建筑敘詞表》(Art and Architecture Thesaurus,簡稱AAT)進行標引,社會科學信息網(wǎng)關(guān)應(yīng)用《人文社會科學電子敘詞表》(Humanities and Social Science Electronic Thesaurus,簡稱HASSET)進行標引。敘詞表在網(wǎng)絡(luò)信息組織中的應(yīng)用也體現(xiàn)為嵌入到數(shù)據(jù)庫檢索系統(tǒng)中,如ETOH數(shù)據(jù)庫(The Alcohol and Alcohol Problems Science Database)應(yīng)用《酒類和其他藥物敘詞表》(Alcohol and Other Drug Thesaurus,簡稱AOD),使用戶可以直接選擇AOD敘詞表的敘詞進行檢索。在提高專題性或?qū)W術(shù)性網(wǎng)絡(luò)資源搜索引擎的查準率與查全率時,應(yīng)充分認識到敘詞表的重要作用。

3 國外敘詞表的發(fā)展趨勢

3.1 敘詞表的多語言化

隨著擁有不同文化和語言背景的群體對各種信息需求量的增加,支持多語種的檢索工具變得越來越重要,多語言化成為敘詞表編制和發(fā)展的一種趨勢。敘詞表并非在編制之初就擁有多種語言版本,而是隨著信息組織的需要,通過翻譯原敘詞表的方式添加新的版本。如所調(diào)查的敘詞表中,《綜合多語言環(huán)境敘詞表》在1998年發(fā)布之初,只擁有荷蘭、芬蘭、法、德、意大利、挪威、葡萄牙、西班牙、丹麥和希臘語10種語言[10],截至2011年則發(fā)展至18種語言?!兜厍蚩茖W多語言敘詞表》(Multilingual Thesaurus of Geoscience)的編制委員會IUGS/COGEOINFO(International Union of Geological sciences/Commission on Management and Application of Geoscience Infomation,國際地質(zhì)科學聯(lián)合會/國際地學信息管理與應(yīng)用委員會)宣稱,其目標之一就是將該敘詞表翻譯為多種語言版本,目前該敘詞表已有7種語言版本[11]。

3.2 敘詞表的互操作化

被調(diào)查的敘詞表在學科范圍、詞表結(jié)構(gòu)和敘詞的選取等方面都存在著一定的差異,這些差異不利于資源的標引與共享,因此,需要實現(xiàn)不同敘詞表之間的兼容和互操作。在這方面的研究已取得了一些成果,如許多國家已將MeSH譯為本國語言,目前MeSH有法、德、俄、西班牙等多種語言的譯本,可建立跨語言的醫(yī)學檢索系統(tǒng)。另外,不同類型的數(shù)據(jù)庫使用的情報檢索語言也不同,成為了用戶在檢索某一課題時的障礙。因此,情報檢索語言之間也必須實現(xiàn)兼容和互換,使一個檢索式適用于多個系統(tǒng)。如工程索引(Engineering Index,簡稱EI)分類主題一體化詞表的應(yīng)用在實質(zhì)上實現(xiàn)了分類語言和主題語言的兼容與互換,體現(xiàn)了分類、主題一體化的發(fā)展趨勢。

3.3 敘詞表的可視化

敘詞表須使用戶易于理解,通過提供定義、范圍注釋或簡介段落提高用戶檢索的查準率與查全率。紙質(zhì)版敘詞表的詞間關(guān)系顯示和術(shù)語標注都不足以幫助用戶理解。網(wǎng)絡(luò)環(huán)境下,敘詞表的編制和應(yīng)用可以采用相應(yīng)的技術(shù)實現(xiàn)可視化,從而提高用戶瀏覽和檢索的便利性。例如,由斯坦福大學醫(yī)學院的醫(yī)學情報學研究組開發(fā)的Protégé工具,可以用于實現(xiàn)詞間關(guān)系可視化。《可視化敘詞表》(Visual Thesaurus)應(yīng)用輻射圖顯示相關(guān)詞匯并可以點擊查詢詞義。

在圖3中,連線顯示詞與詞之間的聯(lián)系。鼠標放置在結(jié)點,則出現(xiàn)方框顯示該結(jié)點下詞的解釋和相關(guān)例句?!犊梢暬瘮⒃~表》并非是用于信息標引和檢索的敘詞表,而是以學習工具的形式出現(xiàn),但這種可視化的應(yīng)用為敘詞表的未來發(fā)展提供了方向。

3.4 敘詞表的分面化

分面敘詞表是Aitchison等人于1969年提出的概念,表示將分面分類法和敘詞表相結(jié)合。他指出,分面在當前的背景下表示一組基本的分類及類與類之間依據(jù)一定規(guī)則的結(jié)合。每一個基本分類本身可能是一個類層次結(jié)構(gòu)①,且絕大多數(shù)情況下不同的分面是相互排斥的,因此可以將不同分面中單個概念結(jié)合用以查詢或形成檢索式[12]。與傳統(tǒng)敘詞表相比,分面敘詞表引入了一個相當于傳統(tǒng)敘詞表的范疇表和詞族表功能的分面分類表,從而更系統(tǒng)、更明確、更完整地顯示了敘詞表中敘詞間的關(guān)系。被調(diào)查的敘詞表中,大部分含有等級關(guān)系的敘詞表的編制沒有嚴格的分面分析過程,且等級結(jié)構(gòu)不能組合,因此為非分面敘詞表。一小部分敘詞表是分面敘詞表,如《酒類和其他藥物敘詞表》、《美國醫(yī)學主題詞表》、《Getty藝術(shù)和建筑敘詞表》、《UNESCO敘詞表》、《國際難民術(shù)語詞庫》,等等[12]。建立分面敘詞表既可以用于先組式系統(tǒng)②,也可以用于后組式系統(tǒng)③,從而提高信息檢索系統(tǒng)的查詢和瀏覽功能。

4 結(jié) 語

隨著新技術(shù)的出現(xiàn),國外對傳統(tǒng)敘詞表的改進、創(chuàng)新和應(yīng)用不斷加深。敘詞表的編制機構(gòu)多樣化、數(shù)量的增長、語種的增加等,顯示了其作為成熟的語義工具依然在不斷地發(fā)展;敘詞表在本體構(gòu)建、知識分類表構(gòu)建、網(wǎng)絡(luò)信息組織優(yōu)化等方面的應(yīng)用,推動著其研究的深化。新環(huán)境下,敘詞表對當前的信息組織、知識組織有重大意義。國內(nèi)在敘詞表理論及應(yīng)用研究方面與國外存在著較大的差距。因此,加強敘詞表的理論研究和應(yīng)用研究勢在必行。

注 釋:

①類層次結(jié)構(gòu)是由相互有關(guān)聯(lián)的若干個類以一定的關(guān)系構(gòu)成的。一個類層次結(jié)構(gòu)有兩種組成成分:類和類之間的關(guān)系。

②第一代 OPAC被稱為“詞組索引或先組式系統(tǒng)”。

③第二代OPAC被稱為“關(guān)鍵詞或后組式系統(tǒng)”。這類系統(tǒng)采納布爾、截斷、限定(按年代、語種) 等檢索技術(shù),而且能夠按關(guān)鍵詞作后組式檢索。

[1]Taxonomy Warehouse[EB/OL].[2011-03-15].http://www.taxonomywarehouse.com/.

[2]Thesaurus.com[EB/OL].[2011-03-15].http://thesaurus.com/Roget-Alpha-Index.html.

[3]Visualthesaurus[EB/OL].[2011-03-15].http://www.visualthesaurus.com/.

[4]侯漢清.網(wǎng)絡(luò)時代的情報檢索語言:進展及熱點[EB/OL].[2011-03-15].http://wenku.baidu.com/view/b42aed6eb84ae45c3b358c3b.html.

[5]Eriksen L.From Thesaurus to Ontology: From AGROVOC to the Agricultural Ontology Service (AOS)[J].Synopsis, 2003 (1): 17-20.

[6]聯(lián)合國糧農(nóng)組織AOS項目[EB/OL].[2011-03-15].http://www.fao.org/fishery/topic/18046/en.

[7]Soonho K, Howard W B.A practical Comparison Between Thesaurus and Ontology Techniques as a Basis for Search Improvement[J].Journal of Agricultural & Food Information,2006 (4) :23-42.

[8]Saeed H, Chaudhry A S.Using Dewey Decimal Classification Scheme(DDC) for Building Taxonomies for Knowledge Organization[J].Journal of Documentation,2002 (5):575-583.

[9]Wang Zhonghong, Chaudhry A S, Christopher S G K.Using Classification Schemes and Thesauri to Build an Organizational Taxonomy for Organizing Content and Aiding Navigation[J].Journal of Documentation, 2008 (6): 842-876.

[10]General Multilingual Environmental Thesaurus [EB/OL].[2011-03-15].http://uta.iia.cnr.it/GEMET.htm.

[11]Multilingual Thesaurus of Geoscience[EB/OL].[2011-03-15].http://www.cgi-iugs.org/docs/Multilingual_thesaurus_of_geoscience.pdf.

[12]Tudhope D, Binding C.Faceted Thesauri[J].Axiomathes, 2008 (18):211-222.

猜你喜歡
詞表檢索語言
編制受控詞表的著作權(quán)侵權(quán)風險及其應(yīng)對策略
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
語言是刀
學術(shù)英語詞表研究管窺
——三份醫(yī)學英語詞表比較分析
讓語言描寫搖曳多姿
專利檢索中“語義”的表現(xiàn)
我有我語言
常用聯(lián)綿詞表
國際標準檢索
國際標準檢索