国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

傳統(tǒng)受控詞表的SKOS描述規(guī)范及應用指南*

2014-07-12 17:09:43曾新紅
數(shù)字圖書館論壇 2014年4期
關鍵詞:詞表分類法類目

曾新紅

(深圳大學圖書館NKOS研究室,深圳 518060)

傳統(tǒng)受控詞表的SKOS描述規(guī)范及應用指南*

曾新紅

(深圳大學圖書館NKOS研究室,深圳 518060)

依據(jù)我國情報檢索語言的權威理論和構(gòu)建標準,參考中國分類主題詞表、漢語主題詞表、中圖法、軍用電子分類表的編制說明或規(guī)范,以及已有的國內(nèi)外研究成果,以SKOS標準文本的定義為準繩,將情報檢索語言的理論和構(gòu)建規(guī)范與SKOS的建模規(guī)范對應起來,從易于共享和實現(xiàn)的角度,對中文敘詞表及分類法中各項語義元素的SKOS描述進行了具體的規(guī)定或建議,并通過示例介紹了該規(guī)范的具體應用方法。

受控詞表;分類法;敘詞表;形式化表示;語義描述;SKOS;CNKOS;知識組織系統(tǒng)

1 引言

國家數(shù)字圖書館工程“知識組織標準規(guī)范”項目(項目編號D009,合同編號GC-HD090453)的總目標是設計中文NKOS的建設規(guī)范和共享共建平臺,作為國內(nèi)NKOS建設的指導規(guī)范和NKOS資源,提高國家圖書館應用NKOS的水平,推動國內(nèi)NKOS的發(fā)展和應用。筆者承擔了其中的1.2子項,即“基于傳統(tǒng)知識組織系統(tǒng)的中文NKOS構(gòu)建規(guī)范”,所提交的三份報告:受控表語義描述規(guī)范(D009-3)[1]、“中國分類主題詞表”語義描述規(guī)范及應用指南(D009-4)[2]以及受控表語義描述規(guī)范之調(diào)研報告(D009-8)[3],與其他7份報告一起,共同組成了“國家圖書館知識組織標準規(guī)范”[4]。完整的“受控表語義描述規(guī)范”請見國家圖書館出版社近期出版的“網(wǎng)絡環(huán)境下的知識組織規(guī)范和應用指南”一書第二篇[5],或登錄“http://nkos.lib.szu.edu.cn/2011/08/ cnkos/”下載更新版“通用CNKOS語義描述規(guī)范”,供機器使用的RDF Schema版本的URI為:http://nkos. lib.szu.edu.cn/2011/12/ckos/。

“受控表語義描述規(guī)范”(CNKOS)實際包含兩個版本:純SKOS版和CNKOS擴展版。CNKOS擴展版的主要內(nèi)容已在文獻[6]中進行了介紹。鑒于目前國內(nèi)受控詞表的語義描述研究和實踐重點還在SKOS描述階段,并且因為理解上的不同產(chǎn)生了一些不同的具體描述方法,為了方便本規(guī)范的使用者更準確地把握SKOS在中文受控詞表語義描述中的使用方法,本文將專門介紹純SKOS版,包括在其設計過程中的具體考量、具體的描述示例以及使用中需要注意的問題。

2 國內(nèi)外研究現(xiàn)狀

簡單知識組織系統(tǒng)SKOS[7,8]及其在國內(nèi)外的一般研究現(xiàn)狀在文獻[6]中已作了詳細介紹,本文不再贅述。簡言之,對于中文敘詞表(主題詞表)而言,國外已有研究可以直接借鑒,其特殊性主要在于拼音、英譯名、族首詞、附表等的描述以及URI的確定。筆者對已有的國內(nèi)外相關研究進行了比較深入的分析,結(jié)論是:應用SKOS詞匯描述敘詞表(或主題標題表)的敘詞概念(或標目概念)、首選語言標簽、可選語言標簽、上位/下位/相關詞、注釋等的轉(zhuǎn)換方案比較一致,可以直接利用。但現(xiàn)有研究對于拼音、英譯名、主題詞對應的分類號、附表、專類概念的進一步區(qū)分、組配概念、分面及Node label、組配概念的分面組成、等級和相關關系的進一步細化等的語義化描述,由于SKOS的“簡單”定位以及研究者的不同理解,要么沒有涉及,要么做了一些展望或不盡相同的建議,沒有直接可利用的成功經(jīng)驗。

與敘詞表(或主題標題表)相比,國內(nèi)外對分類法的語義描述研究要薄弱得多。SKOS主要是針對敘詞表標準的,分類法中與敘詞表相似的共性部分,可以采用SKOS來進行描述。但分類法中有大量不同于敘詞表的特性,與這部分的描述相關的研究非常稀少。

筆者依據(jù)我國情報檢索語言的權威理論[9]和構(gòu)建標準[10,11],參考中國分類主題詞表[12]、漢語主題詞表、中圖法[13]、軍用電子分類表[14]的編制說明或規(guī)范,以及已有的國內(nèi)外研究成果,以SKOS標準文本的定義為準繩,將情報檢索語言的理論和構(gòu)建規(guī)范與SKOS的建模規(guī)范對應起來,找到它們之間的契合點,對中文敘詞表及分類法中各項語義元素的SKOS描述進行了具體的規(guī)定或建議。

3 CNKOS純SKOS版的總體介紹

3.1 命名域和詞匯表

純SKOS版中所采用的SKOS/RDF/RDFS/OWL詞匯使用其原有的命名域及其縮寫,詳見表1。

表1 命名域URI 縮寫

純SKOS版原則上包含SKOS Core的所有詞匯,規(guī)范中列出了其中在傳統(tǒng)中文KOS語義描述中可能會經(jīng)常使用的詞匯。詳見CNKOS規(guī)范全文[1,5]中的表2。規(guī)范中還包含了這些SKOS詞匯的說明及定義的中譯文,并對某些比較抽象的定義在其后用“()”添加了自然語言注釋。

3.2 CNKOS純SKOS版的使用方法

CNKOS參考了W3C發(fā)布的SKOS Reference 20090818[7]的目錄結(jié)構(gòu),引用了SKOS Core的核心內(nèi)容(譯為中文)。為便于使用者閱讀理解,CNKOS在引言部分給出了詳細的閱讀說明,包括形式化定義、URI引用和構(gòu)成建議、描述示例的格式說明等。另外,在D009-8受控表語義描述之調(diào)研報告[3]中,給出了詳細的參考資料要點,說明采用SKOS詞匯或擴展CNKOS詞匯進行描述的參考依據(jù),并對語義Web建模語言(RDF/RDFS/OWL)的基礎知識進行了介紹,以利于快速了解語義Web的基本原則、建模的意義、建模語言的種類和基本結(jié)構(gòu)及它們的作用,以及該領域常用術語的含義,并站在語義Web的大背景下來看待SKOS的作用以及對SKOS進行的擴展。

該版本適用于國內(nèi)傳統(tǒng)的敘詞表(主題詞表)和分類法的SKOS描述,也可應用于中文規(guī)范文檔和其他KOS類型的SKOS描述。

4 中文受控詞表的描述需求及具體的SKOS描述規(guī)范

4.1 受控詞表整體的描述

作為整體的中文KOS,如中文敘詞表(主題詞表)、分類法等國內(nèi)受控詞表,可以視為一個概念體系(concept scheme),用skos:ConceptScheme及其相應的屬性進行描述。

根據(jù)SKOS的定義,一個SKOS概念體系可以被看作是一個或多個SKOS概念(concept)的集合(aggregation)。這些概念之間的語義關系(鏈接)也可以被看作是一個概念體系的一部分(此句僅為建議而非約束)。一個獨立的SKOS概念體系大致對應于一個獨立的敘詞表、分類法、主題標題表或其他知識組織系統(tǒng)。

當一個CNKOS文件(RDF/XML序列格式)中含有多個概念體系時,概念與概念體系之間的關系可以用skos:inScheme來描述。從利于實現(xiàn)的角度,本規(guī)范建議盡量不要將兩個以上獨立的概念體系放在一個CNKOS文件中進行描述,尤其當它們規(guī)模龐大或分別屬于不同的NKOS類型時。除非這些概念體系不可分割,如將分類法的附表也描述為概念體系,參見4.2節(jié)。

概念體系與其包含的頂級概念之間的關系可用skos:topConceptOf或skos:hasTopConcept來描述。這兩個屬性是互逆的,建議可選擇其中之一(如skos: hasTopConcept)進行描述。需要注意的是,用skos: topConceptOf或skos:hasTopConcept描述的是概念體系與其包含的頂級概念之間的關系。這與傳統(tǒng)中文敘詞表敘詞款目中的族首詞關系在語義上有所不同。敘詞款目中的族首詞表達的是敘詞與其所屬詞族的頂級概念之間的關系,即SKOS概念與SKOS概念之間的關系,而非SKOS概念體系與SKOS概念之間的關系,SKOS未提供相應的描述詞匯。如需聲明敘詞款目中的族首詞關系,可采用擴展的ckos:TopConcept進行描述[5,6]。

如例1中將中圖法(CLC)描述為一個概念體系,并描述了它與其一級大類(頂級概念)的關系。

注:RDF/XML格式的SKOS描述代碼可登錄CLC Linked Data服務[15]檢索下載。

例2中將漢語主題詞表(CT)描述為一個概念體系,并描述了它與其頂級概念(詞族的族首詞)的關系。

注:RDF/XML格式的SKOS描述代碼可登錄CCT1 Linked Data服務[16]檢索下載。

4.2 附表的描述

采用CNKOS擴展版時敘詞表中的附表(特種概念集合)可以直接處理為skos:Concept的子類。當選擇用純SKOS版本描述敘詞表時,因只能采用skos:Concept來描述所有的敘詞概念,如想保留某些特種概念的特殊性,可采用skos:ConceptScheme來描述這些附表或特種概念集合(利于獨立使用和共享)。這樣在需要時可以根據(jù)指定的skos:ConceptScheme的URI來識別其所包含的特種概念,也可再轉(zhuǎn)換為相應的子概念類型。

對于分類法中不能獨立使用的附表(通用復分表,專類復分表,被仿分類目范圍),有以下三個備選方案:

?skos:Collection

適于表示簡單的、無等級關系和注釋的附表。對于有等級關系和注釋的復雜附表,建議可以采用以下兩種表示方式:一是采用嵌套的skos:Collection表示;二是只列出附表中的一級概念,需要時再由支持系統(tǒng)推出所有下位概念和注釋等。

需要注意的是,分類法不同附表中同一類號可能代表不同的類目,如中圖法“二、世界地區(qū)表”中的“1世界”和“三、中國地區(qū)表”中的“1 北京市”,類號都是“1”。根據(jù)SKOS的定義,skos:Collection與其成員之間的關系用skos:member屬性表示,這個屬性的rdfs: domain是skos:Collection,rdfs:range是skos:Concept或skos:Collection。也就是說,如果用skos:Collection來描述分類法中的附表,那么這些附表中的類目概念也是同一概念體系中的概念。而SKOS認為,按照常規(guī)同一概念體系中的兩個不同的概念不應擁有同一個符號(notation),否則就不可能用這個符號來唯一地指引一個概念。因此,如果用skos:Collection來表示分類法中的附表,可能會違反SKOS中一個符號唯一表示一個概念的約定。

?skos:ConceptScheme

將附表視為獨立的概念體系,可描述任意復雜度的附表,并解決不同附表中同一類號代表不同類目的問題。但對于不能獨立使用的、專用于某個類目的專類復分表(仿分表),將其描述為獨立的概念體系有些勉強。

此方案不違背SKOS對概念體系的定義,即“一個SKOS概念體系可以被看作是一個或多個SKOS概念的集合”,但不太符合“一個獨立的SKOS概念體系大致對應于一個獨立的敘詞表、分類法、主題標題表或其他知識組織系統(tǒng)”這句約定。并且,如果分類法整體與其附表都采用skos:ConceptScheme進行描述,它們之間就形成了一種并列關系,原有的包含和隸屬關系語義會丟失。

?ckos:Auxiliary

擴展的skos:ConceptScheme的子類,可用于表示所有附屬于某一獨立概念體系的、不能獨立使用的子概念體系(如《中圖法》中的附表)。

本規(guī)范建議:可用skos:Collection表示簡單的、無等級關系和注釋的、類號與主表類號及其他采用skos: Collection表示的附表類號不重復的附表;用skos: ConceptScheme描述相對獨立的通用復分表;用ckos: Auxiliary描述其他類號重復又無法獨立使用(即必須與主表特定類目聯(lián)合使用才有意義)的附表(如中圖法中的專類復分表)。當采用純SKOS版時,只能選用前兩種方案。

如例3中將中圖法(CLC)中的“二、世界地區(qū)表”描述為一個獨立的概念體系,并描述了它與其一級大類(頂級概念)的關系,以及附表中的類目概念。

4.3 概念及概念標簽的描述

4.3.1 概念的描述

中文敘詞表中的敘詞(我國多稱為正式主題詞)是取自自然語言并經(jīng)過規(guī)范化處理的、以基本概念為基礎的表達文獻主題的詞或詞組[9]。

傳統(tǒng)分類法中的類目是一個個表達文獻、信息內(nèi)容的概念。每個類目都代表具有某種共同屬性的文獻、信息集合。分類法的每一個類目都是一個特定的主題概念(或主題概念集合)。類目的含義在一個由上位概念、同位概念、下位概念、相關概念和類目注釋構(gòu)成的語義空間中進行限定。類目應當是穩(wěn)定的[9]。

在SKOS標準中,SKOS概念(SKOS concept)是一種觀念(idea)或想法(notion),一個思想(thought)單位。因此,敘詞表中的敘詞和分類法中的類目都可以視為SKOS概念,描述為skos:Concept的實例。

作為RDF資源的SKOS概念必須用URI來表示。當描述后的CNKOS用作Linked Data目的時,一般用完整URI來表示概念;當描述后的CNKOS用作交換格式、一個CNKOS文件只包含一個概念體系、且所有的概念都擁有同樣的base URI(基準URI)時,可以采用相對的URI來表示概念。

若敘詞概念本身或類目概念中的類號(或類名)發(fā)生變化,且概念的內(nèi)涵或外延發(fā)生了變化,則URI也應該變,此時不應視為URI不穩(wěn)定??梢酝ㄟ^自動生成歷史注釋(skos:historyNote)和擴展一個映射屬性(skos:relatedMatch的子屬性ckos:previousMatch)鏈接前URI來解決[5,6]。

SKOS本身沒有為skos:Concept定義子類,當采用純SKOS詞匯進行描述時,敘詞表或分類法中的特種概念也只能用skos:Concept來描述,其特殊性會丟失。如想保留,可采用上一節(jié)中建議的方式進行描述。

描述示例見例1至例3,其三元組格式形如“<概念URI> rdf:type skos:Concept.”。

例 3 <2WorldRegionTable> rdf:type skos:ConceptScheme; skos:prefLabel "二、世界地區(qū)表"; skos:hasTopConcept <1 世界>, <2 中國>, ……, <7 美洲>. <1 世界> rdf:type skos: Concept;skos:notation "1" ; skos:inScheme <2WorldRegionTable>.……

4.3.2 概念的語言標簽的描述

SKOS將概念(或其他資源)的語言形式視為語言標簽,即一個UNICODE字符串??捎胹kos:prefLabel和skos:altLabel分別描述概念的首選標簽和可選標簽。對于敘詞表而言,概念的首選標簽就是敘詞本身,其拼音、英譯名和入口詞(非敘詞)都可以描述為相應語種的skos:altLabel值;對于分類法而言,概念的首選標簽是類名,而類名的拼音及其他語種類名可以描述為相應語種的skos:altLabel值。對于容易寫錯的敘詞或類名,其錯誤形式可以用skos:hiddenLabel進行描述,以起到一定的入口作用。

例4展示了中圖法(CLC)中類目概念的語言標簽(類名)的描述方法。

例 4 rdf:type skos:Concept; skos:prefLabel "哲學、宗教".

例5展示了軍用電子分類表中類目概念的不同語種類名的描述方法。

例 5 < K1541 后勤訓練> rdf:type skos:Concept; skos:prefLabel "后勤訓練"; skos:altLabel "hou qin xun lian" @zh-pinyin; skos:altLabel " Logistical training" @en.

例6展示了漢語主題詞表(CT)中敘詞概念的不同語種語言標簽(首選標簽,入口詞,首選標簽的漢語拼音,首選標簽的英譯名)的描述方法。

例 6 <宗教> rdf:type skos:Concept; skos:prefLabel "宗教"; skos:altLabel "zong jiao" @zh-pinyin; skos:altLabel "Religion" @en.

建議不描述入口詞的拼音,否則將無法分辨若干拼音形式的語言標簽與中文形式的語言標簽之間的對應關系。唯一的語種為漢語拼音的skos:altLabel值默認對應skos:prefLabel中的中文語種標簽。

出于對類名敘詞化發(fā)展趨勢(如軍用電子分類表中類名的描述需求)以及支持系統(tǒng)實現(xiàn)便利方面的考慮,本規(guī)范對敘詞概念和類目概念的語言標簽采用了統(tǒng)一的描述方式。但嚴格來講,一個類目的完整顯示應該是類號+類名,即skos:notation+空格+skos: prefLable,它們的完整出現(xiàn)才代表一個唯一的類目。一般情況下,單獨的類名不能代表一個類目。因此,需要通過dc:type(詞表類型,參見文獻[5]第一篇表1-7-1)來區(qū)分不同的KOS類型,以使支持系統(tǒng)可以選擇不同的顯示方案(對于不同的KOS類型,同樣的類和屬性在顯示時的語言標簽也可能不同)。

4.4 概念的標記符號的描述

在分類法中,類號是類目的標記符號或代號,它用號碼表示類目的含義,決定類目在分類體系中的排列位置,表達類目之間的關系。在分類法主表中,類號具有唯一性,即一個類號只能代表一個類目。附表(復分表,仿分表)中的類號需與主表類號組配使用,不能獨立使用。同一分類法所包含的不同附表中的類號可能重復,即同一個類號在不同附表中代表不同的類目。

SKOS規(guī)定,標記符號(notation)是一個字符串(如“T58.5”或“303.4833”),用于唯一地標識一個給定的概念體系范圍內(nèi)的一個概念。一個概念可以有0個、1個或多個標記符號(來自同一個或不同的符號系統(tǒng))。但來自同一個概念體系中的兩個概念不能擁有相同的標記符號,否則將不可能用這個標記符號唯一地指向一個概念(即,標記符號將有多義性)。

顯然,分類法主表中的類號可以用skos:notation來描述。如果將附表中的類目視為與主表類目同屬于一個概念體系,那么不同附表中的重復類號將會違反SKOS的“標記符號唯一地標識一個給定的概念體系范圍內(nèi)的一個概念”的原則。因此,在不同附表中的類目概念存在類號重復的情況時,需要將附表視為獨立的概念體系(如準備獨立使用的通用復分表)或子概念體系(如不能獨立使用的通用復分表、專類復分表和仿分表,采用CNKOS擴展版時可用)。此時,用skos:notation來描述附表中的類號將不再違反SKOS的原則。

敘詞表中敘詞概念對應的分類號或范疇號,本身并不是敘詞概念的唯一標記符號,而是與某一分類體系中的類目概念的對應關系,如中圖法類號對應的是中圖法中的相應類目,范疇號對應的是敘詞表本身帶有的分類索引(范疇表)中的類目。而且,在敘詞表中,同一個分類號或范疇號一般對應于多個敘詞概念,并不具有唯一性。因此,本規(guī)范建議:敘詞表中敘詞概念對應的分類號或范疇號,不用skos:notation來描述,而采用SKOS的映射屬性進行描述。此時,對應的分類法或分類索引(范疇表)應描述為獨立的概念體系。同時,可以采用國際上已有的分類號元數(shù)據(jù)來描述一些常用的分類號,如DC Terms的UDC、LCC、DDC元數(shù)據(jù)。

例7中用skos:notation描述了CLC主表中的類目的類號。

例 7 rdf:type skos:Concept; skos:prefLabel "哲學、宗教"; skos:notation "B".

例8展示了CLC中附表(通用復分表 “二、世界地區(qū)表” )中類目的類號的描述方法(參見例3)。

注:采用純SKOS版時,上例中的ckos:LocationConcept應替換為skos:Concept。

規(guī)范代碼表,即每個術語(概念)都擁有唯一規(guī)范代碼的術語列表,也可以仿照分類法的類目描述方式進行描述:每一條規(guī)范記錄視為一個SKOS概念(類似于類目概念),用skos:Concept表示;規(guī)范代碼類似于類號,用skos:notation表示;相對應的術語類似于類名,用skos:prefLabel表示。

目前國內(nèi)外元數(shù)據(jù)標準中還沒有中圖法分類號等國內(nèi)常用分類號的元數(shù)據(jù)元素,建議相關部門在制定或引進元數(shù)據(jù)標準(如DC Terms)時,增加CLC等國內(nèi)常用分類號的元數(shù)據(jù)元素,使它們能夠像UDC、LCC、DDC那樣,廣泛參與國際間交流。OntoThesaurus中為國內(nèi)常用的兩種分類號定義了相應的屬性:ont:CLC和ont:LCCAS[17],如有需要也可以使用。

4.5 概念間語義關系的描述

中文敘詞表中敘詞概念之間的語義關系包括屬(S,即上位詞)、分(F,即下位詞)、族(Z,即族首詞)、參(C,即相關詞)關系。用代關系在SKOS中被處理為敘詞概念與兩個語言標簽之間的關系,詳見第4.3節(jié)。在敘詞表中,敘詞概念之間的等級關系(即屬、分關系)是經(jīng)過嚴格控制的,一般具有傳遞性。但在敘詞款目中,一般只包含直接上下位關系詞。

傳統(tǒng)分類法(體系分類法)中類目概念之間的語義關系主要包括上位類、下位類和相關類關系。交替類目與正式類目之間的關系可視為類目概念之間的一種等同關系(需擴展SKOS進行描述,參見文獻[5][6])。在分類法中,同位類也是一種比較重要的類目間關系,指與某一類目具有同一個上位類的其他類目,它們能夠通過上(下)位類關系推理得出,可以不作明確的描述聲明。

分類法中類目概念的含義在一個由上位概念、同位概念、下位概念、相關概念和類目注釋構(gòu)成的語義空間中進行限定。分類法中的類目注釋種類繁多,其中隱含了大量的語義關系,包括相關關系,CNKOS擴展版擴展了一些關系屬性可將其明確揭示出來,參見文獻[5][6]。

SKOS的語義關系(semantic relation)是SKOS概念之間的鏈接(link),這種鏈接是兩個被鏈接概念的含義中固有的。SKOS區(qū)分兩種基本的語義關系種類:等級(hierarchical)和相關(associative)。兩個概念之間的等級鏈接指明一個概念(broader)在某一方面比另一個概念(narrower)更全面(或概括、廣義,general)。兩個概念之間的相關鏈接指明兩個概念是內(nèi)在“相關的”(related),但其中一個并不比另一個更全面。

SKOS用skos:broader和skos:narrower來聲明兩個SKOS概念之間的直接等級鏈接。三元組“ skos: broader ”斷言:這個三元組的客體,是三元組的主體的上位概念。類似地,三元組“ skos: narrower ”斷言:這個三元組的客體,是三元組的主體的下位概念。

按照常規(guī),skos:broader和skos:narrower只用來聲明兩個SKOS概念之間直接的等級鏈接。這給了應用程序一種方便而可靠的方式來訪問任意一個給定概念的直接上位或下位鏈接。這兩個屬性沒有被聲明為傳遞屬性。

一些應用程序需要使用概念之間的直接和間接等級鏈接,例如通過查詢擴展提高搜索的查全率(recall)。為此目的,SKOS提供了屬性skos: broaderTransitive和skos:narrowerTransitive。三元組“ skos:broaderTransitive ”表示了一個直接或間接的等級鏈接,其中的一個上位“祖先”(ancestor)。類似地,三元組“ skos: narrowerTransitive ”也表示了一個直接或間接的等級鏈接,其中的一個下位“后代”(descendant)。

但按照SKOS的規(guī)定,skos:broaderTransitive和skos:narrowerTransitive不用來進行聲明(斷言)。這兩個屬性用來推理等級鏈接的傳遞閉包(transitive closure),該傳遞閉包可以用來訪問概念之間的直接或間接等級鏈接。

屬性skos:related用來聲明兩個SKOS概念之間的相關鏈接,它是對稱屬性。

中文敘詞表和分類法中的等級關系和相關關系顯然可以采用以上SKOS的語義關系屬性進行描述。

在傳統(tǒng)的中文敘詞表(主題詞表)中,敘詞的族首詞指的是敘詞概念與其所屬詞族等級的頂級概念之間的關系,即應描述為兩個SKOS概念之間的關系。SKOS中的skos:hasTopConcept和skos:topConceptOf屬性揭示的是概念體系與其包含的頂級概念之間的關系(參見4.1節(jié)),因此如果用SKOS的這兩個屬性來描述敘詞表中的族首詞關系,語義上會有所改變。CNKOS規(guī)范提供兩種選擇:一是不明確聲明敘詞款目中敘詞概念的族首詞關系,需要時通過上下位關系屬性推理得出;二是使用擴展的owl:ObjectProperty的實例ckos:topConcept來描述傳統(tǒng)敘詞表敘詞款目中的族首詞關系,以方便從任一敘詞出發(fā)直接獲取其族首詞。這個擴展屬性可與skos:hasTopConcept和skos: topConceptOf同時使用,表達相應的語義。鑒于查看某一敘詞款目時需要經(jīng)常通過族首詞顯示整個詞族等級,使用第二種方案,即明確揭示敘詞概念與其族首詞之間的關系,可以大大減少推理的負擔。采用純SKOS版時則只能選用第一種方案。

例9展示了CLC中類目概念的上位類的描述方法。

例 9 rdf:type skos:Concept; skos:prefLabel "哲學、宗教". rdf:type skos:Concept; skos:prefLabel "宗教"; skos:broader .

例10展示了《中國分類主題詞表》的主題詞表部分(CCT_CT)中敘詞概念的語義關系的描述方法。

例 10 <馬克思主義哲學> rdf:type skos:Concept; skos:broader <馬克思主義三個組成部分>, <哲學>; skos:narrower <辯證唯物主義>, <歷史唯物主義>, <唯物辯證法>; ckos:topConcept <馬克思主義三個組成部分>, <哲學>; (采用純SKOS版時略)skos:related <辯證邏輯>, <自然辯證法>.

未來需要的進一步擴展及思考:如果要支持ISO 25964-1中擴展的種屬(generic)、實例(instance)和部分-整體(part-whole)這三種子等級關系的語義描述,則需要擴展新的子屬性。請參見OntoThesaurus的相應定義[17,18]。

CNKOS規(guī)范是基于SKOS的擴展版本,因此盡量選擇使用SKOS的原有定義。SKOS中定義的以上四種等級關系屬性對于現(xiàn)有的傳統(tǒng)中文KOS中的語義關系描述是基本適用的。有擴展描述需求的高受控詞表宜采用OntoThesaurus進行描述。

4.6 注釋的描述

中文敘詞表中的注釋一般分為含義注釋、用法注釋和歷史注釋,注釋種類相對較少,表現(xiàn)形式也比較統(tǒng)一,一般可以找到對應的SKOS注釋屬性進行描述。ISO25964-1[19]中的note種類與SKOS的注釋屬性種類基本對應。

傳統(tǒng)分類法中的注釋雖然一般分為含義范圍注釋、使用說明注釋和沿革注釋,與敘詞表中的注釋類型基本對應,但實際上可細分的注釋種類很多,表現(xiàn)形式各異,而且還隱含了很多類目與類目之間、類目與附表之間、類目與主題之間的鏈接關系。這些注釋對類目的正確使用至關重要,是類目概念款目中不可缺少的組成部分。如果只采用SKOS現(xiàn)有的注釋屬性進行描述,有些注釋在語義上會有所缺失,而且隱含的語義關系也只能供人閱讀,機器無法理解。因此,CNKOS規(guī)范建議進行一些必要的擴展,以明確揭示不同注釋的語義和隱含的鏈接關系[5,6]。

對于對注釋沒有細分要求(即對各種注釋的處理無區(qū)別,只顯示給人看)的KOS,如中文敘詞表,建議選用skos:note(一般注釋)、skos:definition(定義注釋)、skos:scopeNote(含義范圍注釋)、skos: historyNote(歷史注釋)這幾個屬性描述相應的注釋類型。其中最常用的是skos:scopeNote。

對于對注釋有細分要求的KOS(即需要支持系統(tǒng)對不同的注釋類型區(qū)別對待,如CLC,軍用電子分類表等),則建議根據(jù)需要選用skos:note及其相應子屬性,甚至擴展skos:note(或其子屬性)的子屬性進行描述。

當采用純SKOS版時,只能選用SKOS已有的注釋屬性描述分類法中的注釋,具體對應關系請參見CNKOS規(guī)范[5]中的表3。

例11展示了CLC中類目注釋的描述方法。

例 11 rdf:type skos:Concept; skos:prefLabel "哲學、宗教"; skos:scopeNote "總論哲學及兼論哲學與宗教的著作入此。", "宗教入B9。", "專門科學的哲學理論入有關各類。例:教育哲學入G40-02;歷史哲學入K01。"; skos:note "依總論復分表分,-0理論與方法論所屬類目入B0。". rdf:type skos:Concept; skos :prefLabel "宗教"; skos:broader ; skos:note "依總論復分表分。"; skos:historyNote "<3版類名:無神論、宗教>:.

4.7 不同概念體系中概念之間映射關系的描述

SKOS采用映射屬性(mapping property)來聲明不同概念體系中SKOS概念之間的映射(對齊)鏈接,這些鏈接是被鏈接概念的含義中內(nèi)在固有的。

SKOS的映射屬性包括skos:mappingRelation及其子屬性:skos:closeMatch(包含子屬性skos: exactMatch)、skos:broadMatch、skos:narrowMatch和skos:relatedMatch。

屬性skos:broadMatch和skos:narrowMatch用來聲明兩個概念之間的一個等級映射鏈接。屬性skos: relatedMatch則用來聲明兩個概念之間的一個相關映射鏈接。

屬性skos:closeMatch用來鏈接兩個足夠相似的概念,它們可以在某些信息檢索應用程序中交換使用。為了避免當組合跨越兩個以上概念體系的映射時出現(xiàn)“復合錯誤”(compound errors)的可能性,skos: closeMatch沒有被聲明為是一個傳遞屬性。

屬性skos:exactMatch用來鏈接兩個概念,表明了一種高度的信心:這兩個概念可以在很大范圍的信息檢索應用程序之間交換使用。它是一個傳遞屬性,而且是skos:closeMatch的子屬性。

在國內(nèi)的受控詞表中,不同分類法的類目概念之間,不同敘詞表的敘詞(正式主題詞)概念之間,以及分類法的類目概念與敘詞表的敘詞概念之間,都存在概念含義中固有的映射關系。我們可以采用以上所述的SKOS的映射屬性對它們進行描述。具體使用哪一個屬性需要根據(jù)具體情況而定。

例如,在中國分類主題詞表(CCT)中,類目與主題詞之間的對應關系分為三種類型:(1)直接對應;(2)間接對應;(3)非主要類目對應。

第一種類型是直接的對應,建議統(tǒng)一使用skos: closeMatch來描述。如果選用skos:exactMatch,需要人工進一步確認其可交換使用的程度,因為即使類名與主題詞字面上完全一致,類目的涵蓋范圍也未必和主題詞完全相同(類目的含義是在一個由上位概念、同位概念、下位概念、相關概念和類目注釋構(gòu)成的語義空間中進行限定的)。

第二種類型是一種間接的對應,可能是除skos: closeMatch(和skos:exactMatch)之外的任何一種映射關系(skos:broadMatch、skos:narrowMatch和skos:relatedMatch)。如果要統(tǒng)一描述,現(xiàn)有的SKOS映射屬性似乎沒有完全適用的。若統(tǒng)一使用skos:mappingRelation來描述這種間接對應關系,又體現(xiàn)不出主次對應關系的區(qū)別。CNKOS規(guī)范建議,擴展一個與skos:closeMatch對應的映射屬性ckos: nonCloseMatch,它是skos:mappingRelation的子屬性,用于描述skos:closeMatch(和skos:exactMatch)之外的所有關系[5,6]。

第三種類型是用豎線標識的與非主要類目對應的主題詞,建議選用skos:relatedMatch進行描述。

CCT_CT(主題詞—分類號對應表)將主題詞對應的分類號區(qū)分為等同對應類號、主要類號、次要類號、交替等同對應類號、交替類號。其中主、次、交替是從類號的使用角度進行區(qū)分的,主要類號用作排架類號,次要類號不用于排架,但可用于檢索,交替類號則作為專業(yè)機構(gòu)的一種選擇。一個類號可以同時是等同對應類號和主類號。因此建議第一步仍按直接(skos: closeMatch)、間接(ckos:nonCloseMatch)和非主要類目對應(skos:relatedMatch)的方式對它們分別進行描述,以便與上述類目-主題詞對應關系的描述雙向統(tǒng)一。例如:等同對應類號、交替等同對應類號、主要類號(直接對應)和交替類號(直接對應)均用skos:closeMatch描述,間接對應的主要類號和交替類號用ckos:nonCloseMatch描述,次要類號用skos:relatedMatch描述。映射的類目概念是否是交替類目,在該類目概念本身的描述中會進行聲明。

當采用純SKOS版時,上面所說的間接對應需明確區(qū)分skos:broadMatch、skos:narrowMatch和skos: relatedMatch,或暫時先采用skos:mappingRelation統(tǒng)一描述,之后再逐步細化描述。

5 結(jié)語

因篇幅所限,本文不能提供示例的SKOS詳細代碼。深圳大學圖書館NKOS研究室已經(jīng)實現(xiàn)了OTCSS Linked Data服務,目前提供CCT一版全部數(shù)據(jù)[16,20]和CLC四版全部數(shù)據(jù)[15]的Linked Data服務,可在線檢索下載所需敘詞概念和類目概念的SKOS和CNKOS格式語義描述代碼(可選擇RDF/XML、N-Triples和JSON格式)。歡迎使用并多提寶貴意見。

本規(guī)范保留了SKOS Core的完整數(shù)據(jù)模型,因此對于SKOS適用的主題標題表、分類表、民間分類表和其他類似的受控詞表同樣適用。比分類法和敘詞表結(jié)構(gòu)更簡單的中文規(guī)范檔、術語列表(規(guī)范代碼表)等類型,也可以簡化使用本規(guī)范進行描述。

中文知識組織系統(tǒng)形式化語義描述標準體系擬包含純SKO S版、C N KO S擴展版、高受控OntoThesaurus版及OWL應用規(guī)范四個部分。敬請關注本系列論文的后續(xù)部分以及深圳大學圖書館NKOS研究室網(wǎng)站(http://nkos.lib.szu.edu.cn)。本研究室致力于中文NKOS的公益性研究和服務,希望與各方有識之士建立良好的合作關系,共同推進我國NKOS研究的發(fā)展。

[1]曾新紅.受控表語義描述規(guī)范(D009-3)[R].國家圖書館,2011.

[2]曾新紅,王軍.“中國分類主題詞表”語義描述規(guī)范及應用指南(D009-4)[R].國家圖書館,2011.

[3]曾新紅.受控表語義描述規(guī)范之調(diào)研報告(D009-8)[R].國家圖書館,2011.

[4]王軍,曾新紅,歐石燕.國家圖書館知識組織標準規(guī)范[R].國家圖書館,2011.

[5]王軍,卜書慶.網(wǎng)絡環(huán)境下的知識組織規(guī)范和應用指南[M].國家圖書館出版社,2012.

[6]曾新紅.中文知識組織系統(tǒng)形式化語義描述標準體系研究(一):擴展SKO S實現(xiàn)傳統(tǒng)受控詞表全描述[J].中國圖書館學報,2012(3):57-68.

[7]W3C. SKOS Simple Knowledge Organization System Reference: W3C Recommendation 18 August 2009 [EB/ OL]. [2010-02-23]. http://www.w3.org/TR/2009/REC-skosreference-20090818/.

[8]W3C. SKOS Simple Knowledge Organization System Primer: W3C Working Group Note 18 August 2009 [EB/OL]. [2010-02-23]. http://www.w3.org/TR/2009/NOTE-skosprimer-20090818/.

[9]戴維民.信息組織[M].2版.北京:高等教育出版社,2009.

[10]中華人民共和國國家標準. GB 13190-91,漢語敘詞表編制規(guī)則[S].國家技術監(jiān)督局,1991.

[11]中華人民共和國國家標準. GB/T 3860-2008,文獻主題標引規(guī)則(報批稿)[S].國家質(zhì)量技術監(jiān)督檢驗檢疫總局.

[12]國家圖書館《中國圖書館分類法》編輯委員會.中國分類主題詞表:第二版[M].北京圖書館出版社,2005.

[13]中國圖書館分類法編輯委員會.中國圖書館分類法[M].4版.北京圖書館出版社,1999.

[14]中華人民共和國國家軍用標準. GJB6793- 2009,軍用電子分類表編制規(guī)則[M].中國人民解放軍總裝備部.

[15]深圳大學圖書館NKOS研究室. CLC Linked Data服務[EB/OL]. [2012-12-25]. http://nkos.lib.szu.edu.cn/CCT_CLC_V4.0.

[16]深圳大學圖書館NKOS研究室. CCT1 Linked Data服務[EB/OL]. [2011-01-16]. http://nkos.lib.szu.edu.cn/CCT_CT_V1.0.

[17]曾新紅.中文敘詞表本體OntoThesaurus詞匯表[EB/OL]. [2010-11-11]. http://nkos.lib.szu.edu.cn/2010/10/ont/.

[18]曾新紅.中文敘詞表本體的形式化表示與SKOS的比較研究:以及對建立中文知識組織系統(tǒng)形式化表示標準體系的建議[J].中國圖書館學報,2010(2):99-106.

[19]ISO. ISO/CD 25964-1, Information and documentation -- Thesauriand interoperability with other vocabularies -- Part 1: Thesauri for information retrieval [S]. ISO, 2008.

[20]黃華軍,曾新紅,林偉明.OTCSS關聯(lián)數(shù)據(jù)服務的研究與實現(xiàn)[J].現(xiàn)代圖書情報技術,2012(7/8):40-47.

SKOS Specializations and Guides for Chinese Controlled Vocabularies

ZENG XinHong
(NKOS Research Of fi ce, Shenzhen University Library, Shenzhen 518060, China)

Based on the authoritative theory and building standards for information retrieval languages (such as thesauri and Classi fi cation Schemes) in China, and the preparation instructions for Chinese Classi fi cation Thesaurus, Chinese Thesaurus, Chinese Library Classi fi cation, and the Guidelines for establishment of military electronic classi fi cation schemes, as well as the existing research at home and abroad, the SKOS speci fi cations for Chinese Controlled Vocabularies are studied and formulated with the SKOS standards as the criterion, from the point of view of the easy sharing and implementation. The application guides are also given with examples.

Controlled vocabulary; Classi fi cation scheme; Thesaurus; Formal representation; Semantic description; SKOS; CNKOS; KOS

G254; TP18

10.3772/j.issn.1673—2286.2014.04.002

曾新紅,女,1968年生,碩士,深圳大學圖書館NKOS研究室研究館員。E-mail: zengxh@szu.edu.cn。

2014-04-04)

*本研究得到國家數(shù)字圖書館工程項目“知識組織標準規(guī)范”(編號:D009)、廣東省哲學社會科學“十一五”規(guī)劃項目“中文知識組織系統(tǒng)形式化語義描述標準體系研究”(編號:GD10CTS02)和國家社會科學基金項目“中文知識組織系統(tǒng)形式化語義描述標準體系研究”(編號:12BTQ045)的資助。

猜你喜歡
詞表分類法類目
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
英語世界(2021年13期)2021-01-12 05:47:51
本期練習題類目參考答案及提示
分類法在高中化學中的應用
K 近鄰分類法在巖屑數(shù)字圖像巖性分析中的應用
錄井工程(2017年1期)2017-07-31 17:44:42
敘詞表與其他詞表的互操作標準
基于貝葉斯分類法的股票選擇模型的研究
ABC分類法在介入耗材庫存管理中的應用
《中圖法》第5版交替類目研究綜述
黃三角、長三角、珠三角明、清及民國通志一級類目比較*
圖書館論壇(2015年2期)2015-01-03 01:43:00
DDC22與CLC5化學類目映射分析
桐梓县| 凉山| 长兴县| 密山市| 罗平县| 偃师市| 冀州市| 通城县| 榆林市| 台南市| 大埔区| 涿州市| 庄河市| 塔河县| 蛟河市| 黄山市| 桐乡市| 涡阳县| 开鲁县| 香港| 峡江县| 黄冈市| 松原市| 五峰| 五指山市| 沂水县| 赤峰市| 翁源县| 阜阳市| 佛冈县| 报价| 开平市| 鄂托克旗| 芜湖县| 乐业县| 江安县| 平凉市| 南开区| 邯郸县| 大渡口区| 石棉县|