全紅
本文從本體知識(shí)表示基礎(chǔ)上出發(fā),采用OWL描述本體知識(shí),闡述了OWL語言的描述敘詞表的方法及其本體轉(zhuǎn)化的過程,為中文敘詞表的網(wǎng)絡(luò)化和智能化發(fā)展提供了技術(shù)上的參考.
基于OWL語言描述網(wǎng)絡(luò)敘詞表的方法
由于互聯(lián)網(wǎng)的發(fā)展,出現(xiàn)了像谷歌、百度等大型網(wǎng)絡(luò)搜索引擎,可以通過日志標(biāo)注來獲取用戶檢索用詞的種類頻次,敘詞表由敘詞及敘詞之間關(guān)系組成,采用參考符號(hào)顯示并清楚的區(qū)分間敘詞間基本語義關(guān)系,習(xí)慣上主要分為3種:①等同關(guān)系(Equivalence Relationship)又稱同一關(guān)系、用代關(guān)系,指含義相同或相近的敘詞與非敘詞之間的關(guān)系;②等級(jí)關(guān)系(Hierarchical Relationship),包含屬種、整部和多層級(jí)關(guān)系;③相關(guān)關(guān)系(Associative Relationship),又稱類緣關(guān)系,表示一個(gè)概念與另一個(gè)概念相關(guān)。通過“、代、屬、分、族、參(分別以漢語拼音字母首字Y、D、S、F、Z、C表示)”示敘詞關(guān)系。其中,“Y、D”表示同一關(guān)系“S、F”等級(jí)關(guān)系,“Z”表示一組詞中最大的族首詞,“C”表示相關(guān)關(guān)系。在OWL語言中,用類、個(gè)體與屬性等關(guān)系語句描述實(shí)體間的關(guān)系,用OWL描述敘詞間的關(guān)系,與(漢表)的敘詞關(guān)系表示有很多相似的地方和相應(yīng)的語句。如圖1所示。
(三)相關(guān)關(guān)系的OWL描述
基于OWL語言網(wǎng)絡(luò)環(huán)境下本體知識(shí)表示
中文敘詞表作為一種規(guī)范化詞表,在信息結(jié)構(gòu)化檢索中起到準(zhǔn)確匹配的作用。但同現(xiàn)有的本體相比,中文敘詞表更多的面向人而不是面向計(jì)算機(jī)構(gòu)建,沒有采用計(jì)算機(jī)形式化語言表述,因而限制其發(fā)展。我國專家利用一些本體加以利用構(gòu)建新的的本體,以尋求語義網(wǎng)環(huán)境下的新的發(fā)展[4]。
在OWL知識(shí)表示中,首先需要對(duì)信息資源和知識(shí)資源進(jìn)行面向?qū)ο?,抽取?duì)象概念以及他們之間的關(guān)系,然后遵循OWL知識(shí)表示的語法要求,建立對(duì)應(yīng)的抽類(包括概念、屬性、關(guān)系等),并將這些類存放在一個(gè)OWL類型聲明文檔中,然后再定義這些類的實(shí)例,放到另一個(gè)OWL知識(shí)文檔。有這些OWL文檔構(gòu)成知識(shí)庫。
基于OWL環(huán)境下網(wǎng)絡(luò)敘詞表本體轉(zhuǎn)化
當(dāng)前,本體是圖書情報(bào)領(lǐng)域的研究熱點(diǎn)。英美兩國以對(duì)其受控詞表的編制標(biāo)準(zhǔn)進(jìn)行了修訂等;2005年,美國國家信息標(biāo)準(zhǔn)組織NISO發(fā)布了Z39.19的四版Z39.19-2005,而同年英國標(biāo)準(zhǔn)協(xié)會(huì)(British Standards Instiution,BSI)也發(fā)布了BS5723的升級(jí)版本。說明國外在這方面的研究已取得了第三階段,而我國中文敘詞表電子化網(wǎng)絡(luò)化的發(fā)展整體水平方面還比較薄弱??偨Y(jié)OWL描述的網(wǎng)絡(luò)敘詞表的本體轉(zhuǎn)換的步驟。
本體重在概念及其關(guān)系的體現(xiàn),其內(nèi)在的關(guān)系規(guī)則在表達(dá)不同詞之間的等同、從屬和相關(guān)關(guān)系的同時(shí),也提供一種推理的機(jī)制。因此,應(yīng)充分利用敘詞表進(jìn)行本體的構(gòu)建,將敘詞表轉(zhuǎn)化為本體等在網(wǎng)絡(luò)時(shí)代知識(shí)組織系統(tǒng)中發(fā)揮作用。
(一)準(zhǔn)備階段
主要任務(wù)是分析敘詞表,敘詞表的概念模型作為本體轉(zhuǎn)換的背景知識(shí)的分析,概念模型和數(shù)字模型之間的關(guān)系的分析。
(二)類和屬性確定
從敘詞表到OWL的語義轉(zhuǎn)換規(guī)范,只有這樣才能充分利用現(xiàn)有詞表資源進(jìn)行OWL描述,縮短工作時(shí)間,減輕勞動(dòng)效率。通過一系列準(zhǔn)備步驟可以通過建立通用的轉(zhuǎn)化規(guī)則映射表來實(shí)現(xiàn)。
(三)描述階段
按照前面步驟中確定的關(guān)系、類、屬性和語法、語義對(duì)照表進(jìn)行表示和描述。
在轉(zhuǎn)化過程中應(yīng)該遵循以下規(guī)則:使用基于XML的數(shù)據(jù)類型;盡量保持原始命名;盡量和敘詞表的原始結(jié)構(gòu)保持相近;不要轉(zhuǎn)化一些與語義無關(guān)的命令信息,避免信息過量。
(作者單位:新疆石河子大學(xué)圖書館)