国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)系型本體轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)技術(shù)方案比較研究

2014-01-16 01:09濮德敏任瑞娟
圖書館理論與實(shí)踐 2014年12期
關(guān)鍵詞:關(guān)系數(shù)據(jù)庫三元組本體

●濮德敏,任瑞娟,米 佳,張 欣

(1.河北大學(xué)a.管理學(xué)院,b.圖書館,河北保定071002;2.天津空港經(jīng)濟(jì)區(qū)文化中心,天津300308)

關(guān)系型本體轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)技術(shù)方案比較研究

●濮德敏1,b,任瑞娟1,a,b,米 佳b,張 欣2

(1.河北大學(xué)a.管理學(xué)院,b.圖書館,河北保定071002;2.天津空港經(jīng)濟(jì)區(qū)文化中心,天津300308)

關(guān)系型本體;關(guān)聯(lián)數(shù)據(jù);轉(zhuǎn)化;Ⅴirtuoso;Triplify;D2R

論述了關(guān)系型本體向關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)化的可行性,在此基礎(chǔ)上分別論述了Ⅴirtuoso Universal Server、Triplify、D2R三種主流的轉(zhuǎn)化技術(shù)方案并進(jìn)行了比較分析,得出結(jié)論:D2R方式是當(dāng)前規(guī)?;D(zhuǎn)化的優(yōu)選方式,并將國內(nèi)成功實(shí)現(xiàn)的研究機(jī)構(gòu)——河北大學(xué)知識組織與知識管理實(shí)驗(yàn)室作為本研究的成功案例進(jìn)行了介紹。

關(guān)系型數(shù)據(jù)庫是結(jié)構(gòu)化數(shù)據(jù)的存儲方式,也是規(guī)?;倔w存儲的常用格式,在其中的數(shù)據(jù)屬性間和表與表間主鍵連接中蘊(yùn)含大量的關(guān)聯(lián)關(guān)系,此關(guān)聯(lián)關(guān)系是完全可以采取自動或半自動方式提取并加以定義為互聯(lián)網(wǎng)語義化組織所廣為應(yīng)用的。因此,本論文的研究就是針對這種關(guān)系型數(shù)據(jù),利用關(guān)聯(lián)數(shù)據(jù)技術(shù),實(shí)現(xiàn)自動或半自動提取數(shù)據(jù)的關(guān)聯(lián)關(guān)系并加以定義、映射和發(fā)布,實(shí)現(xiàn)基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的語義化信息發(fā)布,并作為關(guān)鍵詞查詢的補(bǔ)充,提高語義查找效率,最終提高搜索結(jié)果的語義理解并扶持決策。[1]從本體出發(fā),依據(jù)其語義關(guān)系,采用關(guān)聯(lián)數(shù)據(jù)技術(shù)方案是知識檢索的最佳方案,而解決問題的核心是將本體和關(guān)聯(lián)數(shù)據(jù)相結(jié)合。[2]

1 關(guān)系型本體向關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)化可行性

1.1 關(guān)系型數(shù)據(jù)庫

關(guān)系模型的實(shí)體以及實(shí)體之間的關(guān)系都可以用二維表來表示,其屬性間的關(guān)系可以看成是一種單一的結(jié)構(gòu)關(guān)系。依關(guān)系模型中實(shí)體間聯(lián)系的復(fù)雜程度,分成三種:一對一聯(lián)系,一對多聯(lián)系和多對多聯(lián)系。實(shí)體關(guān)系模型利用圖形的方式呈現(xiàn),即,實(shí)體-關(guān)系圖(圖1)來表示數(shù)據(jù)庫的結(jié)構(gòu)及概念設(shè)計(jì)。

圖1 實(shí)體-關(guān)系圖

在上述關(guān)系模型的實(shí)例中,通常將每一個(gè)實(shí)體設(shè)計(jì)為一個(gè)表,方框中的三個(gè)實(shí)體則分別存儲著者、出版、作品三類不同實(shí)體,橢園內(nèi)為實(shí)例,在關(guān)系模型中表現(xiàn)為表的屬性。

1.2 關(guān)系型本體

本體能夠體現(xiàn)出知識和知識之間的語義關(guān)系,本研究的本體是指由詞表、術(shù)語等改造而成的輕量級本體?;谖募到y(tǒng)存儲本體的方式簡單,但檢索效率低,且難適應(yīng)數(shù)據(jù)大的情況。采用關(guān)系型數(shù)據(jù)庫存取本體,這適合規(guī)?;Z義應(yīng)用系統(tǒng),能支持大數(shù)據(jù)下的高效語義查詢。關(guān)系型本體依其采用水平或垂直存儲形式的程度,分為水平型存儲、垂直型存儲或混合存儲,表及其屬性根據(jù)對術(shù)語的含義以及術(shù)語之間的關(guān)系加以定義。[2]由此,可用關(guān)系表來表示某個(gè)特定領(lǐng)域的知識。圖2是關(guān)系型本體庫的關(guān)系圖示。關(guān)系表Knowledge中的領(lǐng)域名稱、描述信息、子領(lǐng)域概念、領(lǐng)域公理集和上述本體定義相對應(yīng)。領(lǐng)域中概念都由概念名稱、屬性、屬性值、實(shí)例組成,關(guān)系表Sub-WordKnowlege中的名稱、描述信息、關(guān)系、屬性集、實(shí)例集、子領(lǐng)域概念集和上述子本體組成元素對應(yīng)。而本體庫中的關(guān)系、屬性、實(shí)例分別由關(guān)系表Relationship、Property、Ⅰnstance來表示。利用這種對應(yīng)關(guān)系,采用關(guān)系型數(shù)據(jù)庫存儲本體。

圖2 關(guān)系數(shù)據(jù)庫和本體庫之間的對應(yīng)關(guān)系

1.3 關(guān)聯(lián)數(shù)據(jù)組織模式

關(guān)聯(lián)數(shù)據(jù)的數(shù)據(jù)模型是RDF一階謂詞模型。RDF模型可以用三元組的方法來表示,即主語、謂語、客體構(gòu)成,稱為RDF陳述。例如:張老師教信息檢索課。其中,張老師是主語,是需要描述的資源,教是謂語,它可以看成描述主語與其某個(gè)屬性的關(guān)系,信息檢索課是客體,它其實(shí)可以看成是屬性的值或者關(guān)系的值。但不管是主語還是謂語最后都表示成HTTP URⅠ。而客體不僅可以是用HTTP URⅠ標(biāo)識的資源,也可是文本。即:主語可被認(rèn)為是類資源,謂語可被認(rèn)為是類資源的屬性,而客體或者是類資源或者是文字型資源。由客體的種類決定了三元組的分類,即分為文字型三元組以及非文字型三元組。

1.4 可行性分析

把主語和客體看作節(jié)點(diǎn),屬性看成是一條邊,則一個(gè)RDF陳述可表示成一個(gè)RDF有向圖。RDF實(shí)質(zhì)是一種二元關(guān)系的表達(dá),其中屬性和屬性值類似于關(guān)系模型,因此RDF數(shù)據(jù)模型可以被用來描述任何復(fù)雜的關(guān)系。實(shí)際上,屬性和屬性值都可以包含URⅠ,通過URⅠ可以訪問任何可以被標(biāo)識的事物,因此,RDF能聯(lián)系萬維網(wǎng)上各類事物,鏈接萬維網(wǎng)上的各種資源。Linked Data強(qiáng)調(diào)通過豐富的RDF鏈接,構(gòu)建資源的“語境”。[3,4]用戶可通過RDF命名域和值來表達(dá)與資源有關(guān)的簡單聲明,自定義一些詞匯,然后用這些詞匯來描述資源。

由于關(guān)系型數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)的概念模型都是基于實(shí)體、屬性及其關(guān)系而構(gòu)建,兩者具備建立映射和實(shí)現(xiàn)轉(zhuǎn)換的可能性,這種可能性是基于二者之間的關(guān)系確立。關(guān)系模型和RDF三元組之間的轉(zhuǎn)換關(guān)系從兩個(gè)方面入手:一是概念轉(zhuǎn)換,二是數(shù)據(jù)轉(zhuǎn)換(如表1)。

表1 關(guān)系模型與三元組之間的映射關(guān)系

因此,在關(guān)系模型和RDF三元組的轉(zhuǎn)換中,類名稱、數(shù)據(jù)屬性與實(shí)體名稱、實(shí)體關(guān)系的映射較明了。從表1可以看出:首先是類與實(shí)體的轉(zhuǎn)換表現(xiàn)為二維表與RDF三元組中類的轉(zhuǎn)換,也就是二維表轉(zhuǎn)換為RDF三元組中的主體或客體,而表的主鍵轉(zhuǎn)換為主語或?qū)ο蟮腢RⅠ;其次是數(shù)據(jù)屬性的轉(zhuǎn)換,也就是二維表的列轉(zhuǎn)換為三元組中的謂詞,而二維表的行數(shù)據(jù),轉(zhuǎn)換成文本對象。對象屬性的轉(zhuǎn)換較復(fù)雜,在關(guān)系數(shù)據(jù)庫中,實(shí)體內(nèi)部及實(shí)體之間的關(guān)系有不同的表達(dá)和構(gòu)建方式,且在設(shè)計(jì)轉(zhuǎn)換過程中根據(jù)實(shí)際需求有獨(dú)特的應(yīng)用設(shè)計(jì)。而在關(guān)聯(lián)數(shù)據(jù)中,資源描述框架鏈接表示對象之間的語義關(guān)系。因此,對象屬性的映射,是關(guān)系數(shù)據(jù)庫與關(guān)聯(lián)數(shù)據(jù)語義組織模式映射的關(guān)鍵。[5]關(guān)系型數(shù)據(jù)轉(zhuǎn)換關(guān)聯(lián)數(shù)據(jù)的構(gòu)建方式、模式轉(zhuǎn)換、語義映射分析如下。

(1)不同表之間的關(guān)聯(lián)關(guān)系。在關(guān)系型的某數(shù)據(jù)庫中,會用很多不同的表來代表不同的實(shí)體,而表與表之間的關(guān)系可以看成是實(shí)體與實(shí)體之間的關(guān)系。在關(guān)聯(lián)數(shù)據(jù)的資源描述框架中,通過關(guān)聯(lián)鏈接來表達(dá)不同表間的關(guān)聯(lián)關(guān)系。這些關(guān)系型數(shù)據(jù),根據(jù)其不同表之間的關(guān)系種類可以劃分為以下兩種。①通過外鍵標(biāo)引的表間關(guān)系。例如在書目數(shù)據(jù)表中,書目數(shù)據(jù)的keyword屬性,引自主題詞表的keywordsⅠD,主題數(shù)據(jù)的母體即keywords屬性,引自本體庫關(guān)系敘詞表的subjectⅠD。對這些數(shù)據(jù)進(jìn)行關(guān)聯(lián)數(shù)據(jù)發(fā)布時(shí),應(yīng)表達(dá)這些在數(shù)據(jù)庫中顯性構(gòu)建的關(guān)聯(lián)關(guān)系。②通過屬性來關(guān)聯(lián)的表間關(guān)系。例如書目數(shù)據(jù)表和教師信息表都有name屬性,表明兩者存在一定的關(guān)系,使用SQL檢索的語句如下:

select*from書目數(shù)據(jù)表,教師信息表where書目數(shù)據(jù)表.name=教師信息表.name

通過上面的SQL檢索語句,可得到書目數(shù)據(jù)表和教師信息表中相同作者姓名的關(guān)聯(lián)關(guān)系。如果再增加一定的限制條件,還能夠動態(tài)獲得某些關(guān)聯(lián)關(guān)系。

(2)同一表內(nèi)部的關(guān)聯(lián)關(guān)系。①二維表中的列,看以看成一個(gè)實(shí)體及其屬性之間存在的一對多的映射,表1中的實(shí)體屬性和數(shù)據(jù)屬性的映射轉(zhuǎn)換。例如關(guān)系敘詞表與其諸多列之間,存在一對多的內(nèi)在聯(lián)系。②兩個(gè)行列相同二維表,是指可以通過將一個(gè)表邏輯上拆分為兩個(gè)表,基于屬性相等的條件,構(gòu)建兩個(gè)不同實(shí)體的邏輯關(guān)系。

(3)與外部數(shù)據(jù)的關(guān)系。關(guān)聯(lián)數(shù)據(jù)即為從文檔網(wǎng)絡(luò)向數(shù)據(jù)網(wǎng)絡(luò)轉(zhuǎn)化的一種優(yōu)化策略,在關(guān)聯(lián)數(shù)據(jù)標(biāo)準(zhǔn)下,其可成為目前最好的發(fā)布和連接結(jié)構(gòu)化數(shù)據(jù)的規(guī)則。[6,7]在關(guān)系型數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)過程中,數(shù)據(jù)關(guān)聯(lián)化表示與外部更多的數(shù)據(jù)相關(guān)聯(lián)時(shí),需將這些數(shù)據(jù)與已知的URⅠ建立關(guān)聯(lián),關(guān)聯(lián)數(shù)據(jù)就是通過URⅠ、HTTP、RDF等語義網(wǎng)技術(shù)將網(wǎng)絡(luò)上相關(guān)的數(shù)據(jù)資源關(guān)聯(lián)起來。RDF用URⅠ標(biāo)識事物,用簡單的屬性(Property)及屬性值來描述資源,這使得資源描述框架可以將關(guān)于資源的簡單陳述中的一個(gè)或多個(gè)表示為一個(gè)由節(jié)點(diǎn)和弧組成的圖。其中,節(jié)點(diǎn)和弧代表資源、屬性或?qū)傩灾?。本質(zhì)上,RDF數(shù)據(jù)模型所描述是包含主體、謂詞和客體的三元組。RDF模式定義語言(Resource Description Framework Schema,簡稱RDFS)和網(wǎng)絡(luò)本體語言(Ontology Web Language,簡稱OWL)來建立描述實(shí)體及其聯(lián)系的詞表的基礎(chǔ)。任何人都可以建立網(wǎng)絡(luò)數(shù)據(jù)詞表,但這些數(shù)據(jù)須用RDF三元組表示,并可與其他詞表相關(guān)聯(lián)。

2 關(guān)系型數(shù)據(jù)的關(guān)聯(lián)化轉(zhuǎn)化主流技術(shù)方案

雖然關(guān)聯(lián)數(shù)據(jù)在進(jìn)行數(shù)據(jù)的語義查詢時(shí)帶來了便利,但目前很多現(xiàn)有的數(shù)據(jù)并不滿足關(guān)聯(lián)數(shù)據(jù)的準(zhǔn)則。要想把現(xiàn)有的數(shù)據(jù)發(fā)布成關(guān)聯(lián)數(shù)據(jù),須借助自動化工具,Linked Data推動者促使相應(yīng)工具的產(chǎn)生,常見的主流軟件有D2R、Drupal、Ⅴirtuoso、Triple等,且這些軟件都是開源的。

2.1 Ⅴirtuoso Universal Server方式

Ⅴirtuoso Universal Server系統(tǒng)屬于應(yīng)用程序服務(wù),其架構(gòu)為一種網(wǎng)絡(luò)實(shí)時(shí)程序設(shè)計(jì)架構(gòu)。Ⅴirtuoso是一種開放鏈接軟件、支持跨平臺應(yīng)用操作系統(tǒng),主要功能是提供網(wǎng)絡(luò)查詢與瀏覽服務(wù)。數(shù)據(jù)以被稱為三元組的形式存儲(subject-predicate-object)類型,支持導(dǎo)入/導(dǎo)出RDF文件來對數(shù)據(jù)進(jìn)行操作。

Ⅴirtuoso具有通用操作系統(tǒng)的特點(diǎn),提供硬件虛擬化,是一種嵌入式實(shí)時(shí)操作系統(tǒng)。ⅤirtuosoⅠDE中對于應(yīng)用程序的編譯、加載、運(yùn)行可自動完成,并為程序調(diào)試提供所有目標(biāo)的動態(tài)信息,程序運(yùn)行的結(jié)果可調(diào)用實(shí)時(shí)庫函數(shù),通過主機(jī)實(shí)現(xiàn)輸出操作。Ⅴirtuoso Universal Server由關(guān)聯(lián)數(shù)據(jù)界面或一個(gè)SPARQL端點(diǎn)將數(shù)據(jù)轉(zhuǎn)化為RDF數(shù)據(jù),且直接存儲在Ⅴirtuoso中。Ⅴirtuoso具備混合體系結(jié)構(gòu)能夠提供以下幾個(gè)方面的功能模塊:關(guān)系數(shù)據(jù)管理、RDF數(shù)據(jù)管理、XML數(shù)據(jù)管理、文字內(nèi)容管理和全文索引、文件Web服務(wù)器、鏈接數(shù)據(jù)服務(wù)器、Web應(yīng)用服務(wù)器、部署Web服務(wù)(SOAP或REST),支持SPARQL查詢。[6]

2.2 Triplify方式

Triplify,是AKSW(The Agile Knowledge and Semantic Web,簡稱ASKW)研究組最近發(fā)布的產(chǎn)品,目的在“為萬維網(wǎng)的‘語義化’提供建筑單元”。Triplify是發(fā)布從關(guān)系數(shù)據(jù)庫到RDF并且鏈接web數(shù)據(jù)的一個(gè)簡單方法,是基于關(guān)系數(shù)據(jù)庫的映射并可以通過HTTP-URⅠ進(jìn)行查詢。Triplify為輕量級組件,易集成,易被Web應(yīng)用程序廣泛部署。不支持SPARQL,不支持發(fā)布更新日志。Triplify為小型Web插件,能將關(guān)系型數(shù)據(jù)庫發(fā)布成RDF數(shù)據(jù)。

Triplify可將關(guān)系型數(shù)據(jù)轉(zhuǎn)換成RDF語句,并在網(wǎng)絡(luò)上公布,它提供不同的RDF序列化,特別是為關(guān)聯(lián)數(shù)據(jù)。Triplify能夠以RDF、JSON或者Linked Data格式提供數(shù)據(jù)庫的內(nèi)容,屬小型Web應(yīng)用插件,能揭示出關(guān)系數(shù)據(jù)庫中存儲的數(shù)據(jù)語義結(jié)構(gòu)。通過Triplify插件和在查詢中調(diào)整數(shù)據(jù)列,Triplify可以分析查詢所返回的數(shù)據(jù),并以前面提到的格式對外提供數(shù)據(jù)?;谥匦掠成銱TP URⅠ請求,Triplify可以分析查詢所返回的數(shù)據(jù),能將HTML DOM數(shù)據(jù)以RDF格式序列化輸出,從而揭示出關(guān)系數(shù)據(jù)庫中所保存數(shù)據(jù)的語義結(jié)構(gòu)。不需維護(hù)大規(guī)模語義定義,支持Web環(huán)境下拓展關(guān)聯(lián)數(shù)據(jù)應(yīng)用。

2.3 D2R方式

D2R(Database to RDF,簡稱D2R)軟件是目前使用廣泛的工具,能夠支持多種主流關(guān)系型數(shù)據(jù)如Oracle、MySQL、PostgreSQL、Microsoft SQLServer、Microsoft、Access等。它的功能是把關(guān)系型數(shù)據(jù)庫發(fā)布成Linked Data。

D2R發(fā)布關(guān)聯(lián)數(shù)據(jù)時(shí)的映射機(jī)制主要分為兩大部分,第一部分是構(gòu)建關(guān)系型數(shù)據(jù)庫與RDF三元組之間映射關(guān)系,即利用映射語言,將映射關(guān)系用RDF三元組的形式描述出來,形成映射文件;第二部分是構(gòu)建關(guān)聯(lián)數(shù)據(jù)服務(wù),應(yīng)用第一部分中形成的映射文件對關(guān)系型數(shù)據(jù)進(jìn)行轉(zhuǎn)化,并提供多種訪問模式。D2R主要包括三個(gè)核心部分:D2R Server、D2RQ Engine和D2RQ Mapping語言。[5,8]圖3是D2R總體框架及運(yùn)行機(jī)制圖。

圖3 D2R總體框架及運(yùn)行機(jī)制圖

3 主流轉(zhuǎn)化技術(shù)方案對比分析

3.1 相同點(diǎn)與不同點(diǎn)比較分析

通過對D2R、Ⅴirtuoso、Triple三種軟件的介紹,總結(jié)它們的異同,便于將關(guān)系型數(shù)據(jù)轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)時(shí)選擇最合適的方案,為本研究的實(shí)現(xiàn)搭建最優(yōu)平臺(如表2)。

(1)相同點(diǎn)。①均為web服務(wù),屬于B/S(Browser/Server,瀏覽器/服務(wù)器模式)模式,這種模式統(tǒng)一了客戶端,將系統(tǒng)功能實(shí)現(xiàn)的核心部分集中到服務(wù)器上,簡化了系統(tǒng)的開發(fā)、維護(hù)和使用。關(guān)聯(lián)數(shù)據(jù)發(fā)布到Web服務(wù)器,用戶只需有一臺能上網(wǎng)的電腦通過Web瀏覽器就能訪問客戶端。因此,系統(tǒng)的擴(kuò)展性非常容易,只要能上網(wǎng),再由系統(tǒng)管理員分配一個(gè)用戶名和密碼,就可以使用了。甚至可以在線申請,通過服務(wù)器內(nèi)部安全認(rèn)證后,系統(tǒng)可自動分配給賬號,不需要人工參與。②均為轉(zhuǎn)化RDF的專用工具。③均有對域名的依賴。D2R、Ⅴirtuoso、Triple三種軟件在發(fā)布關(guān)聯(lián)數(shù)據(jù)后,都需要通過Http或者URⅠ協(xié)議進(jìn)行瀏覽訪問。

(2)不同點(diǎn)。①自動化程度不同。D2R自動化程度最高,Ⅴirtuoso屬于半自動化軟件,Triple是依靠人工操作多,自動化程度最低。②數(shù)據(jù)庫語義驅(qū)動類型不同。D2R和Ⅴirtuoso屬于可以手工定制數(shù)據(jù)庫驅(qū)動,Triple是只局限于自己的領(lǐng)域。③訪問的接口不同。D2R可以通過關(guān)聯(lián)數(shù)據(jù)和SPARQL兩種方式展示,Ⅴirtuoso則是依賴SPARQL,而Triple是直接用關(guān)聯(lián)數(shù)據(jù)形式訪問。

表2 三種方案的比較

(DB+M指,半自動方法即可以手動進(jìn)行定制)

D2R是用來將關(guān)系數(shù)據(jù)庫中的內(nèi)容發(fā)布到語義網(wǎng)上的一個(gè)工具,在語義網(wǎng)中,使用RDF對數(shù)據(jù)進(jìn)行建模和表示,D2R Server使用一個(gè)可定制的D2RQ映射文件來將關(guān)系數(shù)據(jù)庫中的內(nèi)容映射成RDF格式,并使這些數(shù)據(jù)可以被瀏覽和搜索到,這也是語義網(wǎng)中兩種主要的訪問模式。

3.2 D2R的優(yōu)勢

作為一種致力于關(guān)系型數(shù)據(jù)庫的RDF映射框架,D2RQ由于其對環(huán)境(操作系統(tǒng)、數(shù)據(jù)庫版本等)的適應(yīng)性、操作簡便性以及靈活的可配置性,仍不失為對現(xiàn)有數(shù)據(jù)內(nèi)容完成關(guān)聯(lián)數(shù)據(jù)化發(fā)布的最佳選擇。D2R是其中一個(gè)非常流行的工具,它的作用是將關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)轉(zhuǎn)換為虛擬的RDF數(shù)據(jù)進(jìn)行訪問。D2R主要包括D2R Server、D2RQ Engine以及D2RQ Mapping語言。選擇D2R Server的原因如下。

(1)D2R Server沒有將關(guān)系型數(shù)據(jù)庫發(fā)布成真實(shí)的RDF數(shù)據(jù),而是使用D2RQ Mapping文件將其映射成虛擬的RDF格式。它的好處是可以適時(shí)地使以大型關(guān)系數(shù)據(jù)庫為后端的應(yīng)用系統(tǒng)可以提供語義服務(wù),而不用事先將大量關(guān)系型數(shù)據(jù)庫存儲在專用RDF數(shù)據(jù)庫中。

(2)D2R Server是一個(gè)HTTP Server,是廣泛應(yīng)用的關(guān)系數(shù)據(jù)庫內(nèi)容發(fā)布成關(guān)聯(lián)數(shù)據(jù)的一種工具。用D2R Server發(fā)布的關(guān)聯(lián)數(shù)據(jù)集有:Berlin DBLP Bibliography Server;Hannover DBLPBibliography Server;歐盟國家和地區(qū)數(shù)據(jù)庫;歐洲研究和發(fā)展信息服務(wù);歐洲就業(yè)服務(wù);歐洲研究領(lǐng)域人才數(shù)據(jù)庫。D2RQ Engine并沒有將關(guān)系型數(shù)據(jù)庫發(fā)布成真實(shí)的RDF數(shù)據(jù),而是使用D2RQMapping文件將其映射成虛擬的RDF格式。一般來講,數(shù)據(jù)庫的數(shù)據(jù)規(guī)模都比較大,且內(nèi)容經(jīng)常發(fā)生變化,轉(zhuǎn)換為虛擬的RDF數(shù)據(jù)空間復(fù)雜度會更低,更新內(nèi)容更加容易,因此,D2R的應(yīng)用更加廣泛。

4D2R方案案例:河北大學(xué)知識組織與知識管理實(shí)驗(yàn)室D2R項(xiàng)目

該項(xiàng)目組在國家社科基金與教育部人文社科基金支持下建立,通過在完成詞表本體化組織基礎(chǔ)上,通過D2R生成映射文件完成了關(guān)系型數(shù)據(jù)的二維組織模式轉(zhuǎn)換為RDF的三元組模式;通過關(guān)聯(lián)數(shù)據(jù)的統(tǒng)一語義描述方法(RDF)和統(tǒng)一存取機(jī)制(SPARQL),實(shí)現(xiàn)了對書目信息關(guān)聯(lián)化發(fā)布及在關(guān)聯(lián)發(fā)布與本體基礎(chǔ)上的語義化組織與語義化聚合。

項(xiàng)目組在實(shí)驗(yàn)室通過D2R實(shí)驗(yàn)實(shí)現(xiàn)了下述內(nèi)容(網(wǎng)址:http://sinto.hbu.edu.cn/D2R)。

(1)書目數(shù)據(jù)的關(guān)聯(lián)化發(fā)布。初步實(shí)踐基于本體構(gòu)建語義關(guān)聯(lián),通過關(guān)聯(lián)數(shù)據(jù)的一致化語義描述方法(RDF)和統(tǒng)一存取機(jī)制(SPARQL)進(jìn)行語義化組織,實(shí)現(xiàn)書目數(shù)據(jù)關(guān)聯(lián)化發(fā)布。

(2)映射的形成。將數(shù)據(jù)結(jié)構(gòu)、約束條件轉(zhuǎn)換為本體的概念語義和規(guī)則語義,通過執(zhí)行D2R生成映射文件的執(zhí)行腳本Generate Mapping實(shí)現(xiàn)[9]了關(guān)系型數(shù)據(jù)的二維組織模式轉(zhuǎn)換為RDF的三元組模式。

(3)原有的語義關(guān)系的細(xì)化及書目數(shù)據(jù)的語義聚合。通過詞表本體化組織及關(guān)聯(lián)化發(fā)布,基于本體與實(shí)際語義邏輯修改MAPPⅠNG文件,實(shí)現(xiàn)書目原有語義關(guān)系的細(xì)化及細(xì)化關(guān)系后的書目數(shù)據(jù)的語義聚合。

[1]肖強(qiáng),鄭立新.關(guān)聯(lián)數(shù)據(jù)研宄進(jìn)展概述[J].圖書情報(bào)工作,2011(13):72-75,134.

[2]任瑞娟,等.分布式本體編輯系統(tǒng)(ADORES)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2011(3):9-16.

[3]白海燕,喬曉東.基于本體和關(guān)聯(lián)數(shù)據(jù)的書目組織語義化研究[J].現(xiàn)代圖書情報(bào)技術(shù),2010(9):18-27.

[4]黃永文.關(guān)聯(lián)數(shù)據(jù)驅(qū)動的Web應(yīng)用研究[J].圖書館雜志,2010(7):55-59.

[5]白海燕,梁冰.利用D2R實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫與關(guān)聯(lián)數(shù)據(jù)的語義映射模式[J].現(xiàn)代圖書情報(bào)技術(shù),2011(z1):1-7.

[6]孫鴻燕.圖書館關(guān)聯(lián)數(shù)據(jù)的綜合管理及其實(shí)現(xiàn)[J].圖書館學(xué)研究,2011(23):51-54,5.

[7]任瑞娟,等.基于概念云與本體的信息檢索系統(tǒng)(ⅠRSCCO)的設(shè)計(jì)與實(shí)現(xiàn)[J].情報(bào)學(xué)報(bào),2011,29(6):992-999.

[8]Miller,et al.Linked data and libraries[J].Serials Librarian,2011,60(1-4):17-22.

[9]王毅喆,張力.金融領(lǐng)域基于本體模式的關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)換解決方案[J].計(jì)算機(jī)工程,2007,33(12):93-95.

G250.74

A

1005-8214(2014)12-0030-05

濮德敏(1968-),女,副研究館員,碩士,發(fā)表論文10余篇;任瑞娟(1970-),女,教授,博士在讀,發(fā)表論文及出版著作30多篇(冊);米佳(1976-),男,副研究館員,本科,發(fā)表論文20余篇;張欣(1986-),女,碩士,發(fā)表論文2篇。

2014-02-26[責(zé)任編輯]菊秋芳

本文系教育部人文社會科學(xué)研究一般項(xiàng)目規(guī)劃基金(項(xiàng)目編號:11YJA870019)和教育部“網(wǎng)絡(luò)時(shí)代的科技論文快速共享”研究資助項(xiàng)目(項(xiàng)目編號:201113)研究成果之一。

猜你喜歡
關(guān)系數(shù)據(jù)庫三元組本體
關(guān)系數(shù)據(jù)庫在高爐數(shù)據(jù)采集系統(tǒng)中的應(yīng)用
特征標(biāo)三元組的本原誘導(dǎo)子
眼睛是“本體”
關(guān)系數(shù)據(jù)庫技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)設(shè)計(jì)中的應(yīng)用
關(guān)于余撓三元組的periodic-模
一個(gè)時(shí)態(tài)RDF存儲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
基于本體的機(jī)械產(chǎn)品工藝知識表示
探討關(guān)系數(shù)據(jù)庫設(shè)計(jì)中范式理論的教學(xué)方法
三元組輻射場的建模與仿真
專題
景洪市| 手机| 三门县| 上饶县| 吐鲁番市| 宁武县| 浏阳市| 图木舒克市| 文山县| 乳山市| 惠东县| 哈巴河县| 宁津县| 错那县| 财经| 固镇县| 鱼台县| 岚皋县| 昭通市| 江达县| 开江县| 宜城市| 肇州县| 遵化市| 呈贡县| 沛县| 大竹县| 商都县| 象州县| 寿阳县| 晋宁县| 集安市| 西林县| 沙田区| 南和县| 张家口市| 许昌县| 雷波县| 始兴县| 信阳市| 来安县|