国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向科研信息資源整合的元數(shù)據(jù)協(xié)同方法研究

2017-08-30 23:28于薇
現(xiàn)代情報(bào) 2017年8期
關(guān)鍵詞:元數(shù)據(jù)整合

于薇

〔摘 要〕針對(duì)科研信息資源整合利用問題,利用元數(shù)據(jù)協(xié)同的方法為已有科研信息資源系統(tǒng)的整合與共享利用提供解決方案。以論文、專利、科技報(bào)告為例,把表示相同語義的元數(shù)據(jù)整合到一個(gè)體系下,形成子體系,將多個(gè)子體系整合到一個(gè)網(wǎng)絡(luò)中,形成元數(shù)據(jù)映射網(wǎng)絡(luò)。結(jié)果表明,元數(shù)據(jù)協(xié)同方法在保持原有元數(shù)據(jù)標(biāo)準(zhǔn)不變的前提下,可以通過語義層面的映射來解決不同科研信息資源的整合與利用問題,對(duì)解決科研信息資源整合具有比較現(xiàn)實(shí)的意義。

〔關(guān)鍵詞〕科研信息資源;整合;元數(shù)據(jù);協(xié)同方法

DOI:10.3969/j.issn.1008-0821.2017.08.010

〔中圖分類號(hào)〕G254.362 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2017)08-0074-07

〔Abstract〕Research information resource integration is the key for collaborative innovation. This paper used the method of information harmonization to resolve the problem of research information resource integration. This paper expressed the different metadata schemas in a semantic mapping network to integrate the paper,patent,scientific and technical report. The result showed that metadata harmonization provided a method to map the different metadata schemas on the semantic level,and provided a useful reference for research information integration.

〔Key words〕research information resource;integration;metadata;harmonization method

科研信息資源是數(shù)字資源中與科研活動(dòng)相關(guān)的資源集合,是已經(jīng)數(shù)字化的、與科研活動(dòng)相關(guān)的科技管理政策、科研條件、科研活動(dòng)中產(chǎn)生的論文、專著、專利、科研數(shù)據(jù)、科技報(bào)告及檔案等資源的總和,是科研活動(dòng)的寶貴財(cái)富資源,是進(jìn)行科技管理和知識(shí)服務(wù)的資源基礎(chǔ),既是科研活動(dòng)的產(chǎn)出成果,也是科研活動(dòng)管理、實(shí)施和評(píng)價(jià)的重要參考,對(duì)于國家科技計(jì)劃管理部門、科研單位和研究者個(gè)人而言都有著非常重要的參考價(jià)值。

政府、科研機(jī)構(gòu)、科技信息服務(wù)機(jī)構(gòu)等科研活動(dòng)主體由于使用目標(biāo)不同、任務(wù)職責(zé)不同、參考和制定元數(shù)據(jù)規(guī)范不同等原因,導(dǎo)致科研信息資源的組織方式也存在差異,給科研信息資源的整合造成了困難。如何以盡量少的成本代價(jià)實(shí)現(xiàn)已有科研信息資源系統(tǒng)的整合與共享利用,是圖書情報(bào)學(xué)和信息資源管理等領(lǐng)域?qū)<覍W(xué)者重點(diǎn)思考的問題。元數(shù)據(jù)協(xié)同是在一個(gè)系統(tǒng)中,多個(gè)元數(shù)據(jù)標(biāo)準(zhǔn)的組合互操作的能力,為解決不同元數(shù)據(jù)標(biāo)準(zhǔn)之間的語義差異問題而提出的新的研究思路。因此,本文以論文、專利、科技報(bào)告等科研信息資源為研究對(duì)象,探討元數(shù)據(jù)協(xié)同在科研信息資源整合中應(yīng)用的問題和解決方案。

1 科研信息資源元數(shù)據(jù)研究現(xiàn)狀

1.1 從科研信息資源元數(shù)據(jù)創(chuàng)建者角度

隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,元數(shù)據(jù)的創(chuàng)建已不僅僅是元數(shù)據(jù)信息管理人員的職責(zé)。NISO[1]提出研究人員、技術(shù)人員和信息專家在創(chuàng)建元數(shù)據(jù)時(shí)需要合作,例如由數(shù)字化或創(chuàng)建數(shù)字對(duì)象的技術(shù)人員負(fù)責(zé)創(chuàng)建管理元數(shù)據(jù)或結(jié)構(gòu)元數(shù)據(jù),由資源提供者負(fù)責(zé)描述元數(shù)據(jù),共同完成元數(shù)據(jù)創(chuàng)建工作。

可見,元數(shù)據(jù)的創(chuàng)建者已經(jīng)不再僅僅局限于信息資源管理與加工人員,資源的創(chuàng)建者也開始加入到元數(shù)據(jù)創(chuàng)建工作中來。因?yàn)樵獢?shù)據(jù)創(chuàng)建者來源的多樣性,就導(dǎo)致不同創(chuàng)建者對(duì)同一元數(shù)據(jù)元素定義不同的問題發(fā)生。當(dāng)不同的信息資源系統(tǒng)進(jìn)行整合和互操作時(shí),大量的、多樣化的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范將會(huì)阻礙信息資源整合的效率和質(zhì)量。

1.2 從科研信息資源元數(shù)據(jù)標(biāo)準(zhǔn)類型角度

狹義的科研信息資源包括論文、專利、科學(xué)數(shù)據(jù)、科技報(bào)告等在科研活動(dòng)過程中產(chǎn)生的信息資源,為了對(duì)這些信息資源進(jìn)行組織和利用,科研機(jī)構(gòu)和科技信息機(jī)構(gòu)創(chuàng)建了描述不同類型信息資源的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范。

國內(nèi)已有的元數(shù)據(jù)標(biāo)準(zhǔn)從使用范圍看,有國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)之分;從資源類型看科技報(bào)告、檔案、信息與文獻(xiàn)、科學(xué)數(shù)據(jù)元數(shù)據(jù)之分。已經(jīng)發(fā)布的各類元數(shù)據(jù)標(biāo)準(zhǔn)中(見表1),以“地理空間信息”為例,涉及城建、水利和測(cè)繪三種元數(shù)據(jù)標(biāo)準(zhǔn),不同標(biāo)準(zhǔn)對(duì)于元數(shù)據(jù)元素含義的定義也不盡相同,造成資源間的整合利用的困難。

綜上,元數(shù)據(jù)仍然是對(duì)科研信息資源進(jìn)行建設(shè)、組織、管理與利用的重要工具,國外的元數(shù)據(jù)研究從使用、標(biāo)準(zhǔn)、應(yīng)用等多方面開展了廣泛的研究,國內(nèi)更關(guān)注在具體科學(xué)領(lǐng)域的元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)方面,對(duì)于功能需求和應(yīng)用的研究較少。目前國內(nèi)對(duì)于科研信息資源元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的研究多是面向信息資源組織管理,而較少從應(yīng)用需求和資源共享整合的角度考慮元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的建設(shè)。

2 元數(shù)據(jù)協(xié)同的研究現(xiàn)狀

關(guān)于元數(shù)據(jù)語義互操作的研究,自St. Pierre和LaPlant[2]在1998年提出元數(shù)據(jù)互通的語義協(xié)調(diào)開始,一直是元數(shù)據(jù)互操作研究領(lǐng)域的熱點(diǎn)。

為了解決元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范之間的語義互操作,學(xué)術(shù)界開始關(guān)注利用本體來描述元數(shù)據(jù)語義和利用本體映射來傳遞語義的研究。2000年左右,來自澳大利亞、英國和美國的研究人員建立了一個(gè)核心本體——ABC本體,用來描述元數(shù)據(jù)的語義特征,目的[3]在于提供一個(gè)用來理解和分析現(xiàn)有元數(shù)據(jù)本體與實(shí)例的概念基礎(chǔ),為未來繼續(xù)調(diào)查和建立描述性本體提供指導(dǎo),為元數(shù)據(jù)本體之間的自動(dòng)映射提供概念性基礎(chǔ)。這個(gè)本體不僅描述了跨領(lǐng)域的基本概念,而且提供了建立專門領(lǐng)域的概念和術(shù)語的基本方法和框架。

在元數(shù)據(jù)語法一致性解決的前提下,需要建立一個(gè)統(tǒng)一的描述語義和語法相互關(guān)系的框架,即元數(shù)據(jù)的抽象模型。元數(shù)據(jù)的抽象模型對(duì)元數(shù)據(jù)的互操作有重要的影響。Devey M和Cote M[4]介紹了在加拿大政府元數(shù)據(jù)項(xiàng)目中遇到的元數(shù)據(jù)結(jié)構(gòu)不一致帶來的困難。Nilsson Mikael[5]通過研究發(fā)現(xiàn)在E-learning領(lǐng)域,由于DC和LOM的抽象模型不同,合并DC和LOM元素會(huì)造成語法不一致的問題。

國際上已經(jīng)有一些文化遺產(chǎn)項(xiàng)目將本體應(yīng)用于現(xiàn)有的元數(shù)據(jù)系統(tǒng)中,解決公共數(shù)字文化資源的語義互操作問題。芬蘭的CultureSampo基于國際finnONTO本體框架構(gòu)建了文化遺產(chǎn)語義門戶,利用KOKO本體的映射關(guān)系,解決了高度異質(zhì)性與跨領(lǐng)域的文化遺產(chǎn)整合問題,將資源聚合到一個(gè)具備豐富語義的人機(jī)智能系統(tǒng),可實(shí)現(xiàn)語義檢索與推薦、語義可視化等[6]。eCHASE項(xiàng)目采用CIDOC CRM和CRM核心本體作為元數(shù)據(jù)映射方案,解決文化遺產(chǎn)資源的語義整合與互操作問題[7]。Stasinopoulou T等提出基于本體的文化遺產(chǎn)領(lǐng)域的元數(shù)據(jù)整合方案,選擇CIDOC CRM本體作為中介促進(jìn)元數(shù)據(jù)的語義真核,研究元數(shù)據(jù)向本體映射的問題及EAD和DC元數(shù)據(jù)到CIDOC CRM的映射方法,實(shí)現(xiàn)文化遺產(chǎn)領(lǐng)域的語義互操作[8]。Kakali C等提出了一種基于本體的元數(shù)據(jù)互操作框架,使用CIDOC CRM本體作為中介模型,研究將DC元數(shù)據(jù)及DCCAP映射其中的方法,構(gòu)建基于本體的元數(shù)據(jù)語義整合機(jī)制[9]。國內(nèi)肖希明[10]提出了基于本體的公共數(shù)字文化資源整合語義互操作模型。

綜上分析,通過引入領(lǐng)域本體可以解決元數(shù)據(jù)語義一致性問題,這為實(shí)現(xiàn)科研信息資源整合提供了思路,但是在科研信息資源整合領(lǐng)域還未見深入的探討與研究。

3 科研信息資源整合的元數(shù)據(jù)協(xié)同方法研究

科研信息資源是數(shù)字資源中與科研活動(dòng)相關(guān)的一類數(shù)字資源的集合,隨著網(wǎng)絡(luò)和信息技術(shù)的發(fā)展,絕大部分科研信息資源已經(jīng)轉(zhuǎn)變成數(shù)字的形式,存儲(chǔ)在不同系統(tǒng)中,例如我們平時(shí)使用的專著、論文和檔案數(shù)據(jù)庫等。還有一部分科研信息資源分散在網(wǎng)頁上,如學(xué)術(shù)會(huì)議信息、科研機(jī)構(gòu)信息、科研人員的博客等,這些資源以HTML、XML、Excel、Word、PDF等格式存在。從數(shù)字資源組織的角度看,前一類科研信息資源屬于規(guī)范的資源,后一類科研信息資源數(shù)據(jù)非規(guī)范的資源。目前通過元數(shù)據(jù)標(biāo)準(zhǔn)組織管理的科研信息資源多屬于規(guī)范性數(shù)據(jù)庫。這類科研信息資源在一定程度上有序,不同資源之間又存在差異,這為科研信息資源整合提供了基礎(chǔ),同時(shí)也提出了迫切需求。

3.1 科研信息資源的特征

科研信息資源具有以下特征:

1)在一定程度上的有序。經(jīng)過元數(shù)據(jù)標(biāo)引組織的科研信息資源在一定程度上是有序的,而這為科研信息資源整合提供了前提。

2)存在異構(gòu)性?!爱悩?gòu)”的含義比較廣泛,資源的異構(gòu)性主要體現(xiàn)資源存儲(chǔ)系統(tǒng)的異構(gòu)性、資源類型的異構(gòu)、資源結(jié)構(gòu)、語法上的異構(gòu)、資源語義之間的異構(gòu)。科研信息資源的異構(gòu)性已成為知識(shí)服務(wù)的主要障礙之一,也使得科研信息資源整合成為一種迫切需要。

3)具有開放性。科研信息資源可以通過信息技術(shù)進(jìn)行基于格式和內(nèi)容的鏈接,實(shí)現(xiàn)異構(gòu)資源之間的互操作??蒲行畔①Y源的這種開放性使得資源整合成為可能。

4)生長性??蒲行畔①Y源一方面為科研活動(dòng)提供參考價(jià)值和研究基礎(chǔ),另一方面科研活動(dòng)又產(chǎn)生新的科研信息資源,是不斷膨脹和反復(fù)利用的過程??蒲行畔①Y源這種生長性,對(duì)元數(shù)據(jù)標(biāo)準(zhǔn)組織管理資源的能力提出了挑戰(zhàn)。

在分析了科研信息資源的分類和特征基礎(chǔ)上,我們可以看出科研信息資源的整合是一個(gè)系統(tǒng)性工程,在為協(xié)同創(chuàng)新提出知識(shí)服務(wù)的目標(biāo)下,必須以系統(tǒng)科學(xué)和知識(shí)論為理論基礎(chǔ),通過整合技術(shù)和方法,將不同科研資源內(nèi)部的分散知識(shí)關(guān)聯(lián)組織成有效的知識(shí)網(wǎng)絡(luò),從而提供有效的知識(shí)服務(wù)。

3.2 面向科研信息資源整合的科研本體

客觀描述科研活動(dòng)的相關(guān)要素,并準(zhǔn)確表示各要素之間的關(guān)系,對(duì)知識(shí)獲取和科研信息資源整合具有重要的應(yīng)用意義。借鑒Ettorre等人提出的科研本體[11],本研究分析了科研活動(dòng)中涉及的要素及其之間的關(guān)系,提出了為科研信息資源整合服務(wù)的本體對(duì)象和關(guān)系模型。

主要概念包括機(jī)構(gòu)(organization)、科技計(jì)劃(plan)、科研人員(people)、科研產(chǎn)出(outcome)、科研項(xiàng)目(project)、研究領(lǐng)域(researchfield)。進(jìn)一步又細(xì)分成更具體的概念,如在機(jī)構(gòu)(organization)中,又包括管理機(jī)構(gòu)、科研機(jī)構(gòu),在科研產(chǎn)出(outcome)中,又包括期刊論文(Paper)、專利(patent)、科技報(bào)告(S&T report)和產(chǎn)品(Product)等。

各主要概念之間存在著相互關(guān)系,如管理機(jī)構(gòu)和科技計(jì)劃之間存在制定關(guān)系(Plans),科研機(jī)構(gòu)與科研項(xiàng)目之間存在承擔(dān)關(guān)系(undertakes),科技計(jì)劃與科研項(xiàng)目之間存在資助關(guān)系(supports),科研項(xiàng)目與研究領(lǐng)域、科研人員與研究領(lǐng)域、科研產(chǎn)出與項(xiàng)目之間存在屬于關(guān)系(Belongs_to),科研人員與科研項(xiàng)目之間存在參與研究關(guān)系(Has_attendees),科研人員與科研單位之間存在隸屬關(guān)系(Has_position)。

主要概念和概念之間的關(guān)系組成了科研活動(dòng)中相關(guān)要素的知識(shí)網(wǎng)絡(luò)如圖1:

每一個(gè)概念是一個(gè)類,每個(gè)類下均有實(shí)例。以“機(jī)構(gòu)”這一類進(jìn)行說明,“機(jī)構(gòu)”的下位類分“管理機(jī)構(gòu)”、“科研機(jī)構(gòu)”和“企業(yè)”等。

3.3 基于語義的元數(shù)據(jù)協(xié)同映射模型

實(shí)現(xiàn)元數(shù)據(jù)的協(xié)同,首先需要構(gòu)建適用于多數(shù)據(jù)源的映射模型。通過借鑒都柏林核心元數(shù)據(jù)以及對(duì)網(wǎng)絡(luò)信息的語義描述框架,可以幫助我們建立多元數(shù)據(jù)映射模型,采用一種普適的方法將多源數(shù)據(jù)映射到一個(gè)網(wǎng)絡(luò)中。在這個(gè)元數(shù)據(jù)協(xié)同映射模型中,映射可能存在多種形式,兩個(gè)不同元數(shù)據(jù)中“意義”相同的元素可能會(huì)使用不同的名稱,同時(shí)相同名稱的元素也有可能有不一樣的“意義”。

基于語義進(jìn)行映射,通過初始設(shè)定的語義,將多個(gè)不同元數(shù)據(jù)通過初始設(shè)定的語義映射到同一元數(shù)據(jù)中。這樣,不同元數(shù)據(jù)中“意義”相同的元素將會(huì)賦予相同的名稱;不同數(shù)據(jù)源中相同名稱的元素也會(huì)因?yàn)楸旧硭哂械摹耙饬x”不同而被賦予不同的名稱。

3.4 映射模型中的主體

通過構(gòu)建基于語義的元數(shù)據(jù)協(xié)同映射模型,可以有效地實(shí)現(xiàn)元數(shù)據(jù)協(xié)同,進(jìn)而實(shí)現(xiàn)科研信息資源的整合。元數(shù)據(jù)協(xié)同映射模型中的主體包括三個(gè),分別是實(shí)體、元素和值。

3.4.1 實(shí)體

實(shí)體,表示的是科研信息資源中存在且可以互相區(qū)別的事物,由于科研信息資源中既包括人,也包括物,因此實(shí)體在這里既可以表示人,也可以表示物。同時(shí)實(shí)體也可以作為一個(gè)抽象概念被我們所理解。

通過對(duì)科研信息資源的分析,我們發(fā)現(xiàn)在科研信息資源中,實(shí)體由物理和抽象的構(gòu)成。物理指的是在科研信息資源中,能夠在客觀世界中直接反應(yīng)的實(shí)體,包括資料文檔、機(jī)構(gòu)、人物等。抽象指的是在科研信息資源中,并不能在客觀世界中直接反應(yīng)的實(shí)體,具有抽象的概念,包括學(xué)科、分類等。根據(jù)對(duì)實(shí)體的分類,我們做出基于科研信息資源的實(shí)體分類圖,如圖2所示。

從圖2我們可以發(fā)現(xiàn),從科研論文、專利、科技報(bào)告三種科技數(shù)字資源出發(fā),實(shí)體可以由Document(文檔)、Person(人物)、Institution(機(jī)構(gòu))、Discipline(學(xué)科)、Classification(分類)五個(gè)大類構(gòu)成。文檔表示論文、專利、科技報(bào)告三種資源;人物表示論文、專利、科技報(bào)告中涉及的人物,包括作者、發(fā)明人、專利權(quán)人、科技報(bào)告提供者、科技報(bào)告作者等;機(jī)構(gòu)包括論文、專利以及科技報(bào)告的所在機(jī)構(gòu)可以是科研機(jī)構(gòu),也可以是企業(yè),除此之外還可以是資助該項(xiàng)目所涉及的基金機(jī)構(gòu);學(xué)科包括論文、專利、科技報(bào)告所涉及內(nèi)容的學(xué)科,這里的學(xué)科包括該內(nèi)容涉及的主題,通過對(duì)主題的識(shí)別判斷學(xué)科內(nèi)容;分類指的是論文、專利、科技報(bào)告中所涉及的相關(guān)研究方向的分類,其中論文可以通過中國圖書館分類法、中國科學(xué)院圖書館分類法等分類法進(jìn)行分類、專利可以通過國際專利分類或者美國專利分類等方法進(jìn)行分類,科技報(bào)告可以通過其學(xué)科所屬進(jìn)行分類。

因此,實(shí)現(xiàn)元數(shù)據(jù)的協(xié)同,首先在于實(shí)體的劃分,如何劃分實(shí)體決定了協(xié)同后元數(shù)據(jù)的規(guī)范情況,本文將科研信息資源的實(shí)體劃分為文檔、人物、機(jī)構(gòu)、學(xué)科以及分類五個(gè)方面,這種劃分有助于后期對(duì)元數(shù)據(jù)協(xié)同的實(shí)現(xiàn)。

3.4.2 元素

基于語義的元數(shù)據(jù)協(xié)同映射模型中,元素是對(duì)實(shí)體內(nèi)容的描述。每一個(gè)元素都有一個(gè)描述性名稱,對(duì)實(shí)體內(nèi)容相應(yīng)部分進(jìn)行描述性定義。

針對(duì)科研論文、專利以及科技報(bào)告的元數(shù)據(jù),本文通過語義整理,提出適用于三種資源的核心元素,其中,針對(duì)文檔的科研信息資源元素規(guī)范如表3所示。

根據(jù)針對(duì)文檔的科研信息資源元素規(guī)范,本文分別對(duì)五個(gè)不同實(shí)體提出了其獨(dú)有的元數(shù)據(jù)規(guī)范,分別是基于科研信息資源中人物的核心元素,基于科研信息資源中機(jī)構(gòu)的核心元素、基于科研信息資源中學(xué)科的核心元素以及基于科研信息資源中分類的核心元素。

3.4.3 值屬性

基于語義的元數(shù)據(jù)協(xié)同映射模型中,值是對(duì)每個(gè)元素內(nèi)容的描述。在該模型中,值有兩種類型,數(shù)值型和文本型。

元數(shù)據(jù)元素的描述,是不同科研信息資源之間互操作性的基礎(chǔ),對(duì)于不同科研信息資源之間不一致的描述,使用元數(shù)據(jù)可以很好地做到統(tǒng)一描述。這種基于元數(shù)據(jù)實(shí)現(xiàn)的元數(shù)據(jù)抽象模型,是設(shè)計(jì)元數(shù)據(jù)規(guī)范的重要工具之一,可以很好地解決前邊提到的不同元數(shù)據(jù)之間統(tǒng)一性問題。

3.5 元數(shù)據(jù)協(xié)同映射網(wǎng)絡(luò)

針對(duì)科研信息資源中的論文、專利以及科技報(bào)告元數(shù)據(jù)制作多個(gè)基于語義的元數(shù)據(jù)協(xié)同映射模型,并將多個(gè)基于語義的元數(shù)據(jù)協(xié)同模型結(jié)合起來,構(gòu)成基于語義的元數(shù)據(jù)協(xié)同映射網(wǎng)絡(luò),網(wǎng)絡(luò)如圖3所示。網(wǎng)絡(luò)中存在7個(gè)實(shí)體,17個(gè)元素以及每個(gè)元素所賦予的值,實(shí)體之間、元素之間以及實(shí)體與元素之間存在直接映射關(guān)系和間接映射關(guān)系。

從元數(shù)據(jù)協(xié)同映射網(wǎng)絡(luò)模型中可以看出,將所有元數(shù)據(jù)劃分成兩類,分別是Physical(物理)和Abstract(抽象),Physical對(duì)應(yīng)Document(文獻(xiàn))、Person(人物)和Institution(機(jī)構(gòu))三個(gè)子體系,Abstract對(duì)應(yīng)Discipline(學(xué)科)和Classification(分類)兩個(gè)子體系。對(duì)于文獻(xiàn)來說,可以映射到文獻(xiàn)的子體系包括Type(類型)、Doi、Keyword(關(guān)鍵詞)、Publish year(出版年)、Topic(主題)、Publisher(出版商),該網(wǎng)絡(luò)末端為研究對(duì)象所共有或獨(dú)有的元數(shù)據(jù)。將從科研論文、專利、科技報(bào)告中抽取得到的元數(shù)據(jù)映射到該網(wǎng)絡(luò)中,映射后得到的元數(shù)據(jù)體系就是科研信息資源邏輯描述體系。

3.6 基于元數(shù)據(jù)協(xié)同的科研信息資源整合方法模型

基于元數(shù)據(jù)協(xié)同的科研信息資源整合方案由資源層、元數(shù)據(jù)標(biāo)準(zhǔn)協(xié)同層和服務(wù)層構(gòu)成。資源層主要包括科研活動(dòng)相關(guān)的科研管理類資源、科研條件類資源和科研成果類資源,這些資源原本相互獨(dú)立,分散存在于異構(gòu)的數(shù)字資源系統(tǒng)中;元數(shù)據(jù)標(biāo)協(xié)同層是將不同資源的元數(shù)據(jù)標(biāo)準(zhǔn)組合在一起,利用水平協(xié)同的方法將不同元數(shù)據(jù)標(biāo)準(zhǔn)中的元素集進(jìn)行映射,利用垂直協(xié)同的方法XML作為編碼規(guī)則,以RDF表示元素關(guān)系,對(duì)不同元數(shù)據(jù)標(biāo)準(zhǔn)內(nèi)部進(jìn)行協(xié)同,通過前邊構(gòu)建的科研本體對(duì)元數(shù)據(jù)標(biāo)準(zhǔn)集合進(jìn)行知識(shí)結(jié)構(gòu)的解釋,從而實(shí)現(xiàn)對(duì)不同科研信息資源的整合。

4 結(jié)語

元數(shù)據(jù)協(xié)同是元數(shù)據(jù)研究領(lǐng)域?yàn)榻鉀Q不同元數(shù)據(jù)標(biāo)準(zhǔn)之間的語義差異問題而提出的新的研究思路,通過解決不同元數(shù)據(jù)標(biāo)準(zhǔn)的語義一致性問題,降低不同系統(tǒng)整合的成本。本文以論文、專利、科技報(bào)告等科研信息資源為研究對(duì)象,通過構(gòu)建科研本體和元數(shù)據(jù)協(xié)同映射網(wǎng)絡(luò),探討元數(shù)據(jù)協(xié)同方法解決解決科研信息資源整合的問題,具有比較現(xiàn)實(shí)的意義。但是對(duì)大規(guī)??蒲行畔①Y源構(gòu)建元數(shù)據(jù)協(xié)同映射網(wǎng)絡(luò),還有很多問題,比如系統(tǒng)存儲(chǔ)規(guī)模,推理能力,語義關(guān)系的準(zhǔn)確性等。進(jìn)一步引入本體來研究科研信息資源元數(shù)據(jù)協(xié)同的實(shí)現(xiàn)將是下一步研究的重點(diǎn)。

參 考 文 獻(xiàn)

[ 1 ] National Information Standards Organization. Understanding metadata[EB/OL]. [2014-8-22]. http://www.niso.org/publications/press/UnderstandingMetadata.pdf

[ 2 ] St. Pierre M,LaPLANT W P. Issues in Crosswalking Content Metadata Standards[EB/OL].(1998)[2009-21-12].http://www.niso.org/press/whitepapers/crosswalk.html

[ 3 ] LAGOZE C,HUNTER J. The ABC Ontology and Model[EB/OL]. Journal of Digital Information,2001(2).[2009-08-08].http://jod.ec3.ac.uk/Articles/v02/i02/Lagoze/

[ 4 ] Devey M,Cote M. the Development and Use of Metadata Application Profiles:the Government of Canada experience[J]. the Serials Librarian,2006,(2).

[ 5 ] Nilsson Mikael,Naeve Ambj?rn. Metadata Harmonization:a Roadmap for Standardization. http://kth.diva-portal.org/smash/record.jsf?pid=diva2:359449 ,2010.

[ 6 ] Hyvonen E,et al. CultureSampo—Finnish Culture on the Semantic Web2.0. Thematic Perspectives for the End-user[C]//Proceedings,Museums and the Web. 2009:15-18.

[ 7 ] Sinelair P,et al. Semantic Web Integration of Cultural Heritage Sources[C]//Proceedings of the 15th International Conference on World Wide Web. ACM,2006:1047-1048.

[ 8 ] Stainopoulou T,et al. Ontology-based Metadata Integration in the Cultural Heritage Domain[M]//Asian Digital Libraries. Looking Back 10 Years and Forging New Frontiers. Springer Berlin Heidelberg,2007:165-175.

[ 9 ] Kakali C,et al. Integration Dublin Core Metadata for Culture Heritage Collections Using Ontologies[C]//International Conference on Dublin Core and Metadata Applications. 2007:128-139.

[ 10 ] 肖希明,完顏盼盼. 基于本體的公共數(shù)字文化資源整合語義互操作研究[J]. 國家圖書館學(xué)刊,2015(3):43-49.

[ 11 ] Ettorre M,Pontieri P,Ruffolo M,et a1.A Prototypal Environmentfor Collaborative Work Within a Research Organization[C].In:Proceedings of the 14th International Workshop on Database and Ex—pert Systerw Applications,Ithaca,Greece.2003:274.

(本文責(zé)任編輯:馬卓)

猜你喜歡
元數(shù)據(jù)整合
談高職院校計(jì)算機(jī)教學(xué)中學(xué)生創(chuàng)新能力培養(yǎng)
淺析信息技術(shù)與小學(xué)數(shù)學(xué)教學(xué)整合
記初中英語詞匯教學(xué)的一次歸類、整合改革及反思
財(cái)會(huì)信息資源元數(shù)據(jù)標(biāo)準(zhǔn)的研究