浦燕妮,劉琪,耿騫
(北京師范大學政府管理學院,北京 100875)
通用型科學元數據標準研究
浦燕妮,劉琪,耿騫
(北京師范大學政府管理學院,北京 100875)
科學數據在科學研究第四范式的研究時代被視為具有重要的科研價值,科學元數據在數據管理生命周期中的重要作用也逐漸受到重視。大量的科學數據亟需專門且具有統(tǒng)一標準的元數據進行組織和管理。國外的通用型科學元數據標準已經發(fā)展較為成熟,而國內的相關標準還處于建設之中。本文分析國外較為成熟的元數據標準的建設目的、功能構成,以及主要標準元素等內容,為國內建設通用型科學元數據標準提供可參考的建議。
科學元數據;元數據標準;通用型元數據標準
自數據密集型科學出現以來,科學數據成為繼科學文獻之后重要的研究資源,對科學數據的有效管理成為促進和保障科學研究和交流活動的重要內容,并由此引發(fā)科學數據管理的研究和實踐熱潮。
科學數據來源于對科學研究活動的事實記錄(包括數值、文本記錄、圖像和聲音等形式),是被科學團體所共同接受的、對研究結果有用的數據[1],是科學界普遍認同的能對研究成果進行驗證的必要材料[2]??茖W數據既包括在科學研究過程中產生的、能存貯在計算機中的任何數據,也包括能轉換成數字形式的非數字形式數據[3]。如傳感器讀取的數據、遙感勘測數據、調研結果、神經圖像、實驗數據及來自測試模型的仿真數據等[4]。作為描述科學數據的工具,科學元數據(Scientific Metadata)在數據發(fā)現、數據使用和數據重利用及存儲等關鍵環(huán)節(jié)有重要作用,元數據標準為科學數據的存儲、整序、組織、索引以及檢索等一系列關鍵問題提供解決方案。
科學元數據是一系列詮釋科學數據的文件,提供必要的輔助信息來發(fā)現、解釋、理解、評估和使用數據[5]。在很大程度上,科學元數據基本是對與研究相關的所有信息的描述,這些描述以重用和解釋數據為目的[6]。數據用戶群體的學科背景往往是小而專,其來自某一個特定的學科或者研究領域。因此,制定科學元數據標準通常需要特定的專業(yè)知識[7],這導致科學元數據多以描述對象所處的專業(yè)領域進行劃分。目前,應用比較廣泛的劃分方式是將其劃分為學科領域元數據標準和通用型元數據標準[3,5]。例如,英國數字監(jiān)護中心收集6種不同學科的元數據標準。據統(tǒng)計,77%的科學元數據標準是特定學科領域元數據標準或指向統(tǒng)計、行為描述等特定領域的元數據[8]。盡管存在豐富的元數據標準,科研人員的使用情況卻不樂觀。Tenopir等的調查顯示,56%的研究人員未使用過元數據標準,22%的研究者僅用過實驗室的元數據標準[9]。由此可見,學科領域內復雜的元數據標準體系雖然豐富,但實用性不強。隨著科學數據管理的不斷推進,不同標準的使用也會造成數據交換和統(tǒng)一管理的困難。因此,實現跨學科或者不受學科限制使用的通用型元數據標準備受重視。對比單一學科的元數據標準,通用型元數據標準可以涵蓋多個學科的數據特點,覆蓋學科范圍廣、適應性強,有利于進行數據交換。
目前,國外通用型科學元數據標準已經從標準制定發(fā)展到實際應用階段。英國、美國等國家的多個數據管理機構已開始使用自身研制的通用型元數據標準。在國內,研究者對通用型科學元數據標準在理論研究和技術應用等方面進行研究[10-11]。胡芳[12]、趙華等[13]分析國外典型科學元數據標準以及科學數據倉儲中應用的元數據方案,為國內元數據標準建設提供建議;劉峰等在對6種典型的學科類型元數據標準進行概述、分析和統(tǒng)計的基礎上,進一步構建通用型元數據規(guī)范[14];常穎聰等嘗試以植物學基因表達實驗為例進行科學實驗數據元數據模型研究[15];徐坤等通過研究科學數據的元數據模型,構建科學數據本體,將數據組織置于知識環(huán)境中[3];周波提出針對高??茖W數據的通用元數據設計原則[16]。不過,以上研究基本是基于國外成熟學科元數據標準,進一步明確科學元數據標準建設的規(guī)范和功能,尚未對通用型元數據標準進行直接地分析探討。本文重點對國外通用型科學元數據標準進行研究,為國內相應的元數據標準建設提供建議。
通用型科學元數據標準在適用范圍和內容元素等方面與學科元數據標準存在差異。在適用范圍上,通用型科學元數據標準不受學科領域限制,可以對不同學科的科學數據進行描述和組織,可以被眾多綜合性的數據倉儲機構和數據檢索平臺所使用,不局限于特定學科的數據存儲庫。
在元素設置上,通用型科學元數據標準建設的目標是可擴展性、彈性、模塊化和可移植性等,滿足數據的記錄、交換、檢索和存檔等功能需求。Huang等的調查顯示,研究人員使用元數據標準側重于其綜合性、充分性、簡易性和抽象性[17],而諸多學科元數據元素以及大量的、多樣化的標準和廣泛而差異的命名規(guī)則,在一定程度上阻礙元數據標準的推廣使用[18]。Boyd基于分類和組織內容提出科學元數據標準內容的三個層次:第一層次是元數據標準的元素集合,如Dublin Core、CKAN等;第二層次是反應科學環(huán)境元數據(Contextual Metadata),涉及基本實體有project、person、organization unit、result、publication、patent、product;第三層次是描述性元數據,提供更細粒度的、詳細的信息[19]。這些詳細的信息應涵蓋數據狀態(tài)、數據管理權限、地理、空間信息引用和版本說明等[20]。例如,英國中央實驗室研究理事會研發(fā)的核心科學元數據模型(Core Scientific MetaData Model)將組成元素分為主題、研究描述、數據獲取條件、數據描述、數據定位和相關資源等六個方面,從而方便以統(tǒng)一的形式實現科學數據的組織和獲取[8]。
3.1 國外通用型元數據標準
在科學數據管理周期中,元數據標準處于核心地位。國外諸多科學數據管理模型,如ICPSR社會科學數據存檔生命周期模型、DataONE科學數據生命周期管理模型,以及英國數據存檔數據生命周期管理模型等都十分重視數據歸檔和階段管理規(guī)范化[21]。元數據標準是每個數據管理機構必須重視的規(guī)范化文件之一。2012年,NISO/DCMI聯合研討會更是以“科學研究數據管理元數據”為主題,對元數據標準進行系統(tǒng)地研討[22]。
目前,國外科學元數據標準十分豐富,不僅研制學科性質的元數據標準,而且在制定和使用通用型科學元數據標準。本研究調查了英國數字監(jiān)護中心(DCC)[23]、Research Data Alliance(RDA)[24]以及都柏林核心元數據[25]等科學元數據使用和管理平臺,對目前國外通用型元數據標準進行初步統(tǒng)計,相關情況如表1所示。
除此之外,還有一些關于編碼、控制語言等方面科學數據描述的標準。
(1)Data Catalog Vocabulary(DCAT)。利用DCAT可以描述數據目錄中的數據集。統(tǒng)一的描述使得應用程序更容易從多個目錄中獲取元數據。該標準有利于將分散出版的目錄集成在網站中,從而進行聯合數據集搜索。聚集的DCAT元數據可以作為一個數字保存清單。
(2)RDF Data Cube Vocabulary。該標準為在網絡發(fā)布多維數據(如統(tǒng)計數據)提供了一種方式。通過該標準和W3C的RDF(資源描述框架)標準,可以將數據鏈接到相關數據集和概念實體。模型支撐數據方體(Data Cube)的詞匯和立方體模型,并與SDMX(Statistical Data and Metadata Exchange)的數據模型兼容。
(3)Data Package是一個數據交換的通用包裝格式。雖然支持任意的元數據,但該格式定義了數據包作為一個整體必備的、推薦的和可選的字段,以及所包含的相關資源。
表1 國外通用型元數據標準情況調查表
在科學數據元數據標準發(fā)展過程中,諸多數據存儲機構也參與到標準的制定中。一些大規(guī)模的數據存儲服務提供者認為目前很多元數據標準并不能滿數據庫的使用,所以按需制定了元數據描述要求和規(guī)則[26]。這些存儲機構很多都是專業(yè)領域內涵蓋具體學科數據的數據庫,有大量的專業(yè)數據,所以其制定的元數據更專注于特定的數據(如基因數據、GIS數據等)。
國外通用型元數據標準適用于綜合性的科學數據管理平臺,基于效率以及管理的角度,其重要程度應得到足夠的重視。但是,迄今為止美國和ISO沒有發(fā)布通用的元數據標準。國際元數據標準中,僅有都柏林核心元素集(15個描述元素)在科學數據管理中被應用,而且這一標準并不可以完全覆蓋科學數據管理周期的所有要求。元數據管理者更多地依賴專業(yè)領域內的元數據標準或者是利用第三方數據庫服務(如datacite進行數據發(fā)現)[27]。通用型元數據標準并沒有得到統(tǒng)一的制定和使用,僅處于機構和聯盟內部標準階段。
3.2 國內科學元數據標準
隨著科學數據管理的興起,國內開始逐漸重視元數據標準發(fā)展問題。我國自2002年開始實施國家科學數據共享工程,并制定數據共享工程的核心元數據標準;2005年,科技部提出建立國家科學數據共享工程技術標準,并發(fā)布《國家科學數據共享工程核心元數據內容》和《科學數據共享元數據標準(試行稿)》?!犊茖W數據共享元數據標準(試行稿)》提供了科學數據共享元數據內容標準框架,定義科學數據共享核心元數據、公共元數據和參考元數據[28]。中國科學院也先后發(fā)布《中國科學院科學數據庫核心元數據標準》《人地系統(tǒng)主題數據庫元數據標準》《土壤科學數據庫元數據標準》等一系列學科數據庫元數據標準。2011年,“國家科技基礎條件平臺建設基礎科學數據共享網項目”發(fā)布《數據集核心元數據標準》。
目前,我國主要存在三項有關科學數據元數據的國家標準:GB/T 20533—2006《生態(tài)科學數據元數據》、GB/T 19710—2005《地理信息元數據》和GB/T 26499.3—2011《機械 科學數據 第3部分:元數據》。另外,部分行業(yè)的元數據標準也陸續(xù)推出。
國內元數據標準建設側重于單個學科或部分行業(yè),科學元數據發(fā)展呈現不均衡狀態(tài),通用型科學元數據標準還在研制中,社會科學領域的科學元數據標準也尚未發(fā)展成型,元數據標準發(fā)展較為緩慢。在元數據標準應用階段,國內科學數據管理平臺應用的元數據標準基本是國外已有的元數據標準或平臺建設軟件提供的元數據。
3.3 典型通用型科學元數據標準
3.3.1 《都柏林核心元數據元素集》
作為目前唯一的通用型元數據國際標準,《都柏林核心元數據元素集》(Dublin Core Metadata Element Set,DC)被廣泛認可,其15個DC元素得到廣泛傳播[29]。我國與其對應的標準是GB/T 25100—2010。很多科學元數據標準以DC為基礎進行擴展,例如:Dryad Metadata Application Profile[30](用于描述同行評議的科學和醫(yī)學文獻等多學科數據)、ANZLIC Metadata Profile(方便有效地訪問信息資源,特別是地理或空間數據)和AGLS Metadata Standard[31](澳大利亞政府定位服務元數據標準,適用于網絡資源的可視性和可用性)等。
科學數據和科研過程極大地影響科學元數據的功能??茖W元數據在很大程度上是對與具體研究相關的所有信息的描述,包括對數據資源語境[相關性、質量、限制(權利、成本)]變化的記錄以及相關軟件和計算機資源的參數數據,最終可以根據元數據記錄創(chuàng)建虛擬的研究環(huán)境。相對于其他科學元數據標準,DC元數據缺少必備的元素對科學數據產生過程中的信息進行全面地記錄和描述,所以DC中的15個必備元素需要一定地擴展和補充[32]。
3.3.2 《數據文件倡議》
《數據文件倡議》(Data Documentation Initiative,DDI)是一個應用廣泛的項目,很多科學數據管理機構(如英國數據服務中心、英國數據檔案、美國ICPSR等)都采用該標準進行數據管理。DDI可以描述社會、經濟、行為和健康科學領域內的觀測方法得到的數據,并進行文檔發(fā)現和互操作。DDI是描述社會和行為科學數據文檔的標準,該標準提供內容交換和信息保存的格式標準進而可以促進文檔間的共同操作(見表2)。目前,DDI有兩個擴展版本。
(1)DDI Codebook(DDIversion 2)是比較簡單的版本,用于記錄簡單的調查類型數據,可以進行交換或歸檔。DDI Codebook可以創(chuàng)建目錄記錄,分為兩種:study-level descriptions和codebook-type variable-level descriptions。這樣的記錄層次降低調查類的數據記錄粒度,使得問卷中的問題可以被描述和重利用。
表2 DDI元素
(2)DDI Lifecycle(DDIversion 3)是比較豐富的版本,可用于描述處于數據生命周期任一階段的數據,涵蓋從概念產生、發(fā)布和數據重用。它是模塊化和可擴展的。DDI Lifecycle可以對復雜數據進行層次性和縱向性的描述,創(chuàng)建元數據驅動的調查設計(如問卷設計);DDI Lifecycle的描述可以使整個數據生命周期的任意階段數據得到重用,如可變編碼階段、數據收集工具使用階段等;同時,DDI Lifecycle創(chuàng)建問題/概念/變量存儲、組織/個人的登記表等。DDI標準采用XML組織, 由國際數據文檔倡議聯盟組織(DDIA)負責開發(fā)[33]。
3.3.3 《科學數據共享核心元數據標準》
科技部為滿足科學數據共享工程對元數據內容的基本需求制定《科學數據共享核心元數據標準》(見表3),其目的是方便科學數據共享數據集的管理,提高數據庫建庫質量,促進數據加工的規(guī)范化、標準化,實現數據交流與共享。該標準主要采用或參考ISO 19115《地理信息——元數據》和《都柏林核心元數據元素集》。該標準定義三個層次的元數據集合:科學數據共享核心元數據(22個元素)、公共元數據(156個元數據元素和實體)和參考元數據(388個元素)。三個層次的元數據集合在內容上是包含關系,又同時分別滿足整個工程、各個領域以及具體應用層面的需求。核心元數據面對不同領域、不同類型的數據資源展開統(tǒng)一描述,而公共元數據和參考元數據對于制定領域元數據標準和領域專用元數據標準起著很重要的作用。
表3 《科學數據共享核心元數據標準》
3.3.4 《中國科學院科學數據庫核心元數據標準》
2005年,中國科學院計算機網絡信息中心和科學數據庫中心聯合推出《中國科學院科學數據庫核心元數據標準》。該標準參考都柏林核心元數據標準、RSLP資源集合描述標準、生態(tài)學元數據語言、數字地理空間元數據內容標準?!吨袊茖W院科學數據庫核心元數據標準》包括《數據集元數據》和《服務元數據》兩個主要部分。
《數據集元數據》是一個面向數據集層次的科學數據資源的元數據標準,定義一組通用的元數據模塊和元素,包括數據集描述信息、數據質量信息、數據集分發(fā)信息、元數據參考信息、服務參考信息以及結構描述信息等六個主要復合元素模塊,還包括范圍信息和聯系信息輔助模塊。用戶在遵循擴展機制的基礎上,基于此標準開發(fā)滿足特定學科或主題領域的元數據應用方案。
《服務元數據》是一個面向科學數據庫系統(tǒng)中各種服務的元數據標準,定義一個通用的服務描述模型,并基于此模型為所需要的五類服務分別定義描述元素。這五類服務是數據集連接服務、中間件服務、網格服務、WWW服務和FTP服務。通用描述模型抽象了所有服務的描述模式,任何新的服務均可依據該模型來定義其元數據元素。
3.3.5 《數據集核心元數據標準》
2011年3月,國家科技基礎條件平臺建設基礎科學數據共享網項目發(fā)布《數據集核心元數據標準》。該標準規(guī)定各種需求層次的元數據應用所需要的最小元數據元素(簡稱“核心元數據”),以及對元數據進行擴展和制定元數據應用方案的規(guī)則和方法,以滿足各學科領域的特殊需求。該標準適用于科學數據庫的編目和描述、組織管理,也可用于數據資源的交換、集成和服務[34]。
核心元數據面向數據集層次的科學數據資源,主要分為3個模塊:描述信息、元數據參考信息和聯系信息。
(1)描述信息。主要包括數據集的名稱、簡介、創(chuàng)建日期、創(chuàng)建者等基本信息,著重描述數據資源的基本屬性,且與DC、Content Standard for Digital Geospatial Metadata等國際上主要的元數據標準的相應元素基本一一對應(共22個標準元素)。
(2)元數據參考信息。提供數據集依據的元數據標準名稱和版本、有關元數據創(chuàng)建日期和元數據創(chuàng)建及維護者的聯系方式等方面的重要信息。數據集用戶可以了解到與元數據記錄的建立有關的信息,將有助于元數據維護人員進行元數據的修改與維護。
(3)聯系信息。作為該標準的輔助模塊,供其他模塊的特定元素在需要的時候進行引用。聯系信息分為六個方面:聯系人姓名(與數據集有關的聯系人員名稱)、單位、地址、傳真、電話以及電子郵件地址。
此外,《數據集核心元數據標準》還提供擴展和應用說明,為元數據的互操作性奠定基礎。
我國的科學數據管理尚處于起步階段,目前國內外尚未形成比較完備的管理標準,特別是通用型元數據標準,標準建設不完善。雖然有對科技平臺資源進行描述的標準,但是還不能完全滿足科學數據的管理需求。
國外科學數據管理發(fā)展迅速,眾多的數據管理機構推出科學元數據標準,再加上已存在的學科領域的數據標準,最終形成復雜多樣的科學元數據標準。管理者自主制定的標準導致數據互操作性以及共享性受到很大影響。隨著數據的流動和開放數據共享的發(fā)展,標準的差異將會帶來更繁雜的數據整合工作。大量的科學數據的產生必然需要高效規(guī)范的管理。
國內相關標準還在研制中,不斷出現的數據倉儲和管理平臺迫切需要比較成熟的元數據標準進行管理。目前國內的管理者都是各自選擇國外的元數據標準,國外的標準大多也還處于行業(yè)和機構標準的水平,這不利于數據交換和統(tǒng)一管理。科學數據的管理將會面臨大儲量、多學科、規(guī)范性等問題。為達到數據分享和統(tǒng)一管理等目的,通用型元數據標準的使用是解決這些問題的一個有效方法。因此,國內相關標準創(chuàng)建可以借鑒國外已有經驗,縮短探索過程。
(1)整合已有科學元數據標準元素,創(chuàng)建統(tǒng)一的元素集合。國內標準在制定時,多采用國際應用范圍較廣的元數據標準。國外也是如此,如:Dataverse Network符合DDI Codebook、DC、CSDGM、MARC LOCKSS、OAI等標準創(chuàng)建;Dryad的元數據服務也同時符合DC、Darwin Core、Bibliographic Ontology、METS/MODS等元數據標準。Willis等通過對16個元數據標準、4 400多個獨特的元素進行統(tǒng)計分析,發(fā)現描述類元素數量較大而且與DC元素存在重復[35]。所以對比國內外的標準發(fā)現,在元素設計上,很多標準可以繼續(xù)整合提取,創(chuàng)建涵蓋科學數據管理周期的元素集合。
(2)擴展元數據描述層次,涵蓋數據生命周期。國內目前的元數據標準設計主要有3類信息:描述數據集、元數據參考信息和數據責任方信息。描述對象集中于數據集合,以及對數據集層面的關聯信息,缺少數據集層次以下的數據描述和組織??茖W元數據描述范圍應該涵蓋數據產生到引用的全過程,如DDI涵蓋從項目到變量的多層次數據,建立較深層的數據索引。
(3)以科學數據共享元數據為藍本進行標準制定,建立通用型元數據標準??茖W數據共享元數據在覆蓋信息范圍、元素設計層次以及建立實體關聯等方面領先于國內其他的元數據標準;而且在元素設計層次上,考慮到核心元數據集合與各領域內元數據集合的關聯,在框架結構上起到通用型標準的作用,這也是國外標準未實現的功能。因此,可以此標準為藍本進行進一步的設計和擴展。在數據標識、名稱的權限控制,關聯數據,本體和詞匯,以及數據引用標準等方面進行規(guī)范[36],特別是擴展描述性元數據支持資源發(fā)現和保存的功能。這也是科學元數據與傳統(tǒng)元數據標準的不同之處。將不同學科的數據通過統(tǒng)一元數據標準進行關聯,加強數據索引的深度和廣度,為下一步的科學發(fā)現和合作做好準備。
大多數的科學元數據標準為特定學科的元數據標準或特定領域的元數據標準,通用型元數據標準建設不足,廣泛認可的國際標準缺乏。國內正處于標準建設期,可從建設初期制定國家標準,避免標準發(fā)展的混亂,將會極大地促進科學數據管理的發(fā)展。
[1] OECD.OECD Principles and Guidelines for access to research data from public funding[EB/OL].(2007-04)[2016-09-09].http://www.oecd.org/science/sci-tech/oecdprinciplesandguidelinesforaccesstoresearchdatafro mpublicfunding.htm.
[2] NIH.NIH Grants Policy Statement[EB/OL].(2011-10-20)[2016-09-09]. http://grants.nih.gov/grants/policy/nihgps_2011/nihgps_ch2.htm.
[3] 徐坤,蔚曉慧,畢強.基于數據本體的科學數據語義化組織研究[J].圖書情報工作,2015(17):120-126.
[4] 李曉輝.圖書館科研數據管理與服務模式探討[J].中國圖書館學報,2011(5):46-52.
[5] DAVENHALL C.Scientific Metadata[EB/OL].[2016-09-09].http://www. dcc.ac.uk/resources/curation-reference-manual/chapters-production/scientific-metadata.
[6] Australian National Data Service.Metadata[EB/OL].[2016-09-09].http://www.ands.org.au/working-with-data/metada.
[7] Australian National Data Service.Metadata: Working level[EB/OL].[2016-09-09]. http://www.ands.org.au/guides/metadata-working#4.4.
[8] MATTHEWS B,SUFI S,FLANNERY D,et al.Using a core scientific metadata model in large-scale facilities[J].International Journal of Digital Curation,2010,5(1):106-118.
[9] TENOPIR C,ALLARD S,DOUGLASS K,et al.Data sharing by scientists: practices and perceptions[J].PLos ONE,2011,6(6):1-21.
[10] 周波,錢鵬.我國科學數據元數據研究綜述[J].圖書館學研究,2013(2):7-10.
[11] 黃如花,邱春艷.國內外科學數據元數據研究進展[J].圖書與情報,2014(6):102-108.
[12] 胡芳.國外典型科學數據倉儲實施的元數據方案及啟示[J].圖書與情報,2015(1):117-121.
[13] 趙華,王健.國內外科學數據元數據標準及內容分析[J].情報探索,2015(2):21-24,30.
[14] 劉峰,張曉林.科學數據元數據標準述評及其通用化設計研究[J].現代圖書情報技術,2015(12):3-12.
[15] 常穎聰,何琳.科學實驗數據元數據模型構建研究——以植物學基因表達實驗為例[J].圖書情報工作,2015(13):117-125.
[16] 周波.高??茖W數據元數據方案初探[J].圖書館學研究,2012(1):45-49,53.
[17] HUANG H,QIN J.Understanding metadata functional requirements in genome curation work[J].Proceedings of the American Society for Information Science and Technology,2013,50(1):1-4.
[18] QIN J,LI K.How portable are the metadata standards for scientific data?A proposal for a metadata infrastructure[EB/OL].[2016-09-07]. http://jianqin.metadataetc.org/wp-content/uploads/2013/08/DC2013-metadatad-portability.pdf.
[19] BOYD D.CERIF tutorial and UK data surgery[EB/OL].(2012-02-16) [2016-09-07].http://data.blogs.ilrt.org/2012/02/16/cerif-tutorial-and-uk-datasurgery/.
[20] Metadata for managing scientific research data NISO/DCMI webinar[EB/OL]. [2016-09-07].http://www.slideshare.net/BaltimoreNISO/metadata-formanaging-scientific-research-data.
[21] 丁寧,馬浩琴.國外高??茖W數據生命周期管理模型比較研究及借鑒[J].圖書情報工作,2013(6):18-22.
[22] Metadata for managing scientific research data[EB/OL].[2016-08-10]. http://www.niso.org/news/events/2012/dcmi/scientific_data/#about.
[23] Digital Curation Centre[EB/OL].[2016-08-10].http://www.dcc.ac.uk.
[24] RDA:Metadata directory[EB/OL].[2016-08-14].https://www.rd-alliance.org/.
[25] Dublin Core Metadata.Announcements[EB/OL].[2016-08-10].http://dublincore.org/.
[26] Repository-Developed metadata schemas[EB/OL].[2016-08-10].http://rdalliance.github.io/metadata-directory/standards/repository-developedmetadata-schemas.html.
[27] Metadata for research data management[EB/OL].[2016-08-10].http://hangingtogether.org/?p=5616.
[28] 吳丹.近五年國內外元數據研究進展[M]//陳傳夫.圖書館學研究進展.武漢:武漢大學出版社,2010.
[29] Dublin Core Metadata. Metadata basics[EB/OL].[2016-08-10].http://dublincore.org/metadata-basics/.
[30] Dryad Metadata Application Profile(Schema)[EB/OL].[2016-08-10]. http://wiki.datadryad.org/Metadata_Profile.
[31] AGLS Metadata standard[EB/OL].[2016-08-10].http://www.agls.gov.au/.
[32] DRYAD.Metadata profile[EB/OL].[2016-08-10].https://rd-alliance.org/metadata-principles-and-their-use.html.
[33] DDI-Community[EB/OL].[2016-09-10].http://www.ddial-liance.org/alliance.
[34] 數據集核心元數據標準[EB/OL].(2012-04-13)[2016-08-10].http://wenku. baidu.com/link?url=uhRqBPEyaX2F_8Ba8lARkyn3bkts-Dz60PgfH8CXdL2 jvrqGvCuaksFFfDCRGkb8GtNABBYmToBEXwqOt_BsAeEMIdNRx ku8SnClR2cWub_.
[35] WILLIS C,GREENBERG J,WHITE H.Analysis and synthesis of metadata goals for scientific data[J].Journal of the American Society for Information Science and Technology,2012,63(8):1505-1520.
[36] Scientific data application profile scoping study[EB/OL].[2016-09-10]. http://www.ukoln.ac.uk/projects/sdapss/.
Research on General Scientifi Metadata Standards
PU YanNi, LIU Qi, GENG Qian
(School of Government, Beijing Normal University, Beijing 100875, China)
Scientific data is regarded as an important scientific research value in the fourth paradigm of science time. The important role of scientific metadata has been paid more and more attention in the life cycle of data management.Especially in the field of social science, a large number of scientific data is in urgent need of specialized and unified metadata standards for the organization and management.Foreign comprehensive scientific metadata standards have developed more mature, while domestic metadata standards are still in the construction.This paper analyzes the construction purpose, function and main standard elements of the foreign metadata standards, and provides a reference for the domestic construction of comprehensive scientific metadata standards.
Scientific Metadata; Metadata Standards; General Metadata Standards
G201
10.3772/j.issn.1673-2286.2016.12.006
浦燕妮,女,1991年生,碩士研究生,研究方向:科研數據管理,E-mail:puyanni@163.com。
劉琪,女,1992年生,碩士研究生,研究方向:信息檢索、科研數據管理,E-mail:bnuliuqi@126.com。
耿騫,男,1965年生,教授,研究方向:信息檢索、網絡信息管理、管理信息系統(tǒng),E-mail:gengqian@bnu.edu.cn。
2016-10-11)