国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國內(nèi)外元數(shù)據(jù)標(biāo)準(zhǔn)宏觀比較研究

2011-04-12 07:59:51廣東金融學(xué)院圖書館廣東省廣州市510521陳彩紅
河北科技圖苑 2011年1期
關(guān)鍵詞:標(biāo)準(zhǔn)資源信息

廣東金融學(xué)院圖書館 〔廣東省廣州市 510521〕 陳彩紅

一、元數(shù)據(jù)的定義

至今元數(shù)據(jù)還沒有統(tǒng)一的定義,最常規(guī)的定義就是:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)(Data about data)。過于簡單的此定義無法揭示其內(nèi)涵,一些專家和學(xué)者遂將其深化和擴(kuò)展,比較有代表性的是:元數(shù)據(jù)(Metadata)是描述數(shù)據(jù)的數(shù)據(jù)(Data that defines and describes other data)(ISO/IEC 11179-3:2003(E));是結(jié)構(gòu)化數(shù)據(jù)(Structured data about data),它描述數(shù)據(jù)的結(jié)構(gòu)和意義;是用于描述數(shù)據(jù)的內(nèi)容(What)、覆蓋范圍 (Where,When)、質(zhì)量(Quality)、管理方式(Management)、數(shù)據(jù)的所有者(Who)、數(shù)據(jù)的提供方式(How)等信息的數(shù)據(jù),是連接數(shù)據(jù)與數(shù)據(jù)用戶二者之間的橋梁(Bridge);是一組獨(dú)立的關(guān)于資源的說明(metadata is a set of independent assertions about a resource);是描述資源的信息(Information about a resource);是數(shù)據(jù)管理、控制信息(Administrative information);是數(shù)據(jù)編目信息(Cataloguing information)。傳統(tǒng)的書目數(shù)據(jù)、產(chǎn)品目錄等都是元數(shù)據(jù)。元數(shù)據(jù)可以為各種形態(tài)的信息資源提供規(guī)范、普遍的描述方法,為由多種資源組成的信息體系(如數(shù)字圖書館等)提供整合的工具與檢索。離開元數(shù)據(jù)的數(shù)字圖書館將無法提供有效的處理。

二、都柏林核心元數(shù)據(jù)標(biāo)準(zhǔn)述評(píng)

DC由美國 OCLC公司與國家超級(jí)計(jì)算應(yīng)用中心 (NCSA)聯(lián)合發(fā)起,國際性合作項(xiàng)目Dublin Core Metadata Initiative設(shè)計(jì),52位來自圖書館界、計(jì)算機(jī)網(wǎng)絡(luò)界專家共同研究產(chǎn)生,適用于網(wǎng)絡(luò)信息資源描述,包括l5個(gè)元數(shù)據(jù)核心元素:數(shù)據(jù)集名稱、主題、摘要、數(shù)據(jù)源、語言、關(guān)系、時(shí)空覆蓋范圍、數(shù)據(jù)生產(chǎn)者、出版者、其他生產(chǎn)者、版權(quán)、日期、類型、格式、標(biāo)識(shí)碼。它吸引了諸如博物館、圖書館、政府部門和商業(yè)組織等正規(guī)資源描述界的廣泛關(guān)注,得到了國際間的廣泛承認(rèn),作為學(xué)科分類信息資源描述而言,是目前世界上使用最廣泛的元數(shù)據(jù)格式,具有最大的彈性和最強(qiáng)的適應(yīng)性,是描述、支持、發(fā)現(xiàn)、管理和檢索網(wǎng)絡(luò)信息資源的最有效組織方式之一。

DC元數(shù)據(jù)原是為作者生成對(duì)萬維網(wǎng)資源的描述而設(shè)計(jì)的,是旨在推動(dòng)電子資源發(fā)現(xiàn)的最小的元數(shù)據(jù)元素集,由其適應(yīng)性和互操作性而額外具有一個(gè)重要特質(zhì)——全世界范圍內(nèi)在一個(gè)核心集內(nèi)達(dá)成跨學(xué)科領(lǐng)域的共識(shí)。DC元數(shù)據(jù)是在充分吸收?qǐng)D書情報(bào)界的編目、分類、文籀等經(jīng)驗(yàn)以及利用計(jì)算機(jī)、網(wǎng)絡(luò)自動(dòng)搜索、編目、索引、檢索等研究成果的基礎(chǔ)上發(fā)展起來的,其最大特點(diǎn)是數(shù)據(jù)結(jié)構(gòu)簡單。

三、國際上常用的幾種元數(shù)據(jù)標(biāo)準(zhǔn)

(一)CDWA(Categories for the Description of Works of Art)

由 AIT F(Art Information Task Force,藝術(shù)信息專業(yè)組織)頒布實(shí)施,適用于藝術(shù)品及數(shù)字圖像資源描述,包括描述藝術(shù)品物理形態(tài)、圖像及與時(shí)空、人物、歷史文化等方面的上下文關(guān)系等 26個(gè)基本元素:對(duì)象 /作品、分類、方位 /布置、題名、形態(tài)、版本、尺寸、材質(zhì)與技術(shù)、制作方法、物理描述、碑銘 /標(biāo)志、條件 /檢查歷史、保存 /處理歷史、創(chuàng)造性、擁有 /收藏歷史、版權(quán) /限制、風(fēng)格 /時(shí)期 /流派 /樂章、主題、上下文、展覽 /借出歷史、視頻文件、文本參考描述、反響、編目歷史、所在地等。

(二)VRA(Core Categories ForVisual Resources)

由美國視覺資料協(xié)會(huì)制定,適用于藝術(shù)、建筑、史前古器物、民間文化等藝術(shù)類三維實(shí)體的可視化資源描述,包括 l7個(gè)基本元素:類型、題名、作者、時(shí)間、身份號(hào)、文化、主題、關(guān)系、描述、來源、版權(quán)、記錄式樣、尺寸、材質(zhì)、技術(shù)、所在地、風(fēng)格 /時(shí)期等。

(三)FGDC(Federal Geographic Data Committee)

由美國聯(lián)邦地理數(shù)據(jù)委員會(huì)制定,適用于地理空間數(shù)據(jù)內(nèi)容描述,FGDC是按照段(Section)、復(fù)合元素 (Compound Element)、數(shù)據(jù)元素 (Data Element)由來組織記錄的,包括 7個(gè)主要子集和 3個(gè)輔助子集,共有 460個(gè)元數(shù)據(jù)實(shí)體(含復(fù)合元素)和元素。FGDC規(guī)定了3種性質(zhì)的子集、復(fù)合元素和元素。主要子集包括:標(biāo)識(shí)信息、數(shù)據(jù)質(zhì)量信息、空間數(shù)據(jù)組織信息、空間參照系統(tǒng)信息、實(shí)體和屬性信息、發(fā)行信息、元數(shù)據(jù)參考信息。次要子集包括:引用文獻(xiàn)(引證)信息、時(shí)間信息、聯(lián)系信息等。

(四)GILS(Government Information Locator Service)

由美國管理與預(yù)算辦公室、國家檔案與記錄管理局及總務(wù)管理局聯(lián)合制定,適用于政府的公用信息資源描述,包括描述性、管理性及記錄維護(hù)或系統(tǒng)使用的28個(gè)核心元素。描述性元素包括:標(biāo)題、創(chuàng)作者、投稿者、公布時(shí)間、公布地點(diǎn)、使用語種、文摘、規(guī)范主題索引、非控主題詞、空間域、時(shí)間段、聯(lián)系方式、附加信息、目的、處理程序、參照、來源日期、方法。管理性元素包括:有效性、獲取條件、使用權(quán)限、進(jìn)度號(hào)碼、處理標(biāo)識(shí)、來源控制標(biāo)識(shí)、記錄來源。記錄維護(hù)或系統(tǒng)用的元素包括:使用語種、最后更新時(shí)間、記錄檢查時(shí)間。

(五)TEI(Text Encoding Initiative)

由計(jì)算機(jī)和人文協(xié)會(huì)、計(jì)算語言學(xué)會(huì)、文字語言協(xié)會(huì)聯(lián)合制定,適用于電子文本的描述方法、標(biāo)記定義、記錄結(jié)構(gòu),TEI使用 SGM L作為數(shù)據(jù)記錄的編碼語言,對(duì)元數(shù)據(jù)和內(nèi)容數(shù)據(jù)進(jìn)行描述,包括 T EI Header、front、body、back 4個(gè) 部分。其 中 ,T EI Header規(guī)定了對(duì)電子文本內(nèi)容的描述,front、body和back分別用 TEI標(biāo)簽格式來記載文本文前內(nèi)容、文本正文、附錄的實(shí)際內(nèi)容。TEI Header包括的元素有:題名、版本、長度、出版、叢書、附注、來源元素、項(xiàng)目過程描述、抽樣、編輯、標(biāo)簽、參照、分類、特征體系、變化聲明元素、制作信息、語言使用、文本類別、文本參數(shù)、參加者、背景描述、日期、責(zé)任說明、變化項(xiàng)目元素。每個(gè)元素還包括相應(yīng)的子元素。front包含圖像——封面、書脊、空白頁、標(biāo)題頁、卷首插圖等文本——標(biāo)題頁、序言,包括其中的目錄、插圖目錄、導(dǎo)論、序言、銘文等;Body中是正文部分,根據(jù)文本類型不同,可以使用核心標(biāo)記集+相應(yīng)的附加標(biāo)記集合(DTD)來標(biāo)記文本;back包含附錄和索引的內(nèi)容等。

(六)EAD(Encoded Archival Description)

由美國國會(huì)圖書館網(wǎng)絡(luò)開發(fā)&M ARC標(biāo)準(zhǔn)辦公室、美國檔案管理員協(xié)會(huì)聯(lián)合開發(fā)維護(hù),主要用于描述檔案和手稿資源,包括文本文檔、電子文檔、可視材料和聲音記錄等,EAD使用SGML作為數(shù)據(jù)記錄的編碼語言,EAD2002共計(jì)包括 146個(gè)元素,由EAD標(biāo)目 (eadheader)、前面事項(xiàng) (frontmatter)、檔案描述(archdesc)三個(gè)高層元素組成,每一個(gè)高層元素下可分若干子元素,子元素下還可再細(xì)分出若干元素,主要元素包括:取用限制、增加、采訪信息、其他可取得的形式、鑒定、檔案描述、編排、書目、傳記 /歷史、收藏歷史、描述規(guī)則、EAD識(shí)別、語言資料、法律狀態(tài)、附注、其他描述資料、原件位置、來源、其他檢索工具、實(shí)體描述、實(shí)體技術(shù)、處理信息、相關(guān)資料、范圍與內(nèi)容、分別資料、單元日期、單元識(shí)別、單元題名、使用限制等。

四、中文元數(shù)據(jù)標(biāo)準(zhǔn)

(一)中文元數(shù)據(jù)方案

由國家圖書館中文元數(shù)據(jù)研究組制定,適用于中文數(shù)字資源建設(shè)、保存及共建共享服務(wù),包括 25個(gè)描述性、管理性、技術(shù)性和法律性信息元素:名稱、主題、版本、內(nèi)容摘要、內(nèi)容類型、語種、內(nèi)容覆蓋范圍、內(nèi)容創(chuàng)建者、其他責(zé)任者、內(nèi)容創(chuàng)建日期、出版、版權(quán)所有者、資源標(biāo)識(shí)符、關(guān)聯(lián)資源、數(shù)字資源制作者、數(shù)字資源制作日期、數(shù)字資源制作地、權(quán)限聲明、公開對(duì)象、操作許可、原始技術(shù)環(huán)境、加工處理歷史、維護(hù)歷史、認(rèn)證指示符、基本抽象格式描述等。

(二)中國科學(xué)院科學(xué)數(shù)據(jù)庫核心元數(shù)據(jù)標(biāo)準(zhǔn)

由中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心主持,聯(lián)合中科院各單位共同研究制定,屬于中國科學(xué)院“科學(xué)數(shù)據(jù)庫及其應(yīng)用系統(tǒng)”項(xiàng)目研究成果,適用于科學(xué)數(shù)據(jù)庫資源的建設(shè)、管理、共享和服務(wù),包括數(shù)據(jù)集元數(shù)據(jù)、服務(wù)元數(shù)據(jù)兩部分。數(shù)據(jù)集元數(shù)據(jù)主要包括:數(shù)據(jù)集描述信息 (名稱、URI、主題、描述、目的、類型、數(shù)據(jù)量、數(shù)據(jù)來源、提供者、貢獻(xiàn)者、更新頻率、數(shù)據(jù)集時(shí)間、語種、URL、關(guān)聯(lián)數(shù)據(jù)集、數(shù)據(jù)集范圍)、數(shù)據(jù)集質(zhì)量信息(數(shù)據(jù)志、評(píng)測(cè)報(bào)告)、數(shù)據(jù)集分發(fā)信息(數(shù)據(jù)格式、技術(shù)要求、收費(fèi)策略、權(quán)限聲明、訂購指南、訪問時(shí)間、聯(lián)系方式、分發(fā)信息元數(shù)據(jù)示例)、元數(shù)據(jù)參考信息(元數(shù)據(jù)標(biāo)準(zhǔn)、元數(shù)據(jù)時(shí)間、元數(shù)據(jù)聯(lián)系信息、元數(shù)據(jù)參考信息元數(shù)據(jù)示例)、服務(wù)參考信息、指示信息、結(jié)構(gòu)描述信息(檢索點(diǎn)、實(shí)體、關(guān)系)、范圍信息(學(xué)科范圍、時(shí)間范圍、空間范圍)、聯(lián)系信息(聯(lián)系人名稱、聯(lián)系地址、其他聯(lián)系方式、聯(lián)系時(shí)間)。服務(wù)元數(shù)據(jù)主要包括:服務(wù)類型、服務(wù)名稱、服務(wù)URI、服務(wù)描述、服務(wù)屬性等。

(三)基本數(shù)字對(duì)象描述元數(shù)據(jù)標(biāo)準(zhǔn)

屬于科技部科技基礎(chǔ)工作專項(xiàng)資金重大項(xiàng)目研究成果,適用于各類數(shù)字對(duì)象管理,包括 15個(gè)基本元素:名稱、主要責(zé)任者、主題、描述、出版者、其他責(zé)任者、日期、類型、格式、標(biāo)識(shí)符、來源、語種、關(guān)聯(lián)、時(shí)空范圍、權(quán)限。基本元數(shù)據(jù)集可根據(jù)實(shí)際需要進(jìn)行擴(kuò)展,采用 RDF Schema和 RDF/XM L對(duì)元數(shù)據(jù)形式化的詞匯和語法進(jìn)行描述。

(四)中文元數(shù)據(jù)標(biāo)準(zhǔn)框架

由北京大學(xué)數(shù)字圖書館研發(fā),適用于各類數(shù)字資源對(duì)象,由14個(gè)核心元數(shù)據(jù)、3個(gè)北大數(shù)字圖書館核心元素及個(gè)別元素組成。核心元數(shù)據(jù):元素名稱、主要責(zé)任者、主題 /關(guān)鍵詞、資源描述、其他責(zé)任者、日期、資源類型、資源形式、來源、語種、相關(guān)資源、時(shí)空范圍、權(quán)限管理;北大數(shù)字圖書館核心元素:版本、物理特征、出版項(xiàng);個(gè)別元素根據(jù)資源對(duì)象情況制定。

五、關(guān)于中文元數(shù)據(jù)標(biāo)準(zhǔn)制定的建議

(一)合作開發(fā),避免重復(fù)投入而造成資源浪費(fèi)

在中文元數(shù)據(jù)開發(fā)與利用方面,我國臺(tái)灣省和香港特區(qū)已經(jīng)取得了一定的成果,而中國大陸關(guān)于這一方面的研究還處于剛剛起步的階段。因此,兩岸三地有必要加強(qiáng)合作、共同開發(fā),避免資源浪費(fèi),共享研究成果,共同促進(jìn)中文元數(shù)據(jù)的發(fā)展,促進(jìn)中文元數(shù)據(jù)標(biāo)準(zhǔn)的進(jìn)一步發(fā)展和完善,為中文網(wǎng)絡(luò)信息資源的編目組織工作提供有效的工具,促進(jìn)中文網(wǎng)絡(luò)信息資源建設(shè)的發(fā)展。

(二)以都柏林核心元數(shù)據(jù)作為信息資源描述格式的主導(dǎo)發(fā)展趨勢(shì)

在本文的第二部分,評(píng)述都柏林核心元數(shù)據(jù)時(shí),已經(jīng)提到,從元數(shù)據(jù)在整個(gè)世界范圍的發(fā)展及應(yīng)用情況來看,都柏林核心元數(shù)據(jù)主導(dǎo)信息資源描述格式發(fā)展趨勢(shì)已成定局,都柏林核心元數(shù)據(jù)具有很大的彈性、有效的互操作性和最強(qiáng)的適應(yīng)性,已日漸得到業(yè)界的廣泛認(rèn)同。因此,都柏林核心元數(shù)據(jù)大有逐漸取代其他元數(shù)據(jù)格式而成為元數(shù)據(jù)格式發(fā)展主導(dǎo)之勢(shì),在制定中文元數(shù)據(jù)標(biāo)準(zhǔn)時(shí)要充分認(rèn)識(shí)到這一點(diǎn),圖書館應(yīng)在兼顧使用者的習(xí)慣以及與現(xiàn)有系統(tǒng)的兼容性的同時(shí),考慮是否開發(fā)以都柏林核心元數(shù)據(jù)格式作為信息資源描述結(jié)構(gòu)的系統(tǒng),以及如何開發(fā)等問題,應(yīng)以充分論證為基礎(chǔ),對(duì)都柏林核心元數(shù)據(jù)信息資源描述格式給予充分的重視。

(三)注意與國際標(biāo)準(zhǔn)的兼容

在制定中文元數(shù)據(jù)標(biāo)準(zhǔn)方面,在充分認(rèn)識(shí)中文元數(shù)據(jù)處理方面特殊性的同時(shí),還必須注意到與國際相關(guān)標(biāo)準(zhǔn)兼容的問題,考慮所定立標(biāo)準(zhǔn)的開放性,從全球信息大環(huán)境、元數(shù)據(jù)標(biāo)準(zhǔn)大系統(tǒng)著眼,制定能與國際相關(guān)標(biāo)準(zhǔn)兼容的中文元數(shù)據(jù)標(biāo)準(zhǔn),形成國際化的標(biāo)準(zhǔn)體系,這也有助于標(biāo)準(zhǔn)的進(jìn)一步發(fā)展。

(四)積極參加國際性的元數(shù)據(jù)項(xiàng)目

通過參加一系列試驗(yàn)項(xiàng)目,進(jìn)而總結(jié),為中文元數(shù)據(jù)標(biāo)準(zhǔn)的制定積累經(jīng)驗(yàn)。眾所周知,國際上對(duì)于網(wǎng)絡(luò)信息資源是否進(jìn)行編目以及如何進(jìn)行、采取何種方式方法早已形成定論,中國大陸的圖書館應(yīng)盡早加入此類項(xiàng)目,在多方國際合作的過程中積累經(jīng)驗(yàn),這將有助于開展中文網(wǎng)絡(luò)信息資源組織,推動(dòng)中文網(wǎng)絡(luò)信息資源的對(duì)外輸出,提高中文信息資源在國際互聯(lián)網(wǎng)上所占的比例,弘揚(yáng)中國文化,擴(kuò)大中文的世界影響力。

[1]張曉林,肖瓏,孫一剛,等.我國數(shù)字圖書館標(biāo)準(zhǔn)與規(guī)范的建設(shè)框架 [J].圖書情報(bào)工作,2003,47(4):7~11,64.

[2]林衛(wèi),高雄鷹.試談網(wǎng)絡(luò)信息資源的編目 [J].山東圖書館季刊 ,2001,(2):25~27.

[3]張東.論元數(shù)據(jù)互操作的層次 [J].情報(bào)理論與實(shí)踐,2005,(6):648~650.

[4]朱超.關(guān)于元數(shù)據(jù)互操作的探討 [J].情報(bào)理論與實(shí)踐,2005,(6):644~647,655.

[5]肖瓏,陳凌,馮項(xiàng)云,等.中文元數(shù)據(jù)標(biāo)準(zhǔn)框架及其應(yīng)用[J].大學(xué)圖書館學(xué)報(bào) ,2001,19(5):29~35.

[6]馮項(xiàng)云,肖瓏,廖三三,等.國外常用元數(shù)據(jù)標(biāo)準(zhǔn)比較研究[J].大學(xué)圖書館學(xué)報(bào),2001,19(4):15~21.

[7]張曉琳.元數(shù)據(jù)研究與應(yīng)用 [M].北京:北京圖書館出版社,2002:15~18.

[8]劉嘉.元數(shù)據(jù)導(dǎo)論 [M].北京:華藝出版社,2002:37~41.

猜你喜歡
標(biāo)準(zhǔn)資源信息
2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
忠誠的標(biāo)準(zhǔn)
美還是丑?
資源回收
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
展會(huì)信息
迁安市| 宁夏| 延津县| 克拉玛依市| 出国| 仁怀市| 承德市| 南阳市| 图木舒克市| 芦溪县| 衡东县| 陇川县| 安多县| 旬邑县| 汉沽区| 时尚| 革吉县| 曲水县| 阿拉尔市| 宽甸| 江达县| 理塘县| 临邑县| 宜兴市| 东台市| 安图县| 海晏县| 日照市| 梨树县| 临澧县| 徐水县| 巨野县| 简阳市| 孟连| 吴江市| 蓝山县| 加查县| 酒泉市| 同心县| 万宁市| 樟树市|