殷福興
(貴州省圖書館貴州·貴陽(yáng)550003)
DC元數(shù)據(jù)及其在數(shù)字圖書館建設(shè)中的實(shí)踐
殷福興
(貴州省圖書館貴州·貴陽(yáng)550003)
元數(shù)據(jù)主要是描述數(shù)據(jù)屬性的信息,是信息資源共享與交換技術(shù)發(fā)展中的重要問題,是數(shù)字圖書館建設(shè)的基礎(chǔ)工作。元數(shù)據(jù)是一種電子式目錄,為了達(dá)到編制目錄的目的,必須在描述并收藏?cái)?shù)據(jù)的內(nèi)容或特色,進(jìn)而達(dá)成協(xié)助數(shù)據(jù)檢索的目的。包括圖像、文本信息及其他網(wǎng)絡(luò)環(huán)境下的電子資源都是元數(shù)據(jù)描述的對(duì)象,它適用于任何網(wǎng)絡(luò)數(shù)據(jù)和資源,在數(shù)字圖書館建設(shè)中的作用舉足輕重。
數(shù)字圖書館;DC元數(shù)據(jù);圖書館建設(shè)
隨著互聯(lián)網(wǎng)的發(fā)展,元數(shù)據(jù)這個(gè)詞最早出現(xiàn)在美國(guó)國(guó)家航空與航天局手冊(cè)中。就圖書館領(lǐng)域而言,元數(shù)據(jù)的應(yīng)用更為重要,卡片目錄和MARC數(shù)據(jù)都是元數(shù)據(jù)的形式。圖書館領(lǐng)域定義的元數(shù)據(jù)主要從強(qiáng)化結(jié)構(gòu)化數(shù)據(jù)以及突出元數(shù)據(jù)功能兩個(gè)角度進(jìn)行。
(一)DC元數(shù)據(jù)的產(chǎn)生
目前,人們查找所需要的信息一般通過搜索引擎來實(shí)現(xiàn),通過網(wǎng)絡(luò)機(jī)器人自動(dòng)抓取網(wǎng)頁(yè)信息,并自動(dòng)拆字詞做索引的方式建立數(shù)據(jù)庫(kù)。隨著網(wǎng)絡(luò)資源迅速增長(zhǎng),網(wǎng)絡(luò)信息資源不僅數(shù)量龐大,不穩(wěn)定,而且質(zhì)量參差不齊,不規(guī)范,如何更為有效地組織信息資源,用戶快速、準(zhǔn)確地找到所需要的資源已經(jīng)顯得尤為重要。DC元數(shù)據(jù)的出現(xiàn),提供了規(guī)范、準(zhǔn)確的網(wǎng)絡(luò)信息資源描述格式,大大提高了信息搜索的效率。
(二)DC元數(shù)據(jù)的優(yōu)點(diǎn)
DC元數(shù)據(jù)規(guī)范最基本的內(nèi)容是包含十五個(gè)元素的元數(shù)據(jù)元素集合,用以描述資源對(duì)象的語(yǔ)義信息。DC元數(shù)據(jù)具有內(nèi)在性、可重復(fù)性、可選擇性、可修改性、可擴(kuò)展性以及獨(dú)立句法結(jié)構(gòu)等特點(diǎn)。在實(shí)踐應(yīng)用中,其主要優(yōu)點(diǎn)體現(xiàn)在通用性、簡(jiǎn)易性、可擴(kuò)展性以及兼容性等幾個(gè)方面。首先,通用性。因?yàn)樵乜梢灾貜?fù)、自由使用,其所描述資源是否嵌入不會(huì)影響元素含義。與MARC主要對(duì)印刷文獻(xiàn)等靜態(tài)信息進(jìn)行描述相比較,DC元數(shù)據(jù)支持任何內(nèi)容的資源描述,因此,夸學(xué)科的語(yǔ)義描述才有了互操作的可能。其次,簡(jiǎn)易性。與MARC相比DC元數(shù)據(jù)元素不僅語(yǔ)義較為普遍理解,且只有15個(gè),圖書館建設(shè)中非專業(yè)人員也可以進(jìn)行著錄,操作簡(jiǎn)易優(yōu)勢(shì)明顯。再則,可擴(kuò)展性。DC元數(shù)據(jù)的擴(kuò)展描述可根據(jù)實(shí)際需要通過使用限定詞實(shí)現(xiàn)。
(三)數(shù)字圖書館的元數(shù)據(jù)需求
完備的數(shù)字圖書館是多種信息資源的集聚中心,重要信息的生產(chǎn)基地,是信息發(fā)現(xiàn)、搜索好的導(dǎo)航站點(diǎn),它應(yīng)該為用戶提供高水平的服務(wù),成為讀者、專家以及圖書館之間形成交互樞紐。建立一個(gè)為用戶所接受的,簡(jiǎn)單的標(biāo)準(zhǔn)化元數(shù)據(jù)集,不僅可以有效解決數(shù)字圖書館建設(shè)中網(wǎng)絡(luò)資源的查找問題,更是為了適應(yīng)網(wǎng)絡(luò)飛速發(fā)展的迫切需要。再則,為讀者提供信息服務(wù)以及信息資源的收藏,是數(shù)字圖書館的兩大主要職能。為資源建立元數(shù)據(jù)描述,即為了方便資源的儲(chǔ)存和提取對(duì)信息資源進(jìn)行描述和抽取,是數(shù)字圖書館兩大主要職能履行的保障。DC元數(shù)據(jù)簡(jiǎn)易、靈活,便于理解,易于擴(kuò)展及其與其他元數(shù)據(jù)的橋接的可行性等,使得它成為通用網(wǎng)絡(luò)資源描述的元數(shù)據(jù)依據(jù),在數(shù)字圖書館建設(shè)中舉足輕重。
(一)DC元數(shù)據(jù)在數(shù)字圖書館中的應(yīng)用領(lǐng)域
1.組織數(shù)字圖書館中信息資源
DC元數(shù)據(jù)在數(shù)字資源組織方面具有描述、定位、搜索、評(píng)估以及選擇等主要功能,在數(shù)字圖書館建設(shè)中起到傳統(tǒng)目錄的“著錄”作用。DC元數(shù)據(jù)對(duì)數(shù)字資源的組織,以便于使用者和維護(hù)者對(duì)館內(nèi)資源的了解和辨別,促進(jìn)使用者對(duì)資源的利用效率,維護(hù)者對(duì)資源的管理效率,進(jìn)而實(shí)現(xiàn)數(shù)字圖書館的內(nèi)容管理。
2.用戶使用數(shù)字圖書館的導(dǎo)航
用戶通過圖書館網(wǎng)站了解館藏資源,數(shù)字資源的基本屬性通過DC元數(shù)據(jù)進(jìn)行資源描述,進(jìn)而在圖書館網(wǎng)站公布,用戶對(duì)館藏資源的基本了解無須瀏覽信息對(duì)象本身,網(wǎng)站窗口的導(dǎo)航使得檢索更為科學(xué),便捷。
3.解決數(shù)字圖書館系統(tǒng)互操作問題
所謂元數(shù)據(jù)的互操作性問題是指多個(gè)元數(shù)據(jù)格式描述的數(shù)字化信息資源體系之間的透明檢索以及多個(gè)不同的元數(shù)據(jù)格式的解讀、轉(zhuǎn)換。由于多種元數(shù)據(jù)格式在不同乃至相同領(lǐng)域,資源描述、檢索和利用時(shí),不同元數(shù)據(jù)格式描述的資源體系就出現(xiàn)了元數(shù)據(jù)互操作的問題。DC元數(shù)據(jù)是一種結(jié)構(gòu)化的元數(shù)據(jù),不依賴具體編碼方法,任一元素的是獨(dú)立描述,與任何傳輸結(jié)構(gòu)之間無必然聯(lián)系,充當(dāng)一種交換格式,解決數(shù)字圖書館系統(tǒng)互操作問題。
4.數(shù)字圖書館數(shù)據(jù)庫(kù)的設(shè)計(jì)與維護(hù)
數(shù)字圖書館數(shù)據(jù)庫(kù)的設(shè)計(jì),需要元數(shù)據(jù)的搜集,該過程中設(shè)計(jì)人員需要對(duì)數(shù)據(jù)來源系統(tǒng)的邏輯模型、物理結(jié)構(gòu)以及業(yè)務(wù)規(guī)則等進(jìn)行詳細(xì)查看。元數(shù)據(jù)搜集的相關(guān)信息,在數(shù)字圖書館數(shù)據(jù)庫(kù)的設(shè)計(jì)和維護(hù)工作中,不僅便于設(shè)計(jì)人員隨時(shí)查閱,更有利于數(shù)據(jù)庫(kù)的管理人員對(duì)數(shù)據(jù)庫(kù)全貌的掌握及數(shù)據(jù)變更情況的了解,為數(shù)據(jù)庫(kù)數(shù)據(jù)的準(zhǔn)確性和完整性提高保障。
5.管理數(shù)字圖書館用戶
用戶資源信息是不僅包含了用戶的身份、年齡、性別、興趣,更是用戶對(duì)圖書館利用情況的直觀體現(xiàn)。通過元數(shù)據(jù)對(duì)用戶信息資源進(jìn)行描述,建立數(shù)據(jù)模型,管理數(shù)字圖書館用戶,對(duì)用戶服務(wù),圖書館信息采集都起到一定指導(dǎo)作用。
(二)DC元數(shù)據(jù)在數(shù)字圖書館應(yīng)用中存在的問題
隨著DC元數(shù)據(jù)模式在國(guó)內(nèi)外圖書館界的應(yīng)用研究的不斷開展和深入研究,DC元數(shù)據(jù)在數(shù)字圖書館建設(shè)中取得一定成績(jī)的同時(shí)也迎來了新的挑戰(zhàn)。其中,中文元數(shù)據(jù)標(biāo)準(zhǔn)化以及元數(shù)據(jù)實(shí)施的架構(gòu)是主要問題,詳細(xì)介紹如下:
1.中文元數(shù)據(jù)標(biāo)準(zhǔn)化的問題
我國(guó)數(shù)字化圖書館建設(shè)中,大多采用的元數(shù)據(jù)體系是國(guó)際上應(yīng)用廣泛且技術(shù)成熟的元數(shù)據(jù)體系。我國(guó)實(shí)際應(yīng)用要求與國(guó)際上常用擴(kuò)展的巨大區(qū)別,出現(xiàn)了中文標(biāo)準(zhǔn)化問題。標(biāo)準(zhǔn)化工作在本地化應(yīng)用方面作用尤為突出,標(biāo)準(zhǔn)化工作的好壞直接影響到元數(shù)據(jù)在不同領(lǐng)域的推廣和使用。
2.元數(shù)據(jù)實(shí)施的架構(gòu)問題
由于應(yīng)用系統(tǒng)本身對(duì)不同元數(shù)據(jù)格式尤其是MARC復(fù)雜元數(shù)據(jù)格式的支持不足,在元數(shù)據(jù)裝載入系統(tǒng)時(shí),全部轉(zhuǎn)化為DC元數(shù)據(jù)。因不同元數(shù)據(jù)定義的非對(duì)稱性,所有元數(shù)據(jù)轉(zhuǎn)化為DC元數(shù)據(jù)過程中容易造成語(yǔ)義概念上的不恰當(dāng)伸縮,信息丟失,歧義等,同時(shí)使得為用戶提供的檢索服務(wù)功能受到一定限制。故而,所有元數(shù)據(jù)都裝入應(yīng)用系統(tǒng)是最為理想的狀態(tài),進(jìn)行多庫(kù)檢索的轉(zhuǎn)換被放置到系統(tǒng)之外,滿足了用戶檢索界面與服務(wù)的統(tǒng)一的同時(shí),使得用戶的選擇更為多樣化,數(shù)據(jù)挖掘服務(wù)的提供也更加到位。
我國(guó)數(shù)字圖書館建設(shè)過程中DC元數(shù)據(jù)的規(guī)范要從加強(qiáng)DC元數(shù)據(jù)的宣傳和普及,培養(yǎng)研究人員,加強(qiáng)國(guó)際合作,提高研發(fā)能力,加大數(shù)字圖書館標(biāo)準(zhǔn)和規(guī)范研究的力度,推進(jìn)中國(guó)數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)等幾個(gè)方面進(jìn)行。
(一)加強(qiáng)DC元數(shù)據(jù)的宣傳和普及,培養(yǎng)專業(yè)研究人員
數(shù)字圖書館是DC元數(shù)據(jù)的主要應(yīng)用領(lǐng)域,真正熟悉和了解DC元數(shù)據(jù)的專業(yè)人員十分有限,遠(yuǎn)遠(yuǎn)無法滿足數(shù)字圖書館的發(fā)展需求。專業(yè)人員不足,勢(shì)必會(huì)對(duì)數(shù)字圖書館的建設(shè)的質(zhì)量帶來不利影響。加強(qiáng)DC元數(shù)據(jù)的宣傳和普及,培養(yǎng)專業(yè)研究人員是提高我國(guó)數(shù)字圖書館建設(shè)質(zhì)量水平的前提。
(二)加強(qiáng)國(guó)際合作,提高研發(fā)能力
積極參加相關(guān)國(guó)際會(huì)議及研討會(huì),通過參與數(shù)字圖書館研究項(xiàng)目的國(guó)際合作廣泛培養(yǎng)、鍛煉人才。每一個(gè)國(guó)際會(huì)議的研討主題都是國(guó)內(nèi)同行學(xué)習(xí)提高的機(jī)會(huì),每一次國(guó)際合作都是培養(yǎng)和鍛煉人才的途徑。參與者對(duì)各國(guó)數(shù)字圖書館建設(shè)的成果取長(zhǎng)補(bǔ)短,研究出最適合的成果并應(yīng)用到數(shù)字圖書館建設(shè)中,進(jìn)而促進(jìn)我國(guó)數(shù)字圖書館的建設(shè)。另一方面,為了培養(yǎng)更多元數(shù)據(jù)研究人才,定期進(jìn)行專家講座及培訓(xùn)班。
(三)加大數(shù)字圖書館標(biāo)準(zhǔn)和規(guī)范研究的力度
我國(guó)數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范的研究應(yīng)該引入國(guó)際數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)的成果,集中國(guó)內(nèi)DC元數(shù)據(jù)研究專家的優(yōu)勢(shì),將之本地化并應(yīng)用到我國(guó)數(shù)字圖書館建設(shè)的實(shí)踐中。經(jīng)過數(shù)十年的應(yīng)用研究,我國(guó)也培養(yǎng)了一批滿足本地化實(shí)踐的DC元數(shù)據(jù)研究專家,充分發(fā)揮專家優(yōu)勢(shì),緊跟國(guó)際數(shù)字圖書館建設(shè)發(fā)展的前沿,實(shí)現(xiàn)我國(guó)數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)的全球化和國(guó)際化。另一方面,相關(guān)研究人員依據(jù)DCMI元數(shù)據(jù)術(shù)語(yǔ)的最新版本,將之應(yīng)用到我國(guó)數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范體系中,在數(shù)字圖書館建設(shè)中充分發(fā)揮指導(dǎo)作用。
(四)推進(jìn)我國(guó)數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)
推進(jìn)我國(guó)數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)要擴(kuò)展參加人員的范圍。目前,我國(guó)數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)方面中國(guó)高等教育文獻(xiàn)保障系統(tǒng)、中國(guó)國(guó)家圖書館以及中國(guó)科學(xué)院圖書館等機(jī)構(gòu)已經(jīng)制定了長(zhǎng)期合作,并取得了一定的成果,但是,DC元數(shù)據(jù)的標(biāo)準(zhǔn)研究不能固守圖書館領(lǐng)域,廣泛吸納社會(huì)各界專家的建議才能真正意義上推進(jìn)我國(guó)數(shù)字圖書館規(guī)范建設(shè)。
[1].徐長(zhǎng)林,楊玲,李艷菊.高校圖書館與大學(xué)校園文化建設(shè)探析[J].圖書館理論與實(shí)踐,2010,(3):79-81.
[2].龔永紅.DC元數(shù)據(jù)及其在數(shù)字圖書館建設(shè)中的應(yīng)用[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2010,20(31):78-79.
[3].高惠榮,孫曉玫.元數(shù)據(jù)及其在數(shù)字圖書館發(fā)展中的作用[J].圖書情報(bào)工作,2012(1):170-172.
責(zé)任編校:于吉瑞
G250.76
A
1009-8534(2017)01-0104-02
殷福興,貴州省圖書館館員,碩士。研究方向:圖書信息技術(shù)及數(shù)據(jù)庫(kù)研究。