摘要:網(wǎng)絡信息時代,網(wǎng)絡信息數(shù)量膨脹與質(zhì)量良莠不齊之間的矛盾日益凸顯,歸檔網(wǎng)絡信息價值判斷標準開始被當作解決此矛盾的有效途徑加以研究,而如何充分利用元數(shù)據(jù)對網(wǎng)絡信息進行精準描述可以有效解決此矛盾。本文指出了對歸檔網(wǎng)絡信息價值判斷工作面臨的挑戰(zhàn),介紹元數(shù)據(jù)的基本情況,分析元數(shù)據(jù)在歸檔網(wǎng)絡信息價值判斷的應用,最后,初步提出了歸檔網(wǎng)絡信息價值判斷的元數(shù)據(jù)描述的結(jié)論與展望,以供參考。
關鍵詞:元數(shù)據(jù);網(wǎng)絡信息;價值判斷
中圖分類號:G202 文獻識別碼:A 文章編號:1001-828X(2016)018-000-02
一、歸檔網(wǎng)絡信息價值判斷工作面臨的挑戰(zhàn)
(一)網(wǎng)絡信息資源自身特點帶來的挑戰(zhàn)
與傳統(tǒng)文獻相比,網(wǎng)絡信息資源本身具備獨特性,例如:網(wǎng)絡信息資源數(shù)量日漸龐大、質(zhì)量良莠不齊;更新速度愈來愈快;網(wǎng)絡信息資源壽命日漸縮短;網(wǎng)絡信息內(nèi)容廣泛,網(wǎng)絡信息發(fā)布與傳播隨意性大等。因此,歸檔網(wǎng)絡信息價值判斷工作面臨更大的困難。
(二)數(shù)字信息環(huán)境改變給歸檔網(wǎng)絡信息價值判斷帶來挑戰(zhàn)
隨著現(xiàn)代數(shù)字化信息技術的不斷革新,給歸檔網(wǎng)絡信息價值判斷帶來了新的挑戰(zhàn):
1.歸檔網(wǎng)絡信息價值必須借助于特定的信息設備或技術才能被有效讀取與判斷,其判斷歸檔網(wǎng)絡信息價值的技術方法也日趨復雜多變,這意味著歸檔網(wǎng)絡信息價值判斷的技術難度不可避免地提高。
2.多種多樣的歸檔網(wǎng)絡信息價值判斷標準存在,卻一直未有一個統(tǒng)一的標準供歸檔網(wǎng)絡信息價值判斷使用,也給歸檔網(wǎng)絡信息價值判斷工作增加了難度。
二、元數(shù)據(jù)的基本情況介紹
(一)元數(shù)據(jù)的定義理解
當前,人們對元數(shù)據(jù)的定義理解存在明顯差異,也一直沒有一個明確的關于元數(shù)據(jù)統(tǒng)一標準的定義。
元數(shù)據(jù)最普及接受的概念是元數(shù)據(jù)屬于“數(shù)據(jù)的數(shù)據(jù)”,是反映數(shù)據(jù)地址及其關系的數(shù)據(jù)信息的集合。元數(shù)據(jù)出現(xiàn)在生活中的任何地方,被廣泛應用到社會各個行業(yè)和領域。每一大類對象和事物,都能夠被定義為一套元數(shù)據(jù)①。
(二)元數(shù)據(jù)的特點和作用
元數(shù)據(jù)作為一個重要概念,在數(shù)據(jù)信息管理專業(yè)領域尤其重要。元數(shù)據(jù)的格式標準比較統(tǒng)一、描述方式比較規(guī)范,并且它并不是歸類為平臺概念,它反而是通過確定一個元數(shù)據(jù)模型結(jié)構(gòu),以最標準化的數(shù)據(jù)元素來表達最通用的數(shù)據(jù)信息。元數(shù)據(jù)的在管理信息系統(tǒng)專業(yè)領域有著不可替代的重要功能,元數(shù)據(jù)被更為廣泛地應用,它具有2個特點:
1.元數(shù)據(jù)獨立性較強,獨立于與任何平臺,元數(shù)據(jù)本身不受使用任何技術平臺任何影響,這便保證了元數(shù)據(jù)的通用性,能幫助其自身效能隨時隨處得以正常發(fā)揮。
2.元數(shù)據(jù)是生成其它數(shù)據(jù)模型的基礎②。元數(shù)據(jù)的最基本功能是可以有效借用相應的代碼生成器和相關的重要工具生成其它的數(shù)據(jù)代碼或模型信息元數(shù)據(jù),這種數(shù)據(jù)代碼可以直接使用。元數(shù)據(jù)能夠有效描述信息資源,也有利于全面管理網(wǎng)絡信息資源的每一個工作環(huán)節(jié),在網(wǎng)絡信息資源組織方面的作用也十分顯著。
(三)元數(shù)據(jù)應用與格式
各個行業(yè)領域都有各自明顯的特征,近些年來,隨著現(xiàn)代信息技術的快速革新,根據(jù)各行業(yè)自有的應用需求和數(shù)據(jù)特點,不同的元數(shù)據(jù)格式在不同行業(yè)有明顯差異。例如:
網(wǎng)絡資源:Dublin Core(都柏林核心元數(shù)據(jù))、Web Collections網(wǎng)站集合)、CDFCDF(頻道定義格式)。
文獻資料:Dublin Core、MARC(機讀目錄格式)。
人文科學:TEI Header(文本編碼先導計劃)。
社會科學數(shù)據(jù)集:ICPSR SGML Code Book(政治和社會研究方面的校際聯(lián)盟)。
博物館與藝術作品:CDWA(藝術作品描述目錄)
三、元數(shù)據(jù)描述在歸檔網(wǎng)絡信息價值判斷中的應用
(一)元數(shù)據(jù)描述對于歸檔網(wǎng)絡信息價值判斷的意義
基于歸檔網(wǎng)絡信息價值判斷的元數(shù)據(jù)描述,是指通過對每個歸檔網(wǎng)絡信息價值的影響因素進行詳細分析來判斷網(wǎng)絡信息是否是具有一定價值,然后利用元數(shù)據(jù)描述這種有效手段判斷歸檔網(wǎng)絡信息價值的標準并只對符合標準的有價值的網(wǎng)絡信息進行保存,最終獲得歸檔網(wǎng)絡價值最優(yōu)化。
第一,為歸檔網(wǎng)絡信息保存提供了理論依據(jù)。網(wǎng)絡信息資源的全面歸檔有利于促進社會和諧發(fā)展,但由于網(wǎng)絡信息規(guī)模的日益膨脹,網(wǎng)絡信息要實現(xiàn)全面歸檔幾乎已成空想;而網(wǎng)絡信息質(zhì)量的參差不齊導致了全面歸檔的不確定性與歸檔網(wǎng)絡信息的組織與利用的有效性之間的矛盾。歸檔保存研究對網(wǎng)絡信息的篩選一直未收到國內(nèi)外網(wǎng)絡信息的保存研究的足夠重視,并且歸檔機構(gòu)采取的歸檔網(wǎng)絡信息價值判斷標準的差異較大,對歸檔網(wǎng)絡信息價值判斷工作不利。面對網(wǎng)絡信息的快速更新與數(shù)量規(guī)模膨脹的困境,明確統(tǒng)一的元數(shù)據(jù)標準將是有效提高歸檔網(wǎng)絡信息價值判斷工作效率的有效措施。
第二,有助于構(gòu)建科學系統(tǒng)的歸檔保存體系,節(jié)約經(jīng)濟成本。目前,網(wǎng)絡信息數(shù)量日益膨脹,但網(wǎng)絡信息的質(zhì)量卻參差不齊。在龐大數(shù)量的網(wǎng)絡信息里,存在數(shù)量不小的虛假和垃圾信息,如果不對這些垃圾信息進行有效判斷與篩選,高質(zhì)量的網(wǎng)絡信息的利用率將會大打折扣,導致大量有價值的網(wǎng)絡信息資源的浪費。元數(shù)據(jù)描述使歸檔網(wǎng)絡信息價值的有效判斷成為可能。
(二)元數(shù)據(jù)描述研究述評
1.國外研究現(xiàn)狀
國外在研究元數(shù)據(jù)方面起步較早,理論與實踐研究都比較豐富,研究已達到一定水平??傮w研究現(xiàn)狀大致如下:
第一,元數(shù)據(jù)研究起源。管理元數(shù)據(jù)是最早的起源。國外于20世紀末開始研究網(wǎng)絡信息管理元數(shù)據(jù),當時研究者意識到管理元數(shù)據(jù)的研究能幫助提高信息系統(tǒng)在管理層面上的開放性和操作性,最大限度促進信息資源的共享。
第二,元數(shù)據(jù)定義與范疇。國外在研究元數(shù)據(jù)定義方面也比國內(nèi)早。例如,1998年,美國Getty 信息研究所在一本關于元數(shù)據(jù)的研究專著中,Anne J. Gilliland-Swetland提出了較早的定義,即元數(shù)據(jù)是在管理信息資源中利用的元數(shù)據(jù)。
第三,具有代表性的元數(shù)據(jù)方案。國外具有很多比較有代表性的管理性元數(shù)據(jù)方案。由于國外一些研究機構(gòu)在制定元數(shù)據(jù)方案時,缺乏統(tǒng)一協(xié)調(diào),導致國外現(xiàn)存的管理性元數(shù)據(jù)種類變得比較復雜且分散性明顯。根據(jù)元數(shù)據(jù)描述對象的不同,可概括為描述資源或資源集合的管理性元數(shù)據(jù)、描述業(yè)務流程的管理性元數(shù)據(jù)和三類是描述系統(tǒng)功能的元數(shù)據(jù)以下三類。
2.國內(nèi)研究現(xiàn)狀
筆者從“中國期刊全文數(shù)據(jù)庫”、“中國博士學位論文書數(shù)據(jù)庫”、“中國優(yōu)秀碩士學位論文數(shù)據(jù)庫”中,以“網(wǎng)絡信息價值、“網(wǎng)絡信息”、“網(wǎng)絡信息價值+元數(shù)據(jù)”、“網(wǎng)絡信息+元數(shù)據(jù)” 等為檢索詞,根據(jù)題名、關鍵詞、摘要等字段進行檢索。
我們對該領域已有的研究成果進行比較分析發(fā)現(xiàn),諸多相關元數(shù)據(jù)研究成果及其工作大多都是基于元數(shù)據(jù)的創(chuàng)建者的手動方式角度的研究,主要考慮創(chuàng)建工具的有效性與便利性??傊?,從國內(nèi)相關文獻調(diào)研的結(jié)果中我們發(fā)現(xiàn),關于網(wǎng)絡信息價值的研究僅有2篇,且發(fā)表時間都在2011年后;其次,國內(nèi)對網(wǎng)絡信息價值的相關研究內(nèi)容也比較狹窄,例如,李宗偉也只是基于BP神經(jīng)網(wǎng)絡競爭對手的角度來研究網(wǎng)絡信息價值。綜上所述,國內(nèi)外學界對于網(wǎng)絡信息價值的研究均存在薄弱環(huán)節(jié),即未達成與網(wǎng)絡信息價值的構(gòu)成要素的統(tǒng)一共識,也始終未制定一個將價值與元數(shù)據(jù)有效結(jié)合的方案。
(三)結(jié)論與展望
本文對元數(shù)據(jù)的定義、作用及特點進行了簡單明了的分析,當然,在研究深度上還有待加強,研究面也不夠廣。但本文對元數(shù)據(jù)的功能明確了科學認知,即元數(shù)據(jù)功能十分強大并且應用非常廣,被廣泛能作用于所有行業(yè)。因此,元數(shù)據(jù)相關研究未來的重點發(fā)展方向是加快研究元數(shù)據(jù)的步伐、拓展研究深度,尤其建議信息資源開發(fā)的團隊,要重點提高對元數(shù)據(jù)的認知。關于歸檔網(wǎng)絡信息價值元數(shù)據(jù)描述研究還有許多可以進步的地方,例如如何構(gòu)建網(wǎng)絡信息歸檔保存領域的價值“本體,如何”將“本體”和元數(shù)據(jù)有機結(jié)合起來;如何選擇合適的歸檔保存機構(gòu)實施項目;如何重點對歸檔網(wǎng)絡信息價值進行動態(tài)描述等。對這些后續(xù)問題的深入研究之路還很漫長,需要加大研究力度,才能真正實現(xiàn)歸檔網(wǎng)絡信息價值判斷與保存的長遠意義。
注釋:
①赫亞玲.DC元數(shù)據(jù)與網(wǎng)絡信息資源的描述[J].情報科學,2002,20(10)。
②高沛鑫.論元數(shù)據(jù)及其作用[J].軟件,2014,35(3):201-202。
參考文獻:
[1]赫亞玲.DC元數(shù)據(jù)與網(wǎng)絡信息資源的描述[J].情報科學,2002,20(10).
[2]劉志.PREMIS保存元數(shù)據(jù)與數(shù)字資源長期保存研究[D].湘潭大學,2009.
[3]于文斌.網(wǎng)絡環(huán)境下檔案著錄標準分析—以檔案編碼著錄標準(EAD)為例[D].山東大學,2009.
[4]高沛鑫.論元數(shù)據(jù)及其作用[J].軟件,2014,35(3):201-202.
作者簡介:向禮花(1985-),女,湖南湘潭人,碩士,貴州師范學院助教,研究方向:檔案現(xiàn)代信息化。
現(xiàn)代經(jīng)濟信息2016年18期