国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電子文件管理元數(shù)據(jù)漫談

2015-05-30 10:48:04趙屹
北京檔案 2015年1期
關(guān)鍵詞:管理系統(tǒng)標(biāo)準(zhǔn)信息

趙屹

摘要:從元數(shù)據(jù)的定義、元數(shù)據(jù)的作用、元數(shù)據(jù)與電子文件和背景信息的關(guān)系、元數(shù)據(jù)在電子文件管理中的使用四個(gè)方面對(duì)電子文件管理元數(shù)據(jù)進(jìn)行研究和闡述。力求將研究性、知識(shí)性與易讀性結(jié)合,有助于檔案工作者了解元數(shù)據(jù),進(jìn)而依據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)在實(shí)際工作中進(jìn)行應(yīng)用。

關(guān)鍵字:電子文件元數(shù)據(jù)標(biāo)準(zhǔn)封裝

Abstract:This paper research and expound the four aspects of the metadata in electronic document management. The four aspects are the definition of metadata,the function of metadata,the relation? ships with electronic documents and background in? formation,the use of the metadata in electronic doc? ument management. There are the characters of re? search,knowledge and legibility in the paper and strive to help archivists understand metadata and then use metadata based on metadata standard in practical work。

Key words:Electronic documents;Metadata;Standard;Encapsulate

一、涵義:關(guān)于數(shù)據(jù)的數(shù)據(jù)

數(shù)字時(shí)代要完成對(duì)海量數(shù)字信息的管理,尤其是對(duì)網(wǎng)絡(luò)信息資源的管理,信息管理者急需解決如何對(duì)信息進(jìn)行有效組織。信息組織是采用一定的方式,將某一方面的大量的、分散的、雜亂的信息經(jīng)過整序、優(yōu)化,形成一個(gè)便于有效利用的系統(tǒng)的過程。在這個(gè)過程中,人們引入元數(shù)據(jù)概念來解決數(shù)據(jù)描述的問題。

元數(shù)據(jù)(Metadata)是關(guān)于數(shù)據(jù)的數(shù)據(jù)(data about data),用于記錄數(shù)據(jù)的產(chǎn)生、數(shù)據(jù)的定義以及數(shù)據(jù)之間關(guān)系的種種屬性,包括數(shù)據(jù)描述、數(shù)據(jù)結(jié)構(gòu)等。

鑒于元數(shù)據(jù)的定義讀起來太過抽象,有研究者形象地對(duì)元數(shù)據(jù)進(jìn)行了解釋:在契訶夫的小說《套中人》中這樣描寫一個(gè)叫瓦蓮卡的女子:“(她)年紀(jì)已經(jīng)不輕,三十歲上下,個(gè)子高挑,身材勻稱,黑黑的眉毛,紅紅的臉蛋——一句話,不是姑娘,而是果凍,她那樣活躍,吵吵嚷嚷,不停地哼著小俄羅斯的抒情歌曲,高聲大笑,動(dòng)不動(dòng)就發(fā)出一連串響亮的笑聲:哈,哈,哈!”這段話里揭示了瓦蓮卡的四類信息:年齡(三十歲上下)、身高(個(gè)子高挑)、相貌(身材勻稱,黑黑的眉毛,紅紅的臉蛋)、性格(活躍,吵吵嚷嚷,不停地哼著小曲,高聲大笑)。有了這些信息,人們就可以大致想象出瓦蓮卡是個(gè)什么樣的人。推而廣之,只要提供這四類信息,就可以推測出其他人的樣子。用于描述這些信息屬性的“年齡”、“身高”、“相貌”、“性格”就是元數(shù)據(jù),它們是用來描述具體信息(數(shù)據(jù))的數(shù)據(jù)。[1]

假設(shè)我們用計(jì)算機(jī)的數(shù)據(jù)庫管理系統(tǒng)來管理類似上述事例中的人員信息,那么需要將每個(gè)人的信息輸入數(shù)據(jù)庫。在輸入之前,我們必須先“告訴”計(jì)算機(jī),對(duì)于每一個(gè)人,我們需要采集哪些數(shù)據(jù)。我們“告訴”計(jì)算機(jī)要采集每一個(gè)人的姓名、性別、年齡、身高、相貌、性格。如圖1所示,這個(gè)“告訴”的動(dòng)作是由定義數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)的。

當(dāng)定義好數(shù)據(jù)結(jié)構(gòu)后,我們就可以在名為《人員基本情況表》的數(shù)據(jù)庫中輸入數(shù)據(jù)了。每一個(gè)人在數(shù)據(jù)庫中成為一條記錄。如圖2所示,輸入了3個(gè)人的基本情況,便成為該庫中的3條記錄。

這樣,人員基本情況就被計(jì)算機(jī)管理起來了,可以進(jìn)行檢索和統(tǒng)計(jì)等操作。例如,統(tǒng)計(jì)年齡在“三十”左右的人員,計(jì)算機(jī)就會(huì)顯示有2條結(jié)果,即“瓦蓮卡”和“武大郎”;若有大齡剩女悄悄地利用該數(shù)據(jù)庫尋找戀愛對(duì)象,她以“不打女人”為性格條件進(jìn)行檢索,那么武大郎就會(huì)成為符合條件的候選人之一。當(dāng)然,武大郎的身高、相貌也會(huì)作為檢索結(jié)果展現(xiàn)給該女士供其參考。在這個(gè)計(jì)算機(jī)管理人員信息檢索的過程中,“姓名”是元數(shù)據(jù),“瓦蓮卡”、“李白”和“武大郎”是數(shù)據(jù),“性格”是元數(shù)據(jù),“活躍”、“豪放”和“不打女人”是數(shù)據(jù)……??梢?,元數(shù)據(jù)是用于描述數(shù)據(jù)的抽象信息,數(shù)據(jù)是具體信息。所以,元數(shù)據(jù)是對(duì)數(shù)據(jù)最根本的描述,是數(shù)據(jù)的本質(zhì),也可以稱其為描述數(shù)據(jù)的數(shù)據(jù)(date that describe data)。

二、作用:電子文件管理系統(tǒng)的“血液”

元數(shù)據(jù)最早出現(xiàn)和應(yīng)用于計(jì)算機(jī)信息技術(shù)領(lǐng)域,在當(dāng)前已經(jīng)廣泛發(fā)展并應(yīng)用到眾多專業(yè)領(lǐng)域。事實(shí)上,在社會(huì)生活中,元數(shù)據(jù)無所不在。有一類事物,就可以定義一套元數(shù)據(jù)。例如,文獻(xiàn)領(lǐng)域適用于網(wǎng)絡(luò)資源與文獻(xiàn)資料的DC(Dublin Core,都柏林核心元數(shù)據(jù)),電子政務(wù)領(lǐng)域適用于政府信息的GILS(Government Information Locator Service,政府信息定位服務(wù)),檔案領(lǐng)域適用于檔案與手稿的EAD(Encoded Archival Description,置標(biāo)檔案描述)等都是各專業(yè)領(lǐng)域?yàn)槊枋霰绢I(lǐng)域的對(duì)象而制定的元數(shù)據(jù)體系。其中EAD是用于描述檔案與手稿的形式與內(nèi)容的規(guī)范,以便它們作為網(wǎng)絡(luò)信息可以在任何計(jì)算機(jī)平臺(tái)上進(jìn)行檢索、顯示與交換。

在電子文件管理中,有必要引入元數(shù)據(jù)概念來描述電子文件的定義、屬性、結(jié)構(gòu)、關(guān)系等數(shù)據(jù)屬性,揭示電子文件的形成、內(nèi)容、排版、格式及系統(tǒng)環(huán)境等,以便有效地記錄電子文件的內(nèi)容、背景和結(jié)構(gòu),方便對(duì)電子文件的標(biāo)識(shí)、鑒別、描述、管理和長久利用。

元數(shù)據(jù)在電子文件管理中的作用可以概括為以下五個(gè)方面:一是全面描述電子文件;二是保障電子文件的真實(shí)性。電子文件在整個(gè)生命周期內(nèi),是在網(wǎng)絡(luò)環(huán)境中動(dòng)態(tài)流動(dòng)的。元數(shù)據(jù)用于記錄電子文件生命周期中所有重要的變遷,所經(jīng)歷的任務(wù)、部門、人員、操作等,依據(jù)這些記錄可以再現(xiàn)電子文件流程;三是維護(hù)電子文件的完整性。電子文件的有些結(jié)構(gòu)、背景與其內(nèi)容相對(duì)獨(dú)立,元數(shù)據(jù)以規(guī)范格式來描述電子文件的內(nèi)容、結(jié)構(gòu)以及背景,建立三者間的有機(jī)聯(lián)系;四是有助于電子文件的長期可讀。元數(shù)據(jù)可以對(duì)計(jì)算機(jī)系統(tǒng)進(jìn)行說明;五是提高電子文件的可理解性。元數(shù)據(jù)集有助于利用者了解電子文件的內(nèi)容、創(chuàng)建原因、流轉(zhuǎn)過程、利用條件、內(nèi)在關(guān)系與外在聯(lián)系等。

目前,國際文件與檔案管理領(lǐng)域已達(dá)成共識(shí),元數(shù)據(jù)是實(shí)現(xiàn)對(duì)電子文件進(jìn)行科學(xué)、有效、動(dòng)態(tài)、集成管理的關(guān)鍵與基礎(chǔ),并被國外學(xué)者喻為是電子文件管理系統(tǒng)中的“血液(Blood)”。[3]

三、關(guān)系:與電子文件、背景信息密不可分

在當(dāng)前的電子文件研究和管理中,對(duì)于元數(shù)據(jù)的概念、作用、使用還有一些模糊和誤解存在。如有研究者將電子文件管理中的元數(shù)據(jù)定義為“由電子文件系統(tǒng)自動(dòng)記錄的關(guān)于文件形成時(shí)間、地點(diǎn)、人員、活動(dòng)、文件系統(tǒng)、結(jié)構(gòu)等方面的具體數(shù)據(jù)?!惫P者認(rèn)為,該定義存在較大偏差。首先,該定義的屬概念是完全錯(cuò)誤的。元數(shù)據(jù)是抽象數(shù)據(jù),而非具體數(shù)據(jù),它是對(duì)具體數(shù)據(jù)的抽象,所以才是數(shù)據(jù)的數(shù)據(jù);二是元數(shù)據(jù)不是電子文件管理系統(tǒng)自動(dòng)記錄的,而是人為定義的。元數(shù)據(jù)是預(yù)先制定的標(biāo)準(zhǔn)、方案、體系或規(guī)則。電子文件管理系統(tǒng)自動(dòng)記錄的是數(shù)據(jù)。例如,一份電子文件是由“瓦蓮卡”創(chuàng)建的,由“李白”修改的,由“武大郎”簽發(fā)的。那么電子文件管理系統(tǒng)記錄下的“瓦蓮卡”、“李白”和“武大郎”是數(shù)據(jù),而“創(chuàng)建者”、“修改者”、“簽發(fā)者”才是元數(shù)據(jù)。元數(shù)據(jù)是預(yù)先制定好的方案,電子文件管理系統(tǒng)在開發(fā)時(shí),依據(jù)預(yù)先制訂好的元數(shù)據(jù)方案去記錄相應(yīng)的數(shù)據(jù)。假如在預(yù)先制定的方案中只有“創(chuàng)建者”和“簽發(fā)者”而沒有“修改者”,那么即使一份電子文件是由“瓦蓮卡”創(chuàng)建、“李白”修改、“武大郎”簽發(fā)的,但電子文件管理系統(tǒng)只會(huì)記錄下“瓦蓮卡”和“武大郎”,而不會(huì)去記錄“李白”。因?yàn)槔畎资恰靶薷恼摺保獢?shù)據(jù)體系沒有要求記錄修改者,依據(jù)該元數(shù)據(jù)體系開發(fā)的電子文件管理系統(tǒng),就不會(huì)捕獲并記錄修改者的信息。

還有研究者提出,在電子文件管理過程中要捕獲元數(shù)據(jù)。同理,元數(shù)據(jù)是預(yù)先制定的標(biāo)準(zhǔn)、方案、體系或規(guī)則,在電子文件管理過程中,是根據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)去“捕獲”、“自動(dòng)記錄”數(shù)據(jù)而不是捕獲元數(shù)據(jù)。那些被“捕獲”和“自動(dòng)記錄”的數(shù)據(jù)多數(shù)是背景信息數(shù)據(jù)。

對(duì)于電子文件、元數(shù)據(jù)、背景信息三者的關(guān)系,筆者認(rèn)為,可以用一句著名的詩句來形容,如圖3所示,[4]那就是“舉杯邀明月,對(duì)影成三人”。

圖中的李白暗應(yīng)電子文件。電子文件若想永久保存,必須引入相應(yīng)的記錄機(jī)制,即把元數(shù)據(jù)“邀”到電子文件管理中。為此,需要制定電子文件管理的元數(shù)據(jù)標(biāo)準(zhǔn)。元數(shù)據(jù)標(biāo)準(zhǔn)就恍如圖3中的月亮一樣掛在那里。而背景信息是描述電子文件形成與維護(hù)背景的具體信息,它如同電子文件的影子一般與其形影不離,成為電子文件的重要組成部分。背景信息一般包括電子文件的發(fā)送信息、辦理信息、歸檔信息、技術(shù)信息等(當(dāng)然,人離了影子照樣是完整的,電子文件離了背景信息就不完整了。因此這個(gè)比喻稍有偏差,只是用于幫助加強(qiáng)理解)。在圖中,月亮決定了影子的方向和長短,類似地,元數(shù)據(jù)標(biāo)準(zhǔn)決定電子文件背景信息的內(nèi)容和數(shù)量,即電子文件管理中需要捕獲和記錄哪些信息,才能確保電子文件的真實(shí)性、可靠性、完整性與可用性。電子文件管理系統(tǒng)必須依據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)捕獲和記錄詳細(xì)的背景信息,這種捕獲和記錄有自動(dòng)生成、自動(dòng)捕獲、手工錄入等不同方式。

四、使用:標(biāo)準(zhǔn)制定、系統(tǒng)引用、管理維護(hù)

在電子文件管理中引入和使用元數(shù)據(jù),必須制定相應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn)。世界各國對(duì)此都很重視,紛紛研究與制定各自國家的電子文件管理元數(shù)據(jù)標(biāo)準(zhǔn)。澳大利亞1999年發(fā)布世界上第一個(gè)專門解決文件長期管理問題的國家級(jí)元數(shù)據(jù)標(biāo)準(zhǔn)《聯(lián)邦政府機(jī)關(guān)文件保管元數(shù)據(jù)標(biāo)準(zhǔn)》并于2008年進(jìn)行了修訂,英國公共文件局2002年發(fā)布《電子文件管理系統(tǒng)需求——元數(shù)據(jù)標(biāo)準(zhǔn)》,加拿大國家圖書與檔案館2006年發(fā)布《文件管理元數(shù)據(jù)標(biāo)準(zhǔn)》等。[5]此外,還有前文提到的EAD,國際檔案理事會(huì)于1993年制訂、2000修訂的《國際檔案著錄標(biāo)準(zhǔn)(總則)》,國際標(biāo)準(zhǔn)化組織2006年頒布的《信息與文獻(xiàn)—文件管理流程—文件元數(shù)據(jù)—原則》和《信息與文獻(xiàn)—文件管理流程—文件元數(shù)據(jù)—概念及實(shí)施》等。我國已經(jīng)發(fā)布行業(yè)標(biāo)準(zhǔn)《文書類電子文件元數(shù)據(jù)方案》和《核電電子文件元數(shù)據(jù)標(biāo)準(zhǔn)》,以方便行業(yè)對(duì)電子文件的理解、管理、交換和利用。目前國家行業(yè)標(biāo)準(zhǔn)《電子文件元數(shù)據(jù)標(biāo)準(zhǔn)》進(jìn)入公示和征求意見階段。另外,我國有許多研究項(xiàng)目也在研究更具體的專業(yè)領(lǐng)域的元數(shù)據(jù)方案。例如,筆者主持的2010年7月結(jié)項(xiàng)的國家哲學(xué)和社會(huì)科學(xué)基金檔案學(xué)項(xiàng)目“電子政務(wù)環(huán)境下電子公文流程分析與設(shè)計(jì)”對(duì)電子公文的元數(shù)據(jù)進(jìn)行了分析和設(shè)計(jì),設(shè)計(jì)了98個(gè)基本元素并對(duì)這些元素從序號(hào)、元素名稱、來源、數(shù)據(jù)說明、數(shù)據(jù)類型、性質(zhì)、數(shù)據(jù)捕獲時(shí)機(jī)、數(shù)據(jù)捕獲方法、對(duì)應(yīng)關(guān)系九個(gè)方面進(jìn)行了描述。

電子文件管理中元數(shù)據(jù)的使用一般通過電子文件管理系統(tǒng)實(shí)現(xiàn)。電子文件管理系統(tǒng)引用元數(shù)據(jù),一般是在系統(tǒng)的設(shè)計(jì)階段將元數(shù)據(jù)標(biāo)準(zhǔn)預(yù)設(shè)在電子文件管理系統(tǒng)中,而后元數(shù)據(jù)標(biāo)準(zhǔn)自始至終伴隨每一份電子文件的整個(gè)生命周期。在電子文件的全程管理過程中,電子文件管理系統(tǒng)依據(jù)預(yù)設(shè)的元數(shù)據(jù)標(biāo)準(zhǔn)全面地、持續(xù)地實(shí)現(xiàn)對(duì)電子文件各種相關(guān)數(shù)據(jù)信息即背景信息的捕獲。電子文件管理系統(tǒng)的實(shí)際操作要求元數(shù)據(jù)標(biāo)準(zhǔn)必須堅(jiān)持可行性的設(shè)計(jì)原則,力求做到易于理解、易于使用、有效地控制元數(shù)據(jù)的數(shù)量,從而使元數(shù)據(jù)的設(shè)計(jì)具有實(shí)用價(jià)值。元數(shù)據(jù)的數(shù)量過多,會(huì)加大電子文件處理的工作量,占用更多的存儲(chǔ)空間,導(dǎo)致更復(fù)雜的管理。所以,元數(shù)據(jù)的設(shè)計(jì)只要能夠滿足揭示電子文件的主要特征,記錄電子文件的主要流程,滿足電子文件管理需要即可。

元數(shù)據(jù)的使用還需要管理維護(hù)。在電子文件管理中使用元數(shù)據(jù),對(duì)元數(shù)據(jù)的管理維護(hù)包括兩個(gè)方面:一是元數(shù)據(jù)的實(shí)現(xiàn),二是元數(shù)據(jù)的封裝。

元數(shù)據(jù)是最基本的理論模型,在電子文件管理系統(tǒng)引用時(shí)還需要具體加以實(shí)現(xiàn)。實(shí)現(xiàn)是指用一種計(jì)算機(jī)可以識(shí)別的形式表示元數(shù)據(jù),以便計(jì)算機(jī)程序能夠?qū)υ獢?shù)據(jù)進(jìn)行處理。目前元數(shù)據(jù)一般都以XML(Extensible Markup Language,可擴(kuò)展標(biāo)記語言)作為編碼標(biāo)準(zhǔn),以XML Schema的方式實(shí)現(xiàn),可以說XML Schema就是元數(shù)據(jù)。用XML描述元數(shù)據(jù)有以下四個(gè)方面的優(yōu)點(diǎn):一是具有等級(jí)結(jié)構(gòu),層次清晰,既可以很好地表達(dá)電子文件的物理結(jié)構(gòu),還能充分表達(dá)電子文件的內(nèi)容及其邏輯結(jié)構(gòu);二是可以克服傳統(tǒng)著錄中字段的長度限制,詳細(xì)標(biāo)識(shí)各個(gè)元素內(nèi)容;三是計(jì)算機(jī)可以通過識(shí)別XML標(biāo)簽理解元素的意義,從而將元素作為檢索途徑;四是電子文件數(shù)據(jù)可以不經(jīng)轉(zhuǎn)化直接在互聯(lián)網(wǎng)絡(luò)上發(fā)布,實(shí)現(xiàn)資源共享。

封裝是將元數(shù)據(jù)與電子文件相關(guān)聯(lián)的重要步驟。封裝將元數(shù)據(jù)與電子文件綁定成一個(gè)完整對(duì)象,即形成一個(gè)整體封裝包來進(jìn)行保存和保護(hù)。這樣的封裝包是一個(gè)由電子文件及其元數(shù)據(jù)組成的自我包含、自我描述和自我證明的實(shí)體。元數(shù)據(jù)與電子文件的關(guān)聯(lián)至關(guān)重要。失去二者間的關(guān)聯(lián),元數(shù)據(jù)將變得毫無意義,而電子文件的價(jià)值也將大打折扣。封裝便于對(duì)電子文件及其元數(shù)據(jù)同時(shí)進(jìn)行管理。封裝是一種先進(jìn)的電子文件保管理念,是確保電子文件長久保存和具有憑證價(jià)值的核心方法之一。2009年,我國頒布《基于XML的電子文件封裝規(guī)范》用于規(guī)范電子文件的封裝。它規(guī)定了基于XML的電子文件封裝格式和要求,為電子文件提供統(tǒng)一的封裝格式,保證電子文件及其元數(shù)據(jù)的完整合一性,以利于電子文件長期的保存和交換。

注釋及參考文獻(xiàn):

[1]阮一峰.元數(shù)據(jù)[EB/OL].[2013-06-07].http:// www.ruanyifeng.com/blog/2007/03/metadata.html.

[2]佚名.最具特色的武大郎個(gè)人簡歷[EB/OL].[2013- 06-07].http://www.kaixin001.com/repaste/50395290_ 711409321.html.

[3]徐維.元數(shù)據(jù):電子文件管理的關(guān)鍵所在[J].山西檔案.2000(4):11-14.

[4]佚名.李白畫像[EB/OL].[2014-12-30].http:// cul.jschina.com.cn/system/2012/08/18/014199383.shtml.

[5]劉越男,梁凱,顧偉.電子文件管理系統(tǒng)實(shí)施過程中元數(shù)據(jù)方案的設(shè)計(jì)[J].檔案學(xué)研究,2012(2):56-64.

猜你喜歡
管理系統(tǒng)標(biāo)準(zhǔn)信息
2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
基于James的院內(nèi)郵件管理系統(tǒng)的實(shí)現(xiàn)
忠誠的標(biāo)準(zhǔn)
美還是丑?
基于LED聯(lián)動(dòng)顯示的違停管理系統(tǒng)
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
海盾壓載水管理系統(tǒng)
中國船檢(2017年3期)2017-05-18 11:33:08
一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
展會(huì)信息
基于RFID的倉儲(chǔ)管理系統(tǒng)實(shí)現(xiàn)
盐山县| 太仆寺旗| 宁明县| 盐源县| 江津市| 明星| 淳安县| 英吉沙县| 云浮市| 边坝县| 牙克石市| 方山县| 通河县| 茌平县| 柳江县| 成安县| 响水县| 繁峙县| 丹东市| 山东| 雷州市| 泰宁县| 玉环县| SHOW| 天等县| 陈巴尔虎旗| 辽宁省| 贺兰县| 贵州省| 大连市| 泸州市| 阿图什市| 南京市| 贞丰县| 永定县| 丹江口市| 噶尔县| 凤翔县| 丽江市| 双峰县| 高密市|