国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分布式檔案數(shù)據(jù)庫系統(tǒng)的建立及其對檔案編研的影響

2014-11-11 18:10鄭慧覃筱媚
北京檔案 2014年10期
關(guān)鍵詞:數(shù)據(jù)庫系統(tǒng)編研檔案館

鄭慧+覃筱媚

摘要:21世紀(jì)初,網(wǎng)絡(luò)環(huán)境下的檔案編研就成為人們關(guān)注的熱點(diǎn)問題之一。然而,人們對將分布式檔案數(shù)據(jù)庫系統(tǒng)應(yīng)用于檔案編研缺乏足夠的關(guān)注。分布式檔案數(shù)據(jù)庫系統(tǒng)通過分別設(shè)置受眾模塊、檔案原文數(shù)據(jù)庫模塊、專家模塊、編研模塊,對檔案編研工作環(huán)節(jié)、檔案編研成果傳播、檔案編研成果開放范圍均產(chǎn)生一定積極影響,將對未來的檔案編研工作起到重要作用。

關(guān)鍵詞:分布式檔案數(shù)據(jù)庫系統(tǒng)檔案數(shù)據(jù)庫檔案編研

The Influence of BuildingDistributed Archival Database System on Archival Compilation

Abstract: At the beginning of twenty- firstCentury,archival compilation under the network be? came one of the hot issues.How? ever, people paid little attention on the distributed archival data? base system applying on the ar? chive compilation. By setting the audience module, archival original databasemodule,theexperts module, editing module, the dis? tributed archival database system can have a positive impact on the archival compilation work, archival compilation products dissemina? tion and the open range and it will play an important role on the fu? ture of the archival compilation.

Keywords: distributed archi? val database system; archival data? base; archival compilation

如果以2001年張文娟在《蘭臺內(nèi)外》發(fā)表的論文《網(wǎng)絡(luò)環(huán)境下檔案編研工作面臨的機(jī)遇與對策》作為我國研究網(wǎng)絡(luò)環(huán)境下的檔案編研的起點(diǎn),至今這個問題的研究已經(jīng)持續(xù)了14年,相關(guān)論著已逾百篇(部),取得了不少有價值的成果。但是,人們對將分布式檔案數(shù)據(jù)庫系統(tǒng)用于檔案編研的關(guān)注不夠,在一定程度上忽視了網(wǎng)絡(luò)環(huán)境下分布式檔案數(shù)據(jù)庫系統(tǒng)對檔案編研帶來的積極影響。本文將從建立分布式檔案數(shù)據(jù)庫系統(tǒng)入手,進(jìn)而分析分布式檔案數(shù)據(jù)庫系統(tǒng)對檔案編研帶來的影響。

一、建立分布式檔案數(shù)據(jù)庫系統(tǒng)

迅猛發(fā)展的信息高速公路給檔案編研帶來了諸多挑戰(zhàn)和機(jī)遇,如何充分而快速地集合各方資源,縮短檔案編研周期,提高編研成果質(zhì)量,擴(kuò)大編研成果傳播的范圍,是大多數(shù)檔案編研工作者關(guān)注的普遍問題。分布式檔案數(shù)據(jù)庫系統(tǒng)為編研提供了資源存儲的倉庫——數(shù)據(jù)庫、成果生產(chǎn)的平臺——系統(tǒng)、成果共享的渠道——網(wǎng)絡(luò),有利于幫助檔案編研工作更好地適應(yīng)和利用網(wǎng)絡(luò)環(huán)境。

(一)分布式檔案數(shù)據(jù)庫系統(tǒng)

1.分布式檔案數(shù)據(jù)庫系統(tǒng)的概念。分布式檔案數(shù)據(jù)庫系統(tǒng)是由分布式數(shù)據(jù)庫系統(tǒng)發(fā)展而來的。分布式數(shù)據(jù)庫系統(tǒng)是由分布于多個計(jì)算機(jī)節(jié)點(diǎn)上的若干個數(shù)據(jù)庫組成,每個子數(shù)據(jù)庫系統(tǒng)各自獨(dú)立,都擁有各自的數(shù)據(jù)庫、中央處理機(jī)、終端以及局部數(shù)據(jù)庫管理系統(tǒng)。分布式數(shù)據(jù)庫在使用上可視為一個完整的數(shù)據(jù)庫,而實(shí)際上它是分布在地理分散的各個節(jié)點(diǎn)之上的。[1]分布式檔案數(shù)據(jù)庫系統(tǒng)就是以檔案館(室)檔案數(shù)字化成果為基礎(chǔ)建立數(shù)據(jù)庫,并將其作為分布式檔案數(shù)據(jù)庫系統(tǒng)中的子數(shù)據(jù)庫,通過計(jì)算機(jī)網(wǎng)絡(luò)將各子數(shù)據(jù)庫在邏輯上連接形成龐大的數(shù)據(jù)庫。不僅如此,各檔案館(室)的人力資源也通過計(jì)算機(jī)網(wǎng)絡(luò)互相連接,促進(jìn)“死”的檔案資源與“活”的人力資源的有機(jī)結(jié)合。

2.分布式檔案數(shù)據(jù)庫系統(tǒng)的可行性。(1)物理分布與邏輯結(jié)合相統(tǒng)一。分散的檔案館(室)就像是分布在不同地理上的節(jié)點(diǎn),網(wǎng)絡(luò)在虛擬形態(tài)上將其連接并構(gòu)成邏輯上的一個整體,從而構(gòu)成分布式檔案數(shù)據(jù)庫系統(tǒng)最基本的幾個點(diǎn),在物理上分散,在邏輯上屬于一個整體。(2)檔案數(shù)字化與電子檔案資源的積累為建立子數(shù)據(jù)庫奠定了基礎(chǔ)。分布式檔案數(shù)據(jù)庫系統(tǒng)最重要的部分是子數(shù)據(jù)庫內(nèi)的數(shù)據(jù),這些數(shù)據(jù)由檔案數(shù)字化成果以及正在不斷接收的電子檔案組成。全國各省市各級各類檔案館(室)多年來在檔案數(shù)字化方面取得的成果是最重要的組成部分。南寧市檔案局2011年采集了4500分鐘的《南寧新聞》電視數(shù)據(jù),完成大概51萬張A4幅面檔案掃描圖像[2];2012年上半年共加工完成88916件實(shí)體檔案611550頁(A4)成品圖像[3];2013年完成館藏紙質(zhì)檔案掃描加工60萬頁,完成民國檔案33607頁掃描數(shù)據(jù)的檢查驗(yàn)收[4]。檔案館(室)的檔案數(shù)字化已成為一種必然的同時,檔案館(室)生成和接收的電子檔案數(shù)量也在逐年增加。正是這些源源不斷的檔案資源每天為分布式檔案數(shù)據(jù)庫系統(tǒng)的子數(shù)據(jù)庫注入新的內(nèi)容,并使子數(shù)據(jù)庫日益豐滿。(3)自主管理,特色經(jīng)營。每個檔案館(室)管理著自己的檔案資源,通過構(gòu)建有自己鮮明特色的子檔案數(shù)據(jù)庫使得數(shù)據(jù)庫系統(tǒng)中的每個“節(jié)點(diǎn)”都有別于其他“節(jié)點(diǎn)”,實(shí)現(xiàn)資源和人力的共享和互補(bǔ)。

(二)分布式檔案數(shù)據(jù)庫系統(tǒng)包含的主要模塊

分布式檔案數(shù)據(jù)庫系統(tǒng)是一個龐大的綜合體,由許多不同功能的模塊構(gòu)成,設(shè)計(jì)者可根據(jù)不同的服務(wù)目的選擇設(shè)置不同功能的模塊。對檔案編研工作而言,分布式檔案數(shù)據(jù)庫系統(tǒng)主要包括受眾模塊、檔案原文數(shù)據(jù)庫模塊、專家模塊、編研模塊四個主要模塊。

1.受眾模塊。受眾模塊的主要功能是在展示檔案編研成果的同時,為檔案編研成果利用者服務(wù)。當(dāng)前,檔案編研成果存在的一個普遍問題就是社會利用率不高,主要利用者為機(jī)關(guān)團(tuán)體、企事業(yè)單位、領(lǐng)導(dǎo)、研究人員等單位和個人,其他廣大的社會群眾對其認(rèn)識和利用的程度不高。受眾模塊通過接收受眾在閱讀檔案編研成果之后產(chǎn)生的意見、建議、需求等反饋信息,不僅可以促使檔案工作者有效地提高檔案編研成果的質(zhì)量,也能更大程度地滿足社會用戶的需求,克服了編研與需求脫節(jié)的弊端。endprint

2.檔案原文數(shù)據(jù)庫模塊。檔案原文數(shù)據(jù)庫模塊是子數(shù)據(jù)庫數(shù)據(jù)的集合,它是以各子數(shù)據(jù)庫的數(shù)字化檔案通過計(jì)算機(jī)網(wǎng)絡(luò)虛擬聯(lián)合構(gòu)建的全文數(shù)據(jù)庫。檔案數(shù)據(jù)庫分為檔案目錄數(shù)據(jù)庫、檔案內(nèi)容簡介數(shù)據(jù)庫、檔案原文數(shù)據(jù)庫三種類型。由于檔案目錄數(shù)據(jù)庫與檔案內(nèi)容簡介數(shù)據(jù)庫無法直接查找并獲取所需的檔案全文,不能滿足用戶的需求,而檔案原文數(shù)據(jù)庫是集檔案檢索與檔案全文提供于一體,適應(yīng)了用戶精準(zhǔn)和完整的信息需求。中國知網(wǎng)、萬方數(shù)據(jù)庫、超星、維普等全文數(shù)據(jù)庫的相對成熟和廣泛應(yīng)用正是全文數(shù)據(jù)庫受到用戶普遍歡迎的典型案例。

3.專家模塊。專家模塊中的專家實(shí)際上指的是檔案編研工作者,主要包含兩個部分,一是檔案館(室)的檔案編研工作者,二是檔案館(室)聘請的各行各業(yè)的杰出專家學(xué)者。檔案館(室)的工作人員每天都要對檔案數(shù)據(jù)庫進(jìn)行增容、管理、維護(hù)等工作,決定了其不可替代的地位。由于檔案館(室)接收的檔案涉及各行各業(yè),檔案館(室)工作人員不可能完全熟悉這些行業(yè)和領(lǐng)域,因此需要借助各行業(yè)、各領(lǐng)域?qū)<业牧α?,對這些專業(yè)性極強(qiáng)的檔案相關(guān)問題進(jìn)行分析、研究和解決。

4.編研模塊。編研模塊是檔案從原材料轉(zhuǎn)變?yōu)槌善返哪K。檔案編研模塊的功能不僅是為檔案編研工作進(jìn)行實(shí)時服務(wù),檔案編研工作者也可以按照專題分類進(jìn)行檔案編研前期準(zhǔn)備。目前,檔案數(shù)字化主要是紙質(zhì)檔案進(jìn)行掃描后轉(zhuǎn)化為數(shù)字化信息,成果主要為圖片格式,不便于對檔案原文數(shù)據(jù)庫進(jìn)行全文檢索。因此,檔案編研前期準(zhǔn)備必須利用文字識別等技術(shù)對圖片格式的檔案進(jìn)行可編輯轉(zhuǎn)化,對不能識別的圖片應(yīng)手動轉(zhuǎn)錄。

傳統(tǒng)的檔案編研成果存在表達(dá)方式以文字為主,敘述方式直白簡單的現(xiàn)象。信息高速公路快速發(fā)展的今天,檔案編研應(yīng)改變傳統(tǒng)方式,利用文字、圖片、表格、數(shù)據(jù)、聲像等形式進(jìn)行組合排列,增加成果的吸引力。多種形式相結(jié)合的編排方式無疑給檔案編研工作者的工作增加了難度,但如果以模塊的形式進(jìn)行編排則會降低難度。檔案館(室)可以請專業(yè)人士設(shè)計(jì)多種不同類型的編排模塊,根據(jù)編研選題和選材的需要選擇套用合適的模塊,再通過修改和潤色,就能形成豐富多彩、別具一格的檔案編研成果,有效地避免了千篇一律。

二、分布式檔案數(shù)據(jù)庫系統(tǒng)對檔案編研的影響

(一)分布式檔案數(shù)據(jù)庫系統(tǒng)對檔案編研工作環(huán)節(jié)的影響

1.受眾模塊對檔案編研選題的影響。檔案編研選題有三大要求,選題要“大而全”,防止“炒冷飯”,要“高層次”?!按蠖笔侵割}目內(nèi)容廣泛,能給讀者較大的選擇空間;“炒冷飯”是指公布別人已經(jīng)公布過的檔案文獻(xiàn);“高層次”是指選題富有內(nèi)涵,具有理論性和學(xué)術(shù)特點(diǎn),能給讀者理論指導(dǎo)和學(xué)術(shù)影響。[5]這些要求歸結(jié)到一點(diǎn)就是要符合受眾需求,能為受眾服務(wù)。受眾模塊通過接收受眾的反饋,可以幫助檔案編研工作者分析總結(jié)出哪些選題價值更大、需求更迫切、更有市場,從而擬定“大而全”的選題。受眾模塊也是檔案編研成果的展示模塊,包含了一定時間段、一定國家、地區(qū)內(nèi)所有的檔案編研成果,通過檢索主題就可以避免“炒冷飯”。檔案編研成果服務(wù)的對象中,各類學(xué)者和研究人員是其重要組成部分,他們對檔案編研成果的要求是內(nèi)涵深厚、學(xué)術(shù)性強(qiáng)。檔案編研工作者也可以根據(jù)自己的工作實(shí)踐,結(jié)合分析這類受眾的反饋,確定“高層次”的選題。

2.檔案原文數(shù)據(jù)庫模塊對檔案編研選材的影響。檔案編研的選材包括檔案的查找和挑選,檔案原文數(shù)據(jù)庫模塊對檔案編研的選材有深刻影響。過去,檔案的查找與挑選是分開進(jìn)行的,檔案編研工作者在這兩個程序上花費(fèi)了大量的時間、人力和物力。檔案的查找分為檔案部門內(nèi)的查找和檔案部門外的查找。在檔案部門內(nèi)查找依據(jù)從直接全宗到間接全宗查找,根據(jù)選題的時間斷限和涉及人物相關(guān),不同檔案類型查找。在檔案部門外的查找則從圖書館、博物館入手,對散落在社會上的檔案進(jìn)行查找,從新、舊著述中查找。如果說檔案的查找是一項(xiàng)浩大的工程,花費(fèi)了大量時間、人力和物力,那么檔案的挑選就是一個在價值、真?zhèn)沃g不斷做取舍的過程。檔案的選材要經(jīng)過初選、復(fù)選和定選。由于不同的檔案編研工作者的標(biāo)準(zhǔn)不一和交流得不夠及時,很容易對同一份檔案有不同的看法,在取舍之間面臨兩難選擇。

檔案原文數(shù)據(jù)庫模塊中,檔案查找就是檔案檢索,不需要大量的人手分頭行動,也不需要大量的時間翻閱檔案資料,更不需要在各地的檔案館(室)之間來回奔波。在檔案原文數(shù)據(jù)庫中,使用計(jì)算機(jī)既能實(shí)現(xiàn)高效的檔案檢索,也可以同時對檔案進(jìn)行挑選。在檢索與挑選檔案時,遇到有疑問的檔案材料,還可直接進(jìn)行在線交流,提高效率,保證效果。

3.專家模塊對檔案編研成果的影響。檔案是歷史的原始記錄,具有憑證和參考的作用。檔案編研就是為了克服檔案實(shí)體浩繁、檔案信息蕪雜、檔案載體局限性等障礙,更好地發(fā)揮檔案的信息價值。檔案編研按照層次分為一次編研、二次編研和三次編研。一次編研和二次編研都屬于層次比較低,功能比較單一,價值不大的成果。三次編研成果則是以檔案為基礎(chǔ),經(jīng)過分析研究形成的新材料,包含了編者的知識、認(rèn)識、結(jié)論、建議等信息增量,其深度和廣度更能滿足用戶(受眾)的多方面深層次需求。然而在檔案館(室)的實(shí)際工作中,檔案編研多以一次、二次編研成果為主,三次編研成果較少,在一定程度上影響了編研成果利用范圍的擴(kuò)大和增值的實(shí)現(xiàn)。這種情況的出現(xiàn)與檔案館(室)工作人員知識結(jié)構(gòu)的單一有密切關(guān)系,專家模塊就是為解決這一突出問題而設(shè)置的。

檔案館(室)通過聘請各行各業(yè)的專家進(jìn)行含有信息和價值增量的三次編研工作,可以研發(fā)出內(nèi)涵更豐富、價值更大、受眾面更廣的編研成果,更好地實(shí)現(xiàn)“大而全”、“高層次”的選題要求。

4.編研模塊對檔案加工編輯的影響。加工編輯是檔案編研成果主體內(nèi)容形成有機(jī)統(tǒng)一體的必經(jīng)之路。加工編輯分為轉(zhuǎn)錄、點(diǎn)校、標(biāo)題擬寫、編排等程序。檔案編研模塊中,檔案的加工編輯比過去更省時省力。首先,檔案轉(zhuǎn)錄從電子版到電子版,不脫離電腦。其次,直接在電子版上標(biāo)注、刪節(jié)、統(tǒng)一格式。再次,文字編輯軟件自帶的糾錯功能,有助于檔案編研工作者糾錯。最后,可以使用設(shè)計(jì)好的各種模板對文字、圖片、音頻、視頻等多種形式的檔案進(jìn)行加工編輯和混合式編排。endprint

(二)分布式檔案數(shù)據(jù)庫系統(tǒng)對檔案編研成果傳播的影響

利用分布式檔案數(shù)據(jù)庫系統(tǒng)編研的檔案編研成果有文字式、圖片式、數(shù)據(jù)式、聲像式等編排形式,紙質(zhì)出版物的形式已不能完全容納所有形式的編排。如果以光盤、磁帶等形式進(jìn)行出版?zhèn)鞑ィ瑫a(chǎn)生高消費(fèi),傳播范圍也會受到一定限制。如果檔案編研成果的傳播與分享能借助智能手機(jī)這個移動的客戶端平臺,將有助于減少傳播費(fèi)用,擴(kuò)大傳播范圍,提高利用率。檔案編研的產(chǎn)品除了展示在“受眾模塊”內(nèi)讓讀者閱讀之外,也可以存放在移動圖書館內(nèi)讓讀者“借閱”。這意味著檔案編研成果的閱讀不再受限于檔案館(室)、圖書館等空間,也不再受周六周日等時間限制,人們可以在乘坐交通工具、等候客戶、睡覺前等閑暇時間,都可以隨時隨地閱讀檔案編研成果。

(三)分布式檔案數(shù)據(jù)庫系統(tǒng)對檔案編研成果開放范圍的影響

檔案每隔一段時間都要進(jìn)行鑒定以決定銷毀還是開放。南寧市檔案館2013年完成館藏1983年以前形成的到期檔案的開放鑒定,共鑒定檔案全宗80個,檔案1195卷又157件,其中向社會開放檔案483卷又76件[6]。每一次鑒定后決定向社會開放的檔案的數(shù)量非??捎^,這對檔案編研的影響也是巨大的。出于檔案保密的原因,某些選題被迫擱置,關(guān)鍵性檔案在選材時不得不被舍棄,檔案編研成果只能作為內(nèi)部資料,不允許對外公開等。分布式檔案數(shù)據(jù)庫系統(tǒng)的優(yōu)勢在于,只要文字?jǐn)?shù)據(jù)有修改變動,檔案原文數(shù)據(jù)庫就能進(jìn)行實(shí)時查詢,對于缺少關(guān)鍵性材料的可以及時補(bǔ)充。對于被迫擱置的選題只要滿足條件就可以再次啟用,檔案編研成果若滿足對外開放條件則可以立刻通過受眾模塊進(jìn)行開放,從而避免了在檔案選材和編研成果傳播上處置不當(dāng)而帶來不利影響。

利用分布式檔案數(shù)據(jù)庫系統(tǒng)編研的檔案編研成果應(yīng)滿足以下條件:首先,能滿足受眾的利用需求;其次,能利用網(wǎng)絡(luò)環(huán)境形成大范圍的傳播;最后,檔案編研成果的內(nèi)容質(zhì)量高,以三次編研成果為主。檔案編研成果要滿足這些條件還需要經(jīng)歷長時間的研究與實(shí)踐,特別是在如何發(fā)揮檔案休閑利用觀的問題上要更加努力。如何使人們在基本需求得到滿足的前提下,利用自由時間去閱讀檔案編研成果以滿足個人的興趣和愛好,達(dá)到休閑、消遣的目的,并使自身素質(zhì)得到提高,應(yīng)是未來檔案編研發(fā)展繼續(xù)深入研究的方向。

參考文獻(xiàn)

[1]林真,黃建峰.以分布式檔案數(shù)據(jù)庫建設(shè)為核心構(gòu)建檔案信息資源共享體系[C].2008年海峽兩岸檔案暨縮微學(xué)術(shù)交流會論文集,2008:27-33.

[2]南寧市檔案局2011年上半年工作總結(jié)[2014-05-18].http://nnda.gxi. gov.cn/web/2011-07/104447.html.

[3]南寧市檔案局2012年上半年工作總結(jié)[2014-05-18].http://nnda.gxi. gov.cn/web/2012-07/106628.html.

[4]南寧市檔案局2013年上半年工作總結(jié)[2014-05-18].http://nnda. gxi.gov.cn/web/2013- 07/107657.ht? ml.

[5]劉耿生.檔案文獻(xiàn)編纂學(xué)[M].北京:中國人民大學(xué)出版社,2007: 62-63.

[6]南寧市檔案局2013年工作總結(jié)[2014- 05- 18]. http://nnda.gxi. gov.cn/web/2013-12/107658.html.

作者單位:廣西民族大學(xué)管理學(xué)院endprint

猜你喜歡
數(shù)據(jù)庫系統(tǒng)編研檔案館
《山東檔案》
談?wù)劮康禺a(chǎn)檔案的編研
數(shù)據(jù)庫系統(tǒng)shell腳本應(yīng)用
微細(xì)銑削工藝數(shù)據(jù)庫系統(tǒng)設(shè)計(jì)與開發(fā)
檔案編研在地鐵文化中的應(yīng)用
全省部分檔案館新館掠影
實(shí)時數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)安全采集方案
房地產(chǎn)檔案編研工作的特點(diǎn)及其完善建議
核反應(yīng)堆材料數(shù)據(jù)庫系統(tǒng)及其應(yīng)用
太倉市數(shù)字檔案館成為“全國示范數(shù)字檔案館”
金华市| 乡宁县| 兴城市| 林西县| 吴旗县| 五华县| 任丘市| 英山县| 乌鲁木齐市| 日喀则市| 克什克腾旗| 青铜峡市| 阿拉善右旗| 巢湖市| 贵州省| 当雄县| 都江堰市| 华池县| 荣昌县| 新余市| 新竹县| 万盛区| 闵行区| 志丹县| 庐江县| 河北省| 钦州市| 乌拉特中旗| 深水埗区| 巴东县| 华亭县| 辽宁省| 舞阳县| 监利县| 陆丰市| 远安县| 富宁县| 乐都县| 清镇市| 云南省| 井冈山市|