朱桂平
[摘 要] 檔案館庫存的資料,尤其是20世紀(jì)的老資料多為紙質(zhì)資料,借閱及資料的二次開發(fā)利用不方便,只有做好庫存檔案資料的電子化工作,才能更好地發(fā)揮檔案資料的作用。
[關(guān)鍵詞] 檔案;資料;電子化;二次開發(fā)
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 12. 028
[中圖分類號] F272.7;G275 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2014)12- 0045- 01
0 引 言
檔案館庫存的紙質(zhì)檔案資料存在以下幾個(gè)特點(diǎn):①保存不便,保存時(shí)限有限,年久容易損壞,防火、防潮、防蟲等安全系數(shù)不高;②對庫房的容量要求比較高,隨著地勘單位承擔(dān)的地勘項(xiàng)目越來越多,向檔案館匯交存檔的紙質(zhì)檔案資料越來越多,檔案館庫存的壓力越來越大;③借閱、利用不便,很多圖紙圖幅大,翻閱不便,容易損壞;④資料的二次開發(fā)利用不便,大部分地質(zhì)資料的二次開發(fā)是建立在電子版的基礎(chǔ)上。由此,檔案館庫存的紙質(zhì)檔案資料電子化工作刻不容緩,如何高效做好紙質(zhì)資料電子化工作對檔案工作人員的綜合素質(zhì)要求很高。
1 準(zhǔn)備工作
1.1 儀器、設(shè)備
(1)電腦。要求配置高,運(yùn)行內(nèi)存大,對提高大型圖件及軟件運(yùn)行速度有利;存儲內(nèi)存要求大,掃描高質(zhì)量的圖件所占內(nèi)存較大。
(2)掃描儀。選擇掃描速度快,大小合適的掃描儀??蓮囊韵聨讉€(gè)性能指標(biāo)來挑選。
①分辨率:分辨率反映的是掃描圖像的清晰程度。選擇分辨率時(shí)要適合圖紙掃描,但也不能過大,分辨率越大所占內(nèi)存越大,對存儲配置要求就越高。②色彩位數(shù):色彩位數(shù)反映了掃描圖像與實(shí)物在色彩上的接近程度。色彩的位數(shù)越高則掃描儀所能反映的色彩越豐富,掃描出的圖像也越真實(shí)。③感光元件:掃描儀所使用的感光元件有光電倍增管、CCD電荷耦合器件和CIS接觸式圖像傳感器3種,光電倍增管是3種感光元件中性能最好的。④掃描幅面:掃描儀的幅面規(guī)格一般有A4、A4加長、A3、A1等。建議配置兩臺不同規(guī)格的掃描儀,A4幅面的掃描報(bào)告及附表、附件類,A1幅面的掃描圖紙類。
1.2 軟件
(1)Photoshop。Photoshop是對掃描的圖像格式的文件進(jìn)行處理的軟件,掃描后的圖像在經(jīng)過Photoshop裁剪、修飾、旋轉(zhuǎn)、銳化照片以及去除掃描時(shí)產(chǎn)生的暗邊等處理后才能存檔。
(2)OCR文字識別。掃描的報(bào)告類資料是圖片格式,資料二次利用不方便,需將其轉(zhuǎn)換成可編輯的文檔??渴止や浫氡容^費(fèi)時(shí),可安裝OCR文字識別類軟件。OCR軟件的應(yīng)用對文字資料的整理非常方便,替代了人工鍵入文字的工作,大大縮短了錄入時(shí)間,減輕了勞動(dòng)強(qiáng)度,節(jié)省了人力且降低了費(fèi)用,提高了錄入正確率、工作效率和現(xiàn)代辦公自動(dòng)化程度。選擇OCR文字識別類軟件時(shí)注意其是否能夠識別各種印刷體、手寫體、表格以及能否識別中英文混排等因素。
(3)MapGIS圖形處理軟件。MapGIS是中國地質(zhì)大學(xué)武漢中地信息工程有限公司開發(fā)的地理信息系統(tǒng)平臺,廣泛適用于地質(zhì)、礦產(chǎn)、地理、測繪、城建、土地管理、水利、交通等領(lǐng)域。與傳統(tǒng)制圖相比較,MapGIS具有成圖周期短、速度快、精度高等特點(diǎn),工作效率高,節(jié)省人力。成圖后,對于地形地質(zhì)圖的二次開發(fā)利用作用明顯,在單一的地形地質(zhì)圖上添加不同的專業(yè)內(nèi)容,如添加地質(zhì)、物探、水文要素,可以生成各種專題地圖,應(yīng)用廣泛。
(4)AutoCAD圖形處理軟件。AutoCAD是由美國Autodesk 公司開發(fā)的通用計(jì)算機(jī)輔助設(shè)計(jì)軟件,能夠繪制二維圖形與三維圖形、標(biāo)注尺寸、渲染圖形以及打印輸出圖紙,目前已廣泛應(yīng)用于機(jī)械、建筑、土木工程、冶金、地質(zhì)、氣象、紡織、輕工、商業(yè)等領(lǐng)域。
工程勘察領(lǐng)域的圖件資料多使用AutoCAD進(jìn)行矢量化。
2 電子化工作
2.1 一般紙質(zhì)檔案資料的電子化
一般紙質(zhì)檔案資料指文書檔案、報(bào)告及其附表、附件等無大型圖件的資料,該類資料內(nèi)容多為文字。該類資料的電子化先選擇適合檔案資料篇幅的掃描儀進(jìn)行掃描,掃描時(shí)統(tǒng)一編號、命名,保存時(shí)選擇JPEG格式存檔。掃描后使用Photoshop進(jìn)行修飾及去除暗邊等處理后才能存檔。對成果報(bào)告類檔案資料,除存檔圖片格式外,還應(yīng)將其使用OCR文字識別類軟件進(jìn)行處理,將其轉(zhuǎn)錄成可編輯的文檔類資料,以便日后資料二次開發(fā)利用。
2.2 圖件的電子化
地形地質(zhì)圖等圖件類檔案資料在掃描儀掃描后還應(yīng)進(jìn)行矢量化。
2.2.1 地形地質(zhì)圖的矢量化
(1)掃描。地形地質(zhì)圖掃描時(shí)比例不能縮放,保存時(shí)選擇Tiff柵格格式,掃描后使用Photoshop進(jìn)行修飾,調(diào)整水平。
(2)標(biāo)準(zhǔn)/非標(biāo)準(zhǔn)分幅的影像校正。由于原圖圖紙變形和掃描時(shí)存在一定的系統(tǒng)誤差,在掃描后應(yīng)進(jìn)行圖形校正,消除輸入圖形的變形,校正后的圖形可直接在圖上讀取實(shí)際坐標(biāo)。
(3)矢量化。按照國標(biāo)的圖例,對圖件進(jìn)行矢量化,將矢量數(shù)據(jù)分別存入到點(diǎn)文件(*.WT)、線文件(*.WL)和面文件(*.WP)中。在開始矢量化前,可先建立圖例庫,矢量化時(shí)更加快捷;矢量化時(shí)一定要先建好圖層,將不同的圖形實(shí)體存放在不同的圖層上,為以后的利用提供方便。
2.2.2 工程圖件的矢量化
因工程領(lǐng)域圖件處理多使用AutoCAD,所以工程圖件使用AutoCAD進(jìn)行矢量化,方法步驟與地形地質(zhì)圖類似,在此不贅述。
3 電子檔案資料后期處理工作
電子化的檔案資料為方便管理及二次開發(fā)利用,應(yīng)對其進(jìn)行分類、建庫、建檔。
3.1 分類
一般性檔案資料按成果資料、原始資料、實(shí)物資料進(jìn)行分類;地形圖的電子化管理應(yīng)對地形圖按圖幅進(jìn)行分類;地質(zhì)圖等專題圖件可按專題分類或按礦區(qū)分類。分類的好處一是避免不同檔案工作人員重復(fù)矢量化;二是方便資料提取,查閱。
3.2 建庫
掃描及電子化處理后的檔案資料多而亂,為方便管理,應(yīng)按檔案號進(jìn)行建庫,并及時(shí)加載進(jìn)地質(zhì)資料管理系統(tǒng),方便檔案資料查詢和利用。
3.3 建檔
對分類好并建庫的檔案資料,按題名建立檔案目錄,避免不同時(shí)期、不同檔案工作人員重復(fù)工作,也可方便技術(shù)人員搜索、查閱、利用。
4 結(jié) 語
檔案資料的電子化工作看似簡單,但是要做好這項(xiàng)工作,就需要掌握電子化工作的方法及上述軟件的使用技巧。做好檔案資料的二次開發(fā)利用,除做好檔案資料的電子化工作,還需要做好電子化檔案資料的管理。