程 俠
(法庫(kù)縣葉茂臺(tái)鎮(zhèn)人民政府,遼寧 法庫(kù) 110400)
應(yīng)用數(shù)字化處理技術(shù)掃描特殊載體的檔案是一個(gè)檔案數(shù)字化的難點(diǎn),特殊的載體檔案其成分及結(jié)構(gòu)都比較復(fù)雜、易變質(zhì)、易損壞,保存的年限大多低于紙張。掃描方法難度大、新型軟件更新快、處理的方式方法多樣,要保障信息完整、準(zhǔn)確、安全、可多次利用,還必須將原載體的檔案信息進(jìn)行數(shù)字化,并全面地向新型載體遷移供長(zhǎng)期利用,這是一個(gè)非常難解決的現(xiàn)實(shí)問(wèn)題。
把照片檔案進(jìn)行數(shù)字化保存是保管照片檔案的有效方法。沒(méi)有數(shù)字化的照片檔案大多都是通過(guò)傳統(tǒng)的光學(xué)照相,進(jìn)行化學(xué)沖洗,得到照片或底片檔案來(lái)保存的,這些底片或照片檔案隨著時(shí)間的推移,就會(huì)發(fā)生褪色、模糊、出現(xiàn)斑跡而失真等問(wèn)題,檔案保存質(zhì)量受到大大影響。
1.1 掃描前選擇適當(dāng)?shù)膾呙璺直媛?。要掃描一組照片,尺寸從一寸直到十二寸,首先要統(tǒng)籌一下,設(shè)計(jì)最終掃描輸出尺寸的大小為標(biāo)準(zhǔn)確定掃描分辨率,可以把十二英寸的照片掃描標(biāo)準(zhǔn)作為分辨率,這樣進(jìn)行一英寸照片掃描時(shí),照片大小的尺寸在2.5cm*3.5cm,此時(shí)可選擇分辨率為2200dpi進(jìn)行掃描,相應(yīng)的文件圖片分辨率為3058*2249pixel,如果掃描12英寸*10英寸大小的照片,可以選擇240dpi的掃描分辨率,得出的文件圖片分辨率為3000*2500。這樣掃描出來(lái)的數(shù)字化文件能使大小不同的照片尺寸保持一致,方便以后統(tǒng)一管理[1]。
1.2 使用合理的掃描儀及其軟件。不同規(guī)格和類(lèi)型的掃描軟件其功能大不同,有的型號(hào)掃描設(shè)備配有一鍵掃描功能,有的軟件設(shè)置智能修復(fù)功能,在照片檔案的掃描過(guò)程中一定注意和把握使用這些功能,要結(jié)合事先選擇的掃描分辨率來(lái)合理運(yùn)用,有時(shí)候選擇了這些自動(dòng)功能,恰恰使預(yù)期的效果沒(méi)有達(dá)到要求。特別是利用去除雜點(diǎn)、背光補(bǔ)償、色彩翻新等功能,為了保持檔案照片的原始記錄性和真實(shí)性,千萬(wàn)不隨意選擇自動(dòng)功能讓原始照片的真實(shí)性受到破壞。
1.3 最終掃描效果的調(diào)節(jié)。掃描照片檔案最重要的是保持照片的真實(shí),要觀察掃描之后的照片長(zhǎng)寬比例,檢測(cè)是否同原始的檔案照片保持一致,有時(shí)候還可以把照片的外延邊界保留住,以便保證保留好照片檔案的真實(shí)面貌。要注意不可以把存檔用的檔案照片進(jìn)行移位遮擋、改變顏色等處理。
底片檔案通常指的是銀鹽膠片通過(guò)光學(xué)相機(jī)記錄潛在影像,而后經(jīng)過(guò)顯影處理和定影加工獲得記錄影像。隨著底片檔案保存時(shí)間的推移,它會(huì)褪色、霉斑、老化,為了能長(zhǎng)久保存和利用底片檔案,在加強(qiáng)收集整理和保管等各個(gè)環(huán)節(jié)的同時(shí),傳統(tǒng)的方法是進(jìn)行有效備份,現(xiàn)代的保管方法是把底片檔案掃描后實(shí)現(xiàn)數(shù)字化存儲(chǔ),給檔案利用者利用檔案帶來(lái)便利。
2.1 感光元件的選擇。感光器件(CCD)技術(shù)相對(duì)成熟,該技術(shù)在物體表面成像,具有一定的景深效果。掃描凹凸不平的底片檔案時(shí),能夠?qū)崿F(xiàn)一定程度的三維效果,并且采用硅單晶技術(shù)的CCD對(duì)周?chē)h(huán)境溫度的要求較低,適應(yīng)的范圍較廣。CMOS和CCD一樣,同是在掃描儀中可記錄光線變化的半導(dǎo)體,采用直接光線路徑,掃描有折痕的底片檔案時(shí),最大限度地減少圖像的變形概率,能捕獲對(duì)比度細(xì)微的地方,并獲得出色的圖像細(xì)節(jié)。
2.2 分辨率的選擇。底片掃描儀的一般光學(xué)分辨率范圍在2000ppi~9600ppi之間,最大的掃描尺寸可達(dá)6in*9in。通常情況下,底片掃描儀把分辨率設(shè)定為2000ppi是完全能夠把35mm的底片掃描進(jìn)行數(shù)字化存儲(chǔ)的,如果不進(jìn)行大尺寸底片的掃描可設(shè)定低分辨率,要想使底片檔案的細(xì)節(jié)更真實(shí)少損傷地再現(xiàn)出來(lái),掃描分辨率至少設(shè)定到1200dpi。以常見(jiàn)的35毫米底片為例,它的圖像面積非常小,長(zhǎng)邊只有36mm和短邊24mm,但其存儲(chǔ)信息的密度高。如果把底片檔案用5英寸的幅面掃描出來(lái),就等于擴(kuò)大4倍,要想將底片檔案中的色彩少丟失,掃描儀的分辨率需要設(shè)定為1200dpi以上效果為好,要進(jìn)行更大幅面的掃描,掃描分辨率則需要設(shè)定更高。
2.3 儲(chǔ)存格式的選擇。TIFF、BMP是保存底片檔案中最原始的圖像數(shù)據(jù)及各種信息的最佳格式,JPEG的壓縮格式會(huì)因壓縮丟失很多圖像細(xì)節(jié),掃描底片檔案時(shí)不能很好地表現(xiàn)圖像細(xì)節(jié)出現(xiàn)色彩的斷層,若果利用圖像格式TIFF來(lái)存儲(chǔ)底片檔案還可以轉(zhuǎn)換成JPEG的圖像格式,但不可逆。隨著技術(shù)的發(fā)展出現(xiàn)了一些新的存儲(chǔ)格式,如JPEG2000、DjVu,這些格式的利用范圍廣,效果也不錯(cuò)??傊?,數(shù)字化的底片檔案存儲(chǔ)格式選擇要根據(jù)其利用價(jià)值來(lái)確定存儲(chǔ)格式。
古籍的數(shù)字化掃描通常經(jīng)過(guò)以下五個(gè)工序:拆書(shū)處理、頁(yè)面修正、掃描、裝訂還原、圖像加工保存。原則上古籍不需要拆書(shū)處理,如果情況特殊需要拆書(shū),需要經(jīng)過(guò)專(zhuān)業(yè)人士的鑒定同意,由專(zhuān)業(yè)人員進(jìn)行拆裝。頁(yè)面修整是對(duì)古籍頁(yè)面的褶皺、折角、折痕進(jìn)行平整處理,防止在掃描過(guò)程中對(duì)古籍紙張?jiān)斐稍俅螕p傷。裝訂還原是對(duì)拆書(shū)處理的古籍按原樣進(jìn)行重新裝訂,要求檢查仔細(xì)、結(jié)實(shí)牢固、裝訂美觀、無(wú)遺漏并認(rèn)真核對(duì)數(shù)量。掃描古籍過(guò)程中的圖像處理,通常采用市面上常見(jiàn)的ACD-See、Photo Shop等軟件,掃描完畢的圖像文件需要進(jìn)行糾偏、去影像黑邊、影像拼接等處理,要求頁(yè)面端正、圖像版心位置一致、版心橫向傾斜不超過(guò)1度,最大限度地保持原書(shū)中的原始信息。古籍掃描后將相關(guān)資料刻入光盤(pán)加以保存并將光盤(pán)保存在黑暗和低溫的地方以保障光盤(pán)的使用壽命。
首先掃描設(shè)備價(jià)格昂貴,并且掃描儀的后期維護(hù)費(fèi)用也是相當(dāng)高。其次,對(duì)現(xiàn)存文件的掃描也需要花費(fèi)大量的時(shí)間和人工來(lái)進(jìn)行紙質(zhì)檔案的錄入[2]。
漏掃、錯(cuò)掃以及重復(fù)掃描這類(lèi)情況是在許多企業(yè)檔案文件管理部門(mén)的數(shù)字化掃描過(guò)程中普遍存在的,沒(méi)有一個(gè)相關(guān)的掃描流程做參考。
一是現(xiàn)存文件的混亂、缺失以及圖像失真等現(xiàn)象都是常有的,二是對(duì)于掃描過(guò)后的實(shí)體文件的裝訂工作并未落實(shí),時(shí)常因?yàn)椴僮鞑划?dāng),出現(xiàn)實(shí)體文件順序混亂以及紙張破損等現(xiàn)象。
現(xiàn)在的社會(huì)對(duì)檔案不夠重視,所以對(duì)檔案相關(guān)的專(zhuān)業(yè)人士培養(yǎng)也相對(duì)滯后,對(duì)于掃描工作的專(zhuān)業(yè)人才更是缺少。很多企事業(yè)單位都不會(huì)聘請(qǐng)相關(guān)的檔案專(zhuān)業(yè)人才,從根本上影響了檔案文件掃描的進(jìn)度和質(zhì)量,更甚者影響整個(gè)檔案文件數(shù)字化的進(jìn)程。
調(diào)查發(fā)現(xiàn)一些單位在進(jìn)行檔案文件數(shù)字化掃描的過(guò)程中并沒(méi)有重視掃描儀的掃描參數(shù)設(shè)置,沒(méi)有針對(duì)一些特定的檔案文件材料去設(shè)置適合該材料介質(zhì)掃描的參數(shù),所以導(dǎo)致一些檔案文件材料的掃描效果不佳。
首先,在掃描工作開(kāi)始前,需要將所掃描的文件進(jìn)行整理,并且將所要掃描的文件分配到個(gè)人,實(shí)行個(gè)人責(zé)任制。個(gè)人負(fù)責(zé)將所掃描的檔案文件按質(zhì)、按量、按時(shí)的完成,并且還要保證實(shí)體檔案文件的完整和有序。
其次,在掃描工作進(jìn)行時(shí),要先將需要掃描的檔案文件按照順序排放好,使用專(zhuān)業(yè)工具拆除訂書(shū)針或者裝訂線等,務(wù)必保證檔案文件原件的完好,然后再依次進(jìn)行掃描;根據(jù)所需掃描的自身?xiàng)l件,選擇最合適的掃描參數(shù)進(jìn)行掃描。
最后,在掃描工作完成時(shí),由專(zhuān)門(mén)的管理人員或者是掃描工作人員之間交換檢查、核查,其主要檢查內(nèi)容包括掃描成品的清晰度、查漏補(bǔ)缺和檔案文件實(shí)體的完整性和有序性[3]。
2.1 對(duì)于掃描圖像的后期處理。檢查掃描成品是否齊全,核對(duì)內(nèi)容,檢查文件掃描的清晰度,掃描成品是否有歪斜的現(xiàn)象,如果出現(xiàn)需要及時(shí)的補(bǔ)救。掃描圖像的后期處理工作也需要借助Photoshop軟件來(lái)完成。比如調(diào)整圖像畫(huà)質(zhì)、清晰度等,修補(bǔ)一些紙張的漏洞,使畫(huà)面更加整潔。但是需要注意的一點(diǎn)就是使用Photoshop軟件的時(shí)候不能對(duì)掃描圖像的內(nèi)容進(jìn)行修改、刪除或者破壞,必須要保證掃描文件的真實(shí)性和原始性。
2.2 檔案文件實(shí)體原件的后期處理。在掃描工作完成過(guò)后,需要對(duì)已經(jīng)掃描過(guò)的檔案文件進(jìn)行核對(duì)整理,再將這些檔案文件行進(jìn)裝訂存儲(chǔ),確保檔案文件原件的完整和有序,也要確保每一份文件都是掃描合格的。
一是分辨率參數(shù)的設(shè)定。要保證掃描后的圖像完整、清晰、不影響檔案利用,建議辨率參數(shù)的選擇在100dpi以上,如果遇到密集、清晰度較差、文字偏小等特殊情況,可適當(dāng)提高分辨率,需要進(jìn)行OCR漢字識(shí)別的檔案,要選擇大于200dpi的分辨率進(jìn)行掃描。二是色彩模式。首先,因?yàn)榇蠖鄶?shù)文件都是黑白兩色、字跡清晰的并且沒(méi)有插圖的,所以黑白模式是最適合的也是最常用的;其次,頁(yè)面只要有黑白兩色,字跡清晰度較差,或者是帶有插圖以及頁(yè)面為多色文字的,會(huì)用到灰度模式。三是明暗。太亮掃描的文字筆畫(huà)斷裂殘缺不全,太暗,文字筆畫(huà)相互粘連而黑成一團(tuán)。因此,對(duì)于掃描紙張光面或底色較淺的書(shū)刊和雜志,可適當(dāng)調(diào)低亮度;掃描底色較深的報(bào)紙,則宜增加亮度。四是存儲(chǔ)格式。采用國(guó)家規(guī)范中所推薦的TIFF、JPEG等常見(jiàn)格式掃描,如果是提供網(wǎng)絡(luò)查詢可存儲(chǔ)為CEB、PDF或其他格式做出相應(yīng)的選擇。