劉傳峰
【摘要】隨著科學(xué)技術(shù)的發(fā)展以及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的普及,當(dāng)前的檔案管理工作已經(jīng)逐漸形成了數(shù)字化處理的模式,并在其基礎(chǔ)上不斷的完善成熟,本文將對(duì)檔案管理工作中的數(shù)字化處理技術(shù)進(jìn)行具體的分析和介紹。
【關(guān)鍵詞】檔案管理;數(shù)字化處理;信息數(shù)據(jù)
隨著各種信息量的增加,檔案管理工作越來(lái)越復(fù)雜,人們的檔案數(shù)據(jù)越來(lái)越多,有涉及到職位升遷的個(gè)人基本履歷,有關(guān)于黨員干部評(píng)定的思想履歷等,如何對(duì)這些豐富的檔案數(shù)據(jù)實(shí)現(xiàn)科學(xué)化的管理,更好的保證檔案管理工作有序的展開(kāi),是目前檔案管理工作的重點(diǎn)。在計(jì)算機(jī)知識(shí)的網(wǎng)絡(luò)化時(shí)代的影響下,檔案管理已經(jīng)逐漸開(kāi)始了數(shù)字化的管理模式,并在未來(lái)一段時(shí)間將會(huì)得到更好的發(fā)展。
一、掃描技術(shù)
掃描是實(shí)現(xiàn)檔案管理數(shù)字化模式的一個(gè)前提,所謂的掃描就是講所有紙質(zhì)的文件檔案資料通過(guò)掃描儀掃描下來(lái),并將數(shù)據(jù)存儲(chǔ)到計(jì)算機(jī)里。掃描工作的實(shí)現(xiàn)需要工作人員熟悉掃描儀的基本工作原理,能根據(jù)實(shí)際的需要對(duì)掃描儀進(jìn)行數(shù)值定制。
1、掃描儀工作基本原理
掃描儀是新型的科技產(chǎn)物也是實(shí)現(xiàn)檔案管理的一個(gè)必備設(shè)備,它能夠?qū)⑽谋绢?lèi)以及聲像等類(lèi)型的數(shù)據(jù)信息通過(guò)掃描最終實(shí)現(xiàn)數(shù)字化的轉(zhuǎn)換。它的工作步驟主要分為兩個(gè)程序,首先將信息進(jìn)行光學(xué)的掃描,形成模擬的利用信號(hào),最后將這些信號(hào)再轉(zhuǎn)化為我們可以利用的數(shù)字信息。
掃描儀通過(guò)對(duì)原稿進(jìn)行光學(xué)掃描,將光學(xué)圖像傳送到廣電轉(zhuǎn)換器中變?yōu)槟M電信號(hào),又將模擬電信號(hào)變換成數(shù)字電信號(hào),并通過(guò)計(jì)算機(jī)接口傳至計(jì)算機(jī)中。在掃描儀獲取圖像的過(guò)程中,有兩個(gè)原件起到關(guān)鍵作用:一個(gè)是CCD,它將光信號(hào)轉(zhuǎn)換成電信號(hào);另一個(gè)是A/D變換器,它將模擬電信號(hào)變?yōu)閿?shù)字電信號(hào)。這兩個(gè)元件的性能和技術(shù)指標(biāo)直接影響掃描儀的工作質(zhì)量。掃描儀的工作方式主要有反射式和透射式兩種。
大多數(shù)平板掃描儀采用反射式掃描原理。在掃描儀內(nèi)部,有一個(gè)步進(jìn)電動(dòng)機(jī)驅(qū)動(dòng)的可移動(dòng)拖架,拖架上有光源、反射鏡片、透鏡和CCD光敏元件等。掃描時(shí),原稿固定不動(dòng),拖架移動(dòng),其上的光源隨拖架移動(dòng),光線照射到正面向下的原稿上,其過(guò)程類(lèi)似復(fù)印機(jī)。圖片反射回來(lái)的光線通過(guò)反射鏡片反射到透鏡上,經(jīng)過(guò)透鏡的聚焦,投影到CCD廣電耦合元件上,經(jīng)過(guò)廣電轉(zhuǎn)換形成電信號(hào),然后進(jìn)行譯碼,講數(shù)字信號(hào)輸出。采用透射式掃描原理的掃描儀一般有兩類(lèi),一類(lèi)是專用的膠片掃描儀,另一類(lèi)是混合式掃描儀。掃描儀與計(jì)算機(jī)之間的接口方式主要有SCSI、EPP、USB等,其中以SCSI、USB較為常用。
2、掃描儀技術(shù)指標(biāo)
掃描分辨率、掃描精度、色彩位數(shù)、灰度級(jí)、掃描幅面、掃描速度、兼容性、接口形式等都是選擇和使用掃描儀時(shí)應(yīng)重點(diǎn)考慮的技術(shù)指標(biāo)。
掃描分辨率(dpi)主要是指掃描儀CCD的光學(xué)分辨率,是決定掃描清晰度的主要參數(shù)指標(biāo)。不同的掃描儀其掃描分辨率的數(shù)值也是不一致的,通常來(lái)說(shuō)掃描儀的掃描分辨率越高,那么掃描出來(lái)的數(shù)據(jù)越真實(shí),在使用的過(guò)程中可以根據(jù)實(shí)際的需要進(jìn)行合理的選擇。當(dāng)然分表率高的掃描儀其掃描成本和設(shè)備成本相對(duì)來(lái)說(shuō)也會(huì)有所提高,因此在選擇掃描儀需要從經(jīng)濟(jì)和效果兩個(gè)方面進(jìn)行衡量。
二、模數(shù)轉(zhuǎn)換技術(shù)
聲像檔案的數(shù)字化過(guò)程與紙質(zhì)檔案完全不同,這是因?yàn)閭鹘y(tǒng)的聲響都采用模擬的磁帶、錄音帶、錄像帶來(lái)保存,必須通過(guò)模擬到數(shù)字轉(zhuǎn)換才能實(shí)現(xiàn)數(shù)字化。
模數(shù)轉(zhuǎn)換是將模擬輸入信號(hào)轉(zhuǎn)換成二進(jìn)制數(shù)字信息的一種技術(shù),主要包括采樣、保持、量化和編程四個(gè)過(guò)程,實(shí)現(xiàn)這些過(guò)程的技術(shù)很多,并采用這些技術(shù)研制出各種轉(zhuǎn)換設(shè)備和系統(tǒng),在開(kāi)展聲響檔案數(shù)字化過(guò)程中必須了解和熟練掌握浙西額設(shè)備的功能、性能和操作規(guī)程。
模擬聲像檔案數(shù)字化的核心過(guò)程既是要完成聲響檔案的數(shù)據(jù)采集與數(shù)字化轉(zhuǎn)存,實(shí)現(xiàn)聲像檔案從模擬數(shù)據(jù)向數(shù)字信息的轉(zhuǎn)化。這個(gè)過(guò)程主要依靠模擬聲像資料播放機(jī)、數(shù)模轉(zhuǎn)換線、視頻采集卡、影響工作站等設(shè)備搭建的聲像數(shù)模轉(zhuǎn)換系統(tǒng)完成。聲像數(shù)據(jù)的數(shù)字化轉(zhuǎn)換過(guò)程是實(shí)時(shí)的,即一個(gè)小時(shí)的模擬聲像資料轉(zhuǎn)化為數(shù)字格式同樣需要一個(gè)小時(shí)。
三、網(wǎng)絡(luò)存儲(chǔ)技術(shù)
經(jīng)過(guò)掃描后的信息將被存儲(chǔ)到相關(guān)的計(jì)算機(jī)內(nèi),首先需要保證計(jì)算機(jī)的安全,為了降低檔案數(shù)據(jù)管理的風(fēng)險(xiǎn),應(yīng)該對(duì)重要的數(shù)據(jù)進(jìn)行備份;其次,存儲(chǔ)的計(jì)算機(jī)需要具備足夠大的空間容量,能夠?qū)λ行畔?shù)據(jù)進(jìn)行存儲(chǔ);最后計(jì)算機(jī)需要實(shí)現(xiàn)網(wǎng)絡(luò)化,以便實(shí)現(xiàn)數(shù)據(jù)的及時(shí)更新,更能實(shí)現(xiàn)信息檔案的便捷管理和在線分享。
主機(jī)與網(wǎng)絡(luò)存儲(chǔ)系統(tǒng)之間的連接方式有多重,主要有在線存儲(chǔ)、近線存儲(chǔ)和離線存儲(chǔ)。磁盤(pán)陣列與服務(wù)器之間的直接連接就是采用在線存儲(chǔ)方式,存取速度快,成本高,適合高速數(shù)據(jù)存取的應(yīng)用場(chǎng)合;光盤(pán)庫(kù)與主機(jī)之間采用近線存儲(chǔ)方式,存取速度中等,成本合理,適合于對(duì)在線訪問(wèn)速度要求不高的檔案館、圖書(shū)館等;磁帶庫(kù)、脫機(jī)存儲(chǔ)設(shè)備是采用離線存儲(chǔ)方式,平均存取速度較低,成本也較低,適合大規(guī)模后備備份或者用以保密數(shù)據(jù)的保管和訪問(wèn)等。
存儲(chǔ)設(shè)備與網(wǎng)絡(luò)的連接標(biāo)準(zhǔn)也有多種方式,主要有SCSI連接、光纖、3GIO、InfiniBand等。SCSI連接和光纖連接是檔案館中通常使用的連接方式。
四、數(shù)據(jù)壓縮技術(shù)
信息存儲(chǔ)的過(guò)程中通常會(huì)遇到兩個(gè)主要的問(wèn)題,其一是存儲(chǔ)的信息量大,存儲(chǔ)空間有限,存儲(chǔ)難度大;其二是存儲(chǔ)的信息類(lèi)型不統(tǒng)一,有數(shù)據(jù)型有圖像型等,不同的信息需要存儲(chǔ)在不同的文件夾內(nèi),存儲(chǔ)程序復(fù)雜,而壓縮技術(shù)正好可以恰當(dāng)?shù)慕鉀Q掉這兩個(gè)矛盾。
經(jīng)過(guò)壓縮后的文件和信息,所占的存儲(chǔ)空間下降,提高了存儲(chǔ)空間的有效利用率。當(dāng)人們需要對(duì)存儲(chǔ)的信息加以利用時(shí),可以通過(guò)相關(guān)的軟件對(duì)信息進(jìn)行解壓。目前主要有兩種主要的壓縮形式,一種是有損減壓,一種是無(wú)損減壓。無(wú)損減壓顧名思義,就是在減壓的過(guò)程中沒(méi)有實(shí)現(xiàn)數(shù)據(jù)的缺損和變更,該技術(shù)能夠保證數(shù)據(jù)信息的真實(shí)性,但是壓縮的效果和程度有限,在一定程度上還是有限制的,不能實(shí)現(xiàn)理論上減壓的效果。
通過(guò)壓縮處理后的信息數(shù)據(jù)基本上能夠減少硬盤(pán)的存儲(chǔ)負(fù)荷,因此是十分必要的,但是由于壓縮技術(shù)需要耗損機(jī)械設(shè)備,因此經(jīng)濟(jì)成本也相對(duì)較高。所以應(yīng)該在壓縮領(lǐng)域?qū)崿F(xiàn)壓縮能力與壓縮質(zhì)量的突破,為檔案管理實(shí)現(xiàn)準(zhǔn)確安全廉價(jià)的信息壓縮。
有損壓縮方法在保證了壓縮效率的同時(shí)也最高限度的保證了信息數(shù)據(jù)壓縮后的高質(zhì)量。它的基本操作原理是基于人類(lèi)對(duì)某些視頻和圖像在一定范圍內(nèi)的敏感度比較低,那么對(duì)這部分敏感度低的數(shù)據(jù)進(jìn)行壓縮缺損,將不會(huì)影響到人們對(duì)于數(shù)據(jù)和信息的有效利用。因此,有損壓縮技術(shù)能夠得到普及。
五、結(jié)束語(yǔ)
通過(guò)檔案管理數(shù)字化模式的實(shí)踐數(shù)據(jù)調(diào)查,我們發(fā)現(xiàn)該種管理較之傳統(tǒng)的管理方式更快捷高效,能夠?qū)崿F(xiàn)信息的有效存儲(chǔ)和高效利用,并有利于檔案管理領(lǐng)域精簡(jiǎn)機(jī)構(gòu),節(jié)約經(jīng)濟(jì)成本。因此,檔案管理的數(shù)字化模式將在我國(guó)得到大力的推廣。