申雪克
(南陽理工學(xué)院圖書館,河南 南陽 473061)
筆者基于對信息資源數(shù)字化生產(chǎn)項目的考察與分析,得出影響數(shù)字圖像質(zhì)量的生產(chǎn)因素主要有掃描分辨率、位元深度、文件格式、圖像壓縮、圖像增強處理和數(shù)字化生產(chǎn)操作的人員等。
分辨率是一種識別空間細(xì)節(jié)的能力,是決定數(shù)字圖像質(zhì)量的最重要因素之一。數(shù)字圖像采樣時所使用的空間頻率(采樣頻率)常常是分辨率的一個重要指標(biāo)。因此,dpi(每英寸取樣的點數(shù))和ppi(每英寸取樣的像素數(shù))常常用來表示數(shù)字圖像的分辨率。通常情況下,增加采樣頻率有助于提高分辨率。但是,無論是多高的分辨率,圖像放大到一定程度后,仍可看到構(gòu)成圖像的單個像素。
對于數(shù)字化掃描設(shè)備來說,掃描分辨率表示掃描儀在既定文檔中捕獲像素的模式與數(shù)量,它決定了從原始文獻(xiàn)中所采集信息的精細(xì)程度,掃描分辨率越高,所獲得的圖像越精細(xì)。掃描階段,應(yīng)盡可能多地捕獲原始文獻(xiàn)信息,以便在后面的轉(zhuǎn)換處理、打印輸出過程中即使丟失部分信息,仍然可以保持一定的圖像信息總量,保證數(shù)字圖像的相應(yīng)品質(zhì)。
但是,提高分辨率有一個“度”的問題,當(dāng)超過這個“度”時,分辨率的增加無助于數(shù)字圖像質(zhì)量的提高,只能導(dǎo)致文件體積的增大,增加生產(chǎn)成本。關(guān)鍵問題在于尋找到抓取原始文獻(xiàn)所有有價值信息所需的分辨率。
事實上,不存在一個“完美無缺”的分辨率用來掃描所有類型的信息資源。因此,掃描分辨率的設(shè)置沒有統(tǒng)一的尺度,主要取決于被掃描的文獻(xiàn)原稿、掃描需求以及圖像處理要求等。一般認(rèn)為,最佳掃描分辨率應(yīng)該界定為,在輸出的數(shù)字圖像中,能夠保證最小字符或最有意義的信息清晰可讀。但這在實際工作中常常難以確定。首先,就最小字符而言,對于印刷文本,最小的字符常常是上標(biāo)、腳注等,但手稿的最小字符就難以確定,影響手稿字跡清晰可讀的因素很多,如墨色濃淡、字跡大小等等。其次,最有意義的信息的確定取決于數(shù)字圖像的用途與用戶的主觀判斷。比如,對于照片、圖片和地圖等文獻(xiàn),最有意義的信息就很難確定,一幅圖片上哪個信息更為重要,是隨使用目的(欣賞、作為證據(jù)、還是用于資料)以及用戶需求(普通用戶、研究人員、鑒賞家等)而變化的。
掃描分辨率的確定還得考慮輸出的圖像文件是否需要光學(xué)識別。分辨率設(shè)置不當(dāng),低版本的OCR可能根本無法識別文字材料。對于不同的掃描模式,OCR的識別能力與要求也不同。盡管目前OCR軟件一般都具有識別彩色稿件的功能,但從效果看,黑白掃描模式的識別率較高。對于大多數(shù)黑白掃描的印刷型文本,300dpi是可以進(jìn)行OCR識別的最低值,若被掃描的文獻(xiàn)字體太小,分辨率就需增加,特別小的字體要增加到600dpi才可較好地進(jìn)行OCR識別。反之,被掃描的字體大,分辨率可考慮減少。對于灰色模式的掃描,OCR對掃描分辨率的要求不宜低于200dpi。盡管今天的OCR技術(shù)還存在諸多不盡人意的地方,但光學(xué)字符識別代表了數(shù)字掃描與圖像處理同時進(jìn)行的發(fā)展趨勢。
另外,在黑白掃描模式中,還有一個“閾值”的設(shè)定問題。不同的“閾值”點(0~256 之間,0 表示“黑”,256表示“白”)將決定捕捉到的灰度值是被轉(zhuǎn)換成黑像素還是白像素。所以,同一臺掃描儀以同樣的分辨率進(jìn)行掃描,“閾值”的設(shè)定不同,掃描效果可能很不一樣。
位元深度是指定義每個像素所用的位數(shù)。位元深度值越大,能夠表現(xiàn)的色調(diào)數(shù)量就越多。位元深度直接影響數(shù)字圖像的形態(tài)。數(shù)字圖像的形態(tài)有黑白(或稱雙調(diào))、灰色或彩色三種。
每個像素由一個位構(gòu)成,而一個位可以表示兩種色調(diào)(一般是“黑”與“白”),如用 0表示黑,則 1表示白,反之亦然。
由多個位(一般是2~8個位或更多位)的信息所表現(xiàn)的像素所構(gòu)成。比如,在一幅2位圖像中,有四種可能的組合:00、01、10、11。如果用“00”表示黑,“11”表示白,那么“01”便是深灰,“10”便是淺灰。位元深度為2,能夠表現(xiàn)的色調(diào)數(shù)量為22,即4。如果位元深度是8,則每個像素能夠有28(256)種不同的色調(diào)。
通常由8~24或更多的位來表現(xiàn)的圖像。就24位元深度的圖像(一般稱RGB)而言,位元常分為三組:8位紅、8位綠、8位藍(lán)。這些位組合起來表現(xiàn)相應(yīng)的顏色。一幅24位的圖像,可以提供1670多萬(224)色調(diào)值。越來越多的掃描儀以每個頻道10或10以上的位元深度來捕獲圖像,但常常輸出是8位,以補償掃描儀中的“噪波”,輸出更接近人的視覺圖像。
文件格式中包括了文件信息和文件頭信息,這些信息給出對文件進(jìn)行讀寫和解釋的方法。不同的文件格式在分辨率、位元深度、彩色功能以及對壓縮的支持和元數(shù)據(jù)的析出方法等方面會有所不同。
數(shù)字主文檔采用的文件格式應(yīng)該支持所需的分辨率、位元深度、顏色信息和元數(shù)據(jù)。例如,如果采用的數(shù)字主文檔的文件格式不支持8位以上位元深度的圖像,那么掃描為全彩色圖像就失去了意義。另外,數(shù)字主文檔的文件格式應(yīng)該是開放的、廣泛支持的和跨平臺兼容的,因為這樣的文檔格式有利于數(shù)據(jù)交換,且生命周期長。目前絕大多數(shù)數(shù)字化項目采用TIFF格式來保存數(shù)字化主文檔,并使用其他格式來保存數(shù)字主文檔的各類副本。
數(shù)字化生產(chǎn)產(chǎn)生的數(shù)字圖像一般都比較大,不利于計算機處理和網(wǎng)絡(luò)傳輸,為此,數(shù)字化項目常常需要采用一定的技術(shù)對其進(jìn)行壓縮。所有壓縮技術(shù)都是基于一些復(fù)雜算法,將未壓縮的數(shù)字圖像中的二進(jìn)制代碼串縮減為一種數(shù)學(xué)縮略形式。
壓縮技術(shù)有標(biāo)準(zhǔn)和專用之分。一般來講,使用一種得到廣泛支持的標(biāo)準(zhǔn)壓縮技術(shù)比使用專用壓縮技術(shù)更有利,雖然后者有時可能會提供更有效的壓縮或更好的質(zhì)量,但從數(shù)字資源長期保存和應(yīng)用的角度,標(biāo)準(zhǔn)壓縮技術(shù)更可靠,效率更高。
從壓縮前后文件中信息量的損失角度,壓縮技術(shù)又分為無損壓縮(如ITU-T.6)和有損壓縮(或稱失真壓縮)(如JPEG)兩類。無損壓縮利用數(shù)據(jù)的統(tǒng)計冗余進(jìn)行壓縮,數(shù)據(jù)“解壓縮”后,完全恢復(fù)到原來狀態(tài),與原文件比特對比特地一致,不會導(dǎo)致任何失真,但壓縮率受到數(shù)據(jù)統(tǒng)計冗余度的限制。GIF、TIFF和PNG格式都支持無損壓縮。
有損壓縮利用了人類視覺對圖像中的某些頻率成分不敏感的特性,對一些最不重要的信息進(jìn)行了平均化處理或者舍棄。所以,有損壓縮可以認(rèn)為是“視覺無損”(在視覺效果上察覺不到損傷)。有損壓縮中,壓縮程度的不同對圖像的質(zhì)量效果影響不同,一些新興的壓縮方法允許從一個圖像生成多種分辨率的圖像,從而使得圖像交付和呈現(xiàn)給最終用戶時,具有一定的靈活性。
在信息資源數(shù)字化項目實施過程中,無損壓縮常用于印刷文本的黑白掃描,有損壓縮則用于色調(diào)圖像(尤其是連續(xù)色調(diào)圖像)的掃描。因為后者僅僅靠簡化信息并不能明顯地節(jié)省圖像所占的空間。目前,越來越多的數(shù)字化項目將其生產(chǎn)的數(shù)字主文檔采取不壓縮或無損壓縮方式存儲,而各種副本則采用有損壓縮方式保存并向用戶提供各種服務(wù)。
雖然有損壓縮被認(rèn)為“視覺無損”,但對數(shù)字圖像質(zhì)量的影響是明顯的,尤其是壓縮比率高的時候。另外,有損壓縮會導(dǎo)致圖像質(zhì)量的“世襲”性降低(即,基于有損壓縮圖像進(jìn)行再次有損壓縮操作時,產(chǎn)生的新圖像質(zhì)量會更低),這也是數(shù)字主文檔不采用有損壓縮存儲的原因之一。
圖像增強處理可以提高掃描后的圖像質(zhì)量。這類處理一般包括去除網(wǎng)紋、去除斑點、糾正偏斜、銳化、使用定制濾波器以及位元深度調(diào)整等。所用的處理工具是圖像掃描加工軟件或圖像編輯軟件。
但是,圖像增強處理的使用引起了人們對圖像真實性和真實度的關(guān)注。所以,越來越多的數(shù)字化項目不贊成對數(shù)字化主文檔圖像進(jìn)行增強處理,增強處理僅局限在由數(shù)字主文檔派生的各種副本上使用。
掃描操作人員的技能與工作狀態(tài)會對數(shù)字圖像的質(zhì)量產(chǎn)生影響。比如,在黑白掃描模式中,閾值的設(shè)定會對圖像質(zhì)量產(chǎn)生影響,而該項操作是由操作人員通過判斷來實施的,如果設(shè)定得當(dāng),可以最大限度地減少線條失落或線條粘連現(xiàn)象,否則會導(dǎo)致圖像質(zhì)量的降低。再如,當(dāng)使用數(shù)碼相機對三維實物型信息資源進(jìn)行數(shù)字化拍照時,照明是影響數(shù)字圖像質(zhì)量的一個重要因素,攝影師的技能則是實施照明效果的關(guān)鍵。
[1] Cornell University Library.Attributes for Common Compression Techniques. [2011-01-19].http://www.library.cornell.edu/preservation/tutorial/presentation/table7-3.html.
[2] CornellUniversityLibrary.CommonImageFileFormats.[2010-12-09]..http://www.library.cornell.edu/preservation/tutorial/presentation/table7-1.html.
[3] Cornell University Library.THE CASE FOR CREATING A RICH DIGITAL MASTER.[2010-10-06].http://www.library.cornell.edu/pres ervation/tutorial/conversion/ conversion-03.html.