信息資源數(shù)字化生產(chǎn)質(zhì)量的影響因素分析

2011-04-13 02:46:17申雪克

河南圖書館學(xué)刊 2011年4期

申雪克

(南陽理工學(xué)院圖書館，河南南陽 473061)

筆者基于對信息資源數(shù)字化生產(chǎn)項目的考察與分析，得出影響數(shù)字圖像質(zhì)量的生產(chǎn)因素主要有掃描分辨率、位元深度、文件格式、圖像壓縮、圖像增強處理和數(shù)字化生產(chǎn)操作的人員等。

1 分辨率

分辨率是一種識別空間細(xì)節(jié)的能力，是決定數(shù)字圖像質(zhì)量的最重要因素之一。數(shù)字圖像采樣時所使用的空間頻率（采樣頻率）常常是分辨率的一個重要指標(biāo)。因此,dpi（每英寸取樣的點數(shù)）和ppi（每英寸取樣的像素數(shù)）常常用來表示數(shù)字圖像的分辨率。通常情況下，增加采樣頻率有助于提高分辨率。但是,無論是多高的分辨率,圖像放大到一定程度后,仍可看到構(gòu)成圖像的單個像素。

對于數(shù)字化掃描設(shè)備來說,掃描分辨率表示掃描儀在既定文檔中捕獲像素的模式與數(shù)量，它決定了從原始文獻(xiàn)中所采集信息的精細(xì)程度,掃描分辨率越高,所獲得的圖像越精細(xì)。掃描階段,應(yīng)盡可能多地捕獲原始文獻(xiàn)信息,以便在后面的轉(zhuǎn)換處理、打印輸出過程中即使丟失部分信息,仍然可以保持一定的圖像信息總量,保證數(shù)字圖像的相應(yīng)品質(zhì)。

但是,提高分辨率有一個“度”的問題,當(dāng)超過這個“度”時,分辨率的增加無助于數(shù)字圖像質(zhì)量的提高,只能導(dǎo)致文件體積的增大,增加生產(chǎn)成本。關(guān)鍵問題在于尋找到抓取原始文獻(xiàn)所有有價值信息所需的分辨率。

事實上，不存在一個“完美無缺”的分辨率用來掃描所有類型的信息資源。因此,掃描分辨率的設(shè)置沒有統(tǒng)一的尺度,主要取決于被掃描的文獻(xiàn)原稿、掃描需求以及圖像處理要求等。一般認(rèn)為，最佳掃描分辨率應(yīng)該界定為,在輸出的數(shù)字圖像中,能夠保證最小字符或最有意義的信息清晰可讀。但這在實際工作中常常難以確定。首先,就最小字符而言,對于印刷文本，最小的字符常常是上標(biāo)、腳注等，但手稿的最小字符就難以確定,影響手稿字跡清晰可讀的因素很多，如墨色濃淡、字跡大小等等。其次,最有意義的信息的確定取決于數(shù)字圖像的用途與用戶的主觀判斷。比如，對于照片、圖片和地圖等文獻(xiàn),最有意義的信息就很難確定，一幅圖片上哪個信息更為重要,是隨使用目的(欣賞、作為證據(jù)、還是用于資料)以及用戶需求(普通用戶、研究人員、鑒賞家等)而變化的。

掃描分辨率的確定還得考慮輸出的圖像文件是否需要光學(xué)識別。分辨率設(shè)置不當(dāng)，低版本的OCR可能根本無法識別文字材料。對于不同的掃描模式，OCR的識別能力與要求也不同。盡管目前OCR軟件一般都具有識別彩色稿件的功能,但從效果看,黑白掃描模式的識別率較高。對于大多數(shù)黑白掃描的印刷型文本,300dpi是可以進(jìn)行OCR識別的最低值,若被掃描的文獻(xiàn)字體太小,分辨率就需增加,特別小的字體要增加到600dpi才可較好地進(jìn)行OCR識別。反之,被掃描的字體大,分辨率可考慮減少。對于灰色模式的掃描,OCR對掃描分辨率的要求不宜低于200dpi。盡管今天的OCR技術(shù)還存在諸多不盡人意的地方,但光學(xué)字符識別代表了數(shù)字掃描與圖像處理同時進(jìn)行的發(fā)展趨勢。

另外,在黑白掃描模式中,還有一個“閾值”的設(shè)定問題。不同的“閾值”點（0～256 之間,0 表示“黑”,256表示“白”）將決定捕捉到的灰度值是被轉(zhuǎn)換成黑像素還是白像素。所以，同一臺掃描儀以同樣的分辨率進(jìn)行掃描，“閾值”的設(shè)定不同,掃描效果可能很不一樣。

2 位元深度

位元深度是指定義每個像素所用的位數(shù)。位元深度值越大，能夠表現(xiàn)的色調(diào)數(shù)量就越多。位元深度直接影響數(shù)字圖像的形態(tài)。數(shù)字圖像的形態(tài)有黑白（或稱雙調(diào)）、灰色或彩色三種。

2.1 黑白圖像

每個像素由一個位構(gòu)成，而一個位可以表示兩種色調(diào)（一般是“黑”與“白”）,如用 0表示黑，則 1表示白，反之亦然。

2.2 灰色圖像

由多個位（一般是2～8個位或更多位）的信息所表現(xiàn)的像素所構(gòu)成。比如，在一幅2位圖像中,有四種可能的組合：00、01、10、11。如果用“00”表示黑，“11”表示白，那么“01”便是深灰，“10”便是淺灰。位元深度為2，能夠表現(xiàn)的色調(diào)數(shù)量為22，即4。如果位元深度是8，則每個像素能夠有28（256）種不同的色調(diào)。

2.3 彩色圖像

通常由8～24或更多的位來表現(xiàn)的圖像。就24位元深度的圖像（一般稱RGB）而言，位元常分為三組：8位紅、8位綠、8位藍(lán)。這些位組合起來表現(xiàn)相應(yīng)的顏色。一幅24位的圖像，可以提供1670多萬（224）色調(diào)值。越來越多的掃描儀以每個頻道10或10以上的位元深度來捕獲圖像,但常常輸出是8位，以補償掃描儀中的“噪波”,輸出更接近人的視覺圖像。

3 文件格式

文件格式中包括了文件信息和文件頭信息，這些信息給出對文件進(jìn)行讀寫和解釋的方法。不同的文件格式在分辨率、位元深度、彩色功能以及對壓縮的支持和元數(shù)據(jù)的析出方法等方面會有所不同。

數(shù)字主文檔采用的文件格式應(yīng)該支持所需的分辨率、位元深度、顏色信息和元數(shù)據(jù)。例如，如果采用的數(shù)字主文檔的文件格式不支持8位以上位元深度的圖像，那么掃描為全彩色圖像就失去了意義。另外，數(shù)字主文檔的文件格式應(yīng)該是開放的、廣泛支持的和跨平臺兼容的，因為這樣的文檔格式有利于數(shù)據(jù)交換，且生命周期長。目前絕大多數(shù)數(shù)字化項目采用TIFF格式來保存數(shù)字化主文檔，并使用其他格式來保存數(shù)字主文檔的各類副本。

4 圖像壓縮

數(shù)字化生產(chǎn)產(chǎn)生的數(shù)字圖像一般都比較大，不利于計算機處理和網(wǎng)絡(luò)傳輸，為此，數(shù)字化項目常常需要采用一定的技術(shù)對其進(jìn)行壓縮。所有壓縮技術(shù)都是基于一些復(fù)雜算法，將未壓縮的數(shù)字圖像中的二進(jìn)制代碼串縮減為一種數(shù)學(xué)縮略形式。

壓縮技術(shù)有標(biāo)準(zhǔn)和專用之分。一般來講，使用一種得到廣泛支持的標(biāo)準(zhǔn)壓縮技術(shù)比使用專用壓縮技術(shù)更有利，雖然后者有時可能會提供更有效的壓縮或更好的質(zhì)量，但從數(shù)字資源長期保存和應(yīng)用的角度，標(biāo)準(zhǔn)壓縮技術(shù)更可靠，效率更高。

從壓縮前后文件中信息量的損失角度，壓縮技術(shù)又分為無損壓縮（如ITU-T.6）和有損壓縮(或稱失真壓縮)（如JPEG）兩類。無損壓縮利用數(shù)據(jù)的統(tǒng)計冗余進(jìn)行壓縮,數(shù)據(jù)“解壓縮”后，完全恢復(fù)到原來狀態(tài),與原文件比特對比特地一致,不會導(dǎo)致任何失真，但壓縮率受到數(shù)據(jù)統(tǒng)計冗余度的限制。GIF、TIFF和PNG格式都支持無損壓縮。

有損壓縮利用了人類視覺對圖像中的某些頻率成分不敏感的特性,對一些最不重要的信息進(jìn)行了平均化處理或者舍棄。所以,有損壓縮可以認(rèn)為是“視覺無損”（在視覺效果上察覺不到損傷）。有損壓縮中,壓縮程度的不同對圖像的質(zhì)量效果影響不同,一些新興的壓縮方法允許從一個圖像生成多種分辨率的圖像,從而使得圖像交付和呈現(xiàn)給最終用戶時,具有一定的靈活性。

在信息資源數(shù)字化項目實施過程中,無損壓縮常用于印刷文本的黑白掃描，有損壓縮則用于色調(diào)圖像（尤其是連續(xù)色調(diào)圖像）的掃描。因為后者僅僅靠簡化信息并不能明顯地節(jié)省圖像所占的空間。目前，越來越多的數(shù)字化項目將其生產(chǎn)的數(shù)字主文檔采取不壓縮或無損壓縮方式存儲，而各種副本則采用有損壓縮方式保存并向用戶提供各種服務(wù)。

雖然有損壓縮被認(rèn)為“視覺無損”，但對數(shù)字圖像質(zhì)量的影響是明顯的,尤其是壓縮比率高的時候。另外,有損壓縮會導(dǎo)致圖像質(zhì)量的“世襲”性降低（即,基于有損壓縮圖像進(jìn)行再次有損壓縮操作時,產(chǎn)生的新圖像質(zhì)量會更低）,這也是數(shù)字主文檔不采用有損壓縮存儲的原因之一。

5 圖像增強處理

圖像增強處理可以提高掃描后的圖像質(zhì)量。這類處理一般包括去除網(wǎng)紋、去除斑點、糾正偏斜、銳化、使用定制濾波器以及位元深度調(diào)整等。所用的處理工具是圖像掃描加工軟件或圖像編輯軟件。

但是，圖像增強處理的使用引起了人們對圖像真實性和真實度的關(guān)注。所以,越來越多的數(shù)字化項目不贊成對數(shù)字化主文檔圖像進(jìn)行增強處理,增強處理僅局限在由數(shù)字主文檔派生的各種副本上使用。

6 操作人員

掃描操作人員的技能與工作狀態(tài)會對數(shù)字圖像的質(zhì)量產(chǎn)生影響。比如,在黑白掃描模式中，閾值的設(shè)定會對圖像質(zhì)量產(chǎn)生影響，而該項操作是由操作人員通過判斷來實施的,如果設(shè)定得當(dāng),可以最大限度地減少線條失落或線條粘連現(xiàn)象,否則會導(dǎo)致圖像質(zhì)量的降低。再如，當(dāng)使用數(shù)碼相機對三維實物型信息資源進(jìn)行數(shù)字化拍照時,照明是影響數(shù)字圖像質(zhì)量的一個重要因素,攝影師的技能則是實施照明效果的關(guān)鍵。

［1］ Cornell University Library.Attributes for Common Compression Techniques. ［2011-01-19］.http://www.library.cornell.edu/preservation/tutorial/presentation/table7-3.html.

［2］ CornellUniversityLibrary.CommonImageFileFormats.［2010-12-09］..http://www.library.cornell.edu/preservation/tutorial/presentation/table7-1.html.

［3］ Cornell University Library.THE CASE FOR CREATING A RICH DIGITAL MASTER.［2010-10-06］.http://www.library.cornell.edu/pres ervation/tutorial/conversion/ conversion-03.html.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡