国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

信息資源數(shù)字化生產(chǎn)質(zhì)量的影響因素分析

2011-04-13 02:46:17申雪克
河南圖書館學(xué)刊 2011年4期
關(guān)鍵詞:數(shù)字圖像色調(diào)文檔

申雪克

(南陽理工學(xué)院圖書館,河南 南陽 473061)

筆者基于對信息資源數(shù)字化生產(chǎn)項目的考察與分析,得出影響數(shù)字圖像質(zhì)量的生產(chǎn)因素主要有掃描分辨率、位元深度、文件格式、圖像壓縮、圖像增強處理和數(shù)字化生產(chǎn)操作的人員等。

1 分辨率

分辨率是一種識別空間細(xì)節(jié)的能力,是決定數(shù)字圖像質(zhì)量的最重要因素之一。數(shù)字圖像采樣時所使用的空間頻率(采樣頻率)常常是分辨率的一個重要指標(biāo)。因此,dpi(每英寸取樣的點數(shù))和ppi(每英寸取樣的像素數(shù))常常用來表示數(shù)字圖像的分辨率。通常情況下,增加采樣頻率有助于提高分辨率。但是,無論是多高的分辨率,圖像放大到一定程度后,仍可看到構(gòu)成圖像的單個像素。

對于數(shù)字化掃描設(shè)備來說,掃描分辨率表示掃描儀在既定文檔中捕獲像素的模式與數(shù)量,它決定了從原始文獻(xiàn)中所采集信息的精細(xì)程度,掃描分辨率越高,所獲得的圖像越精細(xì)。掃描階段,應(yīng)盡可能多地捕獲原始文獻(xiàn)信息,以便在后面的轉(zhuǎn)換處理、打印輸出過程中即使丟失部分信息,仍然可以保持一定的圖像信息總量,保證數(shù)字圖像的相應(yīng)品質(zhì)。

但是,提高分辨率有一個“度”的問題,當(dāng)超過這個“度”時,分辨率的增加無助于數(shù)字圖像質(zhì)量的提高,只能導(dǎo)致文件體積的增大,增加生產(chǎn)成本。關(guān)鍵問題在于尋找到抓取原始文獻(xiàn)所有有價值信息所需的分辨率。

事實上,不存在一個“完美無缺”的分辨率用來掃描所有類型的信息資源。因此,掃描分辨率的設(shè)置沒有統(tǒng)一的尺度,主要取決于被掃描的文獻(xiàn)原稿、掃描需求以及圖像處理要求等。一般認(rèn)為,最佳掃描分辨率應(yīng)該界定為,在輸出的數(shù)字圖像中,能夠保證最小字符或最有意義的信息清晰可讀。但這在實際工作中常常難以確定。首先,就最小字符而言,對于印刷文本,最小的字符常常是上標(biāo)、腳注等,但手稿的最小字符就難以確定,影響手稿字跡清晰可讀的因素很多,如墨色濃淡、字跡大小等等。其次,最有意義的信息的確定取決于數(shù)字圖像的用途與用戶的主觀判斷。比如,對于照片、圖片和地圖等文獻(xiàn),最有意義的信息就很難確定,一幅圖片上哪個信息更為重要,是隨使用目的(欣賞、作為證據(jù)、還是用于資料)以及用戶需求(普通用戶、研究人員、鑒賞家等)而變化的。

掃描分辨率的確定還得考慮輸出的圖像文件是否需要光學(xué)識別。分辨率設(shè)置不當(dāng),低版本的OCR可能根本無法識別文字材料。對于不同的掃描模式,OCR的識別能力與要求也不同。盡管目前OCR軟件一般都具有識別彩色稿件的功能,但從效果看,黑白掃描模式的識別率較高。對于大多數(shù)黑白掃描的印刷型文本,300dpi是可以進(jìn)行OCR識別的最低值,若被掃描的文獻(xiàn)字體太小,分辨率就需增加,特別小的字體要增加到600dpi才可較好地進(jìn)行OCR識別。反之,被掃描的字體大,分辨率可考慮減少。對于灰色模式的掃描,OCR對掃描分辨率的要求不宜低于200dpi。盡管今天的OCR技術(shù)還存在諸多不盡人意的地方,但光學(xué)字符識別代表了數(shù)字掃描與圖像處理同時進(jìn)行的發(fā)展趨勢。

另外,在黑白掃描模式中,還有一個“閾值”的設(shè)定問題。不同的“閾值”點(0~256 之間,0 表示“黑”,256表示“白”)將決定捕捉到的灰度值是被轉(zhuǎn)換成黑像素還是白像素。所以,同一臺掃描儀以同樣的分辨率進(jìn)行掃描,“閾值”的設(shè)定不同,掃描效果可能很不一樣。

2 位元深度

位元深度是指定義每個像素所用的位數(shù)。位元深度值越大,能夠表現(xiàn)的色調(diào)數(shù)量就越多。位元深度直接影響數(shù)字圖像的形態(tài)。數(shù)字圖像的形態(tài)有黑白(或稱雙調(diào))、灰色或彩色三種。

2.1 黑白圖像

每個像素由一個位構(gòu)成,而一個位可以表示兩種色調(diào)(一般是“黑”與“白”),如用 0表示黑,則 1表示白,反之亦然。

2.2 灰色圖像

由多個位(一般是2~8個位或更多位)的信息所表現(xiàn)的像素所構(gòu)成。比如,在一幅2位圖像中,有四種可能的組合:00、01、10、11。如果用“00”表示黑,“11”表示白,那么“01”便是深灰,“10”便是淺灰。位元深度為2,能夠表現(xiàn)的色調(diào)數(shù)量為22,即4。如果位元深度是8,則每個像素能夠有28(256)種不同的色調(diào)。

2.3 彩色圖像

通常由8~24或更多的位來表現(xiàn)的圖像。就24位元深度的圖像(一般稱RGB)而言,位元常分為三組:8位紅、8位綠、8位藍(lán)。這些位組合起來表現(xiàn)相應(yīng)的顏色。一幅24位的圖像,可以提供1670多萬(224)色調(diào)值。越來越多的掃描儀以每個頻道10或10以上的位元深度來捕獲圖像,但常常輸出是8位,以補償掃描儀中的“噪波”,輸出更接近人的視覺圖像。

3 文件格式

文件格式中包括了文件信息和文件頭信息,這些信息給出對文件進(jìn)行讀寫和解釋的方法。不同的文件格式在分辨率、位元深度、彩色功能以及對壓縮的支持和元數(shù)據(jù)的析出方法等方面會有所不同。

數(shù)字主文檔采用的文件格式應(yīng)該支持所需的分辨率、位元深度、顏色信息和元數(shù)據(jù)。例如,如果采用的數(shù)字主文檔的文件格式不支持8位以上位元深度的圖像,那么掃描為全彩色圖像就失去了意義。另外,數(shù)字主文檔的文件格式應(yīng)該是開放的、廣泛支持的和跨平臺兼容的,因為這樣的文檔格式有利于數(shù)據(jù)交換,且生命周期長。目前絕大多數(shù)數(shù)字化項目采用TIFF格式來保存數(shù)字化主文檔,并使用其他格式來保存數(shù)字主文檔的各類副本。

4 圖像壓縮

數(shù)字化生產(chǎn)產(chǎn)生的數(shù)字圖像一般都比較大,不利于計算機處理和網(wǎng)絡(luò)傳輸,為此,數(shù)字化項目常常需要采用一定的技術(shù)對其進(jìn)行壓縮。所有壓縮技術(shù)都是基于一些復(fù)雜算法,將未壓縮的數(shù)字圖像中的二進(jìn)制代碼串縮減為一種數(shù)學(xué)縮略形式。

壓縮技術(shù)有標(biāo)準(zhǔn)和專用之分。一般來講,使用一種得到廣泛支持的標(biāo)準(zhǔn)壓縮技術(shù)比使用專用壓縮技術(shù)更有利,雖然后者有時可能會提供更有效的壓縮或更好的質(zhì)量,但從數(shù)字資源長期保存和應(yīng)用的角度,標(biāo)準(zhǔn)壓縮技術(shù)更可靠,效率更高。

從壓縮前后文件中信息量的損失角度,壓縮技術(shù)又分為無損壓縮(如ITU-T.6)和有損壓縮(或稱失真壓縮)(如JPEG)兩類。無損壓縮利用數(shù)據(jù)的統(tǒng)計冗余進(jìn)行壓縮,數(shù)據(jù)“解壓縮”后,完全恢復(fù)到原來狀態(tài),與原文件比特對比特地一致,不會導(dǎo)致任何失真,但壓縮率受到數(shù)據(jù)統(tǒng)計冗余度的限制。GIF、TIFF和PNG格式都支持無損壓縮。

有損壓縮利用了人類視覺對圖像中的某些頻率成分不敏感的特性,對一些最不重要的信息進(jìn)行了平均化處理或者舍棄。所以,有損壓縮可以認(rèn)為是“視覺無損”(在視覺效果上察覺不到損傷)。有損壓縮中,壓縮程度的不同對圖像的質(zhì)量效果影響不同,一些新興的壓縮方法允許從一個圖像生成多種分辨率的圖像,從而使得圖像交付和呈現(xiàn)給最終用戶時,具有一定的靈活性。

在信息資源數(shù)字化項目實施過程中,無損壓縮常用于印刷文本的黑白掃描,有損壓縮則用于色調(diào)圖像(尤其是連續(xù)色調(diào)圖像)的掃描。因為后者僅僅靠簡化信息并不能明顯地節(jié)省圖像所占的空間。目前,越來越多的數(shù)字化項目將其生產(chǎn)的數(shù)字主文檔采取不壓縮或無損壓縮方式存儲,而各種副本則采用有損壓縮方式保存并向用戶提供各種服務(wù)。

雖然有損壓縮被認(rèn)為“視覺無損”,但對數(shù)字圖像質(zhì)量的影響是明顯的,尤其是壓縮比率高的時候。另外,有損壓縮會導(dǎo)致圖像質(zhì)量的“世襲”性降低(即,基于有損壓縮圖像進(jìn)行再次有損壓縮操作時,產(chǎn)生的新圖像質(zhì)量會更低),這也是數(shù)字主文檔不采用有損壓縮存儲的原因之一。

5 圖像增強處理

圖像增強處理可以提高掃描后的圖像質(zhì)量。這類處理一般包括去除網(wǎng)紋、去除斑點、糾正偏斜、銳化、使用定制濾波器以及位元深度調(diào)整等。所用的處理工具是圖像掃描加工軟件或圖像編輯軟件。

但是,圖像增強處理的使用引起了人們對圖像真實性和真實度的關(guān)注。所以,越來越多的數(shù)字化項目不贊成對數(shù)字化主文檔圖像進(jìn)行增強處理,增強處理僅局限在由數(shù)字主文檔派生的各種副本上使用。

6 操作人員

掃描操作人員的技能與工作狀態(tài)會對數(shù)字圖像的質(zhì)量產(chǎn)生影響。比如,在黑白掃描模式中,閾值的設(shè)定會對圖像質(zhì)量產(chǎn)生影響,而該項操作是由操作人員通過判斷來實施的,如果設(shè)定得當(dāng),可以最大限度地減少線條失落或線條粘連現(xiàn)象,否則會導(dǎo)致圖像質(zhì)量的降低。再如,當(dāng)使用數(shù)碼相機對三維實物型信息資源進(jìn)行數(shù)字化拍照時,照明是影響數(shù)字圖像質(zhì)量的一個重要因素,攝影師的技能則是實施照明效果的關(guān)鍵。

[1] Cornell University Library.Attributes for Common Compression Techniques. [2011-01-19].http://www.library.cornell.edu/preservation/tutorial/presentation/table7-3.html.

[2] CornellUniversityLibrary.CommonImageFileFormats.[2010-12-09]..http://www.library.cornell.edu/preservation/tutorial/presentation/table7-1.html.

[3] Cornell University Library.THE CASE FOR CREATING A RICH DIGITAL MASTER.[2010-10-06].http://www.library.cornell.edu/pres ervation/tutorial/conversion/ conversion-03.html.

猜你喜歡
數(shù)字圖像色調(diào)文檔
有人一聲不吭向你扔了個文檔
湖光水色調(diào)
色調(diào)會說話
童話世界(2019年14期)2019-06-25 10:11:46
分離色調(diào)與色調(diào)曲線
ARGUS-100 藝術(shù)品鑒證數(shù)字圖像比對系統(tǒng)
基于RI碼計算的Word復(fù)制文檔鑒別
In Spring!春之色調(diào)
Coco薇(2016年4期)2016-04-06 02:00:19
基于塊效應(yīng)測度的JPEG數(shù)字圖像盲取證
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
數(shù)字圖像修復(fù)在圖像壓縮上的應(yīng)用
機械與電子(2014年1期)2014-02-28 02:07:31
墨脱县| 墨江| 渝北区| 天镇县| 阜平县| 正蓝旗| 营口市| 红河县| 烟台市| 板桥市| 丹棱县| 高邮市| 江永县| 蒲城县| 浦江县| 巴塘县| 香河县| 铜鼓县| 绥芬河市| 盐源县| 台江县| 永州市| 平江县| 武冈市| 德州市| 上林县| 利辛县| 天镇县| 清涧县| 古丈县| 乌审旗| 万州区| 察哈| 东海县| 延安市| 五台县| 九江县| 林州市| 宜城市| 阿坝县| 噶尔县|