張海燕
(南京信息工程大學(xué),210044)
?
IQA在數(shù)字化文獻(xiàn)質(zhì)量評(píng)估中的應(yīng)用研究
張海燕
(南京信息工程大學(xué),210044)
IQA(Image Quality Assessment圖像質(zhì)量評(píng)價(jià))是一種測評(píng)數(shù)字化文獻(xiàn)質(zhì)量優(yōu)劣的客觀方法。文章利用IQA對(duì)不同掃描模式、不同掃描分辨率獲得的數(shù)字化文獻(xiàn)分別進(jìn)行圖像質(zhì)量測值和文字識(shí)別錯(cuò)誤測值,結(jié)合圖表對(duì)測值進(jìn)行了波動(dòng)分析。研究發(fā)現(xiàn),數(shù)字化文獻(xiàn)的質(zhì)量高低并非完全取決于掃描分辨率,在常規(guī)的黑白、4階灰度掃描模式下,并非掃描分辨率越高,圖像質(zhì)量就越好,而是當(dāng)分辨率取200 - 400 DPI時(shí)獲得的圖像質(zhì)量測值最低而圖像質(zhì)量最好。基于測值的波動(dòng)分析,進(jìn)一步給出了文獻(xiàn)數(shù)字化在不同模式下比較理想的掃描分辨率范圍。
文獻(xiàn)數(shù)字化;文獻(xiàn)掃描;IQA; 圖像質(zhì)量評(píng)估
隨著科技的進(jìn)步,電子文獻(xiàn)的興起打破了紙質(zhì)文獻(xiàn)長期一統(tǒng)天下的局面。對(duì)于非再生性的古籍文獻(xiàn)、拓片、甲骨、家譜、輿圖、手稿、地圖、書籍、樂譜等,如何能夠更好地得到傳承使用及保存,如何能夠被更廣泛地閱讀,文獻(xiàn)數(shù)字化技術(shù)應(yīng)該說是解決這一難題的有效途徑[1]。文獻(xiàn)的數(shù)字化過程一般是從掃描文獻(xiàn)開始,然后對(duì)掃描的圖像做進(jìn)一步預(yù)處理,最后形成電子文檔。雖然技術(shù)上還存在著標(biāo)準(zhǔn)的多樣性與需求的單一性的矛盾等問題,但是文獻(xiàn)數(shù)字化技術(shù)也已經(jīng)逐漸形成了一定的技術(shù)標(biāo)準(zhǔn),然而對(duì)數(shù)字化文獻(xiàn)的質(zhì)量進(jìn)行評(píng)估的研究卻并不多見,目前大部分研究主要集中在圖像質(zhì)量評(píng)價(jià)上[2]。
最近十幾年,電子文獻(xiàn)直接采用文本文檔,不但閱讀方便,而且可以直接拷貝引用。然而不管是紙質(zhì)文獻(xiàn),還是電子文檔,讀者都是通過眼睛閱讀頁面的文獻(xiàn)直接獲取其中的信息,頁面質(zhì)量越好,讀者閱讀起來就越舒服?;贗QA的數(shù)字化文獻(xiàn)質(zhì)量評(píng)估,就是根據(jù)人眼的生理特性和人的視覺心理,提出基于圖像質(zhì)量評(píng)價(jià)體系的文獻(xiàn)數(shù)字化理論依據(jù)和操作方法,對(duì)不同掃描模式下的數(shù)字化文獻(xiàn)的質(zhì)量進(jìn)行客觀分析,根據(jù)文獻(xiàn)來源科學(xué)地確定掃描模式和掃描分辨率,提高了文獻(xiàn)數(shù)字化質(zhì)量。
2.1 數(shù)字化文獻(xiàn)質(zhì)量的基本要求
文獻(xiàn)數(shù)字化不但對(duì)文獻(xiàn)有保護(hù)作用,同時(shí)也有利于文獻(xiàn)的利用和研究[3]。東南大學(xué)朱成林等認(rèn)為在古籍文獻(xiàn)數(shù)字化過程中,OCR(optical character register,光學(xué)字符識(shí)別)等技術(shù)的識(shí)別正確率不高,導(dǎo)致研究效率低下,不同機(jī)構(gòu)開發(fā)的古籍?dāng)?shù)據(jù)庫的質(zhì)量差距也較大,為保障研究的可信度,研究者在參考數(shù)字文獻(xiàn)的過程中依然需要與紙本原文進(jìn)行對(duì)照[4]。要解決這一問題,數(shù)字化后的電子文獻(xiàn)就必須符合兩個(gè)基本要求:(1)文本能夠拷貝引用。如果文獻(xiàn)不能被直接拷貝引用,還需手工輸入,就會(huì)使得文獻(xiàn)的利用研究效能大為降低。(2)文本清晰,閱讀舒服。要求數(shù)字化后的文獻(xiàn)能夠符合人眼的生理特性和人的視覺心理,讀者無需再參考紙本文獻(xiàn),在閱讀電子文獻(xiàn)時(shí)的感覺和閱讀原有的紙質(zhì)文獻(xiàn)一樣清晰舒服。不管是數(shù)字化文獻(xiàn),還是純文本的電子文獻(xiàn),必須符合上述兩個(gè)基本要求,讀者才會(huì)接受并愿意典藏起來。
文獻(xiàn)能夠拷貝引用涉及到OCR技術(shù)。如何降低OCR的文字識(shí)別錯(cuò)誤率,提高OCR圖像質(zhì)量值是問題的關(guān)鍵。文獻(xiàn)能夠舒服清晰地閱讀涉及到人眼的視覺特性和圖像質(zhì)量。文獻(xiàn)的圖像質(zhì)量是首要的,即使是純文本的電子文獻(xiàn)。
2.2 影響OCR準(zhǔn)確率的主要因素
OCR這一概念最早于1929年由德國科學(xué)家Tausheck提出[5]。隨后美國科學(xué)家Handel描述了利用光學(xué)技術(shù)對(duì)文字進(jìn)行識(shí)別的概念模型。OCR技術(shù)即是利用光學(xué)技術(shù)對(duì)文字和字符進(jìn)行掃描識(shí)別,并將其轉(zhuǎn)化為計(jì)算機(jī)內(nèi)碼的技術(shù)。影響OCR準(zhǔn)確率的主要因素包括:
(1)OCR軟件的性能。不同的OCR軟件有著不同的性能,導(dǎo)致這種差異的原因是多方面的,其中最主要的原因是軟件開發(fā)和傳承方面。起步早、技術(shù)力量雄厚的軟件公司,OCR軟件的內(nèi)核模式、特征提取等方面有著明顯的優(yōu)勢,其軟件的文字識(shí)別準(zhǔn)確率會(huì)遠(yuǎn)遠(yuǎn)高于其它一些起步晚、實(shí)力小的公司。
一款好的OCR軟件,其高性能不僅體現(xiàn)在版面分析、邊緣提取、傾斜校正、去噪、對(duì)灰度圖像二值化、對(duì)二值圖像偽灰度化等圖像的預(yù)處理方面,同時(shí)在樣本字庫的建立、文本行字的切分、預(yù)分類、特征提取、匹配方法、細(xì)分類、識(shí)別字典、詞句確認(rèn)等文字識(shí)別方面,性能也會(huì)高于一般的OCR軟件,尤其在表格、字體識(shí)別等細(xì)節(jié)方面優(yōu)勢明顯。
CHIP全球測試中心中國實(shí)驗(yàn)室在2000年便對(duì)中國6款著名的中文OCR軟件從圖像預(yù)處理、版面分析、理解、文字塊檢出、文字的行、字切分、圖像文字的規(guī)范化、文字特征的提取、與特征庫比較分類、判別、后處理等各個(gè)方面進(jìn)行了重點(diǎn)測試。測試結(jié)果:漢王OCR新世紀(jì)專業(yè)版以其令人信服的高識(shí)別率遙遙領(lǐng)先,尚書五號(hào)OCR增強(qiáng)版與漢王 OCR新世紀(jì)專業(yè)版使用的是同一個(gè)程序內(nèi)核,也擁有極高的識(shí)別率。此外,丹青中英文文件辨識(shí)系統(tǒng)V4.0、清華紫光OCRMF7.5、清華文通TH-OCRMF7.5等,也被廣泛應(yīng)用。
(2)文獻(xiàn)的來源。數(shù)字化文獻(xiàn)的來源很多,不同來源的數(shù)字化文獻(xiàn)有著不同的特質(zhì),需要不同特質(zhì)的OCR軟件與之配套。如,針對(duì)發(fā)黃的古籍善本需要注意標(biāo)點(diǎn)符號(hào)的識(shí)別,繁體字、通假字等字體的轉(zhuǎn)換[6];對(duì)于陳舊版本的樂譜則需要注意音符的附點(diǎn)、連線的識(shí)別,必須利用計(jì)算機(jī)光學(xué)樂譜識(shí)別技術(shù)(OMR),把樂譜圖像自動(dòng)轉(zhuǎn)化為通用的數(shù)字音樂格式[7];票據(jù)的OCR識(shí)別對(duì)識(shí)別結(jié)果的精度要求很高,誤識(shí)率理論上要求趨近于零,識(shí)別對(duì)象較少,主要集中于金額、日期、賬號(hào)[8]。因此,針對(duì)不同待識(shí)別對(duì)象,采用不同“特質(zhì)”的OCR軟件,文字識(shí)別的準(zhǔn)確率將大大提高。
(3)數(shù)字化設(shè)備設(shè)置。文獻(xiàn)數(shù)字化采用的設(shè)備主要是掃描儀。針對(duì)不同的文獻(xiàn),掃描儀如何設(shè)置,掃描模式、掃描分辨率如何確定,是影響數(shù)字化文獻(xiàn)質(zhì)量的重要因素,也是提高數(shù)字化文獻(xiàn)質(zhì)量的關(guān)鍵。
2.3 基于人眼視覺特性的圖像質(zhì)量評(píng)價(jià)
由于人眼是圖像的最終觀測者, 所以主觀圖像質(zhì)量評(píng)價(jià)方法是惟一最準(zhǔn)確的方法,傳統(tǒng)的圖像質(zhì)量評(píng)價(jià)算法由于沒有充分考慮人眼的視覺特性,使得質(zhì)量評(píng)價(jià)結(jié)果與實(shí)際圖像的人眼感知質(zhì)量不符[9]?;谌搜垡曈X特性的圖像質(zhì)量評(píng)價(jià)就是根據(jù)人眼對(duì)圖像邊緣信息非常敏感這一特性,通過比較失真彩色圖像與原始參考圖像的邊緣,以及除邊緣之外的背景相似程度,最終確定失真圖像的質(zhì)量,這樣的評(píng)價(jià)結(jié)果更接近圖像的實(shí)際視覺感知質(zhì)量。
2.4 IQA在測量文獻(xiàn)質(zhì)量中的應(yīng)用
2.4.1 IQA原理簡述
在自然界中,自然場景內(nèi)本身具備大量的平坦區(qū)域和豐富的邊緣和輪廓信息,其頻率分布有一定的規(guī)律——人類大腦皮層細(xì)胞的響應(yīng)與自然場景的統(tǒng)計(jì)信息呈對(duì)數(shù)關(guān)系[10]。自然場景中的平坦區(qū)域以及邊緣和輪廓的關(guān)系,首先表現(xiàn)在空間上相關(guān),即:圖像空間上相鄰的像素點(diǎn)有著相似的灰度值,像素點(diǎn)在空間上離得越遠(yuǎn),兩者灰度值差異越大。如果一個(gè)像素點(diǎn)越亮,則相鄰的像素點(diǎn)也越亮,隨著像素間間距的加大,相關(guān)性隨之降低。根據(jù)自然圖像的變換不變性,借助傅里葉變換,可以從像素的亮度和坐標(biāo)的相關(guān)性中恢復(fù)出圖像的“自然性”。
考察數(shù)字化文獻(xiàn)的質(zhì)量,就是考察文獻(xiàn)中每個(gè)頁面的圖像質(zhì)量。每個(gè)頁面的圖像并非是掃描儀直接掃描館藏文獻(xiàn)而成,還必須經(jīng)過傾斜、二值化等圖像預(yù)處理環(huán)節(jié),最后才能形成數(shù)字化文獻(xiàn)[11]。無論掃描儀的質(zhì)量多么高、圖像預(yù)處理環(huán)節(jié)多么完美,與原文獻(xiàn)資料相比,用戶所看到的數(shù)字化文獻(xiàn)總是存在或多或少的失真。圖像的失真不是人們所期望的,但利用人眼的視覺特性,建立相應(yīng)的圖像質(zhì)量評(píng)估(IQA)模型可以評(píng)估這些失真。失真越大的圖像質(zhì)量越差,反之,圖像質(zhì)量越好。利用IQA方法,可以方便地測量出數(shù)字化文獻(xiàn)中每頁圖像的評(píng)估值;并能根據(jù)這些值判斷出圖像的自然度。
2.4.2 IQA測量文獻(xiàn)頁面質(zhì)量
數(shù)字化文獻(xiàn)是由一頁一頁的圖像構(gòu)成的,測定數(shù)字化文獻(xiàn)的頁面質(zhì)量,要把每一頁圖像提取出來,然后利用IQA圖像評(píng)估方法,測定頁面圖像質(zhì)量值。
數(shù)字化文獻(xiàn)頁面的提取采用PDF Image Extraction Wizard,可以批量通篇提取,也可以設(shè)定頁碼范圍提取圖像頁面。電子文本文獻(xiàn)盡管本質(zhì)上不是圖像,但因?yàn)樽詈蟮娘@示是借助于字符碼調(diào)用系統(tǒng)字庫圖像,所以最終仍是以圖像形式展現(xiàn)在用戶的面前,字符圖像和背景構(gòu)成的畫面就是讀者閱讀的圖像。這種圖像如果質(zhì)量差,用戶閱讀不舒服,就會(huì)影響文獻(xiàn)的閱讀效果。用戶的閱讀界面就是IQA要評(píng)估的圖像,因此可以通過屏幕截圖,采樣歸檔。
3.1 多種模式下的數(shù)字化文獻(xiàn)測量
數(shù)字化文獻(xiàn)的圖像質(zhì)量,就是文獻(xiàn)每個(gè)頁面的圖像質(zhì)量的平均。每個(gè)頁面的圖像質(zhì)量雖然跟原有文獻(xiàn)的質(zhì)量有著直接關(guān)系,但數(shù)字化過程中掃描模式的設(shè)置以及頁面的預(yù)處理,也在很大程度上影響著一幅圖像的質(zhì)量。這里采用HP服務(wù)器的廣告頁面作為數(shù)字化的源文獻(xiàn),頁面為奶油背景色,文字有黑白的、有彩色的,還有internet網(wǎng)址,是測量數(shù)字化的良好選擇。掃描儀是方正z3000,其分辨率是1600x1600dpi。選用清華同方的Cajviewer測量OCR文字識(shí)別準(zhǔn)確率。圖像質(zhì)量的測量采用MATLAB平臺(tái)上的全盲圖像測量軟件Natural Image Quality Evaluator (NIQE)[12]。
利用NSS像素和相鄰像素之間的對(duì)數(shù)規(guī)律及圖像與距離預(yù)測系數(shù)矩陣,得出了較好的圖像質(zhì)量評(píng)估值,建立了客觀評(píng)估值與圖像內(nèi)容的相關(guān)性,而且運(yùn)算方便,精度高。
掃描時(shí)共分七個(gè)分辨等級(jí),分別是75、100、200、300、400、600、1200(DPI),掃描模式分4個(gè)等級(jí),即黑白(bw)、四階灰色(gray)、256彩色(8bit)、真彩色(24bit)。所有的掃描圖像都用PHOTOSHOP傾斜矯正、頁面切割等預(yù)處理,以避免次要因素影響到最終的結(jié)果評(píng)析。這些掃描圖像最終形成PDF格式的文獻(xiàn),以便閱讀和測量。
軟件在進(jìn)行OCR識(shí)別時(shí),能夠識(shí)別半個(gè)字符或者大句號(hào)識(shí)別為小句號(hào)的,文字錯(cuò)誤值設(shè)定為0.5。圖像質(zhì)量的測量值越小表示圖像質(zhì)量越高。得到的圖像質(zhì)量測量值如表1所示,文字識(shí)別錯(cuò)誤值如表2所示。
表1 圖像質(zhì)量測量值
表2 文字識(shí)別錯(cuò)誤值
3.2 測量結(jié)果評(píng)析
為了直觀、方便地分析測量結(jié)果,下面給出了圖像質(zhì)量測量值和文字識(shí)別錯(cuò)誤值的二維坐標(biāo)圖,如圖1、圖2所示。
根據(jù)圖1和圖2的結(jié)果分析,不難得出以下結(jié)論:
(1)從圖1可以看出掃描模式為bw黑白模式下,掃描分辨率設(shè)為200DPI,圖像質(zhì)量值最低,表明此時(shí)圖像質(zhì)量最佳,隨著分辨率的增高反而圖像質(zhì)量值增大,圖像質(zhì)量越差;對(duì)于gray灰度模式、8bit彩色模式、256bit真彩模式下,掃描分辨率在600DPI處,圖像質(zhì)量值最低,圖像質(zhì)量最佳。因此對(duì)于不同類型的文獻(xiàn),為了保證數(shù)字化后文獻(xiàn)質(zhì)量,可以采用不同的分辨率。如水墨畫、油畫等的數(shù)字化,掃描模式分辨率可以選擇600DPI以上,同時(shí)選擇真彩模式。而黑白的純文本(包含發(fā)黃的古籍文獻(xiàn))類型的數(shù)字化,分辨率可以選擇200至400DPI之間,甚至只考慮200DPI的分辨率。
圖1 圖像質(zhì)量值
圖2 文字識(shí)別錯(cuò)誤率
(2)從圖2可以看出,分辨率在75-200DPI之間時(shí),各種掃描模式的文字識(shí)別錯(cuò)誤個(gè)數(shù)均產(chǎn)生了一個(gè)很大的躍變,分辨率在75DPI處的文字識(shí)別錯(cuò)誤個(gè)數(shù)甚至遠(yuǎn)遠(yuǎn)超過19;掃描分辨率在200-400DPI之間,圖像質(zhì)量整體比較穩(wěn)定,但是文獻(xiàn)掃描模式設(shè)為8bit彩色模式時(shí),分辨率在300DPI處文字的識(shí)別錯(cuò)誤個(gè)數(shù)發(fā)生明顯躍變,故應(yīng)避免將分辨率設(shè)在300DPI附近;當(dāng)分辨率設(shè)在400DPI-1200DPI之間時(shí),黑白、灰度及彩色模式下文獻(xiàn)識(shí)別錯(cuò)誤率都很理想,近乎為零,但掃描模式為24bit真彩色模式,掃描分辨率在600DPI處文字的錯(cuò)誤率發(fā)生明顯的躍變。這主要是由于掃描儀內(nèi)核軟件插值所致,因此24bit真彩色模式下分辨率設(shè)為300-400DPI或1200DPI時(shí)文獻(xiàn)質(zhì)量最優(yōu)。因此,在實(shí)際工作中進(jìn)行文獻(xiàn)數(shù)字化時(shí),需要考慮機(jī)器分辨率的范圍,掃描分辨率也必須避開掃描儀內(nèi)核軟件插值后的分辨率,不能簡單地認(rèn)為數(shù)字化時(shí)分辨率越高文獻(xiàn)質(zhì)量越好。
(3)數(shù)字化工作可以從質(zhì)量評(píng)估開始。在實(shí)際進(jìn)行數(shù)字化工作時(shí),應(yīng)首先進(jìn)行源文獻(xiàn)的質(zhì)量評(píng)估,然后進(jìn)行不同掃描模式下文獻(xiàn)質(zhì)量測評(píng);根據(jù)測評(píng)結(jié)果再進(jìn)行大規(guī)模的數(shù)字化。不同模式的文獻(xiàn)質(zhì)量測量值可以相互參考,但不能直接比較,如黑白的圖像質(zhì)量值是19,真彩色的圖像測量值為13,卻不能表明黑白模式的文獻(xiàn)質(zhì)量比真彩模式的文獻(xiàn)質(zhì)量差。
研究選取圖像的視覺感知重要區(qū)域作為考察對(duì)象,一方面它提供了可靠的線性規(guī)律,另一方面它可以很好的解決客觀評(píng)價(jià)值與圖像內(nèi)容相關(guān)性的問題。原始圖像視覺感知重要區(qū)域的子帶能量在對(duì)數(shù)域內(nèi)具有很強(qiáng)的線性規(guī)律,而失真圖像卻會(huì)破壞這種規(guī)律。以上是比較宏觀的描述,在具體評(píng)價(jià)的時(shí)候,可以從影像各個(gè)波段的最小值、最大值、值域、均值、標(biāo)準(zhǔn)差、波段間的協(xié)方差和相關(guān)系數(shù)等具體定量指標(biāo)進(jìn)行確認(rèn)[14]。
文獻(xiàn)數(shù)字化不但是數(shù)字圖書館實(shí)現(xiàn)的前提條件,也是個(gè)人進(jìn)行科學(xué)研究可以借用的手段。如何保證文獻(xiàn)數(shù)字化能夠閱讀舒服、引用方便是文獻(xiàn)數(shù)字化一直研究的課題。利用IQA(Image Quality Assessment)圖像質(zhì)量評(píng)價(jià)體系對(duì)數(shù)字化文獻(xiàn)的質(zhì)量進(jìn)行評(píng)估,可以為文獻(xiàn)的數(shù)字化提供一種客觀的尺度,可以使得用戶在具體文獻(xiàn)數(shù)字化時(shí)有了精細(xì)的參考。
文獻(xiàn)數(shù)字化要保證理想的質(zhì)量,還必須考慮到不同的文獻(xiàn)類型。文獻(xiàn)類型不一樣,具體數(shù)字化時(shí)的要求也不一樣?;贗QA的數(shù)字化文獻(xiàn)質(zhì)量評(píng)估方法,還可以根據(jù)不同類型的文獻(xiàn),測定出理想?yún)?shù),幫助用戶數(shù)字化時(shí)取得比較好的效果;同樣是書畫,但不同時(shí)期的書畫有著各自的理想系數(shù),這也能使其數(shù)字化時(shí)多一個(gè)參考。
[1] 宋琳琳,李海濤.大型文獻(xiàn)數(shù)字化項(xiàng)目元數(shù)據(jù)互操作調(diào)查與啟示[J].中國圖書館學(xué)報(bào),2012(5):27-38.
[2] 楊勇.圖書館館藏文獻(xiàn)數(shù)字化建設(shè)若干問題的思考[J].大理學(xué)院學(xué)報(bào),2006,5(3):53-57.
[3] 李國新.中國古籍資源數(shù)字化的進(jìn)展與任務(wù)[J].大學(xué)圖書館學(xué)報(bào),2002,20(1):21-26.
[4] 朱成林,袁曦臨.中國古籍的數(shù)字化導(dǎo)讀研究[J].圖書館建設(shè),2014(11):50-55.
[5] 中文OCR軟件橫向評(píng)測 漢字識(shí)別 誰強(qiáng)誰弱?[J].電子計(jì)算機(jī)與外部設(shè)備,2000(5):84-87,89-91,93-94.
[6] 劉金榮.古籍資源數(shù)字化過程中的問題[J].吉林省教育學(xué)院學(xué)報(bào)(下旬),2015(8):144-146.
[7] 王紫劍.館藏陳舊版本樂譜的數(shù)字化與應(yīng)用[J].黑龍江史志,2014(17):278-279.
[8] 張殿東,包常新,溫尚卓.OCR技術(shù)在銀行票據(jù)識(shí)別系統(tǒng)中的應(yīng)用[J].山東科學(xué),2005(2):68-70.
[9] D. J. Field.Relations between the statistics of natural images and the response properties of cortical cells[J]. Journal of Optical Society of American, vol. 4, no. 12, Dec, 1987.
[10] 金波.基于自然圖像信息統(tǒng)計(jì)的無參考圖像質(zhì)量評(píng)估研究[D].無錫:江南大學(xué),2012.
[11] 樓斌.基于NSS與HVS的圖像質(zhì)量評(píng)價(jià)方法研究[D].杭州:浙江大學(xué),2009.
[12] A. Schaaf and J. H. Hateren. Modelling the Power Spectra of Natural Images:statistics and information[J]. Vision research, 1996,36(17):2759-2770.
[13] Naturalness Image Quality Evaluator (NIQE)[EB/OL]. [2015-10-14].http://live.ece.utexas.edu/research/Quality.
[14] 付偉,顧曉東,汪源源. 基于人眼視覺特性的彩色圖像質(zhì)量評(píng)價(jià)[J].微電子學(xué)與計(jì)算機(jī),2010(2):59-63,67.
(責(zé)任編輯:王靖雯)
Research on Image Quality Assessment of Digitalized Document with IQA
ZHANG Hai-yan
(Nanjing University of Information Science and Technology, Nanjing 210044, China)
IQA is an objective method to evaluate the quality of digital documents. In this paper, IQA is used to measure the image quality and text recognition error in different scanning modes and different scanning resolutions. The study finds that the quality level of digital documents is not completely determined by the scan resolutions. In the conventional scanning mode of black-white and fourth order gray-scale, the higher scan resolution doesn’t lead to the better image quality. The best image quality is obtained when its measured value is the lowest with the 200-400 DPI resolution. Based on the analysis of the fluctuation of the measured value, the paper further gives the ideal scanning resolution range of the literature digitization in different modes.
document digitization; document scanning; IQA; Image Quality Assessment
南京信息工程大學(xué)圖書館科技項(xiàng)目(nl-2015001);南京信息工程大學(xué)實(shí)驗(yàn)室開放項(xiàng)目(15KF046)
G255
A
1006-1525(2016)06-0046-05
張海燕,女,館員。
2016-02-22
大學(xué)圖書情報(bào)學(xué)刊2016年6期