国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

靜態(tài)圖像文字提取技術(shù)綜述

2014-12-25 07:52:39姚麗君李浪
電腦知識(shí)與技術(shù) 2014年33期

姚麗君 李浪

摘要:近年來(lái),數(shù)字圖像的數(shù)量急劇上漲。通常數(shù)字圖像中所包含的文字信息對(duì)于圖片內(nèi)容的理解、索引和檢索具有重要意義。該文介紹了計(jì)算機(jī)對(duì)圖像中文字自動(dòng)識(shí)別和提取的主要步驟和技術(shù)難點(diǎn);并提出了在靜態(tài)圖像文字提取技術(shù)中的幾個(gè)設(shè)想。

關(guān)鍵詞:文字提??;靜態(tài)圖像;文字檢測(cè)

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)33-7991-02

Abstract: In recent years, the number of digital images has increased dramatically. Generally speaking, the text information digital image containsis of great significance to understand, index and retrieve the content of the images.Consequently this paperintroduces the the main steps and technical difficulties for a computer torealize automatic recognition and extraction of image texts and at last puts forward some ideas aboutthe techniques of extracting texts from still images.

Key words: text extraction;still image;text detection

1 研究背景

隨著計(jì)算機(jī)科學(xué)的飛速發(fā)展,以圖像為主的多媒體信息迅速成為重要的信息傳遞媒介,在圖像中,文字信息(如新聞標(biāo)題等字幕)包含了豐富的高層語(yǔ)義信息,提取出這些文字,對(duì)于圖像高層語(yǔ)義的理解、索引和檢索非常有幫助。圖像文字提取又分為動(dòng)態(tài)圖像文字提取和靜態(tài)圖像文字提取兩種。其中,靜態(tài)圖像文字提取是動(dòng)態(tài)圖像文字提取的基礎(chǔ),其應(yīng)用范圍更為廣泛,對(duì)它的研究具有基礎(chǔ)性,所以本文主要討論靜態(tài)圖像的文字提取技術(shù)。

2 主要技術(shù)

如何從一幅靜態(tài)圖像中提取出我們感興趣的文字,一般需要經(jīng)過(guò)以下幾個(gè)步驟:

第一,文字的檢測(cè),即先在圖像中定位文字區(qū)域,這里可以利用文字自身的一些先驗(yàn)知識(shí)和特征來(lái)達(dá)到目的。

第二,圖像增強(qiáng),改善字符區(qū)域的圖像質(zhì)量,提高圖像水平和垂直方向的分辨率。

第三,字符的分割與提取,即對(duì)字符區(qū)域進(jìn)行二值化處理。

第四,字符的識(shí)別,采用目前成熟的光學(xué)字符識(shí)別(OCR)技術(shù)來(lái)進(jìn)行識(shí)別。

2.1 文字檢測(cè)

1) 基于邊緣的文字檢測(cè)方法,即通過(guò)尋找垂直邊緣來(lái)檢測(cè)文字。這種方法能夠快速的檢測(cè)文字,但是該方法不能適應(yīng)圖像背景的復(fù)雜變化,檢測(cè)的錯(cuò)誤率較高。

2) 基于紋理的文字檢測(cè)方法,即利用紋理的特征去決定一個(gè)像素點(diǎn)或像素區(qū)域是否屬于文字。這種方法對(duì)于復(fù)雜背景中的文字能夠較好的檢測(cè)出,但是這種算法也存在著定位不準(zhǔn)和算法復(fù)雜度較高的缺點(diǎn)。

3) 基于區(qū)域的文字檢測(cè)方法是把字符作為滿足特定啟發(fā)式規(guī)則的單色區(qū)域來(lái)檢測(cè)。該方法的處理速度快并且定位精確,但是只適用于二值圖像,具有局限性。

4) 基于學(xué)習(xí)的文字檢測(cè)方法就是引入學(xué)習(xí)機(jī)機(jī)制,先通過(guò)選取的樣本來(lái)對(duì)學(xué)習(xí)機(jī)進(jìn)行訓(xùn)練,然后再用訓(xùn)練好的學(xué)習(xí)機(jī)來(lái)檢測(cè)文字,因此該方法的訓(xùn)練樣本集與測(cè)試樣本集的相似程度就決定了最終的識(shí)別效果。

2.2 圖像增強(qiáng)

圖像增強(qiáng)技術(shù)的使用,主要是為了通過(guò)一定手段對(duì)圖像中附加一些信息或變換數(shù)據(jù),突出文字的特征而抑制或掩蓋非文字區(qū)域中的特征,使得在下一步驟中更好的進(jìn)行字符分割與提取處理。圖像增強(qiáng)分為兩大類:頻率域法和空間域法。前者一般采用低通濾波法來(lái)去掉圖中的噪聲;采用高通濾波法來(lái)增強(qiáng)邊緣等高頻信號(hào),使圖片變得清晰。后者常用局部求平均值法和中值濾波法來(lái)去除或減弱圖片中噪聲,以達(dá)到清晰化圖片的目的。

2.3 字符分割與提取

字符的分割與提取其實(shí)是屬于圖像分割技術(shù)范疇的,只不過(guò)在進(jìn)行分割時(shí)還應(yīng)該把字符本身的一些特性考慮進(jìn)去,如:文字一般位于前端,不會(huì)被遮擋;文字一般是單色的;一幅圖片中的文字大寫(xiě)比較固定;文字的分布比較集中;文字的排列方向一般為水平或垂直等。目前彩色圖像分割技術(shù)主要采用的方法有:直方圖閥值化,特征空間聚類分析方法,基于區(qū)域的方法,邊緣檢測(cè),模糊技術(shù),人工神經(jīng)網(wǎng)絡(luò)和基于物理模型的方法等。這部分研究我們可以考慮將文字自身特性和已有的彩色圖像分割方法融合到一起,另外結(jié)合其他學(xué)科優(yōu)秀的知識(shí)成果也是一個(gè)不錯(cuò)的選擇,這是我接下來(lái)研究的方向。

2.4 字符識(shí)別

目前,字符的識(shí)別技術(shù)是比較成熟的,一般我們用現(xiàn)有的OCR系統(tǒng)就可以完成字符的識(shí)別工作。特別需要考慮的是:分割出來(lái)的文字可能由于圖像分辨率較低而達(dá)不到較好的識(shí)別效果,這時(shí)我們就需要先對(duì)分割出來(lái)的文字區(qū)域再進(jìn)行一定的增強(qiáng)處理,之后再來(lái)識(shí)別。當(dāng)然,也可以考慮優(yōu)化現(xiàn)有的識(shí)別系統(tǒng),以達(dá)到更好的識(shí)別效率。

3 結(jié)束語(yǔ)

隨著計(jì)算機(jī)技術(shù)、多媒體技術(shù)以及通訊技術(shù)的飛速發(fā)展,信息量急劇增長(zhǎng),相當(dāng)多的新增信息都是以數(shù)字形式存在著,它們不僅包括文字和聲音,更多的是圖形、圖像和視頻等視覺(jué)信息,因此,如何管理和檢索海量的圖像和視頻數(shù)據(jù)已經(jīng)成為全球?qū)W術(shù)界和工業(yè)界一個(gè)富有挑戰(zhàn)性的熱門話題之一。在此形勢(shì)下,基于內(nèi)容的多媒體檢索的研究和被稱為多媒體內(nèi)容描述接口的國(guó)際標(biāo)準(zhǔn)MPEG-7的制定也就引起了人們廣泛的關(guān)注,而圖像中的文字,尤其是網(wǎng)頁(yè)和視頻圖像中的文字,就是其一個(gè)高層語(yǔ)義的來(lái)源。實(shí)踐證明,這些文字對(duì)圖像和視頻的高層語(yǔ)義索引和檢索是非常有價(jià)值的,雖然人眼可以輕而易舉地識(shí)別出這些文字,但對(duì)于計(jì)算機(jī)來(lái)說(shuō),這些文字的獲取還面臨很大困難。正如本文所綜述的,現(xiàn)有的許多工作對(duì)這些難題都做了有益的嘗試和得到一定程度上的解決,但其結(jié)果離實(shí)用化還有相當(dāng)?shù)木嚯x,需要國(guó)內(nèi)外學(xué)者的繼續(xù)努力。

參考文獻(xiàn):

[1] 楊磊.復(fù)雜背景圖像中文本檢測(cè)與定位研究[D].廣州:華南理工大學(xué),2013.

[2] 周翔,陳會(huì),張鍇,宋懷波.復(fù)雜背景下的圖像文本區(qū)域定位方法研究[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(12):101-105.

[3] 孫巧榆.復(fù)雜背景圖像的文本信息提取研究[D].上海:華東師范大學(xué),2012.

[4] 陳慶民.圖像文本提取系統(tǒng)設(shè)計(jì)及應(yīng)用研究[D].上海:上海交通大學(xué),2011.

[5] Su Lu.DCT coefficient based text detection[D].newark:the University of Delaware,2008.

[6] 戴維,張申生.基于二值化聚類的圖像文字提取算法[J].計(jì)算機(jī)應(yīng)用,2009,29(1):57-59.

鄄城县| 出国| 方山县| 南宫市| 古浪县| 澄城县| 高密市| 柏乡县| 天长市| 怀集县| 齐齐哈尔市| 侯马市| 莆田市| 邵阳县| 化州市| 遵义市| 犍为县| 龙陵县| 时尚| 景谷| 若尔盖县| 阳西县| 新泰市| 昌乐县| 原平市| 乌鲁木齐县| 博乐市| 尉氏县| 潞城市| 林芝县| 江安县| 阿城市| 和静县| 同江市| 永善县| 虎林市| 荔波县| 蒲城县| 高台县| 麻江县| 彭州市|