基于圖像分析的文字排版技術(shù)的深入研究

2013-04-15 01:50鄧連瑾尤德祥

科學(xué)時(shí)代·上半月 2013年2期

鄧連瑾　尤德祥

【摘要】一種利用手機(jī)等移動(dòng)設(shè)備進(jìn)行電子閱讀的全新模式，正以前所未有的普及速度沖擊著人們的閱讀習(xí)慣。如何獲得最佳閱讀效果，同時(shí)解決盜版電子讀物對(duì)電子出版業(yè)的傷害，成為我們急需解決的問(wèn)題。本論文提出了基于圖像分析的文字排版技術(shù)，使得在手機(jī)等移動(dòng)設(shè)備上進(jìn)行閱讀也能達(dá)到紙本閱讀的效果，同時(shí)由于其基于圖像的固有特性，出版者可以在文字內(nèi)容上打上版權(quán)水印，也起到了打擊盜版，維護(hù)版權(quán)的目的。

【關(guān)鍵詞】電子閱讀；基于圖像；文字排版

不僅一般圖像類的媒體信息需要重新排版，由于一些文本類信息具有附加顯示屬性，例如word里的文字信息具有格式信息，用來(lái)突出某部分的重要性等等，如果只是將文本信息傳送到移動(dòng)設(shè)備上，則這些重要的附加信息將被丟失，從而極大影響讀者的閱讀、理解過(guò)程。

如何對(duì)這些文字信息進(jìn)行重排版，本文提出了全新的基于圖像分析的文字排版技術(shù)，直接對(duì)包含文字的圖像進(jìn)行像素分析、文字分割、重新排版。在對(duì)源圖像的像素進(jìn)行分析，將文本塊周圍的空白區(qū)域去除之后，可以進(jìn)行下述處理。

一、源圖像文字分割

由于源圖像需要重排版，所以必須對(duì)源圖像按行進(jìn)行文字分割，如下圖所示，獲得每行的上側(cè)位置Linetop、下側(cè)位置Linebottom，其過(guò)程和在對(duì)源圖像的像素分析步驟中獲得Wleft相類似[1]，程序沿垂直方向自上而下不斷掃描每行的像素，若從全白像素行進(jìn)入有非白色像素行，則是一個(gè)新文字行的上側(cè)，反之，若從有非白色像素行進(jìn)入全白像素行，則是一個(gè)文字行的下側(cè)。由此可知，只需掃描一次即可獲得文本區(qū)域每行的上下位置，即下圖所示中第一行上下側(cè)位置為紅色虛線，第二行上下側(cè)位置為藍(lán)色虛線，第三行上下側(cè)位置為綠色虛線。

1）首先用戶必須按照目標(biāo)移動(dòng)設(shè)備的屏幕分辨率設(shè)置目標(biāo)圖像的寬度Wdest和高度Hdest，例如有的高分辨率手機(jī)則達(dá)到800*480，則設(shè)置Wdest=800，Hdest=480；

2）然后用戶選擇文字排版后放置的起始位置，即根據(jù)排版要求設(shè)置變量P1；

3）接下來(lái)程序?qū)⒆詣?dòng)按源圖像中各行文字，分別進(jìn)行圖像信息賦值[2]，如果源文字一行放置下來(lái)還不到目標(biāo)圖像右側(cè)，如上圖“源文字1行”所示，則將該行所在區(qū)域的右上角坐標(biāo)P2自動(dòng)賦值為下一行文字的起始點(diǎn)位置；

4）如果源文字一行放置下來(lái)超出目標(biāo)圖像右側(cè)，則以目標(biāo)圖像右側(cè)為分界線將源文字分為兩部分，右側(cè)部分將在放置在下一行，如“源文字2行”那樣，出現(xiàn)了換行效果[3]，最終同樣最后一塊的右上角坐標(biāo)自動(dòng)賦值為下一行文字的起始點(diǎn)位置，如上圖中“第三行起始點(diǎn)坐標(biāo)P3”；

5）在放置完所有源圖像文字后，即可將內(nèi)存中的目標(biāo)圖像保存到磁盤上，完成整個(gè)重排版過(guò)程。

三、實(shí)驗(yàn)結(jié)果分析

本文將上述基于圖像的處理過(guò)程編制成計(jì)算機(jī)程序，并做了相應(yīng)的重排版試驗(yàn)，經(jīng)觀察發(fā)現(xiàn)本文所述原理對(duì)基于圖像的文本重排版處理效果非常良好，下面是處理實(shí)例，如圖3所示，處理前圖像寬度為873，超過(guò)一般移動(dòng)設(shè)備的分辨率，用戶在閱讀時(shí)需要不斷縮放、移動(dòng)圖像，非常麻煩。

本文提出的基于圖像的文本重排版技術(shù)，除了大幅提高移動(dòng)設(shè)備的閱讀效果外，還可以在重排版后向圖像中加入注入數(shù)字水印等版權(quán)保護(hù)措施，為電子出版商在移動(dòng)設(shè)備上的數(shù)字出版提供一種可靠的防盜版技術(shù)保證。

參考文獻(xiàn)：

[1]張娜. 簡(jiǎn)牘圖像增強(qiáng)與分割的研究[D]成都理工大學(xué)， 2007.

[2]孫晶. 圖像局部不變特征提取技術(shù)研究及其應(yīng)用[D]大連理工大學(xué)， 2009.

[3]王曉峰. 水平集方法及其在圖像分割中的應(yīng)用研究[D]中國(guó)科學(xué)技術(shù)大學(xué)， 2009 .

作者簡(jiǎn)介：

鄧連瑾（1981-），女，天津市人，碩士，天津渤海職業(yè)技術(shù)學(xué)院講師，主要從事人工智能、圖形圖像等研究。

尤德祥（1982-），男，碩士，江蘇省揚(yáng)州市人，鐵道第三勘察設(shè)計(jì)院集團(tuán)有限公司信息中心工程師，主要從事圖形圖像研究與開(kāi)發(fā)工作。

科學(xué)時(shí)代·上半月2013年2期

科學(xué)時(shí)代·上半月的其它文章: 關(guān)于推進(jìn)社會(huì)主義核心價(jià)值體系融入國(guó)民教育問(wèn)題; 革命紀(jì)念館在建設(shè)和諧社會(huì)中的作用; 我國(guó)可持續(xù)水資源管理途徑分析; 寧夏在我國(guó)區(qū)域經(jīng)濟(jì)發(fā)展格局中產(chǎn)業(yè)戰(zhàn)略地位的研究; 試析地方電視臺(tái)如何辦好民生新聞; 環(huán)境保護(hù)的公眾參與制度研究

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于圖像分析的文字排版技術(shù)的深入研究