鄧連瑾 尤德祥
【摘 要】一種利用手機(jī)等移動(dòng)設(shè)備進(jìn)行電子閱讀的全新模式,正以前所未有的普及速度沖擊著人們的閱讀習(xí)慣。如何獲得最佳閱讀效果,同時(shí)解決盜版電子讀物對(duì)電子出版業(yè)的傷害,成為我們急需解決的問(wèn)題。本論文提出了基于圖像分析的文字排版技術(shù),使得在手機(jī)等移動(dòng)設(shè)備上進(jìn)行閱讀也能達(dá)到紙本閱讀的效果,同時(shí)由于其基于圖像的固有特性,出版者可以在文字內(nèi)容上打上版權(quán)水印,也起到了打擊盜版,維護(hù)版權(quán)的目的。
【關(guān)鍵詞】電子閱讀;基于圖像;文字排版
不僅一般圖像類的媒體信息需要重新排版,由于一些文本類信息具有附加顯示屬性,例如word里的文字信息具有格式信息,用來(lái)突出某部分的重要性等等,如果只是將文本信息傳送到移動(dòng)設(shè)備上,則這些重要的附加信息將被丟失,從而極大影響讀者的閱讀、理解過(guò)程。
如何對(duì)這些文字信息進(jìn)行重排版,本文提出了全新的基于圖像分析的文字排版技術(shù),直接對(duì)包含文字的圖像進(jìn)行像素分析、文字分割、重新排版。在對(duì)源圖像的像素進(jìn)行分析,將文本塊周圍的空白區(qū)域去除之后,可以進(jìn)行下述處理。
一、源圖像文字分割
由于源圖像需要重排版,所以必須對(duì)源圖像按行進(jìn)行文字分割,如下圖所示,獲得每行的上側(cè)位置Linetop、下側(cè)位置Linebottom,其過(guò)程和在對(duì)源圖像的像素分析步驟中獲得Wleft相類似[1],程序沿垂直方向自上而下不斷掃描每行的像素,若從全白像素行進(jìn)入有非白色像素行,則是一個(gè)新文字行的上側(cè),反之,若從有非白色像素行進(jìn)入全白像素行,則是一個(gè)文字行的下側(cè)。由此可知,只需掃描一次即可獲得文本區(qū)域每行的上下位置,即下圖所示中第一行上下側(cè)位置為紅色虛線,第二行上下側(cè)位置為藍(lán)色虛線,第三行上下側(cè)位置為綠色虛線。
1)首先用戶必須按照目標(biāo)移動(dòng)設(shè)備的屏幕分辨率設(shè)置目標(biāo)圖像的寬度Wdest和高度Hdest,例如有的高分辨率手機(jī)則達(dá)到800*480,則設(shè)置Wdest=800,Hdest=480;
2)然后用戶選擇文字排版后放置的起始位置,即根據(jù)排版要求設(shè)置變量P1;
3)接下來(lái)程序?qū)⒆詣?dòng)按源圖像中各行文字,分別進(jìn)行圖像信息賦值[2],如果源文字一行放置下來(lái)還不到目標(biāo)圖像右側(cè),如上圖“源文字1行”所示,則將該行所在區(qū)域的右上角坐標(biāo)P2自動(dòng)賦值為下一行文字的起始點(diǎn)位置;
4)如果源文字一行放置下來(lái)超出目標(biāo)圖像右側(cè),則以目標(biāo)圖像右側(cè)為分界線將源文字分為兩部分,右側(cè)部分將在放置在下一行,如“源文字2行”那樣,出現(xiàn)了換行效果[3],最終同樣最后一塊的右上角坐標(biāo)自動(dòng)賦值為下一行文字的起始點(diǎn)位置,如上圖中“第三行起始點(diǎn)坐標(biāo)P3”;
5)在放置完所有源圖像文字后,即可將內(nèi)存中的目標(biāo)圖像保存到磁盤上,完成整個(gè)重排版過(guò)程。
三、實(shí)驗(yàn)結(jié)果分析
本文將上述基于圖像的處理過(guò)程編制成計(jì)算機(jī)程序,并做了相應(yīng)的重排版試驗(yàn),經(jīng)觀察發(fā)現(xiàn)本文所述原理對(duì)基于圖像的文本重排版處理效果非常良好,下面是處理實(shí)例,如圖3所示,處理前圖像寬度為873,超過(guò)一般移動(dòng)設(shè)備的分辨率,用戶在閱讀時(shí)需要不斷縮放、移動(dòng)圖像,非常麻煩。
本文提出的基于圖像的文本重排版技術(shù),除了大幅提高移動(dòng)設(shè)備的閱讀效果外,還可以在重排版后向圖像中加入注入數(shù)字水印等版權(quán)保護(hù)措施,為電子出版商在移動(dòng)設(shè)備上的數(shù)字出版提供一種可靠的防盜版技術(shù)保證。
參考文獻(xiàn):
[1]張娜. 簡(jiǎn)牘圖像增強(qiáng)與分割的研究[D]成都理工大學(xué), 2007.
[2]孫晶. 圖像局部不變特征提取技術(shù)研究及其應(yīng)用[D]大連理工大學(xué), 2009.
[3]王曉峰. 水平集方法及其在圖像分割中的應(yīng)用研究[D]中國(guó)科學(xué)技術(shù)大學(xué), 2009 .
作者簡(jiǎn)介:
鄧連瑾(1981-),女,天津市人,碩士,天津渤海職業(yè)技術(shù)學(xué)院講師,主要從事人工智能、圖形圖像等研究。
尤德祥(1982-),男,碩士,江蘇省揚(yáng)州市人,鐵道第三勘察設(shè)計(jì)院集團(tuán)有限公司信息中心工程師,主要從事圖形圖像研究與開(kāi)發(fā)工作。