黃弋石 梁艷
摘要:為了解決書寫較為工整的英文聯(lián)機(jī)手寫文字識(shí)別,定義了英文字母的有限組成字元,形成一套七組不同的基礎(chǔ)字元系統(tǒng)。使用方格邊比測量法,與簡單的數(shù)學(xué)計(jì)算,可以確定字元的種類與性質(zhì)。使用字元搭建,對(duì)大小寫英文字母與阿拉伯?dāng)?shù)字實(shí)施具體定義,由于每個(gè)字符的具體定義組成,完全各不相同,所以可以在邏輯上判斷,這種方法能夠容易快捷地識(shí)別獨(dú)立的較為工整的英文手寫字母。這種定義方法,可以推廣到連寫的手寫字母與各種字體。這種建模方法,如果移植到類似的中國少數(shù)民族文字與其它類似外國文字的手寫識(shí)別,應(yīng)該很樂觀。
關(guān)鍵詞:英文文字;手寫識(shí)別;連筆輸入;聯(lián)機(jī)識(shí)別;聯(lián)機(jī)手寫
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)20-4959-03
English Handwriting Character Recognition Modeling Method
HUANG Yi-shi1,LIANG Yan2
(1.Lab Center, School of Public Health, Nantong University, Nantong 226019,China; 2. Nantong LangChao General Software Limited Company, Nantong 226006,China)
Abstract: Defines limited compositional units to the English letters. Use grid side ratio measurement method to determine their properties. Make specific definitions to all sorts of letters. Then it is easy to recognize independent English handwritten letters quickly. This definition method can be extended to the connected handwritten letters and various fonts. This modeling method will be very optimistic, if transplant ed into the similar Chinas minority languages and some other foreign languages for recognition of handwriting.
Key words: English character; handwriting recognition; cursive input; online recognition; online handwriting
在中國市場,中文手寫輸入產(chǎn)品都很成熟,但在英文手寫輸入方面功能不強(qiáng)甚至很弱[1-3]。在英語國家,發(fā)展迅速,但有關(guān)技術(shù)方法的報(bào)道甚少。
該文提出一種建模方法,簡捷的解決英文手寫識(shí)別。其中用到,方格邊比測量法。即,用方框?qū)⒛繕?biāo)圍住,四邊縮小至無法縮小且包含的網(wǎng)格數(shù)為整數(shù),以包含方格數(shù)與邊比特征等一系列特征作為參數(shù)計(jì)算,可以快速簡便的判斷字的字元、筆畫的起始端位置、曲度、角的角度、圓角的弧度、豎橫斜線的傾斜程度。使用這個(gè)方法判斷以下有限的基本定義,十分簡便快速,繞過了復(fù)雜的圖形計(jì)算。使用現(xiàn)有的成熟的二值圖像學(xué)計(jì)算方法可以很容易實(shí)現(xiàn)。
1基本定義
豎與橫。手寫的豎與橫,都有一定的搖擺幅度。但是豎與橫,使用方格邊比測量法,很容易區(qū)分。
角與圓角。接近與V與U,在手寫特征下的區(qū)別是有拐點(diǎn)與無拐點(diǎn)。
圈與近圈。也就是,封閉的圓與接近封閉的圓。手寫圓具有拓?fù)涓綦x性質(zhì),與其它基本定義明顯不同。近圈的筆畫兩端距離較近,且沒有拐點(diǎn),這一點(diǎn)有別于角與圓角。使用方格邊比測量法易識(shí)別。
短劃與點(diǎn)。與豎與橫的區(qū)別是方向性不強(qiáng),在方格中,通過邊比特征可以區(qū)分。
交叉與連續(xù)。交叉,是指基本定義的筆畫相交叉,分T型交叉,和X型交叉,也可簡化為一種交叉。連續(xù),是指,基本定義的筆畫從起點(diǎn)到終點(diǎn)(或筆畫的兩端)是連續(xù)的且無分叉,可平滑,也可轉(zhuǎn)折。
相對(duì)位置與方向?;径x的字元之間的關(guān)系,有上、下、左、右、上左、上右、下左、下右。
斜線。幾何特征介于豎與橫,但可賦予相對(duì)方向的特征為,左斜、右斜、下斜、上斜、(左上斜、左下斜、右上斜、右下斜)。用方格邊比測量法,易與豎橫區(qū)分。
用這些基本定義就可對(duì)每個(gè)不同的手寫字母,加以分割定義。這一方法,也可以移植到漢字手寫識(shí)別,經(jīng)確定適合漢字的基本定義,可快速判斷漢字的基本筆畫或基本要素。
2建模方法
用基本定義對(duì)a到z和A到Z實(shí)施具體定義。顯然,只要每個(gè)對(duì)象的定義各不相同,那就可簡單區(qū)分。
2.1容易混淆的字母
這里先解決書寫較為規(guī)整的字母,無論字母,右斜、左斜還是居中。
a u a圈或近圈+右下圓角或短劃,筆畫連續(xù)。u圓角+右下圓角或短劃,筆畫連續(xù)。o v手寫中,o會(huì)出現(xiàn)近圈,v會(huì)出現(xiàn)圓角,易區(qū)分。
z 2 z的右上是角,角開口向左下,2的右上是圓角,筆畫都連續(xù)。
C L在手寫情況下,C是開口向右的圓角,L是開口向右或右上的角。
J T J的特征是橫+豎+左下圓角,圓角開口向上。
K R手寫的K是豎+右上斜+右下斜,右上斜在豎的右側(cè),右下斜在豎的右側(cè)、右上斜的下或右下。在手寫中豎與右上斜,可以筆畫連續(xù)成為角,屬于字母的變體。R是豎+開口向左的圓角+右下斜。在手寫中筆畫可以連續(xù),這個(gè)問題,可以歸類于下文的變體與字體庫技術(shù)處理。
S 8規(guī)整手寫S的兩個(gè)圓角一般是不會(huì)閉合為圈。8的上部為圈或近圈或圓角,但下部必然是閉合圈。
2.2 a到z的基本定義
使用基本定義分解每個(gè)字母,解決書寫較為規(guī)整的字母,無論字母右斜、左斜還是居中都適用。a圈或近圈+右下圓角或短劃,筆畫連續(xù)。b豎+左開口圓角,圓角在右。c右開口圓角。d右開口圓角+豎,豎在右。e圈或近圈+右開口圓角,筆畫連續(xù)。f豎+橫+圓角,豎橫交叉,豎與圓角連續(xù),圓角開口右下。g圈或近圈+豎+圓角,筆畫連續(xù),圓角開口向上,圈在圓角的上,圈在豎的左。h豎+圓角,豎在左,圓角開口向下。i短劃或點(diǎn)+豎,豎在下,手寫中書上下會(huì)有圓角特征,歸類于下文的變體與字體庫。j短劃或點(diǎn)+豎+圓角,圓角開口左上。k豎+右上斜+右下斜,豎在左。l豎,借助下文的拼寫法輔助可與數(shù)字1區(qū)分。m豎+圓角+圓角,圓角開口向下,豎在左。n豎+圓角。o圈或近圈,借助拼寫法輔助可與數(shù)字0區(qū)分。p豎+圓角,圓角開口向左,豎在左。q豎+圓角,圓角開口向右,豎在右。r豎在左,圓角向右下,筆畫連續(xù)。s圓角+圓角,開口一左一右,筆畫連續(xù)。t橫+豎+圓角,圓角開口右上。u圓角+豎,開口向上,豎在右,筆畫連續(xù)。v角,開口向上。w角+角+角,兩角開口向上,一角開口向下,這里列出三個(gè)角,目的是要為解決連筆寫的方案打好鋪墊。x角+角,角開口一向上一向下,角一上一下(也可定義為交叉的斜線,但易于與y混淆)。y右下斜+左下斜,左右關(guān)系。z左開口角+右開口角,一上一下,筆畫連續(xù),如此仔細(xì)定義,目的是為解決連筆寫方案做好鋪墊。
2.3 A到Z的基本定義
A左下斜+右下斜+橫,筆畫可不連續(xù)。B豎+左開口圓角+左開口圓角,豎在左,筆畫可不連續(xù)。C右開口圓角。D豎+左開口圓角,豎在左。E豎橫連續(xù)+橫+橫,兩橫在右。F豎+橫+橫,豎在左。G右開口圓角+橫豎(或橫+豎),圓角與豎連續(xù),圓角在左。H豎+橫+豎,不連續(xù),豎在橫左,豎在橫右,不連續(xù)。I橫+豎+橫,橫在豎上,橫在豎下,不連續(xù)。J橫+豎+上開口圓角,豎圓角連續(xù)。K豎+右上斜+右下斜,豎在左。L豎+橫,豎在左,連續(xù)。M豎+開口上角+豎,角與右豎連續(xù)。N豎+開口上角,豎在左,不連續(xù)。O圈或近圈,與小寫o區(qū)分基于包含的網(wǎng)格數(shù)有明顯差異。P豎左開口圓角,豎在左。Q圈或近圈+短劃,交叉。R豎+左開口圓角+右下斜,豎在左。S圓角+圓角,圓角一左上、一右下,筆畫連續(xù)。T橫+豎,豎在下,不連續(xù)。U圓角開口向上,用方格邊比測量法包圍的小方格數(shù),可區(qū)分大小寫U。V角開口向上,區(qū)分大小寫易。W角+角+角,兩角開口向上,一角開口向下,區(qū)分大小寫易。X上開口角+下開口角,一上一下,區(qū)分大小寫易。Y右斜+左斜+豎,豎在下,不連續(xù)。Z左開口角+右開口角,一上一下,筆畫連續(xù),區(qū)分大小寫易。
延伸的,數(shù)字0到9的定義可類推。
3變化
3.1變體與字體庫
每個(gè)英文字,在手寫體上都有變體,但分類極其有限[4]。如,英美人士對(duì)t,有時(shí)寫成類似中文的十。顯然,因英文字母結(jié)構(gòu)的簡單與有限,其變體也是極其有限。
同時(shí),英文字母也有極其有限的書法字體,都有很成熟的統(tǒng)一規(guī)范。建立不大的字體集后,根據(jù)字元關(guān)系,建立特征數(shù)據(jù)庫,就很容易進(jìn)行整字識(shí)別。這就類似于手寫漢字的識(shí)別,只要建立體分類字庫,再建立特征數(shù)據(jù)庫,就能解決草體手寫識(shí)別[5]。
英美人士,書寫時(shí)可分為左傾、居中、右傾。在美國,長期有人收集各種手寫字體,研究書寫者的性格與傾向,并形成一個(gè)學(xué)科,這些資料都很成熟同時(shí)如果依照規(guī)范分類,量也不大。
另外,英文中的藝術(shù)體,在實(shí)際記錄書寫中并不多見,就如同有的中文書法家雖然有的精通篆書、隸書,但平時(shí)還是用行書記錄。
3.2連寫的分割與識(shí)別
每個(gè)英文字的手寫連接部分的特征,都有有限的特征。根據(jù)這些特征可以將每個(gè)字分割。具體方法是,將a到z與A到Z進(jìn)行組合,施加不同的變體與字體,得到有限的特征。工作量不大,難度也不大。經(jīng)過手寫實(shí)驗(yàn),字母之間的連接有明顯的角、圓角與圈等的連接間隔特征。
對(duì)于方框內(nèi)獨(dú)立的字母,可以采用平面重疊法,就是將每個(gè)獨(dú)立的筆畫儲(chǔ)存為一個(gè)平面,然后疊加,這在算法上很簡便,程序能寫的很小。但對(duì)于連筆英文,使用連續(xù)點(diǎn)追蹤為好,就是在輸入框中找到一個(gè)黑像素,追蹤連續(xù)的點(diǎn)至筆畫的斷點(diǎn),然后再實(shí)施分割[6]。
由于手寫字母間有明顯的角、圓角與圈等的連接間隔特征,所以可實(shí)施字母窮舉法實(shí)施字母分割。
拼寫法輔助也是重要的[7-8]??少彫F(xiàn)成的拼寫軟件,不貴且很成功。在市場上的代表有,手機(jī)上的智能英文輸入軟件,在美國常用的英文單詞輸入校正提示軟件。拼寫提示軟件對(duì)錯(cuò)誤的拼寫,都可智能的判定并提示可能的正確拼法,準(zhǔn)確率極高?;驹硎腔冢S玫挠⑽淖质怯邢薜?,這些字母的組合不是無限的,這些組合都有有限的規(guī)律可循。由于英語的語言密碼學(xué)早已很發(fā)達(dá),所以促使這種軟件十分成熟。
4結(jié)束語
這種建模方法結(jié)合漢字手寫識(shí)別建模方法[9][10]的思想,如果機(jī)動(dòng)靈活的加以移植,很可能能簡捷的解決類似的中國少數(shù)民族文字與其它類似的外國文字的手寫識(shí)別。希望有此意愿者,合作交流。
參考文獻(xiàn):
[1]鄒明福,白洪亮,劉昌平,等.聯(lián)機(jī)手寫英文識(shí)別的解碼算法[J].計(jì)算機(jī)工程,2005,31(21):19-21.
[2]趙道華,艾斯卡爾艾木都拉.基于過拆分和合并的聯(lián)機(jī)手寫英文單詞分割技術(shù)[J].電腦知識(shí)與技術(shù),2009,5(7):1693-1695.
[3]張豪杰,張紅云,苗奪謙.基于主曲線的脫機(jī)手寫英文字母結(jié)構(gòu)特征分析及選取[J].計(jì)算機(jī)科學(xué),2009,36(10):197-201.
[4]梁艷,黃弋石.英文連筆手寫圖形輸入方法研究[J].科學(xué)研究月刊,2005,1(5):18,26.
[5]黃弋石,梁艷.手寫文字識(shí)別的體分類模糊數(shù)學(xué)模型[EB/OL].中國科技論文在線(http://www.paper.edu.cn), 2005年6月.
[6] Casey R G, Lecolinet E. A Survey of Method and Strategies in Character Segmentation[J]. IEEE Trans PAMI,1996,18(7):690-706.
[7] Arica N, Yarman-Vural F T. Optical Character Recognition for Cursive Handwriting [J]. IEEE Transaction on Pattern Analysis and Ma chine Intelligence, 2002,24(6).
[8] Sin B K, Kim J H. Ligature Modeling for Online Cursive Script Recognition [J]. IEEE Transactions on Pattern Analysis and Machine Intel ligence, 1997.19(6).
[9]黃弋石.一種手寫文字圖形輸入理論方法[J].廣西民族學(xué)院學(xué)報(bào):自然科學(xué)版,2003,9(2):40-43.
[10]梁艷,黃弋石.計(jì)算機(jī)漢字草體手寫輸入算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2005,15(10):14,15.