国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

藏文聯(lián)機(jī)手寫識(shí)別的研究與實(shí)現(xiàn)索

2017-07-20 12:37南尖措關(guān)白李雷山發(fā)富
計(jì)算機(jī)時(shí)代 2017年7期

南尖措+關(guān)白+李雷+山發(fā)富

摘 要: 提出了一種基于筆畫的藏文聯(lián)機(jī)手寫識(shí)別的方法。首先將每個(gè)藏文字分解為各個(gè)子模式,然后將子模式進(jìn)一步劃分為筆畫,最后通過(guò)識(shí)別出的筆畫和每個(gè)藏文字之間對(duì)應(yīng)規(guī)則判斷出使用者所書寫的藏文字。識(shí)別筆畫時(shí),將其軌跡看成點(diǎn)的集合,使用八個(gè)方向碼對(duì)其進(jìn)行標(biāo)記,進(jìn)而確定這個(gè)筆畫。在識(shí)別之前,先將相似的筆畫進(jìn)行歸類合并,以解決使用者書寫不規(guī)范的情況。在不考慮連筆的情況下,對(duì)常用的600多個(gè)藏文字進(jìn)行測(cè)試,準(zhǔn)確率可以達(dá)到92%。

關(guān)鍵詞: 藏文聯(lián)機(jī)手寫識(shí)別; 筆畫識(shí)別; 方向碼; 筆畫合并

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2017)07-10-03

Research and implementation of Tibetan online handwritten recognition

Suonan Jiancuo, Guan Bai, Li Lei, Shan Fafu

(Tibetan information technology engineering research center, Tibet, Lhasa 850000, China)

Abstract: This paper presents a method of Tibetan online handwriting recognition based on stroke and its corresponding rules, and implements it. First, each Tibetan text is decomposed into various sub patterns, and then the sub pattern is further divided into strokes. Through the identification of strokes and the corresponding rules of each Tibetan character, the user's handwriting character is recognized. In the identification of a stroke, its trajectory is taken as a set of points, and eight directional codes are used to mark it, and then the stroke is determined. Before the identification, the similar strokes are classified and merged to solve the problem of nonstandard user writing. Without considering the joined-up writing, tested on more than 600 Tibetan words commonly used, the accuracy rate can reach 92%.

Key words: Tibetan online handwriting recognition; stroke recognition; directional code; stroke merge

0 引言

隨著如平板電腦、智能手機(jī)和數(shù)碼筆等基于筆和觸摸輸入設(shè)備的發(fā)展,聯(lián)機(jī)手寫字符識(shí)別再次引起了人們的興趣。近年來(lái),研究人員開(kāi)發(fā)出多種方法,來(lái)識(shí)別不同類別的字符并提高識(shí)別性能。這些方法力求在實(shí)際應(yīng)用中以較低的復(fù)雜度來(lái)實(shí)現(xiàn)高性能的識(shí)別來(lái)滿足用戶的需求。

在中國(guó),藏文作為少數(shù)民族文字,大約被600萬(wàn)人使用,尤其是在西藏自治區(qū),云南和青海等省。聯(lián)機(jī)手寫藏文字符識(shí)別也被廣泛應(yīng)用到便攜設(shè)備以及桌面的應(yīng)用程序[1]。然而,相較于中文、英文和日文等語(yǔ)言,藏文要達(dá)到高識(shí)別率仍然具有挑戰(zhàn)性。

1 藏文聯(lián)機(jī)手寫識(shí)別

1.1 研究方法

手寫識(shí)別方面主要有基于統(tǒng)計(jì)決策模式的識(shí)別方法和基于文字結(jié)構(gòu)模式的識(shí)別方法兩大類別[2-5],基于統(tǒng)計(jì)決策模式的識(shí)別方法是首先將待識(shí)別的文字提取出一組統(tǒng)計(jì)特征,然后根據(jù)此組特征形成該文字的多維特征向量,最后再將該多維特征向量與語(yǔ)料庫(kù)中每個(gè)字的訓(xùn)練的多維特征向量進(jìn)行比較,得出相似度最高的那個(gè)多維特征向量,此多維特征向量對(duì)應(yīng)的文字就是所識(shí)別出的文字,如圖1所示。

[待識(shí)別文字][多維特征向量][語(yǔ)料庫(kù)][識(shí)別結(jié)果][特征提取][判別函數(shù)][相似度]

基于文字結(jié)構(gòu)模式的識(shí)別方法就是將被識(shí)別的文字(本文中指單個(gè)藏文字)看成由多個(gè)子模式(本文中指藏文字母)按照一定的規(guī)則組成,而子模式又由基元(本文中指筆畫)組成,如圖2所示。基元是構(gòu)成該模式的最小單元。通過(guò)識(shí)別基元,進(jìn)而識(shí)別出子模式,最終識(shí)別出該模式,即識(shí)別出要識(shí)別的藏文字,如圖3所示。識(shí)別藏文字時(shí),可以把藏文字當(dāng)作一種特殊的二維文字,其基本組成單元為:基字、前加字、上加字、下加字、后加字、再后加字、元音[6]。

基于文字結(jié)構(gòu)模式的識(shí)別方法相比于基于統(tǒng)計(jì)決策模式的識(shí)別方法,充分利用了藏文字的構(gòu)字規(guī)律,因此本文采用基于文字結(jié)構(gòu)模式的識(shí)別方法。

1.2 筆畫的歸納及合并

藏文的輸入及編碼已經(jīng)有了統(tǒng)一的標(biāo)準(zhǔn),但是在手寫識(shí)別研究方面的成果還不多,前人多是基于構(gòu)件進(jìn)行識(shí)別。本文采用一種基于筆畫的和規(guī)則的方法進(jìn)行識(shí)別[7],首先對(duì)藏文筆畫進(jìn)行歸類,然后建立每個(gè)藏文字與筆畫之間對(duì)應(yīng)的規(guī)則,根據(jù)規(guī)則查找到對(duì)應(yīng)的藏文字。

一個(gè)藏文字由若干個(gè)部件構(gòu)成,一個(gè)部件又由若干個(gè)筆畫組成,筆畫是組成藏文字的最小單位。要想識(shí)別藏文字,首先就要識(shí)別出筆畫。但是藏文字筆畫比較復(fù)雜和繁多,為了方便識(shí)別,我們首先對(duì)藏文字筆畫根據(jù)其特征進(jìn)行分類,最終確定了20個(gè)筆畫,并用a—t對(duì)其分別命名,如圖4所示。然后確定了30個(gè)輔音字母的構(gòu)成規(guī)則,如

1.3 筆畫的識(shí)別問(wèn)題

我們采用了筆畫識(shí)別的方法進(jìn)行藏文字識(shí)別,即先識(shí)別用戶輸入的筆畫,再根據(jù)筆畫的集合查找對(duì)應(yīng)的藏文字所對(duì)應(yīng)的筆畫序列,最終確定所寫藏文字。這種基于筆畫的藏文字識(shí)別方法,特點(diǎn)是寫一筆,識(shí)別一筆,即聯(lián)機(jī)識(shí)別。筆畫識(shí)別是藏文字識(shí)別的前提和關(guān)鍵。然而筆畫識(shí)別還存在諸多問(wèn)題,例如筆畫的獲取算法對(duì)識(shí)別的影響、書寫速度的快慢對(duì)識(shí)別的影響、連筆情況下的識(shí)別等。

1.3.1 書寫快慢影響的解決

通過(guò)對(duì)訓(xùn)練的筆畫的數(shù)據(jù)進(jìn)行預(yù)處理,用以解決使用者在書寫快慢對(duì)識(shí)別率的影響。在筆畫識(shí)別的程序設(shè)計(jì)時(shí),筆者把用戶輸入的筆畫軌跡看成點(diǎn)的集合,使用者在進(jìn)行訓(xùn)練或者書寫的時(shí)候,不同的書寫速度會(huì)對(duì)筆畫軌跡信息造成影響。例如寫“橫”的時(shí)候,雖然二者的方向數(shù)據(jù)都是“3”,但是在數(shù)據(jù)長(zhǎng)度方面卻有很大差別,緩慢書寫要比快速書寫的長(zhǎng)度要長(zhǎng)許多,所以書寫的快慢也會(huì)影響識(shí)別率。

對(duì)于此問(wèn)題,本文提供兩種解決辦法。第一種是在數(shù)據(jù)訓(xùn)練時(shí),就故意快速寫和緩慢寫,此方法可以解決這種問(wèn)題,但這對(duì)于訓(xùn)練人員的要求較高,并且此種方法會(huì)產(chǎn)生大量的數(shù)據(jù),會(huì)降低識(shí)別速度。第二種方法是將數(shù)據(jù)進(jìn)行歸一化處理,連續(xù)相同的方向以一個(gè)數(shù)字代替,不計(jì)算其長(zhǎng)度,只關(guān)注其方向,再拐點(diǎn)處再標(biāo)記下一個(gè)方向。本文采用第一種方法,用數(shù)據(jù)的訓(xùn)練來(lái)彌補(bǔ)技術(shù)的不足。

1.3.2 連筆問(wèn)題的解決

人們書寫藏文經(jīng)常會(huì)兩筆或多筆連寫,所以連筆是個(gè)需要解決的問(wèn)題,不過(guò)已經(jīng)有了解決思路。首先統(tǒng)計(jì)經(jīng)常會(huì)連筆的筆畫,例如藏文字“”的最后兩筆,正常書寫應(yīng)該像圖5的左邊是由兩筆完成,但是人們經(jīng)常會(huì)按照?qǐng)D5右邊那樣一筆寫完,所以我們采用一個(gè)藏文字對(duì)應(yīng)兩個(gè)筆畫序列規(guī)則或者一個(gè)藏文字對(duì)應(yīng)多個(gè)筆畫序列規(guī)則進(jìn)行連筆識(shí)別,即“”對(duì)應(yīng)的規(guī)則有正常書寫的“accm”和連筆書寫的“acd”兩個(gè)。

1.3.3 訓(xùn)練程序及識(shí)別程序的實(shí)現(xiàn)

基于筆畫識(shí)別的藏文字識(shí)別方法還需考慮用戶在輸入的時(shí)候,難免會(huì)有一些抖動(dòng)或者其他干擾因素導(dǎo)致和標(biāo)準(zhǔn)的藏文字體差別的情況,為此,本文提出了一種具有容錯(cuò)機(jī)制的訓(xùn)練方法,以達(dá)到能夠具有容錯(cuò)的性能。

具體的優(yōu)化方法為:

第一步,將用戶輸入的點(diǎn)看作原點(diǎn),以正上方為Y軸的正半軸,正右方為X軸的正半軸,建立一個(gè)平面直角坐標(biāo)系,如圖6所示。原來(lái)采用正向上為方向碼“1”,現(xiàn)在采取兩邊各5度的容錯(cuò)范圍,即在正上方(即Y軸的正半軸)向左偏離5度的范圍內(nèi)或者向右偏離5度的范圍內(nèi)都認(rèn)為用戶輸入的是方向碼“1”,同理,方向碼“2”到方向碼“8”如圖6所示。

第二步,開(kāi)始對(duì)筆畫進(jìn)行訓(xùn)練,筆畫訓(xùn)練起初是采用直接在電腦上進(jìn)行訓(xùn)練,用鼠標(biāo)代替手寫輸入,給出所要訓(xùn)練的筆畫,照著所給筆畫進(jìn)行描寫,點(diǎn)擊保存則會(huì)保存當(dāng)前筆畫軌跡信息,獲得該筆畫的訓(xùn)練數(shù)據(jù)。后來(lái),為了更加準(zhǔn)確的獲得訓(xùn)練數(shù)據(jù),我們?cè)O(shè)計(jì)了安卓版的訓(xùn)練軟件,使用戶可以在屏幕上用手直接進(jìn)行訓(xùn)練。

在基于安卓手機(jī)的訓(xùn)練程序完成后,我們找了20個(gè)藏族學(xué)生,每人訓(xùn)練一小時(shí),對(duì)筆畫進(jìn)行了訓(xùn)練。訓(xùn)練完成后,開(kāi)始對(duì)筆畫的識(shí)別,筆畫識(shí)別方面,我們采用的是基于余弦定理的文本相似判別方法,將所寫筆畫的軌跡信息與訓(xùn)練的語(yǔ)料庫(kù)中所有筆畫訓(xùn)練的信息進(jìn)行對(duì)比,計(jì)算出當(dāng)前所寫筆畫的軌跡信息知識(shí)經(jīng)過(guò)多少步可以變成與當(dāng)前比較的語(yǔ)料庫(kù)中的軌跡信息,最后得出差異化步驟最小的就是相似度最高的那個(gè)筆畫軌跡,進(jìn)而判斷出所寫筆畫。

1.4 聯(lián)機(jī)手寫識(shí)別

藏文聯(lián)機(jī)手寫識(shí)別則是在用戶進(jìn)行手寫的同時(shí)進(jìn)行處理和識(shí)別,因而可以非常方便的獲得藏文手寫筆畫。由此,藏文聯(lián)機(jī)手寫識(shí)別流程可以簡(jiǎn)化為圖7,即先獲取用戶所寫的當(dāng)前筆畫,根據(jù)語(yǔ)料庫(kù)對(duì)當(dāng)前筆畫進(jìn)行識(shí)別,獲得當(dāng)前書寫的筆畫。然后再計(jì)算當(dāng)前所獲得的筆畫序列和語(yǔ)料庫(kù)中藏文字所對(duì)應(yīng)的筆畫序列相似度,計(jì)算此相似度的時(shí)候,方法為:當(dāng)前筆畫序列數(shù)與藏文字對(duì)應(yīng)序列中有x個(gè)筆畫對(duì)應(yīng)相同,該字共有y個(gè)筆畫,相似度則為x/y,若x大于y,則相似度為y/x。然后得出相似度最高的藏文字。

[獲取當(dāng)前筆畫][識(shí)別出當(dāng)前筆畫][識(shí)別出藏文字][語(yǔ)料庫(kù)] [規(guī)則]

2 結(jié)論及展望

最終,我們采用常用的600多個(gè)常用藏文字對(duì)其進(jìn)行測(cè)試,在不考慮連筆書寫的情況下,識(shí)別的準(zhǔn)確率可以達(dá)到92%以上,證明基于筆畫的藏文字識(shí)別是可行的,可以繼續(xù)研究和探討。

此方法還有一些需要改進(jìn)的地方。第一,在筆畫歸類的時(shí)候,可以先進(jìn)行訓(xùn)練,然后根據(jù)訓(xùn)練的數(shù)據(jù)進(jìn)行分析和聚類,控制一個(gè)閾值,使相似度達(dá)到這個(gè)閾值的筆畫聚為一類,然后將其作為語(yǔ)料庫(kù),這種辦法可以有效解決筆畫聚類方面由于開(kāi)發(fā)者主觀因素的影響。第二,記錄筆畫軌跡信息的時(shí)候,可以通過(guò)只錄拐點(diǎn)處的方向碼,以此減少數(shù)據(jù)量,進(jìn)而提高識(shí)別速度。

參考文獻(xiàn)(References):

[1] 楊峰.聯(lián)機(jī)手寫藏文字樣本符采集及分析處理[D].青海師范

大學(xué)碩士學(xué)位論文,2014.

[2] 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊.深度學(xué)習(xí)在手寫

漢字識(shí)別中的應(yīng)用綜述[J].自動(dòng)化學(xué)報(bào),2016.8:1125-1141

[3] 呂新橋.聯(lián)機(jī)手寫漢字識(shí)別技術(shù)研究[D].華中科技大學(xué)碩士

學(xué)位論文,2009.

[4] 柳洪軼,王曉東,王維蘭.藏文聯(lián)機(jī)手寫識(shí)別的難點(diǎn)及其解決

方法[J].西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2005.1:77-80

[5] 唐松,郭椿標(biāo),鄭南寧.基于文字結(jié)構(gòu)特征的快速平滑細(xì)化方

法[J].中文信息學(xué)報(bào),1990.2:49-54

[6] 關(guān)白.信息處理用藏文分詞單位研究[J].中文信息學(xué)報(bào),

2010.3:124-128

[7] 樊慶林.基于筆畫的聯(lián)機(jī)手寫漢字識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D].

安徽大學(xué)碩士學(xué)位論文,2007.