国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

漢字書寫質(zhì)量的模糊分析方法

2013-07-20 01:33王求真戴永樊亮孫廣武
關(guān)鍵詞:特征向量筆畫書寫

王求真,戴永,樊亮,孫廣武

1.湘潭大學(xué)信息工程學(xué)院,湖南湘潭 411105

2.智能計(jì)算與信息處理教育部重點(diǎn)實(shí)驗(yàn)室,湖南湘潭 411105

漢字書寫質(zhì)量的模糊分析方法

王求真1,2,戴永1,2,樊亮1,孫廣武1

1.湘潭大學(xué)信息工程學(xué)院,湖南湘潭 411105

2.智能計(jì)算與信息處理教育部重點(diǎn)實(shí)驗(yàn)室,湖南湘潭 411105

1 引言

漢字書寫質(zhì)量評價(jià)是計(jì)算機(jī)輔助漢字書寫練習(xí)系統(tǒng)中的一項(xiàng)重要功能。對手寫漢字進(jìn)行質(zhì)量評價(jià),不僅能有效提高識別準(zhǔn)確性,而且對書寫者能夠進(jìn)行書寫指導(dǎo),提高書寫質(zhì)量。近年來,計(jì)算機(jī)輔助中文學(xué)習(xí)技術(shù)取得很大的進(jìn)步[1-3],但對手寫漢字的書寫質(zhì)量研究方面非常少見。文獻(xiàn)[4]根據(jù)字體結(jié)構(gòu)的相似度實(shí)現(xiàn)了對手寫制圖字體進(jìn)行自動(dòng)評分,但僅限于規(guī)定格式的標(biāo)準(zhǔn)書寫字體;文獻(xiàn)[5]對聯(lián)機(jī)手寫漢字布局提出了一種基于模板的評價(jià)方法,規(guī)則復(fù)雜,適應(yīng)范圍較小,不具有通用性。目前漢字習(xí)字系統(tǒng)都是基于觸摸屏?xí)鴮懛绞?,但由于觸摸屏的光滑性,觸摸筆在書寫過程中會(huì)產(chǎn)生滑動(dòng)導(dǎo)致書寫產(chǎn)生筆畫畸變、變形、位置偏移、大小不均等一系列錯(cuò)誤,從而影響書寫的美觀,因此質(zhì)量評價(jià)對于快速客觀評價(jià)書寫質(zhì)量并有效指導(dǎo)書寫有著重要的研究意義。在這方面,文獻(xiàn)[6]針對規(guī)定格式手寫英文字母,通過建立標(biāo)準(zhǔn)模板,利用距離比較法,檢測二者之間的相似度,而提出了一種普適質(zhì)量評價(jià)方法,取得了一定的實(shí)驗(yàn)效果,然而這一方法針對手寫漢字效果并不理想,因?yàn)闈h字類別眾多,結(jié)構(gòu)復(fù)雜,手寫漢字具有更大的隨意性,從而導(dǎo)致其結(jié)構(gòu)產(chǎn)生較大的模糊性。本文針對在仿真文字書寫練習(xí)本規(guī)定格式中練習(xí)書寫漢字常見的幾種漢字書寫問題提出相應(yīng)的模糊[7-11]分析方法,書寫筆畫以關(guān)鍵點(diǎn)為特征,書寫結(jié)構(gòu)以比例、大小及位置等為特征,關(guān)鍵點(diǎn)直接采用高斯法進(jìn)行模糊化,書寫結(jié)構(gòu)特征通過統(tǒng)計(jì)實(shí)驗(yàn)?zāi):?,通過模糊貼近度實(shí)現(xiàn)漢字書寫質(zhì)量分析,評價(jià)結(jié)果較為客觀理想。

2 觸摸屏漢字書寫分析

漢字屬于方塊字,是由不同的筆畫和部件按照一定的順序和相對位置在二維空間上構(gòu)成的線段圖像,由于存在字形結(jié)構(gòu)復(fù)雜性的問題,即筆畫多、部件繁、結(jié)構(gòu)雜,使得漢字難寫、難用。書寫風(fēng)格因人而異,從而造成手寫體漢字變形,具體表現(xiàn)為:基本筆畫變化,如橫不平,豎不直,折筆的拐角變成圓弧等;筆畫模糊不規(guī)范,該連的不連,不該連的卻相連。筆畫與筆畫之間、部件與部件之間的位置發(fā)生改變。筆畫的傾斜角、筆畫的長短、部件的大小發(fā)生變化。這些字形的變化是最難以判斷和評價(jià)的問題。

圖1是部分觸摸屏仿真文字書寫練習(xí)本田字格式上書寫練習(xí)產(chǎn)生的問題漢字。圖1(a)反映了筆畫書寫多次抖動(dòng)產(chǎn)生的筆畫畸變問題;圖1(b)書寫漢字明顯過小;圖1(c)中漢字書寫長寬比例不當(dāng),漢字顯得過廋;圖1(d)中漢字位置明顯偏左。綜合上面書寫的各種問題,本文對手寫漢字的質(zhì)量評價(jià)主要包括對各筆畫(基元)、字形結(jié)構(gòu)的規(guī)范性評價(jià),具體內(nèi)容為書寫大小、比例、位置等方面。

圖1 觸摸屏上手寫樣本

3 書寫特征模糊子集構(gòu)造

3.1 筆畫書寫特征模糊子集

觸摸屏筆跡點(diǎn)二維坐標(biāo)向量用P表示,P=[p1,p2,…,pn]=[(x1,y1),(x2,y2),…,(xn,yn)]。如果以筆跡坐標(biāo)作為筆畫特征,建庫量特別大,因此將按下述方法進(jìn)行特征提取。

3.1.1 筆畫特征提取

根據(jù)所分析的筆畫書寫特點(diǎn)可建立四種拐點(diǎn)和四種極點(diǎn)共八種關(guān)鍵點(diǎn)類型。圖2(a)~(h)所示黑色點(diǎn)分別為左上拐點(diǎn)ζ1、右上拐點(diǎn)ζ2、左下拐點(diǎn)ζ3、右下拐點(diǎn)ζ4、左極點(diǎn)ζ5、右極點(diǎn)ζ6、上極點(diǎn)ζ7、下極點(diǎn)ζ8。因此可以提取一個(gè)漢字中的各種組成筆畫關(guān)鍵點(diǎn),構(gòu)成的集合表示為K= {ζ1,ζ2,ζ3,ζ4,ζ5,ζ6,ζ7,ζ8},統(tǒng)計(jì)各關(guān)鍵點(diǎn)數(shù)目用向量N表示,N=[n1,n2,n3,n4,n5,n6,n7,n8]。

圖2 關(guān)鍵點(diǎn)分類

3.1.2 筆畫特征模糊集

以上述方法提取的特征點(diǎn)建立各種書寫筆畫特征集合,如橫筆畫,顯然在理想的情況下,其特征集合應(yīng)該為Nh={0,0,0,0,0,0,0,0},即不含上述任何關(guān)鍵點(diǎn);撇筆畫,其理想特征集合應(yīng)該為Np={0,0,0,0,0,1,0,0},即該理想筆畫只含一個(gè)右極點(diǎn);橫折筆畫,其理想特征集合應(yīng)該為Nhz={0,1,0,0,0,0,0,0},即該理想筆畫只含一個(gè)右上拐點(diǎn)。對書寫的各筆畫特征進(jìn)行模糊化,建立筆畫特征的模糊集合,式(1)用來建立書寫各筆畫模糊特征向量。

其中,xK為書寫筆畫特征向量,aK為理想筆畫特征向量,δ為最大允許特征點(diǎn)差異數(shù)目,K={ζ1,ζ2,ζ3,ζ4,ζ5,ζ6,ζ7,ζ8}。

3.2 書寫大小、比例和位置特征模糊子集

在規(guī)定方格里面進(jìn)行漢字書寫,要顯得美觀,其大小、比例和位置都應(yīng)在合適范圍之內(nèi),不宜采取固定值匹配分析方法,采用模糊的方法能得到更為客觀準(zhǔn)確的分析結(jié)果。

3.2.1 特征提取

征:T=(xmax-xmin)/(ymax-ymin);以漢字書寫的重心作為位置特征點(diǎn),構(gòu)成二維特征向量,其中

圖3 規(guī)定方格書寫漢字坐標(biāo)定義

3.2.2 特征模糊函數(shù)確定

通過206個(gè)漢字按標(biāo)準(zhǔn)書寫而采集到的大小、比例模糊特征分布情況分別如圖4、圖5所示。

由圖4分布情況,可知大部分漢字大小特征值處于0.2~0.4之間,圖4(b)分布情況定義大小特征模糊隸屬度函數(shù)如下:

圖4 標(biāo)準(zhǔn)書寫漢字大小特征分布

圖5 標(biāo)準(zhǔn)書寫漢字比例特征分布

其中,xS為書寫大小特征向量,aS為大小特征分布的中心點(diǎn),aS∈[0.2,0.4]。

由圖5分布情況,可知大部分漢字比例特征值處于0.9~1.1之間,由此可由模糊子集的概念定義下面的模糊隸屬度:

其中,xT為書寫大小特征向量,aT為大小特征分布的中心點(diǎn),aT∈[0.9,1.1]。

4 書寫質(zhì)量模糊評價(jià)模型設(shè)計(jì)及算法

4.1 筆畫模糊評價(jià)

設(shè)一個(gè)書寫漢字有m條筆畫,由標(biāo)準(zhǔn)書寫產(chǎn)生各筆畫特征模糊集合為:

待評價(jià)筆畫的模糊特征集合向量:

B、A中單個(gè)筆畫模糊特征貼近度:

其中i∈{1,2,…,m}。

計(jì)算漢字整體筆畫模糊特征貼近度:

其中0〈wi〈1為各筆畫在整個(gè)漢字的重要性而分配的權(quán)值。

筆畫質(zhì)量評價(jià)集內(nèi)容設(shè)計(jì)為VK={很好,較好,一般,較差,很差},即書寫效果按5個(gè)等級進(jìn)行評價(jià),“很好”為最高級別,“很差”為最低級別。式(8)計(jì)算結(jié)果與筆畫質(zhì)量評價(jià)等級JK(∈VK)對應(yīng)關(guān)系如表1所示。

表1 漢字書寫筆畫質(zhì)量評價(jià)等級與模糊貼近度對應(yīng)表

在觸摸屏上進(jìn)行書寫,落筆到抬筆決定了一個(gè)筆畫,可得到筆畫數(shù)目為m,筆畫類型可從習(xí)字樣本庫中獲取,具體評價(jià)算法如下:

算法1書寫質(zhì)量筆畫評價(jià)

輸入:經(jīng)前置處理之后的筆畫信息{P(1),P(2),…,P(m)},標(biāo)準(zhǔn)模糊集μA(x)

輸出:筆畫質(zhì)量等級JK

步驟:

(1)i←1;

(3)由式(1)計(jì)算筆畫模糊特征向量集合μB(xi);

(4)由式(7)計(jì)算μA(xi)和μB(xi)的貼近度d(i)(A,B);i←i+1,若i〈=m,轉(zhuǎn)(2),否則轉(zhuǎn)(5);

(5)由式(8)計(jì)算漢字整體筆畫模糊特征貼近度sim(A,B);

(6)根據(jù)表2查取筆畫質(zhì)量評價(jià)JK并輸出。

4.2 結(jié)構(gòu)模糊評價(jià)

利用式(2)~(4)分別計(jì)算大小、比例、位置的模糊特征隸屬度μ(xS)、μ(xT)和μ(xw),作為評價(jià)書寫漢字結(jié)構(gòu)質(zhì)量好壞的3個(gè)指標(biāo),則可以構(gòu)成模糊集合:

為表達(dá)兩個(gè)書寫漢字結(jié)構(gòu)質(zhì)量狀況的相似程度,利用下式來計(jì)算兩個(gè)漢字的結(jié)構(gòu)模糊特征集Ha和Hb的貼近度:

考慮到書寫的差異性,取n個(gè)書寫漢字結(jié)構(gòu)模糊特征{H1,H2,…,Hn-1,Hx},建立模糊相似矩陣,其中H1-Hn-1為n-1個(gè)標(biāo)準(zhǔn)書寫漢字,Hx為待評價(jià)漢字模糊結(jié)構(gòu)特征集。于是可以得到以rij為元素的模糊相似矩陣。

計(jì)算Hx與其他標(biāo)準(zhǔn)書寫漢字的平均相似度:

利用模糊聚類的方法,對照表2可以得出相應(yīng)的結(jié)構(gòu)質(zhì)量評價(jià)結(jié)果JH(∈VH)。書寫結(jié)構(gòu)評價(jià)集為VH={好,一般,差}。

表2 漢字書寫結(jié)構(gòu)質(zhì)量評價(jià)等級與相似度對應(yīng)表

在評價(jià)書寫結(jié)構(gòu)質(zhì)量之前,需提取n-1個(gè)標(biāo)準(zhǔn)書寫漢字的模糊結(jié)構(gòu)向量并建立相似矩陣,待評價(jià)漢字與它們的平均相似度決定其書寫結(jié)構(gòu)標(biāo)準(zhǔn)程度,算法如下:

算法2書寫質(zhì)量結(jié)構(gòu)評價(jià)

輸入:經(jīng)前置處理之后的筆畫信息{P(1),P(2),…,P(m)},標(biāo)準(zhǔn)書寫結(jié)構(gòu)向量組{} H1,H2,…,Hn-1

輸出:結(jié)構(gòu)質(zhì)量等級JH

步驟:

(1)j←1;

(2)用式(2)(3)(4)分別計(jì)算大小、比例、位置的模糊特征隸屬度μ(xS)、μ(xT)和μ(xw);

(3)由式(9)計(jì)算其與標(biāo)準(zhǔn)書寫漢字的模糊結(jié)構(gòu)特征相似度rjx;j←j+1,若j〈=n-1則繼續(xù)(3),否則轉(zhuǎn)(4);

(4)由式(11)計(jì)算平均相似度-rx;

(5)根據(jù)表2查取結(jié)構(gòu)質(zhì)量評價(jià)JH并輸出。

4.3 綜合評價(jià)

在上述各種評價(jià)的基礎(chǔ)上進(jìn)行綜合評價(jià),可得到一個(gè)全面的評判結(jié)果。若筆畫和結(jié)構(gòu)相似度任意一項(xiàng)小于0.5則取其中的最小值,否則根據(jù)各項(xiàng)的重要性求取綜合評價(jià)結(jié)果。綜合評價(jià)函數(shù)如下:

綜合評價(jià)等級集VU={好,一般,差},評價(jià)結(jié)果JU(∈VU)對應(yīng)關(guān)系如表3所示。

表3 漢字書寫綜合評價(jià)等級對應(yīng)表

5 實(shí)驗(yàn)及效果分析

實(shí)驗(yàn)硬件平臺包括7英寸觸摸屏、32位ARM920Τ、64 MB內(nèi)存等;軟件平臺方面,操作系統(tǒng)采用Wince 5.0,編程軟件采用VS2005,編程語言采用C++。以田字格為例,書寫區(qū)域?yàn)?0×80點(diǎn)陣。圖6是部分漢字書寫評價(jià)實(shí)驗(yàn)效果。

表4 測試漢字書寫評價(jià)表

圖6 漢字書寫實(shí)驗(yàn)效果圖

對圖6(a)中字“水”進(jìn)行筆畫質(zhì)量評價(jià),得到筆畫總數(shù)m=4,筆畫類型:豎勾,橫撇,撇,捺;筆畫模糊特征向量為:

對照表1得出評價(jià)結(jié)果為:JK=“一般”。

字“水”進(jìn)行結(jié)構(gòu)質(zhì)量評價(jià),經(jīng)過書寫訓(xùn)練,取aS=0.35,aT=1.0,80×80方格區(qū)域其重心為(40,40),由式(2)~(4)計(jì)算其結(jié)構(gòu)模糊特征向量為:Hx={} 0.664,0.925,0.776,取模糊相似矩陣n=10,建立相似矩陣如下:

因此Hx與其他標(biāo)準(zhǔn)書寫漢字的平均相似度:

對照表2得出評價(jià)結(jié)果為:JH=“好”。

對“水”進(jìn)行綜合評價(jià):

對照表3得出評價(jià)結(jié)果:JU=“一般”。

按照前面所述方法對書寫筆畫和結(jié)構(gòu)質(zhì)量進(jìn)行評價(jià),圖6書寫漢字其各項(xiàng)評價(jià)結(jié)果如表4所示。

通過對200個(gè)漢字進(jìn)行共500次書寫的樣本進(jìn)行質(zhì)量評價(jià),得到評價(jià)效果分析表如表5所示。實(shí)驗(yàn)結(jié)果表明,各項(xiàng)漢字書寫質(zhì)量評價(jià)準(zhǔn)確率較高,最低為82.03%,最高能達(dá)到90.42%,因此能夠很好地應(yīng)用于漢字書寫輔導(dǎo)。

表5 評價(jià)效果測試表

6 結(jié)束語

仿真紙質(zhì)文字書寫練習(xí)本規(guī)定格式的文字書寫練習(xí)指導(dǎo)是聯(lián)機(jī)自由手寫模式處理的一個(gè)新型研究內(nèi)容,文獻(xiàn)[12]報(bào)道了這方面取得的重要研究成果。本文就仿真練習(xí)本自由手寫漢字常見的幾個(gè)書寫問題實(shí)現(xiàn)了模糊分析,在文獻(xiàn)[12]報(bào)道的系統(tǒng)中得到了具體應(yīng)用,分析效果客觀,評價(jià)意見表達(dá)實(shí)時(shí),能夠很好地指導(dǎo)習(xí)字者進(jìn)行正確的漢字書寫,可有效提升用戶漢字書寫質(zhì)量。同時(shí),該方法也能借鑒到其他文種文字的仿真紙質(zhì)文字書寫練習(xí)本規(guī)定格式書寫輔導(dǎo)。

[1]Gu Yi,Wu Yan.Handwritten chinese character synthesis method based on structure knowledge[J].Computer Engineering,2011,37(3):266-268.

[2]Hu Zhihui,Xu Yun,Huang Liusheng.A Chinese handwriting education system with automatic error detection[J].Journal of Software,2009,4(2):101-107.

[3]劉禹,何克抗.計(jì)算機(jī)輔助漢字書寫教學(xué)的研究:書寫漢字庫生成系統(tǒng)的研制[J].中文信息學(xué)報(bào),1994,8(4):34-42.

[4]劉玉峰.手寫制圖字體結(jié)構(gòu)評判自動(dòng)化研究[J].測繪學(xué)院學(xué)報(bào),2000,17(1):49-52.

[5]夏偉平,金連文.一種基于模板的聯(lián)機(jī)手寫體漢字布局評價(jià)方法[C]//2008年全國模式識別學(xué)術(shù)會(huì)議論文集,2008:354-359.

[6]王耀,戴永.規(guī)定格式文字書寫練習(xí)質(zhì)量普適評價(jià)[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(29):69-72.

[7]李哲,玉俊奇,楊兆中,等.一種模糊識別手寫體漢字技術(shù)[J].計(jì)算機(jī)工程,2003,29(12):96-97.

[8]萬莉.手寫簽名模糊識別方法的研究與實(shí)現(xiàn)[D].武漢:武漢理工大學(xué),2006.

[9]Chen S M.Fuzzy forecasting based on fuzzy-trend logical relationship groups[J].IEEE Τransactions on Systems,Man,and Cybernetics,Part B,Cybernetics,2010,40(5):1343-1348.

[10]Khatibi V,Montazer G A.Intuitionistic fuzzy set vs.fuzzy set application in medical pattern recognition[J].Artificial Intelligence in Medicine,2009,47(1):43-52.

[11]Lu J,Yuan X,Yahagi Τ,et al.A method of face recognition based on fuzzy c-Means clustering and associated sub-NNs[J]. IEEE Τransactions on Neural Networks,2007,18(1):150-160.

[12]戴永.可聯(lián)網(wǎng)交互的多功能規(guī)定格式習(xí)字系統(tǒng)及方法:中國,ZL 201010149767.2[P].2011-08-25.

WANG Qiuzhen1,2,DAI Yong1,2,FAN Liang1,SUN Guangwu1

1.College of Information Engineering,Xiangtan University,Xiangtan,Hunan 411105,China
2.Key Lab of Intelligent Computing&Information Processing,Ministry of Education,Xiangtan,Hunan 411105,China

Evaluating the quality of handwritten Chinese characters can evaluate the degree of writing appearance objectively, and can point out even correct the non-standard case in Chinese characters written.Τhis paper prescribes several common problems of Chinese characters written in restricted area,and uses fuzzy analysis method to evaluate the writing strokes and structure quality of writing objectively by extracting different writing characteristics.Τhe experiment shows that the method is accurate and efficient for Chinese characters writing counseling.

Chinese character;writing quality;fuzzy;quality evaluation

對書寫漢字進(jìn)行質(zhì)量評價(jià),可以客觀評價(jià)書寫的美觀程度,指出甚至糾正漢字書寫中的不規(guī)范的情況。針對規(guī)定格式的漢字書寫常見的幾種書寫問題,在書寫筆畫和書寫結(jié)構(gòu)方面,通過提取不同的書寫特征向量,采用模糊分析的方法,對漢字書寫質(zhì)量進(jìn)行了客觀的評價(jià)。實(shí)驗(yàn)表明,這種評價(jià)方法準(zhǔn)確高效,能很好實(shí)現(xiàn)漢字書寫輔導(dǎo)。

漢字;書寫質(zhì)量;模糊;質(zhì)量評價(jià)

A

ΤP391

10.3778/j.issn.1002-8331.1201-0323

WANG Qiuzhen,DAI Yong,FAN Liang,et al.Fuzzy analysis method for quality of handwritten Chinese characters. Computer Engineering and Applications,2013,49(21):180-185.

湖南省重點(diǎn)學(xué)科資助;湖南省高校創(chuàng)新平臺開放基金項(xiàng)目(No.09K040);湖南省科技計(jì)劃項(xiàng)目(No.2011GK3204);湘潭大學(xué)自然科學(xué)基金項(xiàng)目(No.09XZX23)。

王求真(1976—),男,講師,CCF會(huì)員,主要研究方向:模式識別、人工智能、信息安全;戴永,教授;樊亮,研究生;孫廣武,研究生。E-mail:wqz76@163.com

2012-01-17

2012-03-31

1002-8331(2013)21-0180-06

CNKI出版日期:2012-06-04http://www.cnki.net/kcms/detail/11.2127.ΤP.20120604.1433.003.html

◎信號處理◎

猜你喜歡
特征向量筆畫書寫
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
Unwritten 尚未書寫
克羅內(nèi)克積的特征向量
用什么書寫呢?
筆畫相同 長短各異
——識記“己”“已”“巳”
有趣的一筆畫
離婚起訴書寫好之后
找不同
一類特殊矩陣特征向量的求法
EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用