国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多特征集成分類器的脫機滿文識別方法

2012-05-04 08:09:16巍,郭
計算機工程與設(shè)計 2012年6期
關(guān)鍵詞:鏈碼滿文交叉點

魏 巍,郭 晨

(1.大連民族學(xué)院 計算機科學(xué)與工程學(xué)院,遼寧 大連116600;2.大連海事大學(xué) 航海學(xué)院,遼寧 大連116026)

0 引 言

近年來國內(nèi)外針對漢字印刷體和手寫體的識別技術(shù)開展了很多研究,取得了一定的成果,但對我國少數(shù)民族文字的識別,特別是對滿文識別的研究卻相對較少。事實上,自清太祖努爾哈赤仿照蒙文字母創(chuàng)制滿族文字以來,在近300余年的時間里,滿文作為一種官方文字清晰的記錄了大量的滿清時期我國政治、軍事、歷史、氣象等具有很高史料價值的資料,然而這些資料如今散落在各地的博物館中,信息利用率較低[1]。運用現(xiàn)代化的識別技術(shù),充分挖掘這些寶貴的檔案資料,對于研究滿清歷史文化,保護和傳承我國非物質(zhì)文化遺產(chǎn)有著十分重要的意義。

1 滿文識別系統(tǒng)的架構(gòu)

滿文屬于阿爾泰語系滿-通古斯語族語支,其書寫形式通常帶有圈點,故又稱為 “圈點滿文”。滿文識別技術(shù)的研究對其它阿爾泰語系文字,特別是對錫伯文和蒙古文的掃描識別研究有重要的借鑒作用。由于大部分滿文資料均為手書體,因此本文研究的目標(biāo)是規(guī)范書寫的圈點滿文手寫體。

滿文存在字符變形的情況,為了更好的識別滿文,針對滿文字元開展識別研究。所謂滿文字元是組成滿文單詞的基本單元,通過一系列處理操作獲得。首先將掃描成圖像的手寫圈點滿文數(shù)字化為二維像素點坐標(biāo)序列,其次進行二值化、去噪、傾斜校正、行列劃分等預(yù)處理操作,最后依據(jù)一定的算法切分出滿文字元。針對字元提取其投影特征、鏈碼特征以及端點和交叉點特征,并組合3組特征進行基于BP神經(jīng)網(wǎng)絡(luò)的集成分類識別,將識別得到的結(jié)果作為后處理部件的輸入進行處理,采用隱馬爾科夫模型(HMM)校正識別過程中出現(xiàn)的錯判和拒判情況,進一步提高系統(tǒng)的識別率。脫機手寫體滿文文本識別系統(tǒng)的架構(gòu)如圖1所示。

圖1 脫機手寫體滿文文本識別系統(tǒng)架構(gòu)

2 識別預(yù)處理

預(yù)處理是識別系統(tǒng)中重要的一個環(huán)節(jié),通過二值化、去噪等操作來消除原始圖像中一些與統(tǒng)計類別無關(guān)的因素,以此提高統(tǒng)計的精度。

2.1 二值化原始滿文圖像

由于滿文文檔存放年代久遠(yuǎn),書寫的紙張存在不同程度的腐蝕和老化,因此在原始滿文圖像中,背景色的對比度并不總是相同的。為此,設(shè)計了動態(tài)閾值識別算法來區(qū)別圖像像素中文本信息和背景信息,并以此二值化圖像。求取動態(tài)閾值算法如下:

(1)設(shè)置128作為圖像二值化的初始閾值;

(2)高于128的像素點均作為背景色,低于128的作為前景色;

(3)求出(2)中背景色和前景色的均值,并將兩者的平均作為新閾值;

(4)重復(fù)操作(2)~(4)直到新閾值與上次閾值變化在2%以內(nèi)。

2.2 去 噪

手書的滿文序列受書寫快慢和筆畫抖動等因素的影響,通常帶有較大的噪聲,這對識別將會產(chǎn)生一定的影響,這里采用高斯濾波算法[2],對滿文圖像進行濾波去噪處理,如下所示

2.3 傾斜校正

滿文的書寫方式非常獨特,與漢字和英文等文字有很大區(qū)別。滿文書寫一般按照從左至右,由上至下豎寫完成,每個單詞中所有的字符綴連在一個豎直的主干線上,然而由于書寫風(fēng)格不同,部分滿文字體存在偏離主干線的情況,因此有必要對滿文進行傾斜校正。本文采用Hough變換[3]獲得實際滿文的主干線,它與垂直線的夾角即為偏離正常主線的角度,將樣本旋轉(zhuǎn)相應(yīng)的角度即可校正傾斜的樣本,如圖2所示。

圖2 滿文 “閣”字的校正

2.4 滿文的切分

滿文字符拼寫復(fù)雜,同一個字符根據(jù)所在單詞位置的不同具有不同的顯現(xiàn)形式,如滿文元音字母a就有獨立形、詞首形、詞中形和詞尾形等不同的顯示形式,這為正確識別滿文帶來很大的困難。為了更好的識別滿文,在識別前需要對滿文圖像進行行列切分,以獲取滿文字元。如圖3所示,左邊為正常書寫的滿文單詞,右邊為切分得到的滿文單詞字元。

考慮到滿文單詞中存在圈點的形式,由于圈點并沒有和文字主干相連,可以直接通過掃描法判斷它們的存在并得到具體的位置所在,因此在以下切分和文字識別算法中沒有考慮圈點的情況。對掃描的滿文文本采用分層切分的方式,首先切分出圖像中滿文文本的列,再切分出每列中不同的單詞,再對每個滿文單詞進行進一步的切分,得到識別用的字元[2,4]。具體切分算法如下:

圖3 滿文單詞 “哲理”字元切分

(1)滿文列切分:列切分就是將圖像中的每一列滿文提取出來??紤]到滿文的書寫特點,對滿文圖像進行垂直投影,由于兩列滿文之間存在一定的空隙,因此在投影圖像中必然存在投影的空白區(qū)域,由左至右搜索投影圖像中空白區(qū)域,將空白區(qū)域與投影區(qū)域的交界作為滿文列切分的左右邊界,從而切分出滿文列;

(2)滿文詞切分:滿文在行文中詞與詞之間存在一定的空隙,因此針對切分出的滿文列在水平方向進行投影,由上至下搜索投影圖像中空白區(qū)域,將空白區(qū)域與投影區(qū)域的交界作為單詞之間的上下邊界,進而切分出滿文單詞;

(3)滿文字元切分:由滿文的字形可知,單詞中軸匯聚了最多的像素點,中軸的左側(cè)和右側(cè)為滿文單詞的分支筆畫,統(tǒng)計大量的滿文單詞可知,中軸左右兩側(cè)的有效像素信息一般為中軸像素信息的3倍寬度,因此可采用以下算法切分滿文字元:

1)對滿文單詞進行垂直投影,像素點最多的投影區(qū)域被確定為單詞的中軸邊界,計算出滿文中軸邊界長度,并以此為基準(zhǔn)分別向左右擴展3倍中軸邊界寬度,重點考察這一區(qū)域的滿文像素分布情況;

2)對考察區(qū)域內(nèi)的滿文單詞進行水平投影,分布在中軸左右兩側(cè)的筆畫信息所投得影像將高于單純的中軸水平投影,因此將高于中軸投影的像素累積與中軸投影的像素累積的交界點作為滿文字元的切分點,依此算法共切分出36個滿文字元;

3)通過仿射變換對切分出的滿文字元歸一化為100*100像素尺寸,同時使用形態(tài)學(xué)操作來平滑字符圖像的邊界。

3 特征提取

針對切分的滿文字元,通過三類特征集合進行描述,分別是投影特征、邊界鏈碼特征和端點交叉點特征。陰影特征從歸一化的字符圖像中統(tǒng)計獲得;邊界鏈碼特征通過對圖像進行邊界追蹤從而獲得邊界點的鏈碼信息;端點交叉點特征從細(xì)化為一個像素寬的滿文字元骨架中獲取。

3.1 投影特征

這里的投影特征是將滿文字元向某一方向做垂直映射,所獲得的映射陰影長度作為特征集合中的元素進行保存[5]。如圖4所示,考察滿文字符a的獨立形,把封閉滿文字元的矩形分為8個象限,將位于不同象限中的字元向垂直邊界和對角線上分別做3個方向上的投影計算,以此獲得24個投影特征。

圖4 滿文字元投影特征的提取

3.2 邊界鏈碼特征

使用鏈碼表示圖像邊界最早是由Freeman提出的。所謂鏈碼可被看作由一系列具有固定方向和長度的小直線段組成。Freeman鏈碼具有兩種表現(xiàn)形式,8方向鏈碼和4方向鏈碼[6-7],如圖5和圖6所示。根據(jù)邊界跟蹤,每個邊界像素點被分配不同的碼值用來表示下一個邊界像素的鏈碼方向,邊界跟蹤可以按順時針方向進行也可按逆時針方向。滿文字元的字符邊界判斷方法如圖7所示,考慮一個3*3的像素點陣,如果目標(biāo)點P的4個鄰接點中有1個是背景像素點,則稱目標(biāo)點P為邊界點。將字元邊界圖像劃分為5*5網(wǎng)格的形式,為了避免因起始點確定的不同而導(dǎo)致鏈碼統(tǒng)計的多樣性,這里約定以每個網(wǎng)格中的左下角為基準(zhǔn)開始掃描,將遇到的第一個邊界點作為本網(wǎng)格內(nèi)邊界像素鏈碼統(tǒng)計的起始點,逆時針方向統(tǒng)計網(wǎng)格內(nèi)邊界像素的4方向和8方向鏈碼值,分別累計獲得100個和200個鏈碼特征信息。

3.3 端點和交叉特征

為了提取滿文字元的端點和交叉點特征,需要將滿文字元細(xì)化為一像素寬度,重點考察滿文字元的骨架信息,使用Hilditch算法將滿文字元細(xì)化為一像素寬度。將細(xì)化的圖像劃分為4*4的網(wǎng)格形式,每一網(wǎng)格的像素尺寸為25*25。統(tǒng)計每個網(wǎng)格中存在的字元骨架的端點和交叉點的特征個數(shù)。實際上所謂的端點像素特征是在8方向鄰接像素內(nèi)僅有一個像素點與之相連[8],即(Effect({p})=1)∩(Effect({Next8(p)})=1)。其中p是當(dāng)前像素點,函數(shù)Effect({p1,p2,…,pn})表示返回集合 {p1,p2,…,pn}中的有效像素點個數(shù),Next8(p)表示像素點p的8鄰域像素。

像素交叉點特征的確定算法是:設(shè)當(dāng)前黑色像素點為參考點P,考察P點的8方向鄰域,確定黑色像素點的個數(shù)記為C,從中任選兩個不相鄰的黑色像素點M和N,分別考察其4方向鄰域,確定其與P點相鄰的黑色像素點個數(shù),記為C1和C2。若C-C1-C2≥3,則參考點P為像素交叉點。不難發(fā)現(xiàn),若P為交叉點,則在其8方向鄰域像素內(nèi)至少存在3個像素點與之相連,即(Effect({p})=1)∩(Effect({Next8(p)})≥3)是當(dāng)前像素P為交叉點的必要條件。

統(tǒng)計滿文字元的端點和交叉點特征如圖8所示,考慮到滿文字符的整體結(jié)構(gòu)集中在單詞中軸附近,因此僅考察網(wǎng)格4-11,對于其它網(wǎng)格的舍棄,并不影響滿文特征的識別效果。統(tǒng)計由端點和交叉點特征組成16個特征值,其中前8個特征為每個網(wǎng)格中的字元端點個數(shù),后8個特征為網(wǎng)格中交叉點的個數(shù),圖8所示的端點和交叉點特征為01001110 01000100。

圖8 滿文字元骨架網(wǎng)格分布

4 分類器的設(shè)計

神經(jīng)網(wǎng)絡(luò)是對人腦或自然神經(jīng)網(wǎng)絡(luò)若干基本特性的抽象和模擬,是一種基于連接學(xué)說構(gòu)造的智能仿生模型,是由大量神經(jīng)元組成的非線性動力系統(tǒng)。將神經(jīng)網(wǎng)絡(luò)用于文字分類識別的出發(fā)點是因為神經(jīng)網(wǎng)絡(luò)的優(yōu)點主要是抗干擾能力很強[9]。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型有BP網(wǎng)絡(luò),Hopfield網(wǎng)絡(luò),Hamming網(wǎng)絡(luò)等。本文使用BP網(wǎng)絡(luò)對提取的滿文字元不同特征進行識別分類。通過求得權(quán)值空間中下降梯度來使訓(xùn)練樣本的方差和最小,以此對滿文字元進行分類,其中激勵函數(shù)采用S型函數(shù),同時為了提高網(wǎng)絡(luò)的運算效率避免求解限于局部最優(yōu),在修正權(quán)值ω(k)時,引入了動量項和變學(xué)習(xí)率的算法,因此權(quán)值修改公式如下

式中:η——動量項因子,取值在 [0,1)之間;D(k)、D(k-1)——k、k-1時刻的負(fù)梯度;α——學(xué)習(xí)率,取值在 [0,1]之間,α越大,對網(wǎng)絡(luò)權(quán)值的修改越大,網(wǎng)絡(luò)學(xué)習(xí)速度越快,權(quán)值在學(xué)習(xí)過程中易產(chǎn)生振蕩,α過小,對權(quán)值修改難趨穩(wěn)定,收斂過慢[10]。采用變學(xué)習(xí)率算法,在BP網(wǎng)絡(luò)進化初期快速收斂,隨著學(xué)習(xí)過程的進行,學(xué)習(xí)率不斷減小,網(wǎng)絡(luò)趨于穩(wěn)定。變學(xué)習(xí)率計算公式如下

式中:αmax、αmin——最大、最小學(xué)習(xí)率,tmax——最大迭代次數(shù),t——當(dāng)前迭代次數(shù)。

針對上述提取的滿文字元特征,設(shè)置BP網(wǎng)絡(luò)輸入層的神經(jīng)元個數(shù)分別為24、100、200和16。通過實驗效果的對比,投影、4方向鏈碼、8方向鏈碼以及端點和交叉點特征的隱含層神經(jīng)元個數(shù)分別6、16、18、4時,單個特征識別效果最優(yōu)。輸出層為所分類的字元類別數(shù)目,這里為36個類別。BP網(wǎng)絡(luò)采用簡單最大響應(yīng)策略對滿文字元進行分類。

5 分類器的集成

多分類器的集成往往較單分類器的識別能獲取更好的識別效果。一般來講,物體的某一特征僅反映了其某一方面的特性,而從物體提取的多個特征向量,往往具有一定的互補性;另一方面,在當(dāng)前維度中不好區(qū)分的特征,可能在另一種特征空間中很容易區(qū)分。因此,考慮采用多分類器的集成對物體的多個特征進行識別,進而達到提高識別率的目的。多分類器集成有3種基本的結(jié)構(gòu)形式,串聯(lián)型、并聯(lián)型和混聯(lián)型[11],分別如圖9所示。

圖9 多分類器集成結(jié)構(gòu)

本文采用并聯(lián)結(jié)構(gòu)設(shè)計分類器集成,該集成分類器基于候選字加權(quán)多數(shù)表決原理對滿文字元的3組特征識別結(jié)果進行集成判斷。集成分類器由C1,C2,…Ck個子分類器組成,待識別滿文字元M經(jīng)過分類器Ck識別后產(chǎn)生n個候選輸出ck1,ck2,…,ckn,每個候選輸出對應(yīng)的加權(quán)因子為pk1,pk2,…pkn,對應(yīng)的相似度為sk1,sk2,…,skn。若分類器Ck決定將一個未知的滿文字元分類到第i個類,1≤i≤n,n為分類的個數(shù),則其置信度可表示為

式中:ωk——分類器的加權(quán)因子,dk——單獨采用一種特征進行分類識別時所獲得的識別率。最終系統(tǒng)的集成判據(jù)根據(jù)置信度最大原則如下

6 識別效果

為了測試集成分類器的識別效果,本文構(gòu)建了滿文字體識別系統(tǒng),對滿文詞典中的800個單詞進行學(xué)習(xí)并構(gòu)建滿文的投影、鏈碼以及端點和交叉點特征庫,其中每個滿文單詞選取3種方式書寫進行訓(xùn)練。測試樣本從 《高宗實錄第一卷》中隨機抽取600字并分為3部分,每部分200個測試字。所有測試樣本經(jīng)過光學(xué)掃描、預(yù)處理、歸一化等操作轉(zhuǎn)換為標(biāo)準(zhǔn)的100*100二值化像素點陣圖像。

實驗首先分別單獨測試采用投影、鏈碼以及端點和交叉點作為特征的滿文識別率。使用3倍交叉驗證的方式,將第一和第二部分共400字作為特征訓(xùn)練樣本對單系統(tǒng)開展訓(xùn)練,用第三部分的200字對系統(tǒng)進行陰影特征識別測試;將第一和第三部分作為特征訓(xùn)練樣本,第二部分進行鏈碼特征識別測試;將第一和第二部分作為特征訓(xùn)練樣本,第三部分進行端點和交叉點特征識別測試。測試結(jié)果如表1所示。

表1 滿文字元不同特征識別率

實驗其次對兩類單獨的特征和三類特征進行集成識別,結(jié)果見表2。

表2 多分類器集成識別率

綜合表1和表2的數(shù)據(jù)可知,8方向鏈碼的特征組合識別率要高于4方向鏈碼,集成分類器的識別率要高于單個特征的識別率,同時集成分類器中類別越多,識別效果越好。

7 識別后處理

滿文識別后處理的過程就是利用單詞識別已獲得的滿文識別信息,結(jié)合滿文的構(gòu)詞規(guī)則及其統(tǒng)計特性來檢測、糾正單詞識別輸出的拒識詞和錯識詞,以此來提高系統(tǒng)的識別率[12-13]。隱馬爾科夫模型(HMM)可以將自然語言和圖像觀測這兩個隨機過程有機結(jié)合起來,在完成對大量滿文單詞樣本集的識別分析基礎(chǔ)上,可以精確地統(tǒng)計出候選詞的后驗概率,進而提高系統(tǒng)的滿文字符識別率。

一個典型的識別后處理架構(gòu)如圖10所示。識別后處理系統(tǒng)由兩個部件組成,前端為單詞識別器(SCR),后端為語言編碼器[14-15]。設(shè)滿文識別系統(tǒng)從前端部件輸入的符號串為A(a1,a2,…ai),識別輸出對應(yīng)于每個ai的候選字集B(bi1,bi2,…bij),后端部件以待定字集B為輸入,考慮可能對應(yīng)的所有滿文序列C(c1,c2,…ci),并對每一字串進行概率賦值,選擇最優(yōu)的結(jié)果。即設(shè)A(a1,a2…an)為待識別的有確定邊界的滿文序列,C為識別結(jié)果,現(xiàn)欲使得C獲得最優(yōu)結(jié)果,可表示為P(C|A)=max {P(B|A)}。根據(jù)Bayes公式可知max {P(B|A)}=max {P(B)P(A|B)/P(A)},其中P(A),P(A|B)為已知項,因此P(C|A)=max {P(B|A)}可轉(zhuǎn)換為求得max {P(B)}。視滿文輸入為隱馬爾科夫源,采用一階隱馬爾科夫模型,識別結(jié)果C可表示為bi-1),其中p(bi|bi-1)為狀態(tài)轉(zhuǎn)移概率,可通過大規(guī)模滿文語料庫的統(tǒng)計獲得。為了避免狀態(tài)轉(zhuǎn)移概率中出現(xiàn)概率為0的情況而影響最終的分類效果,識別結(jié)果C可近似表示為經(jīng)統(tǒng)計,使用隱馬爾科夫模型對滿文單詞識別結(jié)果進行后處理,系統(tǒng)的識別率可提高3%。

圖10 典型識別后處理

8 結(jié)束語

滿文作為近代中國的主要文字之一,記錄了大量寶貴的歷史文化信息,具有很高的應(yīng)用研究價值。研究滿族文字的識別方法對保護我國少數(shù)民族非物質(zhì)文化遺產(chǎn),促進民族地區(qū)的科技發(fā)展有重要的意義。本文根據(jù)滿族文字的特點,將模式識別和圖像處理等技術(shù)結(jié)合在一起,提出了基于投影、鏈碼以及端點和交叉點特征的多分類器集成識別方法,取得了比較滿意的識別效果。采用隱馬爾科夫模型對識別結(jié)果進行后處理,進一步提高了滿文的識別率。由于滿文手寫字體的標(biāo)準(zhǔn)樣庫還沒有建立,測試數(shù)據(jù)相對不足,需要在以后的工作中進一步完善。就目前的測試結(jié)果看,本文提出的基于多特征集成識別方法在滿文的識別中是比較有效的,這對識別其它少數(shù)民族文字也有一定的借鑒意義。

[1]WEI Wei,GUO Chen,ZHAO Jing-ying.Implement of manchu script input method in mobile terminal [J].Journal of Dalian Maritime University,2011,37(1):113-117(in Chinese). [魏巍,郭晨,趙晶瑩.移動終端滿文輸入的實現(xiàn)[J].大連海事大學(xué)學(xué)報,2011,37(1):113-117.]

[2]BAI Wen-rong.Research of the technology of online handwriting Mongolia words recognition [D].Hohhot:Inner Mongolia University,2007:27-28(in Chinese).[白文榮.聯(lián)機手寫蒙古文字識別技術(shù)的研究 [D].呼和浩特:內(nèi)蒙古大學(xué),2007:27-28.]

[3]WANG Hui,MU Hong-xin,WANG Jia-mei,et al.An approach to document skew detection and correction [J].Journal of Yunnan University of Nationalities(Natural Sciences Edition),2010,19(3):232-234(in Chinese). [王輝,牟宏鑫,王嘉梅,等.一種文本圖像傾斜校正的方法 [J].云南民族大學(xué)學(xué)報(自然科學(xué)版),2010,19(3):232-234.]

[4]WEI Hong-xi,GAO Guang-lai.Feature selection of Mongolian characters in the recognition of printed mongolian characters[J].Journal of Inner Mongolia University(Acta Scientiarum Naturalium Universitatis NeiMongol),2006,37(6):694-697(in Chinese).[魏宏喜,高光來.印刷體蒙古文字識別中蒙古文字特征的選擇 [J].內(nèi)蒙古大學(xué)學(xué)報(自然科學(xué)版),2006,37(6):694-697.]

[5]Nibaran Das,Brindaban Das,Ram Sarkar,et al.Handwritten Bangla basic and compound character recognition Using MLP and SVM [J].Journal of Computing,2010,2(2):109-115.

[6]LIU Yongkui,WEI Wei,WANG Pengjie,et al.Compressed vertex chain codes [J].Pattern Recognition,2007,40(11):2908-2913.

[7]LIU Yong-kui,WEI Wei,GUO He.Research on compressed chain code [J].Chinese Journal of Computers,2007,30(2):281-287(in Chinese).[劉勇奎,魏巍,郭禾.壓縮鏈碼的研究 [J].計算機學(xué)報,2007,30(2):281-287.]

[8]ZHANG Guang-yuan,LI Jing-jiao,WANG Ai-xia.Separation and recognition method for off-line handwritten manchu character strokes [J].Computer Engineering,2007,33(22):200-202(in Chinese).[張廣淵,李晶皎,王愛俠.脫機手寫滿文筆畫基元的提取和識別 [J].計算機工程,2007,33(22):200-202.]

[9]ZHAO Dong-xiang.A recognition research of off-line handwritten WuMei Tibetan based on BP network [D].Xining:Qinghai Normal University,2009:17-22(in Chinese). [趙冬香.基于BP網(wǎng)絡(luò)的脫機手寫吾美藏文識別技術(shù)研究 [D].西寧:青海師范大學(xué),2009:17-22.]

[10] WANG Geng.The research of off-line handwritten Chinese character recognition based on BP neutral network [D].Tianjin:Tianjin Normal University,2009:35-37(in Chinese).[王賡.基于BP神經(jīng)網(wǎng)絡(luò)的脫機手寫漢字識別研究[D].天津:天津師范大學(xué),2009:35-37.]

[11]ZHU Long-h(huán)ua, WANG Jia-mei.Off-Line handwritten Yi character recognition based on the multi-classifier ensemble with combination features [J].Journal of Yunnan University of Nationalities(Natural Sciences Edition),2010,19(5):329-333(in Chinese). [朱龍華,王嘉梅.基于組合特征的多分類器集成的脫機手寫體彝文字識別 [J].云南民族大學(xué)學(xué)報(自然科學(xué)版),2010,19(5):329-333.]

[12]ZHAO Ji,LI Jing-jiao,WANG Li-jun,et al.Research on the post-processing of Manchu character recognition based on hidden Markov model [J].Journal of Chinese Information Processing,2006,20(4):63-66(in Chinese). [趙驥,李晶皎,王麗君,等.基于HMM的滿文文本識別后處理的研究 [J].中文信息學(xué)報,2006,20(4):63-66.]

[13]ZHAO Ji,LI Jing-jiao,ZHANG Guang-yuan,et al.Design and implement of off-line handwritten document recognition system of Manchu manuscript [J].Pattern Recognition and Artificial Intelligence,2006,19(6):801-805(in Chinese).[趙驥,李晶皎,張廣淵,等.脫機手寫體滿文文本識別系統(tǒng)的設(shè)計與實現(xiàn) [J].模式識別與人工智能,2006,19(6):801-805.]

[14]ZHANG Guang-yuan,LI Jing-jiao,WANG Ai-xia.Manchu Handwritten character recognition post-processing based on knowledge base [J].Computer Aided Engineering,2006,15(3):69-71(in Chinese). [張廣淵,李晶皎,王愛俠.基于知識的滿文識別后處理 [J].計算機輔助工程,2006,15(3):69-71.]

[15]BAI Wen-rong,SHOU Zhen-kun.Research of the technology of Mongolia feature information selection [J].Journal of Inner Mongolia Agricultural University,2010,31(1):241-244(in Chinese).[白文榮,壽震坤.蒙古文字特征信息選取技術(shù)的研究[J].內(nèi)蒙古農(nóng)業(yè)大學(xué)學(xué)報,2010,31(1):241-244.]

猜你喜歡
鏈碼滿文交叉點
圍棋棋盤的交叉點
一種新壓縮頂點鏈碼
基于高中生命科學(xué)知識交叉點的教學(xué)方法研究
滿文檔案所見厄魯特源流
基于鏈碼特征的幾何圖形快速識別算法*
三田渡漢文滿文蒙古文碑文對比研究
區(qū)域重力異常值的交叉點平差實例分析
清代審理哈密和吐魯番回人案件的兩份滿文題本譯釋
紐結(jié)的(m,n)-變換
無損鏈碼技術(shù)的分析與比較
盈江县| 苗栗县| 汶上县| 巧家县| 渭南市| 新乡市| 新绛县| 自贡市| 乌拉特后旗| 新和县| 修水县| 五原县| 安康市| 金秀| 山西省| 上思县| 曲水县| 阿拉尔市| 手游| 镇原县| 和平县| 渝北区| 海丰县| 尼木县| 定陶县| 睢宁县| 潼关县| 巩义市| 博乐市| 兴义市| 浏阳市| 方正县| 舟曲县| 偃师市| 芮城县| 汝州市| 定西市| 涿鹿县| 策勒县| 甘谷县| 台湾省|