許亞美 盧朝陽 李靜 姚超
摘要:針對維吾爾詞書寫粘連和手寫筆畫漂移等問題,提出一種基于多信息融合路徑尋優(yōu)的字符分割算法。利用筆畫提取、切分和聚類,過分割單詞圖像得到主體和附加字段,通過字段模糊匹配獲得魯棒的字根序列描述,以抑制筆畫漂移造成的干擾;由建立的匹配位置高斯模型來估算字段匹配信息,經(jīng)對單字分類器輸出進行置信度轉(zhuǎn)換,從而得到字符識別信息,再運用數(shù)據(jù)統(tǒng)計獲取單詞語義信息;由構(gòu)建的字符序列二階Markov語言模型,基于Bayes準則,提出了單詞后驗概率的多信息加權(quán)融合計算方法,通過字段匹配及字根合并的路徑尋優(yōu),可得到最佳字符分割結(jié)果。在手寫維文樣本庫上的實驗表明,所提算法能有效提升字符分割的準確率和穩(wěn)定性。
關(guān)鍵詞:信息處理技術(shù);手寫文字識別;字符分割;維吾爾語;多信息融合