李婷婷 趙鐵軍 張春越
摘要:采用基于統(tǒng)計的方法實現(xiàn)日本人名的識別和翻譯系統(tǒng)。將人名的識別轉(zhuǎn)換成序列標注問題,采用條件隨機場方法訓練識別模型。訓練語料在標注時使用S/E(Starl/End)標注風格;利用人名在上下文中的關(guān)系、人名稱呼后綴詞和人名字典來設(shè)計特征模板。人名翻譯時將日本人名分為假名人名和漢字人名,漢字人名的翻譯通過建立日本人名常用漢字翻譯字典實現(xiàn):假名人名的翻譯通過Moses系統(tǒng)訓練翻譯模型實現(xiàn)。該系統(tǒng)在人名的識別和翻譯測試中都取得了不錯統(tǒng)計結(jié)果。