吳承鳳+劉濤
摘 要: 為了提高機器翻譯對模糊語句的準(zhǔn)確翻譯能力,提出基于多模糊語義自動判斷的機器翻譯優(yōu)化方法。構(gòu)建機器翻譯的主題詞表的上下文語義映射的概念樹模型,基于語義本體主題詞表對翻譯文本進(jìn)行規(guī)則約簡和文本信息模糊語義特征抽取,采用多模糊自然語言形式化結(jié)構(gòu)分析方法進(jìn)行模糊語句的自動翻譯判斷,提高翻譯的自動配準(zhǔn)性。仿真結(jié)果表明,采用所提方法進(jìn)行機器翻譯中的多模糊語義自動判斷,能提高翻譯的準(zhǔn)確度。
關(guān)鍵詞: 機器翻譯; 模糊語義; 自動判斷; 語義映射
中圖分類號: TN957.52+3?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)14?0075?03
Abstract: In order to improve the accurate translation ability of machine translation for fuzzy statement, a machine translation optimization method based on multi?fuzzy semantics automatic judgment is proposed. The concept tree model of thesaurus context semantics mapping of machine translation was constructed. The translated text was performed with fuzzy semantic feature extraction of text information and rule reduction on the basis of semantics ontology thesaurus. The multi?fuzzy natural language formalized structure analysis method is used to judge the automatic translation of the fuzzy statement to improve the automatic registration of translation. The simulation results show that the method can perform the multi?fuzzy semantics automatic judgment in machine translation, and improve the translation accuracy.
Keywords: machine translation; fuzzy semantics; automatic judgment; semantics mapping
隨著信息技術(shù)和軟件技術(shù)的發(fā)展,翻譯軟件的改進(jìn)和革新競爭越來越強烈,機器翻譯軟件已經(jīng)由傳統(tǒng)的逐字逐句翻譯演化為面向?qū)ο蠛腿藱C交互的模糊翻譯,結(jié)合翻譯語句的關(guān)鍵詞信息進(jìn)行翻譯對象的領(lǐng)域判斷,提高翻譯的準(zhǔn)確性[1]。在機器翻譯中,由于受到來源語言的組詞和語句的差異化限制,導(dǎo)致來源語言往往具有模糊性和歧義性,還導(dǎo)致機器翻譯的準(zhǔn)確性和智能性受到限制,需要進(jìn)行機器翻譯中的多模糊語義自動判斷,采用語義信息分析方法,結(jié)合上下文的語義映射判斷。構(gòu)建機器翻譯的語義本體模型[2?3],從機器翻譯的輸出內(nèi)容上體現(xiàn)了原文創(chuàng)作者的意圖,提高機器翻譯的智能化水平。
1 機器翻譯的上下語義映射的概念樹模型
1.1 機器翻譯的主題詞表構(gòu)建
為了實現(xiàn)機器翻譯的多模糊語義自動化判斷,采用自然語義處理方法進(jìn)行機器翻譯的主題詞表構(gòu)建,采用基于結(jié)構(gòu)信息本體映射方法進(jìn)行機器翻譯的傳播圖模型分析,通過語義編輯和概率推理機制構(gòu)建機器翻譯的主題詞表[4],輸入機器翻譯的訓(xùn)練樣本為:
定義是一個五元組表示機器翻譯的語義本體結(jié)構(gòu)模型,采用本體映射方法構(gòu)建二維C4.5決策樹表示機器翻譯的主題詞表的信息輸入矢量為:
式中:為機器翻譯的主題詞信息輸出量;s為準(zhǔn)確翻譯主題詞匯概率。對于機器翻譯中語義本體的知識存儲的基本單元,用表示翻譯過程中的語義歧義項的跟隨修正向量集合,計算表達(dá)為:
用定義機器翻譯的語義自相關(guān)的頻繁項集,采用本體集成進(jìn)行翻譯過程中的知識交換和關(guān)鍵詞信息檢索,實現(xiàn)關(guān)聯(lián)分析度量[5],其計算式為:
根據(jù)上述分析,構(gòu)建機器翻譯的主題詞表結(jié)構(gòu)模型如圖1所示。
1.2 機器翻譯的上下文語義映射概念樹
采用上下文映射方法構(gòu)建機器翻譯的概念樹模型,進(jìn)行多模糊語義自動判斷,在概念樹中對詞語知識利用結(jié)構(gòu)知識賦予了人類可理解語義[6],得到語義相關(guān)度最大的語法分析的語義相關(guān)度函數(shù)為:
采用不同界限劃分方案得到機器翻譯的上下文語義映射概念樹結(jié)構(gòu)模型如圖2所示。圖2中,語義修飾目標(biāo)屬性取值,映射到語義映射概念樹中表現(xiàn)為映射值,對語句的多模糊性進(jìn)行自動判斷。在實驗過程中,轉(zhuǎn)化為簡單語義單元進(jìn)性語義特征分析和機器翻譯的自適應(yīng)伴隨跟蹤識別[7],選擇具有最佳語義相關(guān)度值的上下文語義映射概念樹推薦實驗參數(shù),在C4.5決策樹中進(jìn)行語義分析和機器翻譯的修飾。
2 多模糊語義自動判斷實現(xiàn)
2.1 文本信息模糊語義特征抽取及其規(guī)則約簡
在上述進(jìn)行了機器翻譯的上下文語義映射概念樹構(gòu)建的基礎(chǔ)上進(jìn)行機器翻譯的多模糊語義自動判斷設(shè)計,提出基于多模糊語義自動判斷的機器翻譯優(yōu)化方法?;谡Z義本體主題詞表對翻譯文本進(jìn)行規(guī)則約簡和文本信息模糊語義特征抽取,選擇準(zhǔn)備規(guī)則約簡的簡單子句進(jìn)行Prim算法設(shè)計,Prim算法公式描述為:
經(jīng)過多輪目標(biāo)從句的S,V,O分解運算后,計算每個簡單語義的最大生成樹矩陣A,它是一個的實矩陣,將其設(shè)置為目標(biāo)從句,有m階正交語義約簡規(guī)則矩陣U和n階正交矩陣V,經(jīng)過SVM分解,確定合理的權(quán)重系數(shù),分解過程為:
通過文本信息模糊語義特征抽取及其規(guī)則約簡,為進(jìn)行多模糊語義自動判斷提供準(zhǔn)確的信息輸入基礎(chǔ)。
2.2 機器翻譯多模糊語義自動判斷實現(xiàn)步驟
采用多模糊自然語言形式化結(jié)構(gòu)分析方法進(jìn)行模糊語句的自動翻譯判斷,從而提高機器翻譯的自動配準(zhǔn)能力[8],機器翻譯多模糊語義自動判斷實現(xiàn)步驟描述如下:
(1) 根據(jù)機器翻譯多模糊語義對象集合O的主題詞表,選擇共同屬性的簡單子句,作為機器翻譯的所有屬性的概念子集從句;
(2) 選定待匹配詞的從句進(jìn)行S,V,O分解,并確定合理的權(quán)重得到機器翻譯中的多模糊語義若干個簡單主句單元;
(3) 計算模糊語義特征單元的共同屬性語義相關(guān)度值,定義為g(I):={oO
(4) 根據(jù)主題詞表中最頂層節(jié)點進(jìn)行自動判斷搜索,計算對象集合O的特征詞值;
(5) 將匹配修正后的文本歸結(jié)為一個詞匯;對于oO,AA,如果滿足收斂條件,得到的機器翻譯結(jié)果是模糊的,返回步驟(2),重新選定主題詞表的基本單位;否則,進(jìn)入下一步;
(6) 根據(jù)主題詞表匹配算法進(jìn)行循環(huán)遍歷,實現(xiàn)機器翻譯的多模糊語義自動判斷,得到對應(yīng)的最佳語法分析結(jié)果;
(7) 調(diào)整主題詞(敘詞)款目,進(jìn)行模糊語義自動配準(zhǔn)和判斷,得到從句權(quán)重系數(shù)KS,進(jìn)行實驗對比分析。
3 實驗測試分析
采用編程語言Java 1.5.4作為編程軟件進(jìn)行機器翻譯中的多模糊語義分析判斷編程,開發(fā)環(huán)境為Eclipse 3.4.2,測試的機器翻譯文本來自于positionTAg1文本數(shù)據(jù)庫,選擇k=4,得到由A,B,C,D四個語義特征組成的信息屬性集,使用ICTCLAS2015機器翻譯軟件進(jìn)行批量的中英文機器翻譯處理,自定義抽取特征詞的個數(shù)(1”,1)=({1,2},{a,b,f}),(1”,2)=({2},{a,c,d,e}),設(shè)定機器翻譯的上下文語義映射概念樹的參量如圖3所示。
根據(jù)上述仿真環(huán)境和參數(shù)設(shè)置,進(jìn)行機器翻譯的多模糊語義自動判斷,測試語義映射的特征配準(zhǔn)率,采用本文方法和傳統(tǒng)方法,得到對比結(jié)果如圖4所示。
分析圖4的仿真結(jié)果得知,采用本文方法進(jìn)行機器翻譯中的多模糊語義自動判斷,能提高翻譯的準(zhǔn)確度,相比傳統(tǒng)方法,上下文語義映射的特征配準(zhǔn)率得到大幅提高,具有優(yōu)越性,提高了機器翻譯的準(zhǔn)確性。
4 結(jié) 語
為了提高機器翻譯的可靠性和智能性,提出基于多模糊語義自動判斷的機器翻譯優(yōu)化方法。結(jié)果表明,采用本文方法進(jìn)行機器翻譯的模糊語義判斷和配準(zhǔn),提高了機器翻譯的自動判斷能力,從而能提高翻譯的準(zhǔn)確性。
參考文獻(xiàn)
[1] 饒翔,王懷民,陳振邦,等.云計算系統(tǒng)中基于伴隨狀態(tài)追蹤的故障檢測機制[J].計算機學(xué)報,2012,35(5):856?870.
[2] 楊來,史忠植,梁帆,等.基于Hadoop云平臺的并行數(shù)據(jù)挖掘方法[J].系統(tǒng)仿真學(xué)報,2013,25(5):936?944.
[3] 華翔,康鳳舉,田學(xué)偉,等.可視化仿真的私有云框架研究[J].系統(tǒng)仿真學(xué)報,2011,23(8):1652?1656.
[4] 石倩,陳榮,魯明羽.基于規(guī)則歸納的信息抽取系統(tǒng)實現(xiàn)[J].計算機工程與應(yīng)用,2008,44(21):166?170.
[5] 馮貴玉,趙琪,張可黛.多源信息融合認(rèn)知機理與模型研究[J].計算機與數(shù)字工程,2013,41(2):182?184.
[6] LI Chenliang, SUN Aixin, ANWITAMAN D. TSDW: two?stage WSD using Wikipedia [J]. Journal of the American society for information science and technology, 2013, 64(6): 1203?1223.
[7] 張沙清,劉強,張平,等.基于本體語義的制造網(wǎng)格構(gòu)建機理研究[J].計算機應(yīng)用研究,2008,25(8):2289?2291.
[8] MAHMOUD E E. Complex complete synchronization of two nonidentical hyperchaotic complex nonlinear systems [J]. Mathematical methods in the applied sciences, 2014, 37(3): 321?328.
[9] 吳江,唐常杰,李太勇,等.基于語義規(guī)則的Web金融文本情感分析[J].計算機應(yīng)用,2014,34(2):481?485.