国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合單詞翻譯的神經(jīng)機(jī)器翻譯

2019-08-05 06:49李軍輝周?chē)?guó)棟
中文信息學(xué)報(bào) 2019年7期
關(guān)鍵詞:字典編碼器譯文

韓 冬,李軍輝,周?chē)?guó)棟

(蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006)

0 引言

神經(jīng)機(jī)器翻譯(neural machine translation,NMT)是當(dāng)前機(jī)器翻譯的主流方法,其在多種語(yǔ)言對(duì)上翻譯效果超過(guò)了傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯[1-3]。如今,大部分神經(jīng)機(jī)器翻譯包含一個(gè)編碼器和一個(gè)解碼器,編碼器讀入源端序列,輸出固定長(zhǎng)度的句子向量表示[4-5]。解碼器根據(jù)源端的向量產(chǎn)生正確的翻譯。2017年Vaswani等[6]提出的Transformer結(jié)構(gòu)取得了機(jī)器翻譯的最優(yōu)效果,該網(wǎng)絡(luò)區(qū)別于基于循環(huán)神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯,舍棄了循環(huán)神經(jīng)網(wǎng)絡(luò)[7]和卷積神經(jīng)網(wǎng)絡(luò)[8],僅僅通過(guò)自注意力機(jī)制進(jìn)行編碼與解碼。Transformer克服了原有以循環(huán)神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的機(jī)器翻譯系統(tǒng)無(wú)法并行的缺點(diǎn),顯著地提升了整體效率,節(jié)省了大量訓(xùn)練時(shí)間。

在NMT中,為了建模單詞與單詞之間的相關(guān)性,每個(gè)單詞均被表示為一組連續(xù)的向量,使得語(yǔ)義相近的單詞具有相似的向量表示。但是,從理論上講,通過(guò)這種方法,每個(gè)源端單詞存在著一定的翻譯為目標(biāo)端任意單詞的可能,造成雖然譯文通順,但是翻譯結(jié)果中存在著大量的單詞錯(cuò)誤翻譯現(xiàn)象[9-10]。例如,圖1中給出一個(gè)源句子及其翻譯結(jié)果的例子。其中,基準(zhǔn)系統(tǒng)Transformer將源端詞“官位”錯(cuò)誤地翻譯為“l(fā)ife”,而正確的翻譯應(yīng)該為“official position”。針對(duì)該基準(zhǔn)系統(tǒng),關(guān)于單詞翻譯錯(cuò)誤的更詳細(xì)分析,見(jiàn)本文第2節(jié)。

圖1中,Transformer指本文采用的基準(zhǔn)系統(tǒng),Ours指本文提出的融合單詞翻譯的系統(tǒng)。

針對(duì)上述錯(cuò)誤翻譯現(xiàn)象,本文提出一種融合單詞翻譯用于增強(qiáng)源端信息的神經(jīng)機(jī)器翻譯方法,能夠在一定程度上避免源端單詞錯(cuò)誤翻譯。例如,如果預(yù)先能夠判斷源端單詞“官位”的目標(biāo)端翻譯為“official”,通過(guò)編碼器將該目標(biāo)端單詞信息進(jìn)行編碼,將有利于目標(biāo)端做出正確的譯文預(yù)測(cè)。具體地,該方法首先通過(guò)查字典的方式為源端單詞找到對(duì)應(yīng)的最有可能的在目標(biāo)端的單詞翻譯,如圖1中的‘WT’序列所示。然后將單詞翻譯作為額外的輸入,讓編碼器自動(dòng)學(xué)習(xí)到有用的信息。為此,本文提出了兩種不同的編碼器: Factored編碼器和Gated編碼器,用于對(duì)源端單詞與其單詞翻譯進(jìn)行融合。其中,F(xiàn)actored編碼器采用直接相加的方式利用全部的單詞翻譯信息??紤]到通過(guò)字典方法查找單詞翻譯存在著錯(cuò)誤的情形,進(jìn)而本文又提出一種Gated編碼器的方式,旨在通過(guò)門(mén)機(jī)制控制單詞信息的讀入,從而使系統(tǒng)有選擇性地利用單詞翻譯提供的信息。在中英翻譯上的實(shí)驗(yàn)表明,本文提出的兩種方法均能有效地提高翻譯的質(zhì)量。其中,Gated編碼器方法與原有的Transformer系統(tǒng)相比,BLEU值獲得了0.81個(gè)點(diǎn)的提升。此外,本文最后從不同的方面比較分析了所提出系統(tǒng)之間的不同與優(yōu)缺點(diǎn)。

1 Transformer

本節(jié)將簡(jiǎn)要地描述本文的基于自注意力機(jī)制的神經(jīng)機(jī)器翻譯系統(tǒng)Transformer,該系統(tǒng)包含一個(gè)編碼器和一個(gè)解碼器。與基于循環(huán)神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯不同,Transformer編碼器和解碼器由一種新穎的注意力機(jī)制和一個(gè)前饋的神經(jīng)網(wǎng)絡(luò)構(gòu)成。作者命名這種新穎的注意力機(jī)制為“多頭注意力機(jī)制”(multi-head attention)。同時(shí),一個(gè)“多頭注意力機(jī)制”又由多個(gè)點(diǎn)積注意力機(jī)制通過(guò)三個(gè)向量Q,K,V計(jì)算得到:

(1)

其中dk指向量K的維度。

最終,多個(gè)點(diǎn)積注意力機(jī)制的結(jié)果進(jìn)行拼接后送入一個(gè)前饋神經(jīng)網(wǎng)絡(luò)中:

前饋神經(jīng)網(wǎng)絡(luò)為兩層的全連接網(wǎng)絡(luò)層,并且使用“修正線性單元”(RELU)作為其激活函數(shù)。該網(wǎng)絡(luò)定義為:

FFN(x)=max(0,xW1+b1)W2+b2

(4)

其中,W1,W2,b1,b2為模型參數(shù)。在Vaswani[6]等的論文中,設(shè)置輸入輸出的維度均為512維,隱層的維度設(shè)置為2 048維。

由于Transformer結(jié)構(gòu)既沒(méi)有使用循環(huán)神經(jīng)網(wǎng)絡(luò),也沒(méi)有使用卷積神經(jīng)網(wǎng)絡(luò),因此,為了彌補(bǔ)輸入序列順序上的缺失,Transformer使用了一種叫做位置編碼的方法在編碼和解碼詞向量后增加了表示位置的信息,該信息是一種絕對(duì)的位置信息,被定義為:

(5)

其中,pos是單詞在輸入句子中的位置,i是向量的維度。

2 Transformer中的單詞錯(cuò)誤翻譯問(wèn)題

單詞的錯(cuò)誤翻譯問(wèn)題是機(jī)器翻譯面臨的一大難題。大量的科研工作者為了減少單詞錯(cuò)誤翻譯的現(xiàn)象,做出了不懈的努力[10-11]。Transformer的提出為機(jī)器翻譯注入了新的活力,與原有的以循環(huán)神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的翻譯系統(tǒng)相比,Transformer在多種語(yǔ)言對(duì)上取得了當(dāng)前最優(yōu)的效果。因此,很自然會(huì)存在這樣的疑問(wèn): 在Transformer系統(tǒng)的譯文中,單詞錯(cuò)誤翻譯的現(xiàn)象是否依舊嚴(yán)峻?到底有多少單詞在Transformer系統(tǒng)中被錯(cuò)誤地翻譯?

由于很難準(zhǔn)確地計(jì)算機(jī)器翻譯中單詞翻譯的正確率,本文采用近似的方法,按兩種不同的方式計(jì)算單詞翻譯準(zhǔn)確率。

方式一: 為了得到每個(gè)源端單詞在目標(biāo)端對(duì)應(yīng)的單詞翻譯,使用詞對(duì)齊工具fast-align[12],得到源端句子與機(jī)器譯文之間的詞對(duì)齊,進(jìn)而得到源端單詞在目標(biāo)端的單詞翻譯。特別地,如果源端單詞與多個(gè)目標(biāo)端單詞對(duì)齊,僅考慮單詞翻譯概率最大的那個(gè)單詞。同樣地,可以為源端單詞得到其在參考譯文上的對(duì)齊目標(biāo)單詞,并看作是該源端單詞的正確單詞翻譯。比照其在自動(dòng)譯文及參考譯文上的單詞翻譯,可以判斷該源端單詞是否翻譯正確。

方式二: 考慮到上述方法的有效性依賴(lài)于詞對(duì)齊的結(jié)果。特別是,給定源端句子與機(jī)器譯文時(shí),由于源端句子與自動(dòng)譯文本身在語(yǔ)義上可能是不等價(jià)的,在此句對(duì)上得到的自動(dòng)對(duì)齊會(huì)存在錯(cuò)誤。因此,對(duì)每個(gè)源端單詞,我們按照方式一獲取它的正確譯文,再查看該譯文是否出現(xiàn)在自動(dòng)譯文中。如果出現(xiàn),則認(rèn)為該單詞翻譯正確,否則翻譯不正確。

表1給出了分別按以上兩種方式計(jì)算的源端單詞翻譯的正確率。由于第一種方式的判斷條件要比第二種方式更嚴(yán)格,因此其得到的準(zhǔn)確率較第二種方式低。從表1中可以得出一個(gè)結(jié)論: 即使Transformer能夠較顯著改善譯文的質(zhì)量,但是Transformer中單詞錯(cuò)誤翻譯的現(xiàn)象依舊十分嚴(yán)峻。例如,即使第二種計(jì)算方式較寬松,根據(jù)其計(jì)算結(jié)果,仍然存在有約20%的單詞未正確翻譯。

表1 Transformer中單詞翻譯的準(zhǔn)確率(%)

3 Transformer中融合單詞翻譯

為了緩解Transformer中單詞錯(cuò)誤翻譯的問(wèn)題,本文提出在Transformer翻譯框架中融入單詞翻譯的方法,使得翻譯模型能夠根據(jù)提供的單詞,選擇正確的譯文。特別地,本文將單詞翻譯作為額外的輸入,讓翻譯模型去學(xué)習(xí)有用的信息來(lái)輔助生成譯文。本節(jié)首先采用字典方法為每個(gè)源端單詞找尋課文;然后提出兩種不同的編碼器來(lái)實(shí)現(xiàn)單詞及其翻譯結(jié)果的融合: Factored編碼器和Gated編碼器;最后分析了這兩種結(jié)構(gòu)的不同與優(yōu)劣。

3.1 字典方法獲取單詞翻譯

對(duì)于源端單詞xi,通過(guò)單詞翻譯字典尋找其對(duì)應(yīng)最大概率的單詞翻譯結(jié)果,如式(6)所示。

(6)

其中,Vt是目標(biāo)端單詞的詞表,Plex(w|xi)是源端單詞xi翻譯為目標(biāo)端單詞w的概率。

為了得到單詞翻譯的字典,本文首先使用Giza++在機(jī)器翻譯語(yǔ)料上得到源端單詞到目標(biāo)端單詞的對(duì)齊信息,進(jìn)而通過(guò)該對(duì)齊信息計(jì)算單詞的翻譯概率。需要注意的是,如果源端單詞沒(méi)有對(duì)齊的目標(biāo)端單詞,那么則用特殊標(biāo)記“NULL”表示。

通過(guò)上述的方法,可以為每個(gè)源端單詞獲取其最大概率的目標(biāo)端翻譯單詞。這種方法忽略了單詞翻譯的多樣性,相同源端單詞的單詞翻譯都是一樣的。例如,雖然源端單詞“中”可以翻譯為China、Sino、in等,字典方法都簡(jiǎn)單地將“China”視作“中”的單詞翻譯,因?yàn)樵诮o定源端詞“中”的條件下,此翻譯的概率最高。

3.2 融合單詞翻譯到Transformer

單詞翻譯可以視作額外的信息,用以輔助生成正確的譯文,本文提出了兩種不同的編碼器,用于融合單詞與單詞翻譯。

3.2.1 Factored編碼器

與Sennrich等[13-14]的工作相似,本文將單詞翻譯作為額外的特征直接加入到編碼器中,假設(shè)源端單詞xi和其翻譯詞ti對(duì)應(yīng)的詞向量分別為exi與eti,那么最終輸入到編碼器中的詞向量ei為:

ei=exi+eti

(7)

圖2 Factored編碼器和Gated編碼器

圖2(a)顯示了本文Factored編碼器方法。該方法將單詞翻譯信息全部用到編碼器中,是最為直接的一種方法。這種方法將單詞與單詞翻譯看作是等價(jià)的輸入,并沒(méi)有彼此區(qū)別的對(duì)待。

3.2.2 Gated編碼器

由于字典方法采用一刀切的方式,使得相同源端單詞對(duì)應(yīng)的單詞翻譯也相同,而忽略了源端單詞所處的上下文信息。因此,該方法得到的單詞翻譯結(jié)果勢(shì)必存在錯(cuò)誤,從而負(fù)面影響了譯文的質(zhì)量。為此,本文提出了另外一種方法: Gated編碼器,旨在通過(guò)一個(gè)門(mén)機(jī)制選擇性地控制單詞翻譯進(jìn)入編碼器的信息量。正如圖2(b)顯示的,輸入到編碼器中的詞向量ei表示為:

ei=exi+g°eti

(8)

其中“°”為元素相乘,“g”為門(mén)機(jī)制,計(jì)算如下:

g=σ(Wxexi+Wteti+b)

(9)

其中,σ為sigmoid激活函數(shù).Wx∈Rd×d,Wt∈Rd×d,b∈R1×d模型待訓(xùn)練的參數(shù),d為詞向量大小。

3.2.3 Factored編碼器與Gated編碼器的比較

(1) 參數(shù)比較

在兩種不同的編碼器中,單詞翻譯的詞向量與目標(biāo)端單詞的詞向量是共享的。在Factored編碼器中,僅將源端單詞的詞向量與單詞翻譯詞向量相加,輸入到編碼器中的向量維度和基準(zhǔn)系統(tǒng)的輸入維度相同,因此該編碼器并沒(méi)有引入額外的參數(shù)。對(duì)于Gated編碼器,需要增加(2*d+1)d個(gè)參數(shù),這些參數(shù)均用于式(9)中計(jì)算門(mén)機(jī)制的值。

(2) 利用單詞翻譯方式比較

Factored編碼器采用簡(jiǎn)單但一刀切的方式,使系統(tǒng)在翻譯時(shí)考慮了單詞的翻譯信息,雖然這種方法能夠?qū)W習(xí)到有用的信息,但是對(duì)于錯(cuò)誤的單詞翻譯,該方法并沒(méi)有甄別的能力。Gated編碼器可以看作是對(duì)Factored編碼器方法的改進(jìn), 通過(guò)門(mén)機(jī)制賦予了該系統(tǒng)一定的自主選擇單詞譯文的能力,對(duì)于錯(cuò)誤單詞翻譯,該方法自動(dòng)挑選了最有利于最終翻譯的信息,使得系統(tǒng)自動(dòng)學(xué)習(xí)到甄別單詞翻譯是否正確的能力。

4 實(shí)驗(yàn)

本文實(shí)驗(yàn)使用中英NIST翻譯數(shù)據(jù),訓(xùn)練語(yǔ)料是從LDC數(shù)據(jù)中抽取的1.25MB句對(duì)的平行語(yǔ)料[注]其中包括了: LDC2002E18, LDC2003E07, LDC2003E14, LDC2004T07,LDC2004T08和LDC2005T06。,分別含有27.9MB的中文單詞和34.5MB的英文單詞。選擇NIST MT 06 數(shù)據(jù)集為開(kāi)發(fā)集,含有1 664句。NIST MT 02、03、04、05作為測(cè)試集,分別含有878、919、1 788、1 082句。

4.1 Transformer 系統(tǒng)設(shè)置

為了有效地訓(xùn)練實(shí)驗(yàn)?zāi)P?,本文分別從中英訓(xùn)練語(yǔ)料中抽取詞頻最高的前30K個(gè)單詞作為其詞表,其中中文詞表覆蓋整個(gè)訓(xùn)練語(yǔ)料的97.3%,英文詞表覆蓋率為99.3%。所有不在詞表中的單詞被表示為“UNK”特殊標(biāo)記符號(hào),限制源端和目標(biāo)端句子最大長(zhǎng)度為256,單詞超過(guò)256的句子被舍棄。使用6層編碼器與解碼器,“多頭注意力機(jī)制”含有8個(gè)頭,同時(shí)設(shè)置Pdropout=0.1。單詞詞向量和隱層狀態(tài)維度均為512維。

實(shí)驗(yàn)使用Adam模型[15]更新參數(shù),設(shè)置β1=0.9,β2=0.98,使用GTX 1080訓(xùn)練模型,翻譯性能的評(píng)測(cè)為BLEU[16]值。在解碼時(shí),設(shè)置beam_size=4,batch_size=32,所有其他的設(shè)置使用Vaswani系統(tǒng)中的默認(rèn)設(shè)置。

4.2 實(shí)驗(yàn)結(jié)果

表2給出了本文提出的兩種編碼器與基準(zhǔn)系統(tǒng)在各測(cè)試集上的翻譯性能。從表2可以看出,本文提出的兩種編碼器均能夠提高系統(tǒng)的翻譯性能。特別地,與基準(zhǔn)系統(tǒng)相比,Gated 編碼器較基準(zhǔn)系統(tǒng)提升了0.81個(gè) BLEU值,這表明了文中提出的融合單詞翻譯方法的有效性。另一方面,即使利用相同的信息,F(xiàn)actored編碼器較基準(zhǔn)系統(tǒng)僅僅使BLEU值提升了0.14個(gè)點(diǎn)。這說(shuō)明,雖然單詞翻譯可以在一定程度上提供有用的信息,但如果不區(qū)分單詞翻譯的好壞(如Factored編碼器),完全利用單詞翻譯信息,容易造成錯(cuò)誤傳播,使得翻譯系統(tǒng)學(xué)習(xí)到錯(cuò)誤的譯文;而Gated編碼器采用門(mén)機(jī)制控制單詞翻譯的信息流入編碼器,使得模型能夠在一定程度上學(xué)習(xí)篩選有用的單詞翻譯信息,減少單詞錯(cuò)誤翻譯對(duì)后續(xù)翻譯模型的影響。

表2 本文方法與基準(zhǔn)系統(tǒng)在不同測(cè)試集上的BLEU值

注: ALL為將02,03,04,05測(cè)試集拼接后測(cè)試的結(jié)果;=|: 與Transformer基準(zhǔn)系統(tǒng)相比較,BLEU值在p=0.01時(shí)具有顯著性提高。

5 實(shí)驗(yàn)分析

從第4節(jié)中可以看出,融合單詞翻譯到機(jī)器翻譯系統(tǒng)中,即使在強(qiáng)基準(zhǔn)中(Transformer)依舊可以提高最終的實(shí)驗(yàn)效果。本節(jié)進(jìn)一步從幾個(gè)不同的方面分析單詞翻譯對(duì)最終機(jī)器翻譯性能的影響。

5.1 字典獲取翻譯的準(zhǔn)確率分析

為了增強(qiáng)整體模型對(duì)語(yǔ)義的建模,本文引入了單詞翻譯作為額外的信息。理論上,正確的單詞翻譯可以提供更多有用的信息,而錯(cuò)誤的翻譯可能降低系統(tǒng)最終的翻譯質(zhì)量。因此,我們首先分析本文使用的字典方式獲取單詞翻譯的準(zhǔn)確率。在開(kāi)發(fā)集上根據(jù)源端句子與參考譯文,使用fast-align工具獲取源端句子與參考譯文之間的詞對(duì)齊信息,從而得到每個(gè)源端單詞的正確譯文。然后再把源端單詞按字典方式獲取的譯文當(dāng)作機(jī)器譯文,計(jì)算字典獲取翻譯的準(zhǔn)確率。結(jié)果顯示,字典方法單詞翻譯準(zhǔn)確率在開(kāi)發(fā)集上為61.2%。從中可以看出,雖然采用字典的方法獲取單詞翻譯存在錯(cuò)誤,但是依舊有較大部分比例的單詞能夠獲取正確的譯文,可以提高句子翻譯的質(zhì)量。

5.2 翻譯準(zhǔn)確率分析

類(lèi)似于第2節(jié)的分析,從兩個(gè)不同的方面分析本文提出的Factored編碼器和Gated編碼器方法譯文的準(zhǔn)確性,表3呈現(xiàn)了兩種方法和基準(zhǔn)系統(tǒng)的對(duì)比。從中可以看出,本文的Gated編碼器在兩種不同的評(píng)測(cè)方法上均超過(guò)原有的Transformer 基準(zhǔn)系統(tǒng),其中,采用方式二的評(píng)測(cè)方法,與基準(zhǔn)系統(tǒng)相比,準(zhǔn)確率提高了1.2%。這也進(jìn)一步說(shuō)明了,本文的Gated編碼器采用門(mén)機(jī)制,能夠有選擇性地使用正確的單詞翻譯,緩解單詞翻譯錯(cuò)誤帶來(lái)的負(fù)面影響。另一方面,F(xiàn)actored編碼器將單詞翻譯的信息全部流入編碼器,容易受單詞翻譯錯(cuò)誤的影響。同時(shí),較之基準(zhǔn)系統(tǒng),F(xiàn)actored編碼器在方式一和方式二的評(píng)測(cè)上并沒(méi)有優(yōu)勢(shì),說(shuō)明本文按3.1節(jié)字典方式獲取的單詞翻譯性能還不夠好,有待進(jìn)一步提高。

表3 Factored編碼器,Gated編碼器與基準(zhǔn)系統(tǒng)單詞翻譯準(zhǔn)確率比較(%)

5.3 長(zhǎng)句子分析

類(lèi)似于Bahdanau[1]等的工作,本文將句子按照單詞長(zhǎng)度劃分,然后分別測(cè)試系統(tǒng)在不同長(zhǎng)度的句子上的翻譯性能。如圖3所示,本文提出的Gated編碼器和Factored 編碼器方法在短句子上(<=30)要優(yōu)于原本的Transformer基準(zhǔn)系統(tǒng)。有趣的是,隨著句子長(zhǎng)度的增加,特別是當(dāng)句子長(zhǎng)度介于40和50之間時(shí), Factored編碼器的翻譯性能甚至低于基準(zhǔn)系統(tǒng);而對(duì)于長(zhǎng)句子(>50),F(xiàn)actored編碼器和Gated編碼器均優(yōu)于基準(zhǔn)系統(tǒng)。造成以上翻譯趨勢(shì)的原因在于,F(xiàn)actored編碼器和Gated編碼器的性能與單詞翻譯的準(zhǔn)確率有著明顯的關(guān)系。在短句子上(<=30),單詞翻譯的準(zhǔn)確率較高,達(dá)到65.3%;在句子長(zhǎng)度介于40~50之間時(shí),單詞翻譯的準(zhǔn)確率偏低,僅為58.1%;而對(duì)于長(zhǎng)句子(>50),單詞翻譯的準(zhǔn)確率上升為62.2%。

圖3 不同長(zhǎng)度句子翻譯結(jié)果

6 總結(jié)

將單詞翻譯序列融入機(jī)器翻譯中,使得系統(tǒng)在翻譯時(shí),考慮更多源端的語(yǔ)義信息,有利于翻譯系統(tǒng)最終效果的提升。對(duì)于每個(gè)單詞對(duì)應(yīng)的翻譯,本文采用字典的方法雖然含有不可避免的錯(cuò)誤,在翻譯字典中相同的源端單詞的單詞翻譯是一樣的,但是類(lèi)似于源端單詞詞向量可以模擬不同的語(yǔ)義信息,這種方法依舊是可取的。

為了將單詞及其翻譯建模進(jìn)系統(tǒng)中,本文創(chuàng)造性地提出了兩種不同的編碼器: Factored編碼器和Gated編碼器。Factored編碼器無(wú)復(fù)制地將單詞翻譯與單詞本身同等看待,直接相加,簡(jiǎn)單而且直觀地使得系統(tǒng)在翻譯時(shí)考慮到單詞翻譯信息。Gated編碼器可以看作是對(duì)Factored編碼器的改進(jìn),通過(guò)門(mén)機(jī)制自動(dòng)選擇單詞的翻譯信息,賦予系統(tǒng)一定的自主選擇的權(quán)利。最終實(shí)驗(yàn)結(jié)果顯示,本文采用的方法,即使相比當(dāng)前最優(yōu)的機(jī)器翻譯系統(tǒng)Transformer,依舊取得了不錯(cuò)的效果。

在未來(lái)的工作中,我們將進(jìn)一步探究?jī)蓚€(gè)方向: ①字典方法雖然可以找尋到對(duì)應(yīng)的翻譯,是否有其他更優(yōu)的方法?②對(duì)于融合單詞翻譯進(jìn)入系統(tǒng)的方式,是否有更加有效的方式?

猜你喜歡
字典編碼器譯文
融合CNN和Transformer編碼器的變聲語(yǔ)音鑒別與還原
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
舞臺(tái)機(jī)械技術(shù)與設(shè)備系列談(二)
——編碼器
字典的由來(lái)
基于雙增量碼道的絕對(duì)式編碼器設(shè)計(jì)
弟子規(guī)
大頭熊的字典
弟子規(guī)
正版字典
基于數(shù)字信號(hào)處理的脈沖編碼器