国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

翻譯過(guò)程的非線性與機(jī)輔翻譯的有限性

2013-07-18 06:20:21唐燁
大陸橋視野·下 2013年5期
關(guān)鍵詞:機(jī)器翻譯非線性語(yǔ)料庫(kù)

唐燁

摘 要 本文從非線性這個(gè)概念入手,論述了翻譯過(guò)程的非線性過(guò)程的內(nèi)涵,并舉例說(shuō)明了由此而導(dǎo)致的機(jī)器翻譯存在的有限性,指出由于英漢兩種語(yǔ)言之間的差別,使得翻譯過(guò)程不是簡(jiǎn)單地一一對(duì)應(yīng)的過(guò)程,而是一種復(fù)雜的多因素影響的結(jié)果,如語(yǔ)境因素及文化差異。而這些問(wèn)題在目前的機(jī)器翻譯中沒(méi)有得到有效地解決,致使機(jī)器翻譯的適用范圍有一定的局限性。

關(guān)鍵詞 非線性 機(jī)器翻譯 語(yǔ)料庫(kù) 文本類型

一、引言

隨著全球化的發(fā)展和科學(xué)技術(shù)的進(jìn)步,翻譯工作也面臨著越來(lái)越大的挑戰(zhàn)。全球文化和科技的交流,極大地拓寬了翻譯市場(chǎng)??萍嫉难该桶l(fā)展,也使翻譯工作由傳統(tǒng)的人工作業(yè)逐漸向計(jì)算機(jī)作業(yè)轉(zhuǎn)變。然而機(jī)遇和挑戰(zhàn)并存,機(jī)器翻譯雖然方便快捷,但是目前來(lái)看還缺乏準(zhǔn)確性,使用的范圍不夠廣,從質(zhì)量上無(wú)法滿足時(shí)代的需求。為了分析計(jì)算機(jī)翻譯有限性的原因,本文先提出了一個(gè)非線性的概念,然后通過(guò)對(duì)漢英語(yǔ)言的對(duì)比,分析翻譯過(guò)程的非線性過(guò)程,并借以說(shuō)明機(jī)器翻譯的有限性,并通過(guò)機(jī)器翻譯和筆者翻譯來(lái)進(jìn)一步對(duì)比證明。

二、翻譯過(guò)程的非線性

1.非線性的定義。非線性是一個(gè)數(shù)學(xué)的、物理的概念,要談非線性,首先要從線性這個(gè)概念說(shuō)起。所謂線性即linear,是指量與量之間按比例、成直線的關(guān)系,在數(shù)學(xué)上可以理解為一階導(dǎo)數(shù)為常數(shù)的函數(shù),其畫(huà)在函數(shù)圖上會(huì)呈現(xiàn)一條直線,見(jiàn)圖1。

線性意味著方程的解與方程本身是一種一一對(duì)應(yīng)的關(guān)系。以y=2x+1為例,x=1時(shí),y只有唯一解,即y=3。線性也意味著系統(tǒng)的簡(jiǎn)單性,但世間萬(wàn)物的自然現(xiàn)象就其本質(zhì)來(lái)說(shuō),都是復(fù)雜的,非線性的。非線性即non-linear,是指兩個(gè)變量間的關(guān)系,是不成簡(jiǎn)單比例(即線性)關(guān)系的,也就是說(shuō)其畫(huà)在函數(shù)圖上不會(huì)呈現(xiàn)單一一條直線,有可能會(huì)是折線或者呈曲線狀。如圖2所示為一個(gè)非線性函數(shù),y=x3-9x。

非線性意味著一種非一一對(duì)應(yīng)的關(guān)系,是復(fù)雜的、曲折性的。我們?cè)谔幚矸蔷€性關(guān)系時(shí),就要考慮到多方面的因素,翻譯活動(dòng)即是如此。

2.翻譯過(guò)程的非線性定義?!胺g是以符號(hào)轉(zhuǎn)換為手段、意義再生為任務(wù)的一項(xiàng)的跨文化交際和活動(dòng)”,而翻譯的過(guò)程即是解釋符號(hào)意義的過(guò)程。而英漢之間的翻譯就是解讀英語(yǔ)和漢語(yǔ)這兩種語(yǔ)言符號(hào)的過(guò)程。漢語(yǔ)是有別于英語(yǔ)的語(yǔ)言符號(hào)系統(tǒng),因此兩者之間存在的巨大差別,是我們?cè)诜g過(guò)程中碰到的主要障礙。漢字是人類歷史上最古老的表意文字之一,它具有形象化、表意為主表音為輔較強(qiáng)的穩(wěn)定性等特征。而漢字的這些特征,是英語(yǔ)這一拼音文字不可比擬的。下面我們從語(yǔ)音和語(yǔ)法方面對(duì)現(xiàn)代漢語(yǔ)和現(xiàn)代英語(yǔ)之間進(jìn)行一個(gè)概略比較,見(jiàn)表1。

從上表1可以看出,漢語(yǔ)和英語(yǔ)的語(yǔ)音系統(tǒng),尤其是語(yǔ)法系統(tǒng),差別很大。由于漢語(yǔ)與英語(yǔ)之間相去甚遠(yuǎn),漢語(yǔ)和英語(yǔ)這兩種符號(hào)之間的翻譯就不可能做到一一對(duì)應(yīng),更不可能像一次線性函數(shù)方程一樣找到唯一解。也就是說(shuō),翻譯的過(guò)程是一種非線性的過(guò)程。要準(zhǔn)確地進(jìn)行翻譯,不僅要理解句義、理解詞義,更要理解語(yǔ)境,理解兩種語(yǔ)言之間存在的文化差異。而對(duì)于語(yǔ)境和文化之間的理解和解析,只能通過(guò)譯者的揣摩,這一點(diǎn)通過(guò)機(jī)器是無(wú)法做到的。

三、基于語(yǔ)料庫(kù)的機(jī)器翻譯

1.機(jī)器翻譯的概念。所謂機(jī)器翻譯(machine translation)是指把一種自然語(yǔ)言生成另一種自然語(yǔ)言的計(jì)算機(jī)系統(tǒng),是在沒(méi)有人工干預(yù)的情況下,由機(jī)器進(jìn)行語(yǔ)言之間的轉(zhuǎn)換。通常我們利用計(jì)算機(jī)的計(jì)算能力來(lái)分析源語(yǔ)中的話語(yǔ)結(jié)構(gòu),并將其分割成為易于翻譯的單元,從而在目標(biāo)語(yǔ)中以相同的結(jié)構(gòu)重新創(chuàng)建話語(yǔ)。而機(jī)器翻譯則是基于語(yǔ)料庫(kù)而建立起來(lái)的。

2.語(yǔ)料庫(kù)的概念。那什么是語(yǔ)料庫(kù)呢?語(yǔ)料庫(kù)的英文是corpus,有“集合”、“全集”之意。因此,在通俗意義上,語(yǔ)料庫(kù)就是語(yǔ)料收集的倉(cāng)庫(kù)。而作為專業(yè)術(shù)語(yǔ),不同的人對(duì)此有不同的說(shuō)法,在這里我們采用《語(yǔ)言學(xué)和語(yǔ)音學(xué)詞典》中的定義。語(yǔ)料庫(kù)是“語(yǔ)言資料的收集,通常是經(jīng)加工后帶有語(yǔ)言學(xué)信息標(biāo)注的語(yǔ)料文本,可以被用作語(yǔ)言描述的起點(diǎn)或驗(yàn)證語(yǔ)言假設(shè)的方式”。由此看來(lái),語(yǔ)料庫(kù)作為語(yǔ)言樣本的集合,不僅僅包括一些文本文件,還包括電子文件。語(yǔ)料庫(kù)是真實(shí)的,譯為語(yǔ)料的收集取自于真實(shí)的語(yǔ)言材料,取自于正在“使用中”的語(yǔ)言,來(lái)自于我們的工作、生活,來(lái)自于各種正式的、非正式的環(huán)境,能夠反映語(yǔ)言變化的規(guī)律,代表和體現(xiàn)了無(wú)限真實(shí)的語(yǔ)言環(huán)境。因此,我們也可以說(shuō)語(yǔ)料庫(kù)是人們長(zhǎng)期生活積累下來(lái)的習(xí)慣性話語(yǔ),翻譯的工作就是將一種語(yǔ)言迅速對(duì)應(yīng)到另一種語(yǔ)言的習(xí)慣性話語(yǔ)上,譯出讓受眾都能理解的文本。

3.基于語(yǔ)料庫(kù)的機(jī)器翻譯。在本文中,我們主要討論的是基于語(yǔ)料庫(kù)的機(jī)器翻譯,因此分析基于語(yǔ)料庫(kù)的機(jī)器翻譯的模式,將更有利于我們了解機(jī)器翻譯的過(guò)程,以找出其局限性。基于語(yǔ)料庫(kù)的機(jī)器翻譯主要有以下兩種模式:基于統(tǒng)計(jì)的翻譯方法和基于實(shí)例的翻譯方法?;诮y(tǒng)計(jì)的機(jī)器翻譯方法是把翻譯問(wèn)題看作是一個(gè)噪音信道問(wèn)題,源語(yǔ)言經(jīng)過(guò)一個(gè)噪音信道而發(fā)生了扭曲變形,因而在信道的另一端展現(xiàn)為另一種目標(biāo)語(yǔ)言,翻譯的問(wèn)題實(shí)際上就是如何根據(jù)觀察到的目標(biāo)語(yǔ)還原成為最可能的源語(yǔ)。實(shí)質(zhì)上是采用了一種概率計(jì)算的方法,把源語(yǔ)和目標(biāo)語(yǔ)看成兩種對(duì)應(yīng)的模型,通過(guò)統(tǒng)計(jì)分析映射來(lái)解決翻譯問(wèn)題。而基于實(shí)例的方法是把翻譯看成是一種解碼過(guò)程。系統(tǒng)根據(jù)已有的翻譯樣例分析源句和目標(biāo)句,計(jì)算匹配程度,并查找出和源句詞匯和表達(dá)最相配的目標(biāo)句。以此類推,直至生成完整的句子。

由此可以看出,基于語(yǔ)料庫(kù)的機(jī)器翻譯在翻譯過(guò)程中完全依賴于語(yǔ)料庫(kù)的健全程度,分析時(shí)是基于單個(gè)詞語(yǔ)或單個(gè)句子,并從語(yǔ)料庫(kù)中調(diào)用相應(yīng)的對(duì)齊詞語(yǔ)或句子。然而翻譯時(shí)需要考慮的語(yǔ)境和文化因素是無(wú)法靠語(yǔ)料庫(kù)進(jìn)行解讀的。由于翻譯過(guò)程經(jīng)常依賴于超語(yǔ)言信息,這些信息用計(jì)算機(jī)術(shù)語(yǔ)很難捕捉,換言之,正確理解自然語(yǔ)言在很大程度上依賴于人類的語(yǔ)言直覺(jué)。從這個(gè)意義上來(lái)講,機(jī)器翻譯具有一定的有限性。

4.機(jī)器翻譯的有限性。由以上分析可以看出,翻譯的非線性過(guò)程意味著在翻譯時(shí)我們要更多地考慮到兩種語(yǔ)言之間的文化差異和語(yǔ)境,而機(jī)器翻譯則是基于一種規(guī)則,按照程序的指令進(jìn)行翻譯,無(wú)法將文化因素考慮進(jìn)去。因此,我們可以認(rèn)為機(jī)器翻譯的可譯度應(yīng)該與文本的體裁類型密切相關(guān)。文本的文學(xué)程度越高,即所包含文化的因素越多,機(jī)器翻譯的可譯度越低;相反,文本越偏向自然科學(xué)等陳述事實(shí)的文體,包含文化的因素越低,機(jī)器翻譯的可譯度越高。下面將分別以科技文體和文學(xué)文體為例,討論機(jī)器翻譯的可譯程度。

例1.As a technology bringing together several fields including physics, chemistry, biology and computer sciences, nanotechnology will, theoretically, enable you to make everything we can make today.

谷歌翻譯譯文:作為一個(gè)匯集多個(gè)領(lǐng)域,包括物理,化學(xué),生物學(xué)和計(jì)算機(jī)科學(xué)技術(shù),納米技術(shù),從理論上說(shuō),讓你做的一切,我們今天可以。

有道詞典譯文:作為一項(xiàng)技術(shù),召集幾個(gè)領(lǐng)域,包括物理、化學(xué)、生物學(xué)和計(jì)算機(jī)科學(xué)、納米技術(shù),從理論上講,使你能夠讓一切,我們可以讓今天。

SYSTRAN譯文:作為帶來(lái)幾個(gè)領(lǐng)域包括物理的技術(shù),化學(xué)、生物和計(jì)算機(jī)科學(xué),納米技術(shù),理論上,將使您做我們可以今天做的一切。

筆者修改譯文:納米技術(shù),集多學(xué)科于一身。包括物理,化學(xué),生物學(xué)和計(jì)算機(jī)科學(xué)技術(shù)。從理論上講,納米技術(shù)可以制造出現(xiàn)有的所有東西。

將三種機(jī)器翻譯的譯文進(jìn)行對(duì)比發(fā)現(xiàn),機(jī)器翻譯對(duì)專業(yè)名詞的翻譯不會(huì)出現(xiàn)錯(cuò)誤,因?yàn)榭梢灾苯诱{(diào)用語(yǔ)料庫(kù)中的專業(yè)詞典信息,而無(wú)需考慮文化因素的影響。而機(jī)器翻譯時(shí)基本不會(huì)改變?cè)恼Z(yǔ)序,導(dǎo)致句子的理解有不恰當(dāng)?shù)牡胤?。但是筆者根據(jù)機(jī)器翻譯結(jié)果只需進(jìn)行小部分調(diào)整語(yǔ)序即能完成。

例2. While the present century was in its teens, and on one sunshiny morning in June, there drove up to the great iron gate of Miss Pinkerton's academy for young ladies, on Chiswick Mall, a large family coach, with two fat horses in blazing harness, driven by a fat coachman in a three-cornered hat and wig, at the rate of four miles an hour.(W.M.Thackeray:Vanity Fair, Ch.1).

谷歌翻譯譯文:而在本世紀(jì)是在其十幾歲,和1六月,天氣晴朗早晨,有駕駛起來(lái)的偉大的鐵閘門的陸平克頓的年輕女士,奇西克購(gòu)物中心,1大型家庭教練2熾烈線束脂肪馬,中國(guó)科學(xué)院,驅(qū)動(dòng)由脂肪車夫在三個(gè)角的帽子和假發(fā),在每小時(shí)4英里的速度。

有道詞典譯文:而現(xiàn)行的世紀(jì)的青少年,在一個(gè)早上吹拂在六月,那里開(kāi)到大鐵門的平克頓小姐的年輕女子學(xué)院,句購(gòu)物中心,一個(gè)大家庭的教練,有兩匹馬具脂肪燃燒,驅(qū)動(dòng)在三角帽的語(yǔ)意連貫和假發(fā),四英里每小時(shí)的速度。

SYSTRAN譯文:當(dāng)前世紀(jì)是在它的十幾歲之內(nèi)和在一個(gè)陽(yáng)光照耀早晨在6月時(shí),那里駕駛了到Pinkerton小姐的學(xué)院巨大鐵門小姐的, Chiswick購(gòu)物中心,一位大家庭教練的,有二匹肥胖馬的在燃燒的鞔具,駕駛由一位肥胖馬車夫一頂三角帽子和假發(fā)的,以四英里每小時(shí)的率。

筆者修改譯文:當(dāng)時(shí)我們處在這個(gè)世紀(jì)的前十幾年。六月里的一天早上,天氣晴朗,陽(yáng)光明媚。契息克林蔭道上平克頓女子學(xué)院的大門前來(lái)了一輛寬大的私家馬車。拉車的兩匹肥馬套著雪亮的馬具,駕車的馬夫帶著假發(fā)和三角的帽子,趕車速度1小時(shí)4公里。

而機(jī)器翻譯的文學(xué)文體時(shí),基本上只是翻譯出單個(gè)詞語(yǔ)的意思,脫離了整個(gè)語(yǔ)境,句子成為了詞語(yǔ)的簡(jiǎn)單堆疊。筆者需要結(jié)合語(yǔ)境經(jīng)過(guò)大量加工修改,才能完成。

通過(guò)以上對(duì)比可以看出,機(jī)器翻譯存在的有限性表現(xiàn)在:(1)對(duì)于句法復(fù)雜的句子處理時(shí),過(guò)于簡(jiǎn)單化,使句子失去了原有的語(yǔ)義關(guān)系。由于英語(yǔ)句法結(jié)構(gòu)的復(fù)雜性,機(jī)器無(wú)法準(zhǔn)確確定某一詞語(yǔ)在句子里的依附關(guān)系。如第一篇文本中“make everything we can make today”,機(jī)器翻譯時(shí),無(wú)法分析出這句話中“we can make today”是“everything”的同位語(yǔ),導(dǎo)致譯文將這一小句翻譯已成了兩個(gè)毫無(wú)關(guān)系的句子“讓你做的一切,我們今天可以”;(2)由于語(yǔ)義存在的模糊性,使翻譯出的句子脫離了語(yǔ)境意義。由于每個(gè)詞語(yǔ)放在不同的語(yǔ)境中都會(huì)產(chǎn)生不同的意義,因此在翻譯時(shí)需要結(jié)合語(yǔ)境考慮,而機(jī)器翻譯做不到這一點(diǎn)。如第二篇文本“Chiswick Mall”一詞中的“mall”不再是原意“百貨商場(chǎng)”而根據(jù)語(yǔ)境和上下文,這里指的是“林蔭道”。

由此可見(jiàn),機(jī)器翻譯在處理文學(xué)類文本時(shí)難度相對(duì)較大,而對(duì)于非文學(xué)類文本的可譯度較高。主要原因在于后者所使用的語(yǔ)言具有句法結(jié)構(gòu)相對(duì)簡(jiǎn)單、詞性較為單一,形式較為規(guī)范等特點(diǎn)。因此,機(jī)器翻譯目前更適用于“科普文獻(xiàn)、金融商業(yè)交易、行政管理備忘錄、法律文書(shū)、說(shuō)明書(shū)、農(nóng)業(yè)及醫(yī)學(xué)資料、工業(yè)專利、宣傳冊(cè)、報(bào)紙等”。機(jī)器翻譯要克服這些局限性,實(shí)現(xiàn)全自動(dòng)翻譯,譯文質(zhì)量達(dá)到專家水平還需努力。雖然目前機(jī)器翻譯在一定的專業(yè)領(lǐng)域,尤其是科技領(lǐng)域中已經(jīng)廣泛成功的使用,但是在大部分文學(xué)作品的翻譯中,機(jī)器翻譯的準(zhǔn)確度是非常低的。目前的大部分機(jī)器翻譯還是基于孤立的句子為單位,因此機(jī)器翻譯未來(lái)的發(fā)展方向還是要努力考慮語(yǔ)境因素,將范圍擴(kuò)大到句群甚至整個(gè)語(yǔ)篇,這樣語(yǔ)意間的轉(zhuǎn)換才會(huì)更為準(zhǔn)確。這樣不僅能提高翻譯的速度,更重要的是能提高譯文的質(zhì)量。

五、結(jié)束語(yǔ)

本文從介紹非線性這個(gè)數(shù)學(xué)概念出發(fā),將這個(gè)概念引入翻譯中,由此討論了基于語(yǔ)料庫(kù)的機(jī)器翻譯,及由于翻譯過(guò)程的非線性而造成的機(jī)器翻譯的有限性,并通過(guò)科技文本和文學(xué)文本兩個(gè)例證對(duì)比證明了機(jī)器翻譯的適用范圍存在著一定的局限性。機(jī)器翻譯要實(shí)現(xiàn)真正意義上的全自動(dòng)翻譯,必須跨過(guò)對(duì)語(yǔ)言的淺層次分析而進(jìn)入深層次的分析領(lǐng)域,努力考慮語(yǔ)境、篇章因素。機(jī)器翻譯要達(dá)到高質(zhì)量、高精確性的譯文,還有很長(zhǎng)的路要走。

參考文獻(xiàn)

[1]Hutchins, W. J. & H. L. Somers. An Introduction to Machine Translation[M].London:Academic Press,1992,3.

[2]陳海東.計(jì)算機(jī)翻譯存在的困難及解決方法新探.廣東科技,2009,第219期:87-88.

[3]陳宏薇.高級(jí)漢英翻譯.北京:外語(yǔ)教學(xué)與研究出版社,2009.24-25.

[4]劉楊.語(yǔ)料庫(kù)與機(jī)器翻譯.大眾文藝,2009,第19期:23.

[5]許鈞.翻譯論.武漢:湖北教育出版社,2003,75.

[6]余國(guó)良.語(yǔ)料庫(kù)語(yǔ)言學(xué)與應(yīng)用.成都:四川大學(xué)出版社,2009.

猜你喜歡
機(jī)器翻譯非線性語(yǔ)料庫(kù)
《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
互聯(lián)網(wǎng)+新時(shí)代下人機(jī)翻譯模式研究
考試周刊(2017年2期)2017-01-19 09:13:50
“語(yǔ)聯(lián)網(wǎng)+行業(yè)” 助力中國(guó)偉大復(fù)興
考試周刊(2017年2期)2017-01-19 09:12:54
大數(shù)據(jù)背景下石油科技翻譯
電子節(jié)氣門非線性控制策略
汽車科技(2016年5期)2016-11-14 08:03:52
基于SolidWorksSimulation的O型圈錐面密封非線性分析
科技視界(2016年23期)2016-11-04 08:14:28
機(jī)器翻譯不可盲取
四輪獨(dú)立驅(qū)動(dòng)電動(dòng)汽車行駛狀態(tài)估計(jì)
工業(yè)機(jī)器人鋁合金大活塞鑄造系統(tǒng)設(shè)計(jì)與研究
科技視界(2016年24期)2016-10-11 12:53:13
南安市| 汝南县| 仙桃市| 大丰市| 莎车县| 茌平县| 聂荣县| 蒙城县| 蕲春县| 防城港市| 西藏| 和龙市| 湖南省| 彝良县| 西宁市| 镇赉县| 林口县| 临安市| 鸡西市| 时尚| 新和县| 肃北| 东明县| 昌吉市| 许昌市| 怀来县| 会理县| 满洲里市| 德令哈市| 永兴县| 腾冲县| 孟连| 寻乌县| 合川市| 泸定县| 靖远县| 海盐县| 巴林右旗| 含山县| 乌兰浩特市| 苍山县|