李 晗 佶, 陳 海 慶
(1.大連理工大學(xué) 人文與社會(huì)科學(xué)學(xué)部,遼寧 大連 116024;2.大連理工大學(xué) 外國(guó)語(yǔ)學(xué)院,遼寧 大連 116024)
翻譯作為一項(xiàng)古老的人類(lèi)職業(yè)和實(shí)踐活動(dòng),在漫長(zhǎng)的人類(lèi)發(fā)展史中為經(jīng)濟(jì)交流和文化傳播都做出了不可磨滅的貢獻(xiàn)。在人工智能、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等技術(shù)的驅(qū)使下,機(jī)器翻譯得到了飛速發(fā)展并且在翻譯速度、譯文質(zhì)量、覆蓋語(yǔ)種、知識(shí)獲取方式等方面取得了豐碩成果。但與此同時(shí),機(jī)器翻譯技術(shù)存在的問(wèn)題也在不斷展現(xiàn)。與技術(shù)研發(fā)者樂(lè)觀的預(yù)期相反,包括譯者在內(nèi)的語(yǔ)言學(xué)家對(duì)機(jī)器翻譯的未來(lái)持謹(jǐn)慎態(tài)度[1]。這就使我們不禁要對(duì)當(dāng)前突飛猛進(jìn)的機(jī)器翻譯技術(shù)重新審視。少數(shù)國(guó)內(nèi)外學(xué)者,如哈欽斯(W John Hutchins)[2]、威爾克斯(Yorick Wilks)[3]、麥德森(Mathias Winther Madsen)[4]、楊憲澤[5]、張政[6]等人從不同的學(xué)科視角出發(fā),對(duì)機(jī)器翻譯技術(shù)難點(diǎn)進(jìn)行了探討。但是我們也發(fā)現(xiàn)其中存在著明顯的不足:首先,當(dāng)前的研究?jī)H將機(jī)器翻譯視為工程學(xué)上的技術(shù)問(wèn)題或語(yǔ)言學(xué)上的翻譯問(wèn)題,呈現(xiàn)出學(xué)科多元的趨勢(shì);其次,對(duì)于造成技術(shù)困境的內(nèi)在成因缺乏深入分析。鑒于目前理論研究的不足以及現(xiàn)實(shí)應(yīng)用中的迫切需求,本文旨在回答以下3個(gè)問(wèn)題:(1)機(jī)器翻譯技術(shù)的困境外在表征如何;(2)造成這種局面的內(nèi)在成因是什么;(3)我們需要以何種路徑走出這種技術(shù)困境。
機(jī)器翻譯就是指利用計(jì)算機(jī)實(shí)現(xiàn)自然語(yǔ)言文本間轉(zhuǎn)換的技術(shù)。早在古希臘時(shí)期,一些哲學(xué)家就萌發(fā)了利用機(jī)械裝置進(jìn)行語(yǔ)言翻譯的想法。但是直到20世紀(jì)50年代,美國(guó)科學(xué)家威弗(Warren Weaver)的構(gòu)想與實(shí)踐才真正拉開(kāi)了機(jī)器翻譯研發(fā)的序幕。在“全自動(dòng)高質(zhì)量機(jī)器翻譯”(Fully Automated High-Quality Machine Translation,F(xiàn)AHQMT)宏偉目標(biāo)的指引下,這一領(lǐng)域在數(shù)十年的發(fā)展歷程中經(jīng)歷了幾度沉浮。信息化時(shí)代的快節(jié)奏溝通對(duì)語(yǔ)言障礙的消解提出了日益緊迫的需求,無(wú)論是從商業(yè)價(jià)值、社會(huì)價(jià)值還是技術(shù)價(jià)值角度上來(lái)看,機(jī)器翻譯無(wú)疑都具有重大的理論與實(shí)踐意義。近些年來(lái),機(jī)器翻譯的研發(fā)在算法結(jié)構(gòu)、設(shè)計(jì)思路、硬件支持等方面都發(fā)生了巨大的變化:谷歌神經(jīng)翻譯(Google Neural Machine Translation,GNMT)的質(zhì)量已經(jīng)可以和人工翻譯相媲美;臉書(shū)(Facebook)基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的翻譯系統(tǒng)在速度上實(shí)現(xiàn)了超越;微軟翻譯(Microsoft Translate)在中英新聞翻譯方面以1.3分BLEU測(cè)評(píng)分差超越人類(lèi);法國(guó)AI企業(yè)康特梅特里公司和德國(guó)初創(chuàng)公司DeepLy聯(lián)合設(shè)計(jì)編制完成的機(jī)器翻譯系統(tǒng)僅用12小時(shí)就將800頁(yè)的《深度學(xué)習(xí)》(Deep Learing)一書(shū)內(nèi)容由法文譯為英文并付諸出版……似乎在當(dāng)下,機(jī)器翻譯已經(jīng)實(shí)現(xiàn)了“高質(zhì)量”的目標(biāo)。那有關(guān)“全自動(dòng)”的設(shè)想呢?就在神經(jīng)翻譯系統(tǒng)發(fā)布不久,谷歌再度發(fā)布重要成果,稱(chēng)其實(shí)現(xiàn)了不同語(yǔ)種間“零知識(shí)”(Zero-Shot)的互譯,也就是可以在兩種事先未學(xué)習(xí)過(guò)的語(yǔ)言間轉(zhuǎn)換。臉書(shū)的研究人員也提出了一種“不需要任何翻譯資源的無(wú)監(jiān)督翻譯模型”,并將詞到詞的翻譯(Word-by-Word Initialization)、語(yǔ)言建模和反向翻譯作為指導(dǎo)原則。
技術(shù)上一次又一次顛覆性的突破令人不禁思考,技術(shù)學(xué)家所提出的“奇點(diǎn)”(Singularity)論斷是否將在翻譯領(lǐng)域首先來(lái)臨?語(yǔ)言學(xué)家普遍認(rèn)為,機(jī)器翻譯取代人工翻譯的論斷還為時(shí)過(guò)早。而工程師則將翻譯視為一個(gè)數(shù)學(xué)和統(tǒng)計(jì)學(xué)方面的問(wèn)題,并試圖依靠算法和大數(shù)據(jù)來(lái)“勝過(guò)”語(yǔ)言學(xué)家[7]。雖然對(duì)這一領(lǐng)域的未來(lái)前景持樂(lè)觀態(tài)度,但是技術(shù)研發(fā)者也并不否認(rèn)當(dāng)前研發(fā)路徑中存在的不足:如何將先驗(yàn)知識(shí)融入系統(tǒng),如何對(duì)神經(jīng)機(jī)器翻譯過(guò)程和錯(cuò)誤進(jìn)行解釋?zhuān)绾未_保機(jī)器學(xué)習(xí)全局關(guān)聯(lián)模型的系統(tǒng)魯棒性[8]。上述技術(shù)問(wèn)題在機(jī)器翻譯輸出的譯文結(jié)果中具體表現(xiàn)在以句子為單位機(jī)器翻譯系統(tǒng)在處理篇章信息時(shí)會(huì)忽略上下文信息,同時(shí)對(duì)于一詞多義、歧義解構(gòu)和存在瑕疵的原文處理時(shí)效果不佳。
那么機(jī)器翻譯所面臨的技術(shù)困境是否真的就只是工程學(xué)意義上的技術(shù)問(wèn)題或語(yǔ)言學(xué)層面的翻譯問(wèn)題呢?為此,我們需要對(duì)機(jī)器翻譯的本質(zhì)進(jìn)行分析。機(jī)器翻譯的任務(wù)就在于模擬人類(lèi)的語(yǔ)言轉(zhuǎn)換能力。而人工智能所要追求的目標(biāo)就是讓計(jì)算機(jī)完成人類(lèi)心智能做的各種事情。語(yǔ)言作為人類(lèi)思維和智能的外在表象,無(wú)疑成為二者之間連接的紐帶。人工智能哲學(xué)研究者卡特(Matt Carter)指出:“人工智能發(fā)展中面臨的最有意義、最困難的計(jì)算問(wèn)題也許是自然語(yǔ)言的理解與產(chǎn)生問(wèn)題?!盵9]144智能、思維、意識(shí)等問(wèn)題不僅受到人工智能領(lǐng)域的關(guān)注,同時(shí)也是哲學(xué)研究中力圖厘清的關(guān)鍵所在。這就使得人工智能與哲學(xué)之前的聯(lián)系比其他學(xué)科要更為緊密。一方面,哲學(xué)對(duì)人工智能具有假設(shè)論證、概念澄清和歷史檢驗(yàn)等積極作用[10];另一方面,人工智能發(fā)展也將校驗(yàn)哲學(xué)之中的預(yù)設(shè)和假說(shuō)。因此,作為人工智能的具體應(yīng)用,機(jī)器翻譯技術(shù)的發(fā)展同樣需要接受哲學(xué)的檢驗(yàn)和拷問(wèn)。
哲學(xué)自身的發(fā)展也經(jīng)歷了數(shù)次轉(zhuǎn)向,早期哲學(xué)家們關(guān)注對(duì)世界本原問(wèn)題進(jìn)行追問(wèn)的本體論哲學(xué),隨后又開(kāi)始了對(duì)主體性問(wèn)題研究的認(rèn)識(shí)論哲學(xué)。但是由于在解釋認(rèn)識(shí)論的語(yǔ)句中存在著內(nèi)容空泛、邏輯混亂、概念不清等局限,“語(yǔ)言”的重要性得以突顯,分析哲學(xué)哲學(xué)家開(kāi)始強(qiáng)調(diào)只有通過(guò)對(duì)語(yǔ)言進(jìn)行分析,人們才有能力追求世界的本質(zhì)并獲得客觀真理。語(yǔ)言哲學(xué)關(guān)注語(yǔ)言與世界以及語(yǔ)言與思維的關(guān)系問(wèn)題。對(duì)上述問(wèn)題的不同解答不僅影響著我們對(duì)人類(lèi)智能的理解,同時(shí)也直接決定著人工智能發(fā)展的未來(lái)走向。為此,機(jī)器翻譯能否最終實(shí)現(xiàn)突破,我們有必要從語(yǔ)言哲學(xué)中的“語(yǔ)義問(wèn)題”與“語(yǔ)境問(wèn)題”出發(fā)進(jìn)行審視。
人類(lèi)認(rèn)識(shí)圍繞“意義”展開(kāi)。弗雷格(Friedrich Ludwig GottlobFrege)、羅素(Bertrand Russell)等哲學(xué)家認(rèn)為,語(yǔ)句的意義就等同于其所蘊(yùn)涵的真值條件。為了彌補(bǔ)自然語(yǔ)言的缺陷,他們?cè)噲D通過(guò)建構(gòu)一種符合邏輯規(guī)則,且清晰、簡(jiǎn)潔“人工語(yǔ)言”以此消解其對(duì)思維的阻礙。如果這種預(yù)設(shè)能夠?qū)崿F(xiàn),那么包括語(yǔ)言、心智以及世界等在內(nèi)的一切都可以經(jīng)由形式化的構(gòu)造和符號(hào)化的過(guò)程得以表征和實(shí)現(xiàn)。早期的符號(hào)主義(Symbolism)人工智能由此得以催生,技術(shù)研發(fā)者也著手開(kāi)發(fā)基于規(guī)則的機(jī)器翻譯系統(tǒng)(Rule-based Machine Translation),即通過(guò)人為構(gòu)建自然語(yǔ)言之間的轉(zhuǎn)換規(guī)律進(jìn)行翻譯。這種研發(fā)路徑遵循“句法”規(guī)則,以強(qiáng)大的形式描述和生成能力表現(xiàn)出極強(qiáng)的應(yīng)用價(jià)值,但是開(kāi)發(fā)周期長(zhǎng)、魯棒性差、人工成本高、翻譯知識(shí)獲取難、難以升級(jí)等局限也在后續(xù)的發(fā)展過(guò)程中逐步顯現(xiàn)。此時(shí),由于轉(zhuǎn)向“句法”而暫時(shí)得以規(guī)避的“語(yǔ)義問(wèn)題”再度成為焦點(diǎn)。面對(duì)自然語(yǔ)言的符號(hào)化表征、形式語(yǔ)言的語(yǔ)義意向性獲取以及統(tǒng)一、系統(tǒng)的語(yǔ)義理論框架建構(gòu)等方面的發(fā)出挑戰(zhàn)[11],同時(shí)憑借計(jì)算機(jī)性能以及算法上的大幅度提升,人工智能研發(fā)者開(kāi)辟了聯(lián)結(jié)主義(Connectionism)的研發(fā)路徑。對(duì)機(jī)器翻譯來(lái)說(shuō),研發(fā)者將傳統(tǒng)基于規(guī)則的機(jī)器翻譯內(nèi)在難以解答的“語(yǔ)義問(wèn)題”交由數(shù)據(jù)和統(tǒng)計(jì)解決。統(tǒng)計(jì)機(jī)器翻譯(Statistical Machine Translation)依靠大量語(yǔ)料,通過(guò)數(shù)學(xué)模型描述自然語(yǔ)言的轉(zhuǎn)換過(guò)程并建立自動(dòng)訓(xùn)練的語(yǔ)言統(tǒng)計(jì)模型。這種方式在很大程度上彌補(bǔ)了理性主義翻譯方法的局限,其結(jié)果也達(dá)到了令人滿(mǎn)意的效果。端到端編碼器-解碼器結(jié)構(gòu)、seq2seq學(xué)習(xí)的方法的提出以及注意力(attention)機(jī)制的引入使得神經(jīng)機(jī)器翻譯(Neural Machine Translation,NMT)開(kāi)始展現(xiàn)其巨大的魅力。使用深度學(xué)習(xí)(deep learning)神經(jīng)網(wǎng)絡(luò)獲取自然語(yǔ)言之間的映射關(guān)系使得這一系統(tǒng)只需要少量代碼就可以驅(qū)動(dòng)整個(gè)系統(tǒng)完成運(yùn)轉(zhuǎn)。神經(jīng)機(jī)器翻譯系統(tǒng)不僅顯著提升了翻譯質(zhì)量、訓(xùn)練所需數(shù)據(jù)量更少、同時(shí)對(duì)新語(yǔ)言間轉(zhuǎn)換的拓展也更為便捷。那么,這是否就意味著人工智能以及機(jī)器翻譯可以繞開(kāi)“語(yǔ)義問(wèn)題”得以發(fā)展呢?
針對(duì)這一問(wèn)題,哲學(xué)家們的洞見(jiàn)無(wú)疑為我們提供了答案。20世紀(jì)50年代,被譽(yù)為“人工智能之父”的英國(guó)數(shù)學(xué)家圖靈一直在思考一個(gè)問(wèn)題,機(jī)器能思維嗎?為了能夠更加清晰地對(duì)“機(jī)器”和“思維”兩個(gè)詞進(jìn)行定義,他構(gòu)想了“圖靈測(cè)試”這一模仿游戲來(lái)證明:計(jì)算機(jī)就是算法。圖靈的創(chuàng)見(jiàn)為人工智能發(fā)展開(kāi)辟了一條全新的道路,直接促進(jìn)了符號(hào)主義研究范式的發(fā)展。工程師在這種理論基礎(chǔ)上建造計(jì)算機(jī),并處理各種邏輯推理,試圖解決包括翻譯在內(nèi)的各種問(wèn)題。但同時(shí),他的設(shè)想也蘊(yùn)含著一個(gè)根本性的問(wèn)題:由于受到數(shù)學(xué)本質(zhì)的限制,人類(lèi)思維是否就是算法的集合,機(jī)器有可能發(fā)展出如人腦一般的智能嗎?為了反駁圖靈有關(guān)“智能”的觀點(diǎn),美國(guó)語(yǔ)言哲學(xué)家塞爾(J. R. Searle)構(gòu)想了一個(gè)名為“中文屋論證”的思想實(shí)驗(yàn):設(shè)想不懂中文的塞爾在封閉的房間中,借由用英文所寫(xiě)成的轉(zhuǎn)換規(guī)則也可以產(chǎn)出令人滿(mǎn)意的“轉(zhuǎn)換”結(jié)果。塞爾借此想要證明,從來(lái)沒(méi)有一種純形式的模式足以憑借自身就能產(chǎn)生意向性(Intentionality)。他指出:“人的思維不僅是形式或語(yǔ)法的過(guò)程……計(jì)算機(jī)程序只是語(yǔ)法的,而心不僅僅是語(yǔ)法的。心是語(yǔ)義的,人心不僅是一個(gè)形式結(jié)構(gòu),它是有內(nèi)容的?!薄耙斫庖环N語(yǔ)言需要完全具有心理狀態(tài),這比僅僅一套形式語(yǔ)法的要求更多,要具備一種釋義,或者說(shuō)那些符號(hào)都要有意義?!盵12]塞爾所要強(qiáng)調(diào)的是機(jī)器并不能產(chǎn)生與人類(lèi)相似的理解過(guò)程,同時(shí)程序所產(chǎn)出的近似結(jié)果也不能為人類(lèi)的理解過(guò)程提供充分的解釋?zhuān)瑥亩鞔_指出了人工智能研究范式中句法與語(yǔ)義、邏輯與現(xiàn)實(shí)以及符號(hào)和對(duì)象之間的斷裂與對(duì)立?;诂F(xiàn)象學(xué)觀點(diǎn),美國(guó)哲學(xué)家德雷福斯分別從生物學(xué)、心理學(xué)、認(rèn)識(shí)論和本體論4個(gè)角度對(duì)人工智能的基本理論預(yù)設(shè)進(jìn)行了一一的駁斥[13]。他認(rèn)為永遠(yuǎn)不可能以理解客體的方式來(lái)對(duì)人類(lèi)自身進(jìn)行理解,人類(lèi)行為無(wú)法用數(shù)學(xué)的方式進(jìn)行計(jì)算。由此,德雷福斯得出結(jié)論,人類(lèi)和機(jī)器的信息加工是以完全不同的形式進(jìn)行的……人工智能目前的困難就暴露出了技術(shù)的限度。
從認(rèn)知科學(xué)角度來(lái)看,神經(jīng)認(rèn)知、心理認(rèn)知屬于人與動(dòng)物所共有的低階認(rèn)知,而語(yǔ)言認(rèn)知、思維認(rèn)知和文化認(rèn)知?jiǎng)t屬于人類(lèi)所特有的高階認(rèn)知。雖然人工智能在不斷的進(jìn)步,但并未在這5層認(rèn)知中的任何一層得以實(shí)現(xiàn)。即便是令人歡欣鼓舞的機(jī)器學(xué)習(xí)也只不過(guò)是對(duì)人類(lèi)智能粗淺的模仿[14]。那么當(dāng)前的“風(fēng)光無(wú)限”的神經(jīng)機(jī)器翻譯是否實(shí)現(xiàn)了語(yǔ)義理解呢?我們來(lái)看兩個(gè)例子:①在公園新安裝的座椅上放置著“油漆未干!”的警示牌,谷歌神經(jīng)機(jī)器翻譯將其翻譯為“Paint is not dry!”;②對(duì)于“天哪!有炸彈!”這樣的警示,谷歌給出了“God! There are bombs!”這樣的翻譯結(jié)果。而有經(jīng)驗(yàn)的人類(lèi)譯員則會(huì)分別給出“Wet Paint!”的翻譯和“Get Out!”并馬上轉(zhuǎn)身就跑的應(yīng)激反應(yīng)。通過(guò)對(duì)比原文,我們會(huì)發(fā)現(xiàn)人類(lèi)譯員做出的翻譯與之并不對(duì)應(yīng);而機(jī)器翻譯的結(jié)果無(wú)論從語(yǔ)義對(duì)應(yīng)還是語(yǔ)序結(jié)構(gòu)上來(lái)說(shuō)都沒(méi)有問(wèn)題。這是否就意味著機(jī)器翻譯的結(jié)果就要優(yōu)于人類(lèi)譯員呢?很顯然,答案是否定的。翻譯是心理的、認(rèn)知的過(guò)程,不僅表現(xiàn)為原語(yǔ)輸入和譯語(yǔ)產(chǎn)出這一外在的言語(yǔ)行為和言語(yǔ)事實(shí),同樣也反映了譯者語(yǔ)際轉(zhuǎn)換的內(nèi)在心理機(jī)制和言語(yǔ)信息加工的認(rèn)知過(guò)程。英國(guó)翻譯理論家紐馬克根據(jù)語(yǔ)言類(lèi)型與功能,對(duì)翻譯方法做出了“語(yǔ)義翻譯”(Semantic Translation)和“交際翻譯”(Communicative Translation)的區(qū)分:前者強(qiáng)調(diào)忠實(shí)于原文的信息內(nèi)容;而后者則關(guān)心語(yǔ)言信息對(duì)讀者所產(chǎn)生的效果[15]。由此可見(jiàn),人類(lèi)譯員的翻譯結(jié)果實(shí)際上呈現(xiàn)出的是對(duì)原文進(jìn)行語(yǔ)義理解并重組和再現(xiàn)的過(guò)程,這也是當(dāng)前基于數(shù)據(jù)的機(jī)器翻譯難以實(shí)現(xiàn)的。有人可能會(huì)提出反駁,當(dāng)前機(jī)器翻譯出現(xiàn)的問(wèn)題只是數(shù)據(jù)量大小的問(wèn)題,從邏輯上來(lái)講這一問(wèn)題會(huì)在未來(lái)技術(shù)的驅(qū)使下得以解決。但是正如語(yǔ)言學(xué)家喬姆斯基所言,語(yǔ)言的可能性是無(wú)限的,跨語(yǔ)言的組合方式與對(duì)應(yīng)條件更不可能使用數(shù)據(jù)和統(tǒng)計(jì)的方法所窮盡[16]。與機(jī)器翻譯所依賴(lài)的大數(shù)據(jù)相比,人類(lèi)譯員學(xué)習(xí)范圍十分的有限,但是人類(lèi)可以從中總結(jié)并發(fā)掘潛藏的知識(shí)。這種抽象化的能力則是當(dāng)今的人工智能難以實(shí)現(xiàn)的特質(zhì)。
翻譯需要遵循源語(yǔ)識(shí)別、語(yǔ)義理解與目的語(yǔ)產(chǎn)出的標(biāo)準(zhǔn)過(guò)程。而當(dāng)前基于數(shù)據(jù)的神經(jīng)機(jī)器翻譯繞開(kāi)了“語(yǔ)義問(wèn)題”并使“語(yǔ)義理解”的過(guò)程成為“黑匣”,技術(shù)研發(fā)者將關(guān)注焦點(diǎn)聚焦于機(jī)器的輸出結(jié)果上。神經(jīng)網(wǎng)絡(luò)技術(shù)受到了人腦工作方式的啟發(fā),但其依舊沿襲計(jì)算科學(xué)的路徑而并非神經(jīng)科學(xué)。從本質(zhì)上來(lái)講,神經(jīng)機(jī)器翻譯與統(tǒng)計(jì)機(jī)器翻譯的基本思路都是概率最大化,只不過(guò)在具體的實(shí)現(xiàn)方式上存在差異而已。也就是說(shuō),當(dāng)前人工智能以及機(jī)器翻譯領(lǐng)域所取得進(jìn)步并非是理論和技術(shù)上的突破,只能稱(chēng)之為算法和硬件性能上的提升。不理解語(yǔ)義的人工智能并不能體現(xiàn)人類(lèi)智能的本質(zhì),同時(shí)也無(wú)法實(shí)現(xiàn)強(qiáng)人工智能的宏大愿景。由此可見(jiàn),盡管在當(dāng)前的研究范式下機(jī)器翻譯從產(chǎn)出效果上來(lái)講已經(jīng)取得了長(zhǎng)足的進(jìn)步,但是“語(yǔ)義問(wèn)題”依舊是不能也無(wú)法繞開(kāi)的難題。
構(gòu)建“人工語(yǔ)言”的設(shè)想雖然避免了歧義的產(chǎn)生,但是卻并未認(rèn)清邏輯語(yǔ)言的實(shí)質(zhì)。以?shī)W斯汀(J. L. Austin)、格萊斯(H.P.Grice)等為代表的哲學(xué)家們并不否認(rèn)自然語(yǔ)言中的歧義和混亂的事實(shí),更加關(guān)注對(duì)日常語(yǔ)言的分析,由此將焦點(diǎn)從“語(yǔ)義”轉(zhuǎn)向了“語(yǔ)用”。不同于早期基于語(yǔ)言與世界相對(duì)應(yīng)理念所提出的“圖像論”,維特根斯坦(Wittgenstein)經(jīng)過(guò)反思,在《哲學(xué)研究》中對(duì)自己建構(gòu)的哲學(xué)體系進(jìn)行了批判。他認(rèn)為語(yǔ)言和行為相互交織形成了“語(yǔ)言游戲”[17]13,這種具有多樣性、目的性、規(guī)則性和工具性的活動(dòng)恰恰是生活形式中的一部分。這一觀點(diǎn)的核心就在于語(yǔ)言只有在具體的使用情境中才能突顯出意義與價(jià)值。他指出語(yǔ)言游戲不僅包括下命令、提出假設(shè)、講故事、演戲、唱歌等,將一種語(yǔ)言譯成另一種語(yǔ)言同樣也是其表現(xiàn)形式之一[17]。由此可見(jiàn),翻譯就是游戲。那么當(dāng)前基于經(jīng)驗(yàn)主義路徑所研發(fā)的機(jī)器翻譯系統(tǒng)是否彌補(bǔ)了“翻譯游戲”對(duì)現(xiàn)實(shí)世界知識(shí)缺失的局限呢?美國(guó)認(rèn)知科學(xué)家侯世達(dá)針對(duì)這一問(wèn)題進(jìn)行了精辟的論述。他指出,盡管谷歌翻譯技術(shù)的實(shí)用性毋庸置疑,但是在技術(shù)方法上還是缺乏“理解力”。由于沒(méi)有記憶的參與,這些看似可行的譯文在本質(zhì)上來(lái)講沒(méi)有圖像,缺乏理解,也就失去了意義。他總結(jié)道:“更多的數(shù)據(jù)并不會(huì)使機(jī)器獲得理解能力,因?yàn)槔斫饽芰ι婕暗剿枷耄@也是當(dāng)今機(jī)器學(xué)習(xí)面臨的最基本問(wèn)題。”[18]
正如侯世達(dá)所言,目前已知的智能形式所使用的都是記憶,而非數(shù)據(jù)存儲(chǔ)。作為一種深刻的人類(lèi)藝術(shù)形式,翻譯散發(fā)著神秘而振奮的光芒。在將語(yǔ)言A表達(dá)的思想轉(zhuǎn)化成語(yǔ)言B表達(dá)的思想的過(guò)程之中,不僅僅要保持語(yǔ)義與形式的清晰性,還要呈現(xiàn)出原作者的品位、偏好和寫(xiě)作風(fēng)格。這就是說(shuō),翻譯不僅僅是語(yǔ)言層面的轉(zhuǎn)換,還要涉及語(yǔ)言的背景信息并結(jié)合譯者自身的經(jīng)歷加以理解,是一種“深度心智”的表現(xiàn)形式。當(dāng)前基于數(shù)據(jù)統(tǒng)計(jì)的機(jī)器翻譯只是在進(jìn)行詞語(yǔ)間的聯(lián)想而非思想的對(duì)接。這種研發(fā)路徑的缺陷就在于它所處理的符號(hào)與我們對(duì)這個(gè)世界的體驗(yàn)與知識(shí)并無(wú)關(guān)聯(lián),具體表現(xiàn)為以下兩個(gè)方面。
首先,當(dāng)前的機(jī)器翻譯缺乏對(duì)常識(shí)的理解。所謂常識(shí),就是指日常生活中的知識(shí),尤其是那些不言自明、難以言說(shuō)的知識(shí)[19]。如對(duì)一顆蘋(píng)果樹(shù)而言,我們具有超越其外在的物理形態(tài)的以下常識(shí):蘋(píng)果樹(shù)的樹(shù)冠可以供人們遮蔭,樹(shù)干可以作為木料制作工具,結(jié)出的果實(shí)可以食用;其生長(zhǎng)需要陽(yáng)光、水、土壤等基本條件;遭受害蟲(chóng)侵襲可能會(huì)導(dǎo)致其生病、枯萎等。上述對(duì)于蘋(píng)果樹(shù)的泛在概念是人類(lèi)經(jīng)由語(yǔ)言將日常的生活經(jīng)驗(yàn)潛移默化進(jìn)行存儲(chǔ)的結(jié)果,但是由于無(wú)法以形式化的語(yǔ)言精準(zhǔn)表述,如何讓機(jī)器對(duì)其掌握就成為難題。我們來(lái)看一個(gè)例子,一位顧客在網(wǎng)站上發(fā)表了一條對(duì)餐廳的點(diǎn)評(píng):“Guys!Stuff re so friendly and helpful. ”使用谷歌翻譯,我們得到了這樣的結(jié)果:“伙計(jì)們!東西是如此友好和樂(lè)于助人?!笨吹竭@條譯文,我們無(wú)疑會(huì)感到十分迷惑:友好和樂(lè)于助人都是來(lái)對(duì)人進(jìn)行修飾的形容詞,而在此為何搭配的主語(yǔ)是“東西”?回到原文我們就不難發(fā)現(xiàn),這位粗心的顧客錯(cuò)將“staff”(員工)拼成了“stuff”(東西)。這種對(duì)人工譯員而言明顯的錯(cuò)誤卻難倒了當(dāng)前“智能”的機(jī)器翻譯系統(tǒng)。此外,人類(lèi)的常識(shí)儲(chǔ)備也是一個(gè)不斷豐富的過(guò)程。不同于一蹴而就的數(shù)學(xué)計(jì)算,翻譯在不斷的摸索和探討中追求近似的完美。法律翻譯譯者需要查閱大量資料了解源語(yǔ)與目標(biāo)語(yǔ)國(guó)家的法律規(guī)范與社會(huì)風(fēng)俗才能準(zhǔn)確地對(duì)相關(guān)概念進(jìn)行闡釋?zhuān)粸榱送瓿晒S交給的翻譯任務(wù),譯者還需要親自來(lái)到車(chē)間了解生產(chǎn)流程與工具組件的相關(guān)信息。上述人類(lèi)譯者通過(guò)不斷學(xué)習(xí)來(lái)豐富自身的知識(shí)儲(chǔ)備的行為就是常識(shí)積累的過(guò)程。而當(dāng)前機(jī)器所進(jìn)行的“學(xué)習(xí)”依舊是以人類(lèi)現(xiàn)有的知識(shí)成果,而非以與現(xiàn)實(shí)世界的交往為來(lái)源。
其次,當(dāng)前的機(jī)器翻譯依舊難以跨越語(yǔ)境障礙。正如“理想語(yǔ)言學(xué)派”哲學(xué)家所指出,自然語(yǔ)言具有的不確定性主要表現(xiàn)為歧義和模糊兩個(gè)方面。前者產(chǎn)生的原因就在于意義與形式之間的非一一對(duì)稱(chēng)性;而后者可以歸納為描述對(duì)象類(lèi)屬界面的不確定性、語(yǔ)言符號(hào)體系的收斂性、描述對(duì)象自身的不可言說(shuō)和不同社會(huì)角色對(duì)語(yǔ)言本身理解的差異性等多個(gè)方面[20]。這種不確定性無(wú)疑對(duì)依賴(lài)于邏輯語(yǔ)言分析并形式化描寫(xiě)人類(lèi)思維的計(jì)算機(jī)程序提出了巨大的挑戰(zhàn)。我們來(lái)看一個(gè)例子:
原文:人們以為他對(duì)她有“意思”,于是,建議他對(duì)她“意思意思”。他說(shuō),他沒(méi)那種“意思”。她則反問(wèn),你們是什么“意思”。大伙中有的覺(jué)得很有“意思”,有的則認(rèn)為真沒(méi)“意思”[21]。
谷歌翻譯:People thought that he had “meaning” to her,so he suggested that he “meaning” to her. He said that he did not have that “meaning.” She asked,what is your meaning? Some of them feel very “meaning”,while others think that there is no “meaning.”
“意思”這個(gè)詞在80余字的原文中重復(fù)出現(xiàn)了6次。面對(duì)這種中文詞匯層面的歧義,谷歌翻譯將原文中分別表示“愛(ài)意”(feeling)、“示愛(ài)”(express)、“意圖”(intention)、“有趣”(interesting)和“無(wú)趣”(boring)的指稱(chēng)一股腦地處理成了“meaning”。人類(lèi)可以經(jīng)由上下文語(yǔ)境以及自身對(duì)世界的理解撥開(kāi)語(yǔ)言歧義的迷霧進(jìn)行語(yǔ)義識(shí)別,而計(jì)算機(jī)則在此犯了難。自然語(yǔ)言的不確定性是當(dāng)今包括機(jī)器翻譯、自然語(yǔ)言處理乃至整個(gè)人工智能發(fā)展無(wú)法回避的問(wèn)題。機(jī)器只能處理在基本單元、運(yùn)算和關(guān)系以及優(yōu)先級(jí)上都明確的語(yǔ)言。美國(guó)人工智能奠基人西蒙就表示:“在自動(dòng)翻譯過(guò)程中,當(dāng)翻譯取決于上下文和意義而非句法線索時(shí),這一理論就遇到了困難。”[22]
目前人工智能領(lǐng)域針對(duì)“語(yǔ)用問(wèn)題”所采取的解決方式無(wú)外乎兩種。常識(shí)化需要對(duì)世界上大量的知識(shí)進(jìn)行編碼,并讓程序使用者寫(xiě)編碼識(shí)別語(yǔ)言意圖;而統(tǒng)計(jì)則利用龐大的語(yǔ)料庫(kù)和簡(jiǎn)單的識(shí)別規(guī)則,讓機(jī)器自己進(jìn)行學(xué)習(xí)。但二者都存在缺點(diǎn),前者的工作量難以想象,后者又存在著過(guò)程難以解釋、結(jié)果不確定的局限??ㄌ刂赋觯骸叭斯ぶ悄艿陌l(fā)展中必要的一環(huán)就是以相應(yīng)的方式與外部世界相關(guān)聯(lián)。通過(guò)感知方式使人工智能和外部世界通過(guò)經(jīng)驗(yàn)得以表征?!盵9]206由此可見(jiàn),“語(yǔ)用問(wèn)題”所反映的實(shí)質(zhì)在于不確定性思維是人類(lèi)把握客觀世界的一種重要方式,用不精確、非定量、模糊的思維進(jìn)行思考和推理的能力正是人與機(jī)器在智力層次的根本差別之所在。
通過(guò)上文論述,我們分析了困擾機(jī)器翻譯技術(shù)發(fā)展的內(nèi)在動(dòng)因。那么機(jī)器翻譯技術(shù)困境的未來(lái)出路究竟在哪里?本文認(rèn)為需要從以下3個(gè)方面入手來(lái)對(duì)這一問(wèn)題予以解答。
我們首先要明確,機(jī)器翻譯技術(shù)難以達(dá)到甚至超越人類(lèi)的翻譯能力?!皥D靈測(cè)試”為人工智能研究者測(cè)試機(jī)器是否智能提供了可行的工具,但是也同樣包含了3個(gè)未曾言明的內(nèi)在預(yù)設(shè):機(jī)器智能是對(duì)人類(lèi)智能的模擬;人類(lèi)智能是世界上最高的智能形態(tài);世界上只有一種智能形態(tài),就是人類(lèi)智能[23]。人工智能發(fā)展是在不斷探求并模仿人類(lèi)意識(shí)和本質(zhì)的過(guò)程,而“心智”謎題目前仍然有待破解。通過(guò)對(duì)機(jī)器翻譯面臨的“語(yǔ)義問(wèn)題”和“語(yǔ)境問(wèn)題”的分析我們可以看到,即使對(duì)當(dāng)前在研究思路、反映效率以及產(chǎn)出質(zhì)量等方面都有了很大的提高的神經(jīng)機(jī)器翻譯來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)只是在亞符號(hào)層面的對(duì)象進(jìn)行多層次加工,產(chǎn)出的結(jié)果依舊只是數(shù)學(xué)統(tǒng)計(jì)層面的呈現(xiàn),并未實(shí)現(xiàn)翻譯所需的語(yǔ)義知識(shí)、語(yǔ)用知識(shí)、普通常識(shí)和非語(yǔ)言知識(shí)層面上的突破[24],也就并不能如人類(lèi)一樣展現(xiàn)出語(yǔ)言意義方面的特征。而當(dāng)前一些媒體與科技公司出于自身利益的考量,往往夸大機(jī)器翻譯所取得的成果并鼓吹“人工譯員即將失業(yè)”,從而造成了普通民眾對(duì)于翻譯本質(zhì)和翻譯行業(yè)的錯(cuò)誤認(rèn)知。一些技術(shù)研發(fā)內(nèi)部人士的看法恰恰是對(duì)這種不切實(shí)際言論最強(qiáng)有力的回?fù)???刂普撎岢稣呔S納為韋弗信心滿(mǎn)滿(mǎn)的機(jī)器翻譯設(shè)想給出了負(fù)面的評(píng)價(jià):“說(shuō)實(shí)話,每一種語(yǔ)言在詞匯范圍上都十分模糊。而且語(yǔ)言的情感和言外之意若是以機(jī)器來(lái)進(jìn)行翻譯,似乎不甚樂(lè)觀?!盵25]歐洲機(jī)器翻譯協(xié)會(huì)主席哈欽斯也明確指出:“機(jī)器翻譯并沒(méi)有也不可能對(duì)職業(yè)翻譯產(chǎn)生威脅?!盵26]機(jī)器翻譯有其特定的使用范疇,如崔啟亮的研究就指出,以出版和審美欣賞為目的的文學(xué)類(lèi)文本和與信息檢索和實(shí)際使用為目的天氣預(yù)報(bào)等類(lèi)型文本分別居于人工翻譯與機(jī)器翻譯的兩端[27]。由此可見(jiàn),我們不能因?yàn)樵谙缕?、自?dòng)化等特定領(lǐng)域的出色表現(xiàn)就認(rèn)為“通用人工智能”或“強(qiáng)人工智能”已經(jīng)實(shí)現(xiàn),甚至相信超越人類(lèi)智能的“超人工智能”即將來(lái)臨。同樣不能只因?yàn)闄C(jī)器翻譯所展現(xiàn)出的“類(lèi)人工翻譯”結(jié)果,就認(rèn)為翻譯的難題已經(jīng)或即將被解決。
人工智能誕生的目的就是為了服務(wù)并促進(jìn)人類(lèi)的進(jìn)一步發(fā)展。由此,一些學(xué)者就指出,人工智能在概念上就存在歧義:我們當(dāng)前所做的工作并非是在再造智能,而是在增強(qiáng)智能(Augmented Intelligence,AI)[28]。正如德國(guó)技術(shù)哲學(xué)家卡普(Ernst Kapp)所提出的“人體器官投影說(shuō)”一樣,人工智能技術(shù)憑借其在計(jì)算和存儲(chǔ)方面的巨大優(yōu)勢(shì)彌補(bǔ)了人類(lèi)在生理層面上的不足,實(shí)現(xiàn)了人類(lèi)的增強(qiáng)。無(wú)論是對(duì)專(zhuān)業(yè)譯者還是普通用戶(hù)來(lái)說(shuō),機(jī)器翻譯都無(wú)疑已經(jīng)成為工作和溝通的強(qiáng)有力工具。面對(duì)當(dāng)前職業(yè)化翻譯工作中任務(wù)量大、交付時(shí)間緊的現(xiàn)狀,采用機(jī)器翻譯進(jìn)行初譯并輔以人工譯后編輯(Post-editing)的做法不僅能夠提升工作效率、保證翻譯質(zhì)量并實(shí)現(xiàn)語(yǔ)言資產(chǎn)的復(fù)用,同時(shí)還將譯者從繁重的、重復(fù)性的勞動(dòng)中得以解放。對(duì)普通用戶(hù)來(lái)說(shuō),雖然目前的機(jī)器翻譯譯文存在著一些問(wèn)題,但是在出國(guó)旅行、日常交流和應(yīng)急使用等場(chǎng)景下,諸如語(yǔ)音翻譯、圖片翻譯等機(jī)器翻譯新模式無(wú)疑降低了翻譯使用的門(mén)檻,實(shí)現(xiàn)了信息的實(shí)時(shí)獲取。正如胡開(kāi)寶和李翼所指出,機(jī)器翻譯與人工翻譯之前的關(guān)系并非對(duì)立,而是相輔相成、相互促進(jìn)[29]。
人工智能在發(fā)展的過(guò)程之中不斷吸收著來(lái)自計(jì)算機(jī)科學(xué)、控制論、心理學(xué)、語(yǔ)言學(xué)、認(rèn)知科學(xué)等眾多學(xué)科的最新成果。因此,機(jī)器翻譯的發(fā)展不能僅僅依靠工程領(lǐng)域的努力,而應(yīng)采取跨學(xué)科聯(lián)動(dòng)的方式促進(jìn)技術(shù)創(chuàng)新。從哲學(xué)角度來(lái)講,我們不難發(fā)現(xiàn)機(jī)器翻譯技術(shù)難以跨越的“語(yǔ)義問(wèn)題”和“語(yǔ)用問(wèn)題”正是人工智能面的意向性、框架性、語(yǔ)境化與日常認(rèn)識(shí)等哲學(xué)問(wèn)題的縮影[30]。哲學(xué)與人工智能之間并非敵對(duì)關(guān)系,兩個(gè)學(xué)科的聯(lián)手能夠相互指引,共同發(fā)展。來(lái)自分析哲學(xué)、現(xiàn)象學(xué)對(duì)于智能本質(zhì)的詰難不僅能夠?yàn)闄C(jī)器翻譯以及人工智能發(fā)展澄清問(wèn)題,同時(shí)還有助于技術(shù)研發(fā)者提煉新的研發(fā)視角并對(duì)已取得的成果進(jìn)行分析與批評(píng)。從語(yǔ)言學(xué)角度來(lái)講,語(yǔ)言學(xué)家與語(yǔ)言學(xué)理論不應(yīng)該被拒之門(mén)外。以語(yǔ)用學(xué)為例,這一理論更加注重人類(lèi)在具體的、真實(shí)的場(chǎng)景中如何使用語(yǔ)言以及如何傳達(dá)和獲取語(yǔ)言意義。將這一理論的引入機(jī)器翻譯研究將會(huì)有助于彌補(bǔ)當(dāng)前研發(fā)范式上的缺陷,通過(guò)模擬人類(lèi)利用語(yǔ)言的方式來(lái)克服現(xiàn)有系統(tǒng)中語(yǔ)言信息在歧義、模糊、不確定性等方面存在問(wèn)題,從而在有效地規(guī)避以往“規(guī)則路徑”和“統(tǒng)計(jì)路徑”中語(yǔ)言信息與語(yǔ)境脫離的缺憾,并有助于識(shí)別語(yǔ)言意向性,對(duì)自然語(yǔ)言處理以機(jī)器翻譯的跨越式發(fā)展無(wú)疑都具有重要的推動(dòng)作用。從認(rèn)知科學(xué)角度來(lái)講,我們需要借助最新的技術(shù)手段對(duì)人類(lèi)思維、語(yǔ)言生成等“黑匣”進(jìn)行探究。翻譯就是信息加工過(guò)程,因此,對(duì)于譯者翻譯過(guò)程的研究應(yīng)該聚焦于翻譯活動(dòng)的客觀描述,也就是譯者的腦內(nèi)思維活動(dòng)方面。除了以往機(jī)器翻譯開(kāi)發(fā)中所使用的技術(shù)之外,對(duì)翻譯文本的認(rèn)知、翻譯策略的選擇、文本的情感特質(zhì)以及文本的背景知識(shí)等也應(yīng)成為技術(shù)模型中的重要組成部分。只有通過(guò)哲學(xué)家們對(duì)技術(shù)發(fā)展框架上邏輯缺陷的分析,輔以語(yǔ)言學(xué)和認(rèn)知科學(xué)對(duì)人類(lèi)語(yǔ)言和人類(lèi)認(rèn)知活動(dòng)探求的最新成果,再結(jié)合計(jì)算機(jī)科學(xué)家對(duì)程序算法以及數(shù)據(jù)統(tǒng)計(jì)上的不斷改進(jìn),未來(lái)的機(jī)器翻譯技術(shù)才能夠取得實(shí)質(zhì)性的進(jìn)步。
機(jī)器翻譯作為一種技術(shù)手段,其研發(fā)不僅對(duì)人工智能學(xué)科的理論具有極強(qiáng)的指導(dǎo)價(jià)值,同樣在人類(lèi)的現(xiàn)實(shí)生活中也發(fā)揮著重要的實(shí)踐性作用。面對(duì)目前取得的階段性進(jìn)展,我們不能被沖昏頭腦,而需要透過(guò)現(xiàn)象對(duì)其本質(zhì)進(jìn)行分析。從表象上來(lái)看,機(jī)器翻譯存在的問(wèn)題似乎是由于工程學(xué)或語(yǔ)言學(xué)領(lǐng)域的不足所導(dǎo)致的。但是究其實(shí)質(zhì),這恰恰反映出了機(jī)器智能與人類(lèi)智能之間的差別。正如本文所指出的,機(jī)器翻譯技術(shù)若想取得突破性進(jìn)展,“語(yǔ)義”和“語(yǔ)用”是無(wú)法繞過(guò)且必須解決的兩大挑戰(zhàn)。由此可見(jiàn),在尚未實(shí)現(xiàn)“強(qiáng)人工智能”的當(dāng)下,距離“全自動(dòng)高質(zhì)量的機(jī)器翻譯”這一宏偉目標(biāo)的最終實(shí)現(xiàn)還有很長(zhǎng)的路要走。但我們同樣需要看到,雖然塞爾、德雷福斯和侯世達(dá)等哲學(xué)家對(duì)人工智能展開(kāi)了激烈的批判,但是他們所針對(duì)的只是技術(shù)研發(fā)范式中的邏輯缺陷,并非是從根本上否定人工智能的可能性與合理性。與此相同,本文的研究目的也在于強(qiáng)調(diào)我們需要在認(rèn)清造成機(jī)器翻譯技術(shù)困境內(nèi)在成因基礎(chǔ)上,明確機(jī)器翻譯的技術(shù)本質(zhì),并采取跨學(xué)科聯(lián)動(dòng)的方式進(jìn)行未來(lái)研發(fā),以期促進(jìn)機(jī)器翻譯技術(shù)取得長(zhǎng)足的發(fā)展。