国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器翻譯中引入“詞化”模式的初步設(shè)想

2017-03-12 00:25劉美平
文教資料 2017年11期
關(guān)鍵詞:語(yǔ)素語(yǔ)義框架

劉美平

(北京大學(xué) 哲學(xué)系,北京 100871)

機(jī)器翻譯中引入“詞化”模式的初步設(shè)想

劉美平

(北京大學(xué) 哲學(xué)系,北京 100871)

機(jī)器翻譯作為自然語(yǔ)言處理的重要分支領(lǐng)域,涉及語(yǔ)言、數(shù)學(xué)和計(jì)算機(jī)等學(xué)科。目前機(jī)器翻譯的譯文質(zhì)量并不理想,尤其是對(duì)漢語(yǔ)動(dòng)結(jié)式的處理。“詞化”模式理論或可用于改善漢語(yǔ)動(dòng)結(jié)式語(yǔ)義自動(dòng)分析,提高機(jī)器翻譯的質(zhì)量。本文就此提出一項(xiàng)初步解決方案。

機(jī)器翻譯 “詞化”模式 動(dòng)結(jié)式語(yǔ)義分析

當(dāng)前機(jī)器翻譯的譯文質(zhì)量還很難達(dá)到實(shí)際應(yīng)用的要求,有悲觀論調(diào)認(rèn)為幾十年內(nèi)都難有大的突破?!坝?jì)算機(jī)領(lǐng)域的人工智能、機(jī)器翻譯等都需要精準(zhǔn)的語(yǔ)言規(guī)律。要讓機(jī)器理解自然語(yǔ)言、模仿自然人思考,必須準(zhǔn)確揭示語(yǔ)言的運(yùn)作原理及相關(guān)的具體規(guī)律。目前這些領(lǐng)域的進(jìn)展尚不能盡如人意,其根源則在于語(yǔ)言研究的滯后,自然語(yǔ)言中的很多規(guī)律尚未搞清楚”(石毓智,2010)。其實(shí)問(wèn)題不僅在語(yǔ)言規(guī)律的探索,已有語(yǔ)言知識(shí)實(shí)用價(jià)值的轉(zhuǎn)化也亟待提高。本文將就“詞化”模式理論對(duì)提高漢譯英譯文質(zhì)量等問(wèn)題進(jìn)行探討。

一、“詞化”模式理論

“詞化”模式理論提出不同語(yǔ)言的動(dòng)詞所表達(dá)的事件信息存在差異,據(jù)此可進(jìn)行語(yǔ)言類型劃分。該理論把詞匯區(qū)分為開放與封閉兩大類,前者主要指動(dòng)詞、名詞和形容詞等實(shí)詞,其余都可歸入后者。封閉類詞匯主要用于構(gòu)建概念框架,實(shí)詞則為相應(yīng)的框架提供概念內(nèi)容。在表達(dá)運(yùn)動(dòng)事件時(shí),一些封閉詞類作為動(dòng)詞的衛(wèi)星語(yǔ)素起作用。英語(yǔ)中的衛(wèi)星語(yǔ)素是與動(dòng)詞詞根有姊妹關(guān)系的成分,但不包括做補(bǔ)語(yǔ)的名詞和介詞短語(yǔ),大致相當(dāng)于小品詞(verb particle)。這些詞在形式上與動(dòng)詞區(qū)別明顯(一般是副詞或動(dòng)詞前綴),比如:

He ran across\along\through\past\by.

The bolt must have unscrewed(from the plate).

漢語(yǔ)也有與動(dòng)詞相互配合的衛(wèi)星語(yǔ)素成分,如述補(bǔ)結(jié)構(gòu)中的補(bǔ)語(yǔ),常常是一類動(dòng)詞或者形容詞。例如:大風(fēng)吹垮了房子。其中“吹”作為表達(dá)運(yùn)動(dòng)的動(dòng)詞,另一動(dòng)詞“垮”充當(dāng)補(bǔ)語(yǔ)。英語(yǔ)衛(wèi)星語(yǔ)素多用于表達(dá)運(yùn)動(dòng)事件的路徑,通常表現(xiàn)為一個(gè)衛(wèi)星語(yǔ)素加介詞的組合,如:I ran out of the house.衛(wèi)星成分也可不依賴介詞單獨(dú)出現(xiàn),如:(After rifling through the house,)I ran out.當(dāng)然,有些語(yǔ)言通過(guò)動(dòng)詞表達(dá)路徑,比如:法語(yǔ)、西班牙語(yǔ)、日語(yǔ)等。

語(yǔ)言模式的劃分還與事件整合類型學(xué)相關(guān)。這一理論提出概念的深層組織與表層語(yǔ)言現(xiàn)象相對(duì),可分析成基本的事件復(fù)合體——“宏事件”(The Macro-event)。復(fù)合體中包括主事件和伴隨事件。前者在整個(gè)事件中起到框架設(shè)置的作用,因此被稱為“框架事件”(Framing Event)。伴隨事件指與框架事件相伴發(fā)生的事件。據(jù)框架事件的意義結(jié)構(gòu)可把“宏事件”分為五種類型:運(yùn)動(dòng)事件、狀態(tài)的改變、體相、行為相關(guān)及實(shí)現(xiàn)。分別示例簡(jiǎn)介如下:運(yùn)動(dòng)事件中的路徑:The ball rolled in./體相中的體:They talked on./狀態(tài)變化中的性質(zhì):The candle blew out./行為相關(guān)事件中的相互關(guān)系:She sang along./實(shí)現(xiàn)事件中的完成:The police hunted the fugitive down.事件的語(yǔ)義層面和語(yǔ)言形式表達(dá)都可以分析為多種獨(dú)立成分。意義層面包括運(yùn)動(dòng)、路徑、焦點(diǎn)和背景等;語(yǔ)言形式涉及動(dòng)詞、附置詞和衛(wèi)星語(yǔ)素等。兩個(gè)層面之間存在系統(tǒng)性對(duì)應(yīng),只不過(guò)并未在總體上展現(xiàn)出規(guī)整的一一對(duì)應(yīng),通常是一對(duì)多或者多對(duì)一的關(guān)系。根據(jù)對(duì)應(yīng)的具體情況便可以實(shí)現(xiàn)上述的語(yǔ)言類型劃分。

借助動(dòng)詞(可以是表達(dá)運(yùn)動(dòng)語(yǔ)義的動(dòng)詞,也可以是表達(dá)處所或者位置等的詞)描述的典型運(yùn)動(dòng)事件,其主事件(框架事件)在意義層面同樣可以分析出四種成分:焦點(diǎn):運(yùn)動(dòng)體;背景:焦點(diǎn)運(yùn)動(dòng)的參照體;路徑:焦點(diǎn)所經(jīng)過(guò)的路線或所占的地點(diǎn);運(yùn)動(dòng)。另外還包括與伴隨事件相關(guān)的非中心元素,分為以下兩種:方式:焦點(diǎn)運(yùn)動(dòng)的方式。使因:致使焦點(diǎn)產(chǎn)生運(yùn)動(dòng)。核心動(dòng)詞一般同時(shí)對(duì)運(yùn)動(dòng)主事件和伴隨事件進(jìn)行表征。伴隨事件則可以對(duì)運(yùn)動(dòng)主事件的方式、使因等給出附加描繪。因?yàn)橹魇录蚣苁录┲械穆窂教峁┝藢?duì)“宏事件”抽象框架的表征,從而被稱為框架事件的核心圖式(Core Schema)。其余的語(yǔ)義元素(焦點(diǎn)、運(yùn)動(dòng)、背景等)可以被填充入這一框架。核心圖式可通過(guò)動(dòng)詞表達(dá),也可通過(guò)衛(wèi)星語(yǔ)素,這直接導(dǎo)致“詞化”模式的差異。具體來(lái)說(shuō),動(dòng)詞表征的語(yǔ)義成分可以是運(yùn)動(dòng)+路徑,也可以是運(yùn)動(dòng)+方式或者運(yùn)動(dòng)+原因。比如在英語(yǔ)中:The bottlefloated out of the cave.其中動(dòng)詞float對(duì)運(yùn)動(dòng)和方式同時(shí)進(jìn)行了編碼:The bottle moved out of the cave with-the-manner-of The bottle floated.路徑通過(guò)衛(wèi)星語(yǔ)素與介詞的組合“out of”表達(dá)出來(lái)。與此相對(duì),西班牙語(yǔ)描述同樣的意義時(shí)其表層語(yǔ)言形式為:La botella salióde la cueva flotando.形式上對(duì)譯為英語(yǔ)為:The bottle exited from the cave,floating.動(dòng)詞exit編碼的是運(yùn)動(dòng)+路徑,方式則通過(guò)分詞形式floating表達(dá)出來(lái),并沒(méi)有被并入核心動(dòng)詞。上述西班牙語(yǔ)句在字面上對(duì)譯出的英語(yǔ)句子表現(xiàn)得明顯不自然,所以不屬于英語(yǔ)通常的表達(dá)方式。兩大語(yǔ)言類型(動(dòng)詞框架語(yǔ)言和衛(wèi)星語(yǔ)素框架語(yǔ)言)的區(qū)分正是基于這種差異,區(qū)分標(biāo)準(zhǔn)在于框架事件的核心圖式是由語(yǔ)句中的動(dòng)詞還是衛(wèi)星語(yǔ)素表達(dá)的。衛(wèi)星語(yǔ)素框架語(yǔ)言在使用動(dòng)詞表達(dá)框架事件的同時(shí)常常對(duì)伴隨事件加以描繪,而核心圖式一般通過(guò)其他衛(wèi)星語(yǔ)素表達(dá)。在這類語(yǔ)言中,通過(guò)分析動(dòng)詞的語(yǔ)義結(jié)構(gòu)就可以推出伴隨事件。這種語(yǔ)義推理示例如下:

方式類伴隨事件

Nonagentive(非施事性語(yǔ)句):The rope hung across the canyon from two hooks.=The rope was across the canyon withthe-manner-of The rope hung from two hooks.

Agentive(施事性語(yǔ)句):I bounced the keg into the storeroom.=I moved the keg into the storeroom with-the manner-of I bounced the keg.

使因類伴隨事件

Nonagentive:The napkin blew off the table.=The napkin moved off the table with-the-cause-of Something blew on the napkin.

Agentive:I kicked the keg into the storeroom.=I moved the keg into the storeroom with-the-cause-of I kicked the keg.

二、漢譯英問(wèn)題

基于句法規(guī)則的自然語(yǔ)言處理方案較為依賴規(guī)范性語(yǔ)言研究。但句法形式與語(yǔ)義結(jié)構(gòu)之間并不存在嚴(yán)格的同構(gòu)關(guān)系,詞匯意義的豐富性遠(yuǎn)大于包括詞匯形態(tài)在內(nèi)的表層語(yǔ)言形式。形式與意義在復(fù)雜性上的不對(duì)等直接導(dǎo)致同一句法形式可以表示差別極大的意義結(jié)構(gòu)。自然人之間實(shí)現(xiàn)復(fù)雜意義交互的基礎(chǔ)在于,每個(gè)自然人都通過(guò)“具身經(jīng)驗(yàn)”儲(chǔ)存了相對(duì)自足的關(guān)于詞匯的語(yǔ)義信息。上述句法和語(yǔ)義之間的對(duì)應(yīng)問(wèn)題不可能局限在形式領(lǐng)域內(nèi)部得到解決,這屬于一類在形式上不能自足的語(yǔ)言現(xiàn)象。這類語(yǔ)言知識(shí)的歸納整理工作量非常繁重,當(dāng)前主流的研究?jī)A向于使用統(tǒng)計(jì)方法。只不過(guò)統(tǒng)計(jì)研究說(shuō)到底還是需要基于特定的統(tǒng)計(jì)模型,由于統(tǒng)計(jì)模型必須由自然人基于語(yǔ)言知識(shí)構(gòu)建,最終還是繞不開語(yǔ)言知識(shí)的歸納整理?!耙远嗔x現(xiàn)象分析為例,從目前已經(jīng)開發(fā)的系統(tǒng)來(lái)看,大約50%到70%的多義語(yǔ)言現(xiàn)象可以通過(guò)單純的句法分析來(lái)解決,而其余30%的多義語(yǔ)言現(xiàn)象必須通過(guò)語(yǔ)義分析甚至語(yǔ)用分析才能解決……”(馮志偉,2012)。這類層級(jí)結(jié)構(gòu)通常是基于自然人往返交互的語(yǔ)言實(shí)踐并通過(guò)約定俗成產(chǎn)生的,既有認(rèn)知的理?yè)?jù)性,又無(wú)法排除實(shí)踐中的偶然因素,只能通過(guò)理清語(yǔ)言形式背后的認(rèn)知原理才可以解釋清楚。形式主義語(yǔ)言研究?jī)A向于由相對(duì)抽象的語(yǔ)言規(guī)則統(tǒng)攝具體的語(yǔ)言現(xiàn)象,在追求抽象規(guī)律時(shí)丟掉了太多具體意義,不能很好地解釋表層結(jié)構(gòu)與語(yǔ)義內(nèi)涵的對(duì)應(yīng)模式。語(yǔ)言習(xí)得研究表明,任何一個(gè)兒童都無(wú)法單獨(dú)依賴抽象語(yǔ)言模式掌握語(yǔ)法。兒童要掌握一種語(yǔ)言的語(yǔ)法結(jié)構(gòu),不僅要通過(guò)觀察現(xiàn)實(shí)中的事件結(jié)構(gòu),而且要在長(zhǎng)期的語(yǔ)言實(shí)踐中不斷積累才可以掌握大量約定俗成的搭配方式。這些具體搭配作為固定的語(yǔ)言單位儲(chǔ)存在語(yǔ)言使用者的記憶中,高度依賴隨機(jī)經(jīng)驗(yàn),不可能靠規(guī)則臨時(shí)產(chǎn)生?!吧蓪W(xué)派夸大了語(yǔ)言規(guī)律的能產(chǎn)性,而低估了語(yǔ)言中廣泛存在的約定俗成的用法,而且忽略了人們記憶的巨大潛力”(石毓智,2010)。我們認(rèn)為,通過(guò)將相關(guān)語(yǔ)言知識(shí)編輯成機(jī)器詞典的方式可以為機(jī)器注入“記憶”。

語(yǔ)言對(duì)于經(jīng)驗(yàn)的依賴性體現(xiàn)為:任何語(yǔ)言的語(yǔ)法結(jié)構(gòu)都不是無(wú)限能產(chǎn)的,特定語(yǔ)法結(jié)構(gòu)對(duì)于語(yǔ)言中同一類屬的詞匯有些可以很好地適配,有些則不可以。判斷可行與否的依據(jù)都需要在經(jīng)驗(yàn)中獲取。另外,由于不同語(yǔ)言表層形式的差異,包括“詞化”模式的差異,任何兩種語(yǔ)言之間都很難在詞匯層面實(shí)現(xiàn)一一對(duì)應(yīng)。比如:漢語(yǔ)中“哭啞”,如果將其視為一個(gè)整體的復(fù)合動(dòng)詞,在英語(yǔ)中就找不到可以直接對(duì)應(yīng)的單詞,必須通過(guò)“cry”和“hoarse”的組合才可以較為恰當(dāng)?shù)姆g。筆者嘗試了百度翻譯和google翻譯對(duì)“他哭啞了嗓子”這一語(yǔ)句的翻譯,最終得出的結(jié)果分別為“He cried and cried.”和“He cried hoarse.”兩者都不能很好地把漢語(yǔ)詞義恰當(dāng)?shù)胤g為英語(yǔ)?!八皢×松ぷ印钡姆g結(jié)果相對(duì)較為理想,都是“He shouted himself hoarse.”。究其原因:英語(yǔ)中有一個(gè)和漢語(yǔ)“喊啞”基本對(duì)應(yīng)的慣用語(yǔ)“shout oneself hoarse”,實(shí)現(xiàn)了詞匯層面的直接對(duì)應(yīng),互譯中才表現(xiàn)出高度的切合。所以,當(dāng)前的機(jī)器翻譯在很大程度上仍然依賴不同語(yǔ)言詞匯層面的直接對(duì)應(yīng)。漢英兩種語(yǔ)言在“詞化”模式上又存在較大差別,很難實(shí)現(xiàn)詞匯層面的直接匹配,這便是當(dāng)前機(jī)翻譯文的質(zhì)量不高的一個(gè)主要原因。語(yǔ)言表層形式的差異體現(xiàn)的是語(yǔ)言使用群體深層概念化模式的差異,概念化模式正是認(rèn)知語(yǔ)義學(xué)的核心議題。從認(rèn)知語(yǔ)義學(xué)角度展開的漢語(yǔ)研究已經(jīng)持續(xù)了數(shù)十年,目前已有的很多理論成果對(duì)工程領(lǐng)域的技術(shù)提高而言可資借鑒之處頗多。

三、處理方案

機(jī)器翻譯漢譯英一旦遇到動(dòng)結(jié)式,往往就會(huì)生成一些莫名其妙的英語(yǔ)結(jié)構(gòu),可見當(dāng)前的處理方案還不能恰當(dāng)?shù)胤治鰟?dòng)結(jié)式的復(fù)雜語(yǔ)義結(jié)構(gòu)。語(yǔ)言學(xué)領(lǐng)域并不缺少對(duì)動(dòng)結(jié)式語(yǔ)義結(jié)構(gòu)的研究,只是還未能被工程領(lǐng)域充分吸收利用。為達(dá)成對(duì)動(dòng)結(jié)式語(yǔ)義結(jié)構(gòu)的自動(dòng)分析,從述語(yǔ)動(dòng)詞意義和補(bǔ)語(yǔ)意義整合來(lái)的動(dòng)結(jié)式整體的意義必須得到精確的描述,并通過(guò)形式化的方式表達(dá),最終才能實(shí)現(xiàn)句法層面的機(jī)器操作?!霸~項(xiàng)”的語(yǔ)義可以簡(jiǎn)單也可以復(fù)雜,由于語(yǔ)義的組合性,“復(fù)雜詞項(xiàng)”的意義結(jié)構(gòu)通常都可以分解成“簡(jiǎn)單詞項(xiàng)”意義結(jié)構(gòu)的特定組合。動(dòng)結(jié)式的意義結(jié)構(gòu)就是如此,通過(guò)分解可實(shí)現(xiàn)與底層述語(yǔ)和補(bǔ)語(yǔ)動(dòng)詞意義結(jié)構(gòu)的對(duì)應(yīng)。

動(dòng)結(jié)式表達(dá)的“致役事件”通常包含參與者、事件發(fā)生的方式及造成的結(jié)果等語(yǔ)義信息。“在漢語(yǔ)復(fù)合動(dòng)詞的構(gòu)造中,動(dòng)作的方式或達(dá)到某一結(jié)果的途徑和動(dòng)作的結(jié)果是比較凸顯的語(yǔ)義因素。漢語(yǔ)復(fù)合動(dòng)詞的優(yōu)勢(shì)語(yǔ)義模式可以概括為:方式或途徑+行為或結(jié)果”(董秀芳,2005)。上述概括可更詳細(xì)地表述為:方式+行為、途徑+結(jié)果,分別對(duì)應(yīng)狀中式復(fù)合詞和動(dòng)結(jié)式復(fù)合詞。就動(dòng)結(jié)式來(lái)看,述語(yǔ)動(dòng)詞一般表示達(dá)成結(jié)果的途徑。 如:“撞開”、“踢開”、“撬開”、“推開”,結(jié)果動(dòng)詞“開”前的述語(yǔ)動(dòng)詞就表達(dá)了達(dá)成這一結(jié)果的途徑,或者說(shuō)原因;補(bǔ)語(yǔ)動(dòng)詞則表達(dá)引發(fā)的結(jié)果,如:“開”。事實(shí)上,因?yàn)閯?dòng)結(jié)式的存在,整個(gè)漢語(yǔ)系統(tǒng)對(duì)信息的組織都表現(xiàn)為非 “伴隨特征+謂語(yǔ)中心+結(jié)果狀態(tài)”這一總體模式。由于不同語(yǔ)言之間簡(jiǎn)單句法結(jié)構(gòu)存在共性的可能性更大,更容易實(shí)現(xiàn)異種語(yǔ)言之間的詞匯直接匹配,更容易達(dá)到更高程度的互譯準(zhǔn)確度。以“撞開”、“踢開”、“推開”為例,百度翻譯中可得出如下結(jié)果:1.他撞開了門?!鶫e broke the door./2.他踢開了門?!鶫e kicked the door open./3.他撬開了門?!鶫e opened the door./4.他推開了門?!鶫e pushed the door open.語(yǔ)句1與3翻譯效果很不理想,1譯文直接在意義上無(wú)法對(duì)應(yīng),而3則未能把相關(guān)的動(dòng)作方式體現(xiàn)出來(lái)。語(yǔ)句2、4翻譯較為恰當(dāng),因?yàn)樵谟⒄Z(yǔ)中kick…open和push…open屬于比較通用的組合用法,可歸入慣用語(yǔ),實(shí)現(xiàn)了語(yǔ)言表層的直接對(duì)應(yīng)。對(duì)語(yǔ)句1可進(jìn)行以下語(yǔ)義分析處理:他撞開了門。→他撞門,門開了。“他撞門?!苯?jīng)百度翻譯得到結(jié)果:He knocked the door.“門開了?!苯?jīng)百度翻譯得到結(jié)果:The door opened。兩條獨(dú)立的翻譯經(jīng)過(guò)句法組合操作可表述為:He knocked the door so the door opened.經(jīng)過(guò)上述處理意義上的對(duì)應(yīng)顯然更恰當(dāng)。對(duì)語(yǔ)句3也可做類似的處理。這種可以落實(shí)到句法層面的語(yǔ)義分析正是當(dāng)前機(jī)器翻譯所急需的。通過(guò)將這類語(yǔ)言規(guī)則編輯成機(jī)器詞典以知識(shí)庫(kù)的形式整合進(jìn)智能系統(tǒng),并保持這類知識(shí)庫(kù)的開放狀態(tài),不斷擴(kuò)充與優(yōu)化,再與其他方法配合,機(jī)器翻譯生成的譯文甚至可以擁有自然語(yǔ)句的質(zhì)量。

[1]Talmy,Leonard.Toward a Cognitive Semantics[M]. Massachnsetts:MIT Press,2000.

[2]闞哲華.漢語(yǔ)位移事件詞匯化的語(yǔ)言類型探究[J].當(dāng)代語(yǔ)言學(xué),2010(2).

[3]董秀芳.漢語(yǔ)的詞庫(kù)與詞法[M].北京:北京大學(xué)出版社,2005.

[4]馮志偉.自然語(yǔ)言處理簡(jiǎn)明教程[M].上海:上海外語(yǔ)教育出版社,2012.

[5]石毓智.漢語(yǔ)語(yǔ)法[M].北京:商務(wù)印書館,2010.

猜你喜歡
語(yǔ)素語(yǔ)義框架
《最低入門等級(jí)音節(jié)、漢字、詞匯表》語(yǔ)素和語(yǔ)素義分析
多義語(yǔ)素識(shí)別及教學(xué)探討
——針對(duì)對(duì)外漢語(yǔ)語(yǔ)素教學(xué)構(gòu)想
廣義框架的不相交性
語(yǔ)言與語(yǔ)義
語(yǔ)素的判定、分類及語(yǔ)法單位關(guān)系研究述評(píng)
因果復(fù)合詞
WTO框架下
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
一種基于OpenStack的云應(yīng)用開發(fā)框架
認(rèn)知范疇模糊與語(yǔ)義模糊