国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

俄漢文學(xué)翻譯語(yǔ)料庫(kù)的創(chuàng)建*
——基于契訶夫小說(shuō)平行語(yǔ)料庫(kù)的設(shè)計(jì)與建構(gòu)

2016-10-26 02:29:53
外語(yǔ)學(xué)刊 2016年1期
關(guān)鍵詞:契訶夫俄語(yǔ)譯本

劉 淼 邵 青

(北京第二外國(guó)語(yǔ)學(xué)院,北京 100024/北京大學(xué),北京 100871;中央電視臺(tái)網(wǎng)絡(luò)傳播中心,北京 100048)

俄漢文學(xué)翻譯語(yǔ)料庫(kù)的創(chuàng)建*
——基于契訶夫小說(shuō)平行語(yǔ)料庫(kù)的設(shè)計(jì)與建構(gòu)

劉 淼 邵 青

(北京第二外國(guó)語(yǔ)學(xué)院,北京 100024/北京大學(xué),北京 100871;中央電視臺(tái)網(wǎng)絡(luò)傳播中心,北京 100048)

基于契訶夫短篇小說(shuō)創(chuàng)建的俄漢文學(xué)翻譯語(yǔ)料庫(kù)是一個(gè)以俄語(yǔ)經(jīng)典文學(xué)作品及其中文譯本為語(yǔ)料的雙語(yǔ)平行語(yǔ)料庫(kù)。創(chuàng)建本語(yǔ)料庫(kù)的主要環(huán)節(jié)包括語(yǔ)料文本的選擇與加工、語(yǔ)句屬性的確定與標(biāo)注、搜索功能的支持與擴(kuò)展以及用戶(hù)體驗(yàn)的設(shè)計(jì)與維護(hù)。創(chuàng)建本語(yǔ)料庫(kù)的重要思想之一是用互聯(lián)網(wǎng)平臺(tái)進(jìn)行語(yǔ)料庫(kù)的存儲(chǔ)與運(yùn)行,使大眾用戶(hù)能夠充分利用互聯(lián)網(wǎng)平臺(tái)完成數(shù)據(jù)共享與研究交流。

俄漢平行翻譯語(yǔ)料庫(kù);語(yǔ)料庫(kù)的創(chuàng)建;契訶夫短篇小說(shuō)

1 引言

語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展已有五十多年的歷史,已經(jīng)成為一門(mén)較為成熟、成果豐富的前沿?zé)狳c(diǎn)學(xué)科。推動(dòng)語(yǔ)料庫(kù)語(yǔ)言學(xué)發(fā)展的重要因素之一是語(yǔ)料庫(kù)的開(kāi)發(fā)與研制,持續(xù)建設(shè)各種不同類(lèi)別、不同用途的語(yǔ)料庫(kù)是語(yǔ)料庫(kù)語(yǔ)言學(xué)發(fā)展的動(dòng)力源頭。

我國(guó)俄語(yǔ)界的語(yǔ)料庫(kù)語(yǔ)言學(xué)研究起步較晚,已有的成果主要分為4類(lèi):一是探討語(yǔ)料庫(kù)創(chuàng)建過(guò)程中的具體環(huán)節(jié),如標(biāo)注俄語(yǔ)語(yǔ)料的原則與方法;二是依托俄羅斯國(guó)家語(yǔ)料庫(kù)的相關(guān)研究成果,主要包括語(yǔ)法研究與語(yǔ)料標(biāo)注研究(陳虹 2012,李紹哲 2012);三是自建俄語(yǔ)單語(yǔ)語(yǔ)料庫(kù),使用相關(guān)軟件從詞頻、關(guān)鍵詞和詞匯搭配等角度分析總結(jié)語(yǔ)料庫(kù)的相關(guān)數(shù)據(jù)(張祿彭 張超靜 2012);四是自建俄漢平行語(yǔ)料庫(kù),進(jìn)行雙語(yǔ)對(duì)比研究(崔衛(wèi) 2014)??偟膩?lái)說(shuō),基于俄語(yǔ)單語(yǔ)語(yǔ)料庫(kù)的研究成果相對(duì)較多,而俄漢雙語(yǔ)語(yǔ)料庫(kù)的研制與應(yīng)用鮮有學(xué)者涉及。然而,雙語(yǔ)語(yǔ)料庫(kù)較單語(yǔ)語(yǔ)料庫(kù)有更廣泛的應(yīng)用空間,如翻譯研究、翻譯教學(xué)、對(duì)比語(yǔ)言學(xué)、雙語(yǔ)詞典編撰與翻譯軟件開(kāi)發(fā)等領(lǐng)域。本文將創(chuàng)建俄漢平行語(yǔ)料庫(kù)作為研究目標(biāo),探討基于契訶夫小說(shuō)及其3個(gè)中文譯本的俄漢文學(xué)翻譯語(yǔ)料庫(kù)的創(chuàng)建以及互聯(lián)網(wǎng)模式下語(yǔ)料庫(kù)應(yīng)用平臺(tái)的搭建與運(yùn)行。

2 基于契訶夫小說(shuō)的俄漢文學(xué)翻譯語(yǔ)料庫(kù)的創(chuàng)建

2.1 語(yǔ)料庫(kù)的創(chuàng)建目的與應(yīng)用價(jià)值

基于契訶夫小說(shuō)的俄漢文學(xué)翻譯語(yǔ)料庫(kù)是一個(gè)以經(jīng)典文學(xué)作品及其譯本為語(yǔ)料、通過(guò)互聯(lián)網(wǎng)平臺(tái)的形式對(duì)源語(yǔ)與譯文進(jìn)行再現(xiàn)的平行語(yǔ)料庫(kù),文學(xué)翻譯語(yǔ)料庫(kù)的特點(diǎn)在于其語(yǔ)料的經(jīng)典與準(zhǔn)確。文學(xué)大師創(chuàng)造的經(jīng)典文學(xué)作品是民族智慧的結(jié)晶,它使民族語(yǔ)言得到完好的保存與高度的凝練。同時(shí),原著的經(jīng)典譯本也是外國(guó)文學(xué)研究的熱點(diǎn)之一。同一部經(jīng)典作品往往有多個(gè)版本的譯文,將原著與多個(gè)譯本聯(lián)系在一起,進(jìn)行原著與譯本、譯本與譯本間的對(duì)比研究,符合現(xiàn)代翻譯學(xué)、現(xiàn)代語(yǔ)言學(xué)重視言語(yǔ)、對(duì)語(yǔ)言進(jìn)行描寫(xiě)式研究的發(fā)展趨勢(shì)。而計(jì)算機(jī)技術(shù)的發(fā)展使原著及多個(gè)譯本語(yǔ)料的搜集、存儲(chǔ)、標(biāo)注、搜索及統(tǒng)計(jì)成為可能;互聯(lián)網(wǎng)技術(shù)的發(fā)展為多用戶(hù)在線(xiàn)訪(fǎng)問(wèn)、發(fā)表評(píng)論及用戶(hù)交流提供保障。

基于契訶夫小說(shuō)及其3個(gè)中譯本創(chuàng)建的俄漢文學(xué)翻譯語(yǔ)料庫(kù)能夠幫助研究者在掌握大量真實(shí)語(yǔ)料的基礎(chǔ)上將定性研究與定量研究結(jié)合起來(lái),從而更好地輔助翻譯教學(xué)與翻譯研究。

語(yǔ)料的選取是俄漢文學(xué)翻譯語(yǔ)料庫(kù)創(chuàng)建的第一個(gè)重要環(huán)節(jié)。在確定作家和具體文學(xué)作品時(shí),須要考慮作家的知名度、譯本的多樣化、作品內(nèi)容的代表性、語(yǔ)言的規(guī)范性以及語(yǔ)言現(xiàn)象的豐富程度等因素。契訶夫是俄羅斯文學(xué)巨匠,其作品語(yǔ)言以精練準(zhǔn)確見(jiàn)長(zhǎng)。他的作品被中國(guó)讀者廣泛熟知,且中文譯本較多,便于進(jìn)行翻譯文本的平行對(duì)比?;谄踉X夫小說(shuō)的俄漢文學(xué)翻譯語(yǔ)料庫(kù)共收錄他的7部短篇小說(shuō)《Аннанашее》,《Ванька》,《Смертьчиновника》,《Толстый и тонкий》,《Хамелеон》,《Человек в футляре》,《Крыжовник》和1部中篇小說(shuō)《Палата № 6》. 這些作品的原文出自1983-1986年間俄羅斯科學(xué)出版社出版發(fā)行的30卷本《契訶夫作品全集》;中文譯本選擇汝龍(《契訶夫小說(shuō)全集》,上海譯文出版社, 2000)、沈念駒(《契訶夫短篇小說(shuō)精選》,浙江少年兒童出版社, 2009)和馮加(《契訶夫中短篇小說(shuō)集》,譯林出版社, 2011)的翻譯作品。

2.3 語(yǔ)料的加工

語(yǔ)料加工的質(zhì)量決定語(yǔ)料庫(kù)數(shù)據(jù)的可靠性,所有數(shù)據(jù)必須經(jīng)過(guò)初步處理后方可錄入計(jì)算機(jī)。語(yǔ)料文本的處理主要分以下幾個(gè)步驟:(1)語(yǔ)料采集。隨著信息技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)上已能搜索到契訶夫短篇小說(shuō)作品的俄語(yǔ)和漢語(yǔ)文本。課題組下載電子版后與紙質(zhì)版原文仔細(xì)校對(duì),經(jīng)過(guò)整理后分別保存為格式統(tǒng)一的txt文檔。(2)文本處理。為方便電腦讀取和顯示,須要對(duì)文本格式進(jìn)行統(tǒng)一化處理:俄語(yǔ)文本使用半角標(biāo)點(diǎn)符號(hào),漢語(yǔ)文本使用全角標(biāo)點(diǎn)符號(hào),每個(gè)自然段段首不保留空格,段與段之間不保留空行。(3)段落劃分。由于俄漢語(yǔ)言的差異,加之譯者的個(gè)人因素,有些譯文的段落分布并未與原文保持一致??紤]到語(yǔ)料平行對(duì)比的需要,課題組以俄語(yǔ)原文的章節(jié)、段落劃分為基準(zhǔn),相應(yīng)的漢語(yǔ)文本按照原文段落進(jìn)行調(diào)整。同一段俄語(yǔ)原文及其3個(gè)譯本為1組段落,每組段落均賦予1個(gè)獨(dú)立的Paragraph ID,便于數(shù)據(jù)索引。(4)語(yǔ)句對(duì)齊。語(yǔ)句層面同樣以俄語(yǔ)為基準(zhǔn),將漢語(yǔ)文本與原文一一對(duì)應(yīng)。由于在文學(xué)作品的譯文中經(jīng)常出現(xiàn)語(yǔ)序的調(diào)整,故這一步驟暫由人工完成,而新聞、科技等其他語(yǔ)體可使用SDL Trados(www.trados.com)內(nèi)置的WinAlign等工具自動(dòng)進(jìn)行,完成后須要進(jìn)行人工校正。同1句俄語(yǔ)原文及其3個(gè)譯本為1組語(yǔ)句,每組語(yǔ)句均賦予1個(gè)獨(dú)立的Sentence ID,并且與其所屬段落的Paragraph ID相對(duì)應(yīng),這便于定位數(shù)據(jù),使語(yǔ)料庫(kù)各組成部分間存在明確的層次結(jié)構(gòu)。(5)數(shù)據(jù)導(dǎo)入。先前步驟已完成句子層面的初步處理,為便于計(jì)算機(jī)存儲(chǔ)和管理這些數(shù)據(jù),需將每1組已對(duì)齊的語(yǔ)句及對(duì)應(yīng)ID制作成1條記錄,生成xml格式的數(shù)據(jù)表,并導(dǎo)入SQL數(shù)據(jù)庫(kù)。

2.4 語(yǔ)料屬性標(biāo)注

標(biāo)注指以統(tǒng)一的標(biāo)準(zhǔn)來(lái)標(biāo)示語(yǔ)料文本所具有的特征,并將數(shù)據(jù)用二維表結(jié)構(gòu)進(jìn)行邏輯表達(dá),使信息的性質(zhì)和量值出現(xiàn)在固定的位置,實(shí)現(xiàn)數(shù)據(jù)的結(jié)構(gòu)化,以便根據(jù)特定條件篩選出符合相應(yīng)需求的語(yǔ)料。語(yǔ)料庫(kù)不僅僅是原始語(yǔ)料的集合,而且是有結(jié)構(gòu)的、標(biāo)注語(yǔ)法、語(yǔ)義、語(yǔ)音、語(yǔ)用等語(yǔ)言信息的語(yǔ)料的集合,這是語(yǔ)料庫(kù)區(qū)別于一般的文本數(shù)據(jù)庫(kù)的重要標(biāo)志(何婷婷 2003:14)。例如,俄羅斯國(guó)家語(yǔ)料庫(kù)設(shè)置被搜索詞句的“詞匯-語(yǔ)法特征”篩選功能,從語(yǔ)法特征、語(yǔ)義特征、補(bǔ)充特征、詞組特征等角度設(shè)置一百二十多個(gè)屬性選項(xiàng);又如北京大學(xué)的《人民日?qǐng)?bào)》標(biāo)注語(yǔ)料庫(kù),從26個(gè)基本詞類(lèi)、專(zhuān)有名詞和語(yǔ)言學(xué)角度對(duì)所有的語(yǔ)料進(jìn)行多達(dá)四十余項(xiàng)的標(biāo)記,幫助用戶(hù)精確定位所需信息。

在對(duì)語(yǔ)料進(jìn)行屬性標(biāo)注前,首先須要標(biāo)注語(yǔ)料庫(kù)對(duì)象文本的元數(shù)據(jù),即描述數(shù)據(jù)及其環(huán)境數(shù)據(jù),包括語(yǔ)言、版本、作者、出版信息等。為便于從原文及各個(gè)譯本中篩選出含有一定特征的語(yǔ)句加以研究,錄入語(yǔ)句的同時(shí)還要定義其獨(dú)有的屬性字段,即語(yǔ)句屬性的標(biāo)注,據(jù)此可在語(yǔ)料庫(kù)中進(jìn)行更詳細(xì)的搜索。俄漢翻譯語(yǔ)料庫(kù)檢索所需的標(biāo)注屬性劃分尚無(wú)現(xiàn)成案例可以套用,如果要達(dá)到一定的精準(zhǔn)度和可信度,需要有一套相對(duì)科學(xué)嚴(yán)謹(jǐn)?shù)膶傩詷?biāo)準(zhǔn)。根據(jù)俄譯漢教學(xué)與翻譯研究的需要,課題組對(duì)原文及譯文進(jìn)行3個(gè)層面的人工屬性標(biāo)注,即“語(yǔ)法范疇”、“修辭范疇”和“翻譯技巧”。其中,語(yǔ)法范疇指原文自身的語(yǔ)法屬性,包括“單部句類(lèi)型”與“動(dòng)詞非變位形式”;修辭范疇分為原文修辭與譯文修辭兩部分,其中原文修辭主要包括俗語(yǔ)、習(xí)語(yǔ)、諺語(yǔ)、成語(yǔ)、詞匯情感色彩后綴、人名稱(chēng)謂、比喻和借代;譯文修辭包括四字格、正反義詞、疊詞與象聲詞;翻譯技巧主要包括增譯、減譯、成分改變、斷句與合句。

人工標(biāo)注的優(yōu)勢(shì)在于能夠完成機(jī)器無(wú)法識(shí)別的一些屬性標(biāo)注,可以為研究者提供更有針對(duì)性的屬性檢索與面向某一具體屬性的定量研究材料。如原句語(yǔ)法屬性的標(biāo)注能夠幫助使用者便捷地一鍵搜索到所有帶有相關(guān)屬性的句子,大大節(jié)省閱讀與記錄的時(shí)間,同時(shí)又能查看不同譯本的翻譯方案與翻譯策略;而翻譯技巧的屬性標(biāo)注則顯示譯者對(duì)原文的不同處理方式,能夠有效地保障多譯本模式下不同譯者翻譯風(fēng)格的定量與定性研究。

在這樣的學(xué)術(shù)背景下,上海交通大學(xué)劉華文教授《翻譯詩(shī)學(xué)》一書(shū)的出版無(wú)疑是及時(shí)而可貴的。正如顧明棟(2015:vii)教授在該書(shū)序中所說(shuō),該書(shū)“精當(dāng)?shù)貙⒎g和詩(shī)學(xué)、中西哲學(xué)和美學(xué)、中西文論和語(yǔ)言理論、中國(guó)譯學(xué)史料和翻譯實(shí)踐相結(jié)合,已初步構(gòu)建成一個(gè)學(xué)貫中西、打通古今、理論聯(lián)系實(shí)踐的體大思精之作,可以說(shuō)是迄今為止最好的一部中國(guó)翻譯詩(shī)學(xué)。”

然而,人工屬性標(biāo)注的不足之處也是顯而易見(jiàn)的。這種標(biāo)注方式耗時(shí)長(zhǎng),需要大量人力資源的保障。因很難快速處理海量文本,所以其準(zhǔn)確性難免受到標(biāo)注人自身知識(shí)水平的限制。但由于目前俄文信息處理技術(shù)的限制,俄語(yǔ)語(yǔ)句屬性的自動(dòng)標(biāo)注在實(shí)際操作中不易實(shí)現(xiàn),語(yǔ)料的整理標(biāo)注工作十分艱辛,大量的手工操作必不可少。為了保證標(biāo)注的準(zhǔn)確統(tǒng)一,課題組定期檢查標(biāo)注錯(cuò)誤并及時(shí)糾正,力求使錯(cuò)誤發(fā)生的概率降到最低。

2.5 語(yǔ)料庫(kù)檢索功能開(kāi)發(fā)

語(yǔ)料的檢索是語(yǔ)料庫(kù)面對(duì)用戶(hù)最重要的核心功能之一。而俄語(yǔ)詞匯具有變化繁雜、詞形眾多的特點(diǎn),如只對(duì)一種詞形進(jìn)行搜索,則須要進(jìn)行多次操作才能獲得較為全面的信息;若通過(guò)模糊搜索等方法擴(kuò)大檢索范圍,得到的結(jié)果往往包含大量不需要的信息。對(duì)此,課題組深入研究,刻苦攻關(guān),研發(fā)出包含俄語(yǔ)基本詞匯所有詞形變化的語(yǔ)料檢索功能。

契訶夫小說(shuō)俄漢文學(xué)翻譯語(yǔ)料庫(kù)檢索功能的開(kāi)發(fā)是基于А. А. Зализняк主編的《俄語(yǔ)語(yǔ)法詞典》。這是一本俄語(yǔ)詞形變化詞典,全書(shū)共收錄詞條10萬(wàn)余個(gè),詳盡地給出這些俄語(yǔ)詞匯可能發(fā)生的所有變化方式,并列舉和分類(lèi),歸納成索引符號(hào)。該詞典的電子化版本奠定眾多計(jì)算機(jī)運(yùn)行俄語(yǔ)程序的基礎(chǔ),涵蓋拼寫(xiě)檢查、搜索引擎、機(jī)器翻譯等諸多領(lǐng)域,為俄語(yǔ)國(guó)家的現(xiàn)代化建設(shè)做出重要貢獻(xiàn)。通過(guò)《俄語(yǔ)語(yǔ)法詞典》所列的詞形變化,課題組歸納出俄語(yǔ)基本詞匯形變的具體算法,結(jié)合詞典中提供的特例,利用計(jì)算機(jī)根據(jù)詞條自動(dòng)處理,整理出常用俄語(yǔ)詞匯的詞形列表。

搜索功能的運(yùn)行流程可分為輸入、回溯、檢索和輸出4個(gè)步驟。假設(shè)其中1個(gè)俄語(yǔ)單詞的原形為A,其所有變化形式為A1, A2, A3…An,搜索時(shí)輸入的關(guān)鍵詞為Ax,那么程序就會(huì)將關(guān)鍵詞與詞形變化列表進(jìn)行比對(duì),據(jù)此判斷出Ax屬于A(yíng)1~An中的一項(xiàng),再逐個(gè)對(duì)A1~An進(jìn)行搜索,最終向用戶(hù)返回完整的搜索結(jié)果。例如,A為單詞原形человек,A1, A2, A3...An則為其所有可能出現(xiàn)的變化形式:человек, человека, человеку, человеком, человеке, люди, людей, людям, людьми, людях. 當(dāng)用戶(hù)輸入的關(guān)鍵詞Ax為человек時(shí),程序?qū)⑴卸ǔ鲈撛~屬于集合{человек, человека, ..., людях},并分別以человек, человека, ..., людях作為關(guān)鍵詞檢索,并整合查找到的結(jié)果,最終反饋給用戶(hù)的結(jié)果如下:

圖1 俄漢文學(xué)翻譯語(yǔ)料庫(kù)對(duì)человек搜索的結(jié)果(部分)

2.6 語(yǔ)料庫(kù)存儲(chǔ)和使用平臺(tái)的構(gòu)建

當(dāng)前,國(guó)內(nèi)俄漢翻譯平行語(yǔ)料庫(kù)建設(shè)已實(shí)現(xiàn)語(yǔ)料在本地?cái)?shù)據(jù)庫(kù)的存儲(chǔ),并開(kāi)發(fā)了相應(yīng)的語(yǔ)料處理工具和管理系統(tǒng)。這些方法已經(jīng)可以滿(mǎn)足較為初步的基于俄漢對(duì)照的翻譯教學(xué)與研究,但仍存在兩個(gè)問(wèn)題:(1)數(shù)據(jù)未能存儲(chǔ)在云端,且缺少開(kāi)放的外部用戶(hù)界面,本地域之外使用較為不便,移動(dòng)性不強(qiáng);(2)依賴(lài)管理系統(tǒng)應(yīng)用程序,僅能在特定操作系統(tǒng)運(yùn)行,迭代開(kāi)發(fā)較為繁瑣,兼容性不強(qiáng)。為滿(mǎn)足不同的教學(xué)和研究需要,課題組經(jīng)過(guò)廣泛調(diào)研和深入分析,提出具有普適性的語(yǔ)料庫(kù)平臺(tái)基本框架,以便在線(xiàn)進(jìn)行內(nèi)容管理和數(shù)據(jù)檢索。

該平臺(tái)不同于傳統(tǒng)語(yǔ)料庫(kù)的Client/Server結(jié)構(gòu)(客戶(hù)端/服務(wù)器模式),它采用Browser/Server結(jié)構(gòu)(瀏覽器/服務(wù)器模式)將系統(tǒng)功能實(shí)現(xiàn)的核心部分集中到服務(wù)器上,簡(jiǎn)化系統(tǒng)的開(kāi)發(fā)、維護(hù)和使用;采用的MySQL關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)具有體積小、速度快的特點(diǎn),并可以通過(guò)索引功能加快數(shù)據(jù)檢索操作;編程語(yǔ)言采用Java,可在所有平臺(tái)的任意環(huán)境中開(kāi)發(fā)、部署、擴(kuò)展;運(yùn)行環(huán)境為輕量級(jí)應(yīng)用服務(wù)器Tomcat,適合語(yǔ)料庫(kù)這類(lèi)中小型系統(tǒng)和并發(fā)訪(fǎng)問(wèn)用戶(hù)較少的場(chǎng)合,運(yùn)行時(shí)占用的系統(tǒng)資源小,擴(kuò)展性較強(qiáng)。該平臺(tái)具有以下優(yōu)勢(shì):(1)使用方便,隨時(shí)隨地均可進(jìn)行語(yǔ)料檢索;(2)兼容性強(qiáng),在Windows,Linux,Mac OS等各種操作系統(tǒng)上均可正常使用;(3)類(lèi)型開(kāi)放,可建設(shè)多語(yǔ)種、多語(yǔ)體、多版本、多種標(biāo)注屬性的平行語(yǔ)料庫(kù);(4)易于維護(hù),可任意增刪語(yǔ)料庫(kù)或語(yǔ)料數(shù)據(jù),技術(shù)升級(jí)和版本迭代更為簡(jiǎn)便;(5)程序輕量,可流暢運(yùn)行;(6)免去安裝,可直接使用。

目前,契訶夫小說(shuō)俄漢文學(xué)翻譯語(yǔ)料庫(kù)的后臺(tái)管理和前臺(tái)檢索系統(tǒng)已基本完成開(kāi)發(fā),錄入數(shù)據(jù)7116條,總計(jì)78萬(wàn)余字,并通過(guò)相關(guān)備案手續(xù)(京ICP備12033280號(hào))進(jìn)入試運(yùn)行階段,網(wǎng)址為http://www.rucorpus.cn/,高級(jí)搜索界面和搜索結(jié)果界面如下:

圖2 俄漢文學(xué)翻譯語(yǔ)料庫(kù)檢索系統(tǒng)高級(jí)搜索界面

圖3 俄漢文學(xué)翻譯語(yǔ)料庫(kù)檢索系統(tǒng)搜索結(jié)果詳情頁(yè)

在語(yǔ)料庫(kù)系統(tǒng)層級(jí)結(jié)構(gòu)方面,該語(yǔ)料庫(kù)可按照語(yǔ)體劃為不同的類(lèi)別,同一分類(lèi)下可按作者、題材等添加多個(gè)語(yǔ)料庫(kù),每個(gè)新添加的語(yǔ)料庫(kù)均可按作品、來(lái)源等容納多個(gè)素材,繼而劃分素材段落,對(duì)語(yǔ)句進(jìn)行標(biāo)注,具體結(jié)構(gòu)如下圖所示:

圖4 俄漢文學(xué)翻譯語(yǔ)料庫(kù)層級(jí)結(jié)構(gòu)

3 語(yǔ)料庫(kù)使用體驗(yàn)優(yōu)化

為更好地滿(mǎn)足用戶(hù)需求,提升用戶(hù)體驗(yàn),俄漢文學(xué)翻譯語(yǔ)料庫(kù)檢索系統(tǒng)加入一系列人性化的功能設(shè)置,以方便廣大俄語(yǔ)學(xué)習(xí)者和研究者使用。

首先,搜索時(shí)如不需要關(guān)鍵詞的所有詞形變化,可勾選“精確匹配”,系統(tǒng)將只搜索用戶(hù)輸入的詞形。在網(wǎng)站注冊(cè)的用戶(hù)登陸后,每條搜索結(jié)果都帶有收藏按鈕,點(diǎn)亮即可加入收藏,以便多次查詢(xún)或異地調(diào)取先前搜索到的結(jié)果,用戶(hù)可在自己的收藏夾查看已保存的結(jié)果。

其次,為便于收集用戶(hù)反饋,提升語(yǔ)料庫(kù)的內(nèi)容和服務(wù)質(zhì)量,語(yǔ)料詳情頁(yè)面增設(shè)評(píng)論功能,并且支持使用微博等社交平臺(tái)賬號(hào)登錄和分享。同時(shí),課題組還建立以俄語(yǔ)語(yǔ)料庫(kù)為主題的互動(dòng)社區(qū),網(wǎng)址為http://bbs.rucorpus.cn/,社區(qū)包括俄語(yǔ)語(yǔ)料庫(kù)專(zhuān)區(qū)、語(yǔ)料庫(kù)專(zhuān)題研究、語(yǔ)料庫(kù)書(shū)籍資料、學(xué)界新聞動(dòng)態(tài)、用戶(hù)意見(jiàn)征集等欄目,為廣大語(yǔ)料庫(kù)使用者和研究者提供資源共享和在線(xiàn)交流的平臺(tái)。

4 當(dāng)前存在的問(wèn)題和今后的發(fā)展方向

由于國(guó)內(nèi)俄漢文學(xué)翻譯語(yǔ)料庫(kù)的研究剛剛起步,加之課題組仍處于探索階段,俄漢文學(xué)翻譯語(yǔ)料庫(kù)檢索系統(tǒng)還有許多須要改進(jìn)之處:(1)目前僅完成部分契訶夫作品的錄入與標(biāo)注,文本量相對(duì)較小,且語(yǔ)體和語(yǔ)料都較為單一,將來(lái)可擴(kuò)大作家和作品范圍,充實(shí)內(nèi)容,可以嘗試錄入詩(shī)歌、劇本等其他體裁的文學(xué)作品,同時(shí),也可嘗試創(chuàng)建其他作家、作品的語(yǔ)料庫(kù),如普希金作品語(yǔ)料庫(kù)、托爾斯泰作品語(yǔ)料庫(kù)等。(2)依靠人工進(jìn)行屬性標(biāo)注的效率較低,無(wú)法應(yīng)對(duì)大量文本的標(biāo)注。但人工標(biāo)注是對(duì)文學(xué)等靈活性較強(qiáng)的語(yǔ)體進(jìn)行屬性標(biāo)注的必經(jīng)之路,也為語(yǔ)料屬性的分類(lèi)和框架構(gòu)建奠定基礎(chǔ)。隨著語(yǔ)言語(yǔ)義研究的深入與計(jì)算機(jī)技術(shù)的不斷進(jìn)步,將來(lái)應(yīng)努力實(shí)現(xiàn)計(jì)算機(jī)半自動(dòng)或全自動(dòng)屬性標(biāo)注。(4)目前語(yǔ)料庫(kù)較偏重語(yǔ)法屬性的標(biāo)注,屬性標(biāo)注的分類(lèi)和框架仍須要完善。今后課題組將會(huì)繼續(xù)積極進(jìn)行探索和實(shí)踐,增加語(yǔ)義、語(yǔ)篇等類(lèi)型的屬性標(biāo)注,并可嘗試將各類(lèi)語(yǔ)義詞典的算法導(dǎo)入語(yǔ)料庫(kù),強(qiáng)化搜索功能。

5 結(jié)束語(yǔ)

契訶夫小說(shuō)俄漢文學(xué)翻譯語(yǔ)料庫(kù)的創(chuàng)建是一次大膽的嘗試,它創(chuàng)建俄漢翻譯語(yǔ)料庫(kù)的基本框架,探尋出一套具有普適性與開(kāi)放性的內(nèi)容管理平臺(tái);它對(duì)源語(yǔ)文本及多版本譯文進(jìn)行詞法、句法與譯法的屬性標(biāo)注,真正實(shí)現(xiàn)語(yǔ)料的數(shù)字化與結(jié)構(gòu)化;它內(nèi)置數(shù)據(jù)完備的搜索模塊,能夠高效地支持“一對(duì)多”的檢索需求;它依托互聯(lián)網(wǎng)平臺(tái),是我國(guó)首個(gè)面向大眾用戶(hù)的俄漢翻譯在線(xiàn)語(yǔ)料庫(kù);它能解決當(dāng)前俄漢語(yǔ)料庫(kù)存在的移動(dòng)性與兼容性差的問(wèn)題,打破研發(fā)者與用戶(hù)之間的空間壁壘。

目前,契訶夫小說(shuō)俄漢文學(xué)翻譯語(yǔ)料庫(kù)的容量仍在不斷地?cái)U(kuò)充中,除繼續(xù)補(bǔ)充新的語(yǔ)料外,課題組還定期檢查系統(tǒng)功能,及時(shí)糾正標(biāo)注錯(cuò)誤,最大限度地保障與提升語(yǔ)料的準(zhǔn)確性。本語(yǔ)料庫(kù)的建設(shè)經(jīng)驗(yàn)與成果可為俄羅斯經(jīng)典文學(xué)作品翻譯語(yǔ)料庫(kù)的建設(shè)提供一定的理論框架與操作支持,從而為我國(guó)俄語(yǔ)界目前研究較少、難度相對(duì)較大的俄漢/漢俄平行語(yǔ)料庫(kù)建設(shè)做出自己的貢獻(xiàn)。在“互聯(lián)網(wǎng)+”的時(shí)代背景下,俄漢雙語(yǔ)平行在線(xiàn)語(yǔ)料庫(kù)的研發(fā)具有廣闊的發(fā)展前景,對(duì)我國(guó)俄語(yǔ)教學(xué)、俄漢對(duì)比研究、俄語(yǔ)語(yǔ)言及文學(xué)研究具有重要的實(shí)踐意義與學(xué)術(shù)價(jià)值。我們期待俄語(yǔ)界同仁共同努力,不斷開(kāi)發(fā)出不同用途的、更具應(yīng)用價(jià)值的俄漢雙語(yǔ)平行語(yǔ)料庫(kù),為俄漢語(yǔ)料庫(kù)的研究添磚加瓦。鑒于篇幅所限,本語(yǔ)料庫(kù)的應(yīng)用研究將另文探討。

陳 虹. 俄語(yǔ)語(yǔ)料庫(kù)的標(biāo)注[J]. 中國(guó)俄語(yǔ)教學(xué), 2012(2).

崔 衛(wèi) 李 峰. 俄漢-漢俄平行語(yǔ)料庫(kù)的構(gòu)建設(shè)想與應(yīng)用展望[J]. 中國(guó)俄語(yǔ)教學(xué), 2014(1).

何婷婷. 語(yǔ)料庫(kù)研究[D]. 華中師范大學(xué)博士學(xué)位論文, 2003.

李紹哲. 俄語(yǔ)語(yǔ)料庫(kù)和基于語(yǔ)料庫(kù)的語(yǔ)法研究[D]. 黑龍江大學(xué)博士學(xué)位論文, 2012.

契訶夫. 契訶夫小說(shuō)全集[M]. 上海: 上海譯文出版社, 2000.

契訶夫. 契訶夫短篇小說(shuō)精選[M]. 杭州: 浙江少年兒童出版社, 2009.

契訶夫. 契訶夫短篇小說(shuō)集——變色龍[M]. 南京: 譯林出版社, 2011.

張祿彭 張超靜. 自建語(yǔ)料庫(kù)在俄語(yǔ)教學(xué)中的應(yīng)用[J]. 中國(guó)俄語(yǔ)教學(xué), 2012(3).

Зализняк А. А. Граматический словарь русского языка[M]. Москва: АСТ-ПРЕСС, 2010.

Чехов А. П. Полное собрание сочинений и писем в 30-ти томах[M]. Москва: Наука, 1983-1986.

ConstructionofRussian-ChineseTranslationCorpus— On the Basis of Anton Chekhov’s Short Stories

Liu Miao Shao Qing

(Beijing International Studies University, Beijing 100024, China/Peking University, Beijing 100871, China; China Network Television, Beijing 100048, China)

Russian-Chinese translation corpus is a bilingual parallel corpus, which has Russian classic literature and their Chinese versions as the base of its linguistic data. Basic elements of constructing the corpus are as follows: text selection and processing, determination of sentence attributes and labeling, search function supporting and extending as well as user experience designing and maintenance. One of the most vital thoughts of constructing this corpus is building and running the corpus through the online platform. Hence, ordinary users can share the information in the corpus and enjoy communication by the full use of the Internet.

Russian-Chinese parallel translation corpus; construction of corpus; Chekhov’s short stories

*本文系北京市優(yōu)秀人才培養(yǎng)資助D類(lèi)項(xiàng)目“基于契訶夫短篇小說(shuō)的俄漢翻譯語(yǔ)料庫(kù)的創(chuàng)建”(2010D005008000002)的階段性成果,獲北京市委組織部資助。

H319.5

A

1000-0100(2016)01-0154-5

10.16263/j.cnki.23-1071/h.2016.01.031

定稿日期:2015-07-09

【責(zé)任編輯王松鶴】

猜你喜歡
契訶夫俄語(yǔ)譯本
可愛(ài)的契訶夫
讀者(2024年11期)2024-05-31 02:46:30
變色龍
別讓道歉成為一種打擾
《佛說(shuō)四人出現(xiàn)世間經(jīng)》的西夏譯本
西夏研究(2019年1期)2019-03-12 00:58:16
翻譯中的“信”與“不信”——以《飄》的兩個(gè)中文譯本為例
基于3D虛擬情境的俄語(yǔ)視聽(tīng)說(shuō)教學(xué)
俄語(yǔ)稱(chēng)呼語(yǔ)的變遷
今日俄語(yǔ):語(yǔ)法領(lǐng)域中的積極過(guò)程*——“今日俄語(yǔ)”系列研究之二
今日俄語(yǔ):現(xiàn)狀與問(wèn)題*——《今日俄語(yǔ)》系列研究之一
《孫子兵法》俄譯本簡(jiǎn)介
軍事歷史(1993年5期)1993-08-21 06:17:26
普宁市| 黄龙县| 马关县| 黔西县| 惠水县| 开平市| 宁城县| 商河县| 林芝县| 汤原县| 华阴市| 石城县| 陆川县| 昭通市| 天峻县| 兴国县| 来安县| 应城市| 宁陵县| 洞头县| 舒兰市| 怀来县| 吉隆县| 漯河市| 安溪县| 达日县| 石渠县| 台安县| 黄平县| 衡阳县| 阳城县| 灵川县| 普兰店市| 荔波县| 道真| 获嘉县| 垫江县| 永顺县| 惠安县| 沛县| 四子王旗|