国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

自建農(nóng)學(xué)英漢平行語(yǔ)料庫(kù)的初探

2020-05-25 18:46:39郭賢茹洪大勇董梅
鴨綠江·下半月 2020年3期
關(guān)鍵詞:農(nóng)學(xué)英漢語(yǔ)料

郭賢茹 洪大勇 董梅

摘要:目前國(guó)內(nèi)外,通用型的、基于網(wǎng)絡(luò)的超大型語(yǔ)料庫(kù)發(fā)展迅速,然而專業(yè)用途的英漢平行語(yǔ)料庫(kù)發(fā)展緩慢,數(shù)量較少,尤其是農(nóng)學(xué)英語(yǔ)平行語(yǔ)料庫(kù)更是寥寥無(wú)幾?;谶@樣的現(xiàn)狀,筆者對(duì)農(nóng)學(xué)英漢術(shù)語(yǔ)平行語(yǔ)料庫(kù)建設(shè)的背景和意義做了分析,探討了建庫(kù)思路和語(yǔ)料收集。希望為農(nóng)學(xué)領(lǐng)域從業(yè)者、譯員、論文寫(xiě)作者的相關(guān)工作提供幫助。

關(guān)鍵詞:農(nóng)學(xué)英漢術(shù)語(yǔ);平行語(yǔ)料庫(kù)

一、概述

(一)項(xiàng)目介紹

根據(jù)翻譯方向不同,平行語(yǔ)料庫(kù)可分為單向平行語(yǔ)料庫(kù)(uni-directionalparallelcorpus)、雙向平行語(yǔ)料庫(kù)(bi-directionalparallelcorpus)和多向平行語(yǔ)料庫(kù)(multidirectionalparallelcorpus)三種。根據(jù)使用目的不同,可分為通用英漢平行語(yǔ)料庫(kù)和專門(mén)用途英漢平行語(yǔ)料庫(kù)。英漢平行語(yǔ)料庫(kù)(parallelcorpus)是由原文文本及其平行對(duì)應(yīng)的譯語(yǔ)文本構(gòu)成的英漢雙語(yǔ)語(yǔ)料庫(kù),其對(duì)齊程度可有詞級(jí)、句級(jí)、段級(jí)和篇級(jí)這四種。[1]筆者團(tuán)隊(duì)的項(xiàng)目屬于專門(mén)用途英漢平行語(yǔ)料庫(kù),目前對(duì)齊程度主要是詞級(jí)和句級(jí)兩級(jí)雙語(yǔ)對(duì)齊,預(yù)計(jì)后續(xù)將繼續(xù)收錄文章以及大量語(yǔ)料,達(dá)到段級(jí)和篇級(jí)。

(二)現(xiàn)實(shí)依據(jù)

相比其它,專門(mén)用途的英漢平行語(yǔ)料庫(kù)數(shù)量較少、規(guī)模較小。作為專門(mén)用途英語(yǔ)語(yǔ)料庫(kù)分支之一的農(nóng)林英語(yǔ)語(yǔ)料庫(kù),尤其是平行語(yǔ)料庫(kù)更是寥寥無(wú)幾,目前僅有華中農(nóng)業(yè)大學(xué)建設(shè)的農(nóng)科學(xué)術(shù)英語(yǔ)論文語(yǔ)料庫(kù)、西北農(nóng)林科技大學(xué)建立的FAO農(nóng)業(yè)英語(yǔ)語(yǔ)料庫(kù)、王景懌主持建設(shè)的英漢/漢英雙語(yǔ)畜牧業(yè)小型語(yǔ)料庫(kù)。研究農(nóng)林英語(yǔ)語(yǔ)料庫(kù)建設(shè)的學(xué)者也屈指可數(shù),如栗娜、范晶晶、張永萍和婁瑞娟等。[2]

(三)農(nóng)學(xué)英漢平行語(yǔ)料庫(kù)及術(shù)語(yǔ)平行語(yǔ)料庫(kù)的建設(shè)意義

英漢平行語(yǔ)料庫(kù)最基本也是最重要的一個(gè)功能是確認(rèn)表達(dá)是否正確。遇到模棱兩可的用詞和句式時(shí),在語(yǔ)料庫(kù)中檢索、尋找例證,根據(jù)語(yǔ)料庫(kù)的建議和范例選擇合適的用詞和句式以確定表達(dá)是否正確、地道。也可以用來(lái)尋求地道的翻譯,根據(jù)源文和譯文的對(duì)應(yīng)來(lái)獲得目標(biāo)文本的翻譯。針對(duì)農(nóng)學(xué)專業(yè)同學(xué)在翻譯和閱讀英文文獻(xiàn)可能遇到的困難,以及國(guó)內(nèi)農(nóng)學(xué)英漢平行語(yǔ)料庫(kù)數(shù)量少、共享難的現(xiàn)狀。本團(tuán)隊(duì)通過(guò)需求分析、設(shè)計(jì)語(yǔ)料庫(kù)、收集語(yǔ)料、加工語(yǔ)料、建立語(yǔ)料庫(kù)、開(kāi)發(fā)部署語(yǔ)料庫(kù)應(yīng)用軟件等步驟,以建立小型作物學(xué)英漢平行語(yǔ)料庫(kù)為起點(diǎn)和基礎(chǔ),逐步建立起涵蓋整個(gè)農(nóng)學(xué)的英漢平行語(yǔ)料庫(kù)。

二、農(nóng)學(xué)英漢平行語(yǔ)料庫(kù)的建設(shè)

(一)整體設(shè)計(jì)

本研究旨在建設(shè)一個(gè)完備的農(nóng)學(xué)英漢平行語(yǔ)料庫(kù)。語(yǔ)言本身是動(dòng)態(tài)發(fā)展的,因此語(yǔ)料庫(kù)也設(shè)計(jì)為動(dòng)態(tài)的,可以隨時(shí)對(duì)語(yǔ)料進(jìn)行擴(kuò)充或修改。在語(yǔ)料庫(kù)的規(guī)模上,條件允許的情況規(guī)模越大越好。在語(yǔ)料庫(kù)的內(nèi)容上,要保證語(yǔ)料具有相當(dāng)高的質(zhì)量。因此在語(yǔ)料的收集上,遵循系統(tǒng)性、準(zhǔn)確性和專用性。

由于語(yǔ)料來(lái)源和人力有限,本項(xiàng)目目前僅建設(shè)了一個(gè)小型語(yǔ)料庫(kù),為以后建設(shè)更大規(guī)模語(yǔ)料庫(kù)做準(zhǔn)備。

(二)語(yǔ)料的采集

語(yǔ)料來(lái)源于近幾年各大農(nóng)業(yè)期刊如《應(yīng)用生態(tài)學(xué)報(bào)》、《中國(guó)農(nóng)業(yè)科學(xué)》、《作物學(xué)報(bào)》等等中所使用的論文段落,保證了時(shí)效性。另一部分來(lái)源于相關(guān)辭典、網(wǎng)絡(luò)文庫(kù),保證內(nèi)容豐富性。搜集后的語(yǔ)料由專業(yè)學(xué)生小組進(jìn)行審閱批注和修改,保證語(yǔ)料的準(zhǔn)確性。

(三)語(yǔ)料的整理加工

1.語(yǔ)料清潔與標(biāo)注

由于原始語(yǔ)料的來(lái)源各不相同,大部分需要對(duì)文本的內(nèi)容和格式進(jìn)行整理及標(biāo)記。本項(xiàng)目使用MicrosoftWord、Notepad等文檔編輯工具對(duì)文檔修改,統(tǒng)一標(biāo)點(diǎn)符號(hào)、數(shù)字與字母,去除文中多余空格,使其成為內(nèi)容不互相重復(fù)、保存格式統(tǒng)一、排版格式一致的篇章級(jí)對(duì)齊單位。

在語(yǔ)料庫(kù)研制中,較為通用的標(biāo)注軟件包括:WinBrill、QTAG等等,本項(xiàng)目使用這些工具對(duì)語(yǔ)料進(jìn)行詞語(yǔ)切分,對(duì)詞性和詞義進(jìn)行標(biāo)注,以便于后續(xù)對(duì)語(yǔ)料進(jìn)行統(tǒng)計(jì)分析,研究詞組或句式的用法、翻譯策略及譯者風(fēng)格等等。

.2語(yǔ)料對(duì)齊與校對(duì)

經(jīng)過(guò)系統(tǒng)整理生成的清潔規(guī)范的篇章級(jí)對(duì)齊單位,需要進(jìn)一步進(jìn)行對(duì)齊和校對(duì)。我們使用TMX在線對(duì)齊工具h(yuǎn)ttps://tmx.yeekit.com/align/#/進(jìn)行語(yǔ)料對(duì)齊。該工具支持單文檔或雙文檔對(duì)齊,支持世界主流46種語(yǔ)言,能自動(dòng)識(shí)別“一對(duì)多”、“多對(duì)一”、“多對(duì)多”句子對(duì)應(yīng)關(guān)系,極大地提高對(duì)齊的效率與準(zhǔn)確度。

之后對(duì)自動(dòng)對(duì)齊導(dǎo)出的tmx文檔進(jìn)行人工校對(duì)。按照規(guī)范和要求,人工調(diào)整源文與譯文之間的對(duì)齊關(guān)系,并從格式、標(biāo)記及內(nèi)容等方面對(duì)單句進(jìn)行細(xì)節(jié)性修改。

(四)語(yǔ)料檢索工具

本研究使用了TMROBOT語(yǔ)料檢索軟件,該軟件支持中英文雙語(yǔ)查詢,正則模糊搜索。同時(shí)支持語(yǔ)料的批量導(dǎo)入共享與批量刪除修改;還具備在線翻譯功能,方便疑難詞的查詢。

本研究還開(kāi)發(fā)了在線語(yǔ)料查詢網(wǎng)站。將農(nóng)林英漢平行語(yǔ)料庫(kù)部署在云服務(wù)器上,以網(wǎng)站的形式展現(xiàn)出來(lái),方便用戶隨時(shí)隨地使用。用戶輸入英文或中文,系統(tǒng)將返回含有輸入內(nèi)容的英漢短句及其翻譯。在搜索中允許用戶使用模糊搜索,如“*crop*”,將返回所有含有crop的詞語(yǔ)、短句。在結(jié)果返回中若短句過(guò)多將會(huì)分頁(yè)展示。搜索一個(gè)術(shù)語(yǔ)后有多個(gè)譯文,則按譯文中含有搜索內(nèi)容的數(shù)量進(jìn)行排序,數(shù)量最多的連同所在句子一起全部出現(xiàn)在最前面,接著是數(shù)量次級(jí)的譯文,以此類(lèi)推。

在線網(wǎng)站上,用戶能夠在留言板提出修改意見(jiàn)或者內(nèi)容報(bào)錯(cuò),以便管理員進(jìn)入管理員頁(yè)面在線對(duì)語(yǔ)料條目進(jìn)行增刪改查。開(kāi)發(fā)人員能夠使用NavicatforMySQL對(duì)數(shù)據(jù)庫(kù)進(jìn)行可視化操作,批量導(dǎo)入語(yǔ)料、查找刪除修改條目,在日志中查看導(dǎo)入詳情(導(dǎo)入時(shí)間、導(dǎo)入條目數(shù)量等等)。

三、結(jié)束語(yǔ)

農(nóng)學(xué)英語(yǔ)語(yǔ)料庫(kù)的建設(shè)不僅能給農(nóng)學(xué)教學(xué)帶來(lái)極大的便利,更促進(jìn)相關(guān)語(yǔ)言研究工作的順利開(kāi)展。由于客觀原因,農(nóng)業(yè)英語(yǔ)語(yǔ)料庫(kù)的建設(shè)和應(yīng)用仍然存在缺陷,主要表現(xiàn)在語(yǔ)料采集的深度和廣度不夠,但是語(yǔ)料庫(kù)不是一次成品,相信在今后的研究中,農(nóng)學(xué)英語(yǔ)語(yǔ)料庫(kù)會(huì)更加發(fā)展成熟完善,為農(nóng)學(xué)專業(yè)其他學(xué)科的語(yǔ)料庫(kù)建設(shè)打下基礎(chǔ),為國(guó)內(nèi)同行的類(lèi)似研究提供一定的啟發(fā),從而為促進(jìn)農(nóng)學(xué)事業(yè)的發(fā)展。[3]

參考文獻(xiàn):

[1]GB/T7714王敏,李麗霞.FAO農(nóng)業(yè)英語(yǔ)語(yǔ)料庫(kù)的建設(shè)和應(yīng)用[J].考試周刊,2014(65):83-85.

[2]張永萍,婁瑞娟.農(nóng)林英漢術(shù)語(yǔ)平行語(yǔ)料庫(kù)建設(shè)初探[J].北京林業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2017,16(4):79-82.

[3]栗娜.淺析農(nóng)業(yè)學(xué)術(shù)英語(yǔ)語(yǔ)料庫(kù)建設(shè)思路及設(shè)想[J].高教學(xué)刊,000(18):261-262.

項(xiàng)目基金:四川農(nóng)業(yè)大學(xué)大學(xué)生創(chuàng)新訓(xùn)練項(xiàng)目“建立英漢平行語(yǔ)料庫(kù)—以作物學(xué)為例(201810626161)的階段性成果。

猜你喜歡
農(nóng)學(xué)英漢語(yǔ)料
中國(guó)古代農(nóng)學(xué)風(fēng)土論的形成、演變與價(jià)值
蒲松齡《農(nóng)桑經(jīng)》的農(nóng)學(xué)思想及其當(dāng)代啟示
《廣西農(nóng)學(xué)報(bào)》投稿指南
基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
商務(wù)英語(yǔ)翻譯中英漢褒貶義詞的應(yīng)用探討
農(nóng)學(xué)
華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
淺談?dòng)h習(xí)語(yǔ)的文化差異及翻譯方法
英漢文化中的委婉語(yǔ)應(yīng)用對(duì)比分析
《苗防備覽》中的湘西語(yǔ)料
南汇区| 安化县| 白朗县| 商城县| 化隆| 聊城市| 会昌县| 兴隆县| 玉林市| 昭苏县| 咸宁市| 保山市| 庄河市| 方城县| 从江县| 班玛县| 三河市| 治多县| 平利县| 玛多县| 安多县| 德庆县| 临城县| 庆阳市| 景德镇市| 田东县| 鹤岗市| 南京市| 双柏县| 义马市| 温泉县| 慈溪市| 瑞金市| 益阳市| 德保县| 威信县| 山西省| 张家港市| 南康市| 平乡县| 渝中区|