国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

河南省旅游漢英雙語平行語料庫的創(chuàng)建和應用研究

2018-08-16 23:54:02姚曉鳴
校園英語·下旬 2018年4期
關(guān)鍵詞:應用前景

姚曉鳴

【摘要】“一帶一路”與自貿(mào)試驗區(qū)建設為河南全域旅游帶來了發(fā)展新機遇, 但目前在政府門戶網(wǎng)站上相關(guān)旅游信息的英文介紹存在譯法不規(guī)范等現(xiàn)象,因此,從河南省的全方位出發(fā),很有必要構(gòu)建一個漢英雙語平行語料庫,這個平行語料庫要涉及到河南省的自然景觀、人文景觀、文化遺產(chǎn)等。本文首先介紹了旅游漢英平行語料庫建設的必要性,明確了該語料庫的建設步驟及發(fā)展應用前景,為河南省旅游文化走向國際助力。

【關(guān)鍵詞】河南省旅游;平行語料庫;應用前景

一、引言

在20世紀90年代,加拿大議會會議錄英法平行語料庫建成,這是世界上第一個雙語平行語料庫。一些大型平行語料庫也在國內(nèi)建成,其中有王克非教授等創(chuàng)建的通用漢英平行語料庫,胡開寶教授等創(chuàng)建的英漢醫(yī)學平行語料庫以及由香港理工大學和北京外國語大學學者共同合作而創(chuàng)建的英漢旅游文本語料庫等。和通用語料庫相比,專門用途語料庫在很多方面的優(yōu)勢還是很明顯的,比如專業(yè)詞典編撰、學科語言研究及教學方面。因此,河南省構(gòu)建旅游漢英雙語語料庫的創(chuàng)建是很必要的,能夠提供翻譯工作者所需要的語料,對旅游漢英表達等起到了規(guī)范作用,也大大提高了翻譯教學和語言教學質(zhì)量等。

二、河南省構(gòu)建旅游漢英雙語平行語料庫的必要性

旅游語料庫建設在國內(nèi)外均取得了突出成果,但很少創(chuàng)建與河南省旅游相關(guān)的漢英雙語平行語料庫。相對比大型語料庫,在各地的旅游資源基礎(chǔ)上,創(chuàng)建中小型的漢英雙語旅游語料庫非常重要。河南省有著悠久的歷史文化,旅游資源也極其豐富,特別是嵩山、少林寺、龍門石窟、云臺山、安陽殷墟等都聞名世界,吸引了越來越多的西方國外旅游者。西方游者喜歡中原文化,但是用漢英雙語介紹河南的文化資源、旅游資源、風土人情等的資料并不多,與之相關(guān)的出版物也是很少。在政府門戶網(wǎng)站上會有一些相關(guān)旅游信息的英文介紹,但都比較滯后,還存在譯法不規(guī)范等現(xiàn)象。旅游業(yè)的發(fā)展日新月異,及時構(gòu)建一個涵蓋全省人文自然景觀和文化遺產(chǎn)等更為全面的旅游漢英雙語平行語料庫就顯得尤為必要。

三、河南省旅游漢英雙語平行語料庫的創(chuàng)建

雙語平行語料庫的建設不同于單語語料庫,它主要包括語料庫設計、語料的收集、語料的整理與加工、語料的存儲與檢索等步驟。

1.語料庫的總體設計。在設計語料庫時,要考慮語料庫的類別、規(guī)模、性能、實現(xiàn)方法和后期發(fā)展等。語料庫的規(guī)模并不是越大越好,針對性較強的小型語料庫也能達到研究目的。Flowerdew指出普通的小型語料庫規(guī)模達到25萬字/詞就已足夠。Tribble認為大型語料庫對師生的使用不能達到理想效果,這是由于大型語料庫的范圍過于廣泛、數(shù)據(jù)龐雜造成其不能適應專門用途的英語學習。特定語料庫的代表性主要體現(xiàn)在該語料庫上獲得的分析結(jié)果可以概括成為該語言整體或其指定部分的特性。這個語料庫的內(nèi)容將分為自然景觀、人文景觀、文化遺產(chǎn)等三個字庫,每個字庫將從自然、人文和文化遺產(chǎn)等方面選取具有代表性的內(nèi)容。形成以漢語為原語,以英語為譯語,原語文本與譯語文本相互對照,通過加工形成句子層面對齊的河南省旅游漢英雙語平行語料庫。

2.語料收集。在語料的收集方面,要考慮到語料的代表性。語料的采集不能是隨機的,既要圍繞應用目標,又要考慮應用需要。因此,漢英語料不僅需要同時收集電子版本和紙質(zhì)版本的漢語和英語的原文文本,同時包括漢語和英語譯文文本?;诖?,該語料庫主要收集教育教學材料、期刊雜志、各類電子出版物、字典和網(wǎng)絡資源等。漢語文本的可以通過互聯(lián)網(wǎng)進行,可以選取地方的官方旅游網(wǎng)站,比如河南省旅游局官方網(wǎng)站、河南旅游文化網(wǎng)、各個地區(qū)的旅游局官方網(wǎng)站以及其他正規(guī)的旅游網(wǎng)站,如河南旅游集團有限公司網(wǎng)等。

選擇書面語語料要參考以下幾個基本的原則:基于學術(shù)影響力;人們閱讀習慣的統(tǒng)計采樣;隨機采樣;資料的流通程度和文本被閱讀的次數(shù);依據(jù)語言說明進行文本選擇的經(jīng)驗等。可以參考的中文資料有《河南旅游地理》、《河南旅游歷史文化》、《走遍中國——河南》、《發(fā)現(xiàn)者旅行指南——河南》等。漢英對譯文本方面可以利用《洛陽旅游文化大觀(漢英對照)》。但是漢英對譯的資料很少,因此進行一些英譯工作來充實漢英對譯文本。

3.語料整理和加工。目前人們常用的文本處理軟件主要有Microsoft Office軟件、OCR圖片文字識別軟件、TXT文本文檔等。除了格式外,還要檢查是否出現(xiàn)錯別字、亂碼、語法錯誤等情況,同時要刪除多余的信息。與此同時,還要對語料進行除噪,規(guī)范加工。通過txtmarker、headadder等軟件對漢英語料進行除噪。將除噪后形成的TXT格式導入電腦。

收集的漢英雙語語料還要進行對齊處理,在平行語料庫中,常見的對齊方式就是句子對齊。而句子對齊方法一般是基于長度、基于詞和混合法等方法。在這三個方法當中,基于長度的對其方法資源占用少,計算效果較高,因為它是根據(jù)句子的長度來預測對齊的可能性。而基于詞的對齊方法會影響算法效率,因為它需要借助詞典。這樣看來,混合法的效果會更好。

4.語料存儲和檢索。一般都使用ASCII文本形式存儲已處理好的語料,存儲的文本中不能出現(xiàn)斜體、下劃線、字體加黑、特殊符號等情況。通過這種方式存儲能夠為后期的檢索提供方便,同時也能規(guī)范文本的內(nèi)容,保持格式的一致,去除多余的回車和空格等文本噪音。語料庫構(gòu)建完成后,有必要對其進行改進,擴充內(nèi)容,將其內(nèi)容和功能更加完善。因此需要對語料庫的檢索系統(tǒng)進行維護,這樣來滿足不斷發(fā)展的科技和信息需求。Paraconc是常用的雙語語料庫檢索軟件。

四、河南省旅游漢英雙語平行語料庫的應用

雙語平行語料庫的建設影響著語言的諸多方面。河南省旅游漢英雙語平行語料庫建成后,將會具備及其廣泛的應用前景,主要體現(xiàn)在以下三方面:

目前已有的河南省旅游漢英文本形式存在一定的差異,部分專有名詞的譯文很不規(guī)范,沒有形成統(tǒng)一的譯文。河南省旅游漢英雙語平行語料庫能夠為我省的人文自然景觀和文化遺產(chǎn)提供漢語和英語文本,能夠?qū)β糜蔚臐h英詞匯進行統(tǒng)一,能夠規(guī)范河南旅游方面的漢英表達,能更好地培養(yǎng)旅游方面的人才。

本語料庫研究將積極促進語言學研究,并輔助翻譯教學。因為語料庫是通過觀察和科學分析而得出的數(shù)據(jù),更能體現(xiàn)出科學性和準確性,因此在語言教學中能起到至關(guān)重要的作用。在翻譯教學方面,雙語平行語料庫的作用更像一個“譯員培訓研習班”,能夠提高學習者的漢英互譯能力。通過關(guān)鍵詞的搜索,河南省旅游漢英雙語平行語料庫能夠展示漢英雙語的對譯語料,所提供的雙語詞匯和句型表達比較準確。

本語料庫將對旅游漢英詞語詞匯的選擇、語用、語體等研究提供重要的參考。該語料庫的構(gòu)建將為河南省漢英旅游辭典的編纂提供重要依據(jù)。語料庫能夠為英語的教育教學提供豐富的資料,同時也為辭典的編寫、各類教材和參考資料編寫提供了主要語料來源。能夠更好地服務于雙語導游人才的培養(yǎng)。

五、結(jié)論

在語料庫的廣泛應用下,河南省旅游漢英雙語平行語料庫將展示出河南省豐富的旅游資源,構(gòu)建英漢互譯,通過深入加工實現(xiàn)句子層面的對齊。通過語料庫的應用,實現(xiàn)河南省旅游漢英表達的進一步規(guī)范,并在此基礎(chǔ)上進行語言教學和翻譯教學,能夠更好地培養(yǎng)河南旅游人才,同時也為河南省漢英旅游辭典的編纂和旅游教材的編寫提供有力支撐。本語料庫的開發(fā)和運用將也會對我省旅游業(yè)的持續(xù)健康發(fā)展有著重要意義。

參考文獻:

[1]Anne OKeeffe and Michael McCarthy The Routledge Handbook of Corpus Linguistics[M].London:Routledge,2010.

[2]LEECH G.The State of the Art in Corpus Linguistics[M]//AIJMER K,ALTENBERC B.English Corpus Linguistics:Study in Honor of Jan Svartvik.Londres:Longman,1991:8-29.

[3]KENNEDY G.An Introduction to Corpus Linguistics[M].Beijing:Foreign Language Teaching & Research Press.2000:83.

[4]SUNNERS D.Lancaster English Language Corpus:Criteria and Design[M].Harlow:Longman,1991.

[5]ZANETTIN F.Bilingual comparable corpora and the training of translators[M].Meta,1998(4):616-630.

[6]潘璠,馮躍進.基于語料庫的同義詞差異性特征調(diào)查[J].山東外語教學,2000(4):8-12.

[7]柏曉靜,常寶寶,詹衛(wèi)東.構(gòu)建大規(guī)模的漢英雙語平行語料庫[C]. 2002全國機器翻譯論壇會議論文,2002.

[8]胡開寶.語料庫翻譯學概論[M].上海:上海交通大學出版社,2001.

[9]宋亞軍.小型旅游英漢雙語平行語料庫的創(chuàng)建及教學研究[J].河南機電高等專科學校學報,2017(3).

[10]王克非.雙語平行語料庫在翻譯教學上的用途[J].外語電化教學,2004(6):27-32.

猜你喜歡
應用前景
淺論“產(chǎn)出導向法”研究及其應用
量子點探針顯影的應用研究進展
物聯(lián)網(wǎng)技術(shù)現(xiàn)狀及應用前景展望
太陽能光熱發(fā)電特點及應用前景技術(shù)分析
利用新的廣電媒體技術(shù)帶動廣電事業(yè)發(fā)展
遙感技術(shù)在公安業(yè)務中的應用淺析
無線通信技術(shù)電網(wǎng)通信探討
信息技術(shù)在醫(yī)院人力資源管理中的應用策略研究
單片機在企業(yè)生產(chǎn)中的應用前景
LED集魚燈在遠洋漁業(yè)的應用前景探討
邛崃市| 二连浩特市| 永福县| 厦门市| 泾源县| 全州县| 横峰县| 蓬莱市| 汶上县| 磐安县| 连江县| 信丰县| 韶山市| 福安市| 定州市| 彭阳县| 大英县| 奉新县| 沈阳市| 任丘市| 白玉县| 肇东市| 仁怀市| 峡江县| 黄骅市| 肥东县| 汝城县| 西昌市| 武胜县| 西畴县| 萨嘎县| 清原| 吴江市| 集贤县| 蚌埠市| 乐平市| 西丰县| 扎囊县| 长宁县| 古蔺县| 修水县|