□李偉超 宋亞軍
(一)構(gòu)建西藏旅游外宣漢英平行語料庫的必要性。外宣翻譯是要完成那些以對(duì)外宣傳材料的翻譯任務(wù)為基本內(nèi)容的翻譯實(shí)踐活動(dòng)的總稱(張健,2013)。對(duì)旅游業(yè)出現(xiàn)的文本進(jìn)行的翻譯實(shí)踐活動(dòng)可稱之為旅游外宣,其目的在于“外”,即向來自海外的旅游者解釋、說明、推介相關(guān)旅游資源,其傳播方式在于“宣”,即以各種媒介為渠道,對(duì)來自海外的旅游者宣傳相關(guān)旅游資源。旅游外宣翻譯的質(zhì)量高低,在一定程度上決定了旅游資源的宣傳效果以及海外旅游者的旅游舒適度。通過中國知識(shí)網(wǎng)CNKI 的檢索發(fā)現(xiàn),學(xué)者們對(duì)西藏旅游外宣翻譯的研究并不多見,但也有學(xué)者做了深入的研究。比如譚益蘭(2013)通過運(yùn)用語篇翻譯的相關(guān)理論,選取了布達(dá)拉宮、羅布林卡和拉魯濕地三個(gè)旅游景區(qū)中的地圖、旅游指南、門票、旅行社宣傳資料等的公示語篇,詳細(xì)分析了此類語料庫漢英翻譯存在的問題,并提出了提升西藏旅游景區(qū)公示語語篇漢英翻譯質(zhì)量的具體對(duì)策與建議。此外,弋睿仙、賈麗萍(2014)運(yùn)用賴斯的翻譯批評(píng)理論,對(duì)布達(dá)拉宮門票上的漢英翻譯質(zhì)量進(jìn)行了評(píng)估,從文本類型、語言內(nèi)因素和語言外因素對(duì)譯文進(jìn)行了全面、客觀的分析,發(fā)現(xiàn)了譯文在語義、詞匯和語法等方面存在的一些不足之處。上述兩個(gè)研究針對(duì)西藏旅游外宣文本的漢英翻譯進(jìn)行了個(gè)案研究,西藏旅游外宣文本漢英翻譯現(xiàn)狀不容樂觀,存在著的大量問題亟待解決。隨著語料庫語言學(xué)以及語料庫翻譯研究的發(fā)展,不少學(xué)者提出建設(shè)旅游外宣類漢英平行語料庫為解決旅游外宣文本翻譯質(zhì)量低下的問題提供了更為實(shí)用、方便的途徑。
(二)構(gòu)建西藏旅游外宣漢英平行語料庫的可行性。語料庫(corpus)是應(yīng)用計(jì)算機(jī)技術(shù)對(duì)海量自然語言材料進(jìn)行處理、存儲(chǔ),以供自動(dòng)檢索、索引以及統(tǒng)計(jì)分析的大型資料庫(李文中,1999)。在建設(shè)語料庫的過程中,首要的任務(wù)就是搜集海量的自然語言,在語料稀少的情況下,是無法建設(shè)成具有一定規(guī)模的語料庫的。西藏自治區(qū)旅游資源豐富,充斥著大量的漢英對(duì)照的旅游文本,包含公示語、景觀介紹、門票信息、交通地圖、酒店餐飲介紹、博物館展品說明、特色旅游紀(jì)念品介紹等等。此外,每年西藏都有大型的節(jié)慶、博覽展出等活動(dòng),比如藏歷新年、賽馬節(jié)、雪頓節(jié)、林卡節(jié)等一系列具有民族特色的節(jié)慶活動(dòng)??梢哉f,隨著西藏旅游走向國際化的道路,旅游外宣文本的多語對(duì)照已經(jīng)形成常態(tài),我們可以輕而易舉地獲得大量的語言數(shù)據(jù)。
(一)建庫目的。語料庫并不是大量自然語言數(shù)據(jù)的簡單集合,它是有嚴(yán)格的設(shè)計(jì)標(biāo)準(zhǔn)的。就語料庫的應(yīng)用目標(biāo)而言,其收錄的語言材料應(yīng)該具有代表性(常寶寶、俞士汶,2009)。這就要求我們?cè)诮◣烨懊鞔_哪些語言材料是建庫所需要的,同時(shí)應(yīng)明確哪些語言材料是應(yīng)剔除的。對(duì)于本研究中提出的西藏旅游外宣漢英平行語料庫建設(shè)來說,要建設(shè)高質(zhì)量、精品化、本地化的旅游外宣漢英平行語料庫,使其能很好地服務(wù)于西藏旅游外宣漢英翻譯的工作;服務(wù)于西藏區(qū)內(nèi)高校旅游專業(yè)學(xué)生翻譯教學(xué)的工作;服務(wù)于西藏區(qū)內(nèi)旅游從業(yè)人員英語培訓(xùn)提高的工作。因此,這就對(duì)建庫過程中的語料選取提出了更高、更優(yōu)的要求。
(二)語料選取。在構(gòu)建平行語料庫時(shí),其中一個(gè)基本原則就是平行文本的來源和領(lǐng)域必須嚴(yán)格界定(李文中,2010)。針對(duì)本研究中語料庫的語料選取問題,首先要明確的是旅游外宣文本的含義。廣義的外宣翻譯涵蓋所有的對(duì)外宣傳方面的翻譯活動(dòng),狹義的外宣翻譯包括各種媒體報(bào)道、政府文件公告、政府及企事業(yè)單位的介紹、公示語、信息資料等實(shí)用文體的翻譯(張健,2013)。此外,根據(jù)上述的語料庫的建庫應(yīng)用目標(biāo),本研究提出的西藏旅游外宣漢英平行語料庫側(cè)重于旅游文本在對(duì)外宣傳過程中的漢英翻譯,而并非外宣文本的漢英翻譯。本研究中的旅游外宣文本屬于外宣文本中的一個(gè)類別,它包含了所有在旅游活動(dòng)中出現(xiàn)的,起到對(duì)外宣傳作用的文本。因此,在語料選取過程中,主要搜集以下幾類漢英對(duì)照的旅游文本材料:景觀介紹;觀光指南;景區(qū)公示語;餐飲住宿介紹;博物館陳列說明。通過購買印刷材料,收集網(wǎng)站資料,實(shí)地考察旅游景區(qū)等方式獲取相關(guān)語料。確定了語料來源之后,另一個(gè)需要解決的問題就是語料的代表性問題。采取根據(jù)社會(huì)語域的標(biāo)準(zhǔn),利用分層抽樣、均衡抽樣和比例抽樣三者結(jié)合的方法,使得西藏本地旅游業(yè)中具有代表性的漢英翻譯文本成為入庫語料。由于本語料庫是應(yīng)用型語料庫,主要用于為西藏旅游外宣翻譯提供可靠的參考,以及西藏本地高校旅游英語翻譯教學(xué),那么必須要建設(shè)成為高質(zhì)量、精品化、本地化的旅游外宣漢英平行語料庫,也就需要對(duì)收集到的文本中的語言材料的質(zhì)量進(jìn)行評(píng)估,以免質(zhì)量不高的語言材料入庫,對(duì)以后的研究和英語產(chǎn)生負(fù)面效果。因此,在語料入庫時(shí)要注意以下幾個(gè)方面:一是含有語法、搭配、拼寫錯(cuò)誤的文本,略加更正后入庫;二是出現(xiàn)譯文表達(dá)不準(zhǔn)確甚至錯(cuò)誤的文本不予入庫;三是組織翻譯專家對(duì)入庫語料進(jìn)行二次審核把關(guān),剔除或修改質(zhì)量不高的譯文。
(三)語料錄入與保存。由于語料來自于印刷材料、網(wǎng)絡(luò)電子文本、拍攝下來的圖片資料,因此需要大量的人力物力將這些語料進(jìn)行數(shù)字化的轉(zhuǎn)換。對(duì)于紙質(zhì)的印刷材料,可以采取先掃描成PDF 格式的文件,再轉(zhuǎn)換成TXT 格式文本的方法;對(duì)于網(wǎng)絡(luò)文本,其轉(zhuǎn)換方法很簡單,需要注意的就是剔除嘈雜信息;然后拍攝的圖片資料則需要人工輸入。所有入庫語料經(jīng)過掃描、轉(zhuǎn)換、剔除網(wǎng)絡(luò)嘈雜信息等過程后,經(jīng)過多次的文字校對(duì)和格式整理,全部保存為TXT 格式的文檔備用。
(四)語料標(biāo)記與標(biāo)注。對(duì)于語料庫的標(biāo)注的定義,李文中(2012)認(rèn)為各家觀點(diǎn)不同,但分歧不大,因此他主張使用“標(biāo)記”和“標(biāo)注”兩個(gè)術(shù)語,語料庫標(biāo)記表示添加與文本結(jié)構(gòu)正字特征的表達(dá)和有關(guān)文本識(shí)別特征的過程,語料庫標(biāo)注則表示詞性標(biāo)注、語法標(biāo)注、話語標(biāo)注以及錯(cuò)誤賦碼、語用特征賦碼等。關(guān)于語料庫的標(biāo)注,李文中(2012)指出語料庫學(xué)界對(duì)于語料庫標(biāo)注支持和反對(duì)的兩種截然不同的態(tài)度,不僅反映了語料庫研究中兩種既個(gè)性又相輔相成的學(xué)術(shù)思想(即基于語料庫的研究與語料庫驅(qū)動(dòng)研究),也反映了研究者對(duì)待語料庫中語言數(shù)據(jù)態(tài)度和使用路徑的不同,但二者在研究實(shí)踐中并不是互相排斥的。他指出對(duì)語料庫設(shè)計(jì)標(biāo)注或應(yīng)用標(biāo)注時(shí),要立足于自己的研究實(shí)際。對(duì)于本語料庫的應(yīng)用來說,在設(shè)計(jì)標(biāo)注時(shí)只考慮對(duì)文本的元信息進(jìn)行標(biāo)記,以及對(duì)中英文進(jìn)行詞性標(biāo)注。文本的元信息指的是關(guān)于文本的信息,在本語料庫中,在進(jìn)行元信息標(biāo)記的時(shí)候,采用多數(shù)語料庫常用的XML 語言進(jìn)行標(biāo)記,主要注明語料來源、景區(qū)類別、景區(qū)所在地、譯者信息等。為方便進(jìn)一步的檢索和研究,對(duì)英文文本采用免費(fèi)的CLAWS7 軟件進(jìn)行計(jì)算機(jī)自動(dòng)詞性標(biāo)注。然而機(jī)器自動(dòng)標(biāo)注的準(zhǔn)確率只能達(dá)到96%左右,因此,在完成自動(dòng)標(biāo)注后需要對(duì)標(biāo)注后的文本進(jìn)行人工修正。
(五)語料對(duì)齊。相較于單語語料庫,平行語料庫需要進(jìn)行雙語語料的對(duì)齊這一必不可少的步驟。對(duì)于語料對(duì)齊的問題,目前大部分平行語料庫能普遍能做到的是段落對(duì)齊和句子對(duì)齊,目前來說,還沒有對(duì)齊率達(dá)到百分百準(zhǔn)確性的對(duì)齊軟件,因此,在進(jìn)行語料對(duì)齊時(shí)要做到機(jī)器對(duì)齊和人工對(duì)齊相結(jié)合的辦法。Paraconc 軟件可以對(duì)語料庫中的中英文文本進(jìn)行粗略的句子對(duì)齊,由于旅游文本的翻譯會(huì)出現(xiàn)摘譯、擴(kuò)譯或省譯的情況,所以機(jī)器自動(dòng)對(duì)齊軟件在某些句子無法實(shí)現(xiàn)一對(duì)一的對(duì)應(yīng),因此會(huì)造成對(duì)應(yīng)混亂,這就要求進(jìn)行人工核查,完成進(jìn)一步的人工對(duì)齊。在人工對(duì)齊的時(shí)候,一句中文原文有可能譯成一句英文,因此實(shí)現(xiàn)一句中文對(duì)應(yīng)一句英文;一句中文原文有可能譯成多句英文,因此實(shí)現(xiàn)一句中文對(duì)應(yīng)多句英文;多句中文原文有可能譯成一句英文,因此實(shí)現(xiàn)多句中文對(duì)應(yīng)一句英文。
一是研究者可以從旅游文本的漢、英語料的對(duì)比研究入手,從文體和功能方面探究二者的差異和共性,發(fā)現(xiàn)不同類型的西藏旅游文本及其英譯文本的語言特點(diǎn),進(jìn)一步結(jié)合翻譯學(xué)理論,探討西藏旅游文本外宣翻譯的翻譯策略、翻譯方法及其內(nèi)在成因,為今后旅游文本的翻譯提供可靠的理論和實(shí)踐基礎(chǔ)。二是由于在建庫時(shí)嚴(yán)格控制入庫語料,所以建設(shè)成的西藏旅游外宣漢英平行語料庫可以為譯者提供可靠的翻譯參考,能夠有效地提高旅游文本翻譯的質(zhì)量,達(dá)到良好的外宣效果。三是西藏旅游外宣漢英平行語料庫可以應(yīng)用與西藏本地高校的旅游翻譯教學(xué)。基于該語料庫可以開發(fā)數(shù)據(jù)驅(qū)動(dòng)式(data-driven learning,簡稱DDL)旅游翻譯教學(xué)手段。DDL 旅游翻譯教學(xué)內(nèi)容豐富多彩,教學(xué)形式也更加多樣化,能夠有效地培養(yǎng)學(xué)生主動(dòng)學(xué)習(xí)、獨(dú)立思考的學(xué)習(xí)習(xí)慣,進(jìn)一步提高旅游翻譯教學(xué)的效果,為培養(yǎng)服務(wù)于西藏旅游業(yè)的專業(yè)人才提供更好的教學(xué)方法。
在建設(shè)西藏旅游外宣漢英平行語料庫的時(shí)候,需要大量的人力物力財(cái)力,需要旅游專業(yè)人士、翻譯專業(yè)人士以及計(jì)算機(jī)專業(yè)人士的共同協(xié)作和參與。盡管西藏旅游外宣漢英平行語料庫的建設(shè)并非一蹴而就,但可以肯定的是,建成后的語料庫其應(yīng)用前景廣泛,必將對(duì)西藏旅游翻譯和旅游翻譯教學(xué)產(chǎn)生積極的影響。
[1] 常寶寶,俞士汶.語料庫技術(shù)及其應(yīng)用[J].外語研究,2009,5:43~51
[2] 李德超,王克非.基于雙語旅游語料庫的DDL 翻譯教學(xué)[J].外語電化教學(xué),2011,1:20~26
[3] 李文中.語料庫、學(xué)習(xí)者語料庫與外語教學(xué)[J].外語界,1999,1:51~55
[4] 李文中.平行語料庫設(shè)計(jì)及對(duì)應(yīng)單位識(shí)別[J].當(dāng)代外語研究,2010,9:22~27
[5] 李文中.語料庫標(biāo)記與標(biāo)注:以中國英語語料庫為例[J].外語教學(xué)與研究,2012,3:336~345
[6] 譚益蘭.從語篇分析角度研究西藏旅游景點(diǎn)公示語漢英語篇翻譯[J].西藏大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013,4:57~64
[7] 弋睿仙,賈莉萍.賴斯翻譯批評(píng)論在旅游文本翻譯中的應(yīng)用——以布達(dá)拉宮門票漢英翻譯為例[J].牡丹江大學(xué)學(xué)報(bào),2014,3:125~127
[8] 張?。蚧Z境下的外宣翻譯“變通”策略芻議[J].外國語言文學(xué),2013,1:19~27