何三鳳
(1.浙江大學外語語言文化與國際交流學院,浙江杭州 310058;2.浙江水利水電??茖W校國際教育交流學院,浙江杭州 310018)
水利行業(yè)英語專用語料庫建設構想
何三鳳1、2
(1.浙江大學外語語言文化與國際交流學院,浙江杭州 310058;2.浙江水利水電專科學校國際教育交流學院,浙江杭州 310018)
語料庫語言學為研究專門用途英語提供了有力的研究方法和工具。水利行業(yè)英語專用語料庫建設的目的是為水利行業(yè)英語的學習和研究提供大量翔實的語料,為水利英語的教學設計、教材編寫和翻譯培訓提供動態(tài)的、可借鑒的專門語料。其框架設計建立在專門用途交際概念之上,包括三個子語料庫,即技術資料子庫、水利項目運行和管理資料子庫和文獻資料子庫。
專門用途英語;專用語料庫;水利行業(yè)英語;框架設計
語料庫語言學是20世紀80年代嶄露頭角的一門交叉學科,它以真實的語言數(shù)據(jù)為研究對象,對大量的語言事實進行系統(tǒng)分析[1]。語料庫從應用層面可分為通用語料庫和專用語料庫[1],專用語料庫又可以進一步根據(jù)使用的目的來劃分[2]。李文中認為“語料庫開發(fā)正在向兩頭快速發(fā)展和延伸”,一是“通用型的、基于網(wǎng)絡的超大型語料庫”的開發(fā),二是“個性化、專門化、行業(yè)化的小型語料庫”的開發(fā)[3]。本文從分析專門用途英語語料庫著手,提出建設水利行業(yè)英語專用語料庫的設想和構思。
專門用途英語(English for Specific Purposes,ESP)的定義一直在演化。Strevens認為,ESP在內(nèi)容上與特定專業(yè)、職業(yè)和活動相關,其詞匯、句法和語篇都在特定專業(yè)、職業(yè)的語境中[4]。通俗地說,ESP是指從事某種特定行業(yè)或?qū)W習、研究某一特定學科所用到的英語。ESP教學是社會發(fā)展的大勢所趨,其教學和研究在中國才起步不久。北京外國語大學在2008年6月成立了第一所,也是到目前為止全國唯一的一所專門用途英語學院。
語料庫語言學提供了研究專門用途英語的新方法、新視角。許多研究者個人建立了適合自己的小型專用英語語料庫,如廣州體育學院陳建生建立了美國職業(yè)籃球比賽賽事報道語料庫,并探討了體育英語語料庫的建設[5];南京師范大學倪傳斌研究了中醫(yī)英語語料庫的建庫原則[6];北京物質(zhì)學院的何啟濱等撰寫了物流英語語料庫建庫研究方面的論文[7]。黃大網(wǎng)認為,專門用途英語語料庫的研究人員往往是該語料庫的建庫人,對語料庫代表的專門行業(yè)的特定宏觀交際語境有著更深入的了解,從而有助于全面準確地闡釋語料數(shù)據(jù)[8]。
中國水利行業(yè)企業(yè)對外投資建設規(guī)模不斷擴大,水利行業(yè)涉外活動不斷增加,導致社會對水利行業(yè)英語需求也不斷擴大,從而把水利行業(yè)英語研究、教學及培訓提到了一個重要的位置。但是,目前水利行業(yè)英語相關資料嚴重缺乏,成為限制其發(fā)展的瓶頸。
在Strevens定義的基礎上,Dudley-Evans和St.John提出了ESP的幾個不變特征和可變特征[9]。根據(jù)這幾個特征,水利行業(yè)英語可以被視為一種專門用途英語。水利行業(yè)資料繁多,涉及水文、地質(zhì)、水工、施工、概預算、工程承包、環(huán)境評價、移民安置、大壩安全、水利志、水利學術論文等資料。但是這些英語資料專業(yè)性強,可獲得途徑少。為此,可以嘗試將語料庫語言學的研究方法與ESP理論結合,構建一個水利行業(yè)英語專用語料庫。
1.建庫目的。水利行業(yè)英語專用語料庫是一個專為學習和研究水利行業(yè)英語服務的語料庫。語料庫的建設的目的是為水利行業(yè)英語的學習和研究提供大量翔實的語料,為水利英語的教學設計、教材編寫和翻譯培訓提供動態(tài)的、可借鑒的專門語料。
2.建庫規(guī)模。一般來說,語料庫容量越大,其代表性就越強。但是,Bowker和Pearson認為只要精心設計,幾千到幾十萬詞的語料庫都有助于專門用途語言的研究。他們提到,專門用途語料庫建設的關鍵不在于其規(guī)模,而在于語料庫的開放性、語料的作者多元化以及與語料庫項目研究目的關聯(lián)性等[10]。鑒于以上認識,同時考慮到時間、精力等因素的制約,水利行業(yè)英語專用語料庫只要能夠覆蓋水利行業(yè)英語的文本類型,能夠滿足設計用途即可,規(guī)模擬定為15~20萬詞。
3.建庫內(nèi)容。Boswood在1994提出了“專門用途交際”這個概念,即通過“交際事件”把ESP文本置放于社會語境下,整合諸如民族語言學、跨文化交際以及語用學等其他學科理論,構建一個嶄新的、涵蓋面廣的專門用途英語教學[11]。專門用途交際概念下的ESP更注重交際語境。語料庫內(nèi)容從整體上分為三部分:一是以水利技術人員為服務對象的技術資料語料;二是為水利項目管理人員、水利英語教學人員服務的項目運行和活動管理語料;三是以水利研究人員為服務對象的水利文獻語料。
1.語料的代表性和平衡性。如何保證語料代表性和平衡性將直接決定語料庫是否能實現(xiàn)預期功能。李文忠也指出小型專用語料庫的開發(fā)更強調(diào)語料庫的整體平衡性和代表性[2]。選取哪些材料才能夠保證語料庫的代表性?如何編排這些材料才能保證語料庫的平衡性?這兩個問題是設計水利行業(yè)英語專用語料庫的重點和難點。它們的解決在一定程度上取決于對水利行業(yè)英語的了解程度及對其發(fā)展的恰當預見。前文提到,專門用途語料庫建設還要考慮語料的社交語境。也就是說,語料選取不僅要考慮專門用途語言涉及的文本類型覆蓋面,同時還要考慮文本創(chuàng)建者和使用者的客觀交際環(huán)境。就水利行業(yè)英語而言,隨著現(xiàn)在對外交流的增加和國家對水利建設的重視,增加了很多項目運行和管理資料,涉及工程承包合同協(xié)議、年報、備忘錄、發(fā)文通知、往來信函、環(huán)境評價、移民安置、外部監(jiān)測等等。這些文本交際功能的實現(xiàn)與原來的技術資料有著很大的區(qū)別。要實現(xiàn)語料庫的代表性,就不能不把它們列為語料的重要組成部分。由于前期已經(jīng)完成了水利行業(yè)英語需求調(diào)研和幾個以水利英語為研究對象的課題,語料選擇方面已經(jīng)有了基本框架(表1):
表1 水利行業(yè)英語專用語料庫框架
水利行業(yè)英語專用語料庫將按照上述三大類收集生語料。第一類技術資料相對專業(yè),覆蓋面很廣,交際環(huán)境較為單純;第二類是指水利涉外項目或者涉外水事活動的運行管理資料,涉及的文本內(nèi)容也很廣泛,其交際環(huán)境更為多樣和復雜;第三類水利文獻資料也相對專業(yè),交際環(huán)境比第一類資料復雜,比第二類單純,涉及的文本類型則很明確。語料庫子庫之間的平衡取決于很多因素,其中最重要的是語料的可獲得性。具體采集語料時,應合理配置不同語料的搭配比例。
2.語料處理和加工工具。語料庫語料的加工處理需要一定的技術,而語料庫處理軟件的選擇和使用是大部分語言教師比較擔心的問題。哪些軟件工具適合本課題專門語料庫語料的處理和加工?如何使用這些工具?很多語料庫研究人員推薦了文本處理工具、標注工具和檢索工具。山東中醫(yī)藥高等??茖W校的趙宏展在其論文里詳細地介紹了DIY小型翻譯語料庫的工具使用[12]。北京外國語大學中國外語教育研究中心舉辦的語料庫語言學在線網(wǎng)站(www.corpus4u.org)提供即時的語料庫問題解答。水利行業(yè)英語專用語料庫語料的采集分為兩個步驟:第一步是前期積累語料處理,主要是利用文本處理工具(如Edit PadPro、TextEditor)將這些語料全部轉(zhuǎn)換為text文件,并進行去除不必要空格等清理工作。第二步是采集網(wǎng)絡語料,可以手動進行,也可以利用相關軟件(如WordSmith軟件webgetter功能)進行采集,并清除雜質(zhì)和多余符號。上面采集到的生語料,需進一步加工處理后才能真正形成可以實現(xiàn)用途的語料。王克非認為,對語料進行賦碼的第一步是加注篇頭,即給語料標注篇名、作者、文本、領域、語體、時代、出版信息、文本字數(shù)等[13]。鑒于水利行業(yè)英語采集語料的特點,篇頭信息可標注篇名、文本、領域、時間、字數(shù)等。之后利用AnnoTool或GoTagger標注軟件對語料進行詞性賦碼。最后,整合所有語料成庫。
如前所述,水利行業(yè)英語專用語料庫的建設是為水利行業(yè)英語的學習、研究和培訓提供翔實的語料。語料庫建成后,利用檢索軟件對語料庫進行檢索,統(tǒng)計并分析文本特點。同時,結合社交語境,分析不同子庫的語言特點和交際環(huán)境之間的規(guī)律。根據(jù)語料庫研究者的推薦,并結合實際操作情況,語料檢索軟件將采用AntConc。AntConc易于操作,且是一款免費使用的綠色軟件。它可以檢索單個詞項,還具有檢索多個詞項的功能。
水利行業(yè)英語語料庫是動態(tài)的專門用途語料庫,因此有必要對語料庫定期進行更新。這種更新將建立在對水利行業(yè)英語的發(fā)展認識基礎之上。定期更新語料庫語料的同時,考慮到水利語料的不斷增長和發(fā)展,將計劃增建子庫,將語料庫發(fā)展成為英漢平行語料庫,以便更好地服務于水利行業(yè)英語翻譯的研究。
[1]楊惠中.語料庫語言學導論[M].上海:上海教育出版社,2002.
[2]馮志偉.《語料庫語言學與計算語言學研究叢書》序[DB/OL].(2008-12-06)[2011-12-11].http://www.lingviko.net/feng/clcl.pdf.
[3]桂詩春.語料庫語言學與中國外語教學[J].現(xiàn)代外語,2010,33(4).
[4]Kristen Gatehouse,KeyIssues in English for Specific Purposes(ESP)CurriculumDevelopment[J/OL].The Internet TESL Journal,2001(10).
[5]陳建生.語料庫、專門用途英語與體育英語語料庫建設[J].廣州體育學院學報,2009,29(3).
[6]倪傳斌.中醫(yī)英語語料庫的建庫原則[J].上海中醫(yī)藥大學學報,2005,19(3).
[7]何啟濱.物流英語語料庫的建庫研究[J].物流教育,2009,28(4).
[8]黃大網(wǎng).專門用途英語語料庫:挑戰(zhàn)、理據(jù)與愿景[J].寧波大學學報:人文科學版,2010,23(5).
[9]Dudley-Evans,T.,&StJohn,M.DevelopmentsinESP:Amulti-disciplinaryapproach[M].Cambridge:CambridgeUniversityPress,1998.
[10]Bowker L,Pearson J.Workingwith Specialized Language:APractical Guide toUsingCorpora[M].London and NewYork:Routledge,2002.
[11]Boswood,T..Communication for Specific Purposes:Establishingthe communicative events as the focus ofattention in ESP[J].Perspectives:WorkingPapers in English and Communication,1994,6(1):35-60.
[12]趙宏展.小型翻譯語料庫的DIY[J].中國科技翻譯,2007,20(2).
[13]王克菲.新型雙語對應語料庫的設計與構建[J].中國外語,2004,25(6).
H31
A
1008-178X(2012) 04-0071-03
2012-01-23
浙江省社科聯(lián)研究課題(2011B108)。
何三鳳(1977-),女,浙江杭州人,浙江大學外語語言文化與國際交流學院講師,從事英語翻譯研究。