国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)驅(qū)動下的口譯學(xué)習(xí)者語料庫建設(shè)構(gòu)想*

2016-03-19 03:01:05伍彥安徽新華學(xué)院外國語學(xué)院安徽合肥230000
高教學(xué)刊 2016年17期
關(guān)鍵詞:口譯語料語料庫

伍彥(安徽新華學(xué)院 外國語學(xué)院,安徽 合肥 230000)

數(shù)據(jù)驅(qū)動下的口譯學(xué)習(xí)者語料庫建設(shè)構(gòu)想*

伍彥
(安徽新華學(xué)院 外國語學(xué)院,安徽 合肥 230000)

本研究提出建設(shè)一個基于數(shù)據(jù)驅(qū)動學(xué)習(xí)理論的口譯學(xué)習(xí)者語料庫,旨在推進(jìn)口譯教學(xué)現(xiàn)代化,為口譯研究提供數(shù)據(jù),并通過數(shù)據(jù)驅(qū)動的學(xué)習(xí)模式,為社會培養(yǎng)更多優(yōu)秀口譯人才。

數(shù)據(jù)驅(qū)動;口譯;語料庫

一、概述

“大數(shù)據(jù)”時代,數(shù)據(jù)已成為滾滾洪流,影響著全球經(jīng)濟(jì)社會各個領(lǐng)域。隨著數(shù)據(jù)提取、存儲、搜索、共享、分析、處理技術(shù)的不斷提高,大數(shù)據(jù)與高等教育的結(jié)合逐漸成為教育發(fā)展的必然趨勢。數(shù)據(jù)驅(qū)動學(xué)習(xí)(Data-driving Learning),作為一種新的教學(xué)工具和技術(shù),最早由Tim Johns于上世紀(jì)九十年代提出,主要思想是指引學(xué)生基于語料庫數(shù)據(jù)觀察、概括和歸納語言使用現(xiàn)象。

從教學(xué)形式上,數(shù)據(jù)驅(qū)動學(xué)習(xí)逆轉(zhuǎn)了“規(guī)則第一、實踐第二”的演繹式教學(xué)方法,強(qiáng)調(diào)學(xué)生自己探索并歸納規(guī)則。從教學(xué)內(nèi)容上,數(shù)據(jù)驅(qū)動學(xué)習(xí)跳出了課本數(shù)據(jù)的窠臼,提供給學(xué)生的語言數(shù)據(jù)具有容量大、種類多、速度快、價值高四大特征。

二、數(shù)據(jù)驅(qū)動學(xué)習(xí)與口譯語料庫的發(fā)展

(一)數(shù)據(jù)驅(qū)動學(xué)習(xí)的國內(nèi)外發(fā)展現(xiàn)狀

近十幾年,國內(nèi)外學(xué)者從不同角度對數(shù)據(jù)驅(qū)動學(xué)習(xí)的應(yīng)用進(jìn)行了研究。Johns[1]進(jìn)一步提出了數(shù)據(jù)驅(qū)動學(xué)習(xí)所面臨的技術(shù)、語言、教學(xué)法等挑戰(zhàn),探討了在21世紀(jì)如何使數(shù)據(jù)庫更加符合學(xué)習(xí)者需求,并將數(shù)據(jù)驅(qū)動學(xué)習(xí)與互惠式學(xué)習(xí)以及互聯(lián)網(wǎng)的應(yīng)用結(jié)合起來。Gilquin&Granger[2]總結(jié)了數(shù)據(jù)驅(qū)動學(xué)習(xí)的三大優(yōu)勢,包括使課堂更真實,有修正功能,使學(xué)習(xí)過程更具激勵性和趣味性。

中國學(xué)者也積極將數(shù)據(jù)驅(qū)動學(xué)習(xí)運(yùn)用到課堂實踐。俞燕明[3]對數(shù)據(jù)驅(qū)動詞匯教學(xué)進(jìn)行了探索,發(fā)現(xiàn)該模式能有效提高學(xué)生詞匯水平,對培養(yǎng)學(xué)生自主學(xué)習(xí)和研究性思維有一定促進(jìn)作用。李德超、王克非[4]利用數(shù)據(jù)驅(qū)動學(xué)習(xí)輔助旅游翻譯教學(xué)課堂實踐,認(rèn)為該學(xué)習(xí)模式能促進(jìn)旅游翻譯教學(xué)理念的轉(zhuǎn)變,教學(xué)形式的多樣化,并引導(dǎo)學(xué)生獲得“自主學(xué)習(xí)”的樂趣。

(二)口譯語料庫的國內(nèi)外發(fā)展現(xiàn)狀

目前世界上規(guī)模最大的口譯語料庫是日本名古屋大學(xué)設(shè)計開發(fā)的英、日雙語的同傳語料庫,采編口譯錄音材料共182小時,轉(zhuǎn)寫材料約1百萬字。在建的有英語、意大利語、西班牙語的多語平行語料庫“歐洲議會口譯語料庫(EPIC)”,匯集并轉(zhuǎn)寫歐洲議會同傳的材料,由意大利博洛尼亞大學(xué)開發(fā),目前容量為18萬字。此外還有用于譯員教學(xué)和培訓(xùn)的語料庫,例如歐盟口譯司開發(fā)的Speech Repository等。

國內(nèi)的口譯語料庫研究起步于2007年以后,目前已初具規(guī)模的口譯語料庫是由上海交通大學(xué)研究開發(fā)的“漢英會議口譯語料庫(CECIC)”。該語料庫是以國內(nèi)外新聞發(fā)布會口譯活動為對象的平行語料庫,包括漢英口譯語料庫、英語原語語料庫、漢語原語語料庫三個子庫,目前容量約為54萬字。此外還有一些民間發(fā)起的口譯合作平臺,例如Speechpool、Chinese Speech Bank等。

三、數(shù)據(jù)驅(qū)動下的口譯學(xué)習(xí)者語料庫建設(shè)構(gòu)想

結(jié)合口譯教學(xué)實踐,構(gòu)建一個數(shù)據(jù)驅(qū)動下的口譯學(xué)習(xí)者語料庫,具有教學(xué)價值和科研意義。一方面,語料庫的構(gòu)建要求在口譯訓(xùn)練中對學(xué)習(xí)者進(jìn)行錄音或錄像,作為口譯監(jiān)控的一種有效方式,有助于學(xué)生在通用交傳階段完成口譯任務(wù)和口譯能力的提高。同時,基于該語料庫的數(shù)據(jù)驅(qū)動學(xué)習(xí)使學(xué)生能夠通過關(guān)鍵詞檢索,找到相關(guān)話題和演講,并使用語料庫中的音頻和視頻進(jìn)行口譯練習(xí)或進(jìn)行同輩反饋,節(jié)約了上網(wǎng)搜索練習(xí)素材的時間,并提供了同輩之間相互學(xué)習(xí)、教師提供指導(dǎo)反饋的平臺。另一方面,口譯學(xué)習(xí)者語料庫具有學(xué)術(shù)價值。口譯學(xué)習(xí)者語料庫可以為副語言研究、口譯策略研究等話題提供研究數(shù)據(jù),此外,建立口譯學(xué)習(xí)者語料庫,對比考察口譯學(xué)員和職業(yè)口譯員在口譯策略、口譯質(zhì)量等方面的差異,能夠全面顯示口譯學(xué)習(xí)與實踐對口譯技能發(fā)展的影響,對口譯教學(xué)和培訓(xùn)有明顯而實際的啟示意義及應(yīng)用價值[5]。

結(jié)合歐盟口譯司Speech Repository的語料庫模型,參照數(shù)據(jù)驅(qū)動語言學(xué)習(xí)的提出問題(Identify),材料分類(Classify)和歸納總結(jié)(Generalize)三階段,本口譯學(xué)習(xí)者語料庫的具體操作模式如下:

根據(jù)我國大學(xué)本科英語專業(yè)大三大四學(xué)生的實際水平和需要,本語料庫擬將涵蓋記憶練習(xí)、筆記練習(xí)和口譯應(yīng)試能力練習(xí)三個訓(xùn)練重點(diǎn)。

記憶練習(xí)的音視頻長度設(shè)計在1-2分鐘,話題難度為簡單,術(shù)語頻次低,對話題來源不做要求。以一學(xué)期16周計算,記憶練習(xí)主要安排在課程的1-3周,主要目的在于鍛煉學(xué)生的注意力、分析能力和短時記憶。相應(yīng)的,學(xué)生按照上述要求,每人每周有針對性地準(zhǔn)備1篇中文演講和1篇英文演講,課下自行錄音或錄像,經(jīng)教師審核后,上傳到數(shù)據(jù)庫平臺。課上,教師可使用該語料指導(dǎo)學(xué)生進(jìn)行交互練習(xí),即一個學(xué)生聽另一個學(xué)生的演講進(jìn)行源語復(fù)述(中-中,英-英)或者翻譯練習(xí)(中-英,英-中)。練習(xí)結(jié)束后,教師和同輩可對具體學(xué)生的口譯表現(xiàn)進(jìn)行反饋,分析該演講的邏輯結(jié)構(gòu)和記憶要點(diǎn)。

筆記練習(xí)的音視頻長度設(shè)計在5-8分鐘,話題難度根據(jù)學(xué)生水平可分級為入門級、中級和高級,術(shù)語頻次按級增加,話題要求涵蓋口譯工作的主要領(lǐng)域,文本內(nèi)容可以自擬,也可以參照網(wǎng)上的資料進(jìn)行改寫。同樣以一學(xué)期16周計算,筆記練習(xí)主要安排在4-16周,旨在鍛煉學(xué)生的口譯筆記系統(tǒng)、分析提煉能力和篇章表達(dá)能力。類似的,學(xué)生按照上述要求,每人每周有針對性地準(zhǔn)備1篇中文演講和1篇英文演講,課下自行錄音或錄像,經(jīng)教師審核后,上傳到數(shù)據(jù)庫平臺。課上,教師每周從語料庫中選取1篇中文演講和1篇英文演講,指導(dǎo)學(xué)生進(jìn)行課堂練習(xí),主要訓(xùn)練并考察學(xué)生筆記系統(tǒng)的建立、有筆記交傳的譯出質(zhì)量以及相關(guān)百科知識。課下,學(xué)生進(jìn)行小組練習(xí),通過關(guān)鍵詞搜索功能調(diào)用語料庫的音視頻,輪流練習(xí)并進(jìn)行相互反饋。

口譯應(yīng)試能力練習(xí)的音視頻長度設(shè)計在5分鐘左右,材料來源于CATTI三級和二級的真題。材料由教師收集整理,制作成音頻或視頻,上傳至數(shù)據(jù)庫平臺。該材料的訓(xùn)練側(cè)重于應(yīng)試訓(xùn)練,主要安排在14-16周以及假期,旨在讓學(xué)生接觸真實的考試題型和考察話題,通過練習(xí)了解CATTI證書考試的形式和內(nèi)容,從而可以查缺補(bǔ)漏,進(jìn)行針對性練習(xí)。

針對上述數(shù)據(jù)類型和用戶層次,本數(shù)據(jù)庫初步定位于交替?zhèn)髯g訓(xùn)練用途,語種為英語和漢語,語料難度分為入門、中等和高級,語料類型為演講,話題囊括會議致辭、人物訪談、信息科技、體育健康、環(huán)境保護(hù)、經(jīng)濟(jì)、社會、外交、國情等口譯工作的常見方面。教師組建工作坊,對收集到的每一篇語料進(jìn)行編號,定義檢索關(guān)鍵詞,并對口譯中的原語和譯語文本進(jìn)行轉(zhuǎn)寫,完成詞性附碼、標(biāo)注等工作。在語料庫界面開發(fā)方面,由計算機(jī)編程人員開發(fā)針對上述數(shù)據(jù)并能夠?qū)崿F(xiàn)在線檢索功能的人機(jī)交互界面,實現(xiàn)語種、難度、領(lǐng)域選擇和關(guān)鍵詞、編號搜索等功能。

數(shù)據(jù)庫初步建立后,首先在個別高校進(jìn)行教師、學(xué)生用戶公測,完善數(shù)據(jù)結(jié)構(gòu)和檢索程序,擴(kuò)充數(shù)據(jù)庫語料容量、種類和適用范圍,以期為更多口譯學(xué)習(xí)者提供便利,發(fā)揮更大的價值。此外,還可以建立一套基于本數(shù)據(jù)庫語料的數(shù)據(jù)驅(qū)動口譯學(xué)習(xí)方案,把數(shù)據(jù)運(yùn)用到課堂實踐,讓學(xué)生真正成為數(shù)據(jù)的貢獻(xiàn)者、使用者和受益者。

四、結(jié)束語

建設(shè)一個數(shù)據(jù)驅(qū)動下的口譯學(xué)習(xí)者語料庫是運(yùn)用新技術(shù)促進(jìn)口譯教學(xué)和科研發(fā)展的重要途徑。比起傳統(tǒng)的教材編寫,數(shù)據(jù)庫的建立能夠為口譯學(xué)習(xí)者和研究者提供容量更大、種類更多、速度更快、價值更高的練習(xí)和研究素材。此外,依托數(shù)據(jù)庫平臺,口譯學(xué)習(xí)從課內(nèi)延伸到課外,在搜集語料、錄制語料、使用語料進(jìn)行練習(xí)和接受反饋的過程中,學(xué)生的信息篩選能力、口語表達(dá)能力和口譯技巧得到潛移默化的鍛煉。同時,通過積極參與本語料庫的建設(shè),并將其與口譯學(xué)習(xí)結(jié)合起來,學(xué)生將成為該數(shù)據(jù)驅(qū)動學(xué)習(xí)模式中最積極的因子和最大的受益方。

當(dāng)然,語料庫的建設(shè)需要大量精力和時間投入。從語料庫的容量建設(shè)上來看,絕非短短幾年,憑借一屆或幾屆口譯學(xué)習(xí)者的貢獻(xiàn)就可以達(dá)到預(yù)期規(guī)模。此外,在技術(shù)層面上需要外語專業(yè)和信息技術(shù)等專業(yè)的合作,具體難點(diǎn)包括質(zhì)量監(jiān)控、程序編寫、語料標(biāo)注、信息處理和互聯(lián)網(wǎng)平臺搭建等。從長遠(yuǎn)來看,建設(shè)這樣一個數(shù)據(jù)驅(qū)動下的口譯學(xué)習(xí)者語料庫,收集與口譯學(xué)習(xí)相關(guān)的語料,搭建一個口譯練習(xí)反饋的平臺,具有較大的教育意義和應(yīng)用價值。同時,數(shù)據(jù)庫的不斷更新和推廣能夠為高校口譯教學(xué)和科研提供最新的素材和數(shù)據(jù),讓口譯培訓(xùn)行業(yè)跟上“大數(shù)據(jù)”時代的步伐,為社會貢獻(xiàn)更多高水平的口譯人才。

[1]Johns,Tim.Data-driven Learning:the Perpetual Challenge [C].Language and Computers,2000:107-117.

[2]Gilquin,G.,Granger,S.How Can Data-driven Learning be Us ed in Language Teaching[C].The Routledge Handbook of Corp us Linguistics,2010:359-370.

[3]俞燕明.數(shù)據(jù)驅(qū)動詞匯教學(xué)-基于計算機(jī)和語料庫的研究性教學(xué)探索[J].外語電化教學(xué),2009(3):58-62.

[4]李德超,王克非.基于雙語旅游語料庫的DDL翻譯教學(xué)[J].外語電化教學(xué),2011(1):20-26.

[5]張威.近十年來口譯語料庫研究現(xiàn)狀及發(fā)展趨勢[J].浙江大學(xué)學(xué)報(人文社會科學(xué)版),2012(2):201.

This study proposes to construct a Chinese-English corpus for interpreting learners based on Datadriven Learning theory.The corpus is aimed at pushing forward the modernization of interpreting training,providing data for interpreting researchers and cultivating more capable interpreting professionals for the society.

data-driven learning;interpreting;corpus

G642

A

2096-000X(2016)17-0131-02

安徽新華學(xué)院校級科研項目(編號:2016rw015)

伍彥(1989,09-),女,漢族,安徽潛山,碩士,助教,研究方向:口譯理論與實踐。

猜你喜歡
口譯語料語料庫
《語料庫翻譯文體學(xué)》評介
中外口譯研究對比分析
把課文的優(yōu)美表達(dá)存進(jìn)語料庫
基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
EAP視聽說對英語口譯關(guān)聯(lián)遷移的增效性——以交替?zhèn)髯g為例
華語電影作為真實語料在翻譯教學(xué)中的應(yīng)用
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
《苗防備覽》中的湘西語料
國內(nèi)外語用學(xué)實證研究比較:語料類型與收集方法
論心理認(rèn)知與口譯記憶
商河县| 紫金县| 清河县| 灵丘县| 旬阳县| 刚察县| 满城县| 江安县| 牡丹江市| 彩票| 宁阳县| 双江| 瓦房店市| 连城县| 揭东县| 崇州市| 普定县| 绵阳市| 治县。| 鄱阳县| 天台县| 清水河县| 葫芦岛市| 庄浪县| 织金县| 龙游县| 贵德县| 民权县| 库车县| 永兴县| 东丽区| 湘潭市| 卓尼县| 乌兰浩特市| 白沙| 东宁县| 澄迈县| 南木林县| 昂仁县| 石阡县| 宜宾县|