国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語(yǔ)料庫(kù)語(yǔ)言學(xué)的過(guò)去、現(xiàn)在與未來(lái)

2013-12-29 00:00:00王聰穎
考試周刊 2013年48期

摘要: 本文簡(jiǎn)要敘述了語(yǔ)料庫(kù)語(yǔ)言學(xué)的歷史,重點(diǎn)描述了語(yǔ)料庫(kù)語(yǔ)言學(xué)與詞匯研究,翻譯理論研究,以及漢語(yǔ)研究等領(lǐng)域的合作及進(jìn)展情況,指出語(yǔ)料庫(kù)語(yǔ)言學(xué)對(duì)其他學(xué)科的發(fā)展作出了巨大貢獻(xiàn)。展望了語(yǔ)料庫(kù)語(yǔ)言學(xué)的未來(lái)發(fā)展方向和趨勢(shì),指出未來(lái)幾十年語(yǔ)料庫(kù)語(yǔ)言學(xué)將迎來(lái)繁榮期,語(yǔ)料庫(kù)語(yǔ)言學(xué)必將為推動(dòng)其他學(xué)科的發(fā)展發(fā)揮巨大作用。

關(guān)鍵詞: 語(yǔ)料庫(kù)語(yǔ)言學(xué) 過(guò)去 現(xiàn)在 未來(lái)

一、語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展史

語(yǔ)料庫(kù)語(yǔ)言學(xué)研究是以大規(guī)模的機(jī)器可讀語(yǔ)料為基礎(chǔ)的,一般認(rèn)為始于上世紀(jì)60年代。但是在機(jī)讀語(yǔ)料庫(kù)出現(xiàn)之前,語(yǔ)料庫(kù)研究已廣泛用于圣經(jīng)和文學(xué)研究、詞匯、方言研究等領(lǐng)域,這一時(shí)期也被稱(chēng)為“前電子語(yǔ)料庫(kù)時(shí)期”。

在SEU語(yǔ)料庫(kù)創(chuàng)建不久,英語(yǔ)語(yǔ)料庫(kù)的編制進(jìn)入了電子時(shí)代。語(yǔ)料庫(kù)電子時(shí)代又分為第一代和第二代。

第一代電子語(yǔ)料庫(kù)時(shí)期建立的主要語(yǔ)料庫(kù)有布朗語(yǔ)料庫(kù)(The Brown Corpus)、蘭卡斯特-奧斯陸/卑爾根語(yǔ)料庫(kù)(LOB Corpus)、倫敦-隆德語(yǔ)料庫(kù)(LLC)等。LOB語(yǔ)料庫(kù)由英國(guó)蘭卡斯特大學(xué)和挪威奧斯陸大學(xué)與挪威人文科學(xué)計(jì)算中心共同合作建立。LOB語(yǔ)料庫(kù)被認(rèn)為可與布朗語(yǔ)料庫(kù)相媲美,它收集了1961年出版的英國(guó)書(shū)面,同樣有500篇文本,每篇約2000詞,共計(jì)100萬(wàn)詞次。1975年,瑞典隆德大學(xué)開(kāi)始將英國(guó)SEU語(yǔ)料庫(kù)收集的英語(yǔ)口語(yǔ)材料轉(zhuǎn)化成機(jī)讀的形式,并在原來(lái)語(yǔ)料的基礎(chǔ)上增加了13篇文本,經(jīng)過(guò)加工整理,收錄100篇文本,于1980年建立起倫敦-隆德英語(yǔ)口語(yǔ)料庫(kù)。

在第一代電子語(yǔ)料庫(kù)的基礎(chǔ)上,第二代電子語(yǔ)料庫(kù)收錄內(nèi)容不再僅限于口語(yǔ)語(yǔ)料,語(yǔ)言信息更多,相比之下,更加完善,實(shí)用。第二代電子語(yǔ)料庫(kù)主要有COBUILD語(yǔ)料庫(kù)、朗文語(yǔ)料庫(kù)、國(guó)際英語(yǔ)語(yǔ)料庫(kù)等。

COBUILD計(jì)劃是英國(guó)柯林斯出版社和伯明翰大學(xué)的一個(gè)合作項(xiàng)目,歷時(shí)4年多,于1984年完成。1990年SINCLAIR宣布,COBUILD語(yǔ)料庫(kù)經(jīng)過(guò)擴(kuò)展,更名為英語(yǔ)庫(kù)。1997年,其所含的語(yǔ)料已超過(guò)3億詞次,并且還在不斷擴(kuò)大。朗文語(yǔ)料庫(kù)網(wǎng)由英國(guó)的三大語(yǔ)料庫(kù)組成,它們是朗文蘭卡斯特英語(yǔ)語(yǔ)言語(yǔ)料庫(kù)、朗文口語(yǔ)語(yǔ)料庫(kù)和朗文學(xué)習(xí)者英語(yǔ)語(yǔ)料庫(kù)。該語(yǔ)料庫(kù)取材自1900年以來(lái)英國(guó)英語(yǔ)、美國(guó)英語(yǔ)和世界上其他主要的英語(yǔ)變體,涉及書(shū)面英語(yǔ)和口頭英語(yǔ)兩種形式,是一個(gè)覆蓋范圍很廣的語(yǔ)料庫(kù),計(jì)劃庫(kù)容為5000萬(wàn)詞次,到90年代早期,庫(kù)容已達(dá)到3000萬(wàn)詞次。國(guó)際英語(yǔ)語(yǔ)料庫(kù)的最大特點(diǎn)是其嚴(yán)密的組織和語(yǔ)料庫(kù)的國(guó)際性和代表性,統(tǒng)一的標(biāo)準(zhǔn)和周密的設(shè)計(jì)確保了語(yǔ)料庫(kù)的質(zhì)量,其潛在的研究與應(yīng)用價(jià)值與日俱增[1]。

在我國(guó)已完成的語(yǔ)料庫(kù)有上海交大的黃人杰、楊惠中主持完成的專(zhuān)門(mén)用途英語(yǔ)語(yǔ)料庫(kù)、交通大學(xué)科技英語(yǔ)語(yǔ)料庫(kù),北京大學(xué)計(jì)算語(yǔ)言研究所開(kāi)發(fā)建設(shè)的Babel漢英平行語(yǔ)料庫(kù),北外中國(guó)外語(yǔ)教育研究中心創(chuàng)建的北外雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù),以及由上海交通大學(xué)外國(guó)語(yǔ)學(xué)院翻譯與詞典學(xué)研究中心創(chuàng)建的莎士比亞戲劇英漢平行語(yǔ)料庫(kù)等。

二、語(yǔ)料庫(kù)與其他學(xué)科的關(guān)系

1.語(yǔ)料庫(kù)的學(xué)科定位

什么是語(yǔ)料庫(kù)語(yǔ)言學(xué)?很多學(xué)者和語(yǔ)言學(xué)家都各自給出過(guò)定義:

(1)K.Ailmer&B.Altenberg 指出,根據(jù)篇章材料對(duì)語(yǔ)言的研究稱(chēng)為語(yǔ)料庫(kù)語(yǔ)言學(xué)[2]。

(2)基于現(xiàn)實(shí)生活中語(yǔ)言運(yùn)用的實(shí)例進(jìn)行的語(yǔ)言研究稱(chēng)為語(yǔ)料庫(kù)語(yǔ)言學(xué)(T.McEnery & A.Wilson,1996:1)[3]。

(3)黃昌寧指出:“語(yǔ)料庫(kù)語(yǔ)言學(xué)是80年代才嶄露頭角的一門(mén)計(jì)算機(jī)語(yǔ)言學(xué)的新的分支學(xué)科。它研究機(jī)器可讀的自然語(yǔ)言文本的采集、存儲(chǔ)、檢索、統(tǒng)計(jì)、語(yǔ)法標(biāo)注、句法語(yǔ)義分析,以及具有上述功能的語(yǔ)料庫(kù)在語(yǔ)言定量分析、詞典編纂、作品風(fēng)格分析、自然語(yǔ)言理解和機(jī)器翻譯等領(lǐng)域中的應(yīng)用[4]?!?/p>

2.語(yǔ)料庫(kù)的應(yīng)用

語(yǔ)料庫(kù)語(yǔ)言學(xué)經(jīng)過(guò)半個(gè)多世紀(jì)的發(fā)展,已與多個(gè)學(xué)科結(jié)合在一起,形成典型的跨學(xué)科領(lǐng)域。目前,語(yǔ)料庫(kù)已被用于詞典編纂、詞匯研究、句法研究、語(yǔ)義研究、語(yǔ)用研究與話語(yǔ)分析、文體學(xué)研究、機(jī)器翻譯、社會(huì)語(yǔ)言學(xué)研究等領(lǐng)域,并取得了豐碩的成果。

(1)語(yǔ)料庫(kù)在詞匯研究領(lǐng)域的應(yīng)用

近年來(lái),借助語(yǔ)料庫(kù)對(duì)于詞匯學(xué)的研究取得了一定的進(jìn)展。衛(wèi)乃興指出:“詞語(yǔ)搭配是當(dāng)今語(yǔ)料庫(kù)語(yǔ)言學(xué)研究中最為活躍的領(lǐng)域,它處于中心地位?!蓖蹩朔呛秃@耀借助語(yǔ)料庫(kù)對(duì)翻譯漢語(yǔ)詞匯和源語(yǔ)詞匯進(jìn)行對(duì)比分析,考察翻譯漢語(yǔ)區(qū)別于漢語(yǔ)源語(yǔ)語(yǔ)料的詞匯使用特征。采用定量分析研究詞匯使用情況顯然更有說(shuō)服力,從這個(gè)意義上說(shuō),語(yǔ)料庫(kù)在詞匯研究領(lǐng)域十分有價(jià)值。

另外,衛(wèi)乃興在詞匯搭配方面做出了積極的探索。衛(wèi)指出,研究專(zhuān)業(yè)性搭配可進(jìn)一步豐富詞語(yǔ)搭配研究的內(nèi)容,對(duì)描述科技文章中詞語(yǔ)組合的特點(diǎn)與規(guī)律,其語(yǔ)義特點(diǎn)和語(yǔ)篇組織特點(diǎn)都有重要價(jià)值[5]。

(2)語(yǔ)料庫(kù)與翻譯學(xué)

語(yǔ)料庫(kù)翻譯學(xué)的創(chuàng)始人是以英國(guó)曼徹斯特大學(xué)翻譯與跨文化研究中心MONA BAKER教授為代表的一批學(xué)者。語(yǔ)料庫(kù)翻譯學(xué)是指以語(yǔ)料庫(kù)為基礎(chǔ),以真實(shí)的雙語(yǔ)語(yǔ)料或翻譯語(yǔ)料為研究對(duì)象,以數(shù)據(jù)統(tǒng)計(jì)與理論分析為研究方法,依據(jù)語(yǔ)言學(xué)、文學(xué)和文化理論及翻譯學(xué)理論,系統(tǒng)分析翻譯本質(zhì)、翻譯過(guò)程和翻譯現(xiàn)象等內(nèi)容的研究[6]。

一般來(lái)說(shuō),用于翻譯學(xué)研究的語(yǔ)料庫(kù)有平行語(yǔ)料庫(kù),翻譯語(yǔ)料庫(kù),可比語(yǔ)料庫(kù)和口譯語(yǔ)料庫(kù)等?,F(xiàn)已建成的比較成熟的譯學(xué)研究語(yǔ)料庫(kù)有翻譯英語(yǔ)語(yǔ)料庫(kù)、Babel漢英平行語(yǔ)料庫(kù)、北外雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù)、中國(guó)法律法規(guī)漢英平行語(yǔ)料庫(kù)、全國(guó)公示語(yǔ)翻譯語(yǔ)料庫(kù)、莎士比亞戲劇英漢平行語(yǔ)料庫(kù)、奧斯陸多語(yǔ)語(yǔ)料庫(kù)等,很多語(yǔ)料庫(kù)資源是共享的,研究者可以根據(jù)需要選擇合適的語(yǔ)料庫(kù)[7]。

語(yǔ)料庫(kù)翻譯學(xué)研究雖然只有短短十幾年的發(fā)展歷史,但起步較快,發(fā)展勢(shì)頭迅猛。語(yǔ)料庫(kù)翻譯學(xué)區(qū)別于傳統(tǒng)的譯學(xué),為翻譯學(xué)科的發(fā)展提供了新的思路和發(fā)展方向,使得譯學(xué)研究?jī)?nèi)容得到不斷拓展和延伸。

(3)語(yǔ)料庫(kù)與漢語(yǔ)研究

語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展和英語(yǔ)語(yǔ)料庫(kù)的建設(shè)推動(dòng)了漢語(yǔ)語(yǔ)料庫(kù)的建設(shè)和漢語(yǔ)的研究。

我國(guó)在離散單詞、簡(jiǎn)單口令的語(yǔ)音識(shí)別方面已經(jīng)取得不少進(jìn)展。90年代,中國(guó)科學(xué)院自動(dòng)化研究所研制了“漢語(yǔ)大詞匯量語(yǔ)音識(shí)別與口呼文本輸入系統(tǒng)”,以聲韻調(diào)為基元來(lái)進(jìn)行語(yǔ)音識(shí)別,識(shí)別時(shí)采用了隱馬爾可夫模型及人工神經(jīng)網(wǎng)絡(luò)方法[8]。

另外,在漢字識(shí)別系統(tǒng)的研究方面也取得了很多成績(jī)。我國(guó)從上世紀(jì)70年代開(kāi)始漢字自動(dòng)識(shí)別的研究工作,清華大學(xué)、北京郵電大學(xué)、武漢工業(yè)大學(xué)等研發(fā)的系統(tǒng)漢字識(shí)別率都相對(duì)較高,成績(jī)喜人。

此外,很多學(xué)者利用語(yǔ)料庫(kù)進(jìn)行語(yǔ)義韻研究。語(yǔ)料庫(kù)在人工智能和外語(yǔ)教學(xué)等方面也大有用武之地。很多時(shí)候,語(yǔ)料庫(kù)用于其他學(xué)科并不是涇渭分明的,語(yǔ)料庫(kù)研究范式可以將多個(gè)學(xué)科研究有機(jī)地結(jié)合在一起,從而能夠更好地服務(wù)于各個(gè)學(xué)科。

三、語(yǔ)料庫(kù)的未來(lái)

梁茂成曾指出[9],由于大型語(yǔ)料庫(kù)包含了大量的語(yǔ)言事實(shí),無(wú)論是從事理論研究的理論語(yǔ)言學(xué)家,還是從事實(shí)研究的經(jīng)驗(yàn)語(yǔ)言學(xué)家,語(yǔ)料庫(kù)都將成為最重要的數(shù)據(jù)源。

在未來(lái)語(yǔ)料庫(kù)語(yǔ)言學(xué)探索的道路上,其發(fā)展趨勢(shì)將會(huì)呈現(xiàn)以下特點(diǎn):

首先,隨著科技的進(jìn)步,尤其是計(jì)算機(jī)網(wǎng)絡(luò)信息技術(shù)的爆炸式發(fā)展,語(yǔ)料庫(kù)的庫(kù)容將不是難題。語(yǔ)料庫(kù)的容量將會(huì)進(jìn)一步增大,以滿足增大樣本的需求,以便于更加全面客觀地進(jìn)行語(yǔ)言研究。

其次,語(yǔ)料庫(kù)的類(lèi)型將會(huì)更加多樣化。為了不同學(xué)科和研究的需要,未來(lái)的語(yǔ)料庫(kù)將會(huì)更加多樣,以適應(yīng)不同研究的需要。

再次,語(yǔ)料庫(kù)與其他學(xué)科的聯(lián)系將會(huì)更加緊密,甚至語(yǔ)料庫(kù)與多個(gè)學(xué)科同時(shí)融合在一起,從而更好地開(kāi)展研究工作。正如劉滿堂指出,隨著語(yǔ)料庫(kù)應(yīng)用領(lǐng)域的不斷擴(kuò)大,語(yǔ)言研究各領(lǐng)域越來(lái)越依賴(lài)于電子語(yǔ)料庫(kù)這一研究工具,語(yǔ)料庫(kù)語(yǔ)言語(yǔ)言學(xué)正逐漸成為一個(gè)跨學(xué)科的語(yǔ)言學(xué)分支[10]。語(yǔ)料庫(kù)與翻譯學(xué)、詞典學(xué)、計(jì)算語(yǔ)言學(xué)、人工智能等學(xué)科結(jié)合,必將極大地促進(jìn)各個(gè)學(xué)科的發(fā)展。

四、結(jié)語(yǔ)

語(yǔ)料庫(kù)語(yǔ)言學(xué)是一門(mén)新興的學(xué)科,同時(shí)它又是一門(mén)交叉學(xué)科?;谶@點(diǎn),語(yǔ)言庫(kù)語(yǔ)言學(xué)有著廣闊的前景和發(fā)展空間。未來(lái)語(yǔ)料庫(kù)自身建設(shè)和完善是擺在研究者面前的新的有意義的課題。此外,語(yǔ)料庫(kù)與其他各個(gè)學(xué)科的結(jié)合和應(yīng)用還有待進(jìn)一步探索。

參考文獻(xiàn):

[1]劉滿堂.近40年英語(yǔ)語(yǔ)料庫(kù)及語(yǔ)料庫(kù)語(yǔ)言學(xué)研究的回顧與展望[J].陜西教育學(xué)院學(xué)報(bào),2004,20(1):98-100.

[2]Ailmer,J.& B.Altenberg(eds.) English Corpus Linguistics:Studies in Honor of Jan Svartvik[C].Longman.1991.

[3]T.McEnery,A.&A.Wilson.Corpus Linguistics[M].Edinburgh:Edinburgh University Press,1996.

[4]黃昌寧.語(yǔ)料庫(kù)語(yǔ)言學(xué)[M].北京:商務(wù)印書(shū)館,2002.

[5]衛(wèi)乃興.專(zhuān)業(yè)性搭配初探[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào)2001,24,(4):20-23.

[6]胡開(kāi)寶.語(yǔ)料庫(kù)翻譯學(xué)概論[M].上海:上海交通大學(xué)出版社,2011:1.

[7]胡開(kāi)寶.基于語(yǔ)料庫(kù)的莎劇《哈姆雷特》漢譯本中“把”字句應(yīng)用及其動(dòng)因研究[J].外語(yǔ)學(xué)刊,2009(1):111-115.

[8]馮志偉.基于語(yǔ)料庫(kù)的機(jī)器翻譯系統(tǒng)[J].術(shù)語(yǔ)標(biāo)準(zhǔn)化與信息技術(shù),2010,1:28.

[9]梁茂成.理性主義、經(jīng)驗(yàn)主義與語(yǔ)料庫(kù)語(yǔ)言學(xué)[J].中國(guó)英語(yǔ)教育,2009,4.

[10]劉滿堂.近40年英語(yǔ)語(yǔ)料庫(kù)及語(yǔ)料庫(kù)語(yǔ)言學(xué)研究的回顧與展望[J].陜西教育學(xué)院學(xué)報(bào),2004,20(1):102.

泸州市| 马公市| 松溪县| 鹤山市| 霍林郭勒市| 宁国市| 浦城县| 安国市| 南雄市| 吴桥县| 祁阳县| 嘉峪关市| 中牟县| 图木舒克市| 孟津县| 衡东县| 江口县| 汪清县| 集安市| 鸡西市| 江陵县| 会理县| 留坝县| 潮安县| 施秉县| 利川市| 普陀区| 靖边县| 绥化市| 巴里| 澄迈县| 慈利县| 运城市| 隆回县| 三都| 武城县| 车险| 黄骅市| 武乡县| 商都县| 景谷|