国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語(yǔ)料庫(kù)的分類應(yīng)用以及在中國(guó)的發(fā)展趨勢(shì)

2015-09-10 07:22:44崔穎
考試周刊 2015年37期
關(guān)鍵詞:語(yǔ)料庫(kù)發(fā)展趨勢(shì)

崔穎

摘 要: 語(yǔ)料庫(kù)是對(duì)生活中的語(yǔ)言資料加以收集和整理,便于使用者進(jìn)行研究和分析的一種研究方法。我國(guó)對(duì)語(yǔ)料庫(kù)的研究雖落后于西方,但是從上世紀(jì)開始,國(guó)內(nèi)語(yǔ)料庫(kù)取得了前所未有的發(fā)展。本文陳述了國(guó)內(nèi)語(yǔ)料庫(kù)的分類,分析了語(yǔ)料庫(kù)的應(yīng)用和在國(guó)內(nèi)的發(fā)展趨勢(shì),為語(yǔ)料庫(kù)的使用者和研究者提供了了解語(yǔ)料庫(kù)的途徑。

關(guān)鍵詞: 語(yǔ)料庫(kù) 分類應(yīng)用 發(fā)展趨勢(shì)

語(yǔ)料庫(kù)研究是基于人類真實(shí)的語(yǔ)言資料,調(diào)查和分析語(yǔ)言的分布、使用規(guī)律、使用頻率和使用模式的一種研究方法。電腦科技的發(fā)展,為語(yǔ)料庫(kù)研究帶來(lái)了前所未有的發(fā)展機(jī)會(huì)。由于電腦具有龐大的存儲(chǔ)功能、篩查功能和分析功能,20世紀(jì)的中后期形成了許多對(duì)電腦語(yǔ)料庫(kù)的對(duì)比研究的語(yǔ)言學(xué)理論。

從20世紀(jì)20年代開始就有學(xué)者為制定基礎(chǔ)漢字字表開始建立語(yǔ)料庫(kù)。自上世紀(jì)70年代末以來(lái),現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)(1983年)等機(jī)器可讀語(yǔ)料庫(kù)開始建設(shè)。90年代以后,以《人民日?qǐng)?bào)》光盤數(shù)據(jù)庫(kù)、北大語(yǔ)料庫(kù)為代表的大型漢語(yǔ)語(yǔ)料庫(kù)日益發(fā)展,語(yǔ)料庫(kù)成為研究漢語(yǔ)的主要資源。我國(guó)從上個(gè)世紀(jì)80年代,由上海交通大學(xué)楊惠中教授為首的項(xiàng)目組開始建設(shè)JDEST學(xué)術(shù)英語(yǔ)語(yǔ)料庫(kù),促進(jìn)了英語(yǔ)語(yǔ)料庫(kù)語(yǔ)言學(xué)在中國(guó)的發(fā)展。這個(gè)語(yǔ)料庫(kù)是當(dāng)時(shí)世界上的第一個(gè)同類語(yǔ)料庫(kù),也是國(guó)內(nèi)最大最完備的英語(yǔ)語(yǔ)料庫(kù)之一。由廣東外語(yǔ)外貿(mào)大學(xué)桂詩(shī)春教授和楊惠中教授合辦開發(fā)的“中國(guó)學(xué)習(xí)者語(yǔ)料庫(kù)”(CLEC)于1999年建成,該語(yǔ)料庫(kù)廣泛收集了我國(guó)中學(xué)生和大學(xué)生在內(nèi)的超過(guò)一百萬(wàn)詞的各種書面語(yǔ)資料,并對(duì)所有語(yǔ)料進(jìn)行了語(yǔ)法標(biāo)注和言語(yǔ)失誤的標(biāo)注,對(duì)研究中國(guó)學(xué)習(xí)者的英語(yǔ)特點(diǎn)具有開創(chuàng)性的意義。最近幾十年,隨著電腦科技的發(fā)展和教育國(guó)際化的加深,語(yǔ)料庫(kù)語(yǔ)言學(xué)在中國(guó)的發(fā)展及其快速。我國(guó)現(xiàn)有的語(yǔ)料庫(kù)包括口筆譯語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù),研究方向包含許多方面,包括二語(yǔ)習(xí)得、翻譯對(duì)比、話語(yǔ)分析、認(rèn)知語(yǔ)言學(xué)等方面的研究。不同研究背景和學(xué)術(shù)背景的人都參與語(yǔ)料庫(kù)建設(shè),為語(yǔ)料庫(kù)帶來(lái)越來(lái)越多、越來(lái)越全面的研究資源。西方對(duì)語(yǔ)料庫(kù)的研究比中國(guó)早,通過(guò)國(guó)內(nèi)外的學(xué)術(shù)交流,國(guó)外的語(yǔ)言學(xué)家給中國(guó)的語(yǔ)料庫(kù)研究開辟了更廣闊的發(fā)展空間,帶來(lái)了許多新的知識(shí)和營(yíng)養(yǎng)。

一、語(yǔ)料庫(kù)的分類

語(yǔ)料庫(kù)主要是按照其收集語(yǔ)料的類別,研究的服務(wù)對(duì)象或研究的目的進(jìn)行分類的。我國(guó)現(xiàn)有的語(yǔ)料庫(kù)大致可以分為英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)、特殊英語(yǔ)語(yǔ)料庫(kù)、漢語(yǔ)語(yǔ)料庫(kù)等。

(一)英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)

英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)由廣東外語(yǔ)外貿(mào)大學(xué)和上海交通大學(xué)合作建設(shè)和開發(fā),簡(jiǎn)稱CLEC,其中搜羅100多萬(wàn)詞條,主要是針對(duì)中國(guó)的中學(xué)生和大學(xué)生等英語(yǔ)學(xué)習(xí)者在學(xué)習(xí)中的書面語(yǔ)進(jìn)行研究。該語(yǔ)料庫(kù)中標(biāo)注了學(xué)生的失誤,便于研究中國(guó)學(xué)生在習(xí)得英語(yǔ)的過(guò)程中的常見問(wèn)題進(jìn)行分析和研究。除此之外,上海交通大學(xué)所創(chuàng)立的大學(xué)英語(yǔ)學(xué)習(xí)者口語(yǔ)語(yǔ)料庫(kù)COLSEC包含了5萬(wàn)個(gè)詞次。與CLEC不同,這個(gè)語(yǔ)料庫(kù)偏重英語(yǔ)學(xué)習(xí)者在口語(yǔ)中常犯的問(wèn)題和錯(cuò)誤,為我們對(duì)中國(guó)學(xué)生英語(yǔ)口語(yǔ)的研究提供了便利。香港科技大學(xué)建設(shè)的香港科技大學(xué)學(xué)習(xí)者語(yǔ)料庫(kù)HKUST Learner Corpus,是針對(duì)大學(xué)英語(yǔ)學(xué)習(xí)者所使用的英語(yǔ)所建立的語(yǔ)料庫(kù),該語(yǔ)料庫(kù)針對(duì)的范圍主要是大學(xué)英語(yǔ)學(xué)習(xí)者,語(yǔ)料的收集主要是以在學(xué)習(xí)英語(yǔ)的大學(xué)生為對(duì)象,方便我們對(duì)大學(xué)生的英語(yǔ)思維和習(xí)慣進(jìn)行研究。而南京大學(xué)建設(shè)的中國(guó)英語(yǔ)專業(yè)語(yǔ)料庫(kù)CEMC,則是針對(duì)國(guó)內(nèi)英語(yǔ)專業(yè)的學(xué)生設(shè)立的語(yǔ)料庫(kù),這個(gè)語(yǔ)料庫(kù)共收集100多萬(wàn)詞次。

(二)平行語(yǔ)料庫(kù)

北京外國(guó)語(yǔ)大學(xué)建設(shè)的漢英平行語(yǔ)料庫(kù)PCCE,是涉及范圍最廣的漢英平行語(yǔ)料庫(kù)。國(guó)內(nèi)還有其他的一些比較具體和專業(yè)的語(yǔ)料庫(kù),比如馮友蘭的《中國(guó)哲學(xué)史》漢英對(duì)照語(yǔ)料庫(kù);香港城市理工大學(xué)建設(shè)的對(duì)比語(yǔ)料庫(kù)LIVAC;臺(tái)灣建設(shè)的平衡語(yǔ)料庫(kù)Sinica Corpus;國(guó)家語(yǔ)言文字工作委員會(huì)應(yīng)用研究所的計(jì)算機(jī)專業(yè)的雙語(yǔ)語(yǔ)料庫(kù),等等。

(三)特殊英語(yǔ)語(yǔ)料庫(kù)

由河南師范大學(xué)建設(shè)的中國(guó)英語(yǔ)(China English)語(yǔ)料庫(kù);由解放軍外語(yǔ)學(xué)院建設(shè)的軍事英語(yǔ)語(yǔ)料庫(kù)(Corpus of Military Texts);上海交通大學(xué)建設(shè)的新視野大學(xué)英語(yǔ)教材語(yǔ)料庫(kù),等等。

二、語(yǔ)料庫(kù)的應(yīng)用

(一)用于語(yǔ)言的研究

大量的語(yǔ)言素材存儲(chǔ)在語(yǔ)料庫(kù)中,按照一定的語(yǔ)言學(xué)原則分類組合在一起,這為語(yǔ)言的研究提供了方便和便利。對(duì)語(yǔ)言學(xué)家來(lái)說(shuō),語(yǔ)料庫(kù)的存在更方便他們查詢、檢索和分析語(yǔ)言原始數(shù)據(jù),從某種程度上說(shuō),簡(jiǎn)化了語(yǔ)言學(xué)家分析語(yǔ)料的過(guò)程和時(shí)間,大量的語(yǔ)言素材使語(yǔ)言學(xué)家對(duì)語(yǔ)言的定量分析成為可能。語(yǔ)料庫(kù)的存在便于語(yǔ)言學(xué)家揭示地區(qū)語(yǔ)言的特征及一個(gè)區(qū)域(國(guó)家或地區(qū))的語(yǔ)言使用情況。語(yǔ)料庫(kù)中的語(yǔ)言資料方便語(yǔ)言學(xué)家對(duì)語(yǔ)言的某些特征或結(jié)構(gòu)進(jìn)行檢索,比如某個(gè)詞匯或句型在某個(gè)語(yǔ)言或某個(gè)地區(qū)的語(yǔ)言中的分布等。

(二)用于語(yǔ)言測(cè)試

語(yǔ)料庫(kù)的存在為基于語(yǔ)言的測(cè)試試卷的出題和批改提供了依據(jù)。語(yǔ)料庫(kù)能夠揭示一些常見的問(wèn)題和錯(cuò)誤。對(duì)于出題者而言,能更方便地了解英語(yǔ)學(xué)習(xí)者在學(xué)習(xí)中常出現(xiàn)的問(wèn)題和錯(cuò)誤,從而在出題的時(shí)候具有針對(duì)性地測(cè)評(píng),更真實(shí)準(zhǔn)確地反映學(xué)生的語(yǔ)言學(xué)習(xí)狀況。對(duì)學(xué)生而言,語(yǔ)料庫(kù)能夠反映他們的不足,從而推動(dòng)他們對(duì)自己錯(cuò)誤的改進(jìn)和修正,利用語(yǔ)料庫(kù)做有針對(duì)性的復(fù)習(xí)和練習(xí),從而達(dá)到減少錯(cuò)誤和提高語(yǔ)言能力的目的。

(三)用于編撰字典

語(yǔ)料庫(kù)中所收集的大量詞條,是來(lái)源于真實(shí)生活的,是確實(shí)存在的句子和詞匯。在字典的編撰過(guò)程中,不僅要快速顯示和反映出詞條的出現(xiàn)頻率和各個(gè)語(yǔ)義的使用情況,而且真實(shí)生活的詞條會(huì)比編撰的詞條更形象、生動(dòng)、準(zhǔn)確。語(yǔ)料庫(kù)中詞匯和句型的使用還能反映語(yǔ)言的發(fā)展趨勢(shì),由于語(yǔ)言的發(fā)展日新月異,新的詞義和詞匯不停涌現(xiàn)。語(yǔ)料庫(kù)能夠幫助字典的編撰者很好地掌握和了解語(yǔ)言的發(fā)展趨勢(shì),從而在字典的編寫中與時(shí)俱進(jìn),添加最新的內(nèi)容。

(四)用于機(jī)器翻譯

隨著互聯(lián)網(wǎng)和國(guó)際化的發(fā)展,許多人傾向上網(wǎng)翻譯不懂的外語(yǔ)詞匯和句子。語(yǔ)料庫(kù)能夠歸納詞匯和句型的語(yǔ)義和語(yǔ)用,從而對(duì)給定的句子進(jìn)行分析,從語(yǔ)料庫(kù)中搜索出它所認(rèn)為最符合該句型或詞匯的翻譯方式。雖然仍有需要改進(jìn)的地方,但大致講,翻譯軟件已經(jīng)能夠滿足基本的翻譯,為語(yǔ)言不通的國(guó)人提供便利。同時(shí),語(yǔ)料庫(kù)還能對(duì)常見的英語(yǔ)或漢語(yǔ)錯(cuò)誤進(jìn)行分析,并提醒校正,大大節(jié)省翻譯者和語(yǔ)言學(xué)習(xí)者的時(shí)間和精力。

(五)用于語(yǔ)言教學(xué)

語(yǔ)料庫(kù)存儲(chǔ)的信息量相當(dāng)巨大,學(xué)習(xí)外語(yǔ)的學(xué)生對(duì)于如此龐大的數(shù)據(jù)庫(kù),可以按自己的要求和需要進(jìn)行檢索、分析和學(xué)習(xí)。由于語(yǔ)料庫(kù)中的語(yǔ)言信息來(lái)源于生活,因此更真實(shí)可靠,更生動(dòng)多樣。語(yǔ)言學(xué)習(xí)者對(duì)語(yǔ)料庫(kù)的使用是多元化的,這樣有利于促進(jìn)外語(yǔ)學(xué)習(xí)者的主觀能動(dòng)性的發(fā)揮。語(yǔ)料庫(kù)的使用者對(duì)語(yǔ)言資料的開放式的使用,為學(xué)生提供了思考的機(jī)會(huì),同時(shí)也為教師轉(zhuǎn)換角色提供了可能。

三、語(yǔ)料庫(kù)在中國(guó)的發(fā)展趨勢(shì)

語(yǔ)料庫(kù)在中國(guó)已經(jīng)得到長(zhǎng)足發(fā)展,各種語(yǔ)料庫(kù)紛紛涌現(xiàn)。隨著教育國(guó)際化和計(jì)算機(jī)技術(shù)的發(fā)展,學(xué)習(xí)者語(yǔ)料庫(kù)的建設(shè)是今后語(yǔ)料庫(kù)研究的重點(diǎn)之一,口語(yǔ)語(yǔ)料庫(kù)的發(fā)展和對(duì)口語(yǔ)語(yǔ)料進(jìn)行的話語(yǔ)分析已經(jīng)成為語(yǔ)料庫(kù)今后的發(fā)展方向。我國(guó)語(yǔ)料庫(kù)的發(fā)展雖然迅速,但仍然存在一些問(wèn)題。比如,語(yǔ)料資源的重復(fù)性,語(yǔ)料庫(kù)之間的獨(dú)立非信息共享的問(wèn)題,歷時(shí)語(yǔ)料庫(kù)對(duì)早期中國(guó)語(yǔ)料的收集問(wèn)題,以及語(yǔ)料庫(kù)在教學(xué)中應(yīng)用的問(wèn)題,都是亟待解決的巨大課題。

雖然語(yǔ)料庫(kù)發(fā)展迅速,但是仍然存在許多問(wèn)題。語(yǔ)料庫(kù)的存在和發(fā)展,無(wú)疑為我國(guó)語(yǔ)言學(xué)的研究和外語(yǔ)學(xué)習(xí)的發(fā)展作出了巨大的貢獻(xiàn)。隨著計(jì)算機(jī)的普及和人們對(duì)語(yǔ)料庫(kù)認(rèn)識(shí)的提高,語(yǔ)料庫(kù)的進(jìn)一步發(fā)展和大規(guī)模的應(yīng)用,以及它對(duì)外語(yǔ)教學(xué)的指導(dǎo),會(huì)隨著時(shí)間的推移而發(fā)揮更重要的作用。

參考文獻(xiàn):

[1]馮銳,朱慧,李會(huì)敏.語(yǔ)料庫(kù)及語(yǔ)料庫(kù)語(yǔ)言學(xué)研究初探[J].肇慶學(xué)院學(xué)報(bào),2009(06).

[2]甄鳳超.語(yǔ)料庫(kù)語(yǔ)言學(xué)在中國(guó)的成長(zhǎng)與發(fā)展[J].當(dāng)代外語(yǔ)研究,2010(03).

[3]孟塖.我國(guó)語(yǔ)料庫(kù)語(yǔ)言學(xué)研究現(xiàn)狀及展望[J].四川文理學(xué)院學(xué)報(bào),2012(06).

[4]黃曉梅,黃勇.語(yǔ)料庫(kù)語(yǔ)言學(xué)研究發(fā)展現(xiàn)狀淺析[J].新西部(理論版),2013(08).

[5]衛(wèi)乃興.語(yǔ)義韻研究的一般方法[J].外語(yǔ)教學(xué)與研究:外國(guó)語(yǔ)文雙月刊,2002(4):300-307.

猜你喜歡
語(yǔ)料庫(kù)發(fā)展趨勢(shì)
《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
基于語(yǔ)料庫(kù)“隱秘”的詞類標(biāo)注初步探究
把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
試論當(dāng)前國(guó)際金融的形勢(shì)與發(fā)展趨勢(shì)
國(guó)有企業(yè)經(jīng)濟(jì)市場(chǎng)條件下營(yíng)銷戰(zhàn)略發(fā)展
論企業(yè)管理模式與企業(yè)管理現(xiàn)代化
快速原型技術(shù)在機(jī)械制造中的應(yīng)用及發(fā)展趨勢(shì)
鄉(xiāng)鎮(zhèn)配網(wǎng)規(guī)劃及未來(lái)發(fā)展趨勢(shì)
分析我國(guó)品牌營(yíng)銷的管理及發(fā)展問(wèn)題
基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開發(fā)與實(shí)現(xiàn)
伊宁县| 和顺县| 潍坊市| 霍山县| 诏安县| 凉城县| 黄陵县| 双桥区| 丹寨县| 浦城县| 剑阁县| 永宁县| 固镇县| 山丹县| 凤山市| 恭城| 芷江| 灵台县| 石阡县| 隆安县| 承德县| 中牟县| 肥西县| 高密市| 沽源县| 邮箱| 桃江县| 邯郸市| 桂林市| 太原市| 册亨县| 隆化县| 常德市| 刚察县| 卢氏县| 凭祥市| 沙湾县| 华阴市| 武鸣县| 永顺县| 沁阳市|