国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國內(nèi)平行語料庫應(yīng)用現(xiàn)狀調(diào)查研究
——基于近十年CNKI期刊論文的數(shù)據(jù)分析

2017-08-02 01:41郭建麗
關(guān)鍵詞:外語教學(xué)語料語言學(xué)

王 灝,郭建麗

(西北師范大學(xué) 外國語學(xué)院,甘肅 蘭州 730070)

國內(nèi)平行語料庫應(yīng)用現(xiàn)狀調(diào)查研究
——基于近十年CNKI期刊論文的數(shù)據(jù)分析

王 灝,郭建麗

(西北師范大學(xué) 外國語學(xué)院,甘肅 蘭州 730070)

將我國期刊全文數(shù)據(jù)庫中從2005年到2015年所出版的有關(guān)平行語料庫的學(xué)術(shù)論文作為研究樣本,分別以語料庫、平行語料庫為關(guān)鍵詞檢索了國內(nèi)核心期刊中有關(guān)平行語料庫的學(xué)術(shù)論文,利用對上述數(shù)據(jù)的分析,對國內(nèi)平行語料庫應(yīng)用現(xiàn)狀展開調(diào)查,找出近幾年國內(nèi)平行語料庫應(yīng)用的特點及存在的問題。

平行語料庫;學(xué)術(shù)論文;應(yīng)用現(xiàn)狀

引言

隨著計算機應(yīng)用技術(shù)的迅猛發(fā)展以及語料庫語言學(xué)的不斷壯大,“語料庫”(corpus或corpora[復(fù)])一詞逐漸受到越來越多的專家、學(xué)者的關(guān)注。真正意義上的語料庫是一個按照一定的采樣標準采集而來的、能夠代表一種語言或某種語言的一種變體或文類的電子文本集。(宋紅波等,2013)語料庫基于大量的真實語言數(shù)據(jù),極大地豐富了已有的研究方法,基于語料庫的實證研究也在逐年增加。平行語料庫是與電子信息技術(shù)結(jié)合而建立的平臺,其對于語言和翻譯研究、外語教學(xué)、詞匯編纂以及信息檢索等用處很大,此外對一些以單語語料或者直覺為基礎(chǔ)所做的假設(shè)還可進行考察與驗證,因此其發(fā)展前景十分廣闊。它還有互相對應(yīng)的兩種語言,和語言對比研究聯(lián)系緊密,是語言對比研究中的主要數(shù)據(jù)來源;此外,由于其有對應(yīng)詞與對應(yīng)單詞,因此也是詞典編著者有效的數(shù)據(jù)來源之一;源語言與目標語言相互對應(yīng)的特點也使其成為重要的翻譯教學(xué)與外語學(xué)習(xí)工具。

我國對于平行語料庫的研究并不十分深入,從全球第一個平行語料庫The Canadian Hansard Corpus(包括英、法語版本的加拿大議會辯論語料)創(chuàng)建至今也只有約20年的歷史。然而因為平行語料庫在語言的對比研究、翻譯以及詞典編纂上有著不可估量的使用價值,因此一經(jīng)開發(fā)之后便快速發(fā)展。近十年左右,我國的平行語料庫也有了突破性進展,目前建有的平行語料庫有英漢以及日漢等,比如北京大學(xué)計算語言學(xué)研究所的漢英平行語料庫以及后來建成的英漢平行語料庫,還有哈爾濱工業(yè)大學(xué)的英漢雙語語料庫。此外,我國近年來還創(chuàng)建了部分專門用語語料庫,比如上海交通大學(xué)就建成了莎士比亞戲劇英漢平行語料庫,燕山大學(xué)建成了《紅樓夢》譯本平行語料庫,還有紹興文理學(xué)院建成了魯迅小說漢英平行語料庫等。上述語料庫由于專業(yè)性比較強,且語料來源較少,范圍有限,因此適用于專業(yè)研究,而對于通用研究不適用。

本文通過在中國期刊全文數(shù)據(jù)庫中分別以語料庫、平行語料庫以及平行語料庫應(yīng)用為主題進行檢索后發(fā)現(xiàn),相比較而言,以語料庫為主題的文章較多,而以平行語料庫和平行語料庫應(yīng)用為主題的文章較少,而發(fā)表在核心期刊的關(guān)于平行語料庫應(yīng)用的文章寥寥無幾。所以本文希望通過數(shù)據(jù)分析找出國內(nèi)平行語料庫應(yīng)用的特點及存在的問題,為以后平行語料庫創(chuàng)建提供參考價值。

一、研究方法

本研究采用文獻檢索的方式,首先,通過在中國知網(wǎng)中以語料庫、平行語料庫為關(guān)鍵詞檢索出2005年至2015年所發(fā)表的學(xué)術(shù)論文,將其按照時間順序統(tǒng)計如圖1所示。

圖1 2005-2015歷年有關(guān)語料庫、平行語料庫研究的論文數(shù)量統(tǒng)計

其次,篩選出10種外語類研究的核心期刊,分別以語料庫、平行語料庫為關(guān)鍵詞進行檢索,精確匹配出2005年至2015年發(fā)表在核心期刊的學(xué)術(shù)論文,并將其具體信息統(tǒng)計如圖2所示。

圖2 2005-2015歷年有關(guān)語料庫、平行語料庫研究的核心論文數(shù)量

首先,在中國期刊全文數(shù)據(jù)庫里以語料庫、平行語料庫為主題詞,對2005-2015年間全部期刊進行檢索。然后還是以以上兩個詞為關(guān)鍵詞,對與語料庫相關(guān)的核心期刊(《外語界》《外語教學(xué)與研究》《中國翻譯》《外語電化教學(xué)》《現(xiàn)代外語》《外國語》《外語教學(xué)》《語言文字應(yīng)用》《當(dāng)代語言學(xué)》《上海翻譯》)進行人工檢索,組成了此次研究的數(shù)據(jù)樣本。以論文發(fā)表的時間、所登期刊和論文主題為劃分依據(jù)將其進行分類,從而得出了本文的統(tǒng)計結(jié)果。

二、數(shù)據(jù)分析

統(tǒng)計數(shù)據(jù)顯示國內(nèi)關(guān)于平行語料庫的研究少之又少,而基于語料庫的研究內(nèi)容卻非常豐富。筆者將檢索到的有關(guān)語料庫的論文分類后發(fā)現(xiàn)主要包括以下幾方面:(1)語料庫翻譯研究。廖七一(2000)、王克非(2006)深入探討了語料庫研究方法;王克非、黃立波(2008)對近20年來語料庫翻譯學(xué)的發(fā)展史與研究觀念進行了綜合論述。(2)語料庫輔助教學(xué)研究。桂詩春等(2010)學(xué)者將海內(nèi)外的語料庫語言學(xué)進行了整理歸納,并表示語料庫輔助外語教學(xué)將會成為將來外語教學(xué)的主要方向。(3)詞匯搭配研究。婁寶翠(2004)與李曉紅(2004)各自利用語料庫語言學(xué)的方法對health以及effect兩個詞語的搭配進行了研究;何安平(2001)通過語料庫語言學(xué)就中國中學(xué)生的外語拼寫錯誤展開了研討。(4)詞典編纂研究。在沒有語料庫語言學(xué)之前,中國詞典在編寫時一直都是沒有系統(tǒng)的依據(jù)。一直到了上個世紀70年代,辛克萊教授開創(chuàng)了COBULD 語料庫,并通過詞語索引技術(shù)開展了大范圍調(diào)查,進而為當(dāng)代詞典的編纂奠定了一定基礎(chǔ)。當(dāng)前,我國研究人員對語料庫的探索基本都集中在其對于詞典編纂的引導(dǎo)作用、以語料庫為基礎(chǔ)的詞典編寫方法以及詞典評價等。

三、平行語料庫創(chuàng)建存在的問題

通過上述分析可以看出,近十年間我國在平行語料庫上發(fā)展迅速,以前只能單純研究國外的語料庫,但現(xiàn)在我國已有能力自行建立平行語料庫,而且運用到各個研究領(lǐng)域。與此同時,在分析的過程中可以發(fā)現(xiàn)國內(nèi)平行語料庫的研究還是存在一些問題。

第一,語料庫還需進一步地深入加工。通常,語料庫的建設(shè)與研究目標合為一體,在加工標注語料庫時也是基于預(yù)設(shè)研究目標為基礎(chǔ)的,但是在創(chuàng)建大規(guī)模、綜合性以及多用途的平行語料庫時往往要考慮全面,標注的信息要便于今后的持續(xù)性研究。從預(yù)期研究目的入手,依照具體研究對象設(shè)計軟件兼容的標注符,再通過軟件編輯來批量賦碼。

第二,應(yīng)當(dāng)加強學(xué)科之間的溝通與合作。語料庫的發(fā)展與運用離不開計算機技術(shù)的支持,在過去較長一段時間里,人們在研究語料庫時往往集中于計算機專業(yè)以及計算語言學(xué)專業(yè),對于技術(shù)性的研究要更為重視。但是近年來,語料庫語言學(xué)的崛起將語言與翻譯研究很好的和計算機技術(shù)結(jié)合到一起,兩方面專業(yè)工作者的交流也不斷增多,語言研究者與翻譯研究者為計算機專業(yè)人員指出了新的研究方向,而計算機專業(yè)人士則為其研究提供技術(shù)輔助。

第三,語料庫研究領(lǐng)域還有待擴展。就當(dāng)前而言,以平行語料庫為基礎(chǔ)的語言對比要就還不夠深入,翻譯研究也基本都是類比研究,以時代、譯者、翻譯內(nèi)容等為分類參數(shù)的研究要比較少見。??祁愓Z料庫的一對多模式是指一個原文的相應(yīng)譯文至少有兩種,這種模式也是其特色所在,不但能夠運用到多語言轉(zhuǎn)換研究中,還可以進行多種類比研究等。然而當(dāng)前這樣的研究還只局限在文學(xué)作品當(dāng)中,對于非文學(xué)作品,如政論以及新聞等文本的類似研究尚比較缺乏。在開發(fā)語料庫的過程中要不斷完善其翻譯研究方法,除了英漢語對比研究外,積極開發(fā)別的研究對象,創(chuàng)造全新研究方式,比如基于超大規(guī)模平行語料庫輔助下對翻譯語言進行歷史變遷探究、翻譯語言和原創(chuàng)語言的歷時對照研究、各種翻譯方面的翻譯方法對比研究等。

四、展望

首先可以預(yù)見的是,超級平行語料庫的建設(shè)是未來的必然趨勢。之所以說“超級”,是因為其不但庫存量巨大,并且還具有一定的跨度性。這個庫主要由人文、社會以及自然科學(xué)等眾多分庫組成,各個分支之間可以相互獨立又可以互相融合。人文類語料還可以進一步劃分為文學(xué)、法律、歷史、哲學(xué)、宗教等子庫;社會科學(xué)也可以劃分為文化、地理、旅游、考古、經(jīng)濟、政治等多個子庫;自然科學(xué)則涵蓋生物、化學(xué)、物理、天文、醫(yī)藥等。各個語料庫在內(nèi)部還可以進一步分類,在時間上也有一定的間隔,可實現(xiàn)歷時的對比與研究。如此一來,語料庫的功能將更加強大,不但能夠用于各種學(xué)術(shù)性研究與實際應(yīng)用,還可以拓展語料庫翻譯研究的范圍。

其次,語料庫語言與翻譯研究都必須建立在語料的加工標注研究基礎(chǔ)之上。信息技術(shù)的發(fā)展給翻譯研究帶來了很大的方便。對語料的加工不單單是運行計算機,而應(yīng)該有一定的語言學(xué)理論基礎(chǔ),在此基礎(chǔ)上才能做好翻譯研究。標注是否深入恰當(dāng)對于將來的研究起了很大的決定作用,現(xiàn)在的自動標注是遠遠達不到要求的。

第三,積極設(shè)計新的軟件,建立完善的網(wǎng)絡(luò)平臺。語料庫本身是一種研究工具,但是創(chuàng)立語料庫也需要用先進的工具。與別的國家進行比較,我國在適用于漢英翻譯研究的有關(guān)軟件開發(fā)上還比較落后。因此,語料庫研究有關(guān)軟件的研發(fā)將會是未來語料庫翻譯研究的核心內(nèi)容之一。此外,建設(shè)語料庫的目的是為了方便理論研究與實際運用,對于這兩方面的要求,大規(guī)模、綜合性以及多用途的國家級平行語料庫能夠很好的滿足。單從實際運用上說,當(dāng)前的方法主要是將語料庫作為背后運行的數(shù)據(jù)庫來建立網(wǎng)絡(luò)檢索平臺。檢索到的信息內(nèi)容是否完整,是否深入完全決定于數(shù)據(jù)庫的大小以及加工深度。但是當(dāng)前平臺只能夠提供簡單的詞語、搭配等單一檢索,利用率較差。但是隨著將來語料標注和加工技術(shù)的進一步深入,檢索平臺必定能夠更加完善,提供更優(yōu)質(zhì)的服務(wù)。

結(jié)語

歷經(jīng)多年的發(fā)展之后,我國的語料庫建設(shè)有了很大的進展,并且在語料庫語言研究上也碩果累累,但是還是有一些不足之處,如:語料庫語言學(xué)研究領(lǐng)域較為單一,很多方面的研究還比較淺薄。語料庫語言學(xué)還需要不斷完善和發(fā)展,有關(guān)人員要繼續(xù)努力,研發(fā)出更為高效的語料庫處理軟件,為研究者提供有效支持。相信語料庫語言學(xué)未來會有更加美好的前景。

[1]桂詩春,等.語料庫語言學(xué)與中國外語教學(xué)[J].現(xiàn)代外語,2010(11).

[2]何安平. 學(xué)生英語拼寫錯誤分析[J]. 外語教學(xué)與研究, 2001(3).

[3]黃立波, 王克非. 翻譯普遍性研究反思[J].中國翻譯,2006(5).

[4]李曉紅. 基于語料庫的EFFECT搭配行為對比研究[J].外語教學(xué), 2004(6).

[5]婁寶翠. 英語常用詞搭配使用的對比:以health 為例[J]. 外語與外語教學(xué),2004(7).

[6]廖七一. 語料庫與翻譯研究[J]. 外語教學(xué)與研究,2000(5).

[7]宋紅波, 王雪利. 近十年國內(nèi)語料庫語言學(xué)研究綜述[J].山東外語教學(xué),2013(3).

Class No.:H030 Document Mark:A

(責(zé)任編輯:蔡雪嵐)

Investigation on the Application of Parallel Corpus —Based on CNKI Papers from 2005 to 2015

Wang Hao,Guo Jianli

(School of Foreign Languages and Literature, Northwest Normal University, Lanzhou, Gansu 730070,China)

In this paper, the academic papers about parallel corpus published from 2005 to 2015 in CNKI are used as the research samples. The corpus and the parallel corpus are used as the key words to retrieve the academic papers in the domestic core journals. By analyzing the above data, the author aims at investigating the application of domestic parallel corpus and finding out the characteristics of domestic parallel corpus and the existing problems.

parallel corpus; academic papers; application

王灝,副教授,碩士生導(dǎo)師,西北師范大學(xué)外國語學(xué)院。 郭建麗,在讀碩士,西北師范大學(xué)外國語學(xué)院。

西北師范大學(xué)2014年度青年教師科研能力提升計劃項目(人文社科類)“構(gòu)建甘肅地方性法規(guī)翻譯平行語料庫的可行性研究”(編號:SKQNYB14014)。

1672-6758(2017)07-0146-4

H030

A

猜你喜歡
外語教學(xué)語料語言學(xué)
基于歸一化點向互信息的低資源平行語料過濾方法*
從震旦到復(fù)旦:清末的外語教學(xué)與民族主義
體認社會語言學(xué)芻議
《復(fù)制性研究在應(yīng)用語言學(xué)中的實踐》評介
《神經(jīng)語言學(xué)和心理語言學(xué)視角下的二語習(xí)得》述評
The Book Review of Methods of Critical Discourse Analysis
The Connection Between “Wolf Child” Story and “Poverty of Stimulus” Argument
《苗防備覽》中的湘西語料
外語教學(xué)法的進展
國內(nèi)外語用學(xué)實證研究比較:語料類型與收集方法