国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

將詞頻統(tǒng)計引入高中英語教學(xué)中

2019-09-10 07:22張琮
安徽教育科研 2019年22期
關(guān)鍵詞:語料庫英語教學(xué)

張琮

摘要:在平常的高中英語教學(xué)中,教師往往憑自己的直覺或經(jīng)驗來授課,這種方法容易出錯且效率低下。如果能把詞頻統(tǒng)計引入到平常的英語教學(xué)中,它將成為英語教學(xué)的一大利器,在幫助避開已不再常用的詞匯與搭配、提高教學(xué)效率、增加教學(xué)趣味及理性選擇語言素材等方面為教師提供助力。

關(guān)鍵詞:詞頻統(tǒng)計??語料庫??英語教學(xué)

2017年,一位六年級的小學(xué)生用大數(shù)據(jù)分析的方式,研究蘇軾的詩詞,并發(fā)表了許多相關(guān)的論文。此舉震驚了學(xué)術(shù)界,成了當(dāng)年的新聞熱點,也再一次帶火了詞頻統(tǒng)計。

一、詞頻統(tǒng)計的由來

詞頻統(tǒng)計(Word Frequency Count)是一種分析研究詞匯的方法,它通過統(tǒng)計一定數(shù)量的語言材料中每個詞出現(xiàn)的次數(shù),分析統(tǒng)計結(jié)果,以便描繪詞匯規(guī)律。

詞頻統(tǒng)計并不是近年來才有的新鮮名詞,它其實有著悠久的歷史。不過,第一次現(xiàn)代意義上的以統(tǒng)計調(diào)查方法完成的詞匯研究工作發(fā)生在19世紀90年代初。德國語言學(xué)家克定(Kacding,F(xiàn).W.)在5,000名速記人員和800名合作者的共同幫助下,完成了一項偉大的工程。該工程耗時七年,在沒有計算機幫助的情況下,參與人員手工統(tǒng)計了以報刊為主的14個語料來源的資料。據(jù)統(tǒng)計,該項工程總詞匯量達10,910,777條,頻率在4以上的詞共79,716個。調(diào)查結(jié)果形成了一部厚達671頁的《德語頻率詞典》(Haufigkcitsworterbuch der deutschen Sprache),于1898年出版。

由于計算機網(wǎng)絡(luò)技術(shù)的應(yīng)用與發(fā)展,我們已不需要像這位德國語言學(xué)家一樣再去耗費大量的人力、時間才能做詞頻統(tǒng)計了。現(xiàn)在只要有一臺計算機并且這臺計算機能連接網(wǎng)絡(luò),我們每一個人都可以做詞頻統(tǒng)計,將這種科學(xué)的方法引入高中英語教學(xué)中有了現(xiàn)實基礎(chǔ)。

二、無詞頻統(tǒng)計時的缺陷

大部分老師都教過學(xué)生這樣一個俚語:rain cats and dogs,而且經(jīng)常將其作為重點內(nèi)容來講解。而據(jù)詞頻統(tǒng)計的結(jié)果,這個短語在1000萬詞語的口語語料庫中,出現(xiàn)次數(shù)為零;在當(dāng)今世界上最大的英語平衡語料庫——美國當(dāng)代英語語料庫(Corpus of Contemporary American English)中進行檢索,它也只出現(xiàn)了兩次。這也就是說,這個短語幾乎已被現(xiàn)代人所拋棄,再去花大量時間講解或練習(xí)這個搭配,已經(jīng)沒有太大的意義。

再以講解cut這個詞的搭配為例。詞典中給出的此詞的搭配有20種之多。很顯然,這20種搭配不可能全都講解一遍,一定要有所取舍。取哪些,舍哪些呢?根據(jù)在JTW(http://www.justtheword.com)上的詞頻統(tǒng)計結(jié)果,我們會發(fā)現(xiàn) cut off,cut out,cut down是使用頻率最高的短語,也是最值得去講解的短語;cut across,cut through,cut into,cut off這四個短語次之,講解時可以提一提。

三、詞頻統(tǒng)計的基礎(chǔ)——語料庫

只有在一定長度的語言材料的基礎(chǔ)上,才能進行詞頻統(tǒng)計。因此詞頻統(tǒng)計的基礎(chǔ)是語料庫,在把詞頻統(tǒng)計引入高中英語教學(xué)之前,必須先了解語料庫。

語料是人們運用語言時自然發(fā)生的書面或口頭的語言材料(語言素材)的集合,按照一定的目的與方式建立起來的大規(guī)模儲存這些語言材料(語言素材)的“倉庫”就稱之為語料庫。

1.網(wǎng)絡(luò)上的語料庫

從20世紀90年代起,得益于計算機網(wǎng)絡(luò)的日益發(fā)展,語料庫的建設(shè)與使用迎來了大爆發(fā)。目前網(wǎng)絡(luò)上提供的有楊伯翰大學(xué)語料庫(https://corpus.byu.edu/),它也是目前使用人數(shù)最多、最頻繁的語料庫,每月有超過13萬師生及科研人員在使用。還有英語國家語料庫(https://corpus.byu.edu/bnc/)、美國國家語料庫(http://www.anc.org/)、當(dāng)代美語語料庫(https://corpus.byu.edu/coca/)等,它們都可以免費使用。這些可以免費使用的網(wǎng)絡(luò)語料庫為個人進行詞頻統(tǒng)計提供了條件,將它引入日常教學(xué)也有了現(xiàn)實基礎(chǔ)。

2.自建語料庫

除了這些可以在網(wǎng)絡(luò)上免費使用的大型語料庫以外,還可以通過人工收集或網(wǎng)絡(luò)爬蟲的方法來建立自己的語料庫。比如,把人教版高中英語從必修1至選修11共11本教材上所有的reading,using language 中的reading以及課后練習(xí)部分的reading文章輸入到電腦當(dāng)中,就建立了一個小型的“人教版高中英語教材閱讀材料語料庫”。

四、詞頻統(tǒng)計在高中英語教學(xué)中的應(yīng)用

充分利用網(wǎng)絡(luò)上的免費語料庫或是自建的語料庫,能夠讓高中英語的教學(xué)更加精細、更加有效率,還會更加有趣。下面筆者將從四個方面來探討如何將詞頻統(tǒng)計應(yīng)用到高中英語教學(xué)中。

1.剔除過時的詞匯與搭配——少做無用功

除了上文提到的rain cats and dogs這個俚語之外,仍然有許多中國英語老師一直在教,而實際上國外卻已經(jīng)很少使用的表達。例如“How do you do?”這個中國老師常教的問候語,把它輸入美國當(dāng)代英語語料庫中進行詞頻統(tǒng)計。

從統(tǒng)計結(jié)果可以看出,“How do you do?”這一表達在1990-2017年共27年560,000,000詞匯量的語料中,一共只出現(xiàn)了1082次,其中在“口語部分”中出現(xiàn)655次,占比60.5%,在其他如小說、雜志、新聞、學(xué)術(shù)部分出現(xiàn)次數(shù)很少。從時間跨度上來看,其使用頻率也在逐漸降低,從1990-1994年共出現(xiàn)216次,降低到2005-2009年的156次,之后略有回升。

再去查看“How do you do?”這個短語出現(xiàn)的語言環(huán)境。該短語出現(xiàn)的前24個語境中,可以明顯看出在第二個do的后面都有賓語的存在,即說明這個短語在這些語境中都不是教師經(jīng)常告訴學(xué)生的“非常正式地打招呼的方式”,而是用來表達“你是如何做某事的”。這里并沒有對全部1082次出現(xiàn)的上下文進行全部統(tǒng)計,但也可以看出,“How do you do?”這種表達現(xiàn)在已經(jīng)很少用于見面的問候了。

與此類似的還有“thanks very much”,其使用頻率在時間跨度上呈直線下降趨勢,從2000-2004年共出現(xiàn)1997次,降低到2015-2017年只出現(xiàn)了298次。

利用這些語料庫中的詞頻統(tǒng)計,教師可以輕易對很多表達進行甄別,剔除掉那些不常用的詞匯或搭配,使教師和學(xué)生都少做一點無用功。

2.快速找出常用表達與搭配——提高效率

例如make up這個短語,其含義與搭配很多,哪一個才是最常用的呢?

從詞頻統(tǒng)計結(jié)果可以看出,“make up mind” 這個搭配出現(xiàn)的頻率最高,覆蓋范圍最廣,應(yīng)是學(xué)生首先需要掌握的搭配,其次是“make up story”這個搭配,學(xué)生應(yīng)掌握其所包含的“編造”這個含義。

3.比較近義詞的區(qū)別——沒有辨不清的單詞

利用詞頻統(tǒng)計的比較功能,還可以進行近義詞的比較。比如在美國當(dāng)代英語語料庫中輸入“say”和“speak”兩詞,進行比較。

從統(tǒng)計結(jié)果可以輕易看出,say后通常接說話的直接內(nèi)容,如hello,thanks,goodbye等;speak后多是搭配各種語言,如Chinese,English,portuguese等。另外可以看出“say”的總使用頻率為8.74,遠大于“speak”的使用頻率0.11,說明say比speak更常見到。

4.統(tǒng)計自有語料——教學(xué)素材選擇更理性

《新概念英語》教材一直以來受到不少教師與學(xué)生的推崇,甚至網(wǎng)絡(luò)上還有人說學(xué)完這套教材,可以達到聽、說、讀流利自如的狀態(tài)。以《新概念英語》全部四冊課文內(nèi)容作為語料庫,進行詞頻統(tǒng)計,看看是否如傳言一般。

從詞頻統(tǒng)計的結(jié)果看,《新概念英語》全部四冊課文共統(tǒng)計出7157個單詞,合并一種詞的多種變化形式,包含復(fù)數(shù)、不規(guī)則動詞變化、過去分詞、現(xiàn)在分詞、比較級與最高級之后共有單詞3486個,一共出現(xiàn)62554次。

新版英語課程標準規(guī)定:“除教材以外,高中學(xué)生英語八級的課外閱讀量應(yīng)達到35萬詞以上?!薄缎赂拍钣⒄Z》只有6萬多詞的閱讀量,遠遠不夠新版英語課程標準的推薦數(shù),可見,只讀《新概念英語》難以符合學(xué)生閱讀量的需求。此外,3486個單詞的詞匯量也遠遠達不到聽、說、讀流利的要求,直接破除了網(wǎng)絡(luò)謠言。

再看細節(jié)部分。在合并一個單詞的多種變化形式之前,詞頻在5次以下的單詞數(shù)為5506個,占總單詞量的比重約為76.9%??梢姡薪咏顺傻脑~匯都是低頻詞匯,重復(fù)次數(shù)不足。出現(xiàn)頻率最高的前100個詞共重復(fù)32621次,占總詞匯量的52%,剩下的7057個單詞只占總詞匯量的48%,再次印證其低頻詞過多,重復(fù)次數(shù)不足的重大缺陷。

對詞頻統(tǒng)計的應(yīng)用當(dāng)然不止上文提到這幾種,它還可以有許多其他的應(yīng)用方式,例如檢驗一種英語表達是否地道、尋找合適的替代詞、獲取詞匯的使用環(huán)境等。此外,如果能組織起教師建立自己的語料庫,如英語閱讀語料庫、英語歌詞語料庫、英語影視劇語料庫等,利用詞頻統(tǒng)計工具,就可以讓英語教學(xué)變得異常簡潔高效、趣味橫生。這些更高級的應(yīng)用,筆者會在以后的教學(xué)中一一去探索。

參考文獻:

[1]劉洪波.詞頻統(tǒng)計的發(fā)展[J].圖書與情報,1991,(2):1319.

[2]尹斌庸,方世增.詞頻統(tǒng)計的新概念和新方法[J].語言文字應(yīng)用,1994,(2):6975.

[3]章柏成.語料庫與英語詞匯教學(xué)[J].重慶交通學(xué)院學(xué)報(社科版),2006,6(2):108111.

[4]Paul Nation, Robert Waring. Vocabulary size, test coverage and word lists[M].Shanghai: Shanghai Foreign Language Education Press,2002.

[5]劉世芳.語料庫對英語詞匯教學(xué)的促進作用[J].安徽工業(yè)大學(xué)學(xué)報(社會科學(xué)版),2007,24(4):6567.

[6]李曉彤.基于漢語高頻詞聯(lián)想場的中俄大學(xué)生語言意識對比研究[D].哈爾濱:哈爾濱師范大學(xué),2017.

責(zé)任編輯:趙瀟晗

猜你喜歡
語料庫英語教學(xué)
英語教學(xué)中對任務(wù)的幾點思考
將“課程思政”融于小學(xué)英語教學(xué)實踐
基于語料庫翻譯學(xué)的廣告翻譯平行語料庫問題研究
Cultivation of independent learning ability in English teaching英語教學(xué)自主學(xué)習(xí)能力培養(yǎng)
淺談?wù)Z料庫分類及用途
國內(nèi)外語料庫建設(shè)研究簡述
運用語料庫輔助高中英語寫作
英語教學(xué)設(shè)計——詞匯教學(xué)
英語教學(xué)中的文化因素
英語教學(xué)案例分析