国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語料庫的閱讀語篇復雜度對比研究

2021-09-10 07:43:26原蓉田興斌
科教創(chuàng)新與實踐 2021年9期

原蓉 田興斌

摘要:閱讀理解因其占據(jù)較大的分數(shù)比例,在語言測試中一直占有重要的地位。作為選拔高質量研究生的語言測試和目前國內最為廣泛的檢驗大學生英語能力的全國性統(tǒng)一標準化考試,研究生入學考試英語一和大學英語六級的重要性不言而喻。本研究運用語料庫軟件Range和Readability analyzer從詞匯、句長、語篇長度以及可讀性層面對這兩類考試的閱讀語篇進行對比分析。

關鍵詞:研究生入學考試英語一;大學英語六級;語篇復雜度

一、引言

據(jù)統(tǒng)計,2021年全國考研人數(shù)已突破400萬,而研究生英語入學考試(下文稱為英語一)在考研中占據(jù)著重要的地位。英語一適用于全部學術型碩士研究生以及部分專業(yè)型碩士,如法律、漢語國際教育、建筑學、臨床醫(yī)學、口腔醫(yī)學、護理和公共衛(wèi)生等專業(yè)型碩士。英語一試卷共包括英語知識運用、閱讀理解、英譯漢和寫作四種題型。其中,閱讀理解所占分值最多,比重最大,同時也是考生們最為關注的部分之一。那么,在英語一的閱讀理解部分中所需要的詞匯量和語篇理解能力與大學英語六級的閱讀理解有什么異同呢?

目前,關于研究生英語入學考試閱讀部分的研究很多,如王立陽和申如冰于2019年對比分析了考研英語一和英語二閱讀語篇的難易度,分析出考研英語一的閱讀語篇要難于考研英語二。李鵬和趙妍于2014年通過評估研究生入學英語試卷一,探討其中存在的問題并提出解決的建議,為準備考研的學生提供了一定的參考。楊旭和裴學梅于2018年對研究生入學考試英語一與托福閱讀語篇的復雜度進行了對比研究,研究發(fā)現(xiàn)無論是在單詞長度、句法、深度銜接還是相鄰段落之間的潛在語義交叉,二者都存在著顯著性的差異。但是研究者們很少研究中國大學生英語六級考試的閱讀理解與考研英語一閱讀理解之間的聯(lián)系。中國大學生英語六級考試是由國家統(tǒng)一出題的全國性考試,用于評定已修完大學英語六級的學生是否達到了教學大綱的要求。那么,學生在準備大學英語六級考試時所習得的詞匯和英語知識是否能為其考研英語一服務呢?因此,為探討這一問題,本研究運用語料庫工具readability analyzer和range,以大學英語六級考試的英語閱讀為參照,分析研究生入學考試英語一閱讀語篇在詞匯、句長、語篇和可讀性層面上的復雜度,探討二者之間的異同。

二、閱讀語篇的可讀性和測量方式

閱讀語篇的可讀性或者易讀性指的是閱讀語篇的難度,即語篇難以理解的程度。影響閱讀語篇難度的因素主要是語言的詞匯復雜度、句子復雜度、語篇的長度以及文本復雜度等。

詞匯復雜度可從平均詞長、詞目比率、詞的形符類符比和標準形符類符比、詞目的形符類符比和標準形符類符比六個維度來衡量。詞匯復雜度將通過語料庫軟件Range進行測量,并搭配readability analyzer軟件一起使用。Range軟件是一個用于分析文本中詞匯廣度和深度的語料庫工具,它自帶若干個基礎詞表,也就是高頻詞表,可以統(tǒng)計出語篇中的詞數(shù)、詞目數(shù)、詞群以及這些詞在不同的詞表中所出現(xiàn)的頻率和占比情況等指標。

兩項考試閱讀語篇中句子的復雜度、語篇長度以及文本可讀性便從由賈云龍和許家金開發(fā)的語料庫語篇分析軟件readability analyzer中獲取。這一軟件能計算一組傳統(tǒng)的可讀性數(shù)值,像弗萊士易讀度和金凱德難度等級以及一些其他測試語篇詞匯復雜度的指標,如形符類符比、標準化的形符類符比、平均單詞長度、平均句長以及詞或形符的描述性統(tǒng)計,其中弗萊士易讀度數(shù)值越小,易讀度越高,而金凱德難度級數(shù)越大,難度越高。

三、分析和討論

本研究使用的語篇有兩組,分別包括2005年到2020年考研英語一的閱讀理解語篇和大學英語六級考試的閱讀理解語篇60篇和66篇。為了使研究結果具有可比性,排除了選詞填空、快速閱讀和考研英語一中的新題型,僅保留了閱讀之后需要做單項選擇題的語篇。隨后,運用語篇整理器統(tǒng)一兩組語篇的格式,如刪除兩組語篇中閱讀的標題、標注、英語釋義、漢語釋義以及更改標點符號為英文輸入等。接下來將從詞匯特征、平均句子長度、語篇長度和可讀性四個方面對兩組語篇的特征進行分析:

(一)詞匯特征

考研英語一和大學英語六級閱讀語篇中的詞匯特征主要從詞匯覆蓋率、詞頻分布、平均詞長以及詞匯密度四個層面來體現(xiàn)。其中,詞頻和詞匯覆蓋率的數(shù)據(jù)由range語料庫軟件進行統(tǒng)計分析,得出如下結果:

大學英語六級的閱讀語篇共計30382個詞,可分為6016個詞類,這些詞類來源于1754個詞組。其中,在基礎詞表一中,大學英語六級閱讀共有21620個詞,這21620個詞占閱讀文中總詞量的71.16%,而在基礎詞表一里有1960個詞類,占語篇總詞類的32.58%。除此之外,這些詞類又可劃分成一些詞群,如care,careful,careless等詞同屬于一個詞群。從基礎詞表一的統(tǒng)計結果來看,這1960個詞類來源于864個詞群。且在這一詞表中,詞匯覆蓋率達到71.16%。

同樣,在基礎詞表二中,六級閱讀有1698個詞,占總詞數(shù)的5.59%,有763個詞類,占總詞類的12.68%,從屬于472個詞群。而在詞表三中,有2108個詞,占總詞量的6.94%,共有816個詞類,占總詞類的13.56%,從屬于418個詞群。此時的詞匯覆蓋率為基礎詞表一的詞匯覆蓋率加上基礎詞表二和三的詞匯覆蓋率,即為83.69%。

此外,大學英語六級的閱讀語篇中有4956個詞不在上述三個基礎詞表中,占總詞量的16.31%。而在這一詞表中的詞匯共分為2477個詞類,占總詞類的41.17%。

Range軟件的三個基礎詞表是按詞匯頻率由高到低統(tǒng)計而成的,由此前三個詞表是使用頻率最高的詞。正如上文對統(tǒng)計數(shù)據(jù)的分析,83.69%的詞來自于前三個基礎詞表,而低頻詞的詞匯覆蓋率僅有16.31%。

考研英語一在基礎詞表一、二和三中分別有 19774、1502和2140個詞,占總詞量的比例分別為71.81%、5.45%和7.77%。由此看來,前三個詞表的詞匯覆蓋率為85.03%,而低頻詞的共計4121,占14.97%。

綜上,在大學英語六級考試的閱讀語篇和考研英語一的閱讀語篇中,高頻詞分別占據(jù)83.69%和85.03%,而低頻詞分別占16.31%和14.97%。因此,大學英語六級的閱讀理解比考研英語一的閱讀語篇含有更多的低頻詞和較少的高頻詞,那么可以粗略地說,考研閱讀理解的詞匯復雜度更高,更難,且詞匯豐富度更高。此外,前人研究中指出高頻詞的覆蓋率達到95%是能基本理解語篇全文的一個閾值。而兩組語篇均未達到這一閾值,說明無論是六級閱讀語篇還是考研英語一的閱讀語篇對于考生來說都有一定難度,且考研閱讀要更難一些,擁有更廣泛的詞匯覆蓋率和詞匯復雜度。

然而,為了得到關于詞匯復雜度或詞匯豐富度更詳細的信息,需要使用readability analyzer語料庫工具對兩組語篇的平均詞長、詞目比率、詞的標準形符類符比、詞目的形符類符比以及詞目的標準形符類符比進行進一步的分析,隨后使用SPSS軟件進行獨立樣本T檢驗,結果如下:

兩組語篇在以上幾個指標中均無顯著性差異,即P值大于0.05,但是兩組語篇在某些層面中仍有差異。具體分析如下:兩組語篇中AWL的平均值相等,沒有差異,說明六級閱讀語篇和考研閱讀語篇的平均詞長一致。而六級中的Word TTR、Word STTR和Lemma TTR略高于考研閱讀語篇,也就是說六級閱讀語篇的詞的形符類符比和標準形符類符比以及詞目的形符類符比均要略高于考研英語閱讀語篇。其中詞目比率、詞的形符類符比和標準形符類符比以及詞目的形符類符比和標準形符類符比常用于測量詞匯密度的,在這幾個指標中六級閱讀語篇略高,就說明六級閱讀語篇中詞匯的重復率要高于考研英語一閱讀,即六級閱讀語篇詞匯豐富度略低。同時,這也證實了Range統(tǒng)計分析出的結果,考研英語一的閱讀語篇擁有更廣的詞匯覆蓋率,詞匯豐富度更高。

總之,在詞匯特征方面,六級閱讀有更多的低頻詞匯,更少的高頻詞匯,而考研閱讀詞匯量更廣泛,詞匯豐富程度更高。

(三)平均句長和語篇長度

平均句長影響句子的難度,并且與閱讀語篇的易讀度相關。從readability analyzer的統(tǒng)計結果來看,與考研英語一相比,從2005年到2020年六級閱讀中平均句長的整體變化趨勢較為平穩(wěn)且句子長度略短。但在經過獨立樣本T檢驗之后發(fā)現(xiàn),二者平均句長P值大于0.05,因此二者的平均句長并沒有顯著地差異,但總體來講,考研英語一閱讀語篇的句子長度要略長于大學英語六級閱讀。

在2005至2020年間,英語六級的語篇長度在1592至1801間波動,最低的是在2009年,最高的是在2010年,波動幅度比較小,僅有209個字。而考研英語一閱讀語篇的長度在888至7521間波動,最低的是在2008年,最高的在2017年,波動幅度極大,高達6633個字。從變化趨勢來看,英語六級閱讀語篇的較為平穩(wěn),而考研英語一閱讀語篇的波動幅度較大,特別是從2005年至2008年字數(shù)極劇銳減,雖2008年至2016年逐漸平穩(wěn)過渡,但到2017年又攀至頂峰,而從2017至2020年又逐漸下降且趨于平緩。總體來看,考研英語一的閱讀語篇要長于六級閱讀,且每年的語篇長度變化較大。

然而,在進行獨立樣本T檢驗之后發(fā)現(xiàn),英語六級閱讀語篇的長度與考研英語一的閱讀語篇長度雖有差異但并沒有顯著差異。

(四)可讀性

為了分析兩組閱讀語篇的可讀性,本研究運用readability analyzer軟件分別計算了兩組語篇的弗萊士易讀度和金凱德難度級別。正如上文中提到的,弗萊士易讀度數(shù)值越小,語篇越難。數(shù)值在0-59之間為難,60-69為標準,70-100為簡單。金凱德難度等級與句子中的詞數(shù)和每個詞的音節(jié)數(shù)有關。它與弗萊士易讀度相反,金凱德難度等級越高,語篇越難。

同樣的,在可讀性方面,大學英語六級閱讀和考研英語一閱讀并沒有顯著性差異,但是二者存在差異。具體來看,大學英語六級的易讀度常在40-50之間波動,2010年有一篇易讀值非常接近30,而考研英語的易讀度多在30-50之間波動,2012-2015年間有兩篇閱讀易讀值低于30,2016年有兩篇非常接近50。根據(jù)弗萊士易讀度的規(guī)定,低于30為非常難,30-50之間為較難,因此無論是大學英語六級閱讀還是考研英語一閱讀的平均難度均為較難,有個別年份為特別難,總體來看,考研英語一的閱讀要比大學英語六級的閱讀要難。且從金凱德難度等級來看,考研英語一的閱讀語篇和大學英語六級的閱讀語篇的難度等級基本一致,但是考研英語一閱讀難度略高一些,這一結果與弗萊士易讀度的結果一致。

結語

本研究運用語料庫工具Range和Readability Analyzer從詞匯特征、句子長度、語篇長度和可讀性四個方面對大學英語六級閱讀語篇和研究生入學考試英語一閱讀語篇的語篇復雜度進行了對比分析。研究發(fā)現(xiàn),二者在這四個方面均有一定差異但沒有顯著差異。在詞匯層面,六級閱讀和考研閱讀平均詞長是一致的,但六級閱讀語篇中詞的形符類符比和標準形符類符比以及詞目的形符類符比均要略高于考研英語閱讀語篇,這說明考研英語一閱讀語篇中詞匯的重復率要低于大學英語六級閱讀,且擁有更廣泛的詞匯量。在平均句長和語篇長度方面,考研英語一閱讀語篇的平均句長要略長于大學英語六級的閱讀語篇,語篇長度亦是如此,但考研英語一閱讀語篇的語篇長度波動比較大,語篇復雜度變化較大。在可讀性方面,考研英語一的可讀性要略低一些,有幾篇閱讀的難度值甚至接近30,為非常難。

總之,考研英語一的閱讀難度在以上四個層面均要略高于大學英語六級閱讀,但同時二者的閱讀難度也非常的相近,所以在準備大學英語六級時所習得的英語知識對考研英語一來說是有一定幫助的。需要注意的是,考研英語一的詞匯量要更廣泛,句子長句要更長,語篇也要略長一些,在準備考研英語一的過程中,考生定要重視擴大詞匯量,加強對句法知識的練習,提高分析句子的能力,并通過記時練習閱讀以適應其語篇長度。

參考文獻:

[1]黃娟,虞程遠,彭瑩瑩.全國碩士研究生入學考試(英語一)閱讀理解測試內容效度研究(2012-2016)[J].考試研究,2017(05):64-71.

[2]曹琳爽.基于語料庫的雅思作文Task 2詞匯復雜度研究[J].英語教師,2017,17(14):23-25+30.

[3]許智堅.信息技術環(huán)境下的文本易讀性分析及其工具[J].龍巖學院學報,2014,32(06):44-51.

1.貴州大學外國語學院 貴州省 貴陽市 550025

2.銅仁學院 國際學院 貴州省 銅仁市 554300

石台县| 盐源县| 安达市| 武鸣县| 色达县| 龙泉市| 乌兰察布市| 都昌县| 天水市| 南康市| 平远县| 伽师县| 松溪县| 称多县| 图片| 东乡| 耿马| 台南市| 翁牛特旗| 厦门市| 平原县| 广饶县| 土默特右旗| 依兰县| 昌邑市| 图们市| 巍山| 荥经县| 石家庄市| 循化| 宜州市| 湛江市| 集贤县| 石首市| 垣曲县| 海阳市| 广宁县| 蒲江县| 南部县| 德兴市| 苍南县|