国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大學英語四六級閱讀語言難度對比——基于語料庫的研究

2013-09-20 06:10:04陳建生
關(guān)鍵詞:形符詞表語料庫

劉 冰, 陳建生

(天津科技大學 外國語學院,天津 300222)

一、引言

大學英語四、六級考試是全國大學英語四、六級考試委員會設計和開發(fā),與教育部考試中心共同實施的一項大規(guī)模標準化考試,其目的是準確衡量我國在校大學生的英語綜合應用能力,為實現(xiàn)大學英語課程教學目標發(fā)揮積極作用。在大學英語四、六級考試各項技能的考核中,閱讀理解部分占有很大比重(均為35%)。閱讀部分短文詞匯豐富,語法覆蓋全面,是檢測學生詞匯、語法及語篇理解能力的重要手段。近年來,國內(nèi)學者針對閱讀理解部分的研究涉及諸多方面,主要包括閱讀感知、理解過程、閱讀教學、閱讀模式等,但閱讀測試難度方面的研究較少。判定閱讀測試難度涉及諸多因素,包括閱讀篇章的題材、體裁、語言難度(包括生詞量大小、詞匯與結(jié)構(gòu)的復雜程度等)以及測試問題的形式、數(shù)量,甚至包括閱讀部分的測試時間等。

目前,國內(nèi)針對閱讀測試的語言難度研究剛剛起步,研究方法和標準不一。唐美華從文本結(jié)構(gòu)、語義復雜性(語法隱喻視角)和可讀性三個層面對2004年英語專業(yè)四、八級新考試大綱施行后TEM 4和TEM 8中閱讀理解部分的難度進行了對比研究[1]。該研究使用的兩個語料庫——英語專業(yè)四級和專業(yè)八級英語語料庫分別由12篇短文構(gòu)成,語料明顯不足,研究結(jié)論有一定的局限性。

本研究基于語料庫語言學的方法,對大學英語四級和六級考試中閱讀部分理解部分篇章的語言難度從不同層面進行對比分析。采用的語料來自1990—2011年間全國大學英語四六級考試閱讀理解部分的語篇。通過語料庫語言學方法,對四六級考試閱讀理解部分語篇的語言難度進行分析,為大學英語四級和六級考試中閱讀部分語言難度差異的研究提供了一個全新的角度,對今后四六級測試檢測及英語教學工作提出建議。

二、研究方法

(一)研究方法與步驟

本研究通過定性和定量相結(jié)合的統(tǒng)計方法,以語料庫語言學手段對大學英語四六級閱讀部分的語言難度進行整體對比。

詞匯特征和語法特征是語料庫語言學用來衡量語言難度的主要手段。以詞匯層面為界,本研究分為兩部分:一是詞匯層面的研究,包括詞匯密度和詞匯難度;二是詞匯以上層面的研究,包括平均句長和語法隱喻(被動語態(tài)和名詞化)。

(二)語料庫及研究工具

本研究的數(shù)據(jù)來自兩個語料庫:大學英語四級考試閱讀語料庫(以下簡稱四級庫)和大學英語六級考試閱讀語料庫(以下簡稱六級庫),兩個語料庫分別包含1990—2011年大學英語四級和六級考試閱讀理解部分的短文。四級庫有168篇短文(50052詞),六級庫有157篇短文(58389詞)。為了便于研究,刪除了兩個語料庫中所有短文內(nèi)超綱詞的中文注釋。此外,還對這兩個語料庫分別做了自動詞性附碼,采用的是分類詳細的CLAWS7詞性附碼集①。

使用的研究工具包括 WordSmith Tools 4.0,UltraEdit 32,AntConc和 Range32等軟件。

三、數(shù)據(jù)對比與分析

(一)詞匯層面

1.詞匯密度

詞匯密度(lexical density)是區(qū)別語體正式程度的一個標準,語體越正式,詞匯密度越高;反之,語體越接近自然口語,詞匯密度越低。詞匯密度的一般計算方法是統(tǒng)計語篇中實詞和總詞數(shù)的百分比[2]。

根據(jù)胡壯麟對實詞和虛詞的分類,實詞包括名詞、動詞、形容詞和副詞[3]。通過對四級庫和六級庫的檢索統(tǒng)計得出,四級庫中實詞總數(shù)為29350個,其中名詞12833個,動詞9365個,形容詞4044個,副詞3108個;六級庫實詞總數(shù)為35174個,其中名詞15747個,動詞10397個,形容詞5345個,副詞3685個。四級庫的實詞和總詞數(shù)的百分比為58.6%;六級庫的實詞和總詞數(shù)的百分比為60.2%。相比之下,六級庫的詞匯密度明顯高于四級庫??ǚ綑z驗的結(jié)果也驗證了兩個庫中實詞的分布具有顯著性差異(見表1)。

表1 四、六級庫詞匯密度的對比

2.詞匯難度

對于大學英語四六級考試閱讀部分詞匯的難度,本文通過語料庫工具Range32(Nation et al.1995)進行分析。Range32的基本原理是將某一文本中的詞匯與某一詞匯表相比較,觀察哪些詞出現(xiàn)在該詞匯表中及其出現(xiàn)的比率,找出該文本的用詞情況。Range32自帶三個基礎(chǔ)詞表,表一是高頻詞,難度最低;表三是相對的非高頻詞,難度較表一大。在處理輸入的目的文本時,該軟件會自動以這三個詞頻表為參照,輸出目的文本的詞頻等信息。表2和表3分別是四級庫和六級庫詞匯的分布情況。

表2 四級庫詞匯分布

表2的數(shù)據(jù)表明,四級庫中共出現(xiàn)49255個形符,其中有38880個形符屬于基礎(chǔ)詞表一,3339個形符屬于基礎(chǔ)詞表二,2920個形符屬于基礎(chǔ)詞表三,剩下4116個形符不在三個詞表內(nèi)。四級庫詞匯在三個基礎(chǔ)詞表中所占的比例分別為78.94%、6.78%和5.93%,基礎(chǔ)詞匯以外的詞占8.36%,說明四級庫的詞匯以基礎(chǔ)詞表一中的詞匯為主。

表3 六級庫詞匯分布

表3的數(shù)據(jù)表明,六級庫中共出現(xiàn)58722個形符,其中有45367個形符屬于基礎(chǔ)詞表一,3529個形符屬于基礎(chǔ)詞表二,4317個形符屬于基礎(chǔ)詞表三,剩下5509個形符不在三個詞表內(nèi)。六級庫詞匯在三個基礎(chǔ)詞表中所占的比例分別為77.26%、6.01%和7.35%,基礎(chǔ)詞匯以外的詞占9.38%,說明六級閱讀庫的詞匯也是以基礎(chǔ)詞表一的詞匯為主。

雖然四級庫和六級庫的詞匯都是以基礎(chǔ)詞匯表一中的詞匯居多,但從表2和表3數(shù)據(jù)對比的結(jié)果可以看出,四級庫詞匯在基礎(chǔ)詞表三和未列入基礎(chǔ)詞匯表中的詞所占的百分比比六級庫低。由此可見,四級庫詞匯的難度低于六級庫詞匯。

用語料庫方法衡量詞匯難度的另一個手段是詞長(word length)的統(tǒng)計。詞長是指一個單詞所包含的字母的數(shù)量,單位為字母,如great一詞的詞長為5個字母。英語中的常用詞多為詞長較短的詞,往往為1—7個字母,8個或8個以上字母的詞可以算作長詞。長詞除了包括一些本身就很長的詞,如 etiquette、exaggerate、fertilize等以外,絕大多數(shù)是通過不同構(gòu)詞法構(gòu)成的合成詞或派生詞,如aluminum-coated、irresponsible、philosophically、unaffordable 等,因此,長詞無論從記憶還是從理解角度看都是具有一定難度的詞。

使用WordSmith Tools對四級庫和六級庫的平均詞長進行統(tǒng)計,結(jié)果四級庫為4.76,六級庫為4.88,表明兩者的平均詞長差別不大。但是我們不能因此得出結(jié)論,認為兩個庫中詞匯的難度相當。WordSmith Tools在詞長的統(tǒng)計結(jié)果中詳細列出了各詞長單詞的數(shù)量,我們可以據(jù)此來對比兩個庫在詞匯難度方面的差異。表4是兩個庫中8個字母及以上的長詞在總詞數(shù)中所占的百分比和卡方檢驗的結(jié)果。

表4 四、六級庫詞長詞分布的對比

表4的數(shù)據(jù)表明,兩個庫在長詞的數(shù)量上具有非常顯著的差異,說明六級庫的詞匯比四級庫難度大。

(二)詞匯以上層面

1.平均句長

平均句長是指一個語篇中句子的平均長度,以詞數(shù)為統(tǒng)計單位。一般來說,簡單句的句長較短,容易理解;并列句、復合句或并列復合句的句子較長,較難理解。因此,通過對平均句長的統(tǒng)計和對比可以從一個側(cè)面了解語篇的難度。通過對兩個語料庫的總句子數(shù)和平均句長統(tǒng)計,四級庫共有2623個句子,平均句長為19.18詞(標準差是10.00);六級庫共有2915個句子,平均句長為20.31詞(標準差11.19)。獨立樣本 t檢驗的結(jié)果(t=3.95,df=5536,p<0.0001)表明兩個語料庫的平均句長存在非常顯著的差異,六級庫的平均句長比四級庫長。

2.語法隱喻

語法隱喻是影響語言材料難度的重要因素。Halliday區(qū)分了兩種語法結(jié)構(gòu)對語義的體現(xiàn)關(guān)系,一種是一致式,即語言結(jié)構(gòu)直接反映現(xiàn)實世界;另一種是隱喻式,即語言結(jié)構(gòu)不是直接反映現(xiàn)實世界,體現(xiàn)出了不同的語言單位之間的轉(zhuǎn)換過程[4]。這種語法結(jié)構(gòu)對語義的不一致體現(xiàn)就是語法隱喻。

語法隱喻阻礙了學生閱讀理解的過程。范文芳分析了決定語篇難易度的因素,認為在其它因素相同的情況下,語篇中語法隱喻的含量越高,語篇的難度就越大[5]。Ravelli指出,外國學生在掌握英語語法隱喻時會比較困難。造成這些問題的根本原因就是語法隱喻的復雜性[6]。Lassen在研究專業(yè)技術(shù)手冊時,曾提到語法隱喻的五種體現(xiàn)形式:名詞短語、被動語態(tài)、定冠詞省略、非限定動詞V-ing形式和省略句[7]。通過韓禮德對語法隱喻的定義,語義的不一致表達形式都屬于語法隱喻的范疇。以下針對語法隱喻的幾個主要形式(被動態(tài)和名詞化),分別對四級庫和六級庫做統(tǒng)計分析和對比。

被動語態(tài)通過設計完善的正則表達式檢索項,在經(jīng)過詞性附碼的兩個語料庫中檢索被動語態(tài)謂語的使用情況。表5是兩個語料庫中被動語態(tài)謂語使用情況的對比。

表5 四、六級庫被動語態(tài)謂語的對比

表5的數(shù)據(jù)表明,兩個庫在被動語態(tài)謂語的使用上沒有顯著性差異(p=0.9)。

名詞化是指把別的詞類加上-tion、-ment、-ness、-ity(包括其復數(shù))等后綴轉(zhuǎn)化成名詞的語言現(xiàn)象。Halliday認為名詞化是語法隱喻的主要體現(xiàn),指出“名詞化是創(chuàng)建語法隱喻的唯一最強大的手段”[4]。名詞化表達抽象的概念和過程。名詞化程度越高,語言越抽象,語言難度越大。由于統(tǒng)計兩個語料庫中全部名詞化現(xiàn)象有一定困難,本文只對幾個高頻名詞后綴進行統(tǒng)計和比較。表6是四級庫和六級庫名詞化情況的對比。

表6 兩個語料庫中名詞化使用情況的對比

表6的數(shù)據(jù)表明,在對所選的幾個常用名詞后綴的統(tǒng)計中,六級庫的名詞化現(xiàn)象與四級庫有非常顯著的差異。因此從名詞化的角度分析,六級庫語言難度高于四級閱讀。在名詞化統(tǒng)計的過程中,檢索結(jié)果中存在噪音(noise),如nation是以-tion結(jié)尾的名詞,但不屬于名詞化??紤]到對四級庫和六級庫均采用未排除噪音的方法統(tǒng)計,因此結(jié)果仍有效,且具有可比性。

四、結(jié)語

本研究基于語料庫語言學的方法,通過詞匯和詞匯以上兩個層面對大學英語四級和六級閱讀的語言難度進行比較。

詞匯層面上主要從詞匯密度和詞匯難度兩方面進行分析比較。在詞匯密度方面,六級庫的詞匯密度明顯高于四級庫??ǚ綑z驗的結(jié)果也驗證了兩個庫中實詞的分布具有顯著性差異;在詞匯難度方面,通過語料庫工具Range32進行分析,得出四級閱讀的詞匯主要集中在Range32的基礎(chǔ)詞表一和基礎(chǔ)詞表二,而六級閱讀的詞匯主要集中在Range32的基礎(chǔ)詞表三和基礎(chǔ)詞以外的詞??偠灾?,在詞匯層面上,六級閱讀部分語言難度高于四級。由此可見,四級庫詞匯的難度低于六級庫詞匯。在平均詞長方面,本研究使用WordSmith Tools對四級庫和六級庫做了統(tǒng)計,結(jié)果表明,兩者的平均詞長差別不大。但是,兩個庫中8個字母及以上的長詞在總詞數(shù)中所占的百分比和卡方檢驗的結(jié)果表明,兩個庫在長詞的數(shù)量上具有非常顯著的差異,再次說明了六級庫的詞匯比四級庫的難度大。由此可以看出,四六級庫的語言難度在詞匯層面上有著顯著的差異,六級庫語言難度明顯大于四級庫。

詞匯以上層面主要從平均句長和語法隱喻兩方面進行分析比較。在平均句長方面,結(jié)果表明兩個語料庫的平均句長存在非常顯著的差異,六級庫的平均句長比四級庫長;在語法隱喻方面,六級庫語言的名詞化現(xiàn)象大于四級庫,說明六級庫語言難度明顯大于四級庫。然而,四六級庫的被動語態(tài)現(xiàn)象沒有顯著區(qū)別。出現(xiàn)這種結(jié)果的原因,可能是因為四六級庫篇章的體裁沒有固定的比例,在不同體裁下被動語態(tài)的使用率不同。綜合以上結(jié)果,在詞匯以上層面,六級庫語言難度遠遠大于四級庫。

綜合上述兩個層面,大學英語四六級閱讀部分的語言難度具有顯著差別,六級閱讀部分語言詞匯使用更廣,語言的客觀抽象程度更高(本文主要從語法隱喻角度出發(fā)),句子的復雜程度也更高。由于篇幅所限,本研究除了從詞匯及詞匯以上兩個層面對四六級閱讀語篇的語言難度進行研究外,并未涉及到語篇體裁和語言難度的關(guān)系,這一點有待繼續(xù)研究。

本研究通過語料庫語言學的研究方法對大學英語四級和六級閱讀部分的語言難度進行了分析比較,從詞匯和詞匯以上層面證明六級閱讀語篇的語言難度大于四級,對今后的大學英語教學有一定的指導意義。在今后的大學英語教學中,教師應針對不同學習階段,讓學生集中掌握本階段范圍的詞匯。此外,教師應該意識到語法隱喻在語篇中的大量存在增加了語篇自身的難度,同時降低了學習者的閱讀速度,進而引發(fā)了學習者情感上的焦慮,最終阻礙了學習者對閱讀材料的理解,極大地制約了學習者語言能力的發(fā)展。在教學過程中,教師應重視句子的復雜性和語言的抽象性,學生應逐漸掌握復雜的句子,重視語言之間的邏輯關(guān)系。除教學啟發(fā)外,本文研究大學英語四六級閱讀語言難度的方法也可以作為一種全新的、檢驗測試難度的方法。

注釋:

①有關(guān)自動詞性附碼和附碼集的詳細情況請參見http://ucrel.lancs.ac.uk/claws7tags.html。

[1]唐美華.英語專業(yè)等級考試中閱讀理解對比分析[J].吉林省教育學院學報,2009(1):75 -77.

[2]Ure J.Lexical density and register differentiation[M]//Perren G,Trim J L M(eds).Applications of Linguistics.London:Cambridge University Press,1971:443 -452.

[3]Hu Zhuanglin.Linguistics:An Advanced Course Book[M].Beijing:Beijing University Press,2002.

[4]Halliday M A K.An Introduction to Functional Grammar[M].Beijing:Foreign Language Teaching and Research Press,2000.

[5]范文芳.語法隱喻對語篇閱讀難易度的影響[J].北京大學學報:外國語言文學專刊,1996(3).

[6]Ravelli L J.Grammatical metaphor:An initial analysis[M]//Steiner E,Veltman R(eds).Pragmatics,Discourse and Text.London:Frances Pinter,1988.

[7]Lassen Inger.Accessibility and acceptability in Technical Manuals[M].Philadelphia:John Benjaminis B.V.,2003.

猜你喜歡
形符詞表語料庫
近二十年形聲字形符研究綜述
從形符與字義的關(guān)系角度論《說文解字》中形聲字分類
——以“人”“彳”字部為例
留學生形聲字教學實踐研究
——以滿洲里學院為例
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
英語世界(2021年13期)2021-01-12 05:47:51
《語料庫翻譯文體學》評介
把課文的優(yōu)美表達存進語料庫
“形符”在小學數(shù)學課堂中的教學困境、功能與應用策略
遼寧教育(2017年7期)2017-03-11 13:35:20
敘詞表與其他詞表的互操作標準
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
國外敘詞表的應用與發(fā)展趨勢探討*
圖書館建設(2012年3期)2012-10-23 05:16:30
策勒县| 武夷山市| 定兴县| 凌源市| 二连浩特市| 和林格尔县| 民丰县| 浦江县| 宝兴县| 汪清县| 华池县| 双峰县| 日土县| 兴城市| 镇江市| 洞口县| 青铜峡市| 乌兰察布市| 桦南县| 肇东市| 阿克| 峨边| 雷山县| 巫溪县| 新余市| 怀柔区| 宣威市| 黎川县| 香河县| 天峨县| 含山县| 保亭| 舞钢市| 太和县| 武强县| 哈尔滨市| 凭祥市| 曲松县| 台江县| 会宁县| 宽城|