袁哲琨
(香港理工大學(xué) 中國香港 999077)
在1862年中國的考試系統(tǒng)進入現(xiàn)代考試階段(modern examination period)的初期,對于外語的考察就已經(jīng)出現(xiàn)了??忌梢栽诙碚Z、德語、法語、日語、英語以及西班牙語這6種外語中選擇一門來進行考核。然而,隨著英語作為第二語言在世界范圍內(nèi)被推廣,學(xué)習(xí)英語在中國受到了廣泛的重視。因此,很多大學(xué)只招收在高考中選擇了英語作為外語考核目標的學(xué)生,隨之而來的就是超過99%的學(xué)生選擇英語作為他們的第二語言。本文基于Wmatrix對自建的“高考英語試卷”語料庫進行語料庫分析,旨在通過分析出現(xiàn)在高考試卷中的高頻詞匯、詞性和語義域來研究高考英語試卷作為英語學(xué)習(xí)材料模板的可靠性(authenticity)。
考試對教與學(xué)過程產(chǎn)生的巨大影響,被稱為“反撥效應(yīng)”?!胺磽苄?yīng)”帶來的影響可能是積極的,也可能是消極的,這主要取決于考試的內(nèi)容。積極的反撥是指,“學(xué)習(xí)者相信教與學(xué)過程中進行的練習(xí)對英語學(xué)習(xí)有幫助。”當(dāng)將正面的反撥效應(yīng)細分為不同的題型時,這種對特定題型的反撥效應(yīng)可以為教師提供有效的教學(xué)建議,為學(xué)生提供合適的學(xué)習(xí)策略。
因此,為了確保高考英語能夠?qū)χ袊挠⒄Z學(xué)習(xí)和教學(xué)產(chǎn)生積極的影響,我們應(yīng)該考慮到高考英語試卷作為英語學(xué)習(xí)材料模板的可靠性。
由于高考英語能對學(xué)生的英語學(xué)習(xí)過程產(chǎn)生強烈的反撥效應(yīng),它對學(xué)習(xí)過程中所使用的英語學(xué)習(xí)材料也會有很大的影響。因此,高考英語試卷的可靠性是保證這些學(xué)習(xí)材料可靠性的關(guān)鍵。
在教育領(lǐng)域有一個共識,即“學(xué)習(xí)材料在語言學(xué)習(xí)和教學(xué)的過程中是很重要的一點”。教材和學(xué)習(xí)材料是語言課程中不可缺少的工具。正是由于這種學(xué)習(xí)材料的廣泛使用,才能在世界各地建立起成功的外語學(xué)習(xí)環(huán)境。Hutchinson和Waters更是聲稱英語學(xué)習(xí)材料“能夠激勵英語學(xué)習(xí);展現(xiàn)語言學(xué)習(xí)的本質(zhì);反映語言學(xué)習(xí)任務(wù)的性質(zhì);有效拓展教師培訓(xùn)的基礎(chǔ),并提供正確及適當(dāng)?shù)恼Z言使用方法”[1](Hutchinson & Waters,1987)。
優(yōu)秀的學(xué)習(xí)材料被Widdowson定義為“讀者對它的反應(yīng)比它是否被簡化更重要”[2](Widdowson,1978)。在他看來,連貫性對于材料的可靠性很重要,這是由讀者的反饋決定的。只有讀者能夠理解材料并做出回應(yīng),材料才能被判斷為可靠的。因此,在分析學(xué)習(xí)材料的可靠性時,學(xué)習(xí)者應(yīng)是一個必須考慮的重要因素。另一方面,Richards主張“可靠的學(xué)習(xí)材料應(yīng)該作為課堂活動的基礎(chǔ)?!彼J為可靠的學(xué)習(xí)材料能夠提供目的語的文化信息,使學(xué)習(xí)者置身于真實的語言環(huán)境中。從學(xué)習(xí)和教學(xué)過程的角度來看,這些教材能夠更好地滿足學(xué)習(xí)者的需求,為教師提供一種更有效、更有創(chuàng)造性的教學(xué)模式[3](Richards,2006)。
Brandl對Richards的觀點也有類似的認可,即學(xué)習(xí)材料應(yīng)該是真實情況和需求的反映[4](Brandl,2008)。Brandl認為,可靠的學(xué)習(xí)材料能讓學(xué)生在現(xiàn)實世界自然發(fā)生的語境中接觸到真實的語言情境,并將課堂練習(xí)與真實世界聯(lián)系起來,以滿足學(xué)生的需求??煽康膶W(xué)習(xí)材料為課堂活動提供了基礎(chǔ),使教師設(shè)計的活動更符合自己的教學(xué)風(fēng)格和學(xué)生的學(xué)習(xí)風(fēng)格。
Gilmore回顧了對語言學(xué)習(xí)材料可靠性的研究,總結(jié)出8種評判標準:“由本族人發(fā)明在一個特定語言社區(qū)中的本族人之間所使用的語言;由真實的演講者或作者為真實的聽眾所使用的語言,用以傳達真實的信息;由接受者賦予文本的品質(zhì),即它不是文本本身固有的東西,而是由讀者或聽眾反饋給文本的;師生互動;選擇的任務(wù)類型;課堂的社會情境狀況;與教學(xué)評估相關(guān)。文化,以及像目標語言群體那樣的行為或思維能力,以便被他們認可和驗證?!盵5](Gilmore,2007)。他認為語言學(xué)習(xí)材料的真實性應(yīng)該體現(xiàn)在文本、參與者、社會文化情境、交際行為目的或是其中三者的結(jié)合上。
之后,McKay從基于內(nèi)容和基于交互兩個方面對學(xué)習(xí)材料可靠性的定義進行了補充:基于內(nèi)容是指可靠的語言學(xué)習(xí)材料是為特定的學(xué)習(xí)群體設(shè)計的,具有教學(xué)目的;交互性方面表明,這種可靠的語言學(xué)習(xí)材料的目的是訓(xùn)練學(xué)生為課堂外的實際語言交流做準備[6](McKay, 2013)。
根據(jù)Pinner在這方面的觀點,“可靠性是一個重要的概念,它可以賦予學(xué)習(xí)者和教師權(quán)力,因為可靠性將學(xué)習(xí)者個體與用于學(xué)習(xí)的內(nèi)容連接了起來”[7](Pinner,2015)。因此,雖然關(guān)于可靠性和可靠的學(xué)習(xí)資料的爭議尚未統(tǒng)一,但其重要性不容忽視。本文通過對高考英語試卷進行語料庫研究,分析其中的高頻詞匯、詞性和語義域,與上述的對可靠的學(xué)習(xí)資料的定義進行對比驗證來研究高考英語試卷作為英語學(xué)習(xí)材料模板的可靠性。
“關(guān)鍵度”的概念在20世紀90年代中后期被引入,而進行關(guān)鍵度分析的程序首先被納入Wordsmith工具中?!瓣P(guān)鍵詞”一詞通常用于描述語境中重要的詞語,但在語言學(xué)領(lǐng)域?qū)ζ涞亩x與此不同。Scott將“關(guān)鍵詞”的概念定義為“與某種參考語料庫相比,在給定文本中出現(xiàn)頻率異常的詞”[8](Scott, 1997),這表明對關(guān)鍵詞的研究主要集中在文本特征上。Scott的目的是在語料庫中建立能夠代表特定社會意義的詞匯,并將它們以具有文化意義的方式組合在一起。因此,這里的關(guān)鍵詞被定義為,“一個在給定的文本或一組文本中,體現(xiàn)出重要性的高質(zhì)量單詞,它們反映了文本的真正含義?!?/p>
需要明確的是,在關(guān)鍵詞分析中,詞語并不是唯一可以進行分析的語言單位。頻率比較也可以在其他類型的語言單位中進行,特別是當(dāng)語料庫已經(jīng)標注了語法、句法或語義類別時。
對關(guān)鍵詞進行分析雖然可以體現(xiàn)文本特征,找出目標語料庫中突出的詞項,但存在一定的現(xiàn)實局限性。其中一個被Baker證實為過度關(guān)注詞匯而導(dǎo)致的。他指出,關(guān)鍵詞分析只關(guān)注詞匯差異,而不是語義、語法或功能差異是有缺陷的。他進一步聲稱,有些詞可能在較低的頻率下產(chǎn)生了足夠的影響,但由于它們沒有被包括在關(guān)鍵詞列表中,因此會被忽略[9](Baker, 2006)。例如,在對莎士比亞的《羅密歐與朱麗葉》中六個人物的說話方式進行分析時就出現(xiàn)了類似的情況,將每個人物的說話方式與同一部戲劇中的另外五個人物進行對比,預(yù)期的結(jié)果能夠體現(xiàn)出每個人物的不同風(fēng)格。然而,對比關(guān)鍵詞列表和關(guān)鍵詞性列表的結(jié)果,似乎有一些關(guān)于角色風(fēng)格的重要特征被忽視了。因此,將關(guān)鍵詞分析擴展到詞性或語義范疇,可以為理解特定的語言使用提供有用的信息,反映語料庫中的文本更傾向于哪些語義領(lǐng)域。
本文自建的“高考英語試卷”語料庫由2015年至2019年的高考英語試卷組成。在這五年中,每年全國范圍內(nèi)的高考英語試卷共8個版本。包括:全國卷1、全國卷2、全國卷3、北京卷、天津卷、上海卷、江蘇卷和浙江卷。在這8個版本中,上海卷的題型和考點都與其他7個版本有所不同,因此從研究對象中被剔除。對剩余的7個不同版本的試卷作為一個整體進行分析,高考的英語考試有9個類型的問題,包括:聽力、單項選擇、完形填空、閱讀、改錯、語法填空(根據(jù)上下文,使用所給單詞的正確語法形式填空)、情境填空(根據(jù)上下文,在7個句子中選擇5個正確的句子填在文中空處)、寫作和口語。
在對這些不同類型的問題進行文本選擇的過程中,需要注意3點:第一,在寫作部分,這些試卷中都是用中文描述寫作要求的,所以寫作部分不能包含在語料庫中。第二,由于高考英語的口語考試是按照教育部的規(guī)定由各地區(qū)設(shè)計的,因此也由于缺乏普遍性而被從研究對象中剔除。第三,在過去的五年里,江蘇卷的聽力部分與全國卷1和全國卷2是完全相同的,并且浙江卷從2017年增加了聽力這一題型后,也使用相同的聽力材料和問題測試學(xué)生的聽力水平。因此,在7個版本的高考試卷中只有3個版本的聽力部分:全國卷1、全國卷3和北京卷。然而,從2018年起,北京不再將聽力納入考試范圍,在過去5年中,北京的聽力部分只有3年。這使得北京的聽力測試與其他兩個版本的聽力測試相比變得沒有參考價值。因此,本語料庫僅以全國卷1和全國卷3,近五年來的聽力測試為例。語料庫中的聽力部分包括聽力材料和問題。
按照上述標準收集文本后,建立起的語料庫組成表如下:
這個語料庫總共有113,667個文本,上面的表格給出了文本在3種分類方式下的分布情況。從表3.1中可以看出,該語料庫主要由完形填空、聽力和閱讀組成。尤其是閱讀部分,一般由4篇文章及相關(guān)問題組成,占整個語料庫的一半以上。雖然各題型所占比例不夠平均,但對研究目的沒有影響。表3.2和表3.3分別按照年份和地區(qū)對文本進行分類,在這兩種分類下文本較為平均,這意味著每個地區(qū)近五年的高考英語試卷都是具有研究價值的。因此,這是一個平衡的語料庫。
表3.1 根據(jù)題型 語料庫文本分布情況
表3.2 根據(jù)年份 語料庫文本分布情況
表3.3 根據(jù)地區(qū) 語料庫文本分布情況
Wmatrix是由英國蘭開斯特大學(xué)語料庫研究中心開發(fā)的用于語料庫分析的工具。它是一個基于網(wǎng)絡(luò),可以通過密碼訪問的工具。與其他語料庫分析工具一樣,它具有生成頻率列表和索引的功能。本文使用Wmatrix4進行語料庫分析,它的獨特之處在于它的“標簽向?qū)А惫δ?。利用嵌入式工具CLAWS(the Constituent Likelihood Automatic Word-tagging System)和USAS (UCREL Semantic Annotation System),Wmatrix4能夠分別根據(jù)語法詞性和語義類別對語料庫進行標記。它的語義賦碼集以《朗文多功能分類詞典》為基礎(chǔ),包括“情感”“糧食與農(nóng)業(yè)”“政府與公眾”“建筑與房屋”“教育”“時間”等21個語義域。這些語義域還可以再細分為232個子語義域,并分別進行標注。
本研究使用Wmatrix4對“高考英語試卷”語料庫進行分析,生成單詞、詞性和語義域的頻率列表。這些結(jié)果將表明高考英語試卷的內(nèi)容主要由哪類詞匯構(gòu)成以及更傾向于哪種主題。
從高頻詞表(見表4.1)可以看出,語料庫中出現(xiàn)頻率最高的是定冠詞“the”和不定冠詞“a”。單詞“a”也被廣泛地用來表示單數(shù)。緊接其后的是介詞和連詞,如“to”“And”“of”“in”“for”“with”和“on”。這種情況是可以預(yù)料到的,因為它們是組成句子的重要元素。此外,“that”和“what”出現(xiàn)的頻率很高,說明高考英語試卷中包含了很多疑問句和從句。
為了更深入地分析語料庫中的文本,擴展到詞性范疇對語料庫進行分析。與在高頻詞表中觀察到的一些結(jié)果符合(見表4.2),如“AT”類中的“the”“AT1”類中的“a”“to”類中的“to”“CC”類中的“in”等。此外,還在高頻詞性列表中發(fā)現(xiàn)了一些新的信息。雖然在20個最常見的單詞列表中沒有常見的名詞或動詞,但它們在整個語料庫中出現(xiàn)的頻率很高。尤其是“NN1”這一常見單數(shù)名詞在榜單中出現(xiàn)頻率最高。與名詞相關(guān)的還有“NN2”,代表普通名詞的復(fù)數(shù)形式。
表4.2 高頻詞性列表(前10)
在“NN1”和“NN2”的列表中,有很多高頻詞匯可以描述學(xué)生的生活,如:“school”“family”“book”“home”“children”“student”“kids”等。這些名詞出現(xiàn)的頻率高,說明高考英語考慮到考生的身份,更傾向于選擇他們比較熟悉的話題。以“school”這個詞為例。(見例證1)與“school”相關(guān)的句子描述了學(xué)校生活或與學(xué)校有關(guān)的成長經(jīng)歷。這些東西對學(xué)生來說很熟悉,可以使他們更容易理解文章和問題,并對材料做出反饋。這符合Widdowson對優(yōu)秀的學(xué)習(xí)材料的觀點。另一個高頻詞“author”也值得注意。例證表明(見例證1),作者的態(tài)度、目的、傾向、理解和思維都被問及,這意味著高考對學(xué)生英語學(xué)習(xí)的要求不僅是詞匯和語法的掌握,還包括理解文章深層面的語用能力。高考英語希望學(xué)生具有以英語為母語般的思維能力。這樣的能力是為他們將來在真實的語言環(huán)境中所準備的。這一點與Gilmore對“可靠學(xué)習(xí)材料”的定義是一致的,即擁有“像目標語言群體一樣行為或思考的能力”。
例1 “NN1”和“NN2”中高頻詞的頻率及例證
結(jié)合題型,與動詞詞性相關(guān)的高頻率也說明,正確使用動詞和組織從句的能力也很重要。這說明高考英語的目標是培養(yǎng)學(xué)生能夠在不同的真實語言環(huán)境中正確使用英語。這種能力需要學(xué)生能夠組織出更優(yōu)美、更地道的句子,在語法和句子結(jié)構(gòu)上接近母語標準。而不是簡單的只有主語、謂語、賓語的句子。
分析進行到語義域的范疇時,可以通過高頻語義域列表來確定高考英語更傾向的語義。(見表4.3)
表4.3 高頻語義域列表(前20)
9 A9+(Getting and possession) 1 257 19 A2.2(CAUSE & Effect/Connection) 667 10 T1.3(Time:Period) 1 245 20 A2.1+(Change) 660
從“P1”(Education in general)的高頻率,可以看出高考英語試卷在本質(zhì)上是教育性質(zhì)的?!癙1”中出現(xiàn)的高頻詞匯,如“students”“school”“study”和“college”,進一步說明選擇的文本可以使學(xué)生更好地做出反饋。
此 外, 從“Q2.2”(Speech acts) 和“Q2.1”(Speech:Communicative)的高頻率可以看出高考英語試卷中使用英語作為交流媒介的思維?!癚2.2”和“Q2.1”是由多種表達形式組成的,如:“tell”“report”“explain”和“advice”。學(xué)會使用這些詞,學(xué)生可以在英語語言環(huán)境中進行交際行為,表達自己的觀點。
本文通過對自建語料庫“高考英語試卷”的分析,驗證了高考英語試卷作為英語學(xué)習(xí)材料模板的可靠性。分析結(jié)果表明,高考英語注重英語的正確性和實用性。它的目的是幫助學(xué)生掌握英語,為真實的語言環(huán)境做準備,使他們盡量能用英語進行母語水平的交流,并得到母語者的認可。因此,高考英語試卷的確是學(xué)生學(xué)習(xí)地道英語的一個很好的榜樣,它也為學(xué)生學(xué)習(xí)地道英語指明了正確有效的方向。以高考英語試卷為模板設(shè)計英語學(xué)習(xí)材料,可以培養(yǎng)學(xué)生用專業(yè)詞匯和正確語法構(gòu)建句子的能力。更重要的是能激發(fā)學(xué)生學(xué)習(xí)英語的興趣。因此,在學(xué)習(xí)和教學(xué)過程中,學(xué)生和教師都應(yīng)該更加注意語法的使用和從句的組織。更多的口語練習(xí)是必要的,而不僅僅練習(xí)在寫作中使用英語。
最后,雖然本文驗證了高考英語試卷作為英語學(xué)習(xí)材料模板的可靠性,但仍存在一定的局限性。本文將除上海以外所有地區(qū)的高考英語試卷作為一個整體分析,盡管這些地區(qū)之間的差異沒有與上海之間的差異那么大,但這些地區(qū)之間的試卷仍存在一定的差異。因此,我們可以進一步研究不同地區(qū)的高考英語試卷在可靠性上的差異,這將有助于高考英語的改革。