過(guò)君琰
(奧克蘭大學(xué)文學(xué)院,新西蘭 奧克蘭 1010)
詞匯是語(yǔ)言的重要組成部分,它不僅對(duì)理解、掌握和表達(dá)語(yǔ)言至關(guān)重要,同時(shí)對(duì)促進(jìn)語(yǔ)言背后思辨能力的發(fā)展也起著舉足輕重的作用。了解學(xué)習(xí)者的詞匯水平是衡量他們語(yǔ)言水平的重要指標(biāo)。自二十世紀(jì)八十年代起,學(xué)者們就開(kāi)始對(duì)詞匯測(cè)試工具進(jìn)行了初步探索。隨著語(yǔ)料庫(kù)的普及和計(jì)算機(jī)技術(shù)的發(fā)展,大量詞匯測(cè)試工具不斷涌現(xiàn)。目前國(guó)內(nèi)有關(guān)詞匯測(cè)試工具的綜述類(lèi)文章較少,僅有針對(duì)測(cè)試詞匯知識(shí)的單一方面如廣度[1]、深度[2],亦或是對(duì)少數(shù)測(cè)試工具的綜述[3]。本文從詞匯知識(shí)的內(nèi)涵和維度出發(fā),深入剖析主要的詞匯測(cè)試工具,并對(duì)未來(lái)詞匯測(cè)試工具的開(kāi)發(fā)進(jìn)行展望。本研究還結(jié)合《中國(guó)英語(yǔ)能力等級(jí)量表》中詞匯知識(shí)運(yùn)用能力子量表,為開(kāi)發(fā)適用于國(guó)內(nèi)大學(xué)生的英語(yǔ)詞匯測(cè)試以及如何用詞匯測(cè)試促進(jìn)詞匯教學(xué)提供一些建議和思考。
詞匯知識(shí)是一個(gè)多維度的、相對(duì)開(kāi)放的領(lǐng)域。關(guān)于詞匯知識(shí)的內(nèi)涵,最具綜合性且應(yīng)用最為廣泛的是Nation 提出的框架,該框架涵蓋詞形(口頭、書(shū)面、詞匯部件)、詞意(詞形和意義、概念和指稱(chēng)、聯(lián)想)和使用(語(yǔ)法功能、搭配、語(yǔ)境制約)三大類(lèi),共九個(gè)小類(lèi),展示了一個(gè)單詞內(nèi)部具體且相互聯(lián)系的組成部分[4]。Nation 將框架中的每一個(gè)小類(lèi)分為接受性和產(chǎn)出性?xún)蓚€(gè)方面。接受性詞匯知識(shí)是指學(xué)習(xí)者能夠在閱讀和聽(tīng)力中理解詞匯,而產(chǎn)出性詞匯知識(shí)是指學(xué)習(xí)者能夠在寫(xiě)作和口語(yǔ)中表達(dá)詞匯[5]。除了接受性/ 產(chǎn)出性這種基于技能的區(qū)分方式,另一種方式是把詞匯知識(shí)分為廣度知識(shí)和深度知識(shí)。廣度知識(shí)指的是學(xué)習(xí)者所知道的單詞數(shù)量,深度知識(shí)指的是學(xué)習(xí)者對(duì)這些單詞各方面了解的程度[6]。
對(duì)于學(xué)習(xí)者的詞匯知識(shí)有三點(diǎn)值得注意:第一,學(xué)習(xí)者各個(gè)方面詞匯知識(shí)的發(fā)展并不平衡,比如學(xué)習(xí)者的產(chǎn)出性詞匯知識(shí)水平的發(fā)展落后于接受性詞匯知識(shí);第二,這些區(qū)分之間有交叉的部分,比如形意關(guān)聯(lián)普遍被認(rèn)為屬于詞匯廣度知識(shí)層面,它包含詞形識(shí)別、詞意識(shí)別、詞形召回和詞意召回四個(gè)方面,其中詞形詞意識(shí)別屬于接受性知識(shí),詞形詞意召回屬于產(chǎn)出性知識(shí)。對(duì)于詞匯深度知識(shí)內(nèi)涵的界定,學(xué)者們看法不一。Henriksen[7]和Schmitt[6]把接受性和產(chǎn)出性知識(shí)的區(qū)分歸類(lèi)于詞匯深度知識(shí);第三,對(duì)詞匯知識(shí)內(nèi)涵的不同界定模式產(chǎn)生了相應(yīng)模式下不同的測(cè)試方法和工具。但由于詞匯知識(shí)的多面性,迄今為止沒(méi)有一個(gè)詞匯測(cè)試工具可以涵蓋詞匯知識(shí)的各個(gè)方面,或是全面地測(cè)量詞匯知識(shí)的某一方面。本文將從廣度和深度這兩個(gè)涵蓋更為廣泛的維度出發(fā)對(duì)主要的測(cè)試工具進(jìn)行分析。
詞匯廣度測(cè)試是目前詞匯測(cè)試開(kāi)發(fā)成果最為豐碩的領(lǐng)域,主要是測(cè)試書(shū)面形式的接受性詞匯知識(shí)。按照測(cè)試的類(lèi)型主要分為詞匯量測(cè)試和詞匯層級(jí)測(cè)試兩大類(lèi)。
1.詞匯量測(cè)試
詞匯量測(cè)試目標(biāo)是測(cè)試學(xué)習(xí)者所掌握的詞匯總量。目前主要有兩種測(cè)試形式:是否測(cè)試和大小測(cè)試。
是否測(cè)試(YES/NO,YN)是介于自我測(cè)評(píng)和測(cè)試之間的一種形式。它給學(xué)習(xí)者呈現(xiàn)一份詞匯清單,學(xué)習(xí)者需要勾選出所有他們知道含義的單詞。它最早用于測(cè)試母語(yǔ)學(xué)習(xí)者的詞匯量。然而,這種自我報(bào)告的方法不能準(zhǔn)確地反映學(xué)習(xí)者的詞匯知識(shí),學(xué)習(xí)者可能會(huì)勾選他們不認(rèn)識(shí)的單詞從而夸大自己實(shí)際的詞匯量。為了解決這一問(wèn)題,虛構(gòu)詞被引入清單,如果學(xué)習(xí)者勾選出這些虛構(gòu)詞,他們的分?jǐn)?shù)則會(huì)向下調(diào)整從而更好地預(yù)測(cè)他們真實(shí)的詞匯量[8]。學(xué)者們將這種方法運(yùn)用于二語(yǔ)詞匯測(cè)試并開(kāi)發(fā)了不同版本。
YN 測(cè)試中的虛構(gòu)詞主要有兩種虛構(gòu)方法:改變真實(shí)單詞里的一兩個(gè)字母和改變真實(shí)單詞的詞綴。根據(jù)受試者的回答,共有四種計(jì)分類(lèi)型:命中(hit)即選擇真實(shí)詞、錯(cuò)過(guò)(miss)即未選真實(shí)詞、錯(cuò)誤警報(bào)(false alarm)即選擇虛構(gòu)詞和正確拒絕(correct rejection)即未選虛構(gòu)詞。根據(jù)命中和錯(cuò)誤警報(bào)的比例運(yùn)用一些公式對(duì)原始分?jǐn)?shù)進(jìn)行校正從而計(jì)算出受試者真實(shí)的詞匯量。這些公式包括命中的個(gè)數(shù)減去錯(cuò)誤警報(bào)的個(gè)數(shù)、基于信號(hào)探測(cè)理論的猜測(cè)矯正(correction for guessing,cfg)[8]、兩個(gè)指數(shù)Δm[9]和ISDT[10]以及回歸公式(regression formula)[11]。經(jīng)過(guò)三十年的更新迭代,YN 測(cè)試在內(nèi)容和計(jì)分方式方面也進(jìn)行了不斷的調(diào)整。
YN 測(cè)試最顯著的優(yōu)點(diǎn)是便捷、高效。對(duì)受試者答題、測(cè)試者編制和評(píng)閱測(cè)試來(lái)說(shuō)都相對(duì)簡(jiǎn)單,能夠在較短的時(shí)間里測(cè)試大量的詞匯。其設(shè)計(jì)方法也適用于其它語(yǔ)言詞匯測(cè)試的開(kāi)發(fā)。此類(lèi)測(cè)試沒(méi)有明顯的負(fù)面反撥效應(yīng)[12]。不過(guò),YN 測(cè)試也有其不容忽視的缺點(diǎn):這種測(cè)試形式只測(cè)試了單詞一個(gè)方面的詞匯知識(shí)(被動(dòng)認(rèn)知)。而且虛構(gòu)詞存在的必要性也存疑。對(duì)虛構(gòu)詞的構(gòu)詞原則、詞匯屬性缺乏深入研究,虛構(gòu)詞的比例缺乏統(tǒng)一標(biāo)準(zhǔn),對(duì)于精準(zhǔn)有效的校正公式存在分歧。另外,YN 測(cè)試也受到與測(cè)試構(gòu)念無(wú)關(guān)因素的影響,如測(cè)試形式本身、測(cè)試環(huán)境和答題偏見(jiàn)等[13][14]。
針對(duì)YN 測(cè)試信度和效度研究主要圍繞以下方面展開(kāi)。學(xué)者們對(duì)YN 測(cè)試和其他形式的詞匯測(cè)試(如匹配、選擇、填空、翻譯、訪談等)以及水平測(cè)試的關(guān)聯(lián)度展開(kāi)了一系列研究,然而各項(xiàng)研究的結(jié)果并不一致:從不相關(guān)或弱相關(guān)[15][16]、到中等相關(guān)[13]、再到高度相關(guān)[17][18]。導(dǎo)致研究結(jié)果不一致的原因之一是錯(cuò)誤警報(bào)的比例不同。研究者們嘗試探索一些避免猜測(cè)、調(diào)整錯(cuò)誤警報(bào)比例的方法,從而增強(qiáng)YN 測(cè)試的信度和效度,比如:進(jìn)一步明確測(cè)試任務(wù)的要求;改變測(cè)試形式,如用電腦版本取代紙質(zhì)版本、基于識(shí)別的詞匯測(cè)試(Recognition Based Vocabulary Test)[16];研究虛構(gòu)詞的詞匯屬性[18];探索除虛構(gòu)詞法以外的其他方法,如反應(yīng)時(shí)間法等[17]。
第二種詞匯量大小測(cè)試(Vocabulary Size Test,VST)是以單選題的形式呈現(xiàn)的[19]。它主要有三大目的:衡量學(xué)習(xí)者是否擁有足夠的詞匯量來(lái)完成一些英語(yǔ)學(xué)習(xí)任務(wù),比如閱讀英文小說(shuō)、報(bào)紙等;橫向和縱向追蹤學(xué)習(xí)者詞匯量的成長(zhǎng);比較母語(yǔ)學(xué)習(xí)者和非母語(yǔ)學(xué)習(xí)者的詞匯量。
跟YN 測(cè)試以詞元(lemma)為基礎(chǔ)不同,VST選擇涵蓋面更為廣泛的詞族(word family)來(lái)展現(xiàn),它以Bauer &Nation 編制的詞族層級(jí)6 級(jí)為標(biāo)準(zhǔn)[20],采用分層隨機(jī)抽樣法從最高頻的前14,000個(gè)英國(guó)國(guó)家語(yǔ)料庫(kù)(BNC)詞族表中每1,000 個(gè)單詞層級(jí)選取10 個(gè)目標(biāo)詞,共140 個(gè)。VST 通過(guò)測(cè)試詞匯的形式和含義關(guān)系考查學(xué)習(xí)者書(shū)面形式的接受性詞匯知識(shí)。題干是考查的目標(biāo)詞和一個(gè)包含該單詞的非限定語(yǔ)境的句子,目的是讓學(xué)習(xí)者無(wú)法通過(guò)語(yǔ)境來(lái)猜測(cè)該單詞的意思,選項(xiàng)包含一個(gè)正確答案和三個(gè)干擾項(xiàng)。干擾項(xiàng)的含義所指向的單詞和考查單詞基本同頻,且和考查單詞的正確含義通常會(huì)有一部分重疊,學(xué)習(xí)者必須對(duì)所考查單詞的含義有一定程度的了解才能夠選出正確的選項(xiàng)。每選對(duì)一題得1 分,學(xué)習(xí)者的詞匯量為總分乘以100。
VST 的不同版本開(kāi)發(fā)及研究主要集中在三個(gè)方面:(1)測(cè)試的詞匯量。14,000 高頻詞族版本的VST 測(cè)試的對(duì)象主要是英語(yǔ)非母語(yǔ)學(xué)習(xí)者以及12 歲以下的英語(yǔ)母語(yǔ)者。基于此,研究人員開(kāi)發(fā)了面向英語(yǔ)母語(yǔ)者的20,000 高頻詞族版本的VST 以克服天花板效應(yīng)[21]。(2)測(cè)試的語(yǔ)言。雙語(yǔ)版本的開(kāi)發(fā)主要是為了避免單語(yǔ)版本中與構(gòu)念無(wú)關(guān)的變量以及與詞匯知識(shí)無(wú)關(guān)因素的影響。雙語(yǔ)版本的形式為題干是英語(yǔ),選項(xiàng)是學(xué)習(xí)者的母語(yǔ)。到目前為止,已開(kāi)發(fā)的語(yǔ)言版本包括漢語(yǔ)在內(nèi)共十個(gè)語(yǔ)種。對(duì)各個(gè)版本的內(nèi)部效度研究包含用Rasch 模型和經(jīng)典測(cè)試?yán)碚搶?duì)單語(yǔ)和雙語(yǔ)版本的效度研究。研究表明,單語(yǔ)和雙語(yǔ)版本都有較好的信度和效度,明確測(cè)試單一因素(書(shū)面形式的接受性詞匯知識(shí)),且能夠很好地區(qū)分不同水平的學(xué)習(xí)者。雙語(yǔ)版本對(duì)于英語(yǔ)非母語(yǔ)學(xué)習(xí)者而言更直接、省時(shí),且能更精準(zhǔn)地預(yù)測(cè)低水平學(xué)習(xí)者的詞匯量。但是對(duì)于中低水平學(xué)習(xí)者是否需要用完整版還是只需要縮減版(比如前8,000 詞頻)還有待進(jìn)一步研究。(3)圍繞VST 變體展開(kāi)的研究,旨在通過(guò)修改VST 減少猜測(cè)等考試策略,從而更準(zhǔn)確地測(cè)量學(xué)習(xí)者的詞匯量,比如不定選項(xiàng)、通過(guò)網(wǎng)頁(yè)版設(shè)置不同數(shù)量的干擾項(xiàng)[22]、在選項(xiàng)中加入“我不知道”(I don’t know,IDK)這個(gè)選項(xiàng)等[23]。
2.詞匯層級(jí)測(cè)試
層級(jí)測(cè)試(Vocabulary Levels Test,VLT)屬于診斷性測(cè)試,主要測(cè)試學(xué)習(xí)者是否掌握某一具體頻度的詞匯。層級(jí)測(cè)試不僅可以了解學(xué)習(xí)者所具有的詞匯資源是否能夠完成特定的語(yǔ)言任務(wù)[24],而且可以定位學(xué)習(xí)者具體層級(jí)的詞匯缺陷從而更好地幫助他們確立學(xué)習(xí)目標(biāo)、調(diào)整學(xué)習(xí)材料和學(xué)習(xí)策略。
層級(jí)測(cè)試也是測(cè)試學(xué)習(xí)者的書(shū)面接受性詞匯知識(shí)。它有較多版本(表1),主要有以下四個(gè)特點(diǎn):(1)表中前兩個(gè)VLT 選用的詞匯語(yǔ)料庫(kù)較為陳舊,采樣率比較低,但涵蓋的詞匯頻度寬,高、中、低詞頻均有涉及。后三個(gè)測(cè)試選用的語(yǔ)料庫(kù)更新,采樣率更高,但涵蓋的頻度密集,主要集中于高頻和部分中頻詞匯。Nation 認(rèn)為層級(jí)測(cè)試的目標(biāo)不是測(cè)試詞匯總量,因此設(shè)定最高頻的3,000詞或5,000 詞更為合適[25]。(2)前三個(gè)都是匹配形式,UVLT 雖然也是匹配形式但稍有不同,它將詞匯和含義設(shè)置成更為清晰的網(wǎng)格形式。后兩個(gè)則是和VST 一樣的單選題形式。(3)前四個(gè)以詞族方式展現(xiàn),而最后一個(gè)則以修飾過(guò)的詞元(modified lemma 或稱(chēng)為flemma)展現(xiàn)。(4)相關(guān)的效度研究較為缺乏。即便是后三個(gè)最新的測(cè)試,編者們也只進(jìn)行了初步的效度驗(yàn)證。
表1 不同版本的層級(jí)測(cè)試
3.小結(jié)
以YN、VST 和VLT 為代表的詞匯廣度測(cè)試工具自研發(fā)以來(lái)得到了廣泛應(yīng)用,然而圍繞廣度測(cè)試依然有三個(gè)值得關(guān)注的問(wèn)題。
(1)目標(biāo)詞匯的選擇。目前的詞匯廣度測(cè)試都是以詞頻為選擇標(biāo)準(zhǔn),采取隨機(jī)分層抽樣的方法。這種選擇標(biāo)準(zhǔn)默認(rèn)同頻度的詞匯難度是一樣的,然而即使是同頻詞匯,單詞的難度不一。因此,面對(duì)測(cè)試工具中的低采樣率,某頻度少量詞匯的掌握是否意味著對(duì)相應(yīng)頻度所有詞匯的習(xí)得,這一點(diǎn)學(xué)者們依然存疑。
(2)詞匯的展現(xiàn)方式。廣度測(cè)試工具以詞元或是詞族為單位來(lái)展現(xiàn)詞匯。詞元包括詞干及其曲折變化,詞族包括詞干及其曲折變化和派生變化。學(xué)習(xí)者對(duì)一個(gè)單詞的正確作答則被認(rèn)為他/ 她掌握了該單詞的詞干以及所有相關(guān)變化。Nation認(rèn)為以詞族方式展現(xiàn)詞匯更適合測(cè)試接受性詞匯知識(shí)[25]。另外一些學(xué)者認(rèn)為對(duì)單詞詞干接受性知識(shí)的掌握并不意味著對(duì)該詞所有派生變化的習(xí)得[41],因此以詞族方式展現(xiàn)的詞匯測(cè)試結(jié)果實(shí)際上夸大了學(xué)習(xí)者的實(shí)際詞匯知識(shí)水平,以詞元為單位可能更合理。而Webb 則認(rèn)為以詞元為單位的詞匯數(shù)量比以詞族為單位的多很多,會(huì)讓測(cè)試可行性受到影響[42]。
(3)測(cè)試形式和分?jǐn)?shù)解釋。詞匯廣度測(cè)試考查的是書(shū)面形式的接受性詞匯知識(shí),也就是閱讀所需要的詞匯,但是以上測(cè)試工具所測(cè)試的詞匯知識(shí)層面(識(shí)別)與閱讀所需要的詞匯知識(shí)層面(詞意召回)并不對(duì)應(yīng)。識(shí)別層面的詞匯知識(shí)要求遠(yuǎn)比詞意召回層面低,所以即便學(xué)習(xí)者能夠在這些詞匯測(cè)試中選對(duì)單詞的含義,在實(shí)際閱讀中仍然會(huì)存在想不起這些單詞意思的情況。另外在現(xiàn)行的詞匯測(cè)試形式(判斷、單選、匹配等)中,學(xué)習(xí)者能夠通過(guò)猜測(cè)或其它與構(gòu)念無(wú)關(guān)的考試策略來(lái)答對(duì),導(dǎo)致這些測(cè)試結(jié)果顯示的學(xué)習(xí)者詞匯水平偏高。但是考查召回層面的詞匯知識(shí)需要學(xué)習(xí)者寫(xiě)出該單詞的含義,這樣的形式費(fèi)時(shí)費(fèi)力,也會(huì)影響測(cè)試的可行性。
Yanagisawa &Webb 概括了界定詞匯深度知識(shí)內(nèi)涵的三種模式:發(fā)展模式(詞匯知識(shí)的發(fā)展程度)、網(wǎng)格模式(詞與詞之間的聯(lián)結(jié))和成分模式(詞匯知識(shí)的方面)[43]。
1.發(fā)展模式下的詞匯深度測(cè)試
基于發(fā)展模式的詞匯知識(shí)量表(Vocabulary Knowledge Scale,VKS)[44][45]最初是用來(lái)追蹤閱讀材料中新單詞的習(xí)得,它的設(shè)計(jì)理念是學(xué)習(xí)者每個(gè)單詞的知識(shí)是遵循一定發(fā)展模式的,從對(duì)單詞完全不認(rèn)識(shí)到正確地符合語(yǔ)法和語(yǔ)義規(guī)范地運(yùn)用該詞。按照這個(gè)理念VKS 把詞匯知識(shí)分為5 個(gè)層級(jí),學(xué)習(xí)者根據(jù)這5 個(gè)級(jí)別來(lái)呈現(xiàn)他們的詞匯知識(shí)水平。
VKS 自研發(fā)以來(lái)其效度不斷受到質(zhì)疑[46][47],主要集中在以下三點(diǎn):(1)填寫(xiě)和評(píng)分費(fèi)時(shí),只能在有限的學(xué)習(xí)者中測(cè)試有限的單詞。(2)5 個(gè)層級(jí)涵蓋的詞匯深度知識(shí)依然有限,而且層級(jí)之間的難度并不均等[5]。VKS 測(cè)試的維度并不單一,且測(cè)試構(gòu)念區(qū)分不明確。(3)學(xué)習(xí)者的詞匯知識(shí)并不一定是遵循這樣的線(xiàn)性發(fā)展模式。
2.網(wǎng)格模式下的詞匯深度測(cè)試
網(wǎng)格模式編制理念為詞匯深度知識(shí)是單詞與單詞之間能夠在大腦中形成網(wǎng)絡(luò)聯(lián)結(jié)。詞匯聯(lián)想測(cè)試(Word Associate Format,WAF)[48][49]是使用最為頻繁的詞匯深度測(cè)試。第一版WAF 是用于衡量大學(xué)層級(jí)的學(xué)術(shù)英語(yǔ)學(xué)習(xí)者的詞匯學(xué)習(xí),兩個(gè)平行版本100 個(gè)目標(biāo)詞匯來(lái)源于UWL。詞性包括名詞、形容詞和動(dòng)詞。學(xué)習(xí)者根據(jù)目標(biāo)詞匯在8 個(gè)關(guān)聯(lián)詞中排除4 個(gè)干擾詞,選出4 個(gè)正確的關(guān)聯(lián)詞。關(guān)聯(lián)詞與目標(biāo)詞的關(guān)系包含以下三種之一:橫聚合(paradigmatic)、縱聚合(syntagmatic)和分析(analytic)。第二版40 個(gè)目標(biāo)詞匯全部為形容詞,主要選自Barnard 2,000 和3,000 詞表[50],并將8 個(gè)單詞(4 個(gè)正確關(guān)聯(lián)詞和4 個(gè)干擾詞)隨機(jī)分成左右兩組,此版本的開(kāi)發(fā)僅用作研究工具。
WAF 的不足在于:(1)它雖然測(cè)試了詞匯知識(shí)的三個(gè)方面(同義詞、搭配和多義詞),但本質(zhì)上還是以形意關(guān)聯(lián)為中心的接受性測(cè)試,因此它對(duì)詞匯深度知識(shí)的涵蓋面依然具有局限性[47]。(2)盡管選項(xiàng)中的關(guān)聯(lián)詞和目標(biāo)詞展現(xiàn)了不同的關(guān)系,但是在計(jì)分方面沒(méi)有區(qū)別,WAF 的分?jǐn)?shù)無(wú)法代表某個(gè)具體方面的詞匯知識(shí),而且測(cè)試結(jié)果所反映的學(xué)習(xí)者的深度知識(shí)僅限于被測(cè)詞匯,無(wú)法將其外推到同頻度的其它詞匯。(3)它的測(cè)試形式(選擇)依然會(huì)受猜測(cè)等因素的影響。
Lex 30 是另外一個(gè)網(wǎng)格模式下的深度測(cè)試[51],它測(cè)試的是學(xué)習(xí)者的自由詞匯產(chǎn)出能力。Lex 30共有30 個(gè)目標(biāo)詞(均選自最高頻的1,000 個(gè)詞族),針對(duì)每一個(gè)目標(biāo)詞,學(xué)習(xí)者寫(xiě)出自己能想到的與之相關(guān)聯(lián)的詞(最多4 個(gè))。計(jì)分方法是將學(xué)習(xí)者寫(xiě)出的所有單詞根據(jù)詞頻進(jìn)行分類(lèi),每一個(gè)低頻單詞(第一個(gè)1,000 詞以上)得1 分,滿(mǎn)分120 分。隨著語(yǔ)料庫(kù)的發(fā)展,統(tǒng)計(jì)詞頻的對(duì)照詞表也在與時(shí)俱進(jìn)。最近的研究開(kāi)始使用詞匯分析工具VocabProfiler 中的BNC/COCA 詞表來(lái)統(tǒng)計(jì)詞頻[52]。共有兩種計(jì)分方式:總分(低頻詞總數(shù))和百分比(低頻詞的總數(shù)÷所寫(xiě)單詞總數(shù))。
Lex 30 在一些研究中其效度得到了一定程度的驗(yàn)證[53][54]。Fitzpatrick&Clenton 從廣義的產(chǎn)出詞匯知識(shí)角度出發(fā)編制了詞匯測(cè)試能夠涉及的詞匯知識(shí)模型[54]。該模型包括學(xué)習(xí)者產(chǎn)出詞匯知識(shí)的四個(gè)方面:能夠產(chǎn)出這些單詞詞形;能夠使用這些詞匯來(lái)替代合適的指稱(chēng)和母語(yǔ)詞匯;能夠在語(yǔ)境中使用這些單詞并符合語(yǔ)意規(guī)范;能夠在語(yǔ)境中使用這些單詞并符合語(yǔ)意和語(yǔ)法規(guī)范。他們認(rèn)為以上四個(gè)方面Lex 30 測(cè)試均能涉及。然而產(chǎn)出性詞匯深度知識(shí)包含詞形、使用、語(yǔ)域、搭配、詞意等多個(gè)方面,Lex 30 只測(cè)試了學(xué)習(xí)者對(duì)單詞的詞形召回能力,即使上述研究認(rèn)為它的測(cè)試范圍能包括學(xué)習(xí)者四個(gè)方面的詞匯知識(shí),但它能測(cè)試到什么程度依然無(wú)法清晰地界定。可見(jiàn),如何解釋Lex 30 的分?jǐn)?shù)是一個(gè)問(wèn)題。
3.成分模式下的詞匯深度測(cè)試
因?yàn)樵~匯深度知識(shí)所涵蓋層面的廣泛性和多樣性,既要能全面衡量學(xué)習(xí)者的詞匯深度知識(shí)又要考慮到實(shí)際操作性,僅靠單個(gè)詞匯測(cè)試工具很難實(shí)現(xiàn),因此學(xué)者們嘗試從詞匯知識(shí)的不同方面入手,測(cè)試學(xué)習(xí)者對(duì)某一詞匯深度知識(shí)成分的掌握情況,比如搭配:Collocation test[55]和詞的組成部分Word Part Levels Test[56]等。然而上述測(cè)試的應(yīng)用并不廣泛,而且因?yàn)樗鼈兊拈_(kāi)發(fā)是獨(dú)立進(jìn)行的,詞源不一致,所得結(jié)果無(wú)法直接進(jìn)行平行比較。學(xué)習(xí)者對(duì)每個(gè)單詞各個(gè)方面的知識(shí)不盡相同。
4.小結(jié)
測(cè)試學(xué)習(xí)者的深度知識(shí)要比廣度知識(shí)復(fù)雜和困難許多。學(xué)習(xí)者對(duì)每個(gè)單詞各個(gè)方面的知識(shí)不盡相同。測(cè)試學(xué)習(xí)者的深度知識(shí)首先要選擇需要被測(cè)的詞匯以及這些詞匯具體需要被測(cè)的方面,然后再用成分模式下對(duì)應(yīng)的測(cè)試將學(xué)習(xí)者所掌握的詞匯知識(shí)的各個(gè)方面進(jìn)行測(cè)試匯總,才能更好地了解學(xué)習(xí)者對(duì)這些詞匯掌握的深度。
詞匯測(cè)試工具是詞匯測(cè)試研究中的重要課題??v觀這些主要的測(cè)試工具,我們發(fā)現(xiàn):(1)現(xiàn)有的測(cè)試工具普遍缺乏系統(tǒng)且嚴(yán)密的效度證據(jù)。(2)這些測(cè)試工具主要聚焦于學(xué)習(xí)者的顯性陳述性詞匯知識(shí),即學(xué)習(xí)者詞匯知識(shí)的準(zhǔn)確度。(3)詞匯深度測(cè)試工具較少。雖然詞匯廣度測(cè)試工具較多,但集中于考查接受性詞匯知識(shí)(詞意認(rèn)知),其它方面的廣度知識(shí)較少涉及。(4)在現(xiàn)有的詞匯測(cè)試工具中,無(wú)法用不同的工具來(lái)衡量同一詞匯的不同知識(shí)層面,因此使用這些工具所得到的結(jié)果不能平行比較。也有少數(shù)例外,比如Stuart McLean等學(xué)者用同一詞源開(kāi)發(fā)了兩種形式的詞匯等級(jí)測(cè)試:前文所提及的書(shū)面形式的NVLT 和聽(tīng)力形式的Listening Vocabulary Levels Test(LVLT)[57]。而同為書(shū)面形式的VLT 和Productive Vocabulary Levels Test(PVLT)[58]則可以比較同一詞匯的詞意認(rèn)知和詞形召回情況。(5)目前的詞匯測(cè)試所關(guān)注的詞匯多為通用詞匯,學(xué)術(shù)詞匯較少涉及。
基于此,對(duì)于未來(lái)詞匯測(cè)試工具的研究,我們可以從以下幾個(gè)方面進(jìn)行嘗試:(1)繼續(xù)對(duì)現(xiàn)有的測(cè)試工具進(jìn)行進(jìn)一步的效度論證研究,例如明確測(cè)試目的、測(cè)試語(yǔ)言和形式、不同的學(xué)習(xí)者和教育環(huán)境、不同分?jǐn)?shù)的解釋等[59]。(2)除了陳述性詞匯知識(shí)以外,Godfroid 拓展了Nation 的框架[60],增加了詞匯知識(shí)使用的流利度和自動(dòng)性維度,未來(lái)可以加強(qiáng)在這方面測(cè)試工具的開(kāi)發(fā)。(3)針對(duì)詞匯廣度測(cè)試,我們可以研究開(kāi)發(fā)測(cè)試產(chǎn)出性詞匯知識(shí)的工具(例如考查詞形詞意召回)。雖然這種方法費(fèi)時(shí)費(fèi)力,但隨著人工智能的發(fā)展,未來(lái)可以嘗試開(kāi)發(fā)此類(lèi)測(cè)試的自動(dòng)打分系統(tǒng)。針對(duì)詞匯深度測(cè)試,我們可以系統(tǒng)地、有針對(duì)性地開(kāi)發(fā)測(cè)試工具來(lái)測(cè)試學(xué)習(xí)者各個(gè)方面的詞匯深度知識(shí),如詞綴、多詞單位等。(4)開(kāi)發(fā)詞匯測(cè)試組合模塊,用一組測(cè)試工具來(lái)衡量學(xué)習(xí)者同一詞頻的詞匯知識(shí)或同一詞匯不同層面的知識(shí)[43]。(5)嘗試開(kāi)發(fā)單獨(dú)的學(xué)術(shù)英語(yǔ)詞匯測(cè)試工具,而不是僅僅將學(xué)術(shù)詞匯的考查作為通用詞匯考查的一部分。除此以外,詞匯知識(shí)的考查還應(yīng)該與語(yǔ)言技能相結(jié)合,加強(qiáng)語(yǔ)言技能詞匯測(cè)試工具的開(kāi)發(fā),包括細(xì)分這些技能詞匯知識(shí)的層級(jí),如聽(tīng)力詞匯、口語(yǔ)詞匯等。
因?yàn)椴煌哪刚Z(yǔ)學(xué)習(xí)者在詞匯習(xí)得和測(cè)試的表現(xiàn)不盡相同,我們迫切需要在對(duì)標(biāo)教學(xué)大綱、教學(xué)目標(biāo)、課程指南和教材基礎(chǔ)上,改編現(xiàn)有英語(yǔ)詞匯測(cè)試、開(kāi)發(fā)新的測(cè)試以適應(yīng)不同學(xué)段、不同語(yǔ)言水平的母語(yǔ)為漢語(yǔ)的英語(yǔ)學(xué)習(xí)者,衡量他們的詞匯水平、追蹤他們的詞匯發(fā)展。以大學(xué)階段的英語(yǔ)教學(xué)為例,首先教師可以讓學(xué)生用詞匯量測(cè)試(如YN、VST 等)進(jìn)行自測(cè)。根據(jù)測(cè)試結(jié)果對(duì)標(biāo)大學(xué)英語(yǔ)教學(xué)和英語(yǔ)專(zhuān)業(yè)教學(xué)大綱的接受性詞匯量要求,對(duì)于詞匯量偏低的學(xué)生,教師應(yīng)積極鼓勵(lì)其擴(kuò)大詞匯量,例如關(guān)注NGSL 和AWL 等詞表,而非僅僅局限于四六級(jí)單詞表。其次,教師應(yīng)重視中高頻詞匯的教學(xué)。教師可以用不同形式的詞匯層級(jí)測(cè)試(如口頭、書(shū)面)來(lái)診斷學(xué)生對(duì)于中高頻詞匯的掌握情況。除了形意關(guān)聯(lián)層面,《中國(guó)英語(yǔ)能力等級(jí)量表》中詞匯知識(shí)運(yùn)用能力子量表(大學(xué)階段5-7 級(jí))的描述語(yǔ)強(qiáng)調(diào)了產(chǎn)出性詞匯知識(shí),并涵蓋了概念、聯(lián)想、搭配和語(yǔ)境等方面知識(shí)。因此,教師可以選定需要測(cè)試的目標(biāo)詞匯,設(shè)計(jì)符合教學(xué)要求和學(xué)生需求的詞匯深度組合測(cè)試。教師應(yīng)該根據(jù)測(cè)試結(jié)果,定位學(xué)生的詞匯知識(shí)缺陷,在教學(xué)過(guò)程中,加強(qiáng)培養(yǎng)學(xué)生的詞匯深度知識(shí)。