劉 宇
(四川外國語大學 出國培訓部,重慶 400031)
?
國家公派訪問學者英語高級培訓聽力測試的選詞特點
——基于RANGE軟件的分析
劉宇
(四川外國語大學 出國培訓部,重慶 400031)
本研究運用以詞頻為統(tǒng)計基礎(chǔ)的Range軟件,對國家公派學者英語高級培訓聽力測試(2010—2014)六套最新解密真題的錄音腳本及考點答案的詞匯范圍進行量化分析。結(jié)果表明:就錄音腳本而言,每套真題中不同語篇的選詞范圍存在明顯差異,但六套試題選用的詞匯范圍從總體上看較為一致;六套真題考點答案選取的各級詞匯,其詞頻出現(xiàn)了較大幅度的波動;與錄音腳本相比,低頻詞匯在考點答案中出現(xiàn)的頻率較高。弄清這些特點有利于優(yōu)化國家公派學者英語高級培訓的聽力測試設(shè)計并進一步提高教學質(zhì)量。
聽力測試;Range軟件;高頻詞匯;學術(shù)詞匯;低頻詞匯
國家留學基金管理委員會(以下簡稱留學基金委)每年在選拔資助高級研究學者、訪問學者和博士后赴海外留學時,對申請者的外語水平提出了明確要求。[1]計劃前往英語國家的公派留學人員可以直接報考學術(shù)類雅思考試(IELTS:Academic Mo-dule)、托??荚?TOEFL),或全國英語等級考試第五級(PETS-5)并達到最低分數(shù)線;也可以在教育部指定出國留學人員培訓部參加英語高級班培訓,并通過留學基金委組織的英語測試(CSC-ET)。由此可見,CSC-ET是我國政府用于衡量公派留學人員英語水平的一項重要測試手段。然而與其他三種公共英語考試相比,公眾對CSC-ET考試的形式和特點仍缺乏了解,相關(guān)研究尚處于起步階段。
近年來,隨著在全國范圍內(nèi)參加英語高級班培訓的公派出國預備人員數(shù)量不斷增長, 學界開始關(guān)注CSC-ET考試。例如,吳曉諾對CSC-ET聽力試題錄音原文中的語篇長度及類型、題目類型、語速等特點進行了考察,并將其與全國英語等級考試第五級(PETS-5)進行比較。他還根據(jù)80名公派培訓人員參加兩種聽力測試的成績,分析CSC-ET試題的信度和效度,進而指出CSC-ET聽力測試的難度低于PETS-5考試。[2]盡管該研究揭示了CSC-ET聽力測試的一些特點,但由于沒有分析試題的具體內(nèi)容,對公派學者英語強化培訓的促進作用有限。
針對上述不足,本研究擬從詞匯的角度考察CSC-ET聽力測試的內(nèi)容特點。以2010—2014年六套最新解密真題為數(shù)據(jù)建立語料庫,并使用Range軟件分析六套真題錄音腳本及考點答案的選詞范圍,以期為優(yōu)化考題設(shè)計及提高聽力教學水平提供相應的實證依據(jù)。
(一)研究數(shù)據(jù)
本研究的數(shù)據(jù)來源于CSC-ET考試的聽力部分,考試時間介于2010年至2014年,是經(jīng)過留學基金委解密的六套最新真題。數(shù)據(jù)分為兩大部分,包括六套真題聽力測試的錄音腳本以及考點答案。兩種數(shù)據(jù)涉及不同類型的詞匯。錄音腳本中出現(xiàn)的詞匯要求考生在聆聽時能快速理解其基本語義,主要屬于接受性詞匯;而CSC-ET聽力測試的一大特點是,除了五道判斷正誤題外,其余35道都是要求考生填寫答案的主觀試題,考點答案所涉及的詞匯需要能夠快速而準確地拼寫出來,對考試者提出了更高的要求,因此主要屬于產(chǎn)出性詞匯。[3]六套聽力真題的這兩大類數(shù)據(jù)建立起本研究的數(shù)據(jù)庫。根據(jù)研究需要,錄音腳本數(shù)據(jù)按照對應的考試時間和所屬的語篇類型進行歸類,考點答案數(shù)據(jù)則按對應的考試時間進行歸類。錄音腳本和考點答案均以文本文件形式建立語料庫,此外還去除了解密真題材料中出現(xiàn)的中文釋義、評分說明等冗余信息。
(二)研究工具
Range軟件由新西蘭語言測試專家 Nation & Coxhead 設(shè)計開發(fā),是一款能夠有效分析統(tǒng)計英語文本中詞頻及詞匯范圍的重要工具。[4]我國學者近年來已經(jīng)開始使用該軟件考查學生在英語寫作中表現(xiàn)出的詞匯習得情況,或評估英語閱讀測試的詞匯覆蓋率。[4]-[5]本研究所使用的Range軟件自帶三個不同級別的詞頻表。[4]其中,第一級、第二級兩個詞頻表均包括1000個詞族(word family)。這兩個詞頻表的內(nèi)容是英語使用者最常用及次常用的2000個詞族,我們將其稱為高頻詞匯。第三級詞頻表則源于Coxhead所收集的學術(shù)英語詞匯表[6],包含570個詞族,我們將其稱作學術(shù)詞匯。
按照Coxhead的解釋,英語中一個詞族包括能單獨使用的核心詞和在核心詞基礎(chǔ)上通過曲折變化及添加前后綴等方式派生出的其他詞匯。[6]例如以“collect”為核心詞的詞族包括“collects,collected,collecting,collection”等。而“special”和“specify”盡管語義上有相關(guān)性,但他們共有的詞素“spec”無法在英語中單獨使用,因此不屬于同一詞族。同一詞族下以各種形式出現(xiàn)的詞匯,如“collects,collected,collecting,collection”等,記錄為不同的詞類(word type)。而某個詞類如在語篇中出現(xiàn)的次數(shù)則記錄為詞符(word token)。
Range軟件在處理語料庫中的文本文件時,會自動將文本中出現(xiàn)的詞匯同自帶的三個詞頻表進行比較和統(tǒng)計,從而顯示該文本在三個級別的詞匯覆蓋率。如果某個文本的學術(shù)英語詞匯覆蓋率較高,則該語篇的學術(shù)性更強。對于文本中包含在三個詞頻表范圍內(nèi)的詞匯,Range軟件能夠自動統(tǒng)計出詞族、詞類和詞符三者的數(shù)量和百分比。而如果文本中出現(xiàn)了三個詞頻表范圍以外的詞匯(本文稱之為低頻詞匯),Range軟件則只能統(tǒng)計出詞類和詞符兩者相關(guān)數(shù)據(jù)。鑒于此,本研究在考察CSC-ET的詞匯覆蓋率時,以詞類為重點比較對象。
(一)聽力腳本中不同類型語篇的詞匯分布情況分析
CSC-ET聽力測試的錄音腳本在形式上分為四個部分(section)。從語域這一視角上看,[7]考慮到話語活動的目的、話語活動參與者之間的關(guān)系,以及話語交際的渠道,CSC-ET聽力測試涉及五種不同語篇類型。第一部分(Section 1)是一則就人文社科領(lǐng)域話題的獨白,例如簡要介紹一所國際知名大學的發(fā)展歷史。第二部分(Section 2)分為兩個不同語篇(Section 2a,Section 2b)。Section 2a是日常生活服務領(lǐng)域中(如入住酒店)的一段對話;Section 2b 則是由男女兩名播音員輪流播報的新聞。第三部分(Section 3)往往是一位專家就人文、社科或科技領(lǐng)域內(nèi)某一話題接受記者或?qū)W生的采訪。第四部分(Section 4)是教育場景中的一個小型講座。將六套真題的錄音腳本按照語篇類型進行匯總后,使用Range軟件處理,表1顯示的是五種語篇中的詞類分布比率。
表1 CSC-ET聽力測試五種語篇的詞類分布比率
從詞類分布比率來看,Section 2a對話這種語篇的內(nèi)容最貼近英語國家的日常生活,有超過八成的詞類都屬于最常見和次常見的2000個高頻詞匯,而對話中的學術(shù)詞匯比率不到百分之五。相反,Section 1簡介的內(nèi)容最為學術(shù)化,其學術(shù)詞匯的比率差不多是對話的三倍,高頻詞匯的比率卻比對話低了近兩成。另外,Section 4小型講座的內(nèi)容學術(shù)化特征也很突出,其學術(shù)詞匯的比率只比簡介差0.2%。相比之下,Section 3 采訪的內(nèi)容則比較均衡,其高頻詞匯的比率在五種語篇類型中排第二,學術(shù)詞匯的比率排第三。Section 2b 新聞語篇的一個突出特點是,其低頻詞匯的比率最高,超過四分之一。這些低頻詞匯包括大量涉及人名地名的專用名詞,如“Charles、Alaska”等,對考試者的聽力理解提出了一定挑戰(zhàn)。
(二)各套真題聽力腳本的詞類分布情況分析
本項目收集的CSC-ET聽力真題按照考試時間分類,各套題的錄音腳本經(jīng)過Range軟件分析,其詞類的分布比率如表2所示。
表2 CSC-ET聽力測試六套真題錄音腳本的詞類分布比率
表2的數(shù)據(jù)顯示,各套聽力真題測試選用的接受性詞匯,其級別詞頻分布較為一致:其中絕大多數(shù)(七成左右)來自英語國家的日常生活場景,一成左右涉及學術(shù)場景,還有近兩成的內(nèi)容較為專業(yè)化,屬于低頻詞匯。在場景內(nèi)容的選取上有較大波動的是2010年1月和2012年1月的試題。前者的第三級詞匯比率高出后者近一倍,學術(shù)化特征突出,難度值較高。
(三)各套真題考點答案的詞類分布情況分析
CSC-ET聽力測試有一大特征和難點,那就是主觀試題的比例接近九成,即40道聽力試題中有35道要求考試者填寫答案。聽力腳本中出現(xiàn)的詞匯往往只要求考試者理解,屬于接受性詞匯。與此不同,考點答案中的詞匯不僅要求正確理解,而且還要求能夠準確拼寫,因此屬于產(chǎn)出性詞匯。六套真題考點答案所涉及的產(chǎn)出性詞匯的詞類分布情況如表3所示。
表3 CSC-ET聽力測試六套真題考點答案的詞類分布比率
表3顯示的數(shù)據(jù)表明,各套真題測試的產(chǎn)出性詞匯在級別分布上存在較大差異。例如,2014年6月的考點詞匯超過七成屬于日常生活中最常見和次常見的2000基本詞匯;而2010年1月的試題中屬于此范圍內(nèi)的考點詞匯比率不到四成五。同樣,2011年6月的考點詞匯只有很少一部分(5.5%)屬于學術(shù)場景,而2010年1月要求正確填寫的答案有超過三成是學術(shù)詞匯。另外,大多數(shù)CSC-ET聽力真題都將低頻詞匯列為重點考查對象,其在考點詞匯中的比率達到兩成以上;唯一例外的是2014年6月試題,這套題所測試的產(chǎn)出性詞匯只有不到一成屬于低頻詞。
(四)各套真題聽力腳本與考點答案的選詞范圍變化趨勢之比較
真題考點中要求準確填寫的產(chǎn)出性詞匯來源于相應聽力腳本中出現(xiàn)的接受性詞匯,兩者之間因而存在密切聯(lián)系。我們有必要研究一下六套真題中接受性詞匯同產(chǎn)出性詞匯在選詞范圍上的變化是否具有一致性。以學術(shù)詞匯的百分比為例,兩者在六套真題中的變化趨勢如圖1所示。
圖1 六套真題聽力腳本與考點答案中學術(shù)詞匯的百分比變化
圖1表明,聽力腳本與考點答案選取的學術(shù)詞匯,在六套CSC-ET真題中呈現(xiàn)出的詞頻變化趨勢迥異。首先,從總體上看,考點中學術(shù)詞匯的詞頻有較大波動,而腳本里學術(shù)詞匯的詞頻變化較為平穩(wěn)。其次,兩者在各階段的詞頻變化也很不一致。舉例來說,從2010年1月到2010年7月這一階段,考點中學術(shù)詞匯所占百分比的變化趨勢是大幅下降,而腳本中學術(shù)詞匯百分比則緩慢上升;從2010年7月到2011年6月這個階段,考點中學術(shù)詞匯百分比先是顯著上升然后又驟降,而腳本中學術(shù)詞匯百分比則是略微下降;從2011年6月到2014年6月這一階段,考點中學術(shù)詞匯的百分比直線上升,而腳本中學術(shù)詞匯的百分比先是下降,然后又反彈回升。
(一)聽力試題設(shè)計的反思
通過分析CSC-ET聽力的真題腳本中不同類型語篇的詞頻特征,我們發(fā)現(xiàn)測試第一部分Section 1簡介語篇選取的高頻詞匯比率最低,學術(shù)詞匯比率最高,難度較大;而測試第二部分,特別是Section 2a 對話語篇選取的高頻詞匯比率最高,學術(shù)詞匯比率最低,理解障礙較小。按照從易到難,循序漸進的原則,我們建議在以后設(shè)計CSC-ET聽力考題時,調(diào)整不同語篇的測試順序,將對話部分的考題位置提前。
另外,Range軟件的統(tǒng)計結(jié)果表明,六套真題中接受性詞匯的級別分布情況比較一致,而產(chǎn)出性詞匯的級別分布則差異很大。這提醒我們在今后設(shè)計CSC-ET聽力測試的考點答案時,需要進一步明確各級詞匯的比率范圍,從而避免選詞的隨意性。
(二)教學啟示
隨著CSC-ET考試的影響力日益擴大,相關(guān)語言培訓項目也在不斷摸索和發(fā)展?!秶夜稍L問學者類別培訓大綱》在說明“知識要求”時,提到學員需要掌握7000認知詞匯以及4000積極詞匯。但考試組織方迄今為止沒有公布明確的CSC-ET考試詞匯表,部分學員在準備考試時存在困惑,感覺無從下手。我們的研究表明,無論是真題聽力腳本中出現(xiàn)的接受性詞匯,還是考點答案選取的產(chǎn)出性詞匯,Range軟件自帶的三個詞匯表的覆蓋率均達到八成左右。也就是說,Range軟件自帶的近2570個詞族可以成為今后編寫CSC-ET考試聽力詞匯表的基礎(chǔ)核心內(nèi)容。
我們使用Range軟件分析還發(fā)現(xiàn),CSC-ET聽力測試無論是接受性詞匯還是產(chǎn)出性詞匯,其中低頻詞匯的比率也比較高,達兩成左右,包括人名地名等專用名詞以及經(jīng)濟、自然科學等專業(yè)領(lǐng)域使用的詞匯。這也要求教師在開展聽力培訓時,在Range軟件2570個詞族的基礎(chǔ)上繼續(xù)擴充詞匯,引導學生掌握這部分涉及專業(yè)領(lǐng)域的內(nèi)容,從而幫助學生在準備聽力考試時能夠更好地做到有的放矢。
Range軟件不僅能夠剖析出CSC-ET聽力測試的錄音腳本和考點答案的選詞范圍和特點,為不斷改善試題設(shè)計,提高教學質(zhì)量提供實證依據(jù);其本身自帶的高頻詞匯及學術(shù)詞匯表也是學員用于準備CSC-ET考試的寶貴資源。熟練掌握和運用Range軟件,對國家公派訪問學者英語高級培訓項目的建設(shè)和發(fā)展具有積極推動作用。
[1]國家留學基金管理委員會.國家留學基金資助出國留學外語條件[EB/OL].(2016-01-04)[2016-06-08].http://www.csc.edu.cn/article/250.
[2]吳曉諾.“全國英語等級考試”與“國家留學基金委英語考試”的聽力測試分析[D].上海:上海外國語大學,2011.
[3]Nation, P.LearningVocabularyinAnotherLanguage[M]. Cambridge: Cambridge University Press, 2001.
[4]鮑貴,王霞.RANGE在二語產(chǎn)出性詞匯評估中的應用[J].外語電化教學,2005(4):54-58.
[5]文忠毅,王雪瑋.基于語料庫的高考英語閱讀理解試題語言復雜性分析——以2008—2012年重慶市高考英語試題為例[J].重慶第二師范學院學報,2014(2):167-170.
[6]Coxhead, A. A New Academic Word List[J].TESOLQuarterly, 2000(2):213-238.
[7]Halliday, M.A.K.LanguageasSocialSemiotic:TheSocialInterpretationofLanguageandMeaning[M]. Baltimore: University Park Press,1978.
[責任編輯亦筱]
2016-06-22
國家留學基金管理委員會“培訓部外語強化教學人員出國研修項目”(20153044)
劉宇(1975— ),男,重慶市人,博士,副教授,研究方向:系統(tǒng)功能語言學,英語強化培訓教學。
H319.3
A
1008-6390(2016)05-0156-04