国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

詞匯豐富性研究方法及現(xiàn)狀

2018-01-30 11:13:59王藝璇
海外華文教育 2017年12期
關鍵詞:豐富性詞頻復雜性

王藝璇

(北京語言大學對外漢語研究中心,中國北京100083)

詞匯是測量二語學習者語言水平的有效指標(Linnarud,1986;Astika,1993;DeBoer,2014)?,F(xiàn)有研究主要使用“詞匯豐富性”(Lexical Richness)作為研究和測量的重要方法(Laufer&Nation,1995;John Read,2000:201;Lu,2012;王藝璇,2017)。

在漢語作為第二語言的詞匯豐富性研究中,多數(shù)為使用該方法測量學習者的語言水平(吳繼峰,2016;丁安琪、肖瀟,2016等),系統(tǒng)的介紹性文章較少。趙守輝(2008)簡要介紹了詞匯豐富度和詞匯個性。張艷、陳紀梁(2012)總結了詞匯多樣性和詞匯復雜性的測量方法。

詞匯豐富性是一個總括性的概念,下轄多個維度,以上研究并沒有將之完全覆蓋。同時,相較于漢語作為第二語言的研究,有關英語和其他語言的詞匯豐富性研究成果豐碩。因此,我們將對詞匯豐富性各維度的研究方法做系統(tǒng)的梳理并介紹已有成果,以期為漢語作為第二語言的詞匯豐富性研究提供參考和借鑒。

一、詞匯豐富性

“詞匯豐富性”主要有兩種含義:一種是總稱性的,如Read(2000)“詞匯豐富性”框架中包括詞匯變化性(Lexical variation)、詞匯復雜性(Lexical sophistication)、詞頻概貌(Lexical frequency profile)、詞匯錯誤(Lexical errors)和詞匯密度(Lexical density);另一種是詞匯變化性的別稱,計算及觀察方法與詞匯變化性相同(Fiona&Baayen,1998)。不同研究對于作為總稱的“詞匯豐富性”所轄維度有不同的界定,主要分為以下兩種。

其一,Laufer(1991)將詞匯豐富性概括為詞匯獨特性(Lexical originality)、詞匯密度、詞匯復雜性和詞匯變化性。隨后,Laufer&Nation(1995)提出“詞頻概貌”,認為該維度可以避免以上四者的缺陷并將其納入到詞匯豐富性的測量方法中。

其二,Read(2000:203-205)將有關詞匯豐富性下設的考察維度總結為詞匯密度、詞匯復雜性、詞匯變化性、詞頻概貌和詞語錯誤(Occurrence of errors)。此后,大部分研究都采用了該框架,例如Lu(2012)。

本文使用總稱性概念,對下轄的詞匯變化性、詞匯復雜性、詞頻概貌、詞匯密度和詞匯獨特性等維度及相關研究做系統(tǒng)介紹[1]。

二、詞匯變化性

詞匯變化性亦被稱作詞匯多樣性(Lexical diversity)(Malvern et al.,2002;Yun,2010等),是指學習者在語言使用中所展現(xiàn)出的詞匯變化程度。

通過對有關詞匯變化性研究的總結,將現(xiàn)有成果概括為以下兩方面:

(一)計算公式和測量方法

從Yule(1944)詞匯統(tǒng)計中有關詞匯變化性的研究開始(轉引自Laufer&Nation,1995),學界分別從概念界定和計算方法上展開討論。其中,有關計算方法的研究較多。

類符和形符的比(Type-Token Ratio,TTR)是使用最廣泛的計算公式(Templin,1957)。但是傳統(tǒng)的TTR受到樣本長度的影響,即如果文本中詞數(shù)過多,TTR就不能對其進行有效評價(Arnaud,1984;Richards,1987)。為此,之后的一些研究嘗試通過代數(shù)變換的方法,對TTR公式進行不斷修改以消除文本長度對詞匯變化性測量效度的影響。例如Guiraud(1960)中提出的Root TTR(T/);Carrol(1964)中的計算詞匯變化性的CTTR公式,即corrected TTR);Herdan(1960)的Log TTR(logT/logN);Sommers(1966)中使用的 S=log(log t)/log(log n);Sommers(1966)的 M法,M=log n-log t/log2n;Dugast(1978)提出的 U法,U=log2n/(log n-log t);Tuldava(1993)的 T法,T=log(log t)/(log(log n/t+A))5(轉引自 Joan Torruella&Ramon Capsada,2013)。

除以上研究外,近年來傳統(tǒng)TTR測量方法得到進一步發(fā)展。Malvern&Richard(2002)為了克服TTR及其變體公式受到文本長度的影響,提出D值法。該方法通過數(shù)值模擬(mathematically modeling)呈現(xiàn)出詞語是如何進入長度逐漸增加的語言樣本(language samples)中的,并通過使用VOCD軟件計算文本中的詞匯變化性。有研究者將文本等長切分以避免計算結果受到文本長度的影響,如Johnson(1944)提出的MSTTR,即將文本以100個字符長度作為切分節(jié)點再計算TTR(轉引自Joan Torruella&Ramon Capsada,2013);McCarthy(2005)使用的MTLD法,該方法與MSTTR部分相同,即都對文本長度加以控制,不同的是MTLD對長度的控制更加嚴格,每一段文本的TTR值首先要達到0.72,然后再使用公式L/n計算MTLD值,其中L為文本長度,n為文本被切分后的總段數(shù);還有HD-D法,即隨機截取文本中的42個字符,最后數(shù)值是通過超幾何概率分布(Hypergeometricprobability distribution)計算得出(轉引自 Joan Torruella&Ramon Capsada,2013)。

Joan Torruella&Ramon Capsada(2013)回顧了以上方法中的11種計算方法,使用語料庫文本,考察現(xiàn)有公式在不同體裁和長度的文本中的測量信度。研究認為TTR、RTTR、CTTR易受文本長度的影響,Mass、MSTTR、MTLD等對文本長度的敏感度較低,可以作為測量詞匯變化性的備選方法。

(二)應用研究

詞匯變化性的應用研究主要是考察詞匯變化性與語言水平的關系以及使用該方法對比一語和二語產出性詞匯的差異。

有關詞匯變化性與語言水平關系的研究,學者們根據被試產出的文本,探究該維度與語言水平的關系或使用詞匯變化性公式作為測量方法,考察被試的語言水平。

大部分的研究顯示,詞匯變化性是有效的測量維度。Danielle S.McNamara et al.(2010)采用語料庫語言學的方法,從密西西比大學語料庫(MSU corpus)中抽取母語為英語的大學生完成的120篇作文,考察詞匯多樣性與作文成績的相關性。研究表明二者相關,即詞匯多樣性可以作為預測文本質量的語言指標(linguistic indicate)。

Engber(1995)通過考察就讀于美國大學英語強化班的中高級水平的英語學習者的作文,發(fā)現(xiàn)詞匯多樣性與整體寫作質量極為相關。Pilar Durán et al.(2004)通過使用D值法,考察年齡在18到42個月的母語為英語的兒童在5年間詞匯發(fā)展情況。研究發(fā)現(xiàn),隨著年齡增長,兒童在表達中的詞匯多樣性逐漸提升。因此,詞匯多樣性可以作為衡量學習者語言水平的有效工具。Serpil Demir-Vegter et al.(2014)直接將詞匯變化性作為衡量文本質量的標尺,并據此考察學習者的語言水平。

但也有研究持不同觀點,如Vermeer(2000)使用詞匯多樣性的若干測量方法,觀察幼兒園(4到5歲)和小學一年級(6歲)的兒童在自發(fā)性口語產出中的差異,考察學習者語言水平和自發(fā)性口語產出質量與詞匯多樣性的關系。研究顯示,現(xiàn)有的統(tǒng)計方法,包括類符數(shù)(number of types)及TTR在內的相關方法并不能有效反映兩組被試間的差異。因此,研究認為詞匯多樣性無助于反映學習者的語言水平。

對比研究主要是比較一語和二語者在言語產出中詞匯多樣性的差異。

Linnarud(1986)對比年齡為17歲、學習英語時間為9年的瑞典二語學習者與同齡的英語母語者在詞匯多樣性、詞匯錯誤和詞匯獨特性等方面的差異。研究表明,兩組被試在詞匯多樣性上差異顯著,在名詞的使用上最小,在副詞和形容詞的使用上差距最大。

Birgit Harley&Mary Lou King(1988)對比母語為法語的英語學習者在動詞多樣性上的不同。Judit Kormos(2011)對比一語者和二語者在寫作文本中所用詞匯的變化性,并認為該維度可以有效區(qū)別一語和二語寫作文本。但也有研究如Foste&Tavakoli(2009)通過使用Malvern.D和Richards.B(2000)的統(tǒng)計方法對比一語和二語學習者作文中的詞匯多樣性,研究顯示二者并沒有區(qū)別。

通過對詞匯變化性(詞匯多樣性)研究的梳理,我們可以看到,現(xiàn)有成果十分豐富,主要集中在如何創(chuàng)建和改良詞匯多樣性的計算方法以及該維度與學習者詞匯發(fā)展關系上,但對于該方法的有效性還存在一定爭議。

三、詞匯復雜性

Read(2000/2010:203)指出“復雜”詞語又可稱為罕見詞語(Lexical rareness),是指在文本中出現(xiàn)的常用度較低的詞(Unusual word)或高級詞(Advanced word)。研究認為,所用的復雜詞語比重越高,文本質量和學習者的語言水平就越高(Linnarud,1986;Vermeer,2000;劉東虹,2003;McNamara et al.,2010;萬麗芳,2010;Fan,2012等)。

計算詞匯復雜性的方法有以下幾種。Linnarud(1986)和Hyltenstam(1988)通過計算復雜詞匯的數(shù)量與總詞數(shù)的比來考察文本中的詞匯復雜性(具體公式見下,下同),Laufer(1991)在此基礎上進行了微調;Harley&King(1989)將范圍縮減為復雜動詞,即復雜動詞的類符數(shù)與動詞總數(shù)的比值;Chaudron&Parker(1990)在Harley和King的基礎上,將公式調整為平方版本(Squared Version);Wolfe-Quintero et al.(1998)根據Carroll(1964)的研究,對corrected type-token ration公式進行調整,提出計算動詞復雜性的公式。具體為:

除此之外,還有研究是基于詞頻表并通過軟件統(tǒng)計,直接計算詞匯復雜性。如Judit Kormos(2011)使用的是Coh-Metrix2.0程序,對文本的詞匯復雜性進行考察,盡管在具體的研究方法上不同,但該文的主體思路與以上研究相同,都是針對其所確定的復雜詞語進行考察。

Vermeer(2000)指出,與以TTR為代表的詞匯變化性相比,詞匯的復雜性更能體現(xiàn)出學習者在用詞上的能力。鮑貴(2008)認為,詞匯復雜性是區(qū)別不同水平學習者的最佳維度,無論使用何種具體計算方法,都始終保持著線性增長的趨勢。Danielle S.McNamara(2010)將詞匯復雜性作為區(qū)別不同語言水平學習者的依據,該研究顯示,寫作分數(shù)與文本中的復雜詞語使用極為相關。Judit Kormos(2011)對所收集到的一語和二語者的語料進行對比,發(fā)現(xiàn)二語者在詞匯復雜性上遠遠低于一語者,認為詞匯復雜性可有效區(qū)分不同語言水平。朱慧敏、王俊菊(2013)研究表明,文本中的詞匯復雜性隨著學習者年級的升高而增加,而且相鄰兩個年級間的詞匯復雜性存在顯著差異。

從結論來看,以上研究無一例外都認可詞匯復雜性的有效性,但問題是,如何判定一個詞對被試來說是“復雜”的?

對于不同語言水平和教育背景的學習者來說,“復雜”是一個相對概念,沒有一個固定范圍。例如,同樣是考察詞匯復雜性,但不同研究需要針對不同語言水平的被試劃定不同復雜程度的詞匯等級。Vermeer(2000)研究中的被試是幼兒園和一年級的兒童,而East(2006)的實驗參與者是17到18歲的高中生,Judit Kormos(2011)的研究樣本則來自于學習英語的匈牙利大學生。除了被試在年齡和教育水平上的差距外,學習者的知識背景也會影響詞匯復雜性的確定,比如同樣是中級水平的二語學習者,其中一個被試由于某些原因頻繁接觸某個或某些常用度較低的詞并習得,那么盡管學習者在輸出中使用了該詞,但不能說明他在用詞上的復雜性高于不能使用該詞的其他被試。誠如Laufer&Nation(1995)所指出的,“詞匯復雜性依賴于對復雜詞匯的界定,同樣的文本會得出不同的詞匯復雜性分析結果。……如果想對不同教育體系下的被試組進行對比,就需要對高級詞匯或復雜詞匯進行標準化的界定?!?/p>

綜合上述研究,可以發(fā)現(xiàn),詞匯復雜性可有效反映學習者的語言水平,但詞匯的復雜性要根據學習者的水平進行調整,因此,所謂的“復雜”是相對的,也是難以統(tǒng)一標準的。

四、詞匯密度

關于詞匯密度的研究開始于Ure(1971)。Ure認為,某一文本中詞匯詞(Lexical word)在總詞數(shù)中的比重即為詞匯密度。Halliday(1985)發(fā)展了Ure的公式,通過計算文本中的實詞數(shù)和小句總數(shù)的比,來計算文本的詞匯密度。Laufer(1991)、Laufer&Nation(1995)則在以上公式的基礎上進行了一定調整,具體見下。

詞匯密度主要應用在兩個方面:其一,測量文本質量,其二,區(qū)分不同體裁的文本。

研究者認為,與語法詞(Grammatical/Function words)相比,詞匯詞在文本中主要承擔表義功能(Engber,1995;McNamara et al.,2010;Demir-Vegter et al.,2014等)。因此,認為計算出的數(shù)值越大,學習者的語言水平或文本質量越高。

Ure(1971)、Halliday(1985)和Stubbs(1986)等研究發(fā)現(xiàn),口語產出中的詞匯密度低于寫作文本,并且認為詞匯密度是區(qū)分不同體裁文本的有效指標。

詞匯密度作為區(qū)分不同文本體裁的工具,其有效性已得到學界認可,但是通過詞匯密度測量寫作質量則存在爭議。Linnarud(1986)和Engber(1995)指出詞匯密度與二語寫作成績無關,在整體評分(holistic rating)中不能對分數(shù)產生影響。Lu(2012)使用Ure(1971)中的公式考察二語學習者在口語測試中的表現(xiàn),研究發(fā)現(xiàn)詞匯密度并不能反映出學習者的語言水平。但朱慧敏&王俊菊(2013)通過使用Halliday(1985)中的公式考察中國英語專業(yè)一到四年級大學生詞匯發(fā)展情況,結果顯示詞匯密度整體呈上升趨勢。

為何詞匯密度在體現(xiàn)學習者寫作質量上存在爭議?我們認為,詞匯密度或可反映出學習者的語言水平,因為詞匯水平是二語者語言水平的一部分。語法詞是一個封閉類,成員主要是高頻詞;而詞匯詞是一個開放的類,內部成員眾多紛雜,常用度、典雅度等各有不同,對詞匯詞的使用反映出學習者的語言能力。因此,可以作為觀察語言水平的一個維度。但是,語言水平或寫作質量并不能單單依靠詞匯詞的堆砌來提升,王藝璇(2015)的研究表明,文本中復句的數(shù)量影響作文成績。復句的構建需要連詞等非詞匯詞,即語法詞的銜接,如果語法詞在文本中數(shù)量過少,在一定程度上反映出文本中復句數(shù)量少,簡單句較多,作文成績因此會受到影響。誠如Laufer&Nation(1995)所指出,“一篇作文中的功能詞(語法詞)較少,可能反映出該文本中的從句、分詞短語和省略的使用水平太低,這些并不是詞匯詞,而是作文的結構特性。”

五、詞頻概貌

“詞頻概貌”(Lexical frequency profile,LFP)是指在某一文本中常用度不同的詞語的使用情況,其反映了所用詞語在各詞頻等級中的比重(Laufer&Nation,1995)。Batia Laufer和Paul Nation是在詞匯復雜性基礎上提出詞頻概貌這一觀察維度的,主要依據詞語在本族語中的使用頻率對詞匯進行等級劃分并據此考察學習者的詞匯水平和語言水平。詞頻概貌和詞匯復雜性雖然都是根據詞語的常用度進行判斷,但與詞匯復雜性不同的是,詞頻概貌不僅僅是考察常用度等級低的詞語,而且還對文本中出現(xiàn)的每一個詞進行常用度判斷,最后以數(shù)值的方式呈現(xiàn)出學習者的用詞情況,也就是所用詞語詞頻等級的大“概”面“貌”。有關詞匯復雜性的研究已表明,相對于水平較低的語言學習者,高水平的二語者在表達中更傾向于使用低頻詞。除此之外,詞頻概貌還將呈現(xiàn)其他詞頻等級中詞語使用的趨勢和特點。

Laufer和Nation在1995年的研究中指出,與詞匯豐富性中其他觀察維度相比,LFP有以下優(yōu)點:1)與詞匯獨特性相比,LFP是基于大環(huán)境而非被試組,因此更客觀。2)與詞匯密度相比,LFP獨立于句法和文本中的結構,關注詞語,因此更適合作為考察詞匯豐富性的工具。3)與詞匯復雜性相比,LFP呈現(xiàn)出了更為詳盡的各詞頻等級詞語的使用情況,同時,由于詞匯復雜性中復雜詞語的確定是根據學習者的語言程度,而LFP是基于詞頻詞表進行判斷,因此更適合比較不同程度的被試。4)與詞匯多樣性相比,LPF可以展示出學習者所用詞語的不同詞頻等級,而不是像前者所簡略呈現(xiàn)的那樣,在有限的詞匯量基礎上,變換使用不同詞語進行表達。在之后Laufer&Paribakht(1998),Laufer(1998)和James Muncie(2002)等相關研究中,LFP也顯示了較好的信度。

Meara(2005)使用Monte Carlo模擬的方法,結合自己的研究經驗及成果(Meara,1993;Meara et al.,1997)對LFP進行分析后,從四個方面提出質疑:首先,不同語言水平的學習者的LFP是否有顯著區(qū)別?(Meara認為低頻詞在文本中使用的數(shù)量有限且相對較少,可能無法產生顯著差異)其次,同一學習者在詞語水平測試中所得分數(shù),與其作文中的LFP是否顯著相關?再次,同一學習者產出的兩組作文,在LFP上是否存在顯著的相關性?最后,兩組作文間,同一學習者所用的不同詞頻等級詞語的比重是否高度相關?

Laufer在同年同刊發(fā)文,以Lexical Frequency Profile:From Monte Carlo to the Real World—A Response to Meara為題,針對Meara提出的四點質疑逐一回復并對LFP的相關問題做了進一步闡述。例如,Meara認為學習者產出的低頻詞過少,不能清晰顯示出學習者的水平,但Laufer認為,正是由于低頻詞的產出較少,所以每一個低頻詞背后所體現(xiàn)的意義才更大,才更能反映出學習者的水平。同時,Laufer以自己和Nation在研究中所采集到的真實數(shù)據作為佐證,認為Meara基于計算機產生的模擬數(shù)據不足以作為推翻LFP的證據,并指出Meara所模擬的數(shù)據(以及經驗上的)與現(xiàn)實中學習者產出的情況相去甚遠,因此,基于該數(shù)據所得到的結論不能作為批評LFP的依據。Laufer在文章最后指出Meara(2005)對LFP存在的誤解,例如,Meara認為LFP包括詞語錯誤,影響其信度,但事實上,Laufer指出在計算LFP前已去除詞匯錯誤。

盡管Laufer(2005)對Meara(2005)的質疑進行了有針對性的回擊,并將LFP的相關問題加以闡述和清晰化,但并不代表LFP是無懈可擊的。

首先,Laufer(2005)并沒有提出如何有效解決低頻詞所占比重較少,不利于客觀反映學習者詞匯產出情況的解決方案。由于LFP在觀察中加入了其他詞頻等級的詞語,導致低頻詞在整體上的顯著度被降低。因為無論學習者語言水平多高,都不能避免使用作為日常表達基礎的高頻詞語。雖然Laufer(1995)中提供了簡化版“Beyond 2000”,但是如此一來模糊了Advance word中不同詞頻的詞語界限,反而不利于細致觀察高水平學習者的詞匯產出情況。

其次,LFP受到文本長度影響,Laufer已意識到LFP會受到影響,因此在其1995年的研究中指出LFP應用在長度為200到400詞的文本中似乎更有效。但是對于長度低于200和超出400的文本將如何處理?Laufer沒有提供解決方案。

最后,LFP僅能呈現(xiàn)出學習者詞匯使用的“概貌”,無法精細到每部分的具體情況,在一篇文本中,學習者使用同一個詞10次和使用處于相同等級的10個不同的詞所呈現(xiàn)出的LFP是一樣的。

還有一些研究是針對LFP中的問題做進一步探討。如Meara和Bell(2001)針對LFP易受到文本長度的影響提出P-Lex法。操作方法為將自然文本分解為以10個詞為一個言語片段的單位,然后對其中不同詞頻等級的詞進行統(tǒng)計,并基于此制作曲線圖。除此之外,Kojima(2011)和Masumi Kojima、Junko Yamashita(2014)提出和使用的S法等。

六、詞匯獨特性

在一組被試中,針對某一題目,學習者所用的異于他人的詞匯越多,所得數(shù)值越大,說明他的詞匯廣度越大,詞匯知識越豐富,相應的語言水平或寫作質量也應高于旁人(Linnarud,1986;Laufer,1991)。但是,詞匯獨特性依然存在不足。

首先,數(shù)據的有效性有限。由于受到被試組成員的限制,因此某一具體研究中所得數(shù)據并不具有普適性。正如Laufer&Nation(1995)指出的,“如果被試組發(fā)生變化,詞匯獨特性指數(shù)也將發(fā)生變化。也就是某篇作文的詞匯獨特性是不穩(wěn)定的,因為這一數(shù)據不僅僅由作文本身質量決定,還受制于被試組成員。因此,該方法的信度會受到影響。”Read(2000:204)也指出,“(與衡量詞匯豐富性的其他維度相比)很明顯,這種測量方法并不穩(wěn)定,它是由對照組中其他被試的語言能力決定的?!本褪钦f,詞匯獨特性是相對的,并非是一個可以橫向比較的數(shù)據。

其次,應用范圍有限。從應用角度來看,該方法僅限于小規(guī)模樣本的測量,如隨堂考試或課后作業(yè),無助于大規(guī)模的考試閱卷評分以及據此為學習者提供有關應試的適切建議。大型考試中試卷的批改主要是流水作業(yè),所需評分的試卷數(shù)量極大,這也就使得相關詞語出現(xiàn)的可能大大增加,學習者在這種情況下使用旁人沒有使用過的詞,可能性較小。即便學習者使用了“獨特”的詞匯,但由于其數(shù)量有限,能否引起閱卷者的注意也是一個問題。其應用范圍較小,因此,詞匯獨特性的普適性還需考量。

“詞匯獨特性”(Lexical originality)亦稱詞匯個性(Lexical individuality)(Linnarud,1986),Birgit Harley&Mary Lou King(1989)將之稱為詞匯特殊性(Lexical specificity)。詞匯獨特性,顧名思義是指文本中用詞的獨特之處,這種“獨特”主要通過統(tǒng)計該文本中異于他人所用之詞來體現(xiàn)(Laufer&Nation,1995)。具體方法為:統(tǒng)計被試組中的某一被試所用的異于該組中其他被試所用詞語的比重(Rod Ellis,1984轉引自Laufer,1991)。代表性計算公式為:

七、余 論

有關詞匯豐富性研究成果可概括為兩大類:

其一,公式及方法探討。研究主要集中在公式有效性的探討,最終大部分的成果應用于計算機自動評分。例如Noam Ordanet al.(2010)、RieKoizumi&YoIn’nami(2012)對有關詞匯多樣性公式的討論;Joan Torruella&Ramon Capsada(2013)對前人提出的詞匯多樣性公式進行匯總并加以比對;David Malvern&Brian Richards(2002)使用數(shù)學建模,通過軟件計算和觀察大量樣本,在TTR基礎上提出計算D值的方法等都可歸入這類研究。

其二,相關性研究??疾煸~匯豐富性(或其中的若干維度)與文本質量或語言水平之間的關系。例如Batla Laufer&Paul Nation(1995)使用詞頻概貌的方法測量學習者寫作水平并根據詞匯使用情況觀察其寫作水平的發(fā)展。Engber(1995)根據收集到的66篇文本,考察詞匯變化性、無誤詞匯變化性(Error-free variation)、詞匯錯誤比重(Percentage of lexical error)以及詞匯密度與作文成績的關系。

在兩類研究中,前者的目的在于尋找可靠的測量公式,基于語料進行反復測試以探求考察寫作水平的方法,所得結論一般服務于計算機自動評分而不是直接應用于教學;后者則是通過使用前者提出的統(tǒng)計方法對學習者產出的文本進行測量,使之成為考量學習者語言發(fā)展或區(qū)分不同水平學習者的一個方法。

與英語作為第二語言的研究相比,當前漢語作為第二語言的研究中有關詞匯豐富性的研究相對較少且方法單一,主要為直接或對比使用詞匯豐富性中各維度的計算方法測量學習者的詞匯及語言水平,例如吳繼峰(2016)、丁安琪等(2016)。涉及探討適用于漢語的詞匯豐富性計算方法的研究較少,僅見王藝璇(2017)。

詞匯豐富性是觀察學習者詞匯和語言水平發(fā)展的有效切入點,如何借他山之石,攻己之玉,即如何將之應用于漢語第二語言詞匯習得研究中,是今后探討的重要方面。

注釋:

[1]本文沒有對“詞匯錯誤”做詳細介紹,是因為詞匯錯誤雖隸屬于詞匯豐富性研究框架,但其為人所熟知,故不再占用篇幅贅述。

丁安琪、肖 瀟:《意大利學習者初級漢語口語詞匯能力發(fā)展研究》,《世界漢語教學》,2016年第2期。

萬麗芳:《中國英語專業(yè)大學生二語寫作中的詞匯豐富性研究》,《外語界》,2010年第1期。

王藝璇:《HSK作文成績與句子長度、復雜度及語法錯誤的相關性》,《漢語應用語言學》,2015年第4輯。

王藝璇:《漢語二語者詞匯豐富性與寫作成績的相關性——兼論測量寫作質量的多元線性回歸模型及方程》,《語言文字應用》,2017年第2期。

吳繼峰:《英語母語者漢語寫作中的詞匯豐富性發(fā)展研究》,《世界漢語教學》,2016年第2期。

趙守輝:《詞匯能力測評立體觀》,《暨南大學華文學院學報》,2008年第2期。

張 艷、陳紀梁:《言語產出中詞匯豐富性的定量測量方法》,《外語測試與教學》,2012年第3期。

朱慧敏、王俊菊:《英語寫作的詞匯豐富性發(fā)展特征——一項基于自建語料庫的縱貫研究》,《外語界》,2013年第6期。

Birgit Harley&Mary Lou King.Verb Lexis in theWritten Compositions of Young L2 Learners.Studies in Second Language Acquisition,1989,11(4).

Carroll,J.B.Language and Thought.Englewood Cliffs:Prentice-Hall,Inc.Francais Moderne,1964.

Chaudron,Craig&Parker,Kate.Discoursemarkedness and structuralmarkedness:The acquisition of English noun phrases.Studies in Second Language Acquisition,1990,12(1).

Demir-Vegter,Serpil,Rian Aarts&Jeanne Kurvers.Lexical richness in maternal input and vocabulary development of Turkish preschoolers in the Netherland.Journal of Psycholinguistic Reseach,2014,43(2).

Durán,Pilar,David Malvern,Brian Richards&Ngoni Chipere.Developmental trends in lexical diversity.Applied Linguistics,2004,25(2).

Dusková,Líbu?e.On sources of errors in foreign language learning.International Review of Applied Linguistics in Language Teaching,1969,7(1).

East,Martin.The impact of bilingual dictionaries on lexical sophistication and lexical accuracy in tests of L2 writing proficiency:A quantitative analysis.Assessing Writing,2006,11(3).

Engber,Cheryl A.The relationship of lexical proficiency to the quality of ESL compositions.Journal of Second Language Writing,1995,4(2).

Fan,F(xiàn)engxiang.A quantitative study on the lexical change of American English.Journal of Quantitative Linguistics,2012,19(3).

Fiona.JTweed&Baayen,R Harald.How variablesmay a constantbe Measures in lexical richness in perspective.Computer and the Humanities,1998,32(4).

Foster,Pauline&Parvaneh Tavakoli.Native speakers and task performance:Comparing effects oncomplexity,fluency,and lexical diversity.Language Learning,2009,59(4).

Guiraud,P.Problèmes etMéthodes de la Statistique Linguistique.Paris:Presses universitaires de France,1960.

Haliday,M.A.K.An Introduction to Functional Grammar.London:Edward Arnold,1985.

Harley,Birgit&Mary Lou King.Verb lexis in the written compositions of young L2 learners.Studies in Second Language Acquisition,1989,11(4).

Herdan.G.Quantitative Linguistics.London:Butterworth,1960.

Hyltenstam,Kenneth.Lexical characteristics of near-native second-language learners of Swedish.Journal of Multilingual&Multicultural Development,1988,9(1-2).

Judit Kormos.Task complexity and linguistic and discourse features of narrativewriting performance.Journal of Second LanguageWriting,2011,20(2).

Kojima,Masumi.An argument-based approach to validate S:A newly developmentmeasure of lexical richness.Poster presented at the Corpus Linguistics:Birmingham,2011.

Kojima,Masumi,Junko Yamashita.Reliability of lexical richnessmeasures based on word lists in short second language productions.System,2014,42(1).

Laufer,Batia.The developmentof L2 lexis in the expression of the advanced learner.Modern Language Journal,1991,75(4).Laufer,Batia.The development of passive and active vocabulary in a second language:Same or different?Applied Linguistics,1998,19(2).

Laufer,Batia&Paribakht,T.S.The relationship between active and passive vocabularies:Effects of language learning context.Language Learning,1998,48(3).

Laufer,Batia&Paul Nation.Vocabulary size and use:Lexical richness in L2 written production.Applied Linguistics,1995,16(3).

Laufer,Batia.Lexical Frequency Profiles:From Monte Carlo to the real world:A response to Meara.Applied Linguistics,2005,26(4).

Linnarud,Moira.Lexis in Composition:APerformance Analysis of Swedish Learners’Written English.Lund,Sweden:CWK Gleerup,1986.

Lu Xiaofeng.The Relationship of Lexical Richness to the Quality of ESL Learners’Oral Narrative.The Modern Language Journal,2012,96(2).

Malvern,David&Brian Richards.Investigating accommodation in language proficiency interviews using a new measure of lexical diversity.Language Testing,2002,19(1).

McCarthy,Philip.M.An assessmentof the range and usefulness of lexical diversitymeasures and the potentialof themeasure of textual,lexical diversity(MTLD).Unpubilshed doctoral dissertation,university of Memphis,2005.

McNamara,DanielleS.,ScottA.Crossley&Philip M.McCarthy.Linguistic features of writing quality.Written Communication,2010,27(1).

Meara Paul.Tintin and theworld service:a look at lexical environments.IATEFL:Annual Conference Report,1993,32-37.Meara Paul.Lexical Frequency Profiles:A Monte Carlo Analysis.Applied Linguistics,2005,26(1).

Meara Paul&H.Bell.P-Lex:A simple and effective way of describing the lexical characteristics of short 12 texts.Prospect,2001,16(3).

Meara Paul,Lightbown Patsy M.&Halter Randall.Classrooms as lexical environments.Language Teaching Research,1997,1(1).

Muncie,James.Processwriting and vocabulary development:comparing Lexical Frequency Profiles across drafts.System,2002,30(2).

Ordan,Noam,Victoria Itskovich,Miriam Shlesinger&Ido Kanter.Lexical richness revisited:Blueprint for amore economicalmeasure.Journal of Quantitative Linguistics,2010,17(1).

Read,John.Assessing Vocabulary,Beijing:Foreign Language Teaching and Research Press,2010.

RieKoizumi,YoIn’nami.Effects of text length on lexical diversity measures:Using short texts with less than 200 tokens,System,2012,40(4).

Sommers,H.H.Statisticalmethods in literary analysis.In J.Leeds(Ed.),The Computer and Literary Style,128-140.Kent,OH:Kent State University,1966.

Stubbs,M.Lexical density:a computational technique and some findings.In M.Coulthard(ed.),Talking About Test(p.27-48).Birmingham:English Language Research,University of Birmingham,1986.

Ure,J.N.Lexical density and register differentiation.In G.E.Perren&J.L.M.Trim(eds.)Applicationsof Linguistics:Selected Papers of the Second International Congress of Applied Linguistics,443-452.Cambridge:Cambridge University Press,1971.

Vermeer,A.Coming to grips with lexical richness in spontaneous speech data.Language Testing,2000,17(1).

Wolfe-Quintero,Kate,Inagki,Shunjin.&Kim,HaeYoung.Second language development in writing:Measures of fluency,accuracy,and complexity.Honolulu:University of Hawai’i,Second Language Teaching and Curriculum Center,1998.

猜你喜歡
豐富性詞頻復雜性
基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
園林科技(2021年3期)2022-01-19 03:17:48
PFNA與DHS治療股骨近端復雜性骨折的效果對比
簡單性與復雜性的統(tǒng)一
科學(2020年1期)2020-08-24 08:07:56
電視新聞報道如何擺脫平淡
記者搖籃(2016年11期)2017-01-12 14:00:35
應充分考慮醫(yī)院管理的復雜性
新聞采訪語言信息豐富性缺失的表現(xiàn)分析
科技傳播(2016年17期)2016-10-09 21:28:06
直腸腔內超聲和MRI在復雜性肛瘺診斷中的對比分析
腫瘤影像學(2015年3期)2015-12-09 02:38:52
詞頻,一部隱秘的歷史
云存儲中支持詞頻和用戶喜好的密文模糊檢索
以關鍵詞詞頻法透視《大學圖書館學報》學術研究特色
圖書館論壇(2014年8期)2014-03-11 18:47:59
栾川县| 佛坪县| 南郑县| 通榆县| 溧阳市| 新丰县| 瑞安市| 巴青县| 容城县| 绥滨县| 靖西县| 台中县| 诏安县| 大名县| 宁远县| 加查县| 家居| 昔阳县| 丽水市| 张家界市| 南丰县| 石城县| 滁州市| 万全县| 剑阁县| 甘南县| 页游| 金乡县| 东港市| 南丹县| 阜新| 十堰市| 铁岭市| 兴文县| 五家渠市| 深圳市| 萨嘎县| 尼勒克县| 福建省| 漳州市| 丹阳市|