国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于結(jié)構(gòu)方程模型的高級水平漢語學(xué)習(xí)者語言理解能力結(jié)構(gòu)探究

2013-10-13 07:39:30王佶旻
華文教學(xué)與研究 2013年2期
關(guān)鍵詞:第二語言理解能力測驗

黃 敬,王佶旻

(1.2.北京語言大學(xué)漢語水平考試中心,北京,100083)

0.引言

語言能力問題是語言測試研究的基本問題,因此對這個問題的討論在語言測試?yán)碚撝酗@得尤為重要。根據(jù)接受性和產(chǎn)出性兩類模式,語言能力可分為語言理解能力和語言表達(dá)能力 (Brown,1996)。聽力理解能力和閱讀理解能力都屬于語言理解能力。關(guān)于語言能力結(jié)構(gòu)的研究,國內(nèi)外學(xué)界都做了大量的研究。但是在國內(nèi)漢語作為第二語言測試界,有關(guān)語言理解能力的研究還有待補充。聽力理解和閱讀理解都是復(fù)雜的和多維的過程,國內(nèi)外學(xué)者們都在試圖從不同角度描述其內(nèi)部包括的子能力。正如 Alderson&Lukmani(1989)指出,不同的研究者認(rèn)為存在不同數(shù)量和類型的子能力,但是有的研究者擁有實驗數(shù)據(jù)的支持,有的卻沒有 (例如 Davis,1968;Munby,1978;Richards, 1983; Weir, 1993)。 同時, 在子能力的數(shù)量和類型這一問題上,學(xué)者們?nèi)匀粵]有達(dá)成一致。在國內(nèi),有關(guān)語言理解能力結(jié)構(gòu)的研究,特別是漢語作為第二語言的語言理解能力的結(jié)構(gòu)研究尚不充分,本研究可作為這方面研究的補充。同時,對語言理解能力結(jié)構(gòu)進(jìn)行深入研究,可以為漢語測驗的編制提供思路,為分?jǐn)?shù)解釋和診斷性測驗提供依據(jù),也可以為漢語教學(xué)起到指導(dǎo)和改善作用,為有針對性地進(jìn)行聽力和閱讀技能的訓(xùn)練,改進(jìn)課堂教學(xué)效果提供科學(xué)的依據(jù)。

基于以上理論目的和實踐目的,本研究將使用結(jié)構(gòu)方程模型 (Structural Equation Model,SEM)的方法,探討漢語作為第二語言的高級水平學(xué)習(xí)者語言理解能力的結(jié)構(gòu)。本研究涉及語言理解能力及其內(nèi)部子能力這些潛變量的復(fù)雜關(guān)系,傳統(tǒng)的統(tǒng)計方法 (如回歸分析)不能妥善處理這些潛變量,而結(jié)構(gòu)方程模型能夠同時處理潛變量 (latent variable)及其外顯指標(biāo)(observable indicators)(侯杰泰、溫忠麟、成子娟,2004)。此外,結(jié)構(gòu)方程分析經(jīng)常用以比較不同模型,將同一組數(shù)據(jù)用不同的模型去擬合,看看哪一個模型擬合更好,從而推想被試的能力結(jié)構(gòu) (侯杰泰、溫忠麟、成子娟,2004),這也有利于本研究比較漢語作為第二語言的高級水平學(xué)習(xí)者語言理解能力結(jié)構(gòu)的多個可能模型,并最終得出最優(yōu)模型。在語言測試領(lǐng)域,一些研究也使用過相似的方法來研究第二語言能力結(jié)構(gòu) (如Bachman & Palmer, 1981, 1982;Buck,1991,1992; Sang, Schmitz, Vollmer, Baumert &Roeder, 1986; Sasaki, 1996; Shin, 2005),但很少有研究使用結(jié)構(gòu)方程模型的方法來研究漢語作為第二語言學(xué)習(xí)者語言理解能力的結(jié)構(gòu)。

1.研究問題

基于以上論述,本研究主要解決以下問題:

第一,漢語作為第二語言的高級水平學(xué)習(xí)者的聽力理解能力和閱讀理解能力這兩種語言理解能力是否可分?如果可分,其結(jié)構(gòu)分別是什么?其內(nèi)部所包括的子能力的數(shù)量和類型分別是什么?

第二,漢語作為第二語言的高級水平學(xué)習(xí)者的語言理解能力是否可分?如果可分,語言理解能力的結(jié)構(gòu)是什么?其內(nèi)部所包括的子能力的數(shù)量和類型分別是什么?

2.研究背景

基于以上提出的研究問題,我們將從語言理解能力結(jié)構(gòu)研究和聽力理解能力與閱讀理解能力的結(jié)構(gòu)關(guān)系研究兩方面來梳理前人的有關(guān)研究成果。

2.1 語言理解能力結(jié)構(gòu)研究

關(guān)于語言理解能力的結(jié)構(gòu),學(xué)界一直存在著爭議。歸結(jié)起來主要有兩個基本問題:第一,語言理解能力的可分性;第二,如果可分,那么語言理解能力內(nèi)部的子能力的數(shù)量和種類分別是什么?對于第一個問題的回答,研究者關(guān)于語言理解能力結(jié)構(gòu)主要持有兩派觀點,即語言理解能力不可分論和語言理解能力可分論。

持不可分論的學(xué)者認(rèn)為,語言理解能力由一個單一的、整體的、綜合的特質(zhì)構(gòu)成,并不存在不同的可分性的子能力。Lunzer&Gardner(1979)根據(jù)研究指出,閱讀是一種單一的、整體性的技能,并沒有明晰的證據(jù)表明其內(nèi)部存在可分離的子能力。Alderson&Lukmani(1989)通過研究也對閱讀理解能力是否由不同的子能力構(gòu)成,以及這些子能力之間是否存在層級關(guān)系提出了質(zhì)疑。他認(rèn)為,即使是專家,有時候也很難判斷某一道閱讀題究竟考查的是哪一種閱讀能力。

持可分論觀點的學(xué)者認(rèn)為,語言理解能力是由多個各不相同的子能力構(gòu)成的。但是對于構(gòu)成語言理解能力的子能力的數(shù)量和種類,學(xué)界一直未能達(dá)成共識。目前存在兩派觀點:

一種觀點認(rèn)為,語言理解能力由兩部分構(gòu)成。在聽力理解能力結(jié)構(gòu)研究方面,一些研究者提出聽力理解能力包括兩個部分 (Clark&Clark, 1977; Hughes, 1989; Oakeshott-Taylor,1977;Rivers,1966), 最為典型的是 Carroll(1972),他認(rèn)為聽力理解能力由兩部分構(gòu)成:一是理解語言信息的能力;二是將語言信息和廣闊的交際語境聯(lián)系起來的能力。在閱讀理解能力結(jié)構(gòu)研究方面,目前的研究者越來越傾向于認(rèn)為,閱讀理解能力由解碼和理解兩部分構(gòu)成。解碼是識別詞匯,而理解則包括對句子進(jìn)行語法分析、理解句子在語篇中的意義、建構(gòu)語篇結(jié)構(gòu)以及將這些理解與已有知識整合等(Gough, Ehri& Treiman, 1992)。由于語言材料呈現(xiàn)的方式不一樣,在解碼階段,聽力和閱讀存在明顯的差異,而在理解階段,兩者則是一致的。

另一種觀點認(rèn)為,語言理解能力內(nèi)部包含三種及以上的子能力。但是,對于語言理解能力內(nèi)部的子能力的數(shù)量和種類,研究者并未取得一致意見。在聽力理解能力結(jié)構(gòu)研究方面,研究者們一直嘗試確定構(gòu)成聽力理解能力的子能力。但是,對于構(gòu)成聽力理解能力的子能力的數(shù)量和種類,學(xué)界一直未能達(dá)成共識。不同的研究者從不同的角度劃分了聽力理解能力的子能力,少至3種,多達(dá)250種 (例如Kenneth, 1976; Munby, 1978; Richards, 1983;Valette, 1977; Weir, 1993; 杜建, 1992; 谷陵,2003;金天相、李泉,1994;李清華,1987;劉秀明、王蘋,2008;楊惠元,1989,1991;朱正才、范開泰,2001)。在閱讀理解能力結(jié)構(gòu)研究方面,從事閱讀研究的學(xué)者們同樣也都一直試圖確定構(gòu)成閱讀理解能力的子能力,并提出了許多不同的子能力列表。但是對于構(gòu)成閱讀理解能力的子能力的數(shù)量和種類,學(xué)界也未能達(dá)成共識。不同的研究者從不同的角度劃分了閱讀理解能力的子能力,少至3種,多達(dá)100 種(例如 Carroll,1993;Carver,1982, 1983,1984, 1990, 1992; Davis, 1944,1968; Grabe,1991; Gray, 1960;Harmer, 1983; Kintsch &Dijk,1978;Kintsch& Yarbrough,1982;Lennon,1962;Munby,1978)。綜觀此類研究,多角度考察了語言理解能力,對語言理解能力的研究呈現(xiàn)出多元化趨勢。既有從語音 (重音、語調(diào)等)、詞匯、語法 (句型、句式等)等語言要素的角度考察語言理解能力的結(jié)構(gòu),也有從交際目的、說話者態(tài)度等語用學(xué)角度來分析語言理解能力的結(jié)構(gòu),還有從修辭、連貫等篇章要素的角度來研究語言理解能力的結(jié)構(gòu),等等。這樣的劃分雖然全面,但是帶來的一個嚴(yán)重的問題就是劃分的維度和層次不清晰,有的研究對于子能力的劃分過于細(xì)致,導(dǎo)致下位能力與上位能力之間層次混亂;有的研究對于子能力的劃分過于籠統(tǒng),導(dǎo)致有的子能力過于復(fù)雜,實際上是一個綜合性能力。這樣既加大了子能力定義的難度,也影響了其理論與實證價值的實現(xiàn)。

在實證研究方面,大多數(shù)的研究使用了因素分析的方法 (Carroll, 1993; Davis, 1968;Lennon, 1962; Rost, 1993; Spearitt, 1972; 金琰如、王佶旻,2012)和多元回歸分析的方法(Davey, 1988; Drum, Calfee & Cook, 1981;Freedle & Kostin, 1996; Nissan, DeVincenzi&Tang,1996; Pollitt, Hutchinson, Entwistle &DeLuca, 1985)。隨著統(tǒng)計技術(shù)的發(fā)展,一些研究者開始使用認(rèn)知診斷模型來研究語言理解能力 (Buck& Tatsuoka, 1998; Jang, 2009;李小蘭,2008;王靜,2008;徐式婧,2007;楊旭,2010),但此類研究都是側(cè)重解決有關(guān)測驗分?jǐn)?shù)的診斷性報告的問題,而非研究語言理解能力結(jié)構(gòu)本身的結(jié)構(gòu)特點。

2.2 聽力理解能力和閱讀理解能力的結(jié)構(gòu)關(guān)系研究

有關(guān)聽力理解能力和閱讀理解能力的結(jié)構(gòu)關(guān)系依舊沒有定論。Reves&Levine(1988)運用相關(guān)分析和多元回歸分析進(jìn)行研究,結(jié)果發(fā)現(xiàn)兩種語言理解能力 (聽力理解和閱讀理解)都包含一個單一因子和許多子能力。他們認(rèn)為閱讀理解能力內(nèi)部的子能力在某種程度上來說和聽力理解能力內(nèi)部的子能力是相似的。聽力理解能力不同于閱讀理解能力,是因為聽力理解與閱讀理解相比,是更為整體性的語言理解能力。口頭話語和書面話語之間的差異會導(dǎo)致處理模式的差異。Buck(1991)使用多質(zhì)多法(Multitrait-Multimethod, MTMM)模型進(jìn)行構(gòu)想效度的研究表明聽力理解能力作為一種不同的特質(zhì)區(qū)別于閱讀理解能力。然而,Buck(1992)的研究指出支持聽力理解能力作為一種不同的特質(zhì)這一觀點的證據(jù)是矛盾的。通過兩次研究所得出的不同結(jié)果,他進(jìn)一步推測研究中的 “強大特質(zhì)效應(yīng)”的存在并不能表明聽力理解能力區(qū)別于閱讀理解能力。Bae&Bachman(1998)使用驗證性因素分析進(jìn)行研究,認(rèn)為聽力理解能力和閱讀理解能力存在重疊部分,但各自又有獨特的方面。Freedle&Kostin(1994,1999)對比了聽力理解能力和閱讀理解能力,也得出了類似的結(jié)論。Buck(2001)在對以往理論研究和實證研究總結(jié)的基礎(chǔ)之上,認(rèn)為 “聽力理解能力和閱讀理解能力的許多重要特征實際上是語言理解能力所有形式的特征。雖然兩者在某些方面存在獨特性,但它們擁有許多共同的特征。”Park(2004)則認(rèn)為聽力理解能力和閱讀理解能力是不同的。第二語言聽話者比較容易處理推理性信息,而第二語言閱讀者則較為容易處理事實性信息。語言知識和背景知識對于聽力理解能力來說都十分重要,而在閱讀理解能力中,背景知識沒有語言知識重要。

3.研究方法、過程及結(jié)果

3.1 樣本

本研究的數(shù)據(jù)來自于2010年10月16日施測的HSK[高等]考試,共有來自52個國家和地區(qū)的2733名考生參加了此次考試。此考試適用于漢語作為第二語言的高級水平學(xué)習(xí)者,接受過3000學(xué)時和3000學(xué)時以上現(xiàn)代漢語正規(guī)教育的學(xué)習(xí)者 (包括具有同等學(xué)歷或同等水平的漢語學(xué)習(xí)者)可達(dá)到這一級標(biāo)準(zhǔn)。

3.2 測量工具

本研究使用的試卷是HSK[高等]的筆試試卷。筆試試卷分為三個部分:聽力理解、閱讀理解和綜合表達(dá),共120題。本研究由于需要同時考查聽力理解能力和閱讀理解能力的結(jié)構(gòu),故只選取聽力理解和閱讀理解兩個分測驗。其中聽力理解分測驗主要考查應(yīng)試者聽懂并理解漢語口語的能力,有2個小部分,共40題,約30分鐘;閱讀理解分測驗主要考查應(yīng)試者看懂并理解漢語書面材料的能力,有2個小部分,共40題,約40分鐘。

3.3 觀測變量

3.3.1 對試題進(jìn)行分類

基于前人的研究和HSK[高等]測驗試題的內(nèi)容以及測驗問題和選項分析,80道測驗試題被分為以下3類:

1)概括總結(jié)能力:理解并抓住語言材料的主要內(nèi)容的能力。

2)細(xì)節(jié)捕捉能力:理解并抓住語言材料的有關(guān)細(xì)節(jié)的能力。

3)推理判斷能力:理解并根據(jù)語言材料進(jìn)行推理的能力。

基于此分類,兩位專家受邀分別考查了聽力理解分測驗和閱讀理解分測驗的語言材料以及問題和選項,對80道測驗試題進(jìn)行了歸類,并比較分類結(jié)果。兩位專家分類結(jié)果一致的題目有77道,占總題數(shù)的96%。未能取得一致意見的題目為3道,其中閱讀理解分測驗試題2道,聽力理解分測驗試題1道。在經(jīng)過討論之后,兩位專家對所有題目的分類取得了一致意見。分類結(jié)果見表1:

表1 : 試題分類結(jié)果

3.3.2 項目合并

在結(jié)構(gòu)方程模型中,觀測變量 (或稱指標(biāo))被用來測量那些不能被直接測量的潛變量(或稱因子)。題目或題目組均可作為因子的外顯指標(biāo)。就本研究而言,選擇采用題目組作為各因子的觀測變量,將各分測驗中相同分類下的幾個題目合并成為一個新的連續(xù)變量。主要原因有:第一,這80道試題均為二項記分,不能滿足現(xiàn)有結(jié)構(gòu)方程模型軟件的需要;第二,結(jié)構(gòu)方程模型對于樣本量與觀測變量個數(shù)之間的比值有一定的要求,樣本量小,變量個數(shù)多的情況下極有可能得到不穩(wěn)定的解,因此本研究采用將題目劃分成小組的方式來減少變量個數(shù)。在項目合并的過程中,應(yīng)遵循以下原則:1)合并的項目應(yīng)該是相似的,并被用來測量同一構(gòu)念 (Kishton& Widaman, 1994);2)合并的項目應(yīng)該來自同一篇文章,因為內(nèi)容相似也是項目合并的一個重要原則 (Nasser,Takahashi&Benson,1997);3)項目合并后的合成分?jǐn)?shù)應(yīng)該盡可能呈正態(tài)分布 (Bandalos&Finney,2001; Enders& Bandalos, 1999);4)項目小組中的每一項目應(yīng)該是單維的 (Hattie,1986;Hayduk, 1996; Kishton & Widaman, 1994)。

因此,最終得到13個聽力變量和10個閱讀變量,總共為23個變量,如表2所示:

表2 :觀測變量與分?jǐn)?shù)

3.4 研究過程

3.4.1 初步數(shù)據(jù)分析

首先,對23個觀測變量進(jìn)行描述性統(tǒng)計分析,并計算各變量的組間內(nèi)部一致性信度系數(shù)。計算結(jié)果如表3。

表3 :各變量組間內(nèi)部一致性信度系數(shù)

由表3知,聽力理解測驗13個題目組的內(nèi)部一致性信度系數(shù)為0.852,閱讀理解測驗10個題目組的內(nèi)部一致性信度系數(shù)為 0.816,所有23個題目組的內(nèi)部一致性信度系數(shù)為0.900,可以看出各分測驗題目組間具有較高的內(nèi)部一致性。

3.4.2 結(jié)構(gòu)方程模型分析

基于對以往文獻(xiàn)的回顧以及本研究的目的,本研究將建立以下三類模型:1)單一能力模型;2)雙能力模型;3)三能力模型。在單一能力模型中,只包含一個 “一般理解能力”因子。在雙能力模型和三能力模型中,均包含了 “概括總結(jié)能力”、 “細(xì)節(jié)捕捉能力”和 “推理判斷能力”三個因子。但是,在雙能力模型中,將 “概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”合并為 “理解顯性信息的能力”,而將“推理判斷能力”稱為 “理解隱性信息的能力”。

因此,本研究將分為兩步:

首先,在聽力理解能力和閱讀理解能力分別是不同的能力特質(zhì)這一理論假設(shè)下,分別對聽力變量和閱讀變量進(jìn)行三個模型的檢驗;第二,在聽力理解能力和閱讀理解能力都是語言理解能力,只是呈現(xiàn)模式不同 (聲音和文本)這一理論假設(shè)下,把聽力變量和閱讀變量整合在一起進(jìn)行三個模型的檢驗。

3.4.3 模型評價的標(biāo)準(zhǔn)

擬合指數(shù)是模型擬合數(shù)據(jù)程度的評價標(biāo)準(zhǔn),一個理想的擬合指數(shù),應(yīng)當(dāng)具有下面三個特征 (溫忠麟、侯杰泰、馬什赫伯特,2004):1)不受樣本容量的影響;2)懲罰復(fù)雜模型;3)對誤設(shè)模型敏感。

參考已有研究中常用且普遍認(rèn)為較穩(wěn)定的擬合指數(shù) (Boomsma,2000;Hoyle&Panter,1995; Raykov, Tomer & Nesselroade, 1991),本研究擬選擇以下幾個擬合指數(shù)作為模型擬合的檢驗標(biāo)準(zhǔn):GFI、CFI、RMSEA、ECVI、AIC。需要特別說明的是,由于本研究采用大樣本, 且 χ2和 χ2/df易受樣本容量的影響 (侯杰泰、溫忠麟、成子娟,2004),因此本研究不選擇χ2和χ2/df作為模型評價的標(biāo)準(zhǔn)。各擬合指數(shù)特性和判斷標(biāo)準(zhǔn)如下:

GFI(goodness of fit index,擬合優(yōu)度指數(shù)):早期使用較多,一般認(rèn)為大于或等于0.90則模型擬合較好。

CFI(comparative fit index, 比較擬合指數(shù)):不受樣本容量的影響,從而避免對模型與小樣本擬合優(yōu)度的低估。缺點是沒有懲罰復(fù)雜模型。大于0.90表示較好的擬合。

RMSEA(root mean square error of approximation,近似誤差均方根):評價模型時,會考慮模型的復(fù)雜性,受樣本量影響較小。小于0.05表示非常好的擬合,0.05和0.08之間表示較好的擬合,大于0.10說明擬合很差 (Browne&Cudeck,1993)。

ECVI (expected cross-validation index, 交互效度指數(shù)):反映了模型擬合結(jié)果對同一總體的另一樣本的可重復(fù)性,其值越小,在另一樣本擬合的結(jié)果越好。

AIC (akaike information criterion, 赤 池 信息量準(zhǔn)則):是用于比較不同模型擬合數(shù)據(jù)效果的一種信息指數(shù),可以權(quán)衡所估計模型的復(fù)雜度和此模型擬合數(shù)據(jù)的優(yōu)良性。其數(shù)值越小,表明模型擬合越好。

3.5 研究結(jié)果

3.5.1 對聽力變量和閱讀變量的分別檢驗

我們分別對聽力變量和閱讀變量進(jìn)行了三個模型的檢驗 (單一能力模型、雙能力模型和三能力模型)。單一能力模型假設(shè)第二語言聽力理解能力和閱讀理解能力都是單一的、整體的能力。而雙能力模型和三能力模型則假設(shè)在第二語言理解能力中內(nèi)部存在可分性的子能力,同時,作為高階因子的 “聽力理解能力”或者 “閱讀理解能力”影響著作為一階因子的子能力,并通過被試在聽力試題或者閱讀試題上的作答反應(yīng)表現(xiàn)出來。三個模型檢驗后的擬合指數(shù)總結(jié)于表4:

如表4所示,無論是聽力變量還是閱讀變量,雙能力模型和三能力模型的擬合度均優(yōu)于單一能力模型。單一能力模型的GFI和CFI均低于 0.90 (未達(dá)到 0.09以上), RMSEA 也均介于0.05和0.08之間 (雖然表明模型擬合較好,但是仍高于雙能力模型和三能力模型的RMSEA指數(shù)),ECVI和AIC也都是三個模型當(dāng)中最高的。參考所有的擬合指數(shù),對于聽力變量,三能力模型的GFI和CFI分別為0.994和 0.995, 均達(dá)到 0.90 以上, RMSEA 為 0.015,遠(yuǎn)遠(yuǎn)小于 0.05, ECVI和 AIC 分別為 0.058 和158.386,均是三個模型中最小的,故三能力模型優(yōu)于單一能力模型和雙能力模型;對于閱讀變量,雙能力模型的GFI和CFI分別為0.977和 0.958, 均達(dá)到 0.90 以上, RMSEA 為 0.054,介于 0.05和 0.08之間, ECVI和 AIC 分別為0.123和 335.009, 也均是三個模型中最小的,故雙能力模型優(yōu)于單一能力模型和三能力模型。聽力理解能力三能力模型圖和閱讀理解能力雙能力模型圖見圖1和圖2。

表4 :對聽力變量和閱讀變量進(jìn)行三個模型檢驗后的擬合指數(shù)

圖1 :聽力理解能力的三能力模型圖

因此,在聽力理解能力和閱讀理解能力分別是不同的能力特質(zhì)這一理論假設(shè)下,分別對聽力變量和閱讀變量進(jìn)行三個模型的檢驗結(jié)果顯示:1)第二語言聽力理解能力和閱讀理解能力并不是一個單一的、整體的能力,其內(nèi)部包括不同的可分性子能力;2)對于聽力理解能力而言,三能力模型為最優(yōu)模型,而對于閱讀理解能力而言,雙能力模型為最優(yōu)模型。

3.5.2 對語言理解能力的檢驗

在聽力理解能力和閱讀理解能力都是語言理解能力,只是呈現(xiàn)模式不同 (聲音和文本)這一理論假設(shè)下,我們將聽力變量和閱讀變量整合在一起進(jìn)行了三個模型的檢驗。三個模型的擬合指數(shù)總結(jié)于表5:

圖2 :閱讀理解能力的雙能力模型圖

表5 :對語言理解能力進(jìn)行三個模型檢驗后的擬合指數(shù)

如表5所示,三個模型的GFI和CFI均處于 0.60 和 0.70 之間, 遠(yuǎn)遠(yuǎn)低于 0.90。 單一能力模型的RMSEA雖然小于0.50,但也處于接近0.50的位置,而雙能力模型和三能力模型的RMSEA均處于0.50和0.80之間,只表明模型擬合較好。因此,三個模型的擬合度都不太好?;仡欀胺謩e對聽力變量和閱讀變量的檢驗,雙能力模型和三能力模型在聽力變量和閱讀變量中都擬合較好,而將聽力變量和閱讀變量整合在一起檢驗后則擬合不太好。

因此,我們對三個模型進(jìn)行了一些調(diào)整,在原有模型的基礎(chǔ)之上,我們加入了兩個 “渠道”因子,即 “聽覺渠道”和 “視覺渠道”。這一做法的理論假設(shè)為,在第二語言聽力理解能力和閱讀理解能力中,不僅僅只包含了一個共有的理解過程,同時也包含著一個不同的解碼過程。在聽力理解能力中,存在著對聽覺渠道信息的解碼,而在閱讀理解能力中,存在著對視覺渠道信息的解碼。三個新模型的擬合指數(shù)總結(jié)于表6:

表6 :對語言理解能力進(jìn)行三個新模型檢驗后的擬合指數(shù)

如表6所示,在對原模型調(diào)整后,三個新模型的擬合度都比較好。但是,是否語言理解能力只包含兩個 “渠道”因子,而不包括三個“子能力”因子呢?于是,我們將新模型中的“子能力”因子剔除,得到一個只包含兩個“渠道”因子的模型 (簡稱 “渠道”模型),并對所有變量進(jìn)行了檢驗。 “渠道”模型的GFI和 CFI 分 別 為 0.827 和 0.849, RMSEA 為0.065,這就表明 “渠道”模型不能較好擬合。同時,這也就說明了在原有模型的基礎(chǔ)上加上“渠道”因子是必要的。

根據(jù)表6的各項擬合指數(shù),三個新模型的擬合度都很好。因此,僅僅依據(jù)擬合指數(shù),我們很難選出語言理解能力的最優(yōu)模型。單純就統(tǒng)計的角度來看,新單一能力模型是最優(yōu)模型,原因如下:1)在三個新模型中,單一能力模型的擬合指數(shù)是最好的;2)單一能力模型和三能力模型的各項擬合指數(shù)十分接近,單一能力模型的GFI、CFI和RMSEA分別為0.962、 0.946 和 0.031, 三 能 力 模 型 的 GFI、CFI 和 RMSEA 分 別 為 0.950、 0.939 和 0.038,兩個模型的ECVI和AIC也都十分接近。同時在三能力模型中,三個一階因子在高階因子上的因子負(fù)荷都接近1,這就似乎表明三個 “子能力”因子實際上可能就是一個單一因子。

但是,在結(jié)構(gòu)方程模型中,選擇最優(yōu)模型不能僅僅依靠統(tǒng)計信息 (侯杰泰、溫忠麟、成子娟,2004)。由于在對聽力變量和閱讀變量的分別檢驗中,單一能力模型的擬合度均不好。因此,對所有變量而言,似乎選擇雙能力模型或者三能力模型為最優(yōu)模型比較合適。而根據(jù)表6,新三能力模型的各項擬合指數(shù)均優(yōu)于新雙能力模型。因此,我們選擇新三能力模型為語言理解能力的最優(yōu)模型。語言理解能力的最優(yōu)模型圖見圖3。

圖3 :語言理解能力的最優(yōu)模型圖

4.討論

4.1 聽力理解能力結(jié)構(gòu)和閱讀理解能力結(jié)構(gòu)

本研究的研究問題一是:漢語作為第二語言的高級水平學(xué)習(xí)者的聽力理解能力和閱讀理解能力這兩種語言理解能力是否可分?如果可分,其結(jié)構(gòu)分別是什么?其內(nèi)部所包括的子能力的數(shù)量和類型分別是什么?

關(guān)于這一研究問題,我們分別對聽力變量和閱讀變量進(jìn)行了三個模型的檢驗。如表4所示,在聽力理解能力中,三能力模型優(yōu)于單一能力模型和雙能力模型;在閱讀理解能力中,雙能力模型優(yōu)于單一能力模型和三能力模型。如圖1所示,三能力模型在聽力變量中擬合較好,包含三個子能力因子,即 “概括總結(jié)能力”、 “細(xì)節(jié)捕捉能力”和 “推理判斷能力”。如圖2所示,雙能力模型在閱讀變量中擬合較好,包含兩個子能力因子,即 “理解顯性信息的能力”和 “理解隱性信息的能力”。

就雙能力模型而言,它在閱讀變量中的擬合度優(yōu)于在聽力變量中的擬合度。這就說明“概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”并不能夠很好地在閱讀變量中區(qū)分開來,但卻能夠很好地在聽力變量中區(qū)分開來。我們認(rèn)為原因如下:

第一,參加HSK[高等]考試的漢語學(xué)習(xí)者對漢語閱讀文本比較熟悉,因此,他們既能掌握和理解閱讀文本的主要內(nèi)容,也能較好地理解閱讀文本的具體細(xì)節(jié)。因此,這就使得“概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”在閱讀變量中很難被區(qū)分開來。然而,正如許多聽力研究者所言,即使學(xué)習(xí)者理解了口頭演講中的每一個詞的意義,他們也很難理解其主要觀點(Olsen&Huckin,1990)。因此,這就使得“概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”能夠在聽力變量中得以區(qū)分。同時,這也就說明了對于高級水平漢語學(xué)習(xí)者而言,理解長對話或者口頭演講比理解閱讀文本難度更大和更具挑戰(zhàn)性。

第二,HSK[高等]的聽力理解分測驗和閱讀理解分測驗的任務(wù)特征不同,也是導(dǎo)致聽力理解能力和閱讀理解能力具有不同的能力結(jié)構(gòu)的一個重要原因。HSK[高等]的閱讀理解分測驗的閱讀文本相對較短,每篇文章750字左右。同時,考生在進(jìn)行閱讀理解測試的過程中可以隨時反復(fù)多次閱讀文本。這些都有利于考生理解文章的主要內(nèi)容和具體細(xì)節(jié)。而聽力理解分測驗中有的聽力材料比閱讀文本要長。更為重要的是,考生在聽力理解測試的過程中只能聽一遍,沒有機會回過頭去重新檢查和思考。這就使得考生的 “概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”得以有效區(qū)分。

正如Alderson(2000)所言,子能力對于初級閱讀者來說能夠更為有效地進(jìn)行區(qū)分,技能成分的研究方法對于低水平的第二語言閱讀者來說可能較為有效,而對于高級閱讀者來說則不亦然。也就是說,在考生表現(xiàn)較差的測驗中,子能力能夠更好地區(qū)分開來。因此,在本研究中,較之閱讀變量而言,子能力能夠更好地在聽力變量中區(qū)分開來。

4.2 語言理解能力結(jié)構(gòu)

本研究的研究問題二是:漢語作為第二語言的高級水平學(xué)習(xí)者的語言理解能力是否可分?如果可分,語言理解能力的結(jié)構(gòu)是什么?其內(nèi)部所包括的子能力的數(shù)量和類型分別是什么?

有關(guān)這一研究問題,我們將聽力變量和閱讀變量整合在一起進(jìn)行了三個模型的檢驗。研究結(jié)果從實證的角度支持了聽力理解能力和閱讀理解能力都是語言理解能力,只是呈現(xiàn)模式不同 (聲音和文本)這一理論假設(shè)。但就本研究而言,聽力理解能力和閱讀理解能力兩者的關(guān)系是異大于同的,因為單純包含 “子能力”因子的三個模型的擬合度都不好,在加入 “渠道”因子之后,三個新模型的擬合度有了顯著提高。基于目前的分析,我們很難斷定語言理解能力是整體的、單一的能力還是其內(nèi)部包含若干不同的子能力。雖然我們綜合考慮把新三能力模型作為最優(yōu)模型,但是新單一能力模型和新雙能力模型的擬合度同樣也是好的,這種不確定性有可能源于本研究的數(shù)據(jù)特征。正如之前所討論的,HSK[高等]的聽力理解分測驗和閱讀理解分測驗上的任務(wù)特征不同,這就使得當(dāng)我們把聽力變量和閱讀變量整合在一起檢驗時, “渠道”因子就解釋了總體變異中的大部分,而 “子能力”因子的影響就小得多。

因此,就目前的研究結(jié)果而言,雖然單一能力模型優(yōu)于雙能力模型和三能力模型,但是我們就此斷言第二語言理解能力是一個單一的、整體的能力是值得商榷的。正如前面的討論,實驗數(shù)據(jù)受到被試語言能力和測驗任務(wù)特征的影響,因此第二語言理解能力的可分性也可能受到被試語言能力和測驗任務(wù)特征的影響。

5.結(jié)論

本研究的結(jié)論如下:

第一,聽力理解能力和閱讀理解能力的結(jié)構(gòu)是相似的,它們都包含兩個或者三個子能力。聽力理解能力包含三個子能力,即 “概括總結(jié)能力”、 “細(xì)節(jié)捕捉能力”和 “推理判斷能力”;閱讀理解能力包含兩個子能力,即“理解顯性信息的能力”和 “理解隱性信息的能力”。

第二,聽力理解能力和閱讀理解能力在理解過程方面是相似的,但在解碼過程中卻是不同的,具體表現(xiàn)在呈現(xiàn)模式上,即聽覺渠道和視覺渠道。

第三,第二語言理解能力的可分性會受到被試語言能力和測驗任務(wù)特征的影響。因此,在解決有關(guān)語言理解能力的可分性及其內(nèi)部子能力的種類和數(shù)量的問題時,需要考慮具體測驗情境下的被試語言能力因素和測驗任務(wù)特征因素。

杜 建 1992 聽音理解過程和聽力評估方法[J].外語教學(xué)與研究(4):47-51.

谷 陵 2003 論漢語聽力測試中應(yīng)考查的六種聽力技能[J].云南師范大學(xué)學(xué)報(對外漢語教學(xué)與研究版)(6):23-25.

侯杰泰,溫忠麟,成子娟 2004 結(jié)構(gòu)方程模型及其應(yīng)用[M].北京:教育科學(xué)出版社:14-16.

金天相,李 泉 1994 廣播新聞聽力課教學(xué)論略[J].漢語學(xué)習(xí)(3):60-63.

金琰如,王佶旻 2012 初級階段留學(xué)生漢語聽力能力結(jié)構(gòu)探究[J].語言教學(xué)與研究(3):35-41.

李清華 1987 談科技漢語的聽力理解 [J].語言教學(xué)與研究(2):103-110.

李小蘭 2008 知識空間理論與規(guī)則空間模型在漢語聽力理解技能測驗編制中的應(yīng)用[D].北京語言大學(xué)碩士學(xué)位論文.

劉秀明,王 蘋 2008 預(yù)科漢語聽力成績測試中的微技能與信息轉(zhuǎn)換[J].喀什師范學(xué)院學(xué)報(1):95-97.

王 靜 2008 C.TEST閱讀理解測驗的診斷性評價研究[D].北京語言大學(xué)碩士學(xué)位論文.

溫忠麟,侯杰泰,馬什赫伯特 2004 結(jié)構(gòu)方程模型檢驗:擬合指數(shù)與卡方準(zhǔn)則[J].心理學(xué)報(2):186-194.

徐式婧 2007 C.TEST聽力理解測驗的診斷性評價研究[D].北京語言大學(xué)碩士學(xué)位論文.

楊惠元 1989 談?wù)劼犃虒W(xué)的四種能力訓(xùn)練[J].世界漢語教學(xué)(1):58-63.

———1991論聽和說[J].語言教學(xué)研究(1):88-110.

楊 旭 2010 融合模型在C.TEST聽力理解試題中的認(rèn)知診斷研究[D].北京語言大學(xué)碩士學(xué)位論文.

朱正才,范開泰 2001 語言聽力理解的認(rèn)知結(jié)構(gòu)與測試[J].語言教學(xué)與研究(3):41-46.

Alderson, J. 2000 Assessing Reading[M].Cambridge,UK: Cambridge University Press.

Alderson, J.& Y.Lukmani 1989 Cognition and reading: Cognitive levels as embodied in test questions[J].Reading in a Foreign Language 5(2): 253-270.

Bachman, L.& A.Palmer 1981 The construct validation of the FSI oral interview [J].Language Learning 31: 67-86.

———1982The construct validation of some components of communicative proficiency[J].TESOL Quarterly 16: 449-465.

Bae, J.& L.Bachman 1998 A latent variable approach to listening and reading: Testing factorial invariance across two groups of children in the Korean/English Two-Way immersion Program[J].Language Testing 15(3): 380-414.

Bandalos,D.& S.Finney 2001 Item parceling issues in structural equation modeling[A].In G.Marcoulides et al. (eds.), New Developments and Techniques in Structural Equation Modeling [C]. Mahwah, NJ:Lawrence Erlbaum Associates: 269-295.

Boomsma, A. 2000 Reporting analyses of covariance structure[J].Structural Equation Modeling 7: 461-483.

Brown, J. 1996 Testing in Language Programs [M].Upper Saddle River, NJ: Prentice Hall Regents.

Browne,M.& R.Cudeck 1993 Alternative ways of assessing model fit[A].In K.Bollen et al.(eds.), Testing Structural Equation Models [C].Newbury Park,CA: Sage Publications: 136-162.

Buck, G. 1991 The testing of listening comprehension:An introspective study[J].Language Testing 8 (1):67-91.

———1992Listening comprehension:Construct validity and trait characteristics[J].Language Learning 42(3): 313-357.

———2001Assessing Listening[M].Cambridge,UK:Cambridge University Press.

Buck, G.& K.Tatsuoka 1998 Application of the rulespace procedure to language testing: Examining attributes of a free response listening test[J].Language Testing 15(2): 119-157.

Carroll, J.1972 Defining language comprehension[A].In R.Freedle et al.(eds.), Language Comprehension and the Acquisition of Knowledge [C]. New York:John Wiley.

———1993Human Cognitive Abilities[M].Cambridge, UK: Cambridge University Press.

Carver, R. 1982 Optimal rate of reading prose [J].Reading Research QuarterlyXVIII(1): 56-88.

———1983Is reading rate constant or flexible? [J].Reading Research QuarterlyXVIII(2): 190-215.

———1984Rauding theory predictions of amount comprehended under different purposes and speed reading conditions[J].Reading Research QuarterlyXIX(2): 205-218.

———1990Reading Rate:A Review of Research and Theory[M].New York: Academic Press.

———1992What do standardized tests of reading comprehension measure in terms of efficiency,accuracy, and rate? [J]. Reading Research Quarterly 27(4): 347-359.

Clark, H.& E.Clark 1977 Psychology and Language:An Introduction to Psycholinguistics[M].New York:Harcourt Brace Jovanovich.

Davey, B. 1988 Factors affecting the difficulty of reading comprehension items for successful and unsuccessful readers[J].Experimental Education (56): 67-76.Davis, F. 1944 Fundamental factors of comprehension in reading[J].Psychometrika 9: 185-197.

———1968Research in comprehension in reading[J].Reading Research Quarterly 3: 499-545.

Drum,P.,R.Calfee& L.Cook 1981 The effects of surface structure variables on performance in reading comprehension tests[J].Reading Research Quarterly 16:486-514.

Enders, K.& L.Bandalos 1999 The effects of heterogeneous item distribution on reliability[J].Applied Measurement in Education 12: 133-150.

Freedle, R.& I.Kostin 1994 Can multiple-choice reading tests be construct valid?[J].Psychological Science 5: 107-110.

———1996The Prediction of TOEFL Listening Comprehension Item Difficulty for Mini-talk Passages: Implications for Construct Validity (TOEFL Research Report No.RR-56)[M].Princeton, NJ: Educational Testing Service.

———1999Does text matter in a multiple-choice test of comprehension? The case for the construct validity of TOEFL’s minitalks[J].Language Testing 16(1):2-32.

Gough, P., L.Ehri& R.Treiman 1992 Reading Acquisition[M].Hillsdale, NJ: L Erlbaum.

Grabe, W. 1991 Current development in second language reading research [J]. TESOL Quarterly 25:375-397.

Gray W. 1960 The major aspects of reading[A].In H.Robinson (ed.), Sequential Development of Reading Abilities[C].Chicago: University of Chicago Press,8-24.

Harmer, J. 1983 The Practice of English Language Teaching[M].New York: Longman Group Limited,144-145.

Hattie,A. 1986 Methodology review:Assessing unidimensionality of tests and items [J].Applied Psychological Measurement 9: 139-164.

Hayduk,L. 1996 LISREL Issues,Debates, and Strategies[M].Baltimore, MD: Johns Hopkins University Press.

Hoyle,R.& A.Panter 1995 Writing about structural equation models[A].In H.Hoyle (ed.), Structural E-quation Modeling: Concepts, Issues, and Applications[C].Thousand Oaks, CA: Sage Publications.

Hughes, A. 1989 Testing for Language Teachers[M].Cambridge, UK: Cambridge University Press.

Jang, E. 2009 Cognitive diagnostic assessment of L2 reading comprehension ability: Validity arguments for Fusion Model application to language assessment [J].Language Testing 26(1): 31-73.

Kenneth, C. 1976 Developing Second Language Skills:Theory to Practice[M].Boston: Houghton Mifflin Company.

Kintsch,W.& T.van Dijk 1978 Toward a model of text comprehension and production[J].Psychological Review 85: 363-394.

Kintsch, W.&J.Yarbrough 1982 Role of rhetorical structure in text comprehension[J].Educational Psychological 74(6): 828-834.

Kishton,J.& K.Widaman 1994 Unidimensional versus domain representative parceling of questionnaire items:An empirical example[J].Educational and Psychological Measurement 54: 757-765.

Lennon, R. 1962 What can be measured? [J].Reading Teacher 15: 326-337.

Lunzer, E.& K.Gardner 1979 The Effective Use of Reading[M].London: Heinemann Educational Books.Munby, J. 1978 Communicative Syllabus Design[M].Cambridge: Cambridge University Press.

Nasser, F., T.Takahashi& J.Benson 1997 The structure of test anxiety in Israeli-Arab high school students: An application of confirmatory analysis with miniscales[J].Anxiety, Stress, and Coping 10: 129-151.

Nissan, S., F.DeVincenzi& L.Tang 1996 An Analysis of Factors Affecting the Difficulty of Dialogue Items in TOEFL Listening Comprehension(TOEFL Research Report No.RR-51)[M].Princeton, NJ: Educational Testing Service.

Oakeshott-Taylor, J. 1977 Information redundancy,and listening comprehension[A].In R.Dirven (ed.),Horverstandnis im Fremdsprachenunterricht(Listening Comprehension in Foreign Language Teaching)[C].Kronberg /Ts: Scriptor.

Olsen, L.& T.Huchin 1990 Point-driven understanding in engineering lecture comprehension[J].English for Special Purposes 9: 33-47.

Park,G. 2004 Comparison of L2 listening and reading comprehension by university students learning English in Korea[J].Foreign Language Annals 37: 448-458.

Pollitt, A., C.Hutchinson, N.Entwistle & C.DeLuca 1985 What Makes Exam Questions Difficult? An Analysis of‘O’ Grade Questions and Answers[M].Edinburgh: Scottish Academic Press.

Raykov, T., A.Tome & J.Nesselroade 1991 Reporting structural equation modeling results in Psychology and Aging: Some proposed guidelines[J].Psychology and Aging 6: 499-503.

Reves, T.& A.Levine 1988 The FL receptive skills:Same or different? [J].System 16: 327-336.

Richards,J. 1983 Listening comprehension: Approach,design, procedure[J].TESOL Quarterly 17(2): 219-240.

Rivers, W. 1966 Listening comprehension[J].Modern Language Journal 50(4): 196-202.

Rost, D. 1993 Assessing the difference components of reading comprehension: fact or fiction? [J].Language Testing 10(1): 79-92.

Sang, F., B.Schmitz, H.Vollmer, J.Baumert& P.Roeder 1986 Models of second language competence:Structural equation approach[J].Language Testing 3:54-79.

Sasaki,M. 1996 Second Language Proficiency,F(xiàn)oreign Language Aptitude,and Intelligence:Quantitative and Qualitative Analyses[M].New York: Peter Lang.

Shin, S. 2005 Did they take the same test? Examinee language proficiency and the structure of language tests[J].Language Testing 22(1): 31-57.

Spearitt, D. 1972 Identification of subskills of reading comprehension by maximum likelihood factor analysis[J].Reading Research Quarterly 8: 92-111.

Valette, R. 1977 Modern Language Testing[M].New York: Harcourt Brace Jovanovich.

Weir, C. 1993 Understanding and Developing Language Tests[M].New York: Prentice Hall.

猜你喜歡
第二語言理解能力測驗
第二語言語音習(xí)得中的誤讀
活力(2019年19期)2020-01-06 07:37:26
《新年大測驗》大揭榜
趣味(語文)(2018年7期)2018-06-26 08:13:48
漢語作為第二語言學(xué)習(xí)需求研究述評
兩個處理t測驗與F測驗的數(shù)學(xué)關(guān)系
考試周刊(2016年88期)2016-11-24 13:30:50
如何提高中學(xué)生的英語閱讀理解能力
大學(xué)生公民國際理解能力測評指標(biāo)體系構(gòu)建
多種現(xiàn)代技術(shù)支持的第二語言學(xué)習(xí)
《第二語言句子加工》述評
運用紙質(zhì)地圖提高學(xué)生的理解能力(上)
你知道嗎?
肥东县| 云龙县| 屏东市| 大城县| 关岭| 白水县| 岳阳市| 额敏县| 崇仁县| 确山县| 育儿| 广东省| 达尔| 黑龙江省| 麟游县| 宣化县| 肥乡县| 松原市| 山西省| 建平县| 博客| 天全县| 临沂市| 锡林浩特市| 佳木斯市| 乌兰浩特市| 香港| 蓬溪县| 富宁县| 合水县| 习水县| 凌海市| 雅江县| 鄂托克旗| 新兴县| 紫云| 翁牛特旗| 邳州市| 灌云县| 太和县| 巨野县|