国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

應(yīng)用語言學研究中的圖示與穩(wěn)健統(tǒng)計方法

2018-01-19 01:45
外國語文 2017年6期
關(guān)鍵詞:選點平均數(shù)中位數(shù)

鮑 貴

(南京工業(yè)大學 外國語言文學學院,江蘇 南京 211816)

0 引言

在研究數(shù)據(jù)滿足統(tǒng)計假設(shè)(statistical assumptions)的情況下,常規(guī)(standard;conventional)統(tǒng)計分析方法(如方差分析)是恰當?shù)倪x擇。但是,如果研究數(shù)據(jù)違反了統(tǒng)計假設(shè),使用常規(guī)統(tǒng)計方法就會影響統(tǒng)計效力,得出誤導性甚至錯誤的結(jié)論。譬如,Wilcox(1998)發(fā)現(xiàn),在正態(tài)分布時,如果兩個總體平均數(shù)分別為0和1,方差均為1,使用t檢驗(n= 25,α= .05)的統(tǒng)計效力為0.96,但是如果兩個總體是污染的正態(tài)分布(重尾巴,輕度違反正態(tài)分布),統(tǒng)計效力只有0.28。因此,探索數(shù)據(jù)模式,尤其診斷統(tǒng)計假設(shè),是嚴謹?shù)慕y(tǒng)計分析不可或缺的。但是,應(yīng)用語言學研究者忽視統(tǒng)計假設(shè)的現(xiàn)象相當普遍(Plonsky,2014;Larson-Hall et al.,2015;鮑貴,2012)。究其原因,一方面可能是因為研究者對統(tǒng)計假設(shè)認識不足,沒有掌握有效的統(tǒng)計假設(shè)診斷或檢驗方法;另一方面可能是因為研究者不知道如何應(yīng)對統(tǒng)計假設(shè)違背的情形。實際上,統(tǒng)計學研究在數(shù)據(jù)分析方面的兩大進展已為研究者提供了有價值的統(tǒng)計分析技術(shù)。一是圖示方法(graphical methods),二是穩(wěn)健(robust)統(tǒng)計方法。圖示方法是視覺化的探索式數(shù)據(jù)分析技術(shù)(包括統(tǒng)計假設(shè)的診斷),常常能夠揭示推理統(tǒng)計不易發(fā)現(xiàn)的數(shù)據(jù)特點和模式。穩(wěn)健統(tǒng)計方法是現(xiàn)代統(tǒng)計技術(shù)。在統(tǒng)計假設(shè)滿足的情況下,穩(wěn)健統(tǒng)計方法與常規(guī)統(tǒng)計方法不相上下,但是在統(tǒng)計假設(shè)違反的情況下,穩(wěn)健統(tǒng)計方法有著明顯的優(yōu)勢,不受或較少地受到違反統(tǒng)計假設(shè)對統(tǒng)計分析結(jié)果造成的不利影響。

在應(yīng)用語言學界,除了為數(shù)不多的教材介紹圖示方法(Johnson,2008;Gries,2013)和穩(wěn)健統(tǒng)計方法(Larson-Hall,2016)之外,學術(shù)期刊論文很少介紹或使用這些方法(Larson-Hall et al.,2010;Larson-Hall,2012;Plonsky et al.,2015;鮑貴,2016;2017)。鑒于應(yīng)用語言學研究在進行組間比較時很少使用統(tǒng)計學家大力推薦的箱圖(boxplot)(Larson-Hall et al.,2010),本研究擬介紹箱圖的構(gòu)造原理。更為重要的是,任何圖形,包括箱圖在內(nèi),都有不足之處,因而多圖診斷更值得推介。另外,前期應(yīng)用語言學文獻未能將圖形診斷與穩(wěn)健統(tǒng)計方法的選擇有機地結(jié)合在一起。本文克服這些局限,介紹箱圖、核密度圖和LOWESS(locally-weighted scatterplot smoother,局部加權(quán)散點圖平滑方法)以及穩(wěn)健方差和協(xié)方差分析(即選點分析,pick-a-point analysis)的原理,以真實數(shù)據(jù)為例探討這些方法的應(yīng)用。本文使用的統(tǒng)計軟件為R 3.4.0,穩(wěn)健統(tǒng)計分析使用的函數(shù)來自Wilcox(2017)*穩(wěn)健統(tǒng)計分析數(shù)據(jù)包為Rallfun-v34。。

1 箱圖與核密度圖

1.1箱圖

箱圖是由Tukey(1977)創(chuàng)建的圖示方法。它利用箱體和觸須(whisker)概括數(shù)據(jù)的重要信息,因而又稱箱-須圖(box-and-whisker plot)。傳統(tǒng)上,箱體概括的數(shù)據(jù)信息簡稱五數(shù)總括(five-number summary),即最小值(minimum,Min)、下樞(lower hinge,HL)、第2個四分位數(shù)(second quartile,Q2,常稱作中位數(shù)M)、上樞(upper hinge,HU)和最大值(maximum,Max)。最小值和最大值提供數(shù)據(jù)分布尾巴的信息。中位數(shù)反映分布的中心。上、下樞距離反映分布的展度(spread);利用上、下樞構(gòu)建的上、下圍(upper fence,F(xiàn)U;lower fence,F(xiàn)L)用于診斷異常值(outlier)。中位數(shù)以及上、下樞的位置反映數(shù)據(jù)分布的偏度。換言之,五數(shù)概括涵蓋變量的四個主要特征:中心、展度、非對稱性(asymmetry)和異常值(Hintze et al.,1998:181)。箱圖的基本構(gòu)造如圖1所示。

圖1箱圖構(gòu)造

圖1是水平放置的箱圖。長方形箱體的兩條邊由上、下樞確定,分割箱體的粗線段代表中位數(shù)。上樞為大于中位數(shù)的一半數(shù)據(jù)的中位數(shù),即上四分(the upper fourth);下樞為小于中位數(shù)的一半數(shù)據(jù)的中位數(shù),即下四分(the lower fourth)。R默認的上、下樞采用這一定義。也有箱圖采用上、下四分位數(shù)(the upper quartile,Q3;lower quartile,Q1)表示上、下樞(Wilcox, 2012;Kabacoff,2015)。上、下四分與上、下四分位數(shù)接近,但是由于算法不同,它們之間有時會有小的差異。關(guān)于分位數(shù)的算法,可參考Hyndman et al.(1996)和Ugarte et al.(2015)。圖1中位數(shù)線代表的值是31.5。上、下樞各為37.5和22.5。樞展度(Hspread)為15。樞展度又稱四分展度(fourth-spread),近似于四分位距(interquartile range,IQR),囊括了50%的中間數(shù)值。圖1中的上圍和下圍反映異常值的臨界值(outlier cutoff)。計算上,F(xiàn)U=HU+1.5×Hspread,F(xiàn)L=HL-1.5×Hspread。在標準正態(tài)分布時,上、下圍包括了約99.3%的數(shù)據(jù),只有0.7%的數(shù)據(jù)位于上、下圍之外,被判定為異常值。利用上、下圍定義異常值有些武斷,但是經(jīng)驗表明,這個定義能夠很好地識別可能需要給予特別注意的數(shù)值(Emerson & Strenio,1983:62)。在圖1中,F(xiàn)U= 60,F(xiàn)L= 0。有一個用圓圈表示的異常值位于上、下圍之外。由上、下樞向外垂直延伸的虛線稱作觸須。上鄰近值(upper adjacent value)表示在上圍內(nèi)的最大數(shù)值;下鄰近值(lower adjacent value)表示在下圍內(nèi)的最小數(shù)值。圖1表明,數(shù)據(jù)分布不夠?qū)ΨQ,下須線比上須線略長,但是異常值使右尾巴變長。

盡管傳統(tǒng)箱圖是非常有價值的圖形診斷方法,但是它不能診斷數(shù)據(jù)分布的峰態(tài)(如多峰態(tài),multi-modality)和提供其他統(tǒng)計信息(如平均數(shù))??朔鹘y(tǒng)箱圖的局限有兩種方法。一種是對傳統(tǒng)箱圖進行改造,比如添加平均數(shù)或繪制小提琴圖(violin plot)(McGill et al.,1978)。另外一種方法是多圖并用,彼此取長補短。

1.2核密度圖

核密度圖不僅能夠直觀地顯示分布尾巴,而且還能夠顯示分布的峰頂(peak)、肩部(shoulder)和凸塊(bump,數(shù)據(jù)的聚合),是對傳統(tǒng)箱圖的很好補充。

核密度估計是估計連續(xù)性隨機變量概率密度函數(shù)的非參數(shù)方法,目的是依據(jù)樣本估計一個真實的未知概率密度函數(shù)。核密度估計的函數(shù)是:

公式中,K(·)是核密度函數(shù),h是平滑參數(shù),又稱帶寬(bandwidth),n是樣本量(Ugarte et al., 2015:115)。

常用的核密度函數(shù)有高斯(正態(tài))函數(shù)、矩形(均勻)函數(shù)和三角函數(shù)等。這些核密度函數(shù)的特點是單峰(unimodal)、圍繞0點對稱和曲線下的單位面積為1(Keen,2010:161)。R默認的核密度估計函數(shù)是高斯核密度函數(shù)。

核密度估計中,選擇適合的帶寬非常重要。帶寬過窄時,核密度估計偏差小,但是方差大;帶寬過寬時,核密度估計方差小,但是偏差大(Keen,2010:167)。視覺上,帶寬過窄導致密度估計曲線過于起伏,使分布模式難以察覺;帶寬過寬導致曲線過于平滑,給分布形狀的判斷帶來錯覺。R默認的帶寬計算上采用Silverman經(jīng)驗法則(Silverman,1986:47-48):h= 0.9An-1/5,其中,A= min(SD,IQR/1.34),即A取標準差(SD)和四分位距除以1.34的商之間的較小值。

圖2是反映上節(jié)數(shù)據(jù)分布形狀的高斯核密度圖。在水平軸上的軸須圖(rug plot)中,軸須代表樣本數(shù)據(jù)值(n= 20)。采用的帶寬為R默認算法計算出的值(h= 5.35)。

圖2 核密度估計

1.3 箱圖與核密度圖應(yīng)用

在應(yīng)用語言學研究中,箱圖與核密度圖可用于直觀地比較不同組數(shù)據(jù)分布的基本特點。本節(jié)利用Ellis et al.(2004)研究中的部分數(shù)據(jù)介紹箱圖和核密度圖的實際應(yīng)用*本節(jié)以及第3、4節(jié)數(shù)據(jù)均來自http:∥cw.routledge.com/textbooks/9780805861853/spss-data-sets.asp.。

Ellis et al.(2004)設(shè)計無準備(no planning,NP)、任務(wù)前準備(pretask planning,PTP)和在線準備(on-line planning,OLP)三個條件調(diào)查對42名中國英語學習者記敘文寫作質(zhì)量多個測量指標的影響。本例選擇的測量指標是非流利度(dysfluencies)。該設(shè)計為被試間均衡設(shè)計(n1=n2=n3= 14)。

Ellis et al.(2004)沒有在研究中報告各個條件數(shù)據(jù)分布的具體特點,采用常規(guī)的單因素方差分析和Scheffé配對比較方法檢驗準備條件對學習者非流利度的影響。本節(jié)主要診斷數(shù)據(jù)分布的特點,判斷這些統(tǒng)計檢驗方法是否合適。

1.3.1箱圖診斷

利用本例數(shù)據(jù),圖3比較三個準備條件組非流利度數(shù)據(jù)分布箱圖。

圖3 三個準備條件下非流利度箱圖比較

為了使箱圖能夠更好地揭示數(shù)據(jù)的特點,圖3在傳統(tǒng)的箱圖中增加了平均數(shù)(用加號“+”表示)和切口(notches)。切口顯示中位數(shù)95%的置信區(qū)間。兩幅箱圖的切口不重合是兩個中位數(shù)有差異的最有力證據(jù)。

總體上看,三個組數(shù)據(jù)分布的離散程度有較大差異。無條件組(NP)數(shù)據(jù)分布的離散程度最大,其次是在線準備組(OLP)數(shù)據(jù)分布,任務(wù)前準備組(PTP)數(shù)據(jù)分布最集中。Levene方差齊性檢驗發(fā)現(xiàn),組間方差不齊(F(2,39) = 4.45,p= .018< .05)。

圖3顯示的第2個重要特征是異常值的存在。無準備條件組和在線準備組數(shù)據(jù)有一個異常值。無條件組平均數(shù)輕度正向偏離中位數(shù),主體數(shù)據(jù)分布較為勻稱,但是較大的異常值使整體數(shù)據(jù)分布略正偏。在線準備組平均數(shù)與中位數(shù)幾乎相同,數(shù)據(jù)分布不夠?qū)ΨQ,異常值使整體數(shù)據(jù)分布略正偏。任務(wù)前準備組數(shù)據(jù)沒有異常值,平均數(shù)輕度正向偏離中位數(shù),分布很不對稱,呈正偏趨勢。

圖3顯示的第3個重要特征是切口的重合度。無條件組的切口與其他兩個條件組的切口有少量重合;任務(wù)前準備組和在線準備組切口的重合度高。

1.3.2 核密度圖診斷

我們再利用核密度圖診斷同一批數(shù)據(jù)。圖4比較三個準備條件組非流利度數(shù)據(jù)核密度圖。

圖4 三個準備條件下非流利度核密度圖比較

圖4中的實線為樣本數(shù)據(jù)的分布曲線,虛線是為了對比而添加的正態(tài)分布曲線。為了便于數(shù)據(jù)性質(zhì)診斷,圖4還添加了軸須圖,軸須代表非流利度測量值。同各自的正態(tài)分布曲線相比,三個準備條件組數(shù)據(jù)均呈單峰、正偏態(tài)分布。無準備條件組(NP)和在線準備組(OLP)數(shù)據(jù)分布肩部稍窄,分布曲線右尾各有一個凸塊(即有一個異常值)。任務(wù)前準備組數(shù)據(jù)分布較陡峭,右側(cè)有一個較高的凸塊。這個凸塊是由三個較大值引起的。雖然箱圖沒有將這三個值診斷為異常值,但是它們使肩部變寬。相對于其他兩個準備條件組數(shù)據(jù),任務(wù)前準備組數(shù)據(jù)違反正態(tài)分布的程度較為嚴重。另外,由于圖4的橫坐標采用同樣的刻度值,因而很容易看出,無條件組數(shù)據(jù)分布最分散,其次是在線準備組數(shù)據(jù)分布,任務(wù)前準備組數(shù)據(jù)分布最集中。

綜上所述,不論采用箱圖還是核密度圖,它們均表明本例數(shù)據(jù)違反常規(guī)方差分析的兩個重要統(tǒng)計假設(shè)——正態(tài)分布和方差齊性,違反的程度似乎不嚴重。不過,統(tǒng)計假設(shè)違反程度嚴重性的判斷尚沒有公認的標準。

2 被試間設(shè)計穩(wěn)健方差分析及應(yīng)用

2.1被試間設(shè)計穩(wěn)健方差分析

被試間設(shè)計穩(wěn)健統(tǒng)計最常用的方法之一是穩(wěn)健方差分析。本節(jié)介紹的穩(wěn)健方差分析利用20%截尾平均數(shù)*將一組數(shù)據(jù)由小到大排序,然后從兩端截除樣本20%的數(shù)值,由此得到剩余數(shù)值的平均數(shù)即為20%截尾平均數(shù)。和Welch 方法(Welch’s method)的推廣式。20%截尾平均數(shù)解決數(shù)據(jù)分布問題(如偏態(tài)分布和異常值),Welch方法處理組間方差不齊問題。因此,這種穩(wěn)健方差分析方法又稱截尾平均數(shù)比較WelchF檢驗。

2.2被試間設(shè)計穩(wěn)健方差分析應(yīng)用

Ellis et al.(2004)采用的常規(guī)單因素方差分析方法以及配對檢驗方法(Scheffé檢驗)對三個準備條件開展推理統(tǒng)計。單因素方差分析發(fā)現(xiàn)三個準備條件在非流利度測量上有統(tǒng)計顯著性差異(F(2,39) = 3.75,p= .032 < .05)。*Ellis & Yuan(2004)報告的F值為3.74。但是,Scheffé檢驗發(fā)現(xiàn)配對比較均沒有顯著性差異(無準備和任務(wù)前準備:p= .066 > .05,d= 0.93;無準備和在線準備:p= .080 > .05,d= 0.78;任務(wù)前準備和在線準備:p= .996 > .05,d= 0.06)*當綜合方差分析發(fā)現(xiàn)某個因素有顯著效應(yīng)時,通常認為至少有一個配對比較有顯著性差異。本例研究樣本量較小,作者采用非常保守的Scheffé檢驗導致綜合檢驗與配對檢驗結(jié)果矛盾。作者似應(yīng)兼顧第一類錯誤率和統(tǒng)計效力。在正態(tài)分布和方差齊性條件下,d = 0.20、d = 0.50、d = 0.80依次表示小、中、大效應(yīng)(Cohen,1988)。由于本例數(shù)據(jù)違反方差分析統(tǒng)計假設(shè),效應(yīng)量估計Cohen’s d不準確。。雖然本例中使用常規(guī)統(tǒng)計方法未必一定為誤,但是根據(jù)前面的圖示描述,我們至少可以認為這些傳統(tǒng)的方法不是很恰當?shù)姆椒?。穩(wěn)健組間比較方法是恰當?shù)倪x擇。

3 LOWESS平滑方法及應(yīng)用

3.1 LOWESS平滑方法

3.2 LOWESS平滑方法應(yīng)用

在相關(guān)分析、協(xié)方差分析和回歸分析中,LOWESS平滑方法用于診斷變量之間的線性或非線性關(guān)系。本節(jié)以French et al.(2008)收集的數(shù)據(jù)為例,利用LOWESS平滑方法診斷協(xié)方差分析中的線性與回歸斜率齊性假設(shè)問題。

French et al.(2008)利用前后測實驗設(shè)計調(diào)查音位記憶力、詞匯知識和語法知識前測等多個變量對英語學習者語法知識發(fā)展的預測力。該研究收集的數(shù)據(jù)包括學生性別和接受性詞匯知識前后測,不過研究者在回歸分析中沒有考慮性別因素。本節(jié)利用French et al.(2008)的數(shù)據(jù)回答另外一個問題,即在排除接受性詞匯知識前測的影響后(簡稱詞匯知識前測),性別是否對接受性詞匯知識后測(簡稱詞匯知識后測)有顯著影響。

本例設(shè)計為單因素協(xié)方差分析設(shè)計。在推理統(tǒng)計之前,需要探索數(shù)據(jù)分布的模式,特別要診斷詞匯知識前后測之間是否為線性關(guān)系,回歸斜率是否齊性。

利用箱圖與核密度圖開展正態(tài)分布和方差齊性診斷發(fā)現(xiàn),本例數(shù)據(jù)接近正態(tài)分布,只是女性詞匯知識前測數(shù)據(jù)有三個相同異常值,男性詞匯知識前測數(shù)據(jù)分布略呈雙峰狀,男性詞匯知識后測數(shù)據(jù)有一個異常值。男、女生詞匯知識后測數(shù)據(jù)方差不齊(F(1,102 )= 4.64,p= .034 < .05)。詞匯知識前后測關(guān)系如圖5所示。

圖5左分圖顯示詞匯知識前后測整體數(shù)據(jù)之間的關(guān)系,右分圖顯示男、女生詞匯知識前后測數(shù)據(jù)之間的關(guān)系,圖中的曲線為LOWESS平滑線,數(shù)據(jù)點用不同的符號顯示。左分圖表明,詞匯知識前后測沒有異常點,沒有明顯的方差不齊現(xiàn)象。LOWESS平滑線接近直線,且坡度較陡,說明它們之間有很強的線性關(guān)系。但是,右分圖顯示詞匯知識前后測之間的關(guān)系隨性別的變化而變化。在女生數(shù)據(jù)中,詞匯知識前后測LOWESS平滑線近似為直線,且坡度較陡,反映較強的線性關(guān)系。但是,在男生數(shù)據(jù)中,當詞匯知識前測值較小(約小于33)時,詞匯知識前后測LOWESS平滑線較為水平;當詞匯知識前測值較大(約大于33)時,詞匯知識前后測LOWESS平滑線變得陡峭。這表明,詞匯知識前后測在男生數(shù)據(jù)中存在非線性關(guān)系。另外,右分圖兩條平滑線交叉,說明詞匯知識前后測回歸線在性別的兩個水平上非齊性。進一步的回歸斜率齊性檢驗發(fā)現(xiàn),本例數(shù)據(jù)違反回歸斜率齊性假設(shè)(F(1,100 = 7.33,p= .008 < .01))。

圖5詞匯知識前后測之間的關(guān)系

概而言之,本例數(shù)據(jù)分布有異常值和雙峰現(xiàn)象存在,LOWESS平滑方法診斷發(fā)現(xiàn)詞匯知識前后測違反回歸斜率齊性假設(shè),且在男生數(shù)據(jù)中詞匯知識前后測之間存在非線性關(guān)系,因而常規(guī)的協(xié)方差分析方法不再適合用于推理統(tǒng)計。

4 非線性條件下穩(wěn)健協(xié)方差分析及應(yīng)用

4.1非線性條件下穩(wěn)健協(xié)方差分析

在兩個獨立組的協(xié)方差分析中,如果協(xié)變量和因變量之間的關(guān)系為非線性關(guān)系,回歸斜率非齊性(即回歸線不平行),則常規(guī)協(xié)方差分析方法不再合適,宜選擇穩(wěn)健協(xié)方差分析方法——選點分析。

兩組有條件的位置測量(如20%截尾平均數(shù))記作mj(x),其中j= 1,2。選點分析的零假設(shè)是:H0:m1(x)=m2(x),其中x∈{x1,…,xK},K為協(xié)變量X選點數(shù)。計算條件估計量mj(x)必須要確定在某個協(xié)變量值x鄰近的所有X值xij。一種確定方法是移動區(qū)間平滑方法(running interval smoother)(Wilcox,2017:628)。鄰近值的判斷標準為:|xi-x|f×MADN,其中f是平滑參數(shù)(常用值為1或0.8),MADN表示正態(tài)化的中位數(shù)絕對離差(參見鮑貴,2017)。根據(jù)鄰近值的判斷標準得到鄰近xi的所有xj值的集合,記作N(xi)。令i為滿足條件式j(luò)∈N(xi)的所有yj值的參數(shù)估計。計算所有x=xi(i=1,…,n) 時的i值,將(x1,1),…,(xn,n)連成線便得到回歸線的圖示表征。這一過程稱作移動區(qū)間平滑方法。

通常在五個點上選擇可比較的回歸線。依據(jù)Wilcox(2017:703-704),設(shè)5個選擇點為z1、z2、z3、z4和z5。協(xié)變量xij值按升序排列,即x1j≤ … ≤xnjj。因變量y值的次序與xij值的順序?qū)?yīng)。令Mj(x)是第j組鄰近x的數(shù)據(jù)點數(shù)。在第一組中尋找滿足條件式M1(xi1)≥12的協(xié)變量X最小值xi1。如果M2(xi1)≥12,則z1=xi1。如果M2(xi1)<12,尋找下一個X最小值xi1,照此重復直到滿足條件式M1(xi1)≥12和M2(xi1)≥12。令i1是一個i值,是滿足條件式M1(xi11)≥12和M2(xi11)≥12的最小整數(shù),則z1=xi11。按照同樣的方法得到最大選點z5=xi51。令i2=(i1+i3)/2,i3=(i1+i5)/2,i4=(i3+i5)/2。取i2、i3和i4的整數(shù)部分,則z2=xi21,z3=xi31,z4=xi41。

在穩(wěn)健型選點分析中,令mj(x)為i滿足條件式Nj(x) = {i:|xij-x|fj×MADNj}的第j組所有yij值的20%截尾平均數(shù)。Mj(x)是用于估計mj(x)的所有yij值的點數(shù)。根據(jù)Wilcox(2017: 703),當某個選點x上有效樣本量足夠大時(比如大于12),則在點x上兩條回歸線具有可比性,Yuen方法能夠給出條件平均數(shù)差異m1(x)-m2(x)精確的置信區(qū)間。在多個x點上比較條件平均數(shù)差異時,可以利用Hochberg方法等控制族第一類錯誤率。

4.2非線性條件下穩(wěn)健協(xié)方差分析應(yīng)用

由于非線性條件下選點分析允許非正態(tài)分布、回歸線非線性和非齊性,因而對第3節(jié)關(guān)于詞匯知識前后測數(shù)據(jù)的推理統(tǒng)計適合采用穩(wěn)健選點分析方法。表1報告選點分析的結(jié)果,調(diào)整p值控制族錯誤率的方法為Hochberg方法。

表1 性別對詞匯知識后測影響的選點分析

表1顯示,在詞匯知識前測的五個選點上,男、女生在詞匯知識后測上均沒有統(tǒng)計顯著性差異(ps > .05)。換言之,在控制詞匯知識前測時,性別對詞匯知識后測沒有統(tǒng)計顯著性影響。如果針對本例采用常規(guī)協(xié)方差分析,則得到性別對后測有顯著性效應(yīng)的結(jié)論(F(1,101)= 6.92,p= .010 < .05),效應(yīng)量達到中等水平(Cohen’sd= 0.54)。

從表1效應(yīng)量來看,在前兩個選點上,性別效應(yīng)量低,而在最后三個選點上,效應(yīng)量或接近中等水平,或達到中等甚至更大的水平。這似乎表明,在詞匯知識前測的不同水平上,性別對詞匯知識后測的影響是不一致的。如果研究者認為達到中等以上水平的效應(yīng)量有實際意義,則在詞匯知識前測較高水平(選點為36和42)上,女生比男生在詞匯知識后測上表現(xiàn)更好。本例詞匯知識前測較高水平上的有效樣本量偏小,在大樣本情況下,女生在詞匯知識后測方面是否顯著好于男生尚需進一步的研究論證。

5 結(jié)語

本文簡要介紹了箱圖、核密度圖和LOWESS平滑線、單因素穩(wěn)健方差分析與協(xié)方差分析(選點分析)的基本原理和程序。案例分析表明,這些圖形大大增加了我們對數(shù)據(jù)分布模式的感知,為推理統(tǒng)計分析方法的選擇提供了重要的依據(jù)。當數(shù)據(jù)違反正態(tài)分布和方差齊性時,常規(guī)方差分析與穩(wěn)健方差分析得出不同的結(jié)果。當雙變量數(shù)據(jù)違反線性假設(shè)和回歸斜率齊性假設(shè)時,傳統(tǒng)的協(xié)方差分析得出誤導性的結(jié)果。這些結(jié)果凸顯了診斷數(shù)據(jù)分布和采用穩(wěn)健統(tǒng)計分析方法的重要性。

Cleveland, W. S. 1979. Robust Locally Weighted Regression and Smoothing Scatterplots [J].AmericanStatisticalAssociation, 74(368): 829-836.

Cleveland, W. S. 1985.TheElementsofGraphingData[M]. Monterey, CA: Wadsworth Advanced Book Program.

Cohen, J.1988.StatisticalPowerAnalysisfortheBehavioralSciences(2nd ed.) [M]. Hillsdale, NJ: Lawrence Erlbaum Associates.

Ellis, R. & F. Yuan. 2004. The Effects of Planning on Fluency, Complexity, and Accuracy in Second Language Narrative Writing [J].StudiesinSecondLanguageAcquisition(26): 59-84.

Emerson, J. D. & J. Strenio. 1983. Boxplots and Batch Comparison [G]∥ D. C. Hoaglin, F. Mosteller & J. W. Tukey.UnderstandingRobustandExploratoryDataAnalysis. New York, NY: Wiley,58-96.

French, L. M. & I. O’Brien. 2008. Phonological Memory and Children’s Second Language Grammar Learning [J].AppliedPsycholinguistics, 29(1): 1-25.

Gries, S. Th. 2013.StatisticsforLinguisticswithR:APracticalIntroduction(2nd ed.) [M]. Berlin/Boston: De Gruyter Mouton.

Hintze, J. L. & R. D. Nelson. 1998. Violin Plots: A Box Plot-Density Trace Synergism [J].TheAmericanStatistician, 52(2): 181-184.

Hyndman, R. J. & Y. Fan. 1996. Sample Quantiles in Statistical Packages [J].TheAmericanStatistician, 50(4): 361-365.

Johnson, K. 2008.QuantitativeMethodsinLinguistics[M] Malden, MA: Blackwell Publishing.

Kabacoff, R. I. 2015.RinAction:DataAnalysisandGraphicswithR(2nd ed.) [M]. Shelter Island, NY: Manning Publications Co.

Keen, K. J. 2010.GraphicsforStatisticsandDataAnalysiswithR[M]. Boca Raton, FL: Chapman & Hall/CRC.

Larson-Hall, J. 2012. Our Statistical Intuitions May Be Misleading Us: Why We Need Robust Statistics [J].LanguageTeaching, 45(4): 460-474.

Larson-Hall, J. 2016.AGuidetoDoingStatisticsinSecondLanguageResearchUsingSPSSandR(2nd ed.) [M]. New York, NY: Routledge.

Larson-Hall, J. & R. Herrington. 2010. Improving Data Analysis in Second Language Acquisition by Utilizing Modern Developments in Applied Statistics [J].AppliedLinguistics, 31(3): 368-390.

Larson-Hall, J. & L. Plonsky. 2015. Reporting and Interpreting Quantitative Research Findings: What Gets Reported and Recommendations for the Field[J].LanguageLearning, 65 (1): 127-159.

McGill, R., J. W. Tukey & W. A. Larsen. 1978. Variations of Box Plots [J].TheAmericanStatistician, 32(1): 12-16.

Plonsky, L. 2014. Study Quality in Quantitative L2 Research (1990—2010): A Methodological Synthesis and Call for Reform [J].TheModernLanguageJournal, 98(1): 450-470.

Plonsky, L., J. Egbert & G. T. LaFlair. 2015. Bootstrapping in Applied Linguistics: Assessing Its Potential Using Shared Data [J].AppliedLinguistics, 36(5): 591-610.

Silverman, B. W. 1986.DensityEstimationforStatisticsandDataAnalysis[M]. London: Chapman & Hall.

Tukey , J. W. 1977.ExploratoryDataAnalysis[M]. Reading, MA: Addison-Wesley.

Ugarte, M.D., A. F. Militino & A. T. Arnholt. 2015.ProbabilityandStatisticswithR(2nd ed.) [M]. Boca Raton, FL: CRC Press.

Wilcox, R.R. 1998. How Many Discoveries Have Been Lost by Ignoring Modern Statistical Methods? [J].AmericanPsychologist, 53(3): 300-314.

Wilcox, R. R. 2012.IntroductiontoRobustEstimationandHypothesisTesting(3rd ed.) [M]. San Diego, CA: Elsevier.

Wilcox, R. R. 2017.IntroductiontoRobustEstimationandHypothesisTesting(4th ed.) [M]. San Diego, CA: Elsevier.

鮑貴. 2012. 我國外語教學研究中的統(tǒng)計分析方法使用調(diào)查 [J]. 外語界(1):44-51,60.

鮑貴. 2014. 研究設(shè)計中樣本量的確定 [J]. 外國語文(5):115-121.

鮑貴. 2016. 輸出任務(wù)類型和詞語意象性對英語學習者詞匯習得的影響 [J]. 外語與外語教學(6):56-65,74.

鮑貴. 2017. 語言學定量研究中的穩(wěn)健統(tǒng)計方法 [J]. 外語研究(2):22-29.

猜你喜歡
選點平均數(shù)中位數(shù)
低轉(zhuǎn)速工況VVT選點對排氣溫度影響研究與分析
“選點突破”技法的理論基礎(chǔ)及應(yīng)用
中位數(shù)計算公式及數(shù)學性質(zhì)的新認識
不一樣的平均數(shù)
關(guān)注加權(quán)平均數(shù)中的“權(quán)”
平均數(shù)應(yīng)用舉隅
說說加權(quán)平均數(shù)
基于ArcGIS格網(wǎng)選點的優(yōu)化技術(shù)研究
關(guān)于綜合業(yè)務(wù)接入點選點方案的探討
導學案不能淪落為“習題單”:以“中位數(shù)和眾數(shù)”的導學案為例