胡純嚴(yán),胡良平,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會,北京 100029
方差齊性檢驗(yàn)就是檢驗(yàn)?zāi)吃囼?yàn)因素兩個水平或多個水平下觀測的定量數(shù)據(jù)所代表的總體方差是否相等,它是定量資料均值比較的重要前提條件之一。通常,方差齊性檢驗(yàn)分為單因素兩水平設(shè)計(jì)與單因素多水平設(shè)計(jì)下一元定量資料方差齊性檢驗(yàn)兩種情形。在第一種情形下,只有一種F檢驗(yàn)法;而在第二種情形下,有三種F檢驗(yàn)法和一種χ2檢驗(yàn)法。本文將介紹前述提及的五種方差齊性檢驗(yàn)法,并通過三個實(shí)例和SAS軟件實(shí)現(xiàn)各種方差齊性檢驗(yàn)。
在進(jìn)行兩個或多個均值比較時,若希望采用經(jīng)典統(tǒng)計(jì)學(xué)中的參數(shù)檢驗(yàn)法[(包括Z檢驗(yàn)、t檢驗(yàn)和方差分析(或稱F檢驗(yàn))],定量資料應(yīng)滿足三個前提條件:獨(dú)立性、正態(tài)性和方差齊性。當(dāng)只有一個兩水平的試驗(yàn)因素時,方差齊性檢驗(yàn)的方法比較簡單,只需要用較大的樣本方差除以較小的樣本方差,依據(jù)F分布,就可推斷兩總體方差是否相等;然而,當(dāng)只有一個試驗(yàn)因素且水平數(shù)大于2時,就不適合采取前述的方法進(jìn)行方差齊性檢驗(yàn)。SAS/STAT的GLM過程[1]中介紹了四種方差齊性檢驗(yàn)方法,將在下文進(jìn)行闡述。
當(dāng)試驗(yàn)研究涉及多個試驗(yàn)因素時,傳統(tǒng)的做法仍然是對每一個試驗(yàn)因素分別進(jìn)行方差齊性檢驗(yàn)。若采用混合效應(yīng)模型進(jìn)行方差分析,在SAS/STAT的MIXED過程中,改變了思路,不直接檢驗(yàn)各前提條件是否滿足,而是假設(shè)給定的定量資料具有某種“方差和協(xié)方差結(jié)構(gòu)”?;谔囟ǖ募僭O(shè)去構(gòu)造混合效應(yīng)模型,并計(jì)算一系列衡量模型對給定定量資料擬合效果的評價(jià)指標(biāo)或統(tǒng)計(jì)量。分別采用多種可能的“方差和協(xié)方差結(jié)構(gòu)”對同一個資料進(jìn)行建模,最后,依據(jù)前述提及的評價(jià)指標(biāo)的數(shù)值來確定哪個混合效應(yīng)模型能最好地?cái)M合給定的資料[1-2]。
式(1)中,F(xiàn)服從分子自由度為df1、分母自由度為df2的F分布。拒絕域:F≥F(1-α/2)(df1,df2),則p≤α(注:此時宜采用雙側(cè)檢驗(yàn))。
兩總體方差齊性檢驗(yàn)屬于雙側(cè)檢驗(yàn),而通常的基于均值比較的方差分析(F檢驗(yàn))屬于單側(cè)檢驗(yàn)。理由如下:在方差齊性檢驗(yàn)中,無效假設(shè)為兩總體方差相等。若拒絕此無效假設(shè),就意味著兩總體方差不等,此時,第1個總體方差可能大于第2個總體方差,也可能小于第2個總體方差;而在基于均值比較的方差分析(F檢驗(yàn))中,無效假設(shè)為各組均值相等,在此假設(shè)成立的條件下,所構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量F的分子為“組間方差”,分母為“組內(nèi)方差(或誤差方差)”。通常檢驗(yàn)統(tǒng)計(jì)量F的分子大于等于分母,故此時宜采用單側(cè)檢驗(yàn)。
1.3.1 Bartlett’s χ2檢驗(yàn)
Bartlett提出了一種等方差檢驗(yàn),這是對正態(tài)理論似然比檢驗(yàn)的修正。用于方差齊性檢驗(yàn)的Bartlett’sχ2檢驗(yàn)的原理如下[3-4]。設(shè)有k個總體,每個總體的方差為,則建立檢驗(yàn)假設(shè)如下,H1:k個總體方差不等或不全相等。構(gòu)造檢驗(yàn)統(tǒng)計(jì)量見式(2):
式(2)中,若k個樣本均來自獨(dú)立的正態(tài)分布總體,則χ2服從自由度為df=k-1的χ2分布;拒絕域?yàn)閝和h分別見式(3)、式(4):
式(3)中,“l(fā)g”代表取以10為底的常用對數(shù),ni代表從第i個總體中抽取樣本的樣本含量,N代表總樣本含量,為第i個總體的樣本方差,為合并的樣本方差,其計(jì)算見式(5):
Bartlett’sχ2檢驗(yàn)可以通過 SAS 軟件實(shí)現(xiàn):調(diào)用SAS/STAT中的GLM過程時,在其內(nèi)的MEANS語句的選項(xiàng)中加上“HOVTEST=BARTLETT”[1]。
1.3.2 Levene’s F檢驗(yàn)
導(dǎo)致對基礎(chǔ)分布更穩(wěn)健的檢驗(yàn)方法是轉(zhuǎn)換因變量的原始值以導(dǎo)出離散變量,然后對該變量進(jìn)行方差分析。方差同質(zhì)性檢驗(yàn)的顯著性水平是離散變量方差分析F檢驗(yàn)的P值。除Bartlett方差齊性檢驗(yàn)外,PROC GLM中可用的所有方差齊性檢驗(yàn)均使用此方法[1,4]。
Levene’s檢驗(yàn)被廣泛認(rèn)為是方差的標(biāo)準(zhǔn)同質(zhì)性檢驗(yàn)(HOVTEST=Levene選項(xiàng))。Levene’s檢驗(yàn)采用前面討論的離散變量方差分析形式,其中離散變量為以下任一項(xiàng):
采用式(6)或式(7)對原始數(shù)據(jù)yij做變量變換后,得到新數(shù)據(jù)zij。然后直接對新數(shù)據(jù)采用單因素k水平設(shè)計(jì)一元定量資料方差分析,對應(yīng)的檢驗(yàn)統(tǒng)計(jì)量見式(8):
在式(8)中,F(xiàn)服從分子自由度為k-1、分母自由度為N-k的F分布。
1.3.3 O′Brien’s F檢驗(yàn)
O′Brien提出了一個檢驗(yàn)(HOVTEST=OBRIEN),它基本是對Levene方法的一種修改,使用式(9)等號左邊的離散變量[1,4]:
式(9)中,ni是第i組的樣本大小,是其樣本方差??梢允褂美ㄌ栔械腤=選項(xiàng)[例如:HOVTEST=OBRIEN(W=0.5)]來調(diào)整O′Brien的離散變量,以匹配設(shè)定分布的可疑峰度。默認(rèn)情況下,W=0.5[1]。將式(9)代入式(8),就可實(shí)現(xiàn)對新變量進(jìn)行方差分析,但其結(jié)果是O′Brien’s方差齊性檢驗(yàn)的結(jié)果。
1.3.4 Brown-Forsythe’sF檢驗(yàn)
Brown和Forsythe建議使用式(10),即組中位數(shù)的絕對偏差[1,4]:
在式(10)中,mi是第i組的中位數(shù)??梢允褂肏OVTEST=BF選項(xiàng)指定此檢驗(yàn)。將式(10)代入式(8),就可以實(shí)現(xiàn)對新變量進(jìn)行方差分析,其結(jié)果是Brown-Forsythe’s方差齊性檢驗(yàn)的結(jié)果。
如果其中一項(xiàng)檢驗(yàn)拒絕方差同質(zhì)性假設(shè),則應(yīng)使用Welch’s方差分析而不是通常的方差分析來檢驗(yàn)組間均值的差異。然而,只有當(dāng)使用一個穩(wěn)健的方差齊性檢驗(yàn)(即不適用于HOVTEST=BARTLETT)時,這個結(jié)論才成立;即使如此,任何方差齊性檢驗(yàn)的能力都太小,無法始終檢驗(yàn)Welch’s方差分析是否合適[1]。
【例1】研究呼出氣冷凝液中氮氧化物與哮喘發(fā)病的關(guān)系。探討哮喘急性發(fā)作期患者和健康體檢者呼出氣冷凝液中氮氧化物的水平,了解其與哮喘發(fā)病、病情變化及肺功能的關(guān)系。選取13例哮喘急性發(fā)作期患者和13名健康體檢者,兩組重要的基礎(chǔ)資料比較差異均無統(tǒng)計(jì)學(xué)意義,哮喘急性發(fā)作期患者與健康體檢者的氧氮化物含量(單位:μmol/L)數(shù)據(jù)如下[5]。哮喘急性發(fā)作組:0.62、1.28、1.44、0.26、1.19、1.03、2.11、1.38、1.40、1.42、0.96、2.27、1.55;健康對照組:0.93、0.68、0.54、0.18、0.82、0.88、0.54、1.00、0.94、0.31、0.72、0.25、0.88。試問兩組定量資料所取自的兩個總體的方差是否相等?
【例2】抽樣測定了32名蓄電池廠工人的尿ALA(尿氨基-γ-酮戊酸)含量(單位:μmol/L),平均值為53.8662,方差為2460.4768;測定了6名化工廠工人的尿ALA含量,平均值為26.5640,方差為52.6150。試問兩廠工人尿ALA含量的方差是否相等[3]?
【例3】賓夕法尼亞大學(xué)一項(xiàng)嗅覺鑒定測試[1],旨在探索年齡和性別與嗅覺的關(guān)系。共有180名20~89歲的受試者暴露于40種不同的氣味中,對于每種氣味,受試者被要求從四個詞中選擇一個最能描述該氣味的詞。Freeman-Tukey修正的反正弦變換用于正確識別氣味的比例,得出嗅覺指數(shù)。將受試者分為五個年齡組:年齡≤25歲、25歲<年齡≤40歲、40歲<年齡≤55歲、55歲<年齡≤70歲、年齡>70歲。設(shè)年齡分組變量為agegroup,嗅覺指數(shù)變量為smell。試驗(yàn)數(shù)據(jù)較多,此處從略,參見文獻(xiàn)[1]。試檢驗(yàn)五個年齡組受試對象嗅覺指數(shù)的方差是否相等?
【分析與解答】這是一個單因素兩水平設(shè)計(jì)(常簡稱為成組設(shè)計(jì))一元定量資料,若希望采用單因素兩水平設(shè)計(jì)一元定量資料t檢驗(yàn),需要先檢查前提條件是否滿足,方差齊性檢驗(yàn)是其中的一個。設(shè)所需要的SAS程序如下:
【SAS程序說明】在以上程序中,只調(diào)用了PROC TTEST過程,因?yàn)樵撨^程中包含了兩總體方差齊性檢驗(yàn),但未對定量資料進(jìn)行正態(tài)性檢驗(yàn)。因此,還需要使用PROC UNIVARIATE過程實(shí)現(xiàn)正態(tài)性檢驗(yàn);若資料不滿足正態(tài)性和方差齊性,還需要調(diào)用PROC NPAR1WAY過程對定量資料進(jìn)行秩和檢驗(yàn)。
【SAS輸出結(jié)果及解釋】
因F=3.67,df1=df2=12,P=0.0328<0.05,說明兩總體方差不等。
【分析與解答】這是一個單因素兩水平設(shè)計(jì)一元定量資料(缺乏詳細(xì)的原始數(shù)據(jù)),若希望采用單因素兩水平設(shè)計(jì)一元定量資料t檢驗(yàn),需要先檢查前提條件是否滿足,方差齊性檢驗(yàn)是其中的一個。設(shè)所需要的SAS程序如下:
【SAS程序說明】由于缺乏詳細(xì)的原始數(shù)據(jù),無法利用SAS中的PROC TTEST過程實(shí)現(xiàn)方差齊性檢驗(yàn),只能用兩樣本方差比的計(jì)算公式,并利用F分布的分位數(shù)函數(shù)FINV(1-α/2,df1,df2)計(jì)算F分布曲線下橫坐標(biāo)上的上側(cè)臨界值(按雙側(cè)檢驗(yàn)來確定)[6]。
【SAS輸出結(jié)果及解釋】
在輸出結(jié)果中,var1和var2分別代表兩個樣本方差,F(xiàn)=46.7638為檢驗(yàn)統(tǒng)計(jì)量的值,F(xiàn)005和F001代表與顯著性水平α分別等于0.05和0.01對應(yīng)的雙側(cè)檢驗(yàn)的臨界值。由F=46.7638>F001=12.6395,故得到P<0.01,說明兩總體方差不等。由于var1=2460.48>var2=52.615,說明蓄電池廠工人尿ALA含量的變異度大于化工廠工人尿ALA含量。
【分析與解答】這是一個單因素五水平設(shè)計(jì)一元定量資料,若希望采用單因素五水平設(shè)計(jì)一元定量資料方差分析,需要先檢查前提條件是否滿足,方差齊性檢驗(yàn)是其中的一個。設(shè)所需要的SAS程序如下:
【SAS程序說明】在SAS過程步中有4個“MEANS語句”,分別代表4種具體的方差齊性檢驗(yàn)方法。其中,后3個被放置在注釋語句“/**/”中,被當(dāng)作注釋(不被SAS系統(tǒng)執(zhí)行);每次只能讓一個“MEANS語句”處于可被執(zhí)行的狀態(tài)。
【SAS輸出結(jié)果及解釋】
第一,采用Bartlett’s方法進(jìn)行方差齊性檢驗(yàn)的計(jì)算結(jié)果。
以上呈現(xiàn)的是各年齡組smell的平均值和標(biāo)準(zhǔn)差的計(jì)算結(jié)果(注:第2列為樣本含量)。
以上呈現(xiàn)的是采用Bartlett’s方法對五組定量資料(smell)進(jìn)行方差齊性檢驗(yàn)的結(jié)果,其中,說明該定量資料不滿足方差齊性要求。
第二,采用Brown-Forsythe’s方法進(jìn)行方差齊性檢驗(yàn)的計(jì)算結(jié)果。
以上呈現(xiàn)的是采用Brown-Forsythe’s方法對五組定量資料(smell)進(jìn)行方差齊性檢驗(yàn)的結(jié)果,其中F=5.47,df=4,P<0.0004,說明該定量資料不滿足方差齊性要求。
第三,采用Levene’s方法進(jìn)行方差齊性檢驗(yàn)的計(jì)算結(jié)果。
以上呈現(xiàn)的是采用Levene’s方法對五組定量資料(smell)進(jìn)行方差齊性檢驗(yàn)的結(jié)果,其中F=6.35,df=4,P<0.0001,說明該定量資料不滿足方差齊性要求。
第四,采用O′Brien’s方法進(jìn)行方差齊性檢驗(yàn)的計(jì)算結(jié)果。
以上呈現(xiàn)的是采用O′Brien’s方法對五組定量資料(smell)進(jìn)行方差齊性檢驗(yàn)的結(jié)果,其中F=6.16,df=4,P=0.0001,說明該定量資料不滿足方差齊性要求。
當(dāng)數(shù)據(jù)的基本分布為正態(tài)時,Bartlett’sχ2檢驗(yàn)具有準(zhǔn)確的I型錯誤率和最佳功效,但如果該分布稍不正態(tài),則可能不準(zhǔn)確。因此,一般情況下,SAS不建議使用 Bartlett’sχ2檢驗(yàn)[1]?;趯υ级抠Y料進(jìn)行變量變換后的三種F檢驗(yàn)(即Levene’sF檢驗(yàn)、O′Brien’sF檢驗(yàn)和Brown-Forsythe’sF檢驗(yàn)),對于變換后的新數(shù)據(jù)而言,在本質(zhì)上就是“基于均值比較的方差分析”,實(shí)現(xiàn)了對原始數(shù)據(jù)的方差齊性檢驗(yàn)。采用以上4種方法對本文例1的定量資料進(jìn)行方差齊性檢驗(yàn),得到結(jié)果匯總?cè)缦拢?/p>
Bartlett’sχ2檢驗(yàn)法:χ2=4.5524,df=1,P=0.0329(單側(cè)概率)。Levene’sF檢驗(yàn)法:F=3.21,df1=1,df2=24,P=0.090(單側(cè)概率)。Brown-Forsythe’sF檢驗(yàn)法:F=1.64,df1=1,df2=24,P=0.2131(單側(cè)概率)。O′Brien’sF檢驗(yàn)法:F=2.86,df1=1,df2=24,P=0.104(單側(cè)概率)。
以上4種檢驗(yàn)結(jié)果僅Bartlett’sχ2檢驗(yàn)的結(jié)果與例1的基于方差比的檢驗(yàn)結(jié)果完全一致,其他3種檢驗(yàn)得出了相反的結(jié)論。由于例1的兩組定量資料均服從正態(tài)分布,故Bartlett’sχ2檢驗(yàn)的結(jié)果精確度高。
本文對五種方差齊性檢驗(yàn)的理論和方法進(jìn)行了詳細(xì)介紹,呈現(xiàn)了兩種具有不同數(shù)據(jù)結(jié)構(gòu)的單因素兩水平設(shè)計(jì)一元定量資料,并采用兩種途徑實(shí)現(xiàn)了方差齊性檢驗(yàn);對于單因素多水平設(shè)計(jì)一元定量資料,基于SAS中的PROC GLM過程實(shí)現(xiàn)了三種F檢驗(yàn)和一種χ2檢驗(yàn)。