胡良平,呂辰龍 (軍事醫(yī)學(xué)科學(xué)院科技部生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京100850)
上期介紹了成組設(shè)計定量資料的一般處理方法,試驗中僅涉及一個具有兩水平的試驗因素,例如,研究某種藥物對不同性別、同種疾病病人的治療效果,試驗因素即為性別。但在有些試驗中,試驗因素涉及的水平數(shù)可能超過兩個,例如希望比較三種藥物對某種疾病治療效果的優(yōu)劣,或者比較某種藥物對同種疾病三種不同類型的治療效果。對于第一種情況,最合適的方法就是選擇患了該病但病情和其他重要非試驗因素方面(如病程、病型、病人的基礎(chǔ)健康狀況等)相近的病人若干,將他們隨機分成三組,分別接受不同藥物治療,觀測一項或多項指標(biāo)來衡量最終的治療效果,這時所運用的試驗設(shè)計方法即為單因素三水平設(shè)計。下面看一個例子。
例1 為探討褪黑素對脂肪組織代謝的影響,將24只 SD大鼠隨機分為正常對照組(灌服含2%乙醇的生理鹽水)、高劑量褪黑素組(10 mg·kg-1·d-1)、低 劑 量 褪 黑 素 組(0.2 m g·kg-1·d-1),每組各8只,干預(yù)組每日灌服不同劑量褪黑素溶液,3周后各組大鼠血漿中胰島素的濃度變化見表1[1]。
上面的例子在科研中經(jīng)常會遇到,即考察不同劑量同種藥物對某些生理指標(biāo)的影響,選取某種受試對象用該種藥物不同劑量分別作用相同時間,分析這段時間后各組之間某觀測指標(biāo)是否存在差異,從而推斷出這種藥物對生物機理的影響程度。分析三組定量數(shù)據(jù)樣本均值之間的差異是否具有統(tǒng)計學(xué)意義,可采用單因素三水平設(shè)計定量資料假設(shè)檢驗方法進(jìn)行統(tǒng)計分析。
表1 褪黑素治療后各組大鼠血漿胰島素濃度的變化aTable 1 Changes of insulin concentrationsafter melatonin treatment in different rat groups (n=8,z B/U·L-1)
1.1 單因素多水平設(shè)計的定義和特點 試驗中涉及一個具有k水平(k≥3)的試驗因素,若試驗因素獨立于受試對象,則可將全部受試對象完全隨機地分入該試驗的k個水平組中去;反之,將從特定的k個子總體中隨機抽取受試對象。觀測各組受試對象接受不同處理后,某個或某些定量觀測指標(biāo)的數(shù)值,這樣安排試驗的方法叫做單因素k水平(k≥3)設(shè)計或單因素多水平設(shè)計。單因素多水平設(shè)計的特點是,試驗中僅涉及一個具有k水平的試驗因素,未對其他任何重要非試驗因素進(jìn)行有計劃的安排,僅希望通過隨機化分組來平衡所有非試驗因素在各組間對觀測結(jié)果的干擾和影響。在單因素k水平設(shè)計中,若定量指標(biāo)只有1個,則定量資料就叫做單因素k水平設(shè)計一元定量資料;若定量指標(biāo)有m(m>1)個,則定量資料就叫做單因素k水平設(shè)計m元定量資料。1.2 單因素多水平設(shè)計定量資料統(tǒng)計分析方法合理選用 (1)試驗僅受一個因素影響,并且該因素包含的水平數(shù)不小于3,所有觀測指標(biāo)均為定量數(shù)據(jù); (2)檢測各組定量資料是否同時滿足正態(tài)性,檢測多組定量資料是否滿足方差齊性,若滿足則采用參數(shù)檢驗(單因素多水平設(shè)計一元定量資料方差分析),反之,則采用非參數(shù)檢驗(一元定量資料 Kruskal-Wallis秩和檢驗);(3)當(dāng)觀測的定量指標(biāo)為多個時,需采用單因素多水平設(shè)計多元方差分析。
2.1 應(yīng)用SAS軟件分析單因素多水平設(shè)計一元定量資料 例2 沿用例1中的資料,試問三組受試對象胰島素的濃度變化差異有沒有統(tǒng)計學(xué)意義?
對問題的分析與SAS實現(xiàn) 此資料涉及三組大鼠,試驗因素為褪黑素劑量,具有三個水平,分別為“對照組(零劑量組)”、“高劑量褪黑素組”、“低劑量褪黑素組”,觀測結(jié)果中只有一個定量指標(biāo)“胰島素濃度變化”,假定隨機分組的方法已經(jīng)消除或降低了各種非試驗因素對觀測結(jié)果的影響(否則,應(yīng)按重要非試驗因素進(jìn)行分層隨機化),故此定量資料屬于單因素三水平設(shè)計一元定量資料。對三組大鼠血漿濃度變化分別進(jìn)行正態(tài)性檢驗,若都服從正態(tài)分布,再進(jìn)一步驗證三組試驗數(shù)據(jù)是否滿足方差齊性,若觀測結(jié)果同時滿足正態(tài)性和方差齊性,可采用單因素三水平設(shè)計一元定量資料的方差分析;若有一個條件不滿足,可采用 Kruskal-Wallis秩和檢驗。應(yīng)用SAS進(jìn)行分析,程序如下。
程序說明:第1步創(chuàng)建數(shù)據(jù)集,“group”表示分組因素,“1”是對照組,“2”是高劑量褪黑素組,“3”是低劑量褪黑素組;第3步調(diào)用UN IVARIA TE過程,對觀測結(jié)果進(jìn)行正態(tài)性檢驗;第4步調(diào)用GLM過程對觀測結(jié)果進(jìn)行方差齊性檢驗和參數(shù)檢驗,并利用SN K法進(jìn)行兩兩比較,若觀測結(jié)果同時滿足正態(tài)性和方差齊性,則查看此部分的結(jié)果,若有一個條件不滿足,則查看第5步非參數(shù)檢驗的結(jié)果。SAS輸出結(jié)果及結(jié)果解釋:第3步部分輸出結(jié)果:
/*第1步.創(chuàng)建數(shù)據(jù)集*/ data new; input group; do i=1 to 8; input x@@; output; end; cards; 1 65.44 61.02 91.0 17.97 105.63 88.24 31.97 40.47 2 184.36 132.15 48.28 99.88 77.99 7.84 14.03 29.62 3 50.64 101.49 90.40 42.37 119.94 45.20 21.18 43.29 ; run; /*第2步.按組別進(jìn)行排序*/ p roc so rt; by group; run; /*第3步.正態(tài)性檢驗*/ p roc univariate normal noprint; var x; by group; output out=AA normal= w p robn=p; run; /*網(wǎng)頁格式輸出結(jié)果*/ ods html; p roc p rint data=AA noobs; var group w p; run; /*第4步.方差齊性檢驗和方差分析*/ p roc glm data=new; class group; model x=group/ss3; means group/hovtest snk; run; quit; /*第5步.非參數(shù)檢驗*/ p roc npar1way data=new wilcoxon; class group; var x; run; ods htm l close; quit;
SAS系統(tǒng)正態(tài)性檢驗Test of normality of SAS system
從結(jié)果可以看到,三組數(shù)據(jù)正態(tài)性檢驗的 P值均>0.05,滿足正態(tài)性要求。
第4步部分輸出結(jié)果:
GLM過程The GLM procedure對變量x采用Levene法進(jìn)行方差齊性檢驗各組偏差平方的方差分析Levene’s test for homogenety of x variance ANOVA of squared deviations from group means
該部分給出的是方差齊性的檢驗結(jié)果,F值為2.80,P值為0.083 8>0.05,說明該定量資料滿足方差齊性要求。綜上可知,需要查看參數(shù)檢驗的結(jié)果,也就是GLM過程的輸出結(jié)果。
GLM過程The GLM procedure因變量:xDependen t Variable:x
該部分給出的是差異性的統(tǒng)計分析結(jié)果,可以看到,F值為0.16,P值為0.856 2>0.05,因此認(rèn)為三組數(shù)據(jù)之間沒有統(tǒng)計學(xué)差異。
具有相同字母的任何兩個平均值之間的差異無統(tǒng)計學(xué)意義Means with the same letter are not significantly different
這部分給出的是兩兩比較的結(jié)果,從這里也可以得到三個平均值之間的差別無統(tǒng)計學(xué)意義的結(jié)論,因為三組數(shù)據(jù)同屬于A類(觀察SN K所在列)。
第5步部分輸出結(jié)果:
Kruskal-Wallis秩和檢驗Kruskal-Wallis test
這部分給出的是非參數(shù)檢驗的結(jié)果,如果觀測數(shù)據(jù)不滿足參數(shù)檢驗的前提條件,需要查看此部分的輸出結(jié)果。由上面的輸出結(jié)果可以得到χ2= 0.02,P值為0.99。
統(tǒng)計學(xué)和專業(yè)結(jié)論:F值為0.16,P值為0.856 2>0.05,故按α=0.05水準(zhǔn),認(rèn)為三組大鼠血漿胰島素濃度變化之間的差異無統(tǒng)計學(xué)意義。即不同的褪黑素劑量對大鼠血漿胰島素濃度變化的影響程度基本相同。
2.2 應(yīng)用SAS軟件分析單因素多水平設(shè)計多元定量資料 上面給出的是單因素多水平一元定量資料的例子,如果觀測結(jié)果涉及到在專業(yè)上有一定聯(lián)系的多個定量指標(biāo)時,則需要采用多元方差分析方法處理,聯(lián)合考察多個定量指標(biāo)在組間的整體差異(在統(tǒng)計學(xué)上稱為均值向量之間的比較)是否具有統(tǒng)計學(xué)意義,由此得出基于多個定量指標(biāo)整體評價的統(tǒng)計學(xué)和專業(yè)結(jié)論。
例3 繼續(xù)沿用例1的試驗設(shè)計,觀測指標(biāo)和結(jié)果見表2[1],請作統(tǒng)計分析。
表2 褪黑素治療3周后各組大鼠體重及腹腔組織量的變化aTable 2 Changes of body weight and mass of intra-abdom inal fat after melatonin treatment for3 weeks in different rat groups (n=8,m/g)
對問題的分析與SAS實現(xiàn) 此例觀測的指標(biāo)是兩個定量指標(biāo),分別為體重和腹腔脂肪組織量,試驗因素仍是褪黑素劑量,具有三個水平,屬于單因素三水平設(shè)計二元定量資料,采用單因素三水平設(shè)計定量資料二元方差分析[2]。假設(shè)三組數(shù)據(jù)均滿足參數(shù)檢驗的前提條件,實現(xiàn)此分析的SAS程序如下:
/*第1步.創(chuàng)建數(shù)據(jù)集*/ data new; input group; do i=1 to 8; input x1 x2@@; output; end; cards; 1 303.98 0.377 170.94 1.532 216.60 1.646 263.20 0.442 203.50 0.703 250.46 1.291 228.85 1.117 284.56 1.328 2 210.56 0.384 183.44 0.729 216.60 0.126 199.20 0.579 227.68 0.513 218.78 0.182 220.54 0.285 197.12 0.124 3 251.84 0.717 268.49 1.562 226.92 1.771 224.32 1.249 243.03 1.154 240.53 0.693 248.31 0.676 242.04 0.593 ; run; /*網(wǎng)頁格式輸出結(jié)果*/ ods htm l; /*第2步.多元方差分析*/ p roc glm data=new; class group; model x1-x2=group/nouni; contrast’group1 vs group2’group 1-1 0; contrast’group1 vs group3’group 1 0-1; contrast’group2 vs group3’group 0 1-1; manova H=group; means group; run; quit; ods htm l close; quit;
程序說明:第二步調(diào)用 GLM過程做多元方差分析,nouni表示只做多元方差分析不做一元方差分析,manova H=group是啟動多元方差分析的選項;contrast表示對三組數(shù)據(jù)之間進(jìn)行兩兩比較,將對比的兩個水平中的一個用“1”表示,另一個用“-1”表示。
SAS輸出結(jié)果及結(jié)果解釋:
對于沒有組間效應(yīng)的假設(shè)所做的多元方差分析的檢驗界值和近似F值H=組間III型離差矩陣,E=誤差離差矩陣M ANOVA test criteria and F approximations for the hypothesis of no overall group effect H=type IIISSCPmatrix for group E=error SSCPmatrix S=2 M=-0.5 N=9
這步給出的是多元方差分析的輸出結(jié)果,通常只用第一行上的計算結(jié)果。故僅關(guān)注 Wilks’Lambda統(tǒng)計量,其對應(yīng)的 F值為 6.57,P值為0.000 4<0.05,說明就三項定量指標(biāo)整體而言,三組之間的差異有統(tǒng)計學(xué)意義。
對于沒有第一組與第二組組間效應(yīng)的假設(shè)所做的多元方差分析的檢驗界值和近似 F值H=第一組與第二組組間比較離差矩陣E=誤差離差矩陣MANOVA test criteria and exact F statistics for the hypothesis of no overall group 1 vs group 2 effect H=contrast SSCPmatrix for group 1 vs group 2 E=error SSCPmatrix S=1 M=0 N=9
這三部分給出的是三組之間兩兩比較的結(jié)果,通過觀察W ilks’Lambda統(tǒng)計量,得到第1組與第2組之間差異有統(tǒng)計學(xué)意義(F=12.67、P= 0.000 3<0.05),第2組與第3組之間差異有統(tǒng)計學(xué)意義(F=13.47、P=0.000 2<0.05),第1組與第3組之間差異沒有統(tǒng)計學(xué)意義(F=0.02、P= 0.976 7>0.05)。
對于沒有第一組與第三組組間效應(yīng)的假設(shè)所做的多元方差分析的檢驗界值和近似 F值H=第一組與第三組組間比較離差矩陣E=誤差離差矩陣MANOVA test criteria and exact F statistics for the hypothesis of no overall group 1 vs group 3 effect H=contrast SSCPmatrix for group 1 vs group 3 E=error SSCPmatrix S=1 M=0 N=9
對于沒有第二組與第三組組間效應(yīng)的假設(shè)所做的多元方差分析的檢驗界值和近似 F值H=第二組與第三組組間比較離差矩陣E=誤差離差矩陣MANOVA test criteria and exact F statistics for the hypothesis of no overall group 2 vs group 3 effect H=con trast SSCPmatrix for group 2 vs group 3 E=error SSCPmatrix S=1 M=0 N=9
統(tǒng)計學(xué)和專業(yè)結(jié)論:三組觀測結(jié)果的差異具有統(tǒng)計學(xué)意義,根據(jù)上面分析可知,高劑量褪黑素組可以明顯降低大鼠體重和腹腔脂肪組織量。
[1] 楊凌輝,劉志民,李文桐,等.褪黑素對大鼠腹腔內(nèi)脂肪組織代謝的影響[J].藥學(xué)服務(wù)與研究,2005,5(1):23-24.
Yang LingHui,Liu ZhiMin,Li Wen Tong,et al.Effect of melatonin on metabolism of intra-abdominal fat of rat[J].Pharm Care Res,2005,5(1):23-24.
[2] 胡良平.醫(yī)學(xué)統(tǒng)計學(xué):運用三型理論分析定量與定性資料[M].北京:人民軍醫(yī)出版社,2009:49.
Hu LiangPing.Medical statistics:analysis of quantitative and qualitative data with triple-type theory[M].Beijing:People’s M ilitary M edical Press,2009:49.Chinese.