胡良平,賈元杰,鮑曉蕾 (軍事醫(yī)學科學院科技部生物醫(yī)學統(tǒng)計學咨詢中心,北京100850)
前幾期已經(jīng)介紹過在進行一項科研課題研究時,先要進行合理的科研設計,在設計中特別要注意的是三要素、四原則和設計類型,從而使實驗方案更加科學、完善和合理。從這期起開始介紹獲得實驗數(shù)據(jù)后如何使用SAS編程,并能正確解釋SAS輸出結果。先來看一個例子。
例1 觀察阿托伐他汀治療異常脂蛋白血癥的臨床效果,選取無肝、腎、甲狀腺功能異常,無糖尿病病史,門診首次就診測定血脂水平達到入選標準,或停服其他調(diào)脂藥物1個月以上、復測血脂水平達到入選標準者共21例,男9例,女12例,年齡(52± 4)歲。21例病人晚餐后口服阿托伐他汀10 mg,治療時間為6周。服藥前與服藥后第6周末分別禁食12 h,前臂靜脈采血檢測血清總膽固醇(TC),數(shù)據(jù)見表1[1]。
類似例1的例子在臨床科研中經(jīng)常會遇到,即考察某種藥物的治療效果,選取一組病人給予某種藥物治療一段時間,測量一組病人治療前、治療后定量指標值,分析治療前后的定量指標值是否有差異,得出這種藥物的療效如何。對于這類課題可以選用配對設計定量資料假設檢驗的方法進行統(tǒng)計分析。
表1 阿托伐他汀治療前后病人血清總膽固醇值aTable 1 V alues of serum total cholesterol of patients before and after the treatment with atorvastatin (cB/mmol·L-1)
1.1 配對設計的定義和特點 在試驗中僅涉及一個試驗因素的兩個水平,在這兩個水平作用下獲得的相同定量指標的觀察結果是成對出現(xiàn)的,這種成對出現(xiàn)的數(shù)據(jù)有三種情況,即三種配對方式。(1)自身配對 每一對中的兩個數(shù)據(jù)來自同一個體(如服藥物前、后或同一個體的對稱部位分別接受不同處理);(2)同源配對 每一對中的兩個數(shù)據(jù)來自親代相同的兩個個體,如每窩選兩只條件相近的動物或性別相同的雙胞胎,每對中兩個個體分別服用不同的藥物或接受不同的處理;(3)條件相近者配對 每一對中的兩個數(shù)據(jù)來自條件接近但并非同源的兩個個體,如將性別、體重、年齡、病情等中的單個或多個重要非實驗因素各方面都十分接近的每兩個個體配成一對,若配對條件由多個非實驗因素復合而成,稱為復合型配對條件[2]。配對設計下的數(shù)據(jù)具有一一對應的特點,人們關心的結果是各對數(shù)據(jù)的差值,其優(yōu)點在于能排除個體變異對結果評價所帶來的干擾,在比較兩種處理效應時,可比性更好[3]。
在實際工作中應根據(jù)具體情況選取“配對方式”。若試驗因素的兩個水平(假設為A、B),A為空白對照或安慰劑對照,B為真實處理,則自身配對方式能最大限度地排除個體差異的影響,但前后比較時間間隔不宜過長,否則可能會受到混雜因素影響或自身發(fā)生某種變化,失去自身配對的均衡性[4]。若A、B均為真實的處理,如兩種不同藥物,可采用同源配對,同源配對條件達不到時,可采用條件相近者配對。但按條件配對的形式不可輕易使用,僅當配對條件是對定量觀測結果有影響的全部重要非試驗因素的復合型因素時,其結果和結論才是基本正確的。
1.2 配對設計定量資料統(tǒng)計分析方法的合理選用 (1)當檢測指標為定量資料且僅有一個定量指標時稱之為配對設計一元定量資料,若每對中的兩個數(shù)據(jù)的差值服從(或近似服從)正態(tài)分布,采用配對設計一元定量資料t檢驗,反之采用配對設計一元定量資料符號檢驗或符號秩和檢驗。(2)當檢測的定量指標為在專業(yè)上有一定聯(lián)系的多個定量指標時稱之為配對設計多元定量資料,采用配對設計多元方差分析。
2.1 應用 SAS軟件分析配對設計一元定量資料 例2 沿用例1中的資料,試問阿托伐他汀治療前后血清TC值的改變有沒有統(tǒng)計學意義?
對問題的分析與SAS實現(xiàn) 此資料僅有一組病人,涉及一個試驗因素,該因素的表現(xiàn)型是“測量時間”,其原型是“用藥與否”。故其兩個水平分別為“治療前”、“治療后”,只有一個定量指標為“血清TC”,測得的每一對數(shù)據(jù)來自同一個病人,故此定量資料屬于配對設計一元定量資料。應對病人治療前后心率的差值進行正態(tài)性檢驗,若差值服從正態(tài)分布,可采用配對設計一元定量資料的t檢驗分析此定量資料;反之,可采用符號秩和檢驗。應用SAS進行分析,程序如下。
程序說明:第1步為建立數(shù)據(jù)集,“input”表示輸入變量y1、y2,變量 y1、y2代表“治療前、治療后血清TC值”?!癲”代表兩者差值,配對設計一元定量資料t檢驗的本質是:對差值d與0之間的差別是否有統(tǒng)計學意義進行假設檢驗。第2步為調(diào)用univariate過程對此定量資料進行分析。其中“normal”選項是要求系統(tǒng)對數(shù)據(jù)進行正態(tài)性檢驗,“var d”表示要分析的定量變量是“d”。ods語句用來將統(tǒng)計分析結果輸出成網(wǎng)頁格式。
data a; /*第1步*/ input y1 y2@@; d=y2-y1; cards; 7.67 5.87 7.78 5.26 8.14 5.47 7.25 5.95 7.32 5.74 7.65 5.46 7.43 5.69 8.35 5.34 7.49 5.56 6.93 5.84 7.78 5.57 7.6 5.79 7.6 6.07 7.31 6.11 7.08 5.71 8.15 5.67 7.45 5.39 7.7 5.7 8.57 5.6 7.42 6.14 7.49 5.22 ; run; ods html; proc univariate normal; /*第2步*/ var d; run; ods html close;
SAS輸出結果及結果解釋:
SAS系統(tǒng)單變量分析過程(univariate process)變量:d
這部分給出了原始數(shù)據(jù) y1與 y2對應相減后所得差量(變量名為d)的算術平均值、標準差、變異系數(shù)等簡單統(tǒng)計量的計算結果。
基本統(tǒng)計測度位置 變異性均值 -1.952 86 標準偏差 0.567 45中位數(shù) -1.93 方差 0.322眾數(shù) … 極差 1.92四分位極差 0.74
這部分給出了變量 d的基本統(tǒng)計測度,如算術平均值、中位數(shù)、眾數(shù)、標準差、方差、極差(即最大值與最小值之差)、四分位極差(即第三四分位數(shù)與第一四分位數(shù)之差)。
這部分給出了正態(tài)性檢驗結果和t檢驗結果。查驗正態(tài)性檢驗的結果,d變量正態(tài)性檢驗的結果: W=0.963 159、P=0.581 9,說明差值服從正態(tài)分布,故選用配對設計一元定量資料t檢驗的結果。
位置檢驗:Mu0=0檢驗 統(tǒng)計量 P值學生t t -15.770 7 Pr>|t| <0.000 1符號 M -10.5 Pr≥|M| <0.000 1符號秩 S -115.5 Pr≥|S| <0.000 1
正態(tài)性檢驗檢驗 統(tǒng)計量 P值Shapiro-Wilk W 0.963 159 Pr<W 0.581 9 Kolmogorov-Smirnov D 0.085 92 Pr>D >0.150 0 Cramer-von Mises W-Sq 0.023 7 Pr>W(wǎng)-Sq>0.250 0 Anderson-Darling A-Sq 0.208 918 Pr>A-Sq >0.250 0
統(tǒng)計結論:t=-15.770 7,P<0.000 1,故按α=0.05水準,認為給藥前后血清 TC差量的平均值與0之間的差異有統(tǒng)計學意義。
專業(yè)結論:因給藥后與給藥前的血清 TC差值的平均值-1.952 86<0,結合統(tǒng)計學結論,可認為阿托伐他汀能降低血清TC的水平。
2.2 應用 SAS軟件分析配對設計多元定量資料 在科研工作中,經(jīng)常需要同時對多個指標進行綜合分析,從而得出一個概括性的結論來。這時要用多元方差分析,如何用SAS實現(xiàn)?
例3 研究國產(chǎn)苯磺酸左氨氯地平的降壓療效及對代謝的影響,選取2002年10月到2003年3月符合1999年WHO/ISH診斷原發(fā)性高血壓標準的門診初發(fā)高血壓病人25例,男13例,女12例,年齡22~66歲[(48.4±11.5)歲],體重指數(shù)(24.3± 2.9)kg/m2。排除繼發(fā)性高血壓,糖尿病,肝、腎及其他內(nèi)分泌代謝性疾病。治療前后測定以下指標:血壓、心率、空腹血糖(FPG)及空腹胰島素(FPI)、三酰甘油、總膽固醇、高密度脂蛋白膽固醇、低密度脂蛋白膽固醇、尿素、肌酐、尿酸、膽紅素、丙氨酸氨基轉移酶等[5]。此例中僅拿血壓的收縮壓與舒張壓兩個定量指標示例配對設計多元定量資料方差分析的SAS實現(xiàn),數(shù)據(jù)見表2。試問國產(chǎn)苯磺酸左氨氯地平對降低血壓是否有療效?
對問題的分析與SAS實現(xiàn) 此例測量的指標為兩個定量指標,只有一組受試對象,同一指標下測得的兩個數(shù)值來自于同一個體的兩個時間點,屬于配對設計二元定量資料,采用二元方差分析。實現(xiàn)此分析的SAS程序如下。
程序說明:程序中第1步是數(shù)據(jù)步,“d1”和“d2”分別代表兩個指標治療前后數(shù)值的差值;第2步是過程步,調(diào)用MEANS(均值)過程計算“x1、 x2、y1、y2、d1、d2”統(tǒng)計量的數(shù)值;第3步是二元方差分析過程步,調(diào)用 GLM過程(一般線性模型過程)對“d1”和“d2”進行二元方差分析,“ss3”表示應用GLM過程中第3種算法,此過程中“manova H= intercept”語句是進行多元方差分析,即檢驗總體中兩定量指標的均值向量是否為(0,0)′。
表2 苯磺酸左氨氯地平治療前后舒張壓與收縮壓的指標值aTable 2 Values of diastolic pressure and systolic pressure before and after the treatment with levamlodipine benzenesulfonate (ρ/mm Hg)
data b; /*第1步*/ input x1 x2 y1 y2@@; d1=x2-x1;d2=y2-y1; cards; 143 122 101 70 149 124 96 91 143 128 85 94 143 120 92 75 144 119 100 82 160 119 97 75 111 110 106 74 137 123 93 80 153 115 100 85 141 108 106 89 127 115 100 82 137 114 94 81 148 133 104 65 156 127 106 90 147 135 95 72 157 133 104 75 131 127 100 76 132 106 98 81 144 124 94 76 158 119 86 81 151 142 93 89 164 132 100 73 141 115 103 87 142 135 86 79 137 114 100 82 ; run; ods html; proc means; /*第2步*/ var x1 x2 y1 y2 d1 d2; run; proc glm; /*第3步*/ model d1 d2=/ss3; manova H=intercept; run; ods html close;
SAS輸出結果及結果解釋:
這部分給出了4個原變量(x1、x2、y1、y2)和兩個新變量(d1、d2)所對應的樣本含量、平均值、標準差、最小值和最大值。
均值過程變量 N 均值 標準偏差 最小值 最大值x1 25 143.84 11.560 28 111 164 x2 25 122.36 9.295 519 106 142 y1 25 97.56 6.144 645 85 106 y2 25 80.16 7.215 031 65 94 d1 25 -21.48 10.708 719 2 -41 -1 d2 25 -17.4 10.267 261 9 -39 9
一般線性模型分析過程
這部分給出了分別對 d1、d2兩個變量所做的分析結果,為配對設計一元定量資料的方差分析,等價于配對設計一元定量資料的t檢驗。對 d1做分析的結果 F=100.59、P<0.000 1,說明 d1的平均值與0之間的差異有統(tǒng)計學意義。同樣對 d2作分析的結果 F=71.8、P<0.000 1,說明 d2的平均值與0之間的差異有統(tǒng)計學意義。
多元方差分析結果
這部分給出了配對設計定量資料二元方差分析結果,同時考慮兩項指標,采用了4種統(tǒng)計分析方法,通常只看第1種。Wilks’λ=0.113 82,對應的F=89.53,分子和分母自由度分別為2和23,對應的 P<0.000 1,說明就兩個指標整體而言,服藥前后的差異有統(tǒng)計學意義。
統(tǒng)計結論:針對兩個指標整體而言,服用苯磺酸左氨氯地平治療前后血壓值差異有統(tǒng)計學意義(Wilks’λ=0.113 82、F=89.53、P<0.000 1)。對于反映血壓的兩個指標“舒張壓”和“收縮壓”,服藥前后的數(shù)值差異有統(tǒng)計學意義(F=100.59、P<0.000 1;F=71.8、P<0.000 1)。
專業(yè)結論:服藥前收縮壓平均值為143.84,服藥后為122.36;服藥前舒張壓平均值為97.56,服藥后為80.16;另外,收縮壓和舒張壓服藥前后的差值的均值分別為-21.48和-17.4。因此綜合考慮兩項指標,國產(chǎn)苯磺酸左氨氯地平對于降壓是有效果的。
[1] 陳 凌,秦永文,鄭 興.阿托伐他汀治療異常脂蛋白血癥的臨床效果[J].藥學服務與研究,2002,2(4):224-226.
Chen Ling,Qin YongWen,Zheng Xing.Effects of atorvastatin on lipid profile modification in patients with dyslipoproteinemia [J].Pharm Care Res,2002,2(4):224-226.Chinese with abstract in English.
[2] 胡良平.醫(yī)學統(tǒng)計學:運用三型理論分析定量與定性資料[M].北京:人民軍醫(yī)出版社,2009:49.
Hu LiangPing.Medical statistics-analysis of quantitative and qualitative data with triple-type theory[M].Beijing:People’s Military Medical Press,2009:49.Chinese.
[3] 方積乾.醫(yī)學統(tǒng)計學與電腦實驗[M].上海:上??茖W技術出版社,2001:75.
Fang JiQian.Medical statistics and computer experiments [M].Shanghai:Shanghai Science and Technology Press,2001: 75.Chinese.
[4] 王仁安.醫(yī)學實驗設計與統(tǒng)計分析[M].北京:北京醫(yī)科大學出版社,1999:32.
Wang Ren’an.Medical experiment design and statistical analysis[M].Beijing:Peking Medical University Press,1999:32. Chinese.
[5] 劉 明,卞金陵,秦永文,等.國產(chǎn)苯磺酸左氨氯地平的降壓療效及對代謝的影響[J].藥學服務與研究,2004,4(2):145-146. Liu Ming,Bian JinLing,Qin YongWen,et al.Effects of levamlodipine benzenesulfonate on blood pressure and metabolism in patients with hypertension[J].Pharm Care Res,2004,4(2): 145-146.Chinese with abstract in English.