孫亞清曹穎姝陳平雁
?
樣本量估計(jì)及其在nQuery + nTerim和SAS軟件上的實(shí)現(xiàn)群隨機(jī)試驗(yàn)(一)
孫亞清1曹穎姝2陳平雁△
1.南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系2013級(jí)碩士
2.南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系2014級(jí)碩士
群隨機(jī)試驗(yàn)(cluster randomized trial)又稱群隨機(jī)對(duì)照試驗(yàn)(cluster randomized controlled trial),是將研究對(duì)象以群為抽樣單位進(jìn)行抽樣,并以群為單位將研究對(duì)象隨機(jī)分配到不同處理組進(jìn)行干預(yù)的一種試驗(yàn)設(shè)計(jì)方法。
7.1 兩個(gè)均數(shù)的比較(差異性檢驗(yàn))
7.1.1 完全群隨機(jī)設(shè)計(jì)下兩個(gè)均數(shù)的比較
式中,ICC為群內(nèi)相關(guān)系數(shù);m為每組群的個(gè)數(shù),簡(jiǎn)稱群數(shù);n為每個(gè)群的樣本量,簡(jiǎn)稱群樣本量;|μ1-μ2|為兩個(gè)均數(shù)之差,σ為標(biāo)準(zhǔn)差。這里假定兩組群內(nèi)相關(guān)系數(shù)、群數(shù)和群樣本量都相等。以上公式基于雙側(cè)檢驗(yàn),當(dāng)采用單側(cè)檢驗(yàn)時(shí),只需將α/2替換為α。
在計(jì)算群數(shù)(群樣本量)時(shí),需給定群樣本量(群數(shù)),首先設(shè)定群數(shù)(群樣本量)的初始值,然后迭代群數(shù)(群樣本量)直到滿足設(shè)定的檢驗(yàn)效能為止。此時(shí)的群數(shù)(群樣本量),即研究所需的最小群數(shù)(群樣本量)。完全群隨機(jī)部分同時(shí)給出計(jì)算群數(shù)和群樣本量的實(shí)例,配對(duì)群隨機(jī)部分只給出計(jì)算群對(duì)子數(shù)的實(shí)例,計(jì)算群樣本量的實(shí)例可參照完全群隨機(jī)部分。
[例7-1]某試驗(yàn)欲評(píng)價(jià)某種健康教育對(duì)2型糖尿病患者的有效性。采用完全群隨機(jī)設(shè)計(jì),將社區(qū)作為群,試驗(yàn)組在社區(qū)接受6小時(shí)健康教育,對(duì)照組采用常規(guī)護(hù)理。研究的主要療效指標(biāo)是糖化血紅蛋白HbA1c的變化。假設(shè)兩組HbA1c差值為1%,標(biāo)準(zhǔn)差為2%,群內(nèi)相關(guān)系數(shù)為0.05,每個(gè)社區(qū)可招募18名患者,試估計(jì)當(dāng)檢驗(yàn)效能為90%時(shí)所需的社區(qū)個(gè)數(shù)及總樣本量[2]。
nQuery + nTerim 4.0實(shí)現(xiàn):
設(shè)定檢驗(yàn)水準(zhǔn)α=0.05,采用雙側(cè)檢驗(yàn),檢驗(yàn)效能取1-β=90%。
在nQuery + nTerim 4.0主菜單選擇:
Goal:⊙Cluster Randomized
Number of Groups:⊙Two
Analysis Method:⊙Test
方法框中選擇:CRT Two Means Completely Randomized
在彈出的樣本量估計(jì)窗口計(jì)算框中選擇:Calculate required number of clusters given power,將各參數(shù)值鍵入,結(jié)果如圖7-1所示,即每組需要10個(gè)社區(qū),每個(gè)社區(qū)隨機(jī)抽取18名2型糖尿病患者,本研究總的樣本量為360人。
圖7-1 nQuery + nTerim 4.0關(guān)于例7-1樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
SAS 9.4軟件實(shí)現(xiàn):
圖7-2 SAS 9.4關(guān)于例7-1樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
[例7-2]研究背景同例7-1。假設(shè)每組納入社區(qū)20個(gè),其余參數(shù)設(shè)置相同,試估計(jì)當(dāng)檢驗(yàn)效能為90%時(shí)每個(gè)社區(qū)所需的參與人數(shù)及總樣本量。
nQuery + nTerim 4.0實(shí)現(xiàn):
設(shè)定檢驗(yàn)水準(zhǔn)α=0.05,采用雙側(cè)檢驗(yàn),檢驗(yàn)效能取1-β=90%。
主菜單和方法框的選擇同例7-1。
在彈出的樣本量估計(jì)窗口計(jì)算框中選擇:Calculate required sample size for given power,將各參數(shù)值鍵入,結(jié)果如圖7-3所示,即每個(gè)社區(qū)需隨機(jī)抽取6名2型糖尿病患者,每組需要20個(gè)社區(qū),本研究總的樣本量為240人。
圖7-3 nQuery + nTerim 4.0關(guān)于例7-2樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
SAS 9.4軟件實(shí)現(xiàn):
圖7-4 SAS 9.4關(guān)于例7-2樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
SAS程序:
proc IML;
start CMCR(a,index,x,ICC,mdiff,sita,side,power);/ *index為指示變量,index =1表示求群數(shù),此時(shí)x需輸入群樣本量;index =2表示求群樣本量,此時(shí)x需輸入群數(shù)*/
error =0;if(a>1|a<0)|(index^=1 & index^=2)|(x <=0)|(ICC<=0|ICC>=1)|(sita<=0)
|(side^=1&side^=2)|(power>100|power<1)then error =1;
if error =1 then stop;if(side =1)then a_t =a;if(side =2)then a_t =a/2;y =1;
do until(pw>=power);y =y + 1;if(index =1)then do;N =x;m =y;end;
if(index =2)then do;m =x;N =y;end;df =2#(m-1);nc =(abs(mdiff)/ sita)/ sqrt((2#(1 + ICC#(N-1)))/ (m#N));
pw =100#(1-probt(tinv((1-a_t),df),df,nc)+ probt (-tinv((1-a_t),df),df,nc));
end;pw =round(pw,0.001);
print a[label =“a”]side[label =“1 or 2 sided test”]mdiff[label =“|μ1-μ2|”]sita[label =“σ”]
ICC[label =“ICC”]m[label =“m”]N[label =“N”]pw[label =“Power(%)”];
finish CMCR;
run CMCR(0.05,1,18,0.05,0.01,0.02,2,90);/ * 例7-1*/
run CMCR(0.05,2,20,0.05,0.01,0.02,2,90);/ * 例7-2*/ quit;
7.1.2 配對(duì)群隨機(jī)設(shè)計(jì)下兩個(gè)均數(shù)的比較
方法:Donner和Klar(2000)[3]提出的配對(duì)群隨機(jī)設(shè)計(jì)下兩個(gè)均數(shù)差異性檢驗(yàn)的樣本量估計(jì)方法建立在大樣本正態(tài)近似理論基礎(chǔ)上,其檢驗(yàn)效能的計(jì)算公式為:
式中,k為配對(duì)的群對(duì)子數(shù),簡(jiǎn)稱群對(duì)子數(shù);n為每個(gè)群的樣本量,簡(jiǎn)稱群樣本量;|μ1-μ2|為兩個(gè)均數(shù)之差,σw為群內(nèi)標(biāo)準(zhǔn)差,σB為群間標(biāo)準(zhǔn)差。以上公式基于雙側(cè)檢驗(yàn),當(dāng)采用單側(cè)檢驗(yàn)時(shí),只需將α/2替換為α。
在計(jì)算群對(duì)子數(shù)(群樣本量)時(shí),需給定群樣本量(群對(duì)子數(shù)),首先設(shè)定群對(duì)子數(shù)(群樣本量)的初始值,然后迭代群對(duì)子數(shù)(群樣本量)直到滿足設(shè)定的檢驗(yàn)效能為止。此時(shí)的群對(duì)子數(shù)(群樣本量),即研究所需的最小群對(duì)子數(shù)(群樣本量)。
[例7-3]某試驗(yàn)欲評(píng)價(jià)富含微量元素的飲品對(duì)中小學(xué)生心理健康發(fā)展的有效性。采用配對(duì)群隨機(jī)設(shè)計(jì),將班級(jí)作為群,以年齡作為配對(duì)因素對(duì)班級(jí)進(jìn)行配對(duì)。采用安慰劑對(duì)照,將配對(duì)好的兩個(gè)班級(jí)隨機(jī)分到試驗(yàn)組和對(duì)照組,試驗(yàn)組的飲品中富含微量元素,對(duì)照組的飲品沒(méi)有添加微量元素。研究的主要療效指標(biāo)是中小學(xué)生體重的變化。假設(shè)兩組體重的差值為0.9kg,群間標(biāo)準(zhǔn)差為0.31kg,群內(nèi)標(biāo)準(zhǔn)差為3.883kg,每個(gè)班級(jí)有38名學(xué)生,試估計(jì)當(dāng)檢驗(yàn)效能為80%時(shí)所需的群對(duì)子數(shù)及總樣本量[4]。
nQuery + nTerim 4.0實(shí)現(xiàn):
設(shè)定檢驗(yàn)水準(zhǔn)α=0.05,采用雙側(cè)檢驗(yàn),檢驗(yàn)效能取1-β=80%。
在nQuery + nTerim 4.0主菜單選擇:
Goal:⊙Cluster Randomized
Number of Groups:⊙Two
Analysis Method:⊙Test
方法框中選擇:CRT Two Means Matched Pairs
在彈出的樣本量估計(jì)窗口計(jì)算框中選擇:Calculate required number of matched pairs of clusters for given power and sample size,將各參數(shù)值鍵入,結(jié)果如圖7-5所示,即需要匹配8對(duì)班級(jí),每個(gè)班級(jí)需要38名學(xué)生,本研究總的樣本量為608人。
圖7-5 nQuery + nTerim 4.0關(guān)于例7-3樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
SAS 9.4軟件實(shí)現(xiàn):
圖7-6 SAS 9.4關(guān)于例7-3樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
SAS程序:
proc IML;
start CMMP(a,index,x,mdiff,sitaw,sitab,side,power);
/ *index為指示變量,index =1時(shí)表示求群對(duì)子數(shù)量,此時(shí)x需輸入群樣本量;index =2時(shí)表示求群樣本量,此時(shí)x需輸入群對(duì)子數(shù)*/
error =0;if(a>1|a<0)|(index^=1 & index^=2)|(x <=0)|(sitaw<=0)|(sitab<=0)|(side^=1 & side^=2)|(power>100 |power<1)then error =1;if error =1 then stop;
if(side =1)then a_t =a;if(side =2)then a_t =a/2;y =1;do until(pw>=power);y =y +1;
if(index =1)then do;N =x;k =y;vd =sqrt(2#(sitaw/ N + sitab));end;
if(index =2)then do;k =x;N =y;vd =sqrt(2#(sitaw/ N + sitab));end;
pw =100#CDF('NORMAL′,(abs(mdiff)#sqrt(k))/ vd-probit(1-a_t));end;pw =round(pw,0.001);
print a[label =“a”]side[label =“1 or 2 sided test”]mdiff[label =“|μ1-μ2|”]sitaw[label =“σ2w”]
sitab[label =“σ2b”]k[label =“k”]N[label =“N”]pw[label =“Power(%)”];
finish CMMP;
run CMMP(0.05,1,38,0.9,3.883,0.31,2,80);/ * 例7-3*/ quit;
(責(zé)任編輯:鄧 妍)
·方法介紹·
通信作者:△陳平雁