復(fù)旦大學(xué)公共衛(wèi)生學(xué)院 公共衛(wèi)生安全教育部重點(diǎn)實(shí)驗(yàn)室(200032) 牟喆 林燧恒
整群干預(yù)試驗(yàn)(cluster randomized intervention trial)應(yīng)用在很多評(píng)估干預(yù)效果的試驗(yàn)中。它不同于隨機(jī)干預(yù)試驗(yàn)隨機(jī)分配個(gè)體到干預(yù)組和對(duì)照組,而是隨機(jī)分配群到干預(yù)組和對(duì)照組。如:評(píng)估青少年中吸煙干預(yù)措施、教育領(lǐng)域中新教材的應(yīng)用、社區(qū)健康干預(yù)等。但由于群內(nèi)個(gè)體的相關(guān)性(intra-class correlation ICC),分析時(shí)需考慮個(gè)體的非獨(dú)立性〔1,2〕。
對(duì)整群干預(yù)試驗(yàn)效應(yīng)的估計(jì)有很多方法〔3〕,但近年來不少研究都采用混合效應(yīng)模型(mixed effects model)。一般來說,混合模型中參數(shù)的估計(jì)以似然估計(jì)(ML)或限制似然估計(jì)(REML)為主。而對(duì)于干預(yù)效應(yīng)的推斷,可以用Wald卡方檢驗(yàn),或以此為基礎(chǔ)的近似t檢驗(yàn)。本文目的在于以Monte Carlo模擬評(píng)估樣本量和內(nèi)部相關(guān)系數(shù)對(duì)整群干預(yù)試驗(yàn)中干預(yù)效應(yīng)的推斷的影響。干預(yù)效應(yīng)的推斷通過SAS PROC MIXED的Wald卡方檢驗(yàn)和兩種不同自由度的t檢驗(yàn)。本文對(duì)正態(tài)結(jié)局變量的線性混合效應(yīng)模型的干預(yù)效應(yīng)進(jìn)行假設(shè)檢驗(yàn)和區(qū)間估計(jì)。
模 型
考慮下面不含協(xié)變量的簡(jiǎn)單的混合效應(yīng)模型:
對(duì)于干預(yù)效應(yīng)β1的推斷,SAS PROC MIXED提供以下統(tǒng)計(jì)量〔9〕:
(2)t統(tǒng)計(jì)量:在SAS PROC MIXED中的t檢驗(yàn)有多種自由度的選擇。本文比較containment方法和群方法的 m-2為自由度。Containment是當(dāng) PROC MIXED有隨機(jī)效應(yīng)時(shí),默認(rèn)的自由度計(jì)算方法;而m-2則是以群為單位的兩組t檢驗(yàn)的自由度。
模擬一:通過模型(2)利用卡方檢驗(yàn),確定樣本量對(duì)干預(yù)效應(yīng)檢驗(yàn)的影響。設(shè)計(jì)整群干預(yù)試驗(yàn)時(shí),選擇適當(dāng)?shù)娜簲?shù)和群內(nèi)數(shù),提高檢驗(yàn)精度。
模擬二:群數(shù)m,群內(nèi)數(shù)n,及內(nèi)部相關(guān)系數(shù)ρ對(duì)干預(yù)效應(yīng)推斷結(jié)果的影響。以及卡方檢驗(yàn)和兩種不同自由度對(duì)干預(yù)效應(yīng)推斷的比較,為使95%可信區(qū)間的覆蓋率的精度達(dá)到大約0.01,利用SAS 9.1.3對(duì)每個(gè)參數(shù)組合進(jìn)行獨(dú)立模擬2000次。
結(jié)果解釋參數(shù):
第一類錯(cuò)誤:在無效假設(shè)β1=0時(shí),2000次模擬中P值<0.05所占的比例。
可信區(qū)間覆蓋率:β1=1時(shí),2000次模擬中,干預(yù)效應(yīng)估計(jì)值的可信區(qū)間包含真實(shí)值所占的比例。
模擬步驟:
(1)模型(2)中令β1=0,求解第一類錯(cuò)誤,在模型(2)中,利用β1=1,求解可信區(qū)間覆蓋率,并假設(shè)1。
(2)產(chǎn)生獨(dú)立二分類變量Xj(0或1,j=1,2…,m),0代表對(duì)照組,1代表干預(yù)組,使得干預(yù)組和對(duì)照組群數(shù)相同(滿足均衡設(shè)計(jì)的試驗(yàn)條件)〔7〕。
(3)產(chǎn)生滿足 Xi,m,n 和 N(0)條件下的yij。
(4)模擬結(jié)果進(jìn)行分析,模擬一:利用卡方檢驗(yàn)。模擬二:t檢驗(yàn),自由度分別為containment和m-2兩種方法。
模擬參數(shù)取值:m總?cè)簲?shù),n為每群內(nèi)個(gè)體數(shù),ρ為內(nèi)部相關(guān)系數(shù),模擬6×7×6的析因設(shè)計(jì)。
其中 m(6,10,20,30,50,80),n(3,10,15,25,50,100,300),ρ(0.005,0.01,0.02,0.1,0.2,0.5)。
模擬中有些參數(shù)的組合如(6,3,0.005),即總?cè)簲?shù)m為6(干預(yù)組、對(duì)照組分別有3個(gè)群),群內(nèi)個(gè)體為3,內(nèi)部相關(guān)系數(shù)為0.005,這樣的組合可能不現(xiàn)實(shí),但為考慮結(jié)果的廣義性,都納入模擬組合中。
模擬一:根據(jù)卡方檢驗(yàn)得到的干預(yù)效應(yīng)推斷的第一類錯(cuò)誤和可信區(qū)間覆蓋率隨參數(shù)的變化,得到試驗(yàn)設(shè)計(jì)時(shí)恰當(dāng)?shù)臉颖玖?,從而使干預(yù)效應(yīng)推斷更加可靠。分別對(duì)每種參數(shù)組合做趨勢(shì)圖,由于篇幅有限,選擇部分為參考。
圖1 m=6時(shí),對(duì)每個(gè)固定的群內(nèi)數(shù)n,第一類錯(cuò)誤隨著ρ的變化圖
第一類錯(cuò)誤:卡方檢驗(yàn)得到的干預(yù)效應(yīng)推斷的第一類錯(cuò)誤,一般都大于0.05,且會(huì)隨著內(nèi)部相關(guān)系數(shù)ρ的增加而增加。群內(nèi)數(shù)n對(duì)第一類錯(cuò)誤的影響不大,群數(shù)m對(duì)結(jié)果的影響最大,隨著m的增加第一類錯(cuò)誤會(huì)減小,特別當(dāng)總?cè)簲?shù)m>40后(即干預(yù)組和對(duì)照組內(nèi)群數(shù)分別大于20),無論其他兩個(gè)因素為何值,第一類錯(cuò)誤都比較小,從大于0.05的方向接近0.05。因此整群干預(yù)試驗(yàn)設(shè)計(jì)中,為保證干預(yù)效應(yīng)推斷的準(zhǔn)確性,總?cè)簲?shù)m應(yīng)比較大(m>40)。
圖2 m=50時(shí),對(duì)每個(gè)固定的群內(nèi)數(shù)n,第一類錯(cuò)誤隨著ρ的變化圖
圖3 m=10時(shí),對(duì)每個(gè)固定的群內(nèi)數(shù)n,coverage隨著ρ的變化圖
圖4 m=80時(shí),對(duì)每個(gè)固定的群數(shù)n,coverage隨著ρ的變化圖
可信區(qū)間覆蓋率:卡方檢驗(yàn)的干預(yù)效應(yīng)推斷的可信區(qū)間覆蓋率,一般都是小于95%,群數(shù)m,群內(nèi)數(shù)n和內(nèi)部相關(guān)系數(shù)對(duì)覆蓋率都有一定的影響,隨著內(nèi)部相關(guān)系數(shù)ρ的增加,覆蓋率逐漸降低,但當(dāng)群數(shù)m增加時(shí)(特別當(dāng)m>40時(shí)),覆蓋率的情況有所改善,如圖3的覆蓋率最小值在88%左右,圖4最小值在93%左右。群內(nèi)數(shù)n對(duì)覆蓋率影響較小。當(dāng)內(nèi)部相關(guān)系數(shù)小于0.1時(shí),增大群內(nèi)數(shù)n,會(huì)使覆蓋率降低。但m>40后,無論n和ρ為何值,覆蓋率從小于95%的方向接近95%。
模擬二:卡方檢驗(yàn)、t檢驗(yàn)中群自由度法和containment自由度法的比較:首先把2000次模擬試驗(yàn)的前1000次和后1000次分別求覆蓋率和第一類錯(cuò)誤,得到在相同組合下的重復(fù)觀察值,由glm求得:m,n和ρ的F值較大,交互項(xiàng)中m×ρ的F值較大。t檢驗(yàn)的兩不同自由度對(duì)覆蓋率和第一類錯(cuò)誤的影響隨參數(shù)變化趨勢(shì)同卡方檢驗(yàn)相似,但是取值不同,分別看三種方法的變化趨勢(shì),和相比較的變化趨勢(shì)。
第一類錯(cuò)誤:卡方檢驗(yàn)和containment方法的第一類錯(cuò)誤相差不多。當(dāng)群數(shù)小于50時(shí),群自由度法的第一類錯(cuò)誤優(yōu)于卡方檢驗(yàn)和containment法,但隨著群數(shù)的增加,特別當(dāng)m>50后,無論內(nèi)部相關(guān)系數(shù)為何值,三種推斷方法得到的第一類錯(cuò)誤差不多。
可信區(qū)間覆蓋率:卡方檢驗(yàn)和containment法的可信區(qū)間覆蓋率幾乎差不多。當(dāng)群數(shù)小于50時(shí),群自由度法的覆蓋率高于containment法和卡方檢驗(yàn),但當(dāng)群數(shù)大于50后,三種方法的可信區(qū)間覆蓋率結(jié)果相差不到0.01。
綜上所述:為使干預(yù)效應(yīng)推斷的精度提高,試驗(yàn)設(shè)計(jì)時(shí)每組群數(shù)應(yīng)大于20。同時(shí),Mixed model中對(duì)干預(yù)效應(yīng)推斷的三種方法,對(duì)可信區(qū)間覆蓋率和第一類錯(cuò)誤受參數(shù)的影響趨勢(shì)大體相同,相比較而言:卡方檢驗(yàn)和containment結(jié)果相近。群自由度法優(yōu)于卡方檢驗(yàn)和containment自由度法,但當(dāng)群數(shù)大于50后,無論內(nèi)部相關(guān)系數(shù)多大,三種方法結(jié)果差不多。
為提高整群干預(yù)試驗(yàn)干預(yù)效應(yīng)推斷的精度。本文從設(shè)計(jì)和分析兩方面考慮群數(shù)、群內(nèi)數(shù)、內(nèi)部相關(guān)系數(shù)對(duì)干預(yù)效應(yīng)推斷的影響。首先應(yīng)用自由度為1的Wald卡方檢驗(yàn),得出群數(shù)m對(duì)覆蓋率和第一類錯(cuò)誤影響較大,其次為內(nèi)部相關(guān)系數(shù),但隨著群數(shù)的增加,可以加大覆蓋率并減少第一類錯(cuò)誤,特別當(dāng)m>40,干預(yù)效應(yīng)推斷的結(jié)果較為可靠。因此,整群干預(yù)試驗(yàn)設(shè)計(jì)時(shí),每組群數(shù)最好大于20。其次:分析中由于Wald卡方檢驗(yàn)的局限性,提出近似t分布。t分布分母自由度應(yīng)用SAS MIXED中群自由度法(m-2),和使用random語句默認(rèn)的containment方法。文獻(xiàn)〔9〕中給出了群方法的第一類錯(cuò)誤比較接近0.05,本文通過更廣義的選擇參數(shù)(使結(jié)果具有普遍性),進(jìn)一步探討三種方法,當(dāng)每組群數(shù)小于25時(shí),群自由度法優(yōu)于containment法和卡方檢驗(yàn)。但當(dāng)每組群數(shù)大于25后,無論內(nèi)部相關(guān)系數(shù)為多大,三方法結(jié)果相差不多。SAS PROC MIXED過程中應(yīng)慎重選擇干預(yù)效應(yīng)的推斷方法,建議應(yīng)用群自由度(m-2)的近似t檢驗(yàn)法。本研究只考慮均衡的試驗(yàn)設(shè)計(jì),不均衡的情況更加貼近實(shí)際〔8〕,有待在以后的工作中加以完善。
1.Moerbeek M,Breukelen GJP,Berger MPF.Design issues for experiments in multilevel populations.Journal of Educational and Behavioral Statistics,2000,25:271-284.
2.Donner A.Some aspects of design and analysis of clustered randomized trials.Stat,1998,47:95-113.
3.Moerbeek M,Van Breukelen GJP,Berger MPF.A comparison between traditional methods and multilevel regression for the analysis of multicenter intervention studies.Journal of Clinical Epidemiology,2003,56:341-50.
4.Breukelen GJP,Candel MJJM,Berger MPF.Relative efficiency of unequal versus equal cluster sizes in cluster randomized and multicentre trials.Statistics in Medicine,2007,26:2589-603.
5.Ankenman BE,Aviles AI,Pinheiro JC.Optimal designs for mixed-effects models with two random nested factors.Statistica Sinica,2003,13:385-401.
6.Littel RC,Milliken GA,Stroup WW.SAS for mixed models,Second E-dition.2006,SAS Institute Inc.Cary,NC,USA
7.Heo M,Leon AC.Comparison of statistical methods for analysis of clustered binary observations.Stat Med,2005,24:911-923.
8.Lydia G,Philippe R,et al.Planning a cluster randomized trial with unequal cluster sizes:practical issues involving continuous outcomes.BMC,2006,6:17.
9.Mount J.Small sample inference for the mixed effects in the mixed linear model.Computational Statistics & Data Analysis,2004,46:801-817.