南京醫(yī)科大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)教研室(210029) 王冠融 邵 方 劉麗亞 陳 峰 柏建嶺 于 浩
II/III期無(wú)縫設(shè)計(jì)二分類變量效應(yīng)的估計(jì)*
南京醫(yī)科大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)教研室(210029) 王冠融 邵 方 劉麗亞 陳 峰 柏建嶺 于 浩△
目的針對(duì)二分類結(jié)果變量,探索II/III期無(wú)縫設(shè)計(jì)的效應(yīng)估計(jì)。方法期中分析選擇療效最優(yōu)的一個(gè)試驗(yàn)組進(jìn)入二階段,考慮早期無(wú)效終止,研究試驗(yàn)進(jìn)入二階段條件下的療效無(wú)偏估計(jì)。本文基于二分類資料推導(dǎo)出療效的一致最小方差無(wú)偏估計(jì)法,并比較該法與極大似然估計(jì)法及二階段估計(jì)法的偏性和均方誤差。結(jié)果就偏性而言,二階段估計(jì)法最小,極大似然估計(jì)法最大,一致最小方差無(wú)偏估計(jì)法稍高于二階段估計(jì)法;就均方誤差而言,極大似然估計(jì)法最小,二階段估計(jì)法最大,一致最小方差無(wú)偏估計(jì)法稍高于極大似然估計(jì)法。結(jié)論針對(duì)二分類資料,一致最小方差無(wú)偏估計(jì)法的偏性及均方誤差相對(duì)較小,在可接受范圍內(nèi),故推薦該法作為二分類資料無(wú)縫設(shè)計(jì)的效應(yīng)估計(jì)方法。
II/III期無(wú)縫設(shè)計(jì) 二分類資料 效應(yīng)估計(jì) 一致最小方差無(wú)偏估計(jì)法
近幾年,由于II/III期無(wú)縫設(shè)計(jì)可以節(jié)約研發(fā)時(shí)間和成本而被大家廣泛關(guān)注[1-2]。無(wú)縫設(shè)計(jì)根據(jù)一階段的結(jié)果指導(dǎo)期中分析決策,判定試驗(yàn)是否進(jìn)入下一個(gè)階段,若試驗(yàn)可以繼續(xù),則篩選出最有前途的試驗(yàn)組(或劑量組),與對(duì)照組一起進(jìn)入二階段,試驗(yàn)完成后進(jìn)行最后分析[3]。II/III期無(wú)縫設(shè)計(jì)在確證性分析時(shí)也利用了探索階段的數(shù)據(jù),因此它是一種高效率的設(shè)計(jì),但同時(shí)也給統(tǒng)計(jì)推斷帶來(lái)許多挑戰(zhàn)[4]。目前,人們關(guān)注較多的是如何進(jìn)行有效的組別篩選,并控制好整個(gè)試驗(yàn)的I類錯(cuò)誤,對(duì)點(diǎn)估計(jì)這一統(tǒng)計(jì)學(xué)性質(zhì)關(guān)注較少。本研究關(guān)注于如何綜合兩階段的數(shù)據(jù)對(duì)藥物療效進(jìn)行無(wú)偏估計(jì)。
由于期中分析一般選擇估計(jì)療效最好的處理組進(jìn)入下一階段研究,因此無(wú)縫設(shè)計(jì)的效應(yīng)估計(jì)結(jié)果往往會(huì)超過(guò)實(shí)際的效應(yīng)值。目前,Cohen等[5]對(duì)無(wú)縫設(shè)計(jì)效應(yīng)估計(jì)進(jìn)行研究,并提出一致最小方差條件無(wú)偏估計(jì)方法。Peter等[2]與Bowden等[6]學(xué)者對(duì)上述方法針對(duì)定量結(jié)果變量進(jìn)行了更深層次的研究。本文針對(duì)二分類資料,推導(dǎo)出一致最小方差無(wú)偏估計(jì)的公式,并與其他方法進(jìn)行比較。
根據(jù)觀察到的兩個(gè)階段的數(shù)據(jù)估計(jì)藥物療效。假定期中分析時(shí)選擇療效最優(yōu)組進(jìn)入下一階段研究,考慮早期無(wú)效終止的情形。以有效率為終點(diǎn)指標(biāo),本文考慮一階段試驗(yàn)組數(shù)為k(≥2)個(gè),對(duì)照組數(shù)為1個(gè),并假設(shè)同一階段每組樣本量相同,第一階段樣本量記為nI,第二階段樣本量記為nII。假定第i(i=0,1,…,k)組有效人數(shù)服從B(ni,πi),i=0表示對(duì)照組。一階段樣本有效率記為pIi。將選擇出的試驗(yàn)組記為S(S∈{1,…,k}),S與對(duì)照組同時(shí)進(jìn)入二階段,二階段各組有效人數(shù)服從B(nII,πi)。根據(jù)二階段樣本得到的有效率記為pIIi。提前終止試驗(yàn)標(biāo)準(zhǔn)為:一階段結(jié)束時(shí)若pIS-pI0≤b0,則試驗(yàn)無(wú)效終止,這里b0稱作無(wú)效界值。本研究的目的是試驗(yàn)結(jié)束后對(duì)兩組真實(shí)有效率差Δs=πs-π0進(jìn)行估計(jì)。
1.極大似然估計(jì)法(maximum likelihood,MLE)
我們將nI/(nI+nII)記作期中分析信息時(shí)間t,試驗(yàn)完成后根據(jù)樣本得到對(duì)照組的有效率為p0,MLE=tpI0+(1-t)pII0,篩選組有效率為ps,MLE=tpIS+(1-t)pIIS,此時(shí)利用篩選組與對(duì)照組的極大似然估計(jì),可以得到兩組的率差估計(jì)公式如下:
由于選擇療效估計(jì)最大的試驗(yàn)組進(jìn)入下一階段研究,故這種估計(jì)方法往往會(huì)高估療效。
2.二階段估計(jì)法(stage 2 estimator)
若療效估計(jì)以試驗(yàn)繼續(xù)進(jìn)入二階段為條件,那么pII0和pIIS就是π0和πS的無(wú)偏估計(jì),此時(shí)兩組率差為
公式(2)是Δs的無(wú)偏估計(jì),稱作二階段估計(jì)方法。此法雖然無(wú)偏,但是只利用了二階段的數(shù)據(jù),因此不夠穩(wěn)定。
3.一致最小方差無(wú)偏估計(jì)法(uniform ly minimum variance unbiased estimation,UMVUE)
本文基于Rao-Blackwell定理,推導(dǎo)出基于二分類資料的一致最小方差無(wú)偏估計(jì)(UMVUE)方法。Rao-Blackwell定理是以一個(gè)無(wú)偏估計(jì)為起點(diǎn),尋找其最小方差無(wú)偏估計(jì)量。無(wú)論真實(shí)參數(shù)值是多少,最小方差無(wú)偏估計(jì)都比其他無(wú)偏估計(jì)有更小或至多相等的方差。由上述可知,pIIS是πS的無(wú)偏估計(jì),根據(jù)Rao-Blackwell定理,pIIS的條件期望就是πS的最小方差無(wú)偏估計(jì)。同理,pII0的條件期望就是π0的無(wú)偏估計(jì)。一階段結(jié)束后對(duì)各試驗(yàn)組療效排序,記為pI(1)>pI(2)>…>pI(k),其中pIS=pII(1)。對(duì)于篩選組,用pS,MVE表示療效的一致最小方差無(wú)偏估計(jì),根據(jù)推導(dǎo),得到的公式如下:
用p0,MVE表示對(duì)照組的療效一致最小方差無(wú)偏估計(jì),根據(jù)推導(dǎo),得到的公式如下:
其中,z1=nIpIS+nIIpIIS,z0=nIpI0+nIIpII0,B=b0+pI0。由于pS,MVE,p0,MVE分別是πS和π0的無(wú)偏估計(jì),那么ΔS的無(wú)偏估計(jì)為
根據(jù)Stallard和Todd[7]的研究,極大似然估計(jì)法的偏性取決于處理組數(shù)k,期中分析時(shí)間點(diǎn)t,無(wú)效界值b0,篩選組與對(duì)照組的真實(shí)率差ΔS。故本文考察以下幾種參數(shù)設(shè)置對(duì)偏性(bias)和均方誤差(rootmean square error,RMSE)的影響。具體參數(shù)設(shè)置見表1、2。
表1 模擬試驗(yàn)參數(shù)含義
表2 模擬試驗(yàn)設(shè)置的基本情況
在上述參數(shù)設(shè)置下,每一次模擬中,根據(jù)公式(1)、(2)、(5)計(jì)算分別得到極大似然估計(jì)法、二階段估計(jì)法、一致最小方差無(wú)偏估計(jì)法療效差別的效應(yīng)估計(jì)。若將估計(jì)值統(tǒng)一用dS,est表示,則偏性為Bias=(dS,est-Δs),對(duì)10000次模擬求平均即得到平均偏性;均方誤差為
1.模擬A
此種模擬情境設(shè)定試驗(yàn)中有兩個(gè)試驗(yàn)組和一個(gè)對(duì)照組,兩個(gè)試驗(yàn)組的效應(yīng)相同且都為0.2,即Δ1=Δ2=0.1。模擬結(jié)果見圖1、2。
圖1 四種無(wú)效界值下3種估計(jì)方法的偏性,k=2,Δ1=Δ2=0.1
從圖1中可以看出,極大似然估計(jì)法是偏性的,且隨著期中分析信息時(shí)間t后移而增加,也隨著無(wú)效界值b0的增加而增加;二階段估計(jì)法一直都是無(wú)偏的,不隨t和b0的增加而改變;UMVUE法的偏性在b0較小時(shí)控制的很好,幾乎可以忽略不計(jì)。隨著b0增大,UMVUE法的偏性增加,但仍遠(yuǎn)遠(yuǎn)低于極大似然法的偏性。從圖2前三幅圖中可以發(fā)現(xiàn),極大似然估計(jì)法的RMSE最??;二階段估計(jì)法的RMSE最大;UMVUE法的RMSE稍高于極大似然法。但當(dāng)b0=0.15時(shí),極大似然估計(jì)法的RMSE明顯增加,二階段估計(jì)法的RMSE依然很大,此時(shí)UMVUE法的RMSE最小。這說(shuō)明極大似然估計(jì)法的RMSE容易受無(wú)效界值b0的影響,而UMVUE法相對(duì)穩(wěn)定很多。
圖2 四種無(wú)效界值下3種估計(jì)方法的RMSE,k=2,Δ1=Δ2=0.1
我們?cè)诒3稚鲜鏊膫€(gè)無(wú)效界值b0下,改變?chǔ)?=Δ2=0.2,Δ1=Δ2=0.3,Δ1=Δ2=0.6,結(jié)論同前,此處不再列出圖形。同時(shí)我們發(fā)現(xiàn),極大似然估計(jì)的偏性隨著Δ的增加而減少,并且當(dāng)Δ1=Δ2=0.6,四種b0取值下極大似然估計(jì)的偏性幾乎完全相同。這主要是由于每一次模擬處理組效應(yīng)都超過(guò)了無(wú)效界值,偏性主要由組別篩選產(chǎn)生,因此極大似然估計(jì)的偏性是相同的。
模擬B的結(jié)果與模擬A結(jié)果幾乎相同,p0由0.1增加至0.5時(shí),極大似然估計(jì)法的偏性和均方誤差都輕微增加(1%以內(nèi)),p0由0.5增加至0.9時(shí),極大似然估計(jì)法的偏性和均方誤差都逐漸減小,即p0=0.5,偏性和均方誤差最大。UMVUE法和二階段估計(jì)法的偏性和均方誤差幾乎不受p0的影響。
2.模擬C
此種模擬情境表示試驗(yàn)中有兩個(gè)試驗(yàn)組和一個(gè)對(duì)照組,設(shè)定兩個(gè)試驗(yàn)組的效應(yīng)不同Δ1=0,Δ2=0.1。模擬結(jié)果見圖3、4。
由圖3、圖4可知,模擬C的結(jié)論與模擬A相似,這里不再贅述。唯一的區(qū)別是,當(dāng)b0取值較小時(shí),偏性不隨著期中分析信息時(shí)間t的后移而增加,這是由于當(dāng)兩組差別不等時(shí),隨著t的增加,選錯(cuò)組別的機(jī)會(huì)減少,因此偏性減少。
圖3 四種無(wú)效界值下3種估計(jì)方法的偏性,k=2,Δ1=0,Δ2=0.1
3.模擬D
我們模擬了k取3,4,5的情形,一般結(jié)果同上,這里不再列出。圖5顯示了k對(duì)各方法的偏性和均方誤差的影響。
由圖5可見,隨著k的增加,極大似然估計(jì)法的偏性和均方誤差都輕微增加,而二階段估計(jì)法和UMVUE估計(jì)法基本不受k的影響。
實(shí)例為一項(xiàng)關(guān)于艾迪康唑乳膏治療足癬的多中心、隨機(jī)、雙盲、陽(yáng)性藥物平行對(duì)照的臨床試驗(yàn)。其研究目的是探索最佳給藥濃度,主要效應(yīng)指標(biāo)為停藥2周后真菌清除率。其中,一階段樣本量為72,二階段樣本量為120,因此期中分析信息時(shí)間t=0.375。我們只利用部分的研究數(shù)據(jù)(見表3),介紹如何使用3種效應(yīng)估計(jì)方法。
圖5 3種估計(jì)方法的偏性和均方誤差與組數(shù)k的關(guān)系,Δ1=Δ2=0.2,b0=0.2
表3 各組足癬病人停藥后2周真菌清除率
我們?cè)O(shè)定當(dāng)一階段篩選組與對(duì)照組療效差別大于0時(shí),則試驗(yàn)繼續(xù)進(jìn)入二階段,即無(wú)效界值b0=0。根據(jù)表3中的數(shù)據(jù),計(jì)算得到p0,MLE=0.8056×0.375+0.8235×0.625=81.68%,pS,MLE=0.9028×0.375+0.8914×0.625=89.57%,此時(shí)用極大似然估計(jì)效應(yīng)差別為7.89%;直接用二階段估計(jì)法得到效應(yīng)差別為6.79%;B=0+0.8056=0.8056,
因此用一致最小方差無(wú)偏估計(jì)法估計(jì)的效應(yīng)差別為7.67%。
在藥物研發(fā)過(guò)程中,縮短研發(fā)時(shí)間和降低研發(fā)成本的需求促使了適應(yīng)性無(wú)縫設(shè)計(jì)的出現(xiàn)。適應(yīng)性無(wú)縫設(shè)計(jì)將一個(gè)臨床試驗(yàn)分為幾個(gè)階段逐步實(shí)施,與傳統(tǒng)方法相比,統(tǒng)計(jì)學(xué)面臨了許多新的挑戰(zhàn)。Cohen和Sackrow itz[5]、Shen[8]針對(duì)定量資料研究了試驗(yàn)總是進(jìn)入二階段條件下效應(yīng)的無(wú)偏估計(jì),Stallard和Todd[7]在2005年也提出一種針對(duì)上述條件的無(wú)偏估計(jì)法,Peter K等人[2]對(duì)上述方法進(jìn)行擴(kuò)展,使其可用于早期無(wú)效終止的情形。本文針對(duì)二分類資料,以II/III期無(wú)縫設(shè)計(jì)為例,在期中分析時(shí)選取療效最優(yōu)的組別與對(duì)照組同時(shí)進(jìn)入第二階段,其中考慮早期無(wú)效終止,研究試驗(yàn)進(jìn)入二階段條件下的效應(yīng)估計(jì)。
本文針對(duì)有效率為終點(diǎn)指標(biāo)的情形,推導(dǎo)出試驗(yàn)效應(yīng)的一致最小方差無(wú)偏估計(jì),并評(píng)價(jià)其偏性和均方誤差。該法基于Arthur Cohen和Harold B[4]給出的聯(lián)合密度函數(shù),根據(jù)Rao-Blackwell定理推導(dǎo)而得。模擬試驗(yàn)結(jié)果表明,極大似然估計(jì)法的偏性最大,二階段估計(jì)法在任何條件下都是無(wú)偏的,一致最小方差無(wú)偏估計(jì)法的偏性稍高于二階段估計(jì)法;二階段估計(jì)法的均方誤差最大,極大似然估計(jì)法的均方誤差在無(wú)效界值較小時(shí)均方誤差最小,當(dāng)無(wú)效界值較大時(shí)極大似然估計(jì)法的均方誤差明顯增加,一致最小方差無(wú)偏估計(jì)法的均方誤差稍高于極大似然估計(jì)法,且當(dāng)無(wú)效界值較大時(shí),一致最小方差無(wú)偏估計(jì)的均方誤差最小。Arthur Cohen和Harold B[4]給出的聯(lián)合密度函數(shù)針對(duì)定量資料(正態(tài)分布),定性資料(二項(xiàng)分布)在陽(yáng)性數(shù)足夠大時(shí)近似正態(tài),在此方法的基礎(chǔ)上擴(kuò)展應(yīng)用時(shí)具有一定的偏性,與模擬試驗(yàn)結(jié)果契合。
監(jiān)管機(jī)構(gòu)要求在對(duì)療效進(jìn)行點(diǎn)估計(jì)和區(qū)間估計(jì)時(shí)必須控制好I類錯(cuò)誤[9],并強(qiáng)調(diào)需要控制點(diǎn)估計(jì)的偏性[10],綜合上述三種方法,一致最小方差無(wú)偏估計(jì)法的偏性和均方誤差均較小,在可接受范圍內(nèi),故推薦使用該法作為二分類資料無(wú)縫設(shè)計(jì)的效應(yīng)估計(jì)方法。可信區(qū)間提供效應(yīng)估計(jì)的同時(shí)也提供了假設(shè)檢驗(yàn)方面的信息,Shen在2001年提出針對(duì)二分類數(shù)據(jù)構(gòu)造II/III期無(wú)縫設(shè)計(jì)可信區(qū)間的方法[8]。而基于本研究介紹的效應(yīng)點(diǎn)估計(jì)原理構(gòu)建各試驗(yàn)組的可信區(qū)間是一個(gè)待研究的問(wèn)題。
[1]吳瑩,侯艷,李康.適應(yīng)性無(wú)縫設(shè)計(jì)在臨床試驗(yàn)中的應(yīng)用及研究進(jìn)展.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(1):140-142.
[2]Peter K,Kimani,Susan Todd,etal.Conditionally unbiased estimation in phase II/III clinical trials with early stopping for futility.Statistics in Medicine,2013,32:2893-2910.
[3]Frank B,Heinz S,F(xiàn)ranz K,et al.Confirmatory seam less phase II/III clinical trials with hypotheses selection at interim:general concepts.Biometrical Journal,2006,48(4):623-634.
[4]Shein Chung Chow,Ralph Corey.Benefits,challenges and obstacles of adaptive clinical trial designs.Orphanet Journal of Rare Diseases,2011,6:79.
[5]Arthur Cohen,Sackrow itz HB.Two stage conditionally unbiased estimators of the selected mean.Statistics&Probability Letters,1989,8:273-278.
[6]Jack Bowden,Ekkehard Glimm.Unbiased Estimation of selected treatmentmeans in two-stage trials.Biometrical Journal,2008,4:515-527.
[7]Stallard N,Todd S.Point estimates and confidence regions for sequential trials involving selection.Journal of Statistical Planning and Inference,2005,135:402-419.
[8]Shen L.Estimation follow ing selection of the largestof two normal means.Statistics in Medicine,2001,20:1913-1929.
[9]Food and Drug Adm inistration.Guidance for industry:adaptive design clinical trials for drugs and biologics@ONLINE,11 February 2013.(Available from:http://www.fda.gov/downloads/Drugs/Guidance-ComplianceRegulatory Information/Guidances/UCM 201790.pdf)
[10]Chmp,Emea.Reflection paper onmethodological issues in confirmatory clinical trials planned with an adaptive design@ONLINE,11 February 2013.(Available from:http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2009/09/WC500003616.pdf)10
(責(zé)任編輯:郭海強(qiáng))
Point Estimator in Seam less Phase II/IIIClinical Trials for Binary Data
Wang Guanrong,Shao Fang,Liu Liya,etal.(DepartmentofEpidemiology&Biostatistics,NanjingMedicalUniversity(210029),Nanjing)
ObjectiveTo explore unbiased estimation of effects in seam less phase II/IIIdesign particularly for qualitative data.MethodsWe consider pointestimation of the treatmenteffect in which stage 1 is used to select themosteffective experimental group and to decide whether the trial should stop at stage 1 futility by comparing with the control group.We have developed a new estimator for the treatment difference,and compared it with other estimators by simulations.ResultsOn the whole,for biases,stage 2 estimator is an unbiased method;themaximum likelihood estimator always over-estimates;and the bias of the UMVUE is slightly higher than the stage 2 estimator.For MSE,the stage 2 estimator performsworst,while themaximum likelihood estimator performs best,and the UMVUE performs slightly better than themaximum likelihood estimator.ConclusionBased on binary data,the bias and MSE of the UMVUE are relatively small,within the acceptable range.Therefore,we recommend it as the point estimator of the treatment effect in seam less phase II/III clinical trials.
Seam less phase II/III clinical trials;Binary data;Estimation;UMVUE
*:國(guó)家自然科學(xué)基金(81273184);國(guó)家自然科學(xué)青年基金(81302512)
△通信作者:于浩,E-mail:haoyu@njmu.edu.cn
中國(guó)衛(wèi)生統(tǒng)計(jì)2015年4期