南京醫(yī)科大學流行病與衛(wèi)生統(tǒng)計教研室(211166) 劉麗亞 于 浩 柏建嶺 劉 晉 陳 峰
基于短期結(jié)局預測概率劑量篩選的Ⅱ/Ⅲ期無縫設計研究*
南京醫(yī)科大學流行病與衛(wèi)生統(tǒng)計教研室(211166) 劉麗亞 于 浩 柏建嶺 劉 晉 陳 峰△
目的介紹一種新的Ⅱ/Ⅲ期無縫設計期中分析策略,應用短期結(jié)局預測概率進行劑量篩選,并對其相應統(tǒng)計學性質(zhì)進行評價。方法以二分類數(shù)據(jù)為例,通過Monte Carlo模擬方法探討短期結(jié)局有效劑量組同對照組率差變化、長短期結(jié)局間不同相關關系及給定不同先驗信息對Ⅱ/Ⅲ期無縫設計I類錯誤、檢驗效能的影響。結(jié)果期中應用短期結(jié)局劑量篩選的II/III期無縫設計可以控制總的I類錯誤在檢驗水準以內(nèi),但是當相關關系很弱時結(jié)果偏保守。其檢驗效能一般低于長期結(jié)局劑量篩選結(jié)果,即期望檢驗效能,但是當短期結(jié)局有效劑量組同對照組率差增加,兩指標相關關系較強或者短期結(jié)局有較強的先驗信息時,應用短期結(jié)局劑量篩選可以大大提高檢驗效能。結(jié)論在Ⅱ/Ⅲ期無縫設計臨床試驗研究中,長期結(jié)局在短時間內(nèi)無法獲得,此時期中分析可以選用臨床公認的、有文獻支持的短期結(jié)局指導期中分析決策。
Bayes理論 Ⅱ/Ⅲ期無縫設計 短期結(jié)局 預測概率
傳統(tǒng)的新藥II期和III期臨床試驗是獨立設計、獨立實施、獨立分析的。II期結(jié)束后不能馬上啟動III期臨床試驗,導致藥物上市時間推遲。為彌補傳統(tǒng)臨床試驗設計的不足,Ⅱ/Ⅲ期無縫設計(adaptive seamless phase Ⅱ/Ⅲ design,ASD)將Ⅱ期和Ⅲ期臨床試驗統(tǒng)一設計并實施,期間沒有間隙,縮短了研發(fā)周期,充分利用資料信息,同時提高了檢驗效能。合并Ⅱ期、Ⅲ期臨床試驗的思想首次由Thall等于1988年提出[1],后經(jīng)Bauer等[2]推廣,并有研究結(jié)果表明[3-4]采用合適的統(tǒng)計分析方法可以控制無縫設計Ⅰ類錯誤膨脹問題。無縫設計期中分析無法避免長期結(jié)局短時間內(nèi)無法獲得,那么以此作為期中分析劑量篩選指標勢必導致整個研發(fā)周期過長[5]。本設計的特色之處在于考慮應用短期結(jié)局代替長期結(jié)局指導期中分析決策,從而達到縮短研發(fā)周期節(jié)約研發(fā)成本的目的。本文還將貝葉斯(Bayes)思想應用于替代指標劑量選擇的Ⅱ/Ⅲ期無縫設計中,以提高試驗的把握度。臨床試驗應用貝葉斯思想最早可追溯于二十世紀六十年代[6],Berry等于2001年應用貝葉斯思想決策Ⅱ期臨床試驗是否進入Ⅲ期臨床試驗研究[7]。本文應用混合貝葉斯/頻率方法,已有研究表明該法可以控制無縫設計Ⅰ類錯誤膨脹[8]。
1.Ⅱ/Ⅲ期無縫設計方法介紹
假設無縫設計探索階段(stageⅠ)有i個劑量組,對應i個無效假設Hi:θi=θ0,θi表示試驗組療效,θ0表示對照組療效。期中分析i個劑量組分別與對照組進行比較,規(guī)定最優(yōu)劑量組i’同對照組進入確證階段(stageⅡ)。
探索階段期中分析涉及多劑量組多重比較,為控制總的I類錯誤膨脹一般采用封閉原則[9]。封閉原則指的是將全局原假設劃分H1=∩i∈IHi個交集假設,拒絕Hi則需拒絕Hi所有交集假設,如三個劑量組分別同對照組比較,對應三個無效假設H1、H2、H3,要拒絕H2假設則需拒絕H12、H23、H123交集假設及H2假設。
驗證階段結(jié)束后進行最終分析,分別估計兩階段(探索階段、驗證階段)不同原假設下的統(tǒng)計量pi,j(j=1、2,表示j階段第i個原假設對應的p統(tǒng)計量)。為控制多階段假設檢驗Ⅰ類錯誤膨脹將兩階段統(tǒng)計量合并,常見合并方法有兩種:Fisher’s合并[10]和加權逆正態(tài)合并[11]。本文采用Fisher’s原則,首先根據(jù)公式C(pi,1,pi,2)=pi,1×pi,2計算合并統(tǒng)計量,再根據(jù)試驗前設定的檢驗水準α=0.05,估計校正后的檢驗水準0087則拒絕Hi。
綜上所述,無縫設計為避免多重檢驗I類錯誤膨脹,將封閉原則及合并統(tǒng)計量方法進行了合并。根據(jù)封閉原則,拒絕Hi要拒絕Hi所有交集假設,即在確證階段估計的Hi所有交集假設的合并統(tǒng)計量都要小于或等于檢驗水準。值得注意的是,在應用合并方法控制Ⅰ類錯誤膨脹時,要求不同階段p統(tǒng)計量滿足pclud[12]原則,即在Hi假設成立前提下,pi,1及給定pi,1條件下pi,2均服從均勻分布,并且相互獨立。無縫設計應用短期結(jié)局代替長期結(jié)局指導期中分析決策,而最終分析仍基于長期結(jié)局,此時兩階段統(tǒng)計量不滿足p-clud原則,因此無法直接估計合并統(tǒng)計量。針這一問題,本文采用Jenkins等[13]和Friede等[14]于2011年提出的一種新的合并兩階段統(tǒng)計量的方法。如圖1,探索階段入組N1名受試者,短時期內(nèi)無法估計基于長期結(jié)局的pi,1統(tǒng)計量,要求期中分析后繼續(xù)對一階段受試者進行長期隨訪。確證階段,納入N2名新的受試者基于長期結(jié)局估計pi,2統(tǒng)計量。在Hi假設成立前提下pi,1~uniform(0,1),確證階段與探索階段受試人群相互獨立,在pi,1條件下估計pi,2統(tǒng)計量也服從均勻分布,兩階段統(tǒng)計量相互獨立,此時滿足p-clud原則。
圖1 試驗設計示意圖
2.應用貝葉斯預測概率(predictive power,PP)劑量選擇
Ⅱ/Ⅲ期無縫設計期中分析劑量篩選方法可以分為兩類[15]:一類為基于頻率學派的條件把握度法;另一類為基于Bayes理論的預測概率法,兩者區(qū)別在于后者考慮了先驗信息。本文應用Bayes理論估計預測概率指導期中分析決策,包括最優(yōu)劑量組選擇及確證階段樣本量校正,沒有考慮早期有效或無效終止臨床試驗。預測概率估計公式,
其中CP(θ)為根據(jù)樣本數(shù)據(jù)估計的條件把握度[16],p(θ|interm data)為θ的后驗分布,
p(θ)表示給定參數(shù)θ的先驗分布,p(interm data|θ)為給定θ條件下的似然函數(shù)。
估計預測概率分為三個步驟:
(1)估計條件把握度,
其中pi,1、δi、σi可根據(jù)探索階段數(shù)據(jù)估計,N2為驗證階段總樣本量。假設采用Fisher’s原則合并兩階段統(tǒng)計量將這些統(tǒng)計量均代入公式(3)即可估計條件把握度。
(2)估計參數(shù)θ的后驗分布
假設待估計參數(shù)θ為事件發(fā)生率,共軛先驗分布為Beta分布,pE(d)~Beta(α,β),根據(jù)樣本信息可得后驗分布p(θ|interm data)~Beta(α+xi,β+ni-xi),ni表示探索階段每組樣本量,xi表示陽性事件發(fā)生數(shù)。
(3)估計預測概率
估計預測概率方法包括兩種:一種是將條件把握度及θ后驗分布代入公式(1)可估計預測概率;第二種是通過Monte-Carlo模擬,從θ后驗分布隨機抽取m個θ后驗樣本,將每個θ帶入公式(3)估計不同θ下對應的條件把握度,計算其平均數(shù)即為預測概率。
考慮有效劑量組短期結(jié)局事件發(fā)生率的變化,長短期結(jié)局間不同相關關系、短期結(jié)局不同先驗信息,采用Monte Carlo模擬評價期中分析應用短期結(jié)局劑量篩選對無縫設計I類錯誤及檢驗效能的影響。模擬試驗假定探索階段包括3個劑量組和1個對照組,即對應3個無效假設Hi:θi=θ0(i=1、2、3),樣本量分配比例為1:1:1:1,有效率θ*,θ分別表示短期及長期結(jié)局事件發(fā)生率,不考慮安全性評價指標。根據(jù)期中分析短期結(jié)局估計的預測概率,篩選最優(yōu)劑量組連同對照進入確證階段繼續(xù)研究。注意期中分析決策僅用來挑選最優(yōu)劑量組,不考慮試驗早期有效或無效終止,而最終統(tǒng)計分析仍基于長期結(jié)局。模擬程序編寫采用SAS 9.2軟件,每種參數(shù)組合下模擬3000次,模擬試驗流程如圖2所示。
1.參數(shù)設置及方法選擇
(2)探索階段短期及長期結(jié)局列聯(lián)相關系數(shù)ρ;
(3)根據(jù)二項分布模擬產(chǎn)生驗證階段長期結(jié)局(θ0,2,θ1,2,θ2,2,θ3,2);
(4)多劑量組多重校正采用Bonferroni校正;
(5)兩階段合并統(tǒng)計量方法采用Fisher’s合并;
(6)根據(jù)I類錯誤0.05、檢驗效能90%,按照傳統(tǒng)方法估計每組樣本量N=120、總樣本量為120×4。探索階段期中分析每組樣本量為60(N/2);驗證階段樣本量理論上應按照條件把握度或預測概率估計,簡便起見本文考慮每組樣本量(480-60×4)/2。
圖2 模擬試驗流程圖
2.I類錯誤
考慮短期與長期結(jié)局間的不同相關關系,評價II/III無縫設計中兩種劑量選擇方法(預測概率、條件把握度)與兩評價指標(短期結(jié)局、長期結(jié)局)對I類錯誤的影響。
(1)參數(shù)設置
③探索階段短期與長期結(jié)局列聯(lián)相關系數(shù)ρ=(0.10(0.10)0.90,0.99);
④短期及長期結(jié)局有效率先驗分布為無信息先驗,Beta(1,1)。
(2)結(jié)果
I類錯誤模擬試驗表明(見表1),無論根據(jù)短期結(jié)局還是長期結(jié)局,條件把握度及無信息先驗預測概率劑量篩選Ⅰ類錯誤結(jié)果都非常接近,原因在于估計預測概率給定的先驗為無信息先驗,預測概率的計算主要由條件把握度決定;基于長期結(jié)局選擇最優(yōu)劑量組,即期中分析篩選指標與最終分析指標為同一指標,由于多劑量組比較采用Bonferroni校正,較為嚴格,因此FWER控制在0.05以內(nèi),且不隨相關系數(shù)變化而改變;基于短期結(jié)局選擇最優(yōu)劑量組,即期中分析篩選指標與最終分析指標非同一指標,隨著探索階段短期與長期結(jié)局相關系數(shù)ρ的增加,總Ⅰ類錯誤也隨之增加,ρ=0,用于篩選的短期結(jié)局與長期結(jié)局相互獨立,此刻根據(jù)短期結(jié)局篩選最優(yōu)劑量組有1/3的概率是長期結(jié)局篩選的最優(yōu)劑量組,ρ接近于1,用于篩選的短期結(jié)局與長期結(jié)局接近完全相關,Ⅰ類錯誤接近長期結(jié)局篩選結(jié)果,Ⅰ類錯誤接近0.05。
表1 不同相關關系條件下期中分析應用長、短期結(jié)局對Ⅰ類錯誤的影響
3.檢驗效能
考慮短期結(jié)局有效率的增加,短期與長期結(jié)局間的不同相關關系,及先驗信息的變化,評價II/III無縫設計中短期結(jié)局、長期結(jié)局預測概率劑量選擇方法對檢驗效能及一階段劑量選擇比例的影響。
(1)參數(shù)設置
③探索階段短期及長期結(jié)局列聯(lián)相關系數(shù)ρ=(0.1、0.5);
④短期和長期結(jié)局有效率先驗分布的設定方式:以有效率0.2為例,無、弱、中、強先驗分布分別為Beta(1,1)、Beta(2,8)、Beta(10,40)、Beta(20,80),先驗信息的均數(shù)相同,均為0.2,但方差越來越小,其中Beta(1,1)為給定的無信息先驗等于均勻分布,如圖3所示。
(2)結(jié)果
①劑量選擇比例
模擬試驗結(jié)果表明,不同先驗信息條件下有效組在期中分析被選擇的概率不同,隨著先驗信息強度的增強,有效組被篩選出來的概率增加,增長的速度加快。以相關關系0.5為例說明不同劑量組被選擇比例變化趨勢(見圖4)。在無先驗信息條件下,有效組短期結(jié)局事件發(fā)生率為0.40時,接近90%的有效組被篩選進入確證階段,然而中等信息先驗條件下有效組短期結(jié)局事件發(fā)生率為0.30時,90%的有效組被篩選,強信息先驗條件下事件發(fā)生率只需0.26篩選能力已達90%。同時,隨著先驗信息的強度增強,無效組被篩選的比例不斷降低,降低的速度也在不斷加快。
圖3 短期/長期結(jié)局先驗分布(θ=0.2)
②檢驗效能
I劑量組有效,隨著短期有效劑量組事件發(fā)生率的增加,或相關系數(shù)的提高,檢驗效能都有增長趨勢;兩指標相關關系由0.1到0.5,檢驗效能提高的比例不明顯,在2%以內(nèi);隨著先驗信息的提高檢驗效能的增長速度加快,無信息先驗條件下,短期結(jié)局事件發(fā)生率為0.4時,檢驗效能接近以長期結(jié)局作為篩選指標的檢驗效能,根本原因在于此時短期結(jié)局有效劑量組同對照組率差等于長期結(jié)局有效組同對照組率差;弱信息先驗條件下短期有效劑量組事件發(fā)生率為0.4,中等信息先驗條件下短期有效劑量組事件發(fā)生率為0.36,強信息先驗條件下短期有效劑量組事件發(fā)生率為0.3,檢驗效能均接近長期結(jié)局作為篩選指標結(jié)果(見圖5)。
圖4 不同相關、不同先驗對劑量選擇比例影響
以獨立的艾迪康唑乳膏治療足癬的Ⅱ期、Ⅲ期臨床試驗為例介紹基于Bayes理論的替代指標作為劑量篩選指標的Ⅱ/Ⅲ期無縫設計研究。兩期臨床試驗均為隨機、雙盲、陽性對照、多中心臨床試驗研究,研究目的為評價艾迪康唑乳膏治療足癬的有效性和安全性。其中Ⅱ期計劃入組受試者240例,其中,安慰劑、1%艾迪康唑乳膏、2%艾迪康唑乳膏、4%艾迪康唑乳膏、6%艾迪康唑乳膏組各48例。主要療效指標為:臨床綜合療效、真菌學療效、臨床療效。次要療效指標為:臨床癥狀體征記分改變。Ⅲ期計劃入組受試者480例,其中試驗組360例、對照藥組120例。主要療效指標為:真菌學療效。次要療效指標為:臨床癥狀體征記分改變、臨床療效、臨床綜合療效。計劃用藥4周,停藥后2周隨訪。于用藥前、用藥后2周、用藥后4周、停藥后2周各訪視1次。
圖5 不同相關、不同先驗對檢驗效能影響
假定艾迪康唑乳膏治療足癬的Ⅱ期臨床試驗為Ⅱ/Ⅲ期無縫設計研究探索階段、Ⅲ期臨床試驗為驗證階段。選擇用藥后4周綜合療效為無縫設計短期結(jié)局、停藥后2周真菌學療效為長期結(jié)局,最終數(shù)據(jù)分析集采用FAS集。
首先根據(jù)短期結(jié)局估計預測概率(見表2),2%艾迪康唑乳膏組預測概率最大,因此該組及其對照組進入確證階段。試驗結(jié)束,分別估計探索階段(228例受試者)、確證階段(478例受試者)各劑量組同對照組停藥后2周真菌學差異(見表2、表3)。多劑量組比較采用Bonferroni校正,估計一階段統(tǒng)計量為,p1,1=3.3054×10-4、p2,1=4.3572×10-5、p3,1=1.6256× 10-4、p4,1=2.3202×10-7、p1234,1=4×2.3202×10-7、p123,1=4×2.3202×10-5、p12,1=p23,1=3×2.3202× 10-7、p12,1=p23,1=2×4.3572×10-5、p24,1=2×2.3202 ×10-7,由于僅有2%艾迪康唑乳膏組進入確證階段,則p2,2=p1234,2=p123,2=p124,2=p234,2=p12,2=p23,2=p24,2=0.053。根據(jù)Fisher’s原則合并兩階段統(tǒng)計量,滿足封閉原則要求,最終拒絕H2假設。該資料Ⅱ/Ⅲ期無縫設計研究結(jié)論為2%艾迪康唑乳膏組與對照組治療足癬療效差別有統(tǒng)計學意義。而僅根據(jù)Ⅲ期研究結(jié)果,不能得出2%艾迪康唑乳膏組與對照組治療足癬療效差別有統(tǒng)計學意義的結(jié)論(P=0.053)。
表2 Ⅱ期臨床試驗用藥后4周綜合療效、停藥后2周真菌學療效
表3 Ⅲ期臨床試驗停藥后2周真菌學療效
當研究的藥物或療法在短期內(nèi)有非常好的療效時,應用短期結(jié)局替代長期結(jié)局指導期中分析決策可以縮短藥物研發(fā)周期,提高研究效率。以短期結(jié)局作為初期劑量篩選指標可用于多種疾病的藥物研究。目前,一些在特定環(huán)境下能夠很好替代長期結(jié)局的短期結(jié)局已經(jīng)獲得監(jiān)管當局認可,如關于晚期結(jié)直腸癌研究無進展生存期(progression-free survival、PFS)可替代總生存期[17]及關于結(jié)腸癌輔助化療研究中位隨訪3年的無病生存期(disease-free survival、DFS)也能夠替代中位隨訪5年總生存期(overall survival、OS)[18]。
本研究結(jié)果顯示根據(jù)短期結(jié)局劑量篩選的II/III期無縫設計可以控制總的I類錯誤在檢驗水準以內(nèi),但是在相關關系很弱前提下,短期結(jié)局劑量篩選結(jié)果偏保守。一般情況下其檢驗效能低于期望,但是當有效劑量組同對照組短期結(jié)局率差同長期結(jié)局率差接近,兩指標相關關系較強或者短期結(jié)局有較強的先驗信息時應用短期結(jié)局劑量篩選可以大大提高檢驗效能,并接近期望值。值得注意的是,不同先驗信息的強度對檢驗效能的影響很大,在實際工作中如果可以獲得較強信息先驗的話,應用預測概率進行劑量篩選可以大大提高檢驗效能。
因此,應用短期結(jié)局作為II/III期無縫設計劑量初篩指標時注意,選用臨床公認的、有文獻支持的替代指標。本文尚存在一些不足之初,如本文只考慮有效劑量同對照組率差為0.2的情況,期中分析僅考慮一個最優(yōu)劑量組進入確證階段,研究指標僅為二分類指標,沒有考慮早期有效或無效終止,也沒有考慮藥物安全性等,這些情況有待進一步研究。
1.Thall PF,Simon R,Ellenberg SS.Two-stage selection and testing designs for comparative clinical trials.Biometrika,1988,75(2):303-310.
2.Bauer P,Kieser M.Combining different phases in the development of medical treatments within a single trial.Stat Med.1999,18(14):1833-1848.
3.Posch M,Koenig F,Branson M,etal.Testing and estimation in flexible group sequential designs with adaptive treatment selection.Stat Med,2005,24(24):3697-3714.
4.Bretz F,Schmidli H,Konig F,et al.Confirmatory seam less phase II/III clinical trials with hypotheses selection at interim:general concepts.Biom J,2006,48(4):623-634.
5.吳瑩,侯艷,李康.適應性無縫設計在臨床試驗中的應用及研究進展.中國衛(wèi)生統(tǒng)計,2013,30(1):140-142.
6.Anscombe FJ.Sequential Medical Trials.Journal of the American Statistical Association,1963,58(302):365-383.
7.Berry D,Müller P,Grieve A,et al.Adaptive Bayesian Designs for Dose-Ranging Drug Trials.In:Case Studies in Bayesian Statistics.Edited by Gatsonis C,Kass R,Carlin B,Carriquiry A,Gelman A,Verdinelli I,West M,vol.162:Springer New York,2002:99-181.
8.Schmidli H,Bretz F,Racine-Poon A.Bayesian predictive power for interim adaptation in seam less phase II/III trials where the endpoint is survival up to some specified timepoint.Stat Med,2007,26(27):4925-4938.
9.Marcus R,Eric P,Gabriel KR.On closed testing procedures with special reference to ordered analysis of variance.Biometrika,1976,63(3):655-660.
10.Bauer P,Kohne K.Evaluation of experiments with adaptive interim analyses.Biometrics,1994,50(4):1029-1041.
11.Lehmacher W,Wassmer G.Adaptive sample size calculations in group sequential trials.Biometrics,1999,55(4):1286-1290.
12.Brannath W,Posch M,Bauer P.Recursive Combination Tests.Journal of the American Statistical Association,2002,97(457):236-244.
13.Jenkins M,Stone A,Jennison C.An adaptive seam less phase II/III design for oncology trials with subpopulation selection using correlated survival endpoints.Pharm Stat.2011,10(4):347-356.
14.Friede T,Parsons N,Stallard N,et al.Designing a seam less phase II/III clinical trial using early outcomes for treatment selection:an application in multiple sclerosis.Stat Med,2011,30(13):1528-1540.
15.Spiegelhalter DJ,F(xiàn)reedman LS,Blackburn PR.Monitoring clinical trials:Conditional or predictive power?Controlled Clinical Trials,1986,7(1):8-17.
16.陳建平,魏永越,陳峰,等.期中分析的條件把握度及樣本含量再估計.中國衛(wèi)生統(tǒng)計,2010,27(4):361-363.
17.Sargent DJ,Wieand HS,Haller DG,et al.Disease-free survival versus overall survival as a primary end point for adjuvant colon cancer studies:individual patient data from 20,898 patients on 18 randomized trials.J Clin Oncol,2005,23(34):8664-8670.
18.Buyse M,Burzykowski T,Carroll K,et al.Progression-free survival is a surrogate for survival in advanced colorectal cancer.J Clin Oncol,2007,25(33):5218-5224.
(責任編輯:郭海強)
An Adaptive Seam less Phase II/III Clinical Trials with Dose Selection Using Predictive Power of the Short-term Endpoint
Liu Liya,Yu Hao,Bai Jianling,et al.(Department of Epidemiology&Biostatistics,Nanjing Medical University(211166)Nanjing)
ObjectiveWe describe a new interim analysis strategy with treatment selection based on predictive power of the short-term endpoint in adaptive seam less phase II/III design and corresponding statistical properties are evaluated.MethodsBased on Monte Carlo simulations,we evaluate the influence of parameter variation on the typeⅠerror and power.ResultsThe familywise typeIerror rate can be controlled in the strong sense,especially when the short-term endpoint is weekly correlated with the long-term endpoint.Furthermore,we cannot get a higher power by using the short-term endpoint for subgroup selection at interim analysis than by using the long-term endpoint.However,when the rate difference increases,the short-term/long-term endpoint correlation is not week or the prior information is strong,the power of the new interim analysis will be greatly improved and close to the expected value.ConclusionAs few final outcomes can be observed at the time of interim analysis,the short-term endpoint,which has been proved effective in papers and clinical practice,can be considered as the surrogate of the long-term endpoint to save development cost and to shorten R&D(research and development)cycle in the study of adaptive seamless Ⅱ/Ⅲdesign.
Bayesian methods;Seam less phase II/III design;Short-term endpoint;Predictive power
國家自然科學基金(81273184);國家自然科學青年基金(81302512)
△通信作者:陳峰