国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

貝葉斯最優(yōu)多階段Ⅱa期自適應(yīng)臨床試驗(yàn)方法-BOP2設(shè)計(jì)

2022-01-07 08:54:24謝婉秋郭東升
關(guān)鍵詞:錯(cuò)誤率樣本量貝葉斯

謝婉秋, 周 影, 郭東升

(1.黑龍江大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 哈爾濱 150080; 2.哈爾濱金融學(xué)院 投資保險(xiǎn)系, 哈爾濱 150030;3.科臨達(dá)康醫(yī)藥生物科技(北京)有限公司 生物統(tǒng)計(jì)與編程部門(mén), 北京100026)

0 引 言

Ⅱ期臨床試驗(yàn)的目的是評(píng)估新療法的初步療效,并確定這種療法是否有進(jìn)行大規(guī)模的Ⅲ期隨機(jī)對(duì)照臨床研究的研發(fā)前景[1]。其中Ⅱa期臨床試驗(yàn)的基本設(shè)計(jì)特征是早期無(wú)效終止和中期go/no-go決策,防止過(guò)多的患者暴露在可能無(wú)效的治療中[2]。已經(jīng)有眾多的頻率設(shè)計(jì)和貝葉斯設(shè)計(jì)應(yīng)用于國(guó)內(nèi)外Ⅱa期臨床試驗(yàn)[3-12]。目前國(guó)內(nèi)的臨床研究中,尤以著名的頻率設(shè)計(jì)Simon兩階段設(shè)計(jì)應(yīng)用最為廣泛[13-14],它在治療是無(wú)效的原假設(shè)下,給定Ⅰ類(lèi)和Ⅱ類(lèi)錯(cuò)誤率,可最大程度地減少期望的樣本量或最大樣本量。如果想多做幾次中期觀察,統(tǒng)計(jì)師也可參考其他相關(guān)研究包括Fleming的多階段檢驗(yàn)[15]、Ensign的最優(yōu)三階段設(shè)計(jì)[16]和Chen的最優(yōu)三階段設(shè)計(jì)[17]等。

另一面,以貝葉斯設(shè)計(jì)的觀點(diǎn)來(lái)看,無(wú)效監(jiān)測(cè)的一種方式是基于感興趣事件的后驗(yàn)概率做出go/no-go的決策。Thall等基于這種思想,提出了一種貝葉斯Ⅱa期設(shè)計(jì),如果中期數(shù)據(jù)表明治療的緩解率有很高的概率小于預(yù)先指定的臨界值,則終止試驗(yàn);否則進(jìn)入下一個(gè)中期觀察。此方法原理直觀,已在美國(guó)MD Anderson等癌癥中心廣泛使用[18]。在后驗(yàn)概率的基礎(chǔ)上,Heitjan提出使用“說(shuō)服概率”判斷新療法是否具有研發(fā)前景[19]。Tan等提出了兩個(gè)貝葉斯兩階段設(shè)計(jì),他們模擬了頻率學(xué)派的多階段設(shè)計(jì)[20]。Cai等提出可以通過(guò)使用多重插補(bǔ)方法處理延遲的療效結(jié)局[21]。Lee等提出了另外一種基于預(yù)測(cè)概率的貝葉斯Ⅱa期設(shè)計(jì),可以根據(jù)任意時(shí)刻的中期數(shù)據(jù)對(duì)最終數(shù)據(jù)進(jìn)行預(yù)測(cè)并計(jì)算最終試驗(yàn)成功的概率[22]。然而,以上無(wú)論基于后驗(yàn)概率還是預(yù)測(cè)概率的設(shè)計(jì)大都集中在一個(gè)二元療效終點(diǎn),如客觀緩解率,但隨著新型分子靶向藥物和免疫療法的出現(xiàn),主要終點(diǎn)變得更加復(fù)雜,可以是有序的或多變量的[23]。

以下列舉了常見(jiàn)的四種不同類(lèi)型終點(diǎn)的Ⅱ期試驗(yàn),BOP2設(shè)計(jì)將采用統(tǒng)一的模型處理以下Ⅱ期設(shè)計(jì)。

例1. 二元療效終點(diǎn):一個(gè)Ⅱ期臨床試驗(yàn),目的是評(píng)估二甲雙胍在復(fù)發(fā)性小細(xì)胞肺癌患者的療效[24]。主要終點(diǎn)是ASO治療復(fù)發(fā)性SCLC患者的客觀緩解率(ORR)(使用RECIST1.1版[25]定義)。根據(jù)歷史數(shù)據(jù),原假設(shè)ORR≤5%,成立則認(rèn)為治療無(wú)效,備擇假設(shè)ORR≥20%,成立則認(rèn)為該療法具有研發(fā)前景。該示例用于說(shuō)明具有二元療效終點(diǎn)的標(biāo)準(zhǔn)情況。

例2. 嵌套的療效終點(diǎn):一個(gè)Ⅱ期臨床試驗(yàn),目的是評(píng)估一種新型人源化單克隆抗體對(duì)自體干細(xì)胞移植后失敗的霍奇金淋巴瘤患者的療效。采用修訂后的《國(guó)際惡性淋巴瘤工作組標(biāo)準(zhǔn)》[26]定義淋巴瘤治療的有效性,從四種降低水平分類(lèi)中選取一種,包括完全緩解(CR),定義為所有疾病證據(jù)的消失;部分緩解(PR),定義為可測(cè)量病灶的消退,沒(méi)有新病灶;疾病穩(wěn)定(SD),定義為未達(dá)到CR、PR或疾病進(jìn)展(PD)的標(biāo)準(zhǔn);疾病進(jìn)展(PD),定義為任何新病變的證據(jù)或病變體積從先前受累部位的最低點(diǎn)增加了50%。在該試驗(yàn)中,盡管CR和PR均被認(rèn)為是有利的療效反應(yīng),但實(shí)際上CR更可取。原假設(shè)是Pr(CR+PR)≤30%且Pr(CR)≤15%,成立則認(rèn)為治療無(wú)效。備擇假設(shè)Pr(CR+PR)≥50%或Pr(CR)≥25%,成立則該認(rèn)為該療法具有研發(fā)前景,其中第二種條件的終點(diǎn)嵌套在第一種條件終點(diǎn)中。

例3. 共同多療效終點(diǎn):一個(gè)Ⅱ期臨床試驗(yàn),方案名為GOG 0229E,主要目的是研究貝伐單抗對(duì)復(fù)發(fā)或持續(xù)性子宮內(nèi)膜癌患者的療效。該試驗(yàn)有兩個(gè)共同的主要療效終點(diǎn):客觀緩解率(ORR)和6個(gè)月無(wú)疾病進(jìn)展(或死亡)生存的概率(PFS6)??陀^緩解率使用RECIST 1.1[25]定義。無(wú)進(jìn)展生存期(PFS)定義為從治療開(kāi)始到發(fā)生疾病進(jìn)展或任何原因死亡的時(shí)間。原假設(shè)是ORR≤10%且PFS6≤15%。成立則認(rèn)為治療無(wú)效。兩個(gè)指標(biāo)在臨床顯著改善的差異為20%,所以備擇假設(shè)ORR≥30%或PFS6≥35%,成立則認(rèn)為該療法具有研發(fā)前景。

例4. 聯(lián)合監(jiān)測(cè)療效和毒性終點(diǎn):一個(gè)Ⅱ期臨床試驗(yàn),主要目的是評(píng)價(jià)低劑量氯法拉濱和阿糖胞苷聯(lián)合治療復(fù)發(fā)或?qū)Φ图谆幬锊幻舾械母呶9撬柙錾惓>C合征患者的療效[27]。主要療效終點(diǎn)是使用2006年修正的國(guó)際工作組標(biāo)準(zhǔn)定義的CR率聯(lián)合監(jiān)測(cè)治療的安全性,以與研究藥物相關(guān)的3級(jí)毒性率作為聯(lián)合終點(diǎn)。原假設(shè)是CR率≤20%或毒性率≥30%,成立則認(rèn)為治療無(wú)效。如果CR率>20%且毒性率<30%,則認(rèn)為該療法具有研發(fā)前景。

本文重點(diǎn)介紹Zhou等2017年提出的一種靈活的貝葉斯最優(yōu)Ⅱ期(BOP2)設(shè)計(jì),該設(shè)計(jì)能夠處理上述試驗(yàn)場(chǎng)景[1]。BOP2設(shè)計(jì)使用Dirichlet-多項(xiàng)式模型處理不同類(lèi)型的終點(diǎn)。在每個(gè)中期階段,通過(guò)評(píng)估事件的后驗(yàn)概率來(lái)做出go/no-go的決策。BOP2設(shè)計(jì)可精確控制Ⅰ類(lèi)錯(cuò)誤率,在某種意義上是最優(yōu)的,包括在固定樣本量的備擇假設(shè)下優(yōu)化檢驗(yàn)效能或在原假設(shè)下最小化期望樣本量。Thall等提出了針對(duì)多主要終點(diǎn)(例如毒性和療效)的貝葉斯序貫監(jiān)測(cè)設(shè)計(jì)[28]。與這些設(shè)計(jì)相比,BOP2設(shè)計(jì)具備更多的優(yōu)勢(shì),包括:(1)提供一個(gè)更靈活的框架來(lái)同時(shí)監(jiān)測(cè)多個(gè)事件,包括嵌套或共同主要終點(diǎn);(2)精確控制Ⅰ類(lèi)錯(cuò)誤率并優(yōu)化特定的目標(biāo)函數(shù),從而彌補(bǔ)貝葉斯設(shè)計(jì)與頻率設(shè)計(jì)之間的差距,使所提出的貝葉斯優(yōu)化設(shè)計(jì)更易于為廣大用戶(hù)和監(jiān)管機(jī)構(gòu)所用;(3)模擬研究表明,允許終止規(guī)則的臨界值隨中期樣本量發(fā)生變化,從而提高設(shè)計(jì)的檢驗(yàn)效能。

本文第1節(jié)詳細(xì)介紹BOP2設(shè)計(jì)的概率模型,描述了試驗(yàn)設(shè)計(jì)和設(shè)計(jì)參數(shù)的優(yōu)化;第2節(jié)實(shí)際臨床試驗(yàn)案例分析,同時(shí)簡(jiǎn)要介紹www.trialdesign.org網(wǎng)站實(shí)現(xiàn)BOP2設(shè)計(jì)的軟件操作;第3節(jié)采用模擬方法比較BOP2與其他貝葉斯Ⅱ期設(shè)計(jì)的優(yōu)勢(shì),最后給出結(jié)論。

1 方 法

1.1 概率模型

盡管上述四個(gè)試驗(yàn)案例的主要終點(diǎn)采用不同的形式,但可以統(tǒng)一由服從多項(xiàng)式分布的隨機(jī)變量X和K個(gè)類(lèi)別表示:

X~Multinom(θ1,…,θk)

(1)

式中θk=Pr(X=k)是X屬于第k個(gè)類(lèi)別的概率,k=1,…,K。K個(gè)類(lèi)別可以是單個(gè)終點(diǎn)的真實(shí)級(jí)別,也可以是多個(gè)真實(shí)類(lèi)別終點(diǎn)的某種組合。如例1中單個(gè)二元療效終點(diǎn),多項(xiàng)式的分類(lèi)K=2(OR,無(wú)OR)。例2中,X是有序結(jié)局指標(biāo),X=1,2,3和4分別表示CR,PR,SD和PD。例3中,X是具有4個(gè)類(lèi)別的多項(xiàng)式變量:1 =(OR,PFS6),2 =(OR,無(wú)PFS6),3 =(無(wú)OR,PFS6)和4 =(無(wú)OR,無(wú)PFS6)。例4中,X是具有4個(gè)類(lèi)別的多項(xiàng)式變量:1 =(毒性,CR),2 =(無(wú)毒性,CR),3 =(毒性,無(wú)CR)和4 =(無(wú)毒性,無(wú)CR)。

例1中N次抽樣(即N個(gè)患者參與試驗(yàn)),X為緩解的人數(shù),服從二項(xiàng)式分布;類(lèi)似的,例2、3、4將試驗(yàn)結(jié)局分為4組,4組中結(jié)局發(fā)生對(duì)應(yīng)的概率分別為θ1,θ2,θ3,θ4,且θ1+θ2+θ3+θ4=1;用(X1,X2,…,Xn)分別表示N個(gè)患者中每個(gè)結(jié)局組的人數(shù),則X=(X1,X2,…,Xn)服從多項(xiàng)式分布,可見(jiàn)例1為例3的特例,如果例3忽略PFS6,多項(xiàng)式分布則退化為二項(xiàng)式分布。

設(shè)b表示由元素0和1組成的設(shè)計(jì)向量,而在以上4個(gè)示例中中期觀察的有效性可以表示為模型參數(shù)θ=(θ1,…,θk)T的線(xiàn)性組合:bθ≤φ或bθ≥φ,其中,φ代表預(yù)先指定閾值。

具體例1中,H0:bθ≤φ,其中b=(1,0),φ=0.05;例2和例3中,H0:b1θ≤φ1且b2θ≤φ2,其中例2中b1=(1,0,0,0),b2=(1,1,0,0),φ1=0.15,φ2=0.3;例3中b1=(1,1,0,0),b2=(1,0,1,0),φ1=0.1,φ2=0.15;例4中,H0:b1θ≤φ1或b2θ≥φ2,其中b1=(1,1,0,0),b2=(1,0,1,0) ,φ1=0.2,φ2=0.3。以上結(jié)果匯總在表1中。

表1 四個(gè)試驗(yàn)案例的結(jié)局及參數(shù)設(shè)置Table 1 Outcome and parameter setting of four trail cases

在貝葉斯的框架下,通常為了方便推導(dǎo)參數(shù)的后驗(yàn)分布,會(huì)先假設(shè)參數(shù)的先驗(yàn)分布是聯(lián)合似然函數(shù)的某個(gè)共軛分布,故假設(shè)θ=(θ1,…,θk)T服從Dirichlet共軛先驗(yàn)分布:

θ~Dirichlet(α1,…,αK)

(2)

θ|Dn~Dir(α1+x1,…,αK+xK)

(3)

在X是二元結(jié)局的特例中(例1),該Dirichlet-多項(xiàng)式模型退化為標(biāo)準(zhǔn)的Beta-二項(xiàng)式模型。

1.2 試驗(yàn)設(shè)計(jì)

設(shè)N代表試驗(yàn)的最大樣本量。BOP2設(shè)計(jì)包括R個(gè)中期觀察,當(dāng)納入的患者人數(shù)達(dá)到n1,n2,…,nR時(shí),以及所有N個(gè)患者都納入后的最后一次觀察。如下文所述,每一次中期觀察的目的包括評(píng)估新療法是否具有研發(fā)前景或者由于目前試驗(yàn)累積的數(shù)據(jù)不足以支持任何結(jié)論而需要納入更多的患者。換言之,患者分別納入到大小為n1,n2-n1,…,N-nR的R+1隊(duì)列中,并在每個(gè)隊(duì)列入組后做出go/no-go的決策。當(dāng)R=N-1時(shí),獲得了一個(gè)完整的序貫設(shè)計(jì),在每個(gè)患者之后都會(huì)連續(xù)評(píng)估go/no-go決策。

設(shè)C(n)表示概率閾值,它是中期樣本量n的函數(shù)。在這個(gè)設(shè)計(jì)中,每個(gè)中期階段的go/no-go決策都是基于事件的后驗(yàn)概率來(lái)進(jìn)行的。具體地,對(duì)于四個(gè)試驗(yàn)案例,在中期觀察后,如果出現(xiàn)以下情形則終止試驗(yàn):

例1: Pr(θ1≤0.05|Dn)>C(n);

例2: Pr(θ1≤0.15|Dn)>C(n)且Pr(θ1+θ2≤0.3|Dn)>C(n);

例3: Pr(θ1+θ2≤0.1|Dn)>C(n)且Pr(θ1+θ3≤0.15|Dn)>C(n);

例4: Pr(θ1+θ2≤0.2|Dn)>C(n)或Pr(θ1+θ3≥0.3|Dn)>C(n)。

與大多數(shù)現(xiàn)有的貝葉斯設(shè)計(jì)[18,28]假定一個(gè)恒定的臨界值不同,BOP2設(shè)計(jì)的作者們?cè)试S概率閾值C(n)是中期樣本量n的函數(shù)。就像優(yōu)化參數(shù)設(shè)計(jì)中展示的內(nèi)容,這種修改可以大大提高設(shè)計(jì)的檢驗(yàn)效能,是BOP2設(shè)計(jì)的點(diǎn)睛之筆。盡管這些停止規(guī)則在臨床上有不同的解釋?zhuān)莋o/no-go決策都是可歸結(jié)為基于對(duì)模型參數(shù)θ=(θ1,…,θk)T的線(xiàn)性組合的后驗(yàn)概率為評(píng)估基礎(chǔ),例如,

Pr(bθ≤φ|Dn)>C(n)

(4)

式中b是元素為0和1的設(shè)計(jì)矢量,φ是預(yù)定閾值。

Dirichlet分布有兩個(gè)特性有助于對(duì)(4)中的后驗(yàn)概率進(jìn)行評(píng)估。

因此,可以將Pr(bθ≤φ|Dn)很容易地評(píng)估為

式中B(φ;ζ,ξ)是含有參數(shù)ζ和ξ的Beta分布的累積分布函數(shù),并評(píng)估值φ。Pr(bθ≤φ|Dn)的性質(zhì)導(dǎo)致以下結(jié)果。

性質(zhì)1和引理1的證明和解釋過(guò)程見(jiàn)附件1。在實(shí)踐中,Pr(bθ≤φ|Dn)的單調(diào)性很重要,由于單調(diào)性,不需要在搜索網(wǎng)格中的每一個(gè)點(diǎn)上執(zhí)行實(shí)時(shí)計(jì)算,可在試驗(yàn)開(kāi)始前,通過(guò)單調(diào)性來(lái)計(jì)算停止邊界,這類(lèi)似于Simon的兩階段設(shè)計(jì)。表2展示了在控制Ⅰ類(lèi)錯(cuò)誤率10%,已知最大樣本量40,最大化檢驗(yàn)效能的條件下,四個(gè)試驗(yàn)案例的停止邊界。如例1中25例患者入組以后,如果緩解的患者數(shù)≤1則終止試驗(yàn),判斷新療法沒(méi)有研發(fā)前景;例2中,納入25例患者后,如果CR人數(shù)≤4且CR+PR人數(shù)≤8則終止試驗(yàn),判斷新療法沒(méi)有研發(fā)前景。這個(gè)過(guò)程不需要任何復(fù)雜的計(jì)算,僅需計(jì)算相關(guān)的事件數(shù),便可以做出go/no-go的決策,表2中數(shù)據(jù)可以在www.trialdesign.org網(wǎng)站獲得,僅需輸入幾個(gè)簡(jiǎn)單的參數(shù)。這個(gè)屬性使BOP2設(shè)計(jì)在實(shí)踐中非常容易實(shí)現(xiàn)。

表2 四個(gè)試驗(yàn)案例的BOP2設(shè)計(jì)的停止邊界值Table 2 Stop boundary value of BOP2 design of four trail cases

1.3 優(yōu)化設(shè)計(jì)參數(shù)

首先,本設(shè)計(jì)需根據(jù)相關(guān)試驗(yàn)背景選擇適當(dāng)?shù)脑僭O(shè)H0和備擇假設(shè)H1,依據(jù)反證思想,原假設(shè)為希望依據(jù)數(shù)據(jù)拒絕的假設(shè)。原假設(shè)表示的θ認(rèn)為該方法無(wú)效,而備擇假設(shè)為希望得到的結(jié)論,即表示的θ認(rèn)為該療法有研發(fā)前景。Ⅰ類(lèi)錯(cuò)誤率和統(tǒng)計(jì)檢驗(yàn)效能分別定義為在H0和H1下拒絕H0的概率,Ⅰ類(lèi)錯(cuò)誤率是指藥物無(wú)效的原假設(shè)為真時(shí)拒絕原假設(shè)的概率,應(yīng)使其得到有效控制即保證患者風(fēng)險(xiǎn)最小化;統(tǒng)計(jì)檢驗(yàn)效能是指該療法具有研發(fā)前景的備擇假設(shè)為真時(shí)拒絕原假設(shè)的概率,應(yīng)盡量在控制風(fēng)險(xiǎn)的前提下最大化檢驗(yàn)效能以保證新藥申辦者的利益。如例2中,H0:θ1≤0.15和θ1+θ2≤0.3,一個(gè)可能的合理備擇假設(shè)是H1:θ1≥0.25或θ1+θ2≥0.5。對(duì)于這種復(fù)雜的終點(diǎn),H0和H1的預(yù)定閾值應(yīng)通過(guò)與臨床醫(yī)生協(xié)商確定,用來(lái)反映在臨床實(shí)踐中可行的理想結(jié)果。未拒絕H0意味著試驗(yàn)結(jié)果未達(dá)到最低臨床有效邊界值,則該療法無(wú)效,不具有研發(fā)前景。

與大多數(shù)貝葉斯設(shè)計(jì)假定一個(gè)恒定的臨界值不同,BOP2設(shè)計(jì)的點(diǎn)睛之筆在于指定的一個(gè)概率閾值是中期樣本量n的函數(shù)C(n),這種修改可以大大提高設(shè)計(jì)的檢驗(yàn)效能。C(n)可以使用任何靈活且合理的單調(diào)遞減函數(shù),但采用如下兩參數(shù)冪函數(shù)可以具有良好的特性:

C(n)=1-λ(n/N)γ

(5)

其中λ和γ是調(diào)整參數(shù)。要求γ> 0,以便C(n)隨著n/N單調(diào)遞減,這樣設(shè)計(jì)的優(yōu)點(diǎn)是試驗(yàn)開(kāi)始時(shí)數(shù)據(jù)比較稀疏,停止規(guī)則較為嚴(yán)格,避免意外終止,隨著越來(lái)越多的數(shù)據(jù)積累,對(duì)目標(biāo)終點(diǎn)的不確定性越來(lái)越小,停止規(guī)則自適應(yīng)地變得更加寬松。為獲得最優(yōu)解,BOP2提出者設(shè)定了兩種方式優(yōu)化準(zhǔn)則,在各類(lèi)限制條件下的所有解中選取最合適的一組。

1.3.1 固定最大樣本量和Ⅰ類(lèi)錯(cuò)誤的條件下最大化檢驗(yàn)效能

在固定樣本數(shù)量N時(shí),通過(guò)選擇調(diào)整參數(shù)λ和γ,將Ⅰ類(lèi)錯(cuò)誤率控制在特定的預(yù)定水平下(例如10%)最大化檢驗(yàn)效能。按以下步驟進(jìn)行:

步驟1: 從臨床醫(yī)生得到H0和H1,從申辦方得到最大樣本量,從監(jiān)管機(jī)構(gòu)得到Ⅰ類(lèi)錯(cuò)誤率。

步驟2: 找到控制的Ⅰ類(lèi)錯(cuò)誤率以下的所有(λ,γ)值,可以通過(guò)數(shù)值網(wǎng)格搜索來(lái)執(zhí)行。

步驟3: 在步驟2中確定的(λ,γ)集合中,選擇產(chǎn)生最大統(tǒng)計(jì)檢驗(yàn)效能的集合作為最佳設(shè)計(jì)參數(shù)。

盡管BOP2設(shè)計(jì)是貝葉斯設(shè)計(jì),但仍然必須確保設(shè)計(jì)具有所需的頻率學(xué)特性[29](例如Ⅰ類(lèi)概率和檢驗(yàn)效能)??煽刂频蘑耦?lèi)錯(cuò)誤率,能彌補(bǔ)貝葉斯設(shè)計(jì)和頻率設(shè)計(jì)之間的鴻溝,使BOP2設(shè)計(jì)可供眾多用戶(hù)和監(jiān)管機(jī)構(gòu)使用。

1.3.2 控制Ⅰ類(lèi)和Ⅱ類(lèi)錯(cuò)誤的條件下最小化期望樣本量

另一種優(yōu)化策略是給定預(yù)定的Ⅰ類(lèi)和Ⅱ類(lèi)錯(cuò)誤率,選擇λ和γ,在原假設(shè)為真的條件下,將樣本量N的期望值E(N|H0)最小化。Simon的二階段最優(yōu)設(shè)計(jì)使用了這種優(yōu)化標(biāo)準(zhǔn)。在這種方法中,不固定N,但是要優(yōu)化設(shè)計(jì)參數(shù),確定使E(N|H0)最小的(λ,γ,N)值,過(guò)程可以描述如下:

步驟1: 從臨床研究者得到H0和H1,選擇申辦方可接受的Ⅱ類(lèi)錯(cuò)誤率,從監(jiān)管機(jī)構(gòu)得到Ⅰ類(lèi)錯(cuò)誤率。

步驟2: 找到控制的Ⅰ類(lèi)和Ⅱ類(lèi)錯(cuò)誤率以下的(N,λ,γ)值,可以通過(guò)數(shù)值網(wǎng)格搜索來(lái)執(zhí)行。

步驟3: 在步驟2中確定的(N,λ,γ)集合中,選擇產(chǎn)生最小E(N|H0)的集合作為最佳設(shè)計(jì)參數(shù)。

在第2步中,有兩個(gè)約束條件(即Ⅰ類(lèi)和Ⅱ類(lèi)錯(cuò)誤率),但需要確定三個(gè)未知參數(shù)(N,λ,γ)的值。因此,原則上會(huì)得到無(wú)窮多個(gè)解。通過(guò)將N值限制在(Nmin,Nmax)范圍內(nèi)可以解決此問(wèn)題,其中Nmax是在實(shí)踐中可以提供的最大樣本量,由預(yù)算、增長(zhǎng)率或其他實(shí)際因素決定。Nmin是試驗(yàn)的最小樣本量,只要合理小(例如Nmin= 10),就不會(huì)對(duì)設(shè)計(jì)的操作特性產(chǎn)生影響。給定N的特定值,基于兩個(gè)約束的網(wǎng)格搜索,可以唯一地確定λ和γ的值。此優(yōu)化策略的一個(gè)潛在限制是無(wú)法直接控制樣本量N,并且在某些情況下,對(duì)于實(shí)際使用而言,使E(N|H0)最小的N值可能過(guò)大。因此,建議采用固定最大樣本量和Ⅰ類(lèi)錯(cuò)誤的條件下最大化檢驗(yàn)效能的方法計(jì)算合理的樣本量。

2 實(shí)際案例分析

2.1 研究設(shè)計(jì)

根據(jù)文獻(xiàn)報(bào)道,一項(xiàng)注冊(cè)研究(NCT01210222),試驗(yàn)方案為每周靜脈注射15 mg·kg-1的特雷班尼布對(duì)持續(xù)或復(fù)發(fā)子宮內(nèi)膜癌患者的療效[30],與很多處于Ⅱ期的癌癥患者一樣,這些患者的特點(diǎn)是病情進(jìn)展迅速,對(duì)新增化療藥不敏感。該試驗(yàn)有兩個(gè)共同的主要療效終點(diǎn):客觀緩解率和6個(gè)月無(wú)事件生存期??陀^緩解率使用RECIST 1.1[25]定義。無(wú)事件生存期(EFS)定義為從治療開(kāi)始到首次發(fā)生任何事件的時(shí)間,包括疾病進(jìn)展而無(wú)法進(jìn)行手術(shù)治療、局部或遠(yuǎn)處復(fù)發(fā)、任何原因?qū)е碌乃劳龅?。這兩個(gè)終點(diǎn)都值得Ⅱ期研究中進(jìn)一步探討,因?yàn)樗麄兌加型蔀榭偵嫫?OS)的有效替代終點(diǎn)。

本研究的原假設(shè)H0的界值是根據(jù)基于相似人群的歷史數(shù)據(jù)集獲得,H0聯(lián)合規(guī)定ORR≤10%且EFS6≤20%,成立則認(rèn)為治療無(wú)效。臨床上顯著差異是指6個(gè)月無(wú)事件生存期發(fā)生率增加20%,或客觀緩解率提高15%。所以,備擇假設(shè)EFS6≥40%或ORR≥25%,成立則認(rèn)為該療法具有研發(fā)前景。

2.2 Web端軟件操作

操作界面友好,非統(tǒng)計(jì)專(zhuān)業(yè)人員也能熟練操作和理解,本節(jié)將演示2.1節(jié)的試驗(yàn)案例軟件操作,用戶(hù)僅需選擇試驗(yàn)主要終點(diǎn)的類(lèi)型,中期觀察及最大樣本量,有效率或毒性率,Ⅰ類(lèi)及Ⅱ類(lèi)錯(cuò)誤率等參數(shù),即獲得試驗(yàn)停止邊界的表格(結(jié)果見(jiàn)表3),與Simon兩階段法設(shè)計(jì)類(lèi)似,BOP2設(shè)計(jì)的一個(gè)重要的優(yōu)點(diǎn)是試驗(yàn)開(kāi)始之前便可在試驗(yàn)方案中列出停止邊界值,在試驗(yàn)進(jìn)行中,無(wú)需統(tǒng)計(jì)專(zhuān)業(yè)人員干預(yù),研究者僅需計(jì)算出相關(guān)事件的數(shù)量,通過(guò)查表(表3)觀察是否超出邊界便可做出go/no-go決策。網(wǎng)站www.trialdesign.org免費(fèi)開(kāi)放,無(wú)需注冊(cè)。

表3 試驗(yàn)案例NCT01210222的BOP2設(shè)計(jì)的停止邊界值Table 3 Stop boundary value of BOP2 design of trail case NCT01210222

2.3 研究結(jié)果

采用BOP2設(shè)計(jì)方法,在控制Ⅰ類(lèi)錯(cuò)誤率10%,已知最大樣本量55的條件下,對(duì)比文獻(xiàn)中兩階段法,本方法可中期觀察多次,以觀察4次舉例,結(jié)果見(jiàn)表3:入組28例患者中,至多2名患者獲得客觀緩解(CR或者PR)或者至多5名患者獲得6個(gè)月無(wú)事件生存期,則試驗(yàn)終止,定論試驗(yàn)藥物沒(méi)有研發(fā)前景;入組35例患者中,至多4名患者獲得客觀緩解(CR或者PR)或者至多7名患者獲得6個(gè)月無(wú)事件生存期,則試驗(yàn)終止,定論試驗(yàn)藥物沒(méi)有研發(fā)前景;入組48例患者中,至多6名患者獲得客觀緩解(CR或者PR)或者至多12名患者獲得6個(gè)月無(wú)事件生存期,則試驗(yàn)終止,定論試驗(yàn)藥物沒(méi)有研發(fā)前景;入組55例患者中,至多9名患者獲得客觀緩解(CR或者PR)或者至多15名患者獲得6個(gè)月無(wú)事件生存期,則試驗(yàn)終止,定論試驗(yàn)藥物沒(méi)有研發(fā)前景??紤]兩個(gè)終點(diǎn)正相關(guān),該項(xiàng)研究檢測(cè)出臨床顯著效果的檢驗(yàn)效能(把握度)是99.13%,顯著高于文獻(xiàn)中兩階段法的90%~92%的檢驗(yàn)功效。

3 模擬研究

本節(jié)介紹原文中的模擬比較結(jié)果并給予充分解釋。BOP2作者通過(guò)模擬方法比較了BOP2與文獻(xiàn)中其他貝葉斯Ⅱ期設(shè)計(jì),在模擬研究中,所有設(shè)計(jì)的Ⅰ類(lèi)錯(cuò)誤率控制在10%。下面將重點(diǎn)討論最大化檢驗(yàn)效能的BOP2設(shè)計(jì),最小化期望樣本量E(N|H0)可查閱文獻(xiàn)深入學(xué)習(xí)。在治療首個(gè)10例患者后進(jìn)行了中期分析,以后每增加5例有結(jié)局患者后觀察一次,最大樣本量N=40。

在每個(gè)場(chǎng)景下模擬10 000次試驗(yàn),通過(guò)三個(gè)指標(biāo)評(píng)估不同設(shè)計(jì)方法的性能:(1)拒絕無(wú)效假設(shè)(PRN)的百分比:定義為拒絕H0的模擬試驗(yàn)的百分比。當(dāng)H0為真時(shí),PRN為Ⅰ類(lèi)錯(cuò)誤率;當(dāng)H1為真時(shí),PRN為統(tǒng)計(jì)檢驗(yàn)效能。PRN也可以解釋為新療法有效的百分比;(2)提早終止概率(PET)的百分比:定義為提早終止的試驗(yàn)的百分比;(3)實(shí)際樣本量:定義為10 000個(gè)模擬試驗(yàn)中實(shí)際使用的平均樣本量。

3.1 二元療效終點(diǎn)

對(duì)于簡(jiǎn)單的二元療效結(jié)局(即OR/無(wú)OR),如試驗(yàn)案例1構(gòu)建了四對(duì)不同原假設(shè)H0和備擇假設(shè)H1的場(chǎng)景,并比較BOP2設(shè)計(jì)與Thall等提出的貝葉斯設(shè)計(jì)[8](簡(jiǎn)稱(chēng)為T(mén)S設(shè)計(jì)),兩個(gè)設(shè)計(jì)主要的區(qū)別在于定義臨界值的方式不同(TS設(shè)計(jì)使用固定臨界值C,而B(niǎo)OP2設(shè)計(jì)使用適應(yīng)性概率閾值C(n))。表2列舉出了BOP2設(shè)計(jì)的停止邊界值,以中期觀察到的有效的患者例數(shù)為依據(jù),這些有效的患者用于在表4中場(chǎng)景1的每一次中期分析時(shí)做出go/no-go 決策。表4顯示了ORR的四對(duì)不同H0和H1的場(chǎng)景下,兩種設(shè)計(jì)的性能,分別列出4個(gè)場(chǎng)景下的PRN、PET和實(shí)際樣本量,模擬結(jié)果可得到BOP2設(shè)計(jì)產(chǎn)生的檢驗(yàn)效能比TS設(shè)計(jì)大得多。例如,場(chǎng)景2中,原假設(shè)ORR為20%,備擇假設(shè)ORR為40%,當(dāng)真實(shí)ORR為40%時(shí),BOP2設(shè)計(jì)的檢驗(yàn)效能為88.3%,而TS設(shè)計(jì)的檢驗(yàn)效能僅為76.4%。此外,與TS設(shè)計(jì)相比,BOP2設(shè)計(jì)在新療法有效時(shí)錯(cuò)誤地終止試驗(yàn)的風(fēng)險(xiǎn)較小。例如,當(dāng)真實(shí)ORR為40%時(shí),TS設(shè)計(jì)錯(cuò)誤地終止了23.5%的試驗(yàn),而B(niǎo)OP2設(shè)計(jì)錯(cuò)誤地終止了11.4%的試驗(yàn)。

表4 試驗(yàn)案例1二元療效終點(diǎn)中BOP2和TS設(shè)計(jì)PRN、PET及實(shí)際樣本量模擬結(jié)果比較Table 4 Comparison of BOP2 and TS design PRN, PET and actual sample size simulation results in the binary efficacy endpoint of trail case 1

在原假設(shè)下,TS設(shè)計(jì)比BOP2設(shè)計(jì)更有可能終止試驗(yàn)。因?yàn)門(mén)S設(shè)計(jì)有終止試驗(yàn)的高趨勢(shì),所以它的實(shí)際樣本量比BOP2設(shè)計(jì)小。由于觀察到的數(shù)據(jù)具有離散性,并且定義臨界值的方式不同,在某些場(chǎng)景下,不可能將兩種設(shè)計(jì)的Ⅰ類(lèi)錯(cuò)誤率精確匹配到10%。這就解釋了在場(chǎng)景1中,TS設(shè)計(jì)的Ⅰ類(lèi)錯(cuò)誤與BOP2設(shè)計(jì)相等,而在場(chǎng)景2中,則略高。

3.2 嵌套的療效終點(diǎn)

表5顯示了在試驗(yàn)案例2的嵌套療效終點(diǎn)的模擬結(jié)果,表2給出了相應(yīng)的停止邊界值。最初的10名患者入組后開(kāi)始中期觀察,然后每5名患者入組后進(jìn)行中期監(jiān)測(cè)。情景1是原假設(shè),即H0:Pr(CR)≤0.15和Pr(CR+PR)≤0.3,情景7是備擇假設(shè),即H1:Pr(CR)≥0.25或Pr(CR+PR)≥0.5。同樣將BOP2設(shè)計(jì)與TS設(shè)計(jì)進(jìn)行比較,如表5所示,BOP2設(shè)計(jì)通常比TS設(shè)計(jì)具有更大的檢驗(yàn)效能。如在場(chǎng)景7中,Pr(CR)=0.25,Pr(CR+PR)=0.5,則BOP2設(shè)計(jì)的檢驗(yàn)效能為85.5%,而TS設(shè)計(jì)的檢驗(yàn)效能僅為74.2%。比較這兩種情況,觀察到當(dāng)真實(shí)的CR率從15%增加到20%時(shí),BOP2設(shè)計(jì)可以將PRN從8.7%增加到24.2%。這恰好滿(mǎn)足了可以對(duì)BOP2設(shè)計(jì)的期望,該設(shè)計(jì)可以同時(shí)監(jiān)測(cè)嵌套的終點(diǎn)。相反,TS設(shè)計(jì)無(wú)法區(qū)分這兩種情況,因?yàn)镃R+PR比率均為30%。另外,當(dāng)治療實(shí)際上有效時(shí),TS設(shè)計(jì)比BOP2設(shè)計(jì)傾向于更大的概率錯(cuò)誤終止試驗(yàn)。如在場(chǎng)景7中,TS設(shè)計(jì)提前25.7%的時(shí)間終止了試驗(yàn),而B(niǎo)OP2設(shè)計(jì)提前了9.9%的時(shí)間終止了試驗(yàn)。同樣,由于早期終止試驗(yàn)的可能性很高,TS設(shè)計(jì)的實(shí)際樣本量小于BOP2設(shè)計(jì)的樣本量。

表5 試驗(yàn)案例2嵌套的療效終點(diǎn)中BOP2和TS設(shè)計(jì)PRN、PET及實(shí)際樣本量模擬結(jié)果比較Table 5 Comparison of BOP2 and TS design PRN, PET and actual sample size simulation results in the nested efficacy endpoint of trail case 2

續(xù)表

場(chǎng)景θ(CR,CR+PR)PRN / %PET / %樣本量BOP2TSBOP2TSBOP2TS6(0.25,0.20,0.30,0.25)(0.25,0.45)72.359.019.340.937.129.17(0.25,0.25,0.25,0.25)b(0.25,0.50)85.574.29.925.738.533.08(0.30,0.25,0.25,0.20)(0.30,0.55)95.785.23.014.839.535.9

3.3 共同主要療效終點(diǎn)

表6顯示了在試驗(yàn)案例3具有兩個(gè)共同主要療效終點(diǎn)(即ORR和PFS6)的模擬結(jié)果,表2列出了相應(yīng)的停止邊界值。場(chǎng)景1和7分別展示了H0和H1。將BOP2設(shè)計(jì)與Thall等[18]提出的貝葉斯設(shè)計(jì)進(jìn)行了比較,并將后者簡(jiǎn)稱(chēng)為T(mén)SE設(shè)計(jì)。為了公平比較,TSE設(shè)計(jì)與BOP2設(shè)計(jì)使用的模型和停止規(guī)則相同,只是臨界值的方式不同(TSE設(shè)計(jì)使用固定臨界值C,而B(niǎo)OP2設(shè)計(jì)使用適應(yīng)性概率閾值C(n))。結(jié)果與前述案例一致,與TSE設(shè)計(jì)相比,BOP2設(shè)計(jì)產(chǎn)生了更高的統(tǒng)計(jì)檢驗(yàn)效能,和更低的錯(cuò)誤終止試驗(yàn)的概率。

表6 試驗(yàn)案例3共同的主要療效終點(diǎn)中BOP2和TSE設(shè)計(jì)PRN、PET及實(shí)際樣本量模擬結(jié)果比較Table 6 Comparison of BOP2 and TSE design PRN, PET and actual sample size simulation results in the common primary efficacy endpoint of trial case 3

3.4 聯(lián)合監(jiān)測(cè)療效和毒性終點(diǎn)

表7顯示了在試驗(yàn)案例4的模擬結(jié)果,該案例同時(shí)監(jiān)控療效和毒性。場(chǎng)景1和7分別代表H0和H1。同樣對(duì)BOP2設(shè)計(jì)與TSE設(shè)計(jì)進(jìn)行了比較,TSE設(shè)計(jì)與BOP2設(shè)計(jì)使用相同的模型和停止規(guī)則,只是TSE設(shè)計(jì)在停止規(guī)則中使用了固定的臨界值C。同樣,在相同的Ⅰ類(lèi)錯(cuò)誤率(即場(chǎng)景1中的PRN)的情況下,BOP2設(shè)計(jì)的性能優(yōu)于TSE設(shè)計(jì),具有更高的檢驗(yàn)效能,并且錯(cuò)誤終止試驗(yàn)的風(fēng)險(xiǎn)較小。

表7 試驗(yàn)案例4聯(lián)合毒性和有效性療效終點(diǎn)中BOP2和TSE設(shè)計(jì)PRN、PET及實(shí)際樣本量模擬結(jié)果比較Table 7 Comparison of BOP2 and TSE design PRN, PET and actual sample size simulation results in the combined toxicity and effectiveness efficacy endpoint of trial case 4

相應(yīng)的停止邊界在表2中列出。在這種情況下,停止邊界的使用與以前的案例略有不同。例如,在治療30位患者之后,如果CR次數(shù)≤5或毒性反應(yīng)≥10,則BOP2設(shè)計(jì)將終止試驗(yàn)。

續(xù)表

場(chǎng)景θ(有效性,毒性) PRN / % PET / % 樣本量BOP2TSEBOP2TSEBOP2TSE5(0.15,0.35,0.05,0.45)(0.50,0.20)41.033.851.265.330.722.46(0.15,0.40,0.05,0.40)(0.55,0.20)60.848.633.550.833.926.17(0.18,0.22,0.02,0.58)b(0.40,0.20)86.182.411.818.238.139.58(0.15,0.30,0.05,0.50)(0.45,0.20)86.483.311.113.938.339.6

4 結(jié) 論

隨著Ⅰ期臨床試驗(yàn)完成對(duì)試驗(yàn)藥物的安全性和耐受性的初步評(píng)估,新藥研發(fā)會(huì)進(jìn)入Ⅱ期臨床試驗(yàn)階段。Ⅱ期主要目的是評(píng)估藥物在推薦劑量下的治療效果,并進(jìn)一步監(jiān)控藥物的毒性,防止過(guò)多的患者暴露在可能無(wú)效的治療中。其中Ⅱa期臨床試驗(yàn)的基本特征是早期無(wú)效終止和中期go/no-go決策,只有新療法在Ⅱ期試驗(yàn)階段表現(xiàn)出足夠強(qiáng)的有效性,研發(fā)才會(huì)進(jìn)入到耗時(shí)更長(zhǎng)、耗資巨大的Ⅲ期臨床試驗(yàn)。

目前國(guó)內(nèi)的Ⅰ期臨床試驗(yàn)已不再局限于傳統(tǒng)的3+3設(shè)計(jì),基于區(qū)間的BOIN、Keyboard和基于模型的CRM等貝葉斯適應(yīng)性設(shè)計(jì)方法也被統(tǒng)計(jì)專(zhuān)業(yè)人員、研究者所接受、掌握和應(yīng)用。著眼于Ⅱa期試驗(yàn)高效的設(shè)計(jì)方法,本文討論的BOP2設(shè)計(jì)是一種靈活的貝葉斯優(yōu)化設(shè)計(jì),該設(shè)計(jì)能夠同時(shí)處理簡(jiǎn)單(例如二元)和復(fù)雜(例如有序,嵌套和共同多)終點(diǎn)。設(shè)計(jì)使用Dirichlet-多項(xiàng)式模型統(tǒng)一適應(yīng)不同類(lèi)型的終點(diǎn)。且與Simon兩階段相比,BOP2設(shè)計(jì)可以多次中期觀察,在每個(gè)中期階段,通過(guò)評(píng)估事件的后驗(yàn)概率來(lái)做出go/no-go決策,在原假設(shè)下,對(duì)該決策概率進(jìn)行優(yōu)化,以最大程度地提高檢驗(yàn)效能或減少患者人數(shù)。模擬研究表明,較其他現(xiàn)存的貝葉斯Ⅱ期設(shè)計(jì),BOP2設(shè)計(jì)精確控制Ⅰ類(lèi)錯(cuò)誤率,保證患者風(fēng)險(xiǎn)最小化,具有更高的檢驗(yàn)效能及更低錯(cuò)誤地終止試驗(yàn)的風(fēng)險(xiǎn),彌補(bǔ)了貝葉斯設(shè)計(jì)和頻率設(shè)計(jì)之間的差距。此外,BOP2設(shè)計(jì)可以在試驗(yàn)設(shè)計(jì)階段便枚舉出終止邊界值。這些特性使得BOP2設(shè)計(jì)可供眾多用戶(hù)和監(jiān)管機(jī)構(gòu)使用,且易于實(shí)現(xiàn)。

這一高精度、對(duì)試驗(yàn)過(guò)程高安全保障、對(duì)患者受益最大化的方法將推動(dòng)中國(guó)早期臨床試驗(yàn)的高速發(fā)展,雖然中國(guó)的新藥臨床試驗(yàn)日漸擺脫程式化,逐漸與國(guó)際接軌,總體研發(fā)能力和監(jiān)管水平有了極大水平的提高,但是,早期新藥臨床試驗(yàn)因其特殊性和復(fù)雜性,無(wú)論是方案設(shè)計(jì)、試驗(yàn)管理以及最后的總結(jié)分析,仍然有非常大的提升空間,急需更多的研究人員發(fā)掘高效、高精度、高質(zhì)量的方法,并應(yīng)用在實(shí)踐當(dāng)中。

猜你喜歡
錯(cuò)誤率樣本量貝葉斯
限制性隨機(jī)試驗(yàn)中選擇偏倚導(dǎo)致的一類(lèi)錯(cuò)誤率膨脹*
醫(yī)學(xué)研究中樣本量的選擇
航空裝備測(cè)試性試驗(yàn)樣本量確定方法
Sample Size Calculations for Comparing Groups with Binary Outcomes
貝葉斯公式及其應(yīng)用
正視錯(cuò)誤,尋求策略
教師·中(2017年3期)2017-04-20 21:49:49
解析小學(xué)高段學(xué)生英語(yǔ)單詞抄寫(xiě)作業(yè)錯(cuò)誤原因
基于貝葉斯估計(jì)的軌道占用識(shí)別方法
一種基于貝葉斯壓縮感知的說(shuō)話(huà)人識(shí)別方法
電子器件(2015年5期)2015-12-29 08:43:15
降低學(xué)生計(jì)算錯(cuò)誤率的有效策略
偏关县| 永新县| 昭觉县| 越西县| 庆云县| 法库县| 中江县| 乌审旗| 上林县| 宜兰市| 邹城市| 丰原市| 黄骅市| 铁岭县| 恩平市| 平利县| 西乌| 文化| 昭苏县| 孟连| 鹤庆县| 千阳县| 惠东县| 彭泽县| 印江| 汨罗市| 兴国县| 台湾省| 湖北省| 环江| 进贤县| 玛曲县| 东辽县| 同德县| 庆元县| 兴义市| 万全县| 晋江市| 肥东县| 榆社县| 正定县|