国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Adaptive Elastic Net與加速失效時(shí)間模型的亞組識(shí)別方法的應(yīng)用拓展

2021-04-14 03:29:58韋紅霞劉穎欣黃福強(qiáng)安勝利
關(guān)鍵詞:樣本量亞組個(gè)數(shù)

韋紅霞,康 佩,劉穎欣,黃福強(qiáng),陳 征,安勝利

南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)系,廣東 廣州510515

近年來(lái),世界各地的監(jiān)管機(jī)構(gòu)和衛(wèi)生技術(shù)評(píng)估機(jī)構(gòu)越來(lái)越重視從試驗(yàn)(治療)中識(shí)別獲益的患者亞群,即亞組識(shí)別[1];當(dāng)傳統(tǒng)臨床隨機(jī)對(duì)照試驗(yàn)中組間療效無(wú)差異時(shí),通過(guò)亞組識(shí)別,若能識(shí)別出實(shí)際上在試驗(yàn)組中存在明顯獲益的亞組人群,則可以有效減輕疾病對(duì)該亞組人群的危害[2]。目前,國(guó)內(nèi)外亞組識(shí)別的研究已較多[3-5],但涉及生存數(shù)據(jù)亞組識(shí)別的研究仍較少?,F(xiàn)有生存數(shù)據(jù)亞組識(shí)別的研究,多是基于Cox模型[6-8],而使用此模型需要滿足等比例風(fēng)險(xiǎn)假定,但此假定有時(shí)不成立;對(duì)于高維的小樣本數(shù)據(jù),Cox模型也不夠穩(wěn)定。加速失效時(shí)間(AFT)模型已被證實(shí)適用于高刪失和高維數(shù)據(jù)[9],且無(wú)需滿足等比例風(fēng)險(xiǎn)假定,因此可考慮將AFT模型作為Cox的替代模型。此外考慮到協(xié)變量之間的相關(guān)性問(wèn)題,Engler和Li(2009)[10]提出了基于Elastic Net的懲罰AFT 模型。但Elastic Net 和其他懲罰模型(如lasso、嶺回歸)有一個(gè)共同的缺點(diǎn):不能確保變量選擇的一致性和系數(shù)估計(jì)的漸近正態(tài)性,即不具有Oracle性質(zhì)[11]。針對(duì)此問(wèn)題,Zou 和Zhang(2009)[12]提出了Adaptive Elastic Net。Khan&Shaw(2016)[13]也基于結(jié)合Adaptive Elastic Net的AFT模型,對(duì)高維數(shù)據(jù)進(jìn)行變量選擇。目前這些懲罰模型的應(yīng)用局限于篩選協(xié)變量[9,10,13],Kang(2019)[14]改進(jìn)常規(guī)應(yīng)用中的適應(yīng)性正則化模型,將基于Adaptive Elastic Net的AFT模型應(yīng)用于生存數(shù)據(jù)進(jìn)行亞組識(shí)別,并探討了其在不同的樣本量、刪失率、亞組比例下的性能。本文在Kang(2019)所研究的基礎(chǔ)上進(jìn)行拓展,進(jìn)一步探討協(xié)變量間相關(guān)性、獲益亞組與非獲益亞組間的療效差異、樣本量與待選協(xié)變量個(gè)數(shù)比例、生存數(shù)據(jù)的參數(shù)分布以及適應(yīng)設(shè)計(jì)兩個(gè)階段的檢驗(yàn)水準(zhǔn)分配等對(duì)亞組識(shí)別的影響。

1 方法

生存數(shù)據(jù)亞組識(shí)別分析策略包括3個(gè)部分:亞組相關(guān)協(xié)變量篩選,亞組選擇和臨床效用性評(píng)價(jià)。

1.1 亞組相關(guān)協(xié)變量篩選

1.1.1 單變量AFT模型 假設(shè)臨床試驗(yàn)中,包含一個(gè)試驗(yàn)組和一個(gè)對(duì)照組,且患者中存在兩個(gè)亞組:獲益亞組(g+)和非獲益亞組(g-)。令p 表示待選協(xié)變量個(gè)數(shù);n表示樣本量;TR 表示組別變量(TR=0,對(duì)照組;TR=1,治療組);xij為第i 個(gè)患者的第j 個(gè)協(xié)變量;zij=xij·TRi為第i 個(gè)患者的第j 個(gè)協(xié)變量與組別變量的交互項(xiàng);時(shí)間Ti=min(ti,ci),其中ti和ci分別是出現(xiàn)終點(diǎn)事件和刪失的時(shí)間;δi是第i 個(gè)患者的結(jié)局指示變量δi=I(ti≤ci),當(dāng)?shù)趇 個(gè)患者出現(xiàn)終點(diǎn)事件則δi=1,當(dāng)?shù)趇個(gè)患者刪失則δi=0。

為評(píng)估亞組之間治療效果的異質(zhì)性,對(duì)治療和亞組之間交互作用進(jìn)行檢驗(yàn)是一種常用的統(tǒng)計(jì)方法。本研究中,擬合了單變量AFT模型;每次只納入一個(gè)協(xié)變量xij、治療變量TRi,以及交互效應(yīng)zij:

其中,Yi表示觀察結(jié)局,Yi=log(Ti),其中Ti是第i 個(gè)患者生存時(shí)間;σ 是尺度參數(shù); εij是隨機(jī)誤差;β1j是協(xié)變量的回歸系數(shù);β2j是治療變量的回歸系數(shù);β3j是協(xié)變量與治療變量交互項(xiàng)的回歸系數(shù)。若交互項(xiàng)有統(tǒng)計(jì)學(xué)意義,則xij為亞組相關(guān)協(xié)變量。

有研究表明同時(shí)納入?yún)f(xié)變量xij與組別變量TR 主效應(yīng)時(shí),評(píng)估交互作用的效能往往較差[15-16]。因此,學(xué)者Freidlin 和Simon[17]提出了剔除協(xié)變量xij主效應(yīng)的方法。本研究所對(duì)應(yīng)的模型為:

此外,若指定隨機(jī)誤差項(xiàng)εij的分布,則稱(chēng)為參數(shù)加速失效時(shí)間模型。若誤差項(xiàng)服從標(biāo)準(zhǔn)正態(tài)分布、極值分布(尺度參數(shù)σ =1)、極值分布(尺度參數(shù)σ ≠1)、logistic分布,則分別對(duì)應(yīng)著對(duì)數(shù)正態(tài)AFT模型、指數(shù)AFT模型、Weibull AFT模型、logistic AFT模型。Cox和Oakes(1984)[18]認(rèn)為Weibull分布同時(shí)具有比例風(fēng)險(xiǎn)和加速失效時(shí)間的性質(zhì);Vanderhoef(1982)[19]和Scheme(2003)[20]、Sayehmir(2008)[21]等 學(xué) 者 的 研 究 表 明Weibull回歸模型的擬合效果較好。因此本文的單變量AFT 模型考慮了Weibull 回歸模型,即f( ε )=exp(ε-exp(ε))。

此處的單變量模型,通過(guò)Benjamini-Hochberg 算法控制錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)[22],以實(shí)現(xiàn)多重校正。

記U={x1,x2,…,xk}為預(yù)先指定的錯(cuò)誤發(fā)現(xiàn)率q=0.05 時(shí),單變量AFT模型所篩選的亞組相關(guān)協(xié)變量的子集。

1.1.2 懲罰AFT模型 上述的單變量模型,模型每次只考慮一個(gè)協(xié)變量,沒(méi)有考慮協(xié)變量之間的相關(guān)性問(wèn)題;若建立多變量模型,則得到:

若在上式中剔除協(xié)變量xj主效應(yīng),則得到:

但是上述的兩個(gè)模型通常只適合于協(xié)變量較少而樣本量較多的數(shù)據(jù);對(duì)于協(xié)變量數(shù)量超過(guò)樣本量的數(shù)據(jù),特別是高維的小樣本(HDLSS)數(shù)據(jù),常規(guī)模型不再適用。針對(duì)這個(gè)問(wèn)題,Kang(2019)在上述模型參數(shù)求解 時(shí) 引 入 了Adaptive Elastic Net[14]。最 終Adaptive Elastic Net結(jié)合AFT模型的目標(biāo)函數(shù)為:

1.2 亞組選擇

亞組選擇是指在患者人群中識(shí)別出對(duì)特定治療手段有較好療效的亞組人群g+。對(duì)于生存數(shù)據(jù),其分為兩步:首先基于上述模型所篩選的亞組相關(guān)協(xié)變量計(jì)算每個(gè)患者的預(yù)測(cè)得分;其次是尋找預(yù)測(cè)得分的截?cái)帱c(diǎn),把患者分成g+和g-兩個(gè)亞組。采用Hinkley等[23]學(xué)者提出的change-point算法尋找截?cái)帱c(diǎn)[24]。

1.3 臨床效用性評(píng)價(jià)

亞組分析中,二階段適應(yīng)性設(shè)計(jì)常被用以評(píng)估治療對(duì)亞組人群的有效性[25-26]。第一階段,按檢驗(yàn)水準(zhǔn)α1,比較全部患者試驗(yàn)組和對(duì)照組的治療效應(yīng);如果P ≤α1,則結(jié)論是治療對(duì)全部患者有效;否則繼續(xù)第二階段,按α2,比較獲益亞組人群g+中試驗(yàn)組和對(duì)照組的治療效應(yīng);如果P ≤α2,則認(rèn)為治療對(duì)獲益亞組人群g+有效(圖1)。檢驗(yàn)水準(zhǔn)α=α1+α2(α 取值為0.05)。

圖1 二階段適應(yīng)性設(shè)計(jì)[14]Fig.1 Two-stage adaptive design[14].

2 模擬與實(shí)例

2.1 模擬

其中,截距β0,取值為2;σ 是度量參數(shù),其取值為1;εi是隨機(jī)誤差,并假定其服從廣義F-分布,例如Weibull分布、指數(shù)分布、對(duì)數(shù)正態(tài)分布、對(duì)數(shù)logistics分布、gamma分布等。根據(jù)前期研究[14],得知回歸系數(shù)β2取為3.2,β3j取-0.04。

記是否包含協(xié)變量主效應(yīng)的公式分別為Eq_in、Eq_ex,考慮4種亞組相關(guān)協(xié)變量篩選模型:是否包含協(xié)變量主效應(yīng)的單變量模型和懲罰模型,記為(“Univariate,Eq_in/Eq_ex”和“Penalized,Eq_in/Eq_ex”)。亞組選擇分類(lèi)器基于change-point算法。

存在亞組的條件下,模擬研究適應(yīng)性設(shè)計(jì)的檢驗(yàn)效能。每個(gè)數(shù)據(jù)集中,二階段適應(yīng)性設(shè)計(jì)中的第一階段檢驗(yàn)有統(tǒng)計(jì)學(xué)意義(P <α1),或第二階段檢驗(yàn)有統(tǒng)計(jì)學(xué)意義(P <α2),則適應(yīng)性設(shè)計(jì)的檢驗(yàn)效能記為1,否則記為0。通過(guò)模擬1000次,計(jì)算平均的檢驗(yàn)效能。

各種情形設(shè)置如下:(1)設(shè)置低維、高維數(shù)據(jù);分別產(chǎn)生樣本量不超過(guò)協(xié)變量個(gè)數(shù)(n ≤p)、樣本量遠(yuǎn)大于協(xié)變量個(gè)數(shù)(n >p)數(shù)據(jù);其中,樣本量不超過(guò)協(xié)變量個(gè)數(shù)(n ≤p)的數(shù)據(jù)中待選協(xié)變量個(gè)數(shù)p=600,樣本量遠(yuǎn)大于協(xié)變量個(gè)數(shù)(n >p)的數(shù)據(jù)中p=100,亞組相關(guān)協(xié)變量個(gè)數(shù)k 均為10;(2)設(shè)置不同相關(guān)程度的協(xié)變量;亞組相關(guān)協(xié)變量間的相關(guān)性和非亞組相關(guān)協(xié)變量間的相關(guān)性設(shè)置為r=0、0.3、0.5;(3)調(diào)整適應(yīng)性設(shè)計(jì)中兩個(gè)階段的檢驗(yàn)水準(zhǔn)α1和α2;由于所確定亞組治療效果可能比整個(gè)研究人群大得多,因此在嚴(yán)格的顯著性水準(zhǔn)下對(duì)第二階段的亞組進(jìn)行分析仍可能具有較大的檢驗(yàn)效能。所以考察了以下幾種不同的組合(α1,α2)=(0.015,0.035),(0.02,0.03),(0.025,0.025),(0.03,0.02),(0.035,0.015),(0.04,0.01);(4)在治療僅對(duì)獲益亞組g+有效(u00=u10=u01<u11)的情況下,選取不同的回歸系數(shù)β2和β3j的取值;其中,β2的取值越大,代表獲益亞組與非獲益亞組間的治療效果差異越大;此處考察如下幾種組合(β2,β3j)=(0.8,-0.01),(1.6,-0.02),(2.4,-0.03),(3.2,-0.04),(4.0,-0.05),(4.8,-0.06);這幾種組合下均是u00=u10=u01=2;當(dāng)β1=0.8、1.6、2.4、3.2、4.0、4.8時(shí),u11=2.2、2.4、2.6、2.8、3.0、3.2;(5)此前Kang的研究和以上研究中待選協(xié)變量個(gè)數(shù)為100和600,選取設(shè)置可能不夠嚴(yán)謹(jǐn)、客觀。本研究考慮待選協(xié)變量個(gè)數(shù)與樣本量(n=400)的不同比例(0.25∶1,0.5∶1,1∶1,1.5∶1,2∶1,2.5∶1)下,模型的檢驗(yàn)效能表現(xiàn);(6)研究模擬產(chǎn)生生存時(shí)間的AFT模型的隨機(jī)誤差εi的不同分布(指數(shù)分布、極值分布、對(duì)數(shù)正態(tài)分布)對(duì)模型的影響。除了情形(3)以外,其他情形中α1=0.03、α2=0.02;(7)所有模擬設(shè)定樣本量為400,刪失率為30%,亞組比例為20%。

2.1.2 模擬結(jié)果 不同情形下模型在適應(yīng)性設(shè)計(jì)中的檢驗(yàn)效能如圖2~4 所示。

由圖2可知,圖2A中隨著協(xié)變量間相關(guān)性的提高,各模型的檢驗(yàn)效能均呈平穩(wěn)的狀態(tài)。圖2B中,適應(yīng)性設(shè)計(jì)兩個(gè)階段的檢驗(yàn)水準(zhǔn)不同的組合(α1,α2)=(0.015,0.035),(0.02,0.03),(0.025,0.025),(0.03,0.02),(0.035,0.015),(0.04,0.01)下,不含協(xié)變量主效應(yīng)的懲罰性AFT模型(Penalized,Eq_ex)的檢驗(yàn)效能呈現(xiàn)平穩(wěn)的狀態(tài),含主效應(yīng)的單變量模型(Univariate,Eq_in)的檢驗(yàn)效能呈現(xiàn)緩慢上升的狀態(tài);其他兩個(gè)模型在α1取值為0.015~0.03時(shí)檢驗(yàn)效能也是平穩(wěn)的狀態(tài),但在α1取值為0.035時(shí)達(dá)到最高點(diǎn),而在0.04時(shí)模型的檢驗(yàn)效能下降8%左右。圖2C 中,表現(xiàn)最好的也是“Penalized,Eq_in”與“Univariate,Eq_ex”。各個(gè)模型的檢驗(yàn)效能隨著回歸系數(shù)β2的取值增大而增大;在n >p的數(shù)據(jù)中,當(dāng)β2的取值為0.8~2.4 時(shí),“Penalized,Eq_in”與“Univariate,Eq_ex”的檢驗(yàn)效能較接近;而當(dāng)β2的取值大于2.4時(shí),“Univariate,Eq_ex”的檢驗(yàn)效能高于“Penalized,Eq_in”。在n ≤p 的數(shù)據(jù)中,當(dāng)β2的取值為0.8 和3.2 時(shí),“Penalized,Eq_in”與“Univariate,Eq_ex”的檢驗(yàn)效能較接近;而當(dāng)β2的取值為1.6~2.4時(shí),“Penalized,Eq_in”的檢驗(yàn)效能高于“Univariate,Eq_ex”;而當(dāng)β2的取值大于3.2時(shí),“Univariate,Eq_ex”的檢驗(yàn)效能高于“Penalized,Eq_in”。即,當(dāng)β2的取值(獲益亞組與非獲益亞組間的治療效果差異)較小時(shí),“Penalized,Eq_in”較 有 優(yōu) 勢(shì),其 他 情 況 下 則 是“Univariate,Eq_ex”的效果更好。

圖2 不同情形下懲罰AFT模型在適應(yīng)性設(shè)計(jì)的檢驗(yàn)效能Fig.2 Power of AFT models in subgroup identification in different scenarios. In panel A, the correlation among covariates are set to be 0, 0.3, 0.5 respectively. In panel B, Alpha1 is the significance level α1 of the 1st stage of adaptive design.In panel C,Beta is the coefficient β2.

由圖3可知,當(dāng)待選協(xié)變量個(gè)數(shù)與樣本量(n=400)的 比 例 為0.25∶1,0.5∶1,1∶1,1.5∶1,2∶1,2.5:1 時(shí),“Penalized,Eq_ex”的檢驗(yàn)效能較低且呈現(xiàn)平穩(wěn)的趨勢(shì)。其他三個(gè)模型的檢驗(yàn)效能,在比例為0.25∶1,0.5∶1,1∶1時(shí)緩慢下降,下降了5%~10%;當(dāng)比例為1.5∶1,2∶1,2.5∶1時(shí),平緩下降。即樣本量與待選協(xié)變量個(gè)數(shù)的比例不影響“Univariate,Eq_in”的檢驗(yàn)效能,而其他三個(gè)模型的檢驗(yàn)效能會(huì)隨著比例的增加而緩慢下降;當(dāng)比例小于1時(shí),“Univariate,Eq_ex”的效能更高;其他情況下則是“Penalized,Eq_in”的效能更高。

由圖4可知,相比于指數(shù)AFT模型產(chǎn)生生存數(shù)據(jù)時(shí)模型的檢驗(yàn)效能,Weibull AFT模型產(chǎn)生數(shù)據(jù)時(shí),各個(gè)模型的檢驗(yàn)效能大幅下降至10%~20%左右。而對(duì)數(shù)正態(tài)AFT模型產(chǎn)生生存數(shù)據(jù)時(shí),各個(gè)模型的檢驗(yàn)效能都提高了,差距隨著刪失率的增大而增大;而且“Univariate,Eq_in”的檢驗(yàn)效能超越了“Penalized,Eq_in”。其中,產(chǎn)生生存時(shí)間的模型類(lèi)型對(duì)單變量模型的影響最大;對(duì)數(shù)正態(tài)AFT模型產(chǎn)生生存數(shù)據(jù)時(shí),“Univariate,Eq_ex”的檢驗(yàn)效能提高了0%~20%,而“Univariate,Eq_in”的檢驗(yàn)效能提高了10%~25%,懲罰模型的效能提高了5%左右。產(chǎn)生生存數(shù)據(jù)的模型對(duì)單變量模型的影響較大,可能是因?yàn)閱巫兞磕P褪菂?shù)模型,比較容易受到生存數(shù)據(jù)的參數(shù)分布的影響。

圖3 不同的協(xié)變量個(gè)數(shù)下懲罰AFT模型在適應(yīng)性設(shè)計(jì)的檢驗(yàn)效能Fig.3 Power of penalized AFT model in subgroup identification in different number of sensitive covariates.Ratio is the ratio of the number of covariates to the sample size(0.25∶1,0.5∶1,1∶1,1.5∶1,2∶1,2.5∶1).The dotted line with inverted triangle (reference line)represents the powers of conventional design. The number of sensitive covariates is 10.

2.2 實(shí)例

圖4 生存時(shí)間參數(shù)分布不同時(shí)懲罰AFT模型在適應(yīng)性設(shè)計(jì)的檢驗(yàn)效能Fig.4 Power of penalized AFT model in subgroup identification when the parameter distribution of survival time differs. "Exponential" corresponds to exponential AFT model, and "Weibull"corresponds to WeibullAFT model,and"Lognormal"corresponds to lognormalAFT model.

數(shù)據(jù)來(lái)自艾滋病臨床試驗(yàn)組175(ATCG 175)研究[27]。在這項(xiàng)研究中,2139名艾滋病毒感染者被隨機(jī)分到4個(gè)不同的治療組:齊多夫定(ZDV)單一療法、ZDV+地達(dá)諾新(ddI)、ZDV+扎西他賓(zal)和ddI單一療法。本研究選取聯(lián)合用藥組(ZDV+ddI)和單獨(dú)用藥組(ddI)的病人作為研究對(duì)象,兩組病人的基線協(xié)變量均衡可比[31]。其中,有522名感染者接受了ZDV+ddI治療,559人接受了ddI單一療法。兩組中的刪失率分別是80.27%和77.10%。出現(xiàn)以下終點(diǎn)事件的時(shí)間作為觀察結(jié)局:(i)CD4 T細(xì)胞計(jì)數(shù)至少下降50%;(ii)指示向艾滋病進(jìn)展的事件;(iii)死亡。協(xié)變量包括患者的年齡和體質(zhì)量、CD4和CD8計(jì)數(shù)、Karnofsky得分、先前接受抗逆轉(zhuǎn)錄病毒療法的天數(shù)、是否患血友病、同性性行為、靜脈注射吸毒史、研究前接受非齊多夫定抗逆轉(zhuǎn)錄病毒治療、在治療開(kāi)始前30天內(nèi)使用齊多夫定、在治療開(kāi)始前使用齊多夫定、種族、性別、抗逆轉(zhuǎn)錄病毒史、有無(wú)癥狀指標(biāo)。前6個(gè)協(xié)變量為連續(xù)性變量,其他為二分類(lèi)變量。

經(jīng)檢驗(yàn)滿足比例風(fēng)險(xiǎn)假定(P=0.479),兩組生存曲線比較選用log-rank方法,以及建立Cox模型計(jì)算風(fēng)險(xiǎn)比及其95%可信區(qū)間[28]。兩組間生存曲線沒(méi)有統(tǒng)計(jì)學(xué)差異(HR=0.84,P=0.181)(圖5)[28]。

雖然尚不能認(rèn)為ZDV+ddI組的治療效果好于ddI組。但在ZDV+ddI組的病人中,可能存在獲益亞組,因此考慮用不含協(xié)變量主效應(yīng)的單變量模型(Univariate,Eq_ex)以及含協(xié)變量主效應(yīng)的懲罰模型(Penalized,Eq_in),再結(jié)合十折交叉驗(yàn)證(10-fold cross validation)對(duì)該數(shù)據(jù)進(jìn)行亞組分析,其中,單變量模型通過(guò)Benjamini-Hochberg 算法控制錯(cuò)誤發(fā)現(xiàn)率(FDR)。

亞組識(shí)別結(jié)果如下所示。表1中,第3~4行展現(xiàn)了對(duì)照組與試驗(yàn)組的中位生存時(shí)間和組內(nèi)樣本量。適應(yīng)性設(shè)計(jì)的第一階段(α1=0.03)的結(jié)果(第1行)顯示,對(duì)照組和試驗(yàn)組間生存時(shí)間沒(méi)有統(tǒng)計(jì)學(xué)差異(P=0.181);因此,繼續(xù)適應(yīng)設(shè)計(jì)的第二階段分析(α2=0.02),結(jié)果(第2 行)顯示:“Univariate, Eq_ex”和“Penalized,Eq_in”所識(shí)別的獲益亞組中的兩組間差異比較的P 值分別為0.369和0.549。圖6、7給出了兩個(gè)模型所識(shí)別的4個(gè)亞組的生存曲線圖,結(jié)果顯示試驗(yàn)組中獲益人群(T+)和對(duì)照組中獲益人群(C+)之間的治療效果沒(méi)有差異(圖6),即兩種療法的獲益人群相同,但“Univariate,Eq_ex”所識(shí)別的獲益人群(T+和C+)的治療效果顯著優(yōu)于非獲益人群(T-和C-)(P<0.001,圖7)。其中,“Univariate,Eq_ex”和“Penalized,Eq_in”所識(shí)別的獲益亞組分別為270+293=563 (52.08%)和141+183=324(29.97%)。

圖5 兩組間的生存曲線Fig.5 Survival curves of the ZDV+ddI group and ddI group.

表1 數(shù)據(jù)ACTG175的亞組識(shí)別結(jié)果Tab.1 Subgroup analysis of dataACTG175

3 討論

目前Adaptive Elastic Net與AFT模型的結(jié)合主要應(yīng)用于協(xié)變量篩選,Kang[14]的創(chuàng)新之處在于對(duì)其進(jìn)行改進(jìn)并應(yīng)用于生存數(shù)據(jù)的亞組識(shí)別。本文在此基礎(chǔ)上,進(jìn)一步探討了協(xié)變量間的相關(guān)性、獲益亞組與非獲益亞組間的治療效果差異、樣本量與待選協(xié)變量個(gè)數(shù)比例、生存數(shù)據(jù)的參數(shù)分布以及適應(yīng)設(shè)計(jì)兩個(gè)階段的檢驗(yàn)水準(zhǔn)分配的影響。

對(duì)于樣本量大于協(xié)變量個(gè)數(shù)(n >p)的數(shù)據(jù),在n較小、刪失率較高或者亞組比例較小等不利情況下,含主效應(yīng)的懲罰模型在亞組選擇上相對(duì)有優(yōu)勢(shì);而其他情況下,則是不含主效應(yīng)的單變量模型更優(yōu);對(duì)于n ≤p,含主效應(yīng)的懲罰模型在亞組選擇上相對(duì)有優(yōu)勢(shì)。此外,(0.035,0.015)可以作為二階段適應(yīng)形設(shè)計(jì)顯著性水準(zhǔn)的設(shè)置參考;協(xié)變量間的相關(guān)性不影響模型在適應(yīng)性設(shè)計(jì)中的檢驗(yàn)效能;生存數(shù)據(jù)的參數(shù)分布對(duì)單變量模型的影響較大,對(duì)懲罰模型的影響較小。獲益亞組與非獲益亞組間的治療效果(對(duì)數(shù)生存時(shí)間log(T))差異小于0.6(n >p 的數(shù)據(jù)中)或者小于0.8(n ≤p 的數(shù)據(jù)中)時(shí),基于Eq_in的懲罰模型較有優(yōu)勢(shì)。

實(shí)例數(shù)據(jù)分析中,模型“Univariate,Eq_ex”的亞組識(shí)別結(jié)果顯示,兩種療法的獲益人群差異無(wú)統(tǒng)計(jì)學(xué)意義。另外,不管是接受聯(lián)合用藥還是單獨(dú)用藥,所識(shí)別的獲益人群的治療效果都優(yōu)于非獲益人群。這可能是由于該數(shù)據(jù)中樣本量n 大于協(xié)變量個(gè)數(shù)p ,模型“Univariate,Eq_ex”的檢驗(yàn)效能更高。

前期研究結(jié)果顯示,在預(yù)先設(shè)定的檢驗(yàn)水準(zhǔn)(α1=0.03,α2=0.02)下,亞組選擇中表現(xiàn)最好的模型在適應(yīng)性設(shè)計(jì)中的檢驗(yàn)效能并未顯示出優(yōu)勢(shì),提示這可能與兩個(gè)階段檢驗(yàn)水準(zhǔn)的設(shè)定有關(guān)。本研究發(fā)現(xiàn),固定樣本量(400),刪失率(30%)和亞組比例(20%)時(shí),(α1,α2)=(0.035,0.015)時(shí)亞組識(shí)別能力較好的兩個(gè)模型(Univariate,Eq_ex、Penalized,Eq_in)的檢驗(yàn)效能最高,但樣本量、刪失率和亞組比例等因素如何影響適應(yīng)性設(shè)計(jì)檢驗(yàn)水準(zhǔn)的設(shè)置有待進(jìn)一步研究。

當(dāng)治療有效且存在獲益亞組時(shí),我們僅模擬了治療對(duì)獲益亞組人群g+有效的情況(u00=u10=u01<u11);后續(xù)可拓展到治療對(duì)獲益亞組g+和非獲益亞組g-都有效,但獲益亞組g+的效果更好(u00=u10<u01<u11)的情形。另外,本研究提出的亞組識(shí)別方法僅限于識(shí)別兩個(gè)亞組,即獲益亞組和非獲益亞組;后續(xù)可延伸到識(shí)別三個(gè)及以上亞組的情況。

Cox比例風(fēng)險(xiǎn)模型和AFT模型是分析生存數(shù)據(jù)最為常用的兩種模型[28-29],這兩種模型潛在的假設(shè)是:在隨訪時(shí)間足夠長(zhǎng)的情況下,每個(gè)病人最終都將經(jīng)歷終點(diǎn)事件。然而,近年來(lái),隨著治療效果的提高,臨床試驗(yàn)中所收集到的生存數(shù)據(jù)常常存在被“治愈”的患者,即這部分患者(獲益亞組)不可能發(fā)生相應(yīng)的終點(diǎn)事件[28,30-32]。換言之,生存數(shù)據(jù)中患者的獲益會(huì)存在兩種情況,第一種是患者僅是生存時(shí)間延長(zhǎng)了,最終仍會(huì)發(fā)生結(jié)局事件;第二種是患者治愈了,最終不會(huì)發(fā)生結(jié)局事件[33-36]。本研究?jī)H考慮了第一種情況,對(duì)于第二種情況下疾病的治療,我們更關(guān)注的不是生存時(shí)間的延長(zhǎng)而是治愈率的提高,若仍然使用傳統(tǒng)的Cox比例風(fēng)險(xiǎn)模型或者AFT模型進(jìn)行分析,可能會(huì)得出不恰當(dāng)?shù)慕Y(jié)論,因此后續(xù)擬將本研究所提出的分析策略拓展到潛在的亞組人群為治愈亞組的情形。

圖6 四個(gè)亞組中不含協(xié)變量主效應(yīng)的單變量AFT模型(A)、含協(xié)變量主效應(yīng)的懲罰AFT模型(B)所識(shí)別的亞組生存曲線圖Fig.6 Survival curves for subgroups identified by Univariate,Eq_ex(A),and Penalized,Eq_in(B).The four subgroups correspond to responder in ZDV+ddI group(T+),non-responder in ZDV+ddI group(T-),responder in ddI group(C+)and non-responder in ddI group(C-).

圖7 兩個(gè)亞組中不含協(xié)變量主效應(yīng)的單變量AFT模型(A)、含協(xié)變量主效應(yīng)的懲罰AFT模型(B)所識(shí)別的亞組生存曲線圖Fig.7 Survival curves for 4 subgroups identified by Univariate,Eq_ex(A),and Penalized,Eq_in(B).The two subgroups correspond to responder in both arms(T+and C+),non-responder in in both arms(T-and C-).

猜你喜歡
樣本量亞組個(gè)數(shù)
基于Meta分析的黃酮類(lèi)化合物對(duì)奶牛生產(chǎn)性能和血清免疫指標(biāo)影響的研究
慢性阻塞性肺疾病患者膈肌移動(dòng)度分析
槭葉鐵線蓮亞組的研究進(jìn)展
園林科技(2021年3期)2022-01-19 03:17:32
醫(yī)學(xué)研究中樣本量的選擇
怎樣數(shù)出小正方體的個(gè)數(shù)
冠心病患者腸道菌群變化的研究 (正文見(jiàn)第45 頁(yè))
等腰三角形個(gè)數(shù)探索
怎樣數(shù)出小木塊的個(gè)數(shù)
航空裝備測(cè)試性試驗(yàn)樣本量確定方法
怎樣數(shù)出小正方體的個(gè)數(shù)
和田县| 金坛市| 雷山县| 斗六市| 健康| 丹江口市| 安吉县| 巴彦县| 昭苏县| 鹿邑县| 昭平县| 类乌齐县| 津南区| 祁门县| 许昌市| 水富县| 庆阳市| 诸城市| 宜宾市| 普格县| 华亭县| 桃园市| 呼图壁县| 容城县| 疏附县| 纳雍县| 于都县| 乾安县| 卓尼县| 宜春市| 香港| 修武县| 长乐市| 岳普湖县| 衡南县| 平遥县| 襄城县| 久治县| 盐池县| 修文县| 桓台县|