醫(yī)療器械臨床試驗(yàn)單組目標(biāo)值法樣本量計(jì)算不同方法的比較

2023-11-10 13:11:14曾治宇

中國食品藥品監(jiān)管 2023年10期

關(guān)鍵詞：正態(tài)目標(biāo)值樣本量

曾治宇

波科國際醫(yī)療貿(mào)易（上海）有限公司

李青

波科國際醫(yī)療貿(mào)易（上海）有限公司

張曉星

波科國際醫(yī)療貿(mào)易（上海）有限公司

彭琳

波科國際醫(yī)療貿(mào)易（上海）有限公司

曾理

波科國際醫(yī)療貿(mào)易（上海）有限公司

張?jiān)?/p>

波科國際醫(yī)療貿(mào)易（上海）有限公司

韓磊

波科國際醫(yī)療貿(mào)易（上海）有限公司

近年來，單組目標(biāo)值法的臨床研究設(shè)計(jì)日益受到關(guān)注，特別是在醫(yī)療器械的臨床試驗(yàn)領(lǐng)域[1]。計(jì)量資料的單組目標(biāo)值法的樣本量計(jì)算方法較為一致，而對(duì)于計(jì)數(shù)資料，樣本量計(jì)算的方法仍有不同的考慮。

二分類計(jì)數(shù)資料的單組目標(biāo)值法的本質(zhì)是單樣本率與已知總體率的比較，即事先確定一個(gè)目標(biāo)值π0（總體率），設(shè)定顯著性水平α（通常為單側(cè)檢驗(yàn)，取值0.025）和檢驗(yàn)效能1-β（β通常取值0.2 或0.1），然后將本研究組預(yù)計(jì)達(dá)到的結(jié)果π1（樣本率）與之比較，從而獲得樣本量。假設(shè)檢驗(yàn)時(shí)，如果是高優(yōu)指標(biāo)（如治療成功率），當(dāng)π1的1-2α可信區(qū)間的下限不小于π0時(shí)則拒絕無效假設(shè)，接受π1≥π0，低優(yōu)指標(biāo)（如并發(fā)癥發(fā)生率）同理。

目前單樣本率比較的樣本量計(jì)算通常有6 種方法：

（1）正態(tài)近似法A。Chow等[2]推薦的基于正態(tài)近似法的樣本量計(jì)算公式為：

其中，π0和π1分別為總體率（目標(biāo)值）和樣本率（期望值），Zα和Zβ分別為α和β所對(duì)應(yīng)的標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)。

（2）正態(tài)近似法B。《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》（第4 版）[3]中推薦使用的計(jì)算公式為：

（3）通用法?！夺t(yī)學(xué)統(tǒng)計(jì)學(xué)》（第3 版）[4]、中國臨床試驗(yàn)生物統(tǒng)計(jì)學(xué)組發(fā)表的《單組目標(biāo)值臨床試驗(yàn)的統(tǒng)計(jì)學(xué)考慮》[5]及2018年原國家食品藥品監(jiān)督管理總局發(fā)布的《醫(yī)療器械臨床試驗(yàn)設(shè)計(jì)指導(dǎo)原則》[6]等推薦使用的計(jì)算公式為：

（4）反正弦法。當(dāng)π0或π1接近0 或1 時(shí)正態(tài)性較差，宜考慮數(shù)據(jù)轉(zhuǎn)換，根據(jù)平方根反正弦轉(zhuǎn)換的樣本量計(jì)算公式為[4]：

（5）確切標(biāo)準(zhǔn)法。使用基于二項(xiàng)分布理論的確切概率法計(jì)算樣本量[7]。由于單樣本率確切概率法獲得的樣本量與檢驗(yàn)效能非單調(diào)遞增[8-9]，會(huì)產(chǎn)生一個(gè)常規(guī)的結(jié)果和一個(gè)較為保守的結(jié)果，前者即為確切標(biāo)準(zhǔn)法。

（6）確切保守法。方法（5）中產(chǎn)生一個(gè)較為保守結(jié)果的方法即為確切保守法。

這6 種樣本量計(jì)算的方法孰優(yōu)孰劣，具體的適用條件如何，尚無系統(tǒng)的研究。本研究旨在利用計(jì)算機(jī)模擬分析，考察不同方法計(jì)算的樣本量及其相應(yīng)的最低成功率、檢驗(yàn)效能，探索不同方法的使用條件，為實(shí)際應(yīng)用中方法的選擇提供依據(jù)。

1 方法

1.1 構(gòu)建π0 和π1

構(gòu)建π0從0.01 至0.99，按0.01遞增。π1比π0分別增加0.01，0.05 及0.1。低優(yōu)指標(biāo)可根據(jù)率的對(duì)稱性轉(zhuǎn)化為高優(yōu)指標(biāo)，比如某研究的并發(fā)癥發(fā)生率目標(biāo)值為10%，預(yù)計(jì)研究組的并發(fā)癥發(fā)生率可降至5%，可將低優(yōu)指標(biāo)（并發(fā)癥發(fā)生率）轉(zhuǎn)化為高優(yōu)指標(biāo)（治療成功率），即治療成功率的目標(biāo)值為90%，預(yù)計(jì)研究組可提高至95%。為方便起見，本研究僅考察高優(yōu)指標(biāo)。

1.2 不同樣本量計(jì)算方法的評(píng)價(jià)

本研究的評(píng)價(jià)指標(biāo)包括樣本量、最低成功率和檢驗(yàn)效能。一般來說，在滿足α及β的情況下，樣本量越小越好；檢驗(yàn)效能則越高越好；而對(duì)于最低成功率，該值越高提示對(duì)產(chǎn)品應(yīng)用效果的要求越高，該值越低則在研究或生產(chǎn)質(zhì)控環(huán)節(jié)更易達(dá)到假設(shè)檢驗(yàn)的顯著性，獲得陽性結(jié)果。

1.2.1 樣本量計(jì)算

基于構(gòu)建的π0和π1，設(shè)定α=0.025（單側(cè)），β=0.2。根據(jù)正態(tài)近似法A、正態(tài)近似法B、通用法、反正弦法、確切標(biāo)準(zhǔn)法及確切保守法6 種方法的計(jì)算公式，分別計(jì)算各自所需的樣本量。

1.2.2 最低成功率

不失一般性，選擇π1=π0+0.1的情形，根據(jù)計(jì)算出的樣本量，編程計(jì)算求得所需的最小成功例數(shù)，即可獲得實(shí)際的成功率。所需的最小成功例數(shù)為滿足該成功率95%可信區(qū)間下限≥π0所需的最小例數(shù)。95%可信區(qū)間的構(gòu)建需與樣本量計(jì)算的方法一致，即正態(tài)近似法及通用法采用正態(tài)近似的方法構(gòu)建，反正弦法采用平方根反正弦轉(zhuǎn)換后再進(jìn)行正態(tài)近似的方法構(gòu)建，而確切標(biāo)準(zhǔn)法和確切保守法根據(jù)二項(xiàng)分布的理論構(gòu)建（Clopper-Pearson 可信區(qū)間）。

1.2.3 檢驗(yàn)效能

不失一般性，選擇π1=π0+0.1的情形，采用計(jì)算機(jī)模擬計(jì)算的方法獲得檢驗(yàn)效能。根據(jù)已知樣本量及預(yù)計(jì)成功率π1，進(jìn)行二項(xiàng)分布概率抽樣獲得成功例數(shù)，重復(fù)10 000 次，統(tǒng)計(jì)成功例數(shù)≥所需最小成功例數(shù)的次數(shù)，除以重復(fù)次數(shù)計(jì)算所得即為檢驗(yàn)效能。

1.3 統(tǒng)計(jì)學(xué)分析

本研究的編程及統(tǒng)計(jì)分析均使用R語言 v3.6.2 和Rstudio平臺(tái) v1.2.5033，使用的R 語言包有proportion、pwr、TrialSize 及gsDesign。

1.4 實(shí)例分析

實(shí)例1：《人工耳蝸植入系統(tǒng)臨床試驗(yàn)指導(dǎo)原則》[10]中，根據(jù)臨床經(jīng)驗(yàn)，開機(jī)12 個(gè)月后，產(chǎn)品的總體有效率需至少達(dá)到70%方可被臨床接受（即目標(biāo)值為70%）。假設(shè)被試驗(yàn)產(chǎn)品的總體有效率可以達(dá)到85%，計(jì)算在雙側(cè)顯著性水平0.05、把握度80%的情況下的樣本量。

實(shí)例2：劉江美等[8]的研究中，已知總體率π0=0.07，預(yù)期的總體率π1=0.03，設(shè)定α=0.05（雙側(cè)），檢驗(yàn)效能80%，計(jì)算樣本量。該例子可驗(yàn)證低優(yōu)指標(biāo)的情況。

實(shí) 例3：設(shè) 定π0=0.1，π1=0.2，可驗(yàn)證一下π0＜0.5的情形。

實(shí)例4：一項(xiàng)全皮下植入型心律轉(zhuǎn)復(fù)除顫器（subcutaneous implantable cardioverter defibrillator，S-ICD）上市后研究[11-12]中，目標(biāo)值無不適當(dāng)電擊率為91.6%（相當(dāng)于不適當(dāng)電擊率為8.4%），S-ICD 預(yù)計(jì)可達(dá)到94.6%，α=0.05（單側(cè)），檢驗(yàn)效能90%，計(jì)算樣本量。

考慮到臨床研究中可能由于多種因素導(dǎo)致最終入選樣本量與計(jì)算樣本量存在差異，因此對(duì)于實(shí)例1和實(shí)例3，除了計(jì)算樣本量，還考察實(shí)際入選例數(shù)在計(jì)算樣本量±5范圍內(nèi)的最低成功率與檢驗(yàn)效能。

2 結(jié)果

2.1 樣本量

不同方法計(jì)算的樣本量比較見圖 1。由圖1 可知，相關(guān)規(guī)律并不十分明確，但大體趨勢為：①在π0＜0.5 時(shí)，正態(tài)近似法B 的樣本量最小，反正弦法次之，通用法與確切概率法較大且相互接近，正態(tài)近似法A 的樣本量最大。②在π0＞0.5 時(shí)，正態(tài)近似法A 的樣本量最小，其次為通用法、反正弦法與確切概率法且三者較為接近，而正態(tài)近似法B 的樣本量隨著π0的增加而逐漸超過確切保守法的樣本量。

圖1 不同方法計(jì)算的樣本量比較

圖2 不同方法的最低成功率比較

2.2 最低成功率

不同樣本量計(jì)算方法下的最低成功率比較見圖 2，可見只要π0不是太小，不同方法所需的最低成功率相差不大，且均略小于π1。

2.3 檢驗(yàn)效能

不同樣本量計(jì)算方法下的檢驗(yàn)效能比較見圖 3。由圖3 可知，不同方法的檢驗(yàn)效能差異較大。正態(tài)近似法B 和通用法在π0＜0.5時(shí)檢驗(yàn)效能不足，而在π0＞0.5 時(shí)檢驗(yàn)效能過度，且在π0趨向極端時(shí)，這種趨勢急劇增加；正態(tài)近似法A 的表現(xiàn)與之相反。反正弦法的檢驗(yàn)效能基本在0.8 附近，但較確切標(biāo)準(zhǔn)法顯得更為離散，特別是π0趨向1 時(shí)。確切保守法幾乎能確保檢驗(yàn)效能在0.8 以上，但在π0＞0.8 時(shí)，也表現(xiàn)為檢驗(yàn)效能明顯增加的趨勢。

圖3 不同方法的檢驗(yàn)效能比較

2.4 實(shí)例分析

不同方法計(jì)算的4 個(gè)實(shí)例的樣本量見表 1，提示不同方法的樣本量有一定的差異，但實(shí)例1、2、4 的樣本量均與原文獻(xiàn)[8,10-11]相對(duì)應(yīng)方法的結(jié)果相同（原文獻(xiàn)采用的方法分別為：實(shí)例1 為通用法，實(shí)例2 給出了確切標(biāo)準(zhǔn)法和確切保守法的結(jié)果，實(shí)例4 為確切保守法）。對(duì)于實(shí)例1 和實(shí)例3，計(jì)算樣本量±5 范圍內(nèi)的比較結(jié)果見表2，基本符合圖 1、圖2 和圖 3 的趨勢，樣本量和檢驗(yàn)效能的差異較為明顯，表現(xiàn)為：在π0＜0.5 時(shí)，正態(tài)近似法B 和通用法得到樣本量相對(duì)較小，但損失了檢驗(yàn)效能；π0＞0.5 時(shí)，正態(tài)近似法B 和通用法樣本量相對(duì)較大，檢驗(yàn)效能也比預(yù)設(shè)值高。不同方法的最低成功率差異不大，但較大的樣本量可以憑借略為較小的最低成功率通過檢驗(yàn)。另外，雖然最低成功率的差異總體不大，但在不同方法間仍然存在一些微小的差異，比如對(duì)于實(shí)例1，當(dāng)樣本量為69 時(shí)，正態(tài)近似法B 只需成功55 例（成功率79.7%）即可拒絕無效假設(shè)，而確切保守法需要成功57 例（成功率82.6%）。

表1 實(shí)例分析不同方法計(jì)算樣本量的結(jié)果

表2 不同方法計(jì)算樣本量的檢驗(yàn)效能比較

3 討論

本研究對(duì)單個(gè)率比較樣本量計(jì)算的6 種不同的方法作了較為系統(tǒng)地研究，6 種方法在π0及π1不接近0 或1 時(shí)表現(xiàn)較為相似，但π0逐漸接近0 時(shí)，正態(tài)近似法B 和通用法得到的樣本量相對(duì)較小，并逐漸損失了檢驗(yàn)效能；π0逐漸接近1 時(shí)，正態(tài)近似法B和通用法的樣本量相對(duì)較大，檢驗(yàn)效能也比預(yù)設(shè)值逐漸增高。正態(tài)近似法B 的表現(xiàn)趨勢與A 正好相反。從檢驗(yàn)效能來看，反正弦法的結(jié)果與確切標(biāo)準(zhǔn)法接近而顯得更為離散，而確切保守法幾乎能保證預(yù)設(shè)的檢驗(yàn)效能，但在π0＞0.5 時(shí)，確切保守法所需樣本量逐漸多于確切標(biāo)準(zhǔn)法。不同方法對(duì)最低成功率的要求總體相似，但存在微小差別。

目前臨床研究中對(duì)于這6 種不同方法的選用尚無明確的適用條件。本研究顯示通用法的整體表現(xiàn)優(yōu)于正態(tài)近似法，但這些方法本質(zhì)上都是基于正態(tài)近似的原理，當(dāng)π0趨于極端時(shí)，檢驗(yàn)效能有較大的變化?！夺t(yī)學(xué)統(tǒng)計(jì)學(xué)》（第3 版）[4]建議當(dāng)率偏向兩側(cè)時(shí)（π0＜0.3 或π0＞0.7）使用反正弦法，但本研究中π0在0.4～0.6 范圍內(nèi)時(shí)其檢驗(yàn)效能才可保持在0.8左右，該結(jié)果提示這些方法的臨床應(yīng)用仍具有一定局限性。也有學(xué)者[7,13-14]認(rèn)為nπ及n（1-π）＞5時(shí)，可以考慮正態(tài)近似法，但是在率較小時(shí)，其計(jì)算的樣本量會(huì)相應(yīng)較大，比較容易滿足nπ及n（1-π）＞5 的條件（如實(shí)例4），故而這個(gè)建議也不理想。

不同方法的比較鮮有研究。有研究[15]比較了通用法和確切標(biāo)準(zhǔn)法，認(rèn)為π1＞0.85 時(shí)，確切標(biāo)準(zhǔn)法所得的樣本量及檢驗(yàn)效能均低于通用法，且顯示通用法檢驗(yàn)效能的提高是以樣本量增加為代價(jià)的，而此時(shí)的檢驗(yàn)效能已明顯大于預(yù)設(shè)值，這與本研究的結(jié)果基本一致。該研究設(shè)定的π0從0.7 開始，并未考察π0＜0.5 的情況。本研究中，π0＜0.5 的表現(xiàn)與π0＞0.5 的表現(xiàn)幾乎是相反的。值得一提的是，在6 種樣本量計(jì)算的方法中，除了反正弦法，其他5 種方法中的π0和π1是不可互換的，比如π0=0.1 和π1=0.2 的樣本量，與π0=0.2 和π1=0.1 的樣本量是不一樣的。

本研究的局限性在于：①本研究的模擬基本覆蓋了臨床常見的一些情形，并且精選了4 個(gè)實(shí)例做了進(jìn)一步的分析驗(yàn)證，但主要為計(jì)算機(jī)模擬分析，未進(jìn)行深入的理論討論，并且模擬的情形相對(duì)有限。②臨床研究中選擇樣本量的考慮還有其他許多重要因素，比如目標(biāo)值的確定、對(duì)受試者脫落的估計(jì)、缺失數(shù)據(jù)的處理等。本研究無法對(duì)眾多因素一一考量，在對(duì)實(shí)例1 和3 的分析中可以看出，根據(jù)確切法計(jì)算的樣本量，實(shí)際入選例數(shù)不宜輕易減少，否則檢驗(yàn)效能達(dá)不到預(yù)設(shè)值。

綜上，單個(gè)率比較的樣本量計(jì)算方法的選擇較為復(fù)雜，從樣本量計(jì)算本身來看，對(duì)檢驗(yàn)效能要求比較高時(shí)（如產(chǎn)品的上市前研究），宜優(yōu)選確切標(biāo)準(zhǔn)法和確切保守法，其次可考慮反正弦法，而通用法和正態(tài)近似法在率偏向兩側(cè)時(shí)，樣本量會(huì)過大或過小，應(yīng)根據(jù)實(shí)際應(yīng)用情況具體權(quán)衡。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

醫(yī)療器械臨床試驗(yàn)單組目標(biāo)值法樣本量計(jì)算不同方法的比較

1 方法

1.1 構(gòu)建π0 和π1

1.2 不同樣本量計(jì)算方法的評(píng)價(jià)

1.3 統(tǒng)計(jì)學(xué)分析

1.4 實(shí)例分析

2 結(jié)果

2.1 樣本量

2.2 最低成功率

2.3 檢驗(yàn)效能

2.4 實(shí)例分析

3 討論