国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

醫(yī)療器械臨床試驗(yàn)單組目標(biāo)值法樣本量計(jì)算不同方法的比較

2023-11-10 13:11:14曾治宇
中國食品藥品監(jiān)管 2023年10期
關(guān)鍵詞:正態(tài)目標(biāo)值樣本量

曾治宇

波科國際醫(yī)療貿(mào)易(上海)有限公司

李青

波科國際醫(yī)療貿(mào)易(上海)有限公司

張曉星

波科國際醫(yī)療貿(mào)易(上海)有限公司

彭琳

波科國際醫(yī)療貿(mào)易(上海)有限公司

曾理

波科國際醫(yī)療貿(mào)易(上海)有限公司

張?jiān)?/p>

波科國際醫(yī)療貿(mào)易(上海)有限公司

韓磊

波科國際醫(yī)療貿(mào)易(上海)有限公司

近年來,單組目標(biāo)值法的臨床研究設(shè)計(jì)日益受到關(guān)注,特別是在醫(yī)療器械的臨床試驗(yàn)領(lǐng)域[1]。計(jì)量資料的單組目標(biāo)值法的樣本量計(jì)算方法較為一致,而對(duì)于計(jì)數(shù)資料,樣本量計(jì)算的方法仍有不同的考慮。

二分類計(jì)數(shù)資料的單組目標(biāo)值法的本質(zhì)是單樣本率與已知總體率的比較,即事先確定一個(gè)目標(biāo)值π0(總體率),設(shè)定顯著性水平α(通常為單側(cè)檢驗(yàn),取值0.025)和檢驗(yàn)效能1-β(β通常取值0.2 或0.1),然后將本研究組預(yù)計(jì)達(dá)到的結(jié)果π1(樣本率)與之比較,從而獲得樣本量。假設(shè)檢驗(yàn)時(shí),如果是高優(yōu)指標(biāo)(如治療成功率),當(dāng)π1的1-2α可信區(qū)間的下限不小于π0時(shí)則拒絕無效假設(shè),接受π1≥π0,低優(yōu)指標(biāo)(如并發(fā)癥發(fā)生率)同理。

目前單樣本率比較的樣本量計(jì)算通常有6 種方法:

(1)正態(tài)近似法A。Chow等[2]推薦的基于正態(tài)近似法的樣本量計(jì)算公式為:

其中,π0和π1分別為總體率(目標(biāo)值)和樣本率(期望值),Zα和Zβ分別為α和β所對(duì)應(yīng)的標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)。

(2)正態(tài)近似法B。《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》(第4 版)[3]中推薦使用的計(jì)算公式為:

(3)通用法?!夺t(yī)學(xué)統(tǒng)計(jì)學(xué)》(第3 版)[4]、中國臨床試驗(yàn)生物統(tǒng)計(jì)學(xué)組發(fā)表的《單組目標(biāo)值臨床試驗(yàn)的統(tǒng)計(jì)學(xué)考慮》[5]及2018年原國家食品藥品監(jiān)督管理總局發(fā)布的《醫(yī)療器械臨床試驗(yàn)設(shè)計(jì)指導(dǎo)原則》[6]等推薦使用的計(jì)算公式為:

(4)反正弦法。當(dāng)π0或π1接近0 或1 時(shí)正態(tài)性較差,宜考慮數(shù)據(jù)轉(zhuǎn)換,根據(jù)平方根反正弦轉(zhuǎn)換的樣本量計(jì)算公式為[4]:

(5)確切標(biāo)準(zhǔn)法。使用基于二項(xiàng)分布理論的確切概率法計(jì)算樣本量[7]。由于單樣本率確切概率法獲得的樣本量與檢驗(yàn)效能非單調(diào)遞增[8-9],會(huì)產(chǎn)生一個(gè)常規(guī)的結(jié)果和一個(gè)較為保守的結(jié)果,前者即為確切標(biāo)準(zhǔn)法。

(6)確切保守法。方法(5)中產(chǎn)生一個(gè)較為保守結(jié)果的方法即為確切保守法。

這6 種樣本量計(jì)算的方法孰優(yōu)孰劣,具體的適用條件如何,尚無系統(tǒng)的研究。本研究旨在利用計(jì)算機(jī)模擬分析,考察不同方法計(jì)算的樣本量及其相應(yīng)的最低成功率、檢驗(yàn)效能,探索不同方法的使用條件,為實(shí)際應(yīng)用中方法的選擇提供依據(jù)。

1 方法

1.1 構(gòu)建π0 和π1

構(gòu)建π0從0.01 至0.99,按0.01遞增。π1比π0分別增加0.01,0.05 及0.1。低優(yōu)指標(biāo)可根據(jù)率的對(duì)稱性轉(zhuǎn)化為高優(yōu)指標(biāo),比如某研究的并發(fā)癥發(fā)生率目標(biāo)值為10%,預(yù)計(jì)研究組的并發(fā)癥發(fā)生率可降至5%,可將低優(yōu)指標(biāo)(并發(fā)癥發(fā)生率)轉(zhuǎn)化為高優(yōu)指標(biāo)(治療成功率),即治療成功率的目標(biāo)值為90%,預(yù)計(jì)研究組可提高至95%。為方便起見,本研究僅考察高優(yōu)指標(biāo)。

1.2 不同樣本量計(jì)算方法的評(píng)價(jià)

本研究的評(píng)價(jià)指標(biāo)包括樣本量、最低成功率和檢驗(yàn)效能。一般來說,在滿足α及β的情況下,樣本量越小越好;檢驗(yàn)效能則越高越好;而對(duì)于最低成功率,該值越高提示對(duì)產(chǎn)品應(yīng)用效果的要求越高,該值越低則在研究或生產(chǎn)質(zhì)控環(huán)節(jié)更易達(dá)到假設(shè)檢驗(yàn)的顯著性,獲得陽性結(jié)果。

1.2.1 樣本量計(jì)算

基于構(gòu)建的π0和π1,設(shè)定α=0.025(單側(cè)),β=0.2。根據(jù)正態(tài)近似法A、正態(tài)近似法B、通用法、反正弦法、確切標(biāo)準(zhǔn)法及確切保守法6 種方法的計(jì)算公式,分別計(jì)算各自所需的樣本量。

1.2.2 最低成功率

不失一般性,選擇π1=π0+0.1的情形,根據(jù)計(jì)算出的樣本量,編程計(jì)算求得所需的最小成功例數(shù),即可獲得實(shí)際的成功率。所需的最小成功例數(shù)為滿足該成功率95%可信區(qū)間下限≥π0所需的最小例數(shù)。95%可信區(qū)間的構(gòu)建需與樣本量計(jì)算的方法一致,即正態(tài)近似法及通用法采用正態(tài)近似的方法構(gòu)建,反正弦法采用平方根反正弦轉(zhuǎn)換后再進(jìn)行正態(tài)近似的方法構(gòu)建,而確切標(biāo)準(zhǔn)法和確切保守法根據(jù)二項(xiàng)分布的理論構(gòu)建(Clopper-Pearson 可信區(qū)間)。

1.2.3 檢驗(yàn)效能

不失一般性,選擇π1=π0+0.1的情形,采用計(jì)算機(jī)模擬計(jì)算的方法獲得檢驗(yàn)效能。根據(jù)已知樣本量及預(yù)計(jì)成功率π1,進(jìn)行二項(xiàng)分布概率抽樣獲得成功例數(shù),重復(fù)10 000 次,統(tǒng)計(jì)成功例數(shù)≥所需最小成功例數(shù)的次數(shù),除以重復(fù)次數(shù)計(jì)算所得即為檢驗(yàn)效能。

1.3 統(tǒng)計(jì)學(xué)分析

本研究的編程及統(tǒng)計(jì)分析均使用R語言 v3.6.2 和Rstudio平臺(tái) v1.2.5033,使用的R 語言包有proportion、pwr、TrialSize 及gsDesign。

1.4 實(shí)例分析

實(shí)例1:《人工耳蝸植入系統(tǒng)臨床試驗(yàn)指導(dǎo)原則》[10]中,根據(jù)臨床經(jīng)驗(yàn),開機(jī)12 個(gè)月后,產(chǎn)品的總體有效率需至少達(dá)到70%方可被臨床接受(即目標(biāo)值為70%)。假設(shè)被試驗(yàn)產(chǎn)品的總體有效率可以達(dá)到85%,計(jì)算在雙側(cè)顯著性水平0.05、把握度80%的情況下的樣本量。

實(shí)例2:劉江美等[8]的研究中,已知總體率π0=0.07,預(yù)期的總體率π1=0.03,設(shè)定α=0.05(雙側(cè)),檢驗(yàn)效能80%,計(jì)算樣本量。該例子可驗(yàn)證低優(yōu)指標(biāo)的情況。

實(shí) 例3:設(shè) 定π0=0.1,π1=0.2,可驗(yàn)證一下π0<0.5的情形。

實(shí)例4:一項(xiàng)全皮下植入型心律轉(zhuǎn)復(fù)除顫器(subcutaneous implantable cardioverter defibrillator,S-ICD)上市后研究[11-12]中,目標(biāo)值無不適當(dāng)電擊率為91.6%(相當(dāng)于不適當(dāng)電擊率為8.4%),S-ICD 預(yù)計(jì)可達(dá)到94.6%,α=0.05(單側(cè)),檢驗(yàn)效能90%,計(jì)算樣本量。

考慮到臨床研究中可能由于多種因素導(dǎo)致最終入選樣本量與計(jì)算樣本量存在差異,因此對(duì)于實(shí)例1和實(shí)例3,除了計(jì)算樣本量,還考察實(shí)際入選例數(shù)在計(jì)算樣本量±5范圍內(nèi)的最低成功率與檢驗(yàn)效能。

2 結(jié)果

2.1 樣本量

不同方法計(jì)算的樣本量比較見圖 1。由圖1 可知,相關(guān)規(guī)律并不十分明確,但大體趨勢為:①在π0<0.5 時(shí),正態(tài)近似法B 的樣本量最小,反正弦法次之,通用法與確切概率法較大且相互接近,正態(tài)近似法A 的樣本量最大。②在π0>0.5 時(shí),正態(tài)近似法A 的樣本量最小,其次為通用法、反正弦法與確切概率法且三者較為接近,而正態(tài)近似法B 的樣本量隨著π0的增加而逐漸超過確切保守法的樣本量。

圖1 不同方法計(jì)算的樣本量比較

圖2 不同方法的最低成功率比較

2.2 最低成功率

不同樣本量計(jì)算方法下的最低成功率比較見圖 2,可見只要π0不是太小,不同方法所需的最低成功率相差不大,且均略小于π1。

2.3 檢驗(yàn)效能

不同樣本量計(jì)算方法下的檢驗(yàn)效能比較見圖 3。由圖3 可知,不同方法的檢驗(yàn)效能差異較大。正態(tài)近似法B 和通用法在π0<0.5時(shí)檢驗(yàn)效能不足,而在π0>0.5 時(shí)檢驗(yàn)效能過度,且在π0趨向極端時(shí),這種趨勢急劇增加;正態(tài)近似法A 的表現(xiàn)與之相反。反正弦法的檢驗(yàn)效能基本在0.8 附近,但較確切標(biāo)準(zhǔn)法顯得更為離散,特別是π0趨向1 時(shí)。確切保守法幾乎能確保檢驗(yàn)效能在0.8 以上,但在π0>0.8 時(shí),也表現(xiàn)為檢驗(yàn)效能明顯增加的趨勢。

圖3 不同方法的檢驗(yàn)效能比較

2.4 實(shí)例分析

不同方法計(jì)算的4 個(gè)實(shí)例的樣本量見表 1,提示不同方法的樣本量有一定的差異,但實(shí)例1、2、4 的樣本量均與原文獻(xiàn)[8,10-11]相對(duì)應(yīng)方法的結(jié)果相同(原文獻(xiàn)采用的方法分別為:實(shí)例1 為通用法,實(shí)例2 給出了確切標(biāo)準(zhǔn)法和確切保守法的結(jié)果,實(shí)例4 為確切保守法)。對(duì)于實(shí)例1 和實(shí)例3,計(jì)算樣本量±5 范圍內(nèi)的比較結(jié)果見表2,基本符合圖 1、圖2 和圖 3 的趨勢,樣本量和檢驗(yàn)效能的差異較為明顯,表現(xiàn)為:在π0<0.5 時(shí),正態(tài)近似法B 和通用法得到樣本量相對(duì)較小,但損失了檢驗(yàn)效能;π0>0.5 時(shí),正態(tài)近似法B 和通用法樣本量相對(duì)較大,檢驗(yàn)效能也比預(yù)設(shè)值高。不同方法的最低成功率差異不大,但較大的樣本量可以憑借略為較小的最低成功率通過檢驗(yàn)。另外,雖然最低成功率的差異總體不大,但在不同方法間仍然存在一些微小的差異,比如對(duì)于實(shí)例1,當(dāng)樣本量為69 時(shí),正態(tài)近似法B 只需成功55 例(成功率79.7%)即可拒絕無效假設(shè),而確切保守法需要成功57 例(成功率82.6%)。

表1 實(shí)例分析不同方法計(jì)算樣本量的結(jié)果

表2 不同方法計(jì)算樣本量的檢驗(yàn)效能比較

3 討論

本研究對(duì)單個(gè)率比較樣本量計(jì)算的6 種不同的方法作了較為系統(tǒng)地研究,6 種方法在π0及π1不接近0 或1 時(shí)表現(xiàn)較為相似,但π0逐漸接近0 時(shí),正態(tài)近似法B 和通用法得到的樣本量相對(duì)較小,并逐漸損失了檢驗(yàn)效能;π0逐漸接近1 時(shí),正態(tài)近似法B和通用法的樣本量相對(duì)較大,檢驗(yàn)效能也比預(yù)設(shè)值逐漸增高。正態(tài)近似法B 的表現(xiàn)趨勢與A 正好相反。從檢驗(yàn)效能來看,反正弦法的結(jié)果與確切標(biāo)準(zhǔn)法接近而顯得更為離散,而確切保守法幾乎能保證預(yù)設(shè)的檢驗(yàn)效能,但在π0>0.5 時(shí),確切保守法所需樣本量逐漸多于確切標(biāo)準(zhǔn)法。不同方法對(duì)最低成功率的要求總體相似,但存在微小差別。

目前臨床研究中對(duì)于這6 種不同方法的選用尚無明確的適用條件。本研究顯示通用法的整體表現(xiàn)優(yōu)于正態(tài)近似法,但這些方法本質(zhì)上都是基于正態(tài)近似的原理,當(dāng)π0趨于極端時(shí),檢驗(yàn)效能有較大的變化?!夺t(yī)學(xué)統(tǒng)計(jì)學(xué)》(第3 版)[4]建議當(dāng)率偏向兩側(cè)時(shí)(π0<0.3 或π0>0.7)使用反正弦法,但本研究中π0在0.4~0.6 范圍內(nèi)時(shí)其檢驗(yàn)效能才可保持在0.8左右,該結(jié)果提示這些方法的臨床應(yīng)用仍具有一定局限性。也有學(xué)者[7,13-14]認(rèn)為nπ及n(1-π)>5時(shí),可以考慮正態(tài)近似法,但是在率較小時(shí),其計(jì)算的樣本量會(huì)相應(yīng)較大,比較容易滿足nπ及n(1-π)>5 的條件(如實(shí)例4),故而這個(gè)建議也不理想。

不同方法的比較鮮有研究。有研究[15]比較了通用法和確切標(biāo)準(zhǔn)法,認(rèn)為π1>0.85 時(shí),確切標(biāo)準(zhǔn)法所得的樣本量及檢驗(yàn)效能均低于通用法,且顯示通用法檢驗(yàn)效能的提高是以樣本量增加為代價(jià)的,而此時(shí)的檢驗(yàn)效能已明顯大于預(yù)設(shè)值,這與本研究的結(jié)果基本一致。該研究設(shè)定的π0從0.7 開始,并未考察π0<0.5 的情況。本研究中,π0<0.5 的表現(xiàn)與π0>0.5 的表現(xiàn)幾乎是相反的。值得一提的是,在6 種樣本量計(jì)算的方法中,除了反正弦法,其他5 種方法中的π0和π1是不可互換的,比如π0=0.1 和π1=0.2 的樣本量,與π0=0.2 和π1=0.1 的樣本量是不一樣的。

本研究的局限性在于:①本研究的模擬基本覆蓋了臨床常見的一些情形,并且精選了4 個(gè)實(shí)例做了進(jìn)一步的分析驗(yàn)證,但主要為計(jì)算機(jī)模擬分析,未進(jìn)行深入的理論討論,并且模擬的情形相對(duì)有限。②臨床研究中選擇樣本量的考慮還有其他許多重要因素,比如目標(biāo)值的確定、對(duì)受試者脫落的估計(jì)、缺失數(shù)據(jù)的處理等。本研究無法對(duì)眾多因素一一考量,在對(duì)實(shí)例1 和3 的分析中可以看出,根據(jù)確切法計(jì)算的樣本量,實(shí)際入選例數(shù)不宜輕易減少,否則檢驗(yàn)效能達(dá)不到預(yù)設(shè)值。

綜上,單個(gè)率比較的樣本量計(jì)算方法的選擇較為復(fù)雜,從樣本量計(jì)算本身來看,對(duì)檢驗(yàn)效能要求比較高時(shí)(如產(chǎn)品的上市前研究),宜優(yōu)選確切標(biāo)準(zhǔn)法和確切保守法,其次可考慮反正弦法,而通用法和正態(tài)近似法在率偏向兩側(cè)時(shí),樣本量會(huì)過大或過小,應(yīng)根據(jù)實(shí)際應(yīng)用情況具體權(quán)衡。

猜你喜歡
正態(tài)目標(biāo)值樣本量
醫(yī)學(xué)研究中樣本量的選擇
ML的迭代學(xué)習(xí)過程
航空裝備測試性試驗(yàn)樣本量確定方法
Sample Size Calculations for Comparing Groups with Binary Outcomes
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
基于泛正態(tài)阻抗云的諧波發(fā)射水平估計(jì)
半?yún)?shù)EV模型二階段估計(jì)的漸近正態(tài)性
基于正態(tài)變換的貸款組合定價(jià)模型構(gòu)建及實(shí)證
不同危險(xiǎn)程度患者的降脂目標(biāo)值——?dú)W洲《血脂異常防治指南》
microRNAs and ceRNAs: RNA networks in pathogenesis of cancer
郯城县| 麦盖提县| 乐山市| 咸阳市| 麻江县| 静乐县| 明溪县| 乡城县| 长垣县| 清河县| 文成县| 盐亭县| 来凤县| 金昌市| 花莲市| 喀喇沁旗| 个旧市| 巴塘县| 黄龙县| 富民县| 城步| 永德县| 诸城市| 镇江市| 温宿县| 余庆县| 龙游县| 南郑县| 郑州市| 巴彦淖尔市| 义乌市| 旬邑县| 阜阳市| 横山县| 博兴县| 宝兴县| 左权县| 桐庐县| 杭锦旗| 淮安市| 黄石市|