翟靜波 鄭文科 王輝 金鑫瑤 張俊華
摘要?真實(shí)世界研究包括多種設(shè)計(jì)類型。當(dāng)受試對(duì)象來源于總體中的部分樣本時(shí),需要考慮樣本量的估計(jì)問題。本文探討了真實(shí)世界研究樣本量估計(jì)的基本原則、分析了其影響因素,提供了幾種常用的真實(shí)世界研究樣本量估計(jì)方法,并對(duì)真實(shí)世界研究樣本量估計(jì)中參與人員的角色進(jìn)行分析,為研究者開展真實(shí)世界研究的樣本量估計(jì)提供一定的方法學(xué)參考。
關(guān)鍵詞?真實(shí)世界研究;樣本量;統(tǒng)計(jì)學(xué);基本原則;影響因素;臨床試驗(yàn);隊(duì)列研究;病例對(duì)照研究
Statistical Considerations in Estimating Sample Size of Real World Study
Zhai Jingbo, Zheng Wenke, Wang Hui, Jin Xinyao, Zhang Junhua
(Evidence-based Medicine Center, Tianjin University of Traditional Chinese Medicine, Tianjin 301617, China)
Abstract?Real world study includes multiple design types.When subjects are derived from a sample in the population, estimating sample size needs to be considered.This study discussed the basic principles of sample size estimation in real world study, analyzed its influencing factors, provided several commonly used sample size estimation methods, and analyzed the roles of participants for estimating sample size in real world study.It provided a methodological reference for estimating sample size in real-world study.
Key Words?Real world study; Sample size; Statistics; Basic principle; Influence factor; Clinical trial; Cohort study; Case control study
中圖分類號(hào):R2-03文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.3969/j.issn.1673-7202.2019.12.006
真實(shí)世界研究(Real-world Study,RWS)是指基于真實(shí)世界數(shù)據(jù)(Real-world Data,RWD)開展的研究[1-3]。盡管數(shù)據(jù)來源于真實(shí)世界,但是,研究者不太可能將所有符合條件的真實(shí)世界數(shù)據(jù)全部用于擬開展的研究。所以,在開展RWS時(shí),研究者仍需考慮樣本量的估計(jì)問題[4]。真實(shí)世界數(shù)據(jù)和大樣本量之間并不能劃等號(hào)?;谟邢蘅傮w開展的RWS,有可能是小樣本的研究。由于數(shù)據(jù)來源于真實(shí)世界的特點(diǎn)、研究設(shè)計(jì)和研究目的的多樣性、經(jīng)費(fèi)來源的廣泛性等,不同真實(shí)世界研究的樣本量往往差異較大(幾十例到上百例均有可能)[5]。如何合理估計(jì)樣本量對(duì)于RWS的順利實(shí)施至關(guān)重要。本文對(duì)RWS樣本量估計(jì)過程中可能涉及的統(tǒng)計(jì)學(xué)問題進(jìn)行了分析和討論。
1?RWS樣本量估計(jì)的基本原則
總體(Population)是指根據(jù)研究目的確定的、具有同質(zhì)性的所有觀察單位構(gòu)成的全體或集合,可以是所有人群,也可以是所有人群的某個(gè)測(cè)量指標(biāo)的集合??傮w包括有限總體和無限總體。傳統(tǒng)的隨機(jī)對(duì)照試驗(yàn)(Randomized Controlled Trial,RCT)的納入和排除標(biāo)準(zhǔn)較為嚴(yán)格[6]。一般情況下,RCT中納入的受試者是某一總體人群中的部分樣本。RWS的受試者來源于真實(shí)世界環(huán)境。這使得RWS有可能納入某一總體人群進(jìn)行研究。所以,在RWS設(shè)計(jì)階段,研究者需要考慮受試對(duì)象來自于某一總體人群還是總體中的代表性樣本。表1列出了常見RWS設(shè)計(jì)中受試對(duì)象的一般來源。
如果擬開展的RWS所納入的受試對(duì)象是某個(gè)有限總體,那么,該RWS可以不用計(jì)算樣本量,而是將這個(gè)總體人群均納入研究。常見于普查、基于某個(gè)國(guó)家或地區(qū)全人口的隊(duì)列研究等。
如果擬開展的RWS所納入的受試對(duì)象所在的有限總體過大或來自于無限總體,研究者無法獲取總體。此時(shí),研究者可以從總體中抽取部分有代表性的樣本,通過樣本來估計(jì)總體特征。此時(shí),抽取樣本量的多少需要通過樣本量估計(jì)公式計(jì)算獲得。常見于實(shí)用性臨床試驗(yàn)、抽樣調(diào)查、病例對(duì)照研究等。
當(dāng)RWS的數(shù)據(jù)來源于一個(gè)或多個(gè)數(shù)據(jù)庫(kù)時(shí),研究者需要分析判斷這些數(shù)據(jù)庫(kù)納入的人群是否代表了計(jì)劃研究的總體人群。當(dāng)RWS使用某一國(guó)家、地區(qū)人口或疾病數(shù)據(jù)庫(kù)時(shí),這類數(shù)據(jù)庫(kù)在一定程度上代表了該國(guó)家或地區(qū)人口或疾病發(fā)展的趨勢(shì),可以考慮不計(jì)算樣本量。但是,如果只是抽取其中有代表性的樣本開展研究時(shí),仍需考慮估計(jì)樣本量?;蛘撸诳色@得的人力、財(cái)力、物力,估計(jì)能夠收集的最大樣本量,通過計(jì)算把握度,評(píng)估有多大把握度能夠獲得事先假設(shè)的研究結(jié)果。常見于注冊(cè)登記式研究、基于電子健康檔案的研究等[7-10]。
2?RWS樣本量估計(jì)的影響因素
2.1?研究設(shè)計(jì)類型
RWS的研究設(shè)計(jì)類型包括觀察性研究和試驗(yàn)性研究[11]。觀察性研究包括橫斷面研究、病例對(duì)照研究、隊(duì)列研究等[11-12]。試驗(yàn)性研究包括單臂臨床試驗(yàn)、實(shí)用性臨床試驗(yàn)等[13]。不同研究設(shè)計(jì)所采用結(jié)局指標(biāo)可能存在差異,所以樣本量估計(jì)方法可能不同[14]。
2.2?資料類型
不同的結(jié)局指標(biāo)分屬于不同的資料類型。RWS的資料類型包括定量資料和定性資料[15]。資料類型的不同,選用的樣本量估計(jì)公式不同[16]。在一定條件下,定量資料與定性資料可以相互轉(zhuǎn)換。所以,明確結(jié)局指標(biāo)對(duì)應(yīng)的資料類型是進(jìn)行樣本量估計(jì)的重要前提。
2.3?樣本量估計(jì)參數(shù)[17]
2.3.1?檢驗(yàn)水準(zhǔn)
檢驗(yàn)水準(zhǔn)α是指研究者在推斷不同組間是否有統(tǒng)計(jì)學(xué)差異時(shí)所采用的概率水平。取值越小,所需樣本量越多。一般情況下,檢驗(yàn)水準(zhǔn)α的取值為0.05[18]。
2.3.2?檢驗(yàn)效能
檢驗(yàn)效能也稱為把握度,通過1減去Ⅱ型誤差(β)獲得。把握度越高,所需樣本量越大。一般情況下,把握度的取值為80%~90%[19]。
2.3.3?變異程度
變異程度是指總體內(nèi)部不同個(gè)體之間或總體之間的差異大小,常采用標(biāo)準(zhǔn)差估計(jì)。一般情況下,變異程度越大,所需樣本量越大。
2.3.4?單、雙側(cè)檢驗(yàn)
在其他參數(shù)不變的情況下,與雙側(cè)檢驗(yàn)比較,單側(cè)檢驗(yàn)所需樣本量更少。單側(cè)和雙側(cè)檢驗(yàn)的選擇主要是根據(jù)研究目的和臨床專業(yè)角度考慮確定。
2.3.5?脫落和失訪
在傳統(tǒng)的隨機(jī)對(duì)照試驗(yàn)樣本量計(jì)算過程中,脫落和失訪率通常設(shè)置為10%~20%。在真實(shí)世界環(huán)境下,受試者的脫落和失訪問題可能更為突出。在確保研究質(zhì)量的前提下,研究者可以在估計(jì)RWS樣本量時(shí)適當(dāng)增大脫落和失訪率,從而使脫落和失訪率符合真實(shí)世界的實(shí)際情況。
3?RWS樣本量估計(jì)的常用方法舉例
PASS軟件是樣本量估計(jì)的專業(yè)軟件。本文以PASS軟件為平臺(tái),簡(jiǎn)要介紹RWS中常用的樣本量估計(jì)方法。
3.1?2個(gè)獨(dú)立樣本定量資料比較的樣本量估計(jì)
假設(shè):研究者擬開展一項(xiàng)實(shí)用性隨機(jī)對(duì)照試驗(yàn)。主要結(jié)局指標(biāo)為收縮壓下降值。觀察組收縮壓下降值為10 mm Hg,對(duì)照組收縮壓下降值為7 mm Hg。2組收縮壓下降值的標(biāo)準(zhǔn)差均為10 mm Hg。檢驗(yàn)水準(zhǔn)為0.05。把握度為90%。2組樣本量相等。如圖1所示,將參數(shù)輸入對(duì)應(yīng)位置后,點(diǎn)擊“RUN”,可得每組樣本量為235例??紤]10%的脫落率之后,每組需要259例。
3.2?2個(gè)獨(dú)立樣本定性資料比較的樣本量估計(jì)
假設(shè):研究者擬開展一項(xiàng)基于真實(shí)世界數(shù)據(jù)的隊(duì)列研究。主要結(jié)局指標(biāo)為某疾病發(fā)生率。暴露組疾病發(fā)生率為9%。非暴露組疾病發(fā)生率為7%。檢驗(yàn)水準(zhǔn)為0.05。把握度為90%。2組樣本量相等。如圖2所示,將參數(shù)輸入對(duì)應(yīng)位置后,點(diǎn)擊“RUN”,可得每組樣本量為3 865例??紤]10%的脫落率之后,每組需要4 252例。
3.3?以中位生存時(shí)間為結(jié)局指標(biāo)的樣本量估計(jì)
假設(shè):研究者擬開展一項(xiàng)基于真實(shí)世界數(shù)據(jù)的隊(duì)列研究。主要結(jié)局指標(biāo)為某疾病的中位生存時(shí)間。暴露組人群的中位生存時(shí)間為20個(gè)月。非暴露組人群的中位生存時(shí)間為24個(gè)月。檢驗(yàn)水準(zhǔn)為0.05。把握度為90%。2組樣本量相等。失訪率為10%。研究期限為36個(gè)月。受試對(duì)象入組期限為12個(gè)月。如圖3所示,將參數(shù)輸入對(duì)應(yīng)位置后,點(diǎn)擊“RUN”,可得每組樣本量為2 786例。
3.4?以罕見事件發(fā)生率為結(jié)局指標(biāo)的樣本量估計(jì)
在以觀察某一人群中罕見事件發(fā)生率為結(jié)局指標(biāo)的研究(例如:藥物安全性集中監(jiān)測(cè)研究)中,一般不設(shè)置對(duì)照,只是縱向觀察該人群某罕見事件的發(fā)生率。此時(shí),我們可以假設(shè):該罕見事件的發(fā)生服從二項(xiàng)分布或Poisson分布[20]。采用SAS軟件編程獲得相應(yīng)的樣本量估計(jì)結(jié)果。從表2和表3中可以看出,罕見事件服從二項(xiàng)分布和Poisson分布的樣本量估計(jì)結(jié)果相近。從表2中可知,假設(shè):罕見事件的實(shí)際發(fā)生率為0.01%,如果研究者想以95%的把握發(fā)現(xiàn)至少1例罕見事件,則調(diào)查的人數(shù)為29 956例(約為3萬例)。我們常見到一些藥物安全性集中監(jiān)測(cè)研究的樣本量設(shè)定為3萬例,其目的就是為了有95%的把握能夠至少發(fā)現(xiàn)1例發(fā)生率為0.01%的不良反應(yīng)[21-22]。
3.5?RWS的把握度估計(jì)
當(dāng)無法獲取計(jì)劃的樣本量時(shí),研究者可以預(yù)估一下可獲得的、最多的樣本量。利用這個(gè)樣本量進(jìn)行把握度估計(jì)[23-24]。
假設(shè):研究者擬開展一項(xiàng)實(shí)用性隨機(jī)對(duì)照試驗(yàn)。主要結(jié)局指標(biāo)為收縮壓下降值。觀察組收縮壓下降值為10 mm Hg,對(duì)照組收縮壓下降值為7 mm Hg。2組收縮壓下降值的標(biāo)準(zhǔn)差均為10 mm Hg。檢驗(yàn)水準(zhǔn)為0.05。2組樣本量相等。研究者能夠獲得的最多樣本量為每組150例。如圖4所示,將參數(shù)輸入對(duì)應(yīng)位置后,點(diǎn)擊“RUN”,可得把握度為74%。也就是說,研究者有74%的把握度識(shí)別出組間收縮壓下降均值之差至少為3 mm Hg的差異。研究者可以根據(jù)這個(gè)把握度評(píng)估樣本量是否足夠支撐研究目的的實(shí)現(xiàn)。
4?RWS樣本量估計(jì)中參與人員的角色
RWS的樣本量估計(jì)過程中需要多方人員參與,例如:臨床專家、統(tǒng)計(jì)學(xué)專家、流行病學(xué)專家、申辦方等。臨床專家的主要任務(wù)是從臨床實(shí)踐角度出發(fā),考慮最合適的結(jié)局指標(biāo)和臨床參數(shù)。統(tǒng)計(jì)學(xué)專家的主要任務(wù)是從統(tǒng)計(jì)學(xué)角度出發(fā),考慮樣本量估算過程中統(tǒng)計(jì)參數(shù)設(shè)置的合理性。流行病學(xué)專家的主要任務(wù)是從流行病學(xué)角度出發(fā),考慮研究設(shè)計(jì)和相關(guān)參數(shù)的合理性。申辦方的主要任務(wù)是基于所掌握的研究資源考慮樣本量估算的可操作性。
5?小結(jié)
RWS設(shè)計(jì)類型多樣,既有傳統(tǒng)的流行病學(xué)研究設(shè)計(jì),也有基于現(xiàn)代信息獲取技術(shù)的健康相關(guān)檔案數(shù)據(jù)研究。傳統(tǒng)的流行病學(xué)研究設(shè)計(jì),例如:RCT、病例對(duì)照研究、隊(duì)列研究等,通常需要考慮樣本量的估計(jì)問題。但是,基于注冊(cè)登記、電子健康檔案等開展的RWS,可能會(huì)產(chǎn)生一些新的研究設(shè)計(jì)類型和統(tǒng)計(jì)分析方法。相關(guān)的樣本量估計(jì)方法可能也將隨之更新和完善。我們也期望這些新的設(shè)計(jì)和方法能夠提高RWS的研究效率。
參考文獻(xiàn)
[1]孫鑫,譚婧,唐立,等.重新認(rèn)識(shí)真實(shí)世界研究[J].中國(guó)循證醫(yī)學(xué)雜志,2017,17(2):126-130.
[2]姚曉瑩,張靖雪,詹思延.真實(shí)世界證據(jù)與隨機(jī)對(duì)照試驗(yàn):RCT DUPLICATE項(xiàng)目概述[J].藥物流行病學(xué)雜志,2019,28(8):495-517.
[3]張曉雨,陳靜,趙晨,等.真實(shí)世界理念下觀察性與實(shí)驗(yàn)性臨床研究協(xié)同應(yīng)用[J].中國(guó)循證醫(yī)學(xué)雜志,2018,18(4):284-288.
[4]曹越,尹慶鋒,曾憲濤.真實(shí)世界研究概述[J].武警醫(yī)學(xué),2017,28(4):400-403.
[5]黃卓山,羅艷婷,劉金來.真實(shí)世界研究的方法與實(shí)踐[J].循證醫(yī)學(xué),2014,14(6):364-368.
[6]崔偉鋒,王素花,王會(huì)麗,等.真實(shí)世界中醫(yī)臨床研究方法與實(shí)踐[J].中國(guó)全科醫(yī)學(xué),2016,19(13):1586-1597.
[7]孫鑫,譚婧,王雯,等.建立真實(shí)世界數(shù)據(jù)與研究技術(shù)規(guī)范,促進(jìn)中國(guó)真實(shí)世界證據(jù)的生產(chǎn)與使用[J].中國(guó)循證醫(yī)學(xué)雜志,2019,19(7):755-762.
[8]王雯,譚婧,于川,等.基于中國(guó)醫(yī)院電子病歷數(shù)據(jù)的藥品安全性評(píng)價(jià)模式探索[J].中國(guó)藥物警戒,2019,16(3):134-138.
[9]李曉春,戴國(guó)華,劉小翠.基于HIS真實(shí)世界研究方法及其在中醫(yī)臨床療效評(píng)價(jià)中的應(yīng)用[J].山東中醫(yī)藥大學(xué)學(xué)報(bào),2016,40(5):415-418.
[10]譚婧,程亮亮,王雯,等.患者登記研究的策劃與患者登記數(shù)據(jù)庫(kù)構(gòu)建:基于觀察性設(shè)計(jì)的真實(shí)世界研究[J].中國(guó)循證醫(yī)學(xué)雜志,2017,17(12):1365-1372.
[11]Jing-Bo Zhai,Jiang Li,Jing Chen.The applications of Bayesian models in real-world studies of traditional Chinese medicine:a primer[J].Traditional Medicine Research,2017,2(2):88-93.
[12]彭曉霞,舒嘯塵,譚婧,等.基于真實(shí)世界數(shù)據(jù)評(píng)價(jià)治療結(jié)局的觀察性研究設(shè)計(jì)技術(shù)規(guī)范[J].中國(guó)循證醫(yī)學(xué)雜志,2019,19(7):779-786.
[13]唐立,康德英,喻佳潔,等.實(shí)效性隨機(jī)對(duì)照試驗(yàn):真實(shí)世界研究的重要設(shè)計(jì)[J].中國(guó)循證醫(yī)學(xué)雜志,2017,17(9):999-1004.
[14]CCTS工作組,陳平雁.臨床試驗(yàn)中樣本量確定的統(tǒng)計(jì)學(xué)考慮[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2015,32(4):727-733.
[15]胡良平.醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)——資料類型的識(shí)別[J].中國(guó)骨腫瘤骨病,2002,1(4):227-229.
[16]Charan J,Biswas T.How to calculate sample size for different study designs in medical research[J].Indian J Psychol Med,2013,35(2):121-126.
[17]田峰,付瑩坤,謝雁鳴.中藥上市后臨床再評(píng)價(jià)試驗(yàn)樣本含量估算方法探討[J].中國(guó)中藥雜志,2011,36(8):1097-1102.
[18]姚晨,閻小妍.臨床研究設(shè)計(jì)中的統(tǒng)計(jì)學(xué)考慮要點(diǎn)[J].北京大學(xué)學(xué)報(bào):醫(yī)學(xué)版,2010,42(6):632-636.
[19]楊進(jìn)波.探討藥物臨床試驗(yàn)中樣本含量及相關(guān)問題[J].中國(guó)臨床藥理學(xué)雜志,2007,23(1):68-69.
[20]楊進(jìn)波.從安全性評(píng)價(jià)角度探討藥物臨床試驗(yàn)的樣本含量[J].中國(guó)臨床藥理學(xué)雜志,2007,23(6):474-475.
[21]賀佳.臨床試驗(yàn)中藥物安全性的統(tǒng)計(jì)學(xué)考慮[J].世界科學(xué)技術(shù)—中醫(yī)藥現(xiàn)代化,2017,19(7):1089-1096.
[22]鄭青山,孫瑞元,陳志揚(yáng).新藥臨床試驗(yàn)最低例數(shù)規(guī)定的安全性評(píng)價(jià)[J].中國(guó)臨床藥理學(xué)與治療學(xué),2003,8(3):354-355.
[23]高培,王楊,羅劍鋒,等.基于真實(shí)世界數(shù)據(jù)評(píng)價(jià)治療結(jié)局研究的統(tǒng)計(jì)分析技術(shù)規(guī)范[J].中國(guó)循證醫(yī)學(xué)雜志,2019,19(7):787-793.
[24]成小如,嚴(yán)若華,伯堅(jiān),等.中國(guó)前瞻性城鄉(xiāng)流行病學(xué)研究的設(shè)計(jì)與方案[J].中國(guó)循環(huán)雜志,2016,31(11):1088-1092.
(2019-11-10收稿?責(zé)任編輯:徐穎)