陳金鳳
臨床醫(yī)師在實(shí)際工作中,會(huì)發(fā)現(xiàn)有很多問(wèn)題尚待解決。循證醫(yī)學(xué)是現(xiàn)代醫(yī)學(xué)的核心,疾病的用藥、治療很大程度上依賴于具有循證醫(yī)學(xué)證據(jù)的指南。面對(duì)臨床上遇到的科研問(wèn)題,采用正確的研究設(shè)計(jì)解決問(wèn)題,是獲得具有高度循證證據(jù)的前提。隨訪研究是目前運(yùn)用較多的一種研究設(shè)計(jì)類(lèi)型。廣義的隨訪研究是指通過(guò)定期隨訪的形式,觀察疾病、健康狀況或某衛(wèi)生事件在一個(gè)固定人群中隨著時(shí)間推移的動(dòng)態(tài)變化情況[1],其包括隊(duì)列研究、隨機(jī)對(duì)照試驗(yàn)、臨床試驗(yàn)、臨床注冊(cè)研究等。其中隊(duì)列研究屬于觀察性隨訪研究,其余均屬于試驗(yàn)性隨訪研究,兩者最大的區(qū)別是有無(wú)進(jìn)行人為的干預(yù)。本研究所指的隨訪研究為觀察性隨訪研究,即隊(duì)列研究。
生存分析是用來(lái)研究生存時(shí)間分布規(guī)律以及生存時(shí)間與相關(guān)因素之間關(guān)系的一種統(tǒng)計(jì)學(xué)方法,是一種針對(duì)具有生存時(shí)間的數(shù)據(jù)資料進(jìn)行統(tǒng)計(jì)分析的方法,在隨訪研究中具有重要的地位。但是,生存分析的規(guī)范運(yùn)用尚存在不足[2]。同時(shí),臨床醫(yī)生對(duì)于統(tǒng)計(jì)學(xué)方法的應(yīng)用可參考的文獻(xiàn)不多[3]。本文旨在闡述隨訪研究的要素以及生存分析的具體應(yīng)用,以期提高隨訪研究論文的質(zhì)量,提高循證醫(yī)學(xué)證據(jù)等級(jí)。
1.1 隨訪研究的設(shè)計(jì) 一個(gè)科學(xué)問(wèn)題的提出,需要臨床醫(yī)生在工作過(guò)程中善于總結(jié)并發(fā)現(xiàn)問(wèn)題,通過(guò)查找文獻(xiàn),了解研究現(xiàn)狀,進(jìn)一步提出研究問(wèn)題和研究目的,然后根據(jù)研究目的設(shè)計(jì)合適的研究方案以及研究?jī)?nèi)容。隨訪研究對(duì)于觀察一個(gè)新藥對(duì)某種疾病的治療效果,探索暴露于某種危險(xiǎn)因素的人群的結(jié)局轉(zhuǎn)歸,或者探討某一疾病的病因等,是一個(gè)相對(duì)容易實(shí)施又能解決問(wèn)題的研究類(lèi)型。但是,在設(shè)計(jì)隨訪研究的過(guò)程中,應(yīng)重點(diǎn)關(guān)注研究的背景以及研究的目的,通過(guò)研究目的進(jìn)一步確定入選對(duì)象、研究因素、研究時(shí)間、分析方法等。科學(xué)、合理、可行的設(shè)計(jì)是研究成功的基礎(chǔ),使用正確的統(tǒng)計(jì)學(xué)方法是得出可靠結(jié)果的前提。
1.2 隨訪研究的實(shí)施
1.2.1 研究對(duì)象:研究對(duì)象是指研究的目標(biāo)人群。隨訪研究中,研究對(duì)象一般是具有共同暴露特征的一組人群。在選擇研究對(duì)象時(shí),最重要的是選取具有代表性的樣本。其次,要明確研究對(duì)象的納入與排除標(biāo)準(zhǔn),并嚴(yán)格執(zhí)行。一般隊(duì)列研究的對(duì)象納入及排除標(biāo)準(zhǔn)沒(méi)有隨機(jī)對(duì)照試驗(yàn)嚴(yán)格。另外,隨訪研究中另一個(gè)重要的要素是暴露的確定。有時(shí)候,研究的暴露因素可以不止一個(gè),可以是自然形成的(觀察性隊(duì)列研究),也可以是人為給予的(臨床試驗(yàn)研究)。除暴露因素外,研究對(duì)象的其他基本特征應(yīng)該在2組中均衡,以使暴露組與非暴露組具有可比性。例如探討神經(jīng)浸潤(rùn)對(duì)結(jié)直腸黏液腺癌預(yù)后的預(yù)測(cè)價(jià)值時(shí),直腸黏液腺癌病人是研究對(duì)象,選擇的樣本應(yīng)是能代表直腸黏液腺癌這個(gè)群體的樣本;其次,是否有神經(jīng)浸潤(rùn)是暴露因素,其他因素如性別、年齡、術(shù)前營(yíng)養(yǎng)狀態(tài),腫瘤直徑、位置、分期等是混雜因素,需要平衡混雜因素在2組中的分布。
1.2.2 樣本量:隨訪研究的樣本量應(yīng)根據(jù)結(jié)局的發(fā)生率、暴露的情況、一類(lèi)錯(cuò)誤概率、生存時(shí)間以及刪失情況等綜合確定。一般來(lái)說(shuō),隨訪研究的樣本量的計(jì)算比較復(fù)雜,有軟件可以實(shí)現(xiàn)[4-5]。但對(duì)于大樣本隊(duì)列研究來(lái)說(shuō),樣本量在研究初始可以不用考慮。
1.2.3 分組方法:隊(duì)列隨訪研究的分組方法與隨機(jī)對(duì)照試驗(yàn)中采用的隨機(jī)化分組方法不同,其是根據(jù)自然暴露形成的分組。隨機(jī)化分組時(shí),組間的均衡性能得到保證,但是在隊(duì)列隨訪研究中,由于是根據(jù)自然形成的暴露因素進(jìn)行的分組,組間基線資料不一定能均衡可比,在進(jìn)行數(shù)據(jù)分析時(shí),可通過(guò)多因素校正、分層分析、傾向性評(píng)分等方法進(jìn)行平衡。
1.2.4 研究?jī)?nèi)容:研究?jī)?nèi)容包括研究的變量、數(shù)據(jù)的來(lái)源與測(cè)量方法等。隨訪研究中,研究的變量包括結(jié)局、暴露、預(yù)測(cè)因子、潛在的混雜因子和效應(yīng)修飾因子等。在研究中,應(yīng)精確描述以上變量的來(lái)源和標(biāo)準(zhǔn)化測(cè)量的方法。
1.2.5 隨訪方法:在隨訪研究實(shí)施過(guò)程中,隨訪的方法也是需要慎重考慮的因素。隨訪研究中,對(duì)象的失訪對(duì)結(jié)果的影響較大,在研究過(guò)程中,還是應(yīng)該盡量避免失訪。一般隨訪的方式有電話隨訪、門(mén)診隨訪、上門(mén)隨訪,以及最近新興的互聯(lián)網(wǎng)隨訪。選擇研究對(duì)象時(shí),建議選擇依從性好、容易隨訪的對(duì)象。
1.2.6 統(tǒng)計(jì)學(xué)方法:隨訪研究的數(shù)據(jù)除與其他研究,如病例對(duì)照研究、橫斷面研究能收集到的基線信息外,還會(huì)有隨訪的數(shù)據(jù)信息,包括生存時(shí)間、暴露的變化以及結(jié)局等,是一個(gè)由因及果的過(guò)程。在統(tǒng)計(jì)分析階段,可根據(jù)不同的研究目的選擇合適的統(tǒng)計(jì)分析方法。進(jìn)行基線資料的比較時(shí),可以根據(jù)數(shù)據(jù)的類(lèi)型選擇t檢驗(yàn)、方差分析、卡方檢驗(yàn)、非參數(shù)檢驗(yàn)等。對(duì)生存時(shí)間進(jìn)行分析時(shí),可以采用生存分析。如果要開(kāi)展病因研究,如明確研究因素是否為獨(dú)立的危險(xiǎn)因素或影響預(yù)后的因素,則需要采用分層分析、多因素分析或傾向性評(píng)分等多種方法校正各種混雜因素。如果開(kāi)展疾病的療效研究,可以采用Cox比例風(fēng)險(xiǎn)回歸模型。
生存分析是既考慮結(jié)局又考慮生存時(shí)間的一種統(tǒng)計(jì)學(xué)方法。隨訪研究中,通過(guò)隨訪,我們可以收集到很多信息,如暴露因子的變化(性質(zhì)與強(qiáng)度)、研究對(duì)象結(jié)局的發(fā)生情況以及發(fā)生結(jié)局的時(shí)間等。生存分析可以充分利用時(shí)間信息,從而得到陽(yáng)性結(jié)果。例如,分別研究采用胃癌根治術(shù)以及化療方式治療進(jìn)展期胃癌的臨床效果,即使最終所有的研究對(duì)象都死亡,我們還是可以通過(guò)生存分析判斷2組病人發(fā)生死亡的時(shí)間是否有差異,進(jìn)而得出胃癌根治術(shù)是否能延緩病人死亡的結(jié)論。另外,由于隨訪研究的失訪問(wèn)題,或者由于經(jīng)費(fèi)、時(shí)間的原因,導(dǎo)致不是所有的研究對(duì)象都能觀察到想要的結(jié)局,會(huì)使研究效率降低。而通過(guò)生存分析,能充分利用失訪者或者未發(fā)生結(jié)局者提供的信息,從而得出可信度高的結(jié)論,提高研究的把握度。
2.1 生存分析中的概念 進(jìn)行生存分析前,對(duì)隨訪研究中涉及的變量或概念應(yīng)有明確的定義,可以使分析報(bào)告更具有合理性和說(shuō)服力。(1)起點(diǎn)事件:對(duì)研究對(duì)象入選的時(shí)間或者研究開(kāi)始的時(shí)間要有明確的定義。起點(diǎn)事件即研究開(kāi)始時(shí)研究對(duì)象所處的狀態(tài),如以治療開(kāi)始為起點(diǎn)、以發(fā)病為起點(diǎn)。(2)終點(diǎn)事件:即隨訪過(guò)程中出現(xiàn)所要研究的結(jié)局事件,如死亡或者疾病進(jìn)展、生物學(xué)標(biāo)志物陽(yáng)性等。對(duì)于終點(diǎn)事件,在隨訪研究中也要有明確的定義。(3)觀察終點(diǎn):由于時(shí)間、經(jīng)費(fèi)的有限性,隨訪研究不是無(wú)限延長(zhǎng)的,因此常常會(huì)確定一個(gè)觀察終點(diǎn),到終點(diǎn)時(shí)間后,所有對(duì)象停止觀察,這個(gè)時(shí)間即隨訪時(shí)間。臨床隨訪研究的隨訪時(shí)間常根據(jù)疾病的短期預(yù)后以及長(zhǎng)期預(yù)后而有所不同。(4)生存時(shí)間:是指從起始事件開(kāi)始,到研究對(duì)象出現(xiàn)終點(diǎn)事件所經(jīng)歷的時(shí)間。生存過(guò)程中,有可能對(duì)象會(huì)因?yàn)槠渌蚨劳?,也有可能?duì)象一直未發(fā)生想要的結(jié)局,導(dǎo)致不能觀察到生存時(shí)間。(5)混雜因素:隨訪研究過(guò)程中,除了研究因素以外,研究對(duì)象的其他特征、暴露的環(huán)境等因素均為混雜因素。(6)截尾數(shù)據(jù):隨訪過(guò)程中失訪、因其他原因死亡以及觀察終點(diǎn)仍未出現(xiàn)終點(diǎn)事件的對(duì)象的生存時(shí)間的數(shù)據(jù)稱為截尾數(shù)據(jù),其生存時(shí)間為從起點(diǎn)事件到最后一次隨訪時(shí)間所經(jīng)歷的時(shí)間。
2.2 生存分析過(guò)程
2.2.1 描述生存過(guò)程:隨訪研究有著非常豐富的數(shù)據(jù)資料,包括研究初始時(shí)的基線資料,隨訪過(guò)程中暴露因子、混雜因子的變化及強(qiáng)度,研究對(duì)象的生存情況以及結(jié)局事件的發(fā)生情況等。在對(duì)隨訪研究資料進(jìn)行分析時(shí),首先應(yīng)描述研究對(duì)象的基線情況、暴露的特征、潛在混雜因素、生存時(shí)間、發(fā)生結(jié)局事件對(duì)象的例數(shù)、截尾數(shù)據(jù)情況及失訪情況。例如,在研究阿帕替尼用于一線治療進(jìn)展后晚期非鱗非小細(xì)胞肺癌的療效時(shí),應(yīng)描述入選對(duì)象的基本特征(年齡、性別、病程、病理分期、吸煙史、手術(shù)史、基因突變狀態(tài)等)、阿帕替尼用藥情況、療效(完全緩解、部分緩解、疾病穩(wěn)定、疾病進(jìn)展的例數(shù))、生存時(shí)間(無(wú)進(jìn)展生存期、總生存期)以及失訪情況。在對(duì)總體情況進(jìn)行描述的基礎(chǔ)上,需對(duì)阿帕替尼用藥組和非用藥組分別進(jìn)行描述并比較組間差異,以判斷2組基線資料是否均衡可比。
描述生存時(shí)間或生存率的常用方法有壽命表法、Kaplan-Meier法等。Kaplan-Meier法既適用于小樣本資料又適用于大樣本資料,而壽命表法僅適用于大樣本(n>100)資料[6-7]。一般我們可以通過(guò)統(tǒng)計(jì)軟件得到生存曲線,例如采用SPSS軟件中的生存分析模塊,可以得到生存曲線(如圖1),用于估計(jì)不同暴露組的生存率(生存函數(shù)或中位生存時(shí)間)等生存情況。
圖1 Kaplan-Meier生存曲線圖
2.2.2 比較生存時(shí)間:對(duì)于隨訪研究,比較不同暴露組的生存時(shí)間的差異可以初步判斷暴露對(duì)研究疾病的作用。但是,由于生存時(shí)間常呈偏態(tài)分布,以及有刪失數(shù)據(jù)的存在,采用t檢驗(yàn)進(jìn)行生存時(shí)間的比較不合適。實(shí)際分析過(guò)程中,對(duì)于組間生存率(生存曲線)的比較,常采用Log-rank檢驗(yàn)、Wilcoxon檢驗(yàn)等。
2.2.3 影響因素分析:一般在隨訪研究中,除了所研究的暴露因素,還有其他很多因素都會(huì)影響研究對(duì)象的結(jié)局,找出影響研究對(duì)象生存時(shí)間或者結(jié)局的因素,或進(jìn)行病因探索,也是進(jìn)行研究的目的。由于Logistic回歸分析未考慮時(shí)間因素,且不能利用截尾數(shù)據(jù),故而一般不用,而是采用Cox比例風(fēng)險(xiǎn)回歸模型分析。進(jìn)行Cox回歸時(shí),下面幾種方法可以用來(lái)選擇納入的校正因素。首先是研究變量有無(wú)臨床意義,這需要研究者閱讀相關(guān)文獻(xiàn)或總結(jié)臨床經(jīng)驗(yàn)。其次,可通過(guò)進(jìn)行單因素分析進(jìn)行初步篩選,然后再將有統(tǒng)計(jì)學(xué)意義的變量納入到多因素分析模型中。考慮到變量間可能存在交互作用,因此建議把單因素分析的顯著性水準(zhǔn)相對(duì)設(shè)置高一些,并在充分考慮專(zhuān)業(yè)意義的基礎(chǔ)上再進(jìn)行選擇。Cox比例風(fēng)險(xiǎn)模型的運(yùn)用前提是2組等比例風(fēng)險(xiǎn)[8-9],這可以通過(guò)比例風(fēng)險(xiǎn)假設(shè)檢驗(yàn)進(jìn)行判斷,或通過(guò)生存曲線有無(wú)相交來(lái)進(jìn)行簡(jiǎn)單判斷。一些學(xué)者對(duì)假設(shè)檢驗(yàn)的方法進(jìn)行了總結(jié),提出了一些方法,如schoenfeld殘差圖法及score殘差圖法[10-11]。
隨訪性隊(duì)列研究論文的規(guī)范撰寫(xiě)可依據(jù)加強(qiáng)觀察性流行病學(xué)研究報(bào)告質(zhì)量(STROBE)中的報(bào)告規(guī)范[12]。首先,文章的題目部分要明確隨訪研究的具體設(shè)計(jì)類(lèi)型,使讀者通過(guò)題目就能很快了解文章的設(shè)計(jì)類(lèi)型。摘要部分要具體表述研究目的、做了哪些內(nèi)容、發(fā)現(xiàn)的結(jié)果是什么等。前言部分是對(duì)研究背景的交待,如前所述,研究背景是一個(gè)項(xiàng)目的“前因后果”,應(yīng)簡(jiǎn)明、扼要、準(zhǔn)確地闡明研究背景。
研究方法部分包括研究設(shè)計(jì)、現(xiàn)場(chǎng),研究對(duì)象征集、暴露、隨訪和數(shù)據(jù)收集的時(shí)間,研究對(duì)象(合格標(biāo)準(zhǔn)、源人群和選擇方法)、隨訪方法、研究變量(明確定義的結(jié)局、暴露、預(yù)測(cè)因子、潛在的混雜因子和效應(yīng)修飾因子,并描述變量的診斷標(biāo)準(zhǔn))、存在的偏倚、樣本量的計(jì)算以及統(tǒng)計(jì)學(xué)方法(包括混雜因素、缺失值以及失訪的處理)。
隨訪研究論文的結(jié)果描述應(yīng)包含以下幾方面:(1)研究的起始時(shí)間以及終止時(shí)間,如出現(xiàn)癥狀或康復(fù)的時(shí)間、診斷日期以及終止日期等;(2)說(shuō)明刪失數(shù)據(jù)的種類(lèi)、原因以及對(duì)刪失數(shù)據(jù)的處理方式;(3)描述計(jì)算生存率的統(tǒng)計(jì)學(xué)方法;(4)描述生存率比較的統(tǒng)計(jì)學(xué)方法以及統(tǒng)計(jì)量;(5)描述暴露組以及非暴露組的一般資料、隨訪時(shí)間、生存時(shí)間(一般采用中位生存時(shí)間)、某一時(shí)期的生存率(如5年存活率等)、結(jié)局等信息;(6)描述Cox回歸的HR以及95%CI,闡明校正的混雜因素及原因。
討論和總結(jié)部分重點(diǎn)描述與假設(shè)有關(guān)的結(jié)果,討論研究的局限性以及潛在偏倚,結(jié)合結(jié)果以及其他研究證據(jù),謹(jǐn)慎地進(jìn)行結(jié)果的解釋?zhuān)⒂懻摻Y(jié)果的外推性,最后得出結(jié)論。
總之,隨訪研究是臨床研究中最常用的研究方法之一,設(shè)計(jì)嚴(yán)謹(jǐn)、實(shí)施規(guī)范、統(tǒng)計(jì)分析正確的隨訪研究也能具有較高的循證醫(yī)學(xué)證據(jù)。在隨訪研究論文中合理應(yīng)用生存分析,可以提高論文的質(zhì)量。