谷鴻秋
在臨床研究統(tǒng)計(jì)分析思路與統(tǒng)計(jì)圖表系列的前兩篇文章中[1,2],我們將臨床研究的統(tǒng)計(jì)分析思路歸納為描述基線信息、估計(jì)效應(yīng)大小及補(bǔ)充敏感性分析三部分,并對(duì)基線信息的統(tǒng)計(jì)分析與圖表做了詳細(xì)論述?;€信息是研究結(jié)果的重要部分,基線組間均衡性的比較是多因素校正的效應(yīng)估計(jì)的基礎(chǔ),但臨床研究的核心目的還需通過(guò)效應(yīng)估計(jì)來(lái)實(shí)現(xiàn)。本文將結(jié)合研究實(shí)例闡述效應(yīng)估計(jì)所涉及的統(tǒng)計(jì)方法和統(tǒng)計(jì)圖表。
臨床研究的核心目的是回答某干預(yù)措施的效果如何,某暴露因素與結(jié)局的關(guān)聯(lián)強(qiáng)度如何。估計(jì)某干預(yù)措施的效果,估算暴露因素與結(jié)局的關(guān)聯(lián)強(qiáng)度,此即臨床研究的效應(yīng)估計(jì)。對(duì)隨機(jī)對(duì)照臨床試驗(yàn),國(guó)際人用藥品注冊(cè)技術(shù)協(xié)調(diào)會(huì)(International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use,ICH)在其統(tǒng)計(jì)指導(dǎo)原則《ICH Harmonised Tripartite Guideline Statistical Principles Clinical Trails E9》的增補(bǔ)文件ICH E9(R1)中總結(jié)和強(qiáng)調(diào)了“估計(jì)目標(biāo)(estimand)”的概念,從目標(biāo)人群、目標(biāo)變量、伴發(fā)事件、以及目標(biāo)變量在目標(biāo)人群層面的效應(yīng)量四個(gè)方面對(duì)效應(yīng)估計(jì)給出了更嚴(yán)格清晰的界定[3]。
依據(jù)結(jié)局變量的類(lèi)型,臨床研究中的效應(yīng)估計(jì)可分為三大類(lèi):①連續(xù)性結(jié)局變量的均數(shù)差(MD);②分類(lèi)結(jié)局變量的率差(RD)、危險(xiǎn)度比(RR)以及優(yōu)勢(shì)比(OR);③生存結(jié)局?jǐn)?shù)據(jù)的生存率和風(fēng)險(xiǎn)比(HR)。不同的效應(yīng)指標(biāo),含義不同、適用的研究類(lèi)型和數(shù)據(jù)類(lèi)型也不同:如MD適用于有對(duì)照研究設(shè)計(jì)的連續(xù)性結(jié)局變量;RD適合前瞻性研究設(shè)計(jì)的二分類(lèi)結(jié)局變量;OR最適合病例對(duì)照研究的二分類(lèi)結(jié)局變量;RR和HR最適合隨機(jī)對(duì)照研究和隊(duì)列研究的二分類(lèi)結(jié)局變量,具體見(jiàn)表1。其它效應(yīng)指標(biāo)如中位數(shù)、回歸系數(shù)、相關(guān)系數(shù)以及RRR、APR、NNT等使用較少,不在本文討論的范圍之內(nèi)。靈敏度、特異度、一致率、陰性預(yù)測(cè)值以及陽(yáng)性預(yù)測(cè)值等屬于診斷研究中專用的效應(yīng)指標(biāo),也不納入本文討論的范疇。
此外,依據(jù)是否進(jìn)行多因素模型的校正,效應(yīng)估計(jì)分為粗略的效應(yīng)估計(jì)和校正的效應(yīng)估計(jì)。常用的多因素模型包括線性回歸、Logistic回歸以及Cox比例風(fēng)險(xiǎn)模型。不同的模型適用的結(jié)局變量類(lèi)型不同,采用的效應(yīng)指標(biāo)也不同,具體見(jiàn)表2。
效應(yīng)估計(jì)結(jié)果的展示可借助統(tǒng)計(jì)圖形或者統(tǒng)計(jì)表格。統(tǒng)計(jì)表格因其制作方便,且可提供精確數(shù)據(jù),在學(xué)術(shù)期刊中使用更為普遍。統(tǒng)計(jì)圖形因其形式豐富、色彩多樣,更有“一圖勝千言”的視覺(jué)優(yōu)勢(shì),在學(xué)術(shù)壁報(bào)和幻燈中使用更為普遍。此外,也可將統(tǒng)計(jì)圖表合為一體,充分利用二者的優(yōu)勢(shì),如Meta分析中普遍使用的森林圖即是此類(lèi)。統(tǒng)計(jì)表格與統(tǒng)計(jì)圖形各有優(yōu)劣,如何選擇效應(yīng)估計(jì)的統(tǒng)計(jì)圖表應(yīng)結(jié)合項(xiàng)目數(shù)據(jù)的特點(diǎn)、目的以及具體的使用場(chǎng)景綜合考量。
表1 臨床研究常用效應(yīng)指標(biāo)的特征比較
表2 不同結(jié)局類(lèi)型的效應(yīng)估計(jì)指標(biāo)與統(tǒng)計(jì)圖形
圖1 急性腦出血患者強(qiáng)化降壓的ATACH-2研究的效應(yīng)估計(jì)表格
圖2 PLATO研究中替格瑞洛與氯毗格雷療效與安全性的效應(yīng)估計(jì)表格
效應(yīng)估計(jì)統(tǒng)計(jì)表格的具體形式變化多樣,但基本遵循一個(gè)通用的范式,具體形式可參考本系列首篇文章中的“表2”[1],典型案例見(jiàn)圖1,急性腦出血患者強(qiáng)化降壓的ATACH-2研究的效應(yīng)估計(jì)表格[4]。隨機(jī)對(duì)照臨床試驗(yàn)由于組間均衡性可由隨機(jī)分配機(jī)制保證,因此常不報(bào)告多因素校正的效應(yīng)估計(jì),如在急性冠狀動(dòng)脈綜合征患者中比較替格瑞洛與氯毗格雷療效與安全性的PLATO研究[5],見(jiàn)圖2。效應(yīng)估計(jì)表格中應(yīng)針對(duì)每個(gè)結(jié)局的類(lèi)別(連續(xù)變量、二分類(lèi)變量、生存數(shù)據(jù))分別做不同的統(tǒng)計(jì)描述和效應(yīng)估計(jì)(表2)。結(jié)局為連續(xù)變量時(shí),統(tǒng)計(jì)描述使用均數(shù)和標(biāo)準(zhǔn)差,效應(yīng)估計(jì)采用多因素模型計(jì)算校正前后的MD及其95% CI和P值(如急性缺血性卒中患者強(qiáng)化降壓的CATIS研究[6]);結(jié)局為二分類(lèi)變量時(shí),統(tǒng)計(jì)描述使用頻數(shù)(百分比),效應(yīng)估計(jì)中依據(jù)研究類(lèi)型計(jì)算多因素模型校正前后的RD(如評(píng)估安定類(lèi)藥物是否增加老年癡呆患者死亡率研究[7])、OR(如急性缺血卒中患者動(dòng)脈內(nèi)治療的隨機(jī)對(duì)照MR CLEAN研究[8])或者RR(如比較卒中患者靜脈t-PA溶栓后支架取栓與單純靜脈t-PA溶栓的SWIFT PRIME研究[9])及其95%CI和P值;生存數(shù)據(jù),統(tǒng)計(jì)描述可直接使用事件數(shù)(百分比)(如比較氯毗格雷和阿司匹林治療急性小卒中和短暫性腦缺血發(fā)作患者CHANCE研究[10]),為充分利用生存數(shù)據(jù)的特點(diǎn),研究者常增加Kaplan-Meier估計(jì)的生存率(如PLATO研究[5],SAVOR研究[11]及SOCRATES[12]等研究),或者發(fā)病密度,即每人年的事件率(如2型糖尿病的強(qiáng)化降糖ACCORD研究[13,14]、伴心血管病高危因素的強(qiáng)化降壓SPIRNT研究[15]),效應(yīng)估計(jì)中計(jì)算多因素模型校正前后的HR值及95%CI和P值。
效應(yīng)估計(jì)統(tǒng)計(jì)圖形在本系列的首篇文章已有論述,具體參見(jiàn)表2的總結(jié)。典型案例如阿利吉倫與氨氯地平片降壓試驗(yàn)中帶誤差限的條圖[16],氯吡格雷高血小板反應(yīng)性的急性冠脈綜合征患者中,比較替格瑞洛和普拉格雷的血小板反應(yīng)性研究的散點(diǎn)圖與箱線圖的組合圖[17],阿利吉倫與氨氯地平片降壓研究的條圖[16],吸煙、戒煙對(duì)體重及肥胖的影響研究[18]和院外心臟驟停的發(fā)病及生存情況的時(shí)間變化趨勢(shì)研究[19]中的帶置信區(qū)間的點(diǎn)圖,以及此前提及的CHANCE研究[10]的Kaplan-Meier生存曲線及ACCROD研究[13,14]的累積事件率曲線,見(jiàn)圖3。
圖3 臨床研究常用效應(yīng)估計(jì)統(tǒng)計(jì)圖形實(shí)例
臨床研究常用的效應(yīng)指標(biāo)中,MD和RD的含義直觀、易于理解和計(jì)算,而RR和OR的含義則需要借助列聯(lián)表來(lái)說(shuō)明。如下,假定由暴露和疾病兩個(gè)屬性定義的四種狀態(tài)的人數(shù)分別為a,b,c,d。
RR表示暴露組與非暴露組疾病發(fā)病率之比,。OR最常見(jiàn)的含義是病例組的暴露比與非病例組的暴露比之比RR適合于前瞻性的研究設(shè)計(jì),OR適合病例對(duì)照研究設(shè)計(jì)。當(dāng)疾病的發(fā)生率很低時(shí),RR≈OR,此時(shí)前瞻性的研究設(shè)計(jì)也可采用OR作為效應(yīng)指標(biāo),如評(píng)價(jià)瑞舒伐他汀預(yù)防心臟外科圍手術(shù)期并發(fā)癥的隨機(jī)對(duì)照臨床試驗(yàn)中,效應(yīng)指標(biāo)即采用OR值[20]。HR則是暴露組與非暴露組在各時(shí)點(diǎn)的瞬時(shí)風(fēng)險(xiǎn)之比,其計(jì)算需要借助Cox比例風(fēng)險(xiǎn)模型。
校正的效應(yīng)指標(biāo)需要借助多因素回歸模型估算。臨床研究中常用的三種多因素回歸模型為線性回歸、Logistic回歸以及Cox比例風(fēng)險(xiǎn)回歸[21]。
線性回歸適用于結(jié)局變量為連續(xù)變量的情形,模型通式如下:
其中x1,x2,…xm即為校正的協(xié)變量,b1,b2,…bm為m個(gè)自變量的回歸系數(shù)。對(duì)于某一回歸系數(shù)bk,其含義是控制了其它協(xié)變量(保持其它協(xié)變量不變的情況下),xk每增加一個(gè)單位所致的y的平均改變量。臨床研究通常比較的是組間的效應(yīng)差異,因此回歸系數(shù)作為效應(yīng)指標(biāo)的可解釋性要遠(yuǎn)低于校正的均數(shù)差,故研究者通常借助多因素線性回歸計(jì)算組間校正的均數(shù)差,即LS-Means Differences。
Logistic回歸模型適用于結(jié)局變量為二分類(lèi)變量的情形。其模型通式如下:
②與①的區(qū)別僅在于等式左邊的變換。由于分類(lèi)反應(yīng)變量的取值為離散的點(diǎn),轉(zhuǎn)而用出現(xiàn)某結(jié)局的概率P的logit變換即做為應(yīng)變量,如此應(yīng)變量的取值范圍從單純的幾個(gè)點(diǎn)擴(kuò)展到(-∞,+∞)。恰巧是流行病學(xué)研究中的比值(odds)的概念。當(dāng)某影響因素xk取值1,0時(shí)(即有無(wú)此影響因素,或此影響因素增加一個(gè)單位),分別代入②式相減便可得回歸系數(shù),即,其中為流行病學(xué)研究中的比值比(OR)。當(dāng)疾病發(fā)生率較低時(shí),OR≈RR,而RR是流行病學(xué)研究里的危險(xiǎn)度比。自變量xk每增加一個(gè)單位(如從0到1),則出現(xiàn)結(jié)局的危險(xiǎn)是原來(lái)的ebk倍,如此,原本看似牽強(qiáng)的數(shù)學(xué)變換與有實(shí)際解釋意義的流行病學(xué)關(guān)聯(lián)指(OR和RR)就此巧妙地結(jié)合起來(lái)。不過(guò)需留意,Logistic回歸直接得出的是校正的OR值,如需計(jì)算校正的RR,需采用相對(duì)危險(xiǎn)度回歸[22-24](Relative risk regression)或者基于Logistic、Log-Binomial、Poisson或者Cox回歸改造而得[25,26]。
Cox比例風(fēng)險(xiǎn)回歸模型適用于結(jié)局為時(shí)間-事件變量的情形,所謂比例風(fēng)險(xiǎn)是指要比較的組間出現(xiàn)某生存結(jié)局的風(fēng)險(xiǎn)比恒定,即不隨時(shí)間而變化。Cox比例風(fēng)險(xiǎn)回歸模型通??蓪?xiě)成如下通式:
其中h0(t)表示基礎(chǔ)風(fēng)險(xiǎn),即所有協(xié)變量為0時(shí)的風(fēng)險(xiǎn),h(t)表示t時(shí)刻的風(fēng)險(xiǎn)。與logistic回歸類(lèi)似,當(dāng)某影響因素xk取值1,0時(shí),分別代入④式相減便可得回歸系數(shù)而流行病學(xué)研究中的風(fēng)險(xiǎn)比HR,表示自變量xk每增加一個(gè)單位,出現(xiàn)結(jié)局的風(fēng)險(xiǎn)變?yōu)樵瓉?lái)的ebk倍。由于Cox比例風(fēng)險(xiǎn)模型對(duì)基礎(chǔ)風(fēng)險(xiǎn)h0(t)并無(wú)假定,限制條件少,使用廣,因此在醫(yī)學(xué)研究領(lǐng)域應(yīng)用廣泛。多因素Cox比例風(fēng)險(xiǎn)回歸模型可直接獲得校正的HR,但在應(yīng)用時(shí)需留意時(shí)依協(xié)變量[27]及競(jìng)爭(zhēng)風(fēng)險(xiǎn)[28]。
臨床研究常用的效應(yīng)指標(biāo)及統(tǒng)計(jì)圖形的SAS實(shí)現(xiàn),具體見(jiàn)表3。SAS的繪圖模塊SAS/GRAPH在語(yǔ)法的一致性,編程的簡(jiǎn)便性上不如9.2版本推出的新繪圖工具ODS Graphics,因此表3推薦ODS Graphics的SGPLOT過(guò)程。其它的繪圖工具如R的ggplot2包[29],以及專門(mén)用于生存分析的survminer包[30]均可方便實(shí)現(xiàn)上述圖形。
表3 臨床研究常用效應(yīng)估計(jì)及統(tǒng)計(jì)圖形的SAS實(shí)現(xiàn)
中國(guó)循證心血管醫(yī)學(xué)雜志2018年9期