曾憲濤,冷衛(wèi)東,郭毅,劉菊英
證據(jù)是循證醫(yī)學(xué)(Evidence-based Medcine,EBM)的核心,基于隨機(jī)對照試驗(yàn)(RCT)的系統(tǒng)評價/Meta分析是當(dāng)前公認(rèn)的最高級別證據(jù)。近些年來,隨著Meta分析的不斷推廣,國內(nèi)Meta分析大量涌現(xiàn),這為臨床實(shí)踐提供了很好的支持。但因制作者的水平各異,使得Meta分析的質(zhì)量良莠不齊,也給臨床實(shí)踐中使用者的選擇帶來了疑惑;再者,Meta分析只有真正走向臨床并正確的使用,才能體現(xiàn)其價值,而當(dāng)前Meta分析的應(yīng)用較少。鑒于此,我們擬從Meta分析的類型、相關(guān)軟件、原始研究質(zhì)量評價、報告規(guī)范、Meta分析的質(zhì)量評價等方面進(jìn)行一個系列的講解,以期為使用者提供參考。
本文作為第一篇,我們將對Meta分的起源和發(fā)展進(jìn)行簡要回顧后,對當(dāng)前存在的Meta分析類型進(jìn)行一個簡介。希望通過本系列,使相關(guān)的讀者能夠撰寫出較高質(zhì)量的Meta分析并能將其在臨床工作中進(jìn)行運(yùn)用。
Meta分析的起源最早可以追溯到著名統(tǒng)計(jì)學(xué)家Pearson,他于1904年在研究“血清接種預(yù)防腸熱病的療效”研究中用這一方法將接種腸熱病疫苗與生存率之間的相關(guān)系數(shù)進(jìn)行了合并[1];1907年,Goldberger制作了特定的標(biāo)準(zhǔn)對所發(fā)表的有關(guān)傷寒桿菌尿毒癥的文獻(xiàn)進(jìn)行選擇及資料的提取分析,然后進(jìn)行統(tǒng)計(jì)學(xué)分析,被認(rèn)為達(dá)到了當(dāng)今Meta分析的基本要求[2];1920年,著名統(tǒng)計(jì)、遺傳學(xué)家Fisher提出了“合并P值”的思想[3],被認(rèn)為是Meta分析的前身;1930年開始,Meta分析開始廣泛應(yīng)用了社會科學(xué)領(lǐng)域[2]。
直到1955年,Beecher[4]發(fā)表了醫(yī)學(xué)領(lǐng)域第一篇真正意義上的Meta分析,用以評價安慰劑的療效,并給予了Meta分析初步的定義;之后Meta分析在社會學(xué)領(lǐng)域再次得到發(fā)展,這一術(shù)語由英國教育心理學(xué)家Glass[5]于1976年命名并將其定義為:“The statistical analysis of large collection of analysis results from individual studies for the purpose of integrating the findings”。此后,關(guān)于Meta分析的定義一直存在爭議,不少方法學(xué)家亦都對其下過定義,但都傾向于“Meta分析是對以往的研究結(jié)果進(jìn)行系統(tǒng)定量綜合的統(tǒng)計(jì)學(xué)方法”這一含義[3]。
如今,Meta分析在醫(yī)學(xué)領(lǐng)域應(yīng)用最為廣泛,應(yīng)用最多的是對干預(yù)性的隨機(jī)對照試驗(yàn)的評價,在觀察性研究和交叉對照研究中也得到推薦[6]。自Archie Cochrane奠定“循證醫(yī)學(xué)”思想以來,Meta分析已成為臨床證據(jù)的重要來源之一[7]。
單組率的Meta分析,是一種只提供了一組人群的總?cè)藬?shù)和事件發(fā)生人數(shù),不像其它類的Meta分析有兩組人群,多為患病率、檢出率、知曉率、病死率、感染率等的調(diào)查,基于的原始研究為橫斷面研究(cross-sectional study)。
目前,對各獨(dú)立樣本中效應(yīng)量為率的同類研究資料進(jìn)行Meta分析并沒有比較成熟的方法,較常用的有以下幾種:①加權(quán)計(jì)算[8]:即根據(jù)每個獨(dú)立研究的樣本量大小,給予不同的權(quán)重,對各獨(dú)立樣本的效應(yīng)量率進(jìn)行合并;②直接等權(quán)相加[9]:即把各獨(dú)立的結(jié)果事件直接等權(quán)相加,然后直接計(jì)算合并率,再用近似正態(tài)法計(jì)算其可信區(qū)間(95%可信區(qū)間=p±1.96 Sp);③調(diào)整后再等權(quán)相加[10]:即對各個獨(dú)立研究資料的率進(jìn)行調(diào)整后再行等權(quán)相加,計(jì)算出合并率的大小。
對單組率的Meta分析而言,最難的就是控制異質(zhì)性,進(jìn)行亞組分析和Meta回歸分析是其重要的處理方法[8-9]。
1932年,著名統(tǒng)計(jì)學(xué)家Fisher提出了“合并P值”的思想,被認(rèn)為是Meta分析的前身[3]。但在后期的應(yīng)用中許多學(xué)者發(fā)現(xiàn)單純合并P值存在以下不足[11-12]:不同研究未能根據(jù)研究特點(diǎn)進(jìn)行加權(quán);無法獲知事件的發(fā)生信息,故無法得出有任何臨床意義的信息;③無法分析兩個結(jié)論相反的研究;④無法進(jìn)一步評價研究之間的差異。
因此,單純行P值的Meta分析是不推薦的。但當(dāng)納入研究僅給出了P值,且按照Cochrane系統(tǒng)評價員手冊[13]給出計(jì)算方法也不能計(jì)算出需要的數(shù)據(jù),且臨床實(shí)踐需要合并,那么,在這種情況下可以考慮單純對P值進(jìn)行合并。
在Meta分析時,需分析各研究間的異質(zhì)性,并對異質(zhì)性的來源進(jìn)行探討,Meta回歸(meta-regression)分析可評價研究間異質(zhì)性的大小及來源。一般認(rèn)為,Meta回歸分析是亞組分析的一種擴(kuò)大,主要通過對多因素的效應(yīng)量進(jìn)行聯(lián)合分析實(shí)現(xiàn),僅當(dāng)Meta分析納入的研究數(shù)量在10個以上時才行此分析[13-15,28]。
在Meta回歸里,將效應(yīng)估計(jì)量(如RR、OR、MD或logRR等)作為結(jié)果變量,將可影響效應(yīng)量大小的研究特征因素(“協(xié)變量”或“潛在效應(yīng)量改變因子”)作為解釋變量,則回歸系數(shù)描述了結(jié)果變量怎樣隨著解釋變量的單位增加而改變;其統(tǒng)計(jì)學(xué)差異性通過對結(jié)果變量和解釋變量之間有無線性關(guān)系來確定,通過回歸系數(shù)的P值來判斷這種差異有無統(tǒng)計(jì)學(xué)意義[13-15,28]。
累積Meta分析(cumulative meta-analysis)最早應(yīng)用于1981年,是指將研究資料作為一個連續(xù)的統(tǒng)一體,按研究開展的時間順序及時將新出現(xiàn)的研究納入原有Meta分析的一種方法[16-19,28]。因此,Meta分析每次研究加入后均重復(fù)一次Meta分析,可以反映研究結(jié)果的動態(tài)變化趨勢及各研究對結(jié)果的影響,也有助于盡早發(fā)現(xiàn)有統(tǒng)計(jì)學(xué)意義的干預(yù)措施。
在臨床實(shí)踐中,經(jīng)常會碰到?jīng)]有直接比較的證據(jù)或者需要從眾多干預(yù)措施中選擇對患者最佳的措施,此時,研究者往往會從RCT中尋找間接證據(jù),這就形成了間接比較的Meta分析或多種干預(yù)措施比較的 Meta分析(網(wǎng)狀 Meta分析)[20-21]。
6.1兩因素間接比較若想比較兩種干預(yù)措施A與B的效果,但當(dāng)前沒有兩者的直接比較的RCT,卻有兩者同干預(yù)措施C的比較,此時,可以將C作為公共比較組,借助間接比較的方法得出A與B的效果。
間接比較包括未調(diào)整間接比較和調(diào)整后間接比較[20,22-23]。未調(diào)整間接比較是直接從RCT中提取A與B的數(shù)據(jù),此方法雖然簡單但對隨機(jī)性的破壞很大,故可能產(chǎn)生較大偏倚從而高估療效,現(xiàn)已不推薦使用。調(diào)整后間接比較以C作為公共比較組(C可以是安慰劑或陽性對照組),與未調(diào)整間接比較相比其最大的的優(yōu)勢是能夠在一定程度上保留隨機(jī)特性,且經(jīng)過了同質(zhì)性和相似相檢驗(yàn),因而偏倚較小,為當(dāng)前推薦的方法(圖 1)[23]。
圖1 調(diào)整后間接比較示意圖
6.2網(wǎng)狀Meta分析在臨床實(shí)踐中,若有一系列的藥物可以治療某種疾病,但RCT均是藥物與安慰劑的對照,而藥物互相之間的RCT都沒有進(jìn)行或很少,那么在這種情況下,就需要將間接比較和直接比較的證據(jù)進(jìn)行合并,即行網(wǎng)狀Meta分析(network meta-analysis)(圖 2)[21]。
圖2 網(wǎng)狀Meta分析示意圖
行網(wǎng)狀Meta分析首要的是構(gòu)造一個等級模型,以處理抽樣變異、治療異質(zhì)性及研究治療比較間的不一致性,并提供模型的最大似然比。目前,主要的方法有經(jīng)典的頻率學(xué)法和貝葉斯法。頻率學(xué)法目前主要應(yīng)用的有倒方差法和廣義線性(混合)模型。倒方差法即將各研究的方差倒數(shù)作為權(quán)重,對各研究效應(yīng)進(jìn)行加權(quán)平均,總體效應(yīng)的方差為權(quán)重之和的倒數(shù),操作相對簡單;廣義線性模型則考慮了隨機(jī)效應(yīng),但應(yīng)用的前提是需要獲得受試者個體數(shù)據(jù)。貝葉斯法是基于貝葉斯定理而發(fā)展而來的,與頻率學(xué)方法相比,其優(yōu)勢在于可以利用后驗(yàn)概率對所有分析的干預(yù)措施進(jìn)行排序,且克服了頻率學(xué)法在參數(shù)估計(jì)時通過不斷的迭代去估計(jì)最大似然函數(shù)、易出現(xiàn)不穩(wěn)定而得到有偏倚的結(jié)果的缺陷,故估計(jì)值更為準(zhǔn)確,且建模更靈活,為當(dāng)前所推薦的方法[24-25]。
因地區(qū)、個體、診斷方法及條件的差異,使得發(fā)表的關(guān)于同一診斷方法的研究結(jié)果存在著不同甚至是矛盾的;且隨著新技術(shù)的不斷走向臨床,選擇也愈來愈多。診斷性Meta分析是近年來出現(xiàn)的,并為“診斷試驗(yàn)準(zhǔn)確性研究的報告規(guī)范(STARD)”指導(dǎo)小組[26]和“Cochrane協(xié)作網(wǎng)”[13]所推薦。
診斷性Meta分析主要是為評價某種診斷措施對目標(biāo)疾病的準(zhǔn)確率,多為對目標(biāo)疾病的敏感性、特異性進(jìn)行評價,報道似然比、診斷比值比等。若是為了評價某種診斷措施對目標(biāo)疾病的診斷價值,則一般納入的應(yīng)為病例對照研究,對照組多為健康人群;此外,若是為評價運(yùn)用診斷措施后對患者的治療效果或預(yù)后效果的改善作用,則納入的原始研究應(yīng)為RCT,這兩種情況下行Meta分析的方法亦與防治性研究的Meta分析相同[26-27]。
個體數(shù)據(jù)(individual patient data,IPD)Meta分析是近年來發(fā)展起來的一種特殊類型,其不是直接利用已經(jīng)發(fā)表的研究結(jié)果總結(jié)數(shù)據(jù)進(jìn)行Meta分析,而是通過從原始研究作者那里獲取每個參與者的原始數(shù)據(jù),并對這些數(shù)據(jù)進(jìn)行Meta分析[13]。
與常規(guī)Meta分析相比,個體數(shù)據(jù)Meta分析具有以下優(yōu)點(diǎn):能夠最大限度的納入未發(fā)表的試驗(yàn)或灰色數(shù)據(jù),能夠進(jìn)行時間-事件分析,能夠更新長期隨訪的數(shù)據(jù),能夠進(jìn)行更復(fù)雜的多變量統(tǒng)計(jì)分析;但耗費(fèi)大量時間、資源等是其最大的缺陷。目前,建立在IPD基礎(chǔ)上的Meta分析被稱為系統(tǒng)評價的金標(biāo)準(zhǔn)[13]。
前瞻性Meta分析(prospective meta-analysis,PMA)是指在RCT的結(jié)果尚未出來之前,先進(jìn)行系統(tǒng)檢索、評價和制定納入及排除標(biāo)準(zhǔn)的一種Meta分析。因PMA是在研究開始之前或者進(jìn)行中就制定好了計(jì)劃,可以避免各研究間出現(xiàn)較大的差異,同時具有個體數(shù)據(jù)Meta分析的優(yōu)點(diǎn)[13]。當(dāng)前認(rèn)為,PMA是針對需要行多中心、大樣本研究但現(xiàn)實(shí)又不能實(shí)現(xiàn)的情況下的最有效方式,但成本非常高、操作困難且需要耗費(fèi)大量的時間。
當(dāng)前,常規(guī)Meta分析主要基于有對照組的直接比較的研究,最常見的是基于RCT的干預(yù)性Meta分析,此外,還有預(yù)后研究、動物實(shí)驗(yàn)、病因研究、基因多態(tài)性等的Meta分析。基于的原始研究類型還有隊(duì)列研究、病例對照研究、群隨機(jī)對照試驗(yàn)、自身對照試驗(yàn)等[3,12-13,28]。
近年來,隨著方法學(xué)的研究進(jìn)展及循證實(shí)踐的實(shí)際需求,出現(xiàn)了許多上述未涉及到的Meta分析,主要有:不良反應(yīng)的Meta分析,成本-效果/效用/效益的Meta分析,患者報告結(jié)局的Meta分析,全基因組關(guān)聯(lián)研究的Meta分析,Meta分析的匯總分析,等[13,29-30]。
結(jié)語:毫無疑問,高質(zhì)量的證據(jù)是循證醫(yī)學(xué)實(shí)踐取得成功的重要支撐,高質(zhì)量的Meta分析則是其重要的保障。隨著Meta分析知識的普及及方法學(xué)的不斷改進(jìn)與廣泛應(yīng)用,其質(zhì)量將進(jìn)一步提高,從而真正為醫(yī)療衛(wèi)生和預(yù)防實(shí)踐提供更科學(xué)的證據(jù)。
[1]Pearson K.Report on Certain Enteric Fever Inoculation Statistics[J].Br Med J,1904,2(2288):1243-1246.
[2]Winkelstein W Jr.The first use of meta-analysis[J]?Am J Epidemiol,1998,147(8):717.
[3]Egger M,Smith GD,Altman DG.Systematic reviews in health care.Meta-analysis in context[M].2nd edition.London:BMJ Publishing Group,2001.
[4]Beecher HK.The powerful placebo[J].JAMA,1955,159(17):1602-1606.
[5]Glass G.Primary,secondary and meta-analysis of research[J].Educ Res,1976,5:3-8.
[6]Egger M,Smith GD.Meta-Analysis.Potentials and promise[J].BMJ,1997,315(7119):1371-1374.
[7]Cochrane AL.Archie Cochrane in his own words.Selections arranged from his 1972 introduction to"Effectiveness and Efficiency:Random Reflections on the Health Services"1972[J].Control Clin Trials,1989,10(4):428-433.
[8]Sutton AJ,Abrams KR,Jones DR,et al.Methods for Meta-Analysis in Medical Research[M].Chichester:John Wiley & SonsLtd,2000.
[9]Ali SA,Donahue RM,Qureshi H,et al.Hepatitis B and hepatitis C in Pakistan:prevalence and risk factors[J].Int J Infect Dis,2009,13(1):9-19.
[10]Batham A,Narula D,Toteja T,et al.Sytematic review and meta-analysis of prevalence of hepatitis B in India[J].Indian Pediatr,2007,44(9):663-674.
[11]Jones J,Hunter D.Consensus methods for medical and health services research[J].BMJ,1995,311(7001):376-380.
[12]Sterne JA.Meta-Analysis in Stata:An Updated Collection from the Stata Journal[M].Stata Press,2009.
[13]Higgins JPT,Green S.Cochrane Handbook for Systematic Reviews of Interventions Version 5.1.0[updated March 2011].The Cochrane Collaboration,2011.Available from www.cochrane-handbook.org.
[14]Berkey CS,Hoaglin DC,Antczak-Bouckoms A,et al.Meta-analysis of multiple outcomes by regression with random effects[J].Stat Med,1998,17(22):2537-2550.
[15]Thompson SG,Higgins JP.How should meta-regression analyses be undertaken and interpreted?[J].Stat Med,2002,21(11):1559-1573.
[16]Berkey CS,Mosteller F,Lau J,et al.Uncertainty of the time of first significance in random effects cumulative meta-analysis[J].Control Clin Trials,1996,17(5):357-371.
[17]Baum ML,Anish DS,Chalmers TC,et al.A survey of clinical trials of antibiotic prophylaxis in colon surgery:evidence against further use of no-treatment controls[J].N Engl J Med,1981,305(14):795-799.
[18]Hu M,Cappelleri JC,Lan KK.Applying the law of iterated logarithm to control type I error in cumulative meta-analysis of binary outcomes[J].Clin Trials,2007,4(4):329-340.
[19]Muellerleile P,Mullen B.Sufficiency and stability of evidence for public health interventions using cumulative meta-analysis[J].Am J Public Health,2006,96(3):515-522.
[20]Song F,Altman DG,Glenny AM,et al.Validity of indirect comparison for estimating efficacy of competing interventions:empirical evidence from published meta-analyses[J].BMJ,2003,326(7387):472.
[21]Lumley T.Network meta-analysis for indirect treatment comparisons[J].Stat Med,2002,21(16):2313-2324.
[22]Glenny AM,Altman DG,Song F,et al.Indirect comparisons of competing interventions[J].Health Technol Assess,2005,9(26):1-134,iii-iv.
[23]Song F,Loke YK,Walsh T,et al.Methodological problems in the use of indirect comparisons for evaluating healthcare interventions:survey of published systematic reviews[J].BMJ,2009,338:b1147.
[24]Dias S,Welton NJ,Caldwell DM,et al.Checking consistency in mixed treatment comparison meta-analysis[J].Stat Med,2010,29(7-8):932-944.
[25]Buti J,Glenny AM,Worthington HV,et al.Network meta-analysis of randomised controlled trials:direct and indirect treatment comparisons[J].Eur J Oral Implantol,2011,4(1):55-62.
[26]Bossuyt PM,Reitsma JB,Bruns DE,et al.Towards complete and accurate reporting of studies of diagnostic accuracy:The STARD Initiative[J].Radiology,2003,226(1):24-28.
[27]Battaglia M,Bucher H,Egger M,et al.The Bayes Library of Diagnostic Studies and Reviews[M].2nd edition,2002.
[28]Borenstein M,Hedges LV,Higgins JPT,et al.Introduction to Meta-Analysis[M].Chichester:John Wiley & SonsLtd,2009.
[29]Ioannidis JP,Patsopoulos NA,Evangelou E.Heterogeneity in metaanalyses of genome-wide association investigations[J].PLoS One,2007,2(9):e841.
[30]Lohmueller KE,Pearce CL,Pike M,et al.Meta-analysis of genetic association studies supports a contribution of common variants to susceptibility to common disease[J].Nat Genet,2003,33(2):177-182.