曾憲濤,莊麗萍,楊宗國,董圣杰
非隨機實驗性研究(non-randomized experimental study)和診斷準確性試驗的Meta分析是臨床研究重要組成部分,而臨床前的動物實驗的Meta分析也日漸得到重視,其結論已成為循證決策的依據之一。在前面的章節(jié)中,我們已對隨機對照試驗[1]及觀察性研究[2]的質量評價工具進行了簡介,現(xiàn)對較為常用的或推薦使用的非隨機實驗性研究、診斷準確性試驗及動物實驗的評價工具進行簡介。
1.1 MINORS條目 非隨機對照試驗方法學評價指標(methodological index for non-randomized studies,MINORS)[3]是由法國外科醫(yī)師Slim等在2007年全面回顧文獻及專家共識的基礎上制定的臨床干預研究的質量評價工具,特別適用于外科非隨機對照干預性研究(non-randomized surgical studies)質量的評價。評價指標共12條,每一條分為0~2分。前8條針對無對照組的研究,最高分為16分;后4條與前8條一起針對有對照組的研究,最高分共24分。0分表示未報道;1分表示報道了但信息不充分;2分表示報道了且提供了充分的信息(表1)。
1.2 Reisch評價工具 1988年,為了促進臨床藥物治療性研究質量的評價,美國德克薩斯大學醫(yī)學部的Reisch等[4]制作了相應的評價工具,即Reisch評價工具。該工具以公認的標準和清單為基礎,歸納了12個類別共57個條目,其中包括設計、樣本量、隨機化和對照組的相關內容。清單的主要作用是評價研究的設計和績效而不是數據的分析。該工具的每個條目都是以確定的問題形式出現(xiàn),回答方式包括“是”,“否”,“不知道或不清楚”或“沒有合適的答案”。
Reisch評價工具主要是針對臨床藥物治療質量的評價,因此很多條目具有明顯的臨床藥物特殊性。該工具對于非隨機實驗性研究的質量評價可用度較高,但需結合實際的研究做一些調整以發(fā)揮該工具的評價功能。現(xiàn)被Cochrane腸道炎癥疾病小組使用,因其條目繁多,使用耗時,易用性不強,在此不作詳細介紹。
1.3 TREND聲明 TREND(the Transparent Reporting of Evaluations with Nonrandomized Designs)聲明[5]是美國疾病預防控制中心(Centers for Disease Control and Prevention,CDC)HIV/AIDS綜合防治研究(PRS)小組為提高對艾滋病防治行為干預研究的綜合能力,于2003年7月在亞特蘭大召開的CDC下屬期刊編輯會議上達成的共識。與會者認為更清晰和標準的研究評價報告不應只包括隨機設計,還要擴展到非隨機對照設計,由此提出非隨機對照設計報告規(guī)范(TREND),會議等具體內容可參閱官網http://www.cdc.gov/trendstatement/。自然,這一規(guī)范可以用來非隨機實驗性研究的質量,因此不是專用工具,在此不作詳細列出。
診斷性研究一般而言可以分為兩類:一是評價運用診斷試驗后對改善患者的治療/預后效果,多采用隨機對照設計,此時質量評價方法與隨機對照試驗相同[1];二是評價診斷試驗的準確性,此種最為常見及熟知。
2.1 QUADAS工具 QUADAS(Quality Assessment of Diagnostic Accuracy Studies)是由英國約克大學Whiting等遵照Delphi法于2003年制定的專用于系統(tǒng)評價中評價診斷準確性試驗質量的工具[6-7]。QUADAS工具是目前唯一一個經過嚴格評價和驗證的診斷準確性試驗質量評價標準,共14個條目,每一條目采用“是”、“否”或“不確定”評價(表2)。2008年,Cochrane協(xié)作網推薦QUADAS作為Cochrane診斷性試驗準確性系統(tǒng)評價中質量評價的標準,并根據協(xié)作網的篩查和診斷性研究方法學組的意見,將QUADAS的第3條、第8條和第9條列入非必須評價條目,故Cochrane診斷性試驗準確性系統(tǒng)評價中質量評價的標準最終為11條[8]。
2.2 Cochrane DTA工作組標準 Cochrane DTA工作組(Cochrane Diagnostic Test Accuracy Working Group)除了將上述QUADAS工具作為推薦使用的評價工具外,還在此基礎上針對特定的研究設計制定了附加質量評價條目[9]。特定的研究主要包括延遲驗證(需要對研究對象進行縱向隨訪)研究和診斷比較(避免選擇性偏差和獨立的多重測試評估),可能附加的質量條目如下:①是否在研究開始前已確定了臨界值(cut-off value)?②研究開始后試驗的技術指標是否未發(fā)生改變?③研究是否提供了陽性結果的清晰定義?④試驗操作者是否接受了適當的培訓?⑤治療是否在測試指標和參考標準執(zhí)行后停止?⑥是否報告了觀察者間差異(observer variation)的數據,以及是否在可接受的范圍內?⑦是否報告了儀器間差異(instrument variation)的數據,以及是否在可接受的范圍內?⑧目標是否是先行指明的?⑨研究是否未受商業(yè)資助?
表1 MINORS評價條目
表2 QUADAS條目
2.3 CASP清單 英國牛津循證醫(yī)學中心文獻嚴格評價項目(critical appraisal skill program,CASP,2004)制定了多種規(guī)范,除了前述介紹的針對隨機對照試驗[1]和分析性研究[2]的質量評價工具之外,還制定了針對診斷性試驗的質量評價清單[10](表3)。對于診斷試驗,CASP采用了12個條目,仍然分為3個部分,1~2條為篩選問題,3~12條為細節(jié)問題,1~6和9~11均采用“是”、“否”及“不知道”判定。
2.4 STARD聲明 STARD(the Standards for Reporting of Diagnostic Accuracy)聲明[11]是由荷蘭阿姆斯特丹大學的Bossuyt等組成的診斷準確性研究報告標準(STARD)籌委會在2000年9月荷蘭阿姆斯特丹舉行的共識會議上,為了改進診斷準確性研究報告質量而形成的一個由25項條目組成的清單。如前所述,STARD也可以用來評價診斷性研究的質量,本處不做詳細列出。
3.1 STAIR清單 STAIR(the initial Stroke Therapy Academic Industry Roundtable)清單最早發(fā)表于1999年,由美國馬薩諸塞大學醫(yī)學院的Fisher M領頭成立的STAIR小組制定[12]。2009年,小組對STAIR進行了更新,制定了美國“確保高質量科學研究的推薦意見(Recommendations for Ensuring Good Scientific Inquiry)”,其清單的7條內容可以作為評價動物實驗質量的標準[13]:①樣本量計算,②納入與排除標準,③隨機序列產生,④隱藏實驗動物分組方案,⑤報道將動物排除分析的原因,⑥結局的盲法評價,⑦聲明潛在的利益沖突及研究資助。
3.2 CAMARADES清單 CAMARADES(Collaborative Approach to Meta Analysis and Review of Animal Data from Experimental Stroke)清單是目前缺血性卒中動物試驗Meta分析中最常用的質量評價清單,其官方網站為http://www.camarades.info/,評價內容包括10條,其他動物實驗的評價標準多數是在此標準基礎上修訂的[14,15](表4)。
表3 CASP清單
表4 CAMARADES清單
3.3 ARRIV指南 ARRIV(Animals in Research: Reporting In Vivo Experiments)指南是在國際實驗動物3R中心(National Centre for the Replacement,Refinement and Reduction of Animals in Research,NC3Rs)的資助下,由Kilkenny領頭制定的動物實驗研究報告指南[16]。ARRIV是在充分借鑒CONSORT聲明[17]的基礎上,結合動物實驗的特殊性制定的,共包括6大部分20個條目。其不僅可以用來作為報告動物實驗的規(guī)范,還可以用來評價動物實驗的質量,此處亦不做詳細介紹。
在實際中,常提的非隨機化研究包括了非隨機實驗性研究及觀察性研究[18],因此,常產生將觀察性研究的質量評價標準應用于評價非隨機實驗性研究的情況(多為NOS)。我們認為,這是不妥當的。針對非隨機實驗性研究,我們推薦使用MINORS條目評價質量,因為其包括了有對照組和無對照組兩部分,且可通過條目10判定對照組的設置類型。對于診斷準確性試驗,早期推薦使用的還有貝葉斯圖書館(Bayes Library)評價指標[19],此標準較為繁瑣,且隨著貝葉斯圖書館合并到Cochrane圖書館中及其成員成為Cochrane DTA工作組的一部分,后期未再更新及推薦;現(xiàn)Cochrane協(xié)作網等推薦使用的是QUADAS工具,Cochrane DTA工作組并根據特定的研究需求制定了補充的標準[9];CASP在動物實驗方面,尚無得到公認的質量評價標準,Cochrane協(xié)作網亦無相關推薦及工具,當前應用較多的是Macleod等[14]自行開發(fā)并經多次修訂完善的CAMARADES清單,使用者可以根據研究實際進行調整。
[1]曾憲濤, 包翠萍, 曹世義, 等. Meta分析系列之三: 隨機對照試驗的質量評價工具[J]. 中國循證心血管醫(yī)學雜志,2012,4(3):183-5.
[2]曾憲濤, 劉慧, 陳曦, 等. Meta分析系列之四: 觀察性研究的質量評價工具[J]. 中國循證心血管醫(yī)學雜志,2012,4(4):297-9.
[3]Slim K,Nini E,Forestier D,et al. Methodological index for nonrandomized studies(minors):development and validation of a new instrument[J]. ANZ J Surg,2003,73(9):712-6.
[4]Reisch JS,Tyson JE,Mize SG. Aid to the evaluation of therapeutic studies[J]. Pediatrics,1989,84(5):815-27.
[5]Des Jarlais DC,Lyles C,Crepaz N,TREND Group. Improving the reporting quality of nonrandomized evaluations of behavioral and public health interventions:the TREND statement[J]. Am J Public Health,2004,94(3):361-6.
[6]Whiting P,Rutjes AW,Reitsma JB,et al. The development of QUADAS:a tool for the quality assessment of studies of diagnostic accuracy included in systematic reviews[J]. BMC Med Res Methodol,2003,3:25.
[7]Whiting P,Rutjes AW,Dinnes J,et al. Development and validation of methods for assessing the quality of diagnostic accuracy studies[J].Health Technol Assess,2004,8(25):iii,1-234.
[8]Higgins JPT,Green S. Cochrane Handbook for Systematic Reviews of Interventions Version 5.1.0 [updated March 2011]. The Cochrane Collaboration,2011[J]. http://www.cochrane-handbook.org.
[9]Deeks JJ,Bossuyt PM,Gatsonis C. Cochrane Handbook for Systematic Reviews of Diagnostic Test Accuracy Version 1.0.0. The Cochrane Collaboration,2009[J]. http://srdta.cochrane.org.
[10]CASP(Critical Skills Appraisal Programme)[EB/OL]. [2012-10-01].http://www.casp-uk.net/wp-content/uploads/2011/11/CASP_Diagno stic_Appraisal_Checklist_14oct10.pdf.
[11]Bossuyt PM,Reitsma JB,Bruns DE,et al. The STARD statement for reporting studies of diagnostic accuracy: explanation and elaboration[J]. Ann Intern Med,2003,138(1):W1-12.
[12]Stroke therapy academic industry roundtable(Fisher M,Chair).Recommendations for standards regarding preclinical neuroprotective and restorative drug development [J]. Stroke,1999,30(12):2752-8.
[13]Fisher M,Feuerstein G,Howells DW,et al. Update of the stroke therapy academic industry roundtable preclinical recommendations[J]. Stroke,2009, 40(6):2244-50.
[14]Macleod MR,O'Collins T,Howells DW,et al. Pooling of animal experimental data reveals influence of study design and publication bias [J]. Stroke,2004,35(5):1203-8.
[15]Crossley NA,Sena E,Goehler J,et al. Empirical evidence of bias in the design of experimental stroke studies: a metaepidemiologic approach[J]. Stroke,2008,39(3):929-34.
[16]Kilkenny C,Browne WJ,Cuthill IC,et al. Improving bioscience research reporting:the ARRIVE guidelines for reporting animal research [J]. PLoS Biol,2010,8(6):e1000412.
[17]Schulz KF,Altman DG,Moher D,et al. CONSORT 2010 statement:updated guidelines for reporting parallel group randomised trials [J].Int J Surg,2011,9(8):672-7.
[18]Britton A,McKee M,Black N,et al. Choosing between randomised and non-randomised studies:a systematic review [J]. Health Technol Assess,1998,2(13):i-iv,1-124.
[19]Battaglia M,Bucher H,Egger M,et al. The Bayes Library of Diagnostic Studies and Reviews [M]. 2ndedition,2002.