孫榮國(guó),賈曉蓉
(1.四川大學(xué)華西臨床醫(yī)學(xué)院/華西醫(yī)院,四川 成都 610041;2.成都市食品藥品檢驗(yàn)研究院,四川 成都 610045)
醫(yī)學(xué)循證的思想自古有之??v觀整個(gè)人類醫(yī)學(xué)發(fā)展史,就是一部不斷發(fā)現(xiàn)問(wèn)題、分析問(wèn)題和解決問(wèn)題,并不斷積累與運(yùn)用科學(xué)證據(jù)進(jìn)行醫(yī)學(xué)實(shí)踐的歷史。原始醫(yī)學(xué)研究或文獻(xiàn)綜合研究各具有特點(diǎn),也均存在著偏倚,直接影響到各自醫(yī)學(xué)研究的證據(jù)力。本文擬從認(rèn)識(shí)論、方法論和實(shí)踐論的角度,較深入地討論醫(yī)學(xué)研究證據(jù)認(rèn)識(shí)的誤區(qū),并提出相應(yīng)的觀點(diǎn)與建議,以便更好地認(rèn)識(shí)與正確地選用醫(yī)學(xué)研究證據(jù)。
醫(yī)學(xué)研究證據(jù)是能夠充分、客觀、正確地反映研究對(duì)象的特征、本質(zhì)、內(nèi)在與外在關(guān)系及其影響因素的事實(shí)根據(jù),包括數(shù)據(jù)、文字、圖像和音像等。
任何決策或抉擇均離不開(kāi)證據(jù)或依據(jù),醫(yī)學(xué)決策或抉擇也不例外,而醫(yī)學(xué)決策或抉擇往往不僅需要單一研究的證據(jù),也需要長(zhǎng)期積累起來(lái)的研究與實(shí)踐“大數(shù)據(jù)”的支撐,故高質(zhì)量的重復(fù)研究與實(shí)踐是必要的,也是證據(jù)累計(jì)與驗(yàn)證的過(guò)程。一項(xiàng)高質(zhì)量研究的結(jié)果及其結(jié)論應(yīng)在不同時(shí)空得到檢驗(yàn),以便確定其結(jié)果及其結(jié)論的可靠性、準(zhǔn)確性和適用性。任何研究證據(jù)均不能代替臨床診療抉擇或臨床管理決策,而是作為相應(yīng)抉擇和決策的依據(jù)。
從醫(yī)學(xué)研究上,可分為原始研究與文獻(xiàn)綜合研究?jī)纱箢?。原始研究,是直接面向研究?duì)象(如受試者)的第一手研究數(shù)據(jù)并形成的原始研究報(bào)告等,成為原始研究文獻(xiàn)(原始文獻(xiàn))。原始研究可以分為前瞻性研究和回顧性研究,也可以歸納為干預(yù)性研究和非干預(yù)性研究,具體類型包括隨機(jī)對(duì)照研究、社區(qū)干預(yù)研究、病例對(duì)照研究、隊(duì)列研究、橫斷面研究和專家征詢意見(jiàn)等。與原始研究不同,文獻(xiàn)綜合研究是運(yùn)用一定的研究方法,對(duì)原始研究文獻(xiàn)進(jìn)行綜合,并形成相應(yīng)的文獻(xiàn)綜合研究報(bào)告,包括定量文獻(xiàn)綜合研究與定性文獻(xiàn)綜合研究?jī)纱箢悾渲饕康脑谟谕ㄟ^(guò)綜合諸多獨(dú)立原始研究文獻(xiàn),增加樣本量及其檢驗(yàn)效能等,力圖獲得一個(gè)可靠、準(zhǔn)確的綜合性結(jié)論,以便與原始研究文獻(xiàn)一道為深入研究或/和臨床實(shí)踐提供證據(jù)。
無(wú)論是原始研究證據(jù)或是文獻(xiàn)綜合研究證據(jù)均是醫(yī)學(xué)證據(jù)學(xué)的重要組成部分,且原始研究證據(jù)是后續(xù)文獻(xiàn)綜合研究證據(jù)的“源頭活水”,其可靠性與準(zhǔn)確性直接影響文獻(xiàn)綜合研究的質(zhì)量。因此,在納入設(shè)計(jì)良好、實(shí)施到位和分析方法應(yīng)用妥當(dāng)?shù)脑佳芯课墨I(xiàn)并進(jìn)行科學(xué)的研究的基礎(chǔ)上,才能在很大程度上保證文獻(xiàn)綜合研究結(jié)論的可靠性與準(zhǔn)確性。
隨機(jī)分配則旨在平衡不同比較組間的研究對(duì)象例數(shù),盡量避免選擇和混雜偏倚[1],從而使各組間具有可比性。隨機(jī)分配的組間均衡性包括組間總例數(shù)的均衡性和組間相關(guān)研究影響因素分布的均衡性。在醫(yī)學(xué)研究中,隨機(jī)化是控制或避免混雜偏倚和選擇偏倚的重要方法,是獲得高質(zhì)量研究結(jié)果的重要保障[1,2]。隨機(jī)化分配的有效性不但取決于隨機(jī)分配的均衡性、分配方案的隱匿性,以及組間例數(shù)和研究影響因素的分布差異等,而受試者和研究者對(duì)處理的正確預(yù)測(cè)會(huì)造成選擇偏倚和信息偏倚[3]。另外,研究存在的失訪、沾染與干擾等因素也可能影響兩組的均衡性。
與醫(yī)學(xué)動(dòng)物實(shí)驗(yàn)相比較,臨床研究受試者的個(gè)體差異較大,能夠影響受試者及其研究效應(yīng)的因素較多。研究影響因素越多,則需要的樣本量越大。當(dāng)樣本量較小時(shí),難以通過(guò)簡(jiǎn)單化隨機(jī)分配來(lái)平衡組間的研究影響因素。Blair等[4]指出,在研究例數(shù)較少且對(duì)研究結(jié)果有影響的因素較為復(fù)雜時(shí),完全隨機(jī)幾乎不能獲得均衡的試驗(yàn)組。甚至有作者指出[5],當(dāng)樣本量大于1000時(shí),簡(jiǎn)單隨機(jī)化才能達(dá)到較好的平衡。關(guān)于分層隨機(jī)分組,當(dāng)因子水平組合數(shù)量接近樣本量的一半時(shí),將失去平衡組間研究影響因素的效用[6]。與簡(jiǎn)單隨機(jī)化和分組隨機(jī)化相比,雖然動(dòng)態(tài)隨機(jī)化,如最小化法具有一定的平衡優(yōu)勢(shì),但是也存在不足,如非真正隨機(jī)化過(guò)程及其選擇偏差、組織復(fù)雜性增加可能帶來(lái)招募影響與成本升高,以及與統(tǒng)計(jì)推斷檢驗(yàn)是基于隨機(jī)分配受試者進(jìn)入試驗(yàn)組和對(duì)照組的假設(shè)不符合[6,7]。Rovers等[8]指出,在最小化法中,每個(gè)子類別的預(yù)期患者人數(shù)應(yīng)始終大于5人,以防止出現(xiàn)空單元格。嚴(yán)格來(lái)說(shuō),動(dòng)態(tài)隨機(jī)化已違背了隨機(jī)化的原理,并不是真正的隨機(jī)化過(guò)程,其統(tǒng)計(jì)分析方法比建立在以隨機(jī)事件分布為基礎(chǔ)的傳統(tǒng)統(tǒng)計(jì)檢驗(yàn)要復(fù)雜得多,這也成為限制動(dòng)態(tài)隨機(jī)分組方法廣泛應(yīng)用的一個(gè)重要因素[9]。
任何隨機(jī)化方法有賴于正確實(shí)施,如果不正確地執(zhí)行,隨機(jī)化可能會(huì)導(dǎo)致分組產(chǎn)生偏差,導(dǎo)致實(shí)驗(yàn)無(wú)效和低效[10]。臨床研究的限制性隨機(jī)化設(shè)計(jì)與其他實(shí)驗(yàn)領(lǐng)域不同,由于患者(受試者)是順序到達(dá)與納入,故不能保證平衡設(shè)計(jì)[11];當(dāng)多個(gè)因素基線不可比時(shí),有理由對(duì)隨機(jī)化的過(guò)程提出質(zhì)疑,尤其是當(dāng)作者沒(méi)有明確報(bào)告是否采用了真正隨機(jī)的方法和/或分配隱藏的方法的時(shí)候,組間基線可比性是衡量隨機(jī)化是否真正實(shí)現(xiàn)的一個(gè)替代指標(biāo)[12]。因此,當(dāng)存在諸多研究影響因素時(shí),進(jìn)行組間均衡性評(píng)價(jià)具有一定必要性,即不能輕易認(rèn)為,只要采用了隨機(jī)分配方法,就一定能夠使組間的研究影響因素具有較好的均衡性,從而完全地放棄多因素分析方法。
應(yīng)該明確指出的是,隨機(jī)對(duì)照研究雖然可以平衡組間研究影響因素,但是卻失去了對(duì)診療效果具有作用的諸多影響因素的研究機(jī)會(huì)。
統(tǒng)計(jì)分析方法無(wú)“高低”和“貴賤”之分,均存在一定的不足和局限性。對(duì)于方法學(xué)的應(yīng)用只有妥當(dāng)不妥當(dāng)、適宜不適宜,其標(biāo)準(zhǔn)是能否最大限度地分析并真實(shí)地反映研究對(duì)象及其數(shù)據(jù)背后的規(guī)律、特征和內(nèi)在的聯(lián)系等。任何統(tǒng)計(jì)分析方法均是建立在一定適用、假設(shè)、前提的條件和適宜場(chǎng)域的基礎(chǔ)之上,舍此,任何方法的分析結(jié)果及其結(jié)論都將可能發(fā)生偏差或錯(cuò)誤。無(wú)論是原始臨床研究或是文獻(xiàn)綜合研究均存在諸多“統(tǒng)計(jì)結(jié)論效度”影響因素,尤其是后者的影響因素可能會(huì)更多。有作者[13]認(rèn)為,薈萃分析(Meta分析)的設(shè)計(jì)和實(shí)施都可能增加發(fā)表偏倚的概率,將嚴(yán)重扭曲估計(jì)值和可能向陽(yáng)性結(jié)果的方向偏倚,現(xiàn)有各種試圖評(píng)估和糾正偏倚的方法均存在局限性,并提醒人們注意:薈萃分析總是給人一種準(zhǔn)確的假象,而這種準(zhǔn)確性可能并不總能得到保證。
設(shè)計(jì)良好、實(shí)施到位和分析妥當(dāng)?shù)脑佳芯拷Y(jié)果及其結(jié)論可以獨(dú)立作為醫(yī)學(xué)證據(jù)而存在,而文獻(xiàn)綜合研究證據(jù)是建立在可靠和準(zhǔn)確的原始研究結(jié)果及其結(jié)論的基礎(chǔ)之上的,其本身方法學(xué)也存在諸多不足或缺陷。當(dāng)原始研究或文獻(xiàn)綜合研究存在方案設(shè)計(jì)缺陷和研究實(shí)施質(zhì)量控制較差及其系統(tǒng)誤差的問(wèn)題時(shí),不應(yīng)奢望依靠任何統(tǒng)計(jì)學(xué)分析加以彌補(bǔ)或矯正。特別當(dāng)原始文獻(xiàn)分析結(jié)果及其結(jié)論出現(xiàn)較大偏差或謬誤時(shí),將更遑論文獻(xiàn)綜合研究結(jié)果及其結(jié)論的可靠性和準(zhǔn)確性了。
研究質(zhì)量控制應(yīng)貫穿于研究方案設(shè)計(jì)及其實(shí)施的全過(guò)程,不是依靠統(tǒng)計(jì)分析方法就可以解決的問(wèn)題。其中,研究者的因素尤為重要,表現(xiàn)為研究方案的科學(xué)性、專業(yè)性(臨床與統(tǒng)計(jì))和倫理性設(shè)計(jì),以及嚴(yán)格按照確定的研究方案進(jìn)行全面、有效的實(shí)施,且后者是非常難以采用統(tǒng)計(jì)學(xué)評(píng)估的關(guān)鍵質(zhì)量影響因素之一。任何統(tǒng)計(jì)學(xué)分析方法無(wú)法控制或難以消除試驗(yàn)設(shè)計(jì)的不科學(xué)、不專業(yè)、不倫理,或?qū)嵤┎坏轿凰鶐?lái)的諸多影響或偏差。
文獻(xiàn)綜合研究不應(yīng)簡(jiǎn)單地強(qiáng)調(diào)合并原始研究效應(yīng)值、增加樣本量,而忽略了每一項(xiàng)納入文獻(xiàn)綜合研究的原始文獻(xiàn)的獨(dú)立納排標(biāo)準(zhǔn)差異性、樣本量及其檢驗(yàn)效能等諸多影響因素。文獻(xiàn)綜合研究若脫離了原始、真實(shí)的研究數(shù)據(jù)及其分析結(jié)果的可靠性與準(zhǔn)確性,任何文獻(xiàn)綜合分析方法都將無(wú)法獲得真實(shí)、可靠的分析結(jié)果及其結(jié)論,也就難以具備文獻(xiàn)綜合應(yīng)具有的臨床參考價(jià)值與指導(dǎo)意義。眾所周知,原始文獻(xiàn)的完整評(píng)價(jià)是一件十分困難的事情,需要更加充分、詳實(shí)的原始研究記錄及其報(bào)告,僅僅依靠原始文獻(xiàn)研究中有“隨機(jī)分配”等字樣和文獻(xiàn)綜合研究采用“隨機(jī)效應(yīng)模型”或“薈萃分析”等方法,尚不足以認(rèn)定其證據(jù)力就一定就高。
任何醫(yī)學(xué)研究,包括原始研究和文獻(xiàn)綜合研究均存在兩類(初步)分析結(jié)論,一是統(tǒng)計(jì)學(xué)結(jié)論,即按照檢驗(yàn)統(tǒng)計(jì)量及其檢驗(yàn)水準(zhǔn)得出的概率性結(jié)論。例如,P值小于檢驗(yàn)水準(zhǔn),則統(tǒng)計(jì)學(xué)結(jié)論為差異具有統(tǒng)計(jì)學(xué)意義;二是臨床專業(yè)性結(jié)論,即按照臨床專業(yè)的理論與實(shí)踐,判斷實(shí)際(差)值是否具有專業(yè)性意義或?qū)I(yè)性價(jià)值。因此,在醫(yī)學(xué)研究中,有的“陽(yáng)性結(jié)果”可能僅僅是具有統(tǒng)計(jì)學(xué)意義但并沒(méi)有相應(yīng)的臨床意義的結(jié)果。研究的臨床意義與價(jià)值是每一項(xiàng)臨床醫(yī)學(xué)研究的出發(fā)點(diǎn)與歸宿,故應(yīng)該重視臨床專業(yè)分析結(jié)論的意義與價(jià)值。
近些年,雖然人們大力提倡并遂行報(bào)告可信區(qū)間,使讀者了解到更多的信息,如總體參數(shù)的95%或99%可信區(qū)間(估計(jì)范圍與精度)等,并借助于已知的、具有臨床意義(差)值,協(xié)助判斷具有統(tǒng)計(jì)學(xué)意義的分析結(jié)果是否也同時(shí)具有臨床價(jià)值,而具有臨床意義(差)值歸根結(jié)底是由臨床專家慎重決定。總之,不能滿足于任何統(tǒng)計(jì)學(xué)分析結(jié)論,包括文獻(xiàn)綜合研究中常常采用的固定效應(yīng)模型或隨機(jī)效應(yīng)模型的分析結(jié)論,簡(jiǎn)單地用統(tǒng)計(jì)學(xué)結(jié)論代替臨床專業(yè)下結(jié)論。
統(tǒng)計(jì)學(xué)效應(yīng)值具有統(tǒng)計(jì)學(xué)意義的判斷容易受到樣本含量大小的影響:在大樣本的條件下,小差值的統(tǒng)計(jì)學(xué)效應(yīng)值也可能具有統(tǒng)計(jì)學(xué)意義。反之,在小樣本的情況下,較大的差值的統(tǒng)計(jì)學(xué)效應(yīng)值也可能不具有統(tǒng)計(jì)學(xué)意義。對(duì)于研究的樣本量來(lái)講,不管是大樣本或是小樣本,關(guān)鍵是具有符合統(tǒng)計(jì)學(xué)要求的樣本,以確保較高的檢驗(yàn)效能。另外,研究影響因素的有效控制也可能是處理因素效應(yīng)值大小及其統(tǒng)計(jì)學(xué)分析結(jié)論的重要影響因素。
在文獻(xiàn)綜合研究中,原始研究間可能存在三類既獨(dú)立又關(guān)聯(lián)的異質(zhì)性,包括臨床異質(zhì)性,如實(shí)驗(yàn)對(duì)象(納排除標(biāo)準(zhǔn)、對(duì)照組設(shè)置)、處理因素(干預(yù)措施)以及實(shí)驗(yàn)效應(yīng)(暴露與結(jié)局的定義、測(cè)量指標(biāo)及工具等);方法學(xué)異質(zhì)性,如研究設(shè)計(jì)、隨機(jī)、盲法、分配隱藏和隨訪時(shí)長(zhǎng)等;統(tǒng)計(jì)學(xué)異質(zhì)性,包括原始研究效應(yīng)值等,如OR效應(yīng)值。原始研究間效應(yīng)值的異質(zhì)性可能會(huì)受到諸多因素的影響,如不同研究團(tuán)隊(duì)素質(zhì)與能力、納排標(biāo)準(zhǔn)、對(duì)照組、檢測(cè)指標(biāo)與方法、處理因素標(biāo)準(zhǔn)化、質(zhì)量管控和混雜因素控制、實(shí)施力度等,故僅靠發(fā)表或交流文獻(xiàn)中所報(bào)告內(nèi)容,難以全面進(jìn)行原始研究效應(yīng)值真實(shí)性與可靠性的評(píng)估。另外,借助于隨機(jī)效應(yīng)模型對(duì)若干原始研究進(jìn)行文獻(xiàn)綜合研究,不完全相同于隨機(jī)效應(yīng)模型在多中心研究(同一研究方案,受試者來(lái)自同一總體)中的應(yīng)用,而是可能存在較大的臨床異質(zhì)性。文獻(xiàn)綜合雖然可以增加研究樣本量,但是并不一定能夠獲得可靠、準(zhǔn)確的研究結(jié)果,因?yàn)楸痪C合的每一項(xiàng)原始研究除隨機(jī)誤差外,尚可能存在系統(tǒng)誤差、過(guò)失誤差等,而這些誤差的判斷必須有賴于相應(yīng)的研究證據(jù)(記錄),才能進(jìn)行有效的評(píng)估。關(guān)于異質(zhì)性的臨床意義與價(jià)值的判斷,需要臨床專業(yè)的共識(shí)與指南,需要訓(xùn)練有素的研究團(tuán)隊(duì),包括相應(yīng)研究的臨床專業(yè)、統(tǒng)計(jì)學(xué)專業(yè)人員等參與資料的原始文獻(xiàn)質(zhì)量細(xì)致評(píng)估,其可能會(huì)較大地影響原始研究效應(yīng)值的大小等。對(duì)統(tǒng)計(jì)學(xué)方法的選擇,應(yīng)考慮研究目的、設(shè)計(jì)類型、樣本含量、變量類型、變量數(shù)量和數(shù)據(jù)質(zhì)量(如準(zhǔn)確性等),以及對(duì)諸多影響研究因素的控制等。因此,對(duì)統(tǒng)計(jì)學(xué)分析本身的質(zhì)量控制和質(zhì)量保證也是獲取可靠性與準(zhǔn)確性研究結(jié)果及其結(jié)論的重要環(huán)節(jié)之一。
無(wú)論采用何種文獻(xiàn)研究方法,如薈萃分析等都屬于觀察性研究。例如,包括薈萃分析在內(nèi)的文獻(xiàn)綜合研究結(jié)果均受到若干偏倚的影響,包括發(fā)表偏倚、納入標(biāo)準(zhǔn)偏倚、篩選者偏倚、研究質(zhì)量評(píng)分偏倚和報(bào)告偏倚等,尤其是發(fā)表(刊出)偏倚[14-16]。同時(shí),在檢索到的文獻(xiàn)中,由于有不少文獻(xiàn)存在變量定義不一致或統(tǒng)計(jì)分析失誤,造成部分研究結(jié)果無(wú)法利用而不得不舍棄,可能會(huì)對(duì)研究結(jié)果產(chǎn)生一定的影響[17]。發(fā)表對(duì)有負(fù)面或非結(jié)論性結(jié)果的研究存在偏見(jiàn),其中臨床試驗(yàn)結(jié)果顯示出顯著性差異被接受的可能性是非顯著性差異結(jié)果的三倍,而且很有可能比那些沒(méi)有顯著發(fā)現(xiàn)的論文發(fā)表得更快[18]。文獻(xiàn)綜合研究若無(wú)明確的原始文獻(xiàn)納排標(biāo)準(zhǔn),很容易導(dǎo)致納入標(biāo)準(zhǔn)偏倚;若有明確的原始文獻(xiàn)納排標(biāo)準(zhǔn),在篩選文獻(xiàn)時(shí)往往會(huì)受到篩選者主觀意愿的影響,特別是當(dāng)文獻(xiàn)納人標(biāo)準(zhǔn)的可操作性和特異性不強(qiáng)時(shí),很容易產(chǎn)生篩選者偏倚[17]。另外,如所選文獻(xiàn)的研究對(duì)象不同,將不同的年齡、性別、疾病的嚴(yán)重程度,或不同的治療劑量和療程的原始研究直接合并,就會(huì)造成誤解[14]。有作者認(rèn)為[19,20],從根本上說(shuō),薈萃分析的結(jié)論取決于單個(gè)獨(dú)立研究的質(zhì)量和數(shù)量;從論證強(qiáng)度來(lái)說(shuō),文獻(xiàn)綜合研究的論證強(qiáng)度不如多中心大樣本的隨機(jī)對(duì)照試驗(yàn),因?yàn)檎业剿械难芯渴掷щy,異質(zhì)性和發(fā)表偏倚等均無(wú)法避免。因此,文獻(xiàn)綜合研究需要設(shè)計(jì)良好、實(shí)施充分、到位的獨(dú)立或多中心、大樣本研究加以印證。應(yīng)該慎重看待文獻(xiàn)綜合研究結(jié)果及其結(jié)論,不可盲目或輕易地將其視為所謂“最高等級(jí)的證據(jù)”。
盡管文獻(xiàn)綜合研究已具有相應(yīng)規(guī)范,如應(yīng)用CONSORT可提高RCT報(bào)告質(zhì)量[21]。但是,CONSORT也存在與時(shí)俱進(jìn)、不斷完善的空間,如其如何更好地對(duì)原始研究質(zhì)量及其異質(zhì)性進(jìn)行全面、準(zhǔn)確的評(píng)估等,特別是原始研究的方案實(shí)施過(guò)程是難以事后準(zhǔn)確評(píng)估及控制。加之,研究者對(duì)于文獻(xiàn)綜合研究規(guī)范的掌握與應(yīng)用程度參差不齊,導(dǎo)致文獻(xiàn)綜合研究質(zhì)量良莠不齊,尚有較大的完善空間[22-25]。文獻(xiàn)綜合分析永遠(yuǎn)無(wú)法替代原始研究,僅能作為同類原始研究的一個(gè)補(bǔ)充,應(yīng)該更加客觀地評(píng)價(jià)文獻(xiàn)研究應(yīng)有的地位與作用。
證據(jù)的局限性或相對(duì)性源于研究對(duì)象的復(fù)雜性與變異性、研究設(shè)計(jì)及研究方法與手段的有限性或局限性,以及人們認(rèn)識(shí)人、事、物的過(guò)程性與不斷深化性等,需要時(shí)間與實(shí)踐的檢驗(yàn)。
無(wú)論是原始研究,或是文獻(xiàn)綜合研究,均屬于醫(yī)學(xué)研究及其醫(yī)學(xué)證據(jù)的組成部分,都應(yīng)該遵循相應(yīng)的研究設(shè)計(jì)原則與基本要求并落實(shí)到位,盡量避免或控制諸多誤差,以便獲得可靠與準(zhǔn)確的數(shù)據(jù)及分析結(jié)論。不恰當(dāng)、不充分、不可靠與不準(zhǔn)確的“研究之研究”并不能提升研究結(jié)論的可靠性與準(zhǔn)確性,甚至還會(huì)產(chǎn)生不正確的結(jié)論和誤導(dǎo)讀者。原始研究數(shù)據(jù)的真實(shí)性與可比性是文獻(xiàn)綜合研究可靠性與準(zhǔn)確性的基本保證。
研究設(shè)計(jì)類型與方法的多樣性,反映了醫(yī)學(xué)研究對(duì)象的紛繁復(fù)雜性,不同的研究目的,客觀上要求采取不同研究設(shè)計(jì)方法,從研究對(duì)象的不同側(cè)面和不同研究階段進(jìn)行深入分析與廣泛研究。任何研究設(shè)計(jì)方法都有一定的局限,均具有一定適用的條件或場(chǎng)域;任何研究設(shè)計(jì)方法均不可能獨(dú)力支撐醫(yī)學(xué)證據(jù)的大廈,泛泛而談或任意夸大任何研究設(shè)計(jì)的效用及其證據(jù)力,只會(huì)毀掉這種研究設(shè)計(jì)。因此,我們認(rèn)為,無(wú)論是動(dòng)物實(shí)驗(yàn)、人體研究,或是動(dòng)物實(shí)驗(yàn)或/和人體研究的文獻(xiàn)綜合研究,只要能充分、真實(shí)反映研究對(duì)象的特征、本質(zhì)、規(guī)律、內(nèi)外在聯(lián)系及其影響因素等,就具備了良好的證據(jù)力,不應(yīng)簡(jiǎn)單按照研究設(shè)計(jì)類型與方法,判斷其證據(jù)力的高低。證據(jù)等級(jí)的高低是相對(duì)的,在有限研究和諸多關(guān)鍵影響因素難以分析或控制等情況下,特別是文獻(xiàn)綜合研究結(jié)果及其結(jié)論影響因素,可能與所綜合的原始文獻(xiàn)的偏倚相互疊加,從而帶來(lái)較大的不確定和/或偏差。隨著醫(yī)學(xué)研究深入和研究數(shù)據(jù)資料的累計(jì),所謂“陽(yáng)性”或“陰性”的研究資料可能會(huì)發(fā)生此消彼長(zhǎng)的情況,人們對(duì)研究對(duì)象的認(rèn)識(shí)也不斷深化,現(xiàn)有的醫(yī)學(xué)證據(jù)的認(rèn)知有可能被修正、充實(shí)或顛覆。關(guān)鍵是,不但要重視證據(jù)的可靠性,更要重視證據(jù)的準(zhǔn)確性,因?yàn)椴徽_或不恰當(dāng)?shù)难芯吭O(shè)計(jì)及其實(shí)施,可以導(dǎo)致錯(cuò)誤的結(jié)果及其結(jié)論一而再再而三的重復(fù)出現(xiàn),這種所謂的“可靠性”是我們應(yīng)該努力避免的。脫離了準(zhǔn)確性的可靠性,只會(huì)為臨床醫(yī)療抉擇或決策提供錯(cuò)誤的依據(jù),而脫離了可靠性的準(zhǔn)確性,會(huì)使人們難以判斷研究結(jié)果可信性。只有可靠性與準(zhǔn)確性并舉,方能為臨床醫(yī)療抉擇或決策提供真實(shí)、可信、有效的證據(jù),為患者帶來(lái)更加精準(zhǔn)的診療方案,最大限度地減少不良反應(yīng),增加有效性,并獲得更好的臨床轉(zhuǎn)歸。
研究質(zhì)量控制應(yīng)貫穿于研究方案設(shè)計(jì)及其實(shí)施的全過(guò)程。其中,研究者的因素尤為重要,表現(xiàn)為研究方案的科學(xué)性、專業(yè)性(臨床與統(tǒng)計(jì))倫理的設(shè)計(jì)和嚴(yán)格按照確定的研究方案進(jìn)行全面、有效的實(shí)施,后者是非常難于評(píng)估的關(guān)鍵質(zhì)量影響因素之一。
根據(jù)不同目的的研究,選擇適宜的研究設(shè)計(jì),關(guān)鍵是具體的研究設(shè)計(jì)能否達(dá)到研究目的,并且為相應(yīng)的臨床診療抉擇或決策提供可靠與準(zhǔn)確的參考證據(jù),而不是簡(jiǎn)單地依據(jù)研究設(shè)計(jì)類型,或“隨機(jī)”“盲法”和“薈萃分析”等,統(tǒng)一進(jìn)行研究證據(jù)等級(jí)劃分,更何況原始研究與文獻(xiàn)綜合研究是兩類不同性質(zhì)的研究,后者研究完全是建立在前者研究的基礎(chǔ)之上的。不同研究設(shè)計(jì)的內(nèi)、外部效度各異,僅僅追求內(nèi)部效度,不足以為臨床推廣應(yīng)用提供全面和完整的證據(jù),也會(huì)降低其作為臨床實(shí)踐指導(dǎo)的相對(duì)性證據(jù)力。有人認(rèn)為,隨機(jī)臨床試驗(yàn)的療效研究結(jié)論并不能真正反映臨床療效。另外,僅從外部效度考慮,非隨機(jī)對(duì)照研究結(jié)果及其結(jié)論對(duì)于臨床實(shí)踐可能具有更大的指導(dǎo)意義,因?yàn)槠淇梢蕴峁┰\療影響因素及其程度的信息,以便臨床實(shí)踐者實(shí)施個(gè)體化、精準(zhǔn)化的臨床診療技術(shù)與服務(wù)。我們提倡圍繞臨床實(shí)踐,選擇不同的研究設(shè)計(jì),取長(zhǎng)補(bǔ)短,從不同角度,全面、完整地提供臨床實(shí)踐所需的有力證據(jù),而不是簡(jiǎn)單以證據(jù)“金子塔”的形式,較為片面、截然分出證據(jù)高下,而完全忽略臨床實(shí)踐問(wèn)題的復(fù)雜性、證據(jù)的多樣性及其證據(jù)力的差異性??梢?jiàn),不存在所謂最佳的證據(jù),只有更好的證據(jù)和更恰當(dāng)?shù)淖C據(jù)(滿足研究目的),即使有所謂“最佳的證據(jù)”也只是暫時(shí)的,因?yàn)殡S著臨床研究的全面與深入,人們對(duì)研究對(duì)象的認(rèn)識(shí)會(huì)不斷加深,更加接近研究事物的本質(zhì),這是一個(gè)不斷遞進(jìn)、螺旋上升的長(zhǎng)期過(guò)程。任何一項(xiàng)原始研究均不是臨床實(shí)踐的唯一證據(jù),不同研究證據(jù)應(yīng)該是相互補(bǔ)充與印證,共同為臨床實(shí)踐服務(wù)。
將不同研究目的、不同設(shè)計(jì)類型、不同分析方法,甚至不同類別文獻(xiàn)簡(jiǎn)單、統(tǒng)一地進(jìn)行所謂醫(yī)學(xué)證據(jù)等級(jí)劃分,如所謂證據(jù)“金字塔”的做法值得進(jìn)一步深入的反思。醫(yī)學(xué)研究包括了臨床前研究(如動(dòng)物實(shí)驗(yàn))與臨床研究(人體研究),而前者是后者的基礎(chǔ)。所謂從醫(yī)學(xué)動(dòng)物實(shí)驗(yàn)到人體觀察研究、干預(yù)性研究的“醫(yī)學(xué)證據(jù)金字塔”[26],反映的是醫(yī)學(xué)研究的基本路徑或不同研究階段,不同研究目的、研究設(shè)計(jì)等不同,均可以為相應(yīng)的研究階段及其研究目的提供真實(shí)、可靠的研究數(shù)據(jù)及其研究證據(jù),并無(wú)所謂“高低”之分。因此,與其采用混合、固化式的“金字塔”醫(yī)學(xué)證據(jù)等級(jí)概念,對(duì)不同類原始研究及其文獻(xiàn)綜合研究統(tǒng)一劃分等級(jí),不如按照研究目的、研究設(shè)計(jì)等,引入醫(yī)學(xué)研究證據(jù)力的概念,分別進(jìn)行研究證據(jù)力的評(píng)判,不必再糾纏于“金字塔”醫(yī)學(xué)證據(jù)等級(jí)劃分,應(yīng)更好地認(rèn)識(shí)觀察性研究和專家意見(jiàn)的證據(jù)力。例如,為了掌握我國(guó)人口相關(guān)數(shù)據(jù),每隔若干年的全國(guó)人口普查的數(shù)據(jù),其證據(jù)力強(qiáng)是源于其數(shù)據(jù)的真實(shí)性,可以為制定我國(guó)人口、教育和就業(yè)等政策提供強(qiáng)有力的依據(jù)和前提;為了掌握某疾病的“三間”(人間、時(shí)間和空間)分布,設(shè)計(jì)科學(xué)(專業(yè)、統(tǒng)計(jì))和倫理并且實(shí)施到位的隨機(jī)抽樣調(diào)查研究,其證據(jù)力強(qiáng)也是源于其數(shù)據(jù)的真實(shí)性,而就其研究的目的而言,其證據(jù)力也是很高的;始于1948年的美國(guó)弗雷明漢心臟研究(FHS)隊(duì)列,先后有三代參與者加入隊(duì)列研究,從人口學(xué)、體檢、血液、心電圖、影像學(xué)的研究,到超聲心動(dòng)圖、頸動(dòng)脈斑塊測(cè)量、運(yùn)動(dòng)試驗(yàn)等的研究證據(jù)力深受肯定,對(duì)包括心血管疾病領(lǐng)域在內(nèi)的許多疾病領(lǐng)域都產(chǎn)生了深遠(yuǎn)而重要的影響;疾病自然史研究所需要的科學(xué)的前瞻性觀察研究方案及其有效實(shí)施的分析結(jié)論的證據(jù)力也是較高的;高素質(zhì)、高水平專家及其團(tuán)隊(duì)既有堅(jiān)實(shí)的多學(xué)科理論基礎(chǔ)、又具有十分豐富的臨床實(shí)踐經(jīng)驗(yàn),并充分掌握諸多學(xué)科研究數(shù)據(jù)、信息和證據(jù),其針對(duì)某一醫(yī)學(xué)臨床與管理問(wèn)題的意見(jiàn),對(duì)于臨床與管理的指導(dǎo)意義與實(shí)踐價(jià)值(證據(jù)力)未必就位居末位。
由于研究目的不同和研究條件限制,包括科學(xué)、專業(yè)和倫理的原因,不一定均能夠或有必要采用隨機(jī)或/和盲法對(duì)照設(shè)計(jì)進(jìn)行研究。因此,在某種意義上,“真實(shí)世界研究”是對(duì)多年來(lái)過(guò)度強(qiáng)調(diào)“隨機(jī)對(duì)照試驗(yàn)”證據(jù)的某種矯正。其特別強(qiáng)調(diào)從臨床診療實(shí)踐的角度,評(píng)價(jià)診療措施的效果,雖然面臨許多困難與不足,但是臨床診療的研究/實(shí)踐者仍然努力前行。這充分表明:臨床診療實(shí)踐者已經(jīng)不滿足于傳統(tǒng)隨機(jī)對(duì)照研究證據(jù),努力推動(dòng)更加貼近臨床診療實(shí)踐的研究。不同的研究可以從不同的角度為臨床診療實(shí)踐提供證據(jù),它們相互印證與補(bǔ)充,為臨床診療實(shí)踐提供更加全面且貼近臨床診療實(shí)踐的良好證據(jù)。
綜上所述,研究誤差的存在是絕對(duì)的,研究的證據(jù)力是相對(duì)的,而真實(shí)、可靠的數(shù)據(jù)是任何研究分析的基石。任何符合科學(xué)、專業(yè)、倫理的研究方案,均離不開(kāi)合格研究人員的有效、準(zhǔn)確的實(shí)施,而實(shí)施過(guò)程有效性與準(zhǔn)確性的評(píng)估遠(yuǎn)比研究方案本身的評(píng)估更難。一項(xiàng)高質(zhì)量的研究勝過(guò)“一打”低質(zhì)量研究,關(guān)鍵在于研究數(shù)據(jù)真實(shí)性、分析結(jié)果及結(jié)論的可靠性與準(zhǔn)確性,而不是片面強(qiáng)調(diào)樣本量或研究項(xiàng)目數(shù)量。在臨床醫(yī)療實(shí)踐中,無(wú)論研究證據(jù)力如何,也僅僅是臨床診治與護(hù)理抉擇或決策的依據(jù),而不是抉擇或決策本身,必須經(jīng)受時(shí)間與實(shí)踐的考驗(yàn),仍然需要臨床醫(yī)護(hù)人員根據(jù)診治與護(hù)理患者的具體情況,例如年齡、性別、病情、病程、并發(fā)癥和合并癥及其診治過(guò)程(包括合并用藥、明確或未明確診斷和治療反應(yīng)等)及其安全性與有效性等,不應(yīng)拘泥于原始研究或文獻(xiàn)綜合研究的證據(jù),應(yīng)該參考不同來(lái)源、不同研究,緊密結(jié)合臨床診療與護(hù)理實(shí)踐,制定出符合患者實(shí)際情況,即具有針對(duì)性、個(gè)性化、精準(zhǔn)性、療效好、毒副作用小、性價(jià)比高的診治與護(hù)理方案的抉擇或決策,并且隨著患者諸多情況的變化加以調(diào)整。因?yàn)槿魏窝芯孔C據(jù)均是特定時(shí)空、特定研究條件下的“產(chǎn)物”,任何脫離了疾病患者的復(fù)雜性、變異性、波動(dòng)性和不確定性,甚至不考慮相關(guān)診治與護(hù)理措施的“適應(yīng)癥”“適用條件”、毒副作用和配伍禁忌等限制,來(lái)單獨(dú)或片面地討論醫(yī)學(xué)研究的臨床療效證據(jù)力的做法都是不可取得。
在數(shù)千年醫(yī)學(xué)發(fā)展歷史中,人類一直秉持“循證”發(fā)展的科學(xué)理念,無(wú)論是中醫(yī)(藥)或是西醫(yī)(藥)的各臨床學(xué)科均重視醫(yī)學(xué)的實(shí)踐性和證據(jù)性。換言之,“遵從證據(jù)”的準(zhǔn)則早已深入各臨床醫(yī)學(xué)學(xué)科實(shí)踐與發(fā)展的骨髓之中。在兼收并蓄的基礎(chǔ)上,任何學(xué)科均應(yīng)該創(chuàng)立和發(fā)展本學(xué)科獨(dú)特理論與方法學(xué)體系,以發(fā)揮不可替代的效用。否則,該學(xué)科將難以持久存在與發(fā)展。例如,統(tǒng)計(jì)學(xué)具有從單因素到多因素、從線性關(guān)系到非線性關(guān)系分析的理論與方法;又如流行病學(xué)具有健康與疾病的“三間”分布的規(guī)律與特征分析的理論與方法;再如臨床流行病學(xué)具有“設(shè)計(jì)、衡量、評(píng)價(jià)”的理論與方法等。在數(shù)千年反復(fù)實(shí)踐與不斷驗(yàn)證的基礎(chǔ)上,我國(guó)中醫(yī)與中藥學(xué)逐漸形成獨(dú)特的醫(yī)學(xué)理論體系,如基于先進(jìn)的“宇宙觀”和“整體觀”的辯證施治和科學(xué)的“君臣佐使”的“個(gè)體化”藥物調(diào)配,均積累了大量豐富、真實(shí)、可靠的實(shí)踐經(jīng)驗(yàn),確保了數(shù)千年中華民族的生息健康與文明進(jìn)步。這從本次其在我國(guó)抗擊“新型冠狀病毒”中所發(fā)揮的預(yù)防、治療和康復(fù)一體作用,可窺見(jiàn)一斑。
我們應(yīng)該建立和健全獨(dú)立的“醫(yī)學(xué)證據(jù)學(xué)”學(xué)科的理論與方法,既凸顯該學(xué)科的特征與發(fā)展方向,又更加全面地反映該學(xué)科與其他醫(yī)學(xué)學(xué)科的內(nèi)在關(guān)聯(lián)性;應(yīng)該跨學(xué)科、跨專業(yè)聯(lián)合發(fā)力,始終立足于不同類型、原始研究的專業(yè)性、統(tǒng)計(jì)性與倫理性設(shè)計(jì)與實(shí)施,并輔以文獻(xiàn)綜合研究,切勿本末倒置。證據(jù)力的判斷應(yīng)以研究結(jié)果及其結(jié)論的可靠性與準(zhǔn)確性為依據(jù),而不是簡(jiǎn)單地依據(jù)研究方案是否采用了大樣本、隨機(jī)化、盲法和薈萃分析等研究設(shè)計(jì)與方法。我們不但要重視數(shù)據(jù)的收集與整理,也要重視數(shù)據(jù)的綜合分析及其方法的正確運(yùn)用;不但要重視研究方案的規(guī)范設(shè)計(jì),更要重視研究方案的正確、有效實(shí)施。與其花大力氣進(jìn)行研究質(zhì)量的事后評(píng)價(jià),不如進(jìn)一步強(qiáng)化每項(xiàng)研究的設(shè)計(jì),包括臨床專業(yè)設(shè)計(jì)、統(tǒng)計(jì)學(xué)設(shè)計(jì)和倫理設(shè)計(jì)等,切實(shí)防范于未然,同時(shí)進(jìn)一步提倡大型臨床醫(yī)學(xué)研究的設(shè)計(jì)和/或?qū)嵤?yīng)有統(tǒng)計(jì)學(xué)和倫理學(xué)人員的參與。
在臨床診療實(shí)踐中,患者情況各異且復(fù)雜,差異是客觀存在,而精準(zhǔn)化診療要求臨床診療實(shí)踐者必須依據(jù)患者具體情況,制定個(gè)體化的診療方案,以期獲得較好的效果。面對(duì)紛繁復(fù)雜的醫(yī)療實(shí)踐,一方面,臨床醫(yī)務(wù)人員應(yīng)進(jìn)一步牢固樹(shù)立“實(shí)踐出真知”的醫(yī)學(xué)研究證據(jù)觀,充分認(rèn)識(shí)各研究的目的性、局限性、階段性和差異性,保持客觀和理性態(tài)度,緊密結(jié)合臨床醫(yī)療實(shí)踐,審慎地評(píng)價(jià)、選擇和使用醫(yī)學(xué)臨床研究證據(jù);另一方面,原始或/和文獻(xiàn)綜合研究者應(yīng)該切實(shí)地按照臨床專業(yè)、統(tǒng)計(jì)和倫理等的原則和規(guī)范,一絲不茍地進(jìn)行科學(xué)的研究設(shè)計(jì),準(zhǔn)確收集、科學(xué)整理研究結(jié)果,恰當(dāng)、合理和有效進(jìn)行分析,并全面地報(bào)告研究方法、質(zhì)量控制和研究的局限與不足等,供讀者或/和應(yīng)用者參考與甄別。當(dāng)然,也有賴于期刊或/和會(huì)議交流的審稿專家或/和和編輯等的不懈努力,認(rèn)真把好審查及發(fā)表關(guān)。
最后,應(yīng)強(qiáng)調(diào)指出的是,整個(gè)醫(yī)學(xué)科學(xué)的發(fā)展不是、也不可能是依賴那一門學(xué)科的“單打獨(dú)斗”,更不可能依靠某種或某幾種分析方法就“打遍天下無(wú)敵手”,而是需要不同學(xué)科相互借鑒、相互融合、各自發(fā)揮優(yōu)勢(shì),共同推動(dòng)醫(yī)學(xué)事業(yè)的持續(xù)、健康和穩(wěn)步發(fā)展。任何夸大或貶低某門醫(yī)學(xué)學(xué)科或醫(yī)學(xué)研究方法在醫(yī)學(xué)發(fā)展中地位及作用,甚至將某門醫(yī)學(xué)學(xué)科或某種醫(yī)學(xué)研究方法凌駕于其他醫(yī)學(xué)學(xué)科或醫(yī)學(xué)研究方法之上的做法都是欠考慮的。只有大家共同努力,才能更好地為醫(yī)學(xué)事業(yè)的快速、健康的發(fā)展,提供高品質(zhì)的醫(yī)學(xué)證據(jù)。