許衛(wèi)華
(廣州中醫(yī)藥大學臨床藥理研究所DME中心,廣東廣州 510405)
基于隨機對照試驗的系統(tǒng)評價/Meta分析是評價干預措施有效性的重要證據(jù)來源。納入的隨機對照試驗在設(shè)計、實施和結(jié)果報告等方面存在的方法學缺陷可影響相應(yīng)的系統(tǒng)評價/Meta分析結(jié)果的準確性,故偏倚風險評估是系統(tǒng)評價/Meta分析制作過程不可缺少的一個步驟。正確運用偏倚風險評估工具并充分報告評估結(jié)果將有助于證據(jù)使用者準確評估及利用源于系統(tǒng)評價/Meta分析的證據(jù)。偏倚風險評估方法有多種[1],如Jadad量表和Cochrane協(xié)作網(wǎng)推薦的偏倚風險評估工具等。近年來發(fā)表于中文期刊的干預措施系統(tǒng)評價/Meta分析文獻數(shù)量明顯增多,但關(guān)于這類文獻中偏倚風險評估方法及其運用情況卻鮮有報告。為此,本研究采用橫斷面抽樣調(diào)查的方法,以發(fā)表于《中國循證醫(yī)學雜志》及其他中文核心期刊雜志的系統(tǒng)評價/Meta分析為調(diào)查樣本,了解其中關(guān)于偏倚風險評估的方法及運用的情況,并分析該方面目前存在的不足,以期為今后此類文獻的偏倚風險評估方法的正確使用提供參考。
1.1資料來源以(“系統(tǒng)評價”[中文標題:智能])or“Meta”[中文標題:智能])and “隨機” [常用字段:智能]為檢索式,檢索中國生物醫(yī)學期刊數(shù)據(jù)庫2017年1月至檢索時(2018年6月)收錄的文獻。以檢索結(jié)果中發(fā)表于《中國循證醫(yī)學雜志》的所有的干預措施系統(tǒng)評價/Meta分析文獻以及系統(tǒng)抽樣10%發(fā)表于其他中文核心期刊的干預措施系統(tǒng)評價/Meta分析文獻為本次調(diào)查樣本。排除非隨機對照試驗、非干預措施療效評價、實驗動物相關(guān)的系統(tǒng)評價/Meta分析文獻。
1.2調(diào)查內(nèi)容包括文獻類別(系統(tǒng)評價/Meta分析)、干預措施類別(藥物或非藥物)、Meta分析綜合效應(yīng)指標數(shù)及指標特性(軟指標/硬指標)、偏倚風險評估方法、評估結(jié)果在Meta分析中的應(yīng)用等。對于采用Cochrane協(xié)作網(wǎng)隨機對照試驗偏倚風險評估工具(Cochrane Collaboration’s tool for assessing the risk of bias in randomized trials,RoB)的文獻還將依據(jù)該工具操作手冊進一步采集以下信息:版本、偏倚風險評估內(nèi)容、提供評估標準(是/否)、報告評估依據(jù)(是/否)、評估結(jié)果(低風險高風險不清楚)、評估結(jié)果報告形式(偏倚風險圖/偏倚風險總結(jié)圖/表格)、基于結(jié)局評估測量偏倚(是/否)、實施偏倚(是/否)、失訪偏倚(是/否)等。
1.3數(shù)據(jù)管理及分析采用Excel軟件進行數(shù)據(jù)錄入及管理,采用SPSS11.0進行描述性分析。
根據(jù)檢索策略檢索獲得發(fā)表于《中國循證醫(yī)學雜志》的文獻74篇(2017年62篇,2018年12篇);發(fā)表于其他中文核心期刊文獻1 268篇(2017年1 135篇,2018年133篇),按發(fā)表年份分層系統(tǒng)抽樣,獲取發(fā)表于2017年和2018年其他中文核心期刊的文獻分別為113篇和13篇。通過閱讀文獻剔除25篇非干預措施或非隨機對照試驗系統(tǒng)評價/Meta分析,最終共有175篇文獻納入本次調(diào)查,其中《中國循證醫(yī)學雜志》66篇,其他中文核心期刊109篇。
2.1一般情況納入調(diào)查的175篇文獻均為Meta分析。共進行了626個指標的定量綜合,包括1 734項平行隨機對照試驗。99.4%(174/175)的Meta分析均進行了偏倚風險評估,RoB為使用頻率最多的風險評估方法,其次為Jadad量表。納入調(diào)查的175篇文獻的一般情況見表1。
表1 納入分析文獻一般情況Table 1 General data of the included systematic reviews n/篇(p/%)
2.2 Cochrane協(xié)作網(wǎng)隨機對照試驗偏倚風險評估工具運用情況納入分析的175篇Meta分析文獻中共有142篇(81.1%;《中國循證醫(yī)學雜志》66篇,其他中文核心期刊76篇)采用RoB,其中65.4%(93/142)采用的是2011年更新版。除3篇發(fā)表于其他中文核心期刊的Meta分析文獻因未說明具體評估內(nèi)容及未報告評估結(jié)果而無法獲知偏倚風險評估內(nèi)容外,其余的139篇均評估了“選擇性偏倚”和“失訪偏倚”;分別有95%(132/139)、92.8%(129/139)Meta分析文獻評估了“報告偏倚”和“其他偏倚”;57.6%(53/92)采用2011版RoB的文獻將“盲法”分為對患者、干預實施者施盲和對結(jié)局評估者施盲。發(fā)表于其他中文核心期刊的76篇文獻中有19篇(25%)還對納入Meta分析的單個研究進行了總體偏倚風險評估,即根據(jù)每項隨機對照試驗在各偏倚維度評估結(jié)果給予A、B、C級總體評估。詳見表2。
2.3 Cochrane協(xié)作網(wǎng)評估工具偏倚風險評估結(jié)果的報告和運用納入分析的66篇發(fā)表于《中國循證醫(yī)學雜志》的Meta分析中有64篇以“偏倚風險表”描述偏倚評估相關(guān)信息,其中62篇列出的是各類偏倚風險評估的判斷依據(jù)而未報告判斷結(jié)果(即高風險/低風險/不清楚),另外2篇則報告判斷結(jié)果但未提供判斷依據(jù)。在采用RoB的76篇發(fā)表于其他中文核心期刊的Meta分析中分別有26篇(34.2%)和28篇(36.8%)以圖、表形式報告風險評估信息;16篇(21.0%)文獻同時報告風險評估結(jié)果和判斷依據(jù);各有1篇文獻以整體風險評估結(jié)果為Meta分析納入標準或敏感性分析依據(jù)。詳見表3。
2.4關(guān)于“報告偏倚”和“其他偏倚”的評估相對于其他4大類偏倚來說,RoB中“報告偏倚”的評估較為復雜和費時,而“其他偏倚”實際上包含了開放性的評估內(nèi)容。故特別調(diào)查了這兩類偏倚的評估結(jié)果。
采用RoB的142篇Meta分析中,3篇Meta分析文獻未說明偏倚風險評估內(nèi)容,分別有92.9%(132/139)和92.8%(129/139)的文獻評估了“報告偏倚”和“其他偏倚”,但其中僅有3篇文獻描述了“報告偏倚”和4篇文獻描述了“其他偏倚”的評估方法。79%(100/126)Meta分析文獻的“報告偏倚”和86%(108/125)Meta分析文獻的“其他偏倚”風險評估結(jié)果或全為不清楚、或全為低高風險。詳見表4。
表2 納入分析文獻使用RoB的基本情況Table 2 Application of RoB in the systematic reviews n/篇(p/%)
偏倚風險評估是撰寫系統(tǒng)評價/Meta分析過程中不可缺少的重要步驟,正確運用偏倚風險評估工具、完整報告評估結(jié)果和評估依據(jù)將有利于系統(tǒng)評價/Meta分析證據(jù)的合理使用。本文的分析資料來源于循證醫(yī)學專業(yè)期刊《中國循證醫(yī)學雜志》2017年1月至2018年6月發(fā)表的所有干預措施隨機對照試驗Meta分析以及同時間段發(fā)表于其他中文核心期刊相關(guān)文獻的隨機抽樣樣本,能較好地反映目前國內(nèi)Meta分析中隨機對照試驗偏倚風險評估的方法及運用的現(xiàn)狀。鑒于RoB為目前最常用的偏倚風險評估方法,也是Cochrane協(xié)作網(wǎng)推薦的偏倚風險評估工具,故重點調(diào)查和分析了RoB的使用情況。
表3 RoB偏倚風險評估結(jié)果的報告方式及運用Table 3 Reporting methods and usage of RoB evaluation results in the included systematic reviews n/篇(p/%)
表4 關(guān)于報告偏倚和其他偏倚的評估Table 4 Evaluation of reporting bias and other bias in the included systematic reviews n/篇(p/%)
調(diào)查結(jié)果顯示絕大多數(shù)(99.4%)Meta分析文獻報告了偏倚風險評估相關(guān)內(nèi)容。偏倚風險(方法學質(zhì)量)評估的方法主要有RoB和Jadad量表。RoB均為兩類期刊Meta分析文獻使用頻率最高的偏倚風險評估方法。其中發(fā)表于《中國循證醫(yī)學雜志》的Meta分析全部采用RoB,而近70%發(fā)表于其他中文核心期刊的文獻也使用了該工具。但兩類期刊在具體運用RoB時存在一些差別。如相關(guān)術(shù)語的使用,95.5%的《中國循證醫(yī)學雜志》文獻采用Cochrane協(xié)作網(wǎng)工作手冊推薦的“偏倚風險評估”,而78.8%的其他中文核心期刊文獻作者仍沿用以往的“方法學質(zhì)量”一詞;97%的《中國循證醫(yī)學雜志》文獻以“偏倚風險表”形式報告各偏倚風險判斷依據(jù)而未直接列出結(jié)果;且使用2011年版RoB的文獻未根據(jù)施盲對象不同分開評估偏倚的比例要高于其他中文核心期刊。另一方面,兩類期刊均較少有文獻描述“報告偏倚”及“其他偏倚”的評估方法;亦鮮有文獻基于結(jié)局指標分別評估“測量偏倚”、“實施偏倚”和“失訪偏倚”;根據(jù)偏倚風險評估結(jié)果計劃或?qū)嵤┟舾行苑治龅奈墨I數(shù)量也極低。
3.1關(guān)于偏倚風險評估方法Cochrane協(xié)作網(wǎng)偏倚風險評估工具首次發(fā)布于2008年[2],并于2011年更新[3]。該工具不僅分別是Cochrane協(xié)作網(wǎng)干預措施系統(tǒng)評價工作手冊5.0版和5.1版中的一個章節(jié),同時也被編入RevMan軟件[4,5]以便于偏倚風險評估結(jié)果的報告。本調(diào)查結(jié)果顯示盡管該工具發(fā)布已達10年,但仍有近23%發(fā)表于其他中文核心期刊的Meta分析文獻使用Jadad量表[6]以便于偏倚風險評估結(jié)果的報告。Jadad量表雖然簡單易用,但由于存在較多不足并不被Cochrane協(xié)作網(wǎng)推薦[1]。建議今后進行隨機對照試驗系統(tǒng)評價或Meta分析時選擇RoB評估偏倚風險。
2008年版和2011年版的RoB最明顯的不同是后者將盲法分離,根據(jù)施盲對象不同分為“測量偏倚”和“實施偏倚”兩個維度。調(diào)查發(fā)現(xiàn)超過一半聲稱采用2011年版的文獻并未分別評估這兩個維度偏倚,而是將之合并為“盲法”進行風險評估。而7篇采用2008年版的文獻中有4篇卻將“盲法”分開評估。文獻“方法”部分的描述與具體運用不相一致的情況反映了Meta分析作者在評估方法描述和具體運用時的隨意性。
3.2偏倚風險評估標準及結(jié)果判斷本次調(diào)查文獻中的多數(shù)作者僅對被評價隨機對照試驗報告中與偏倚風險評估相關(guān)的內(nèi)容進行引述,而未據(jù)此給出相應(yīng)的結(jié)果判斷,即未給出低風險/高風險/不清楚。如在“隨機序列產(chǎn)生”條目下報告“隨機數(shù)字表”,在“對患者、干預實施者施盲”條目下報告“雙盲”,在“數(shù)據(jù)結(jié)果的完整性”條目下報告“失訪”,這將給證據(jù)使用者造成極大困惑。因為同樣的描述偏倚風險評估結(jié)果可能是不同的。例如同樣是“雙盲”的描述,對于1項比較火針與藥物療效的試驗來說,“實施偏倚”可能為“高風險”;而對于能較好滿足盲法要求的干預措施比較試驗來說,則可能為“低風險”。“失訪偏倚”風險的高低同樣也取決于失訪的原因以及處理方法。建議Meta分析作者最好能以表格形式列出納入的各項隨機對照試驗偏倚風險評估依據(jù),再以RevMan軟件繪制的偏倚風險總結(jié)圖報告各項試驗的風險評估結(jié)果。
相對于Jadad量表來說,RoB的使用存在一定的難度。因為該工具評估的著重點不在于文獻是否報告某特定內(nèi)容,而在于評估若存在某方法學不足是否會影響研究結(jié)果的內(nèi)部準確度[7]。因此更要求系統(tǒng)評價員具備良好的臨床流行病學和臨床專業(yè)背景,正確地判斷相關(guān)偏倚風險的高低。以評估“實施偏倚”和“檢測偏倚”風險為例,要求評價員對相關(guān)結(jié)局指標內(nèi)涵有所了解,是軟指標還是硬指標,指標信息由誰提供,結(jié)局由誰來判斷。只有對這些問題能正確認識時方可較為準確地對上述兩類偏倚風險做出評估。例如1項比較基于手機APP的健康教育與常規(guī)健康教育對糖尿病患者糖化血紅蛋白影響的隨機對照試驗,干預措施是無法對患者及干預實施者施盲的,“實施偏倚”應(yīng)判為“高風險”;而由于該效應(yīng)指標的檢測者通常不是研究的參與者且為硬指標,故即便試驗無“盲法”相關(guān)描述,“測量偏倚”亦可判為“低風險”。
RoB中“測量偏倚”、“實施偏倚”和“失訪偏倚”均要求基于不同結(jié)局分別進行風險評估。而此次調(diào)查發(fā)現(xiàn)62篇包括軟指標和硬指標的Meta分析中僅有4篇文獻是基于結(jié)局分別評估盲法相關(guān)的偏倚,而無1篇文獻基于不同結(jié)局分別評估失訪偏倚。當Meta分析包括較多標指時,最好能指定1到2個重要的結(jié)局指標并基于此報告偏倚風險評估結(jié)果和依據(jù)。另外RevMan 5.3軟件可在森林圖中輸出風險總結(jié)圖,評價員也可利用這一功能基于不同結(jié)局報告風險評估結(jié)果。
由于臨床研究的多樣性,除“選擇性偏倚”外RoB對其他幾類偏倚評估只提供了較為寬泛的操作指引。有研究報告RoB易出現(xiàn)評估結(jié)果的不一致[8,9],尤其在評估“報告偏倚”時存在難度[10]。由于“報告偏倚”風險評估往往需要綜合多方面信息進行判斷,如研究計劃、文獻方法部分的相關(guān)描述以及臨床專業(yè)知識(如重要的臨床結(jié)局是否有報告)等,因此更需要系統(tǒng)評價者事先制訂詳細的評估方法和標準。“其他偏倚”是作為RoB中另外5類偏倚的補充,當評價員認為Meta分析納入的隨機對照試驗存在其他5類偏倚無法涵蓋的偏倚時,則可作為“其他偏倚”評估。故在評估“其他偏倚”時同樣需事先制訂詳細的評價內(nèi)容及標準。本次調(diào)查樣本中有132篇文獻評估了“報告偏倚”,但只有3篇發(fā)表于其他中文核心期刊的Meta分析描述了評估方法。而在129篇評估了“其他偏倚”的文獻中兩類期刊僅各有2篇描述了該偏倚的評估內(nèi)容。79%和86%的Meta分析文獻呈現(xiàn)的“報告偏倚”和“其他偏倚”風險評估結(jié)果或全為不清楚,或全為低/高風險,除了被評價的隨機對照試驗報告本身原因外,評價員是否切實認真地評估這兩類偏倚也是值得質(zhì)疑的。
本次調(diào)查的175篇Meta分析中以評估結(jié)果作為納入標準和敏感性分析依據(jù)的各有3篇(其中2篇采用Jadad量表,1篇采用RoB)。其余的Meta分析均未在文獻的“方法”部分描述風險評估結(jié)果相關(guān)的敏感性分析計劃。這一方面可能與納入的隨機對照試驗多為高偏倚風險有關(guān),另一方面也反映了Meta分析的作者未能充分利用偏倚風險評估結(jié)果信息。
本次調(diào)查還發(fā)現(xiàn)部分Meta分析作者對偏倚風險評估相關(guān)的方法學概念理解錯誤,如出現(xiàn)“采用盲法進行隨機分組”、“由于干預措施給藥途徑不同無法實施分配隱藏”等錯誤描述?;蜻^分依賴或機械地根據(jù)隨機對照試驗的報告信息判斷偏倚風險,如在偏倚風險表的“選擇報告結(jié)果”、“其他偏倚”這些需評價員綜合判斷的項目下出現(xiàn)“未描述”,只要隨機對照試驗報告有“雙盲”的描述則將RoB中與盲法相關(guān)的偏倚均判為“低風險”等,卻未進一步評估被比較的干預措施是否能滿足盲法的要求。另外還存在文字描述的偏倚風險判斷結(jié)果與風險圖表達不一致的情況。
綜上,本次調(diào)查表明Cochrane協(xié)作網(wǎng)隨機對照試驗偏倚風險評估工具是目前干預措施隨機對照試驗Meta分析偏倚風險評估最常用的方法,但在實際運用時RoB使用者卻偏離Cochrane協(xié)作網(wǎng)推薦的操作指引。為此,對將來的RoB使用者有以下建議:(1)重視偏倚風險評估在Meta分析中的作用,嚴格按評估工具的內(nèi)容進行評估,避免隨意合并或遺漏評估內(nèi)容。(2)注重臨床流行病學知識與臨床專業(yè)知識相結(jié)合,基于Cochrane工作手冊框架下制訂具體的風險評估標準。(3)根據(jù)《系統(tǒng)評價和薈萃分析優(yōu)先報告條目》[11]要求,充分報告風險評估標準、依據(jù)和判斷結(jié)果。
近年來Cochrane協(xié)作網(wǎng)方法學工作組在以往版本基礎(chǔ)上不斷完善偏倚風險評估工具,全新版的偏倚風險評估工具(Risk of bias 2.0 tool,RoB2.0)業(yè)已完成[12]。本文基于調(diào)查結(jié)果著重分析目前使用頻率最高的RoB1.0在實施時存在的問題,相信有助于今后RoB2.0的正確使用。