周奇,王玲,楊楠,玉炫,張靜怡,馬艷芳,王健健,張先卓,石秀娥,陳耀龍,楊克虎
1.蘭州大學(xué)第一臨床醫(yī)學(xué)院,甘肅蘭州市 730000;2.蘭州大學(xué)基礎(chǔ)醫(yī)學(xué)院循證醫(yī)學(xué)中心,甘肅蘭州市 730000;3.世界衛(wèi)生組織指南實(shí)施與知識轉(zhuǎn)化合作中心,甘肅蘭州市 730000;4.GRADE 中國中心,甘肅蘭州市 730000;5.甘肅省循證醫(yī)學(xué)與臨床轉(zhuǎn)化重點(diǎn)實(shí)驗(yàn)室,甘肅蘭州市 730000;6.蘭州大學(xué)公共衛(wèi)生學(xué)院,甘肅蘭州市 730000;7.甘肅省康復(fù)中心醫(yī)院,甘肅蘭州市 730000;8.甘肅省循證康復(fù)醫(yī)學(xué)研究中心,甘肅蘭州市 730000
證據(jù)質(zhì)量能夠衡量研究結(jié)果和結(jié)論正確預(yù)測真實(shí)情況的程度,推薦強(qiáng)度則反映對干預(yù)措施是否利大于弊的把握程度[1]。指南研究與評價(jià)工具(Appraisal of Guidelines for Research and Evaluation Ⅱ,AGREE Ⅱ)[2]和RIGHT[3]均對證據(jù)質(zhì)量和推薦強(qiáng)度有明確的要求和規(guī)定,并強(qiáng)調(diào)報(bào)告推薦強(qiáng)度和該推薦關(guān)聯(lián)證據(jù)的質(zhì)量。采用證據(jù)和推薦意見分級系統(tǒng)不僅有助于指南制訂者嚴(yán)格評價(jià)和選擇高質(zhì)量證據(jù),提高指南的可靠性,也有助于臨床醫(yī)生在短時(shí)間內(nèi)了解不同干預(yù)措施可能產(chǎn)生的利弊,提高指南的應(yīng)用性。
近年來,隨著循證理念的廣泛傳播[4‐5]和國內(nèi)指南數(shù)量的快速增長[6],指南所采用的證據(jù)質(zhì)量和推薦強(qiáng)度分級系統(tǒng)得到包括康復(fù)醫(yī)生在內(nèi)的各類人群的關(guān)注。其中,GRADE 是目前應(yīng)用最為廣泛的分級系統(tǒng),已被包括世界衛(wèi)生組織(World Health Organization,WHO)、Cochrane 協(xié)作網(wǎng)、英國國家衛(wèi)生與臨床優(yōu)化研究所(National Institute for Health and Care Excel‐lence,NICE)、UpToDate 和中華醫(yī)學(xué)會在內(nèi)的100 多個(gè)組織采用[7]。本文對康復(fù)臨床實(shí)踐指南GRADE 評價(jià)結(jié)果進(jìn)行分析,以期進(jìn)一步理解和使用GRADE 系統(tǒng),提高康復(fù)臨床實(shí)踐指南的可靠性和應(yīng)用性。
計(jì)算機(jī)檢索PubMed、EMBASE、中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(China Biology Medicine disc,CBM)、中國知網(wǎng)(CNKI)和萬方數(shù)據(jù)庫以及醫(yī)脈通、NICE、美國國立指南文庫、蘇格蘭校際指南協(xié)作網(wǎng)(The Scottish Intercollegiate Guidelines Network,SIGN)、WHO、國際指南協(xié)作網(wǎng)等指南相關(guān)網(wǎng)站,搜索國內(nèi)外已發(fā)布的采用GRADE 分級的康復(fù)臨床實(shí)踐指南,檢索時(shí)限均從建庫至2020年1月11日。
中文檢索詞:康復(fù)、復(fù)健、恢復(fù)、功能、物理療法、運(yùn)動(dòng)療法、殘疾、作業(yè)治療、心理治療、“語言療法”、“言語治療”、“運(yùn)動(dòng)療法”、“音樂療法”、“娛樂療法”、“舞蹈療法”、“動(dòng)物輔助療法”、水療、“電刺激療法”、“體外沖擊波療法”、輔助技術(shù)、指南、共識、建議。
英文檢索詞:rehabilitation、recovery、function‐ing、physiotherapy、kinesitherapy、disability、occupa‐tional therapy、psychological therapy、language thera‐py、speech therapy、exercise therapy、music therapy、recreation therapy、dance therapy、animal assisted ther‐apy、hydrotherapy、electric stimulation therapy、extra‐corporeal shockwave therapy、assistive technology、guideline、consensus、recommendations。
納入標(biāo)準(zhǔn):①符合《國際功能、殘疾和健康分類》(International Classification of Functioning,Disabil‐ity and Health,ICF)概念模式[8];②以臨床指南類型發(fā)表;③明確采用GRADE 分級系統(tǒng);④以期刊論文形式發(fā)表;⑤發(fā)表語言為英文或中文。
排除標(biāo)準(zhǔn):①舊版本指南;②指南計(jì)劃書;③無可辨識的推薦意見。
由2 名研究員獨(dú)立對檢索到的文獻(xiàn)進(jìn)行篩選和數(shù)據(jù)提取并交叉核對,如遇分歧則與第三方協(xié)商解決。篩選文獻(xiàn)時(shí)首先通過閱讀文題和摘要,排除明顯不相關(guān)的文獻(xiàn),保留確定納入文獻(xiàn),對不能準(zhǔn)確判斷的文獻(xiàn)進(jìn)一步閱讀全文,以確定最終是否納入。信息提取包括證據(jù)質(zhì)量和推薦強(qiáng)度分級系統(tǒng)以及GRADE 評價(jià)的推薦意見的推薦強(qiáng)度和證據(jù)質(zhì)量分級結(jié)果。
采用Microsoft Excel 2016 軟件進(jìn)行資料整理,匯總分析指南GRADE 分級系統(tǒng)的使用率和GRADE 證據(jù)質(zhì)量和推薦強(qiáng)度的百分比,采用SPSS 19.0 軟件對證據(jù)質(zhì)量和推薦強(qiáng)度的分級結(jié)果進(jìn)行χ2檢驗(yàn)。顯著性水平α=0.05。
根據(jù)預(yù)先制定的檢索策略共獲得相關(guān)文獻(xiàn)7364篇,通過閱讀題目、摘要、全文等逐層篩選,納入康復(fù)臨床實(shí)踐指南83 篇,排除未應(yīng)用分級系統(tǒng)的指南37 篇(44.6%),排除采用其他證據(jù)質(zhì)量和推薦意見分級系統(tǒng)42 篇(50.6%),包括荷蘭衛(wèi)生保健發(fā)展研究院(Dutch Institute for Healthcare Improvement,CBO)分級系統(tǒng)、SIGN、牛津大學(xué)循證醫(yī)學(xué)中心(Oxford Centre for Evidence‐based Medicine,OCEBM)分級系統(tǒng)、澳大利亞國家健康與醫(yī)學(xué)研究理事會(National Health and Medical Research Council,NHMRC)分級系統(tǒng)、美國預(yù)防醫(yī)學(xué)工作組(United States Preventive Services Task Force,USPSFT)分級系統(tǒng)、1986 年David Sackett 分 級系統(tǒng),以及指南工作組自身制訂的分級系統(tǒng)等。最終納入應(yīng)用GRADE分級系統(tǒng)的指南4篇(4.8%)。文獻(xiàn)篩選流程及結(jié)果見圖1。
圖1 文獻(xiàn)篩選流程圖
GRADE 分級系統(tǒng)將證據(jù)質(zhì)量分為“高”“中”“低”“極低”四個(gè)等級,推薦意見分為“強(qiáng)”和“弱”兩級[1]。見表1和表2。
4篇采用GRADE分級系統(tǒng)的指南中,中文1篇[9],英文3 篇[10‐12]。4 篇指南共包含44 條推薦意見,其中39條(88.6%)具有明確的證據(jù)質(zhì)量,另5條推薦意見的推薦強(qiáng)度或證據(jù)質(zhì)量不確定。在引用的證據(jù)中,高質(zhì)量證據(jù)4 條(9.1%),中等質(zhì)量證據(jù)12 條(27.3%),低質(zhì)量證據(jù)15 條(34.1%),極低質(zhì)量證據(jù)8 條(18.2%)。在推薦意見中,強(qiáng)推薦14 條(31.8%),弱推薦25 條(56.8%)。見表3。
對于推薦意見所對應(yīng)的證據(jù)質(zhì)量,強(qiáng)推薦的證據(jù)中,28.6%(4/14)為高質(zhì)量證據(jù),21.4%(3/14)為中等質(zhì)量證據(jù),35.7%(5/14)為低質(zhì)量證據(jù),占比最高;在弱推薦的證據(jù)中,高質(zhì)量證據(jù)為0,36.0%(9/25)為中質(zhì)量證據(jù),40.0%(10/25)為低質(zhì)量證據(jù),占比最高。見表3。
強(qiáng)推薦支持證據(jù)的質(zhì)量高于弱推薦(χ2=8.218,P=0.042)。
在納入的83 篇康復(fù)臨床實(shí)踐指南中,僅約5%采用該系統(tǒng),一方面是因?yàn)椴糠种改现朴喺呷晕磳ψC據(jù)質(zhì)量和推薦意見分級系統(tǒng)給予足夠的重視,另一方面是因指南選用的其他分級系統(tǒng)種類較多,除了各個(gè)協(xié)會/學(xué)會制訂或改編的分級系統(tǒng)外,還有較多指南采用工作組自身制訂的分級系統(tǒng)。自1979年加拿大定期體檢特別工作組(Canadian Task Force on the Periodic Health Examination,CTFPHE)首次對研究證據(jù)進(jìn)行系統(tǒng)分級以來[13],經(jīng)過不斷地探索與發(fā)展,產(chǎn)生了至少50 種分級系統(tǒng)[14],但是讓專家、患者、臨床醫(yī)生和政策制訂者逐一了解不同的分級系統(tǒng)既費(fèi)時(shí)費(fèi)力又不切實(shí)際。GRADE 方法相較其他分級系統(tǒng),有以下幾個(gè)重要特點(diǎn)[15]:①明確界定證據(jù)質(zhì)量和推薦強(qiáng)度及其區(qū)別;②明確指出對證據(jù)質(zhì)量的評估是對報(bào)告了重要臨床結(jié)局指標(biāo)的證據(jù)體的評估,而非對一個(gè)系統(tǒng)評價(jià)或臨床試驗(yàn)的評估;③對不同級別證據(jù)的升級與降級有明確、統(tǒng)一的標(biāo)準(zhǔn);④明確承認(rèn)偏好與價(jià)值觀在推薦中的作用。采用GRADE 分級系統(tǒng)既是WHO 指南制訂的基本要求[16‐17],也是國內(nèi)外指南的總體趨勢,未來康復(fù)臨床實(shí)踐指南采用GRADE 系統(tǒng)的比例還需進(jìn)一步提升。
對采用GRADE 系統(tǒng)的康復(fù)臨床實(shí)踐指南分級結(jié)果分析顯示,低和極低質(zhì)量證據(jù)占比超過50%,康復(fù)臨床實(shí)踐指南的制訂需要系統(tǒng)篩選和納入更多高質(zhì)量證據(jù)支持。推薦意見中,弱推薦的比例高于強(qiáng)推薦,與更低的證據(jù)質(zhì)量呈顯著相關(guān),反映出證據(jù)質(zhì)量會影響推薦強(qiáng)度。但應(yīng)注意證據(jù)質(zhì)量和推薦強(qiáng)度本質(zhì)上是相互獨(dú)立的,GRADE 在確定推薦強(qiáng)度時(shí),證據(jù)質(zhì)量只是一個(gè)影響因素,還應(yīng)考慮資源利用、利弊平衡以及患者價(jià)值觀和偏好等其他因素[18],證據(jù)質(zhì)量和推薦強(qiáng)度并非一一對應(yīng)[19‐21],康復(fù)臨床實(shí)踐指南推薦意見中也存在部分中等質(zhì)量證據(jù)給出弱推薦,極低質(zhì)量的證據(jù)給出強(qiáng)推薦。
基于對現(xiàn)有康復(fù)臨床實(shí)踐指南GRADE 分級的現(xiàn)況分析,結(jié)合指南方法學(xué)的要求,對康復(fù)臨床實(shí)踐指南的證據(jù)和推薦分級提出如下建議。①開展康復(fù)研究提供高質(zhì)量證據(jù)。康復(fù)發(fā)展仍存在證據(jù)缺乏,需要進(jìn)行康復(fù)研究能力建設(shè),擴(kuò)大獲得康復(fù)的有力證據(jù),促進(jìn)健康體系中康復(fù)模塊的建立健全[22],響應(yīng)“康復(fù)2030”行動(dòng)呼吁[23]。②基于系統(tǒng)評價(jià)對證據(jù)進(jìn)行分級[24‐25]。一方面,原美國醫(yī)學(xué)研究所(Institute of Medi‐cine,IOM)對指南新的定義和要求明確指出,指南的推薦意見必須基于對當(dāng)前研究證據(jù)的系統(tǒng)評價(jià)[26]。另一方面,GRADE 是針對系統(tǒng)評價(jià)每個(gè)結(jié)局對應(yīng)研究證據(jù)(即結(jié)局的證據(jù)體),根據(jù)各個(gè)因素(5 個(gè)降級因素包括偏倚風(fēng)險(xiǎn)、間接性、異質(zhì)性、不精確性和發(fā)表偏倚;3 個(gè)升級因素包括大效應(yīng)量、劑量效應(yīng)關(guān)系和負(fù)偏倚)進(jìn)行質(zhì)量評價(jià)[15]。③指南方法學(xué)家應(yīng)參與指南制訂,可以直接負(fù)責(zé)指南證據(jù)質(zhì)量評價(jià)與分級,也可指導(dǎo)推薦意見形成和確定推薦強(qiáng)度,有助于改善指南的方法學(xué)質(zhì)量[27‐28]。④指南全文撰寫應(yīng)按照相應(yīng)的報(bào)告規(guī)范(如RIGHT 聲明[3])進(jìn)行,描述證據(jù)質(zhì)量分級的方法、推薦意見的強(qiáng)度以及支持該推薦的證據(jù)質(zhì)量。
本研究首次對目前康復(fù)臨床實(shí)踐指南的GRADE分級現(xiàn)狀進(jìn)行描述和分析,并就如何改善康復(fù)臨床實(shí)踐指南證據(jù)和推薦分級提出針對性建議。但本研究仍然存在一定的局限性:①使用GRADE 系統(tǒng)的康復(fù)臨床實(shí)踐指南比例較低,研究總體樣本較少;②指南各指南制訂者對GRADE 方法掌握參差不齊,分級的內(nèi)部一致性和外部準(zhǔn)確性可能存在問題;③部分指南推薦意見的推薦強(qiáng)度或證據(jù)質(zhì)量分級不確定,可能會對分析結(jié)果產(chǎn)生一定影響。
表1 GRADE證據(jù)質(zhì)量的描述
表2 GRADE推薦強(qiáng)度的描述
表3 指南推薦意見GRADE分級結(jié)果比較[n(%)]
康復(fù)臨床實(shí)踐指南對GRADE 分級系統(tǒng)的應(yīng)用仍待提高,建議康復(fù)臨床實(shí)踐指南制訂者進(jìn)一步掌握指南和GRADE 方法學(xué),更有效地改善康復(fù)臨床實(shí)踐指南的可靠性和應(yīng)用性。