李江 蘇凱 李放 唐威 黃遙 王樂 黃慧瑤 石菊芳 代敏
目前肺癌已成為人類惡性腫瘤中發(fā)病率和死亡率增長最為迅速的一種[1]。國際癌癥研究署(International Agency for Research on Cancer, IARC)發(fā)布最新數(shù)據(jù)顯示肺癌發(fā)病率已位居男性惡性腫瘤首位和女性第三位,且呈直線上升趨勢;而且不論男女,肺癌死亡率均在首位[2]。最近研究結(jié)果指出,在人群中進行篩查能降低人群死于肺癌的概率(約降低20%)[3],該結(jié)果為篩查工作人員及政府財務(wù)機構(gòu)提供了較權(quán)威的篩查策略推薦指南和經(jīng)濟成本分析證據(jù)[4]。為了高效率地實現(xiàn)對潛在肺癌患者的早期發(fā)現(xiàn)、預(yù)防和治療,以最終達到降低肺癌死亡率和整個社會與經(jīng)濟負擔(dān)的目標(biāo),依據(jù)高質(zhì)量的肺癌篩查指南進行實踐工作是十分重要和必要的。
醫(yī)務(wù)工作人員們對臨床實踐指南已不再陌生。許多國家已經(jīng)制定了或者正在制定各種不同的指南,中國也正在制定自己的實踐指南[5]。過去多數(shù)指南都是基于當(dāng)?shù)鼗驀鴥?nèi)各臨床專家的經(jīng)驗和意見、教科書等制定。隨著科學(xué)證據(jù)的逐漸增多,創(chuàng)新技術(shù)的層出不窮,患者保護意識的加強,醫(yī)務(wù)人員的實踐工作面臨著極大的挑戰(zhàn)。如果指南建立在嚴格的循證醫(yī)學(xué)證據(jù)和高質(zhì)量方法的基礎(chǔ)上,采用系統(tǒng)的文獻評價和檢索方法,基于高質(zhì)量的證據(jù),并予以充分、嚴格和全透明的過程的推薦,在可能的情況下盡量減少偏倚產(chǎn)生,那么這樣的指南將能夠科學(xué)地成為證據(jù)轉(zhuǎn)變?yōu)閷嵺`的一種策略,其臨床使用則更具有可靠性[6]。歐洲指南研究與評估工具(Appraisal of Guidelines Research and Evaluation in Europe, AGREE)是由13個國家的研究者制定的指南研究和評價工具,主要評價指南的開發(fā)、使用和推廣等,已成為世界公認評價指南質(zhì)量的重要工具,目前已經(jīng)更新至第二版(AGREE II)[7]。
本研究調(diào)查分析了肺癌篩查指南的現(xiàn)狀,使用AGREE II工具評價指南方法學(xué)質(zhì)量,為我國肺癌篩查指南編制工作提供借鑒,希望促進我國肺癌篩查工作在方案決策、業(yè)務(wù)操作、經(jīng)濟成本考慮等方面的規(guī)范化。
1.1 研究資料 計算機檢索截至2016年2月的英文數(shù)據(jù)庫包括PubMed、Embase、Cochrane圖書館(Cochrane Library,CL)、Web of Science數(shù)據(jù)庫,中文數(shù)據(jù)庫包括中國期刊全文數(shù)據(jù)庫(China National Knowledge Infrastructure,CNKI)、中國生物醫(yī)學(xué)文獻數(shù)據(jù)庫(China Bio-Medicine database, CBM)和萬方數(shù)據(jù)庫,同時還檢索網(wǎng)站資源包括美國胸科醫(yī)師協(xié)會數(shù)據(jù)資源(American College of Chest Physicians, ACCP)、美國國家癌癥網(wǎng)絡(luò)信息平臺(National Comprehensive Cancer Network, NCCN)、美國臨床腫瘤學(xué)會(American Society of Clinical Oncology, ASCO)、美國預(yù)防服務(wù)工作組(U.S. Preventive Services Task Force,USPSTF),國際肺癌研究協(xié)會(International Association for the Study of Lung Cancer, IASLC)、國際指南協(xié)作網(wǎng)(Guideline International Network, GIN)和中國臨床指南文庫(China Guideline Clearinghouse, CGC)等數(shù)據(jù)庫文獻資料,并手工檢索已發(fā)表和通過參考文獻追溯的相關(guān)指南及全文,嚴格依據(jù)中英文數(shù)據(jù)庫主題詞和關(guān)鍵詞的檢索特點制定檢索策略(表1)。
1.2 納入/排除標(biāo)準(zhǔn) 納入公開發(fā)布的原創(chuàng)和更新的正常人群中肺癌篩查指南/推薦意見全文。題目中有明確“指南(guideline)”和/或“推薦意見(recommendation)”的詞語且肺癌篩查指南的形式為獨立報告,官方發(fā)布或者非官方發(fā)布均納入,并且具備詳細的制作流程和/或研究方法的描述。語種僅限中、英文。排除關(guān)于臨床指南的介紹、評析、應(yīng)用指導(dǎo)、應(yīng)用效果評價、勘誤表,排除非肺癌、非篩查類和非獨立內(nèi)容呈現(xiàn)的指南,排除其他癌種轉(zhuǎn)移性質(zhì),排除翻譯版本及重復(fù)收錄的指南。
1.3 研究方法 ①指南數(shù)量統(tǒng)計和基本情況:將所納入的指南根據(jù)國別(發(fā)布組織所在地區(qū)為準(zhǔn))、發(fā)布時間、指南名稱、發(fā)布機構(gòu)、是否有研究方法、更新次數(shù)與時間進行統(tǒng)計描述;②指南的推薦意見主要內(nèi)容匯總:該部分主要匯總報告了制定方法的指南。將包括肺癌篩查時的高危人群評估指標(biāo)(包括年齡、吸煙史、戒煙狀態(tài)、其他疾病或遺傳史等)、篩查的頻率、篩查地點推薦及篩查試點的建立、篩查手段的潛在利益(包括生存率及行為改變)及潛在危害(包括過度篩查、假陽性以及篩查所引起的并發(fā)癥等),以及在指南中是否鼓勵受試者參與,是否有提出針對受試者的戒煙行為干預(yù),以及制作指南過程中是否對證據(jù)等級進行分級;③指南質(zhì)量初步評價:參考AGREE II指南評價工具[7],按“范圍和目的、參與人員、嚴謹性、清晰性、應(yīng)用性與獨立性”6個領(lǐng)域23個主要條目對納入的報告了制定方法的指南進行綜合評價(表2)。AGREE II的每一個條目均按7分劃分等級(1分代表很不同意,7分代表很同意,條目報道不能滿足全部標(biāo)準(zhǔn)或條件則根據(jù)不同情況給予2分-6分)。每個領(lǐng)域得分等于該領(lǐng)域中每一個條目分數(shù)的總和,并標(biāo)準(zhǔn)化為該領(lǐng)域可能的最高分數(shù)。四名評價人員按照每個條目對每一篇指南進行評估判分。得出每個領(lǐng)域的總分,評判標(biāo)準(zhǔn)為:最大可能得分=7分(很同意)×條目數(shù)×評價者數(shù);最小可能得分=1分(很不同意)×條目數(shù)×評價者數(shù);領(lǐng)域分值是:“實際得分-最小可能得分”/“最大可能得分-最小可能得分” × 100;④指南推薦級別判定:根據(jù)6個領(lǐng)域的綜合判斷所評指南是否值得推薦應(yīng)用,分為三個推薦等級:A級:積極推薦(4個及以上領(lǐng)域的分值≥50)、B級:推薦(3個領(lǐng)域的分值≥50),C級:一定條件下推薦(2個及以下領(lǐng)域的分值≥50)。
1.4 評價人員對評價結(jié)果的一致性判斷 指南篩選采用研究人員獨立判讀、翻譯、校對的方法,如有異議通過小組討論解決。小組中研究人員均需具備較好的英文閱讀能力和流行病學(xué)/循證醫(yī)學(xué)方法的基礎(chǔ),并由通過組內(nèi)培訓(xùn)對文獻嚴格評價的方法、AGREE II工具、評價標(biāo)準(zhǔn)及評價注意事項進行詳細介紹。為保證評價結(jié)果的可靠性,隨機抽取2篇納入文獻進行獨立評分,共同衡量四名評價人員間對指南評價結(jié)果的一致性。
1.5 數(shù)據(jù)分析 文獻資料管理采用Endnote軟件,指標(biāo)積分、統(tǒng)計評價采用Microsoft Excel 2010版本軟件,統(tǒng)計評價方法采用綜合評分法。
表1 檢索策略Tab 1 Search strategy
表2 AGREE II工具評價內(nèi)容及分值范圍Tab 2 Evaluation items of AGREE II and score range
2.1 文獻檢索結(jié)果 初步檢索到相關(guān)文獻237篇,初步符合指南標(biāo)準(zhǔn)的24篇。仔細閱讀全文,按是否在指南報告中提供研究方法,最終納入肺癌篩查領(lǐng)域具備研究方法的指南共11篇[8-18](圖1)。
2.2 指南的基本信息 指南基本信息描述一覽表見表3,按國別、發(fā)布時間、指南名稱、發(fā)布機構(gòu)、是否提供研究方案、更新次數(shù)與時間分類。
2.2.1 指南的國別、發(fā)布時間與更新情況 2012年-2014年呈現(xiàn)一個具備詳細方法學(xué)內(nèi)容的肺癌篩查領(lǐng)域指南的發(fā)布高峰。發(fā)布國家主要集中在美國,占總量的81%,關(guān)注的問題包括了肺癌篩查中高危險人群篩選、方案的選擇以及潛在利害等。2015年,中國發(fā)表1篇獨立于肺癌診療規(guī)范全面版的針對肺癌篩查推薦意見。
2.2.2 指南中所描述的方法 有meta分析/系統(tǒng)評價、證據(jù)分級、隨機對照試驗和專家意見等。2012年以來指南制定所依據(jù)的證據(jù)等級逐步提高,方法也逐漸完善。其中6篇報告了制定指南過程中所依據(jù)證據(jù)等級的分級方法。
2.2.3 指南發(fā)布機構(gòu)情況 指南發(fā)布機構(gòu)共涉及各國腫瘤/胸科專業(yè)協(xié)會(委員會)、癌癥管理中心等專業(yè)機構(gòu)10篇(占91%);未指明發(fā)布機構(gòu)的指南數(shù)1篇。地區(qū)級政府層面發(fā)布1篇(9%),腫瘤/胸科等專業(yè)機構(gòu)發(fā)布9篇(81%),未指明機構(gòu)的1篇(9%)(表3)。
2.3 指南中主要內(nèi)容報告情況 11篇提供具體制作方法的指南中,均提及采用低劑量螺旋CT篩查時的高危人群選擇,高危人群的年齡分為兩個推薦。有8篇[9,11-15,17,18]推薦55歲-74歲的人群接受篩查,3篇[8,10,16]推薦55歲-80歲的人群接受篩查。11篇均推薦具有30包年的吸煙史的人群接受篩查,10篇[8,10-18]推薦即使現(xiàn)在不吸煙,但是在15年內(nèi)有戒煙經(jīng)歷的人群接受篩查。有5篇[8-10,15,17]推薦如有其他肺部疾病史的人群接受篩查。10篇[8-10,12-18]在指南中明確指出對于肺癌篩查的適當(dāng)頻率。7篇[9-12,15-17]推薦篩查地點或者提出建立提供標(biāo)準(zhǔn)化篩查的試點。11篇均指出了篩查的潛在利益及潛在危害,具體內(nèi)容需要根據(jù)具體情況對待。6篇[9,10,12-14,16]指出需要鼓勵受試者參與到篩查的項目中以體現(xiàn)受試者的意愿和個體化選擇。6篇[9,10,13,14,16,17]提出了針對高危人群的戒煙行為干預(yù)的措施。6篇[9,10,13,14,16,17]對于證據(jù)進行了等級的分級(表4)。
2.4 指南質(zhì)量初步評價結(jié)果
2.4.1 總體質(zhì)量評價結(jié)果 本研究對該11篇肺癌篩查指南進行方法學(xué)質(zhì)量評價,采用AGREE II評價工具,在“范圍和目的、參與人員、嚴謹性、清晰性、應(yīng)用性與獨立性”6個領(lǐng)域獨立計分。
“范圍和目的”領(lǐng)域總體評價結(jié)果平均80分,“參與人員”領(lǐng)域總體評價結(jié)果平均52分,“嚴謹性”領(lǐng)域總體評價結(jié)果平均50分,“清晰性”領(lǐng)域總體評價結(jié)果平均76分,“應(yīng)用性”領(lǐng)域總體評價結(jié)果平均43分和“獨立性”領(lǐng)域總體評價結(jié)果平均59分。接受評價的11篇指南/推薦意見中,六個領(lǐng)域的平均分達到50以上者有9篇[9,10,12-18](81%)。7篇指南[12-18]為A推薦等級,其余4篇指南[8-11]為B推薦等級(表5)。
2.4.2 不同年代指南質(zhì)量評價結(jié)果 評估的11篇指南均在近5年內(nèi)發(fā)布?!胺秶c目的”領(lǐng)域在2012年-2015年都達到了高于平均值的水平,“參與人員”領(lǐng)域在2013和2015年高于平均值水平,“嚴謹性”領(lǐng)域在2013年-2015年均高于平均值水平,“清晰性”領(lǐng)域在2013年和2014年高于平均值水平,“應(yīng)用性”領(lǐng)域在2013年和2015年高于平均值水平,“獨立性”領(lǐng)域在2013年和2014年高于平均值水平。2013年-2015年的7篇指南[12-18]均為A推薦等級指南;2012年的4篇指南[8-11]為B推薦等級指南(表5)。
2.4.3 不同國家指南質(zhì)量評價結(jié)果 “范圍與目的”領(lǐng)域中,美國發(fā)布的肺癌篩查指南的平均分為79分,加拿大的90分,中國的80分;“參與人員”領(lǐng)域中,美國指南的平均分為49分,加拿大的78分,中國的55分;“嚴謹性”領(lǐng)域中,美國指南的平均分為47分,加拿大的78分,中國的52分;“清晰性”領(lǐng)域中,美國指南的平均分為76分,加拿大的85分,中國的70分;“應(yīng)用性”領(lǐng)域中,美國指南的平均分為44分,加拿大的42分,中國的40分;“獨立性”領(lǐng)域中,美國指南的平均分為56分,加拿大的92分,中國的56分。A推薦等級的指南中,美國指南有5篇[12-14,16,17],加拿大1篇[15]和中國1篇[18](表5)。
本研究納入指南多數(shù)由相關(guān)癌癥防控組織制定發(fā)布,具備方法學(xué)的指南發(fā)布/更新時間均在2012年之后。指南的內(nèi)容、質(zhì)量等會由于制定的時間、國家地區(qū)和組織不同而差異較大。臨床實踐指南根據(jù)制作方法主要分為基于專家共識和基于循證醫(yī)學(xué)證據(jù)兩個類別,2010年,世界衛(wèi)生組織(World Health Organization, WHO)發(fā)布循證指南制定手冊更新版后,循證臨床指南更加逐漸成為指南制訂的趨勢和主流[19]。文中所納入的具有制作方法的11篇肺癌篩查指南均是在2012年后更新和/或制作,一方面是由于2011年美國發(fā)布了具有廣泛影響力的全美肺癌篩查試驗(National Lung Screening Trial, NLST)的結(jié)果,使得各國肺癌篩查研究人員關(guān)注了這個嚴謹設(shè)計的隨機對照試驗所產(chǎn)生的高質(zhì)量的證據(jù)[20];另一方面則是循證指南制定手冊中明確規(guī)定了指南需要依據(jù)新證據(jù)的出現(xiàn),推薦在3年左右更新[21]。多數(shù)指南遵循制作原則,目的是產(chǎn)生高質(zhì)量的臨床推薦意見,促使更加科學(xué)有效地規(guī)范臨床路徑[22]。本研究中6篇[9,10,13,14,16,17]具有證據(jù)推薦等級的循證實踐指南中,涉及的內(nèi)容全面,有關(guān)于肺癌篩查所考慮的問題如高危人群選擇、篩查頻率、篩查地點推薦及建立、篩查潛在利益和潛在危害、是否鼓勵受試者參與和戒煙行為干預(yù)均有提及,而且均為A推薦等級的指南,具有較好的實用性、適用性和推廣性。
圖 1 肺癌篩查指南檢索流程圖Fig 1 Flowchart of including lung cancer screening guidelines
表3 肺癌篩查指南一覽表Tab 3 Lists of lung cancer screening guidelines
表4 肺癌篩查指南推薦意見內(nèi)容一覽表Tab 4List of recommendations of lung cancer screeningguidelines
表5 肺癌篩查指南AGREE II評估Tab 5Evaluation of lung cancer screening guideline by AGREEII
制定臨床指南時,還需要通過循證醫(yī)學(xué)方法與證據(jù)系統(tǒng)研究和嚴格論證。本研究依據(jù)AGREE II的6個領(lǐng)域?qū)Ψ伟┖Y查指南的質(zhì)量進行評價。評價的11篇指南總體質(zhì)量較高,64%的指南推薦等級均為A級。在AGREE II的6個領(lǐng)域中平均分數(shù)≥60的是“范圍和目的”和“清晰性”,而得分較低(≤50)的領(lǐng)域是“應(yīng)用性”,得分介于50分-60分之間的領(lǐng)域是“參與人員”“制定的嚴謹性”及“編輯的獨立性”。AGREE II評價方法不僅在指南內(nèi)容的制定中強調(diào)注重臨床研究的循證醫(yī)學(xué)依據(jù),同時注重指南的實用性、應(yīng)用性和適用性,也就是臨床實踐指南如何能夠?qū)嵤┑结t(yī)療一線工作中,促進疾病的早期診斷和早期治療,此點在癌癥防治方面尤為重要[7]。制定指南的參與成員由各個國家內(nèi)部知名的多學(xué)科專家組成,共同撰寫,針對特定臨床情況的正確診斷與治療決策,給出系統(tǒng)指導(dǎo)意見。指南如果由國家層面組織制定,則更具有科學(xué)性和權(quán)威性;如果由地方參與制定和地方機構(gòu)管理實施,則更針對基層實踐,具有較強的實用價值[23]。本研究結(jié)果顯示,現(xiàn)有指南發(fā)布機構(gòu)中區(qū)域性專門機構(gòu)占35%,多由非營利官方協(xié)會發(fā)布,少數(shù)由大學(xué)或?qū)W術(shù)團體發(fā)布。其中一些肺癌篩查指南的制定或更新出現(xiàn)了多個國家合作的情況,這將促進指南研究的全面性、綜合性、協(xié)調(diào)性和通用性。指南制定過程中往往需要政府及商業(yè)團體資助,利益沖突不可避免,進行制定組織的責(zé)任利益聲明非常有必要。一方面是為了避免存在像商業(yè)團體傾向性而導(dǎo)致的陽性偏倚,同時也是使得所制定的指南可信度更強[24]。本研究評價的指南中,9篇指南在利益沖突進行了聲明且評估分值大于50,可信度較高。
雖然現(xiàn)有的AGREE II指南評價方法是WHO指南制定方法推薦的一種較為完善的臨床指南評價模式,完全按照AGREE II方法判別臨床指南的優(yōu)劣或是依據(jù)其制定指南也不能完全符合我國目前的實際情況,但是有些評價領(lǐng)域的指標(biāo)值得我們借鑒[25]。本研究所評價的一篇我國推薦意見發(fā)表在英文期刊上,但是縱觀國內(nèi)數(shù)據(jù)庫,并未有獨立的肺癌篩查相關(guān)的指南,多是肺癌診治規(guī)范等內(nèi)容中包含了肺癌篩查這一個部分[26],這也提示了在資源、經(jīng)費、經(jīng)驗和時間有限的國家或地區(qū),由于不同國家或地區(qū)間文化、組織的差異,循證指南制定方法和產(chǎn)出會有差異。如在指南的制定時注重指南的學(xué)術(shù)性,而忽視指南的對各類人群的推廣應(yīng)用以及利益聲明等。通過詳細閱讀所評價的我國的肺癌篩查推薦意見,可以看出,我國肺癌篩查相關(guān)專家關(guān)注并遵循了循證實踐指南的方法制定,充分結(jié)合了我國政府支持的肺癌篩查地域性項目所獲得的數(shù)據(jù),使得推薦意見具有獨立性和地域的指導(dǎo)性。這也提示,借鑒國外高質(zhì)量指南的制訂標(biāo)準(zhǔn)、規(guī)范證據(jù)與當(dāng)?shù)丶膊∝摀?dān)、遺傳特點及衛(wèi)生資源條件相結(jié)合,采用循證理念制定出高質(zhì)量證據(jù)支持的本土化指南是我國標(biāo)準(zhǔn)版癌癥篩查指南的發(fā)展方向。
關(guān)于評價工具,本研究是首次使用AGREE II評價肺癌篩查指南/推薦意見。由于研究人員對英文版的AGREE II工具的理解差異,雖然在項目前期進行了統(tǒng)一的培訓(xùn)而且預(yù)評價的一致性較好,但對AGREE II工具中條目評分體系仍然存在異議。我們將會在今后的研究中結(jié)合不同的指南評價工具進行評價,盡量避免偏倚發(fā)生。AGREE II在國際上已經(jīng)具有較高權(quán)威性,但其只是評價指南研究方法學(xué)質(zhì)量,對具體實踐的內(nèi)容尚未有評價標(biāo)準(zhǔn),且我國目前癌癥篩查指南能夠依據(jù)的本土化高質(zhì)量臨床試驗證據(jù)較少,與國際化標(biāo)準(zhǔn)仍有一定差距,故所納入的特別是結(jié)合我國國情制訂的循證實踐指南較少。除此之外,本研究局限性在于檢索文獻過程中限定了語種(中文和英文),因不同的國家地區(qū)會有針對性的肺癌篩查指南的發(fā)布,語種的限制可能會造成不完全的檢索。我們會在今后的研究中,盡量納入其他語種的肺癌篩查領(lǐng)域指南,通過專業(yè)人員進行翻譯從而提供全球化多語種的指南方法學(xué)質(zhì)量評價。
目前提供研究方案的肺癌篩查指南的總體質(zhì)量較高,且集中在近3年發(fā)布。肺癌篩查指南在“應(yīng)用性”領(lǐng)域需要加強。建議由權(quán)威機構(gòu)籌劃,制定出重點突出的、符合我國國情的癌癥篩查循證實踐指南完整版并定期更新,適應(yīng)醫(yī)療技術(shù)的發(fā)展及臨床的規(guī)范化,從而有力地促進我國癌癥早期診斷和早期治療項目的工作效率與成果。