黎霞,李多多,程潞瑤,萬穎,于長禾*
腰痛是由多種病因造成的以腰部一側(cè)或雙側(cè)疼痛或伴活動受限為主的一種常見病癥[1],是導致全球殘疾或生產(chǎn)力下降的主要原因[2]。腰痛發(fā)病率逐年增高,呈年輕化趨勢,7~10歲兒童發(fā)病率為1%~6%,青少年發(fā)病率為18%,40~69歲人群發(fā)病率為28%~42%,是威脅人類健康的重要病癥[3]。因此,國內(nèi)外開展了大量針對腰痛的臨床研究,有效率/總有效率作為常用的結(jié)局指標,在臨床研究中廣泛應(yīng)用[4],然而由于有效率在研究中的組成缺乏一致性或本身定義不清等因素,導致中西醫(yī)結(jié)合干預腰痛缺少高質(zhì)量的循證醫(yī)學證據(jù)。本研究基于DAUDT等[5]推薦的概況性評價框架系統(tǒng)檢索、篩選和整理近5年的腰痛臨床研究中以有效率為結(jié)局指標的研究,分析有效率作為結(jié)局指標的應(yīng)用情況及其定義,為腰痛臨床試驗中有效率的定義提供理論支持和研究思路。
1.1 文獻納入與排除標準 根據(jù)研究目的和PICOS原則,制訂文獻納入標準:(1)研究對象是確診的慢性腰背痛患者,不限制國家、地區(qū)、種族、性別及年齡;(2)干預和對照措施均不限,結(jié)局指標中包含有效率;(3)研究類型包括隨機對照試驗(RCT)、隊列研究、病例對照研究及病例報道。文獻排除標準:(1)重復發(fā)表的文獻;(2)診斷標準及療效評價不明確;(3)動物實驗或其他非人體臨床試驗;(4)無法獲取全文。
1.2 文獻檢索 以“chronic low back pain”“chronic back pain”“l(fā)ow back ache”“l(fā)ow backache”“l(fā)umbago”“pains,lower back”“backaches,low”“l(fā)umbar disc herniation ”“l(fā)umbar spondylolisthesis ”“ the third lumbar vertebral transverse process”“degenerative changes in the lumbar spine”“l(fā)umbar spinal stenosis”“l(fā)umbar spine surgery”為英文檢索詞,以“慢性腰背痛”“腰痛”“腰腿痛”“下腰痛”“腰椎病變”“腰椎間盤突出”“腰椎滑脫”“第三腰椎橫突綜合征”“腰椎退行性改變”“腰背肌筋膜炎”“腰椎滑脫”“腰椎管狹窄”“腰肌勞損”“腰椎術(shù)后”為中文檢索詞,采用主題詞和自由詞結(jié)合的檢索方式在Web of Science、PubMed、EMBase、Cochrane Library、中國知網(wǎng)、維普網(wǎng)、萬方數(shù)據(jù)知識服務(wù)平臺和中國生物醫(yī)學文獻服務(wù)系統(tǒng)進行檢索,檢索時限為2015—2019年。
1.3 方法 將檢索到的文獻導入文獻管理軟件Note Express 3.4中,由2名研究者獨立對檢索到的文獻根據(jù)題目和摘要進行閱讀,排除不符合納入標準的文獻,初篩后下載原文,根據(jù)納入、排除標準進行復篩并交叉核對,若產(chǎn)生分歧經(jīng)討論或由第三方協(xié)助解決,最終確定納入文獻。
1.4 資料分析方法 應(yīng)用Excel建立文獻數(shù)據(jù)庫,使用頻次、頻率對結(jié)局指標進行描述性分析。
2.1 文獻篩選結(jié)果 根據(jù)檢索策略,共檢索出37 899篇文獻,導入文獻管理軟件Note Express 3.4后進行軟件結(jié)合人工查重,去除重復文獻,剩余文獻29 730篇;閱讀標題和摘要初步排除不相關(guān)文獻后剩余4 022篇,進一步閱讀全文最終納入文獻830篇,文獻檢索及篩選流程詳見圖1。
圖1 文獻檢索及篩選流程圖Figure 1 Literature retrieval and screening flow chart
2.2 納入文獻的基本特征
2.2.1 研究對象與地點 納入的830篇臨床研究中,以腰肌勞損患者作為研究對象的最多,共178篇,占21.4%,其他研究對象包括第三腰椎橫突綜合征患者103篇(12.4%)、腰椎間盤突出患者91篇(11.0%)、腰背痛患者89篇(10.7%)、腰背肌筋膜炎患者72篇(8.7%)、腰椎管狹窄患者69篇(8.3%)、腰椎滑脫患者61篇(7.3%)。
研究地點主要以中國為主。中文研究824篇,其中821篇研究地點在中國,2篇在加拿大,1篇在匈牙利;英文研究6篇,其中4篇研究地點在中國,2篇分別在澳大利亞和土耳其。
2.2.2 干預措施 納入的830篇臨床研究采取多種干預措施,并且多篇研究使用不同療法之間配合干預,主要的干預措施包括針灸(345篇)、推拿(200篇)、物理治療(162篇)、手術(shù)(144篇)、中藥口服(117篇)、中藥外用(101篇)、西藥止痛(69篇)、運動療法(47篇)、牽引(42篇)、護理(30篇)、非止痛類西藥(19篇)、健康教育(5篇)等。
2.2.3 研究類型 納入文獻的研究類型主要為RCT、病例報道、隊列研究,分別為642篇(77.3%)、95篇(11.4%)、93篇(11.2%)。
2.3 有效率作為復合結(jié)局指標的應(yīng)用現(xiàn)狀
2.3.1 有效率的評判標準及其參考來源 納入的830篇臨床研究的結(jié)局指標中均包含有效率,但其定義及評判標準并不統(tǒng)一,根據(jù)頻次排名前5位的是《中醫(yī)病證診斷療效標準》[6]、日本骨科協(xié)會評估治療下腰痛評分表(Japanese Orthopaedic Association Scores,JOA)[7]、《中藥新藥臨床研究指導原則:試行》[4]、MacNab療效評定標準[8]、Oswestry功能障礙指數(shù)(ODI)[9],使用頻次分別為271篇(32.7%)、74篇(8.9%)、57篇(6.9%)、27篇(3.3%)、21篇(2.5%),詳見表1。
表1 有效率定義的參考來源Table 1 The reference standard for defining response level
在有效率評判標準參照國家中醫(yī)藥管理局頒布的不同版本《中醫(yī)病證診斷療效標準》中,使用1994年版本[6]的研究最多,為190篇(70.1%);在不同版本《中藥新藥臨床研究指導原則:試行》中,使用2002年版本[4]的研究最多,為40篇(55.6%);參照的其他標準及參考書籍包括中華醫(yī)學會脊柱外科學組1993年制定的評定標準[10]、《神經(jīng)病學》[11]、《骨科學》[12]、《推拿學》[13]、《疼痛診斷治療學》[14]等。有88篇研究在設(shè)定療效標準時參考了文獻,其中7篇研究參考英文文獻;另有22篇研究未對有效率的療效標準進行定義,203篇研究的療效標準未提及參考其他,故認為是自擬療效標準。
即使多篇研究參考同一版本的療效標準,但對符合結(jié)局指標的定義及療效分級仍不統(tǒng)一,如參考1994年版本的《中醫(yī)病證診斷療效標準》,有87篇研究將療效分為3級進行評判,94篇研究將療效分為4級進行評判,另有9篇研究未予明確說明。
2.3.2 復合結(jié)局指標的成分組成 830篇研究中具體報告有效率這一復合結(jié)局指標的研究有808篇,構(gòu)成復合結(jié)局指標的研究指標搭配不同,構(gòu)成數(shù)量也不同。使用頻次排名前5位的研究指標是臨床癥狀531篇(66.1%)、活動功能517篇(64.4%)、疼痛512篇(63.8%)、體征254篇(31.6%)、工作生活能力223篇(27.8%),詳見表2。各研究對復合結(jié)局指標結(jié)合隨意性較強,且部分研究將測量工具也納入結(jié)局指標中,復合結(jié)局指標使用最多的一篇研究[15]在療效判定過程中提及7項,包括疼痛、癥狀、體征、活動、工作生活能力、用藥情況、天氣。最常見的復合結(jié)局指標組合為疼痛、癥狀、活動,共出現(xiàn)在71篇研究中。納入分析的研究中有效率所包含的指標組合出現(xiàn)次數(shù)(≥5篇)詳見表3。
表2 有效率定義中涉及的評價指標Table 2 The evaluation indicators involved in the definition of response level
表3 有效率定義中不同指標的組合情況Table 3 The combination of different indicators in defining response level
2.3.3 療效判定分級情況分析 納入的830篇研究中,751篇研究有明確的療效判定分級標準,其中425篇研究將療效分為4級療效等級,326篇研究將療效分為3級療效等級,詳見表4。
表4 療效判定分級情況Table 4 Assessment of classification of curative effect
納入分析的研究因復合結(jié)局指標中各分項不同,故分級標準亦不相同,如1篇研究[16]以癥狀、體征、活動為療效判定指標,其判定標準為治愈:主要癥狀及體征基本消失,腰部活動度正常;顯效:主要癥狀和體征大部分消失,腰部活動度基本恢復;有效:主要癥狀和體征部分改善,腰部活動度部分恢復;無效:治療前后無變化;另有1篇研究[17]以JOA評分作為療效判定標準,具體為:JOA評分改善率=(治療后JOA評分-治療前JOA評分)/(29-治療前JOA評分)×100%,JOA評分改善率為100%為治愈,61%~99%為顯效,25%~60%為有效,<25%為無效。如上所示,療效標準的不統(tǒng)一導致各研究存在很大定性方法及量化的差異。
本研究檢索國內(nèi)外2015—2019年關(guān)于慢性腰痛的臨床研究,分析各研究中復合結(jié)局指標——有效率的應(yīng)用情況,發(fā)現(xiàn)臨床研究雖采用有效率/總有效率等命名結(jié)局指標,評價的目的相同,但各研究參考的標準不同或定義不統(tǒng)一,測評方法、觀察指標亦難以統(tǒng)一,具有較大的異質(zhì)性。
3.1 參考標準不統(tǒng)一 復合結(jié)局指標的選擇對臨床研究評估的最終療效起重要作用。在國內(nèi),有效率作為慢性腰痛的重要結(jié)局指標被廣泛應(yīng)用,但有效率作為復合結(jié)局指標尚無規(guī)范的統(tǒng)一標準,導致研究者在研究過程中隨意參考或?qū)ζ溥M行自定義,導致療效評價差異較大。部分參考標準年代久遠、過于陳舊,其本身也存在問題,如參照最多的1994年版的《中醫(yī)病證診斷療效標準》[6],其將療效從腰痛減輕程度與功能恢復程度分為3個等級;參照較多的2002年版《中藥新藥臨床研究指導原則:試行》[4],其從癥狀體征改善程度及使用尼莫地平法計算證候積分,并將療效分為4個等級?!吨兴幮滤幣R床研究指導原則:試行》原則上是用于評價新藥開發(fā)的標準,然而在臨床研究中因療效評價標準的缺乏,此標準被廣泛使用。由此可見上述評價標準表述主觀性較強,過于籠統(tǒng),不能客觀、真實地反映慢性腰痛患者預后情況。
3.2 指標內(nèi)容尚未規(guī)范 作為腰痛臨床研究最常用的復合結(jié)局指標,有效率應(yīng)當具備多維度、全面評價療效的功能。本研究顯示腰痛療效等級評判標準中涵蓋的內(nèi)容領(lǐng)域存在差異,臨床癥狀、活動、疼痛、體征、工作生活能力是判定治療是否有效的常見的5個內(nèi)容領(lǐng)域,常以2~4個隨意組合同時出現(xiàn)在研究的有效率判定中,而影像學、止痛藥使用情況等則是被較少關(guān)注的內(nèi)容。此外還有測量工具如JOA、視覺模擬評分法(VAS)、ODI評分改變也常被用作療效判定,上述測量工具針對癥狀體征、活動功能的改善情況進行定量評價,同樣也隸屬于常見的5個內(nèi)容領(lǐng)域??梢娔壳暗难磁R床研究中多數(shù)研究涵蓋了療效評價的主要內(nèi)容,但仍存在欠缺。
3.3 療效等級模糊不清 本研究納入分析的研究在進行有效率療效判定時,分級情況存在差異,根據(jù)指標進行分級改善率也不一致,由于多篇研究療效判定標準不一致,因此無法進行詳細統(tǒng)計。425篇研究將療效分為4個等級,326篇研究將療效分為3個等級,而分為3個等級的研究是將4個等級的第2、3級合在一起,并且除量化外的指標定性方法的分界較為模糊。如1篇研究[18]將療效判定標準界定為治愈:腰痛消失,腰部功能恢復正常;顯效:腰痛明顯減輕,功能活動基本恢復;有效:腰痛有所減輕,腰部活動仍存在一定程度受限;無效:腰痛無明顯減輕甚至加重;其中治愈與無效可明確區(qū)分,顯效與有效中的腰痛明顯減輕與腰痛有所減輕和無明顯減輕區(qū)分界限不明確,因此在療效判定中可能產(chǎn)生誤差。又如1篇研究[19]將其療效判定標準界定為治愈:癥狀消失,腰部活動自如;好轉(zhuǎn):疼痛減輕,腰部活動功能基本恢復;未愈:癥狀未改善;其各等級療效判定明確,但最終計算(總)有效率為(治愈+顯效+有效)/總?cè)藬?shù)×100%或(顯效+有效)/總?cè)藬?shù)×100%,最終結(jié)果并無區(qū)分。因此,筆者認為療效等級分為3級時等級判定標準更為明確清晰。
另外,在數(shù)據(jù)提取過程中發(fā)現(xiàn),不同研究的等級療效名稱混淆不清,如1篇研究[20]將療效等級分為基本痊愈、顯效、好轉(zhuǎn)、較差,另1篇研究[21]將療效等級分為痊愈、基本痊愈、減輕、無效,可見“基本痊愈”這一定義既出現(xiàn)在一級療效又出現(xiàn)在二級療效,評判標準及定義均未統(tǒng)一,給研究者帶來困惑。
3.4 測量工具應(yīng)用不當 本研究發(fā)現(xiàn),部分納入的研究評定復合結(jié)局指標(有效率)時使用測量工具,如JOA、VAS、ODI,但其應(yīng)用存在較大問題。以本研究所納入的研究中判定復合結(jié)局指標使用最多的、國際通用的JOA為例,該評分量表的內(nèi)容包括4個維度、14個條目:主觀癥狀(下腰痛、腿痛/麻刺痛、步態(tài))、臨床體征(直腿抬高試驗、感覺障礙、運動障礙)、日?;顒邮芟薅龋ㄆ脚P翻身、站立、洗漱、前屈、坐位、舉重物、行走)、膀胱功能,研究表明其效度良好,適合評價國內(nèi)腰痛患者療效情況[22]。然而在療效分級評定中分級臨界值尚未統(tǒng)一規(guī)范,如1篇研究[23]直接以JOA評分作為療效判定標準,包括治愈:功能恢復(JOA評分>25分);有效:功能基本恢復(16分≤JOA評分≤25分),勞累后仍覺疼痛不適;無效:功能受限(JOA評分<16分)。又如1篇研究則將JOA療效指數(shù)作為療效標準,JOA療效指數(shù)=(治療后評分-治療前評分)/治療前評分×100%,以JOA療效指數(shù)≥75%、50%~74%、25%~49%、<25%分別作為臨床控制、顯效、有效、無效的標準[24]。另1篇使用JOA療效指數(shù)的研究將其以>90%、60%~90%、30%~60%、<30%分別作為治愈、顯效、有效、無效的標準[25]。由此可見,測量工具在療效上的應(yīng)用不僅存在計算方法不一致,而且進行分級判定時的臨界值也存在不一致,導致各研究之間結(jié)果存在差異。
本研究通過文獻系統(tǒng)評價總結(jié)了腰痛臨床試驗中有效率的定義,根據(jù)核心結(jié)局體系(COMET)對結(jié)局指標的檢索要求為近2年,本研究檢索近5年(2015—2019年)的文獻,最終納入830篇文獻進行分析,因此具有足夠的代表性。雖然研究僅對文獻進行描述性分析,主觀性較強,但是研究采用2名研究者背對背獨立分析,交叉對照,避免了主觀性導致的選擇性偏倚。未來將在此基礎(chǔ)上進行專家共識,確定腰痛臨床研究的有效率劃分及其內(nèi)容。
綜上所述,以上問題不僅見于慢性腰痛的臨床研究中,也常見于其他疾病的臨床研究中[26],導致臨床研究資料難以整合,不能為循證醫(yī)學研究提供高質(zhì)量的證據(jù)。目前萬穎[27]針對各種類型的慢性腰痛研究并通過兩輪德爾菲調(diào)查建立了普適的慢性腰痛中醫(yī)臨床研究核心結(jié)局指標集(COS-CBP),有效率也被納入其中。筆者認為有效率這一復合結(jié)局指標可通過COMET進一步規(guī)范并提高其效度,以提高中醫(yī)臨床研究的可行性和科學性,有利于提升臨床研究的質(zhì)量和研究結(jié)果的公認度,最大限度地發(fā)揮單項研究的價值,有利于同類研究的合并分析或橫向比較。
作者貢獻:黎霞進行原稿寫作、研究方法的設(shè)計、數(shù)據(jù)管理、繪制表格;李多多進行研究方法的設(shè)計,審查與編輯寫作;程潞瑤、萬穎進行數(shù)據(jù)提取與管理;于長禾提出主要研究目標、為研究課題提供資金支持;所有作者確認了論文的最終稿。
本文無利益沖突。
(掃描二維碼查看本文納入分析的830篇研究)