国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于COSMIN指南對中國腰痛患者羅蘭-莫里殘疾調(diào)查問卷測量性能證據(jù)的系統(tǒng)評價

2024-07-11 10:19高藝軒王錫友陳千吉楊曉明郭俊明訾一路翁志文馬敬祎章乃文劉二楊邵輝孫亞男于長禾
中國全科醫(yī)學 2024年29期
關(guān)鍵詞:內(nèi)容效度效度腰痛

高藝軒 王錫友 陳千吉 楊曉明 郭俊明 訾一路 翁志文 馬敬祎 章乃文 劉二楊 邵輝 孫亞男 于長禾

基金項目:國家自然科學基金青年科學基金項目(81803956);北京市首發(fā)青年優(yōu)才項目(2020-4-4195);首都臨床特色應用研究(Z181100001718165)

引用本文:高藝軒,王錫友,陳千吉,等. 基于COSMIN指南對中國腰痛患者羅蘭-莫里殘疾調(diào)查問卷測量性能證據(jù)的系統(tǒng)評價[J]. 中國全科醫(yī)學,2024,27(29):3672-3678. DOI:10.12114/j.issn.1007-9572.2023.0519. [www.chinagp.net]

GAO Y X,WANG X Y,CHEN Q J,et al. Roland-Morris Disability Questionnaire measurement performance evidence in Chinese patients with low back pain:a systematic review based on COSMIN guidelines[J]. Chinese General Practice,2024,27(29):3672-3678.

? Editorial Office of Chinese General Practice. This is an open access article under the CC BY-NC-ND 4.0 license.

【摘要】 背景 腰痛全球患病率逐步上升,而腰痛是致殘、病休、失業(yè)的主要原因,對個人及社會均是沉重的負擔。評估慢性腰痛患者的殘疾程度對于評價臨床干預療效和臨床流行病學至關(guān)重要。羅蘭-莫里殘疾調(diào)查問卷(RMDQ)是目前評估腰痛患者殘疾的主要工具,但其測量性能在中國人群中的適用性尚不明確。目的 評估RMDQ在中國腰痛人群中的適用性,為臨床實踐、臨床研究的應用提供證據(jù)。方法 計算機檢索中國知網(wǎng)、萬方數(shù)據(jù)知識服務平臺、中國生物醫(yī)學文獻服務系統(tǒng)、PubMed、Embase及Web of Science等,檢索時間為建庫至2023-10-01,針對腰痛量表的性能研究建立文獻庫,再從中篩選RMDQ測量性能的研究。按照健康測量工具選擇的共識標準(COSMIN)系統(tǒng)評價指南對RMDQ的測量學性能進行評價,并采用GRADE證據(jù)評價等級對證據(jù)分級。結(jié)果 共納入6篇RMDQ文獻,RMDQ內(nèi)容效度方法學質(zhì)量為不足,測量性能為充分;內(nèi)部一致性方法學質(zhì)量存在非常好與不確定,測量性能為充分;重測信度方法學質(zhì)量為不確定,測量性能為充分;測量誤差方法學質(zhì)量為不確定,測量性能為充分;校標效度方法學質(zhì)量為不確定,測量性能為不充分;假設檢驗方法學質(zhì)量存在非常好與不確定,測量性能存在充分與不確定;反應度方法學質(zhì)量存在非常好、足夠與不足,測量性能存在充分與不足。根據(jù)GRADE證據(jù)質(zhì)量評級結(jié)果表明內(nèi)容效度有低質(zhì)量證據(jù)證明不確定,重測信度及內(nèi)部一致性有中等質(zhì)量證據(jù)證明充分;測量誤差及反應度有低質(zhì)量證據(jù)證明充分;以Oswestry功能障礙指數(shù)(ODI)和視覺模擬量表(VAS)為校標時,校標效度有非常低質(zhì)量證據(jù)證明不充分;假設檢驗有中等質(zhì)量證據(jù)證明不確定。結(jié)論 RMDQ方法學質(zhì)量不高,測量性能尚可,證據(jù)質(zhì)量偏低,在中國腰痛臨床實踐或試驗中需謹慎使用,重測信度與內(nèi)部一致性雖被中等質(zhì)量證據(jù)證明充分,但研究內(nèi)容和方法不規(guī)范。將來研究應注意規(guī)范,能更準確判斷在中國人群中的適用性。

【關(guān)鍵詞】 腰痛;羅蘭-莫里殘疾調(diào)查問卷;健康測量工具選擇的共識標準;信度;效度;反應度

【中圖分類號】 R 681.55 【文獻標識碼】 A DOI:10.12114/j.issn.1007-9572.2023.0519

Roland-Morris Disability Questionnaire Measurement Performance Evidence in Chinese Patients with Low Back Pain:a Systematic Review Based on COSMIN Guidelines

GAO Yixuan1,2,WANG Xiyou2,CHEN Qianji3,YANG Xiaoming2,GUO Junming2,ZI Yilu2,WENG Zhiwen2,MA Jingyi2,ZHANG Naiwen2,LIU Eryang2,SHAO Hui2,SUN Yanan4,YU Changhe2*

1.The First Clinical Department,Beijing University of Chinese Medicine,Beijing 100700,China

2.Tuina and Pain Management Department,Beijing University of Chinese Medicine Affiliated Dongzhimen Hospital,Beijing 100700,China

3.Shenzhen Luohu District Hospital of Traditional Chinese Medicine,Shenzhen 518001,China

4.Traditional Chinese Medicine Department,Xuanwu Hospital Capital Medical University,Beijing 100053,China

*Corresponding author:YU Changhe,Attending physician;E-mail:yakno2@163.com

【Abstract】 Background The global prevalence of low back pain is gradually increasing,and it is the main cause of disability,sick leave,and unemployment,posing a heavy burden on individuals and society. Assessing the degree of disability in patients with chronic low back pain is crucial for evaluating the efficacy of clinical interventions and clinical epidemiology. The Roland-Morris Disability Questionnaire(RMDQ)is currently the main tool for evaluating disability in patients with low back pain,but the applicability of its measurement performance in the Chinese population remains unclear. Objective To evaluate the applicability of RMDQ in the Chinese population with low back pain and provide evidence for clinical practice and research application. Methods CNKI,Wanfang Data Knowledge Service Platform,SinoMed,PubMed,Embase and Web of Science were searched from inception to 2023-10-01,to establish a literature base for the performance of the low back pain scale,and then select research on the measurement performance of RMDQ from it. The measurement performance of the RMDQ scale was evaluated according to the COSMIN system evaluation guidelines,and the evidence evaluation level was used to grade the evidence. Results A total of six RMDQ documents were included,with insufficient methodological quality for RMDQ content validity and adequate measurement performance. The quality of internal consistency methodology was very good with uncertainty and measurement performance was adequate;the methodological quality of retesting was uncertain,and the measurement performance was sufficient;the methodological quality of measurement error was uncertain,and the measurement performance was sufficient;the methodological quality of criterion validity was uncertain,and the measurement performance was insufficient;hypothesis testing methodological quality was very good with uncertain,and the measurement performance was sufficient and uncertain;the quality of reactivity methodology was very good,with sufficient and insufficient,while the measurement performance was sufficient with insufficient. According to the GRADE evidence quality rating results,there is low quality evidence to prove uncertainty in content validity,and moderate quality evidence to prove sufficient retesting reliability and internal consistency;there is sufficient evidence of low quality to prove the measurement error and reactivity. There is very low quality evidence of insufficient calibration validity when using the Oswestry Dysfunction Index(ODI) and the Visual Analog Scale(VAS) as calibrators;hypothesis testing had moderate quality evidence of uncertainty. Conclusion The methodological quality of the RMDQ scale is not high,with acceptable measurement performanceand low quality of evidence,and needs to be used cautiously in clinical practice or trials of low back pain in China. Although there is sufficient evidence of moderate quality to prove the reliability and internal consistency of retesting,the research content and methods are not standardized. In future research,attention should be paid to standardization to more accurately assess its applicability in the Chinese population.

【Key words】 Low back pain;Roland-Morris Disability Questionnaire;COSMIN;Validity;Reliability;Responsiveness

腰痛全球患病率為13.1%~20.3%[1],我國患病率為6.11%~28.5%[2],腰痛是致殘、病休、失業(yè)的主要原因[3],對個人及社會均是沉重的負擔。評估慢性腰痛患者的殘疾程度對于評價臨床干預療效和臨床流行病學至關(guān)重要[4]。羅蘭-莫里殘疾調(diào)查問卷(Roland-Morris Disability Questionnaire,RMDQ)是由英國學者ROLAND和MORRIS等設計的一種問卷,是目前評估腰痛患者殘疾的主要工具[5],TSANG[6]首次評價RMDQ在中國腰痛人群的測量學性能,隨后亦有研究,但研究的方法學質(zhì)量、量表證據(jù)強度、是否適用等問題尚不清楚。測量學性能評價決定量表的準確性和可靠度,并影響結(jié)果解讀。國外對RMDQ的健康測量工具選擇的共識標準(consensus-based standards for the selection of health measurement instruments,COSMIN)研究[7]顯示其是高質(zhì)量證據(jù)證明可理解但不全面的問卷,低至非常低質(zhì)量證據(jù)證明其內(nèi)容效度,中等質(zhì)量證據(jù)證明其結(jié)構(gòu)效度。但其在中國腰痛人群的測量學性能尚不清楚。

COSMIN是通過評估患者報告結(jié)局指標測量工具研究的方法學質(zhì)量及測量工具測量學性能而制定的,目的為指導臨床研究使用適當?shù)臏y量工具,提高研究質(zhì)量[8]。COSMIN系統(tǒng)評價指南[9]對測量工具測量學性能的系統(tǒng)評價進行了詳細闡述,并指導了研究步驟。

本研究按照COSMIN系統(tǒng)評價指南對RMDQ量表的測量學性能進行評價,并采用GRADE證據(jù)評價等級對證據(jù)分級,旨在評估其在中國腰痛人群中的適用性,為臨床實踐、臨床研究的應用提供證據(jù)。

1 資料與方法

1.1 測量工具

RMDQ是從疾病影響量表(Sickness Impact Profile,SIP)中選擇了24個受腰痛特異影響的問題組成,旨在評估腰痛患者的功能狀態(tài)[5]。每個問題以“因為我的腰痛”加以限制,與其他導致功能障礙的原因區(qū)分,方便患者回答。24個問題主要涉及腰痛對坐、臥、走、自理能力與日常生活等方面的影響,每題1分,“是”為1分,“否”為0分,總分0~24分,得分越高,功能障礙程度越高[5]。

1.2 檢索策略與數(shù)據(jù)庫建立

針對腰痛量表的性能研究建立文獻庫,再從中篩選RMDQ測量性能的研究。從數(shù)據(jù)庫創(chuàng)建至2023-10-01,計算機檢索中國知網(wǎng)、萬方數(shù)據(jù)知識服務平臺、中國生物醫(yī)學文獻服務系統(tǒng)、PubMed、Embase及Web of Science,中文關(guān)鍵詞包括:(1)腰疼、腰痛、腰背痛、腿痛等;(2)中國;(3)效度、信度、反應度等測量學性能。英文關(guān)鍵詞包括:(1)back pain、low back pain;(2)China、Chinese、Hong Kong;(3)inter method comparison、data collection method、validation study、outcome measure;(4)internal consistency、reliab、valid、retest。

1.3 文獻納入與排除標準

納入標準:(1)中國腰痛人群臨床測量(包括診斷、評估和預測等)研究;(2)包括RMDQ中的9種測量性能(內(nèi)容效度、結(jié)構(gòu)效度、假設檢驗、內(nèi)部一致性、重測信度、測量誤差、標準效度、反應度及跨文化效度)至少1種研究;(3)可獲取全文。排除將RMDQ用于另一種工具測量性能研究(如選擇RMDQ作為對比量表以評價PSEQ結(jié)構(gòu)效度的研究)。

1.4 文獻篩選與數(shù)據(jù)提取

2位研究人員獨立排除無關(guān)研究,再檢索保留文獻全文內(nèi)容,按照納入及排除標準對全文數(shù)據(jù)提取,結(jié)果如有不同,雙方進行協(xié)商,若仍不同則由第三方仲裁。每項研究應提取樣本量、性別、年齡、地區(qū)、語言、疾病特征、填寫RMDQ的場景以及測量性能的研究結(jié)果與統(tǒng)計學方法等。

1.5 評價流程

COSMIN對量表的系統(tǒng)評價分為3個部分、10個步驟(圖1):第一部分文獻檢索,步驟1~4,內(nèi)容為明確評價目的、制定納排標準、實施文獻檢索、獲取與篩選。第二部分評價測量性能,步驟5~7,內(nèi)容為評價內(nèi)容效度、內(nèi)部結(jié)構(gòu)和其他測量性能。其中包含對研究偏倚風險、測量性能優(yōu)劣的評價及結(jié)果匯總,后運用GRADE系統(tǒng)形成推薦等級。第三部分選擇量表,步驟8~10,內(nèi)容是描述可解釋性和可行性、形成量表推薦意見。

1.5.1 研究的方法學質(zhì)量評價:按照“COSMIN偏倚風險清單”[10]進行評價,結(jié)果有“非常好”“足夠”“不確定”或“不足”。每項研究質(zhì)量的總分按框中條目的最低分給出。如果多種測量性能在一項研究中,則每種測量性能均需進行評價。

圖1 COSMIN研究

Figure 1 COSMIN study

1.5.2 測量性能的評價順序:首先評價量表開發(fā)質(zhì)量及內(nèi)容效度。內(nèi)容效度在測量性能中至關(guān)重要[11],先排除內(nèi)容效度不足的研究。后評價內(nèi)部結(jié)構(gòu),如內(nèi)部一致性、結(jié)構(gòu)效度等。最后考慮其他測量性能,如重測信度、反應度等。

1.5.3 測量性能的評價:內(nèi)容效度評價按照“內(nèi)容效度10條評價標準”[11],評價結(jié)果為充分(+)、不足(-)或不確定(?)。根據(jù)“單個研究內(nèi)容效度評級指南及評定指南”進行評價,結(jié)果為充分(+)、不足(-)、不一致(±)或不確定(?)。其他測量性能根據(jù)“更新測量性能優(yōu)劣評價標準”[12-13]將測量性能評價為充分(+)、不足(-)或不確定(?)。

1.5.4 證據(jù)綜合與證據(jù)質(zhì)量分級:評判每個測量特性可用研究結(jié)果的一致性。結(jié)果一致時,可對結(jié)果進行定量匯總或定性總結(jié),并與測量特性的良好標準進行比較,來確定量表的測量特性總體上是充分(+)、不足(-)、不一致(±)還是不確定(?);如果結(jié)果不一致,可用亞組分析或根據(jù)大多數(shù)一致的結(jié)果得出結(jié)論,并按照不一致性降低證據(jù)質(zhì)量。

COSMIN應用“改進GRADE證據(jù)質(zhì)量評級”標準[14],標準包含:偏倚風險[15]、不一致性、不精確性及間接性。研究質(zhì)量可根據(jù)以上標準進行降級。

2 結(jié)果

2.1 納入研究一般情況

共檢索到4 731篇文獻,1 394篇文獻因重復被刪除,3 179篇文獻因閱讀題目摘要后不相關(guān)被刪除,最后158篇文獻被納入數(shù)據(jù)庫。全文瀏覽后,11篇RMDQ量表測量性能研究被納入,其中2篇無法獲得全文與3篇重復的研究(2篇畢業(yè)論文與2篇中文文獻為同一研究,1篇英文文獻與1篇中文文獻為相同研究)被排除在外,最終納入文獻6篇[4-6,16-18]。文獻檢索流程圖見圖2,納入文獻基本情況見表1。

注:SinoMed=中國生物醫(yī)學文獻服務系統(tǒng)。

圖2 文獻檢索流程圖

Figure 2 Literature retrieval flow chart

表1 納入文獻基本情況

Table 1 Basic information of the included literature

第一作者 發(fā)表時間(年) RMDQ版本 總樣本量(例) 平均年齡(歲) 性別

(男/女) 疾病

特點

YAO[4] 2020 中文版 353 50.53 156/197 LDH

FAN[16] 2012 簡體中文版 116 52.17 69/47 LBP

YI[17] 2012 簡體中文版 187 41.30 94/93 LBP

高明暄[18] 2005 中文版 57 43.6 34/23 LBP

何高[5] 2005 中文版 435 42.5 298/137 LBP

TSANG[6] 2004 香港中文版 112 41.6 48/64 LBPa

注:RMDQ=羅蘭-莫里殘疾調(diào)查問卷,LDH=腰椎間盤突出癥,LBP=腰痛;a包括坐骨神經(jīng)痛。

2.2 納入研究的方法學質(zhì)量評價

2.2.1 內(nèi)容效度:何高[5]研究中僅提及采用專家審定方法對內(nèi)容效度進行評價,缺少必要的方法學描述。TSANG[6]對各條目認可比例、區(qū)分度和修正項的合計相關(guān)系數(shù)來評價內(nèi)容效度。根據(jù)COSMIN標準,需有相關(guān)領(lǐng)域?qū)<以u價及數(shù)據(jù)的處理和方法,兩項研究各有欠缺,故評為不足。

2.2.2 內(nèi)部一致性:YAO等[4]、高明暄等[18]及YI等[17]研究僅分析了總量表的克隆巴赫系數(shù),缺少單獨條目的分析,故均評為不確定。何高[5]與FAN等[16]分析了總量表及單獨條目的克隆巴赫系數(shù),評為非常好。TSANG[6]將KR20系數(shù)大小作為對內(nèi)部一致性的評估,KR20系數(shù)被看作是克隆巴赫系數(shù)的特殊形式,因此評為非常好。

2.2.3 重測信度:YAO等[4]、何高[5]、TSANG[6]、高明暄等[18]均未說明2次填寫量表的環(huán)境,無法判斷兩次填寫條件的相似性;FAN等[16]缺少對納入患者干預的描述,無法判斷2次填寫時間間隔的合適性及期間內(nèi)待測結(jié)構(gòu)是否穩(wěn)定;YI等[17]患者2次填寫時間間隔為24 h,考慮間隔時間不合適,且未說明2次填寫的環(huán)境,以上研究均評為不確定。

2.2.4 測量誤差:YAO等[4]研究未描述2次量表填寫的條件,無法評價,故評為不確定。

2.2.5 校標效度:何高[5]研究以Oswestry功能障礙指數(shù)(Oswestry Disability Index,ODI)和視覺模擬量表(Visual Analogue Scale,VAS)為校標,采用Spearman秩相關(guān)系數(shù)對294例患者進行評估,但目前沒有統(tǒng)一的腰痛金標準量表,因此研究質(zhì)量評為不確定。

2.2.6 假設檢驗:YAO等[4]分別以日本骨科協(xié)會腰痛評分量表(Japanese Orthopaedic Association,JOA)5個問題、數(shù)字疼痛評定量表(Numerical Pain Rating Scale,NPRS)、ODI、36項健康調(diào)查簡表(Short Form 36 Health Survey,SF-36)為對比工具評價聚合效度,但未提供對比工具測量性能相關(guān)證據(jù)被評為不確定。何高[5]提出兩種理論假設,使用配對性t檢驗來測量樣本,假設與理論一致,評為非常好。

2.2.7 反應度:YAO等[4]、TSANG[6]均采用曲線下面積(area under the curve,AUC)評估反應度,YAO等[4]通過亞組間數(shù)據(jù)統(tǒng)計分析評價,描述了亞組重要特征、統(tǒng)計方法合適且研究設計無重要缺陷,評為非常好。TSANG[6]未具體描述使用的標準,評為足夠。何高[5]用標準化反應均數(shù)(standardized response mean,SRM)評估反應度,未充分描述統(tǒng)計方法,評為足夠。

研究缺少對RMDQ跨文化和結(jié)構(gòu)效度的評價

(表2)。

2.3 量表測量學性能及其評價

2.3.1 內(nèi)容效度:何高[5]研究包含了與腰痛密切的內(nèi)容,專家評審為內(nèi)容效度良好。TSANG[6]研究除個別條目,RMDQ項目的認可比例均在0.20~0.80;條目區(qū)分度指數(shù)為0.30~0.73;條目的二序相關(guān)點為0.31~0.68;故內(nèi)容效度良好。二者研究均可看作專業(yè)人員對其內(nèi)容效度進行評價,但評價方法不符合COSMIN標準,評為不

確定。

2.3.2 內(nèi)部一致性:5項研究[4-5,16-18]克朗巴赫系數(shù)均>0.7,分別為0.807、0.840、0.874(城市)/0.883(農(nóng)村)、0.885、0.826;TSANG[6]研究的KR20系數(shù)為0.86,說明內(nèi)部一致性皆良好,評為充分。

2.3.3 重測信度:6項研究[4-6,16-18]組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)結(jié)果分別為0.855、0.947、0.952(城市組)/0.949(農(nóng)村組)、0.950、0.945、0.910,均>0.7,評為充分。

2.3.4 測量誤差:YAO等[4]計算標準測量誤差(standard error of mean,SEM)結(jié)果為0.28、最小可檢測差異

(smallest detectable change,SDC)結(jié)果為0.77、最小臨床重要變化(minimum important change,MIC)結(jié)果為1.74,根據(jù)SDC小于MIC,評為充分。

2.3.5 校標效度:何高[5]以ODI和VAS為校標,Spearman秩相關(guān)系數(shù)為0.3~0.5,<0.7,故評為不充分。

2.3.6 假設檢驗:YAO等[4]研究中,RMDQ與JOA問題1~5、NPRS、ODI、SF-36的相關(guān)系數(shù)為-0.76~0.74,研究中未提出具體假設或相關(guān)標準描述,故評為不確定。何高[5]研究基于兩種理論假設:1周內(nèi)打算或已看過醫(yī)生的腰痛患者其功能障礙情況應該比沒有看過或打算來看醫(yī)生的患者的功能障礙情況更重;1周內(nèi)需要吃藥的腰痛患者其功能障礙情況應該比沒有吃過藥的患者的功能障礙情況更重。研究配對t檢驗結(jié)果顯示1周內(nèi)接受看醫(yī)或吃藥的患者的功能障礙情況更重。假設與理論一致,評為充分。

2.3.7 反應度:YAO等[4]研究的AUC結(jié)果為0.868,評為充分。何高[5]用SRM評估反應度,SRM值為0.7~0.9,反應度較好,評為充分。TSANG[6]研究的AUC結(jié)果較為多變,不同標準下結(jié)果為0.67~0.84,評為不充分。

無研究評價RMQD量表的跨文化、結(jié)構(gòu)效度(表2)。

2.4 證據(jù)綜合與證據(jù)質(zhì)量分級

研究采用GRADE證據(jù)評價等級對證據(jù)進行分級。YAO等[4]、高明暄等[18]、何高[5]中文版與FAN等[16]、YI等[17]簡體中文版及TSANG[6]香港中文版的量表內(nèi)容差異不大,故綜合了這6篇研究證據(jù)。

GRADE證據(jù)綜合與證據(jù)質(zhì)量評級結(jié)果顯示:RMDQ內(nèi)容效度不確定,因偏倚風險嚴重降級為低質(zhì)量;結(jié)構(gòu)效度無相關(guān)研究;內(nèi)部一致性充分,證據(jù)等級因偏倚風險嚴重降級為中等質(zhì)量;重測信度充分,證據(jù)等級因偏倚風險嚴重降級為中等質(zhì)量;測量誤差充分,證據(jù)等級因偏倚風險非常嚴重降級為低質(zhì)量;以VAS為校標的研究,其結(jié)果校標效度不充分,證據(jù)等級因偏倚風險非常嚴重及結(jié)果不精確嚴重降級為非常低質(zhì)量;假設檢驗不確定,證據(jù)等級因偏倚風險嚴重降級為中等質(zhì)量;反應度充分,證據(jù)等級因偏倚風險非常嚴重降級為低質(zhì)量。所有研究證據(jù)在不一致性、不準確性及間接性三個方面良好,均不存在降級情況(表3)。

3 討論

本研究采用COSMIN標準對RMDQ在中國人群中方法學質(zhì)量與測量性能進行評價。綜合評價結(jié)果來看,內(nèi)容效度和反應度呈低質(zhì)量,且缺少結(jié)構(gòu)效度證據(jù),盡管信度的測量學性能較為充分,但目前研究存在嚴重偏倚風險,RMDQ臨床應用的結(jié)果和解讀需要謹慎。

內(nèi)容效度是最重要的測量學性能。條目是量表、反映預期概念的基本單元,其內(nèi)容和質(zhì)量直接影響量表的內(nèi)容效度。因此,COSMIN首先評價量表的內(nèi)容效度,包括相關(guān)人群(專家與受試者)的定性或定量研究、對量表相關(guān)性、全面性及可理解性全方位評價。本研究中兩篇文獻一是缺少數(shù)據(jù)的處理和方法,一是未說明進行評價的是否為專家,故兩項研究的質(zhì)量評價為不足。

效標效度是對結(jié)構(gòu)效度和內(nèi)容效度的補充,當“金標準”有異議時,校標效度和聚合效度將變得難以區(qū)分。本研究中效標效度的證據(jù)質(zhì)量非常低,測量性能不充分,主要表現(xiàn)為與ODI和VAS校標的相關(guān)性低,降低了證據(jù)質(zhì)量。目前并沒有統(tǒng)一的腰痛金標準量表,ODI是功能障礙量表,病情程度相對比RMDQ要輕,若作為效標或金標準是不完全合適的;VAS僅評價了疼痛,而RMDQ不僅針對疼痛,若作為效標亦是不合適的。

假設檢驗是先對總體特征做出某種假設,通過抽樣研究的統(tǒng)計推理,對此假設應該被拒絕還是接受做出推斷,來驗證總體的特征。在研究中應明確給出假設,選取與其測量內(nèi)涵相同/相似或不相同的量表,說明兩者的關(guān)系是正/負相關(guān)性及相關(guān)程度等,而且選擇的量表應該本身具有較為充分的測量學性能,并提供相關(guān)證據(jù)。YAO等[4]僅提出RMDQ與JOA、NPRS、ODI、SF-36具有相關(guān)性的假設,但缺少具體假設或相關(guān)標準描述,評價為中等質(zhì)量的不確定。何高[5]研究給出了明確假設,通過檢驗證實假設與理論一致,評為充分。此項測量性能存在非常好與不確定兩種情況,存在偏倚,被評價為中等質(zhì)量。

信度是反映測驗結(jié)果受到隨機誤差影響程度的指標,其與效度的關(guān)系是必要但不充分。RMDQ信度證據(jù)均為中等質(zhì)量,其中內(nèi)部一致性為中等質(zhì)量,測量性能充分,方法學部分因其未計算每一條目的內(nèi)部一致性系數(shù)從而存在偏倚,降低了證據(jù)質(zhì)量;重測信度亦為中等質(zhì)量,測量性能充分,但無法判斷兩次填寫條件的相似性、兩次填寫時間間隔的合適性及在這期間內(nèi)待測結(jié)構(gòu)是否穩(wěn)定,使得證據(jù)質(zhì)量降低。在以后的研究中應注意重測間隔時間、地點及其他條件是否合適,以提高重測信度的質(zhì)量。

反應度指量表反映微小特性變化的能力,是對效度進一步的評價。反應度根據(jù)變化程度和是否有臨床意義分為SDC和MIC,前者只要求量表最小評分發(fā)生變化,無論臨床是否有意義;后者強調(diào)量表最小評分變化要有臨床意義,量表的可解釋性屬于后者。RMDQ反應度被判定為低質(zhì)量,測量性能有充分與不充分兩種不一致的結(jié)果,方法學存在差異,使結(jié)果發(fā)生偏倚降低了證據(jù)質(zhì)量。同時也提示RMDQ量表在反映患者治療效果上存在著不足。

整體來看,RMDQ量表的信度比效度具有高證據(jù)質(zhì)量。信度是反映測量結(jié)果的一致性和穩(wěn)定性程度,效度是反映實際能測出的有效程度。信度是效度的必要但不充分條件,無信度必然無效度,但有信度未必有效度;效度是信度的充分但不必要條件,有效度必然會有信度,但無效度卻未必無信度。RMDQ效度證據(jù)質(zhì)量低或缺失,說明其在中國腰痛人群中的適用性有待提高。盡管RMDQ為國際公認通用量表,但并不能說明其可以很好應用于中國臨床。研究也指出RMDQ量表是一個可理解但不全面的量表,其內(nèi)容效度證據(jù)呈低至極低質(zhì)量[7],本研究結(jié)果與之相同。

研究結(jié)果顯示方法學質(zhì)量普遍較低,統(tǒng)計方法與研究設計選擇不當、分析不足、樣本量不夠等會降低質(zhì)量。納入6篇文獻共涉及3個RMDQ版本,且為RMDQ英文翻譯版,但缺少RMDQ跨文化效度研究,那么對于不同版本便有不同的翻譯方式,可能會使RMDQ量表在某些問題上產(chǎn)生理解偏差從而導致結(jié)果發(fā)生偏倚。同時也提示當前沒有統(tǒng)一的中文版RMDQ量表??缥幕Ф妊芯啃柙谖幕{(diào)適的基礎上再進行結(jié)構(gòu)效度的評價,評價時應選用兩組樣本,除了語言的差異外,應控制其余人群特征(如年齡、性別、疾病特點等)的一致。

本研究也存在著很多不足之處,納入文獻使用的量表沒有全部獲取,納入評價的文獻數(shù)量較少,也沒有比較和分析各版本間的差異,從而具有局限性。COSMIN系統(tǒng)評價指南于2005年發(fā)布,但研究納入文獻有3篇發(fā)表于2010年或更早,其研究方法學質(zhì)量按照較新標準進行評價存在爭議,因此研究評價的結(jié)果可能存在偏倚。在此后的研究中應當獲取所有納入文獻的量表,對其進行比較;此外應盡量納入發(fā)布于2010年之后的文獻,以減少爭議。量表性能測量的研究設計、研究方法等應更標準、詳細。還應結(jié)合中國實際情況,改進量表,得到適用于中國本土腰痛患者評估殘疾的量表。測量學性能是一個不斷累積的過程,而且隨著文化、語言、年代、測量方式、人群認識概念、目標人群特點或者疾病譜等的變化而不斷增加新的證據(jù)[19];美國食品藥品監(jiān)督管理局(FDA)也指出量表的研制和修改是一個不斷增加證據(jù)、非線性輪狀的過程[20]。

4 小結(jié)

RMDQ方法學質(zhì)量不高,測量性能尚可,證據(jù)質(zhì)量偏低,在中國腰痛臨床實踐或試驗中需謹慎使用,重測信度與內(nèi)部一致性雖被中等質(zhì)量證據(jù)證明充分,但研究內(nèi)容和方法不規(guī)范。將來研究應注意規(guī)范,能更準確判斷在中國人群中的適用性。

作者貢獻:高藝軒進行文章撰寫,文獻篩選;王錫友、孫亞男提供指導性支持;陳千吉進行文獻篩選;楊曉明、郭俊明、劉二楊、邵輝負責文章內(nèi)容、質(zhì)量評價校對;訾一路、翁志文、馬敬祎、章乃文負責方法學質(zhì)量評價;于長禾負責方法學設計與文章質(zhì)量監(jiān)控,對論文負責。

本文無利益沖突。

參考文獻

MEUCCI R D,F(xiàn)ASSA A G,F(xiàn)ARIA N M X. Prevalence of chronic low back pain:systematic review[J]. Rev Saude Publica,2015,49:1. DOI:10.1590/S0034-8910.2015049005874.

陳棟,陳春慧,胡志超,等. 中國成人腰痛流行病學的系統(tǒng)評價[J]. 中國循證醫(yī)學雜志,2019,19(6):651-655. DOI:10.7507/1672-2531.201801044.

GBD Disease and Injury Incidence and Prevalence Collaborators. Global,regional,and national incidence,prevalence,and years lived with disability for 328 diseases and injuries for 195 countries,1990-2016:a systematic analysis for the Global Burden of Disease Study 2016[J]. Lancet,2017,390(10100):1211-1259. DOI:10.1016/S0140-6736(17)32154-2.

YAO M,XU B P,LI Z J,et al. A comparison between the low back pain scales for patients with lumbar disc herniation:validity,reliability,and responsiveness[J]. Health Qual Life Outcomes,2020,18(1):175. DOI:10.1186/s12955-020-01403-2.

何高. 中文版RMDQ下腰痛量表的研制[D]. 合肥:安徽醫(yī)科大學,2005.

TSANG R C C. Measurement properties of the Hong Kong Chinese version of the roland-morris disability questionnaire[J]. Hong Kong Physiother J,2004,22(1):40-49. DOI:10.1016/S1013-7025(09)70049-1.

CHIAROTTO A,OSTELO R W,BOERS M,et al. A systematic review highlights the need to investigate the content validity of patient-reported outcome measures for physical functioning in patients with low back pain[J]. J Clin Epidemiol,2018,95:73-93. DOI:10.1016/j.jclinepi.2017.11.005.

MOKKINK L B,PRINSEN C A,BOUTER L M,et al. The COnsensus-based Standards for the selection of health Measurement INstruments(COSMIN)and how to select an outcome measurement instrument[J]. Braz J Phys Ther,2016,20(2):105-113. DOI:10.1590/bjpt-rbf.2014.0143.

PRINSEN C A C,MOKKINK L B,BOUTER L M,et al. COSMIN guideline for systematic reviews of patient-reported outcome measures[J]. Qual Life Res,2018,27(5):1147-1157. DOI:10.1007/s11136-018-1798-3.

MOKKINK L B,DE VET H C W,PRINSEN C A C,et al. COSMIN Risk of Bias checklist for systematic reviews of Patient-Reported Outcome Measures[J]. Qual Life Res,2018,27(5):1171-1179. DOI:10.1007/s11136-017-1765-4.

TERWEE C B,PRINSEN C A C,CHIAROTTO A,et al. COSMIN methodology for evaluating the content validity of patient-reported outcome measures:a Delphi study[J]. Qual Life Res,2018,27(5):1159-1170. DOI:10.1007/s11136-018-1829-0.

PRINSEN C A C,VOHRA S,ROSE M R,et al. How to select outcome measurement instruments for outcomes included in a “Core Outcome Set” - a practical guideline[J]. Trials,2016,17(1):1-10. DOI:10.1186/s13063-016-1555-2.

TERWEE C B,BOT S D M,DE BOER M R,et al. Quality criteria were proposed for measurement properties of health status questionnaires[J]. J Clin Epidemiol,2007,60(1):34-42. DOI:10.1016/j.jclinepi.2006.03.012.

GRADE. GRADE Handbook-Handbook for grading the quality of evidence and the strength of recommendations using the GRADE approach[EB/OL].[2023-03-13]. https://gdt.gradepro.org/app/handbook/handbook.html.

TERWEE C B,MOKKINK L B,KNOL D L,et al. Rating the methodological quality in systematic reviews of studies on measurement properties:a scoring system for the COSMIN checklist[J]. Qual Life Res,2012,21(4):651-657. DOI:10.1007/s11136-011-9960-1.

FAN S W,HU Z A,HONG H,et al. Cross-cultural adaptation and validation of simplified Chinese version of the Roland-Morris Disability Questionnaire[J]. Spine,2012,37(10):875-880. DOI:10.1097/BRS.0b013e31823b0460.

YI H L,JI X R,WEI X Z,et al. Reliability and validity of simplified Chinese version of Roland-Morris questionnaire in evaluating rural and urban patients with low back pain[J]. PLoS One,2012,7(1):e30807. DOI:10.1371/journal.pone.0030807.

高明暄,劉興炎. 中文版Roland-Morris腰痛失能問卷可靠性評定[J]. 實用醫(yī)學雜志,2005,21(24):2755-2756. DOI:10.3969/j.issn.1006-5725.2005.24.015.

REEVE B B,WYRWICH K W,WU A W,et al. ISOQOL recommends minimum standards for patient-reported outcome measures used in patient-centered outcomes and comparative effectiveness research[J]. Qual Life Res,2013,22(8):1889-1905. DOI:10.1007/s11136-012-0344-y.

Department of Health and Human Services FDA Center for Drug Evaluation and Research U S,Department of Health and Human Services FDA Center for Biologics Evaluation and Research U S,Department of Health and Human Services FDA Center for Devices and Radiological Health U S. Guidance for industry:patient-reported outcome measures:use in medical product development to support labeling claims:draft guidance[J]. Health Qual Life Outcomes,2006,4:79. DOI:10.1186/1477-7525-4-79.

(收稿日期:2023-07-14;修回日期:2023-11-28)

(本文編輯:賈萌萌)

猜你喜歡
內(nèi)容效度效度腰痛
腰痛這個僅次于感冒的第二大常見病癥怎么處理
妊娠期腰痛的研究進展
COSMIN方法介紹:評價患者報告結(jié)局測量工具內(nèi)容效度的評分系統(tǒng)
慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
職業(yè)腰痛早防治
英語專八閱讀理解部分內(nèi)容效度的歷時對比研究(2009—2017年)
被看重感指數(shù)在中國大學生中的構(gòu)念效度
大學英語新四級閱讀理解內(nèi)容效度研究
外語形成性評估的效度驗證框架
江西省高考英語閱讀理解測試內(nèi)容效度研究