王一鷗 錢文偉 朱詩(shī)白 陳曦 李?yuàn)櫮?/p>
(中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院北京協(xié)和醫(yī)院骨科,北京 100730)
人工膝關(guān)節(jié)置換術(shù)作為終末期膝關(guān)節(jié)病變的一種有效治療手段,至今已有超過(guò)五十年的歷史。隨著肥胖、人口老齡化等問(wèn)題的加劇,以及人們對(duì)生活質(zhì)量需求的提高,全球范圍內(nèi)人工膝關(guān)節(jié)置換術(shù)的手術(shù)量逐年遞增。據(jù)統(tǒng)計(jì)我國(guó)2019年人工膝關(guān)節(jié)置換手術(shù)量已超過(guò)39 萬(wàn)例,且仍保持著超過(guò)27%的年增長(zhǎng)率[1]。面對(duì)手術(shù)量的迅速增長(zhǎng),手術(shù)療效的滿意度卻仍維持在81%~89%[2-4]。提高手術(shù)療效和患者術(shù)后滿意度首先需要合適的工具評(píng)價(jià)手術(shù)療效,本文將對(duì)人工膝關(guān)節(jié)置換術(shù)后療效評(píng)價(jià)工具進(jìn)行探討。
假體生存分析包括假體生存時(shí)間、翻修率等指標(biāo),是人工關(guān)節(jié)置換手術(shù)發(fā)展早期階段最主要的評(píng)價(jià)指標(biāo),也是目前用于臨床研究和關(guān)節(jié)登記系統(tǒng)的重要結(jié)局指標(biāo)。隨著假體設(shè)計(jì)的革新、材料學(xué)的發(fā)展,手術(shù)技術(shù)的進(jìn)步,文獻(xiàn)及國(guó)家關(guān)節(jié)登記系統(tǒng)報(bào)道的全膝關(guān)節(jié)假體15年生存率已經(jīng)超過(guò)93%[5],但術(shù)后滿意度并未獲得相應(yīng)的提升。說(shuō)明假體生存分析的數(shù)據(jù)只評(píng)價(jià)了假體在位情況,但卻忽略了患者的疼痛緩解和功能改善情況。除此之外,翻修率等作為針對(duì)人群的遠(yuǎn)期療效指標(biāo),并不適用于評(píng)價(jià)接受關(guān)節(jié)置換手術(shù)個(gè)體不同時(shí)間節(jié)點(diǎn)的療效。
醫(yī)師評(píng)價(jià)工具的出現(xiàn)標(biāo)志著早期關(guān)注點(diǎn)從假體生存率到患者療效的轉(zhuǎn)變。因?yàn)樾枰舍t(yī)師進(jìn)行測(cè)評(píng),故這些指標(biāo)絕大多數(shù)都是具有明確標(biāo)準(zhǔn)的客觀指標(biāo),如關(guān)節(jié)活動(dòng)度(range of motion,ROM)、穩(wěn)定度、關(guān)節(jié)畸形矯正程度等。這些指標(biāo)與衡量疼痛和功能的問(wèn)題組合在一起,發(fā)展形成了1973 年的特種外科醫(yī)院評(píng)分(Hospital for Special Surgery score,HSS)[6]、1989 年的美國(guó)膝關(guān)節(jié)協(xié)會(huì)評(píng)分(Knee Society Score,KSS)[7]等醫(yī)師評(píng)價(jià)量表,是目前人工膝關(guān)節(jié)置換手術(shù)常用的療效評(píng)價(jià)工具[8]。
但Lingard 等[9]認(rèn)為KSS 量表存在內(nèi)容效度缺陷。即醫(yī)師評(píng)價(jià)工具均由醫(yī)師制定和評(píng)價(jià),而患者未參與問(wèn)卷?xiàng)l目的制定和篩選。由于醫(yī)師與患者對(duì)療效的認(rèn)識(shí)和關(guān)注點(diǎn)存在差異,致使評(píng)價(jià)的內(nèi)容具有很強(qiáng)的醫(yī)師主觀性,可能無(wú)法直接而準(zhǔn)確地反映患者真正的需求[10]。有研究顯示TKA術(shù)后ROM、HSS評(píng)分和KSS 評(píng)分結(jié)果與患者對(duì)療效的滿意度之間并不具有較強(qiáng)相關(guān)性[11-13]。
早期醫(yī)師評(píng)價(jià)工具編撰的過(guò)程中未對(duì)測(cè)量屬性引起足夠重視,導(dǎo)致部分工具不同程度上存在信度、效度和反應(yīng)度的不足,影響最終結(jié)果的準(zhǔn)確性。No?ble等[14]的研究發(fā)現(xiàn)KSS評(píng)分中醫(yī)師評(píng)價(jià)部分并不具有良好的內(nèi)部一致性。這意味著KSS 評(píng)分的總分不具有明確的意義,只適合以單獨(dú)問(wèn)題的形式使用。Ghanem等[15]在研究中舉過(guò)一個(gè)例子:一位不伴疼痛、膝關(guān)節(jié)嚴(yán)重強(qiáng)直但對(duì)線良好的患者和一位伴有輕度疼痛、輕度內(nèi)翻但膝關(guān)節(jié)ROM 良好的患者可以獲得同樣的KSS總分,但二者日常生活的困難程度完全不同。另外傳統(tǒng)量表制定所針對(duì)的人群和當(dāng)今接受關(guān)節(jié)置換的人群已大為不同,更多病變和畸形輕、年輕活躍并且有更高功能需求的患者意味著傳統(tǒng)量表的內(nèi)容已不足以評(píng)價(jià)當(dāng)今接受關(guān)節(jié)置換患者的需求,顯示出嚴(yán)重的天花板效應(yīng)。
近些年來(lái),越來(lái)越多的學(xué)者意識(shí)到醫(yī)師評(píng)價(jià)工具的這些弊端。2005~2019年間,在發(fā)表的涉及全膝關(guān)節(jié)置換術(shù)療效評(píng)價(jià)的文章中,使用KSS評(píng)分的文章占比從2005 年的55.2%下降至2019 年的35.4%[16,17]。同時(shí),針對(duì)這些不足美國(guó)膝關(guān)節(jié)外科協(xié)會(huì)在2011 年編撰了更多基于患者自評(píng)的新KSS 評(píng)分[14]。對(duì)于單獨(dú)使用傳統(tǒng)醫(yī)師評(píng)價(jià)工具作為療效評(píng)價(jià)指標(biāo),研究者應(yīng)當(dāng)更加謹(jǐn)慎。
為了更精準(zhǔn)的評(píng)估患者功能情況,基于患者表現(xiàn)的功能評(píng)價(jià)工具逐漸得到發(fā)展。Dobson 等[18]將其定義為由評(píng)價(jià)者觀測(cè)到受試者完成,如步行、坐立、上下臺(tái)階等指定活動(dòng)時(shí)的各項(xiàng)指標(biāo),通常是時(shí)間、數(shù)量和距離等客觀定量參數(shù)??梢钥醋麽t(yī)師評(píng)價(jià)工具中的特殊類型。常用的包括六分鐘步行試驗(yàn)、坐立試驗(yàn)等。
近年來(lái),隨著傳感器、步態(tài)分析、人工智能等技術(shù)的發(fā)展,智能設(shè)備在功能評(píng)價(jià)中越來(lái)越得到重視。尤其是配備傳感器的3D 步態(tài)分析技術(shù),通過(guò)收集指定活動(dòng)下的時(shí)空步態(tài)、運(yùn)動(dòng)學(xué)、動(dòng)力學(xué)等參數(shù)定量評(píng)價(jià)患者的功能情況。相比于傳統(tǒng)工具測(cè)量,具有更高的靈敏度,可以識(shí)別更細(xì)微的功能改變。同時(shí),得到的數(shù)據(jù)更為全面且?guī)缀鯖](méi)有天花板效應(yīng)[19]。另外,對(duì)于患者而言,這些測(cè)量工具幾乎不存在語(yǔ)言和文化理解障礙。
與醫(yī)師評(píng)價(jià)工具相同,基于患者表現(xiàn)的功能評(píng)價(jià)工具的結(jié)果無(wú)法直接反映患者的滿意度,并且在內(nèi)容效度上的不足更為嚴(yán)重。首先,這些工具只有功能這個(gè)單一維度的評(píng)價(jià),而沒(méi)有測(cè)量疼痛、生活質(zhì)量等其他與療效相關(guān)的重要維度。另外,由于時(shí)間和客觀條件等限制,測(cè)試的內(nèi)容通常只包含一個(gè)動(dòng)作,而缺乏諸如下蹲、上下樓梯等其他在日常生活中重要的活動(dòng)。另一方面是生態(tài)學(xué)效度的不足,患者在醫(yī)院里完成這些任務(wù)的表現(xiàn)與真實(shí)世界中的表現(xiàn)可能存在差異[20]。除此之外,在實(shí)踐過(guò)程中,完成測(cè)試通常相當(dāng)耗時(shí)且需要額外經(jīng)過(guò)培訓(xùn)的評(píng)價(jià)者在場(chǎng),如使用步態(tài)分析等還需要額外的設(shè)備和場(chǎng)地,這些均限制了基于患者表現(xiàn)的評(píng)價(jià)工具的推廣和普及。
由于內(nèi)容效度和生態(tài)學(xué)效度的不足,以及人力物力的需求,基于患者表現(xiàn)的功能評(píng)價(jià)工具并不適用于廣泛?jiǎn)为?dú)地應(yīng)用于膝關(guān)節(jié)置換術(shù)后患者療效的評(píng)價(jià),但因其可以獲得直觀、精確、可靠的數(shù)據(jù),在探索人體和關(guān)節(jié)假體的運(yùn)動(dòng)學(xué)、假體磨損模式等研究中會(huì)扮演越來(lái)越重要的作用。
患者自評(píng)工具是指在沒(méi)有醫(yī)師等其他外部評(píng)價(jià)者干預(yù)的情況下,由患者直接自評(píng)的健康狀況,通常以量表的形式呈現(xiàn)。根據(jù)關(guān)注點(diǎn)的不同,可將患者自評(píng)量表分為反映患者整體健康狀況和生活質(zhì)量的通用型量表和關(guān)注患者特定疾病、癥狀、特殊解剖部位的特異性量表。
患者自評(píng)量表可以更加準(zhǔn)確地評(píng)價(jià)患者關(guān)注的因素,真正從患者的角度評(píng)價(jià)手術(shù)療效[21]。人工膝關(guān)節(jié)置換術(shù)作為一個(gè)擇期手術(shù),目的是通過(guò)減輕關(guān)節(jié)疼痛,改善關(guān)節(jié)長(zhǎng)期功能,提高患者生活質(zhì)量[22]。疼痛、滿意度、生活質(zhì)量等這類主觀性指標(biāo),患者自評(píng)無(wú)疑是金標(biāo)準(zhǔn)。而對(duì)于功能等指標(biāo),也包含著主觀因素,相比于ROM和完成特定動(dòng)作所需時(shí)間,患者認(rèn)為的困難程度更能直接地反映疾病對(duì)個(gè)體功能的影響以及術(shù)后的改善[23]。
其次,患者自評(píng)量表的結(jié)果完全由患者本人評(píng)價(jià)得到,可以最大程度地減少醫(yī)師等其他外部評(píng)價(jià)人員帶來(lái)的偏倚。醫(yī)師在評(píng)價(jià)時(shí)或多或少地會(huì)摻雜自己的理解、經(jīng)驗(yàn)以及目的,導(dǎo)致不同醫(yī)師間的評(píng)價(jià)標(biāo)準(zhǔn)存在差異。另外,在整個(gè)術(shù)前到術(shù)后隨訪過(guò)程中,完全由患者本人評(píng)價(jià)可以最大程度的保持評(píng)價(jià)標(biāo)準(zhǔn)的一致性。除此之外,患者自評(píng)工具的使用不受時(shí)間和空間的限制,且隨著信息技術(shù)的發(fā)展,患者可以通過(guò)互聯(lián)網(wǎng)等方式完成量表的填寫(xiě),減少術(shù)后隨訪的人力物力成本。
對(duì)于患者自評(píng)量表,測(cè)量屬性尤為重要,其充分與否直接關(guān)系到量表能否反映患者的真實(shí)情況。2010 年由心理學(xué)、流行病學(xué)和臨床專家共同制定了COSMIN(Consensus-based Standards for the selection of health status Measurement Instruments)指南,將量表的測(cè)量屬性歸納為效度、信度和反應(yīng)度三個(gè)方面,具體包含9 個(gè)測(cè)量屬性,并制定了系統(tǒng)的評(píng)價(jià)方法[24],2018 年在此基礎(chǔ)上完善并更新了第2 版COSMIN 指南[25]。
近年來(lái),陸續(xù)有學(xué)者將COSMIN指南系統(tǒng)評(píng)價(jià)應(yīng)用于人工全膝關(guān)節(jié)置換術(shù)的患者自評(píng)量表,Harris等發(fā)現(xiàn)牛津膝關(guān)節(jié)評(píng)分(Oxford Knee Score,OKS)和牛津膝關(guān)節(jié)評(píng)分-活動(dòng)和社會(huì)參與量表(OKS-Activity and Participation Questionnaire,OKS-APQ)具有良好的測(cè)量屬性[26]。Gagnier等的研究顯示只有OKS,西安大略和麥克馬斯特大學(xué)骨關(guān)節(jié)炎指數(shù)(Western On?tario and McMaster Universities Arthritis Index,WOMAC)和骨關(guān)節(jié)炎或關(guān)節(jié)置換工作能力評(píng)價(jià)量表(Work,Osteoarthritis or joint-Replacement Question?naire,WORQ)具有相對(duì)較好的測(cè)量屬性[27]。我們利用第2 版COSMIN 對(duì)全膝關(guān)節(jié)置換術(shù)34 個(gè)患者自評(píng)量表系統(tǒng)進(jìn)行評(píng)價(jià),提示OKS,OKS-APQ,遺忘關(guān)節(jié)評(píng)分(Forgotten Joint Score,F(xiàn)JS),膝關(guān)節(jié)損傷和骨關(guān)節(jié)炎評(píng)分12條目縮減版問(wèn)卷(12-item short forms Knee injury and Osteoarthritis Outcome Score,KOOS-12)和功能縮減版問(wèn)卷(Knee injury and Osteoarthritis Outcome Score Physical function Short form,KOOS-PS),WOMAC全膝關(guān)節(jié)置換功能縮減版問(wèn)卷(Western Ontario and McMaster Universities Arthritis Index-Total Knee Re?placement function short form,WOMAC-TKR),下肢功能量表(Lower Extremity Functional Scale,LEFS),患者膝關(guān)節(jié)假體表現(xiàn)評(píng)分(Patient's Knee Implant Perfor?mance,PKIP),加州大學(xué)洛杉磯分?;顒?dòng)量評(píng)分(Uni?versity of California Los Angeles activity score,UCLA),以及KOOS和WOMAC 中的疼痛、功能和生活質(zhì)量子量表具備基本充分的測(cè)量屬性[28]??傮w來(lái)說(shuō),只有少數(shù)患者自評(píng)量表具有可靠的測(cè)量屬性,因此量表的選擇更多應(yīng)基于測(cè)量屬性的證據(jù)。
同傳統(tǒng)醫(yī)師評(píng)價(jià)量表一樣,傳統(tǒng)患者自評(píng)量表也逐漸出現(xiàn)天花板效應(yīng)。早期的患者自評(píng)量表只包含疼痛和日常生活中基本的功能,而滿足日常生活功能需求已不能使所有患者滿意。因此,KOOS、OKS-APQ 和2011 版KSS 量表均在WOMAC、OKS、KSS 傳統(tǒng)量表的基礎(chǔ)上加入了更多娛樂(lè)和運(yùn)動(dòng)功能的評(píng)價(jià)內(nèi)容。2012年Behrend等[29]提出遺忘人工關(guān)節(jié)可以作為人工關(guān)節(jié)置換手術(shù)的終極目標(biāo)。研究者應(yīng)當(dāng)科學(xué)看待患者自評(píng)量表的天花板效應(yīng)。一方面,天花板效應(yīng)的出現(xiàn)使得量表無(wú)法發(fā)現(xiàn)患者進(jìn)一步的改善,但另一方面,關(guān)節(jié)置換手術(shù)的目的是緩解疼痛和改善功能,對(duì)于設(shè)計(jì)科學(xué)的量表達(dá)到天花板分?jǐn)?shù)意味著患者實(shí)現(xiàn)了這個(gè)目的,量表的作用也應(yīng)當(dāng)是用于評(píng)價(jià)患者的健康狀況,而非檢測(cè)差異。因此,天花板效應(yīng)不應(yīng)作為量表選擇的絕對(duì)限制,而應(yīng)當(dāng)將獲得滿意的療效作為評(píng)價(jià)的終點(diǎn)。
KOOS 由Roos 等于1998 年編撰,旨在評(píng)價(jià)膝關(guān)節(jié)損傷和骨關(guān)節(jié)炎患者的癥狀和功能障礙情況。KOOS包括疼痛、其他癥狀、日常生活功能、運(yùn)動(dòng)和娛樂(lè)功能以及生活質(zhì)量5 個(gè)子量表的42 個(gè)條目[30]。KOOS 的優(yōu)勢(shì)在于:①除其他癥狀外的4 個(gè)子量表的信效度均得到高質(zhì)量研究驗(yàn)證[31-33],因此量表的結(jié)果真實(shí)可信。②量表內(nèi)容全面,基本涵蓋了膝關(guān)節(jié)置換術(shù)患者關(guān)心的各方面問(wèn)題。另外KOOS 包含了WOMAC 的所有條目,因此可以直接從KOOS 的結(jié)果中獲得WOMAC 的分?jǐn)?shù)。③Connelly 等的研究顯示KOOS各量表的得分和TKA患者術(shù)后滿意度相關(guān),并建立了基于療效滿意度可應(yīng)用個(gè)體評(píng)價(jià)的閾值[34]。KOOS的主要缺陷在于,繁多的內(nèi)容需要患者花費(fèi)超過(guò)10 分鐘去完成,導(dǎo)致缺失值的增多和依從性的降低。為了解決這個(gè)問(wèn)題,研究者利用項(xiàng)目反應(yīng)理論編撰了反映患者功能情況的7 條目功能縮減版(KOOS-PS)[35]、反映關(guān)節(jié)置換患者膝關(guān)節(jié)情況的7條目關(guān)節(jié)置換縮略版(KOOS,JR)[36]以及全面的12條目縮略版(KOOS-12)[31]。三者均利用人群數(shù)據(jù)和完善的心理統(tǒng)計(jì)學(xué)模型構(gòu)建而成,具備充分的測(cè)量屬性,尤其是2019 年利用現(xiàn)代測(cè)量理論研制的旨在替代KOOS的KOOS-12。但這些縮減版的適用范圍、條件以及是否可以完全替代原版量表,仍需要進(jìn)一步的研究進(jìn)行驗(yàn)證。
FJS由Behrend 等于2012年編撰而成[29]。其開(kāi)創(chuàng)性地將人工關(guān)節(jié)置換術(shù)的終極目標(biāo)以及量表的構(gòu)念定義為“遺忘人工關(guān)節(jié)”。相比于減輕關(guān)節(jié)疼痛和改善功能,遺忘人工關(guān)節(jié)、實(shí)現(xiàn)自然膝對(duì)療效提出了更高的要求。這一方面意味著FJS 的結(jié)果將更接近于患者對(duì)療效的滿意程度。近期有研究證實(shí)與WOMAC 評(píng)分相比,F(xiàn)JS 的結(jié)果與患者療效滿意度之間具有更高的相關(guān)性[37]。另一方面意味著FJS的結(jié)果具有更少的天花板效應(yīng)[38]。憑借其獨(dú)特的優(yōu)勢(shì),近五年使用FJS的研究顯著增多,未來(lái)必將成為人工關(guān)節(jié)置換術(shù)后重要的療效評(píng)價(jià)工具之一。但FJS 的缺陷在于只能用于術(shù)后的評(píng)價(jià),無(wú)法進(jìn)行術(shù)前術(shù)后的對(duì)比。另外,由于遺忘人工關(guān)節(jié)這個(gè)構(gòu)念的獨(dú)特性,在使用過(guò)程中如何使患者理解,準(zhǔn)確完成量表值得研究者進(jìn)一步思考。
部分傳統(tǒng)紙質(zhì)版的患者自評(píng)量表,因條目繁多導(dǎo)致患者依從性較差,同時(shí)不可避免的存在缺失值、錄入錯(cuò)誤,需要更多的人力保障其完整性和準(zhǔn)確性。隨著基于條目反應(yīng)理論的計(jì)算機(jī)自適應(yīng)測(cè)試的普及[39]以及信息技術(shù)的發(fā)展,條目更少、更便捷的電子版量表將成為未來(lái)的發(fā)展趨勢(shì)。
患者自評(píng)量表的結(jié)果來(lái)源于患者,幾乎不受醫(yī)師等醫(yī)療提供方的影響,近年來(lái)研究者嘗試?yán)昧勘淼慕Y(jié)果輔助醫(yī)患共同決策、醫(yī)療服務(wù)評(píng)價(jià)及政策制定。英國(guó)的研究者利用國(guó)家關(guān)節(jié)登記系統(tǒng)中的術(shù)前術(shù)后牛津髖/膝關(guān)節(jié)評(píng)分?jǐn)?shù)據(jù),構(gòu)建了術(shù)前評(píng)分對(duì)術(shù)后改善程度的預(yù)測(cè)模型,從患者療效和衛(wèi)生經(jīng)濟(jì)學(xué)兩方面制定了基于術(shù)前牛津關(guān)節(jié)評(píng)分的轉(zhuǎn)診和手術(shù)閾值[40,41]。但有學(xué)者認(rèn)為這些量表研制的目的是評(píng)估療效,而預(yù)測(cè)療效、指導(dǎo)治療超過(guò)了其適用范圍,閾值的結(jié)果并不具有臨床意義[42]。因此,利用患者自評(píng)量表指導(dǎo)治療決策和衛(wèi)生政策制定方面仍需要進(jìn)一步研究探索。
患者自評(píng)量表未來(lái)仍需要進(jìn)一步解決以下兩方面問(wèn)題:第一,量表的選擇應(yīng)基于其測(cè)量屬性的證據(jù),因此,需要系統(tǒng)評(píng)價(jià)和檢驗(yàn)現(xiàn)有量表的測(cè)量屬性。明確性能良好的量表并形成共識(shí),規(guī)范研究中使用的評(píng)價(jià)工具。第二,利用關(guān)節(jié)登記系統(tǒng)及數(shù)據(jù)庫(kù)全面收集不同人口學(xué)特征患者的患者自評(píng)量表數(shù)據(jù),根據(jù)患者對(duì)療效的滿意度計(jì)算最小臨床差異(minimal clinically important difference,MCID)等參數(shù),從而制定患者個(gè)體水平上量表的閾值。
提高人工膝關(guān)節(jié)置換患者術(shù)后滿意度首先需要選擇合適的評(píng)價(jià)工具,患者自評(píng)量表因其可以客觀反映療效,將會(huì)扮演愈加重要的作用。在臨床實(shí)踐和研究中,醫(yī)師或評(píng)價(jià)者應(yīng)根據(jù)患者的功能需求選擇具備充分測(cè)量屬性且沒(méi)有明顯天花板效應(yīng)的患者自評(píng)量表,才能使療效評(píng)價(jià)的結(jié)果更接近患者的滿意度。