薛紅紅 楊 錚 萬崇華△ 許清安 許傳志 陳 瑩
20世紀(jì)20年代,問卷測量作為一種新的測評工具在國外興起,隨后在醫(yī)學(xué)領(lǐng)域得到廣泛的應(yīng)用。問卷測量結(jié)果是一個(gè)綜合性的指標(biāo),相較于臨床客觀指標(biāo)能夠更全面、多維度地反映出被調(diào)查者的綜合健康狀態(tài)。但由于問卷測量結(jié)果的大小常常反映被調(diào)查者主觀感受,缺乏客觀性,問卷測量差異具有統(tǒng)計(jì)學(xué)意義并不代表在臨床上也有實(shí)際的意義。越來越多的學(xué)者認(rèn)識到僅根據(jù)治療前后量表得分差異的假設(shè)檢驗(yàn)P值來判斷療效是不科學(xué)的,只要樣本例數(shù)足夠大,P值一般都會顯示統(tǒng)計(jì)學(xué)意義,但并不能說明有臨床意義。因此,量表應(yīng)用中的一個(gè)關(guān)鍵問題是得分要改變多少才具有臨床意義。1987年,最小臨床重要性差值(minimal clinically important differences,MCID)的概念首次被提出,隨后加拿大學(xué)者Jaeschke R等人對其進(jìn)行定義,認(rèn)為MCID是在不考慮副作用和成本的前提下,被病人認(rèn)可的最小問卷維度得分變化值[1-2]。以不同的角度最小臨床重要性差值主要可分為三類。以Jaeschke R、Guyatt等人為主的最小顯著變化值(minimal important difference,MID),強(qiáng)調(diào)MID是可觀察到的最小的變化,無論被調(diào)查者是改善還是惡化[3-5];其二是最小可測變化值(smallest detectable difference,SDD,也記作minimal detectable change,MDC):指在一定置信度的前提下,結(jié)合評價(jià)工具測量誤差所確定的最小可測變化;其三是充分重要變化值(sufficient important difference,SID):其主要目的是為克服最小臨床意義變化值的不足,指在考慮成本和副作用后確定的病人最小受益值。
MICD是統(tǒng)計(jì)和臨床建立關(guān)系的橋梁,其重要性不言而喻。如何制定合理可信的MCID值成為學(xué)者研究的熱點(diǎn)。傳統(tǒng)方法主要有2種,包括效標(biāo)法(anchor-based methods),又稱錨法,以及分布法(distribution-based methods)。傳統(tǒng)方法雖有其優(yōu)勢,但尚無統(tǒng)一的標(biāo)準(zhǔn),在使用過程中其缺點(diǎn)與局限性也逐漸暴露出來。近年來,不斷有新的方法被提出,如:基于錨的MIC分配法、線性回歸模型和logistic回歸模型等。本文將對已有方法尤其是近年來新出現(xiàn)的方法如何應(yīng)用進(jìn)行較詳細(xì)的介紹,為量表(問卷)MCID的制定等問題提供依據(jù)和參考,并通過住院系統(tǒng)性紅斑狼瘡患者實(shí)例分析,比較不同方法下MCID值的大小。
1.效標(biāo)法(錨法)
效標(biāo)法是由1993年美國學(xué)者Lydick等人提出,又名錨法,其原理是通過檢驗(yàn)量表與另一獨(dú)立測量工具評分或其他指標(biāo)的關(guān)系來闡明該量表評分改變的含義??煞譃?個(gè)步驟:首先選擇一個(gè)恰當(dāng)?shù)腻^并報(bào)告錨與檢驗(yàn)量表的相關(guān)系數(shù);其次計(jì)算干預(yù)前后在錨選項(xiàng)上至少相差一個(gè)等級的患者的問卷得分差值,若差值服從正態(tài)分布,則以差值的均值作為MCID,若差值服從偏態(tài)分布,則以其中位數(shù)為MCID[6]。
錨的性質(zhì)可分為客觀錨和主觀錨(又可分為患者和專家評價(jià)2種類型)。錨的種類有橫斷面錨和縱向錨。橫斷面錨與時(shí)間無關(guān),一般用于完全隨機(jī)設(shè)計(jì);縱向錨與時(shí)間有關(guān),一般適用于自身配對設(shè)計(jì)或重復(fù)測量設(shè)計(jì)。以錨為基礎(chǔ)的方法關(guān)鍵是要尋找適宜的錨。沒有很好的錨時(shí),可以在測定的問卷中另外加入一個(gè)或幾個(gè)特定的條目,并以此作為總體評價(jià)的一個(gè)標(biāo)準(zhǔn)(錨),調(diào)查錨得分變化與所測量得分變化的關(guān)系。
2.分布法
分布法是根據(jù)觀察到的評分變化分布情況估計(jì)MCID,其分布變異情況可以采用幾個(gè)效應(yīng)統(tǒng)計(jì)指標(biāo),有明確的計(jì)算公式并將測量誤差納入計(jì)算。如標(biāo)準(zhǔn)差(SD)、效應(yīng)尺度(ES)、測量標(biāo)準(zhǔn)誤(SEM)、標(biāo)準(zhǔn)化反應(yīng)均數(shù)(SRM)等[7-10]。當(dāng)不能用錨法時(shí),可采用分布法。分布法的MCID計(jì)算公式及指標(biāo)見表1。
3.基于錨的MIC分配法(anchor-based MIC distribution)
2007年de Vet HC等[11]借助ROC曲線提出了可視化的基于錨的MIC分配方法。其核心在于選擇一個(gè)恰當(dāng)?shù)腻^并以其為分類的金標(biāo)準(zhǔn),以干預(yù)前后被調(diào)查者問卷評分的改變值作為試驗(yàn)分類方法,尋找靈敏度與特異度都最佳的改變值作為MCID(MIC)。應(yīng)用的具體步驟如下:
表1 分布法指標(biāo)匯總
(1)基于錨分組:以SF-36中條目q1為錨,若患者治療后相較于治療前在錨問題的選項(xiàng)上正向改變至少一個(gè)等級,則歸為“改善組”。若患者治療前后在錨問題的選項(xiàng)上未改變,則歸為“無變化組”。若患者治療后相較于治療前在錨問題的答案上反向改變至少一個(gè)等級,則歸為“惡化組”。根據(jù)患者治療前后在錨條目的選項(xiàng)上的變化情況對其進(jìn)行歸類,稱為錨分組。
(2)分布圖繪制:計(jì)算3種不同分類中被調(diào)查者兩次問卷測量分?jǐn)?shù)的變化值(dchange),并分別繪制dchange的頻率分布圖(以百分?jǐn)?shù)表示)。
(3)明確研究目的:若要制定最小臨床重要性改善值,將“無變化”組分布圖的95%上限值定義為有較大改善值(MIC),其計(jì)算公式:MIC=Meanchange+1.645SDchange。(注:95%上限值在ROC曲線中特異度為95%;1.645對應(yīng)5%面積(單側(cè)))。
(4)ROC曲線的構(gòu)建:以無變化組分布圖的最小值與95%上限值為取值范圍,確定組距、截?cái)帱c(diǎn)。以的錨分組為金標(biāo)準(zhǔn),以不同截?cái)帱c(diǎn)分別為試驗(yàn)分類方法,計(jì)算每個(gè)截?cái)帱c(diǎn)的靈敏度和1-特異度。1-特異度為橫坐標(biāo),靈敏度為縱坐標(biāo)進(jìn)行描點(diǎn),形成ROC曲線。
(5)選擇ROC曲線中最左上角的點(diǎn)(Youden指數(shù)最大的點(diǎn))作為截?cái)帱c(diǎn)值,即為最佳分類閾值(MIC值)。
4.響應(yīng)累計(jì)分布函數(shù)(cumulative distribution function of responses,CDF)
2013年Wyrwich等[12]代表國際生命質(zhì)量研究會ISOQOL顧問委員會推薦了利用響應(yīng)累計(jì)分布函數(shù)CDF來制定MCID。如圖1為一條累積分布曲線圖,累積分布函數(shù)能完整描述一個(gè)實(shí)隨機(jī)變量X的概率分布。若以X軸為干預(yù)前后問卷得分的變化值(dchange),從左到右依次增大,Y軸為概率值,對任意變化值x,累積分布函數(shù)定義為F(x)=P(Xx),即x對應(yīng)的y值等于所有小于等于x的值出現(xiàn)概率之和。
圖1 累積分布曲線圖
2018年Cheryl等人[13]在文獻(xiàn)中,表明響應(yīng)值的定義是能夠識別被調(diào)查者干預(yù)前后臨床結(jié)果評估(COA)變化值中有意義的變化值。響應(yīng)值的確定方法有:基于錨的經(jīng)驗(yàn)累積分布函數(shù)、判別分析、錨法。響應(yīng)累積分布函數(shù)制定MCID應(yīng)滿足:(1)一個(gè)合理的研究設(shè)計(jì)(錨與COA同時(shí)使用);(2)至少選擇一個(gè)恰當(dāng)?shù)腻^(錨與COA的結(jié)構(gòu)必須一致);(3)報(bào)告錨與臨床結(jié)果評估(COA)變化值的相關(guān)系數(shù)r。
5.多元線性回歸模型法
2017年Angst等[14]提出了借助多元線性回歸模型制定MCID的方法,可以調(diào)整潛在的混雜因素;其原理是以干預(yù)前后被調(diào)查問卷得分改變量(dchange)為因變量,以年齡、性別、基線得分、組別等混雜因素為自變量,對dchange擬合多元線性回歸模型,對配對縱向隊(duì)列研究其多元回歸模型的具體構(gòu)建步驟如下:
(1)分組:若患者治療后相較于治療前在過渡問題的選項(xiàng)上正向改變至少一個(gè)等級,則歸為“改善組”。若患者治療前后在過渡問題的選項(xiàng)上未改變,則歸為“無變化組”。若患者治療后相較于治療前在過渡問題的答案上反向改變至少一個(gè)等級,則歸為“惡化組”[15-16]。
(2)確定研究對象組:例如過渡問題“今天(隨訪時(shí))與基線相比,你的健康狀況如何”,其選項(xiàng)為:1.好了很多,2.好了一些,3.沒變化,4.差了一些,5.差了很多。若要制定最小臨床重要改善值,則以選擇“好了一些”和“沒變化”這兩組患者為研究對象。
(3)模型構(gòu)建:對分組因素進(jìn)行賦值(例:沒變化=0、好了一些=1),以組別、性別、年齡、基線等混雜因素為自變量,以“dchange”為因變量,構(gòu)建多元線性回歸模型。
(4)MCID值:采用SPSS軟件構(gòu)建多元線性回歸模型并輸出其預(yù)測值的均值,預(yù)測值的均值即為最小臨床重要改善值,也可計(jì)算其95%可信區(qū)間。
6.其他方法
除上述方法外,還可以采取專家意見法和文獻(xiàn)分析法來制定MCID。專家意見法是根據(jù)專家的意見來確定最小臨床意義變化值,常用技術(shù)是Delphi法。因其依賴專家的主觀判斷,不能較好地反映病人的觀點(diǎn)。Brozek等認(rèn)為在確定以病人為主的最小臨床意義變化值時(shí),專家意見法只能作為輔助。根據(jù)已有文獻(xiàn),Revicki等將meta分析作為確定最小臨床意義變化值的一種方法,他們認(rèn)為臨床試驗(yàn)證據(jù)的不斷積累為確定最小臨床意義最小值提供豐富的、有價(jià)值的信息。文獻(xiàn)分析法依賴于已有文獻(xiàn),在確定最小臨床意義變化值時(shí)只能起輔助作用[17,7]。也有一些學(xué)者探討了幾種方法結(jié)合制定MCID。如選擇多個(gè)錨計(jì)算其均值,也可見以計(jì)算分步法中不同指標(biāo)下的MCID值,再求其均值等方法。表2對已有方法的優(yōu)缺點(diǎn)及使用環(huán)境進(jìn)行了總結(jié)。
表2 常見MCID制定方法基本特征
通過上述總結(jié),可以看出錨法與分布法作為廣泛使用的方法,不限研究的設(shè)計(jì)類型。分布法有好幾種指標(biāo)且易受樣本量的影響,不同的指標(biāo)又有不同的參數(shù)可選。本研究采用了一個(gè)實(shí)例(詳見實(shí)例分析中的表3),探討以錨為參照,觀察分布法中各種方法對應(yīng)MCID的變化,結(jié)論為:當(dāng)找不到合適的效標(biāo)時(shí),建議首選分布法中1.96SEM法或SRM=0.8時(shí)對應(yīng)的MCID,其次考慮ES(0.5)法。
1.對象資料
本研究是對已有的研究數(shù)據(jù)為實(shí)例進(jìn)行分析。已有數(shù)據(jù)來源于自身配對的實(shí)驗(yàn)設(shè)計(jì),以昆明醫(yī)科大學(xué)第一附屬醫(yī)院住院系統(tǒng)性紅斑狼瘡患者為研究對象,采用系統(tǒng)性紅斑狼瘡患者生命質(zhì)量量表QLICD-SLE(V2.0)、SF-36中條目(總的來講您的健康狀況是:1.非常好;2.很好;3.好;4.一般;5.差)為錨,對住院系統(tǒng)性紅斑狼瘡患者進(jìn)行三次調(diào)查,分別在患者入院當(dāng)天、入院第二天、干預(yù)后出院前一天。QLICD-SLE(V2.0)量表包含生理、心理、社會功能、疾病特征四個(gè)領(lǐng)域,共計(jì)47個(gè)條目。x0表示被調(diào)查者的基線評分(入院當(dāng)天),x1表示被調(diào)查者干預(yù)后評分(出院前一天),d為同一個(gè)患者兩次測量得分標(biāo)準(zhǔn)化后的差值。
2.結(jié)果
(1)基本情況
研究共計(jì)調(diào)查系統(tǒng)性紅斑狼瘡患者143例;其中女性132例(92.3%)、男性11例(7.7%);患者的年齡主要集中在30~40歲,約占40%;回收有效問卷102例(71.3%)。PROISCD-SLE V1.0量表的重測信度系數(shù)r為0.903,錨得分(第一次)與患者基線得分的相關(guān)系數(shù)0.43。由于d值為患者兩次問卷評分差值(X1-X0),既有正值也有負(fù)值,其標(biāo)準(zhǔn)差是9.96,均數(shù)是1.16。調(diào)查對象中有70例患者在干預(yù)前后在錨條目的選項(xiàng)上的結(jié)果未發(fā)生變化,其對應(yīng)的量表得分差值的均值為0.36,標(biāo)準(zhǔn)差為8.32。被調(diào)查者第一次問卷評分的均數(shù)是67.6,標(biāo)準(zhǔn)差是13.27;第三次問卷評分的均數(shù)是68.8,標(biāo)準(zhǔn)差是12.67。
(2)MCID值
通過不同的方法得出的MCID值具體結(jié)果見表3。其中ES、SRM、RS均以0.2為小效應(yīng),0.5為中等效應(yīng),0.8為大效應(yīng)[18]?;阱^的MIC分布法MCID值對應(yīng)的敏感度0.63,特異度為0.66。通過比較分布法中不同指標(biāo)下MCID值與錨法對應(yīng)的MCID值,可看出SEM法中X=1.96時(shí)對應(yīng)的MCID值與SRM=0.8時(shí)最為接近。SEM法中X=1時(shí)的MCID(4.11)與ROC曲線法中的4.26最為接近。當(dāng)ES=0.5對應(yīng)的MCID值(6.63)與多元線性回歸(6.71)以及錨法(6.69)最為接近。
表3 不同方法的MCID值
根據(jù)國內(nèi)外文獻(xiàn)[19-32]在慢性病領(lǐng)域中,常選用傳統(tǒng)方法中的錨法、分布法制定MCID值。錨法中常見以SF-36、圣喬治呼吸問卷(SGRQ)等國際公認(rèn)的綜合量表為錨;也可見選用兩種錨,求其均值作為MCID。分布法是用統(tǒng)計(jì)學(xué)的指標(biāo)估計(jì)MCID值,常用于自身配對的實(shí)驗(yàn)設(shè)計(jì)或治療組和對照組在某一時(shí)間點(diǎn)或更多時(shí)間點(diǎn)的比較。也可見綜合錨法與分布法,取其最大值、最小值,最終以最大值與最小值和的均值作為MCID,以減小統(tǒng)計(jì)誤差[33-34]。2017年Angst等人將統(tǒng)計(jì)中P值得概念引入MCID計(jì)算中,得出ES、SRM更適用于配對設(shè)計(jì)資料,ES的取值在0.3~0.5之間,可用于MCID的粗略估計(jì)[8]。我國學(xué)者許清安等人[35]采用SPSS模擬的手段,分析了ES法、SEM法、RCI法的應(yīng)用條件并對其適用范圍提出了建議。本文通過自身配對的實(shí)例分析,發(fā)現(xiàn)錨法與1.96SEM法得出的MCID最為接近,建議當(dāng)找不到合適錨的情況下,首選1.96SEM法或SRM為0.8時(shí)對應(yīng)的MCID值,其次考慮ES(0.5)法。
近年來在方法學(xué)研究上,以研究最小臨床重要性改善值為主;基于錨的MIC分配法利用ROC曲線制定MCID相較于傳統(tǒng)的方法使其靈敏度、特異度可視化,而且具有較好的穩(wěn)定性[8],適用范圍較廣;Turner等[36]通過一個(gè)實(shí)例表明,利用整個(gè)隊(duì)列的數(shù)據(jù)與ROC曲線制定MCID能有效提高M(jìn)CID準(zhǔn)確性。在縱向隊(duì)列研究中多元線性回歸模型能夠有效控制混雜因素對MCID的影響,并且能夠識別出對MCID影響最大的混雜因素[11]。響應(yīng)累積分布函數(shù)制定MCID作為一種新的方法已被學(xué)者對其理論概況進(jìn)行探討,但未見實(shí)例報(bào)道。
如今MCID如何體現(xiàn)出個(gè)體差異成為人們關(guān)注的熱點(diǎn)。2010年Henrica等人[37]提出ROC曲線法計(jì)算的MCID的95%可信區(qū)間等方法可用來量化其用于單個(gè)患者時(shí)的不確定性。2013年Linda等[38]提出以置信區(qū)間估計(jì)MCID的范圍時(shí),如果置信區(qū)間跨入由MCID定義的臨床無差異區(qū)域,則無法建立治療方案對結(jié)果的影響(正面或負(fù)面),不能只依靠值或95%CI計(jì)算MCID的取值范圍,必須結(jié)合臨床實(shí)際情況得出合理的結(jié)論。