吳瑤瑤 程璐瑤 郭海健 徐金水 閔 捷△
【提 要】 目的 構(gòu)建糖尿病特異性生活質(zhì)量量表(DSQL)到歐洲五維健康效用量表(EQ-5D)映射模型,將DSQL得分轉(zhuǎn)換為健康效用值。方法 從江蘇省糖尿病并發(fā)癥監(jiān)測點上按糖尿病4種并發(fā)癥進行抽樣調(diào)查,418例患者作為訓練集,75例糖尿病患者作為驗證集。使用普通最小二乘法(OLS)、Tobit回歸法和截尾最小絕對偏差法(CLAD)建立模型,調(diào)整R2、平均絕對誤差(MAE)和均方誤差(MSE)評價每個模型,用訓練集進行內(nèi)部十折交叉驗證,用驗證集進行外部驗證。結(jié)果 訓練集平均年齡為62.07歲,糖尿病特異性生存質(zhì)量量表的平均得分為49.15分,EQ-5D效用值平均為0.9435。三種回歸方法中,CLAD法的預測效果最好,該模型由生理功能、心理精神、社會關(guān)系和治療影響以及生理功能和心理精神的交互作用組成。結(jié)論 當有DSQL得分而無EQ-5D結(jié)果時,可以運用本文的映射模型獲得效用值,用于衛(wèi)生經(jīng)濟學評價和臨床研究。
糖尿病是由遺傳因素和環(huán)境因素共同作用導致的,已成為危害人民健康、影響生活質(zhì)量和加重生活負擔的慢性非傳染病之一[1]。成本-效用分析是慢性非傳染性疾病衛(wèi)生經(jīng)濟學評價常用方法,該方法既考慮了生存時間又考慮了生存質(zhì)量。糖尿病特異性生存質(zhì)量量表(diabetes specific quality of life scale,DSQL)是一種非基于健康偏好的量表,能夠全面評價糖尿病患者的生存質(zhì)量和疾病負擔[2],但該量表無法直接獲得反映生存質(zhì)量的健康效用值。而基于偏好的歐洲五維健康效用量表(EuroQol five-dimensional questionnaire,EQ-5D)因其結(jié)構(gòu)簡單,容易理解和操作而得到廣泛應(yīng)用。多個國家已結(jié)合本國實際,研究出適合本國人群的效用值積分換算體系[3-4],但該量表是普適性的,與疾病的關(guān)聯(lián)性較低。
映射法本質(zhì)是回歸分析,描述兩個量表的數(shù)量關(guān)系。近年來,國內(nèi)外研究者建立了多種疾病特異性專屬量表向EQ-5D轉(zhuǎn)化的映射模型[5-10],但未見有糖尿病特異性生存質(zhì)量量表的映射研究。
因此,本文利用江蘇省糖尿病并發(fā)癥篩查的部分患者生存質(zhì)量調(diào)查信息,制定一種映射算法,幫助實現(xiàn)糖尿病特異性量表積分生成EQ-5D健康效用指數(shù),以便臨床工作者和經(jīng)濟學家在有DSQL而無EQ-5D時仍然能夠獲得患者的健康狀態(tài)和疾病負擔,為進一步制定有利于患者的政策提供依據(jù)。
1.研究對象
本次研究分別從江蘇省蘇南、蘇北地區(qū)糖尿病并發(fā)癥監(jiān)測點上按病種(無并發(fā)癥、糖尿病視網(wǎng)膜病變、糖尿病腎病、糖尿病周圍神經(jīng)病變以及糖尿病足)抽取患者,排除因各種原因不能理解量表內(nèi)容或者交流有問題的研究對象,共抽取9個監(jiān)測點519例患者,將前7個點444例患者作為訓練集,用來建立映射模型;最后調(diào)查的2個監(jiān)測點75例患者作為驗證集。所有研究對象知情同意并簽署知情同意書。為了保證問卷質(zhì)量,由接受統(tǒng)一培訓的調(diào)查員對所有研究對象進行一對一的面對面訪談,完成問卷內(nèi)容。
2.研究內(nèi)容
調(diào)查問卷由三部分組成,分別為人口學特征、糖尿病特異性生活質(zhì)量量表和EQ-5D量表。糖尿病特異性生活質(zhì)量量表由四個維度組成,分別是生理功能、心理精神、社會關(guān)系和治療對患者的影響,共有27個條目,每個條目的分值是1~5分,其中生理功能12~60分,心理精神8~40分,社會關(guān)系4~20分,治療3~15分??偡种凳?7~135分,27分代表最好的健康狀態(tài),135分代表最差的健康狀態(tài)。
EQ-5D有兩種形式,分別是EQ-5D-5L和EQ-5D-3L[11]。本研究使用的EQ-5D-3L由五個問題和VAS得分組成,五個問題分別是活動能力、自我護理、日?;顒?、疼痛/不適和焦慮/抑郁。每個問題的答案有三個選項,1代表沒有問題,2代表輕微問題,3代表嚴重問題,共包含243種健康狀態(tài),不同健康狀態(tài)對應(yīng)不同的健康效用值[12]。VAS得分在0~100分之間,100分代表研究對象認為目前的身體狀態(tài)是想象的最好狀態(tài)。
3.數(shù)據(jù)分析
效用值的計算方法:根據(jù)2018年基于中國人口的效用值積分換算體系將EQ-5D的內(nèi)容換算成健康效用值,表達式為:U=1-(0.0766×M2+0.2668×M3+ 0.0441×S2+0.2912×S3+0.0370×U2+0.0538×U3+0.0274×P2+0.0409×P3+0.0359×A2+0.1771×A3),變量M、S、U、P、A分別代表量表中的5個問題。下標i=2,3分別代表第二個選項,第三個選項。最好的健康狀態(tài)是11111,其健康效用值為1。
模型的選擇:本次研究選擇3個常用的計量經(jīng)濟學模型,即普通最小二乘法(OLS)模型、Tobit模型和截尾最小絕對偏差模型(CLAD)。
OLS模型[13]是計量經(jīng)濟學中常用的一般線性回歸方法,其表達式為:
Yi=Xiβ+εi,εi~(0,σ2)
由于OLS模型預測值可能大于1,而健康效用值的測量存在上限為1的情況,即所謂“天花板效應(yīng)”,因此提出了Tobit模型,該模型[14]適用于一些存在“天花板效應(yīng)”的數(shù)據(jù),當誤差項滿足正態(tài)性和方差齊性時,模型的擬合效果更好。模型表達式為:
CLAD模型是解決天花板效應(yīng)的另一種方法,該方法是基于中位數(shù)回歸,原理是最小化絕對偏差的和,解決了Tobit模型要求誤差滿足正態(tài)性和方差齊性的局限性[13]。
本文在模型擬合過程中考慮不同的自變量內(nèi)容,建立以下6個模型:
模型1:僅含DSQL總分
模型2:僅含DSQL各維度得分
模型3:DSQL各維度得分和模型2中有統(tǒng)計學意義變量的交互項
模型4:DSQL總分和社會人口學特征變量
模型5:DSQL各維度得分和社會人口學特征變量
模型6:DSQL各維度得分、模型2中有統(tǒng)計學意義變量的交互項和社會人口學特征變量
用三種回歸方法分別建立這6個模型,模型的評價指標為調(diào)整R2、均方誤差(MSE)和平均絕對誤差(MAE)。為了實現(xiàn)模型之間的比較,采用OLS模型、Tobit模型和CLAD模型預測值與實際值的相關(guān)系數(shù)r計算R2[15]。模型初步比較后,選擇較優(yōu)模型進行十折交叉驗證(10-fold cross-validation)和外部驗證,進一步確定最優(yōu)模型和驗證模型的穩(wěn)定性。
本研究采用EpiData 3.1軟件進行數(shù)據(jù)雙錄入,運用Stata 16.0處理數(shù)據(jù)和構(gòu)建模型,R 6.4進行十折交叉驗證。
1.一般人口學特征
本研究共收集519份調(diào)查問卷,,去除問卷內(nèi)容填寫不完整的26份,最終納入分析的為訓練集418份和驗證集75份。訓練集中418名參與者的平均年齡為62.07(9.39)歲,以50~70歲人群為主;女性、農(nóng)村地區(qū)、已婚人群、低學歷者比例較高。驗證集的平均年齡為66.02(10.30)歲,以城市地區(qū)人群為主。由兩個數(shù)據(jù)集的一般人口學特征比較可知,年齡、地區(qū)和教育水平差異有統(tǒng)計學意義,訓練集和驗證集的人口學特征不完全一致(表1)。
表1 一般人口學特征
2.效用值
訓練集中418名參與者的效用值平均為0.9435(0.11),有180例(43.06%)達到最大的效用值1,糖尿病特異性生存質(zhì)量量表的平均得分為49.15分,生理功能維度、心理精神維度、社會關(guān)系維度和治療影響維度的平均得分分別為23.10(7.57)、15.35(4.05)、5.92(1.79)和4.78(1.69)。由圖1、圖2可知,EQ-5D-3L效用值分布呈現(xiàn)左偏態(tài),DSQL量表總分呈現(xiàn)右偏態(tài)。
圖1 EQ-5D-3L效用值分布
圖2 糖尿病生存質(zhì)量量表得分分布
3.模型的構(gòu)建
表2為DSQL映射到EQ-5D的三種回歸方法的回歸系數(shù)。應(yīng)用三種回歸方法共擬合18種模型,模型均有統(tǒng)計學意義(P<0.05)。生理功能維度在10個模型中均有統(tǒng)計學意義,心理精神維度在OLS回歸模型2、3、5和6有統(tǒng)計學意義,生理功能和心理精神的交互作用除在Tobit法模型中無統(tǒng)計學意義外,其他包含該交互項的模型均有統(tǒng)計學意義,可以認為生理功能和心理精神對效用值的大小有影響。模型4、5、6添加了性別和年齡人口學特征變量,性別在Tobit回歸的三個模型中均有統(tǒng)計學意義且回歸系數(shù)為負,表明男性的效用值高于女性;年齡僅在Tobit模型4和CLAD模型5中有統(tǒng)計學意義。
表2 OLS、Tobit和CLAD三種回歸方法各種組合模型的回歸系數(shù)
4.模型評價指標比較
表3列出了三種回歸方法18種模型評價指標結(jié)果,總的來看模型3和模型6有較大的調(diào)整R2與較小的MSE和MAE。而模型3與模型6又以CLAD法最為理想,有最大的調(diào)整R2,MAE和MSE也比較小,因此考慮模型3和模型6的擬合效果較好。為了進一步探討模型的穩(wěn)定性,對三種回歸方法的模型3和模型6做十折交叉驗證。即每次將樣本分成10份,9份為訓練集,一份為測試集,通過對測試集進行預測計算MAE和MSE,結(jié)果CLAD法模型3的MAE為0.0379,MSE為0.0069,模型6的MAE為0.0394,MSE為0.0070(表4)。交叉驗證的結(jié)果也表明CLAD法的效果較好,包含生理功能、心理精神、社會關(guān)系和治療影響以及生理功能和心理精神的交互作用模型3的擬合效果最好,以較小的MAE(0.0383)和MSE(0.0063)解釋了42.96%的變化。
表3 訓練集各個模型評價指標比較
表4 交叉驗證結(jié)果比較
5.外部驗證
選擇三種回歸方法(OLS、Tobit、CLAD)的模型3和模型6進行外部驗證的結(jié)果見表5。三種回歸方法中,CLAD法的MAE和MSE最小且在模型3和模型6中(0.0345 vs 0.0336;0.0038 vs 0.0330)差異均無統(tǒng)計學意義(P=0.8996,P=0.9723);綜合外部驗證6個模型結(jié)果,CLAD模型3、6在預測值的均數(shù)、標準差、MAE、MAE都顯示較低的偏差。
表5 6個模型外部驗證結(jié)果
本文選擇了映射研究常用的三種方法,即OLS、Tobit和CLAD方法,以調(diào)整R2與反應(yīng)總體預測能力的MSE和反映個體預測能力的MAE相結(jié)合確定最優(yōu)模型。結(jié)果顯示,CLAD法模型3的調(diào)整R2僅次于模型6,但模型3的結(jié)構(gòu)更簡單。交叉驗證與外部驗證表明,CLAD法的模型3具有良好的穩(wěn)定性,說明包含生理功能、心理精神、社會關(guān)系和治療影響以及生理功能和心理精神的交互作用變量的模型3可認為是最佳模型。一份系統(tǒng)評價報告顯示,從特定調(diào)查表到一般衛(wèi)生效用測量映射的R2通常在0.4到0.6之間[16],本研究CLAD模型3的調(diào)整R2為0.4296,也在這一范圍內(nèi)。雖然R2沒有很高,但與其他模型相比,也得出CLAD法的映射效果最好[17]。有研究表明,OLS模型優(yōu)于Tobit以及CLAD模型[18],但本研究并沒有得出這樣的結(jié)論,可能是由于本研究的天花板效應(yīng)較高,數(shù)據(jù)不滿足方差齊性,因此得出了CLAD法的模型擬合效果較好的結(jié)果。
本文在模型4~模型6中包含人口學特征變量時也曾考慮引入地區(qū)、教育水平與婚姻狀況,但發(fā)現(xiàn)對模型總變異的影響較小,因此最終只考慮了性別與年齡兩個基本變量。這與Siani的研究選取的變量一致,因為性別和年齡是臨床上重要的預測因子[19]。年齡變量在所有回歸模型中,僅有兩個模型表明年齡變量在模型中有統(tǒng)計學意義,Abdin的研究中有一部分模型也探索出年齡與效用值的關(guān)系[8]。兩個較優(yōu)模型相比,性別和年齡變量會使調(diào)整R2增大0.0061,表明該變量對改善模型預測效果的作用不大,這也是選擇模型3的另一點考慮。
有研究表明,基于EQ-5D量表的映射會出現(xiàn)天花板效應(yīng)[20],有的會達到25%。本研究達43%,天花板效應(yīng)較強。偏高的主要原因是研究對象主要來源于社區(qū)人群,社區(qū)人群中大多數(shù)沒有并發(fā)癥或者并發(fā)癥處于穩(wěn)定狀態(tài),生活質(zhì)量較好。相反,針對住院病人的研究,其天花板效應(yīng)會相對減弱[10]。不同比例“天花板效應(yīng)”的映射模型可能會有所不同,這也是將來要進行探索的。
本研究的局限性主要是訓練集的樣本量不夠大,所得到的健康狀態(tài)相對較少,構(gòu)建的模型雖已進行外部驗證,但是用于外部驗證的樣本量有限,模型的可推廣性有待進一步驗證。本研究CLAD法構(gòu)建的包含生理功能、心理精神、社會關(guān)系、治療影響以及生理功能和心理精神的交互作用的模型為較優(yōu)模型。該模型提供了糖尿病特異性量表轉(zhuǎn)化為EQ-5D效用量表的健康效用值,為臨床醫(yī)生和研究人員研究糖尿病相關(guān)疾病負擔和成本效益分析提供了依據(jù)。