藥物經(jīng)濟(jì)學(xué)評價中最常用的方法是成本-效用分析,該方法的核心在于健康效用值(健康效用)的測量。健康效用值指的是某一水平健康狀態(tài)或健康狀態(tài)有所改善的值,按照社會或個體對某一健康狀態(tài)的偏好程度來測量。健康效用值的測量方法有直接和間接測量兩類。直接測量法操作復(fù)雜,在大樣本的情況下難度較大,而間接測量法以普適性效用量表測量為主,包括歐洲五維健康量表(EuroQol five dimensions questionnaire, EQ-5D)、六維度健康調(diào)查簡表(Short form six dimensions questionnaire, SF-6D)等。量表多數(shù)是普適性的,即任何疾病患者都可以使用該量表,與疾病的關(guān)聯(lián)性較低。因此,在疾病的臨床研究中兩類方法的應(yīng)用均存在一定缺陷,在很多研究中很難準(zhǔn)確地得到健康效用值。由此需要對臨床常用的疾病專屬性量表與效用測量的普適性量表之間進(jìn)行科學(xué)換算,既保證測量的結(jié)果能夠轉(zhuǎn)化為效用值,又能夠貼切地反映患者的疾病特有狀態(tài)[1]。當(dāng)健康狀況效用值不能直接用于經(jīng)濟(jì)評估時,將健康狀況指標(biāo)映射到基于通用偏好的指標(biāo)成為一種常見的解決方案。Brazier JE、Longworth L[2]等國外學(xué)者對映射法做出了定義:指非效用值測量工具,即非基于偏好的健康狀態(tài)條件特異性測量工具和普適性測量工具,對已有的效用值測量方法的映射,通過估計(jì)兩種測量工具的回歸關(guān)系將非偏好生命質(zhì)量信息轉(zhuǎn)化為同等效力的基于偏好的效用值單一指數(shù)。目前,映射法已被公認(rèn)為國內(nèi)外健康效用值測量的首選方法之一,國外已有大量學(xué)者從事映射法研究,國內(nèi)的研究還處于起步階段。本研究通過文獻(xiàn)研究,對近11年國內(nèi)外有關(guān)映射法在健康效用值測量中的應(yīng)用研究文獻(xiàn)進(jìn)行歸納與總結(jié)。
1.1 檢索方法 以“mapping”“Cost-utility”“health utility value”作為關(guān)鍵詞在Springer數(shù)據(jù)庫網(wǎng)站上,以2007—2018年為檢索年限,檢索出951篇英文文獻(xiàn)。以“映射”“成本-效用”“健康效用值”為檢索關(guān)鍵詞,在中國期刊全文數(shù)據(jù)庫(CNKI)、中文期刊全文數(shù)據(jù)庫和萬方數(shù)據(jù)知識服務(wù)平臺檢索同期的中文文獻(xiàn),共計(jì)檢索到中文文獻(xiàn)7篇。
1.2 分類歸納 對 958篇中英文文獻(xiàn)進(jìn)行初步篩選,剔除非實(shí)證研究文獻(xiàn)、會議和報(bào)紙文章、明顯不符合主題的文獻(xiàn)和重復(fù)文獻(xiàn),最終選出映射法研究的中英文實(shí)證研究文獻(xiàn) 50篇[3-52]。文獻(xiàn)篩選過程見圖1。
圖1 文獻(xiàn)篩選流程圖
通過對國內(nèi)外對映射法的研究文獻(xiàn)進(jìn)行搜集與整理,納入46篇符合要求的研究文獻(xiàn),按照具有明確函數(shù)關(guān)系、未有明確函數(shù)關(guān)系、疾病特異性量表與普適性量表之間的映射、普適性量表之間的映射四個方面進(jìn)行分析總結(jié)。各類文獻(xiàn)的詳細(xì)情況如圖2所示(“普-普”代表普適性量表之間的映射研究;“特-普”代表疾病特異性量表與普適性量表之間的映射;“T”表示有明確函數(shù)關(guān)系;“F”表示未有明確函數(shù)關(guān)系)。
2.1 疾病特異性量表與普適性量表之間具有明確映射函數(shù)式的研究 近十余年來,大多數(shù)映射法研究是在疾病特異性量表和普適性量表之間構(gòu)建映射模型,部分學(xué)者在映射研究中已給出明確的映射模型,檢索到的此類文獻(xiàn)共29篇[3-31],詳見表1。
圖2 不同類型相關(guān)文獻(xiàn)數(shù)量
2.1.1 國外研究 Gang Chen等[3]以924例糖尿病患者和1760例健康公民為例,分別通過OLS(Ordinary least squares,廣義最小二乘法)和GLM(Generalized Linear Model, 廣義線性模型)對糖尿病功能評價39問題量表(Diabetes-39, D-39)和15D、AQoL-8D、EQ-5D、HUI-3、QWB和SF-6D六種目標(biāo)量表進(jìn)行映射研究,以R2、MAE和RMSE作為評價模型性能的指標(biāo)。結(jié)果顯示,15D、SF-6D、AQoL-8D三種目標(biāo)量表與D-39的映射模型性能較好,其中AQoL-8D與D-39的關(guān)聯(lián)性最好,兩種方法構(gòu)建的模型相比,OLS構(gòu)建的算法更佳。由此可以認(rèn)為,此算法能夠準(zhǔn)確地將D-39映射到AQoL-8D上。
Garry R Barton等[4]以389例骨關(guān)節(jié)炎患者的臨床數(shù)據(jù)作為研究樣本,以西安大略省和麥克馬斯特大學(xué)骨關(guān)節(jié)炎指數(shù)(Western Ontartio and McMaster Universities Osteoarthritis Index, WOMAC)整體得分以及性別和年齡等人口統(tǒng)計(jì)學(xué)特征作為解釋變量共構(gòu)建五個OLS模型,并以調(diào)整R2、MAE和RMSE作為評價映射模型性能的指標(biāo)進(jìn)行對比。結(jié)果顯示,以WOMAC整體得分、年齡和性別賦值(男性性別賦值為0,女性為1)為解釋變量的WOMAC模型能夠準(zhǔn)確地映射到EQ-5D上。Feng Xie等[5]對258例膝關(guān)節(jié)骨關(guān)節(jié)炎患者進(jìn)行WOMAC和EQ-5D問卷調(diào)查,以疼痛、功能、硬化等指數(shù)作為解釋變量,通過OLS和CLAD構(gòu)建映射函數(shù)模型,并根據(jù)MAE值評價其性能。結(jié)果顯示,相比于CLAD,運(yùn)用OLS構(gòu)建的 WOMAC和 EQ-5D之間的映射模型性能更好,該算法能夠?qū)OMAC映射到EQ-5D上。Bilbao A等[6]對西班牙748例髖關(guān)節(jié)或膝關(guān)節(jié)炎患者填寫的EQ-5D-5L和WOMAC問卷數(shù)據(jù)進(jìn)行整理,以疼痛(P)和功能(F)作為解釋變量構(gòu)建GAM(Generalized Additive Model, 廣義相加模型)進(jìn)行線性回歸和 β回歸,得出WOMAC與EQ-5D-5L之間的映射模型,以MAE和RMSE作為映射模型性能的評價指標(biāo)。結(jié)果顯示,線性回歸模型的性能更好,該方法可以將WOMAC映射到EQ-5D-5L上。
表1 疾病特異性量表與普適性量表之間的映射函數(shù)式一覽表
表1 疾病特異性量表與普適性量表之間的映射函數(shù)式一覽表(續(xù))
表1 疾病特異性量表與普適性量表之間的映射函數(shù)式一覽表(續(xù))
Robert L.Askew等[7]以273例黑色素瘤癌癥患者的黑色素瘤癌癥功能評估量表(Functional Assessment of Cancer Therapy-Melanoma, FACT-M)和EQ-5D臨床問卷數(shù)據(jù)為例,以 FACT-M 量表總體指標(biāo)為解釋變量分別構(gòu)建CLAD和OLS模型探尋映射關(guān)系,以R2作為評價模型性能的指標(biāo)。結(jié)果顯示,通過OLS回歸得出FACT-M與EQ-5D之間的映射模型的性能要好于 CLAD 構(gòu)建的映射模型。Eric Q.Wu等[8]以2002年至2004年期間進(jìn)行的來自7個國家的280例轉(zhuǎn)移性 HRPCA患者的癌癥治療的一般功能評估量表(Functional Assessment of Cancer Therapy-General,FACT-P)數(shù)據(jù)、歐洲癌癥生活質(zhì)量研究、治療組織問卷調(diào)查表(European Organization for Research and Treatment of Cancer Quality of Life Questionnaire,EORTC QLQ-C30)和EQ-5D量表數(shù)據(jù)作為研究樣本,分別以FACT-P和QLQ-C30整體和量表子問題作為解釋變量構(gòu)建多個映射模型,以R2作為性能評價指標(biāo)進(jìn)行模型對比。結(jié)果顯示,不含有 EORTC QLQ-C30指標(biāo)變量的,除FACT-P交叉驗(yàn)證項(xiàng)之外的全部樣本構(gòu)建的與EQ-5D之間的映射模型性能最好。但是Eric Q.Wu[8]指出,只有樣本數(shù)據(jù)全部來自于健康生命質(zhì)量調(diào)查(HRQoL)時,該模型才適用。David Cella等[9]使用Eric Q.Wu等[8]的研究數(shù)據(jù),構(gòu)建剔除年齡和BMI預(yù)測變量的優(yōu)化模型。結(jié)果顯示,R2的置信程度有一定的提升,以此算法能夠更好地構(gòu)建FACT-P與EQ-5D之間的映射模型。
Martin J.Buxton等[10]以克羅恩病臨床試驗(yàn)的3300多例炎癥性腸炎患者填寫的炎癥性腸病問卷(Inflammatory Bowel Disease Questionnaire, IBDQ)、克羅恩病活動指數(shù)(Crohn’s Disease Activity Index,CDAI)、EQ-5D和 SF-6D四份問卷數(shù)據(jù)為研究樣本,以年齡、性別、IBDQ總體得分以及其平方項(xiàng)等作為解釋變量構(gòu)建四個有限最大似然法(Reserved Eaximum Likelihood, REML)映射模型,以R2作為評價指標(biāo)進(jìn)行模型性能對比研究。結(jié)果顯示,IBDQ與SF-6D之間的關(guān)聯(lián)性要好于IBQD與EQ-5D之間的關(guān)聯(lián)性。由此可得,以該方法構(gòu)建的 IBDQ與SF-6D之間的映射模型更好。
Stefan Sauerland等[11]以893例減肥手術(shù)患者的MA-Ⅱ(Moorehead-Ardelt Ⅱ)問卷以及EQ-5D和SF-6D兩份通用問卷的健康相關(guān)生活質(zhì)量(HRQoL)數(shù)據(jù)進(jìn)行了研究。以MA-Ⅱ得分、年齡和性別等人口統(tǒng)計(jì)變量為解釋變量對兩個目標(biāo)量表各構(gòu)建四個多元回歸映射模型,并以R2為評價指標(biāo)進(jìn)行模型性能對比。結(jié)果顯示,在MA-Ⅱ與EQ-5D和SF-6D之間的映射模型中,都是以情緒、身體功能、社會關(guān)系、工作能力和性行為指數(shù)作為解釋變量的函數(shù)模型性能最好。由此得出,該算法可以準(zhǔn)確地將MA-Ⅱ映射到EQ-5D和SF-6D上,且情緒、身體功能、社會關(guān)系、工作能力和性行為是構(gòu)建映射模型的重要因素。
在對慢性阻塞性肺病的映射研究中,Helen J.Starkie等[12]以6112例慢性阻塞性肺病患者的圣喬治呼吸問卷(the St.George’ s Respiratory Questionnaire,SGRQ)和 EQ-5D問卷數(shù)據(jù)為研究樣本,以性別、年齡、SGRQ整體及其變式等作為解釋變量,運(yùn)用OLS、GLM和TPM(Two-part models兩部分模型)各構(gòu)建了六個映射函數(shù)模型,并以R2、MAE和RMSE作為性能評價指標(biāo)進(jìn)行模型選擇。結(jié)果顯示,通過OLS構(gòu)建的SGRQ與EQ-5D之間的映射模型性能最好,能準(zhǔn)確地將SGRQ映射到EQ-5D上。Christopher K.Hoyle等[13]對1658例慢性肺阻塞患者的慢性阻塞性肺疾病評估測試[Chronic Obstructive Pulmonary Disease (COPD) Assessment Test, CAT]臨床數(shù)據(jù)進(jìn)行研究,通過OLS和多元Logistic回歸以及二者的組合共建立六個映射模型,并以 R2、調(diào)整 R2、MAE和RMSE作為性能評價指標(biāo)進(jìn)行模型性能對比。結(jié)果顯示,通過OLS建立的以能量、自信心、活動和胸部緊迫感指數(shù)為解釋變量的模型能夠更好地將CAT得分映射到EQ-5D-3L上。
Maria Ko towska-Hgstr等[14]以3005例生長激素缺乏癥患者的EQ-5D和成人生長激素缺乏癥生活質(zhì)量評估(Quality of Life Assessment of Growth Hormone Deficiency in Adults, QoL-AGHDA)調(diào)查問卷數(shù)據(jù)為例,以年齡、性別、教育程度、QoL-AGHDA問卷總體及其變式等作為解釋變量,分別構(gòu)建簡單和復(fù)雜的多元回歸模型,以R2作為映射模型的性能評價指標(biāo)進(jìn)行對比分析。結(jié)果顯示,以QoL-AGHDA、性別和年齡為解釋變量的復(fù)雜回歸模型性能更好。
Marie Lindkvist和Inna Feldman[15]通過對瑞典和英國的 17000余名受訪者的自評心理健康一般健康12問題問卷(General Health Questionnaire-12, GHQ-12)和EQ-5D-3L(MAUI EuroQoL)問卷數(shù)據(jù)為樣本,以GHQ-12指標(biāo)作為定量變量,自評健康、年齡和性別指數(shù)為相關(guān)變量建立GHQ-12與EQ-5D-UK、GHQ-12與EQ-5D-SW兩個OLS回歸模型。結(jié)果顯示,這兩個回歸模型都展現(xiàn)出良好的性能,GHQ-12與EQ-5D-SW的映射模型性能更好,認(rèn)為該算法構(gòu)建的模型可以很好地進(jìn)行GHQ-12與EQ-5D之間的映射。
Attila J.Pulay等[16]使用匈牙利75例18歲以上注意力缺陷多動障礙患者的臨床數(shù)據(jù)進(jìn)行截面研究,以年齡指數(shù)和臨床嚴(yán)重程度評分為解釋變量,采用多元回歸方程構(gòu)建康納斯成人 ADHD評定量表(Conners’ Adult ADHD Rating Scale, CAARS)與EQ-5D指數(shù)和EQ-5D視覺模擬量表(EQ VAS)之間的映射函數(shù)模型,并以R2和調(diào)整R2來對比兩個映射模型的性能。結(jié)果顯示,CAARS與 EQ-5D的映射模型能夠更準(zhǔn)確地進(jìn)行匈牙利成人注意力缺陷多動障礙患者的健康效用值轉(zhuǎn)換。
Christine Blome等[17]在先人研究的基礎(chǔ)上對德國1511例銀屑病患者的臨床截面數(shù)據(jù)進(jìn)行了重新分析,以皮膚病生活質(zhì)量指數(shù)(Dermatology Life Quality Index, DLQI)整體得分以及DLQI雙變量指數(shù)為解釋變量,各構(gòu)建一個多元線性回歸模型,并以R2作為模型性能評價指標(biāo)進(jìn)行對比分析。結(jié)果顯示,兩種映射模型都展示出較好的性能,包含DLQI雙變量指數(shù)的模型性能更好。由此得出,此算法能夠準(zhǔn)確地建立 DLQI與 EQ-5D VAS之間的映射。Rachel Meacock等[18]以 320例系統(tǒng)性紅斑狼瘡患者的狼瘡生活質(zhì)量問卷(LupusQoL)和SF-6D問卷數(shù)據(jù)為樣本,以身體健康、疼痛、情緒健康和疲勞相關(guān)指數(shù)為解釋變量,使用OLS構(gòu)建LupusQoL和SF6D之間的映射模型,并以R2、MAE和RMSE作為模型性能評價指標(biāo)進(jìn)行對比分析?;貧w結(jié)果顯示,LupusQoL的四個選定相關(guān)指數(shù)可以解釋70%以上的SF-6D效用得分。由此得出,該算法可以準(zhǔn)確地把LupusQoL映射到SF-6D上。X.Badia等[19]運(yùn)用23個歐洲國家的 508例庫欣綜合癥患者的臨床數(shù)據(jù),通過對庫欣綜合癥健康生活質(zhì)量問卷(Cushing Quality of Life Measure, CushingQOL)的問題進(jìn)行不同賦值,構(gòu)建四個ORL模型,并以R2、調(diào)整R2、MAE和RMSE作為評價指標(biāo)進(jìn)行模型性能的對比分析。結(jié)果顯示,該方法建立的映射模型可以解釋50%以上的EQ-5D效用值,可以很好地將CushingQOL映射到EQ-5D上。Emese Herédi等[20]對200例連續(xù)成年中重度銀屑病患者的EQ-5D調(diào)查量表和皮膚病生活質(zhì)量指數(shù)問卷(Dermatology Life Quality Index, QLDI)的截面數(shù)據(jù)為例,以問卷總體得分為解釋變量,通過雙變量和多變量回歸算法建立EQ-5D與DLQI之間的映射模型,并以調(diào)整R2作為指標(biāo)評價模型的性能。結(jié)果顯示,EQ-5D和EQ-5D VAS和DLQI之間的關(guān)聯(lián)性均不理想,并不能很好地建立相關(guān)映射模型。
Ay-Yen Hua等[21]運(yùn)用87例跟腱斷裂患者的阿基里斯肌腱斷裂評分(Achilles Tendon Rupture Score,ATRS)和EQ-5D問卷數(shù)據(jù),以ATRS各項(xiàng)問題賦值為解釋變量,采用OLS分別通過直接映射和交叉驗(yàn)證來構(gòu)建ATRS和EQ-5D之間的映射函數(shù)模型,并以R2作為模型性能評價指標(biāo)進(jìn)行對比分析。結(jié)果顯示,以小腿跟腱/腳疼痛、日常生活活動和在不平地面行走等指數(shù)作為解釋變量的OLS模型能夠準(zhǔn)確建立ATRS和EQ-5D之間的映射模型。
Yongjun Zheng等[22]以272例慢性頸痛患者的臨床數(shù)據(jù)為例,在先人研究基礎(chǔ)上,以頸部殘疾指數(shù)(Neck Disability Index, NDI)整體得分作為解釋變量,使用OLS、GLM、CLAD和Tobit回歸構(gòu)建NDI與SF-6D之間的映射模型,并以R2作為模型性能評價指標(biāo)進(jìn)行不同回歸方法的對比分析。結(jié)果顯示,以上回歸方法構(gòu)建的的映射模型中,在解釋變量中包括NDI娛樂項(xiàng)目的OLS回歸模型的性能最好,能夠較為準(zhǔn)確地建立NDI與SF-6D之間的映射。
Gang Chen等[23]以澳大利亞177例特發(fā)性膀胱過度活動癥患者的臨床調(diào)查數(shù)據(jù)為例,分別以無創(chuàng)性生活質(zhì)量評分(Incontinence Quality of Life, I-QOL)量表總體和I-QOL子量表得分作為解釋變量,通過OLS、穩(wěn)健MM估計(jì)和GLM進(jìn)行模型性能評估。結(jié)果顯示,通過GLM回歸的以I-QOL量表總體為解釋變量的模型性能最好,能夠準(zhǔn)確地將IQOL映射到生活質(zhì)量八維評估問卷(Assessment of Quality of Life 8D, AQoL-8D)上。Anthony James Hatswell等[24]在先人研究的基礎(chǔ)上以 439例阿片類藥物引起便秘患者的臨床研究數(shù)據(jù),通過OLS分別以便秘生活質(zhì)量評分總體以及子量表分?jǐn)?shù)為解釋變量建立映射模型,并以調(diào)整R2和RMSE作為模型性能評價指標(biāo)進(jìn)行分析。結(jié)果顯示,該模型的R2和RMSE均較差,不足以將便秘生活質(zhì)量評估量表(Patient Assessment of Constipation Quality of Life, PAC-QOL)映射到EQ-5D-3L上。Mark Parker等[25]以5000余例阿片類藥物引起便秘患者的檢查在慢性便秘普盧卡必利臨床試驗(yàn)中產(chǎn)生的便秘患者評估量表(Patient Assessment of Constipation-QOL, PAC-QOL)以及 EQ-5D和SF-6D量表數(shù)據(jù)為分析樣本,通過構(gòu)建多元回歸模型分別以PAC-QOL總體得分以及子項(xiàng)目得分為解釋變量構(gòu)建映射模型,并以調(diào)整R2、RMSE作為評價模型性能的指標(biāo)。結(jié)果顯示,PAC-QOL與EQ-5D之間的相關(guān)性更好,以PAC-QOL總體得分與EQ-5D構(gòu)建的映射模型的指標(biāo)最優(yōu),但并不能滿足臨床應(yīng)用要求,且部分指標(biāo)的選取并不恰當(dāng),仍需進(jìn)一步優(yōu)化。
Y.B.Cheung等[26]以324例帕金森病患者的研究數(shù)據(jù)為例,以八項(xiàng)帕金森病調(diào)查問卷(Eightitem Parkinson’ s Disease Questionnaire, PDQ-8)的子問題得分作為解釋變量,分別通過OLS和CLAD構(gòu)建映射模型,以MAE作為模型性能評價指標(biāo)進(jìn)行對比分析。結(jié)果顯示,OLS構(gòu)建的映射模型性能更好,能解釋50%以上的EQ-5D效用值,說明該方法可以較準(zhǔn)確地將PDQ-8映射到EQ-5D上。
Badia X[27]以245例肢端肥大癥患者的AcroQoL和EQ-5D評分?jǐn)?shù)據(jù)為研究樣本,以AcroQoL總體得分及其子問題賦值為解釋變量,以調(diào)整 R2和 MAE作為模型性能評價指標(biāo)構(gòu)建TPM、Tobit模型和GAM(Generalized Additive Model, 廣義相加模型)進(jìn)行對比研究。結(jié)果顯示,以GAM回歸構(gòu)建的映射模型性能最好,可以建立AcroQoL和EQ-5D之間的高相關(guān)性映射模型。
在當(dāng)前研究中針對青少年人群的特異性研究較少,能檢索到給出明確映射關(guān)系的是疾病特異性量表與普適性量表之間的映射研究,僅有3例。Carlos King Ho Wong等[28]以227例青少年特發(fā)性脊柱側(cè)凸(AIS)患者數(shù)據(jù)為例,通過OLS,以精編脊柱側(cè)凸研究學(xué)會22問題量表(Refined Scoliosis Research Society 22-item, SRS-22r)子問題得分和人口統(tǒng)計(jì)學(xué)指標(biāo)作為解釋變量進(jìn)行組合,構(gòu)建三個模型對SRS-22r和EQ-5D-5L進(jìn)行映射。結(jié)果顯示,以功能/活動、疼痛、外觀、精神健康以及Cobb角指數(shù)作為解釋變量的模型與EQ-5D-5L關(guān)聯(lián)性最好,能夠較為精確地將青少年 AIS患者的非偏好生命質(zhì)量信息轉(zhuǎn)換為EQ-5D-5L健康效用值。Gang Chen等[29]以590名澳大利亞11~17歲青少年的KIDSCREEN-10和兒童保健九維效用量表(Child Health Utility 9D, CHU- 9D)數(shù)據(jù)為例,以KIDSCREEN-10子項(xiàng)目得分作為解釋變量,構(gòu)建OLS、CLAD、MM估計(jì)和GLM模型,并以MAE和RMSE作為模型性能評價指標(biāo)進(jìn)行對比分析。結(jié)果顯示,MM估計(jì)模型和OLS模型的預(yù)測性能較好,可以準(zhǔn)確地將 KIDSCREEN-10映射到CHU-9D上。Helen Dakin等[30]以217例中耳炎與積液兒童的臨床數(shù)據(jù)為研究樣本,以中耳炎問卷 8-30問題(Otitis Media Questionnaire 8-30, OM8-30)的各個項(xiàng)目以及年齡、性別等人口統(tǒng)計(jì)學(xué)指標(biāo)作為解釋變量,通過OLS、GLM和兩步回歸法,以R2和MAE作為模型性能評價指標(biāo)進(jìn)行 OM8-30與 HUI-2和HUI-3之間的映射研究。結(jié)果顯示,以代表聽力水平(HL)的九個OM8-30子問題以及年齡和性別指數(shù)作為解釋變量的OLS模型性能最好,且OM8-30與HUI-3之間的映射模型性能要好于OM8-30與HUI-2之間的映射模型。
2.1.2 國內(nèi)研究 付希婧等[31]以我國 676例肺癌患者的基本信息、肺癌治療的功能評估量表(Functional Assessment of Cancer Therapy-Lung, FACT-L)中文版(V4.0)及中文版EQ-5D數(shù)據(jù)為例,以基本信息、FACT-L中文版(V4.0)及中文版EQ-5D數(shù)據(jù)為研究樣本,以FACT-L各項(xiàng)得分與年齡和性別指數(shù)為解釋變量,運(yùn)用OLS、GLM、Tobit模型、CLAD以及分位數(shù)回歸模型分別采用中、日、英版效用值積分體系進(jìn)行映射研究,以R2、MAE和RMSE作為模型性能評價指標(biāo)進(jìn)行對比分析。結(jié)果顯示,基于我國人群構(gòu)建的FACT-L與EQ-5D之間的映射模型的預(yù)測能力良好,能夠較為精確地將我國肺癌患者的非偏好生命質(zhì)量信息轉(zhuǎn)換為健康效用值。這是目前能檢索到的我國唯一關(guān)于映射法的實(shí)證研究。
2.2 已給出明確函數(shù)關(guān)系式的普適性量表之間的映射研究 一部分學(xué)者對普適性量表之間的映射模型進(jìn)行研究,并得出了映射函數(shù),此類研究相對于疾病特異性量表與普適性量表之間的映射研究來說要少得多,給出映射函數(shù)的研究更少,查閱到的文獻(xiàn)中僅有2篇[32-33]屬于此類文獻(xiàn),全部來自國外研究,見表2。
Ara.R等[32]使用12個臨床研究期間收集的6350例結(jié)腸癌患者水平數(shù)據(jù),以SF-36的不同子問題為解釋變量建立七個OLS模型,將R2、MAE和RMSE作為評價模型性能的指標(biāo)進(jìn)行不同映射模型的對比分析。結(jié)果顯示,以身體功能(PF)、社會功能(SF)、身體問題(RP)、情緒問題(RE)、心理健康(MH)、活力(VT)、疼痛(BP)和總體健康(GH)感覺得分為解釋變量的SF-36模型與EQ-5D的關(guān)聯(lián)性最好。由此可得,該算法構(gòu)建的映射模型能夠較為精確地將結(jié)腸癌患者的生命質(zhì)量信息轉(zhuǎn)換為EQ-5D健康效用值。
Agata Carre?o等[33]根據(jù)美國風(fēng)濕病學(xué)會診斷標(biāo)準(zhǔn),以244例年齡在18歲及以上的西班牙類風(fēng)濕性關(guān)節(jié)炎患者的殘疾健康評估指數(shù)(Health Assessment Questionnaire-Disability Index, HAQ-DI)、衛(wèi)生健康指數(shù)第3版(Health Utilities Index-3, HUI-3)和EQ-5D三個通用HRQoL問卷數(shù)據(jù)為研究樣本,以性別、年齡等人口統(tǒng)計(jì)學(xué)變量以及臨床活動指數(shù)作為解釋變量,構(gòu)建兩個線性回歸模型預(yù)測HUI-3和EQ-5D對HAQ-DI的評分,并以調(diào)整R2作為評價模型性能的指標(biāo)進(jìn)行對比分析。結(jié)果顯示,人口統(tǒng)計(jì)學(xué)變量對映射模型的性能無影響,HAQ-DI與HUI-3之間的映射模型綜合性能比HAQ-DI與EQ-5D的映射函數(shù)模型更好。
2.3 未給出明確函數(shù)關(guān)系式的疾病特異性量表與普適性量表之間的映射研究 在當(dāng)前疾病特異性量表與普適性量表之間的映射研究中,一部分學(xué)者沒有得出明確的映射函數(shù),或者因?yàn)槟P托阅懿缓脽o法得出。共檢索到的此類文獻(xiàn)共16篇[34-49]。
Yin-Bun Cheung等[34]以558例新加坡癌癥患者臨床數(shù)據(jù)為例,以軀體、情感和功能狀況維度得分作為解釋變量,分別通過OLS和CLAD對癌癥治療功能評價量表FACT-G的中、英文兩版與EQ-5D進(jìn)行映射,以R2和MAE作為模型性能評價指標(biāo)進(jìn)行對比研究。結(jié)果顯示,F(xiàn)ACT-G的社會和家庭維度與EQ-5D效用指數(shù)關(guān)聯(lián)性差。兩種模型相比,CLAD構(gòu)建的算法性能更佳,能夠精確地將中、英兩版FACT-G效用值映射到EQ-5D上。Seon Ha Kim等[35]以 893例韓國癌癥患者為研究對象,根據(jù)收集的臨床數(shù)據(jù)通過OLS以歐洲癌癥研究和治療組織生活質(zhì)量核心-30問卷(European Organization for Research and Treatment of Cancer Quality of Life Questionnaire Core-30, EORTC QLQ-C30)的軀體、角色、情緒和疼痛指數(shù)作為解釋變量構(gòu)建多元線性回歸模型,選取RMSE作為評價模型性能的指標(biāo)。結(jié)果顯示,此算法可以很好地建立QLQ-C30與EQ-5D之間的映射模型,能夠用于韓國癌癥患者的效用值轉(zhuǎn)換。Eun-ju Kim等[36]以韓國199例轉(zhuǎn)移性乳腺癌患者的臨床研究數(shù)據(jù)為研究樣本,以EORTC QLQ-C30和歐洲癌癥研究和治療組織生活質(zhì)量乳腺癌23問卷(European Organization for Research and Treatment of Cancer Quality of Life Questionnaire Breast Cancer-23, EORTC QLQ-BR23)問卷的子項(xiàng)目作為解釋變量,通過OLS構(gòu)建六個模型,以R2、MAE和RMSE作為評價模型性能的指標(biāo)進(jìn)行QLQ-C30、QLQ-BR23與EQ-5D之間的映射研究。結(jié)果顯示,使用QLQ-C30的子項(xiàng)目得分的回歸模型性能最佳,具有良好的預(yù)測有效性。Nick Kontodimopoulos[37]以671例乳腺癌、骨髓瘤、結(jié)腸直腸癌、淋巴瘤、骨髓癌、前列腺癌、肺癌和胃腸癌的患者數(shù)據(jù)為研究樣本,以 OLS、GLM、CLAD和貝葉斯加性回歸(Bayesian additive regressionkernels)構(gòu)建回歸模型,并將調(diào)整R2作為評價模型性能的指標(biāo)進(jìn)行QLQ-C30與SF-6D的映射模型對比研究。結(jié)果顯示,QLQ-C30的全球健康項(xiàng)目、身體、情緒和社會功能量表、疲勞、疼痛和腹瀉癥狀是所有模型的重要預(yù)測指標(biāo),而對于健康狀況最差的患者,所有模型對公共事業(yè)都存在過度預(yù)測。由此可得,該算法雖可以建立QLQ-C30與SF-6D的映射函數(shù),但其性能需要進(jìn)一步提升。
表2 普適性量表之間的映射函數(shù)式一覽表
Evangelos Kalaitzakis等[38]以英國牛津郡和瑞典西約塔蘭省的所有原發(fā)性硬化性膽管炎患者的SF-6D和慢性肝病調(diào)查問卷(Chronic Liver Disease Questionnaire, CLDQ)數(shù)據(jù)為研究樣本,將 CLDQ問卷中的疲勞、全身癥狀和情緒困擾等指標(biāo)得分作為解釋變量,構(gòu)建OLS、GLM、中值和核回歸模型,并以調(diào)整R2、RMSE以及Pearson的r系數(shù)和預(yù)測值與觀測值之間的MAE來評價模型性能。結(jié)果顯示,通過 OLS、廣義線性回歸和中值回歸模型性能均表現(xiàn)良好,可認(rèn)為此算法能夠準(zhǔn)確地將CLDQ映射到SF-6D上。
Faraz Mahmood Ali等[39]以4010例皮膚病患者的臨床數(shù)據(jù)為例,以年齡、性別和皮膚病生活質(zhì)量指數(shù)(Dermatology Life Quality Index, DLQI)的所有子項(xiàng)目作為解釋變量,構(gòu)建十個 OLR(序數(shù)邏輯回歸)模型,以MAE和MSE作為評價模型性能的指標(biāo)進(jìn)行DLQI與EQ-5D之間的健康效用映射研究。結(jié)果顯示,該算法構(gòu)建的映射模型的預(yù)測性能良好,能夠較為精確地將皮膚病患者的生命質(zhì)量信息轉(zhuǎn)換為EQ-5D健康效用值。
Irina Proskorovsky等[40]以英國和德國的154例多發(fā)性骨髓瘤患者的研究數(shù)據(jù)為例,以骨髓瘤生活質(zhì)量20問卷(Quality of Life Questionnaire Myeloma-20,QLQ-MY20)總體及其子項(xiàng)目得分為解釋變量,建立多變量回歸模型并進(jìn)行交叉驗(yàn)證。結(jié)果顯示,在包括QLQ-MY20總體評分的模型中,以健康狀況/生活質(zhì)量、身體功能、疼痛和失眠為解釋變量的回歸模型性能最好,不包括QLQ-MY20總體評分的模型中,以健康狀況/生活質(zhì)量、身體功能、疼痛和情緒功能的模型性能最好。兩個模型均可以有效地將QLQ-MY20映射到EQ-5D上。
Sarah Acaster等[41]以401例英國囊性纖維化患者的囊性纖維化問卷修訂版(Cystic Fibrosis Questionnaire-Revised, CFQ-R)、EQ-5D和背景調(diào)查數(shù)據(jù)為研究樣本,以CFQ-R所有項(xiàng)目及其平方項(xiàng)等虛擬變量作為解釋變量,運(yùn)用OLS、Tobit和TPM共構(gòu)建八個模型,以RMSE作為模型性能的評價指標(biāo)進(jìn)行評估。結(jié)果顯示,以CFQ-R所有項(xiàng)目和以角色及情緒功能、活力、飲食紊亂、體重、消化癥狀等為虛擬變量的兩個模型性能最好??梢圆捎迷撍惴ㄟM(jìn)行CFQ-R與EQ-5D之間的健康效用值映射。
Yingsi Yang等[42]以553例中國結(jié)腸直腸腫瘤患者的健康調(diào)查數(shù)據(jù)為研究樣本,對經(jīng)過三次樣條平滑(Cubic spline smoothing and multiple imputation)后的數(shù)據(jù)通過OLS、Tobit和TPM構(gòu)建映射函數(shù),并以R2作為模型性能評價指標(biāo)與以原始數(shù)據(jù)構(gòu)建的映射模型進(jìn)行性能對比。結(jié)果顯示,與原始數(shù)據(jù)模型相比,擬合三次樣條平滑變換數(shù)據(jù)的模型在擬合度和預(yù)測能力方面具有更好的性能,且OLS模型的擬合優(yōu)度和性能最佳。以此種方法可以很好地構(gòu)建結(jié)腸直腸癌治療的功能評估量表(Functional Assessment of Cancer Therapy-Colorectal, FACT-C)與SF-6D之間的映射模型。
Padraig Dixon等[43]以482例黃斑變性患者的實(shí)驗(yàn)數(shù)據(jù)為例,以黃斑變性生活質(zhì)量量表(Macular Degeneration Quality of Life, MacDQoL)的23個子項(xiàng)目得分以及加權(quán)值為解釋變量,使用OLS、CLAD、Tobit和TPM構(gòu)建MacDQoL與EQ-5D-3L之間的映射,并以MSE作為模型性能的評價指標(biāo)進(jìn)行對比分析。結(jié)果顯示,TPM具有最佳的預(yù)測性能,以此算法構(gòu)建的MacDQoL與EQ-5D-3L之間的映射模型有一定的臨床應(yīng)用價值,但其對EQ-5D-3L的上下兩端的預(yù)測性能一般,仍需要進(jìn)一步優(yōu)化。
Patrick J.Gillard等[44]以多國家的8000余例偶發(fā)性和慢性偏頭痛患者的數(shù)據(jù)為研究樣本,通過 OLS構(gòu)建回歸模型以與頭痛影響6問題測試(Headache Impact Test-6, HIT-6)和偏頭痛特異性生活質(zhì)量問卷2.1版(Migraine-Specific Quality-of-Life Questionnaire version 2.1, MSQ)子項(xiàng)目得分作為解釋變量,以R2作為評價映射模型性能的指標(biāo)進(jìn)行EQ-5D與HIT-6和MSQ之間的映射模型的對比分析。結(jié)果顯示,兩項(xiàng)研究的總體性能均表現(xiàn)一般,均不能很好地建立與EQ-5D之間的映射模型,且偶發(fā)性偏頭痛研究的映射模型的性能不及慢性偏頭痛的映射模型。
Ben F.M.Wijnen等[45]以荷蘭和英國兩個臨床試驗(yàn)的509例癲癇患者數(shù)據(jù)為例,以癲癇生活質(zhì)量-31頁(Quality of Life in Epilepsy, QOLIE-31P)量表各項(xiàng)目得分及其加權(quán)變量作為解釋變量,使用OLS和CLAD構(gòu)建QOLIE-31P與EQ-5D-5L之間的映射模型,并以調(diào)整R2作為模型性能的評價指標(biāo)進(jìn)行對比研究。結(jié)果顯示,兩個映射模型研究的顯著相關(guān)性均一般,具有平方項(xiàng)的OLS回歸模型性能相對較好。
Rafael A.Pinedo-Villanueva等[46]以1759例髖關(guān)節(jié)手術(shù)患者的臨床數(shù)據(jù)為例,構(gòu)建以牛津髖關(guān)節(jié)評分(Oxford Hip Score, OHS)總體作為連續(xù)回歸因子的線性回歸、以12個OHS問題的響應(yīng)作為分類預(yù)測因子的 OLS、TPM、相應(yīng)映射模型進(jìn)行 OHS與EQ-5D之間的映射研究,并以MAE作為映射模型的性能評價指標(biāo)進(jìn)行各個模型的對比研究。結(jié)果顯示,OLS模型的性能最好,可以很好地將 OHS映射到EQ-5D上。
Ning Yan Gu等[47]以2842例有失眠問題的成年美國居民的截面數(shù)據(jù)為研究樣本,分別以失眠嚴(yán)重程度指數(shù)(Insomnia Severity Index, ISI)的七個子項(xiàng)目、ISI總分、臨床類別和失眠癥狀得分作為解釋變量,構(gòu)建GLM進(jìn)行失眠嚴(yán)重程度指數(shù)(ISI)與EQ-5D之間的映射,并以MAE和MSE作為評價映射模型的指標(biāo)進(jìn)行對比研究。結(jié)果顯示,包含失眠癥狀的模型在對EQ-5D效用值的預(yù)測能力上展現(xiàn)出最好的性能。
Ola Ghatnekar等[48]以瑞典272例腦卒中患者的健康相關(guān)的生活質(zhì)量(Health Related Quality of Life,HRQoL)臨床數(shù)據(jù)為例,以穿衣(dressing)、上廁所(toileting)、活動(mobility)、情緒(mood)、一般健康(general health)和代理響應(yīng)(proxy-responders)指數(shù)等為解釋變量,通過OLS、Tobit和CLAD進(jìn)行將腦卒中健康指標(biāo)與EQ-5D的映射研究,并通過預(yù)測性能指標(biāo)MAE和MSE對不同方法構(gòu)建的映射模型進(jìn)行對比分析。結(jié)果顯示,各模型均存在估計(jì)偏差問題,性能均不是很高,無法很好地構(gòu)建腦卒中健康指標(biāo)與EQ-5D之間的映射模型。
Daniel Collado-Mateo等[49]以西班牙129例纖維肌痛女性患者的EQ-5D-5L、15D、AQoL-8D和SF-12四份普適性問卷以及特異性疾病量表纖維肌痛影響問卷(Fibromyalgia Impact Questionnaire, FIQR)的數(shù)據(jù)為研究樣本,以各個量表的子項(xiàng)目得分為解釋變量構(gòu)建OLS和GLM映射模型,并以MAE作為評價模型性能的指標(biāo)進(jìn)行映射模型的對比分析。結(jié)果顯示,F(xiàn)IQR與EQ-5D-5L、15D、AQoL-8D和SF-12之間的GLM映射模型性能更好,能夠準(zhǔn)確地進(jìn)行健康效用值的轉(zhuǎn)換。
2.4 未給出明確函數(shù)關(guān)系式的普適性量表之間的映射研究 在普適性量表之間的映射研究中,學(xué)者對樣本的選取有所不同,可以以多種疾病的數(shù)據(jù)集合作為樣本,也可以以一種疾病的數(shù)據(jù)作為研究樣本。目前,關(guān)于普適性量表之間的映射研究較少,且映射模型的性能普遍不好,無法滿足臨床運(yùn)用要求,這也是此類研究較少的原因,在檢索的文獻(xiàn)中僅有3篇[50-52]屬于此類文獻(xiàn)。
Quang A.Le[50]使用來自2003年醫(yī)療支出小組調(diào)查的19 678名成年人的樣本數(shù)據(jù),通過實(shí)施五重交叉驗(yàn)證,采用多項(xiàng)Logist回歸、OLS和CLAD構(gòu)建映射模型,以R2、MAE和RMSE評估貝葉斯網(wǎng)絡(luò)(Bayesian networks)的概率映射的預(yù)測性能。結(jié)果顯示,使用貝葉斯網(wǎng)絡(luò)的概率映射法優(yōu)于其他映射方法,可以準(zhǔn)確地建立SF-12與EQ-5D之間的映射。Donna Rowen等[51]以3100余項(xiàng)臨床數(shù)據(jù)為例,以SF-36維度總體以及交互項(xiàng)構(gòu)建三個GLS映射模型,并以MAE和MSE作為模型性能評價指標(biāo)與先前的研究結(jié)果進(jìn)行比較。結(jié)果顯示,在三個模型中,具有平方項(xiàng)和交互項(xiàng)的模型性能最好,但總體擬合程度一般,且平均絕對誤差也相對較高。因此,該算法構(gòu)建的模型并不能很好地將SF-12映射到EQ-5D上。
Seon-Ha Kim[52]以韓國2211例結(jié)腸癌患者的數(shù)據(jù)為例,使用OLS、TPM和使用八個量表得分的多項(xiàng)邏輯建模分析預(yù)測模型,以總得分和SF-36的交互項(xiàng)作為解釋變量進(jìn)行SF-36與EQ-5D之間的映射研究,并以R2和RAE作為指標(biāo)衡量標(biāo)準(zhǔn)。結(jié)果顯示,以O(shè)LS模型(包括身體功能、身體疼痛、社交功能、角色情緒和心理健康)得出的映射模型性能最佳,能夠準(zhǔn)確地將SF-36映射到EQ-5D上。
通過對當(dāng)前國內(nèi)外的實(shí)例研究文獻(xiàn)進(jìn)行分析,總結(jié)歸納出當(dāng)前研究的主要對象、初始量表和靶向量表的選取、解釋變量與因變量、計(jì)量經(jīng)濟(jì)學(xué)方法以及性能評價指標(biāo)情況如表3所示。
3.1 數(shù)據(jù)源及研究對象的選擇 從研究對象來看,健康人群和患病人群均為研究的樣本對象,當(dāng)前對患病人群的研究較多。研究疾病包括糖尿病、癌癥、帕金森綜合癥、關(guān)節(jié)炎等;從樣本選擇來看,樣本量從數(shù)十例到幾萬例不等,大部分?jǐn)?shù)據(jù)的來源為臨床試驗(yàn),受試者主要來源于社區(qū)居民以及醫(yī)院的就診人群。
3.2 測量工具的選擇 從初始量表來看,大多數(shù)研究選用疾病特異性量表,如成人生長激素缺乏癥的生活質(zhì)量評估量表 QoL-AGHDA、類風(fēng)濕性關(guān)節(jié)炎生活質(zhì)量評估量表 HAQ-DI等,因?yàn)榧膊√禺愋粤勘砟軌蚋玫胤从诚嚓P(guān)指標(biāo),一小部分學(xué)者選用普適性健康狀態(tài)測量量表,如SF系列量表等;從目標(biāo)量表來看,目前選用最多的是英國的EQ-5D效用值體系計(jì)算健康效用值,也有一部分研究以AQoL-8D、HUI-2、HUI-3或SF-6D作為目標(biāo)量表。
3.3 指標(biāo)變量的選取及建模方法 在檢索到的映射研究文獻(xiàn)中,模型的構(gòu)建多以人口統(tǒng)計(jì)學(xué)指標(biāo)、疾病分級、總分、維度得分、量表?xiàng)l目得分以及各條目水平虛擬變量作為解釋變量,以效用指數(shù)和各維度得分為因變量,常用的計(jì)量經(jīng)濟(jì)學(xué)模型有 OLS、Tobit、CLAD等。除此之外,一些學(xué)者經(jīng)常運(yùn)用TPM、多分類邏輯回歸(Multinominal logit model)、廣義線性回歸、分位數(shù)回歸、潛類別混合模型、受限混合模型等進(jìn)行映射研究。為了更精確地得出映射模型,一些學(xué)者會采用多種模型同時構(gòu)建效用值的方法,這樣能夠通過對比得出最優(yōu)的映射方法。在對映射性能的評價指標(biāo)選擇上,根據(jù)擬合能力和預(yù)測能力分為兩類:擬合能力一般以顯著性、回歸系數(shù)、R2、調(diào)整R2、Ramsey RESET檢驗(yàn)、Jarque-Bera檢驗(yàn)等作為評價指標(biāo);預(yù)測能力多采用穩(wěn)健標(biāo)準(zhǔn)誤差、均方誤差、平均絕對誤差、觀測值與預(yù)測值散點(diǎn)圖和相關(guān)系數(shù)等指標(biāo)進(jìn)行評價[53]。A.Tscuhiya等[54]學(xué)者根據(jù)初始量表和目標(biāo)量表的選取情況,將當(dāng)前映射研究中各類模型分為六大類型,見表4。
解釋變量A為初始量表總分,M為靶向量表效用指數(shù),μ為干擾項(xiàng)。d為初始量表維度個數(shù),i為初始量表?xiàng)l目項(xiàng)數(shù),1為條目等級個數(shù),Md為靶向量表各維度得分;模型2和5中的Ax為各維度的分,模型3中的Ax為各條目得分,模型4中的Axy為條目x的等級y,是虛擬變量。在最后對預(yù)測模型進(jìn)行調(diào)整時,還可以加入平方項(xiàng)和交互項(xiàng)以提高預(yù)測精度[31]。
表3 國內(nèi)外現(xiàn)有映射法研究情況
表4 現(xiàn)有研究映射模型類型
4.1 拓寬靶向量表的選取種類 目前國內(nèi)外的相關(guān)研究中,多數(shù)學(xué)者選擇EQ-5D系列作為靶向量表,但很多研究的結(jié)果顯示,以EQ-5D系列量表作為靶向量表的映射函數(shù)性能并不能達(dá)到臨床應(yīng)用標(biāo)準(zhǔn)。因此,建議學(xué)者在選擇靶向量表時,應(yīng)根據(jù)該研究的情況綜合考慮各個靶向量表的特點(diǎn)和適用性進(jìn)行選擇,以求得到和更好的映射結(jié)果。
4.2 盡可能運(yùn)用多種回歸方法構(gòu)建映射模型,并進(jìn)行性能對比 目前國內(nèi)外的相關(guān)研究中,多數(shù)的映射結(jié)果是通過OLS方法獲得,其次是GLM方法。也有學(xué)者的研究結(jié)果表示,最優(yōu)的映射是通過CLAD、QR、Tobit和 TPM 等回歸方法獲得,但此類研究數(shù)量較少。建議學(xué)者在回歸方法選擇上應(yīng)多探索新方法,以不同回歸方法構(gòu)建多個函數(shù)模型,采用相關(guān)的擬合指標(biāo)和預(yù)測指標(biāo)進(jìn)行映射模型的性能對比。
4.3 加大樣本量,合理利用解釋變量 目前國內(nèi)外的相關(guān)研究中,大部分研究的樣本量較少,研究結(jié)果的可信度不高,建議學(xué)者加大對樣本數(shù)據(jù)的收集,降低研究誤差;在構(gòu)建回歸模型時,解釋變量的選取會對映射模型的性能有很大影響,而目前大多數(shù)研究并沒有對不同指標(biāo)變量的影響程度進(jìn)行分析,這是導(dǎo)致部分學(xué)者研究結(jié)果不理想的原因之一。Stefan Sauerland[11]、Emese Here’di[20]以及 Anthony James Hatswell[24]這三篇文獻(xiàn)雖然給出了映射模型,但性能不理想,無法達(dá)到臨床應(yīng)用標(biāo)準(zhǔn)。模型性能在很大程度上與解釋變量的選取有關(guān),建議在解釋變量選取時應(yīng)根據(jù)實(shí)際情況建立多個回歸模型檢驗(yàn)不同解釋變量組合的模型性能,以獲得最優(yōu)的映射模型。
4.4 拓寬研究領(lǐng)域,開展全面深入研究 在研究目標(biāo)的選擇上,多數(shù)研究選擇全人類為樣本,針對特定年齡、性別等人口統(tǒng)計(jì)學(xué)變量的相關(guān)研究很少,在查閱到的國內(nèi)外文獻(xiàn)中僅有一例關(guān)于女性[49]、三例關(guān)于兒童[28-30]的研究。建議學(xué)者拓寬研究領(lǐng)域,對不同年齡、不同性別的人群進(jìn)行特異性研究,使得映射模型更好地進(jìn)行臨床運(yùn)用;現(xiàn)有的研究中對重大疾病和慢性疾病的研究較多,對普通疾病的相關(guān)研究幾乎沒有,建議學(xué)者在普通疾病的映射研究領(lǐng)域多進(jìn)行探索。
在檢索中發(fā)現(xiàn),大多數(shù)映射模型都是建立在普適性量表與疾病特異性量表和兩種普適性量表之間,對疾病特異性量表之間映射關(guān)系的實(shí)證研究尚未檢索到相關(guān)文獻(xiàn),Emese Herédi等[20]給出了兩種疾病特異性量表之間的相關(guān)性指標(biāo),但并未做深入分析。構(gòu)建針對同一種疾病的特異性量表之間的映射模型在臨床應(yīng)用中有重要的意義。
目前,國內(nèi)映射法研究偏重于映射法的敘述研究。在相關(guān)實(shí)證研究中,國外的相關(guān)工作已經(jīng)很成熟,已構(gòu)建了多種疾病的映射模型。與國外相比,國內(nèi)對于映射法的相關(guān)研究極少,對映射法的實(shí)證研究僅有一例。建議研究人員對映射法進(jìn)行多方面、多領(lǐng)域的研究,探索不同計(jì)量經(jīng)濟(jì)學(xué)方法、模型類型。隨著社會各界的關(guān)注以及國家對映射法研究的大力支持,我國的映射法研究一定會有重大的的突破和進(jìn)展。