林 悅,張杏姍,郭俊豪,陳文丹,萬崇華,潘海燕△
(1.廣東醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,廣東東莞 523808;2.廣東醫(yī)科大學(xué)生命質(zhì)量與應(yīng)用心理研究中心/生命質(zhì)量與心理測評干預(yù)重點實驗室,廣東東莞 523808)
腎病綜合征(nephrotic syndrome,NS)是指腎小球基膜通透性增加而引起的病理生理改變的慢性疾病綜合征,主要表現(xiàn)為大量蛋白尿、低蛋白血癥、水腫及高脂血癥[1]。NS可見于任何年齡段,具有表現(xiàn)明顯、病程長、治療難度大且易復(fù)發(fā)等特點,降低了患者的生活質(zhì)量[2-3]。據(jù)世界衛(wèi)生組織統(tǒng)計顯示,截至2019年全球因腎病而導(dǎo)致的死亡率已經(jīng)從2000年的第13位上升至第10位,死亡人數(shù)從81.3萬增加至130.0萬左右,影響世界約11%的人口,對人類的健康造成嚴(yán)重危害。相關(guān)調(diào)查數(shù)據(jù)顯示,在我國約有 1.4 億人患有慢性腎病,且患者數(shù)量還在不斷增多,情況不容樂觀[4]。治療NS的方法主要使用激素和免疫抑制劑,但往往伴隨著高感染及多種不良反應(yīng)發(fā)生風(fēng)險,嚴(yán)重影響NS患者的生命質(zhì)量[5-8]?;颊叩牟∏槿绻麤]有得到及時控制,則會損害腎臟的正常功能,病情嚴(yán)重時會使得腎臟衰竭,因此治療腎臟疾病的療程較長,對患者的身體、心理、精神等造成不同程度的影響。因此,如何促使患者生命質(zhì)量得到提升至關(guān)重要。
隨著現(xiàn)代醫(yī)學(xué)的不斷進(jìn)步,醫(yī)學(xué)模式發(fā)生了重大改變,人們逐漸從生物、心理、社會等不同層面入手來重新認(rèn)識人類疾病與健康[9]。目前,可用于調(diào)研NS患者生命質(zhì)量的量表種類和分類較為復(fù)雜多樣,如普適性量表少兒主觀生活質(zhì)量問卷[10]、多維工具的兒童生活質(zhì)量問卷(PedsQLTM4.0)[11]、生活質(zhì)量測定量表[12]、健康調(diào)查簡表(SF-36)[13]等,這些普適性量表通常存在以下問題:(1)無法將患者群的疾病特點悉數(shù)展現(xiàn),在反映患者生命質(zhì)量改變的程度方面較差;(2)面對眾多量表,科研人員在選擇合適的量表作為調(diào)查工具時存在一定的難度;(3)部分量表由國外學(xué)者研制,與我國經(jīng)濟(jì)、文化、教育等差異較大。為此,本研究團(tuán)隊研制出了慢性疾病之腎病綜合征生命質(zhì)量測定[quality of life instruments for chronic diseases-nephrotic syndrome,QLICD-NS(V2.0)]量表[14],包含生理功能、心理功能、社會功能、特異模塊4個領(lǐng)域,特異模塊包含 15 個條目,條目內(nèi)容包括臨床癥狀、藥物不良反應(yīng)和心理影響3個方面,各領(lǐng)域和總量表的 Cronbach’s α 系數(shù)和分半信度均>0.70;以中文版SF-36為校標(biāo),QLICD-NS(V2.0)量表各領(lǐng)域與其類似領(lǐng)域的相關(guān)性較高。除認(rèn)知、社會支持條目,其余領(lǐng)域或條目標(biāo)準(zhǔn)反應(yīng)均數(shù)(SRM)均>0.80,尚可認(rèn)為 QLICD-NS(V2.0)量表的反應(yīng)度良好。然而以上經(jīng)典測量理論的測評有一定的局限性[15-16]。
概化理論(generalizability theory,GT)屬于現(xiàn)代測量理論的一種,可體現(xiàn)量表中每個領(lǐng)域或側(cè)面的信度,同時結(jié)合方差分析的固有屬性,獲得量表的概化系數(shù)和可靠性指數(shù)[17]。項目反應(yīng)理論(item response theory,IRT)也屬于現(xiàn)代測量理論的一種,它是從微觀的角度去分析每一條條目的特性,分析被調(diào)查者潛在特質(zhì)與條目之間的關(guān)系,可用于分析量表條目的難易程度、區(qū)分度等特征[18]。因此,本文采取GT和IRT對量表條目進(jìn)行深入分析。
選取2020年6月至2021年11月廣東醫(yī)科大學(xué)附屬醫(yī)院腎病內(nèi)科就診的NS患者為調(diào)查對象。納入標(biāo)準(zhǔn):(1)符合NS的診斷標(biāo)準(zhǔn);(2)小學(xué)文化程度及以上,患者具有閱讀、理解能力,能夠自行或協(xié)助完成問卷(若為未成年患者,在獲得監(jiān)護(hù)人知情同意后由監(jiān)護(hù)人協(xié)助患兒填寫問卷);(3)非病重病危、未伴發(fā)其他嚴(yán)重疾病。排除標(biāo)準(zhǔn):(1)患有精神疾病,思維意識混亂等患者;(2)文盲;(3)拒絕配合調(diào)查的患者。調(diào)研人員對患者簡單說明調(diào)查目的及填寫方法,征得患者同意后(若為未成年患者,需獲得監(jiān)護(hù)人的知情同意),分發(fā)調(diào)查表[即QLICD-NS(V2.0)量表]給患者,患者完成填寫后回收調(diào)查表并核對調(diào)查表是否有缺漏項,若發(fā)現(xiàn)有則現(xiàn)場讓患者補(bǔ)充。選擇部分患者進(jìn)行第2次測定,使用與第1次調(diào)查相同的調(diào)查表,目的是計算重測信度?;颊叱鲈寒?dāng)天完成第3次測量,填寫與之前相同的調(diào)查表,同時,調(diào)查人員記錄患者的相應(yīng)臨床客觀指標(biāo)結(jié)果。本研究取得廣東醫(yī)科大學(xué)附屬醫(yī)院倫理委員會的倫理審批(審批號:PJ2014040),患者均對本研究知情同意。
1.2.1調(diào)查方法
基于GT的量表考評:采用隨機(jī)單面交叉設(shè)計的方式,根據(jù)患者的不同、每個領(lǐng)域?qū)?yīng)的條目不同等因素,估量出患者在每個潛在能力因素上的總體分?jǐn)?shù),以及對應(yīng)的相對或絕對誤差、概化系數(shù)和可靠性指數(shù),最后依據(jù)分析結(jié)果做出判斷[19]。研究過程分為兩個方面:G研究與D研究,G研究著重于較全面地預(yù)計測評過程中誤差原因的差異分量,D研究是按照多項指標(biāo)做出決策。GT的符號、含義及計算方法見表1。
表1 GT中的符號及含義
基于IRT的量表考評。IRT能彌補(bǔ)經(jīng)典測量理論存在缺陷:(1)對條目和量表測量信息的評估取決于樣本量的大小和其他特征,而這些特征的任何變化都會影響量表的測量屬性;(2)結(jié)合測試者總體與條目屬性特點,無法體現(xiàn)微觀層面的信息。而IRT能彌補(bǔ)上述不足,分析被測者潛在特質(zhì)與條目之間的關(guān)系,綜合體現(xiàn)條目的難易程度、區(qū)分度等特征,減少整個量表的錯誤性和不穩(wěn)定性。量表信息通常以5作為標(biāo)準(zhǔn),5/k(k為條目數(shù))作為每個條目的平均信息量,大于5/k則表明條目質(zhì)量較好[20]。本研究基于等級反應(yīng)模型(GRM)構(gòu)建QLICD-NS(V2.0)量表的特異模塊部分的IRT模型參數(shù)。MULTILOG7.0軟件完成對IRT模型參數(shù)的計算。
1.2.2最小臨床重要性差值(minimal clinically important difference,MCID)的制訂方法
分布法是指依據(jù)治療前、后量表分?jǐn)?shù)的差異分布情況得到MCID,采用以下統(tǒng)計指標(biāo)觀察分布變化狀況。本研究運(yùn)用的統(tǒng)計指標(biāo)為效應(yīng)大小(effect size,ES)、標(biāo)準(zhǔn)差法(standard deviation,SD)、標(biāo)準(zhǔn)測量誤差(standard error of measurement,SEM)及可靠性變化指數(shù)(reliable change index,RCI)。根據(jù)Y軸上的靈敏度(真陽性率)與X軸上的1-特異度(假陽性率)繪制受試者工作特征(receiver operating characteristic,ROC)曲線[21],將Youden指數(shù)最大時的截斷點作為MCID參考值。
2.1.1G研究結(jié)果
各效應(yīng)對角線上的值是其在相應(yīng)領(lǐng)域上的方差分量估計,4個領(lǐng)域的被試方差分量分別為0.22、0.49、0.22和0.20;條目方差分量為0.20、0.35、0.72和0.19;被試和條目的交互作用(p*i)的方差分量分別為0.84、0.63、1.59、1.46。除社會功能外,被試方差分量均大于條目方差分量,說明條目質(zhì)量較好,見表2。
表2 效應(yīng)的方差和協(xié)方差分量矩陣
2.1.2D研究結(jié)果
4個領(lǐng)域的概化系數(shù)均>0.50;除社會功能外,其他領(lǐng)域的可靠性指數(shù)也均>0.50;每個領(lǐng)域的相對和絕對誤差方差<0.30,說明4個領(lǐng)域的信度良好,QLICD-NS(V2.0)量表測量結(jié)果較為準(zhǔn)確,見表3。根據(jù)各領(lǐng)域賦分貢獻(xiàn)比可知心理功能和特異模塊的比例高于其他領(lǐng)域,說明這兩個領(lǐng)域在整體QLICD-NS(V2.0)量表分析患者生命質(zhì)量中占較重要的位置。研究4個領(lǐng)域的絕對誤差方差貢獻(xiàn)比發(fā)現(xiàn),特異模塊的絕對誤差方差貢獻(xiàn)比最小,表明此領(lǐng)域的條目質(zhì)量較佳??偟膩碚f,4個領(lǐng)域的全域總分貢獻(xiàn)比分布較恰當(dāng),能夠達(dá)到測量患者生命質(zhì)量的目標(biāo),見表4。將條目數(shù)減半和加倍以探究概化系數(shù)和可靠性指數(shù)的變化,結(jié)果顯示在原始條目數(shù)中(總量表為43個條目),除社會功能外,其余領(lǐng)域的可靠性指數(shù)均>0.50;當(dāng)條目數(shù)為原始的一半時(總量表為23個條目),只有心理功能的可靠性指數(shù)>0.50;當(dāng)條目數(shù)為原始的雙倍時(總量表為86個條目),各領(lǐng)域的可靠性指數(shù)為0.60~0.92。隨著條目數(shù)的增加,每個領(lǐng)域的概化系數(shù)和可靠性指數(shù)依次增加,見表5。
表3 基于多元GT D研究結(jié)果
表4 QLICD-NS(V2.0)各領(lǐng)域的條目數(shù)比例、賦分貢獻(xiàn)比、方差貢獻(xiàn)比比較
表5 QLICD-NS(V2.0)不同條目數(shù)的概化系數(shù)及可靠性指數(shù)
2.2.1特異模塊各條目參數(shù)估計值
在IRT研究中,區(qū)分度的取值在0~2,當(dāng)區(qū)分度<0.30時,可認(rèn)為該條目區(qū)分度較低;難度Bi(i取值1、2、3、4)的取值一般認(rèn)為在-3~3,且B1~B4為單調(diào)遞增,若Bi<-3,表示條目過于容易,若Bi>3,表示條目非常難。根據(jù)結(jié)果可知,QLICD-NS(V2.0)量表特異模塊的區(qū)分度為0.82,各條目區(qū)分度較好;TNS7(您尿液有出現(xiàn)泡沫嗎?)的難度B3和B4均>3,TNS8(您有血尿嗎?)的難度均<-3,這兩個條目難度設(shè)置較不合理,其余條目的難度系數(shù)均在-3~3且呈單調(diào)遞增,尚可認(rèn)為QLICD-NS(V2.0)量表特異模塊的條目難度適宜,見表6。
表6 QLICD-NS(V2.0)量表特異模塊中各條目的區(qū)分度和難度
2.2.2特異模塊各條目信息量估計值
在條目信息量的估計,以5作為QLICD-NS(V2.0)量表總體信息量標(biāo)準(zhǔn),5/k作為每個條目的平均信息量標(biāo)準(zhǔn),既可以滿足內(nèi)部一致性要求,又可以滿足重測信度要求。QLICD-NS(V2.0)量表共計43個條目,因此單個條目信息量標(biāo)準(zhǔn)為0.12。由結(jié)果可知,TNS5(您有尿頻、尿急或尿痛嗎?)、TNS8(您有血尿嗎?)的平均信息量<0.12,條目有待改進(jìn),其余條目的平均信息量值>0.12,達(dá)到標(biāo)準(zhǔn),可認(rèn)為條目質(zhì)量良好,見表7。
表7 QLICD-NS(V2.0)量表特異模塊中各條目信息量
根據(jù)QLICD-NS(V2.0)量表各領(lǐng)域得分分布差異的情況,采用幾個效應(yīng)統(tǒng)計指標(biāo)估計MCID。本研究采用ES、SD、SEM及RCI 4個指標(biāo)計算MCID。其中,ES分別取0.2(差異弱)、0.5(差異中等)、0.8(差異強(qiáng)),SEM、RCI都分別取1.00(效應(yīng)低)、1.96(效應(yīng)中等)、2.77(效應(yīng)高),見表8。以SF-36量表的Q1為標(biāo)準(zhǔn)錨,根據(jù)第1次和第3次Q1的得分變化作為分組條件,若兩次得分的差值>0,則為變化組;若≤0,則為無變化組。將QLICD-NS(V2.0)量表各領(lǐng)域和總量表治療前、后得分差值的絕對值作為檢驗變量,構(gòu)建ROC曲線,取ROC曲線中Youden指數(shù)最大時所對應(yīng)的點作為MCID。ROC曲線見圖1,根據(jù)圖1和表9的結(jié)果可知,QLICD-NS(V2.0)量表各領(lǐng)域和總量表得分的ROC曲線下面積(AUC)≥0.50,說明該項檢驗的診斷效能尚可。各領(lǐng)域的MCID分別為8.33、4.55、7.81、13.84、18.33,總量表的MCID為12.50,見表9。
圖1 各領(lǐng)域及總量表ROC曲線對比圖
表8 分布法制訂的MCID
表9 ROC曲線法制定MCID
本研究采用GT和IRT兩種方法對QLICD-NS(V2.0)量表條目進(jìn)行分析,二者有不同的假設(shè)和計算方法。研究表明,在量表設(shè)計中,IRT在處理被訪者與問項間的實質(zhì)性關(guān)系等微觀問題時更顯出色,GT 在處理對結(jié)果作推論等宏觀問題時優(yōu)勢較明顯[22]。
GT聯(lián)合經(jīng)典測量理論和方差分析的能力,分析測量過程中變異的來源,測量行為的可靠性,探究QLICD-NS(V2.0)量表各側(cè)面對調(diào)查對象的影響程度。從GT的結(jié)果看,G研究采用多元方差分析估計方差和協(xié)方差分量,其通過分析各領(lǐng)域的概化系數(shù)和可靠性指數(shù)的變化,為決策提供依據(jù)。G研究結(jié)果顯示特異模塊的被試和條目的交互作用(p*i)及被試的方差分量較大,而條目的方差所占的方差分量較小,說明特異模塊能較好體現(xiàn)患者的健康情況。D研究結(jié)果表明4個領(lǐng)域的概化系數(shù)均>0.50,除社會功能外,其他領(lǐng)域的可靠性指數(shù)均>0.50,社會功能的可靠性指數(shù)偏小,可能因為這次測量過程中患者的社會功能領(lǐng)域沒有較大的變化,每個領(lǐng)域的相對和絕對誤差方差<0.30,各領(lǐng)域的全域總分方差貢獻(xiàn)比分布較合理,可認(rèn)為QLICD-NS(V2.0)量表信度尚可。通過改變量表條目數(shù)觀察其對信度的影響,雖然各領(lǐng)域的概化系數(shù)、可靠性指數(shù)會隨著條目數(shù)增加而改變,但條目數(shù)過多增加患者填寫問卷的時間,會導(dǎo)致問卷質(zhì)量的降低,實施的可能性不高,因此原條目數(shù)較合適。
IRT能表示一個項目如何區(qū)分能力水平不同的人,項目參數(shù)涵蓋信息參數(shù),它可以增加整個量表的可靠信息和有效性。從IRT 分析結(jié)果上來看,QLICD-NS(V2.0)量表特異模塊的區(qū)分度為0.82,各條目區(qū)分度較好;TNS7(您尿液有出現(xiàn)泡沫嗎?)難度偏大,由于大多數(shù)患者平時較少關(guān)注尿液是否存在泡沫,填寫QLICD-NS(V2.0)量表時多選擇一般這個選項,而TNS8(您有血尿嗎?)的難度偏小,本次調(diào)研發(fā)現(xiàn)患者存在血尿的狀況很少,多選擇無這個選項,兩個條目未能較好體現(xiàn)患者的真實健康情況,其余條目的難度系數(shù)均在-3~3且呈單調(diào)遞增,尚可認(rèn)為QLICD-NS(V2.0)量表特異模塊的條目難度適宜。本次研究的單個條目信息量標(biāo)準(zhǔn)為0.12,其中TNS5和TNS8的信息量<0.12,條目有待改進(jìn),其余條目的平均信息量值達(dá)到0.12的標(biāo)準(zhǔn),可認(rèn)為條目質(zhì)量良好。
高M(jìn)CID可能會被錯誤地認(rèn)為治療或干預(yù)對患者不存在效果,但治療或干預(yù)是有效的,低MCID則為高估治療的效果,因此中等MCID較為合適[23]。由于分布法需要較大的樣本量,本研究樣本量未達(dá)到此要求,則選取錨法的結(jié)果作為本研究MCID估計值。QLICD-NS(V2.0)量表各領(lǐng)域的MCID值分別是5.56、4.55、9.38、3.57、10.89,總量表的MCID為4.65。
綜上所述,本研究采用了GT與IRT兩種方法對QLICD-NS(V2.0)量表的條目進(jìn)行特性分析,提高了條目的代表性和可靠性。本研究存在不足:(1)調(diào)查對象均為同一醫(yī)院的住院患者,未能納入其他醫(yī)院或社區(qū)患者;(2)調(diào)查患者均為漢族。除此之外,由于人力物力原因,本研究僅調(diào)查了203例NS患者,不滿足樣本量大的要求,不利于獲得穩(wěn)定可靠的結(jié)果,可能會使得條目的平均信息量偏低,但是符合樣本量要求[24]。但仍然建議對測試版QLICD-NS(V2.0)量表修改后,增加調(diào)查患者的范圍和樣本量。
致謝:誠摯感謝廣東醫(yī)科大學(xué)附屬醫(yī)院為本研究提供了寶貴的病例支持!