山西醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(030001) 羅艷虹 陳培翠 王瑾瑤 艾永梅 余紅梅
阿爾茨海默病(Alzheimer's disease,AD)是老年期癡呆的一個(gè)主要類(lèi)型,在疾病狀態(tài)不可逆的條件下,應(yīng)盡可能提高AD患者的生命質(zhì)量。故評(píng)價(jià)AD患者的生命質(zhì)量及找出影響其生命質(zhì)量的各相關(guān)因素對(duì)AD早期干預(yù)和防治、延緩疾病進(jìn)程和提高生命質(zhì)量具有重要的意義〔1-2〕。
本文采用阿爾茨海默病生命質(zhì)量測(cè)評(píng)量表(Quality of Life-Alzheimer's Disease,QOL-AD)中文版評(píng)價(jià)AD患者的生命質(zhì)量,量表?xiàng)l目應(yīng)答選項(xiàng)屬于多分類(lèi)有序變量資料。一般而言,有序變量類(lèi)別之間的間距并不固定,也就是各類(lèi)之間的稀疏程度并不均勻,而常規(guī)的數(shù)據(jù)分析方法卻將其作等距對(duì)待。因此,本文對(duì)多分類(lèi)有序變量的間距差異進(jìn)行合理界定,繼而進(jìn)行聚類(lèi)分析〔3〕,明確各條目的影響程度。
抽樣調(diào)查AD患者及照料者200對(duì),患者來(lái)自山西省太原市3個(gè)三級(jí)甲等醫(yī)院神經(jīng)內(nèi)科和老年科確診病例和太原市3個(gè)老年人集中的社區(qū)前期篩檢出的AD患者。采用原作者Rebecca G.Logsdon授權(quán)研制的QOL-AD中文版,分別由患者和照料者來(lái)評(píng)價(jià)患者生命質(zhì)量。QOL-AD包含13個(gè)條目,所有條目均有四個(gè)相同的選項(xiàng),分別為差、一般、好、非常好,評(píng)分分別為1-4分〔1〕?;颊吆驼樟险吒魈钜环荩珹D患者采用面對(duì)面問(wèn)答形式,照料者獨(dú)立填寫(xiě)。其中患者有195例可以完成全部問(wèn)卷,照料者有94例可完成全部問(wèn)卷。
R × C{aiji=1,2,…,r,j=1,2,…,c}為兩因素列聯(lián)表,其中aij為觀察頻數(shù)。變量Y有r個(gè)水平,即Yi=(ai1,ai2,…,aic),i=1,2,…,r,有序變量X有c個(gè)水每個(gè)水平對(duì)應(yīng)一個(gè)秩區(qū)間。X的第j個(gè)水平的合計(jì)頻數(shù)的值稱(chēng)為秩。設(shè)第j個(gè)秩區(qū)間為:
簡(jiǎn)而言之,有序變量X的c個(gè)水平中的第j個(gè)水平的區(qū)間寬度即秩次范圍為變量Y在X的第j水平上的人數(shù),該區(qū)間的最低秩次為該水平前的所有人數(shù)加1。
將第j個(gè)秩區(qū)間的平均秩次記為Rj,j=1,2,…,c,
根據(jù)求出的秩區(qū)間和平均秩可以得到有序變量X的各個(gè)水平的代表值和取值區(qū)間。第j個(gè)水平的取值區(qū)間為〔3-5〕:
有序變量X各水平的間距差異為各水平代表值的差值,即
第j個(gè)水平的代表值為:
將變量Y各水平的觀察頻數(shù)aij都除以ai,得到變量Y各水平在變量X各水平上的條件概率fij,以fij的為權(quán)向量,算得變量Y各水平的總影響程度Ai,即
據(jù)此對(duì)Ai排序。進(jìn)而以Ai為研究變量進(jìn)行系統(tǒng)聚類(lèi)分析〔5-7〕。
表1為AD患者及其照料者各條目影響程度列聯(lián)表。經(jīng)過(guò)秩分析,得到有序變量X各個(gè)水平的區(qū)間寬度、秩區(qū)間、平均秩次、取值區(qū)間、代表值和間距差異值,見(jiàn)表2。
表1 AD患者及其照料者受X各水平影響程度列聯(lián)表
表2 AD患者及其照料者有序變量X的秩分析結(jié)果
從表2可知,有序變量X各個(gè)水平的取值并非數(shù)字1,2,3,4,而是各處于一個(gè)特定的取值區(qū)間內(nèi),且各水平之間的“距離”并不相等,中間相鄰水平的間距最大。
將變量Y各水平的觀測(cè)頻數(shù)aij都除以ai(患者ai=195,照料者ai=94),得到變量Y各水平在變量X各水平上的條件概率fij,以fij為權(quán)向量,計(jì)算得到變量Y各水平的總體影響程度Ai,根據(jù)Ai對(duì)變量Y各水平的影響程度排序〔3,5〕。(見(jiàn)表3)
Ai反映了變量Y各條目對(duì)AD患者生命質(zhì)量的不同影響,據(jù)此對(duì)13個(gè)條目進(jìn)行聚類(lèi)分析。QOL-AD患者版13個(gè)條目大致分為四類(lèi):第一類(lèi)為強(qiáng)效條目,包括婚姻狀況(A7=2.64)、與家人的關(guān)系(A6=2.63)、記憶力(A5=2.45);第二類(lèi)為較強(qiáng)條目,包括經(jīng)濟(jì)狀況(A12=2.21)、情緒(A3=2.11)、與朋友的關(guān)系(A8=2.09)、對(duì)自己的整體感覺(jué)(A9=2.07);第三類(lèi)為普通條目,包括精力(A2=1.92)、身體健康狀況(A1=1.81)、進(jìn)行娛樂(lè)活動(dòng)的能力(A11=1.79);第四類(lèi)為弱效條目,包括做家務(wù)的能力(A10=1.54)、生活的整體狀況(A13=1.42)、居住情況(A4=1.34)。QOL-AD照料者版各條目聚類(lèi)分析結(jié)果與患者版類(lèi)似(結(jié)果略)。
表3 AD患者和照料者變量各水平的排序結(jié)果
由表2可得,在對(duì)QOL-AD患者版和照料者版有序變量X的選擇中,認(rèn)為“一般”的最多(1110次和529次);認(rèn)為“好”的次之(823次和402次);認(rèn)為“差”的較少(495次和203次);認(rèn)為“非常好“的最少(107次和88次)。各個(gè)水平都有特定的代表值,從間距差異來(lái)看,中間相鄰水平的差異為1.525,明顯大于其他水平??梢?jiàn),患者及照料者對(duì)中文版QOL-AD的有序變量的選擇較一致,AD患者總體生命質(zhì)量一般,且在“一般”和“好”之間的選擇差異較大。
患者和照料者各自填寫(xiě)的QOL-AD量表各條目對(duì)患者生命質(zhì)量影響程度的排序和聚類(lèi)比較一致,強(qiáng)效條目均為婚姻狀況、與家人的關(guān)系和記憶力,經(jīng)濟(jì)狀況、情緒及與朋友的關(guān)系次之。
本文通過(guò)秩分析,將有序列聯(lián)資料定量化,即通過(guò)求得有序變量各個(gè)水平的代表值和取值區(qū)間,得到各水平代表值的差值,將間距差異量化,最后計(jì)算得到變量各水平的總體影響程度,據(jù)此對(duì)變量各水平的影響程度排序,并運(yùn)用聚類(lèi)分析法作進(jìn)一步分析。本文只是對(duì)有序變量間距差異的初步探討,還存在許多不足,有待日后進(jìn)一步研究。
1.艾永梅.阿爾茨海默病生命質(zhì)量測(cè)評(píng)量表(QOL-AD)中文版研制與初步應(yīng)用.山西醫(yī)科大學(xué)碩士學(xué)位論文,2011.
2.楊大安,榮茂昌,段一窮.老年癡呆及防治.吉林師范大學(xué)學(xué)報(bào),2004,4:123-124.
3.陳民懇.多分類(lèi)有序變量間距差異的統(tǒng)計(jì)分析與實(shí)際應(yīng)用.廈門(mén)大學(xué)碩士學(xué)位論文,2007.
4.朱建平.數(shù)據(jù)挖掘的統(tǒng)計(jì)方法及實(shí)踐.中國(guó)統(tǒng)計(jì)出版社,2005:101-102.
5.朱建平,陳民懇.數(shù)據(jù)挖掘中有序資料間距差異的量化與聚類(lèi)分析.商業(yè)經(jīng)濟(jì)與管理,2007,1:36-40.
6.朱建平,楊貴軍,張潤(rùn)楚.列聯(lián)資料的有向聚類(lèi)分析及其應(yīng)用.數(shù)理統(tǒng)計(jì)與管理,2002,4:28-33.
7.Julio Ms,F(xiàn)rederico ZP,Patricia Rosa,et al.Parametric and Nonparametric Analyses of Repeated Ordinal Categorical Data.Biometrical Journal,2004,569(4):462.