陳 然,王 瑜,余建英,張 嵐
(四川大學(xué)華西醫(yī)院心理衛(wèi)生中心,四川 成都 610041*通信作者:張 嵐,E-mail:zhangzilan102@126.com)
論著·預(yù)防
PHQ-9在綜合醫(yī)院住院患者中信效度研究
陳 然,王 瑜,余建英,張 嵐*
(四川大學(xué)華西醫(yī)院心理衛(wèi)生中心,四川 成都 610041*通信作者:張 嵐,E-mail:zhangzilan102@126.com)
目的 檢驗(yàn)病人健康問(wèn)卷抑郁量表(PHQ-9)在綜合醫(yī)院住院患者中應(yīng)用的信度和效度,探索PHQ-9在綜合醫(yī)院住院患者中快速篩查抑郁的可行性。方法 方便抽取四川大學(xué)華西醫(yī)院569名住院患者,在規(guī)定指導(dǎo)語(yǔ)下完成PHQ-9評(píng)定,采用隨機(jī)數(shù)字表法隨機(jī)抽取38名患者在完成初次評(píng)定2周后進(jìn)行PHQ-9重測(cè);以簡(jiǎn)明國(guó)際神經(jīng)精神訪談(MINI)作為“金標(biāo)準(zhǔn)”,評(píng)估中文版PHQ-9的效標(biāo)效度,共139名患者接受MINI中文版訪談。結(jié)果 PHQ-9在本研究中的Cronbach' s α系數(shù)為0.839,各條目與總評(píng)分的相關(guān)系數(shù)r=0.484~0.724(P<0.01),各條目間相關(guān)系數(shù)r=0.229~0.520(P<0.01);兩周后重測(cè)系數(shù)r=0.846(P<0.01);因子分析獲得3個(gè)公因子,分別為自我評(píng)價(jià)因子、情感因子和軀體化因子;最佳診斷劃界分為8分,敏感度為92.6%,特異度為60.6%;PHQ-9的ROC曲線下面積為0.841(95%CI:0.777~0.905)。結(jié)論 PHQ-9應(yīng)用于綜合醫(yī)院住院患者抑郁評(píng)估中具有良好的信效度,8分為該量表的最佳劃界分。
PHQ-9;信度;效度;綜合醫(yī)院;住院患者
研究表明,中國(guó)普通人群的重性抑郁障礙發(fā)病率約為2.07%~6.87%[1-3]。然而在綜合醫(yī)院,由于缺乏對(duì)患者精神問(wèn)題的關(guān)注,綜合醫(yī)院對(duì)普通住院患者抑郁發(fā)作識(shí)別率僅為13.0%~31.8%[4-5],加之國(guó)內(nèi)綜合醫(yī)院非精神科專業(yè)醫(yī)師對(duì)精神類疾病識(shí)別率低[6-7],且目前國(guó)內(nèi)尚未廣泛普及應(yīng)用于普通住院患者快速篩查抑郁的工具,非精神科患者的抑郁問(wèn)題往往被忽視。使得患者反復(fù)就醫(yī)、延誤治療、浪費(fèi)醫(yī)療資源[8],甚至患者在住院期間發(fā)生自傷、自殺等嚴(yán)重后果[9]。因此,在該人群中驗(yàn)證一項(xiàng)便捷、可信度高的抑郁自評(píng)問(wèn)卷意義重大。
病人健康問(wèn)卷抑郁量表(Patients’ Health Questionnaire Depression Scale-9 item, PHQ-9)是以《精神障礙診斷與統(tǒng)計(jì)手冊(cè)(第4版)》(Diagnostic and Statistical Manual of Mental Disorders, fourth edition,DSM-IV)的重性抑郁障礙(Major depressive disorder,MDD)為標(biāo)準(zhǔn)編制而成的9個(gè)條目自評(píng)工具,臨床使用方便[10]。該量表已被翻譯為多種語(yǔ)言版本,在不同人群中應(yīng)用顯示其具有良好的信效度[11-15],在國(guó)外已成為基層醫(yī)療中篩查抑郁癥的首選工具之一。但目前還缺乏對(duì)該量表在綜合醫(yī)院普通住院患者中的信效度研究,在一定程度上限制了該量表的使用。本研究旨在檢驗(yàn)PHQ-9在綜合醫(yī)院住院患者中的信效度,以便更好地服務(wù)于臨床。
1.1 對(duì)象
采用方便取樣,于2015年4月對(duì)四川大學(xué)華西醫(yī)院的心臟內(nèi)科、腫瘤科、風(fēng)濕免疫科、疼痛科、甲乳外科5個(gè)科室共582例住院患者進(jìn)行問(wèn)卷調(diào)查。其中腫瘤科238人,風(fēng)濕免疫科134人,心臟內(nèi)科96人,疼痛科64人,甲乳外科50人。入組標(biāo)準(zhǔn):①年齡≥16歲;②受教育程度在初中及以上;③身體狀況能滿足獨(dú)立完成問(wèn)卷評(píng)定;④患者自愿參加本研究并簽署知情同意書。排除標(biāo)準(zhǔn):①調(diào)查當(dāng)日安排出院的患者;②有明顯認(rèn)知功能障礙或嚴(yán)重軀體疾病而無(wú)法完成調(diào)查者。
1.2 研究工具
采用自編一般資料調(diào)查表收集患者年齡、性別、民族、職業(yè)、婚姻情況、受教育程度、醫(yī)療保險(xiǎn)、家庭年收入情況、目前疾病診斷、患病時(shí)間、健康狀況、生活質(zhì)量、心理健康狀況自我評(píng)價(jià)。采用PHQ-9評(píng)估過(guò)去兩周患者抑郁癥狀的發(fā)生頻率,PHQ-9由9個(gè)四分類條目組成,0分為完全沒(méi)有,1分為有幾天, 2分為有一半以上的日子,3分為幾乎每天都有。以中文版簡(jiǎn)明國(guó)際神經(jīng)精神訪談(Mini International Neuropsychiatric Interview,MINI)評(píng)定結(jié)果作為“金標(biāo)準(zhǔn)”來(lái)評(píng)估PHQ-9的效標(biāo)效度。
1.3 評(píng)定方法
預(yù)調(diào)查階段,在四川大學(xué)華西醫(yī)院住院患者中隨機(jī)選取9例進(jìn)行預(yù)調(diào)查,重點(diǎn)考察對(duì)9例患者進(jìn)行MINI評(píng)定的調(diào)查員的一致性,調(diào)查員均為經(jīng)過(guò)統(tǒng)一MINI評(píng)定培訓(xùn)的精神科醫(yī)生。
正式調(diào)查階段,由經(jīng)過(guò)統(tǒng)一培訓(xùn)的3名四川大學(xué)臨床心理學(xué)研究生進(jìn)行自編一般資料調(diào)查表及PHQ-9的發(fā)放和收集,若患者因年齡、受教育程度、軀體疾病等而無(wú)法自行作答者,由調(diào)查員采取個(gè)別訪談的方式完成評(píng)定。問(wèn)卷回收后當(dāng)日交于質(zhì)量控制員并編號(hào)。為了更有效地評(píng)價(jià)PHQ-9的校標(biāo)效度,由質(zhì)量控制員采用盲法分配方式將不同分?jǐn)?shù)段的150名患者分配給調(diào)查員,由調(diào)查員在初次評(píng)定的當(dāng)日或第二日對(duì)其進(jìn)行面對(duì)面的MINI診斷訪談。
重測(cè)階段,在正式調(diào)查完成2周后,由控制員采用隨機(jī)數(shù)字表法抽取38名患者進(jìn)行電話訪談以獲取其一般資料及PHQ-9信息。
1.4 質(zhì)量控制
當(dāng)調(diào)查員之間MINI評(píng)估結(jié)果出現(xiàn)分歧,則由高年資心理學(xué)專家協(xié)助討論,盡量提高研究者內(nèi)部一致性。PHQ-9及MINI訪談問(wèn)卷均在患者床旁、在研究者的指令下完成,調(diào)查時(shí)研究者與患者一一對(duì)應(yīng),避免患者相互討論,問(wèn)卷完成時(shí)間少于3 min則視為無(wú)效問(wèn)卷。
1.5 統(tǒng)計(jì)方法
采用SPSS 18.0進(jìn)行統(tǒng)計(jì)分析。采用Cronbach' s α系數(shù)評(píng)估量表內(nèi)部一致性;采用Spearman相關(guān)系數(shù)法評(píng)估條目間及條目與總評(píng)分的相關(guān)性;探索性因素分析(exploratory factor analysis,EFA)用于評(píng)估結(jié)構(gòu)效度;采用受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)檢驗(yàn)PHQ-9診斷效能,以最大Youden指數(shù)確定最佳劃界分。另外,根據(jù)數(shù)據(jù)分布特點(diǎn),采用的統(tǒng)計(jì)方法包括描述性統(tǒng)計(jì)、方差分析、Bartlett球形檢驗(yàn)、Mann-WitneyU檢驗(yàn)等。檢驗(yàn)水準(zhǔn)α=0.05。
2.1 一般資料
本研究共納入582例患者,其中13例未完成評(píng)定,最終回收有效問(wèn)卷569份,有效問(wèn)卷回收率為97.8%。其中男性264例(46.4%),女性305例(53.6%);年齡16~81歲,平均(51.0±15.0)歲?;颊叻植嫉目剖仪闆r:腫瘤科234例(41.1%),風(fēng)濕免疫科131例(23.0%),心臟內(nèi)科94例(16.5%),疼痛科62例(10.9%),甲乳外科48例(7.4%)。在569例患者中,初篩PHQ-9評(píng)分<10分者464例(81.5%),PHQ-9評(píng)分≥10分者105例(18.5%)。隨機(jī)抽取40名患者進(jìn)行PHQ-9重測(cè),最終共完成38例(2例患者失訪);對(duì)150例患者進(jìn)行MINI訪談,最終完成139例(11例拒絕參與)。
2.2 信度檢驗(yàn)
2.2.1 內(nèi)部一致性檢驗(yàn)
本研究中研究者內(nèi)部一致性系數(shù)(intraclass correlation coefficient, ICC)為0.973,PHQ-9在本研究中的Cronbach' s α系數(shù)為0.839。
2.2.2 相關(guān)分析
Spearman相關(guān)分析顯示:各條目與總評(píng)分的相關(guān)系數(shù)為0.484~0.724(P均<0.01),各條目間相關(guān)系數(shù)為0.229~0.520(P均<0.01)。見表1。
表1 PHQ-9各條目間及各條目與總評(píng)分的相關(guān)性(r)
注:aP<0.01(雙側(cè)檢驗(yàn))
2.2.3 重測(cè)信度
采用Spearman相關(guān)系數(shù)法對(duì)中文版PHQ-9初測(cè)與2周后重測(cè)結(jié)果進(jìn)行分析,相關(guān)系數(shù)r=0.846(P<0.01)。
2.3 效度檢驗(yàn)
2.3.1 結(jié)構(gòu)效度檢驗(yàn)
采用主成分分析法得到的KMO檢驗(yàn)值為0.719,且Bartlett球形檢驗(yàn)統(tǒng)計(jì)量為249.176(P<0.01),表明可進(jìn)行探索性因子分析,并提取到三個(gè)成分,其特征值均大于1(分別為2.975、1.315、1.042),其累積方差貢獻(xiàn)率為59.248%。經(jīng)方差最大旋轉(zhuǎn)后因子矩陣來(lái)看:條目 2(心情沮喪)、條目 6(自我否定)、條目 9(消極觀念)在因子1的負(fù)荷值在0.554~0.897之間,可歸為一個(gè)因子(自我評(píng)價(jià)因子);條目 3(睡眠障礙)、條目 4(精力不足)、條目5(飲食障礙)在因子2的負(fù)荷值在0.688~0.752之間,可歸為一個(gè)因子(軀體化因子);條目 1(興趣下降)、條目7(注意力難集中)、條目8(煩躁不安)在因子3的負(fù)荷值在0.530~0.720之間,可歸為一個(gè)因子(情感因子)。見表2。
2.3.2 ROC曲線
139例接受MINI評(píng)定的患者中,陽(yáng)性68例(48.9%),陰性71例(51.1%)。本研究中ROC曲線的標(biāo)準(zhǔn)為MINI診斷結(jié)果,以最大Youden指數(shù)(靈敏度+特異度-1)作為臨界值的篩選標(biāo)準(zhǔn),而以陽(yáng)性預(yù)測(cè)值和陰性預(yù)測(cè)值作為參考值。最終得出:本研究最佳劃界分為8分(對(duì)應(yīng)的敏感度為92.6%,特異度為60.6%)。見表3。PHQ-9的ROC曲線下面積為0.841(95%CI:0.777~0.905,P<0.01)。見圖1。
表2 PHQ-9因子分析結(jié)果
既往關(guān)于PHQ-9信效度檢測(cè)的研究主要局限于特定病種的患者和特定人群,而隨著近年來(lái)綜合醫(yī)院規(guī)模不斷擴(kuò)大、病種日趨復(fù)雜化,住院患者總體的抑郁癥罹患率常常被低估。本研究對(duì)PHQ-9在綜合醫(yī)院住院患者中應(yīng)用的信效度進(jìn)行評(píng)估并探討最佳劃界分,旨在探索PHQ-9在該類群體中的應(yīng)用價(jià)值。
表3 不同劃界分時(shí)PHQ-9篩查診斷性能指標(biāo)
圖1 PHQ-9的ROC曲線
徐勇等[16]總結(jié)了PHQ-9在社區(qū)老年人群中應(yīng)用的Cronbach' s α為0.832,各條目間的相關(guān)系數(shù)為0.233~0.523,各條目與量表總評(píng)分的相關(guān)系數(shù)為0.451~0.693,重測(cè)系數(shù)為0.934;胡星辰等[17]分析得到PHQ-9在青少年人群中的Cronbach' s α為 0.85,條目間相關(guān)系數(shù)為0.289~0.560,各條目與PHQ-9總評(píng)分相關(guān)系數(shù)為0.616~0.730,4周后重測(cè)信度為0.88;Wang等[15]對(duì)1 045例上海市社區(qū)普通人群進(jìn)行分析得出Cronbach' s α為0.86,2周后重測(cè)信度為0.86。Gelaye等[18]研究顯示,PHQ-9在926例東非國(guó)家成人中的Cronbach' s α為0.85,重測(cè)信度為0.92。本研究顯示PHQ-9在綜合醫(yī)院住院患者中的Cronbach' s α為0.839,各條目評(píng)分與總評(píng)分之間的相關(guān)系數(shù)為0.484~0.724,提示該量表的內(nèi)部一致性較好;其重測(cè)信度系數(shù)為0.81,表明PHQ-9具有良好的時(shí)間穩(wěn)定性,即可重復(fù)評(píng)定的特性,這與PHQ-9在國(guó)內(nèi)外不同群體中的研究結(jié)果接近。
關(guān)于PHQ-9結(jié)構(gòu)效度分析,國(guó)內(nèi)外少量研究中采用探索性因子分析得出1個(gè)潛因子[15,17,19],命名為“情感-軀體化因子”,而目前比較公認(rèn)的為2因子結(jié)構(gòu),即“認(rèn)知-情感和軀體因子”[12,14]。本研究得出三個(gè)特征值大于1的因子(自我評(píng)價(jià)因子、軀體化因子、情感因子),累積方差貢獻(xiàn)率為59.248%,且各條目在其所屬因子的負(fù)荷值均在0.5以上而在其他因子的負(fù)荷值明顯較低,說(shuō)明該量表具有良好的三因子結(jié)構(gòu)。雖然為三因子結(jié)構(gòu),但本研究得出的“自我評(píng)價(jià)因子”仍可被認(rèn)為是傳統(tǒng)“認(rèn)知-情感因子”的一部分。
胡星辰等[17]總結(jié)的PHQ-9在471名青少年中的ROC曲線下面積(AUC)為0.984(95%CI: 0.969~0.993),且PHQ-9評(píng)估抑郁情緒的最佳劃界分為10分;Wang等[15]總結(jié)的PHQ-9在1 045名中國(guó)普通人群中的ROC曲線下面積為0.92(95%CI: 0.86~0.97),最佳劃界分為7分(敏感度為86%,特異度為86%)。而既往有研究認(rèn)為PHQ-9的最佳劃界分為9~11分[20]。本研究PHQ-9應(yīng)用于綜合醫(yī)院患者的ROC曲線下面積(AUC)為0.841,最佳診斷劃界分為8分(敏感度為92.6%、特異度為60.6%),稍優(yōu)于10分(靈敏度為85.3%、特異度為67.6%)。本研究最佳劃界分下的敏感度高而特異度稍低于既往研究,可能與患者住院期間的抑郁狀況較平時(shí)嚴(yán)重有關(guān),這也與臨床實(shí)際情況吻合。另外,較低的劃界分(8分)更有利于早期發(fā)現(xiàn)、及時(shí)干預(yù)。
總之,本研究驗(yàn)證了PHQ-9在國(guó)內(nèi)綜合醫(yī)院住院患者中應(yīng)用具有良好的信效度,探討了在該人群中應(yīng)用的最佳劃界分,為綜合醫(yī)院快速篩查抑郁癥患者提供了有效的工具。但本研究仍存在一定局限性,首先患者均來(lái)自西部同一所大型綜合醫(yī)院,可能存在選擇偏倚,不能代表全國(guó)所有綜合醫(yī)院。另外,PHQ-9為自評(píng)量表,會(huì)受到患者受教育程度及認(rèn)知功能的影響,而本研究并未對(duì)此展開深入分析。在以后的臨床運(yùn)用中,還需進(jìn)一步加以研究和完善。
[1] Lee S, Tsang A, Huang Y, et al. The epidemiology of depression in metropolitan China[J]. Psychol Med, 2009, 39(5): 735-747.
[2] Phillips MR, Zhang J, Shi Q, et al. Prevalence, treatment, and associated disability of mental disorders in four provinces in China during 2001-05: an epidemiological survey[J]. Lancet, 2009, 373(9680): 2041-2053.
[3] Liu J, Yan F, Ma X, et al. Prevalence of major depressive disorder and socio-demographic correlates: results of a representative household epidemiological survey in Beijing, China[J]. J Affect Disord, 2015, 179(8): 74-81.
[4] 陸崢, 朱俊娟, 蔡軍, 等. 上海市綜合性醫(yī)院精神科門診醫(yī)師對(duì)抑郁癥識(shí)別及治療的對(duì)照研究[J]. 中華全科醫(yī)師雜志, 2008, 7(4): 231-234.
[5] Sang W, Sun X, Li B, et al. A cross-sectional survey on the identification and treatment rate for depression of inpatients in general hospitals at country and city levels in Baoding City[J]. J Nerv Ment Dis, 2013, 39(7): 347-351.
[6] 張國(guó)芳, 趙均, 饒順曾, 等. 2345名綜合醫(yī)院醫(yī)務(wù)人員精神衛(wèi)生知識(shí)知曉率的調(diào)查[J].上海精神醫(yī)學(xué), 2005, 17(增刊): 17-18.
[7] Li XJ, He YL, Ma H, et al. Prevalence of depressive and anxiety disorders in Chinese gastroenterological outpatients[J]. World J Gastroenterol, 2012, 18(20): 2561-2568.
[8] Karasz A, Dowrick C, Byng R, et al. What we talk about when we talk about depression:doctor-patient conversations and treatment decision outcomes[J]. Br J Gen Pract, 2012, 62(594): e55-63.
[9] Ng CW, How CH, Ng YP. Depression in primary care: assessing suicide risk[J]. Singapore Med J, 2017, 58(2): 72-77.
[10] Kroenke K, Spitzer RL, Williams JB. The PHQ-9: validity of a brief depression severity measure[J]. J Gen Intern Med, 2001, 16(9): 606-613.
[11] Kiely KM, Butterworth P. Validation of four measures of mental health against depression and generalized anxiety in a community based sample[J]. Psychiatry Res, 2015, 225(3): 291-298.
[12] Beard C, Hsu KJ, Rifkin LS, et al. Validation of the PHQ-9 in a psychiatric sample[J]. J Affect Disord, 2016, 193(5): 267-273.
[13] Liu ZW, Yu Y, Hu M, et al. PHQ-9 and PHQ-2 for screening depression in Chinese rural elderly[J]. PLoS One, 2016, 11(3): 1-10.
[14] Hinz A, Mehnert A, Kocalevent RD, et al. Assessment of depression severity with the PHQ-9 in cancer patients and in the general population[J]. BMC Psychiatry, 2016, 16(22): 1-8.
[15] Wang W, Bian Q, Zhao Y, et al. Reliability and validity of the Chinese version of the Patient Health Questionnaire (PHQ-9) in the general population[J]. Gen Hosp Psychiatry, 2014, 36(5): 539-544.
[16] 徐勇, 吳海蘇, 徐一峰. 病人健康問(wèn)卷抑郁量表(PHQ-9)在社區(qū)老年人群中的應(yīng)用——信度與效度分析[J]. 上海精神醫(yī)學(xué), 2007, 19(5): 257-259.
[17] 胡星辰, 張迎黎, 梁煒, 等. 病人健康問(wèn)卷抑郁量表(PHQ-9)在青少年中應(yīng)用的信效度檢驗(yàn)[J]. 四川精神衛(wèi)生, 2014, 27(4): 357-360.
[18] Gelaye B, Williams MA, Lemma S, et al. Validity of the patient health questionnaire-9 for depression screening and diagnosis in East Africa[J]. Psychiatry Res, 2013, 210(2): 653-661.
[19] Kocalevent RD, Hinz A, Br?hler E. Standardization of the depression screener patient health questionnaire (PHQ-9) in the general population[J]. Gen Hosp Psychiatry, 2013, 35(5): 551-555.
[20] Manea L, Gilbody S, McMillan D. Optimal cut-off score for diagnosing depression with the Patient Health Questionnaire (PHQ-9): a meta-analysis[J]. CMAJ, 2012, 184(3): E191-196.
(本文編輯:陳 霞)
Evaluation of the reliability and validity of PHQ-9 in general hospital inpatients
ChenRan,WangYu,YuJianying,ZhangLan*
(WestChinaHospitalofSichuanUniversity,Chengdu610041,China*Correspondingauthor:ZhangLan,E-mail:zhangzilan102@126.com)
Objective To investigate the reliability and validity of Patients' Health Questionnaire Depression Scale-9 item(PHQ-9) in general hospital inpatients and to explore the feasibility of PHQ-9 in screening hospitalized patients in general hospital.Methods To facilitate the extraction of 569 hospitalized patients in West China Hospital of Sichuan University, PHQ-9 was completed under the specified guidance. 38 patients were randomly selected by random number table and PHQ-9 retest was performed after 2 weeks of initial evaluation. Mini International Neuropsychiatric Interview(MINI) was used as the “gold standard” to evaluate the efficacy and validity of the Chinese version of PHQ-9. A total of 139 patients were interviewed by MINI Chinese version.Results The Cronbach' s α coefficient of PHQ-9 was 0.839 and the 2-week test-retest reliability was 0.846. The correlation coefficient of the items and total score was 0.484~0.724(P<0.01) and between items was 0.229~0.520(P<0.01). Factor analysis suggested a three-factor solution: self-assessment factor, affective factor and somatic symptom factor. The best diagnostic demarcation point is 8, maximizing the Youden Index, yielded a sensitivity of 92.6% and a specificity of 60.6%. The results of ROC analysis indicated that the area under the curve (AUC) was 0.841(95%CI: 0.777~0.905).Conclusion The Chinese version of PHQ-9 was shown to have good reliability and validity in general hospital inpatients. 8 is the best demarcation of the scale points.
PHQ-9; Reliability; Validity; General hospital; Inpatients
R749
A
10.11886/j.issn.1007-3256.2017.02.013
2017-02-27)