趙艷莉,陳 齡,謝冬梅,李 楠,高浪麗,岳冀蓉
譫妄是住院老年人群中常見的一種可逆的、具有波動性的神經(jīng)精神綜合征,常在數(shù)小時至數(shù)天內(nèi)發(fā)生,主要表現(xiàn)為急性發(fā)作的意識紊亂,通常伴注意力不集中,思維混亂、不連貫以及感覺、知覺功能的異常[1-3]。內(nèi)科老年住院患者的譫妄發(fā)生率為20%~29%,術(shù)后老年患者的譫妄發(fā)生率為11%~51%[4]。譫妄可導(dǎo)致死亡率增加、住院時間延長、認知功能下降、再入院率及養(yǎng)老院入住率增加等[5-9]。由于譫妄具有急性波動性、夜間發(fā)病的特點,臨床上易被忽視,故漏診率較高。一項針對急診老年患者的研究發(fā)現(xiàn)譫妄漏診率高達54.5%[10]。因此早期識別譫妄并及時干預(yù),對降低譫妄漏診率、改善譫妄患者的預(yù)后具有重要臨床意義。
美國精神障礙診斷統(tǒng)計手冊第5版(DSM-V)的譫妄診斷標(biāo)準(zhǔn)為目前診斷譫妄的金標(biāo)準(zhǔn),其包含以下5條標(biāo)準(zhǔn):①:注意力障礙和感知力損害;②:在短時間內(nèi)發(fā)生,表現(xiàn)為注意力和認知功能從基線狀態(tài)開始的急性改變,且嚴重程度在1天內(nèi)呈現(xiàn)波動性;③:可伴隨認知功能出現(xiàn)損害;④:當(dāng)①和②的發(fā)生不能被已有的或已確診的神經(jīng)精神疾病所解釋,且不是在意識水平嚴重受損的患者中發(fā)生;⑤:根據(jù)病史、查體、實驗室檢查可以明確致病因素[11]。但此標(biāo)準(zhǔn)相對復(fù)雜,需要有經(jīng)驗的專科醫(yī)師床旁詳細的神經(jīng)精神評估,且無法量化評分。因此臨床中常用的譫妄評估工具大多是基于DSM的量化評估表,意識模糊評估法(confusion assessment method,CAM)和3分鐘譫妄診斷評估(3-Minute Diagnostic Interview for CAM-defined Delirium, 3D-CAM)是目前國內(nèi)外應(yīng)用較為廣泛的譫妄評估工具,具有較高的敏感性和特異性[12-13]。但此類量表需要專業(yè)人員現(xiàn)場進行問卷調(diào)查,對病情的波動難以有動態(tài)的掌握。Inouye等[14]于2005年研發(fā)識別譫妄的電子病歷評估量表,該方法雖不受時間或空間的限制,可回顧性地、重復(fù)地通過電子病歷對患者進行譫妄評估。但該量表需要人工瀏覽電子病歷來評估譫妄,不僅費時費力,且受評估人員的素質(zhì)和培訓(xùn)質(zhì)量的影響,異質(zhì)性較大。本研究旨在構(gòu)建一套基于電子病歷自動化提取關(guān)鍵詞識別譫妄的量表,為醫(yī)護人員能早期識別譫妄提供方便可靠的工具,同時為人工智能識別譫妄奠定基礎(chǔ)。
1.1 研究對象本研究納入2015年1月至2017年12月因呼吸疾病或心血管疾病于四川大學(xué)華西醫(yī)院老年科住院且年齡≥65歲的患者為研究對象。納入標(biāo)準(zhǔn):①年齡≥65歲;②住院期間順利完成譫妄評估且評估結(jié)果資料完整;③電子病歷資料完整。排除標(biāo)準(zhǔn):①全盲、重度聽力障礙或重度癡呆不能完成譫妄評估;②有精神病史的患者;③終末期患者(預(yù)期壽命<6個月);④急性神經(jīng)內(nèi)科疾病及神經(jīng)外科疾病患者。根據(jù)量表的研發(fā)標(biāo)準(zhǔn),樣本量需達到條目數(shù)的5~10倍[15]。
1.2量表的構(gòu)建過程和方法
1.2.1 構(gòu)建關(guān)鍵詞在試驗前期,以DSM-V和ICD-10中譫妄的定義及診斷標(biāo)準(zhǔn)為基礎(chǔ)構(gòu)建理論框架,從譫妄評估方法中提取關(guān)鍵詞構(gòu)建初始量表條目池,最后采用德爾菲法結(jié)合層次分析法形成了初始量表,其中含106個條目和554個關(guān)鍵詞。
本研究中信息學(xué)專業(yè)人員將滿足標(biāo)準(zhǔn)的779份老年住院患者的電子病歷資料形成待分析數(shù)據(jù)集。電子病歷資料包含:患者基本信息、入院方式、入院及出院診斷、醫(yī)師及護理病程記錄。信息學(xué)專業(yè)人員利用R軟件將待分析數(shù)據(jù)集進行自動化分詞[16]。成員組將初始量表中的關(guān)鍵詞形成關(guān)鍵詞詞庫,信息學(xué)專業(yè)人員使用R軟件中最優(yōu)匹配度的混合型模型將分詞后的結(jié)果與詞庫進行匹配,自動生成電子病歷中關(guān)鍵詞的頻數(shù)結(jié)果。
1.2.2條目篩選采用臨界比值法、相關(guān)系數(shù)法及差異性分析對條目進行分析和篩選,應(yīng)用SPSS 23.0軟件進行統(tǒng)計分析。①臨界比值法:檢驗各個條目鑒別不同被調(diào)查者的性能即區(qū)分度。將所有患者的初始量表得分排序,得分在前27%的患者為高分組,得分在后27%的患者為低分組[17]。選擇秩和檢驗檢測每項條目的得分在兩組之間有無差異,若P>0.05說明該條目區(qū)分度不佳,予以剔除。②相關(guān)系數(shù)法:采用Spearman相關(guān)系數(shù)分析每個條目得分與量表總分之間的相關(guān)性,目的是檢測條目的代表性。若P>0.05說明條目與總分相關(guān)性不足,予以剔除。③差異性分析:上述兩種分析方法可能出現(xiàn)刪除與譫妄明顯相關(guān)的條目,為避免此類問題,采用差異性分析檢測條目的區(qū)分度與代表性。按照3D-CAM的評估結(jié)果將患者分為譫妄組與非譫妄組。使用秩和檢驗檢測條目在兩組之間是否有差異性(區(qū)分度),P<0.05表示條目對譫妄的區(qū)分度良好,予以保留。采用相關(guān)系數(shù)分析條目與譫妄是否相關(guān)(代表性),P<0.05表示條目對譫妄的代表性良好,予以保留。臨界比值法或相關(guān)系數(shù)法與差異性分析結(jié)果不一致時,優(yōu)先選擇差異性分析的結(jié)果。
1.2.3德爾菲法結(jié)合層次分析法構(gòu)建權(quán)重系數(shù)正式量表條目與初始量表條目之間差異較大。因此在形成正式量表條目后再次使用德爾菲法得到正式量表條目的權(quán)重賦值[18],將條目權(quán)重賦值按照層次和維度分別建立判斷矩陣圖,采用層次分析權(quán)數(shù)法得到正式量表條目的權(quán)重系數(shù)[19]。同時使用一致性比率(consistent ratio, CR)檢驗權(quán)重判斷矩陣圖的內(nèi)在一致性,CR<0.1說明矩陣圖的權(quán)重賦值通過一致性檢驗。
1.2.4正式量表的建立及得分規(guī)則由正式量表條目及權(quán)重系數(shù)形成完整的正式量表。正式量表的得分規(guī)則為:關(guān)鍵詞頻數(shù)≥1的條目得分等于該條目的權(quán)重系數(shù),所有條目得分之和為量表總分。
2.1 一般資料本研究最終共納入779例住院患者的電子病歷資料,納入的患者中男性占71.9%,平均年齡為(82.8±6)歲,平均住院時間為(21±6)d,見表1。
表 1 本組研究對象的基本特征
Table 1 Basic characteristics of the subjects
項目統(tǒng)計值[n(%)]性別 男560(71.9) 女219(28.1)年齡(歲) 65~75129(16.6) 76~85346(44.4) 86~95291(37.4) 96~10013(1.7)住院時間(d) ≤15338(43.1) 16~30359(46.1) 31~4451(6.5) ≥4531(4)
2.2分詞結(jié)果信息學(xué)專家通過R軟件進行分詞和關(guān)鍵詞匹配,發(fā)現(xiàn)共有192個關(guān)鍵詞出現(xiàn)在電子病歷中,38個條目的關(guān)鍵詞未出現(xiàn)在電子病歷中,故予以刪除。關(guān)鍵詞在1份電子病歷中出現(xiàn)則算1次,出現(xiàn)頻率前5的關(guān)鍵詞分別為:感染、跌倒、手術(shù)、精神尚可、精神差。
2.3條目篩選通過臨界比值法得到得分≤2.3為低分組,得分≥5.5為高分組,結(jié)果顯示共22個條目P>0.05,說明條目的區(qū)分度差,予以剔除。根據(jù)Spearman相關(guān)系數(shù)分析后,結(jié)果顯示11個條目得分與量表總分無顯著相關(guān)性(P>0.05),即此類條目的代表性差,予以剔除。差異性分析中,通過秩和檢驗分析后,發(fā)現(xiàn)共38個條目在譫妄和非譫妄患者中有統(tǒng)計學(xué)差異(P<0.05),說明有良好的區(qū)分度,予以保留;通過相關(guān)系數(shù)分析得出41個條目與譫妄有顯著相關(guān)性(P<0.05),說明對譫妄患者有良好的代表性,予以保留。綜上將以下9個條目予以刪除,分別為視力損傷、多藥共用、自殺傾向、憤怒、躁動不安、精神不集中、言語少、無言語、計算能力下降。最終得到59個正式量表條目。
2.4建立權(quán)重系數(shù),形成正式量表將篩選出來的59個條目組成正式量表,通過德爾菲法結(jié)合層次分析法重建權(quán)重系數(shù)。5位專家均返回意見,專家積極指數(shù)為100%。為便于統(tǒng)計分析,將條目總權(quán)重系數(shù)增大2個數(shù)量級(即乘100),發(fā)現(xiàn)譫妄和反應(yīng)遲鈍的權(quán)重系數(shù)最高,分別為15及13.3。權(quán)重矩陣圖的一致性檢驗結(jié)果顯示CR值均<0.1,說明權(quán)重賦值的判斷矩陣具有滿意的內(nèi)在一致性即可靠性。最后由正式量表條目及總權(quán)重系數(shù)形成正式量表,其中包含59個條目及11個維度。779位患者的正式量表得分在0~53.4分之間,平均值為6.64分,偏度為2.6,峰度為8.2,故正式量表得分為厚尾正偏態(tài)分布,圖1為其分布直方圖。
圖 1 正式量表得分分布直方圖
Figure1Histogramofscoredistributionofformalscale
目前國內(nèi)外有多種用于譫妄的床旁評估工具,但臨床工作中醫(yī)務(wù)人員對此類工具的使用率較低,導(dǎo)致譫妄漏診率居高不下。因此,我們迫切需要一種自動化譫妄識別工具來減少譫妄漏診率。本研究研發(fā)的基于電子病歷的人工智能譫妄識別量表,可從電子病歷中自動化提取關(guān)鍵詞,實時監(jiān)測患者病情,以實現(xiàn)早期識別譫妄,及時采取干預(yù)措施,提高譫妄風(fēng)險應(yīng)對能力。
該量表的建立基于條目的分析,這在量表的構(gòu)建過程中起著至關(guān)重要的作用,其中包括條目篩選、量化及權(quán)重賦值。本研究主要采用德爾菲法對條目進行權(quán)重賦值,即統(tǒng)一通過郵件咨詢專家意見,實施過程嚴格遵守匿名性原則,專家之間不能相互聯(lián)系和討論,最終使量表識別譫妄的敏感度達到最大化。由于國內(nèi)關(guān)于老年譫妄研究方向的專家較少,本研究只邀請到5名專家,今后的研究中應(yīng)增加專家數(shù)量來進一步修訂該量表。此外,該研究采用層次分析權(quán)數(shù)法得到正式量表條目的權(quán)重系數(shù),保證了正式量表建立過程中的科學(xué)性及完整性。
本研究是首次嘗試在電子病歷的基礎(chǔ)上研發(fā)出自動識別譫妄的量表,這是對現(xiàn)有人工譫妄評估工具的補充及創(chuàng)新。目前常用的譫妄評估工具需要有經(jīng)驗的專科醫(yī)生對患者進行面對面評估,由于譫妄起病急、波動性大且夜間多見,醫(yī)護人員很難及時實施床旁評估,因此可行性較低。本量表只需計算機自動化提取電子病歷中的關(guān)鍵詞來識別譫妄,具有較好的操作性和可重復(fù)性,節(jié)約人力和時間,使得應(yīng)用前景廣泛。
但此研究也有以下不足之處:首先,該研究為回顧性研究,電子病歷質(zhì)量可影響評估結(jié)果,后期將進一步對在院患者進行實時評估即前瞻性研究,同時需進一步規(guī)范電子病歷書寫以提高量表的靈敏性;另外,本研究中性別差異較大,男性占71.9%,但性別并非譫妄的危險因素,且量表中譫妄患者的臨床癥狀及相關(guān)指標(biāo)不存在性別差異,故暫未按照性別分層決定權(quán)重;最后,此量表是基于四川大學(xué)華西醫(yī)院住院患者的電子病歷構(gòu)建而成,由于地域和文化的差異,條目中的關(guān)鍵詞可能不完全適用于其他省市的醫(yī)院,未來需進一步開展多中心研究以提高量表的適用性。
這項研究初步構(gòu)建了一種基于電子病歷的智能譫妄識別量表,將計算機信息技術(shù)應(yīng)用于臨床疾病的篩查。作為臨床決策支持功能的一部分,將譫妄識別量表結(jié)合到電子病歷中,通過提取電子病歷中的關(guān)鍵詞,智能、主動的提醒醫(yī)務(wù)人員,實現(xiàn)早期識別譫妄的目的。隨著醫(yī)院信息化發(fā)展,在該研究基礎(chǔ)上,今后有望利用信息技術(shù)研發(fā)出譫妄風(fēng)險預(yù)警系統(tǒng),使醫(yī)務(wù)人員最大化識別譫妄,這對未來譫妄相關(guān)的臨床研究具有重要意義。