徐良辰,郭崇慧
大連理工大學(xué)系統(tǒng)工程研究所,遼寧 大連 116024
在經(jīng)濟(jì)和社會(huì)發(fā)展的現(xiàn)實(shí)需求拉動(dòng)以及政策和技術(shù)因素的驅(qū)動(dòng)下,人們對醫(yī)院信息化水平的要求越來越高,這促使“互聯(lián)網(wǎng)+醫(yī)療健康”不斷深入發(fā)展。傳統(tǒng)醫(yī)院信息系統(tǒng)難以滿足當(dāng)今人們對醫(yī)療服務(wù)水平的要求,國家政策、經(jīng)濟(jì)、社會(huì)和技術(shù)等多重因素推動(dòng)著醫(yī)院向智慧化方向轉(zhuǎn)變。以智慧服務(wù)、智慧診療、智慧管理為核心的智慧醫(yī)院進(jìn)入快速建設(shè)時(shí)期[1],其建設(shè)基本框架如圖1所示。
圖1 智慧醫(yī)院建設(shè)基本框架
醫(yī)療健康大數(shù)據(jù)泛指所有與醫(yī)療和生命健康相關(guān)的信息,其貫穿個(gè)人生命的全周期[2]。國家已對醫(yī)療健康大數(shù)據(jù)管理進(jìn)行了統(tǒng)籌設(shè)計(jì),2014年國家衛(wèi)生和計(jì)劃生育委員會(huì)發(fā)布了“46312”工程,其中“3”是指三大數(shù)據(jù)庫,分別為電子健康檔案數(shù)據(jù)庫、電子病歷(electronic medical record,EMR)數(shù)據(jù)庫和全員人口個(gè)案數(shù)據(jù)庫。醫(yī)療健康大數(shù)據(jù)治理也受到學(xué)者的廣泛關(guān)注[3-4]。電子病歷數(shù)據(jù)庫以患者為中心,將患者醫(yī)療信息及其相關(guān)處理過程綜合集成,促進(jìn)了工作流程的優(yōu)化、醫(yī)療質(zhì)量的提高以及服務(wù)水平的提升[5]。電子病歷數(shù)據(jù)成為核心的醫(yī)療大數(shù)據(jù),也是智慧醫(yī)院建設(shè)的核心基礎(chǔ)。發(fā)達(dá)國家對電子病歷有較深入的研究和應(yīng)用,并成立了相關(guān)機(jī)構(gòu)來組織醫(yī)療單位實(shí)施和普及電子病歷[6]。2010年衛(wèi)生部印發(fā)《電子病歷基本規(guī)范(試行)》,規(guī)范了醫(yī)療機(jī)構(gòu)電子病歷的管理及應(yīng)用;2018年,國家衛(wèi)生健康委員會(huì)制定了《電子病歷系統(tǒng)功能應(yīng)用水平分級評價(jià)方法及標(biāo)準(zhǔn)》,為電子病歷系統(tǒng)的功能應(yīng)用水平分級提供了具體評價(jià)指標(biāo)和方法,這標(biāo)志著我國電子病歷建設(shè)邁入了一個(gè)新的階段。電子病歷的建設(shè)、分析及利用對于智慧醫(yī)院的建設(shè)和發(fā)展具有基礎(chǔ)支持作用。
電子病歷是病歷的一種信息化記錄形式,在當(dāng)前醫(yī)療信息系統(tǒng)建設(shè)中得到迅速發(fā)展。電子病歷的定義可分為狹義和廣義兩種:狹義的電子病歷是指紙質(zhì)病歷的電子化;廣義的電子病歷是指醫(yī)務(wù)人員在醫(yī)療活動(dòng)過程中形成的文字、符號、圖表、影像、切片等資料的總和,包括門(急)診病歷和住院病歷。電子病歷不僅包括靜態(tài)病歷信息,還包括醫(yī)院提供的相關(guān)服務(wù),涉及病人信息的采集、存儲(chǔ)、傳輸、處理和利用等多個(gè)過程。美國醫(yī)學(xué)研究所對電子病歷做了如下定義:以電子化方式管理的有關(guān)個(gè)人終生健康狀態(tài)和醫(yī)療保健的信息,可在醫(yī)療中作為主要的信息源取代紙張病歷,滿足所有的診療、法律和管理需求。綜合來看,電子病歷以患者數(shù)據(jù)為中心,是患者綜合、完整、詳盡的診斷治療全過程的原始記錄,并具有完整性、標(biāo)準(zhǔn)化、規(guī)范化、易檢索等特點(diǎn)。
作為醫(yī)院信息系統(tǒng)的一個(gè)子系統(tǒng),電子病歷系統(tǒng)以患者為中心,綜合集成相關(guān)醫(yī)療信息系統(tǒng)數(shù)據(jù)及其相關(guān)處理過程,更強(qiáng)調(diào)患者信息的原始性和完整性,在醫(yī)院信息管理系統(tǒng)中占有重要地位。電子病歷系統(tǒng)與其他醫(yī)院信息系統(tǒng)的關(guān)系如圖2所示。
由圖2可知,電子病歷數(shù)據(jù)是以患者為中心的其他醫(yī)療信息系統(tǒng)數(shù)據(jù)的綜合集成,且表示形式多樣化。電子病歷數(shù)據(jù)既包含患者情況的文本描述等非結(jié)構(gòu)化數(shù)據(jù),也包含檢查、檢驗(yàn)報(bào)告等結(jié)構(gòu)化數(shù)據(jù)。針對具體的患者,電子病歷主要包括入院記錄、病程記錄(包括首次病程記錄和其他病程記錄等)、檢查報(bào)告、檢驗(yàn)報(bào)告、治療記錄(如手術(shù)記錄等)以及出院小結(jié)等。電子病歷記錄了患者的重要診療信息,具有為臨床決策、臨床科研以及運(yùn)用管理提供巨大支持的潛力,因此有必要對電子病歷數(shù)據(jù)進(jìn)行分析挖掘,并賦能實(shí)踐。
圖2 電子病歷系統(tǒng)與其他醫(yī)院信息系統(tǒng)的關(guān)系
隨著新一代信息技術(shù)的發(fā)展,醫(yī)療數(shù)據(jù)的采集、抽取、存儲(chǔ)以及處理能力增長迅速。面對海量醫(yī)療信息,數(shù)據(jù)挖掘等理論方法將助力電子病歷的分析及利用,更好地為相關(guān)決策提供支持。基于數(shù)據(jù)挖掘的電子病歷分析及利用框架如圖3所示。
圖3 基于數(shù)據(jù)挖掘的電子病歷分析及利用框架
在當(dāng)前的臨床實(shí)踐中,許多治療手段缺乏有效的證據(jù)支持。盡管臨床醫(yī)生利用參考指南來輔助決策,但參考指南通常建立在隨機(jī)對照試驗(yàn)(randomized controlled trial,RCT)的基礎(chǔ)上,而RCT的患者隊(duì)列有限、標(biāo)準(zhǔn)嚴(yán)格,且經(jīng)過了精心設(shè)計(jì),普適性較低。傳統(tǒng)RCT研究面臨很多局限,如對于罕見病癥的研究,臨床上病例較少,而且可能包含其他難以控制的因素。此外,受到倫理道德的限制,一些干預(yù)手段難以實(shí)施。由于限制繁多,RCT只支持部分臨床決策,大多數(shù)臨床決策無據(jù)可循[7]。
電子病歷數(shù)據(jù)蘊(yùn)含大量的信息和知識(shí)。相比于RCT以及前瞻性隊(duì)列研究,充分利用電子病歷可以極大地降低研究成本和研究難度,為循證醫(yī)學(xué)的發(fā)展提供新的思路。合理分析和挖掘電子病歷可以極大地促進(jìn)醫(yī)護(hù)人員對臨床實(shí)踐的認(rèn)知、優(yōu)化診療業(yè)務(wù)流程,幫助醫(yī)護(hù)人員制定符合患者特點(diǎn)的個(gè)性化臨床決策,進(jìn)而提高醫(yī)療服務(wù)質(zhì)量和水平,為精準(zhǔn)醫(yī)療的發(fā)展奠定基礎(chǔ)。
海量的醫(yī)療大數(shù)據(jù)意味著機(jī)遇與挑戰(zhàn)并存。電子病歷集成了多部門、多類型、多項(xiàng)目的數(shù)據(jù),具有多種數(shù)據(jù)特征。電子病歷數(shù)據(jù)具有多樣性,其包含多種數(shù)據(jù)類型,如結(jié)構(gòu)化數(shù)據(jù)(如體溫、血壓、脈搏、檢驗(yàn)結(jié)果等數(shù)據(jù))、半結(jié)構(gòu)化數(shù)據(jù)(如病史信息、病程記錄、出院小結(jié)等)以及非結(jié)構(gòu)化數(shù)據(jù)(如心電圖、CT報(bào)告單等),而且數(shù)據(jù)量較大。隨著醫(yī)療信息化平臺(tái)的建設(shè)和深入應(yīng)用,越來越多的醫(yī)療流程依托于醫(yī)院信息系統(tǒng),這促進(jìn)了醫(yī)療平臺(tái)整合及醫(yī)療設(shè)備互聯(lián),以便為患者提供便捷的醫(yī)療服務(wù)。與此同時(shí),患者的預(yù)約、診斷、治療等活動(dòng)產(chǎn)生的海量數(shù)據(jù)都會(huì)被記錄,形成信息豐富的電子病歷數(shù)據(jù)。電子病歷數(shù)據(jù)是對患者診療過程和病情進(jìn)展的記錄,具有動(dòng)態(tài)性;電子病歷數(shù)據(jù)記錄過程可能因?yàn)獒t(yī)療人員的理解不同而存在誤差或者缺失,產(chǎn)生很多異常值和缺失值,具有不完整性和不規(guī)范性;電子病歷數(shù)據(jù)包括大量患者隱私信息,具有高隱私性。電子病歷數(shù)據(jù)的特性為電子病歷數(shù)據(jù)挖掘帶來了困難和挑戰(zhàn)?;谝延醒芯浚竟?jié)梳理了基于數(shù)據(jù)挖掘的電子病歷分析流程,并針對分析挖掘結(jié)果闡述了基于知識(shí)圖譜的多維度醫(yī)療知識(shí)管理。
(1)基于數(shù)據(jù)挖掘的電子病歷分析挖掘流程
基于數(shù)據(jù)挖掘的電子病歷分析挖掘指通過數(shù)據(jù)挖掘的理論方法對電子病歷進(jìn)行處理,將其中蘊(yùn)含的知識(shí)進(jìn)行挖掘和呈現(xiàn)。電子病歷分析挖掘離不開實(shí)踐需求,因此解決實(shí)踐問題成為電子病歷分析挖掘的重要目標(biāo)?;卺t(yī)療實(shí)踐活動(dòng)中存在的相關(guān)問題進(jìn)行分析提煉,形成科學(xué)研究問題,依據(jù)關(guān)注的科學(xué)問題設(shè)計(jì)實(shí)驗(yàn)。首先基于對研究問題的理解,選擇合適的研究隊(duì)列,隨后對定義好的研究隊(duì)列的數(shù)據(jù)進(jìn)行抽取,通過數(shù)據(jù)預(yù)處理來清洗完善數(shù)據(jù),并通過探索性分析對數(shù)據(jù)有一個(gè)大致的了解?;谘芯繂栴}以及數(shù)據(jù)特點(diǎn)選擇合適的模型方法進(jìn)行實(shí)驗(yàn),并進(jìn)行評估和改進(jìn)。達(dá)到預(yù)期后,可在大規(guī)模真實(shí)數(shù)據(jù)集上進(jìn)行驗(yàn)證,最終發(fā)現(xiàn)知識(shí),為醫(yī)療實(shí)踐提供支持?;跀?shù)據(jù)挖掘的電子病歷分析挖掘流程如圖4所示。
圖4 基于數(shù)據(jù)挖掘的電子病歷分析挖掘流程
(2)基于知識(shí)圖譜的多維度醫(yī)療知識(shí)管理
2012年Google公司提出的知識(shí)圖譜改變了傳統(tǒng)的搜索引擎模式,知識(shí)圖譜可以智能化地理解用戶的輸入,并返回最相關(guān)的知識(shí)。因此,可采用知識(shí)圖譜的形式組織醫(yī)療知識(shí),構(gòu)建多維度醫(yī)療知識(shí)庫管理系統(tǒng),實(shí)現(xiàn)多維度的醫(yī)療知識(shí)管理?;谥R(shí)圖譜的多維度醫(yī)療知識(shí)管理主要包括醫(yī)療知識(shí)圖譜構(gòu)建、知識(shí)庫管理系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)以及知識(shí)應(yīng)用。
在醫(yī)療知識(shí)圖譜的構(gòu)建中,實(shí)體識(shí)別和實(shí)體關(guān)系抽取是基本任務(wù),也是關(guān)鍵問題。實(shí)體識(shí)別的主要任務(wù)是從電子病歷中找出相關(guān)實(shí)體(已存在的概念詞語),包括疾病、癥狀、藥物、檢測以及治療等;關(guān)系抽取的主要任務(wù)是識(shí)別抽取出的實(shí)體之間的關(guān)系,包括同質(zhì)實(shí)體之間的關(guān)系(如藥物與藥物之間的關(guān)系)和異質(zhì)實(shí)體之間的關(guān)系(如疾病與癥狀之間的關(guān)系)。在醫(yī)療知識(shí)圖譜中,以實(shí)體為節(jié)點(diǎn)、實(shí)體之間的關(guān)系為邊,從而對醫(yī)療知識(shí)進(jìn)行表示?;谧匀徽Z言處理的電子病歷的實(shí)體識(shí)別和知識(shí)圖譜構(gòu)建方法成為較流行的知識(shí)圖譜構(gòu)建方式[8]。阮彤等人[9]利用互聯(lián)網(wǎng)數(shù)據(jù)與百科數(shù)據(jù)構(gòu)造了醫(yī)療知識(shí)圖譜,為中文醫(yī)療知識(shí)圖譜的構(gòu)建提供了思路。
3.2.1 基于數(shù)據(jù)挖掘的電子病歷分析促進(jìn)電子病歷的智能化生成
當(dāng)前電子病歷很大程度上靠醫(yī)生輸入計(jì)算機(jī),這占用了醫(yī)生日常工作的大量時(shí)間。據(jù)統(tǒng)計(jì),在工作日醫(yī)生要花費(fèi)6~11個(gè)小時(shí)在電子病歷的輸入上,這縮短了醫(yī)生為患者服務(wù)的有效時(shí)間,降低了醫(yī)療人員的服務(wù)能力。隨著信息技術(shù)的不斷發(fā)展,電子病歷的智能化生成將為降低醫(yī)生的電子病歷輸入壓力提供思路。電子病歷的智能化生成將提高電子病歷的生成效率,減少醫(yī)生的電子病歷輸入任務(wù),有助于提高醫(yī)療人員的服務(wù)能力和水平。基于數(shù)據(jù)挖掘的電子病歷智能化生成包括電子病歷醫(yī)患共創(chuàng)、個(gè)性化電子病歷模板推薦以及結(jié)構(gòu)化數(shù)據(jù)推理生成等重要部分。電子病歷的智能化生成框架如圖5所示。
圖5 電子病歷智能化生成框架
電子病歷的智能化生成可依托互聯(lián)網(wǎng)交互的特性,引導(dǎo)患者參與自身電子病歷的生成,將一些信息收集階段移至患者端,實(shí)現(xiàn)醫(yī)患共創(chuàng),降低醫(yī)療人員的電子病歷輸入壓力。作為電子病歷的重要信息標(biāo)準(zhǔn),電子病歷模板確定了電子病歷的風(fēng)格和基本結(jié)構(gòu),可提高醫(yī)療數(shù)據(jù)記錄的規(guī)范性和完整性。不同病種對電子病歷模板有不同的要求,基于數(shù)據(jù)挖掘與分析,依據(jù)病人、病種、病情等實(shí)際需求,自動(dòng)推薦契合的個(gè)性化電子病歷模板將進(jìn)一步提高電子病歷的生成效率。電子病歷中除了結(jié)構(gòu)化數(shù)據(jù),還包括醫(yī)生的診斷與總結(jié)等非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)的推理生成也是電子病歷智能化生成的重要方式,已有相關(guān)研究對中文出院小結(jié)自動(dòng)生成的方法進(jìn)行了探討[10]?;卺t(yī)生的思維邏輯,依據(jù)可參考的數(shù)據(jù)信息推理生成診斷、摘要等非結(jié)構(gòu)化數(shù)據(jù),醫(yī)生可進(jìn)一步對生成內(nèi)容進(jìn)行完善,人機(jī)結(jié)合,進(jìn)一步提高電子病歷的生成效率和質(zhì)量。
3.2.2 基于多維度醫(yī)療知識(shí)體系的決策支持
當(dāng)前的醫(yī)療知識(shí)主要來源于專家知識(shí)(包括顯性專家知識(shí)、隱性專家知識(shí)等)。隨著醫(yī)療健康數(shù)據(jù)的積累以及數(shù)據(jù)挖掘技術(shù)的發(fā)展,基于數(shù)據(jù)挖掘的模式發(fā)現(xiàn)正逐漸成為醫(yī)療知識(shí)的重要來源之一,與專家知識(shí)一起構(gòu)成多維度的醫(yī)療知識(shí)體系,進(jìn)而為醫(yī)療決策提供支持。本文基于“互聯(lián)網(wǎng)+醫(yī)療健康”的特點(diǎn),結(jié)合數(shù)據(jù)挖掘、循證醫(yī)學(xué)、醫(yī)患共同決策、知識(shí)管理以及決策科學(xué)等理論方法,構(gòu)建了基于多維度醫(yī)療知識(shí)體系的決策框架,如圖6所示。
圖6 基于多維度醫(yī)療知識(shí)體系的決策框架
基于多維度醫(yī)療知識(shí)體系的支持,借助醫(yī)生經(jīng)驗(yàn)和患者知識(shí),醫(yī)患共同決策,采取契合患者的臨床診療模式、護(hù)理模式以及康復(fù)模式等,利用積累的診療數(shù)據(jù)對已有數(shù)據(jù)進(jìn)行補(bǔ)充和更新,以進(jìn)一步完善醫(yī)療知識(shí)體系,形成治療管理循環(huán)。
(1)基于多維度醫(yī)療知識(shí)的輔助診斷
在臨床實(shí)踐中,疾病診斷很大程度上依賴于醫(yī)生的專業(yè)能力和經(jīng)驗(yàn)知識(shí),這可能導(dǎo)致醫(yī)患矛盾加劇等問題?;跈C(jī)器學(xué)習(xí)的電子病歷分析可以基于歷史數(shù)據(jù)挖掘醫(yī)療知識(shí),模擬醫(yī)生診斷推理,得出較為可靠的診斷預(yù)測。
電子病歷的分析挖掘可賦能疾病預(yù)測與病情評估。基于患者的人口統(tǒng)計(jì)學(xué)信息、癥狀、檢查結(jié)果等相關(guān)數(shù)據(jù),對患者可能患有的疾病進(jìn)行預(yù)測,對患者病情輕重緩急進(jìn)行評估,可以為醫(yī)務(wù)人員的相關(guān)診斷提供支持和參考,對于后續(xù)的治療措施也有重要意義,如基于人工智能對肺結(jié)節(jié)病理類型的良惡性進(jìn)行預(yù)測[11]、基于電子病歷數(shù)據(jù)挖掘?qū)膊∥V囟冗M(jìn)行動(dòng)態(tài)預(yù)測[12]、基于混合模型對ICU病人死亡風(fēng)險(xiǎn)進(jìn)行預(yù)測[13]。
電子病歷醫(yī)學(xué)影像數(shù)據(jù)挖掘通過實(shí)現(xiàn)醫(yī)學(xué)影像自動(dòng)分析來輔助診斷。電子病歷數(shù)據(jù)中包含大量的影像數(shù)據(jù),這些數(shù)據(jù)是疾病診療決策的重要依據(jù)。醫(yī)學(xué)影像數(shù)據(jù)量占醫(yī)院數(shù)據(jù)存儲(chǔ)總量的90%以上,積累量巨大[14]。醫(yī)學(xué)影像數(shù)據(jù)的分析將花費(fèi)醫(yī)生大量的精力,且對專業(yè)知識(shí)要求比較高?;跀?shù)據(jù)挖掘的影像數(shù)據(jù)分析有助于提高診斷效率和水平,如基于裂隙燈影像對小兒白內(nèi)障進(jìn)行自動(dòng)診斷和預(yù)測[15]。
(2)基于多維度醫(yī)療知識(shí)的治療指導(dǎo)
從電子病歷數(shù)據(jù)庫中挖掘潛在的醫(yī)療知識(shí),識(shí)別大多數(shù)患者在治療過程中的最佳實(shí)踐,可為臨床治療決策提供參考,主要包括臨床用藥指導(dǎo)和臨床路徑管理。
臨床用藥一方面需要考慮藥品的成分和藥效,另一方面要考慮藥品的毒副作用和配伍問題?;陔娮硬v中的用藥等數(shù)據(jù),采用數(shù)據(jù)挖掘方法對用藥效益和藥物治療方案進(jìn)行分析,可為臨床用藥決策提供參考,如基于數(shù)據(jù)挖掘的糖尿病腎病證候及用藥規(guī)律研究[16]、基于電子病歷挖掘?qū)χ兴幏絼┡湮橐?guī)律進(jìn)行研究[17]。
在典型的治療模式挖掘中,臨床路徑挖掘是一個(gè)重要的方向。作為臨床重要決策問題,臨床路徑管理體現(xiàn)了循證醫(yī)學(xué)、質(zhì)量管理以及流程管理等現(xiàn)代管理思想,對于保障醫(yī)療質(zhì)量、優(yōu)化服務(wù)流程以及控制醫(yī)療成本具有重要作用[18]。傳統(tǒng)臨床路徑主要依靠專家知識(shí)針對特定疾病構(gòu)建的標(biāo)準(zhǔn)流程,耗時(shí)長、效率低,且需要很長時(shí)間進(jìn)行完善,通用性不強(qiáng),臨床變異較大?;卺t(yī)療大數(shù)據(jù)特別是電子病歷,采用數(shù)據(jù)挖掘技術(shù)對臨床路徑模式進(jìn)行發(fā)現(xiàn),形成臨床路徑知識(shí)體系,為患者的臨床路徑的納入、時(shí)序化管理以及變異管理等提供支持,將突破傳統(tǒng)臨床路徑的制約瓶頸,促進(jìn)臨床路徑的應(yīng)用和推廣?;诙嗑S度醫(yī)療知識(shí)的臨床路徑管理框架如圖7所示。
圖7 基于多維度醫(yī)療知識(shí)的臨床路徑管理框架
(3)基于電子病歷數(shù)據(jù)的運(yùn)營管理
在醫(yī)療系統(tǒng)運(yùn)作中,將運(yùn)營管理與信息技術(shù)結(jié)合可有效地實(shí)現(xiàn)成本控制和精細(xì)化管理。
電子病歷分析挖掘可為疾病費(fèi)用管理提供支持。運(yùn)用數(shù)據(jù)挖掘技術(shù),對疾病診療過程中的藥品、衛(wèi)生材料使用等不同的診療行為規(guī)律進(jìn)行分析識(shí)別,探索不同診療行為規(guī)律下影響患者費(fèi)用的主要因素,基于患者信息對疾病費(fèi)用進(jìn)行預(yù)測,為疾病費(fèi)用管理和控制提供了新的思路,如基于數(shù)據(jù)挖掘技術(shù)的冠心病費(fèi)用管理[19]、基于數(shù)據(jù)挖掘算法的慢性病住院費(fèi)用預(yù)測[20]、基于K-means聚類與支持向量機(jī)的大病患者住院費(fèi)用影響因素與控制策略分析[21]。
疾病診斷相關(guān)分組(diagnosis related group,DRG)是醫(yī)療成本控制和精細(xì)化管理的重要舉措,DRG將傳統(tǒng)的實(shí)報(bào)實(shí)銷的后付制轉(zhuǎn)變?yōu)轭A(yù)付制,在控制不合理費(fèi)用增長和過度醫(yī)療需求方面發(fā)揮了積極作用。在我國,對DRG的研究還處于探索階段,DRG的應(yīng)用程度還不夠,分組的合理性對DRG的應(yīng)用有重要影響。電子病歷數(shù)據(jù)蘊(yùn)含患者診療及費(fèi)用等詳細(xì)信息,數(shù)據(jù)挖掘在屬性篩選、樣本分類等方面具有突出優(yōu)勢,因此電子病歷挖掘?qū)镈RG的研究和應(yīng)用提供思路,對于費(fèi)用控制具有重要意義[22]。
隨著以電子病歷為核心的醫(yī)院信息化建設(shè)的不斷推進(jìn),智慧醫(yī)院創(chuàng)新發(fā)展,特別是在新型冠狀病毒肺炎疫情期間,智慧醫(yī)院改善了醫(yī)療服務(wù)成果,在應(yīng)對疫情、滿足人民群眾就醫(yī)需求等方面發(fā)揮了積極作用。為了進(jìn)一步加強(qiáng)智慧醫(yī)院建設(shè),國家衛(wèi)生健康委員會(huì)發(fā)布加強(qiáng)智慧醫(yī)院建設(shè)的工作通知,創(chuàng)新建設(shè)完善醫(yī)療、服務(wù)、管理“三位一體”的智慧醫(yī)院系統(tǒng),提升醫(yī)護(hù)人員工作效率,提高醫(yī)院管理水平,為患者提供高質(zhì)量、高效率的個(gè)性化醫(yī)療服務(wù)。
相關(guān)部門已針對服務(wù)和醫(yī)療分別制定《醫(yī)院智慧服務(wù)分級評估標(biāo)準(zhǔn)體系(試行)》和《電子病歷系統(tǒng)功能應(yīng)用水平分級評價(jià)方法及標(biāo)準(zhǔn)(試行)》,二者對決策支持有一定的要求。電子病歷是智慧醫(yī)院建設(shè)的基礎(chǔ),對智慧醫(yī)院的智慧服務(wù)以及電子病歷系統(tǒng)功能應(yīng)用水平分級有重要的影響。
(1)電子病歷分析對醫(yī)院智慧服務(wù)分級的影響
智慧服務(wù)指應(yīng)用信息技術(shù)改善患者的就醫(yī)體驗(yàn),提升醫(yī)療服務(wù)水平,是智慧醫(yī)院建設(shè)的重要內(nèi)容。電子病歷分析有助于個(gè)性化醫(yī)療服務(wù)的展開。表1是《醫(yī)院智慧服務(wù)分級評估標(biāo)準(zhǔn)體系(試行)》中對智慧服務(wù)的分級劃分總體要求。
表1 醫(yī)院智慧服務(wù)評估分級
將醫(yī)院智慧服務(wù)分級評估6個(gè)級別的描述文本進(jìn)行聚合。為了展示每個(gè)級別的特點(diǎn),采用TF-IDF(term frequencyinverse document frequency)方法進(jìn)行特征詞權(quán)重的計(jì)算,并將6個(gè)級別的關(guān)鍵詞以詞云圖形式進(jìn)行展示,如圖8所示。
由圖8可以大致看出醫(yī)院智慧服務(wù)每個(gè)級別的要求,也可以大致看出不同級別之間的差異。0級的主要特征詞有“手工”“登記”等,1級的主要特征詞有“預(yù)約”“信息系統(tǒng)”等,2級出現(xiàn)“自助”“共享”等特征詞,3級和4級凸顯“移動(dòng)”“在線”等特征詞,5級主要有“監(jiān)測”“記錄管理”等特征詞。特征詞的演化展現(xiàn)了不同級別要求的變化。
圖8 醫(yī)院智慧服務(wù)分級評估具體要求詞云圖
電子病歷分析將賦能實(shí)踐,助力醫(yī)院智慧服務(wù)的提升。本文參照《醫(yī)院智慧服務(wù)分級評估標(biāo)準(zhǔn)體系(試行)》中的醫(yī)院智慧服務(wù)分級評估具體要求,分析、歸納電子病歷分析可能影響的醫(yī)院智慧服務(wù)及相關(guān)任務(wù)方法,見表2。從表2可以看出,電子病歷分析有助于更高級別的醫(yī)院智慧服務(wù)建設(shè),依托分類、推薦、關(guān)聯(lián)規(guī)則、文本挖掘以及自然語言處理等數(shù)據(jù)挖掘方法,可進(jìn)一步提升醫(yī)院的智慧服務(wù)水平。
表2 電子病歷分析可能影響的醫(yī)院智慧服務(wù)及相關(guān)任務(wù)方法
(2)電子病歷分析對醫(yī)院電子病歷系統(tǒng)功能應(yīng)用水平分級的影響
《電子病歷系統(tǒng)功能應(yīng)用水平分級評價(jià)方法及標(biāo)準(zhǔn)(試行)》將電子病歷系統(tǒng)功能應(yīng)用水平劃分為0~8共9個(gè)等級,見表3。除了信息檢索等基本功能,對數(shù)據(jù)的分析挖掘和臨床決策支持也提出了較高的要求。作為支持臨床決策的一種重要方法,基于數(shù)據(jù)挖掘的電子病歷分析對醫(yī)院電子病歷系統(tǒng)功能應(yīng)用水平分級有重要影響。
對電子病歷系統(tǒng)功能應(yīng)用水平分級評價(jià)整體和局部要求的9個(gè)級別的描述文本進(jìn)行抽取。為了展示每個(gè)級別的特點(diǎn),本文同樣采用TF-IDF方法進(jìn)行特征詞權(quán)重的計(jì)算,并將9個(gè)級別的關(guān)鍵詞以詞云圖的形式進(jìn)行展示,如圖9所示。
由圖9可以大致看出,0~3級主要是基礎(chǔ)信息化建設(shè),出現(xiàn)“計(jì)算機(jī)系統(tǒng)”“數(shù)據(jù)交換”“信息系統(tǒng)”等特征詞;4級以上出現(xiàn)“審核”“集成”“知識(shí)庫”等特征詞,8級強(qiáng)調(diào)“區(qū)域”“質(zhì)量”“整合”等特征詞。
仔細(xì)分析表3中的電子病歷系統(tǒng)功能應(yīng)用水平劃分以及圖9可知,3級及以下級別主要強(qiáng)調(diào)基礎(chǔ)信息化的建設(shè),強(qiáng)調(diào)信息系統(tǒng)的建設(shè)和基礎(chǔ)的數(shù)據(jù)交換,傳統(tǒng)信息管理系統(tǒng)可以滿足3級及以下級別的基本需求。4級及以上級別強(qiáng)調(diào)數(shù)據(jù)共享和醫(yī)療決策支持,超出了傳統(tǒng)信息管理系統(tǒng)信息存儲(chǔ)與信息檢索的功能范圍?;跀?shù)據(jù)挖掘的電子病歷分析可以為4級及以上級別的電子病歷系統(tǒng)的建設(shè)提供理論以及技術(shù)方法支持。表4分析了電子病歷評級主要決策支持要求及數(shù)據(jù)挖掘相關(guān)任務(wù)方法。
表3 電子病歷系統(tǒng)功能應(yīng)用水平級別劃分
圖9 電子病歷系統(tǒng)功能應(yīng)用水平級別具體要求詞云圖
表4 電子病歷評級主要決策支持要求及數(shù)據(jù)挖掘相關(guān)任務(wù)方法
《電子病歷系統(tǒng)功能應(yīng)用水平分級評價(jià)方法及標(biāo)準(zhǔn)(試行)》中多次強(qiáng)調(diào)知識(shí)庫的應(yīng)用,特別是知識(shí)庫為4級及以上級別電子病歷應(yīng)用提供的支撐。以知識(shí)圖譜為代表的知識(shí)庫的構(gòu)建將助力全院級多維度醫(yī)療知識(shí)庫體系建設(shè)。關(guān)聯(lián)規(guī)則、自然語言處理、流程挖掘等數(shù)據(jù)挖掘理論和方法將助力電子病歷系統(tǒng)功能應(yīng)用水平的提升。
電子病歷的使用和開發(fā)利用將成為一種趨勢。但當(dāng)前電子病歷還處于建設(shè)階段,電子病歷的應(yīng)用水平比較低。據(jù)中國醫(yī)院協(xié)會(huì)信息專業(yè)委員會(huì)(CHIMA)發(fā)布的《2017—2018年度中國醫(yī)院信息化狀況調(diào)查》,目前三級醫(yī)院的功能應(yīng)用普遍集中在3級、4級,三級以下醫(yī)院主要在2級、3級。電子病歷建設(shè)過程中仍然面臨較多問題,具體如下。
(1)電子病歷建設(shè)標(biāo)準(zhǔn)不統(tǒng)一
電子病歷是對患者診療過程的詳細(xì)記錄,電子病歷數(shù)據(jù)的共享可以更好地發(fā)揮其價(jià)值。電子病歷系統(tǒng)是逐漸發(fā)展起來的,各部門、科室、醫(yī)院以及醫(yī)療服務(wù)機(jī)構(gòu)的電子病歷建設(shè)標(biāo)準(zhǔn)不盡相同,缺乏頂層設(shè)計(jì)和統(tǒng)籌推進(jìn),出現(xiàn)“數(shù)字孤島”等現(xiàn)象,嚴(yán)重阻礙了電子病歷數(shù)據(jù)跨部門、跨機(jī)構(gòu)的數(shù)據(jù)共享,限制了電子病歷系統(tǒng)的互聯(lián)互通。
(2)數(shù)據(jù)共享與隱私保護(hù)
電子病歷開放和共享過程中的數(shù)據(jù)共享和隱私保護(hù)是不可回避的問題,數(shù)據(jù)如何共享、數(shù)據(jù)開放到什么級別以及如何保護(hù)患者隱私需要重點(diǎn)研究。我國在電子病歷開放和共享方面處于初級階段,很多情況下電子病歷數(shù)據(jù)僅供內(nèi)部或者科研使用,甚至很多數(shù)據(jù)靜置于數(shù)據(jù)庫中,無法發(fā)揮其巨大價(jià)值。因此,如何在保護(hù)好患者隱私的基礎(chǔ)上開放和共享電子病歷以發(fā)揮其價(jià)值是需要探討的問題。
(3)挖掘結(jié)果的可解釋性
近年來,數(shù)據(jù)挖掘理論和方法發(fā)展迅速,尤其是深度學(xué)習(xí)算法的提出和發(fā)展,使得數(shù)據(jù)挖掘方法在多領(lǐng)域廣泛應(yīng)用,模型的表示學(xué)習(xí)能力大幅度提高。但隨著模型復(fù)雜度的增加,算法可解釋性越來越差。盡管關(guān)于數(shù)據(jù)挖掘的研究已經(jīng)很多,但挖掘結(jié)果的可解釋性仍是一個(gè)難題,并且已經(jīng)嚴(yán)重影響其在特定領(lǐng)域的應(yīng)用,尤其是醫(yī)療領(lǐng)域。如果一個(gè)決策是可以解釋的,那么決策者可以更好地評估其優(yōu)缺點(diǎn)。因此,結(jié)果的可解釋性是需要關(guān)注和解決的重要問題。
(4)挖掘結(jié)果應(yīng)用責(zé)任主體及關(guān)系
基于挖掘結(jié)果的臨床決策支持的輔助診斷在醫(yī)療責(zé)任認(rèn)定方面存在巨大挑戰(zhàn),明確責(zé)任主體及其關(guān)系能更好地促進(jìn)數(shù)據(jù)挖掘結(jié)果的應(yīng)用。當(dāng)前法律標(biāo)準(zhǔn)還未涉及此問題,因此需要進(jìn)一步完善和健全法律法規(guī)體系,以保障電子病歷的分析應(yīng)用。
基于當(dāng)前電子病歷分析、應(yīng)用存在的問題,本文給出以下建議。
(1)加強(qiáng)頂層設(shè)計(jì)和統(tǒng)籌推進(jìn)
電子病歷建設(shè)融合臨床、信息工程、管理等多領(lǐng)域,涉及管理、技術(shù)以及方法等多方面,是較復(fù)雜的問題??梢越柚獩Q策以及系統(tǒng)工程理論方法,加強(qiáng)頂層設(shè)計(jì),強(qiáng)調(diào)整體性和系統(tǒng)性,統(tǒng)籌推進(jìn)電子病歷建設(shè),實(shí)現(xiàn)提升醫(yī)療服務(wù)效率和水平的目標(biāo)。
(2)診療服務(wù)環(huán)節(jié)全覆蓋
梳理優(yōu)化業(yè)務(wù)流程,實(shí)現(xiàn)醫(yī)囑、用藥等環(huán)節(jié)的閉環(huán)管理,并基于物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等技術(shù)實(shí)現(xiàn)數(shù)據(jù)感知和存儲(chǔ),實(shí)現(xiàn)數(shù)字追蹤及可追溯,積累的數(shù)據(jù)也可為業(yè)務(wù)控制與優(yōu)化提供支持。
(3)探索隱私保護(hù)與數(shù)據(jù)共享的機(jī)制與方法
首先要建立健全隱私保護(hù)機(jī)制和風(fēng)險(xiǎn)審查機(jī)制,建立相關(guān)機(jī)構(gòu)對隱私保護(hù)進(jìn)行監(jiān)察和審查。其次要在保護(hù)隱私的前提下促進(jìn)數(shù)據(jù)的共享,使其產(chǎn)生更大的價(jià)值。一方面可以從機(jī)制上完善數(shù)據(jù)共享流程,另一方面也可從模型算法層面探索如何在保障數(shù)據(jù)隱私的前提下訓(xùn)練和共享模型。
(4)綜合算法性能和可解釋性
隨著機(jī)器學(xué)習(xí)理論算法以及計(jì)算機(jī)硬件的不斷發(fā)展,算法性能得到很大提升。特別是基于深度學(xué)習(xí)的廣泛應(yīng)用,模型擬合能力更強(qiáng)。但是復(fù)雜模型的可解釋性大大降低,這限制了其在特殊領(lǐng)域的應(yīng)用,特別是醫(yī)療領(lǐng)域。需要綜合算法性能和可解釋性來提高算法的綜合效用。建模前主要對數(shù)據(jù)進(jìn)行預(yù)處理,可以通過數(shù)據(jù)探索性分析以及可視化等方法對問題有更深的認(rèn)識(shí)。建立解釋性程度比較高的模型(如決策樹、邏輯回歸等)可以使得到的結(jié)果更具有解釋性。針對一些“黑箱”算法,可以在建模后采用隱層分析、敏感度分析以及知識(shí)蒸餾等方法來提高可解釋性[23]。
(5)發(fā)揮臨床診療決策支持的功能
面對臨床醫(yī)護(hù)人員相對不足以及人們對醫(yī)療水平的要求不斷提高等現(xiàn)實(shí)問題,基于電子病歷數(shù)據(jù)挖掘的決策支持將在輔助臨床診療決策方面發(fā)揮巨大價(jià)值,已有電子病歷數(shù)據(jù)脫敏、集成及二次利用等平臺(tái)在醫(yī)院醫(yī)療能力、質(zhì)量、效率的分析中被采用[24]。隨著電子病歷應(yīng)用的不斷加深,各地醫(yī)院嘗試應(yīng)用臨床決策支持系統(tǒng),但是由于信息系統(tǒng)性能、責(zé)任主體以及觀念等原因,實(shí)際應(yīng)用不足。臨床決策支持系統(tǒng)有助于減少醫(yī)療差錯(cuò)和醫(yī)療糾紛情況的發(fā)生,通過綜合分析多模態(tài)信息(如人口統(tǒng)計(jì)學(xué)信息、臨床表現(xiàn)、檢查結(jié)果以及既往史等),進(jìn)一步保障了診療過程(問、檢、診、療等)的全面性、科學(xué)性以及規(guī)范性,提升了臨床決策和醫(yī)療服務(wù)的質(zhì)量。因此,需要克服當(dāng)前臨床決策支持系統(tǒng)的應(yīng)用阻礙,發(fā)揮其在臨床決策中的重要作用。
在政府大力推進(jìn)智慧醫(yī)院建設(shè)的背景下,本文對電子病歷的分析利用框架進(jìn)行探討。本文首先介紹了電子病歷的內(nèi)涵及其生成,之后對其分析利用框架進(jìn)行梳理,對其分析流程進(jìn)行總結(jié),從診斷、治療以及管理3個(gè)角度對其應(yīng)用進(jìn)行闡述。然后,本文分析了電子病歷分析對智慧醫(yī)院相關(guān)評級的影響,通過對評級整體和具體要求的分析,指出電子病歷分析挖掘是智慧醫(yī)院較高等級的要求,將助力高等級智慧醫(yī)院建設(shè)。最后,本文從數(shù)據(jù)、模型以及應(yīng)用層面探討當(dāng)前電子病歷分析利用中存在的問題,并據(jù)此給出相關(guān)建議。在未來的電子病歷分析利用建設(shè)中,可參考智慧醫(yī)院相關(guān)分析的具體要求,重點(diǎn)關(guān)注電子病歷建設(shè)的頂層設(shè)計(jì)、電子病歷數(shù)據(jù)共享機(jī)制、電子病歷數(shù)據(jù)挖掘模型算法和解釋性以及電子病歷分析挖掘結(jié)果的臨床應(yīng)用等方面的問題。