陳曉明,劉海林
浙江中醫(yī)藥大學(xué)附屬第三醫(yī)院,杭州 310005
?
基于商業(yè)智能技術(shù)的醫(yī)院經(jīng)營決策分析平臺的開發(fā)與應(yīng)用
陳曉明,劉海林
浙江中醫(yī)藥大學(xué)附屬第三醫(yī)院,杭州310005
【摘要】:通過基于商業(yè)智能技術(shù)的醫(yī)院經(jīng)營決策分析平臺建設(shè),對醫(yī)院信息系統(tǒng)中的數(shù)據(jù)進(jìn)行深層次的挖據(jù)與分析,從而提高數(shù)據(jù)資源的利用率,為醫(yī)院的發(fā)展、管理和醫(yī)療服務(wù)提供準(zhǔn)確、全面和及時(shí)的決策依據(jù)。
【關(guān)鍵詞】:商業(yè)智能;數(shù)據(jù)挖據(jù);數(shù)據(jù)倉庫
【DOI】:10.13566/j.cnki.cmet.cn61-1317/g4.201604024
隨著醫(yī)院信息化建設(shè)的不斷深化,醫(yī)院信息系統(tǒng)積累了大量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)包含大量文字、圖像、聲音等醫(yī)學(xué)信息,使醫(yī)院的數(shù)據(jù)庫呈指數(shù)增長[1]。雖然這些數(shù)據(jù)對于醫(yī)院的日常管理、疾病控制等方面有很大的價(jià)值,但并不能被充分有效地利用,僅限于應(yīng)用簡單查詢、刪除、統(tǒng)計(jì)等基礎(chǔ)的功能,而在如何從大量的數(shù)據(jù)中發(fā)現(xiàn)醫(yī)院運(yùn)作的基本規(guī)律,預(yù)測醫(yī)院發(fā)展的趨勢等方面還有所欠缺,造成信息資源的巨大浪費(fèi)。因此,如何有效提高數(shù)據(jù)資源的利用率,為醫(yī)院的發(fā)展、管理和醫(yī)療服務(wù)提供準(zhǔn)確、全面和及時(shí)的決策依據(jù),已經(jīng)成為眾多醫(yī)院迫切需要考慮的問題[2]。
2014年,浙江中醫(yī)藥大學(xué)附屬第三醫(yī)院在醫(yī)院信息系統(tǒng)網(wǎng)絡(luò)架構(gòu)的基礎(chǔ)上,充分利用醫(yī)院信息系統(tǒng),在不影響原有業(yè)務(wù)系統(tǒng)和數(shù)據(jù)結(jié)構(gòu)的前提下,成功地開發(fā)和應(yīng)用了基于商業(yè)智能技術(shù)的醫(yī)院經(jīng)營決策分析平臺。
商業(yè)智能技術(shù)可以將海量數(shù)據(jù)信息轉(zhuǎn)化為有價(jià)值的知識,精確地挖掘和處理大量的業(yè)務(wù)數(shù)據(jù),從而輔助決策管理層更深入地了解業(yè)務(wù)數(shù)據(jù),并做出正確的經(jīng)營戰(zhàn)略和決策[3]。通過研究與應(yīng)用商業(yè)智能技術(shù),結(jié)合醫(yī)院業(yè)務(wù)流程整合HIS、EMR、LIS、PACS等系統(tǒng)的數(shù)據(jù)為基礎(chǔ)業(yè)務(wù)數(shù)據(jù)源,確立數(shù)據(jù)庫主題域,利用SQL Server 2005集成工具對數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換和加載,完成數(shù)據(jù)庫的建立。根據(jù)國家衛(wèi)計(jì)委《三級綜合醫(yī)院醫(yī)療質(zhì)量管理與控制指標(biāo)(2011年版)》七大類指標(biāo)和浙江省衛(wèi)計(jì)委《浙江省醫(yī)療質(zhì)量核心指標(biāo)監(jiān)測評價(jià)工作方案》中明確要定期上報(bào)、收集及分析評價(jià)的醫(yī)療質(zhì)量核心指標(biāo),利用聯(lián)機(jī)分析處理(on line analysis processing,OLAP)技術(shù)實(shí)現(xiàn)切片、切塊、上鉆、下鉆、交叉鉆取的多維數(shù)據(jù)分析[4];采用關(guān)聯(lián)規(guī)則(Apriori算法)、決策樹分類(ID3算法)等數(shù)據(jù)挖掘方法,尋找隱藏在數(shù)據(jù)間的關(guān)系和聯(lián)系,從而發(fā)現(xiàn)醫(yī)療數(shù)據(jù)的內(nèi)在規(guī)律[5];并在以上基礎(chǔ)上,以.Net framework 3.5為開發(fā)平臺、VS 2008為開發(fā)工具、SQL Server 2005為后臺數(shù)據(jù)庫,采用B/S架構(gòu),完成醫(yī)院經(jīng)營決策分析系統(tǒng)的開發(fā),實(shí)現(xiàn)相關(guān)業(yè)務(wù)模型的可視化展現(xiàn)和分析,以便決策者及時(shí)全面了解醫(yī)院的經(jīng)營情況,做出正確的決策。
3.1研究方法
3.1.1需求分析需求分析是數(shù)據(jù)倉庫設(shè)計(jì)的基礎(chǔ),即要明確哪些數(shù)據(jù)需經(jīng)過分析以滿足用戶的決策支持需求。該項(xiàng)目總結(jié)醫(yī)院決策支持系統(tǒng)使用者的需求主要有以下幾個(gè)方面:一是患者信息。可分析患者構(gòu)成比例,也可對患者就診時(shí)間進(jìn)行分析和趨勢預(yù)測;二是費(fèi)用信息??煞治稣麄€(gè)醫(yī)院、各個(gè)科室或者某個(gè)病區(qū)、某類疾病的患者費(fèi)用構(gòu)成情況,以及不同時(shí)間段內(nèi)醫(yī)院各個(gè)科室同期的各種費(fèi)用對比分析;三是成本效益信息。對醫(yī)院的成本效益情況進(jìn)行全面的分析,從而真正掌握醫(yī)院的實(shí)際經(jīng)營狀況,提高醫(yī)院的經(jīng)濟(jì)效益,挖掘醫(yī)院服務(wù)潛力。
3.1.2數(shù)據(jù)倉庫的設(shè)計(jì)
①概念模型的設(shè)計(jì)。概念模型是將需求分析過程中得到的用戶需求抽象為計(jì)算機(jī)表示的信息結(jié)構(gòu)。根據(jù)以上確立的決策支持需求,確定了患者信息、費(fèi)用信息、成本效益信息三個(gè)主題,并通過主題域分析確定了主題邊界。概念模型最常用的表示方法是實(shí)體—關(guān)系法(E-R法)。
②邏輯模型的設(shè)計(jì)。邏輯模型設(shè)計(jì)是把概念模型設(shè)計(jì)好的E-R圖轉(zhuǎn)換成計(jì)算機(jī)所支持的數(shù)據(jù)模型。數(shù)據(jù)倉庫的邏輯模型有三種:星型模型、雪花模型和混合模型。該項(xiàng)目圍繞主題設(shè)計(jì)事實(shí)表,選擇星型模型建立數(shù)據(jù)倉庫的邏輯模型,每個(gè)子主題對應(yīng)一個(gè)星型模型結(jié)構(gòu)。
以“費(fèi)用信息”主題為例,它含有醫(yī)生維、科室維、時(shí)間維、收費(fèi)項(xiàng)目維四個(gè)維表,形成了“費(fèi)用信息”分析的不同角度(某段醫(yī)師、某個(gè)科室、某段時(shí)間、某類收費(fèi)項(xiàng)目),事實(shí)表由這四個(gè)維表的主鍵和一個(gè)度量指標(biāo)“費(fèi)用總計(jì)”組成,一個(gè)事實(shí)表與四個(gè)維表聯(lián)系起來構(gòu)成了一個(gè)四維分析空間。
③物理模型的設(shè)計(jì)。實(shí)現(xiàn)數(shù)據(jù)的抽取、變換、載入過程的設(shè)計(jì),基于邏輯模型構(gòu)建物理數(shù)據(jù)庫,并創(chuàng)建多維數(shù)據(jù)集,建立數(shù)據(jù)倉庫的物理模型。
3.1.3數(shù)據(jù)倉庫的實(shí)施
①創(chuàng)建數(shù)據(jù)倉庫。數(shù)據(jù)倉庫的框架是由事實(shí)表和維表組成,數(shù)據(jù)倉庫的創(chuàng)建可以采用SQL Server 2005中的數(shù)據(jù)庫與表創(chuàng)建工具實(shí)現(xiàn)。
②抽取數(shù)據(jù)。主要是通過網(wǎng)絡(luò)把從醫(yī)院信息系統(tǒng)中提取出的數(shù)據(jù)傳輸?shù)綌?shù)據(jù)倉庫中,利用SQL Server 2005 Integration Services(SSIS)等工具,制定數(shù)據(jù)源與目標(biāo)數(shù)據(jù)間的映射關(guān)系,把數(shù)據(jù)轉(zhuǎn)換和導(dǎo)入、導(dǎo)出過程保存在存儲過程中,讓服務(wù)器自動、定期的執(zhí)行。
③清理和轉(zhuǎn)換數(shù)據(jù)。通過SQL Server 2005的Transact-SQL查詢、SSIS包、ActiveX腳本來完成數(shù)據(jù)的一致性檢查、格式化處理等清理工作,并對數(shù)據(jù)進(jìn)行必要的轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換的目的是將數(shù)據(jù)轉(zhuǎn)換成適合于挖掘的形式,常用的方法是數(shù)據(jù)概化。如對于病名高血壓,在患者的診斷記錄中有可能記錄為高血壓病、原發(fā)性高血壓、高血壓1級、高血壓2級、高血壓3級,等,進(jìn)行挖掘時(shí)都需要將其概化為高血壓。
④加載數(shù)據(jù)。經(jīng)過數(shù)據(jù)提取、數(shù)據(jù)清理與集成之后,數(shù)據(jù)就加載到數(shù)據(jù)倉庫之中。根據(jù)醫(yī)院業(yè)務(wù)的特點(diǎn),加載周期要考慮業(yè)務(wù)分析需求和系統(tǒng)加載的代價(jià),可以對不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)采用不同的加載周期,但必須保持同一時(shí)間業(yè)務(wù)數(shù)據(jù)的完整性。
3.1.4聯(lián)機(jī)分析處理結(jié)合國家衛(wèi)計(jì)委《三級綜合醫(yī)院醫(yī)療質(zhì)量管理與控制指標(biāo)(2011年版)》七大類指標(biāo)(住院死亡類、重返類、醫(yī)院感染類、手術(shù)并發(fā)癥類、患者安全類、醫(yī)療機(jī)構(gòu)合理用藥、醫(yī)院運(yùn)行管理類)以及浙江省衛(wèi)計(jì)委于2013年頒布的《浙江省醫(yī)療質(zhì)量核心指標(biāo)監(jiān)測評價(jià)工作方案》中明確需要定期上報(bào)、收集及分析評價(jià)的醫(yī)療質(zhì)量核心指標(biāo)(門急診核心指標(biāo):工作負(fù)荷類、患者負(fù)擔(dān)類;住院核心指標(biāo):醫(yī)院運(yùn)行管理類、住院死亡類、患者安全類、重返類、醫(yī)院感染類;其他核心指標(biāo):合理用藥類、優(yōu)質(zhì)護(hù)理類),對決策數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行多維度、細(xì)粒度的分析。
利用SQL Server Analysis Services工具實(shí)現(xiàn)OLAP應(yīng)用的創(chuàng)建和管理;采用OLAP多維分析技術(shù),實(shí)現(xiàn)對多維數(shù)據(jù)集的切片、切塊、旋轉(zhuǎn)、鉆取和卷取,解決多因素、多層次的數(shù)據(jù)分析問題。
3.1.5數(shù)據(jù)挖掘使用SQL Server 2005 Analysis Services工具,利用系統(tǒng)提供的“挖掘模型向?qū)А?,?gòu)建數(shù)據(jù)挖掘模型,選擇挖掘算法對數(shù)據(jù)源進(jìn)行數(shù)據(jù)挖掘。
①關(guān)聯(lián)規(guī)則(Apriori算法):針對患者構(gòu)成、疾病癥候以及處方用藥等展開研究。
②決策樹分類(ID3算法):針對費(fèi)用構(gòu)成、就醫(yī)流程、醫(yī)療質(zhì)量以及成本效益等展開研究。
3.1.6系統(tǒng)開發(fā)
①基于傳統(tǒng)終端的開發(fā)。以.Net framework 3.5為開發(fā)平臺、VS2008為開發(fā)工具、SQL Server 2005為后臺數(shù)據(jù)庫,前端展示采用B/S架構(gòu),無須在客戶機(jī)安裝客戶端,業(yè)務(wù)擴(kuò)展簡單方便,只需要改變網(wǎng)頁,即可實(shí)現(xiàn)所有用戶的同步與更新。同時(shí),為了更直觀地展示多維度數(shù)據(jù),在同一個(gè)界面中展示盡可能多的信息量,系統(tǒng)在開發(fā)時(shí)采用了多種綜合的數(shù)據(jù)展示方式,包括儀表盤、趨勢圖、餅圖、柱狀圖、固定報(bào)表等形式。
②基于移動終端的開發(fā)。Android端的開發(fā)是在Android SDK環(huán)境下,使用Android studio集成環(huán)境和SVN團(tuán)隊(duì)協(xié)作工具。其數(shù)據(jù)展示思路為:發(fā)送網(wǎng)絡(luò)請求、服務(wù)器返回?cái)?shù)據(jù)、消息傳遞、UI更新。網(wǎng)絡(luò)請求摒棄傳統(tǒng)且復(fù)雜的Http Client和Http URL Connection,使用AsyncHttp 1.5框架,加快網(wǎng)絡(luò)加載速度;消息傳遞使用開源框架Event Bus;UI使用Android Animations,利用注解的方式精簡大部分代碼。其中,餅圖、柱狀圖、比例圖等使用自定義框架,復(fù)用性高,圖片采用Image Loader框架,解決了緩存、圖片壓縮等問題。
IOS端的開發(fā)依照MVC框架設(shè)計(jì),并采用了工廠類模式、分層次設(shè)計(jì),將頁面搭建和業(yè)務(wù)邏輯分離,代碼可讀性增強(qiáng),后期維護(hù)方便??蛻舳酥写蟛糠挚丶锰O果主流的控件。其中,圖表基于貝塞爾曲線繪制,動畫基于蘋果的Core Animation開發(fā)??蛻舳怂@取的數(shù)據(jù)都經(jīng)過AES和MD5加密,保證了數(shù)據(jù)的安全。
4.1患者構(gòu)成比例分析
對醫(yī)院信息系統(tǒng)中的患者門診和住院信息進(jìn)行分析,如地區(qū)分布、性別差異、職業(yè)構(gòu)成、年齡段、收入層次、疾病類型,等,從而得到某類地區(qū)、某類人群和某類疾病等方面的相關(guān)聯(lián)系,為主管部門確定醫(yī)院發(fā)展方向提供客觀依據(jù),如圖1所示。
圖1 某專家患者構(gòu)成分析
4.2患者就診時(shí)間分析
通過分析每月、每季度不同時(shí)間段的門診人次、住院人次、床位利用率,建立時(shí)間維度分析,利用相應(yīng)模型來預(yù)測下一個(gè)時(shí)期門診和住院患者趨勢,使管理者更有針對性地采取措施,配置醫(yī)療人員及設(shè)備資源。
4.3患者費(fèi)用構(gòu)成分析
分析整個(gè)醫(yī)院、各科室或某病區(qū)、某類疾病的患者費(fèi)用構(gòu)成情況,進(jìn)而為有針對性地控制費(fèi)用比例,探究醫(yī)療費(fèi)用項(xiàng)目改革提供決策支持,解決目前看病貴、醫(yī)療限價(jià)等問題,制定國家基本藥品目錄。
4.4同期費(fèi)用對比分析
對不同時(shí)間段內(nèi)醫(yī)院各個(gè)科室同期的各種費(fèi)用進(jìn)行對比分析,并生成相應(yīng)費(fèi)用報(bào)表,醫(yī)院管理者可以根據(jù)這些分析結(jié)果優(yōu)化、改進(jìn)科室工作效率,節(jié)約成本,提升服務(wù)質(zhì)量,如圖2所示。
圖2 某專家業(yè)務(wù)費(fèi)用及構(gòu)成分析
4.5醫(yī)院成本效益分析
可以將各個(gè)不同子系統(tǒng)的數(shù)據(jù)進(jìn)行匯總,構(gòu)建數(shù)據(jù)倉庫,然后利用該數(shù)據(jù)倉庫對醫(yī)院的成本效益情況進(jìn)行全面的分析,從而真正掌握醫(yī)院的實(shí)際經(jīng)營狀況,提高醫(yī)院的經(jīng)濟(jì)效益,挖掘醫(yī)院服務(wù)潛力。
該項(xiàng)目利用商業(yè)智能技術(shù),針對醫(yī)院業(yè)務(wù)流程整合HIS、EMR、LIS、PACS、HRP等信息系統(tǒng)的數(shù)據(jù)為基礎(chǔ)業(yè)務(wù)數(shù)據(jù)源,并根據(jù)實(shí)際需求,抽取、確立主題,利用SQL Server 2005集成工具對數(shù)據(jù)進(jìn)行清洗、抽取、數(shù)據(jù)轉(zhuǎn)換和加載,完成數(shù)據(jù)倉庫的建立;利用OLAP技術(shù)實(shí)現(xiàn)切片、切塊、上鉆、下鉆、交叉鉆取的多維數(shù)據(jù)分析和數(shù)據(jù)挖掘,制定出醫(yī)院相關(guān)業(yè)務(wù)的分析模型,并在此基礎(chǔ)上進(jìn)行醫(yī)院臨床決策分析平臺的建設(shè),實(shí)現(xiàn)相關(guān)業(yè)務(wù)分析模型的可視化展現(xiàn)和分析,可以方便決策者在任何地方、任何時(shí)間對系統(tǒng)進(jìn)行訪問,及時(shí)、全面了解醫(yī)院的經(jīng)營情況,做出正確的決策。隨著數(shù)據(jù)的進(jìn)一步采集與整理以及挖掘算法的不斷完善,該平臺必將為醫(yī)院疾病診斷和治療、醫(yī)院管理決策等帶來極大的方便和可觀的效益。其成果可以應(yīng)用到建有信息系統(tǒng)的各級醫(yī)療機(jī)構(gòu),在網(wǎng)絡(luò)和信息化社會環(huán)境下,其具有廣闊的應(yīng)用前景。
參考文獻(xiàn)
[1]陳寧,陳玲,張志強(qiáng).數(shù)據(jù)分析系統(tǒng)在醫(yī)院信息系統(tǒng)中的應(yīng)用[J].中國數(shù)字醫(yī)學(xué),2009,4(6):67-69
[2]郭慶,谷巖.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息系統(tǒng)的統(tǒng)計(jì)分析與決策中的應(yīng)用[J].中國醫(yī)療設(shè)備,2010,25(5):64-67
[3]馮強(qiáng),鄭垂勇.商業(yè)智能技術(shù)在物流企業(yè)數(shù)據(jù)倉庫設(shè)計(jì)中的應(yīng)用[J].物流技術(shù):裝備版2015,34(14):192-194
[4]俞磊.基于DW的醫(yī)院決策支持系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].合肥師范學(xué)院學(xué)報(bào),2010,28(3):76-78
[5]周才英,吳闊華.關(guān)聯(lián)規(guī)則挖掘技術(shù)在決策支持系統(tǒng)中的應(yīng)用[J].江西理工大學(xué)學(xué)報(bào),2007,28(4):47-49
【中圖分類號】:R-058
【文獻(xiàn)標(biāo)志碼】:A
【文章編號】:1004-5287(2016)04-0453-03
收稿日期:2016-03-31
作者簡介:陳曉明(1967-),男,杭州人,工程師,本科,主要研究方向:醫(yī)院信息管理。
Development and application of hospital decision support platform based on business intelligence technology
Chen Xiaoming,Liu Hailin
The Third Affiliated Hospital,Zhejiang Chinese Medical University,Hangzhou 310005,China
【Abstract】:This paper first introduces the construction of hospital decision support platform based on business intelligence technology.Then it makes in-depth mining and analysis of the data of the hospital information system so as to improve the utilization of data resources and provide evidence for accurate,comprehensive and timely decision making in hospital's development,management and medical care service.
【Key words】:business intelligence;data mining;data warehouse