邊榮云
[摘 要] 醫(yī)院檔案管理信息化存在著海量信息數(shù)據(jù)無(wú)法有效利用的問(wèn)題,對(duì)醫(yī)院醫(yī)療質(zhì)量提高,管理水平提升的輔助決策支持功能不足。本文詳細(xì)探討了醫(yī)院決策支持系統(tǒng)中疾病轉(zhuǎn)歸統(tǒng)計(jì)分析數(shù)據(jù)倉(cāng)庫(kù)(DW)的設(shè)計(jì)方法及過(guò)程,并在此基礎(chǔ)上構(gòu)建聯(lián)機(jī)分析處理(OLAP)系統(tǒng),根據(jù)數(shù)據(jù)分析的需求選取OLAP主題,進(jìn)行多維數(shù)據(jù)模型的設(shè)計(jì),運(yùn)用MDX多維查詢語(yǔ)言實(shí)現(xiàn)疾病轉(zhuǎn)歸統(tǒng)計(jì)數(shù)據(jù)分析,并應(yīng)用決策樹對(duì)影響因素進(jìn)行深度數(shù)據(jù)挖掘,實(shí)現(xiàn)高效管理和決策的支持作用。
[關(guān)鍵詞] 數(shù)據(jù)倉(cāng)庫(kù);疾病轉(zhuǎn)歸統(tǒng)計(jì)分析;決策支持
中圖分類號(hào):R194 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2055-5200(2014)02-009-03
醫(yī)院檔案包括醫(yī)院診斷、治療、護(hù)理等醫(yī)療活動(dòng)中形成的文字、圖表、影像等諸多材料,是醫(yī)院醫(yī)療業(yè)務(wù)信息的主要載體。經(jīng)過(guò)系統(tǒng)歸納整理后可以為醫(yī)院醫(yī)療、教學(xué)、科研提供豐富基礎(chǔ)資料,通過(guò)病案分析和統(tǒng)計(jì)處理可以為醫(yī)院管理提供一手的詳實(shí)資料。
隨著信息技術(shù)的發(fā)展,圍繞著醫(yī)院信息系統(tǒng)(Hospital Information System, HIS)及配套接入開發(fā)的諸多系統(tǒng),醫(yī)院的管理模式實(shí)現(xiàn)了由經(jīng)驗(yàn)管理向信息管理的轉(zhuǎn)變。HIS系統(tǒng)以病人醫(yī)療信息、醫(yī)院經(jīng)濟(jì)信息和醫(yī)院管理信息3條信息主線來(lái)提供技術(shù)支持平臺(tái),使大量的醫(yī)院日常醫(yī)療、經(jīng)濟(jì)和管理事務(wù)電子化,實(shí)現(xiàn)了高效的數(shù)據(jù)錄入、查詢、統(tǒng)計(jì)等功能,對(duì)提高醫(yī)院工作效率、質(zhì)量和服務(wù)水平等方面起到重要作用[1]。檔案管理的信息化也在逐步完善,但是病案資料積累越多,信息化后的內(nèi)容越豐富,信息流的作用越強(qiáng),反饋出來(lái)的數(shù)據(jù)處理要求就越高,如果沒(méi)有一定的技術(shù)手段方法是實(shí)現(xiàn)不了這些要求的。
面對(duì)醫(yī)院信息數(shù)據(jù)量的迅速膨脹,傳統(tǒng)數(shù)據(jù)庫(kù)陷入“數(shù)據(jù)爆炸,知識(shí)貧乏”的境地。數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse,DW)的出現(xiàn)有效地彌補(bǔ)了傳統(tǒng)數(shù)據(jù)庫(kù)在分析型應(yīng)用上的缺陷。利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)將傳統(tǒng)病案系統(tǒng)中所積累的海量數(shù)據(jù)背后隱藏的有價(jià)值的信息挖掘出來(lái),從而獲取二次相關(guān)信息為醫(yī)院的決策管理、醫(yī)療、科研和教學(xué)服務(wù)提供了一種科學(xué)的解決方案[2]。本研究以患者疾病轉(zhuǎn)歸統(tǒng)計(jì)分析相關(guān)信息為數(shù)據(jù)源,建立了醫(yī)院醫(yī)療質(zhì)量分析的多維數(shù)據(jù)模型及多維數(shù)據(jù)集的數(shù)據(jù)倉(cāng)庫(kù),通過(guò)聯(lián)機(jī)分析處理對(duì)疾病轉(zhuǎn)歸進(jìn)行數(shù)據(jù)挖掘從而提供醫(yī)療決策的相關(guān)信息,將對(duì)醫(yī)院的管理產(chǎn)生積極作用。下文將對(duì)疾病轉(zhuǎn)歸統(tǒng)計(jì)分析決策支持系統(tǒng)的構(gòu)建進(jìn)行闡述。
1 數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建
1.1 疾病轉(zhuǎn)歸統(tǒng)計(jì)分析數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)
以住院病人療效為倉(cāng)庫(kù)主題,建立星型倉(cāng)庫(kù)模型,以一個(gè)事實(shí)表和4個(gè)維表為主要內(nèi)容,其中維表分別為科室維,時(shí)間維,病種維和病人基本情況維,如圖所示。事實(shí)表包含聯(lián)機(jī)分析處理(OLAP)多維數(shù)據(jù)集中所有的度量值,包括住院天數(shù)、各項(xiàng)費(fèi)用;維度表中的不同屬性應(yīng)用文字,離散值等表示,如年齡段分為5段(0~20歲、21~30歲、30~50歲、50~60歲、60歲以上);疾病名稱以ICD-10主類、ICD-10亞類、ICD-10子類表示,維度關(guān)鍵字是與事實(shí)表關(guān)聯(lián)的橋梁,是用于查詢事實(shí)表數(shù)據(jù)的唯一標(biāo)識(shí)符[3]。通過(guò)這種構(gòu)架,可進(jìn)行多維度查詢。
圖1 疾病轉(zhuǎn)歸統(tǒng)計(jì)分析數(shù)據(jù)倉(cāng)庫(kù)星型模型
1.2 數(shù)據(jù)預(yù)處理
HIS系統(tǒng)中大量的數(shù)據(jù)信息中有一部分為空缺數(shù)據(jù)、不一致數(shù)據(jù)或包含有錯(cuò)誤或存在偏倚的噪聲數(shù)據(jù),在進(jìn)行數(shù)據(jù)挖掘前必須對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,清洗后的數(shù)據(jù)才能保證數(shù)據(jù)的一致性和有效性。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)集成和數(shù)據(jù)清理兩部分,其中數(shù)據(jù)集成是將所有的病人的基本信息和醫(yī)療信息數(shù)據(jù)進(jìn)行整合,將從病人主索引表中抽取的所有信息集成到統(tǒng)一的數(shù)據(jù)表中,對(duì)不一致的字段長(zhǎng)度,不一致的賦值等進(jìn)行數(shù)據(jù)轉(zhuǎn)換,整合為統(tǒng)一的格式,如日期形式2012-04-10轉(zhuǎn)換為時(shí)間為上定義的年,月,日格式:2012,4,10;數(shù)據(jù)清理是將缺陷數(shù)據(jù)且無(wú)法進(jìn)行轉(zhuǎn)換的數(shù)據(jù)屏蔽,如篩查2012年的數(shù)據(jù)資料,經(jīng)信息提取后發(fā)現(xiàn)存在部分2011年的數(shù)據(jù)資料時(shí),可通過(guò)定義語(yǔ)句進(jìn)行清洗。
1.3 數(shù)據(jù)倉(cāng)庫(kù)的加載和轉(zhuǎn)換
在SQL Server 2000中使用Transact—SQL、數(shù)據(jù)轉(zhuǎn)換服務(wù)(DTS)和BSP將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中。DTS是以O(shè)LE DB或ODBC等接口技術(shù)連接數(shù)據(jù)源與數(shù)據(jù)目的[4],其驅(qū)動(dòng)數(shù)據(jù)進(jìn)行導(dǎo)入、導(dǎo)出等轉(zhuǎn)換操作,實(shí)現(xiàn)數(shù)據(jù)源與數(shù)據(jù)目的間的交換。轉(zhuǎn)換結(jié)構(gòu)圖見圖2。通過(guò)上述操作過(guò)程,醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)建立完成,為后續(xù)多維數(shù)據(jù)的分析和數(shù)據(jù)挖掘進(jìn)行了鋪墊。
圖2 DTS數(shù)據(jù)轉(zhuǎn)換流程圖
2 基于數(shù)據(jù)倉(cāng)庫(kù)的疾病轉(zhuǎn)歸統(tǒng)計(jì)分析OLAP建模分析
多維數(shù)據(jù)集的構(gòu)建完成后可進(jìn)行以病人、疾病和費(fèi)用等多個(gè)主題開展的OLAP分析。如通過(guò)醫(yī)療付款方式維度進(jìn)行住院費(fèi)用構(gòu)成分析;通過(guò)月份或年份來(lái)分析總住院患者的變化趨勢(shì),或在展現(xiàn)層上定義一些附加度量值,如“增減率”,以反映科室病種的變化趨勢(shì)。在進(jìn)行OLAP分析中,可以運(yùn)用切片、切塊,旋轉(zhuǎn),鉆過(guò)和鉆透等操作程序,或通過(guò)編寫多維查詢語(yǔ)言MDX(Multi-Dimensional Expressions, 多維表達(dá)式)程序進(jìn)行查詢,可以獲得不同匯總結(jié)果上的觀察數(shù)據(jù),也可以獲得住院患者相關(guān)因素間的關(guān)系,我們也可以選擇2個(gè)以上的維度的數(shù)據(jù)實(shí)現(xiàn)多維數(shù)據(jù)集的分析[5-6],如以“科室”和“費(fèi)用類型”類型為關(guān)鍵詞。查詢各科室醫(yī)療費(fèi)用占比的MDX代碼及結(jié)果如下圖3:
圖3 查詢結(jié)果示意圖
3 分析決策支持的實(shí)現(xiàn)
數(shù)據(jù)挖掘(Data Mining,DM)技術(shù)是決策分析的重要工具,目前應(yīng)用比較廣泛的DM算法主要有基于規(guī)則系統(tǒng)的決策樹、聚類分析、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)方法等[7]。在實(shí)際應(yīng)用中,數(shù)據(jù)挖掘可為醫(yī)院管理決策提供多層面幫助。例如利用決策樹方法提取數(shù)據(jù)庫(kù)中的患者信息,包括性別、年齡、入院情況、藥品費(fèi)用等各個(gè)屬性,構(gòu)建相關(guān)性網(wǎng)絡(luò),應(yīng)用相應(yīng)的運(yùn)算方法分析患者信息,得到總醫(yī)療費(fèi)用的強(qiáng)關(guān)聯(lián)項(xiàng)住院天數(shù)與藥品費(fèi),最終得到醫(yī)療費(fèi)用的層決策樹,如圖4所示。決策樹由“Generate decision tree”給定的訓(xùn)練數(shù)據(jù)產(chǎn)生,訓(xùn)練樣本有表示住院費(fèi)用的每個(gè)屬性以離散值的形式表示,運(yùn)算過(guò)程中產(chǎn)生的各個(gè)節(jié)點(diǎn)為不同的分支點(diǎn),顯示費(fèi)用的不同影響屬性,而每一個(gè)節(jié)點(diǎn)內(nèi)的所有樣本均為同一類別。從數(shù)據(jù)挖掘的最終結(jié)果看,藥品費(fèi)用和住院天數(shù)是醫(yī)療費(fèi)用的強(qiáng)影響點(diǎn),與醫(yī)療費(fèi)用呈正相關(guān),住院天數(shù)越長(zhǎng),藥品費(fèi)用越高則患者的總住院費(fèi)越高。在模型判斷的基礎(chǔ)上進(jìn)行有針對(duì)性的費(fèi)用控制決策將是一種目的明確、針對(duì)性強(qiáng),高效的決策支持方法[8-9]。
4 結(jié)論
針對(duì)醫(yī)院檔案利用效率低,海量數(shù)據(jù)對(duì)信息管理系統(tǒng)決策支持不足的現(xiàn)狀,嘗試應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)和基于多維數(shù)據(jù)集的OLAP技術(shù)及數(shù)據(jù)挖掘技術(shù),對(duì)醫(yī)學(xué)信息數(shù)據(jù)進(jìn)行分析,挖掘出更多深層次的、有價(jià)值的信息,為醫(yī)院管理者提供了輔助決策的依據(jù)。同時(shí),隨著醫(yī)院信息技術(shù)的不斷發(fā)展,還可以開發(fā)預(yù)算警示模塊等多個(gè)實(shí)用的,有針對(duì)性的模塊,建立面向醫(yī)院各級(jí)管理層的決策支持系統(tǒng),切實(shí)地、真正地實(shí)現(xiàn)醫(yī)院的精細(xì)化、循證化管理[10]。系統(tǒng)的開發(fā)使用為提高醫(yī)院管理水平提供了高效、可行的技術(shù)手段。
參 考 文 獻(xiàn)
[1] 馬剛, 劉天時(shí),程國(guó)建. 基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的醫(yī)院信息系統(tǒng)應(yīng)用研究[J]. 西安石油大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010,25(4):99-102.
[2] 葉明全,宋念東.基于HIS的醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(3):779-781.
[3] 李慧宗,張學(xué)森. 面向主題的醫(yī)療費(fèi)用分析數(shù)據(jù)倉(cāng)庫(kù)建模[J]. 中小企業(yè)管理與科技, 2009(31):274.
[4] 周治宇,鄭昊. 基于醫(yī)院信息系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)[J]. 中國(guó)數(shù)字醫(yī)學(xué), 2010,05(9):81-83.
[5] 鄭丹青. 基于OLAP技術(shù)的醫(yī)療信息多維數(shù)據(jù)集設(shè)計(jì)與分析[J]. 吉林師范大學(xué)學(xué)報(bào):自然科學(xué)版, 2011,32(3):56-58.
[6] 孔琳. 基于HIS的數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建及多維分析[J]. 醫(yī)學(xué)信息學(xué)雜志, 2011,32(11):6-9.
[7] 胡志東. 數(shù)據(jù)挖掘及數(shù)據(jù)倉(cāng)庫(kù)綜述[J].黑龍江科技信息, 2010(26):100.
[8] 朱秋麗, 張濤, 丁云芳, 等. 呼吸道合胞病毒感染兒童住院費(fèi)用影響因素的回歸樹分析[J]. 復(fù)旦學(xué)報(bào)(醫(yī)學(xué)版),2011,38(4):294-299.
[9] Lemon SC,Roy J,Clark MA,et a1.Classification and regression tree analysis in public health:methodological review and comparison with logistic regression[J].Ann Behav Met,2003,26(3):172-181.
[10] 唐熊,張巨發(fā),段昌奉,等.基于移動(dòng)智能終端的醫(yī)院管理決策支持系統(tǒng)開發(fā)及應(yīng)用[J].現(xiàn)代儀器與醫(yī)療,2013,19(1):47-49.
4 結(jié)論
針對(duì)醫(yī)院檔案利用效率低,海量數(shù)據(jù)對(duì)信息管理系統(tǒng)決策支持不足的現(xiàn)狀,嘗試應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)和基于多維數(shù)據(jù)集的OLAP技術(shù)及數(shù)據(jù)挖掘技術(shù),對(duì)醫(yī)學(xué)信息數(shù)據(jù)進(jìn)行分析,挖掘出更多深層次的、有價(jià)值的信息,為醫(yī)院管理者提供了輔助決策的依據(jù)。同時(shí),隨著醫(yī)院信息技術(shù)的不斷發(fā)展,還可以開發(fā)預(yù)算警示模塊等多個(gè)實(shí)用的,有針對(duì)性的模塊,建立面向醫(yī)院各級(jí)管理層的決策支持系統(tǒng),切實(shí)地、真正地實(shí)現(xiàn)醫(yī)院的精細(xì)化、循證化管理[10]。系統(tǒng)的開發(fā)使用為提高醫(yī)院管理水平提供了高效、可行的技術(shù)手段。
參 考 文 獻(xiàn)
[1] 馬剛, 劉天時(shí),程國(guó)建. 基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的醫(yī)院信息系統(tǒng)應(yīng)用研究[J]. 西安石油大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010,25(4):99-102.
[2] 葉明全,宋念東.基于HIS的醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(3):779-781.
[3] 李慧宗,張學(xué)森. 面向主題的醫(yī)療費(fèi)用分析數(shù)據(jù)倉(cāng)庫(kù)建模[J]. 中小企業(yè)管理與科技, 2009(31):274.
[4] 周治宇,鄭昊. 基于醫(yī)院信息系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)[J]. 中國(guó)數(shù)字醫(yī)學(xué), 2010,05(9):81-83.
[5] 鄭丹青. 基于OLAP技術(shù)的醫(yī)療信息多維數(shù)據(jù)集設(shè)計(jì)與分析[J]. 吉林師范大學(xué)學(xué)報(bào):自然科學(xué)版, 2011,32(3):56-58.
[6] 孔琳. 基于HIS的數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建及多維分析[J]. 醫(yī)學(xué)信息學(xué)雜志, 2011,32(11):6-9.
[7] 胡志東. 數(shù)據(jù)挖掘及數(shù)據(jù)倉(cāng)庫(kù)綜述[J].黑龍江科技信息, 2010(26):100.
[8] 朱秋麗, 張濤, 丁云芳, 等. 呼吸道合胞病毒感染兒童住院費(fèi)用影響因素的回歸樹分析[J]. 復(fù)旦學(xué)報(bào)(醫(yī)學(xué)版),2011,38(4):294-299.
[9] Lemon SC,Roy J,Clark MA,et a1.Classification and regression tree analysis in public health:methodological review and comparison with logistic regression[J].Ann Behav Met,2003,26(3):172-181.
[10] 唐熊,張巨發(fā),段昌奉,等.基于移動(dòng)智能終端的醫(yī)院管理決策支持系統(tǒng)開發(fā)及應(yīng)用[J].現(xiàn)代儀器與醫(yī)療,2013,19(1):47-49.
4 結(jié)論
針對(duì)醫(yī)院檔案利用效率低,海量數(shù)據(jù)對(duì)信息管理系統(tǒng)決策支持不足的現(xiàn)狀,嘗試應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)和基于多維數(shù)據(jù)集的OLAP技術(shù)及數(shù)據(jù)挖掘技術(shù),對(duì)醫(yī)學(xué)信息數(shù)據(jù)進(jìn)行分析,挖掘出更多深層次的、有價(jià)值的信息,為醫(yī)院管理者提供了輔助決策的依據(jù)。同時(shí),隨著醫(yī)院信息技術(shù)的不斷發(fā)展,還可以開發(fā)預(yù)算警示模塊等多個(gè)實(shí)用的,有針對(duì)性的模塊,建立面向醫(yī)院各級(jí)管理層的決策支持系統(tǒng),切實(shí)地、真正地實(shí)現(xiàn)醫(yī)院的精細(xì)化、循證化管理[10]。系統(tǒng)的開發(fā)使用為提高醫(yī)院管理水平提供了高效、可行的技術(shù)手段。
參 考 文 獻(xiàn)
[1] 馬剛, 劉天時(shí),程國(guó)建. 基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的醫(yī)院信息系統(tǒng)應(yīng)用研究[J]. 西安石油大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010,25(4):99-102.
[2] 葉明全,宋念東.基于HIS的醫(yī)院數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(3):779-781.
[3] 李慧宗,張學(xué)森. 面向主題的醫(yī)療費(fèi)用分析數(shù)據(jù)倉(cāng)庫(kù)建模[J]. 中小企業(yè)管理與科技, 2009(31):274.
[4] 周治宇,鄭昊. 基于醫(yī)院信息系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)[J]. 中國(guó)數(shù)字醫(yī)學(xué), 2010,05(9):81-83.
[5] 鄭丹青. 基于OLAP技術(shù)的醫(yī)療信息多維數(shù)據(jù)集設(shè)計(jì)與分析[J]. 吉林師范大學(xué)學(xué)報(bào):自然科學(xué)版, 2011,32(3):56-58.
[6] 孔琳. 基于HIS的數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建及多維分析[J]. 醫(yī)學(xué)信息學(xué)雜志, 2011,32(11):6-9.
[7] 胡志東. 數(shù)據(jù)挖掘及數(shù)據(jù)倉(cāng)庫(kù)綜述[J].黑龍江科技信息, 2010(26):100.
[8] 朱秋麗, 張濤, 丁云芳, 等. 呼吸道合胞病毒感染兒童住院費(fèi)用影響因素的回歸樹分析[J]. 復(fù)旦學(xué)報(bào)(醫(yī)學(xué)版),2011,38(4):294-299.
[9] Lemon SC,Roy J,Clark MA,et a1.Classification and regression tree analysis in public health:methodological review and comparison with logistic regression[J].Ann Behav Met,2003,26(3):172-181.
[10] 唐熊,張巨發(fā),段昌奉,等.基于移動(dòng)智能終端的醫(yī)院管理決策支持系統(tǒng)開發(fā)及應(yīng)用[J].現(xiàn)代儀器與醫(yī)療,2013,19(1):47-49.