国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

病案統(tǒng)計(jì)分析數(shù)據(jù)倉(cāng)庫(kù)的建立

2012-04-29 15:28:22魏忠琴
中國(guó)管理信息化 2012年6期
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘

魏忠琴

[摘要] 本文以醫(yī)院病案統(tǒng)計(jì)分析中疾病的統(tǒng)計(jì)分析為例介紹了用MS Server 2003軟件,建立醫(yī)院病案統(tǒng)計(jì)分析數(shù)據(jù)倉(cāng)庫(kù)的方法、步驟及其意義。

[關(guān)鍵詞] 數(shù)據(jù)倉(cāng)庫(kù); 病案統(tǒng)計(jì)分析; 數(shù)據(jù)挖掘; 聯(lián)機(jī)分析處理; 多維數(shù)據(jù)集

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 06. 026

[中圖分類號(hào)]F272.7[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1673 - 0194(2012)06- 0054- 03

隨著社會(huì)的發(fā)展和市場(chǎng)激烈競(jìng)爭(zhēng)的需要,醫(yī)院管理已經(jīng)逐步從傳統(tǒng)經(jīng)驗(yàn)型向科學(xué)量化管理的方向發(fā)展,而科學(xué)量化管理的信息資源,主要從病案的統(tǒng)計(jì)分析中獲得,特別是重大決策需要科學(xué)的數(shù)據(jù)分析作為依據(jù),這就對(duì)醫(yī)院信息化提出更高的要求。傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)只能完成數(shù)據(jù)統(tǒng)計(jì)分析中最簡(jiǎn)單的動(dòng)態(tài)原始數(shù)據(jù)以及日常數(shù)據(jù)報(bào)表,而在數(shù)據(jù)分析和輔助決策方面就顯得無(wú)能為力了,而數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)正是數(shù)據(jù)倉(cāng)庫(kù)所具有的強(qiáng)大功能。

1明確數(shù)據(jù)倉(cāng)庫(kù)的主題

需求分析之中心工作是提出主題,并明確主題。每個(gè)主題有一個(gè)主題域,對(duì)每個(gè)主題域確定其數(shù)據(jù)模型,并確定每個(gè)主題域的公共主碼。然后建立主題域之間的關(guān)聯(lián),確定主題域數(shù)據(jù)模式與數(shù)據(jù)源之間的關(guān)系。

在我院病案統(tǒng)計(jì)分析的數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施過(guò)程中,確定的主要主題范圍如下:

(1) 病人費(fèi)用構(gòu)成分析:分析整個(gè)醫(yī)院、各個(gè)科室乃至某個(gè)醫(yī)生的病人費(fèi)用構(gòu)成,如發(fā)現(xiàn)藥品比例過(guò)高,可以層層分析是哪個(gè)環(huán)節(jié)導(dǎo)致比例過(guò)高,從而采取措施來(lái)控制;

(2) 同期費(fèi)用對(duì)比分析:找出醫(yī)院收入增加或減少的原因;

(3) 單病種分析:對(duì)單病種的費(fèi)用、住院天數(shù)、治療方案進(jìn)行分析以便醫(yī)生能及時(shí)總結(jié)經(jīng)驗(yàn),找出最佳的質(zhì)量手段和方法,縮短就診時(shí)間,減輕病人負(fù)擔(dān),增加醫(yī)院經(jīng)濟(jì)效益;

(4) 成本效益分析:把各個(gè)不同系統(tǒng)如信息系統(tǒng)、財(cái)務(wù)系統(tǒng)等的數(shù)據(jù)匯總的數(shù)據(jù)倉(cāng)庫(kù),對(duì)成本效益進(jìn)行全面分析,以便能真正把握醫(yī)院經(jīng)營(yíng)狀況,提高醫(yī)院經(jīng)濟(jì)效益;

(5) 疾病的統(tǒng)計(jì)分析:分析不同疾病發(fā)病的病人結(jié)構(gòu)(如年齡、職業(yè)、性別、地區(qū)等)以及輔助診療分類的分析。

2數(shù)據(jù)倉(cāng)庫(kù)的源數(shù)據(jù)調(diào)查——數(shù)據(jù)采集

為了從病案首頁(yè)信息中分析以上主題,建立主題數(shù)據(jù)倉(cāng)庫(kù),源數(shù)據(jù)主要來(lái)自本院HIS系統(tǒng)中2002-2010年的住院病人數(shù)據(jù)資料,其中主要的數(shù)據(jù)關(guān)系表有(以下是以疾病的統(tǒng)計(jì)分析和病人費(fèi)用構(gòu)成分析為例):現(xiàn)行及歷史的病人住院主記錄表、診斷記錄表、疾病字典表、病人付費(fèi)方式表治療結(jié)果表等,具體表結(jié)構(gòu)略。

3數(shù)據(jù)倉(cāng)庫(kù)的核心數(shù)據(jù)庫(kù)設(shè)計(jì)

在數(shù)據(jù)倉(cāng)庫(kù)中,事實(shí)表數(shù)據(jù)模式是一個(gè)比較簡(jiǎn)單易懂的數(shù)據(jù)模式。在本設(shè)計(jì)中就是采用事實(shí)表數(shù)據(jù)模式,主要有疾病的統(tǒng)計(jì)分析數(shù)據(jù)表、時(shí)間表、病人付費(fèi)方式表、治療結(jié)果表、疾病分類表及年齡段表等。表1是疾病的統(tǒng)計(jì)分析數(shù)據(jù)表結(jié)構(gòu)說(shuō)明。

軟件實(shí)現(xiàn)環(huán)境:

操作系統(tǒng):Windows 2003 Server

數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)品:MS Server 2003企業(yè)版

多維數(shù)據(jù)庫(kù)的展現(xiàn)工具:Excel

4數(shù)據(jù)的抽取

本例的抽取程序是利用Sql Server 2003中的數(shù)據(jù)轉(zhuǎn)換服務(wù)DTS(Datastore Transmission Service)從數(shù)據(jù)源Oracle 7中抽取數(shù)據(jù), 在數(shù)據(jù)的提取過(guò)程中,首先建立數(shù)據(jù)源與目標(biāo)數(shù)據(jù)源,然后在目標(biāo)數(shù)據(jù)源服務(wù)器中完成維表、事實(shí)表的創(chuàng)建;根據(jù)模型的建立,再生成SQL數(shù)據(jù)查詢語(yǔ)句的程序包,然后執(zhí)行SQL程序包,將源數(shù)據(jù)庫(kù)的數(shù)據(jù)提取到目的數(shù)據(jù)庫(kù)中的維表和事實(shí)表中,數(shù)據(jù)的提取時(shí)間取決于源表的大小。

5多維數(shù)據(jù)集的建立

5.1維度的確定

在數(shù)據(jù)倉(cāng)庫(kù)中,維度(Dimension)是指觀察數(shù)據(jù)的特定角度,作為識(shí)別數(shù)據(jù)的索引,不同的維度組合構(gòu)成了訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的約束條件。在本例疾病的統(tǒng)計(jì)分析中我們采用了五維,即:時(shí)間維(年月);付費(fèi)方式維(公費(fèi)、自費(fèi)、醫(yī)保等)、年齡段維(5歲以下、5~14歲、15~44歲、45~59歲、60歲以上)、治療結(jié)果維(治愈、好轉(zhuǎn)、未愈、死亡等)。

5.2數(shù)據(jù)集的建立

在本例疾病的統(tǒng)計(jì)分析中我們采用SQL Service 2003 Analysis Services中的多維數(shù)據(jù)集向?qū)Щ蚨嗑S數(shù)據(jù)集編輯器來(lái)生成多維數(shù)據(jù)集,其架構(gòu)如圖1所示。

6OLAP數(shù)據(jù)多維分析

6.1OLAP模型結(jié)構(gòu)

在本例疾病的統(tǒng)計(jì)分析的OLAP模型結(jié)構(gòu)如圖2所示。

多維分析是指在OLAP多維結(jié)構(gòu)上對(duì)以多維形式組織起來(lái)的數(shù)據(jù)采取多種操作,以便分析人員作實(shí)驗(yàn)以驗(yàn)證其主觀分析意圖,主要有鉆取、切片、切快、旋轉(zhuǎn)4種分析方法。

6.2客戶端數(shù)據(jù)分析

在基于微軟的數(shù)據(jù)倉(cāng)庫(kù)框架中,客戶端應(yīng)用可以通過(guò)MS Office、MS Query、MS Visual Studio等任何支持OLE DB的軟件開發(fā)工具開發(fā)。在本系統(tǒng)中。作者使用MS Office中的Microsoft Excel查詢數(shù)據(jù)倉(cāng)庫(kù)中的多維數(shù)據(jù)集,因?yàn)閷?duì)于客戶端用戶來(lái)說(shuō),Microsoft Excel是比較常用且簡(jiǎn)單易懂的。

7創(chuàng)建OLAP數(shù)據(jù)挖掘模型及瀏覽決策樹

7.1創(chuàng)建OLAP數(shù)據(jù)挖掘模型

本文利用Microsoft 決策樹算法創(chuàng)建OLAP數(shù)據(jù)挖掘模型,以挖掘出不同疾病在不同年齡段的平均住院費(fèi)用以及治愈時(shí)間等情況。

7.2瀏覽決策樹

在 OLAP 挖掘模型編輯器中,可以使用編輯器編輯模型屬性或者瀏覽其結(jié)果。在 Analysis Manager 樹視圖中,展開“挖掘模型集”文件夾,右擊“疾病分析模式”模型,選擇子菜單“瀏覽”命令,出現(xiàn)如圖3所示的決策樹。

7.3分析

(1) 在“內(nèi)容詳情”窗格的決策樹區(qū)域中,顏色代表“事例”的密度(在本事例中為:病人年齡段的密度)。顏色越深則節(jié)點(diǎn)中包含的事例就越多。 單擊“全部”節(jié)點(diǎn)。該節(jié)點(diǎn)為黑色,因?yàn)樗?(7733) 事例的 100%。7733 代表出院的病人數(shù)目(即 “疾病分析” 多維數(shù)據(jù)集中有事務(wù)記錄的病人)。

(2) 特性窗格顯示“全部”節(jié)點(diǎn)中,所有事例的 21.80%(或者說(shuō) 1 686 個(gè)示例)的平均住院費(fèi)用可能是1 610元;31.64%的平均住院費(fèi)用可能是3 885元;21.74%的平均住院費(fèi)用可能是4 664元;24.82%的平均住院費(fèi)用可能是2 576元。如果沒(méi)有顯示百分比,則可以調(diào)整“特性”窗格中“合計(jì)”面板的“可能性”列的大小。

(3) 如果選擇了樹的不同節(jié)點(diǎn),此百分比將會(huì)更改。讓我們調(diào)查一下哪些年齡段的病人平均住院費(fèi)用在4 664元。若要執(zhí)行此操作,則需要重新畫出樹以便勾畫出平均住院費(fèi)用在4 664元的高密度區(qū)。在右下角的“樹顏色基于”字段中選擇“4664”。該樹顯示另一種顏色模式??梢钥闯瞿挲g段在60歲以上,平均住院費(fèi)用3 096元與5 980元之間的節(jié)點(diǎn)的密度高于其他任何節(jié)點(diǎn)。

(4) 可以查看樹的其他分支并調(diào)查對(duì)于某一種病,病人在不同年齡段平均住院費(fèi)用的不同可能值。醫(yī)院可以使用此信息來(lái)確定針對(duì)該種病在不同年齡段的平均住院費(fèi)用的高低,采取相應(yīng)的措施來(lái)調(diào)整最佳治療方案,進(jìn)而控制平均住院費(fèi)用。

8總結(jié)

通過(guò)創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)不僅僅用于檢索,還可用來(lái)分析未來(lái)的發(fā)展趨勢(shì),并為管理和決策提供支持,如:病人構(gòu)成分析(分析醫(yī)院門診、住院病人的各種構(gòu)成、如病人的來(lái)源、職業(yè)、身份、年齡等分布以便有針對(duì)性地采取一些措施來(lái)提高服務(wù)質(zhì)量,從而增加門診量和住院收容量)、病人就診時(shí)間分析(從門診病人掛號(hào)到出院各環(huán)節(jié)就醫(yī)時(shí)間,分析病人的就醫(yī)瓶頸以減少排隊(duì),提高就醫(yī)質(zhì)量)、病人費(fèi)用構(gòu)成分析(分析整個(gè)醫(yī)院、各個(gè)科室乃至某個(gè)醫(yī)生的病人費(fèi)用構(gòu)成,如發(fā)現(xiàn)藥品比列過(guò)高,可以層層分析是哪個(gè)環(huán)節(jié)導(dǎo)致比列過(guò)高,從而采取措施來(lái)控制)、同期費(fèi)用對(duì)比分析(找出醫(yī)院收入增加或減少的原因)、單病種分析(對(duì)單病種的費(fèi)用、住院天數(shù)、治療方案進(jìn)行分析以便醫(yī)生能及時(shí)總結(jié)經(jīng)驗(yàn)、找出最佳的質(zhì)量手段和方法,縮短就診時(shí)間、減輕病人負(fù)擔(dān)、增加醫(yī)院經(jīng)濟(jì)效益)、成本效益分析(把各個(gè)不同系統(tǒng)如信息系統(tǒng)、財(cái)務(wù)系統(tǒng)等的數(shù)據(jù)匯總的數(shù)據(jù)倉(cāng)庫(kù),對(duì)成本效益進(jìn)行全面分析,以便能真正把握醫(yī)院經(jīng)營(yíng)狀況,提高醫(yī)院經(jīng)濟(jì)效益)。

當(dāng)然,數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)龐大的知識(shí)系統(tǒng),其功能遠(yuǎn)遠(yuǎn)不止這些,像各類醫(yī)保病人分析、免費(fèi)及各種優(yōu)惠病人分析、醫(yī)院各種科學(xué)預(yù)測(cè)等分析功能。隨著醫(yī)院的發(fā)展,數(shù)據(jù)倉(cāng)庫(kù)的這種決策支持功能將在醫(yī)院的管理和決策中起著越來(lái)越重要的作用,尤其醫(yī)院病案統(tǒng)計(jì)的分析對(duì)醫(yī)療研究著非常重要的作用。

主要參考文獻(xiàn)

[1] Jiawei Han,Micheline Kamber. 數(shù)據(jù)挖掘——概念與技術(shù)[M]. 范明,孟小峰,等,譯. 北京: 機(jī)械工業(yè)出版社,2001.

[2] 飛思科技產(chǎn)品研發(fā)中心. Oracle 9i 數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建技術(shù)[M]. 北京:電子工業(yè)出版社,2003.

[3] 羅運(yùn)模. SQL Server 2000數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用與開發(fā)[M]. 北京:人民郵電出版社,2001.

[4] 徐潔磐. 數(shù)據(jù)倉(cāng)庫(kù)與決策支持系統(tǒng)[M]. 北京:科學(xué)出版社,2005.

[5] 王珊,陳紅. 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與聯(lián)機(jī)分析處理[M]. 北京:科學(xué)出版社,1998.

[6] 夏火松. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)[M]. 北京:科學(xué)出版社,2004.

猜你喜歡
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)傾斜解決方案研究
基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
頁(yè)巖氣工程大數(shù)據(jù)倉(cāng)庫(kù)建設(shè)與管理系統(tǒng)開發(fā)
錄井工程(2017年3期)2018-01-22 08:39:50
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
電子制作(2016年15期)2017-01-15 13:39:15
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析探索與實(shí)踐
正宁县| 桃园县| 灵武市| 平乐县| 巴彦淖尔市| 抚宁县| 雅安市| 敦化市| 银川市| 兴隆县| 万载县| 旬邑县| 拉萨市| 托里县| 陵水| 松江区| 磐石市| 临西县| 马公市| 浦北县| 拜泉县| 双桥区| 东宁县| 石河子市| 丰顺县| 大石桥市| 灵武市| 漯河市| 奇台县| 东阿县| 安康市| 扬州市| 白河县| 全椒县| 连山| 溧阳市| 沁阳市| 梁山县| 曲沃县| 天台县| 双辽市|