王玨 許朝暉 夏新
摘要:通過搭建高性能的數(shù)據(jù)倉(cāng)庫(kù),利用數(shù)據(jù)挖掘相關(guān)技術(shù)結(jié)合運(yùn)營(yíng)指標(biāo)構(gòu)建院科兩級(jí)綜合運(yùn)營(yíng)評(píng)價(jià)模型,幫助醫(yī)院管理者充分利用醫(yī)院業(yè)務(wù)數(shù)據(jù),更加高效的對(duì)醫(yī)院各科室的運(yùn)營(yíng)情況進(jìn)行客觀評(píng)價(jià),幫助科室發(fā)現(xiàn)在運(yùn)營(yíng)過程中存在的問題,并為后續(xù)的醫(yī)院發(fā)展方向提供決策支持。
關(guān)鍵詞:商業(yè)智能;數(shù)據(jù)倉(cāng)庫(kù);醫(yī)院管理;決策支持
中圖分類號(hào):TP311.52? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2019.08.006
文章編號(hào):1006-1959(2019)08-0019-03
Abstract:By building a high-performance data warehouse, using data mining related technology combined with operational indicators to build a two-level comprehensive operational evaluation model of the hospital, to help hospital administrators make full use of hospital business data, and more objectively and efficiently evaluate the operation of hospital departments. Help the department to identify problems in the operation process and provide decision support for the subsequent hospital development direction.
Key words:Business intelligence;Data warehouse;Hospital management;Decision support
近年來(lái)隨著醫(yī)院信息化建設(shè)的飛速發(fā)展,尤其是國(guó)家電子病歷等級(jí)評(píng)審的要求,醫(yī)院的信息系統(tǒng)不斷深化著應(yīng)用的范圍,在提升醫(yī)院工作效率,方便患者就醫(yī)的同時(shí),也積累了海量的業(yè)務(wù)數(shù)據(jù)[1]。隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,商業(yè)智能(BI)的不斷成熟,快速、準(zhǔn)確的獲取有用的數(shù)據(jù),結(jié)合各類算法直接獲得分析結(jié)果是未來(lái)大數(shù)據(jù)應(yīng)用的主流方向[2]。本文主要探討利用BI技術(shù)從醫(yī)院不同業(yè)務(wù)系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行抽取、清洗、加載,形成面向主題的數(shù)據(jù)倉(cāng)庫(kù),并最終通過引入密切值算法,完成醫(yī)院臨床科室綜合運(yùn)營(yíng)評(píng)價(jià)模型的設(shè)計(jì)。
1 BI及其關(guān)鍵技術(shù)
1.1數(shù)據(jù)倉(cāng)庫(kù)? 數(shù)據(jù)倉(cāng)庫(kù)是將不同業(yè)務(wù)系統(tǒng)中分散的數(shù)據(jù),經(jīng)過抽取、清洗及轉(zhuǎn)換(extract-transform-load,ETL)后根據(jù)數(shù)據(jù)分析的要求加載到數(shù)據(jù)倉(cāng)庫(kù)中,為后續(xù)數(shù)據(jù)分析建模做準(zhǔn)備[3]。其中,ETL技術(shù)是數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的核心,通過ETL處理抽取各業(yè)務(wù)系統(tǒng)中的數(shù)據(jù),并通過數(shù)據(jù)一致性檢查、異構(gòu)數(shù)據(jù)源標(biāo)準(zhǔn)化處理、缺失數(shù)據(jù)處理等技術(shù)將各系統(tǒng)數(shù)據(jù)整合到同一主題數(shù)據(jù)倉(cāng)庫(kù)中。數(shù)據(jù)倉(cāng)庫(kù)獨(dú)立于業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)之外,在數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行數(shù)據(jù)查詢時(shí)不會(huì)對(duì)醫(yī)院正常業(yè)務(wù)的產(chǎn)生任何影響,同時(shí)與面向事務(wù)設(shè)計(jì)的業(yè)務(wù)數(shù)據(jù)庫(kù)相比,面向主題設(shè)計(jì)的數(shù)據(jù)倉(cāng)庫(kù)在數(shù)據(jù)分析決策的應(yīng)用上,查詢效率有極大的提升。
1.2數(shù)據(jù)挖掘? 數(shù)據(jù)挖掘是通過各類算法從海量數(shù)據(jù)中獲取潛在的信息和知識(shí)的過程[4]。數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)的技術(shù)延伸,同時(shí)也與近年來(lái)熱門的人工智能、模式識(shí)別和機(jī)器學(xué)習(xí)的搜索算法和建模技術(shù)有著一定的聯(lián)系。包括關(guān)聯(lián)和聚類等描述性挖掘方法及分類,以及回歸等預(yù)測(cè)性挖掘方法,數(shù)據(jù)挖掘的最終目標(biāo)是根據(jù)需求選擇合適的分析方法從海量數(shù)據(jù)中挖掘出有價(jià)值的信息[5]。
2密切值算法基本原理
密切值法是一種常用的多目標(biāo)決策分析方法,適用于多項(xiàng)指標(biāo)的綜合評(píng)價(jià),其數(shù)據(jù)模型簡(jiǎn)單易懂、評(píng)價(jià)結(jié)果客觀合理,因而在績(jī)效評(píng)價(jià)、公共衛(wèi)生、醫(yī)療質(zhì)量等多個(gè)領(lǐng)域都有廣泛應(yīng)用[6]。密切值法在面對(duì)多目標(biāo)、多維度的指標(biāo)時(shí),對(duì)于同時(shí)存在正向指標(biāo)(即數(shù)值越高越好,如業(yè)務(wù)工作量)和負(fù)向指標(biāo)(即數(shù)值越低越好,如藥占比)的進(jìn)行標(biāo)準(zhǔn)化處理,可以得出各評(píng)價(jià)指標(biāo)的“最優(yōu)點(diǎn)”和“最劣點(diǎn)”,并通過計(jì)算每個(gè)評(píng)價(jià)對(duì)象與“最優(yōu)點(diǎn)”及“最劣點(diǎn)”的距離,最后得到的密切值的大小可以排出各評(píng)價(jià)對(duì)象的優(yōu)劣順序[7]。醫(yī)院有n個(gè)臨床科室,每個(gè)臨床科室有m個(gè)評(píng)價(jià)指標(biāo),構(gòu)建原始數(shù)據(jù)指標(biāo)矩陣:
(i=1,2,…,m;j=1,2,…,n),aij是第i個(gè)科室第j個(gè)指標(biāo)的原始數(shù)據(jù)
對(duì)原始數(shù)據(jù)矩陣做同向化處理:當(dāng)評(píng)價(jià)指標(biāo)為正向指標(biāo)時(shí)(如業(yè)務(wù)收入、手術(shù)量等),數(shù)值取正值;當(dāng)評(píng)價(jià)指標(biāo)為負(fù)向指標(biāo)時(shí)(如藥占比、平均住院日),數(shù)值取負(fù)值。
對(duì)不同的指標(biāo)做標(biāo)準(zhǔn)化處理(如門診人次、床位使用率),使不同單位或量級(jí)的指標(biāo)可以統(tǒng)一標(biāo)準(zhǔn)。
從標(biāo)準(zhǔn)化矩陣中找到“最優(yōu)點(diǎn)”D+及“最劣點(diǎn)”D-,代表每一項(xiàng)指標(biāo)的最高分集合和最低分集合。
最優(yōu)點(diǎn)D+=(r1+,r2+,…rm+)
最劣點(diǎn)D-=(r1-,r2-,…rm-)
計(jì)算出各科室的密切值,密切值Ci越小,代表科室各項(xiàng)指標(biāo)距離最優(yōu)點(diǎn)越近,距離最劣點(diǎn)越遠(yuǎn),綜合評(píng)價(jià)越高。