任月榮
隨著病案信息化的不斷發(fā)展,醫(yī)院借助信息技術(shù)手段從病案實(shí)體管理已逐步轉(zhuǎn)向?qū)Σ“感畔⒐芾砗蛿?shù)據(jù)挖掘與綜合利用上。大數(shù)據(jù)發(fā)展經(jīng)歷了由“感知、傳遞、反應(yīng)”到“模仿、記憶、判斷、反應(yīng)”,再到“感知、記錄、傳輸、存儲(chǔ)、處理、挖掘”的變化過(guò)程[1]。大數(shù)據(jù)技術(shù)的不斷發(fā)展,已漸漸滲透到各個(gè)領(lǐng)域,醫(yī)療行業(yè)病案大數(shù)據(jù)是醫(yī)、教、研、管的重要數(shù)據(jù)支撐。病案信息向智能化評(píng)價(jià)體系轉(zhuǎn)換,是實(shí)現(xiàn)病案信息價(jià)值的綜合利用,將病案信息轉(zhuǎn)化為標(biāo)準(zhǔn)信息服務(wù)的關(guān)鍵。從而在未來(lái)趨勢(shì)預(yù)測(cè)的基礎(chǔ)上,提高病案的管理水平,提高醫(yī)療服務(wù)質(zhì)量,為臨床和管理者提供決策支持。
從數(shù)據(jù)表現(xiàn)形式看,通常用“4V”來(lái)概括大數(shù)據(jù)的特征[2]。(1)Volume(大量):數(shù)據(jù)體量巨大。容量由TB量級(jí)到EB量級(jí)。(2)Variety(多樣):數(shù)據(jù)類(lèi)型繁多。分為結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。(3)Velocity(高速):處理速度快。這是區(qū)分傳統(tǒng)數(shù)據(jù)挖掘的最本質(zhì)特征。(4)Value(價(jià)值):價(jià)值密度低。通過(guò)強(qiáng)大的算法,合理利用低密度價(jià)值數(shù)據(jù)對(duì)其進(jìn)行正確分析,迅速完成數(shù)據(jù)“提純”成為急下待解決的難題。上述特征描述了大數(shù)據(jù)的普遍特征,然而“運(yùn)用”才是大數(shù)據(jù)最終的價(jià)值體現(xiàn)。
病案信息是指有關(guān)患者健康情況的文件資料[3]。從病案信息的特殊性看,其具有“4C”的特征。(1)Continuity(連續(xù)):隨患者就診次數(shù)增加而增加。(2)Confidentiality(保密):涉及患者基本信息和病情描述,沒(méi)有授權(quán)不得隨意公開(kāi)。(3)Catholicity(普遍):普遍存在于國(guó)內(nèi)外各等級(jí)醫(yī)療機(jī)構(gòu)。(4)Copy(復(fù)制):個(gè)體病案信息是可以復(fù)制、影印。
習(xí)近平在實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略加快建設(shè)數(shù)字中國(guó)中強(qiáng)調(diào):推動(dòng)實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源整合和開(kāi)放共享;并指出:善于獲取數(shù)據(jù)、分析數(shù)據(jù)、運(yùn)用數(shù)據(jù)使大數(shù)據(jù)在各項(xiàng)工作中發(fā)揮更大作用[4]。
大數(shù)據(jù)挖掘的本質(zhì)就是通過(guò)海量歷史數(shù)據(jù),分析和發(fā)現(xiàn)一些潛在的規(guī)律。他的意義就是利用潛在的規(guī)律預(yù)測(cè)未來(lái)可能發(fā)生的事。大數(shù)據(jù)挖掘就是智能統(tǒng)計(jì)分析的最終體現(xiàn),是統(tǒng)計(jì)學(xué)的升級(jí)。
在病案建設(shè)發(fā)展過(guò)程中,信息累積是構(gòu)建大數(shù)據(jù)挖掘與決策支持的基礎(chǔ)。在完善和優(yōu)化信息化功能,建設(shè)以患者服務(wù)為目標(biāo)的同時(shí),要突破未來(lái)病案管理的瓶頸,亦要“統(tǒng)籌規(guī)劃病案信息資源”“建立完善病案信息管理體系”“加快建立病案信息技術(shù)體系”和“實(shí)現(xiàn)衛(wèi)生事業(yè)的科學(xué)化智能化的管理與決策”。
在頂層設(shè)計(jì)上,統(tǒng)籌建設(shè)避免重復(fù);充分利用現(xiàn)有病案資源和基礎(chǔ)設(shè)施,統(tǒng)籌醫(yī)療數(shù)據(jù)資源,加強(qiáng)數(shù)據(jù)的匯聚整合和關(guān)聯(lián)分析。
推動(dòng)病案信息資源共享。明確病案信息共享范圍、使用權(quán)利和義務(wù),以及使用方式等;建立統(tǒng)一使用接口和交換標(biāo)準(zhǔn),推動(dòng)醫(yī)療機(jī)構(gòu)間信息資源共享[5]。
建立健全一套完整全面的病案信息管理體系[6],充分發(fā)揮病案信息的價(jià)值,促進(jìn)病案管理日趨完善。嚴(yán)格執(zhí)行《醫(yī)療機(jī)構(gòu)病案管理規(guī)定》和《病歷書(shū)寫(xiě)基本規(guī)范》等制度,同時(shí)依照相關(guān)法律法規(guī),結(jié)合本院實(shí)際制定一系列具體程序和可行性規(guī)章制度,做到有章可循、有法可依。
完善病案信息標(biāo)準(zhǔn)體系。一是病案信息標(biāo)準(zhǔn)化的完善,國(guó)際疾病分類(lèi)標(biāo)準(zhǔn)編碼的擴(kuò)展與完善和醫(yī)學(xué)數(shù)字成像和通訊標(biāo)準(zhǔn)的完善,打造更加完善的醫(yī)療共享標(biāo)準(zhǔn)。二是醫(yī)療信息交換格式的標(biāo)準(zhǔn)化,結(jié)合衛(wèi)生信息交換標(biāo)準(zhǔn)的設(shè)計(jì)思想,選擇制定適合我國(guó)實(shí)際和當(dāng)前技術(shù)水平的衛(wèi)生信息標(biāo)準(zhǔn)。
在病案大數(shù)據(jù)全生命周期管理中,加快建立科學(xué)可行的病案信息技術(shù)體系。在病案信息管理、挖掘分析以及信息應(yīng)用等方面,通過(guò)研發(fā)非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),重點(diǎn)攻關(guān)病案信息數(shù)據(jù)管理(數(shù)據(jù)采集、數(shù)據(jù)處理、大數(shù)據(jù)存儲(chǔ))、智能分析、挖掘算法和可視化應(yīng)用,以及建模方法等關(guān)鍵技術(shù),利用病案大數(shù)據(jù)的價(jià)值分析,提升病案管理和輔助決策支持能力。
病案數(shù)據(jù)挖掘與決策支持體系的建立,對(duì)醫(yī)療衛(wèi)生管理者意義在于:一是輔助醫(yī)療資源的合理分配;二是輔助醫(yī)療政策的制定和實(shí)施;三是輔助醫(yī)療費(fèi)用的合理制定。在衛(wèi)生事業(yè)管理的關(guān)鍵環(huán)節(jié)萃取病案信息之精華,其價(jià)值有助于管理者科學(xué)化智能化的管理與決策,有助于醫(yī)療政策的制定優(yōu)化和落實(shí),有助于醫(yī)療資源的合理分配,使政策更具活力。
病案數(shù)據(jù)挖掘與決策支持體系的構(gòu)建離不開(kāi)數(shù)據(jù)中心的建設(shè)[7-10],其架構(gòu)主要包括云平臺(tái)環(huán)境、病案信息采集與預(yù)處理平臺(tái)、病案大數(shù)據(jù)存儲(chǔ)與交換平臺(tái)、病案信息挖掘與分析平臺(tái)和可視化智能決策支持平臺(tái)(BI)五大平臺(tái)。通過(guò)統(tǒng)一部署云平臺(tái)環(huán)境,經(jīng)過(guò)數(shù)據(jù)采集清洗形成標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行存儲(chǔ),構(gòu)建數(shù)據(jù)分析模型用可視化的方法提供給管理者,實(shí)現(xiàn)價(jià)值數(shù)據(jù)的共享利用。
云平臺(tái)環(huán)境:主要包括硬件平臺(tái)、網(wǎng)絡(luò)環(huán)境、操作系統(tǒng)、數(shù)據(jù)存儲(chǔ)等。
病案信息采集與預(yù)處理平臺(tái):包括內(nèi)部系統(tǒng)數(shù)據(jù)、醫(yī)聯(lián)體數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)三方面,尤其依賴于內(nèi)部系統(tǒng)病案數(shù)據(jù)的積累。經(jīng)過(guò)數(shù)據(jù)采集過(guò)濾,使分散存在的不同規(guī)模不同結(jié)構(gòu)的數(shù)據(jù)經(jīng)過(guò)過(guò)濾清洗、關(guān)聯(lián)、分析、加工后提供給數(shù)據(jù)存儲(chǔ)與交換平臺(tái)。
病案大數(shù)據(jù)存儲(chǔ)與交換平臺(tái):構(gòu)建基于Hadoop技術(shù)[11]的大數(shù)據(jù)存儲(chǔ)與交換平臺(tái)是病案大數(shù)據(jù)的核心,通過(guò)構(gòu)建不同醫(yī)療機(jī)構(gòu)間的編碼規(guī)范、接口標(biāo)準(zhǔn)、協(xié)作標(biāo)準(zhǔn),共享公共數(shù)據(jù)、數(shù)據(jù)字典及分布式數(shù)據(jù)存儲(chǔ),實(shí)現(xiàn)病案信息結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的集中存儲(chǔ)和交換。
病案信息挖掘與分析平臺(tái):用決策樹(shù)、聚類(lèi)算法、人工智能、神經(jīng)網(wǎng)絡(luò)和統(tǒng)計(jì)分析等模型,對(duì)病案信息挖掘和分析。
可視化智能決策支持平臺(tái)(BI):通過(guò)數(shù)據(jù)挖掘分析技術(shù)建立多維分析模型、專題分析模型,將價(jià)值數(shù)據(jù)以動(dòng)態(tài)直觀的圖表形式展現(xiàn)給管理者,為其提供依據(jù)和輔助決策建議。
基于疾病診斷相關(guān)分組的預(yù)定額付費(fèi)方式是指基于疾病診斷相關(guān)分組為基礎(chǔ)的預(yù)定額付費(fèi)方式[3]。構(gòu)建病案信息大數(shù)據(jù)挖掘與決策分析體系的價(jià)值在于提供給管理者相對(duì)客觀準(zhǔn)確的分析數(shù)據(jù)和輔助決策,實(shí)現(xiàn)多家醫(yī)療機(jī)構(gòu)的長(zhǎng)期跟蹤建模形成臨床信息數(shù)據(jù)集。
從廣義上講,醫(yī)療衛(wèi)生資源是人類(lèi)開(kāi)展醫(yī)療衛(wèi)生保健活動(dòng)所使用的社會(huì)資源[12]。通過(guò)統(tǒng)籌規(guī)劃病案信息資源,實(shí)現(xiàn)醫(yī)院間、省市間、甚至全國(guó)范圍內(nèi)的醫(yī)療信息數(shù)據(jù)共享,從而獲得各種流行病分布情況,達(dá)到合理分配醫(yī)療資源的目的。
隊(duì)列研究方法可直接計(jì)算測(cè)量疾病危險(xiǎn)強(qiáng)度的指標(biāo),故在流行病學(xué)病因研究中被廣泛應(yīng)用。利用病案大數(shù)據(jù)可以獲得隊(duì)列研究的大數(shù)據(jù)源,避免了數(shù)據(jù)錄入、查閱和隨訪造成的信息偏倚。
大數(shù)據(jù)技術(shù)應(yīng)用于病案信息管理,對(duì)醫(yī)療決策和服務(wù)發(fā)揮巨大的支撐作用。基于病案大數(shù)據(jù)挖掘與決策支持體系建成后,病案大數(shù)據(jù)的研究與應(yīng)用將進(jìn)入新的階段。通過(guò)多渠道對(duì)病案信息采集過(guò)濾后形成集中存儲(chǔ)的標(biāo)準(zhǔn)數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)挖掘提取潛在的信息價(jià)值,為管理者提供決策支持,為衛(wèi)生事業(yè)的蓬勃發(fā)展奠定堅(jiān)實(shí)的基礎(chǔ)。