国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

醫(yī)院重癥醫(yī)學(xué)專病庫的建設(shè)與應(yīng)用

2023-07-03 01:55武亞琴WUYaqin盧晟曄LUShengye趙慧穎ZHAOHuiying閆華YANHua劉麗紅LIULihong趙翔宇ZHAOXiangyu
醫(yī)院管理論壇 2023年3期
關(guān)鍵詞:專病數(shù)據(jù)項(xiàng)結(jié)構(gòu)化

□ 武亞琴WU Ya-qin 盧晟曄LU Sheng-ye 趙慧穎ZHAO Hui-ying 閆華YAN Hua劉麗紅LIU Li-hong 趙翔宇ZHAO Xiang-yu

Objective To construct a specialized database of critical care medicine with scientific research and clinical application significance. Methods Based on the clinical research data platform constructed by the hospital, the business system data related to critical care medicine were mined. The standard data set model of specialized diseases in critical care medicine was established, so as to realize the automatic collection and integration of data in specialized disease database and form a critical care medicine database and application platform with data analysis and retrieval capabilities. Results Through data management, the hospital's 10-year-old critical care medical data was reconstructed into a specialized database of critical care medicine that met the needs of critical care research, and the system automatically and continuously generated high-quality, standardized and structured critical care patient diagnosis and treatment data. Conclusion The database and application platform of critical care medicine can realize the functions of case retrieval, course browsing and patient data export of critical care medicine, support the research of related topics of critical care medicine, assist researchers to establish clinical prediction models, and apply them in clinic to verify their auxiliary diagnosis and treatment effects.

重癥醫(yī)學(xué)科收治的均為危重癥患者,由于其疾病的復(fù)雜性,需要記錄的信息量非常巨大。很多醫(yī)生想通過挖掘臨床數(shù)據(jù)進(jìn)行科學(xué)研究,但是因數(shù)據(jù)存儲分散、時(shí)間精力有限等原因無法獲得高質(zhì)量的臨床數(shù)據(jù),導(dǎo)致研究工作無法開展。在國際上,美國、歐洲、日本等國家在疾病數(shù)據(jù)庫領(lǐng)域起步較早,已經(jīng)建立了不同疾病的國家級數(shù)據(jù)庫,美國麻省理工學(xué)院與貝斯以色列女執(zhí)事醫(yī)療中心聯(lián)合研發(fā)的重癥監(jiān)護(hù)醫(yī)學(xué)信息數(shù)據(jù)庫(MIMIC),已有MIMIC-II、MIMIC-III、MIMIC-IV三個(gè)版本,為重癥疾病研究與發(fā)展奠定了基礎(chǔ)。其中,MIMIC-IV包含2008年至2019年(含)的數(shù)據(jù),其數(shù)據(jù)源來自兩個(gè)院內(nèi)數(shù)據(jù)庫系統(tǒng):一個(gè)是定制的醫(yī)院范圍的數(shù)字電子健康記錄(EHR)、一個(gè)是重癥監(jiān)護(hù)室(ICU)特定的臨床信息系統(tǒng)[1],其為真實(shí)世界研究 (RWR)提供了數(shù)據(jù)基礎(chǔ)[2]。一個(gè)較好的專病數(shù)據(jù)庫,應(yīng)可以為科研人員提供大量的優(yōu)質(zhì)的真實(shí)世界數(shù)據(jù)用于疾病預(yù)測模型搭建、疾病預(yù)后情況分析等[3-4]。本文研究建立的重癥醫(yī)學(xué)數(shù)據(jù)庫,實(shí)現(xiàn)以重癥患者為中心,將重癥患者所有臨床診療數(shù)據(jù)的整合與集中展現(xiàn),為重癥醫(yī)學(xué)臨床診療、科研、決策提供數(shù)據(jù)支持。

醫(yī)院重癥醫(yī)學(xué)專病庫技術(shù)架構(gòu)與實(shí)踐

重癥醫(yī)學(xué)專病庫基于醫(yī)院臨床科研數(shù)據(jù)庫搭建,其應(yīng)用的技術(shù)架構(gòu)能夠解決數(shù)據(jù)資源的海量化、異構(gòu)化,應(yīng)用需求多樣化、復(fù)雜化等現(xiàn)實(shí)問題。技術(shù)架構(gòu)包含ODS數(shù)據(jù)層(ODS,operational data store,數(shù)據(jù)存儲)、數(shù)據(jù)處理及存儲層、數(shù)據(jù)應(yīng)用層、數(shù)據(jù)安全層,如圖1所示。

圖1 重癥醫(yī)學(xué)專病庫技術(shù)架構(gòu)

1.ODS數(shù)據(jù)層。ODS數(shù)據(jù)層存儲了從業(yè)務(wù)系統(tǒng)獲取的最原始的數(shù)據(jù),也稱之為醫(yī)院的臨床科研數(shù)據(jù)湖。匯集了18個(gè)臨床業(yè)務(wù)信息系統(tǒng)的業(yè)務(wù)數(shù)據(jù),超過1100張業(yè)務(wù)表,以及近450萬份數(shù)據(jù)文件,總數(shù)據(jù)量達(dá)到1500GB。為了不影響業(yè)務(wù)系統(tǒng)的正常運(yùn)行,通過建立備份庫的方式,并制定了增量同步機(jī)制,實(shí)現(xiàn)了“T+1”天準(zhǔn)實(shí)時(shí)的數(shù)據(jù)同步。

醫(yī)院依照科研及臨床需求,建立了以臨床研究通用模型為標(biāo)準(zhǔn)的數(shù)據(jù)庫(common data model,CDM)。從患者歷次就診的維度,共計(jì)70余類患者相關(guān)的人口學(xué)、臨床、診斷、檢查、檢驗(yàn)、用藥、手術(shù)、癥狀等面向臨床研究的醫(yī)院真實(shí)世界數(shù)據(jù)[5]。由于不同專病數(shù)據(jù)模型的差異,比如模型數(shù)據(jù)項(xiàng)的多少、數(shù)據(jù)項(xiàng)精細(xì)度的要求等,臨床研究通用數(shù)據(jù)模型并不能滿足各個(gè)專病數(shù)據(jù)需求,所以需要針對于不同專病建立單獨(dú)的數(shù)據(jù)庫,但其數(shù)據(jù)源均來自于ODS數(shù)據(jù)層,對不同的業(yè)務(wù)數(shù)據(jù)集進(jìn)行不同程度的進(jìn)一步處理。

2.數(shù)據(jù)處理及存儲層。主要任務(wù)是以醫(yī)院CDM庫為基礎(chǔ),按照重癥醫(yī)學(xué)專病庫標(biāo)準(zhǔn)數(shù)據(jù)集,對多源異構(gòu)數(shù)據(jù)進(jìn)行采集、治理、入庫,將符合納排條件的重癥醫(yī)學(xué)患者的原始數(shù)據(jù)按照制定的重癥醫(yī)學(xué)標(biāo)準(zhǔn)數(shù)據(jù)集模型映射、重構(gòu)。包括按照專病模型需要,對專病庫所需數(shù)據(jù)的歸一化和結(jié)構(gòu)化處理;對現(xiàn)有數(shù)據(jù)中存在的不完整、不準(zhǔn)確和不標(biāo)準(zhǔn)的“臟”數(shù)據(jù)進(jìn)行清洗;基于醫(yī)學(xué)自然語言處理技術(shù)對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行語義解析和抽??;對通用CDM模型數(shù)據(jù)項(xiàng)二次計(jì)算存儲等。簡要生產(chǎn)方式如圖2所示。

圖2 專病庫數(shù)據(jù)集生產(chǎn)過程

2.1 重癥醫(yī)學(xué)標(biāo)準(zhǔn)數(shù)據(jù)集模型。參考國內(nèi)外行業(yè)標(biāo)準(zhǔn)、疾病診療指南等規(guī)范,調(diào)研重癥醫(yī)學(xué)研究方向課題科研數(shù)據(jù)需求,共同制定面向科研與臨床的重癥醫(yī)學(xué)專病標(biāo)準(zhǔn)數(shù)據(jù)集模型,本文也參考了MIMIC數(shù)據(jù)庫的數(shù)據(jù)集模型,包括元數(shù)據(jù)、數(shù)據(jù)結(jié)構(gòu)和相關(guān)術(shù)語標(biāo)準(zhǔn)。重癥醫(yī)學(xué)統(tǒng)一標(biāo)準(zhǔn)數(shù)據(jù)集模型見表1,梳理出共13個(gè)大類25個(gè)子類235個(gè)字段的結(jié)構(gòu)化數(shù)據(jù)集。在實(shí)踐過程中,與臨床專家明確各個(gè)數(shù)據(jù)項(xiàng)提取的醫(yī)學(xué)規(guī)則,定義了數(shù)據(jù)格式、字段長度、值域、內(nèi)容約束等,為重癥臨床患者數(shù)據(jù)的標(biāo)準(zhǔn)化、規(guī)范化收集、利用與數(shù)據(jù)共享奠定了堅(jiān)實(shí)的基礎(chǔ)。

表1 重癥醫(yī)學(xué)標(biāo)準(zhǔn)數(shù)據(jù)集模型

2.2 重癥醫(yī)學(xué)專科數(shù)據(jù)處理。重癥醫(yī)學(xué)??茢?shù)據(jù)大部分存儲在醫(yī)院重癥監(jiān)護(hù)信息系統(tǒng)(ICU系統(tǒng))中,但是醫(yī)院ICU系統(tǒng)建設(shè)較早,系統(tǒng)架構(gòu)老舊,主要存在的問題有:(1)非常多的關(guān)鍵數(shù)據(jù)未實(shí)現(xiàn)結(jié)構(gòu)化存儲,比如通氣模式、微量泵用藥、出入量等,是以字符串形式存在于文件中,用“$”“|”“@”“^”等特殊符號代表特定含義,通過系統(tǒng)特有的邏輯,轉(zhuǎn)換為前臺記錄單展示出來。當(dāng)有導(dǎo)出或者分析的需要時(shí),非結(jié)構(gòu)化存儲就成了關(guān)鍵的制約因素,大量寶貴的臨床科研數(shù)據(jù)被“封鎖”在特殊格式的文件中,急需解鎖出來。(2)有些關(guān)鍵的評分?jǐn)?shù)據(jù)系統(tǒng)中完全沒有,依賴于大數(shù)據(jù)平臺自動計(jì)算,比如不同時(shí)段SOFA評分等。(3)源數(shù)據(jù)存在修改不規(guī)范,導(dǎo)致數(shù)據(jù)有缺項(xiàng)、錯(cuò)項(xiàng),數(shù)據(jù)質(zhì)量較差。

針對以上問題,在建設(shè)過程中進(jìn)行逐一擊破,以通氣模式規(guī)則解析作為突破點(diǎn),對歷史數(shù)據(jù)庫各類文件的規(guī)則進(jìn)行梳理,利用nlp自然語言處理技術(shù),并編寫自動解析腳本,有效提升了解析效率,將沉淀了10年的寶貴的歷史數(shù)據(jù)進(jìn)行了深度清洗、挽救,實(shí)現(xiàn)了專病數(shù)據(jù)與醫(yī)院其他系統(tǒng)數(shù)據(jù)的整合利用,真正地成為有研究和臨床應(yīng)用價(jià)值的醫(yī)療數(shù)據(jù),提升了專病庫數(shù)據(jù)質(zhì)量。

2.3 通用CDM模型數(shù)據(jù)項(xiàng)二次處理。在重癥醫(yī)學(xué)標(biāo)準(zhǔn)數(shù)據(jù)集模型中,需要對通用CDM模型數(shù)據(jù)項(xiàng)進(jìn)行二次處理,將已初步清洗入庫到通用CDM模型數(shù)據(jù)庫的數(shù)據(jù)項(xiàng)依據(jù)重癥醫(yī)學(xué)標(biāo)準(zhǔn)數(shù)據(jù)集模型進(jìn)行二次加工、生產(chǎn),并通過嚴(yán)格的數(shù)據(jù)質(zhì)控,以滿足專病數(shù)據(jù)庫要求。這個(gè)環(huán)節(jié)主要是解析解釋醫(yī)學(xué)規(guī)則,將符合臨床醫(yī)生需求的醫(yī)學(xué)規(guī)則轉(zhuǎn)換為前文所提到的標(biāo)準(zhǔn)模型,并將互相依賴的相關(guān)規(guī)則生成數(shù)據(jù)庫查詢語言,生產(chǎn)出專病數(shù)據(jù),經(jīng)過多維度的數(shù)據(jù)質(zhì)控,存儲到醫(yī)學(xué)專病數(shù)據(jù)庫。

2.4 數(shù)據(jù)核查與質(zhì)控。通過對源系統(tǒng)的改造,數(shù)據(jù)抽取規(guī)則的制定,實(shí)現(xiàn)自動、持續(xù)性地生成高質(zhì)量、標(biāo)準(zhǔn)化、結(jié)構(gòu)化的重癥患者診療數(shù)據(jù)。專病庫數(shù)據(jù)生產(chǎn)后,需經(jīng)過嚴(yán)格的質(zhì)控環(huán)節(jié),包括自動數(shù)據(jù)質(zhì)控、質(zhì)控異常數(shù)據(jù)修復(fù)、周期全量數(shù)據(jù)更新、人工質(zhì)控、課題質(zhì)控、隨機(jī)業(yè)務(wù)質(zhì)控等,確保專病數(shù)據(jù)庫的完整性、及時(shí)性和可用性。見表2。

表2 數(shù)據(jù)質(zhì)控方法和頻率

3.數(shù)據(jù)應(yīng)用層。數(shù)據(jù)應(yīng)用層與院級臨床研究數(shù)據(jù)平臺的數(shù)據(jù)應(yīng)用層深度融合,具備數(shù)據(jù)搜索、數(shù)據(jù)編輯、數(shù)據(jù)溯源、自定義指標(biāo)、數(shù)據(jù)導(dǎo)出等功能,更好的服務(wù)于科研與臨床。

3.1 數(shù)據(jù)檢索。據(jù)檢索功能涉及ElasticResearch、Spark等各種技術(shù)的組合。ElasticResearch是一個(gè)基于Lucene構(gòu)建的分布式、高擴(kuò)展、高實(shí)時(shí)的搜索與數(shù)據(jù)分析引擎,支持通過HTTP使用JSON進(jìn)行數(shù)據(jù)索引??梢杂糜谌乃阉鳌⒔Y(jié)構(gòu)化搜索及分析。支持and、or、排除等多種關(guān)系,字段支持全匹配、模糊匹配等條件,且支持大數(shù)據(jù)平臺及專病庫字段聯(lián)合檢索。聯(lián)合檢索的功能之所以能夠?qū)崿F(xiàn),是因?yàn)閷2焓腔卺t(yī)院臨床科研數(shù)據(jù)湖搭建,可用數(shù)據(jù)和檢索范圍大大擴(kuò)展。

除數(shù)據(jù)庫已存在的數(shù)據(jù)項(xiàng)外,還支持科研人員根據(jù)研究需要自定義指標(biāo)項(xiàng),選擇檢索結(jié)果范圍,通過結(jié)果處理函數(shù)來具體限制條件命中的位置,比如第一次、最后一次、第n次、倒數(shù)第n次等,以及遞歸引用自定義指標(biāo)形成第2次、第3次引用等形成新的自定義指標(biāo),可以更加靈活、精確的定義納排條件,獲得更具有科研意義的數(shù)據(jù)結(jié)果。例如,在系統(tǒng)中,可定義患者的血糖在某時(shí)間段內(nèi)的峰值出現(xiàn)時(shí)間,作為時(shí)間類型的自定義指標(biāo),系統(tǒng)能夠基于數(shù)據(jù)庫存儲的時(shí)間序列數(shù)據(jù),根據(jù)前后數(shù)據(jù)值對比計(jì)算出來,該指標(biāo)可以繼續(xù)用于聯(lián)合檢索及數(shù)據(jù)導(dǎo)出。

3.2 科研數(shù)據(jù)導(dǎo)出。讓臨床醫(yī)生或研究者先期了解數(shù)據(jù)庫中的數(shù)據(jù)內(nèi)容是提高專病數(shù)據(jù)利用率的重要手段,所以需充分的對用戶進(jìn)行反復(fù)多次的培訓(xùn)、講解、試用,并設(shè)計(jì)足夠靈活的數(shù)據(jù)表格,方便科研所用,保持持續(xù)的科研數(shù)據(jù)產(chǎn)出,為科研項(xiàng)目、發(fā)表論文等提供數(shù)據(jù)支撐。通過模塊化數(shù)據(jù)整合和分析,從而輔助科室開展真實(shí)世界臨床研究。圍繞臨床診療難點(diǎn)及相關(guān)基礎(chǔ)研究,提升重癥醫(yī)學(xué)相關(guān)科研能力。專病庫的數(shù)據(jù)導(dǎo)出支持按縱表導(dǎo)出,能夠更適合作為深度學(xué)習(xí)的數(shù)據(jù)源。

3.3 科研與臨床應(yīng)用案例——臨床預(yù)測模型。重癥醫(yī)學(xué)專病庫上線后,支持了兩項(xiàng)臨床預(yù)測模型的建立,包括膿毒血癥死亡風(fēng)險(xiǎn)預(yù)測模型、有創(chuàng)通氣拔管時(shí)機(jī)預(yù)測模型。重癥醫(yī)學(xué)科科研人員采用深度學(xué)習(xí)的方法,深入挖掘數(shù)據(jù)在不同形式下的特征,使用專病數(shù)據(jù)庫提供的醫(yī)療時(shí)序數(shù)據(jù)參數(shù)集進(jìn)行學(xué)習(xí)、訓(xùn)練,形成了具有較好預(yù)測效果的臨床預(yù)測模型。醫(yī)院重癥醫(yī)學(xué)專病庫提供的數(shù)據(jù)集合有173項(xiàng)靜態(tài)數(shù)據(jù),包括人口學(xué)信息、并發(fā)癥信息等,294項(xiàng)時(shí)序數(shù)據(jù),包括重癥監(jiān)測體征、實(shí)驗(yàn)室指標(biāo)等,確保了真實(shí)醫(yī)療場景下的可用性。

4.數(shù)據(jù)安全層。應(yīng)用數(shù)據(jù)加密技術(shù),對數(shù)據(jù)信息系統(tǒng)中的敏感數(shù)據(jù)字段(病人聯(lián)系方式、病人姓名、病人住址等)進(jìn)行脫敏、加密處理。從應(yīng)用層、數(shù)據(jù)庫維護(hù)層、存儲層、網(wǎng)絡(luò)傳輸?shù)葘用鎸?shù)據(jù)安全進(jìn)行管控,實(shí)現(xiàn)字段級的訪問控制,以保證信息數(shù)據(jù)安全。

制定數(shù)據(jù)安全管理制度,管理流程由科研歸口管理部門和數(shù)據(jù)歸口管理部門聯(lián)合管理,包括科研處、醫(yī)學(xué)信息中心、倫理辦公室等,對用戶權(quán)限進(jìn)行層級授權(quán)管理。

總結(jié)

形成了較完整的結(jié)構(gòu)化、標(biāo)準(zhǔn)化的重癥醫(yī)學(xué)數(shù)據(jù)庫。通過數(shù)據(jù)治理,將醫(yī)院沉淀10年的重癥數(shù)據(jù)重構(gòu)為符合重癥臨床與科學(xué)研究需要的醫(yī)院重癥醫(yī)學(xué)數(shù)據(jù)庫,形成了13個(gè)大類25個(gè)子類219個(gè)數(shù)據(jù)項(xiàng)的結(jié)構(gòu)化數(shù)據(jù)集。建立的重癥醫(yī)學(xué)數(shù)據(jù)庫共納入了2012年11月至 2022年10月的4萬余例住院患者的診療數(shù)據(jù)。經(jīng)過驗(yàn)證,數(shù)據(jù)庫數(shù)據(jù)質(zhì)控滿足臨床及科研要求,并實(shí)現(xiàn)了自動、持續(xù)性地生成高質(zhì)量、標(biāo)準(zhǔn)化、結(jié)構(gòu)化的重癥患者診療數(shù)據(jù)。重癥醫(yī)學(xué)數(shù)據(jù)應(yīng)用平臺操作便利,實(shí)現(xiàn)了病例檢索、患者全病程瀏覽和患者數(shù)據(jù)集導(dǎo)出等功能。目前,已支持了院內(nèi)多項(xiàng)課題研究,輔助科研人員建立兩項(xiàng)臨床預(yù)測模型,并應(yīng)用于臨床,促進(jìn)科研成果的臨床轉(zhuǎn)化,對科研應(yīng)用及臨床業(yè)務(wù)應(yīng)用具有重要意義[6-7]。

猜你喜歡
專病數(shù)據(jù)項(xiàng)結(jié)構(gòu)化
“互聯(lián)網(wǎng)+醫(yī)療”背景下中醫(yī)專病人工智能診療系統(tǒng)的現(xiàn)狀及探討
促進(jìn)知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
一種多功能抽簽選擇器軟件系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
非完整數(shù)據(jù)庫Skyline-join查詢*
基于Python的Asterix Cat 021數(shù)據(jù)格式解析分析與實(shí)現(xiàn)
專病一體化護(hù)理對心衰患者營養(yǎng)管理的影響
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
基于軟信息的結(jié)構(gòu)化轉(zhuǎn)換
腎臟病專病門診護(hù)理管理的新思路