李敏 王梓豪 賀繼剛
摘要:醫(yī)學(xué)案例庫是對(duì)醫(yī)學(xué)信息“大數(shù)據(jù)”的整理、歸納。通過不同的邏輯算法,將醫(yī)學(xué)“大數(shù)據(jù)”電子化。本文通過對(duì)醫(yī)學(xué)生物學(xué)“大數(shù)據(jù)”的整理、收集而介紹目前國內(nèi)外醫(yī)學(xué)、生物學(xué)案例庫的構(gòu)建特點(diǎn)及作用,對(duì)醫(yī)學(xué)案例庫的構(gòu)建及作用進(jìn)行展示。
關(guān)鍵詞:案例;大數(shù)據(jù);醫(yī)學(xué)案例庫
中圖分類號(hào):G642? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:B? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2020.22.002
文章編號(hào):1006-1959(2020)22-0005-05
Construction and Function of Medical Biology Case Library
LI Min,WANG Zi-hao,HE Ji-gang
(Cardiovascular Surgery,the Affiliated Hospital of Kunming University of Science and Technology/the First People's Hospital of Yunnan Province,Kunming 653200,Yunnan,China)
Abstract:Medical case library is the collation and induction of "big data" of medical information. Through different logic algorithms, "big data" will be electronic. This paper introduces the characteristics and functions of medical and biological case databases at home and abroad through the collation and collection of "big data" in medical biology. To demonstrate the construction and function of medical case base.
Key words:Case;Big data;Medical case library
案例是“案例實(shí)例”的意思,必須是“具體情境下發(fā)生的典型案例”。案例學(xué)習(xí)的意義在于通過展現(xiàn)層次豐富、角度不同,彼此之間有密切邏輯關(guān)系的事實(shí),回答“為什么”和“怎么樣”的問題,而不是對(duì)“應(yīng)該是什么”之類的問題做出直接判斷。通過不同邏輯算法構(gòu)建不同類型的案例庫,可以使醫(yī)學(xué)生物學(xué)研究“有據(jù)可查、有據(jù)可依”,也能夠加強(qiáng)科研能力,是一個(gè)準(zhǔn)確、有效的復(fù)雜過程,也是形象生動(dòng)的代表物,具有方法論意義。本文通過介紹目前國內(nèi)外已構(gòu)建醫(yī)學(xué)、生物學(xué)案例庫的特點(diǎn)、作用,旨在提示廣大醫(yī)務(wù)工作者采用案例庫對(duì)醫(yī)學(xué)“大數(shù)據(jù)”進(jìn)行信息挖掘,從而提高醫(yī)療質(zhì)量的統(tǒng)一性、一致性。
1醫(yī)學(xué)數(shù)據(jù)庫內(nèi)案例的本質(zhì)
醫(yī)學(xué)數(shù)據(jù)庫內(nèi)案例的本質(zhì)就是“大數(shù)據(jù)”,即將海量的醫(yī)學(xué)信息長期存儲(chǔ)在計(jì)算機(jī)內(nèi)的、有組織的、可共享的并統(tǒng)一管理的大量數(shù)據(jù)的集合。醫(yī)學(xué)數(shù)據(jù)庫的建立既能夠改善傳統(tǒng)醫(yī)學(xué)文檔存儲(chǔ)方式的冗余和不易查找的問題,又能夠維護(hù)醫(yī)學(xué)文檔的統(tǒng)一性和權(quán)威性?!按髷?shù)據(jù)”一詞涵蓋了多種學(xué)科和應(yīng)用,是采用不同統(tǒng)計(jì)、計(jì)算方法進(jìn)行數(shù)據(jù)的歸類、整理[1]。醫(yī)學(xué)科學(xué)的“大數(shù)據(jù)”必須涉及到不同類型患者的特征、時(shí)間結(jié)構(gòu)、治療信息。盡管一些常規(guī)的統(tǒng)計(jì)方法已經(jīng)滿足了這些要求,并且已經(jīng)應(yīng)用于醫(yī)學(xué)科學(xué)領(lǐng)域,但是開發(fā)更適當(dāng)?shù)姆椒▉磉M(jìn)行自動(dòng)模式的識(shí)別仍有很大的潛力。這些尚待開發(fā)的方法或許將會(huì)證明對(duì)復(fù)雜性大數(shù)據(jù)應(yīng)用程序更為有用。盡管很難通過大數(shù)據(jù)方法獲得無偏差的結(jié)果,但大數(shù)據(jù)方法仍然具有很大希望為醫(yī)學(xué)提供有益的補(bǔ)充信息。例如一家典型的醫(yī)院在患者護(hù)理過程中每年可生成數(shù)百TB的數(shù)據(jù)(1 TB=1012字節(jié)),每位患者可產(chǎn)生5 GB(1 GB=109字節(jié))數(shù)據(jù)[2]。若單純使用計(jì)算機(jī)科學(xué)和傳統(tǒng)的統(tǒng)計(jì)工具已經(jīng)很難完成對(duì)這些大量信息的分析任務(wù),也就是說很難對(duì)數(shù)據(jù)進(jìn)行組織和描述,以及得出科學(xué)上有效的結(jié)論。這就需要對(duì)患者的大量數(shù)據(jù)進(jìn)行復(fù)雜的分析和統(tǒng)計(jì),以此可以優(yōu)化計(jì)算時(shí)間來避免超出可用存儲(chǔ)容量。
對(duì)“大數(shù)據(jù)”的分析可以結(jié)合網(wǎng)絡(luò),如在Google流感趨勢項(xiàng)中,使用Google搜索的某些字詞的頻率可以預(yù)測許多國家或者地區(qū)在其區(qū)域范圍內(nèi)的流感活動(dòng)趨勢。這些地區(qū)有關(guān)“流感”的出版物表明,使用Google搜索字詞頻率等相關(guān)數(shù)據(jù)可以準(zhǔn)確預(yù)測流感趨勢。相反,傳統(tǒng)方式獲取數(shù)據(jù)會(huì)麻煩得多[3]。通常,采用Google搜索可以創(chuàng)造出對(duì)流感趨勢快速反應(yīng)的可能性,這被認(rèn)為是“大數(shù)據(jù)+互聯(lián)網(wǎng)”的成功應(yīng)用。
采用醫(yī)學(xué)“大數(shù)據(jù)”建立醫(yī)學(xué)“數(shù)據(jù)庫”已成為目前世界范圍內(nèi)的趨勢。醫(yī)學(xué)數(shù)據(jù)庫中各種數(shù)據(jù)整理技術(shù)的引入,能夠極大程度的節(jié)省醫(yī)學(xué)數(shù)據(jù)存儲(chǔ)的空間、更好的保護(hù)患者的隱私、進(jìn)一步實(shí)現(xiàn)各個(gè)不同單位間的資源共享、更細(xì)致地整合互聯(lián)網(wǎng)的各種醫(yī)學(xué)資料以及更加快捷地檢索各種信息,從而給醫(yī)學(xué)工作者帶來極大的便利[4]。以下介紹當(dāng)前醫(yī)學(xué)生物學(xué)領(lǐng)域內(nèi)具有代表性的生物醫(yī)學(xué)數(shù)據(jù)庫的構(gòu)建及作用。
2國、內(nèi)外流行的醫(yī)學(xué)生物學(xué)案例數(shù)據(jù)庫
2.1重癥醫(yī)學(xué)醫(yī)療數(shù)據(jù)庫? 目前重癥監(jiān)護(hù)數(shù)據(jù)庫中最主要的數(shù)據(jù)庫為:MIMIC-Ⅲ數(shù)據(jù)庫。據(jù)Johnson AE等報(bào)道[5],MIMIC-Ⅲ是一個(gè)大型的單中心數(shù)據(jù)庫,該數(shù)據(jù)庫收集了大型三級(jí)醫(yī)院重癥監(jiān)護(hù)病房收治患者有關(guān)的信息。所搜集的數(shù)據(jù)包括生命體征、醫(yī)護(hù)人員記錄的病歷、實(shí)驗(yàn)室檢驗(yàn)結(jié)果、影像報(bào)告、診斷代碼、住院時(shí)間、生存數(shù)據(jù)等。該數(shù)據(jù)庫可應(yīng)用于多種方面,包括學(xué)術(shù)和工業(yè)研究、高等教育課程等。在數(shù)據(jù)被納入MIMIC-Ⅲ數(shù)據(jù)庫之前,首先根據(jù)《健康保險(xiǎn)可移植性與責(zé)任法案》(HIPAA)標(biāo)準(zhǔn),先使用結(jié)構(gòu)化數(shù)據(jù)清理及日期轉(zhuǎn)移兩大手段對(duì)數(shù)據(jù)進(jìn)行識(shí)別[5]。結(jié)構(gòu)化數(shù)據(jù)的去識(shí)別化過程需要?jiǎng)h除HIPAA中列出的所有十八個(gè)標(biāo)識(shí)數(shù)據(jù)元素,包括諸如患者姓名、電話號(hào)碼、地址、日期之類的字段。特別是,為了保持時(shí)間間隔,每個(gè)患者以相同的方式通過隨機(jī)偏移將日期移到未來,從而使其在2100到2200年之間的某個(gè)時(shí)間發(fā)生停留。一天中的某個(gè)時(shí)刻、一周中的某天以及大致季節(jié)等,在日期轉(zhuǎn)換期間被保留了下來。比如89歲以上患者的出生日期被更改,以掩蓋其真實(shí)年齡來符合HIPAA規(guī)則:這些患者出現(xiàn)在數(shù)據(jù)庫中其年齡可能超過300歲。通過使用經(jīng)過嚴(yán)格評(píng)估的去識(shí)別化系統(tǒng)(該系統(tǒng)基于廣泛的字典查找和帶有表達(dá)式的模式匹配),從自由文本字段(如診斷報(bào)告和醫(yī)師說明)中刪除了受保護(hù)的健康信息[6]。隨著新數(shù)據(jù)的獲取,該身份識(shí)別系統(tǒng)的組成部分將不斷擴(kuò)展。
MIMIC數(shù)據(jù)模型的開發(fā)需要做到在簡單的講解說明與接近事實(shí)間取得平衡。一般使用ADMISSIONS、PATIENTS、ICUSTAYS、 SERVICES、TRANSFERS五個(gè)表格來定義和跟蹤患者住院時(shí)間。? ? ?此外,五個(gè)表是針對(duì)其各自定義進(jìn)行交叉引用的字典代碼:D_CPT、D_ICD_DIAGNOSES、D_ICD_PROCEDURES、D_ITEMS、和D_LABITEMS。其余表包含與患者護(hù)理相關(guān)的數(shù)據(jù),例如生理測量,護(hù)理者觀察和結(jié)算信息[5]。在某些情況下,例如D_ICD_PROCEDURES表和CPTEVENTS表都包含與過程有關(guān)的詳細(xì)信息,并且可以合并使用,似乎可以將表合并。因?yàn)閿?shù)據(jù)源有很大的不同,Johnson AE等[5]采用是保持表的獨(dú)立性的方法,建議研究人員開發(fā)適當(dāng)?shù)臄?shù)據(jù)庫視圖,并進(jìn)行轉(zhuǎn)換,而不是在MIMIC數(shù)據(jù)模型中組合。MIMIC數(shù)據(jù)庫的文檔可在線獲得。內(nèi)容正在不斷開發(fā)中,其中包括使用MIMIC進(jìn)行的一系列研究。該網(wǎng)站具有允許研究社區(qū)通過GitHub直接提交更新和改進(jìn)的功能[7]。
2016 年,美國科研團(tuán)隊(duì)在其原有 MIMIC-Ⅱ數(shù)據(jù)庫基礎(chǔ)上進(jìn)一步改進(jìn)升級(jí),成功建立了 MIMIC-Ⅲ數(shù)據(jù)庫,包含 52423 例次就診于波士頓貝斯醫(yī)療中心各重癥加強(qiáng)治療病房(ICU)的危重癥患者信息,也是目前世界上少數(shù)可免費(fèi)使用的高質(zhì)量數(shù)據(jù)庫之一[7]。MIMIC-Ⅲ數(shù)據(jù)庫所包含的數(shù)據(jù)來源于在各重癥 ICU 接受治療的患者,為進(jìn)行重癥醫(yī)學(xué)領(lǐng)域的科學(xué)研究提供了條件。
2.2歐洲EpiCom基于網(wǎng)絡(luò)的炎癥性腸病流行病學(xué)數(shù)據(jù)庫? 歐洲流行病學(xué)委員會(huì)(EpiCom)基于網(wǎng)絡(luò)的研究(EpiCom,www.epicom-ecco.eu)在2006年至2010年期間建立了基于網(wǎng)絡(luò)的炎癥性腸病流行病學(xué)數(shù)據(jù)庫。數(shù)據(jù)庫建立是為了更好地確定炎癥性腸病(IBD)與環(huán)境因素的關(guān)聯(lián)機(jī)制、并確定跨國環(huán)境中新的危險(xiǎn)因素[8]?;赪eb的EpiCom數(shù)據(jù)庫應(yīng)用程序是在丹麥克羅恩結(jié)腸炎數(shù)據(jù)庫(DCCD)(www.dccd-ibd.dk)的基礎(chǔ)上設(shè)計(jì)的,其主要目標(biāo)是成為一個(gè)流行病學(xué)數(shù)據(jù)庫,更側(cè)重于學(xué)術(shù)性和流行病學(xué)內(nèi)容,而不是臨床適用性[8]。該數(shù)據(jù)庫用于EpiCom項(xiàng)目中使用的各種表格可在線注冊(cè)。為了能夠跟蹤和記錄該項(xiàng)目中所包括患者的臨床病程,該數(shù)據(jù)庫圍繞9種臨床方案建立,涵蓋了該病程的所有方面。進(jìn)入方案包括診斷標(biāo)準(zhǔn)方案,診斷標(biāo)準(zhǔn)方案中包含有關(guān)診斷、疾病程度和行為、進(jìn)行的檢查、患者人口統(tǒng)計(jì)學(xué)的數(shù)據(jù)。每次患者就診時(shí)使用的方案包括疾病活動(dòng)方案、用于血液分析登記的血樣方案(包括維生素D)、有關(guān)自上次就診以來發(fā)生的疾病狀況、治療和檢查的臨床評(píng)估方案。該數(shù)據(jù)庫在所使用的方案中進(jìn)行了內(nèi)置的控制和驗(yàn)證測試,從而確保避免數(shù)據(jù)丟失和數(shù)據(jù)前后矛盾。EpiCom數(shù)據(jù)庫不允許輸入無效數(shù)據(jù),特別是不能滿足CD和UC哥本哈根診斷標(biāo)準(zhǔn)要求的患者數(shù)據(jù)[8]。為確?;颊邤?shù)據(jù)匿名,EpiCom數(shù)據(jù)庫僅按出生日期和唯一的患者ID號(hào)注冊(cè)患者信息。患者ID由五個(gè)元素組成:包含出生日期(六位數(shù));性別(男/女);中心號(hào)碼(三位數(shù));和國家/地區(qū)號(hào)碼(三位數(shù))。EpiCom數(shù)據(jù)庫創(chuàng)建了一個(gè)驗(yàn)證方案用于數(shù)據(jù)庫驗(yàn)證。驗(yàn)證方案包含有關(guān)數(shù)據(jù)庫的一般用途、時(shí)間消耗、總體印象和滿意度、數(shù)據(jù)庫中使用的問卷和方案的相關(guān)性和適用性的問題。EpiCom研究于2010年1月1日至2010年12月31日時(shí)期內(nèi),在西歐和東歐的地理區(qū)域內(nèi),創(chuàng)建了一個(gè)新的具有前瞻性、統(tǒng)一診斷、基于人群的入組隊(duì)列,其均為IBD患者。隨訪期(FU)持續(xù)到2011年12月31日。在歐洲,科學(xué)家們將首次描述歐洲不同地理區(qū)域之間的差異,并證明生活方式對(duì)IBD發(fā)病率的影響。來自23個(gè)國家或地區(qū)的34個(gè)代表為成年醫(yī)生和兒科醫(yī)生,他們分別來自15個(gè)西歐國家或地區(qū)、8個(gè)東歐國家或地區(qū)、及一個(gè)亞洲國家(中國武漢市)[8]。
EpiCom研究的總體目標(biāo)是調(diào)查歐洲國家IBD發(fā)病率是否存在東西國家的方向梯度,此外,IBD發(fā)病率是否與環(huán)境暴露差異相關(guān)。丹麥的HD-support LLC使用了大約兩年的時(shí)間進(jìn)行了基于Web的EpiCom數(shù)據(jù)庫應(yīng)用程序的開發(fā)。數(shù)據(jù)庫的構(gòu)建需要HD支持、需要項(xiàng)目指導(dǎo)小組就數(shù)據(jù)庫的內(nèi)容和結(jié)構(gòu)進(jìn)行一系列訪談、需要就所構(gòu)建原型的初始功能列表達(dá)成一致[8]。為此項(xiàng)目創(chuàng)建了一個(gè)網(wǎng)站www.epicom-ecco.eu,該網(wǎng)站允許訪問數(shù)據(jù)庫、包含聯(lián)系信息和EpiCom項(xiàng)目協(xié)議,世界上任何人都可以使用該協(xié)議以提高透明度。此外,在網(wǎng)站首頁上創(chuàng)建了一個(gè)包含表,該表顯示數(shù)據(jù)庫中當(dāng)前患者數(shù)量以及每個(gè)參與中心的發(fā)生率[8]。為了描述東歐和西歐國家的醫(yī)療質(zhì)量,EpiCom數(shù)據(jù)庫開發(fā)了一份特別針對(duì)醫(yī)師背景、IBD醫(yī)師教育、患者治療信息水平、藥物不良事件監(jiān)測和結(jié)腸直腸癌監(jiān)測的問卷。
2.3 CardioTF數(shù)據(jù)庫? CardioTF數(shù)據(jù)庫是為了創(chuàng)建心血管基因調(diào)控的綜合數(shù)據(jù)源,并促進(jìn)對(duì)基因組數(shù)據(jù)的更深入了解。該數(shù)據(jù)庫的目的是整理有關(guān)心血管轉(zhuǎn)錄因子(TF)、位置權(quán)重矩陣(PWM)和增強(qiáng)子序列的信息[9]。心臟病是嬰兒和成人發(fā)病和死亡的主要原因之一[10,11]。由于需要對(duì)先天性心臟?。–HDs)病因進(jìn)行深入研究,因而必須對(duì)心臟轉(zhuǎn)錄因子(TFs)突變進(jìn)行鑒定[12]。另一方面,已經(jīng)發(fā)現(xiàn)某些成人心臟病的發(fā)生是基因調(diào)控序列的變化所致[13]。因此,了解TF及其下游靶標(biāo)以及參與心臟發(fā)育的調(diào)控基因組序列將增進(jìn)我們對(duì)心臟病的了解。利用心臟TF來探明與心血管發(fā)育相關(guān)的所有轉(zhuǎn)錄信息是一種生物治療項(xiàng)目,記錄了跨物種的TF、PWM文件和增強(qiáng)子信息,包括蒼蠅、海鞘、魚、青蛙、雞、小鼠和人類,并且CardioTF數(shù)據(jù)庫具有一個(gè)即時(shí)搜索引擎來查詢相關(guān)信息[9]。除了可以查詢數(shù)據(jù)以外,使用Na?觙ve-Bayes方法來識(shí)別核心的心臟TF,可將其用作路線圖,來進(jìn)一步了解涉及心臟發(fā)育基因調(diào)控網(wǎng)絡(luò)的增強(qiáng)子。心臟TFs先前被定義為心臟基因表達(dá)的調(diào)控因子,可以影響心臟的發(fā)育過程,特別是心肌的發(fā)育和維持。在CardioSignal數(shù)據(jù)庫中,還對(duì)促進(jìn)心肌細(xì)胞基因表達(dá)的心臟特異性增強(qiáng)子進(jìn)行了比較。心臟特異性轉(zhuǎn)錄因子被定義為調(diào)節(jié)心肌基因表達(dá)的基因。在發(fā)育過程中,心臟由三層組成心肌層、心外膜層和心內(nèi)膜層。此外,至少有四種心臟特異性細(xì)胞系被鑒定,包括心肌細(xì)胞、內(nèi)皮細(xì)胞、心外膜細(xì)胞和成纖維細(xì)胞,后者主要由心外膜細(xì)胞經(jīng)上皮向間質(zhì)轉(zhuǎn)化(EMT)而來[14]。CardioTF數(shù)據(jù)庫提供了一個(gè)框架,用戶可以在該框架中查詢跨物種的各種TF的同源性信息,以及來自高通量ChIP-seq數(shù)據(jù)與TF和增強(qiáng)子相對(duì)應(yīng)的PWM信息[15]。心臟增強(qiáng)子和TFs的篩選有助于今后構(gòu)建轉(zhuǎn)錄網(wǎng)絡(luò)[15]。目前,Sperling組或Pu組的方法僅基于ChIP-seq數(shù)據(jù)報(bào)告了三到四個(gè)TFs[16]。其他基因組生物學(xué)家試圖在基因組規(guī)模上尋找心臟增強(qiáng)子的類似方法也已在其它地方進(jìn)行了綜述[17,18]。但是,從這些研究中獲得的信息遠(yuǎn)低于我們對(duì)這些核心心血管TF的了解,而這些核心TF有多種來源支持其在心血管發(fā)展中的作用。
2.4日本康復(fù)營養(yǎng)數(shù)據(jù)庫據(jù)? Takasaki M等[19]報(bào)道,日本康復(fù)營養(yǎng)數(shù)據(jù)庫是一個(gè)為康復(fù)營養(yǎng)方面觀察性研究提供個(gè)案登記的數(shù)據(jù)庫,從普通病房收集有關(guān)老年患者肺炎的數(shù)據(jù),從康復(fù)病房收集有關(guān)中風(fēng)和髖部骨折的數(shù)據(jù)。其建立是為推進(jìn)日本康復(fù)營養(yǎng)的臨床研究,而建立了康復(fù)營養(yǎng)數(shù)據(jù)庫并評(píng)估其質(zhì)量??祻?fù)營養(yǎng)數(shù)據(jù)庫是一個(gè)基于Web的注冊(cè)表數(shù)據(jù)庫。該數(shù)據(jù)庫總體目標(biāo)如下:①發(fā)表有關(guān)康復(fù)營養(yǎng)的臨床研究,這將有助于改善世界范圍內(nèi)康復(fù)醫(yī)學(xué)的質(zhì)量;②收集與康復(fù)營養(yǎng)相關(guān)的政策建議;③為康復(fù)營養(yǎng)協(xié)會(huì)的成員提供研究機(jī)會(huì)[19];④在創(chuàng)建此數(shù)據(jù)庫時(shí),選擇要收集的數(shù)據(jù)項(xiàng)很重要[20]。日本康復(fù)數(shù)據(jù)庫(JRD)是針對(duì)康復(fù)醫(yī)學(xué)研究,并且使用JRD的英文論文數(shù)量正在增加[21-25]。該數(shù)據(jù)庫項(xiàng)目的具體目標(biāo)如下:①從每個(gè)機(jī)構(gòu)收集數(shù)據(jù)并建立有關(guān)康復(fù)營養(yǎng)的病例注冊(cè)數(shù)據(jù)庫;②根據(jù)參與機(jī)構(gòu)的需求提供有關(guān)收集的數(shù)據(jù)信息;③允許每個(gè)機(jī)構(gòu)將數(shù)據(jù)用于臨床研究目的。
數(shù)據(jù)庫在構(gòu)建時(shí)需要特殊變量的數(shù)據(jù)則不可避免地會(huì)導(dǎo)致數(shù)據(jù)丟失,并降低所收集數(shù)據(jù)的質(zhì)量[19]。電子數(shù)據(jù)捕獲(EDC)是臨床研究數(shù)據(jù)的電子收集系統(tǒng),是實(shí)現(xiàn)高質(zhì)量數(shù)據(jù)管理必不可少的工具[26]。EDC的優(yōu)點(diǎn)包括易于清理數(shù)據(jù)和實(shí)時(shí)監(jiān)視數(shù)據(jù)。許多EDC系統(tǒng)都很昂貴,但是近年來,已經(jīng)開發(fā)出了低成本高效益且易于使用的EDC。研究電子數(shù)據(jù)捕獲(REDCap)被列為世界標(biāo)準(zhǔn)醫(yī)學(xué)研究EDC[26]。該EDC由范德比爾特大學(xué)開發(fā),其源代碼是免費(fèi)提供的。目前,全世界有超過130000個(gè)REDCap項(xiàng)目正在進(jìn)行中。使用REDCap,即使用戶不是數(shù)據(jù)管理專家,也可以在Web上以低成本構(gòu)建和輕松管理數(shù)據(jù)庫[19]。REDCap的用戶支持最近已在日本啟動(dòng),例如,日本康復(fù)營養(yǎng)研究小組已經(jīng)提出將REDCap作為注冊(cè)表數(shù)據(jù)庫的EDC的應(yīng)用程序。數(shù)據(jù)庫用戶可以使用用戶名和密碼從任何地方登錄系統(tǒng)??祻?fù)營養(yǎng)數(shù)據(jù)庫是使用REDCap構(gòu)建的Active Server網(wǎng)頁??梢詫⑤斎腠?xiàng)目制作為案件登記畫面上的列表。參加機(jī)構(gòu)包括日本康復(fù)營養(yǎng)協(xié)會(huì)成員所屬的綜合醫(yī)院病房和康復(fù)病房。
該數(shù)據(jù)庫具有三個(gè)主要數(shù)據(jù)輸入頁面(基本信息、住院期間的輸入項(xiàng)和出院時(shí)的輸入項(xiàng)),并且在注冊(cè)數(shù)據(jù)庫項(xiàng)目時(shí)會(huì)收集每個(gè)機(jī)構(gòu)的信息并將其注冊(cè)為附錄。所有數(shù)據(jù)收集表格和數(shù)據(jù)報(bào)告都將自動(dòng)分配一個(gè)REDCap ID。與傳統(tǒng)的康復(fù)數(shù)據(jù)庫不同,該數(shù)據(jù)庫包含特定的營養(yǎng)評(píng)估項(xiàng)目,例如吞咽功能、飲食形式、營養(yǎng)攝入以及其他相關(guān)康復(fù)變量。通過利用該數(shù)據(jù)庫,可以進(jìn)行康復(fù)營養(yǎng)的研究,并且有可能在將來可將其結(jié)果提供給臨床用于臨床研究及實(shí)踐。
2.5首都醫(yī)科大學(xué)附屬北京安貞醫(yī)院心外科術(shù)后隨訪數(shù)據(jù)庫? 北京安貞醫(yī)院心外科術(shù)后隨訪數(shù)據(jù)庫旨在構(gòu)建新型、雙向交互式、遠(yuǎn)程醫(yī)療隨訪平臺(tái),完善心臟術(shù)后臨床數(shù)據(jù)的收集,并為患者提供可靠優(yōu)質(zhì)的隨訪服務(wù)。研究人員運(yùn)用現(xiàn)代通信、計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù),開發(fā)與移動(dòng)網(wǎng)兼容的隨診數(shù)據(jù)庫及軟件,以術(shù)后隨訪率、術(shù)后重要指標(biāo)的隨訪質(zhì)量,作為評(píng)估隨訪系統(tǒng)的標(biāo)準(zhǔn)[27]。該數(shù)據(jù)庫在以下方面取得成功:①通過隨訪宣教、不斷更新醫(yī)患問答,提高患者的健康意識(shí);②為每位患者定制個(gè)性化隨訪單,內(nèi)置個(gè)性化隨訪問卷及定期復(fù)查周期,系統(tǒng)的自動(dòng)判斷、提醒、及動(dòng)態(tài)比較功能,將有助于患者自測及術(shù)后調(diào)整;③作為健康檔案,記錄了患者的基本信息及術(shù)后的動(dòng)態(tài)變化,方便以后就診;④系統(tǒng)所有的判斷、回復(fù)都來源于網(wǎng)絡(luò)內(nèi)置程序,減少了人力、時(shí)間成本,并盡可能的規(guī)避了醫(yī)療風(fēng)險(xiǎn)。
2.6北京解放軍總醫(yī)院急診科急救數(shù)據(jù)庫? 北京解放軍總醫(yī)院急診科急救數(shù)據(jù)庫旨在建立急救患者多病種數(shù)據(jù)庫,為研究急救領(lǐng)域臨床科研問題提供基于“真實(shí)世界”的數(shù)據(jù)信息[28]。趙宇卓等研究顯示,該院從解放軍總醫(yī)院的醫(yī)院信息系統(tǒng)(HIS)、實(shí)驗(yàn)室信息系統(tǒng)(LIS)、急診專科系統(tǒng)、急診護(hù)理系統(tǒng)及床旁監(jiān)護(hù)設(shè)備內(nèi),提取2014年1月至2018年1月在急診科就診患者的結(jié)構(gòu)化和非結(jié)構(gòu)化信息,通過建立表單、編寫代碼建立數(shù)據(jù)庫,并對(duì)數(shù)據(jù)進(jìn)行處理,初步建立了單中心數(shù)據(jù)庫,即急救數(shù)據(jù)庫。
3總結(jié)
醫(yī)療大數(shù)據(jù)庫建設(shè)及數(shù)據(jù)分析技術(shù)正在深刻地改變著傳統(tǒng)的生物醫(yī)學(xué)研究、臨床診療、衛(wèi)生管理、醫(yī)學(xué)衛(wèi)生人才培養(yǎng)模式,并已成為大樣本、大數(shù)據(jù)臨床研究、個(gè)性化診療、精準(zhǔn)醫(yī)療、疾病監(jiān)測預(yù)警、衛(wèi)生經(jīng)濟(jì)評(píng)價(jià)、政府政策評(píng)估、新藥研制等醫(yī)學(xué)科技新進(jìn)展的重要支撐手段?,F(xiàn)有數(shù)據(jù)庫中收集的信息的質(zhì)量和廣度在各數(shù)據(jù)庫之間、各機(jī)構(gòu)之間以及國界之間差異很大。近年來,隨著各大醫(yī)院的信息化飛速發(fā)展,大多數(shù)醫(yī)療機(jī)構(gòu)的各項(xiàng)醫(yī)療數(shù)據(jù)總量呈“爆發(fā)”式增加。數(shù)據(jù)的類型多種多樣,除醫(yī)療機(jī)構(gòu)收集的數(shù)據(jù)外,還有基因組學(xué)數(shù)據(jù)、公共衛(wèi)生領(lǐng)域大數(shù)據(jù)等呈現(xiàn)迅速增長趨勢。這些都為我們?cè)谟邢迼l件下,利用現(xiàn)代技術(shù)在各個(gè)醫(yī)學(xué)領(lǐng)域開發(fā)全面而準(zhǔn)確的數(shù)據(jù)庫提供了可能。
參考文獻(xiàn):
[1]Binder H,Blettner M.Big Data in Medical Science-a Biostatistical View[J].Dtsch Arztebl Int,2015,112(9):137-142.
[2]Sejdic E.Adapt current tools for handling big data[J].Nature,2014,507(7492):306.
[3]Ginsberg J,Mohebbi MH,Patel RS,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009,457(7232):1012-1014.
[4]鄧悟,鄧波,廖燈彬,等.醫(yī)學(xué)數(shù)據(jù)庫應(yīng)用的實(shí)踐前景[J].華西醫(yī)學(xué),2009(3):737-738.
[5]Johnson AE,Pollard TJ,Shen L,et al.MIMIC-Ⅲ,a freely accessible critical care database[J].Sci Data,2016,24(3):160035.
[6]Neamatullah I,Douglass MM,Lehman LW,et al.Automated de-identifification of free-text medical records[J].BMC Med Inform Decis Mak,2015,8(2):1-32.
[7]Johnson AEW,Pollard TJ,Shen L,et al.MIMIC-,a freely accessible critical care database[J].Scientific Data,2016,3(4):160035.
[8]Burisch J,Cukovic-Cavka S,Kaimakliotis I,et al.Construction and validation of a web-based epidemiological database for inflammatory bowel diseases in Europe An EpiCom study[J].J Crohns Colitis,2017,5(4):342-349.
[9]Zhen Y,CardioTF.A database of deconstructing transcriptional circuits in the heart system[J].Peer J,2016(4):e2339.
[10]van der Linde D,Konings EE,Slager MA,et al.Birth prevalence of congenital heart disease worldwide:a systematic review and meta-analysis[J].J Am Coll Cardiol,2011,58(21):2241-2247.
[11]Celermajer DS,Chow CK,Marijon E,et al.Cardiovascular disease in the developing world: prevalences,patterns,and the potential of early disease detection[J].J Am Coll Cardiol,2015,60(14):1207-1216.
[12]McCulley DJ,Black BL.Transcription factor pathways and congenital heart disease[J].Curr Top Dev Biol,2015,100(7):253-277.
[13]Smith JG,Newton-Cheh C.Genome-wide association studies of late-onset cardiovascular disease[J].J Mol Cell Cardiol,2015,83(3):131-141.
[14]Evans SM,Yelon D,Conlon FL,et al.Myocardial lineage development[J].Circ Res,2010,107(12):1428-1444.
[15]He A,Kong SW,Ma Q,et al.Co-occupancy by multiple cardiac transcription factors identififies transcriptional enhancers active in heart[J].Proc Natl Acad Sci U S A,2017,108(14):5632-5637.
[16]Schlesinger J,Schueler M,Grunert M,et al.The cardiac transcription network modulated by Gata4,Mef2a,Nkx2.5,Srf,histone modififications,and microRNAs[J].PLoS Genet,2011,7(2):e1001313.
[17]Wamstad JA,Alexander JM,Truty RM,et al.Dynamic and coordinated epigenetic regulation of developmental transitions in the cardiac lineage[J].Cell,2012,151(1):206-220.
[18]Wamstad JA,Wang X,Demuren OO,et al.Distal enhancers:new insights into heart development and disease[J].Trends in Cell Biology,2014,24(5):294-302.
[19]Takasaki M,Momosaki R,Wakabayashi H,et al.Construction and Quality Evaluation of? the Japanese Rehabilitation Nutrition Database[J].J Nutr Sci Vitaminol(Tokyo),2018,64(4):251-257.
[20]Hada T,Momosaki R,Abo M.Impact of orthotic therapy for improving activities of daily living in individuals with spinal cord injury:a retrospective cohort Study[J].Spinal Cord,2018,56(8):790-795.
[21]Sawaguchi A,Momosaki R,Hasebe K,et al.Effectiveness of preoperative physical therapy for older patients with hip fracture[J].Geriatr Gerontol Int,2018,18(7):1003-1008.
[22]Kinoshita S,Momosaki R,Kakuda W,et al.Association between 7 days per week reha bilitation and functional recovery of patients with Acute stroke:a retrospective cohort study based on the Japan Rehabilitation Database[J].Arch Phys Med Rehabil,2017,98(4):701-706.
[23]Momosaki R,Kakuda W,Yamada N,et al.Impact of board-certificated physiatrists on rehabilitation outcomes in elderly patients after hip fracture:An observational study using the Japan Rehabilitation Database[J].Geriatr Gerontol Int,2016,16(8):963-968.
[24]Momosaki R,Abo M,Watanabe S,et al.Effects of ankle-foot orthoses on functional recovery after stroke:a propensity score analysis based on Japan Rehabilitation Database[J].PLoS One,2015,10(4):e0122688.
[25]Kinoshita S,Kakuda W,Momosaki R,et al.Clinical management provided by board-certificated physiatrists in early rehabilitation is a significant determinant of functional improvement in acute stroke patients:a retrospective analysis of Japan rehabilitation database[J].J Stroke Cerebrovasc Dis,2015,24(5):1019-1024.
[26]Harris PA,Taylor R,Thielke R,et al.Research electronic data capture(REDCap)-a metadata-driven methodology and workflow process for providing translational research informatics support[J].J Biomed Inform,2009,42(2):377-381.
[27]焦玉清,王堅(jiān)剛,張海波,等.心臟外科術(shù)后隨訪數(shù)據(jù)庫的建立及完善[J].中國醫(yī)院管理,2015,35(3):53-55.
[28]趙宇卓,王俊梅,潘菲,等.急救數(shù)據(jù)庫建設(shè)初探[J].中華危重病急救醫(yī)學(xué),2018,30(6):609-612.
收稿日期:2020-07-21;修回日期:2020-08-09
編輯/宋偉
基金項(xiàng)目:1.國家自然科學(xué)基金(編號(hào):81460073、82060299);2.云南省科技廳-昆明醫(yī)科大學(xué)應(yīng)用基礎(chǔ)研究聯(lián)合專項(xiàng)[編號(hào):2014FB089,2019FE001(-120)];3.云南省教育廳科學(xué)研究基金(編號(hào):2015Z051);4.中國博士后科學(xué)基金(編號(hào):2015M582764XB);5.成都醫(yī)學(xué)院2015年度科研項(xiàng)目(編號(hào):CYZ15-18);6.云南省醫(yī)學(xué)后備人才(編號(hào):H-201607);7.云南省萬人計(jì)劃青年拔尖人才(編號(hào):Y-q201932);8.云南省專業(yè)學(xué)位研究生教學(xué)案例庫建設(shè)項(xiàng)目(編號(hào):YJS-SJ-02);9.云南省高層次衛(wèi)生健康技術(shù)人才培養(yǎng)專項(xiàng)經(jīng)費(fèi)資助(編號(hào):D-2019020)
作者簡介:李敏(1992.5-),男,湖北黃岡人,碩士,住院醫(yī)師,主要從事醫(yī)學(xué)信息分析研究
通訊作者:賀繼剛(1980.3-),男,云南昆明人,博士,副主任醫(yī)師,主要從事醫(yī)學(xué)信息分析研究