袁駿毅,湯欽華,馬群圣
上海交通大學附屬胸科醫(yī)院 信息中心,上海 200030
隨著精準醫(yī)療以及智慧醫(yī)院的深入,醫(yī)院信息化的重點需要更精細化地聚焦在專病與亞專業(yè)的科研與決策方面。醫(yī)學上專病的研究往往伴隨著大量的患者信息,以及貫穿整個診療活動的醫(yī)學檢查和影像學資料等,在每個專病領域中又各有特殊的要求。目前,國內用于特定專病研究的數據庫正處于蓬勃建設階段,金濤等[1]通過研究歸納國內專病數據庫的建設情況發(fā)現(xiàn),雖然包括運動障礙、前列腺癌等專病數據庫建設取得了較好的效果,但是數據庫中主要是患者病史,結構化程度不高,手術數據等仍有待完善。Barnes等[2]和Khan等[3]通過對特定專病的研究認為,專科病例數據庫可以促進疾病的健康教育、治療與隨訪的效果。胸腺瘤作為前上縱隔原發(fā)性腫瘤,病理類型復雜,臨床醫(yī)生往往由于輔助專業(yè)知識限制因而認識有限[4]。因此,研究胸腺瘤專病數據庫的建設對于臨床工作的有效展開具有重要的現(xiàn)實意義。
上海市胸科醫(yī)院為三級甲等??漆t(yī)院,在胸外科疾病診治方面具有明顯的學科優(yōu)勢與專業(yè)特色。本文以胸科醫(yī)院為背景,通過在電子病歷系統(tǒng)中新增病種模板,進行數據庫需求分析和整體架構構建,設立數據質量評估指標體系,建設基于結構化電子病歷的胸腺瘤專病數據庫,為此類專病的診療質量、臨床方案與醫(yī)療決策提供數據和技術上的支持。
建立胸腺瘤專病數據庫的前提,在于能夠從專病病歷中采集到有效的數據。因此,需要通過細化醫(yī)生的輸入模式,對病種的關鍵病歷內容進行分析與處理,進而在電子病歷系統(tǒng)中設立專病結構化模板[5-8]。專病模板的結構化是較為復雜的工作,既要考慮結構化后錄入的方便,又要兼顧數據元顆粒度的大小,足以支撐病歷檢索和分析[6-10]。在數據庫需求分析階段,采用了現(xiàn)場扎根訪談的形式,根據目的性采樣的原則,與胸外科共計4位醫(yī)生進行需求調研(2位副主任醫(yī)師、2位主治醫(yī)師)。調研結果表明:醫(yī)院現(xiàn)有的電子病歷雖然已經實現(xiàn)部分結構化,包括入院記錄、首次病程錄、手術記錄、出院小結等15種病歷文書。但是已有的病歷文書強調描述性信息,缺乏針對專病管理需求而制定的關鍵指標,無法后續(xù)進行病種數據的采集與挖掘。經過分析討論,最終確定的胸腺瘤結構化專病模板包括患者信息、診斷、檢查及檢驗、手術情況(如Osserman分期、腫瘤情況)、術后情況、病理報告等內容,共計689個結構化指標項。例如,結構化后的胸腺瘤手術記錄模板見圖1。
圖1 胸腺瘤結構化手術記錄模板
胸腺瘤專病數據庫依托于臨床數據中心(Clinical Data Repository,CDR)進行建設,以專病患者為研究對象,將此類疾病的入院診斷與出院診斷編碼(ICD10碼:D38.401、C37.X00等)進行標簽,獨立于其他類疾病,最終實現(xiàn)以患者身份證為主索引,建立完整的診療過程中產生的數據記錄。數據來源范圍涵蓋了醫(yī)院信息系統(tǒng)(Hospital Information System,HIS)、電子病歷(Electronic Medical Record,EMR)系統(tǒng)、醫(yī)囑系統(tǒng)、檢查檢驗系統(tǒng)、病理系統(tǒng)等。實現(xiàn)對胸腺瘤專病數據多層次多角度的分析,為臨床診斷提供數據支撐,系統(tǒng)架構見圖2。
圖2 系統(tǒng)架構
由于專病數據庫存儲方案高度依賴于所需解決病歷的信息表示模型,傳統(tǒng)的關系數據庫事先雖可明確定義屬性和關系,但無法描述復雜的數據類型。因此,胸腺瘤專病數據庫基于XML技術進行存儲,采用了SQLSERVER的R2版本。R2版本是一種基于標準病歷數據描述的語言,可以滿足臨床診療過程中如主訴等直訴性內容的記錄,同時也支持SNOMED等醫(yī)學標準術集的結構化嵌入,在結構化與文本化之間達到靈活控制。為了在復雜的醫(yī)療信息環(huán)境中具備良好的適應性,數據庫不僅開放標準的XML數據訪問方式,同時臨床文檔以XML Schema的URL形式注冊在數據庫中,提供以文件目錄展現(xiàn)的虛擬文件,避免調閱方花費精力進行二次解析,快速實現(xiàn)多種格式類型的文檔查看。
數據中心CDR采用數據庫復制技術從生產庫上實時發(fā)布訂閱,然后采用ETL技術把數據抽取入庫,在抽取過程中對臨床數據進行相應的清洗和轉換工作,胸腺瘤專病數據庫則定時從CDR按設定的病種標簽規(guī)則同步更新數據。專病數據庫存在大量與其他系統(tǒng)的集成,其他臨床系統(tǒng)支持直接調用專病數據服務接口,調用方式通過面向服務的架構進行分布式的部署及應用。在與科教平臺、數據分析平臺等系統(tǒng)對接時,方便醫(yī)院在臨床業(yè)務系統(tǒng)中調閱胸腺瘤專病數據的相關服務[11-14]。
定期對專病數據庫進行數據完整性與準確性方面的檢查非常重要。因此,結合胸腺瘤專病的實際特點,經過與醫(yī)務管理部門多次討論,從數據的采集量、數據的多態(tài)性、數據綜合質量及系統(tǒng)建設質量等四個方面來設立數據庫質量評估體系,為日常巡檢數據收集的可用性制定了判斷的依據。如表1所示。
表1 胸腺瘤專病數據庫建設的質量評估體系
目前醫(yī)院已完成了胸腺瘤結構化專病數據庫的建設,實現(xiàn)了患者數據的集成。正式投入使用后,共收集了394例胸腺瘤患者的診療數據,這些數據全部轉化為可供查詢分析的結構化數據。目前數據庫的數據量約為45萬條記錄、21兆容量(不含影像資料)。隨著醫(yī)院的業(yè)務增長與數字化更精細化,經統(tǒng)計對比,每年收錄的數據量約有10%的復合增長率,滿足了臨床醫(yī)生快速及準確的獲得患者信息資源的需求。
專病數據庫對臨床提供統(tǒng)一的檢索服務,實現(xiàn)了常規(guī)的文字搜索和高級特定范圍搜索。常規(guī)搜索功能類似百度之類的搜索,提供搜索詞聯(lián)想功能、分詞功能、同義詞以及在結果中檢索等功能,檢索結果中關鍵字以高亮的形式顯示。改變了醫(yī)生以往需要在多個業(yè)務系統(tǒng)進行調閱的不便之處,支持更快速地定位到符合研究要求的患者,將患者歷次就診以結構化數據的明細結果導出,便于對數據進一步綜合分析和使用。數據庫應用效果圖,見圖3。
圖3 數據庫應用效果圖
胸腺瘤數據庫的價值不僅在于數據本身,更在于充分利用數據進行回顧性分析所產生的價值。專病數據庫的建設是一個持續(xù)的過程,隨著醫(yī)院信息化建設的不斷完善,專病數據庫中接入的數據將越來越全面。醫(yī)院通過胸腺瘤數據庫中建立的6個數據分析模型,在此基礎上臨床醫(yī)生完成了4個科研隨訪項目的研究,取得了一定的成效,對于醫(yī)院在病種數據庫的建設上起到了以點到面的示范性作用[15-16]??梢灶A見的是,隨著各個醫(yī)院單病種專病數據庫的完善,有利于推動未來的區(qū)域內醫(yī)聯(lián)體構建更大型的、整合多家醫(yī)療機構的多中心專病數據庫,在病種數據的標準化以及跨院數據綜合利用上起到支撐作用,進一步促進醫(yī)務人員更好地分析胸腺瘤疾病的發(fā)展趨勢,完善臨床治療方案,為患者提供更加優(yōu)質的服務。