李子孝,劉翔宇,朱皞罡,王孟,楊昕,王春娟,姜勇,林琳,王韜,趙性泉1,,王擁軍1,(*第一作者)
作者單位
1100070 北京首都醫(yī)科大學(xué)附屬北京天壇醫(yī)院神經(jīng)病學(xué)中心2國(guó)家神經(jīng)系統(tǒng)疾病臨床醫(yī)學(xué)研究中心
3國(guó)家神經(jīng)系統(tǒng)疾病醫(yī)療質(zhì)量控制中心
4北京航空航天大學(xué)生物與醫(yī)學(xué)工程學(xué)院
5軟件開發(fā)環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室
6北京大數(shù)據(jù)精準(zhǔn)醫(yī)療高精尖創(chuàng)新中心(北京航空航天大學(xué)&首都醫(yī)科大學(xué))
7首都醫(yī)科大學(xué)附屬北京天壇醫(yī)院信息中心
健康醫(yī)療大數(shù)據(jù)作為我國(guó)國(guó)家戰(zhàn)略資源,助力《“健康中國(guó)2030”規(guī)劃綱要》和人工智能發(fā)展戰(zhàn)略的實(shí)施[1]。來自醫(yī)院信息系統(tǒng)的數(shù)據(jù),如電子病歷、檢驗(yàn)報(bào)告、影像資源、醫(yī)囑和病案首頁(yè)成為健康醫(yī)療大數(shù)據(jù)主要來源之一[2],應(yīng)用于醫(yī)療質(zhì)量過程評(píng)價(jià)的數(shù)據(jù)來源[3]。如何實(shí)現(xiàn)醫(yī)院間的數(shù)據(jù)可信、安全和持續(xù)的互聯(lián)互通是開展基于數(shù)據(jù)決策的醫(yī)療質(zhì)量評(píng)價(jià)和改進(jìn)的基礎(chǔ)。
醫(yī)療質(zhì)量評(píng)價(jià)和改進(jìn)是提高缺血性卒中醫(yī)療服務(wù)質(zhì)量和降低患者卒中復(fù)發(fā)的有效途徑之一[4-5]。持續(xù)地獲得患者診療過程數(shù)據(jù)是開展醫(yī)療質(zhì)量評(píng)價(jià)和改進(jìn)的基石[6]?;谌斯ざ武浫氲淖渲性\療過程醫(yī)療質(zhì)量數(shù)據(jù)采集和上報(bào)是目前國(guó)內(nèi)外常用的數(shù)據(jù)采集模式[7-8]。然而,這種數(shù)據(jù)采集模式存在數(shù)據(jù)質(zhì)量準(zhǔn)確性、連續(xù)性、人工成本、時(shí)效性等問題,以及參與醫(yī)院對(duì)數(shù)據(jù)安全性和分享性的疑慮,制約對(duì)醫(yī)療數(shù)據(jù)溯源性、可持續(xù)、及時(shí)性、可及性的缺血性卒中醫(yī)療質(zhì)量評(píng)價(jià)和改進(jìn)[9]。基于電子病歷、實(shí)驗(yàn)室檢測(cè)、影像報(bào)告和醫(yī)囑等醫(yī)院信息系統(tǒng)的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化和匯交并形成醫(yī)院診療數(shù)據(jù)庫(kù)成為開展缺血性卒中醫(yī)療質(zhì)量過程評(píng)價(jià)的新的數(shù)據(jù)來源[3]。但是為了確保信息安全,傳統(tǒng)的數(shù)據(jù)庫(kù)形成以醫(yī)院、科室,甚至是設(shè)備為單位的“信息孤島”[10],這種傳統(tǒng)的數(shù)據(jù)中心化聚合分析思路制約多中心遠(yuǎn)程調(diào)用計(jì)算和評(píng)價(jià),成為阻礙醫(yī)療大數(shù)據(jù)、人工智能等新興技術(shù)應(yīng)用于醫(yī)療質(zhì)量評(píng)價(jià)和改進(jìn)的重要因素之一[11]。
基于智能合約區(qū)塊鏈的醫(yī)院信息系統(tǒng)數(shù)據(jù)平臺(tái)建設(shè)已逐步在國(guó)內(nèi)開展[12-13]。區(qū)塊鏈(block chain)采用分布式的數(shù)據(jù)存儲(chǔ)、點(diǎn)對(duì)點(diǎn)傳輸、共識(shí)機(jī)制、加密算法等計(jì)算機(jī)技術(shù),實(shí)現(xiàn)去中心化的分布式結(jié)構(gòu)的醫(yī)療數(shù)據(jù)共享,為數(shù)據(jù)存儲(chǔ)傳輸、溯源性、安全性等提供了良好的解決方案。在醫(yī)院間,實(shí)現(xiàn)去中心化并最終形成統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)分中心,為進(jìn)一步醫(yī)療數(shù)據(jù)分析和開展人工智能應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ)[14]。
本文介紹了探索采用“模型投放”,即算法流替代數(shù)據(jù)傳輸?shù)乃枷耄詤^(qū)塊鏈[15]和智能合約[16]技術(shù)為依托,整合安全沙箱[17]、密碼學(xué)、摘要生成等關(guān)鍵技術(shù),開展基于醫(yī)院信息系統(tǒng)數(shù)據(jù)的缺血性卒中醫(yī)療質(zhì)量過程指標(biāo)評(píng)價(jià)體系。
1.1 基于區(qū)塊鏈的技術(shù)模型和架構(gòu) 缺血性卒中醫(yī)療質(zhì)量評(píng)價(jià)應(yīng)用基于區(qū)塊鏈及相關(guān)技術(shù),構(gòu)建醫(yī)療指標(biāo)評(píng)價(jià)共享的實(shí)施方案,完成相關(guān)的信息交換指標(biāo)。該場(chǎng)景中的研究對(duì)象主要有3類:①醫(yī)院:選擇前期已完成缺血性卒中醫(yī)療信息系統(tǒng)相關(guān)數(shù)據(jù)結(jié)構(gòu)化的醫(yī)院。②患者:采用ICD-10編碼確定的主診斷為缺血性卒中患者(I63)。③缺血性卒中醫(yī)療質(zhì)量控制指標(biāo):采用國(guó)家衛(wèi)生健康委頒布的缺血性卒中醫(yī)療質(zhì)量控制指標(biāo)中用藥相關(guān)指標(biāo)。
缺血性卒中醫(yī)療質(zhì)量評(píng)價(jià)整體應(yīng)用場(chǎng)景分為敏感域和公共域兩個(gè)部分。敏感域?qū)儆诟麽t(yī)院自有和相互隔離,內(nèi)部存放用于進(jìn)行缺血性卒中醫(yī)療質(zhì)量指標(biāo)評(píng)價(jià)的基礎(chǔ)醫(yī)療信息,禁止外部網(wǎng)絡(luò)訪問個(gè)案數(shù)據(jù)。公共域作為開放環(huán)境,負(fù)責(zé)提供用于進(jìn)行缺血性卒中醫(yī)療質(zhì)量指標(biāo)評(píng)價(jià)的數(shù)據(jù)分析算法,可對(duì)算法進(jìn)行迭代更新。算法以“算法流”方式進(jìn)行投放,隨用隨取。
技術(shù)架構(gòu)采用軟硬件混合搭建,主要硬件以“數(shù)據(jù)網(wǎng)關(guān)”作為前置機(jī);軟件則以區(qū)塊鏈、智能合約以及安全沙箱等技術(shù)為基礎(chǔ)進(jìn)行開發(fā)。架構(gòu)分為基礎(chǔ)層、管理層和操作層三層(圖1)?;A(chǔ)層為嵌入式操作系統(tǒng),提供基礎(chǔ)的硬件接口訪問能力;管理層以Docker沙箱技術(shù)[18]為藍(lán)本,針對(duì)沙箱的創(chuàng)建、管理、維護(hù)、清除等生命周期管理以及數(shù)據(jù)安全擦寫等功能進(jìn)行了針對(duì)性的補(bǔ)充和增強(qiáng);操作層則在沙箱內(nèi)部提供對(duì)算法的基礎(chǔ)環(huán)境支持。
1.1.1 執(zhí)行方法 在已完成缺血性卒中醫(yī)療質(zhì)量數(shù)據(jù)結(jié)構(gòu)化的醫(yī)院部署數(shù)據(jù)網(wǎng)關(guān),完成“敏感域-公開域”隔離帶的搭建。執(zhí)行過程中,智能合約依據(jù)各醫(yī)院審閱授權(quán),并記錄在區(qū)塊鏈上的操作主體,負(fù)責(zé)整體控制;數(shù)據(jù)網(wǎng)關(guān)中的安全沙箱作為授權(quán)執(zhí)行機(jī)構(gòu),具體協(xié)調(diào)算法流、數(shù)據(jù)流,并輸出分析結(jié)果和運(yùn)行日志。
在具體執(zhí)行時(shí),用于評(píng)價(jià)缺血性卒中醫(yī)療質(zhì)量的智能合約根據(jù)實(shí)際操作醫(yī)院的情況,在數(shù)據(jù)網(wǎng)關(guān)生成安全沙箱,并將算法流從公共域引入。此后,可能包含敏感信息的患者數(shù)據(jù)(如患者隱私信息、人口學(xué)特征等)以加密方式通過私有域進(jìn)入安全沙箱。在沙箱內(nèi)部,數(shù)據(jù)完成解密后,算法完成數(shù)據(jù)分析并輸出結(jié)果,反饋給預(yù)先指定的用戶。并將操作流程記錄在區(qū)塊鏈上。沙箱管理系統(tǒng)在捕獲完成信號(hào)后,對(duì)沙箱進(jìn)行銷毀,保障敏感數(shù)據(jù)安全無(wú)泄露,整個(gè)流程如圖2。
圖1 區(qū)塊鏈系統(tǒng)架構(gòu)
圖2 區(qū)塊鏈系統(tǒng)中數(shù)據(jù)和算法的流程
1.1.2 關(guān)鍵技術(shù)
(1)敏感數(shù)據(jù)的跟蹤保護(hù)
從需求產(chǎn)生并準(zhǔn)備執(zhí)行開始,區(qū)塊鏈系統(tǒng)對(duì)數(shù)據(jù)調(diào)取、算法分析、結(jié)果輸出、沙箱銷毀等全部操作進(jìn)行共識(shí)和記錄,其不可篡改的特點(diǎn)保障數(shù)據(jù)的安全,同時(shí)也記錄了數(shù)據(jù)與結(jié)論之間的關(guān)聯(lián)關(guān)系。采用了基于微實(shí)數(shù)并行排序思想的微誤差共識(shí)協(xié)議(?-differential agreement,EDA)[19]。通過搶占式排序和并發(fā)共識(shí),以提供適合業(yè)務(wù)場(chǎng)景的系統(tǒng)性能。
(2)基于智能合約的算法調(diào)用機(jī)制
區(qū)塊鏈系統(tǒng)在完成數(shù)據(jù)跟蹤保護(hù)的同時(shí),對(duì)醫(yī)療質(zhì)量評(píng)價(jià)算法的調(diào)用情況進(jìn)行記錄,以統(tǒng)計(jì)算法運(yùn)行效率、準(zhǔn)確率等參數(shù)。采用智能合約技術(shù)對(duì)算法進(jìn)行整合,使每一個(gè)算法成為一個(gè)獨(dú)立的智能合約,通過調(diào)用智能合約,獲得算法的運(yùn)行權(quán)限,并將算法流投入安全沙箱,對(duì)沙箱內(nèi)的數(shù)據(jù)進(jìn)行分析。智能合約的每次調(diào)用和運(yùn)行記錄同樣會(huì)被區(qū)塊鏈系統(tǒng)記錄,并與安全沙箱的輸出日志一一對(duì)應(yīng)。
(3)基于元數(shù)據(jù)鏈的跨中心檢索機(jī)制
采用目錄鏈共享檢索機(jī)制,應(yīng)用摘要生成算法,將醫(yī)療信息非敏感的元標(biāo)簽存放于公開的元數(shù)據(jù)鏈上。采用基于局部敏感哈希[20]的特征檢索系統(tǒng),生成特征區(qū)域的局部敏感哈希字符串并建立映射關(guān)系。因?yàn)楣V蹬c原始數(shù)據(jù)為單向映射,可以實(shí)現(xiàn)保護(hù)原始數(shù)據(jù)的同時(shí),完成數(shù)據(jù)的“以圖檢圖”。通過特征檢索,找到目標(biāo)數(shù)據(jù)后,調(diào)用預(yù)先簽署的智能合約或采用文件交換途徑,向醫(yī)院的數(shù)據(jù)庫(kù)借取對(duì)應(yīng)的資料,并完成統(tǒng)計(jì)分析。
1.2 形式化語(yǔ)言和工作流建模工具 眾多的研究表明臨床指南和臨床決策路徑可以被計(jì)算機(jī)程序解釋執(zhí)行[21]。其中有代表性的工作流建模語(yǔ)言和工具會(huì)嵌入邏輯規(guī)則來表示任務(wù)的結(jié)構(gòu),如計(jì)劃、決策和動(dòng)作。這些任務(wù)組成面向時(shí)間的流程來代表臨床決策路徑和指南,例如Asbru、EON、GLIF、GUIDE、PRODIGY與PROforma[22]。
本文提出一種去中心化的工作流建模語(yǔ)言和引擎工具,該工具通過認(rèn)知計(jì)算模型引入工作流建模過程,使用認(rèn)知分析出的本體及其關(guān)聯(lián)規(guī)則并封裝成要素構(gòu)件,以構(gòu)件拖拽方式實(shí)現(xiàn)工作流的可視化設(shè)計(jì),創(chuàng)建后的工作流程可以在區(qū)塊鏈上運(yùn)行。此工作流建模語(yǔ)言和引擎工具可以替代以代碼形式建立的智能合約,用于構(gòu)建并部署一系列決策支持系統(tǒng)、指南和其他臨床應(yīng)用程序。
通過工作流引擎,可以將臨床指南和醫(yī)療準(zhǔn)則建模為任務(wù)和數(shù)據(jù)項(xiàng)的組合。其中任務(wù)模型分為4類:“動(dòng)作”表示需要在外部環(huán)境中執(zhí)行的過程,“查詢”是指需要從外部系統(tǒng)獲取信息和讀取數(shù)據(jù)過程,“決策”是必須做出選擇的過程,“計(jì)劃”是按照規(guī)則和分類組合在一起的任務(wù)集合。工作流引擎形式化過程可以用有向圖來表示,其中節(jié)點(diǎn)表示任務(wù),連線表示調(diào)度關(guān)系?!皠?dòng)作”被表示為正方形,“查詢”被表示為菱形,“決策”被表示為圓形,“計(jì)劃”被表示為平行四邊形。模型本身包含一個(gè)根計(jì)劃,根計(jì)劃可以遞歸地劃分為子計(jì)劃(圖3)。
圖3展示了工作流引擎的技術(shù)架構(gòu)圖。Web應(yīng)用端是工作流創(chuàng)建的編輯器、狀態(tài)跟蹤器和查詢器,提供工作流設(shè)計(jì)、創(chuàng)建、狀態(tài)監(jiān)視、校驗(yàn)、查詢功能。在應(yīng)用端界面存儲(chǔ)了工作流的任務(wù)基礎(chǔ)模塊:“動(dòng)作”“查詢”“決策”和“計(jì)劃”。通過拖拽任務(wù)模塊和組合資源庫(kù)模板庫(kù),可以定義出新的資源庫(kù)模塊以及更復(fù)雜的工作流程序。資源庫(kù)以本體資源庫(kù)、合約模板庫(kù)、語(yǔ)法語(yǔ)義庫(kù)為基礎(chǔ),支持上層可視化合約的構(gòu)建。服務(wù)與組件主要有兩個(gè)部分,一是合約虛擬機(jī)(smart contract virtual machine,SCVM),負(fù)責(zé)測(cè)試和執(zhí)行構(gòu)建的合約,二是服務(wù)模塊,完成工作流、資源定位、遠(yuǎn)程調(diào)用等服務(wù)。存儲(chǔ)與查詢應(yīng)用程序接口(application programming interface,API),以標(biāo)準(zhǔn)化API的方式對(duì)合約的執(zhí)行過程及結(jié)果進(jìn)行存取。持久化存儲(chǔ)與索引,以區(qū)塊鏈的方式進(jìn)行存儲(chǔ),建立資源和合約的索引,便于存取。
圖4演示了一個(gè)通過工作流引擎創(chuàng)建的智能合約。從開始節(jié)點(diǎn)開始執(zhí)行后面接兩個(gè)“計(jì)劃”——分別通過沙箱提取“抗血小板藥物治療率分子統(tǒng)計(jì)”和“抗血小板藥物治療率單項(xiàng)藥物統(tǒng)計(jì)”數(shù)據(jù),然后連接一個(gè)決策——“抗血小板藥物治療醫(yī)療質(zhì)量指標(biāo)算法1”,用來評(píng)估缺血性卒中患者抗血小板藥物治療率,從而明確需要改進(jìn)的指標(biāo)。最后,沙箱在通過數(shù)據(jù)網(wǎng)管輸出計(jì)算結(jié)果后,完成自銷毀。
圖5 基于醫(yī)院信息系統(tǒng)的缺血性卒中醫(yī)療質(zhì)量評(píng)價(jià)平臺(tái)
2.1 系統(tǒng)運(yùn)行結(jié)果 采用上述思路和方法,搭建了基于醫(yī)院信息系統(tǒng)的缺血性卒中醫(yī)療質(zhì)量評(píng)價(jià)平臺(tái)(圖5),選擇三家已完成缺血性卒中醫(yī)療質(zhì)量數(shù)據(jù)結(jié)構(gòu)化的試點(diǎn)醫(yī)院的數(shù)據(jù)庫(kù)參與醫(yī)療質(zhì)量評(píng)估工作。通過合約創(chuàng)建工具,研究人員在系統(tǒng)中以圖形化流程的方式創(chuàng)建、校驗(yàn)和發(fā)布智能合約。
用戶通過調(diào)用相應(yīng)的智能合約,自動(dòng)對(duì)醫(yī)院的數(shù)據(jù)進(jìn)行分析評(píng)估,并生成分析結(jié)果。在驗(yàn)證中,系統(tǒng)對(duì)各參與醫(yī)院的病案記錄、檢驗(yàn)信息和醫(yī)囑信息等數(shù)據(jù)進(jìn)行分析,完成缺血性卒中住院日、費(fèi)用、死亡率等效率、負(fù)擔(dān)、結(jié)局指標(biāo)的測(cè)算。分析過程中,智能合約通過調(diào)用外部測(cè)算方法,對(duì)院內(nèi)醫(yī)療信息摘要進(jìn)行檢索,并對(duì)需要分析的內(nèi)容進(jìn)行提取。整個(gè)過程中,全部計(jì)算發(fā)生在數(shù)據(jù)網(wǎng)關(guān)根據(jù)智能合約創(chuàng)建安全沙箱中。分析結(jié)束后,沙箱對(duì)醫(yī)院輸出分析結(jié)果,并完成自我銷毀,受保護(hù)的醫(yī)療數(shù)據(jù)未離開醫(yī)院私有域,安全性得到了有效驗(yàn)證。
系統(tǒng)在三家醫(yī)療機(jī)構(gòu)的數(shù)據(jù)中完成初步驗(yàn)證,并獲得了良好的系統(tǒng)性能(表1),區(qū)塊鏈秒平均寫入通量達(dá)到9000條記錄,特征檢索時(shí)間不高于10 ms,能夠在多中心協(xié)作和敏感信息受控場(chǎng)景中,開展缺血性卒中醫(yī)療質(zhì)量藥物相關(guān)過程指標(biāo)評(píng)價(jià),具體結(jié)果見表2。
表2 缺血性卒中醫(yī)療質(zhì)量過程指標(biāo)評(píng)價(jià)
2.2 系統(tǒng)測(cè)試結(jié)果
(1)沙箱測(cè)試結(jié)果
功能性:實(shí)現(xiàn)沙箱創(chuàng)建、沙箱銷毀、沙箱單次執(zhí)行、沙箱多請(qǐng)求執(zhí)行、沙箱超時(shí)控制、沙箱數(shù)量控制、沙箱內(nèi)禁止訪問外網(wǎng)域名控制、沙箱內(nèi)禁止訪問外網(wǎng)IP加端口控制、沙箱內(nèi)存監(jiān)控、沙箱內(nèi)禁止文件寫入磁盤和沙箱中禁用linux系統(tǒng)中/usr/sbin下相關(guān)指令等功能。
性能效率:支持沙箱單次執(zhí)行,超時(shí)設(shè)置為9 s、算法延時(shí)設(shè)置為5 s時(shí),沙箱支持合約算法執(zhí)行完成運(yùn)行時(shí)間為5.146 s;支持沙箱多請(qǐng)求執(zhí)行,超時(shí)設(shè)置為29 s,在沙箱數(shù)為3,隊(duì)列數(shù)為3的情況下,共執(zhí)行727次算法合約,沙箱支持合約執(zhí)行完成的平均運(yùn)行時(shí)間為16.603 s。
(2)合約測(cè)試結(jié)果
在單用戶場(chǎng)景下,數(shù)據(jù)目錄寫入事務(wù)平均響應(yīng)時(shí)間為1.58 s,查看事務(wù)平均響應(yīng)時(shí)間為0.08 s,提交事務(wù)平均響應(yīng)時(shí)間為1.59 s;在10 654條分布式數(shù)據(jù)中進(jìn)行數(shù)據(jù)目錄查詢,事務(wù)平均響應(yīng)時(shí)間為0.13 s;進(jìn)行數(shù)據(jù)目錄詳情查看,事務(wù)平均響應(yīng)時(shí)間為0.11 s;提交數(shù)據(jù)庫(kù)事務(wù)平均響應(yīng)時(shí)間為1.30 s;加載全部庫(kù)目錄事務(wù)平均響應(yīng)時(shí)間為0.07 s;進(jìn)行庫(kù)目錄詳情查看事務(wù)平均響應(yīng)時(shí)間為0.73 s;提交表目錄事務(wù)平均響應(yīng)時(shí)間為0.99 s;在10 703條數(shù)據(jù)中進(jìn)行表目錄查詢事務(wù)平均響應(yīng)時(shí)間為0.15 s;表目錄詳情查看事務(wù)平均響應(yīng)時(shí)間為0.11 s;在遠(yuǎn)程源數(shù)據(jù)庫(kù)中對(duì)己上鏈的庫(kù)表字段進(jìn)行修改,操作結(jié)果同步到系統(tǒng)中時(shí)延為10 s;在遠(yuǎn)程源數(shù)據(jù)庫(kù)中對(duì)已上鏈的庫(kù)表字段進(jìn)行刪除,操作結(jié)果同步到系統(tǒng)中時(shí)延為10 s;在遠(yuǎn)程源數(shù)據(jù)庫(kù)中對(duì)已上鏈的庫(kù)表字段進(jìn)行新增,操作結(jié)果同步到系統(tǒng)中時(shí)延為5 s;通過可視化方式創(chuàng)建不帶算法的數(shù)據(jù)合約,事務(wù)平均響應(yīng)時(shí)間為0.72 s;通過本地上傳方式創(chuàng)建不帶算法的數(shù)據(jù)合約,事務(wù)平均響應(yīng)時(shí)間為0.29 s。
10個(gè)用戶并發(fā)場(chǎng)景:調(diào)用數(shù)據(jù)目錄上鏈接口,事務(wù)平均響應(yīng)時(shí)間為0.17 s;調(diào)用庫(kù)目錄上鏈接口,事務(wù)平均響應(yīng)時(shí)間為0.36 s;調(diào)用表目錄上鏈接口,事務(wù)平均響應(yīng)時(shí)間為0.17 s;可視化創(chuàng)建合約接口,創(chuàng)建不帶算法的數(shù)據(jù)合約,事務(wù)平均響應(yīng)時(shí)間為1.41 s;本地上傳創(chuàng)建接口,創(chuàng)建不帶算法的數(shù)據(jù)合約,事務(wù)平均響應(yīng)時(shí)間為0.83 s;帶數(shù)組去重算法的數(shù)據(jù)合約執(zhí)行接口,事務(wù)平均響應(yīng)時(shí)間為0.68 s。
20個(gè)用戶并發(fā)場(chǎng)景:調(diào)用查看職責(zé)目錄詳情接口,事務(wù)平均響應(yīng)時(shí)間為0.06 s;調(diào)用數(shù)據(jù)目錄查詢接口,在10 654條數(shù)據(jù)中進(jìn)行數(shù)據(jù)目錄查詢,事務(wù)平均響應(yīng)時(shí)間為0.18 s;調(diào)用查看數(shù)據(jù)目錄詳情接口,事務(wù)平均響應(yīng)時(shí)間為0.07 s;調(diào)用庫(kù)目錄查詢接口,返回全部庫(kù)目錄數(shù)據(jù),事務(wù)平均響應(yīng)時(shí)間為0.08 s;調(diào)用查看庫(kù)目錄詳情接口,事務(wù)平均響應(yīng)時(shí)間為0.08 s;調(diào)用查詢表目錄接口,在10 703條數(shù)據(jù)中進(jìn)行表目錄查詢,事務(wù)平均響應(yīng)時(shí)間為0.10 s;調(diào)用查看表目錄詳情接口,事務(wù)平均響應(yīng)時(shí)間為0.30 s;調(diào)用不帶算法的數(shù)據(jù)合約執(zhí)行接口,事務(wù)平均響應(yīng)時(shí)間為1.01 s;調(diào)用帶數(shù)組去重算法的數(shù)據(jù)合約執(zhí)行接口,事務(wù)平均響應(yīng)時(shí)間為1.26 s。
50個(gè)用戶并發(fā)場(chǎng)景:調(diào)用不帶算法的數(shù)據(jù)合約執(zhí)行接口,事務(wù)平均響應(yīng)時(shí)間為3.01 s。
本文初步探索了區(qū)塊鏈技術(shù)在缺血性卒中醫(yī)療質(zhì)量評(píng)價(jià)體系中的應(yīng)用,其中融合智能合約、安全沙箱、摘要生成等區(qū)塊鏈技術(shù)手段,建立了缺血性卒中醫(yī)療質(zhì)量評(píng)價(jià)平臺(tái)。在三家已完成缺血性卒中醫(yī)療質(zhì)量數(shù)據(jù)結(jié)構(gòu)化的醫(yī)院的數(shù)據(jù)庫(kù)架構(gòu)上,有效實(shí)現(xiàn)了缺血性卒中醫(yī)療質(zhì)量指標(biāo)評(píng)價(jià)。進(jìn)一步應(yīng)用數(shù)據(jù)信息提取、數(shù)字化追溯和跨域投放,為開展基于醫(yī)院信息系統(tǒng)的醫(yī)療質(zhì)量評(píng)價(jià)和持續(xù)改進(jìn)奠定了技術(shù)基礎(chǔ)。
這種醫(yī)療質(zhì)量評(píng)價(jià)體系基于區(qū)塊鏈技術(shù)實(shí)現(xiàn)了數(shù)據(jù)不易篡改、很難偽造、可追溯、分布式基礎(chǔ)機(jī)構(gòu),與計(jì)算范式的醫(yī)院信息互聯(lián)互通信息平臺(tái)建設(shè)。平臺(tái)利用分布的區(qū)塊鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)來驗(yàn)證與存儲(chǔ)腦血管病質(zhì)控醫(yī)院臨床數(shù)據(jù),采用分布式節(jié)點(diǎn)共識(shí)算法來生成和更新醫(yī)院的臨床數(shù)據(jù),應(yīng)用密碼學(xué)方式保證臨床數(shù)據(jù)傳輸和訪問的安全,利用由自動(dòng)化腳本代碼組成的質(zhì)控醫(yī)院間智能合約來編程和操作臨床數(shù)據(jù)。
平臺(tái)基于區(qū)塊鏈技術(shù)的關(guān)鍵環(huán)節(jié)如下:
(1)對(duì)質(zhì)控醫(yī)院的腦血管病臨床數(shù)據(jù)資源和結(jié)構(gòu)進(jìn)行評(píng)估,形成詳細(xì)的臨床數(shù)據(jù)目錄鏈系統(tǒng),覆蓋臨床數(shù)據(jù)結(jié)構(gòu)和內(nèi)容。之后對(duì)臨床數(shù)據(jù)資源進(jìn)一步進(jìn)行規(guī)范化完善,逐步達(dá)到有價(jià)值臨床數(shù)據(jù)的目標(biāo)。
(2)項(xiàng)目醫(yī)院有價(jià)值臨床數(shù)據(jù)證明的發(fā)放,這個(gè)過程主要針對(duì)有價(jià)值臨床數(shù)據(jù)證明本身文件實(shí)現(xiàn)防偽,利用區(qū)塊鏈可以做到電子權(quán)益證明去中心化發(fā)放,并且保證不可篡改。
(3)項(xiàng)目醫(yī)院有價(jià)值臨床數(shù)據(jù)的流通,這個(gè)環(huán)節(jié)反映有價(jià)值臨床數(shù)據(jù)的流動(dòng)性?;趨^(qū)塊鏈,這個(gè)有價(jià)值臨床數(shù)據(jù)資產(chǎn)可以實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)流通,并可以再切分,促進(jìn)流動(dòng)性的增強(qiáng)。
綜合上述三個(gè)環(huán)節(jié),平臺(tái)在醫(yī)療領(lǐng)域中可將臨床數(shù)據(jù)轉(zhuǎn)變?yōu)橛袃r(jià)值的臨床數(shù)據(jù),這種權(quán)威而專業(yè)的評(píng)估有著非常重要的作用,可以提供評(píng)估、風(fēng)控、增值等服務(wù)。
本探索研究是在區(qū)塊鏈系統(tǒng)的基礎(chǔ)上,采用基于智能合約的缺血性卒中醫(yī)療質(zhì)控指標(biāo)算法整合和調(diào)用機(jī)制,使每一個(gè)算法成為一個(gè)獨(dú)立的智能合約,通過調(diào)用智能合約,獲得算法的運(yùn)行權(quán)限,并將算法流投入安全沙箱,對(duì)沙箱內(nèi)的數(shù)據(jù)進(jìn)行分析。智能合約的每次調(diào)用和運(yùn)行記錄同樣會(huì)被區(qū)塊鏈系統(tǒng)記錄,并與安全沙箱的輸出日志一一對(duì)應(yīng)。在完成數(shù)據(jù)跟蹤保護(hù)的同時(shí),對(duì)質(zhì)控指標(biāo)的算法的調(diào)用情況進(jìn)行記錄,以統(tǒng)計(jì)算法運(yùn)行效率、準(zhǔn)確率等參數(shù),便于總結(jié)算法瓶頸,為后續(xù)升級(jí)提供方向。
在利用醫(yī)療數(shù)據(jù)開展質(zhì)控評(píng)價(jià)工作中,經(jīng)常需要進(jìn)行跨醫(yī)院協(xié)調(diào)支持。然而,傳統(tǒng)的檢索是建立在對(duì)數(shù)據(jù)庫(kù)的直接訪問基礎(chǔ)上,這在多中心醫(yī)院協(xié)同中存在數(shù)據(jù)管理和安全等的屏障,而應(yīng)用區(qū)塊鏈技術(shù)的優(yōu)勢(shì)實(shí)現(xiàn)了基于元數(shù)據(jù)鏈的跨中心檢索機(jī)制,采用目錄鏈共享檢索機(jī)制,應(yīng)用摘要生成算法,將醫(yī)療信息非敏感的元標(biāo)簽存放于公開的元數(shù)據(jù)鏈上。醫(yī)院通過特征檢索,找到目標(biāo)數(shù)據(jù)后,調(diào)用預(yù)先簽署的智能合約或采用文件交換途徑,向原始醫(yī)院借取對(duì)應(yīng)的資料,并完成統(tǒng)計(jì)分析。
在數(shù)據(jù)安全方面,數(shù)字化信息具有易復(fù)制、難追蹤等特性,很難做到有效保護(hù)。本研究通過引入?yún)^(qū)塊鏈的數(shù)字資產(chǎn)化思想,將數(shù)據(jù)作為特殊資產(chǎn),在區(qū)塊鏈上進(jìn)行管理,明確權(quán)屬并跟蹤記錄其流動(dòng),同時(shí),結(jié)合安全沙箱和加密技術(shù),做到使用留痕、用后銷毀,保障原始數(shù)據(jù)的安全性和唯一性,從而使得數(shù)據(jù)的管理和保護(hù)成為可能。從需求產(chǎn)生并準(zhǔn)備執(zhí)行開始,區(qū)塊鏈系統(tǒng)對(duì)數(shù)據(jù)調(diào)取、算法分析、結(jié)果輸出、沙箱銷毀等全部操作進(jìn)行共識(shí)和記錄,其不可篡改的特點(diǎn)保障了數(shù)據(jù)的安全,同時(shí)也記錄了數(shù)據(jù)與結(jié)論之間的關(guān)聯(lián)關(guān)系,使之可以在不獲取原始數(shù)據(jù)的情況下,證明結(jié)論的有效性和可重復(fù)性。
醫(yī)療行業(yè)是典型的高通量并發(fā)場(chǎng)景,全流程的記錄需求會(huì)對(duì)區(qū)塊鏈系統(tǒng)產(chǎn)生巨大的壓力,傳統(tǒng)的公有鏈系統(tǒng)共識(shí)協(xié)議[如工作量證明算法(proof of work,PoW)、股權(quán)證明(proof of stake,PoS)等]無(wú)法提供足夠的并發(fā)性能[21]。本研究采用了基于微實(shí)數(shù)并行排序思想的EDA共識(shí)協(xié)議[19],通過搶占式排序和并發(fā)共識(shí),以提供適合業(yè)務(wù)場(chǎng)景的系統(tǒng)性能。
本研究的快速實(shí)施依托“十三五”國(guó)家重點(diǎn)研發(fā)計(jì)劃正在開展的基于醫(yī)院信息系統(tǒng)的腦血管病大數(shù)據(jù)平臺(tái)建設(shè),根據(jù)卒中醫(yī)療質(zhì)量評(píng)價(jià)的需要變量進(jìn)行結(jié)構(gòu)化和標(biāo)準(zhǔn)化的處理,建立醫(yī)院卒中質(zhì)控專用的數(shù)據(jù)庫(kù),這為開展基于區(qū)塊鏈的缺血性卒中質(zhì)控平臺(tái)建設(shè)、數(shù)據(jù)調(diào)取和分析奠定了堅(jiān)實(shí)的基礎(chǔ)。目前已完成如下工作:設(shè)計(jì)信息系統(tǒng)標(biāo)準(zhǔn)數(shù)據(jù)接口,規(guī)范數(shù)據(jù)字典;收集各醫(yī)院的接口數(shù)據(jù),校驗(yàn)上報(bào)數(shù)據(jù),對(duì)整體性、種類完整性、數(shù)據(jù)項(xiàng)完整性等進(jìn)行檢查;數(shù)據(jù)清洗,處理問題數(shù)據(jù),收集原始資料,保障數(shù)據(jù)溯源;組織醫(yī)療專業(yè)人員進(jìn)行業(yè)務(wù)邏輯核查和數(shù)據(jù)修正,并對(duì)數(shù)據(jù)字典和采集規(guī)范進(jìn)行補(bǔ)充、完善等。
本研究主要為解決如何在非本地中心開展缺血性卒中醫(yī)療質(zhì)量指標(biāo)的評(píng)價(jià),即在不暴露醫(yī)療信息等敏感數(shù)據(jù)的條件下,基于“模型投放”架構(gòu),解決醫(yī)療質(zhì)量指標(biāo)算法的推送、應(yīng)用、迭代以及后評(píng)估問題。在數(shù)據(jù)分析及評(píng)估應(yīng)用的完整流程中,算法需要在運(yùn)算平臺(tái)上調(diào)用數(shù)據(jù),并形成運(yùn)算結(jié)果對(duì)外輸出。在上述生態(tài)內(nèi),算法、數(shù)據(jù)與運(yùn)算平臺(tái)三者缺一不可。而傳統(tǒng)的以保護(hù)敏感信息為目的的“信息孤島”則徹底將數(shù)據(jù)從生態(tài)中割離開,形成了巨大空洞,阻礙了未來“人工智能+醫(yī)療”的深入結(jié)合與推進(jìn)[11]。未來將區(qū)塊鏈和人工智能相結(jié)合,基于深度學(xué)習(xí)的醫(yī)療人工智能分析技術(shù),是一種以數(shù)據(jù)基礎(chǔ)與應(yīng)用效果直接正相關(guān)的統(tǒng)計(jì)分析方法。隨著目前醫(yī)療數(shù)據(jù)的使用途徑縮窄,未來這種技術(shù)的發(fā)展方向也正被社會(huì)各界廣泛關(guān)注[14]。對(duì)于人工智能這種嚴(yán)重依賴數(shù)據(jù)迭代和更新的應(yīng)用,“一次成型”的部署方式難以發(fā)揮其功能和價(jià)值。目前系統(tǒng)已經(jīng)具備了算法的投放能力,下一步將與多中心數(shù)據(jù)統(tǒng)計(jì),特別是聯(lián)邦學(xué)習(xí)、多方安全計(jì)算相結(jié)合,解決應(yīng)用算法在敏感信息環(huán)境中的投放問題,打通數(shù)據(jù)交匯渠道,探索并推動(dòng)形成醫(yī)療數(shù)據(jù)模型設(shè)計(jì)開發(fā)的新模式,即醫(yī)療機(jī)構(gòu)提供數(shù)據(jù)基礎(chǔ)、醫(yī)療知識(shí)和應(yīng)用渠道,科研機(jī)構(gòu)提供模型的智力支持,整體環(huán)境將從現(xiàn)在的以科研機(jī)構(gòu)或企業(yè)為中心,調(diào)整為以醫(yī)療機(jī)構(gòu)為中心,將為醫(yī)療行業(yè)與信息技術(shù)融合提供更堅(jiān)實(shí)的發(fā)展基礎(chǔ)和廣闊前景。
致謝:北京嘉和美康信息技術(shù)有限公司張雷、郭偉光,張義超、郝昌龍、王濤、邵義工程師對(duì)結(jié)構(gòu)化數(shù)據(jù)庫(kù)建設(shè)的技術(shù)支撐。