国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于電子病例報(bào)告表在醫(yī)院醫(yī)療信息平臺(tái)自動(dòng)抓取兒童肺炎真實(shí)世界數(shù)據(jù)的方法學(xué)探討

2022-05-24 02:42王穎雯桂永浩張崇凡洪建國(guó)方金武王偉炳董曉艷陸國(guó)平葉穎子湯梁峰葛小玲余松軒張曉波
中國(guó)循證兒科雜志 2022年2期
關(guān)鍵詞:變量肺炎標(biāo)準(zhǔn)

王穎雯 蘇 玲 桂永浩 張崇凡 陸 權(quán) 洪建國(guó) 沈 兵 馮 瑞 方金武 王偉炳 顧 鶯 董曉艷 王 瑩 陸國(guó)平 俞 蕙 葉穎子, 湯梁峰 葛小玲 黃 敏 余松軒 徐 虹, 張曉波,

自美國(guó)食品和藥物管理局于2020年發(fā)布了“真實(shí)世界證據(jù)計(jì)劃”[1]以來,真實(shí)世界數(shù)據(jù)對(duì)醫(yī)療保健和監(jiān)管決策的支持作用越來越顯著[2]。真實(shí)世界數(shù)據(jù)采集的完整性、一致性和準(zhǔn)確性,是開展相關(guān)多目標(biāo)研究的數(shù)據(jù)基礎(chǔ)。

病例報(bào)告表(CRF)是臨床試驗(yàn)的數(shù)據(jù)采集工具,其設(shè)計(jì)初衷是根據(jù)研究目標(biāo)記錄研究方案所要求的原始信息[3,4]。隨著電子信息的發(fā)展,CRF也從紙質(zhì)格式向電子格式過渡,即電子病例報(bào)告表(eCRF)。CRF歷來是針對(duì)每項(xiàng)臨床試驗(yàn)單獨(dú)設(shè)計(jì)的,彼此間截然不同又無法兼容[5.6],反復(fù)開發(fā)eCRF及基于各種特異性eCRF的數(shù)據(jù)采集系統(tǒng)花費(fèi)巨大[7],且功能單一。本研究以兒童肺炎為例創(chuàng)建通用eCRF,使其囊括兒童肺炎診療過程中的全部變量,以確保臨床研究數(shù)據(jù)采集的可及性,同時(shí)避免過度的信息收集?;趀CRF的數(shù)據(jù)采集平臺(tái),將計(jì)算機(jī)化病歷系統(tǒng)(EMR)和實(shí)驗(yàn)室信息系統(tǒng)(LIS)端口連接,自動(dòng)抓取eCRF所需數(shù)據(jù),通過eCRF采集數(shù)據(jù)的應(yīng)答率,對(duì)電子病歷書寫進(jìn)行質(zhì)量控制,同時(shí)提取病歷書寫中非結(jié)構(gòu)化數(shù)據(jù),為臨床提供決策支持,并不斷正向促進(jìn)電子病歷數(shù)據(jù)的標(biāo)準(zhǔn)化。

1 方法

1.1 eCRF體例及模塊創(chuàng)建 通過系統(tǒng)文獻(xiàn)檢索、提取兒童肺炎研究變量并由審核專家確定,開發(fā)臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)(CDISC)eCRF表單,驗(yàn)證和修正變量后,構(gòu)建和完善平臺(tái)數(shù)據(jù)中采集測(cè)試模型(圖1)。

1.2 核心變量審核專家 選取上海地區(qū)13名兒童肺炎診斷治療專家為變量審核專家,其中上海市兒科臨床質(zhì)控中心專家委員會(huì)專家3名,上海醫(yī)學(xué)會(huì)兒科學(xué)分會(huì)呼吸學(xué)組委員2名、急救學(xué)組委員4名、感染學(xué)組委員2名,復(fù)旦大學(xué)GRADE中心專家2名。

1.3 檢索策略

1.3.1 檢索數(shù)據(jù)庫 英文網(wǎng)站/數(shù)據(jù)庫:BMJ Best Practice、Up To Date、蘇格蘭學(xué)院間指南協(xié)作網(wǎng)(SIGN)、英國(guó)國(guó)家衛(wèi)生與臨床優(yōu)化研究所網(wǎng)站(NICE)、澳大利亞喬安娜布里格斯研究所循證衛(wèi)生保健中心數(shù)據(jù)庫(JBI)、考克蘭圖書館(Cochrane Library)、美國(guó)兒科學(xué)會(huì)、PubMed、EBSCO、Springer Link、Elsevier Science Direct、Embase(OVID)、Web of Science;中文網(wǎng)站/數(shù)據(jù)庫:中華人民共和國(guó)國(guó)家衛(wèi)生健康委員會(huì)網(wǎng)站、中華兒科學(xué)會(huì)、中國(guó)生物醫(yī)學(xué)文獻(xiàn)服務(wù)系統(tǒng)、中國(guó)知網(wǎng)(學(xué)術(shù)期刊庫)、萬方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)、維普期刊數(shù)據(jù)庫、醫(yī)脈通。檢索時(shí)間為建庫/開網(wǎng)至2021年12月1日。語種為中文和英文。

1.3.2 檢索式 以NICE為例:("Pneumonia" OR "Pneumonia, Staphylococcal" OR "Pneumonia, Mycoplasma" OR "Pneumonia, Pneumococcal" OR "Pleural Effusion" OR "Pleural Effusion, Malignant" OR "Tuberculosis, Pulmonary" )AND (“children”[Title] OR “child”[Title])。

1.4 文獻(xiàn)納入和排除標(biāo)準(zhǔn) 納入實(shí)施對(duì)象為>1月齡至18歲兒童青少年的指南、或?qū)<夜沧R(shí)、或診斷治療規(guī)范。排除重復(fù)和無法獲取全文的文獻(xiàn)。

1.5 文獻(xiàn)篩選 蘇玲和王穎雯獨(dú)立閱讀文獻(xiàn)題目和摘要,根據(jù)文獻(xiàn)納入和排除標(biāo)準(zhǔn)進(jìn)行初步篩選。湯梁峰和葉穎子閱讀全文進(jìn)行二次篩選。篩選過程中不確定是否納入的文獻(xiàn),與張曉波和徐虹討論決定。

1.6 構(gòu)建兒童肺炎研究的核心變量池 由葉穎子和湯梁峰從上述選擇的文獻(xiàn)中分別提取與兒童肺炎相關(guān)的變量,審核專家通過面對(duì)面討論會(huì),對(duì)變量進(jìn)行補(bǔ)充和審核,取得≥90%審核專家同意的變量進(jìn)入核心變量池。

1.7 兒童肺炎eCRF的標(biāo)準(zhǔn)化設(shè)計(jì)

1.7.1 技術(shù)標(biāo)準(zhǔn) 采用CDISC標(biāo)準(zhǔn)[8,9](表1)。本研究?jī)和窝譭CRF生成基于其中的臨床數(shù)據(jù)獲取協(xié)調(diào)標(biāo)準(zhǔn)(CDASH)。

表1 CDISC核心標(biāo)準(zhǔn)[9]

1.7.2 依據(jù)CDASH設(shè)計(jì)表單 擬包括以下10個(gè)域:人口統(tǒng)計(jì)學(xué)信息(DM域),既往與伴隨用藥史(CM域),病史(MH域),體格檢查(PE域),生命體征(VS域),癥狀(SC域),訪視(SV域),納入和排除標(biāo)準(zhǔn)(IE域),試驗(yàn)分組(TA域),數(shù)據(jù)收集備注與說明(CO域)。

1.7.3 命名核心變量池的變量 根據(jù)CDISC核心標(biāo)準(zhǔn)中的CT、TA、XML、LAB,對(duì)采集到的核心變量規(guī)范命名,按照CDASH 標(biāo)準(zhǔn)中定義的變量收集類別標(biāo)記所有變量收集的緊迫程度,如:將規(guī)定必須收集和記錄的數(shù)據(jù)標(biāo)記數(shù)據(jù)收集的推薦級(jí)別,將核心變量歸入相應(yīng)域。需要說明的是,本研究中關(guān)于CM域中變量(性別、年齡、身份證號(hào)、籍貫、現(xiàn)住址)的定義依據(jù)《衛(wèi)生部關(guān)于修訂住院病案首頁的通知》(衛(wèi)醫(yī)政發(fā)〔2011〕84號(hào))中的住院病案首頁部分項(xiàng)目填寫說明,與住院病案首頁采集項(xiàng)目一致。

1.7.4 設(shè)置變量采集描述及回答問題選項(xiàng) 對(duì)核心變量進(jìn)行問題描述,對(duì)需要回答的變量問題,則按照CDISC中的CT設(shè)置回答選項(xiàng)。

1.8 測(cè)試eCRF采集能力

1.8.1 建設(shè)基于兒童肺炎eCRF的數(shù)據(jù)采集平臺(tái) 分析變量來源,如HIS、EMR、LIS、檢查信息管理系統(tǒng)(PACS),與多源數(shù)據(jù)分別建立數(shù)據(jù)接口。根據(jù)數(shù)據(jù)采集模型開展數(shù)據(jù)自動(dòng)采集。制定針對(duì)性的映射操作指南,完成術(shù)語標(biāo)準(zhǔn)化,生成肺炎領(lǐng)域研究專用的術(shù)語庫。對(duì)由于版本迭代產(chǎn)生的源數(shù)據(jù)診斷編碼、術(shù)語不一致的問題,建立映射表進(jìn)行內(nèi)容整合與術(shù)語匹配。對(duì)照CDISC標(biāo)準(zhǔn)代碼,部分無法通過EMR、LIS 等數(shù)據(jù)庫抓取的變量則人工錄入,以確保數(shù)據(jù)的完整性與規(guī)范性。

1.8.2 測(cè)試數(shù)據(jù)采集能力 在醫(yī)院肺炎電子病歷中,通過已建立的eCRF的數(shù)據(jù)采集平臺(tái)完成5輪數(shù)據(jù)自動(dòng)采集,每輪按照隨機(jī)數(shù)字表抽取20份典型病歷。單個(gè)變量采集準(zhǔn)確率=核查準(zhǔn)確采集的份數(shù)/原始數(shù)據(jù)份數(shù)×100%。對(duì)結(jié)構(gòu)化變量,單個(gè)變量采集準(zhǔn)確率100%為達(dá)標(biāo);對(duì)文本數(shù)據(jù)變量,單個(gè)變量采集準(zhǔn)確率90%為達(dá)標(biāo)。每輪測(cè)試后,對(duì)于采集準(zhǔn)確率不達(dá)標(biāo)的原因進(jìn)行分析,如為自然語言分析模型缺乏對(duì)特定表述規(guī)則的學(xué)習(xí),則通過機(jī)器學(xué)習(xí)優(yōu)化規(guī)則;如為醫(yī)生表述不規(guī)范,則反饋臨床,改善醫(yī)生書寫行為;對(duì)未出現(xiàn)變量則通過下一輪繼續(xù)抽樣,新增核查病例。

1.8.3 測(cè)試數(shù)據(jù)采集時(shí)效和系統(tǒng)安全 測(cè)試內(nèi)容包括:①數(shù)據(jù)產(chǎn)生的24 h內(nèi)是否能夠進(jìn)行自動(dòng)采集,②是否具有數(shù)據(jù)的核查和鎖定功能,③是否具備規(guī)定時(shí)間內(nèi)無操作的自動(dòng)退出,④是否具有初次登錄密碼強(qiáng)制修改及密碼復(fù)雜性要求。

2 結(jié)果

2.1 核心變量池的變量來源 審核專家確定了7部指南[10-16]、4部診療建議[17-20]和10部專家共識(shí)[21-30]作為兒童肺炎eCRF核心變量的選擇來源,同時(shí)還選擇了9部經(jīng)典專著[31-39]作為補(bǔ)充和完善。

2.2 核心變量 基于上述文獻(xiàn),提取了383個(gè)兒童肺炎變量進(jìn)入核心變量池,審核專家最終確定了335個(gè)作為兒童肺炎eCRF核心變量,其中人口學(xué)信息變量8個(gè),結(jié)構(gòu)化變量175個(gè),文本數(shù)據(jù)變量(通過自然語言分析)152個(gè);在CDASH設(shè)計(jì)表單的10個(gè)域(本文1.7.2內(nèi)容)的基礎(chǔ)上擴(kuò)增了8個(gè)域,分別為物質(zhì)濫用(SU域)、實(shí)驗(yàn)室檢查結(jié)果(LB域)、影像學(xué)檢查結(jié)果(EG域)、微生物發(fā)現(xiàn)(MI域)、治療(EX域)、用藥記錄(DA域)、不良事件(AE域)和轉(zhuǎn)歸(DD域)。

2.3 采集能力測(cè)試結(jié)果 表2顯示5輪測(cè)試評(píng)估和改進(jìn)修正結(jié)果。人口學(xué)信息模塊第1~5輪均100%達(dá)標(biāo)。結(jié)構(gòu)化信息模塊第1輪變量89.7%達(dá)標(biāo),未達(dá)標(biāo)變量數(shù)6個(gè),未出現(xiàn)變量數(shù)12個(gè);第2~5輪均100%達(dá)標(biāo)。文本數(shù)據(jù)模塊第1輪變量50.0%達(dá)標(biāo),未達(dá)標(biāo)變量數(shù)21個(gè),未出現(xiàn)變量數(shù)70個(gè);第2~5輪達(dá)標(biāo)變量率呈明顯升高趨勢(shì),未達(dá)標(biāo)和未出現(xiàn)變量數(shù)呈明顯下降趨勢(shì);第5輪90.1%達(dá)標(biāo),未達(dá)標(biāo)變量數(shù)7個(gè),未出現(xiàn)變量數(shù)8個(gè)??傮w達(dá)標(biāo)率為95.5%(320/335)。

表2 以eCRF變量為基本單位的數(shù)據(jù)采集質(zhì)量[n(%)]

2.4 數(shù)據(jù)采集時(shí)效和系統(tǒng)安全測(cè)試結(jié)果 5輪測(cè)試中,所有被測(cè)數(shù)據(jù)變量均能夠在數(shù)據(jù)產(chǎn)生的24 h內(nèi)實(shí)現(xiàn)自動(dòng)采集,均可實(shí)現(xiàn)數(shù)據(jù)的核查和鎖定功能、規(guī)定時(shí)間無操作的自動(dòng)退出功能以及初次登錄密碼強(qiáng)制修改和密碼復(fù)雜性要求功能。

3 討論

在兒童肺炎相關(guān)的系列研究中既包括對(duì)疾病發(fā)生機(jī)制、疾病發(fā)生發(fā)展過程的研究,也包括對(duì)疾病診斷、藥物療效及安全性、衛(wèi)生保健效果評(píng)價(jià)的研究。高質(zhì)量、清晰可追溯的數(shù)據(jù)是臨床研究成功完成的重要保證。尤其近年來,國(guó)內(nèi)外多中心合作研究、甚至同一醫(yī)院多部門合作研究廣泛開展,將不同來源的數(shù)據(jù)有效整合是研究順利進(jìn)行的重要前提[40]?;ㄙM(fèi)大量時(shí)間清理映射和翻譯不兼容,不但影響不同領(lǐng)域研究間的交流、阻礙研究的進(jìn)展,也無形中增加了研究成本。本研究開發(fā)的eCRF首先基于CDISC標(biāo)準(zhǔn)構(gòu)建,能夠?qū)崿F(xiàn)以統(tǒng)一的CDASH進(jìn)行標(biāo)準(zhǔn)化數(shù)據(jù)收集,并實(shí)現(xiàn)允許在試驗(yàn)中與其他同意開放的CDASH標(biāo)準(zhǔn)研究結(jié)果數(shù)據(jù)進(jìn)行比較,推動(dòng)不同醫(yī)院之間的治療決策分享與數(shù)據(jù)共享[41];CDASH數(shù)據(jù)標(biāo)準(zhǔn)還方便了研究人員將其映射到數(shù)據(jù)提交的國(guó)際標(biāo)準(zhǔn)格式(SDTM),提高數(shù)據(jù)匯總分析效率和臨床試驗(yàn)數(shù)據(jù)提交質(zhì)量;再者,通用eCRF理想情況下可用于兒童肺炎所有潛在研究,與之前研究集中在特異性臨床試驗(yàn)CRF的創(chuàng)建和數(shù)據(jù)標(biāo)準(zhǔn)化相比[42],可以滿足兒童肺炎研究的絕大多數(shù)臨床試驗(yàn)數(shù)據(jù)收集,減少單個(gè)研究的系統(tǒng)開發(fā)費(fèi)用,提高兒童肺炎臨床試驗(yàn)數(shù)據(jù)的一致性。

eCRF的數(shù)據(jù)采集平臺(tái)旨在通過臨床數(shù)據(jù)的自動(dòng)采集,獲得真實(shí)世界的數(shù)據(jù)。因此,對(duì)臨床數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)采集能力評(píng)價(jià)尤為重要,其直接關(guān)系到數(shù)據(jù)的質(zhì)量?;趦和窝淄ㄓ胑CRF建立的數(shù)據(jù)采集平臺(tái)實(shí)現(xiàn)每日0點(diǎn)自動(dòng)運(yùn)行采集任務(wù),將符合條件的數(shù)據(jù)分別從HIS、LIS、EMR或PACS等系統(tǒng)采集并儲(chǔ)存。在保證自動(dòng)任務(wù)運(yùn)行的情況下,每日檢查任務(wù)運(yùn)行情況確保任務(wù)正確運(yùn)行,通過檢查運(yùn)行日志,比對(duì)數(shù)據(jù)的產(chǎn)生時(shí)間和入庫時(shí)間,保證數(shù)據(jù)采集的及時(shí)性。根據(jù)權(quán)限最小化原則進(jìn)行權(quán)限配置,并通過安全制度、權(quán)限審批、密碼復(fù)雜性要求、超時(shí)自動(dòng)退出等避免賬號(hào)濫用的產(chǎn)生。

在測(cè)試平臺(tái)采集能力所定義的準(zhǔn)確性標(biāo)準(zhǔn)基于如下考慮:①對(duì)于臨床高度結(jié)構(gòu)化數(shù)據(jù)以及關(guān)鍵變量,要求準(zhǔn)確率為100%。而運(yùn)用自然語言處理(NLP)進(jìn)行采集的變量,結(jié)合當(dāng)前中文自然語言處理的技術(shù)水平,采用了目前通行標(biāo)準(zhǔn)90%,此標(biāo)準(zhǔn)并非一成不變,應(yīng)隨著不斷的評(píng)價(jià)反饋和技術(shù)持續(xù)提升進(jìn)行修改。②抽樣核查所需的病例數(shù)不僅需要考慮數(shù)據(jù)采集系統(tǒng)的功能以及病例中所能提取的數(shù)據(jù)量,同時(shí)還需要兼顧核查所需要的工作量,以及期待通過測(cè)試評(píng)估發(fā)現(xiàn)問題等因素。③進(jìn)行評(píng)價(jià)結(jié)果分析時(shí),如果原始數(shù)據(jù)缺失,則需要補(bǔ)充納入新的素材進(jìn)行下一輪測(cè)試,如果準(zhǔn)確率不達(dá)標(biāo),則需要進(jìn)行個(gè)性化分析并完善后進(jìn)行下一輪復(fù)測(cè),常見的原因一般為自然語言分析模型缺乏對(duì)特定表述規(guī)則的學(xué)習(xí),可以通過機(jī)器學(xué)習(xí)、優(yōu)化規(guī)則、改善醫(yī)生書寫病史行為等提升數(shù)據(jù)采集水平。

既往對(duì)專病隊(duì)列的CRF模塊的開發(fā)多基于單一診斷治療規(guī)范[43]或已有研究的CRF[42,44,45],本研究通過系統(tǒng)檢索兒童肺炎的指南、共識(shí)、診斷治療規(guī)范和專著,以專家共識(shí)確定eCRF的數(shù)據(jù)集來源,使得所構(gòu)建的兒童肺炎eCRF數(shù)據(jù)采集平臺(tái)不僅能實(shí)現(xiàn)規(guī)范化數(shù)據(jù)采集,在未來還可實(shí)現(xiàn)以數(shù)據(jù)采集結(jié)果來規(guī)范兒童肺炎的診療,提升臨床醫(yī)生對(duì)于兒童肺炎的診療能力。通過標(biāo)準(zhǔn)的電子病歷數(shù)據(jù)彌補(bǔ)真實(shí)世界數(shù)據(jù)與研究數(shù)據(jù)之間的差距,推動(dòng)我國(guó)真實(shí)世界數(shù)據(jù)生態(tài)建設(shè)。

eCRF和相應(yīng)數(shù)據(jù)采集平臺(tái)系統(tǒng)的成功建設(shè),為開展兒童肺炎相關(guān)臨床研究提供了有力的信息化支撐,促進(jìn)了兒童肺炎病歷規(guī)范化書寫與數(shù)據(jù)完整性、準(zhǔn)確性的提升,為下一步多中心研究的開展和建立重癥肺炎風(fēng)險(xiǎn)評(píng)估系統(tǒng)打下了堅(jiān)實(shí)的基礎(chǔ)。系統(tǒng)的建成運(yùn)行,使得符合納入和排除標(biāo)準(zhǔn)的患兒就診、入院、在院、出院隨訪信息可以及時(shí)結(jié)構(gòu)化納入專病研究平臺(tái),將標(biāo)準(zhǔn)化數(shù)據(jù)通過平臺(tái)數(shù)據(jù)統(tǒng)一收集以便統(tǒng)計(jì)、分析與運(yùn)用,以便進(jìn)一步優(yōu)化診療方案,持續(xù)提升患兒及家屬滿意度。

本研究局限性:盡管創(chuàng)建小組具有專業(yè)知識(shí),但這種新的eCRF在臨床試驗(yàn)中的有效性尚待證明。其是否具備對(duì)所有臨床試驗(yàn)的適用性和數(shù)據(jù)采集的可及性,我們?nèi)孕璩种?jǐn)慎態(tài)度,表單仍有持續(xù)迭代開發(fā)的需要。

猜你喜歡
變量肺炎標(biāo)準(zhǔn)
2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
來勢(shì)洶洶的肺炎
犢牛肺炎巧防治
新型冠狀病毒肺炎防護(hù)小知識(shí)
抓住不變量解題
一分鐘了解新型冠狀病毒感染的肺炎
忠誠(chéng)的標(biāo)準(zhǔn)
美還是丑?
一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長(zhǎng)中的煩惱”
分離變量法:常見的通性通法
梅河口市| 九龙城区| 光泽县| 礼泉县| 衡东县| 丰镇市| 平山县| 湄潭县| 招远市| 昆明市| 鄂尔多斯市| 定兴县| 霞浦县| 工布江达县| 鸡西市| 和平县| 小金县| 疏附县| 凤山市| 雷山县| 四会市| 昭平县| 河源市| 常宁市| 青神县| 穆棱市| 乐都县| 炎陵县| 怀柔区| 类乌齐县| 澄江县| 兰溪市| 凯里市| 定州市| 图们市| 贡觉县| 静乐县| 启东市| 福鼎市| 依安县| 铁岭市|