廖茜雯
北京大學(xué)第一醫(yī)院
北京大學(xué)臨床研究所
姚晨*
北京大學(xué)第一醫(yī)院
北京大學(xué)臨床研究所
海南省真實世界數(shù)據(jù)研究院
張軍
默沙東研發(fā)(中國)有限公司
Larry Z Liu
默沙東有限公司
威爾康奈爾醫(yī)學(xué)院
隨著醫(yī)療數(shù)據(jù)數(shù)量的迅速增長和醫(yī)療信息技術(shù)的快速發(fā)展,真實世界數(shù)據(jù)(real world data,RWD)和真實世界證據(jù)(real world evidence,RWE)已成為推動醫(yī)療健康發(fā)展和創(chuàng)新不可或缺的組成部分。
臨床決策(clinical decision-making,CDM)是指形成診斷或治療方案的過程,一般基于患者的最佳臨床檢查數(shù)據(jù),并考慮患者自身的選擇偏好[1]。CDM 通常由3 個方面組成:疾病診斷、風(fēng)險預(yù)測、疾病管理。傳統(tǒng)上,CDM 在很大程度上是由知識和經(jīng)驗驅(qū)動的,包括患者的主觀和客觀臨床數(shù)據(jù)、醫(yī)生的經(jīng)驗、地理位置、醫(yī)院的資質(zhì)等,導(dǎo)致決策具有主觀性、不確定性和變異性[2]。近年來,循證醫(yī)學(xué)(evidence-based medicine,EBM)理念下的CDM 逐漸被臨床醫(yī)生所采納。其主要建立在3個關(guān)鍵維度上,包括以隨機對照試 驗(randomized controlled trial,RCT)為金標(biāo)準(zhǔn)的現(xiàn)有最佳臨床證據(jù)、醫(yī)生的臨床經(jīng)驗,以及患者的偏好。EBM 理念下的CDM 將科學(xué)嚴(yán)謹(jǐn)?shù)目陀^臨床證據(jù)與主觀的醫(yī)生經(jīng)驗和患者價值結(jié)合,以期做出最佳的CDM[3]。
隨著醫(yī)療數(shù)據(jù)數(shù)量的迅速增長和醫(yī)療信息技術(shù)的快速發(fā)展,真實世界數(shù)據(jù)(real world data,RWD)和真實世界證據(jù)(real world evidence,RWE)已 成為推動醫(yī)療健康發(fā)展和創(chuàng)新不可或缺的組成部分。RWD 是指來源于日常所收集的各種與患者健康狀況或診療及保健有關(guān)的數(shù)據(jù),包括電子病歷(electronic medical record,EMR)、醫(yī) 療索賠數(shù)據(jù)、疾病登記數(shù)據(jù)和患者生成的數(shù)據(jù)等[4-5]。通過分析RWD 所產(chǎn)生的證據(jù)即為RWE[4-5]。與傳統(tǒng)RCT 所產(chǎn)生的證據(jù)相比,RWD/RWE 具有獨特的優(yōu)勢。由于RCT 的受試者通常受限制于嚴(yán)格的納入與排除標(biāo)準(zhǔn),可能會導(dǎo)致較低的外部有效性。而RWD/RWE 的發(fā)展使臨床醫(yī)生和研究者能夠利用非傳統(tǒng)研究環(huán)境中的大量數(shù)據(jù),也就是從常規(guī)醫(yī)療實踐中收集的臨床數(shù)據(jù),從而輔助EBM 理念下的CDM,并為其提供新的臨床假設(shè)和證據(jù)。設(shè)計良好的RWD/RWE 能夠為臨床醫(yī)生在真實醫(yī)療環(huán)境下更廣泛多樣的人群中,就治療的安全性和有效性提供補充信息[6]。使用RWD 產(chǎn)生的RWE 的研究通常納入排除標(biāo)準(zhǔn)更寬泛,研究結(jié)果受患者在真實世界中合并用藥、地理位置以及患者意愿的影響更大,更具有EBM 方面的臨床價值[7-8]。此外,RWD/RWE 可用于填補 RCT 未能解決的臨床問題中的幾個空白,如通過藥品上市后更長的隨訪期發(fā)現(xiàn)額外的治療效果或風(fēng)險,調(diào)查疾病高風(fēng)險患者的人口學(xué)特征和患者的依從模式,并揭示傳統(tǒng)RCT 中未能滿足的醫(yī)療需求等[7,9,10]。
隨著人們對RWD/RWE 在支持CDM 中價值的認(rèn)識程度不斷加深,近年來我國通過多維度的醫(yī)療改革創(chuàng)新,致力于完善RWD/RWE 并推動其廣泛應(yīng)用。2020 年,國家藥監(jiān)局發(fā)布《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》,2021 年,國家藥監(jiān)局藥品審評中心發(fā)布《用于產(chǎn)生真實世界證據(jù)的真實世界數(shù)據(jù)指導(dǎo)原則(試行)》,明確了相關(guān)定義,闡明了RWD/RWE用于評估監(jiān)管決策的基本原則,并概述了用于產(chǎn)生RWD/RWE的高質(zhì)量RWD 的使用原則和范圍[4,11]。此外,在當(dāng)前醫(yī)療大數(shù)據(jù)的背景下,人工智能技術(shù)的迅速發(fā)展也為RWD/RWE 支持CDM帶來了新的發(fā)展方向。2019 年7 月,國家藥監(jiān)局醫(yī)療器械技術(shù)審評中心發(fā)布《深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評要點》,首次明確了使用深度學(xué)習(xí)技術(shù)輔助CDM 軟件注冊申報的審評關(guān)注重點,包含需求分析、數(shù)據(jù)收集、算法設(shè)計、驗證與確認(rèn)等階段[12]。2022 年3 月,《人工智能醫(yī)療器械注冊審查指導(dǎo)原則》正式發(fā)布,進(jìn)一步明確了RWD 采集、整理、標(biāo)注、數(shù)據(jù)集構(gòu)建的要求[13]。
隨著我國對RWD/RWE 的需求及其產(chǎn)量的不斷增加,有必要全面總結(jié)并批判性評估所有現(xiàn)有證據(jù),同時進(jìn)一步探索用于支持CDM 的RWD/RWE 的特點。截至目前,尚不清楚RWD/RWE在我國支持CDM 的應(yīng)用范圍和適用性。為了彌補這一空白,本研究旨在通過文獻(xiàn)綜述,回顧性地總結(jié) RWD/RWE 在我國支持CDM 的應(yīng)用現(xiàn)狀與特征,探索阻 礙RWD/RWE 在CDM 中 廣泛應(yīng)用的潛在因素,并提出可行性建議。
本研究在PubMed、MEDLINE、Embase、萬方數(shù)據(jù)知識服務(wù)平臺、中國知網(wǎng)數(shù)據(jù)庫中對使用RWD/RWE 支持我國CDM 的現(xiàn)有文獻(xiàn)進(jìn)行了檢索。根據(jù)研究目標(biāo),將CDM 分類為疾病診斷、嚴(yán)重程度評估/風(fēng)險預(yù)測、疾病管理。使用中文或英文關(guān)鍵詞在相應(yīng)的電子數(shù)據(jù)庫進(jìn)行檢索。檢索關(guān)鍵詞包括“真實世界數(shù)據(jù)”或“real world data”、“真實世界證據(jù)”或“real world evidence”、“觀察性研究”或“observational studies”、“ 登記研究”或“registry study”、“ 電子病歷” 或“electronic medical records”、“醫(yī)院信息系統(tǒng)”或“hospital information system”、“臨床決策”或“clinical decision-making”、“ 疾病診斷” 或“disease diagnosis”、“疾病評估”或“severity assessment”、“風(fēng)險預(yù)測”或“risk prediction”、“疾病管理”或“disease management”。納入的研究僅限于使用RWD/RWE 在我國支持CDM 的 中文或英文文獻(xiàn),且發(fā)表年份為2010 年及以后。排除與以上3 類CDM 無關(guān)的研究,如成本效益研究、醫(yī)院管理研究、支持監(jiān)管決策的相關(guān)研究。通過文獻(xiàn)的標(biāo)題和摘要進(jìn)行初步篩選,并對符合研究納入和排除標(biāo)準(zhǔn)的文獻(xiàn)進(jìn)一步詳細(xì)評估。
為了支持疾病診斷,目前RWD/RWE 主要用于描述罕見病和新發(fā)傳染性疾?。ㄈ缧滦凸跔畈《靖腥荆┑呐R床特征。對于常見疾病,由于診斷標(biāo)準(zhǔn)已經(jīng)相對成熟,RWD/RWE 通常被用于探索新診斷方法或生物標(biāo)記物對改善診斷效果的影響。例如,有研究者利用單中心EMR 進(jìn)行了傾向性評分匹配的病例對照研究,以評價Mac-2 結(jié)合蛋白聚糖異構(gòu)體聯(lián)合指標(biāo)與血清甲胎蛋白單項指標(biāo)相比,對肝癌的診斷效果和價值[14]。
對于罕見病來說,由于病情的復(fù)雜性和患者的稀缺性,臨床診斷通常面臨較大挑戰(zhàn),導(dǎo)致疾病發(fā)病和臨床診斷之間存在嚴(yán)重延 遲。利用RWD/RWE 可 以輔助臨床醫(yī)生了解罕見病患者的人口統(tǒng)計學(xué)特征和罕見病的臨床表征,從而支持快速準(zhǔn)確的臨床診斷。罕見病注冊系統(tǒng)是常見的RWD 數(shù)據(jù)源。疾病領(lǐng)域涵蓋血友病[15-16]、普拉德-威利(Prader-Willi)綜合征[17]、Takayasu 動脈炎相關(guān)肺高血壓[18]、龐貝氏癥[19]、奧爾波特(Alport)綜合征[20]等。中國血友病治療中心協(xié)作網(wǎng)和中國獲得性血友病登記系統(tǒng)是兩個常用的血友病注冊系統(tǒng)。基于這兩個系統(tǒng)的RWD 所展開的單臂、回顧性、觀察性研究,描述性統(tǒng)計分析總結(jié)了我國白血病患者的人口統(tǒng)計學(xué)特征,并且發(fā)現(xiàn)了我國白血病患者從首次發(fā)病到臨床診斷的嚴(yán)重延遲[15-16]。
除罕見病外,新發(fā)傳染性疾病,如新型冠狀病毒感染的暴發(fā)進(jìn)一步推動了RWD/RWE 在支持疾病診斷方面的重要應(yīng)用。針對無既往診斷經(jīng)驗和相關(guān)指南的未知傳染病,在疾病傳播的早期階段,通過對患者EMR 的回顧性分析所獲得的臨床和流行病學(xué)特征,能夠幫助臨床醫(yī)生迅速準(zhǔn)確地診斷此類傳染病,防止其傳播并降低死亡率[21-22]。需要強調(diào)的是,基于倫理和法律方面的考慮,被視為弱勢群體的兒童和青少年人群一般難以被納入傳統(tǒng)臨床研究中。相比之下,RWD/RWE 能夠就新型冠狀病毒在真實臨床實踐中兒童和青少年人群中獨特的傳播途徑、潛伏期、臨床表征和并發(fā)癥,提供更實用且有價值的證據(jù),以輔助臨床醫(yī)生做出有針對性的臨床診斷[23-24]。
綜上,目前在我國使用RWD/RWE 支持疾病診斷方面,以罕見?。òò籽?、罕見分子亞型癌癥、罕見遺傳性疾病等)和新發(fā)傳染性疾病為主。RWE研究設(shè)計通常為單臂、回顧性、觀察性研究。RWD 數(shù)據(jù)源主要為罕見病注冊系統(tǒng)和患者臨床EMR。統(tǒng)計分析方法主要采用描述性分析,旨在進(jìn)一步了解罕見病和新發(fā)傳染性疾病的臨床表現(xiàn)和患者特征,縮短疾病發(fā)病到臨床診斷的時間,并促進(jìn)疾病及時診療。
目前,RWD/RWE 在疾病風(fēng)險預(yù)測中的主要應(yīng)用包括發(fā)現(xiàn)新的疾病預(yù)后因素和開發(fā)可操作性風(fēng)險預(yù)測工具。通過分析患者在真實臨床實踐中潛在暴露因素或生物標(biāo)志物的數(shù)據(jù),可以產(chǎn)生新的臨床RWE 并生成新的臨床假設(shè),通過RCT 檢驗假設(shè),以輔助相關(guān)指南制修訂并支持CDM。慢性病是研究潛在預(yù)后因素的主要疾病領(lǐng)域,尤其是以腦卒中和急性冠狀動脈綜合征為主的心腦血管疾病。RWD 數(shù)據(jù)源主要采用單中心臨床EMR 和心腦血管疾病注冊系統(tǒng)。其中,較為常用的心腦血管疾病注冊系統(tǒng)包括第三次中國國家腦卒中登記(The Third China National Stroke Registry,CNSR-Ⅲ)、中國心血管疾病醫(yī)療質(zhì)量改善項目——急性冠脈綜合征項目、中國卒中中心聯(lián)盟這三個高質(zhì)量國家級注冊系統(tǒng)。例如,一項回顧性真實世界研究使用CNSR-Ⅲ研究數(shù)據(jù)評估了患者血清鈣水平預(yù)測腦卒中患者一年后臨床結(jié)局的能力[25]。該研究結(jié)果表明,基線血清鈣水平可能作為缺血性卒中的潛在預(yù)后生物標(biāo)志物和治療靶點。此外,對于缺血性卒中患者,預(yù)先使用抗血小板藥物被認(rèn)為是一種保護(hù)性的預(yù)后因素,可以降低住院期間不良結(jié)局的風(fēng)險[26]。
除了發(fā)現(xiàn)新的預(yù)后因素形成臨床RWD/RWE 以間接支持CDM 外,RWD 還被用于建立風(fēng)險預(yù)測模型等可操作性工具,直接支持CDM。由于預(yù)測能力有限,大多數(shù)模型旨在實現(xiàn)短期疾病預(yù)后的個體化預(yù)測。缺血性心腦血管疾病仍是此類預(yù)測模型的研發(fā)重點領(lǐng)域,相關(guān)疾病包括心肌梗死、冠狀動脈疾病和腦卒中。
國家心腦血管疾病注冊系統(tǒng)為主要RWD 數(shù)據(jù)源,包括冠心病抗血小板治療的優(yōu)選方案注冊庫[27]、中國急性心肌梗死(CAMI)注冊庫[28]、CNSR-Ⅲ[29]。這三個數(shù)據(jù)庫均采取國家級、多中心、前瞻性、觀察性設(shè)計,分別被用于預(yù)測我國心肌梗死患者醫(yī)療機構(gòu)內(nèi)死亡的風(fēng)險、冠心病患者出院后1 年內(nèi)缺血性心腦血管疾病的風(fēng)險,以及短暫性腦缺血發(fā)作患者1 年內(nèi)發(fā)生腦卒中的風(fēng)險。使用傳統(tǒng)的Logistic 回歸模型結(jié)合內(nèi)部驗證是常用的建模技術(shù),并且采用ROC 曲線下面積(AUC)作為主要指標(biāo),以評估模型的辨識效果和預(yù)測能力。這些模型所報告的C 統(tǒng)計量或AUC 值都在0.72~0.82之間,表明模型在實際臨床應(yīng)用中具有較好的短期辨別能力。
為了支持疾病管理,RWD/RWE 的主要用途包括比較不同疾病治療模式在真實世界中的效果、探索新治療方法在真實世界中的安全性和有效性、為指導(dǎo)疾病管理和治療提供新的臨床假設(shè)和證據(jù)。研究的疾病領(lǐng)域以慢性病為主,其中癌癥是較為常見的治療領(lǐng)域,其他疾病包括糖尿病以及心腦血管疾病等。
在比較不同疾病治療模式的臨床效果以輔助治療選擇時,臨床EMR 被廣泛使用。對于單中心研究,標(biāo)準(zhǔn)治療方法(如針對癌癥的傳統(tǒng)化療)通常被視為對照組。有研究者評估了在真實臨床實踐中晚期非小細(xì)胞肺癌(NSCLC)的不同治療模式的效果[30]。研究結(jié)果顯示,與標(biāo)準(zhǔn)化療方案相比,使用克唑替尼作為一線治療藥物的患者無進(jìn)展生存期(PFS)顯著更長,但總體生存期(OS)無明顯差異。對于多中心研究,為保證內(nèi)部有效性,傾向性評分匹配常被用于平衡治療組與對照組之間潛在的混雜因素。在評估胰蛋白酶抑制劑治療急性胰腺炎的臨床效果時,一項多中心回顧性研究表明,生長抑素可能是急性胰腺炎最有效的治療方法,具有較短的血清淀粉酶/脂肪酶恢復(fù)時間以及較低的并發(fā)癥發(fā)病率和器官衰竭發(fā)生率,為輔助臨床醫(yī)生進(jìn)行治療選擇提供了有價值的臨床RWE[31]。
傳統(tǒng)上,免疫檢查點抑制劑(ICI)等創(chuàng)新療法的臨床安全性和有效性一般通過具有嚴(yán)格入組標(biāo)準(zhǔn)和有限隨訪期的RCT 來證明。因此,在隨訪期較長的異質(zhì)性人群中進(jìn)行RWE 研究成為評估創(chuàng)新療法在真實世界中的有效性以及發(fā)現(xiàn)更多不良事件的關(guān)鍵?;谂R床EMR 的單中心、單臂、觀察性研究為這類RWE 研究的主要特點。其中,有兩項研究初步探索了ICI 治療晚期NSCLC的真實世界有效性和安全性,并報告了ICI 作為晚期NSCLC 患者一線治療的PFS 獲益[32-33]。然而,這兩項研究對ICI 安全性的報告存在較大差異。其中一項研究發(fā)現(xiàn)了較高的總體免疫相關(guān)不良事件(irAE)發(fā)生率(達(dá)61.71%),4 級irAE 發(fā)生率為8.82%[32],而另一項報告的irAE總體發(fā)生率為29.6%,且無4 級及以上irAE 發(fā)生[33]。此外,有研究者評估了奧拉帕尼在晚期卵巢癌患者中的短期治療效果和不良反應(yīng)[34]。通過較長的隨訪期,該研究提出了在既往RCT 中沒有發(fā)現(xiàn)的新的臨床不良反應(yīng),包括腹脹、血壓下降、體毛增加、口渴等。
利用不同的RWD 數(shù)據(jù)源所產(chǎn)生的RWE 還能為指導(dǎo)治療給藥和疾病管理提供新的臨床假設(shè)和證據(jù)?;贑AMI 數(shù)據(jù)庫的一項研究報告了糖尿病患者急性心肌梗死的非典型癥狀。與沒有糖尿病的患者相比,糖尿病患者出現(xiàn)典型胸痛癥狀的可能性較低,可能導(dǎo)致疾病管理的延遲[35]。有研究者使用單中心EMR 探索了瑞格非尼治療晚期結(jié)直腸癌時平衡安全性和治療效果的合理給藥劑量[36]。在臨床常用的3 種劑 量(包 括80mg、120mg 和160mg)中,接受120mg 最終劑量的患者具有更好的風(fēng)險-效益比以及最長的中位OS,該研究可為疾病管理提供參考。
由于不同的RWD 數(shù)據(jù)源所包含的研究特定數(shù)據(jù)元素可能差異很大,采用適用的RWD 數(shù)據(jù)源是使用高質(zhì)量RWD/RWE 支持CDM 的基礎(chǔ)?;诓煌瑪?shù)據(jù)源的特點,現(xiàn)階段在我國使用RWD/RWE 支持CDM 的主要RWD 數(shù)據(jù)源為結(jié)構(gòu)化EMR 和疾病登記庫。主要疾病領(lǐng)域包括罕見病、新發(fā)傳染性疾病、以心腦血管疾病和癌癥為主的慢性病。我國EMR 數(shù)據(jù)中門診隨訪數(shù)據(jù)的可用性通常受到極大限制,而人口統(tǒng)計學(xué)信息、診斷結(jié)果、藥物治療信息等結(jié)構(gòu)化數(shù)據(jù)元素穩(wěn)定可用。影像和病理學(xué)結(jié)果等非結(jié)構(gòu)化數(shù)據(jù)元素則推動了人工智能(AI)等新技術(shù)的發(fā)展以進(jìn)一步支持CDM,推動個體化診療。此外,根據(jù)研究目的和設(shè)計,盡管疾病登記庫中的可用數(shù)據(jù)元素不同,但由于其具有前瞻性的設(shè)計,通常能夠不同程度地獲得縱向隨訪數(shù)據(jù)。為了支持罕見病和新發(fā)傳染性疾病的診斷,基于罕見病登記庫和EMR 的描述性分析能夠幫助臨床醫(yī)生提高對相關(guān)疾病的認(rèn)知水平。雖然國家級或區(qū)域性疾病登記庫是預(yù)測長期疾病預(yù)后的最佳RWD 數(shù)據(jù)源,但由于傳統(tǒng)模型具有較差的長期預(yù)測能力,疾病登記庫成為建立短期預(yù)后模型和選擇預(yù)后因素的主要數(shù)據(jù)源。為了解決隨訪數(shù)據(jù)缺失問題,研究者通常需要使用電話或電子郵件等方式采集研究特定的數(shù)據(jù)。此外,多中心EMR通常被用于進(jìn)行比較性有效性分析,結(jié)合包括傾向性評分匹配和多元回歸在內(nèi)的統(tǒng)計方法,調(diào)整混雜因素的潛在影響,以支持并指導(dǎo)疾病管理。
近年來,隨著RWD/RWE受到越來越多的關(guān)注,在我國使用RWD/RWE 支持監(jiān)管決策的重要性已得到充分認(rèn)可。目前,已有多個相關(guān)行業(yè)指導(dǎo)原則發(fā)布,旨在積極推動RWD/RWE 在各類醫(yī)療產(chǎn)品全生命周期中的使用[4,37]。相比之下,目前RWD 對CDM的影響力仍較為有限,研究投入和臨床應(yīng)用之間存在較大差距。筆者根據(jù)現(xiàn)有文獻(xiàn)確定了以下潛在障礙,并相應(yīng)提出可行性建議。
高質(zhì)量的疾病登記數(shù)據(jù)和多中心EMR 的缺乏導(dǎo)致大多數(shù)現(xiàn)有可操作性決策輔助工具使用了單中心內(nèi)部驗證,大大限制了所產(chǎn)生的臨床工具的外推性。在我國,EMR 的實施主要是由政府推動的。據(jù)相關(guān)研究統(tǒng)計,2018 年我國一級、二級、三級醫(yī)院EMR的總體采用率為85.3%[38]??傮w來說,目前EMR 系統(tǒng)功能的評價指標(biāo)可大致分為3 種:低級階段(0~2 級,強調(diào)源數(shù)據(jù)采集)、中級階段(3~4 級,強調(diào)同一醫(yī)院內(nèi)各科室的數(shù)據(jù)共享和基本CDM 支持)、高級階段(5~8級,強調(diào)不同醫(yī)院間的信息共享和智慧型CDM 支持)[38-39]。根據(jù)2022 年國家衛(wèi)生健康委辦公廳發(fā)布的《2020 年度全國三級公立醫(yī)院績效考核國家監(jiān)測分析情況的通報》,截至2020 年,參評的三級公立醫(yī)院的EMR 系統(tǒng)功能應(yīng)用水平平均級別為3.65級[40],表明我國整體EMR 發(fā)展正處于中級階段,能夠?qū)崿F(xiàn)院內(nèi)不同部門之間的數(shù)據(jù)交換。此外,有91.26%的參評三級公立醫(yī)院達(dá)到3 級及以上水平,65.26%達(dá)到4 級及以上水平,基本實現(xiàn)院內(nèi)信息共享并初步支持CDM?;谏鲜霰尘埃瑔沃行腅MR 的廣泛應(yīng)用可能源于目前我國EMR系統(tǒng)的整體建設(shè)水平。
如上所述,大多數(shù)RWD 數(shù)據(jù)源并非為研究目的而設(shè)計,通常需要額外采集研究特定數(shù)據(jù)。即使在相同類型的RWD 數(shù)據(jù)源中,可用的數(shù)據(jù)元素也會存在差異[41]。由于醫(yī)療機構(gòu)可自行決定與研究人員共享的數(shù)據(jù)類別及范圍,數(shù)據(jù)元素的可及性因提供數(shù)據(jù)的醫(yī)療機構(gòu)而異[41-42]。特別是,我國獨特的就醫(yī)模式導(dǎo)致EMR 系統(tǒng)中通常缺乏縱向數(shù)據(jù),這在一定程度上限制了臨床RWD 支持長期決策的能力[41,43]。如果不使用自然語言處理等AI 技術(shù),而是從EMR 系統(tǒng)向研究數(shù)據(jù)庫手工轉(zhuǎn)錄非結(jié)構(gòu)化的EMR 數(shù)據(jù)(如影像和病理結(jié)果以及臨床醫(yī)生筆記),則會進(jìn)一步阻礙支持CDM的RWD 的普遍使用[44]。同時,我國使用RWD 的相關(guān)倫理審批制度還有待完善,并且缺乏中心倫理委員會。盡管目前對于使用二級數(shù)據(jù)庫進(jìn)行研究尚未有明確的倫理規(guī)定,但大多數(shù)研究人員選擇申請倫理審查[41,43]。尤其對于多中心研究來說,研究人員通常需要向各個RWD 數(shù)據(jù)源所在機構(gòu)的倫理委員會提交申請批準(zhǔn),以使用去標(biāo)識化的數(shù)據(jù),這為RWD 的廣泛使用增添了不確定性和挑戰(zhàn)性。
為了解決上述問題,有必要建立一個獨立的臨床研究平臺,使用自然語言處理等AI 技術(shù)將EMR 數(shù)據(jù)直接轉(zhuǎn)錄到該平臺上[44]。患者報告的縱向數(shù)據(jù)可以結(jié)合特定研究和常規(guī)收集的數(shù)據(jù)集成到該平臺中[43-44]。需要注意的是,相關(guān)多方開展合作是成功建立此類研究平臺的先決條件,包括醫(yī)院、大數(shù)據(jù)公司、學(xué)術(shù)界和監(jiān)管機構(gòu)等[41,43,45]。這些相關(guān)方的共同努力有助于確保并促進(jìn)數(shù)據(jù)共享,為產(chǎn)生高質(zhì)量RWD 奠定堅實的基礎(chǔ),從而產(chǎn)生高質(zhì)量的RWE 以支持CDM。
由于RWD 存在收集目的多樣、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)缺失等問題,目前我國RWD 質(zhì)量參差不齊[41-44],由此產(chǎn)生的RWE 質(zhì)量強度也存在差異,在一定程度上阻礙了RWD/RWE 在支持CDM 方面的廣泛應(yīng)用。無論是否使用AI 技術(shù),采用低質(zhì)量的RWD 所構(gòu)建的CDM模型或工具的臨床可用性都會大大降低[46-47]。造成RWD 質(zhì)量不足的主要因素包括數(shù)據(jù)缺失[45]、缺乏源數(shù)據(jù)驗證過程[42-43]、數(shù)據(jù)標(biāo)準(zhǔn)不一致[42]、缺乏數(shù)據(jù)通用模型等[43]。為進(jìn)一步推動RWD的應(yīng)用,近年來國家藥監(jiān)局藥品審評中心等監(jiān)管部門制定了一系列RWD 相關(guān)指導(dǎo)原則,旨在規(guī)范并提高RWD 的整體質(zhì)量以支持監(jiān)管決策。根據(jù)相關(guān)文件,數(shù)據(jù)的相關(guān)性和可靠性是評價RWD 質(zhì)量的關(guān)鍵因素[4,11]。其中,相關(guān)性是指RWD 數(shù)據(jù)源是否與所關(guān)注的臨床問題密切相關(guān),可靠性主要從數(shù)據(jù)的完整性、準(zhǔn)確性、透明性、質(zhì)量控制和質(zhì)量保證方面進(jìn)行評價。然而,目前監(jiān)管部門對于研究所用RWD 質(zhì)量的評估未有強制性要求,而是建議并提倡提前進(jìn)行充分溝通。
同時需要注意的是,系統(tǒng)性的RWE 質(zhì)量評估工具尚未形成。與傳統(tǒng)RCT 相比,RWE 在研究設(shè)計上存在固有的局限性[47]。目前廣泛應(yīng)用的RWE 研究類型主要包括橫斷面研究、回顧性隊列研究、疾病登記研究等觀察性研究。觀察性研究的主要局限性源于潛在的偏倚,包括選擇偏倚、信息偏倚以及各種混雜因素。在使用EMR 預(yù)測疾病長期預(yù)后時,排除缺少隨訪數(shù)據(jù)的患者數(shù)據(jù)可能會引入選擇偏倚。缺乏標(biāo)準(zhǔn)化的臨床術(shù)語可能會在多中心研究產(chǎn)生信息偏倚。為了最大程度減少選擇偏倚和信息偏倚,應(yīng)從研究設(shè)計階段進(jìn)行控制,采用科學(xué)、嚴(yán)謹(jǐn)?shù)难芯吭O(shè)計和評價工具。然而,現(xiàn)有針對觀察性研究的評估工具,如紐卡斯?fàn)?渥太華量表(the Newcastle-Ottawa Scale,NOS)[48]和比較效果研究的GRACE 準(zhǔn)則[49]并不能與RWE 完全兼容。在不考慮RWD數(shù)據(jù)源的相關(guān)性和可靠性的情況下,這些工具傾向于強調(diào)組間可比性,忽略了源數(shù)據(jù)質(zhì)量以及單臂研究的重要性。同時,由于缺乏隨機分組,對混雜因素的調(diào)整變得至關(guān)重要。常用的控制混雜因素的統(tǒng)計方法包括基于協(xié)變量多因素回歸模型、傾向性評分分析、工具變量、孟德爾隨機化等。在RWD/RWE支持CDM的實際應(yīng)用中,前兩種分析方法更為常見。然而,多因素回歸模型調(diào)整協(xié)變量和傾向性評分分析都只能控制已知的混雜因素,而不能校正未知或無法測量的因素。也就是說,依然可能存在殘留的混雜因素[50]。因此需要強調(diào)的是,RWD/RWE 無法取代RCT,而是對傳統(tǒng)RCT 的補充[47,51]。由RWD 產(chǎn)生的RWE 可以用于驗證或拓展RCT 的結(jié)果,但RCT仍然是確定臨床療效的金標(biāo)準(zhǔn)。另外,RWD/RWE 可通過發(fā)現(xiàn)新的疾病診斷生物標(biāo)志物和治療效果等方式產(chǎn)生假設(shè),并通過RCT檢驗假設(shè),以輔助相關(guān)指南制修訂從而支持CDM[51-52]。
通過多學(xué)科合作提高RWD質(zhì)量是進(jìn)一步促進(jìn)RWD/RWE 支 持CDM 的首要任務(wù)[41,43,45,47]。為此,有研究者提出了一種適用于我國的解決方案,旨在通過建立臨床研究源數(shù)據(jù)平臺,并與醫(yī)院合作采用源數(shù)據(jù)管理流程來加強源數(shù)據(jù)管理[53]。研究者將這一概念轉(zhuǎn)化為實踐,開創(chuàng)性地開發(fā)了電子源數(shù)據(jù)記錄(eSource record,ESR)工具,形成了一個集臨床源數(shù)據(jù)采集、治理和管理的一體化解決方案[54]。ESR 使用藥物臨床試驗質(zhì)量管理規(guī)范(GCP)中數(shù)據(jù)質(zhì)量控制和可追溯性為指導(dǎo)原則,以保證源數(shù)據(jù)質(zhì)量。初步評估顯示,該工具可以提高數(shù)據(jù)采集效率,并減少從EMR 手動轉(zhuǎn)錄至研究數(shù)據(jù)集的工作量[55]。此外,還應(yīng)加強對RWD/RWE 的管理,不僅要從監(jiān)管的角度推進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)化并強制實施質(zhì)量要求,還要從學(xué)術(shù)研究的角度構(gòu)建系統(tǒng)化的RWD/RWE 質(zhì)量評估框架,以提高用于支持CDM 的RWD/RWE 的質(zhì)量[41,43,45]。
快速發(fā)展的RWD/RWE 領(lǐng)域為醫(yī)療行業(yè)以數(shù)據(jù)為驅(qū)動的創(chuàng)新帶來巨大的希望。在傳統(tǒng)RCT的基礎(chǔ)上,RWD/RWE 進(jìn)一步豐富了支持CDM 的臨床證據(jù)的維度,驗證藥物治療在臨床實踐中的真實效果,提供在真實臨床實踐中與RCT 互補的額外證據(jù),并形成新的臨床研究假設(shè)。然而,現(xiàn)有的RWD/RWE 在CDM 中的應(yīng)用性和可接受程度仍有待提高。為此,需要多學(xué)科交叉融合以及相關(guān)多方間密切合作,從而有效促進(jìn)RWD/RWE 的系統(tǒng)性使用及持續(xù)發(fā)展,進(jìn)一步推動實現(xiàn)我國CDM 中的循證和高質(zhì)量目標(biāo)。