陸芳 李慶娜 趙陽 高蕊
摘要:以一個中藥新藥Ⅲ期臨床研究為例,簡要介紹在數據庫中構建人口統(tǒng)計學、受試者特征、臨床事件、病史、量表、實驗室檢查、不良事件等7個中藥新藥臨床研究中常用的數據采集模塊,以及將其轉換到研究數據表格模型(SDTM)的過程,探討臨床數據交換標準協會(CDISC)臨床數據交換標準在中藥新藥臨床研究中應用的可行性和需要注意的問題。
關鍵詞:中藥新藥臨床研究;臨床數據交換標準;數據管理
DOI:10.3969/j.issn.1005-5304.2016.01.002
中圖分類號:R2-05 文獻標識碼:A 文章編號:1005-5304(2016)01-0009-06
A Preliminary Discussion of Application of CDISC Standards in Clinical Research Data Management of New Traditional Chinese Medicine LU Fang, LI Qing-na, ZHAO Yang, GAO Rui (Clinical Pharmacology Institute of Xiyuan Hospital, China Academy of Chinese Medical Sciences, Beijing 100091, China)
Abstract: In this article, a new TCM clinical trial of phase Ⅲ was served as an example of application of Clinical Data Interchange Standards Consortium (CDISC). It briefly introduced seven data acquisition modules commonly used in clinical research of new traditional Chinese medicine, namely demographics, subject characteristic, clinical event, medical history, questionnaire, laboratory inspection and adverse event. It also introduced the process of transferring the above modules to Study Data Tabulation Models (STDM), and discussed the feasibility and some issues that required attention of CDISC application in clinical research of new traditional Chinese medicine.
Key words: clinical research of new traditional Chinese medicine;clinical data interchange standards;data management
臨床數據交換標準協會(Clinical Data Interchange Standards Consortium,CDISC)是一個全球性的、開放的、多學科的、非盈利性組織,通過建立一系列臨床研究數據的標準,如臨床數據采集標準(Clinical Data Acquisition Standards Harmonization,CDASH)、實驗室數據模型(Laboratory Model,LAB)、操作數據模型(Operational Data Model,ODM)、研究數據表格模型(Study Data Tabulation Model,SDTM)、分析數據庫模型(Analysis Dataset Model,ADaM)等,來支持臨床研究數據與元數據的采集、交換、遞交和儲存,以優(yōu)化研究實施、數據交流、統(tǒng)計分析及最后向管理部門遞交資料的流程,大大縮短研究周期、節(jié)省費用[1]。2014年12月,美國食品藥品監(jiān)督管理局(Food and Drug Administration,FDA)發(fā)布了具有約
束力的數據申報標準指南,要求24個月后開始的臨床試驗必須使用FDA要求的標準、格式和術語進行注冊申請遞交,以避免管理部門在審查研究數據時花費較多的資源[2]。我國藥政當局也正在著手制定適合我國,特別是中藥新藥臨床研究的數據采集和申報標準,本文從中藥新藥研究應用CDISC標準實例出發(fā),探討其應用的可行性和需要注意的問題。
1 建立機構臨床研究數據采集標準
筆者曾對CDISC標準進行過解讀[3],CDASH由CDISC于2008年10月制定,其目的是簡化和規(guī)范各個臨床研究中心的數據采集,為設計病例報告表(Case Report Form,CRF)提供標準。其由一個基本的數據采集字段集(包括定義變量名稱、解釋、元數據)組成,適用于臨床研究階段絕大多數CRF的設計。SDTM圍繞著臨床研究過程中采集的一系列觀察信息構建,它規(guī)定遞交到藥政管理部門的臨床研究數據庫和數據庫變量的標準,包括數據庫的結構、目的、特征和其所包含的內容,從而使評審人員能夠正確理解所遞交的數據庫信息。
要提交符合SDTM的數據,為減少后期數據庫的映射工作,最捷徑的做法是在創(chuàng)建數據庫時即按照CDASH和SDTM對變量及元數據進行定義,并通過define.xml文件對數據的結構和內容進行描述。筆者參照CDASH和SDTM制定了本機構臨床研究數據采集標準,其中數據采集模塊共分為18大類,即一般識別變量(Common Identifier Variables)、不良事件(Adverse Events,AE)、伴隨治療(Concomitant Medications,CM)、人口統(tǒng)計學(Demographics,DM)、研究處理情況(Disposition,DS)、藥物依從性(Drug Accountability,DA)、心電圖檢查(ECG Test Results,EG)、研究藥物(Exposure,EX)、納入排除標準(Inclusion/Exclusion Criteria Not Met,IE)、實驗室檢查(Laboratory Test Results,LB)、病史(Medical History,MH)、體格檢查(Physical Examination,PE)、方案偏離(Protocol Deviation,DV)、受試者特征(Subject Characteristics,SC)、物質使用情況(Substance Use,SU)、生命體征(Vital Signs,VS)、量表(Questionnaire,QS)、臨床事件(Clinical Event,CE)。數據庫中的變量分為CDISC和機構標準,能夠直接按照CDASH或SDTM命名的變量為CDISC,否則為機構標準,在中藥新藥臨床研究中參照此標準進行數據采集。
2 研究實例分析
以一個中藥新藥Ⅲ期臨床研究為例,簡要介紹臨床研究中需要采集的受試者特征、人口統(tǒng)計學、臨床事件、病史、量表、不良事件、實驗室檢查等7類數據及將其轉換為便于藥政管理部門審核的SDTM數據集的過程。
研究實例:A藥治療急性氣管-支氣管炎(痰熱阻肺證)隨機雙盲、安慰劑平行對照、多中心Ⅲ期臨床研究。研究對象為符合急性氣管-支氣管炎西醫(yī)診斷標準及痰熱阻肺證中醫(yī)辨證標準,年齡在18~65歲之間,自愿簽署知情同意書者。試驗組藥物為A藥(10 mL/次,每日3次),對照組為安慰劑(10 mL/次,每日3次),療程6 d。主要療效指標為咳嗽、咳痰癥狀的改善。本試驗數據管理基于電子化數據管理系統(tǒng),在臨床試驗開始前,需要對整個試驗中的數據管理做出安排,根據試驗方案及相關文件,制定數據管理計劃。參考機構數據采集標準,明確所要收集的數據及其類型,設計數據采集表格。為方便后期數據庫的建立、數據的錄入和提取,在設計數據采集表格時,參考CDASH,盡量以CDASH提供的域為單位進行CRF模塊布局,使用各域中推薦的變量,其他變量根據方案要求靈活選擇;同時,使用CDISC提供的受控術語作為變量結果代碼。完成紙質CRF的設計及注釋后,在電子數據采集系統(tǒng)中構建電子病例報告表(eCRF)。在數據庫設計階段引入CDISC標準,保持數據標準的統(tǒng)一和數據的可追溯性,可從數據庫中直接抽取出大量符合SDTM的數據集,進而減少后期繁雜的映射轉換。
2.1 受試者特征
SC是與受試者相關,并且沒有被采集到其他域中的數據。如受試者姓名拼音首字母、婚姻狀況、受教育程度等。SC域是DM數據的擴展,每位受試者只采集1次數據,一般情況下試驗期間該域中的數據是不會更改的。
從電子化數據管理系統(tǒng)導出的數據看,SC數據集為非標準化結構(見表1)。經過轉換,原來在數據庫中的變量名“MARISTAT(婚姻)”、“EDLEVEL(受教育程度)”“EMPJOB(工作性質)”轉化為變量“SCTESTCD(受試者特征簡稱)”和“SCTEST(受試者特征)”的觀測結果,數據結構呈現符合SDTM的結構(見表2)。
2.2 人口統(tǒng)計學
DM數據的結構是固定的,包括出生日期、年齡、性別、民族、人種及國家。在創(chuàng)建DM模塊變量池時,為了收集受試者的民族信息情況,我們使用了CDASH中的變量ETHNIC(族群),另外建立了一個變量“ETHNIOTH(其他民族)”,作為機構標準(見表3的CDASH數據集)。在轉化為SDTM數據集時,按照CDISC中“RACEOTH(其他人種)”的處理方式,將相關數據放在DM域補充數據集(見表3的SUPPDM數據集)中。對于以SDTM形式上報的數據,要定義一段時間作為受試者“接受試驗干預”的參照時間段,開始和結束日期分別以變量“RFSTDTC(參照開始日期)”和“RFENDTC(參照結束日期)”表示。RFSTDTC是為研究開始的第1日,在本實例研究中,根據試驗方案,把這段時間定義為從第1次服藥日期到最后1次服藥日期的時間。
2.3 臨床事件
CE域是獲取研究中疾病的發(fā)作癥狀或體征,或者雖然可能導致不良事件,但事件本身并不構成不良事件。本實例的研究疾病是急性氣管-支氣管炎(痰熱阻肺證),有關該疾病的診斷信息,為區(qū)別于既往病史信息的采集,將其記錄在CE域。需要說明的是,在CDASH中并沒有CE域,為了方便數據收集,在建庫時分西醫(yī)診斷和中醫(yī)辨證2個變量收集原始數據,后期再轉換為縱向CE數據集。事件名稱需轉換為術語,由變量“CEDECOD(源于詞典的術語)”收集,西醫(yī)診斷可以使用國際醫(yī)學用語詞典(MedDRA)中的規(guī)范術語,中醫(yī)辨證可參考《中醫(yī)臨床診療術語·證候部分》(GB/T 16751.2-1997)中的術語。見表4、表5。
2.4 病史
MH數據指受試者在試驗開始之前的病史,包括一般病史、過敏病史、生殖病史或其他特定疾病的病史。本實例在數據庫中采用1個病例多條記錄的模式收集MH數據,導出的數據為縱向數據結構,其中以“MHCAT(病史分類)”區(qū)分“一般病史”和“過敏病史”(見表6)?!癕HENRF(結束狀態(tài))”是根據研究參考時期定義病史的結束狀態(tài),對于參考時期的定義每個研究可以不同。本實例研究參考時期以人口統(tǒng)計學數據集中的定義為準,即以第1次服藥日期作為研究開始時間,結束時間為最后1次服藥日期。該參考時期內如果病史未結束,則結果記為“繼續(xù)”,病史結束日期為“空”;否則,則要記錄病史結束日期。
2.5 量表
QS設置的每個問題均有一個特定的數字“得分”,計算這些得分的總和可得到總評分。QS數據可包括但不限于受試者報告的結果及驗證或未經驗證的調查量表,如漢密頓抑郁量表、阿爾茨海默病評定量表等。
在中醫(yī)臨床研究中一般會收集中醫(yī)臨床癥狀積分情況,本例在建庫時將中醫(yī)癥狀觀察作為QS域中的一個分類。對于這類標準二維表格式的數據,我們可以直接導出縱向結構數據(見表7采集數據集),轉化為SDTM數據集時,我們將變量“QSCAT(量表分類)”賦值為“QSCSO(臨床癥狀觀察)”;對于變量“QSTESTCD(問題簡稱)”尚未形成規(guī)范的受控術語,則以模塊名稱QSCSO加阿拉伯數字的形式表示(見表7提交數據集)。變量“QSDY(研究天數)”描述了從參考日期作為第1日到本次訪視量表填寫日期的天數,該變量通過量表填寫日期與DM域“RFSTDTC(參照開始日期)”的比較而得到。從RFSTDTC每過1 d“QSDY(研究天數)”的值就增加1,往前1 d變量值就減1。
2.6 不良事件
對于AE,和病史的數據采集一樣,直接應用SDTM采集,在數據庫中采用1個病例多條記錄的模式收集數據,導出的數據為縱向數據結構,其SDTM數據集樣式見表8。其中,必需變量“AEDECOD(字典編碼事件名稱)”一般使用MedDRA中的首選語(PT),但中醫(yī)臨床試驗中出現的一些不良事件名稱如“上火”“潮熱”等還不能在MedDRA中找到規(guī)范的編碼。此外,對于與該條AE關聯的實驗室檢查結果,使用相關記錄(RELREC)數據集進行關聯,其關系類型(RELTYPE)為一對一(ONE),對該名受試者的關系標識符(RELID)為“A”(見表9)。
2.7 實驗室檢查
LB域存儲CRF采集或來自中心實驗室的檢查數據。在本實例研究中,為了方便數據的采集,在建庫時,將LB域分為幾個亞模塊,分別采集血常規(guī)、血生化、尿常規(guī)和便常規(guī)數據。在轉化為符合SDTM標準要求的數據集時,需要將幾個亞模塊進行拼接,并將變量“LBCAT(實驗室檢查種類)”賦值為檢查結果對應的亞模塊的名稱。例如,血常規(guī)檢查數據對應的LBCAT的結果為“血常規(guī)”。另外,對于LB域,除了收集是否在正常值范圍內外,還經常會收集“臨床意義判定”和“異常解釋說明”。但是在CDASH和SDTM中實驗室檢查域均無該變量,故筆者建庫時在LB域中增加變量“LBCLSIG(是否有臨床意義)”和“LBCOVAL(異常解釋說明)”。在轉化為SDTM標準變量時,將變量LBCLSIG記錄在LB域補充數據集SUPPLB,變量LBCOVAL記錄在注釋域(Comment Domain,CO)中,以“RDOMAIN(關聯域名)”、“IDVAR(標識變量)”和“IDVARVAL(標識變量值)”將LB域與補充數據集SUPPLB和COMMENTS數據集聯系起來(見表10)。
3 討論
從數據庫建庫開始引入CDASH和SDTM,具有一些明顯的優(yōu)勢[4]。統(tǒng)一的數據收集定義可促進不同項目研究間數據庫設計和結構的標準化,使數據直接以上報遞交的SDTM格式儲存,簡化甚至消除了提取數據的再操作,使數據流程更加合理化[5]。但也存在一定缺陷,雖然CDASH是根據SDTM結構建立的數據采集標準,但畢竟二者的目的不同,因此增加了數據庫內的映射復雜性。同時由于CDASH優(yōu)化的線性法要依賴使用的數據庫系統(tǒng),如果其基本表結構對應并不友好的錄入界面,還可能會使數據錄入過程復雜化[6-7]。
通過實例分析,中醫(yī)和西醫(yī)之間其臨床研究數據采集并沒有太多差異,基本可以按照CDASH或SDTM中的域或變量結構來采集數據。同時,受控術語對于數據標準化亦很重要,CDISC受控術語是一套CDISC開發(fā)或CDISC采納的標準表達(值),適用于CDISC定義的數據集里的數據條目,支持CDISC各個基本標準(如SDTM、CDASH、ADaM和SEND)及所有疾病/治療領域數據標準對受控術語的需求[8]。目前,在應用CDISC標準的過程中,存在的主要問題是中醫(yī)臨床研究相關標準及其術語的缺乏,包括中醫(yī)臨床癥狀類量表和具有中醫(yī)特點的控制術語,如CDISC中合并用藥的“劑量單位”“劑型”“給藥途徑”,應補充中醫(yī)特有的控制術語,如艾灸一壯(劑量單位),湯劑、散劑、膏方(劑型),煙熏、沐?。ńo藥途徑)。
可喜的是,目前在國家食品藥品監(jiān)督管理總局倡導下已經成立臨床試驗數據標準化工作指導組,其下設的TCM專業(yè)小組對中醫(yī)臨床研究如何實現CDISC標準進行了研究和有益的探索[9]。CDISC標準在中醫(yī)臨床研究中的使用還處于起步階段,由于對CDISC標準理解的不同,可能會造成數據庫的建設和后期轉換整理時映射難度和映射結果的差異,例如,有的數據管理單位可能會把研究疾病相關中醫(yī)臨床癥狀放在事件或干預的“相關發(fā)現 (Findings About)”中進行收集。對此,應加強對CDISC標準的學習和研討,逐漸形成行業(yè)內的標準,實現助力數據審評、數據交換的最終目的。
參考文獻:
[1] CDISC. CDISC Vision and Mission[EB/OL].[2015-01-28].http:// www.cdisc.org/CDISC-Vision-and-Mission.
[2] FDA. Study Data Standards for Submission to CDER[EB/OL]. [2015-01-28].http://www.fda.gov/drugs/developmentapprovalprocess/ formssubmissionrequirements/electronicsubmissions/ucm248635. htm.
[3] 陸芳,高蕊,唐旭東,等.臨床研究中的數據管理標準CDISC及其應用前景[J].中國新藥雜志,2011,20(24):2400-2404.
[4] 李庚,李曉彥,溫澤淮.臨床數據交換標準協會標準在中醫(yī)藥臨床研究病例報告表設計中的應用[J].廣州中醫(yī)藥大學學報,2014,31(1):138- 141.
[5] 黎燕蘭,胡鏡清,劉保延.CDISC標準與中醫(yī)藥臨床研究數據標準化[J].世界科學技術-中醫(yī)藥現代化,2012,14(6):2109-2114.
[6] 董雯雯.CDISC標準在藥物臨床試驗中的應用[D].上海:復旦大學, 2012.
[7] 向楠,鄧阿黎,丁曉娟,等.中藥新藥臨床試驗病例報告表的標準化及電子化研究探討[J].中藥新藥與臨床藥理,2006,17(4):297-299.
[8] National Cancer Institute. CDISC Terminology[EB/OL]. [2015-01-28].http://www.cancer.gov/cancertopics/cancerlibrary/ terminologyresources/cdisc.
[9] 王駿,韓景靜,黃欽.從藥品技術審評談臨床試驗的數據標準化[J].中國新藥雜志,2014,23(19):2228-2230,2279.
(收稿日期:2015-06-18)
(修回日期:2015-07-20;編輯:蔡德英)