国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

臨床研究數(shù)據(jù)清理經(jīng)驗(yàn)和實(shí)例

2018-09-03 01:43:12路甲鵬
中國(guó)循環(huán)雜志 2018年8期
關(guān)鍵詞:核查邏輯錯(cuò)誤

路甲鵬

前幾期《臨床研究系列講座》文章針對(duì)研究設(shè)計(jì)、實(shí)施和質(zhì)量控制進(jìn)行了詳細(xì)的闡述,對(duì)開(kāi)展臨床研究設(shè)計(jì)和實(shí)施具有重要指導(dǎo)作用。然而,“殘酷”的現(xiàn)實(shí)告訴我們,再?lài)?yán)謹(jǐn)?shù)脑O(shè)計(jì)、再?lài)?yán)格的研究管理和質(zhì)量控制也無(wú)法避免“錯(cuò)誤”數(shù)據(jù)的出現(xiàn)。所以,數(shù)據(jù)清理是臨床研究的必要過(guò)程,對(duì)提高數(shù)據(jù)分析效率和研究結(jié)果可靠性具有重要意義。但數(shù)據(jù)清理的局限性在于只能針對(duì)錄入到數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行清理,若臨床研究中漏報(bào)不良事件,則無(wú)法通過(guò)數(shù)據(jù)清理發(fā)現(xiàn)。因此,臨床研究需要研究設(shè)計(jì)、實(shí)施管理、質(zhì)量控制以及數(shù)據(jù)清理等環(huán)節(jié)的相輔相成,才能確保研究質(zhì)量。本文擬匯總既往數(shù)據(jù)清理經(jīng)驗(yàn),介紹臨床研究數(shù)據(jù)清理的流程和關(guān)鍵點(diǎn),并以“冠心病醫(yī)療結(jié)果評(píng)價(jià)和臨床轉(zhuǎn)化研究(China PEACE)”數(shù)據(jù)清理過(guò)程為例說(shuō)明臨床研究數(shù)據(jù)清理的邏輯順序及注意事項(xiàng),為臨床研究者開(kāi)展數(shù)據(jù)清理提供借鑒。

1 臨床研究數(shù)據(jù)清理的具體流程

數(shù)據(jù)清理是研究過(guò)程中針對(duì)數(shù)據(jù)重復(fù)或缺失、異常值、邏輯錯(cuò)誤三類(lèi)數(shù)據(jù)問(wèn)題進(jìn)行識(shí)別、查找原因及處理的過(guò)程。其中,連續(xù)變量的異常值主要是指變量取值超出臨床所能接受的合理范圍,如收縮壓為700 mmHg(1 mmHg=0.133 kPa);分類(lèi)變量的異常值是指變量取值與病例報(bào)告表(Case Report Form,CRF)編碼范圍不一致,如CRF中性別變量編碼:男性為1,女性為2,但實(shí)際可能出現(xiàn)性別為0或3等異常值。邏輯錯(cuò)誤的范圍較廣,如日期先后順序錯(cuò)誤、不同來(lái)源同一變量取值不一致、不同時(shí)間點(diǎn)變量取值不符合實(shí)際等問(wèn)題。數(shù)據(jù)清理包括數(shù)據(jù)問(wèn)題核查、確定產(chǎn)生數(shù)據(jù)問(wèn)題的原因、以及處理問(wèn)題數(shù)據(jù)三個(gè)核心過(guò)程[1]。通過(guò)這三個(gè)核心過(guò)程的反復(fù)循環(huán),不斷提升數(shù)據(jù)質(zhì)量。

數(shù)據(jù)問(wèn)題核查:數(shù)據(jù)問(wèn)題核查可通過(guò)人工檢查和電腦程序檢查兩種方式實(shí)現(xiàn),建議通過(guò)電腦程序在CRF或人工錄入的數(shù)據(jù)庫(kù)中進(jìn)行核查,能夠提高效率、避免新錯(cuò)誤的產(chǎn)生。在正式開(kāi)始數(shù)據(jù)清理前,負(fù)責(zé)數(shù)據(jù)清理的研究人員應(yīng)根據(jù)研究方案、CRF以及數(shù)據(jù)清理計(jì)劃編寫(xiě)和測(cè)試邏輯核查程序。對(duì)于數(shù)值變量,應(yīng)在程序中定義異常值的范圍,比如收縮壓在60~250 mmHg范圍以外為異常。對(duì)于主要結(jié)局指標(biāo)相關(guān)變量、日期變量以及多個(gè)來(lái)源同一變量,應(yīng)在程序中定義邏輯錯(cuò)誤的判定條件,比如研究記錄某受試者出院后發(fā)生結(jié)局事件,則該結(jié)局事件發(fā)生的日期應(yīng)在出院日期之后,否則為邏輯錯(cuò)誤。通過(guò)邏輯核查程序輸出報(bào)告,分類(lèi)變量用頻數(shù)和百分比表示,連續(xù)變量用描述統(tǒng)計(jì)量(如均值、標(biāo)準(zhǔn)差、最大值、最小值等)表示,也可以采用箱圖、散點(diǎn)圖等展示數(shù)據(jù)分布,旨在便于研究人員發(fā)現(xiàn)“錯(cuò)誤”數(shù)據(jù)。同時(shí)產(chǎn)生數(shù)據(jù)質(zhì)疑表,應(yīng)包括“錯(cuò)誤數(shù)據(jù)”所對(duì)應(yīng)的變量、原值、錯(cuò)誤類(lèi)型、對(duì)應(yīng)的受試者ID、研究單位信息以及日期等,方便記錄數(shù)據(jù)質(zhì)疑的整個(gè)過(guò)程。

確定產(chǎn)生數(shù)據(jù)問(wèn)題的原因:該過(guò)程對(duì)不斷改進(jìn)數(shù)據(jù)清理過(guò)程具有重要作用,應(yīng)由主要研究者、負(fù)責(zé)數(shù)據(jù)清理的研究人員、數(shù)據(jù)分析人員及其他主要研究人員共同參與?;跀?shù)據(jù)核查報(bào)告和質(zhì)疑表,研究人員可以結(jié)合臨床研究方案、CRF以及臨床實(shí)踐,深入剖析每個(gè)或每類(lèi)“錯(cuò)誤”數(shù)據(jù)的原因以及產(chǎn)生問(wèn)題的環(huán)節(jié),進(jìn)而確定處理“錯(cuò)誤”數(shù)據(jù)的策略。此外,不僅要從某個(gè)變量角度出發(fā),還要從研究單位的角度出發(fā),分析“錯(cuò)誤”數(shù)據(jù)是否存在研究單位聚集性,有利于發(fā)現(xiàn)研究實(shí)施過(guò)程中存在的問(wèn)題,消除系統(tǒng)誤差,例如經(jīng)常出現(xiàn)數(shù)據(jù)異常的研究單位是否是因?yàn)檠芯咳藛T變動(dòng),培訓(xùn)不到位所致等。最后,該過(guò)程還可以幫助研究人員對(duì)已建立的邏輯核查程序進(jìn)行優(yōu)化,包括數(shù)值變量合理取值范圍是否需要調(diào)整,是否需要增加新的邏輯核查條件等。例如,數(shù)據(jù)質(zhì)疑表中記錄某受試者收縮壓為700 mmHg,分析原因發(fā)現(xiàn)可能為研究者填寫(xiě)錯(cuò)誤,可以由研究者核對(duì)后修改。但在該過(guò)程中主要研究者和負(fù)責(zé)數(shù)據(jù)清理的研究人員應(yīng)考慮如何避免在發(fā)生類(lèi)似錯(cuò)誤,比如在電子CRF中增加邏輯核查程序。

處理問(wèn)題數(shù)據(jù):每次數(shù)據(jù)核查完成后,研究人員應(yīng)將產(chǎn)生的質(zhì)疑表以電子或紙質(zhì)文檔的形式發(fā)送給各研究單位。各研究單位工作人員對(duì)每個(gè)疑問(wèn)進(jìn)行認(rèn)真核對(duì),并逐一答復(fù)。負(fù)責(zé)數(shù)據(jù)清理的人員檢查返回的質(zhì)疑表后,根據(jù)質(zhì)疑表對(duì)數(shù)據(jù)進(jìn)行處理。處理方式包括更正、刪除或保留原值。若無(wú)法找到異常值所對(duì)應(yīng)的正確數(shù)值,則刪除該異常值。若研究單位對(duì)可能存在問(wèn)題的數(shù)值變量進(jìn)行再次測(cè)量,且兩次結(jié)果相近,可用兩次測(cè)量結(jié)果的均值替換原有數(shù)值。若質(zhì)疑表有未被解決的質(zhì)疑,將以新的質(zhì)疑表形式再次發(fā)出。如果數(shù)據(jù)缺失為隨機(jī)缺失,在后續(xù)分析過(guò)程中可采用均值或多重填補(bǔ)等方法進(jìn)行填補(bǔ)[2]。如果數(shù)據(jù)缺失超過(guò)30%,建議盡量不使用該變量。如果是結(jié)局事件出現(xiàn)缺失,如患者是否死亡變量缺失,則不能填補(bǔ)。

2 臨床研究數(shù)據(jù)清理的關(guān)鍵點(diǎn)

明確數(shù)據(jù)清理計(jì)劃:研究人員在設(shè)計(jì)階段應(yīng)制定數(shù)據(jù)清理計(jì)劃,用于指導(dǎo)數(shù)據(jù)清理的各項(xiàng)工作。數(shù)據(jù)清理計(jì)劃具體內(nèi)容應(yīng)包括數(shù)據(jù)清理的時(shí)間安排和頻率、數(shù)據(jù)清理內(nèi)容、不同類(lèi)型數(shù)據(jù)問(wèn)題(如缺失、異常值或邏輯錯(cuò)誤等)的處理方法、數(shù)據(jù)問(wèn)題的反饋糾正流程、數(shù)據(jù)庫(kù)鎖定及存儲(chǔ)、各環(huán)節(jié)的具體責(zé)任人以及文件管理等。根據(jù)研究需要,還包括紙質(zhì)或電子CRF交接流程、數(shù)據(jù)錄入方法以及質(zhì)量控制、數(shù)據(jù)庫(kù)安全等內(nèi)容。

盡早開(kāi)始數(shù)據(jù)清理:絕大多數(shù)數(shù)據(jù)問(wèn)題是在研究實(shí)施過(guò)程中出現(xiàn)的,有些數(shù)據(jù)缺失或異常很難彌補(bǔ)。而對(duì)數(shù)據(jù)問(wèn)題的處理需要各研究單位進(jìn)行核實(shí)、更正,甚至需要研究受試者的配合。此外,若由于CRF設(shè)計(jì)有誤導(dǎo)致的數(shù)據(jù)問(wèn)題,可通過(guò)修改CRF避免數(shù)據(jù)錯(cuò)誤的再次出現(xiàn)。因此,數(shù)據(jù)清理應(yīng)在數(shù)據(jù)采集開(kāi)始后盡早開(kāi)始,不應(yīng)在研究數(shù)據(jù)采集結(jié)束后才進(jìn)行數(shù)據(jù)清理。

做好數(shù)據(jù)清理記錄:首先,應(yīng)記錄清理數(shù)據(jù)庫(kù)的基本信息,如數(shù)據(jù)庫(kù)產(chǎn)生的日期、樣本量等。數(shù)據(jù)清理過(guò)程中所產(chǎn)生的數(shù)據(jù)質(zhì)疑表和邏輯核查報(bào)告應(yīng)進(jìn)行歸檔保存。數(shù)據(jù)質(zhì)疑表作為數(shù)據(jù)更改的原始記錄必須由各研究單位負(fù)責(zé)回復(fù)疑問(wèn)的工作人員、負(fù)責(zé)數(shù)據(jù)清理研究人員簽名確認(rèn),并進(jìn)行妥善保存。在數(shù)據(jù)庫(kù)中進(jìn)行問(wèn)題數(shù)據(jù)處理應(yīng)保留修改記錄。

數(shù)據(jù)庫(kù)和邏輯核查程序的版本管理:數(shù)據(jù)清理后可能會(huì)根據(jù)數(shù)據(jù)清理發(fā)現(xiàn)的問(wèn)題對(duì)CRF進(jìn)行修改,將導(dǎo)致數(shù)據(jù)庫(kù)結(jié)構(gòu)、邏輯核查程序均發(fā)生相應(yīng)變化。因此,無(wú)論采用紙質(zhì)還是電子CRF,均應(yīng)對(duì)每次數(shù)據(jù)清理的數(shù)據(jù)庫(kù)和邏輯核查程序進(jìn)行版本管理,提高數(shù)據(jù)清理效率,便于跟蹤和回溯數(shù)據(jù)清理過(guò)程。

3 臨床研究數(shù)據(jù)清理實(shí)例

China PEACE中的前瞻性急性心肌梗死研究是一項(xiàng)前瞻性疾病注冊(cè)登記研究,在全國(guó)約40家二級(jí)和三級(jí)醫(yī)院連續(xù)入選超過(guò)4 000例急性心肌梗死患者并進(jìn)行出院后隨訪(fǎng),采集患者社會(huì)經(jīng)濟(jì)學(xué)、疾病診斷、質(zhì)量及其預(yù)后等信息,旨在評(píng)價(jià)各項(xiàng)冠心病治療措施在國(guó)人中使用的實(shí)際影響因素、安全性、有效性和效價(jià)比,建立適合國(guó)人并簡(jiǎn)單易行的風(fēng)險(xiǎn)評(píng)估模型,以最優(yōu)化的臨床實(shí)踐模式和醫(yī)療資源配置改善急性心肌梗死患者的預(yù)后[3]。

數(shù)據(jù)來(lái)源及內(nèi)容:(1)調(diào)查問(wèn)卷:人口學(xué)信息、社會(huì)經(jīng)濟(jì)學(xué)信息、既往病史、危險(xiǎn)因素、健康狀況評(píng)價(jià)量表以及出院后發(fā)生的結(jié)局事件。(2)病歷:疾病診斷、發(fā)病情況、心電圖、冠狀動(dòng)脈造影等輔助檢查報(bào)告、院內(nèi)治療措施、藥物治療、出院醫(yī)囑、院內(nèi)結(jié)局事件等。(3)冠狀動(dòng)脈造影影像。(4)生物樣本。由于數(shù)據(jù)來(lái)源和數(shù)據(jù)庫(kù)結(jié)構(gòu)(醫(yī)囑、隨訪(fǎng)事件等數(shù)據(jù)庫(kù)為一對(duì)多的結(jié)構(gòu))的不同,最終形成六個(gè)數(shù)據(jù)庫(kù):調(diào)查問(wèn)卷、病歷、醫(yī)囑、隨訪(fǎng)事件、各研究單位實(shí)驗(yàn)室檢查結(jié)果和中心性實(shí)驗(yàn)室檢查結(jié)果。

數(shù)據(jù)清理邏輯順序和注意事項(xiàng):該研究的主要目的是分析識(shí)別影響我國(guó)急性心肌梗死患者主要心血管事件發(fā)生的影響因素,建立風(fēng)險(xiǎn)預(yù)測(cè)模型,為改善臨床實(shí)踐提供循證支持。圍繞該研究目的,我們按照如下邏輯順序,針對(duì)數(shù)據(jù)重復(fù)或缺失、異常值和邏輯錯(cuò)誤三類(lèi)問(wèn)題開(kāi)展數(shù)據(jù)清理:

首先,關(guān)注研究的關(guān)鍵變量和主要結(jié)局指標(biāo),如受試者ID、時(shí)間變量、隨訪(fǎng)期間事件。結(jié)合病案號(hào)等客觀記錄信息,清理受試者ID錯(cuò)誤、重復(fù)或各來(lái)源數(shù)據(jù)ID不一致等問(wèn)題,確保受試者ID的唯一性。臨床研究包含多個(gè)時(shí)間變量,如發(fā)病日期、入院日期、各項(xiàng)檢查日期、出院日期、事件日期和死亡日期。為了遵循臨床實(shí)踐的邏輯順序,選擇入院日期和出院日期作為優(yōu)先清理的時(shí)間變量,并作為清理其他時(shí)間或判定醫(yī)療服務(wù)質(zhì)量的基準(zhǔn)。例如,急性心肌梗死醫(yī)療質(zhì)量研究會(huì)關(guān)注入院24小時(shí)內(nèi)用藥情況,可通過(guò)比較入院具體時(shí)間和院內(nèi)醫(yī)囑中記錄的首次開(kāi)藥時(shí)間判斷是否給予及時(shí)藥物治療。此外,關(guān)注出院日期、事件日期、死亡日期的前后邏輯關(guān)系,對(duì)判定院內(nèi)或院外死亡,院內(nèi)或院外心血管事件具有決定作用。隨訪(fǎng)期間心血管事件的清理主要是心血管事件的類(lèi)型(死亡事件或其他事件)和發(fā)生時(shí)間。心血管事件的診斷是否正確,應(yīng)由臨床專(zhuān)業(yè)醫(yī)師判定,不在數(shù)據(jù)清理的范疇。

其次,清理心血管事件相關(guān)的醫(yī)院、醫(yī)療服務(wù)和患者水平影響因素。部分患者水平影響因素可以從病歷和調(diào)查問(wèn)卷兩個(gè)來(lái)源獲取,可以相互補(bǔ)充。例如既往病史,通常調(diào)查問(wèn)卷采集的信息比病歷記錄的更全面。如果出現(xiàn)病歷和調(diào)查問(wèn)卷數(shù)據(jù)的不一致,需根據(jù)臨床診療實(shí)踐和研究經(jīng)驗(yàn)進(jìn)行判斷,以更可靠的數(shù)據(jù)來(lái)源為準(zhǔn),比如患者職業(yè)應(yīng)以調(diào)查問(wèn)卷為準(zhǔn),醫(yī)保支付類(lèi)型以病歷為準(zhǔn)。如果數(shù)據(jù)清理時(shí)遇到?jīng)]有證據(jù)支持的數(shù)據(jù)問(wèn)題,可暫時(shí)不清理,撰寫(xiě)報(bào)告或科研論文寫(xiě)作時(shí),根據(jù)實(shí)際需求再單獨(dú)處理(表 1)。

表1 研究實(shí)施過(guò)程中可暫時(shí)不進(jìn)行處理的數(shù)據(jù)錯(cuò)誤情況

綜上所述,臨床研究數(shù)據(jù)清理貫穿研究的整個(gè)過(guò)程,對(duì)于彌補(bǔ)研究設(shè)計(jì)或?qū)嵤┻^(guò)程中存在的問(wèn)題、提高研究數(shù)據(jù)質(zhì)量具有重要作用。臨床研究人員應(yīng)高度重視數(shù)據(jù)清理的重要性,緊緊圍繞研究目的,把握關(guān)鍵環(huán)節(jié)開(kāi)展數(shù)據(jù)清理工作。

猜你喜歡
核查邏輯錯(cuò)誤
對(duì)某企業(yè)重大危險(xiǎn)源核查引發(fā)的思考
刑事印證證明準(zhǔn)確達(dá)成的邏輯反思
法律方法(2022年2期)2022-10-20 06:44:24
在錯(cuò)誤中成長(zhǎng)
邏輯
創(chuàng)新的邏輯
關(guān)于設(shè)計(jì)保證系統(tǒng)適航獨(dú)立核查的思考
基于無(wú)人機(jī)影像的營(yíng)造林核查應(yīng)用研究
女人買(mǎi)買(mǎi)買(mǎi)的神邏輯
37°女人(2017年11期)2017-11-14 20:27:40
不犯同樣錯(cuò)誤
采用保留被測(cè)件進(jìn)行期間核查的方法
锡林郭勒盟| 大同市| 碌曲县| 龙井市| 交城县| 韩城市| 卫辉市| 安泽县| 昭苏县| 高安市| 永德县| 砀山县| 常德市| 新疆| 新干县| 营口市| 汉川市| 泾源县| 宁阳县| 永兴县| 丁青县| 临沭县| 衡山县| 株洲市| 胶南市| 安泽县| 拉萨市| 剑河县| 灵山县| 开鲁县| 宣恩县| 峨边| 桦甸市| 湖南省| 白河县| 玉环县| 祁阳县| 天全县| 抚宁县| 澜沧| 冕宁县|