国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

臨床醫(yī)學(xué)研究數(shù)據(jù)庫的創(chuàng)建和質(zhì)量控制要點(diǎn)

2022-01-23 05:30王瑞平李斌
上海醫(yī)藥 2022年1期
關(guān)鍵詞:數(shù)據(jù)錄入臨床研究質(zhì)量控制

王瑞平 李斌

摘 要 規(guī)范、高質(zhì)量的數(shù)據(jù)庫的創(chuàng)建是臨床醫(yī)學(xué)研究的重要環(huán)節(jié),是后續(xù)數(shù)據(jù)統(tǒng)計(jì)分析和成果呈現(xiàn)的重要基礎(chǔ),也是進(jìn)而發(fā)表高質(zhì)量的科研論文的重要保障。本文概要介紹臨床研究常用的數(shù)據(jù)庫類型(Excel數(shù)據(jù)庫、EpiData數(shù)據(jù)庫、SPSS數(shù)據(jù)庫和EDC數(shù)據(jù)庫)及其創(chuàng)建方法,重點(diǎn)介紹數(shù)據(jù)庫變量設(shè)置、數(shù)據(jù)錄入規(guī)則和數(shù)據(jù)質(zhì)量控制要點(diǎn)等內(nèi)容,為醫(yī)務(wù)人員科學(xué)開展臨床研究提供參考。

關(guān)鍵詞 臨床研究 數(shù)據(jù)庫創(chuàng)建 質(zhì)量控制 數(shù)據(jù)錄入

中圖分類號:TP392; C81 文獻(xiàn)標(biāo)志碼:C 文章編號:1006-1533(2022)01-0010-05

基金項(xiàng)目:國家重點(diǎn)研發(fā)計(jì)劃“中醫(yī)藥現(xiàn)代化研究”重點(diǎn)專項(xiàng)項(xiàng)目(2018YFC1705301);國家自然科學(xué)基金面上項(xiàng)目(82174383);上海申康醫(yī)院發(fā)展中心管理研究項(xiàng)目(2020SKMR-32);上海市皮膚病醫(yī)院引進(jìn)人才科研基金項(xiàng)目(2021KYQD01)

Key points for database creation and quality control in clinical medical research

WANG Ruiping, LI Bin

(Clinical Research & Innovation Center, Shanghai Skin Disease Hospital, Shanghai 200443, China)

ABSTRACT The establishment of a standardized and high-quality database is an important link in clinical medical research, a basis for subsequent data statistical analysis and results presentation and also a guarantee for the publication of highquality scientific research papers. This paper briefly introduces the database types commonly used in clinical research (Excel database, EpiData database, SPSS database and EDC database) and some methods for their creation, with emphasis on database variable setting, data entry rules and key points of data quality control, so as to provide reference for medical staff to scientifically carry out clinical research.

KEy wORDS clinical research; database creation; quality control; data input

數(shù)據(jù)庫創(chuàng)建是臨床醫(yī)學(xué)研究中的重要環(huán)節(jié)。規(guī)范、高質(zhì)量的數(shù)據(jù)庫是后續(xù)數(shù)據(jù)統(tǒng)計(jì)分析和成果呈現(xiàn)的重要基礎(chǔ)。為幫助醫(yī)務(wù)人員在開展臨床研究時(shí)能夠選擇合適的數(shù)據(jù)庫,本文就常用數(shù)據(jù)庫的類型、創(chuàng)建方法和質(zhì)量控制要點(diǎn)等作一概要介紹。

1 臨床研究數(shù)據(jù)庫的分類與特點(diǎn)

臨床研究中常用的數(shù)據(jù)庫包括Excel數(shù)據(jù)庫、 EpiData數(shù)據(jù)庫、EpiInfo數(shù)據(jù)庫、SPSS數(shù)據(jù)庫和EDC數(shù)據(jù)庫等,歸納起來可分為4類。

1)應(yīng)用Office辦公軟件創(chuàng)建的數(shù)據(jù)庫,主要是指Excel數(shù)據(jù)庫。Excel數(shù)據(jù)庫具有上手容易、創(chuàng)建簡單、數(shù)據(jù)錄入簡便等特點(diǎn),適用于小規(guī)模臨床研究。

2)應(yīng)用統(tǒng)計(jì)分析軟件創(chuàng)建的數(shù)據(jù)庫,包括EpiInfo數(shù)據(jù)庫和SPSS數(shù)據(jù)庫。創(chuàng)建這類數(shù)據(jù)庫需使用者有應(yīng)用統(tǒng)計(jì)分析軟件的基礎(chǔ)和經(jīng)驗(yàn),并熟悉數(shù)據(jù)庫的架構(gòu)和設(shè)置要求。如在應(yīng)用SPSS軟件創(chuàng)建數(shù)據(jù)庫時(shí),使用者需先在“Variable View (變量窗口)”中設(shè)置變量名,然后才能在“Data View (數(shù)據(jù)窗口)”中錄入數(shù)據(jù)。

3)應(yīng)用專為輔助臨床研究而開發(fā)的數(shù)據(jù)庫軟件創(chuàng)建的數(shù)據(jù)庫,以EpiData數(shù)據(jù)庫為代表。EpiData軟件具有數(shù)據(jù)庫創(chuàng)建、質(zhì)量控制設(shè)置、數(shù)據(jù)錄入、數(shù)據(jù)庫合并、一致性檢驗(yàn)和數(shù)據(jù)導(dǎo)出等功能,由于其功能強(qiáng)大、使用方便且開源免費(fèi),受到越來越多臨床研究者的青睞,近年來在臨床研究和流行病學(xué)調(diào)查中的應(yīng)用越來越廣泛。

4)應(yīng)用電子數(shù)據(jù)捕獲系統(tǒng)創(chuàng)建的數(shù)據(jù)庫,以EDC數(shù)據(jù)庫為代表。電子數(shù)據(jù)捕獲系統(tǒng)是一種適用于臨床研究數(shù)據(jù)采集、傳輸和管理的平臺軟件,其采用國際通用的臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(Clinical Data Interchange Standards Consortium, CDISC)的標(biāo)準(zhǔn)來創(chuàng)建數(shù)據(jù)庫,能實(shí)現(xiàn)EDC數(shù)據(jù)庫與醫(yī)院的醫(yī)院信息系統(tǒng)、實(shí)驗(yàn)室信息管理系統(tǒng)等的互聯(lián)互通并從中直接獲取研究所需數(shù)據(jù),同時(shí)還有使在異地開展的多中心臨床研究的數(shù)據(jù)錄入同質(zhì)化的功能,目前在各期臨床研究、特別是多中心臨床研究中應(yīng)用廣泛。

2 臨床研究數(shù)據(jù)庫的創(chuàng)建方法

臨床研究數(shù)據(jù)庫的創(chuàng)建基本上包括變量名設(shè)置、變量屬性定義和變量間的邏輯關(guān)聯(lián)設(shè)定3個(gè)步驟。根據(jù)4類臨床研究數(shù)據(jù)庫的內(nèi)部架構(gòu)、特點(diǎn)和核心要求,它們的創(chuàng)建方法和操作步驟有所差異和區(qū)別。

2.1 Excel數(shù)據(jù)庫

以研究者要根據(jù)調(diào)查問卷創(chuàng)建一個(gè)Excel數(shù)據(jù)庫為例,假設(shè)調(diào)查問卷中的主要內(nèi)容包括:①一般人口學(xué)特征,如年齡、性別、文化程度、調(diào)查日期;②煙草暴露情況,包括是否吸煙、每天吸煙量、吸煙年數(shù);③疾病情況,是否罹患腫瘤、高血壓、糖尿病等。首先,研究者根據(jù)調(diào)查問卷中的內(nèi)容設(shè)置變量名。變量名可直接使用英文譯名或英文字母加數(shù)字命名。例如,對于年齡,可以設(shè)置變量名為“age”或“A1”,推薦直接使用英文譯名“age”。如將變量名設(shè)置為“A1”,則需做好備注,以方便后期數(shù)據(jù)錄入時(shí)識別。將所有設(shè)置好的變量名錄入Excel數(shù)據(jù)庫的第一行(圖1)。其次,定義每個(gè)變量的屬性。例如,年齡、每天吸煙量、吸煙年數(shù)為定量變量,對它們需同時(shí)標(biāo)記清楚變量的單位;性別、文化程度、是否吸煙,以及是否罹患腫瘤、高血壓、糖尿病為定性變量,對它們需同時(shí)標(biāo)記清楚變量的分類。最后,統(tǒng)一設(shè)定變量間的邏輯關(guān)聯(lián)。例如,當(dāng)“smoking”為“no”時(shí),其后的“number_smoke”和“year_smoke”均應(yīng)自動跳過而不能錄入數(shù)據(jù)。完成以上3步后,Excel數(shù)據(jù)庫即告創(chuàng)建完成,可進(jìn)行數(shù)據(jù)錄入了。

2.2 SPSS數(shù)據(jù)庫

仍以上述調(diào)查問卷中的主要內(nèi)容為例,應(yīng)用SPSS 16.0軟件創(chuàng)建SPSS數(shù)據(jù)庫的步驟如下:首先,研究者根據(jù)調(diào)查問卷中的內(nèi)容設(shè)置變量名。變量名設(shè)置需在SPSS的“Variable View”中操作(圖2上部),變量名可直接使用英文譯名或英文字母加數(shù)字命名。例如,對于性別,可以設(shè)置變量名為“gender”或“A2”,推薦直接使用英文譯名“gender”。如將變量名設(shè)置為“A2”,則需做好備注,以方便后期數(shù)據(jù)錄入時(shí)識別。其次,在“Variable View”的“Label”中定義年齡、每天吸煙量等定量變量的單位,在“Variable View”的“Values”中定義性別、文化程度、是否吸煙、是否罹患腫瘤等定性變量的分類。最后,統(tǒng)一設(shè)定變量間的邏輯關(guān)聯(lián)。完成以上3步后,SPSS數(shù)據(jù)庫即告創(chuàng)建完成。數(shù)據(jù)錄入需在 SPSS的“Data View”中操作(圖2下部)。

2.3 EpiData數(shù)據(jù)庫

還是以上述調(diào)查問卷中的主要內(nèi)容為例,應(yīng)用EpiData軟件創(chuàng)建EpiData數(shù)據(jù)庫的步驟如下:首先,根據(jù)調(diào)查問卷在EpiData軟件中建立QES文件(圖3a),其中變量名可直接使用英文譯名或英文字母加數(shù)字命名。例如,對于年齡,可以設(shè)置變量名為“age”或“A1”。因?yàn)镋piData數(shù)據(jù)庫在數(shù)據(jù)錄入時(shí)有變量問題提醒,故推薦使用英文字母加數(shù)字命名變量名。但須注意的是,在采用這種命名方式時(shí),變量名與后面的問題提醒部分之間一定要用空格隔開,如“A1 年齡 □□歲”。其次,根據(jù)變量類型設(shè)置數(shù)據(jù)錄入格式。數(shù)值型變量用“#”表示,1個(gè)“#”代表1個(gè)數(shù)字;字符型變量用“_”表示,每2個(gè)“_”代表1個(gè)漢字;日期型變量用“yyyy/mm/dd”或“mm/dd/yyyy”表示。將設(shè)置好變量名和數(shù)據(jù)錄入格式的QES文件存盤,然后根據(jù)QES文件生成REC文件(圖3b)并存盤,這時(shí)就已可以進(jìn)行數(shù)據(jù)錄入了(圖3c)。最后,為保證數(shù)據(jù)錄入的準(zhǔn)確性和錄入效率,需為數(shù)據(jù)庫建立CHK文件(圖3d),設(shè)置數(shù)據(jù)錄入質(zhì)量控制相關(guān)要求,主要包括Range/Legal(合法錄入值)、Jump(跳轉(zhuǎn))、Must enter(必須錄入)和Repeat(重復(fù))4項(xiàng)內(nèi)容。

2.4 EDC數(shù)據(jù)庫

與上述3種數(shù)據(jù)庫的創(chuàng)建方法類似,EDC數(shù)據(jù)庫的創(chuàng)建也主要包括變量名設(shè)置、變量屬性定義和變量間的邏輯關(guān)聯(lián)設(shè)定3個(gè)步驟。以上海申康醫(yī)院發(fā)展中心創(chuàng)建的EDC數(shù)據(jù)庫“CRIP數(shù)據(jù)庫”(圖4)為例,首先是采用CDISC標(biāo)準(zhǔn)在“DEV(開發(fā)環(huán)境)”中設(shè)置變量名。變量名應(yīng)具有國際通用性,以方便多中心臨床研究數(shù)據(jù)的拼接和后續(xù)開展合并分析。其次,與EpiData數(shù)據(jù)庫創(chuàng)建中建立CHK文件類似,在“DEV”中對每個(gè)變量設(shè)置數(shù)據(jù)錄入質(zhì)量控制相關(guān)要求,并進(jìn)行試運(yùn)行模擬測試。最后,經(jīng)模擬測試無誤后鎖定數(shù)據(jù)庫,推送至“PROD(生產(chǎn)環(huán)境)”后即可正式使用了。EDC數(shù)據(jù)庫的創(chuàng)建需要專門的知識和技能,一般多委托專業(yè)公司開發(fā)。

3 臨床研究數(shù)據(jù)庫的質(zhì)量控制要點(diǎn)

為保證所創(chuàng)建的臨床研究數(shù)據(jù)庫的質(zhì)量,研究者需按照一定的原則和要求創(chuàng)建數(shù)據(jù)庫,規(guī)范數(shù)據(jù)錄入操作,并對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行質(zhì)量控制。

首先,對于小規(guī)模臨床研究,優(yōu)先選用EpiData數(shù)據(jù)庫,通過建立CHK文件來保障數(shù)據(jù)錄入的準(zhǔn)確性和錄入效率,并對雙錄入數(shù)據(jù)開展一致性核查,確保數(shù)據(jù)的準(zhǔn)確性。如果研究的數(shù)據(jù)量較小,也可考慮選用Excel數(shù)據(jù)庫或SPSS數(shù)據(jù)庫,以節(jié)減建庫時(shí)間。須指出的是,在Excel數(shù)據(jù)庫和SPSS數(shù)據(jù)庫中,數(shù)據(jù)錄入時(shí)因無邏輯校對和質(zhì)量控制,數(shù)據(jù)錄入操作務(wù)必認(rèn)真、仔細(xì),避免出錯(cuò)。對于規(guī)模較大、變量較多的臨床研究,特別是多中心臨床研究,在經(jīng)費(fèi)允許的情況下,建議委托專業(yè)公司開發(fā)EDC數(shù)據(jù)庫。

其次,在數(shù)據(jù)錄入時(shí),各種臨床研究數(shù)據(jù)庫都要求錄入的是阿拉伯?dāng)?shù)字,而不能錄入漢字(如男、女,是、否等),否則后續(xù)數(shù)據(jù)統(tǒng)計(jì)分析無法進(jìn)行。在數(shù)據(jù)錄入前,研究者應(yīng)全面審核調(diào)查問卷的內(nèi)容,保證調(diào)查問卷內(nèi)容清晰和邏輯正確。對于數(shù)據(jù)量較大的臨床研究,可在數(shù)據(jù)錄入開始前對數(shù)據(jù)錄入人員進(jìn)行統(tǒng)一培訓(xùn),以保證數(shù)據(jù)錄入的準(zhǔn)確性和一致性。

再次,對于已完成數(shù)據(jù)錄入的數(shù)據(jù)庫,在正式開展數(shù)據(jù)統(tǒng)計(jì)分析前應(yīng)先完成數(shù)據(jù)質(zhì)量控制工作。數(shù)據(jù)質(zhì)量控制的主要內(nèi)容包括:①數(shù)據(jù)的完整性。研究者應(yīng)全面核查數(shù)據(jù)庫變量數(shù)據(jù)的缺失情況,對于主要結(jié)局變量數(shù)據(jù),爭取做到無缺失。如主要結(jié)局指標(biāo)和核心變量數(shù)據(jù)存在缺失,應(yīng)采用數(shù)據(jù)填補(bǔ)技術(shù)(均值填補(bǔ)、k近鄰填補(bǔ)、回歸填補(bǔ)、隨機(jī)森林填補(bǔ)、多重插補(bǔ)和熱卡填充等法)進(jìn)行數(shù)據(jù)填補(bǔ)[1]。②數(shù)據(jù)的邏輯性。重點(diǎn)核查數(shù)據(jù)間的邏輯關(guān)聯(lián)是否正確,身高、體質(zhì)量、年齡等一般人口學(xué)特征是否存在不符合邏輯的異常數(shù)據(jù),以及時(shí)間數(shù)據(jù)間的邏輯性等。

最后,為保證數(shù)據(jù)錄入的真實(shí)性,需抽取一定比例(一般為5% ~ 10%)的原始調(diào)查問卷與數(shù)據(jù)庫中錄入的數(shù)據(jù)進(jìn)行核對,以評價(jià)整個(gè)數(shù)據(jù)庫的數(shù)據(jù)錄入質(zhì)量。如果核對結(jié)果發(fā)現(xiàn)錄入的正確率<80%,則判定數(shù)據(jù)庫的數(shù)據(jù)錄入質(zhì)量較差,通常建議重新進(jìn)行數(shù)據(jù)錄入。只有在完成上述所有質(zhì)量控制工作且數(shù)據(jù)錄入質(zhì)量評價(jià)結(jié)果為良好后,才能鎖定數(shù)據(jù)庫,并基于鎖定的數(shù)據(jù)庫開展后續(xù)的數(shù)據(jù)統(tǒng)計(jì)分析。

參考文獻(xiàn)

[1] 李業(yè)錦, 趙芃, 楊?;?, 等. 隊(duì)列研究中縱向缺失數(shù)據(jù)填補(bǔ)方法的模擬研究[J]. 中華流行病學(xué)雜志, 2021, 42(10): 1889-1894.

猜你喜歡
數(shù)據(jù)錄入臨床研究質(zhì)量控制
基于SPSS軟件在市場調(diào)研中的數(shù)據(jù)錄入方法
基于SPSS軟件在市場調(diào)研中的數(shù)據(jù)錄入方法
腹腔鏡手術(shù)聯(lián)合促性腺激素釋放激素激動劑治療卵巢內(nèi)異囊腫的臨床研究
黃芝通腦絡(luò)膠囊治療糖尿病周圍神經(jīng)病變的臨床觀察
淺談機(jī)車總風(fēng)缸的制作質(zhì)量控制
淺談在公路橋梁施工環(huán)節(jié)的質(zhì)量管理及控制
淺談石灰土基層施工及質(zhì)量控制
黃土路基臺背回填的質(zhì)量控制
動態(tài)X光片在頸椎病早期診斷中的臨床研究
缺血性腦血管病患者腦動脈狹窄的分布