国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)對(duì)比分析

2020-02-24 06:24袁夢(mèng)雪
數(shù)字圖書館論壇 2020年1期
關(guān)鍵詞:數(shù)據(jù)管理醫(yī)學(xué)科學(xué)

袁夢(mèng)雪

(武漢大學(xué)信息管理學(xué)院,武漢 430072)

健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)可以實(shí)現(xiàn)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的采集、組織、存儲(chǔ)、管理、分析、共享及發(fā)布等[1]。國(guó)內(nèi)針對(duì)科學(xué)數(shù)據(jù)管理平臺(tái)的研究主要聚焦于兩個(gè)方向,一是科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)現(xiàn)狀和評(píng)價(jià)標(biāo)準(zhǔn),包括國(guó)內(nèi)外科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)成就[2-3]、建設(shè)標(biāo)準(zhǔn)規(guī)范[4]以及平臺(tái)評(píng)價(jià)體系構(gòu)建[5-6];二是科學(xué)數(shù)據(jù)管理平臺(tái)技術(shù)研發(fā)與應(yīng)用,包括平臺(tái)建設(shè)技術(shù)[7]、運(yùn)行機(jī)制[8]、系統(tǒng)模型以及設(shè)計(jì)實(shí)現(xiàn)[9]。部分研究人員梳理了國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理的政策演化與發(fā)展[10-11];孫小康等[12]提出健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)系統(tǒng)設(shè)計(jì)方案,如國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)(National Population Health Science Data Center,NCMI)[13]與國(guó)家基因組科學(xué)數(shù)據(jù)中心(the BIG Data Center,BIGD)[14]的設(shè)計(jì);李翼等[15]調(diào)研了開放醫(yī)學(xué)科學(xué)數(shù)據(jù)平臺(tái)的構(gòu)建情況。但當(dāng)前研究缺乏對(duì)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的全面考察,通過對(duì)比分析國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)實(shí)踐可以為國(guó)內(nèi)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的管理與再利用提供先進(jìn)經(jīng)驗(yàn)。基于此,根據(jù)科學(xué)數(shù)據(jù)生命周期理論與科學(xué)數(shù)據(jù)管理能力成熟度模型(Capability Maturity Model for Scientific Data Management,SDM-CMM),結(jié)合健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的特征,本文從建設(shè)基礎(chǔ)與管理過程兩個(gè)層面對(duì)比分析國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)實(shí)踐,為國(guó)內(nèi)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)提供參考與借鑒。

1 研究設(shè)計(jì)

科學(xué)數(shù)據(jù)管理生命周期涵蓋科學(xué)數(shù)據(jù)的產(chǎn)生、收集、描述、存儲(chǔ)、共享、應(yīng)用整個(gè)生命過程,識(shí)別了數(shù)據(jù)管理的核心要素,主要包括數(shù)據(jù)管理計(jì)劃、數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)保存、數(shù)據(jù)共享與再利用。Crowston等[16]提出科學(xué)數(shù)據(jù)管理能力成熟度模型,基于科學(xué)數(shù)據(jù)管理的關(guān)鍵實(shí)踐,將科學(xué)數(shù)據(jù)管理劃分為特定過程與通用過程。特定過程指與科學(xué)數(shù)據(jù)管理生命周期對(duì)應(yīng)的科學(xué)數(shù)據(jù)管理工作流程;通用過程指圍繞管理或支持科學(xué)數(shù)據(jù)管理過程開展的保證科學(xué)數(shù)據(jù)管理可靠性的準(zhǔn)備基礎(chǔ)。本文基于科學(xué)數(shù)據(jù)管理生命周期理論與科學(xué)數(shù)據(jù)管理能力成熟度模型,構(gòu)建如圖1所示的研究框架,從數(shù)據(jù)政策、經(jīng)費(fèi)支持、團(tuán)隊(duì)建設(shè)和技術(shù)基礎(chǔ)4個(gè)方面對(duì)比國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)基礎(chǔ)的差異;從數(shù)據(jù)管理計(jì)劃、數(shù)據(jù)采集標(biāo)準(zhǔn)與流程、數(shù)據(jù)描述與元數(shù)據(jù)、數(shù)據(jù)存儲(chǔ)與保存、數(shù)據(jù)共享與保護(hù)、數(shù)據(jù)應(yīng)用與服務(wù)6個(gè)方面對(duì)比國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)平臺(tái)管理過程的差異。

科學(xué)數(shù)據(jù)倉(cāng)儲(chǔ)目錄(the Registry of Research Data Repositories,Re3data)統(tǒng)計(jì)了跨學(xué)科科學(xué)數(shù)據(jù)倉(cāng)儲(chǔ)標(biāo)準(zhǔn)信息。FAIRsharing重點(diǎn)關(guān)注數(shù)據(jù)、元數(shù)據(jù)及其在數(shù)據(jù)倉(cāng)儲(chǔ)中實(shí)施的標(biāo)準(zhǔn)。利用Re3data與FAIRsharing,結(jié)合期刊出版推薦、訪問下載量、文獻(xiàn)引用等指標(biāo),選擇功能完整且建設(shè)較成熟的8個(gè)國(guó)外平臺(tái)和3個(gè)國(guó)內(nèi)平臺(tái)作為研究對(duì)象,詳細(xì)內(nèi)容見表1。

圖1 健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的研究框架

2 平臺(tái)建設(shè)基礎(chǔ)對(duì)比

2.1 數(shù)據(jù)政策

健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理政策的制定者主要有3個(gè)主體,即政府、科研資助機(jī)構(gòu)、健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)[28]。政府政策從宏觀上引導(dǎo)和推動(dòng)科研機(jī)構(gòu)和其他相關(guān)部門數(shù)據(jù)開放管理政策的制定,如美國(guó)的《數(shù)據(jù)獲取法令》、英國(guó)的《數(shù)據(jù)保護(hù)法案》、澳大利亞的《信息自由法》等,響應(yīng)政府對(duì)數(shù)據(jù)開放的要求,科研資助機(jī)構(gòu)制定數(shù)據(jù)管理與共享政策使健康醫(yī)學(xué)科學(xué)數(shù)據(jù)盡可能地以可重復(fù)利用的格式開放,促進(jìn)現(xiàn)有數(shù)據(jù)的使用[28]。如美國(guó)國(guó)立衛(wèi)生研究院(National Institutes of Health)制定的《數(shù)據(jù)共享政策和實(shí)施指南》(Data Sharing Policy and Implementation Guidance)和英國(guó)生物技術(shù)和生物研究理事會(huì)(British Council for Biotechnology and Bioscience Research,BBSRC)制定的《BBSRC數(shù)據(jù)共享政策》(BBSRC Data Sharing Policy)均要求受資助者在申請(qǐng)科研資助時(shí)提交數(shù)據(jù)管理計(jì)劃和數(shù)據(jù)共享計(jì)劃,并且強(qiáng)調(diào)數(shù)據(jù)匯交的必要性,要求共享科學(xué)數(shù)據(jù)[29-30];部分健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)主體也基于現(xiàn)有科學(xué)數(shù)據(jù)管理政策,構(gòu)建了平臺(tái)自身的數(shù)據(jù)共享管理政策與使用條例(見表2)。如Brain-CODE制定了信息治理政策與平臺(tái)使用條款協(xié)議,概述了用戶如何收集、存儲(chǔ)和訪問數(shù)據(jù),為平臺(tái)的運(yùn)營(yíng)與管理提供了依據(jù)[31-32];TCIA制定了數(shù)據(jù)使用政策,為數(shù)據(jù)管理與共享提供了標(biāo)準(zhǔn)規(guī)范[22]。

國(guó)內(nèi)的科學(xué)數(shù)據(jù)管理法規(guī)政策已初步形成,但數(shù)據(jù)管理仍處于條塊分割和“各自為政”的狀態(tài)[33]?!秶?guó)家科技資源共享服務(wù)平臺(tái)管理辦法》《科學(xué)數(shù)據(jù)管理辦法》《中華人民共和國(guó)人類遺傳資源管理?xiàng)l例》從國(guó)家層面上明確科學(xué)數(shù)據(jù)管理的職責(zé)、原則、方式和機(jī)制,規(guī)定強(qiáng)制性匯交,鼓勵(lì)對(duì)科學(xué)數(shù)據(jù)的合理利用[34-36];但缺乏科研資助機(jī)構(gòu)以及健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)主體針對(duì)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的全生命周期管理政策和數(shù)據(jù)處理規(guī)范文件。

2.2 經(jīng)費(fèi)支持

國(guó)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)經(jīng)費(fèi)來源廣泛,包括政府科研基金、基金會(huì)贊助、私營(yíng)企業(yè)投資、高校資助等。此外,部分平臺(tái)通過提供咨詢服務(wù),以及為其他機(jī)構(gòu)或企業(yè)提供元數(shù)據(jù)等方式獲得外部資金支持。如EMBL-EBI的行業(yè)計(jì)劃會(huì)與全球商業(yè)公司的主要利益相關(guān)者和意見領(lǐng)袖定期保持聯(lián)系和互動(dòng),并通過提供必要的數(shù)據(jù)基礎(chǔ)架構(gòu)和服務(wù)來支持中小型企業(yè)的發(fā)展[23]。國(guó)內(nèi)健康醫(yī)學(xué)科學(xué)管理平臺(tái)的建設(shè)資金主要依托于政府機(jī)構(gòu),來源單一。如NCMI的建設(shè)經(jīng)費(fèi)主要來自科技部科學(xué)數(shù)據(jù)共享工程重大項(xiàng)目資金投入[25],BIGD資金來源于國(guó)家自然科學(xué)基金和中國(guó)科學(xué)院[27]。

表1 國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)介紹

2.3 團(tuán)隊(duì)建設(shè)

部分國(guó)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)設(shè)計(jì)了覆蓋數(shù)據(jù)管理生命周期、職責(zé)清晰、職權(quán)明確的多層次管理體系,包括技術(shù)開發(fā)團(tuán)隊(duì)、信息咨詢團(tuán)隊(duì)、政策信息團(tuán)隊(duì)、數(shù)據(jù)訪問管理團(tuán)隊(duì)、數(shù)據(jù)安全隱私保護(hù)團(tuán)隊(duì)和用戶服務(wù)團(tuán)隊(duì)。如表2所示,NCMI、CNGB和BIGD都構(gòu)建了多層次的管理體系。國(guó)內(nèi)平臺(tái)的管理團(tuán)隊(duì)構(gòu)建已初見規(guī)模,具體分工等細(xì)節(jié)還需進(jìn)一步完善。

2.4 技術(shù)基礎(chǔ)

健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的技術(shù)開發(fā)模式主要分為自主研發(fā)(包括合作研發(fā))、開源二次開發(fā)以及委托第三方開發(fā)3類。國(guó)外平臺(tái)以自主研發(fā)為主,如NCBI自主研發(fā)了平臺(tái)系統(tǒng)及生物數(shù)據(jù)搜索軟件Entrez;由華盛頓大學(xué)醫(yī)學(xué)院神經(jīng)信息學(xué)研究組開發(fā)的XNAT平臺(tái),也被嵌入NITRC與Brain-CODE管理神經(jīng)影像學(xué)數(shù)據(jù)。國(guó)內(nèi)平臺(tái)也以自主研發(fā)為主,部分平臺(tái)為開源二次開發(fā),如北京大學(xué)開放研究數(shù)據(jù)平臺(tái)是基于Dataverse二次開發(fā)的。但健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理的專業(yè)技術(shù)人才較為匱乏,平臺(tái)構(gòu)建的整體技術(shù)水平存在局限性。

表2 國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)基礎(chǔ)對(duì)比

3 平臺(tái)數(shù)據(jù)管理過程對(duì)比

3.1 數(shù)據(jù)管理計(jì)劃

數(shù)據(jù)管理計(jì)劃描述了項(xiàng)目期間以及項(xiàng)目結(jié)束后的數(shù)據(jù)處理方式,通常覆蓋數(shù)據(jù)生命周期的全部或部分,即從數(shù)據(jù)發(fā)現(xiàn)、收集和組織,質(zhì)量保證/質(zhì)量控制、文檔說明與數(shù)據(jù)使用,到數(shù)據(jù)存儲(chǔ)與共享管理[37]。數(shù)據(jù)管理計(jì)劃是健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理的重要環(huán)節(jié),NCBI、EMBL-EBI、NDAR、INDEPTH以及TCIA都為研究人員制訂健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理計(jì)劃提供服務(wù)。而國(guó)內(nèi)平臺(tái)均缺少這一環(huán)節(jié),未形成覆蓋全生命周期的健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理。

3.2 數(shù)據(jù)采集標(biāo)準(zhǔn)與流程

3.2.1 數(shù)據(jù)來源

國(guó)外平臺(tái)的健康醫(yī)學(xué)科學(xué)數(shù)據(jù)來源廣泛。包括NCBI、NDAR、NITRC、TCIA、EMBL-EBI在內(nèi)的5個(gè)平臺(tái)均是被多家期刊出版商推薦的數(shù)據(jù)庫,其數(shù)據(jù)來源不受任何地域和機(jī)構(gòu)限制。此外,數(shù)據(jù)聯(lián)合有助于健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的集成,擴(kuò)寬了健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的數(shù)據(jù)來源。如Brain-CODE與NDAR積極開展聯(lián)合研究,增加數(shù)據(jù)量并提供更豐富的分析資源。國(guó)內(nèi)平臺(tái)的數(shù)據(jù)來源相對(duì)受限。僅有BIGD的組學(xué)原始數(shù)據(jù)歸檔庫(Genome Sequence Archive,GAS)被國(guó)際知名出版商Elsevier收錄為指定基因數(shù)據(jù)歸檔庫。受采集成本、科研績(jī)效、數(shù)據(jù)安全、共享政策等多方限制,國(guó)內(nèi)平臺(tái)數(shù)據(jù)來源集中在合作的高校與科研機(jī)構(gòu)。以NCMI為例,其數(shù)據(jù)主要來自10個(gè)合作機(jī)構(gòu),外源數(shù)據(jù)占比小[38],且平臺(tái)數(shù)據(jù)在及時(shí)更新與補(bǔ)充上難以得到保證。

3.2.2 數(shù)據(jù)采集與評(píng)價(jià)

數(shù)據(jù)采集與評(píng)價(jià)的核心任務(wù)是對(duì)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)價(jià)值進(jìn)行判斷與篩選,包括新數(shù)據(jù)集收錄前的鑒定和評(píng)價(jià),以及對(duì)現(xiàn)有數(shù)據(jù)集的篩選與再評(píng)價(jià)[39],有助于提高健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理效率。國(guó)外平臺(tái)制定了不同的采集評(píng)價(jià)流程,XNAT、TCIA和EMBL-EBI開發(fā)有自動(dòng)數(shù)據(jù)采集工具,具體見表3。部分平臺(tái)有多個(gè)科學(xué)數(shù)據(jù)庫,如NCBI和EMBL-EBI,各個(gè)數(shù)據(jù)庫有不同的數(shù)據(jù)采集與評(píng)價(jià)標(biāo)準(zhǔn)。國(guó)內(nèi)平臺(tái)的采集流程中涉及較多手工操作,如由用戶填寫數(shù)據(jù)標(biāo)準(zhǔn)(元數(shù)據(jù))項(xiàng)。

3.2.3 數(shù)據(jù)質(zhì)量控制

國(guó)內(nèi)外11個(gè)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)采集流程中均包含質(zhì)量控制。國(guó)外8個(gè)平臺(tái)均制定了全面的質(zhì)量檢查與控制流程,保證數(shù)據(jù)的準(zhǔn)確性與真實(shí)性。如NDAR的雙層質(zhì)量控制,第一級(jí)在數(shù)據(jù)提交前,包括自動(dòng)化工具的項(xiàng)目級(jí)驗(yàn)證與人工數(shù)據(jù)準(zhǔn)確性驗(yàn)證;第二級(jí)在數(shù)據(jù)提交后,由數(shù)據(jù)委員會(huì)審查資料的完整性、準(zhǔn)確性和質(zhì)量,生成質(zhì)量審查報(bào)告[18]。而國(guó)內(nèi)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的質(zhì)量控制與管理環(huán)節(jié)中,由平臺(tái)管理人員對(duì)提交的數(shù)據(jù)進(jìn)行質(zhì)量審核,平臺(tái)未提供自動(dòng)化質(zhì)量檢測(cè)工具,也未提供質(zhì)量檢查報(bào)告幫助科研人員控制健康醫(yī)學(xué)科學(xué)數(shù)據(jù)質(zhì)量。

表3 國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)采集流程

3.3 數(shù)據(jù)描述與元數(shù)據(jù)

INDEPTH采用的是常用于社會(huì)科學(xué)信息組織的DDI元數(shù)據(jù)標(biāo)準(zhǔn),其他7個(gè)國(guó)外平臺(tái)的元數(shù)據(jù)標(biāo)準(zhǔn)均是平臺(tái)以現(xiàn)有的元數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ)修改定制的。例如,Brain-CODE開發(fā)的通用數(shù)據(jù)格式(Common Data Elements,CDEs),提供了標(biāo)準(zhǔn)的數(shù)據(jù)定義與格式和詳細(xì)的文檔說明[21],以便研究人員在各類研究中收集數(shù)據(jù)的一致性。國(guó)內(nèi)NCMI制定了《人口健康科學(xué)數(shù)據(jù)共享數(shù)據(jù)集元數(shù)據(jù)標(biāo)準(zhǔn)》[13],BIGD與CNGB整合了國(guó)際組學(xué)、健康、醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)結(jié)構(gòu)和標(biāo)準(zhǔn),構(gòu)建了具有廣泛兼容性、標(biāo)準(zhǔn)化的數(shù)據(jù)標(biāo)準(zhǔn)和結(jié)構(gòu),方便與外部數(shù)據(jù)平臺(tái)鏈接。

3.4 數(shù)據(jù)存儲(chǔ)與保存

除了NCMI以外的10個(gè)平臺(tái)都在Re3data平臺(tái)上為對(duì)應(yīng)的科學(xué)倉(cāng)儲(chǔ)進(jìn)行注冊(cè),便利科研人員使用。國(guó)外平臺(tái)中,NDAR、TCIA和INDEPTH為數(shù)據(jù)分配了數(shù)字對(duì)象標(biāo)識(shí)符(Digital Object Identifier,DOI),EMBLEBI為數(shù)據(jù)分配了科研工作者標(biāo)識(shí)符(Open Research and Contributor ID,ORCID),使得數(shù)據(jù)更易被找到、復(fù)用和長(zhǎng)期保存。國(guó)內(nèi)CNGB支持DOI,NCMI為數(shù)據(jù)分配了系統(tǒng)生成的唯一標(biāo)識(shí)符,BIGD的DOI功能正在開發(fā)中。

3.5 數(shù)據(jù)共享與保護(hù)

3.5.1 數(shù)據(jù)共享

國(guó)內(nèi)外11個(gè)平臺(tái)基本都采取了數(shù)據(jù)分級(jí)獲取、數(shù)據(jù)擁有者自定共享模式(開放/受控)、分層開放訪問等方式支持?jǐn)?shù)據(jù)共享,具體見表4。訪問與上傳限制均以注冊(cè)式限制為主,即注冊(cè)用戶才可上傳與訪問數(shù)據(jù);應(yīng)用程序編程接口(Application Programming Interface,API)為用戶提供高吞吐量的數(shù)據(jù)訪問。國(guó)外平臺(tái)會(huì)提供多類API接口,方便有不同技術(shù)習(xí)慣的科研團(tuán)隊(duì)下載平臺(tái)數(shù)據(jù)。國(guó)內(nèi)平臺(tái)支持的API接口類型單一。國(guó)內(nèi)外平臺(tái)的共享程度差別較大,國(guó)外平臺(tái)的每日下載量與訪問量遠(yuǎn)超國(guó)內(nèi)平臺(tái)。

表4 國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)數(shù)據(jù)共享情況

3.5.2 數(shù)據(jù)安全與隱私保護(hù)

健康醫(yī)學(xué)科學(xué)數(shù)據(jù)涉及大量個(gè)人敏感信息、隱私數(shù)據(jù)、科研機(jī)密等內(nèi)容[40],國(guó)外平臺(tái)從法律政策和平臺(tái)管理兩個(gè)層面采取措施加強(qiáng)對(duì)敏感信息的保護(hù)。法律政策層面,國(guó)外已出臺(tái)系列相關(guān)政策,如美國(guó)的《健康保險(xiǎn)流通與責(zé)任法案》(Health Insurance Portability and Accountability Act,HIPAA)以及歐盟的《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR)規(guī)范了個(gè)人隱私信息的使用、披露與保護(hù)。國(guó)外8個(gè)平臺(tái)均制定了專門的數(shù)據(jù)安全與隱私保護(hù)政策,或在數(shù)據(jù)管理政策中說明用戶健康醫(yī)學(xué)科學(xué)數(shù)據(jù)與個(gè)人數(shù)據(jù)的使用規(guī)范,涵蓋用戶知情同意、個(gè)人信息采集與利用、持久性Cookie相關(guān)技術(shù)、個(gè)人信息儲(chǔ)存與披露、平臺(tái)安全防護(hù)等方面。平臺(tái)管理層面,國(guó)外8個(gè)平臺(tái)均采用數(shù)據(jù)去標(biāo)識(shí)技術(shù)(清除個(gè)人信息)、數(shù)據(jù)加密技術(shù)(對(duì)敏感信息模糊處理)以及數(shù)據(jù)組織分層+訪問控制(限制科研人員獲取數(shù)據(jù)的權(quán)限)等方式保障數(shù)據(jù)安全。如Brain-CODE提供了持續(xù)監(jiān)控軟件,識(shí)別未授權(quán)的訪問,并定期進(jìn)行隱私影響評(píng)估和威脅風(fēng)險(xiǎn)評(píng)估。

國(guó)內(nèi)的《信息安全技術(shù)個(gè)人信息安全規(guī)范》基于個(gè)人信息的全生命周期,提出了保護(hù)個(gè)人信息應(yīng)遵循的原則與安全要求,但缺少對(duì)數(shù)據(jù)安全與隱私保護(hù)的識(shí)別、分類和監(jiān)管等內(nèi)容。國(guó)內(nèi)的3個(gè)平臺(tái)中,NCMI的管理文件缺失了數(shù)據(jù)安全與隱私保護(hù)的內(nèi)容,BIGD在數(shù)據(jù)使用政策中提到了隱私政策,只有CNGB制定了專門的隱私和安全政策。

3.6 數(shù)據(jù)應(yīng)用與服務(wù)

根據(jù)用戶需求,可將平臺(tái)服務(wù)劃分為基礎(chǔ)服務(wù)與增值服務(wù)?;A(chǔ)服務(wù)是健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)為滿足用戶基本需求所提供的基礎(chǔ)性服務(wù),包括用戶指南/手冊(cè)、數(shù)據(jù)采集上傳、數(shù)據(jù)組織存儲(chǔ)、數(shù)據(jù)訪問檢索、數(shù)據(jù)共享下載。而增值服務(wù)是為了滿足用戶更深層次的需求,其能有效提高平臺(tái)的易用性與用戶滿意度。國(guó)外平臺(tái)提供了形式多樣的服務(wù),包括檢索優(yōu)化、數(shù)據(jù)分析、整合集成、知識(shí)發(fā)現(xiàn)、公告發(fā)布、計(jì)算資源、可視化、交流互動(dòng)和教學(xué)培訓(xùn)等。表5顯示,Brian-CODE與TCIA提供數(shù)據(jù)多維可視化服務(wù),以最直觀的方式展示數(shù)據(jù)的分布與特征。NITRC支持資源工具的比較,便于用戶選擇。作為數(shù)據(jù)提供平臺(tái),NCMI以提供數(shù)據(jù)存儲(chǔ)與下載服務(wù)為主,為用戶提供咨詢服務(wù)。CNGB與BIGD正積極利用現(xiàn)有數(shù)據(jù)資源,為健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的分析、挖掘與再利用提供方便。

表5 國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)服務(wù)情況

4 啟示與建議

本文在對(duì)國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)平臺(tái)進(jìn)行深入對(duì)比分析的基礎(chǔ)上,從健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的數(shù)據(jù)政策與激勵(lì)機(jī)制、經(jīng)費(fèi)與數(shù)據(jù)來源、技術(shù)創(chuàng)新與人才培養(yǎng)、數(shù)據(jù)安全與共享、平臺(tái)服務(wù)的角度,總結(jié)了國(guó)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)的建設(shè)經(jīng)驗(yàn)。結(jié)合國(guó)內(nèi)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)的不足,對(duì)國(guó)內(nèi)提升平臺(tái)建設(shè)水平提出以下建議。

4.1 完善數(shù)據(jù)政策,建立激勵(lì)機(jī)制

一方面,我國(guó)需進(jìn)一步完善健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理系列法律法規(guī),在《科學(xué)數(shù)據(jù)管理方法》宣示性條文的基礎(chǔ)上,制定更多授權(quán)性和禁止性條文來規(guī)范健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的知識(shí)產(chǎn)權(quán)、數(shù)據(jù)存儲(chǔ)、安全保護(hù)、數(shù)據(jù)出版、管理監(jiān)督等相關(guān)實(shí)踐,形成一套完整、健全、可執(zhí)行的健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理政策體系;另一方面,基于《科學(xué)數(shù)據(jù)管理辦法》,健康醫(yī)學(xué)相關(guān)的科研資助機(jī)構(gòu)和科研機(jī)構(gòu),如健康醫(yī)學(xué)研究所、地方醫(yī)院、高校圖書館、期刊出版社等須根據(jù)健康醫(yī)學(xué)數(shù)據(jù)需求,制定健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理與共享辦法,提出數(shù)據(jù)匯交的明確要求,規(guī)定健康醫(yī)學(xué)科學(xué)數(shù)據(jù)如何進(jìn)行采集、管理、保存、共享與利用,加強(qiáng)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)整合,規(guī)范健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理。此外,政府、科研資助機(jī)構(gòu)、健康醫(yī)學(xué)研究機(jī)構(gòu)和高校應(yīng)當(dāng)建立激勵(lì)機(jī)制,以資金、數(shù)據(jù)優(yōu)先使用權(quán)、科研業(yè)績(jī)或影響力等方式作為獎(jiǎng)勵(lì),鼓勵(lì)項(xiàng)目人員主動(dòng)共享研究中產(chǎn)生的健康醫(yī)學(xué)科學(xué)數(shù)據(jù)。

4.2 強(qiáng)化經(jīng)費(fèi)支持,拓寬數(shù)據(jù)來源

國(guó)內(nèi)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)的主要經(jīng)費(fèi)來源于基金和項(xiàng)目經(jīng)費(fèi),然而單一的經(jīng)費(fèi)來源難以支撐平臺(tái)的可持續(xù)發(fā)展,還需要社會(huì)其他力量的支持。借鑒國(guó)外平臺(tái)的有償服務(wù)經(jīng)驗(yàn),有償提供計(jì)算資源、數(shù)據(jù)分析報(bào)告、行業(yè)咨詢、決策支持等服務(wù),吸引來自社會(huì)組織機(jī)構(gòu)、企業(yè)或個(gè)人的資助。鼓勵(lì)地方政府、高校、科研院所與企業(yè)對(duì)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)的支持,促進(jìn)各方協(xié)同合作,共同收集、管理和共享健康醫(yī)學(xué)科學(xué)數(shù)據(jù),加大外源數(shù)據(jù)采集力度,拓展健康醫(yī)學(xué)科學(xué)數(shù)據(jù)來源。

4.3 增強(qiáng)技術(shù)創(chuàng)新,加強(qiáng)人才培養(yǎng)

國(guó)內(nèi)平臺(tái)構(gòu)建較多采用自主開發(fā)方式,其開發(fā)的軟件少有開源,而開源的構(gòu)建軟件可有效縮短健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)開發(fā)周期,節(jié)約開發(fā)成本。建議以中國(guó)科學(xué)院為首的國(guó)內(nèi)平臺(tái)開發(fā)團(tuán)隊(duì),開發(fā)并開源類似DSpace、DataVerse、CKAN的平臺(tái)構(gòu)建軟件,降低平臺(tái)的建設(shè)難度,推動(dòng)平臺(tái)服務(wù)的普及;開發(fā)面向科研全過程、覆蓋數(shù)據(jù)全生命周期的通用工具,如自動(dòng)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)采集工具能提高健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理規(guī)范性與自動(dòng)水平。此外,還應(yīng)加強(qiáng)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理人才的培養(yǎng),擴(kuò)大人才儲(chǔ)備。

4.4 保證數(shù)據(jù)安全,促進(jìn)數(shù)據(jù)共享

國(guó)內(nèi)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)安全與隱私保護(hù)的法規(guī)建設(shè)還不夠成熟??蒲匈Y助機(jī)構(gòu)、高校以及健康醫(yī)學(xué)科研機(jī)構(gòu)需完善健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的隱私保護(hù)與安全保障機(jī)制,確立一套完整的健康醫(yī)學(xué)科學(xué)數(shù)據(jù)的安全評(píng)估標(biāo)準(zhǔn),并制定對(duì)應(yīng)的違規(guī)處理辦法,遏制威脅數(shù)據(jù)安全的行為。健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)應(yīng)在確保遵守道德原則和安全法規(guī)的方式采集存儲(chǔ)數(shù)據(jù)的前提下,促進(jìn)數(shù)據(jù)的下載共享。數(shù)據(jù)質(zhì)量良莠不齊是影響數(shù)據(jù)共享的重要因素,平臺(tái)需加強(qiáng)質(zhì)量控制,提高數(shù)據(jù)質(zhì)量,加大宣傳推廣,提高知名度,推動(dòng)數(shù)據(jù)共享。

4.5 擴(kuò)寬服務(wù)體系,深化服務(wù)內(nèi)容

國(guó)內(nèi)健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)建設(shè)時(shí)間較晚,增值服務(wù)較為匱乏。拓展平臺(tái)的服務(wù),需要增設(shè)數(shù)據(jù)管理計(jì)劃,借鑒英國(guó)數(shù)字監(jiān)管中心(Digital Curation Centre)的數(shù)據(jù)管理計(jì)劃模板經(jīng)驗(yàn),設(shè)計(jì)一個(gè)通用的模板來規(guī)范健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理計(jì)劃的內(nèi)容,利用已開發(fā)的DMPonline[41],增加數(shù)據(jù)管理計(jì)劃制定咨詢服務(wù);增加平臺(tái)的增值服務(wù),完善數(shù)據(jù)可視化與數(shù)據(jù)分析服務(wù),增強(qiáng)數(shù)據(jù)分析功能,提供更豐富的在線分析服務(wù);考慮在平臺(tái)中添加論壇討論功能,促進(jìn)用戶以及平臺(tái)管理人員與數(shù)據(jù)使用者之間的溝通交流,提高用戶積極性,擴(kuò)大平臺(tái)影響力;加大平臺(tái)管理人員培訓(xùn)力度,擴(kuò)大咨詢?nèi)藛T數(shù)量,提供更多個(gè)性化的健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理服務(wù)。

猜你喜歡
數(shù)據(jù)管理醫(yī)學(xué)科學(xué)
本刊可直接使用的醫(yī)學(xué)縮略語(二)
企業(yè)級(jí)BOM數(shù)據(jù)管理概要
定制化汽車制造的數(shù)據(jù)管理分析
海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實(shí)踐
醫(yī)學(xué)的進(jìn)步
CTCS-2級(jí)報(bào)文數(shù)據(jù)管理需求分析和實(shí)現(xiàn)
預(yù)防新型冠狀病毒, 你必須知道的事
點(diǎn)擊科學(xué)
科學(xué)大爆炸
科學(xué)拔牙
甘南县| 那坡县| 寿阳县| 朝阳市| 阜城县| 禄劝| 洛扎县| 化州市| 乐平市| 祁连县| 铅山县| 永登县| 漠河县| 海丰县| 中超| 依兰县| 宜州市| 两当县| 九台市| 叙永县| 巴里| 武邑县| 铅山县| 龙川县| 获嘉县| 襄樊市| 通城县| 桂东县| 上犹县| 新余市| 玉田县| 宝兴县| 阜南县| 英吉沙县| 双牌县| 普陀区| 平凉市| 丹江口市| 屏东县| 林口县| 东莞市|