国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多案例研究的生物醫(yī)學(xué)科學(xué)數(shù)據(jù)開放共享策略分析*

2024-03-15 09:40:52萬佳林賈曉峰胡志民
關(guān)鍵詞:案例數(shù)據(jù)庫科學(xué)

萬佳林 賈曉峰 胡志民

(1中國醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院衛(wèi)生健康管理政策學(xué)院 北京100730 2國家衛(wèi)生健康委衛(wèi)生發(fā)展研究中心 北京100044)

1 引言

21世紀(jì)以來,科學(xué)數(shù)據(jù)與數(shù)據(jù)科學(xué)相互促進發(fā)展,共同推動科學(xué)數(shù)據(jù)的建設(shè)與開放使用。2022年12月《中共中央 國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》創(chuàng)新性地提出數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)、數(shù)據(jù)產(chǎn)品經(jīng)營權(quán)等“三權(quán)分置”的中國特色數(shù)據(jù)產(chǎn)權(quán)制度[1],進一步推動數(shù)據(jù)要素化發(fā)展。2023年3月《黨和國家機構(gòu)改革方案》提出組建國家數(shù)據(jù)局,負責(zé)協(xié)調(diào)推進數(shù)據(jù)要素基礎(chǔ)制度建設(shè),表明中國將加快數(shù)據(jù)資源整合共享和開發(fā)利用,統(tǒng)籌數(shù)字經(jīng)濟高質(zhì)量發(fā)展[2]。

生物醫(yī)學(xué)是科學(xué)數(shù)據(jù)每日產(chǎn)出量最多的領(lǐng)域之一,數(shù)據(jù)具有類型多樣、數(shù)量巨大、應(yīng)用價值高等特點。我國生物醫(yī)學(xué)科學(xué)數(shù)據(jù)建設(shè)仍處于政府牽頭的“量的堆積”階段,盡管規(guī)模已相當(dāng)可觀,但數(shù)據(jù)質(zhì)量、數(shù)據(jù)使用以及數(shù)據(jù)牽引的學(xué)術(shù)活躍度仍不足,僅依靠財政資金的建設(shè)模式難以實現(xiàn)科學(xué)數(shù)據(jù)中心的可持續(xù)發(fā)展。借鑒國外典型數(shù)據(jù)平臺的發(fā)展經(jīng)驗,建設(shè)我國高質(zhì)量生物醫(yī)學(xué)科學(xué)數(shù)據(jù)中心是一種可操作的方法,為此,本研究分析國外典型生物醫(yī)學(xué)科學(xué)數(shù)據(jù)平臺的開放共享管理與服務(wù),總結(jié)其成功經(jīng)驗,提出我國數(shù)據(jù)開放共享的策略性建議。

2 研究設(shè)計

2.1 研究方法

本研究采用多案例嵌入式研究方法。案例數(shù)量方面,多案例研究提供比單案例研究更多的數(shù)據(jù)量,有利于挖掘普遍性規(guī)律,增加結(jié)果說服力[3]。本研究中多案例提供了更多的研究素材,便于歸納不同類型科學(xué)數(shù)據(jù)平臺的共性或個性經(jīng)驗。案例分析層次方面,不同于整體式案例研究以揭示整體屬性為目的,嵌入式案例研究通過簇群技術(shù)抽取出次級分析單位,通過考察主分析單位和次級分析單位開展研究[3]。本研究圍繞科學(xué)數(shù)據(jù)的開放共享,選取合適的維度(次級分析單位)拆解分析所選案例,使研究框架更清晰,研究目的更聚焦。

根據(jù)多案例研究的復(fù)制原則和研究目的,選取案例滿足以下標(biāo)準(zhǔn)。一是生物醫(yī)學(xué)領(lǐng)域具有較大學(xué)術(shù)影響力、數(shù)據(jù)資源豐富、知名度較高的科學(xué)數(shù)據(jù)平臺。二是平臺收錄不同類型的特色科學(xué)數(shù)據(jù)。三是在科學(xué)數(shù)據(jù)開放共享方面具有共性化或差異化的特點?;诖?,選取4個科學(xué)數(shù)據(jù)平臺作為案例分析對象:英國生物樣本庫(UK Biobank)、美國國家生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)、全球流感共享數(shù)據(jù)庫(Global Initiative on Sharing All Influenza Data,GISAID)、Cortellis藥物研發(fā)情報平臺(Cortellis Drug Discovery Intelligence,CDDI),見表1。

2.2 分析維度

基于文獻研究,特別是以下兩個標(biāo)準(zhǔn),自行制定分析維度。一是董瑞玉等[4]將數(shù)據(jù)共享機制分為資源整合機制、信息安全保障體系、信息訪問機制、獎勵激勵及配套管理制度。二是孫小康[5]分析國外數(shù)據(jù)共享政策時選取共享時間、共享范圍、共享模式、共享流程、認(rèn)可或引用5個維度。結(jié)合研究目的,基于數(shù)據(jù)共享前、中、后3個環(huán)節(jié),選取資源整合、開放級別、共享方式、數(shù)據(jù)增值4個維度構(gòu)建案例分析框架,見表2。

表2 案例研究分析維度

3 研究結(jié)果

3.1 資源整合

3.1.1 數(shù)據(jù)來源 數(shù)據(jù)資源整合發(fā)生在數(shù)據(jù)的產(chǎn)生、收集、加工過程中,據(jù)此可將數(shù)據(jù)來源分為內(nèi)部產(chǎn)生數(shù)據(jù)、外部匯集數(shù)據(jù)、內(nèi)部加工編輯數(shù)據(jù)和混合模式。UK Biobank數(shù)據(jù)來源于世界上規(guī)模最大的人類遺傳隊列研究,數(shù)據(jù)由區(qū)域分中心收集處理后匯總到平臺[6],屬于內(nèi)部產(chǎn)生數(shù)據(jù)的數(shù)據(jù)庫。依托隊列研究獲得數(shù)據(jù)有助于數(shù)據(jù)來源的穩(wěn)定性和可持續(xù)性,還能以平臺的形式助力數(shù)據(jù)的下游研究和成果追蹤。匯集外源數(shù)據(jù)的數(shù)據(jù)中心不產(chǎn)生原始數(shù)據(jù),僅承擔(dān)數(shù)據(jù)管理和維護職能,NCBI、GISAID和CDDI均屬于這類數(shù)據(jù)中心。相較GISAID由各研究機構(gòu)和組織直接匯交,NCBI的數(shù)據(jù)來源更多元[7],包括數(shù)據(jù)產(chǎn)生方直接匯交、與數(shù)據(jù)提供者和研究聯(lián)盟的合作或協(xié)議、內(nèi)部人工篩選和梳理。2020年美國國立衛(wèi)生研究院發(fā)布的《數(shù)據(jù)管理與共享政策》要求所有其資助研究產(chǎn)生的科學(xué)數(shù)據(jù)應(yīng)匯交到已建立完備、聲譽良好的開放存儲庫[8],使其資助產(chǎn)生的項目數(shù)據(jù)成為NCBI數(shù)據(jù)來源之一。CDDI數(shù)據(jù)來源于臨床試驗、藥物管線、政府文件、經(jīng)銷信息等渠道,同時吸納了許多經(jīng)典的藥物數(shù)據(jù)庫和補充信息[9],CDDI沒有專門的外部數(shù)據(jù)匯交,而是基于商業(yè)競爭性和客戶需求,以資源整合和數(shù)據(jù)搜索為業(yè)務(wù)職能自主收集信息,如梳理行業(yè)新聞、整合政策規(guī)范、報道學(xué)術(shù)會議等[10]。

NCBI和CDDI存在不止一種數(shù)據(jù)來源:NCBI的參考序列數(shù)據(jù)庫(RefSeq)來源于對國際核苷酸序列數(shù)據(jù)庫的二次篩選[7],是內(nèi)部加工形成的精選數(shù)據(jù)庫;CDDI存在大量人工編輯、整合形成的數(shù)據(jù)情報,如Cortellis競爭情報數(shù)據(jù)庫(CCI)由500多名擁有4~7年生化、醫(yī)藥學(xué)經(jīng)驗的專業(yè)人士編輯而成[9]。

3.1.2 數(shù)據(jù)資源整合機制 指科學(xué)數(shù)據(jù)平臺以何種方式保障數(shù)據(jù)來源穩(wěn)定和可持續(xù),4個數(shù)據(jù)平臺既有共性又有差異,見表3。

表3 數(shù)據(jù)資源整合機制

3.2 開放級別

當(dāng)前生物醫(yī)學(xué)科學(xué)數(shù)據(jù)平臺開放級別主要分為開放、限制、關(guān)閉3種。開放指用戶可以無障礙訪問數(shù)據(jù)平臺;限制指外部用戶滿足一定條件后可訪問,如注冊、付費等方式;關(guān)閉指僅面向內(nèi)部用戶[11]。3種開放級別并不完全獨立,部分?jǐn)?shù)據(jù)平臺同時包含開放數(shù)據(jù)和限制數(shù)據(jù),實行不同的管理方式。

根據(jù)開放級別,NCBI平臺收錄的大部分?jǐn)?shù)據(jù)庫對使用者幾乎無任何限制,屬于完全開放式,僅對涉及人類信息數(shù)據(jù)的受控訪問數(shù)據(jù)庫采取分級模型:無法進行個人識別的數(shù)據(jù)不采取任何限制措施;能進行個人識別的數(shù)據(jù)采用審核制并限時訪問[12]。UK Biobank、GISAID和CDDI均屬于限制級別,但開放方式和程度各異,見表4。UK Biobank僅面向科研人員開放,用戶需要通過身份認(rèn)證才能訪問數(shù)據(jù)資源[6]。GISAID數(shù)據(jù)面向通過身份一次性認(rèn)證、遵守《GISAID數(shù)據(jù)庫訪問協(xié)議》條款的所有自然人,無論是否是科研工作者[13]。CDDI具有商業(yè)性質(zhì),面向支付注冊費的用戶,受眾主要為醫(yī)藥企業(yè)、科研機構(gòu)等大型群體對象。

表4 數(shù)據(jù)平臺開放級別及面向人群

3.3 共享方式

3.3.1 共享方法 早期數(shù)據(jù)共享方法通常包括數(shù)據(jù)檔案、數(shù)據(jù)飛地、數(shù)據(jù)管理人員傳播、混合模式等[5]。近年來開放存儲庫的建設(shè)和發(fā)展越來越普遍,期刊紛紛強調(diào)論文關(guān)聯(lián)數(shù)據(jù)的提前共享,科研資助機構(gòu)也陸續(xù)出臺政策促進數(shù)據(jù)共享,將數(shù)據(jù)匯交到開放的公共存儲庫已成為數(shù)據(jù)共享的主流方式。UK Biobank、NCBI、GISAID均屬于科學(xué)數(shù)據(jù)公共存儲庫,生產(chǎn)/匯交的數(shù)據(jù)經(jīng)平臺審核、清洗或加工后,按發(fā)布期限要求對外開放共享。CDDI是企業(yè)所有的私有數(shù)據(jù)平臺。在生化藥物類數(shù)據(jù)領(lǐng)域,企業(yè)出資建立非公共存儲庫也是常見的共享方法之一。

3.3.2 共享流程 數(shù)據(jù)共享流程主要指用戶需要遵循怎樣的流程才能獲取數(shù)據(jù),以及數(shù)據(jù)使用協(xié)議和要求。涉及人類數(shù)據(jù)的科學(xué)數(shù)據(jù)平臺如UK Biobank和NCBI常采用“申請-審核”訪問機制。UK Biobank在用戶注冊并提供身份證明后,還需要提交一份闡述研究項目的申請書,經(jīng)數(shù)據(jù)訪問分委會審核通過后才能獲取其數(shù)據(jù)和生物樣本[6]。NCBI絕大部分?jǐn)?shù)據(jù)庫可以直接訪問,但其基因型和表型數(shù)據(jù)庫(Database of Genotypes and Phenotypes,dbGaP)需要受控訪問,采用“申請-審核”并“限定使用期限”保障數(shù)據(jù)安全[12]。不涉及人類數(shù)據(jù)的GISAID通過自行制定的《GISAID數(shù)據(jù)庫訪問協(xié)議》規(guī)范平臺的數(shù)據(jù)共享和使用行為,并明確數(shù)據(jù)訪問的流程和要求。該協(xié)議通過保證數(shù)據(jù)提供者的所有權(quán)并承認(rèn)其貢獻鼓勵數(shù)據(jù)共享積極性,并要求數(shù)據(jù)提交方不附加任何限制[14],確定了“身份認(rèn)證+貢獻認(rèn)可”的共享機制,通過實名制為病毒數(shù)據(jù)的共享使用提供良好范式。其他數(shù)據(jù)平臺也有相應(yīng)的數(shù)據(jù)訪問和使用協(xié)議,研究人員使用UK Biobank數(shù)據(jù)須與平臺簽訂訪問協(xié)議,詳細說明使用數(shù)據(jù)目的等相關(guān)條款,并承諾不識別任何數(shù)據(jù)和樣本提供者[15];dbGaP要求數(shù)據(jù)申請者嚴(yán)格遵守《數(shù)據(jù)使用行為準(zhǔn)則和協(xié)議》,包括不復(fù)制和保存數(shù)據(jù)、不主動識別個體參與者、主動通報數(shù)據(jù)泄漏事件等[12]。CDDI通過提供數(shù)據(jù)資源和服務(wù)獲取利益,不以“無償”“公益”的數(shù)據(jù)共享為目的,繳納注冊費后用戶可享受平臺提供的全研發(fā)周期的數(shù)據(jù)和技術(shù)工具,而不需要提交額外的數(shù)據(jù)使用申請。

3.4 數(shù)據(jù)增值

科學(xué)數(shù)據(jù)平臺確立成果反饋機制追蹤數(shù)據(jù)轉(zhuǎn)化結(jié)果。UK Biobank規(guī)定所有數(shù)據(jù)使用應(yīng)出于公益目的,且研究者應(yīng)將數(shù)據(jù)二次分析結(jié)果及時反饋以用于未來研究[16]。此外,UK Biobank還會給予受試者有限的反饋。該反饋機制確保UK Biobank數(shù)據(jù)資源愈加完整豐富,數(shù)據(jù)可利用性增強,確保價值鏈條完整可追蹤。

數(shù)據(jù)平臺可通過支撐科技創(chuàng)新和成果轉(zhuǎn)化提升科學(xué)價值和經(jīng)濟價值。NCBI除dbGaP外的30余個數(shù)據(jù)庫完全開放共享,產(chǎn)生數(shù)據(jù)資源“虹吸效應(yīng)”[17],進一步增加來源廣度、提高更新速度、助推平臺建設(shè)發(fā)展和數(shù)據(jù)的深度利用。GISAID支撐數(shù)據(jù)高通量提交、突發(fā)公共衛(wèi)生事件監(jiān)測、疾病風(fēng)險評估和流感界創(chuàng)新研發(fā)的下游分析等工作[18]。

數(shù)據(jù)平臺積極促進科學(xué)數(shù)據(jù)的共享使用,營造數(shù)據(jù)良好生態(tài)。GISAID建立了一套獨特的病毒數(shù)據(jù)共享機制以鼓勵數(shù)據(jù)的快速共享,通過《GISAID數(shù)據(jù)庫訪問協(xié)議》明確數(shù)據(jù)訪問和使用規(guī)范,非匿名化提交、訪問和使用數(shù)據(jù)有效保障科學(xué)家識別并承認(rèn)數(shù)據(jù)提供者,為數(shù)據(jù)貢獻者提供使用數(shù)據(jù)的額外保護,確保其固有權(quán)利(如知識產(chǎn)權(quán))不會喪失。協(xié)議還要求數(shù)據(jù)使用者積極尋求與數(shù)據(jù)提供者的合作,增強數(shù)據(jù)提供者與使用者之間的信任,鞏固對各自互補貢獻的尊重[19]。

4 策略性建議

4.1 共享前——數(shù)據(jù)資源建設(shè):確定數(shù)據(jù)權(quán)利和權(quán)利主體的劃分

科學(xué)數(shù)據(jù)的確權(quán)問題尚未達成共識,開放共享過程中數(shù)據(jù)權(quán)利主體的博弈阻礙數(shù)據(jù)開放共享。科學(xué)數(shù)據(jù)共享是將數(shù)據(jù)從持有者轉(zhuǎn)移到使用者的過程,核心問題是數(shù)據(jù)所有權(quán)和使用權(quán)的分離[20]。當(dāng)前國際上的典型做法是依靠外部或內(nèi)外混合型渠道獲取資源,由數(shù)據(jù)平臺專職行使建設(shè)權(quán)和/或管理權(quán),而不享有使用權(quán),表明數(shù)據(jù)持有者和建設(shè)者角色或可重疊,但從共享角度必須將數(shù)據(jù)持有權(quán)/建設(shè)權(quán)與數(shù)據(jù)使用權(quán)分離,“自產(chǎn)自用”的模式本質(zhì)上還是對數(shù)據(jù)資源的壟斷。在數(shù)據(jù)資源建設(shè)階段應(yīng)以書面形式對數(shù)據(jù)確權(quán)分權(quán),劃分存在哪些數(shù)據(jù)權(quán)利并明確各權(quán)利主體,避免后續(xù)職責(zé)邊界不清,造成數(shù)據(jù)管理效率低下,阻礙數(shù)據(jù)流通和使用。

4.2 共享中——數(shù)據(jù)開放使用:依據(jù)數(shù)據(jù)屬性實行差異化管理

分類開放使用的模式可有目的地推動科學(xué)數(shù)據(jù)的精細化管理,依照“誰投入、誰貢獻、誰受益”的數(shù)據(jù)要素收益分配原則[1],可將公共和企業(yè)投資產(chǎn)生的數(shù)據(jù)分為公共數(shù)據(jù)、企業(yè)數(shù)據(jù)、涉及個體的個人數(shù)據(jù),3種數(shù)據(jù)屬性分別為公益性數(shù)據(jù)、產(chǎn)業(yè)性數(shù)據(jù)和保密性數(shù)據(jù)。具體管理方式:一是公益性數(shù)據(jù)應(yīng)在不涉及保密原則時盡早面向公眾開放共享,體現(xiàn)其公益目的和普惠性;二是產(chǎn)業(yè)性數(shù)據(jù)依法由投資企業(yè)持有、使用、獲利,同時鼓勵企業(yè)在達成一定營利目的后自愿公益性共享;三是保密性數(shù)據(jù)可分級管理,不可識別的數(shù)據(jù)可經(jīng)匿名化后共享,易識別的數(shù)據(jù)可采用去識別化、受控訪問或不對外等方式。

4.3 共享后——數(shù)據(jù)生態(tài)營造:制定促進數(shù)據(jù)增值的機制和措施

生物醫(yī)學(xué)科學(xué)數(shù)據(jù)的價值來源于數(shù)據(jù)共享流通和開發(fā)利用,當(dāng)前科學(xué)數(shù)據(jù)平臺通過追蹤成果轉(zhuǎn)化、創(chuàng)建數(shù)據(jù)共享環(huán)境、支撐產(chǎn)品和技術(shù)研發(fā)、認(rèn)可數(shù)據(jù)貢獻等手段促進科學(xué)數(shù)據(jù)共享和數(shù)據(jù)增值,營造良好的數(shù)據(jù)共享使用生態(tài)。數(shù)據(jù)價值轉(zhuǎn)化過程中存在較多機制體制問題,從政策角度有以下4個切入點:一是建立合適的數(shù)據(jù)引用機制,承認(rèn)數(shù)據(jù)提供者在數(shù)據(jù)采集過程中付出的努力和貢獻,保證數(shù)據(jù)提供者權(quán)利不受侵犯;二是制定數(shù)據(jù)共享使用的激勵或補償措施,如給予數(shù)據(jù)提供者優(yōu)先發(fā)表相關(guān)成果的保護機制,促進數(shù)據(jù)二次利用,形成數(shù)據(jù)和科研相互支撐的良性循環(huán);三是明確科學(xué)的數(shù)據(jù)利益分配方式,以政府為主導(dǎo),同時積極探索市場化分配,兼顧個體效益和公眾效益的平衡;四是出臺科學(xué)數(shù)據(jù)共享的賞罰制度,尤其是科學(xué)數(shù)據(jù)不良使用行為的追責(zé)體系,監(jiān)督科學(xué)數(shù)據(jù)的共享行為。

5 結(jié)語

本研究基于國際上4個典型的生物醫(yī)學(xué)科學(xué)數(shù)據(jù)共享平臺案例進行研究分析,總結(jié)其在開放共享方面普遍性和差異性的經(jīng)驗,并提出中國科學(xué)數(shù)據(jù)開放共享方面可供借鑒的策略性建議:確定數(shù)據(jù)權(quán)利和權(quán)利主體的劃分,剝離數(shù)據(jù)所有權(quán)和使用權(quán);依據(jù)數(shù)據(jù)屬性和特征對科學(xué)數(shù)據(jù)進行個性化管理和利益分配;制定促進數(shù)據(jù)增值的機制和措施,規(guī)范數(shù)據(jù)引用行為,完善賞罰制度。未來生物醫(yī)學(xué)科學(xué)數(shù)據(jù)的開放共享仍應(yīng)平衡處理好數(shù)據(jù)保護與數(shù)據(jù)共享使用的關(guān)系,盡可能使科學(xué)數(shù)據(jù)開放共享效益最大化,營造數(shù)據(jù)開放共享的良好生態(tài)。

利益聲明:所有作者均聲明不存在利益沖突。

猜你喜歡
案例數(shù)據(jù)庫科學(xué)
案例4 奔跑吧,少年!
少先隊活動(2021年2期)2021-03-29 05:40:48
科學(xué)大爆炸
隨機變量分布及統(tǒng)計案例拔高卷
發(fā)生在你我身邊的那些治超案例
中國公路(2017年7期)2017-07-24 13:56:38
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
科學(xué)
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
一個模擬案例引發(fā)的多重思考
新安县| 秦安县| 美姑县| 牙克石市| 尉氏县| 安顺市| 禄丰县| 石柱| 宝清县| 武义县| 绥德县| 米易县| 新建县| 专栏| 龙口市| 凤城市| 哈巴河县| 临夏县| 登封市| 且末县| 新竹县| 胶州市| 德令哈市| 和龙市| 大埔县| 枣强县| 泌阳县| 台山市| 张掖市| 游戏| 台中市| 长宁县| 博兴县| 东平县| 大田县| 钟祥市| 上犹县| 黎城县| 宁远县| 兴和县| 安福县|