王流芳 賈曉峰
(中國(guó)醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院衛(wèi)生健康管理政策學(xué)院 北京 100730) (國(guó)家衛(wèi)生健康委衛(wèi)生發(fā)展研究中心 北京 100044)
胡志民
(中國(guó)醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院衛(wèi)生健康管理政策學(xué)院 北京 100730)
21世紀(jì)以來(lái),以數(shù)據(jù)為中心、數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究第四范式逐漸興起,生命科學(xué)領(lǐng)域科研活動(dòng)產(chǎn)生的大量科學(xué)數(shù)據(jù)成為推動(dòng)未來(lái)科研發(fā)現(xiàn)的重要資源,但從較大體量的數(shù)據(jù)集變成驅(qū)動(dòng)科研新發(fā)現(xiàn)的資源庫(kù)依舊存在數(shù)據(jù)平臺(tái)標(biāo)準(zhǔn)不統(tǒng)一、工具不足、合作機(jī)制缺乏、算力和數(shù)據(jù)整合優(yōu)化不足等問(wèn)題[1]。2021年《中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》提出“構(gòu)建國(guó)家科研論文和科技信息高端交流平臺(tái)”,為科學(xué)數(shù)據(jù)的融合、交流提出明確要求和方向,而以何種模式構(gòu)建生命科學(xué)數(shù)據(jù)的融合、交流平臺(tái)成為當(dāng)前關(guān)注重點(diǎn)。歐洲生命科學(xué)信息基礎(chǔ)平臺(tái)(European Life-Science Infrastructure for Biological Information,ELIXIR)模式可提供重要參考[2]。
ELIXIR成立于2013年12月,是匯集歐洲各地生命科學(xué)資源的政府間組織,由歐洲分子生物學(xué)實(shí)驗(yàn)室(The European Molecular Biology Laboratory,EMBL)、21個(gè)成員國(guó)和1個(gè)申請(qǐng)中的觀察國(guó)(塞浦路斯)組成,是一個(gè)分布式的歐洲生命科學(xué)數(shù)據(jù)研究基礎(chǔ)設(shè)施[3-4]。ELIXIR通過(guò)協(xié)調(diào)數(shù)據(jù)庫(kù)、軟件工具、培訓(xùn)材料、云存儲(chǔ)和超級(jí)計(jì)算機(jī)等方面的資源,為歐洲各地研究者使用現(xiàn)有設(shè)施存儲(chǔ)、轉(zhuǎn)移和分析大數(shù)據(jù)集提供便利,已成為科學(xué)數(shù)據(jù)發(fā)現(xiàn)、共享和交流的重要途徑[5-6]。
ELIXIR采用“中心+節(jié)點(diǎn)”的組織架構(gòu),ELIXIR中心負(fù)責(zé)提出總體工作策略、協(xié)調(diào)各節(jié)點(diǎn)運(yùn)行并對(duì)其進(jìn)行服務(wù)委托、支持各節(jié)點(diǎn)的科學(xué)研究工作,以及聯(lián)合其他生物醫(yī)學(xué)科學(xué)組織共同應(yīng)對(duì)大數(shù)據(jù)帶來(lái)的挑戰(zhàn)。ELIXIR節(jié)點(diǎn)由各個(gè)成員國(guó)或EMBL的研究機(jī)構(gòu)集合而成,主要涉及各節(jié)點(diǎn)的強(qiáng)勢(shì)學(xué)科領(lǐng)域,負(fù)責(zé)運(yùn)行各自的資源與服務(wù),每個(gè)節(jié)點(diǎn)均由一個(gè)領(lǐng)導(dǎo)機(jī)構(gòu)監(jiān)督工作。
ELIXIR中心與節(jié)點(diǎn)通過(guò)簽署合作協(xié)議、設(shè)立協(xié)作監(jiān)督小組、建立合作協(xié)調(diào)組織等方式確保組織架構(gòu)整體穩(wěn)定。一是簽署《ELIXIR合作協(xié)議》,對(duì)節(jié)點(diǎn)角色、服務(wù)及監(jiān)督進(jìn)行定義,這是ELIXIR中心向節(jié)點(diǎn)委托服務(wù)的法律基礎(chǔ)。《ELIXIR合作協(xié)議》有2014版、2018版兩個(gè)版本,內(nèi)容包括4份附件:各節(jié)點(diǎn)服務(wù)交付計(jì)劃,明確各節(jié)點(diǎn)應(yīng)提供的服務(wù);委托服務(wù)合同,概述由節(jié)點(diǎn)執(zhí)行的委托服務(wù)項(xiàng)目(由ELIXIR預(yù)算提供資金);中心合作計(jì)劃,概述ELIXIR中心提供給各節(jié)點(diǎn)的服務(wù);保障機(jī)制,明確各節(jié)點(diǎn)間的法律協(xié)議。二是ELIXIR組織設(shè)有協(xié)作監(jiān)督小組(collaboration oversight group,COG),小組成員包括節(jié)點(diǎn)負(fù)責(zé)人 (head of node,HON)、ELIXIR主任、其他與合作流程相關(guān)的人員(如節(jié)點(diǎn)協(xié)調(diào)員等);協(xié)作監(jiān)督小組對(duì)《ELIXIR合作協(xié)議》中規(guī)定的內(nèi)容進(jìn)行年度審查,并將報(bào)告提交給ELIXIR中心管理團(tuán)隊(duì)[4]。三是建立ELIXIR合作協(xié)調(diào)組織,包括技術(shù)協(xié)調(diào)員小組(the technical coordinators group,TeCG)、培訓(xùn)協(xié)調(diào)員小組(the training coordinators group,TrCG)和節(jié)點(diǎn)協(xié)調(diào)員小組(the node coordinators group,TnCG),其中:技術(shù)協(xié)調(diào)員小組由來(lái)自各ELIXIR節(jié)點(diǎn)的技術(shù)代表組成,主要任務(wù)是探討技術(shù)突破問(wèn)題,促進(jìn)技術(shù)交流;培訓(xùn)協(xié)調(diào)員小組由各ELIXIR節(jié)點(diǎn)的培訓(xùn)代表組成,主要負(fù)責(zé)定期舉行培訓(xùn)會(huì)議、分享培訓(xùn)信息、普及專(zhuān)業(yè)知識(shí)并協(xié)調(diào)和領(lǐng)導(dǎo)整個(gè)歐洲ELIXIR培訓(xùn)計(jì)劃的實(shí)施;節(jié)點(diǎn)協(xié)調(diào)員小組由ELIXIR節(jié)點(diǎn)的代表組成,目的是分享ELIXIR節(jié)點(diǎn)的操作信息和最佳實(shí)踐[4]。
2.2.1 5個(gè)平臺(tái) ELIXIR 5個(gè)平臺(tái)分別為數(shù)據(jù)、工具、計(jì)算、互操作和培訓(xùn)平臺(tái),由ELIXIR中心的技術(shù)協(xié)調(diào)員負(fù)責(zé)維護(hù),由各節(jié)點(diǎn)的高級(jí)科學(xué)家規(guī)劃發(fā)展戰(zhàn)略,見(jiàn)表1。(1)數(shù)據(jù)平臺(tái)旨在確定、遴選和融合全歐洲的關(guān)鍵數(shù)據(jù)資源。(2)工具平臺(tái)幫助研究者找到最好的數(shù)據(jù)分析軟件工具。(3)計(jì)算平臺(tái)負(fù)責(zé)開(kāi)發(fā)服務(wù),使存儲(chǔ)、共享和分析大型數(shù)據(jù)集變得更便捷。(4)互操作平臺(tái)開(kāi)發(fā)統(tǒng)一的標(biāo)準(zhǔn)描述生命科學(xué)數(shù)據(jù)。(5)培訓(xùn)支持系統(tǒng)(training esupport system,TeSS)為培訓(xùn)師和學(xué)員提供培訓(xùn)材料、教程等方面服務(wù)[7-8]。
表1 ELIXIR平臺(tái)及功能
2.2.2 15個(gè)領(lǐng)域單元 ELIXIR領(lǐng)域單元是協(xié)調(diào)不同利益相關(guān)方共同使用ELIXIR數(shù)據(jù)資源的重要場(chǎng)所,主要作用是將特定領(lǐng)域?qū)<揖奂谝黄饋?lái)確定和解決特定問(wèn)題或開(kāi)展小型項(xiàng)目,見(jiàn)表2。每個(gè)領(lǐng)域單元至少有一個(gè)核心數(shù)據(jù)庫(kù),除人類(lèi)聯(lián)邦數(shù)據(jù)領(lǐng)域單元、人類(lèi)拷貝數(shù)變異領(lǐng)域單元和罕見(jiàn)病領(lǐng)域單元之外,每個(gè)領(lǐng)域單元都有自己獨(dú)特的技術(shù)標(biāo)準(zhǔn)和法律標(biāo)準(zhǔn)[9]。
表2 ELIXIR領(lǐng)域單元及功能
2.3.1 資源遴選 ELIXIR核心數(shù)據(jù)資源是指歐洲生命科學(xué)和生物數(shù)據(jù)長(zhǎng)期保存的數(shù)據(jù)資源,通過(guò)將生命科學(xué)相關(guān)數(shù)據(jù)匯集起來(lái)供研究者使用,提升數(shù)據(jù)價(jià)值[10]。ELIXIR創(chuàng)建正式流程動(dòng)態(tài)識(shí)別、遴選歐洲最重要的生命科學(xué)數(shù)據(jù)資源作為ELIXIR核心數(shù)據(jù)資源[11]。截至2020年4月1日,ELIXIR有19項(xiàng)核心數(shù)據(jù)資源,涵蓋廣泛的生命科學(xué)數(shù)據(jù)類(lèi)型,包括基因和基因組、蛋白質(zhì)、化學(xué)、分子結(jié)構(gòu)相互作用以及研究文獻(xiàn)等。ELIXIR使用一套定性、定量相結(jié)合的指標(biāo),評(píng)價(jià)數(shù)據(jù)資源的質(zhì)量和影響力,以確定具有極高科學(xué)影響力的數(shù)據(jù)資源,主要包括數(shù)據(jù)質(zhì)量、數(shù)據(jù)資源所服務(wù)的領(lǐng)域、數(shù)據(jù)服務(wù)質(zhì)量、法律和資金管理、數(shù)據(jù)影響和成果轉(zhuǎn)化5個(gè)方面。核心數(shù)據(jù)資源管理人員每年提供以上5方面指標(biāo)數(shù)據(jù)以評(píng)價(jià)核心數(shù)據(jù)資源[12]。
2.3.2 整合優(yōu)化 一是整合工具與科學(xué)數(shù)據(jù)資源。ELIXIR將其成員國(guó)所開(kāi)發(fā)的各種類(lèi)型生命科學(xué)相關(guān)軟件工具、教育資源進(jìn)行整合,形成統(tǒng)一的發(fā)現(xiàn)平臺(tái);核心數(shù)據(jù)資源之間表現(xiàn)出高度的連通性和相互依賴(lài)性,反映不同數(shù)據(jù)類(lèi)型之間的生物學(xué)關(guān)系[12]。二是持續(xù)開(kāi)展數(shù)據(jù)評(píng)估。ELIXIR節(jié)點(diǎn)負(fù)責(zé)人會(huì)議每2~3年審查一次所有核心數(shù)據(jù)資源,每次審查至少需要3個(gè)ELIXIR節(jié)點(diǎn)負(fù)責(zé)人才可以對(duì)特定數(shù)據(jù)資源進(jìn)行異常評(píng)估;如果審查提出問(wèn)題,節(jié)點(diǎn)負(fù)責(zé)人委員會(huì)應(yīng)負(fù)責(zé)制定下一步改進(jìn)計(jì)劃[7]。三是統(tǒng)一標(biāo)準(zhǔn),落實(shí)推動(dòng)數(shù)字資源管理和開(kāi)放共享可發(fā)現(xiàn)、可訪問(wèn)、可互操作、可重復(fù)(findable,accessible,interoperable,reusable,F(xiàn)AIR)原則,通過(guò)開(kāi)發(fā)數(shù)據(jù)管理工具包推動(dòng)全歐洲生命科學(xué)數(shù)據(jù)管理標(biāo)準(zhǔn)化(包括元數(shù)據(jù)標(biāo)準(zhǔn)、本體、詞表、標(biāo)識(shí)符等在內(nèi)的一系列標(biāo)準(zhǔn))。
2.3.3 開(kāi)放使用 許多ELIXIR領(lǐng)域單元已經(jīng)著手改善核心數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ),并采用元數(shù)據(jù)標(biāo)準(zhǔn)(包括本體)描述數(shù)據(jù),特別是植物科學(xué)、海洋宏基因組學(xué)、代謝組學(xué)和蛋白質(zhì)組學(xué)領(lǐng)域單元。但是由于各方面原因,數(shù)據(jù)往往不易整合到中央數(shù)據(jù)庫(kù)中,例如人體受試樣本中的某些數(shù)據(jù)出于監(jiān)管原因不能跨國(guó)界使用。ELIXIR通過(guò)兩個(gè)方案解決這一問(wèn)題:一是將這類(lèi)不便提交的數(shù)據(jù)庫(kù)連接到歐洲基因組檔案(The European Genome-phenome Archive,EGA),并通過(guò)EGA共享元數(shù)據(jù)。二是通過(guò)信標(biāo)對(duì)潛在有用的數(shù)據(jù)集進(jìn)行分析,判斷數(shù)據(jù)是否能被溯源,并根據(jù)隱私要求對(duì)數(shù)據(jù)進(jìn)行相應(yīng)保護(hù)[9]。ELIXIR通過(guò)用戶(hù)分級(jí)管理推動(dòng)數(shù)據(jù)對(duì)不同用戶(hù)個(gè)性化開(kāi)放,通過(guò)認(rèn)證和授權(quán)身份驗(yàn)證基礎(chǔ)設(shè)施(authentication and authorization infrastructure,AAI)驗(yàn)證用戶(hù)身份,并授權(quán)和限制用戶(hù)在服務(wù)中的可操作范圍[13]。ELIXIR AAI允許用戶(hù)使用全球身份認(rèn)證聯(lián)盟(The Inter-Federation of Identity Federation Across the Globe,eduGAIN)認(rèn)證的身份登錄服務(wù)平臺(tái),并提供資源分配管理、數(shù)據(jù)集授權(quán)系統(tǒng)、多因素身份驗(yàn)證等服務(wù)[14]。ELIXIR中心沒(méi)有權(quán)限訪問(wèn)各節(jié)點(diǎn)的內(nèi)部數(shù)據(jù)和歐盟資助項(xiàng)目的科學(xué)數(shù)據(jù),由各個(gè)節(jié)點(diǎn)處理自己的內(nèi)部數(shù)據(jù)[4]。
2.3.4 數(shù)據(jù)保護(hù)協(xié)議 由于成員國(guó)并不都屬于歐盟,所以ELIXIR在數(shù)據(jù)保護(hù)標(biāo)準(zhǔn)方面保持開(kāi)放態(tài)度。對(duì)ELIXIR節(jié)點(diǎn)而言,歐盟成員國(guó)數(shù)據(jù)受歐盟《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR)保護(hù);非歐盟成員國(guó),如以色列、瑞士和英國(guó),其數(shù)據(jù)受本國(guó)數(shù)據(jù)保護(hù)規(guī)則保護(hù),兩者保護(hù)水平相當(dāng)。ELIXIR是一個(gè)政府間的聯(lián)盟組織,因此缺乏自己的法律人格。為解決該問(wèn)題,ELIXIR節(jié)點(diǎn)中唯一一個(gè)不是國(guó)家的組織——EMBL已經(jīng)同意允許ELIXIR使用其法律人格作為一個(gè)國(guó)際組織。這種“借來(lái)的”法律人格有兩個(gè)主要特征:一是EMBL和ELIXIR不受歐盟GDPR和國(guó)家數(shù)據(jù)保護(hù)法的約束,并且ELIXIR繼承了EMBL作為國(guó)際組織的特權(quán)和豁免權(quán);二是ELIXIR把EMBL《內(nèi)部政策68》(Internal Policy 68,IP68)作為其數(shù)據(jù)保護(hù)法;《內(nèi)部政策68》與歐盟GDPR一樣具有相當(dāng)高標(biāo)準(zhǔn)的數(shù)據(jù)保護(hù)規(guī)則,適應(yīng)國(guó)際科學(xué)研究組織的需要,反映了歐洲數(shù)據(jù)保護(hù)法的原則[4]。
作為分布式基礎(chǔ)設(shè)施,ELIXIR采用以公共資金為主的混合融資模式,見(jiàn)表3。一是ELIXIR中心和節(jié)點(diǎn)共同競(jìng)爭(zhēng)歐盟“地平線2020(Horizon 2020)”和創(chuàng)新醫(yī)學(xué)計(jì)劃(Innovative Medicines Initiative,IMI)的資金。二是ELIXIR中心的資金來(lái)自成員國(guó),即ELIXIR節(jié)點(diǎn)支付的會(huì)員費(fèi),這些資金大部分被返還各節(jié)點(diǎn)來(lái)支持ELIXIR 5年科學(xué)計(jì)劃。三是ELIXIR節(jié)點(diǎn)通常通過(guò)國(guó)家投資獲得資金,支持相關(guān)服務(wù)的開(kāi)發(fā)和運(yùn)營(yíng)。四是ELIXIR節(jié)點(diǎn)可獲得國(guó)際資助者的支持,例如美國(guó)國(guó)立衛(wèi)生研究院(National Institutes of Health,NIH)支持的資金。五是一些ELIXIR節(jié)點(diǎn)能夠獲得歐盟結(jié)構(gòu)基金,支持經(jīng)濟(jì)發(fā)展和產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整。節(jié)點(diǎn)的其他資金來(lái)源還包括基金會(huì)(如惠康信托基金和瓦倫堡基金會(huì))和企業(yè),但是與獲得的公共資金相比,這部分資金規(guī)模較小。
表3 ELIXIR融資渠道
3.1.1 以需求為牽引,廣泛整合資源 ELIXIR匯集23個(gè)國(guó)家和組織的220多家研究所,將地方性和區(qū)域性的國(guó)家基礎(chǔ)設(shè)施與全歐洲的數(shù)據(jù)資源、數(shù)據(jù)標(biāo)準(zhǔn)服務(wù)聯(lián)系起來(lái),形成一個(gè)連貫的基礎(chǔ)設(shè)施,滿(mǎn)足歐洲50多萬(wàn)生命科學(xué)家需求,最大程度確保用戶(hù)方便地訪問(wèn)數(shù)據(jù)資源。ELIXIR與許多國(guó)際組織建立良好合作關(guān)系,例如全球基因組與健康聯(lián)盟(the Global Alliance for Genomics and Health,GA4GH)和科學(xué)研究數(shù)據(jù)全球聯(lián)盟(Research Data Alliance,RDA)等,在非洲人類(lèi)遺傳與健康(Human Heredity and Health in Africa,H3Africa)等項(xiàng)目上不斷擴(kuò)大對(duì)外合作,研究環(huán)境和遺傳因素之間的復(fù)雜相互作用以及非洲人群的疾病易感性和藥物反應(yīng)。如ELIXIR 2019—2023計(jì)劃所述,ELIXIR成員國(guó)承諾聯(lián)合提供服務(wù),使歐洲研究者及其合作者能夠方便訪問(wèn)、分析和重復(fù)使用大型、復(fù)雜和地理特色明顯的數(shù)據(jù)集[15]。
3.1.2 善于總結(jié)交流,提升實(shí)踐經(jīng)驗(yàn) ELIXIR組織中的節(jié)點(diǎn)協(xié)調(diào)員是國(guó)家資助的重要崗位,其主要職責(zé)是分享ELIXIR節(jié)點(diǎn)的操作信息和最佳實(shí)踐。ELIXIR研究者致力于從特定研究領(lǐng)域吸取經(jīng)驗(yàn)教訓(xùn),挖掘同樣適用于其他領(lǐng)域的通用研究方法或解決問(wèn)題的方案,然后通過(guò)各節(jié)點(diǎn)、用戶(hù)群體之間的信息共享,將這些好的做法和經(jīng)驗(yàn)擴(kuò)展到其他不同領(lǐng)域[9]。2016年德國(guó)正式加入ELIXIR組織,2018年9月德國(guó)生物信息網(wǎng)絡(luò)(The German Network for Bioinformatics Infrastructure,de.NBI)組織第1次云會(huì)議向用戶(hù)傳授云計(jì)算方面的最佳實(shí)踐,包括案例介紹、數(shù)據(jù)處理、工具使用和工作流程方面的新技術(shù)、新做法。此外,ELIXIR將運(yùn)營(yíng)大型基礎(chǔ)設(shè)施方面的經(jīng)驗(yàn)引入生命科學(xué)管理其他方面,為基因組學(xué)從生物醫(yī)學(xué)研究轉(zhuǎn)化為醫(yī)療保健系統(tǒng)的常規(guī)應(yīng)用奠定基礎(chǔ)[8]。
3.1.3 注重資源交互,服務(wù)內(nèi)容全面 ELIXIR通過(guò)支持核心數(shù)據(jù)資源之間以及ELIXIR服務(wù)和新興服務(wù)之間的交互提升資源和服務(wù)價(jià)值,可訪問(wèn)性資源不僅包括數(shù)據(jù)還包括其他類(lèi)型,例如軟件工具、工作流程和培訓(xùn)材料[10]。注冊(cè)表工具作為ELIXIR工具平臺(tái)的一部分,使研究軟件資源的過(guò)程更加標(biāo)準(zhǔn)化,并為培訓(xùn)材料、培訓(xùn)流程提供TeSS注冊(cè)表,使研究者能夠輕松查找和訪問(wèn)培訓(xùn)資源[16-17]。FAIRsharing提供有關(guān)數(shù)據(jù)和元數(shù)據(jù)標(biāo)準(zhǔn)的精選資源,通過(guò)規(guī)范源頭數(shù)據(jù)的注冊(cè)表實(shí)現(xiàn)數(shù)據(jù)集和軟件的互操作性[18]。
3.1.4 持續(xù)完善平臺(tái),實(shí)現(xiàn)提質(zhì)增效 計(jì)算平臺(tái)開(kāi)發(fā)的ELIXIR認(rèn)證和授權(quán)身份驗(yàn)證基礎(chǔ)設(shè)施可實(shí)現(xiàn)將人類(lèi)敏感數(shù)據(jù)傳輸?shù)桨踩拼鎯?chǔ);數(shù)據(jù)平臺(tái)定義了ELIXIR核心數(shù)據(jù)資源的標(biāo)準(zhǔn)并對(duì)其進(jìn)行識(shí)別,有助于建立全球生物數(shù)據(jù)聯(lián)盟基礎(chǔ)設(shè)施;互操作平臺(tái)確定了一套互操作性資源生物架構(gòu)(Schema.org),并且不定期召開(kāi)互操作性服務(wù)能力建設(shè)研討會(huì);工具平臺(tái)設(shè)置了ELIXIR工具和數(shù)據(jù)服務(wù)中心注冊(cè)表,還開(kāi)發(fā)了數(shù)據(jù)和方法(embrace data and methods,EDAM)本體用于對(duì)工具和服務(wù)注釋[19];培訓(xùn)平臺(tái)向60個(gè)國(guó)家19 000多人提供850多項(xiàng)培訓(xùn)活動(dòng),建立了TeSS、ELIXIR培訓(xùn)門(mén)戶(hù)網(wǎng)站、電子學(xué)習(xí)平臺(tái)和虛擬學(xué)習(xí)室,擴(kuò)大歐洲培訓(xùn)網(wǎng)絡(luò),并且開(kāi)發(fā)了ELIXIR培訓(xùn)工具包等[13]。
3.1.5 積極對(duì)外合作,提升數(shù)據(jù)價(jià)值 ELIXIR積極參與歐洲100萬(wàn)個(gè)基因組計(jì)劃(the beyond 1 million genomes,B1MG)(2020—2023)、生物多樣性社區(qū)綜合知識(shí)庫(kù)(the biodiversity community integrated knowledge library,BiCIKL)(2021—2024)、基因組數(shù)據(jù)基礎(chǔ)設(shè)施(genomic data infrastructure,GDI)(2022—2026)等項(xiàng)目[4]。在植物和農(nóng)業(yè)研究中,ELIXIR橫跨歐洲最大的植物表型分析中心的數(shù)據(jù)聯(lián)盟現(xiàn)已全面運(yùn)作,為歐洲植物數(shù)據(jù)庫(kù)聯(lián)盟提供基礎(chǔ),開(kāi)展跨國(guó)分布式植物“組學(xué)數(shù)據(jù)集”探索。ELIXIR協(xié)調(diào)FAIRplus項(xiàng)目,促進(jìn)歐盟創(chuàng)新藥物倡議資助項(xiàng)目數(shù)據(jù)的可發(fā)現(xiàn)、可訪問(wèn)和可重復(fù)。ELIXIR還協(xié)調(diào)歐洲開(kāi)放科學(xué)云(the European Open Science Cloud,EOSC)生命項(xiàng)目,推動(dòng)歐洲研究與創(chuàng)新戰(zhàn)略論壇(European Strategy Forum on Research and Innovation,ESFRI)為EOSC創(chuàng)建開(kāi)放協(xié)作的數(shù)字空間。此外,德國(guó)生物信息學(xué)基礎(chǔ)設(shè)施網(wǎng)絡(luò)de.NBI為ELIXIR提供了大量高質(zhì)量的培訓(xùn)課程,為不同研究領(lǐng)域、不同知識(shí)水平的研究者提供幫助[8]。
3.2.1 建立“中心+節(jié)點(diǎn)”分布式科學(xué)數(shù)據(jù)平臺(tái)模式 以政府主導(dǎo)的國(guó)家核心數(shù)據(jù)中心為“中心”,遴選系列高質(zhì)量數(shù)據(jù)庫(kù)作為“節(jié)點(diǎn)”,通過(guò)中心鏈接、整合,提升節(jié)點(diǎn)數(shù)據(jù)質(zhì)量,推動(dòng)數(shù)據(jù)開(kāi)放共享。節(jié)點(diǎn)數(shù)據(jù)庫(kù)的選擇應(yīng)基于對(duì)現(xiàn)有數(shù)據(jù)資源質(zhì)量、管理、服務(wù)和轉(zhuǎn)化應(yīng)用情況的評(píng)估和遴選,按照成熟一個(gè)、納入一個(gè)的原則逐漸累積節(jié)點(diǎn)資源庫(kù)。
3.2.2 推動(dòng)數(shù)據(jù)、工具、標(biāo)準(zhǔn)等方面全方位整合 中心平臺(tái)應(yīng)推動(dòng)以FAIR原則為目標(biāo)的數(shù)據(jù)融合、質(zhì)量改進(jìn)、工具整合,并在數(shù)據(jù)標(biāo)準(zhǔn)、協(xié)議等方面持續(xù)優(yōu)化、提升,以支持更加廣泛的開(kāi)放共享。在具體實(shí)施方面,中心平臺(tái)可通過(guò)建設(shè)集數(shù)據(jù)庫(kù)、分析工具、數(shù)據(jù)計(jì)算、交互和培訓(xùn)等功能于一體的綜合性科學(xué)活動(dòng)平臺(tái),也可通過(guò)建設(shè)領(lǐng)域性、行業(yè)性的論壇或互聯(lián)網(wǎng)社區(qū)(如罕見(jiàn)病社區(qū)、植物科學(xué)社區(qū))等方式實(shí)施。
3.2.3 以數(shù)據(jù)使用為目標(biāo)牽引,開(kāi)展多元化業(yè)務(wù) 中心平臺(tái)應(yīng)通過(guò)開(kāi)展培訓(xùn)、宣傳、交流、參與項(xiàng)目等多種業(yè)務(wù)形式,推動(dòng)數(shù)據(jù)應(yīng)用,實(shí)現(xiàn)價(jià)值轉(zhuǎn)化提升。各節(jié)點(diǎn)可設(shè)立協(xié)調(diào)員小組,負(fù)責(zé)技術(shù)協(xié)調(diào)、培訓(xùn)協(xié)調(diào)以及分享操作信息和最佳實(shí)踐,不斷挖掘和總結(jié)不同行業(yè)領(lǐng)域數(shù)據(jù)管理的成功經(jīng)驗(yàn),鼓勵(lì)各行業(yè)將好的經(jīng)驗(yàn)做法通過(guò)科學(xué)活動(dòng)互聯(lián)網(wǎng)共享交流。
3.2.4 持續(xù)優(yōu)化中心與節(jié)點(diǎn)合作模式、完善運(yùn)作機(jī)制 在國(guó)家層面確定中心和各節(jié)點(diǎn)的合作模式及考核方式,明確各自的權(quán)利和義務(wù)。中心和各節(jié)點(diǎn)之間要遵循一定數(shù)據(jù)協(xié)議,建立數(shù)據(jù)共享及保密機(jī)制。
我國(guó)當(dāng)前已經(jīng)建成多樣化、分散的生命科學(xué)數(shù)據(jù)庫(kù),共享應(yīng)用是各數(shù)據(jù)庫(kù)可持續(xù)發(fā)展、發(fā)揮數(shù)據(jù)價(jià)值的唯一路徑,采用“中心+節(jié)點(diǎn)”分布式生命科學(xué)數(shù)據(jù)平臺(tái)形式是推動(dòng)我國(guó)生命科學(xué)數(shù)據(jù)從分散建設(shè)到集中使用的可參考模式。通過(guò)建設(shè)中心平臺(tái),遴選整合優(yōu)秀的節(jié)點(diǎn)數(shù)據(jù)庫(kù),推動(dòng)數(shù)據(jù)、工具、標(biāo)準(zhǔn)等方面多元融合,開(kāi)展以FAIR原則為總體原則的數(shù)據(jù)提質(zhì)改造工作,整體實(shí)現(xiàn)數(shù)據(jù)質(zhì)量、標(biāo)準(zhǔn)、管理和服務(wù)能力的提升,并推動(dòng)以共享使用為目標(biāo)的多元化運(yùn)作機(jī)制,是實(shí)現(xiàn)我國(guó)科學(xué)數(shù)據(jù)“用起來(lái)”較為可行的發(fā)展路徑。
歡迎訂閱 歡迎賜稿