文 /Stefan Br?se,Britta Nestler
每一個(gè)實(shí)驗(yàn)室都會(huì)承擔(dān)多個(gè)科研項(xiàng)目 // 每一個(gè)科研項(xiàng)目的完成都需要許多人的合作,科研項(xiàng)目的進(jìn)行也需要信息自由地交流,然而數(shù)據(jù)在交換時(shí)常會(huì)遇到了一些阻力。Karsruhe市建造的數(shù)據(jù)管理和數(shù)據(jù)分析能力中心有望解決這一問(wèn)題,利用統(tǒng)一的數(shù)字化平臺(tái)處理來(lái)自科研實(shí)驗(yàn)中的一系列數(shù)據(jù)。
大多數(shù)情況下,實(shí)驗(yàn)數(shù)據(jù)和模擬分析數(shù)據(jù)的產(chǎn)生和存儲(chǔ),都消耗了大量的人力、物力和財(cái)力,這些數(shù)據(jù)對(duì)科研實(shí)驗(yàn)非常重要。可以長(zhǎng)久地保存和利用這些數(shù)據(jù)有著非常重要的意義。數(shù)據(jù)的丟失也就意味著丟失了已經(jīng)獲得的知識(shí)。人工智能的快速發(fā)展都是建立在大數(shù)據(jù)基礎(chǔ)之上的,同時(shí),人工智能也將是未來(lái)實(shí)驗(yàn)室發(fā)展的方向,因此,可持續(xù)發(fā)展科研數(shù)據(jù)庫(kù)就更有價(jià)值了。
由于缺少高效管理科研數(shù)據(jù)所需的基礎(chǔ)設(shè)施和軟件,科研人員在處理科研數(shù)據(jù)時(shí)經(jīng)常會(huì)遇到一些障礙。這一缺失直接導(dǎo)致自然科學(xué)和工程學(xué)科研領(lǐng)域中的許多研究數(shù)據(jù)無(wú)法長(zhǎng)期保存和使用。這不僅影響到專業(yè)領(lǐng)域內(nèi)部數(shù)據(jù)的應(yīng)用問(wèn)題,而且也影響到跨學(xué)科領(lǐng)域的數(shù)據(jù)應(yīng)用問(wèn)題。2019年7月,Karlsruhe理工學(xué)院(KIT)與Karlsruhe大學(xué)、Karlsruhe FIZ萊布尼茨信息基礎(chǔ)設(shè)施研究所合作,建立了MoMaF科研數(shù)據(jù)中心SDC。它將幫助研發(fā)團(tuán)隊(duì)克服科研數(shù)據(jù)管理中存在的障礙。由于自然科學(xué)和工程科學(xué)領(lǐng)域中的許多專業(yè)是相互交織、相互配合的,它們的科研數(shù)據(jù)和科研成果也常??梢杂糜陔p方的科學(xué)研究,因此,MoMaF數(shù)據(jù)中心不僅支持本學(xué)科領(lǐng)域中的科研工作,也支持跨學(xué)科相關(guān)領(lǐng)域中的科學(xué)研究工作。
SDC科研數(shù)據(jù)中心將通過(guò)下述方法為科學(xué)研究人員提供支持和幫助:
■開發(fā)電子實(shí)驗(yàn)室期刊,并將其作為科研工作中有用的虛擬工作環(huán)境;
■建立發(fā)布和保存數(shù)據(jù)的資料庫(kù);
■為科研數(shù)據(jù)的管理和數(shù)據(jù)分析做好推薦服務(wù)工作,建立數(shù)據(jù)推薦服務(wù)系統(tǒng)。
■開發(fā)各個(gè)主管部門、外部數(shù)據(jù)庫(kù)與內(nèi)部資源適用的接口。
■整合現(xiàn)有資源,例如科研數(shù)據(jù)存儲(chǔ)和分類歸檔。
這些措施是通過(guò)Karlsruhe理工學(xué)院KIT和合作伙伴Karlsruhe大學(xué)(Hs-Ka)、Karlsruhe萊布尼茨信息基礎(chǔ)設(shè)施研究所(FIZ)中的不同工作組來(lái)貫徹落實(shí)的。優(yōu)勢(shì)互補(bǔ)的相互結(jié)合能夠制定出以實(shí)踐為主導(dǎo)的科研數(shù)據(jù)管理的整體方案。
電子實(shí)驗(yàn)室期刊ELNs和數(shù)據(jù)儲(chǔ)存庫(kù)是SDC科研數(shù)據(jù)中心的兩大支柱,能為科研人員當(dāng)前的文件資料編撰提供更好的支持和幫助。SDC科研數(shù)據(jù)中心開發(fā)的應(yīng)用軟件簡(jiǎn)化了科研工作的日常工作流程,為用戶提供了優(yōu)質(zhì)的服務(wù),從而能夠吸引更多的科研人員使用這一軟件產(chǎn)品。另外,所有的科研人員都擁有開發(fā)許可證,這就能夠構(gòu)建更加廣泛的用戶群和開發(fā)者社區(qū)。
數(shù)據(jù)中心開發(fā)的電子實(shí)驗(yàn)室期刊軟件是在Chemotion ELN電子實(shí)驗(yàn)室筆記本項(xiàng)目基礎(chǔ)之上進(jìn)行的。電子實(shí)驗(yàn)室期刊軟件的開發(fā)由有機(jī)化學(xué)研究所、Steinbuch計(jì)算中心和KIT的圖書館等部門共同籌備,并在多個(gè)綜合小組開展測(cè)試?,F(xiàn)在已經(jīng)可以使用的源代碼最初是為有機(jī)化學(xué)領(lǐng)域的科學(xué)家使用而編寫的,現(xiàn)在正在逐步地推廣到相鄰專業(yè)領(lǐng)域中使用。電子實(shí)驗(yàn)室期刊軟件開發(fā)方的模塊化方案能夠滿足不同實(shí)驗(yàn)室用戶在實(shí)驗(yàn)分析和模擬計(jì)算時(shí)的不同要求。對(duì)于有著相似工作過(guò)程和分析過(guò)程的科研領(lǐng)域,只需要對(duì)電子實(shí)驗(yàn)室筆記本軟件補(bǔ)充幾個(gè)模塊,就能保證其功能和應(yīng)用。在MoMaF數(shù)據(jù)中心框架內(nèi)的ELN電子實(shí)驗(yàn)室筆記本軟件將由專門小組安裝在各個(gè)相關(guān)研究所的計(jì)算機(jī)中,保證了系統(tǒng)里的科研數(shù)據(jù)和各種當(dāng)前科研信息不會(huì)被泄漏,被帶出實(shí)驗(yàn)室。SDC科研數(shù)據(jù)中心將伴隨和服務(wù)用戶使用電子實(shí)驗(yàn)室期刊的全過(guò)程。
每一個(gè)研究所的電子實(shí)驗(yàn)室期刊軟件都可以將數(shù)據(jù)按照交互操作的方式傳輸給獨(dú)立運(yùn)行的科研數(shù)據(jù)庫(kù),這就使得科研人員不但可以隨時(shí)更新是數(shù)據(jù)庫(kù),還能夠獲取更多的科研數(shù)據(jù)和信息。最初,科研人員需要將ELN電子實(shí)驗(yàn)室筆記本中的數(shù)據(jù)傳輸?shù)終IT理工學(xué)院負(fù)責(zé)運(yùn)營(yíng)的數(shù)據(jù)中心,還要對(duì)數(shù)據(jù)中心的審查過(guò)程提供支持?,F(xiàn)在,電子實(shí)驗(yàn)室期刊軟件可以幫助每一個(gè)科研人員毫不費(fèi)力地將數(shù)據(jù)直接傳輸?shù)綌?shù)據(jù)庫(kù)。從長(zhǎng)期發(fā)展的角度來(lái)看,通過(guò)這種方式源源不斷地提供數(shù)據(jù)將有利于各個(gè)專業(yè)專用數(shù)據(jù)庫(kù)的建設(shè)。有些數(shù)據(jù)因缺少專業(yè)性而不被關(guān)注,并很少被重復(fù)使用,而那些有著明確專業(yè)性的數(shù)據(jù)、信息將成為科研工作的主要信息來(lái)源。在KIT管理學(xué)院建成的Chemotion資料庫(kù)已經(jīng)可以在科研項(xiàng)目的第一個(gè)階段中應(yīng)用了,并為其它領(lǐng)域的科研項(xiàng)目提供了示范。
上述電子實(shí)驗(yàn)室期刊和資料庫(kù)的發(fā)展離不開基礎(chǔ)設(shè)施和專業(yè)技術(shù)的支持。其中的基礎(chǔ)設(shè)施包括了實(shí)現(xiàn)計(jì)劃工作所需的數(shù)據(jù)存儲(chǔ)能力和計(jì)算能力。技術(shù)支持包括了各個(gè)ELN電子實(shí)驗(yàn)室筆記和資料庫(kù)之間的接口。另外,還有以FAIR公平數(shù)據(jù)原則為主導(dǎo)的最佳實(shí)踐模型也是電子實(shí)驗(yàn)室期刊和資料庫(kù)擴(kuò)展的基礎(chǔ)。這一擴(kuò)展不僅需要有收集、整合原數(shù)據(jù)的解決方案,而且也需要從法律的角度考慮SDC科研數(shù)據(jù)中心的研發(fā)設(shè)計(jì)儲(chǔ)存問(wèn)題。