肖婷 陳慧
四川大學(xué)華西第二醫(yī)院/出生缺陷與相關(guān)婦兒疾病教育部重點實驗室 四川 成都 610041
研究數(shù)據(jù)是指“通常被科學(xué)社會所接受的,用于驗證研究發(fā)現(xiàn)的被記錄的必要的事實材料”[1]。該定義包括了分析數(shù)據(jù)和用于描述這些數(shù)據(jù)是如何產(chǎn)生的元數(shù)據(jù)。在大數(shù)據(jù)時代背景下,快速興起的數(shù)據(jù)密集型科學(xué)研究[2],表明巨量科學(xué)數(shù)據(jù)的聚合、分析和探索,已然成為科學(xué)研究的新基礎(chǔ),將加速推動新科學(xué)方法的發(fā)現(xiàn)。
高校實驗室作為科研活動的重要陣地,是研究數(shù)據(jù)產(chǎn)生的主要來源,目前大多實驗室仍沿用傳統(tǒng)紙質(zhì)載體對研究數(shù)據(jù)進行管理,由于科研參與人員在實驗記錄方面的科學(xué)素養(yǎng)主觀差異性較大,從而導(dǎo)致研究項目中的知識傳遞極易出現(xiàn)斷層和偏差,數(shù)據(jù)監(jiān)管也暴露出較大疏漏,嚴(yán)重影響了科研成果的有效延續(xù)和應(yīng)用。
本文將基于科學(xué)素養(yǎng)的視角,探討如何在實現(xiàn)研究數(shù)據(jù)全周期質(zhì)量管理的同時,提升研究人員的科學(xué)素養(yǎng),促進科技創(chuàng)新的高速發(fā)展。
由于實驗室研究參與人員科學(xué)素養(yǎng)的個體化差異,在科研創(chuàng)新大環(huán)境下,傳統(tǒng)紙質(zhì)載體的研究數(shù)據(jù)管理模式,使得科研團隊不易協(xié)作性愈加突出,其劣勢日漸凸顯。
傳統(tǒng)的紙質(zhì)記錄,偏重于對記錄完成的檢查,而對研究人員過程記錄的細節(jié)規(guī)范約束性不足。尤其是部分高校實驗室忽視對研究相關(guān)工作的要求和管理,當(dāng)有些研究人員離開實驗室后,其研究成果需要進行深入探究時,其他研究人員無法看懂和理解該實驗記錄,無法重復(fù)原來的實驗條件和實驗步驟來得出相同的實驗數(shù)據(jù),當(dāng)已發(fā)表的研究成果遭到質(zhì)疑時,無法提供有效的原始記錄[3]。因研究數(shù)據(jù)缺乏有效的管理手段,使產(chǎn)生研究數(shù)據(jù)的記錄的細節(jié)規(guī)范缺乏約束性,導(dǎo)致研究過程中得出的研究數(shù)據(jù)存在多種隱患。
對研究數(shù)據(jù)的實驗記錄規(guī)范培養(yǎng)不足,同時,重研究結(jié)果輕培養(yǎng)過程的普遍現(xiàn)象使研究人員更關(guān)注實驗進度和部分陽性結(jié)果,從而導(dǎo)致記錄較為隨意,時間不詳細,沒有條理,書寫混亂或表述不專業(yè),實驗過程和數(shù)據(jù)記錄不及時,后期憑記憶補記,造成許多細節(jié)被遺漏;僅有過程描述,無實驗現(xiàn)象和實驗結(jié)果的描述等。以上行為都可能導(dǎo)致無法還原最初的實驗條件和實驗步驟,無法重復(fù)實驗結(jié)果,使得已產(chǎn)生的實驗數(shù)據(jù)失去其科學(xué)價值。
目前,多數(shù)高校實驗室的研究人員是自主管理實驗安排和記錄數(shù)據(jù),傳統(tǒng)的紙質(zhì)記錄產(chǎn)生的研究數(shù)據(jù),由于負責(zé)人的工作日程安排不固定,難以實現(xiàn)及時有效的進度交流和核對檢查。同時,傳統(tǒng)模式下,紙質(zhì)記錄具有時間和空間的滯后性,不利于監(jiān)管,不利于共享和深入開展研究工作,并且導(dǎo)致研究人員往往只關(guān)注對自己實驗結(jié)果有利的部分?jǐn)?shù)據(jù),缺乏對實驗數(shù)據(jù)的深層次挖掘,一定程度上造成實驗研究的不全面,降低了研究效率,對于科學(xué)研究的投入是極大的浪費。
近年來,在科研活動中,違背科研誠信要求的事件頻發(fā),科研誠信失信行為常見于各類媒體,以國家自然科學(xué)基金委員會為例,近年來就查處了多起不端行為案例[4-5]。因傳統(tǒng)管理模式對研究數(shù)據(jù)缺乏有效監(jiān)管,使研究人員有機會對研究數(shù)據(jù)編造,篡改科研活動中產(chǎn)生的元數(shù)據(jù),使數(shù)據(jù)更理想化,以支持所研究的觀點,從而易出現(xiàn)科研誠信問題。
高校的研究項目一般持續(xù)時間較長,而實驗室研究人員流動性較大,傳統(tǒng)紙質(zhì)為主的研究數(shù)據(jù)的記錄容易造成研究項目的斷層[6],記錄零碎分散,不易保存和不便檢索的弊端不利于實驗室傳承和存儲共享,難以實現(xiàn)知識共享和有效利用。
調(diào)查發(fā)現(xiàn)[7],個人電腦、光盤、移動硬盤、機構(gòu)電腦等是科研人員保存數(shù)據(jù)最主要的方式,此外,也有部分科研人員選擇保存在紙質(zhì)載體和網(wǎng)絡(luò)硬盤上。我國研究數(shù)據(jù)的保管主要以個人為主(超過80%)[8],這給數(shù)據(jù)的共享與安全帶來不利影響:一是數(shù)據(jù)分散在個人手中,導(dǎo)致研究數(shù)據(jù)管理混亂,零碎分散,不僅規(guī)范性差、不易保存,不也無法快速檢索、查看,使數(shù)據(jù)不會被公開或者共享給其他研究人員作為研究依據(jù),這對于科研經(jīng)費的投入是極大的浪費。二是分散保管容易造成數(shù)據(jù)的丟失和損毀,缺乏手段進行數(shù)據(jù)記錄的規(guī)范化管理,數(shù)據(jù)的安全面臨風(fēng)險。
高校作為科研活動的重要陣地,擁有巨量的研究數(shù)據(jù),同時,高校研究數(shù)據(jù)的管理也是國家研究數(shù)據(jù)管理的重要一環(huán)。國家對研究數(shù)據(jù)管理高度重視,為加強我國科研數(shù)據(jù)管理的規(guī)范性,2018年4月國務(wù)院辦公廳印發(fā)《科學(xué)數(shù)據(jù)管理辦法》[9],規(guī)定科學(xué)數(shù)據(jù)管理工作實行國家統(tǒng)籌、各部門與各地區(qū)分工負責(zé)的體制,并明確規(guī)定高等院校是科學(xué)數(shù)據(jù)管理的責(zé)任主體,應(yīng)該建立健全本單位科學(xué)數(shù)據(jù)相關(guān)管理制度,同時對我國科學(xué)數(shù)據(jù)管理的數(shù)據(jù)的采集、記錄、保存與匯交、共享與應(yīng)用等方面都進行了規(guī)范。對推動科研數(shù)據(jù)管理與共享實踐和促進科技創(chuàng)新具有重要的意義。
近年來,隨著信息技術(shù)的快速發(fā)展與應(yīng)用,以及互聯(lián)網(wǎng)+時代的到來,信息化建設(shè)不斷加強,實現(xiàn)研究數(shù)據(jù)信息化管理成為必備的工作需求。利用研究數(shù)據(jù)的信息化管理,可以更加有效地引導(dǎo)研究參與人員完成研究數(shù)據(jù)的標(biāo)準(zhǔn)化收集、規(guī)范性記錄、系統(tǒng)分析、完整保存和無偏差的共享。同時,在確認(rèn)科學(xué)問題、使用證據(jù)、深入思考、做出科學(xué)結(jié)論的反復(fù)訓(xùn)練過程中,強化知識的理解,訓(xùn)練科學(xué)思維以及應(yīng)用科學(xué)知識解決科學(xué)問題的能力。
大數(shù)據(jù)時代,對于科研數(shù)據(jù)的應(yīng)用和轉(zhuǎn)化,如果沒有更加有效的管理手段和途徑,科研創(chuàng)新的進度將被嚴(yán)重阻礙和滯后。因此,如何行之有效地進行研究數(shù)據(jù)管理,在社會發(fā)展需求背景下,具有重要的現(xiàn)實意義。
研究數(shù)據(jù)產(chǎn)生于科學(xué)工作流,擁有自己的生命周期。英國DCC將研究數(shù)據(jù)生命周期分成6個階段,包括創(chuàng)建、處理、分析、保存、獲取、重用,而數(shù)據(jù)管理是為了以一種有效的方式管理數(shù)據(jù)生命周期的需要,是一系列架構(gòu)、政策、實踐和程序的開發(fā)和執(zhí)行活動[10]。
研究數(shù)據(jù)信息化管理系統(tǒng)主要用于實驗記錄、分析方法庫的建立和實驗數(shù)據(jù)的規(guī)范管理,確保所有的研究數(shù)據(jù)都能被適當(dāng)?shù)赜涗浵聛?,并在必要時得以使用。實驗記錄中保存的研究數(shù)據(jù),須設(shè)計含有多個功能模塊的實驗記錄模板,模板中可容納被允許的記錄要求和研究數(shù)據(jù)保存形式,包含實驗基本信息、記錄正文、元數(shù)據(jù)保存提交等內(nèi)容。
良好的數(shù)據(jù)管理是研究過程各階段的基礎(chǔ),為了有效推動科研發(fā)展,應(yīng)在實驗室研究工作的開始就著手建立。以實驗記錄為管理基線,規(guī)范研究數(shù)據(jù)記錄流程,提高研究數(shù)據(jù)利用效率,全面整合資源,以期實現(xiàn)對實驗過程中的記錄、結(jié)果分析、儲存、數(shù)據(jù)監(jiān)管和應(yīng)用在一定范圍內(nèi)共享的研究數(shù)據(jù)信息化管理,實現(xiàn)數(shù)據(jù)生命周期內(nèi)“記錄-保存-監(jiān)管-應(yīng)用”的完整鏈條,為科研人員提供一個優(yōu)質(zhì)、高效和規(guī)范的創(chuàng)新環(huán)境,構(gòu)建規(guī)范、高效和適用的研究數(shù)據(jù)管理系統(tǒng)。
通過對研究數(shù)據(jù)生命周期管理,將數(shù)據(jù)采集、數(shù)據(jù)記錄、數(shù)據(jù)保存、數(shù)據(jù)分析與挖掘等過程痕跡化,一方面,在后續(xù)實驗過程中重新分析結(jié)果時有了更加可靠的數(shù)據(jù)支持,另一方面,通過研究數(shù)據(jù)監(jiān)管信息化,實驗記錄可實現(xiàn)動態(tài)管理,隨時檢查,便于負責(zé)人員或管理人員及時發(fā)現(xiàn)和糾正實驗過程中發(fā)生的錯誤或疏漏,在存在異議時給予及時指出,使實驗結(jié)果真實、可信,避免學(xué)術(shù)造假等學(xué)術(shù)不端行為。
研究數(shù)據(jù)記錄是研究項目成功的關(guān)鍵因素之一,強調(diào)對數(shù)據(jù)過程和結(jié)果記錄要及時、真實、清晰、完整和規(guī)范,以保證研究數(shù)據(jù)的真實性和規(guī)范性。在研究數(shù)據(jù)保存方面,強調(diào)上傳保存所有的原始數(shù)據(jù),使后續(xù)研究重新分析研究結(jié)果時有數(shù)據(jù)支撐,也杜絕了學(xué)術(shù)不端的可能。除上傳原始數(shù)據(jù)外,還要求研究人員對上傳的數(shù)據(jù)進行分析說明或歸納總結(jié)的詳細而準(zhǔn)確的解釋性文檔,以便他人查閱和理解其研究結(jié)果,同時也是對研究人員進行科研素質(zhì)訓(xùn)練。在數(shù)據(jù)監(jiān)管方面,強調(diào)研究負責(zé)人及時審閱研究人員的研究數(shù)據(jù)記錄,同時通過信息化管理系統(tǒng)與研究人員進行有效互動,共同分析實驗結(jié)果,評價研究項目進展,及時擬定下一步工作計劃,該系統(tǒng)使研究數(shù)據(jù)在細節(jié)方面的管理提供了多樣化的呈現(xiàn),對科學(xué)素養(yǎng)形成進行了強化。
信息化的研究數(shù)據(jù)管理體系有利于固定化培養(yǎng)研究人員的規(guī)范操作、規(guī)范記錄、規(guī)范分析與研究探討,在研究數(shù)據(jù)產(chǎn)生、管理和重用的全生命周期各環(huán)節(jié),設(shè)置質(zhì)量管理要求,在整理數(shù)據(jù)、分析數(shù)據(jù)、得出科學(xué)結(jié)論的循環(huán)中,不斷強化數(shù)據(jù)意識,提升研究人員歸納、分析、總結(jié)、探究的科學(xué)思維能力,進而促進科學(xué)素養(yǎng)的形成。
信息化手段在研究數(shù)據(jù)管理過程中的應(yīng)用,可以更好地實現(xiàn)研究數(shù)據(jù)的規(guī)范化、精細化、動態(tài)化、高效化管理。研究數(shù)據(jù)應(yīng)該包括所有可以用來驗證結(jié)果的,支持研究問題的證據(jù)。為了使研究數(shù)據(jù)在其生命周期中易于發(fā)現(xiàn)、使用和管理,研究人員必須確保創(chuàng)建和維護足夠的文檔或元數(shù)據(jù),保存更為完整的數(shù)據(jù)、描述和觀察,通過更為客觀的信息,進而獲得科學(xué)規(guī)律。
實驗記錄模板的設(shè)計應(yīng)突出以人為本的理念,通過便捷的撰寫錄入,在記錄和保存的過程中逐步落實研究數(shù)據(jù)的規(guī)范化要求,可以有效解決傳統(tǒng)的實驗記錄或紙質(zhì)書寫錄入報告時可能出現(xiàn)的數(shù)據(jù)不清楚、格式不規(guī)范、難以溯源等問題,避免因科研人員流動、基層管理疏漏及儀器設(shè)備更新問題,造成實驗記錄和數(shù)據(jù)的流失和損壞。
在線化的研究數(shù)據(jù)管理系統(tǒng)能夠?qū)崿F(xiàn)快速檢索和回顧查看以往各階段的實驗設(shè)計和過程細節(jié),有助于研究者保持清醒的實驗思路,把握實驗執(zhí)行進度,提高科研效率,抓住關(guān)鍵的實驗現(xiàn)象,準(zhǔn)確回顧和分析科研實踐中的成敗得失,得出更加可靠的實驗結(jié)論。
同時,實驗室研究數(shù)據(jù)信息結(jié)構(gòu)化,實現(xiàn)了即時互通和交流共享,同時,負責(zé)人可通過系統(tǒng)對研究數(shù)據(jù)進行限時的審核歸檔,使研究數(shù)據(jù)得到有效監(jiān)管和及時保存。
信息化管理模式的應(yīng)用可以高效地提高各種格式的研究數(shù)據(jù)創(chuàng)建、組織、存儲和分發(fā),有利于研究數(shù)據(jù)的訪問、整合、發(fā)現(xiàn)、共享、長期保存和重用,使研究數(shù)據(jù)更加具有可讀性和可交流性,提高了知識傳遞的效率,讓研究數(shù)據(jù)的提取更加直觀和便捷,降低科學(xué)研究成本,也切實保障了科學(xué)研究過程的可回溯性和驗證。
數(shù)據(jù)處于研究的核心位置,由研究項目過程創(chuàng)建,擁有比研究項目更長的壽命[11]。有效的研究數(shù)據(jù)是孕育科研成果的源泉。在科技創(chuàng)新背景下,加強高校實驗室研究數(shù)據(jù)的信息化建設(shè)是必然發(fā)展趨勢,也是促進科學(xué)素養(yǎng)教育的重要手段。研究數(shù)據(jù)管理必須貫穿于整個研究數(shù)據(jù)生命周期,高校實驗室的研究人員應(yīng)轉(zhuǎn)變心態(tài),接受和適應(yīng)信息化轉(zhuǎn)型,加快科技創(chuàng)新進程,提高研究數(shù)據(jù)管理能力,規(guī)范科學(xué)素養(yǎng)的培養(yǎng)過程,孵化更多的研究成果。