吳海茹
為提高科研數據管理水平,國外眾多研究機構引入生命周期管理理念,形成各具特色的數據管理模型,如ICPSR社會科學數據存檔生命周期模型、DataONE科學數據生命周期管理模型、英國數據存檔生命周期管理模型等[1]。這些模型雖因研究主體的不同而存在一定差異,但均將制定數據管理計劃視為科研數據管理的關鍵點。為幫助研究者迅速生成簡單有效的數據管理計劃,加州數字圖書館數據保存中心基于科研人員的現實需求,聯合其他7所科研機構,共同研制了一款數據管理計劃生成工具—DMPTool。本文擬對該工具進行介紹,并闡述該工具為國內科研數據管理帶來的啟示。
2010年初,美國國家自然科學基金會(簡稱NSF)發(fā)布了項目管理指南,規(guī)定自2011年1月18日起所有提交至NSF的申請項目必須以附件形式提交一份不超過兩頁紙的數據管理計劃,詳細描述申請者如何實現項目數據的有效管理與共享傳播,缺少數據管理計劃的申請項目將不予接受[2]。除此之外,美國衛(wèi)生和人類服務部下屬的國立衛(wèi)生研究院、美國航空航天局等其他科研項目資助巨頭同樣在其資助指南中對項目的數據管理做出明確規(guī)定。為響應這些科研項目資助機構的要求,方便科研者制作數據管理計劃,美國加州數字圖書館數據保存中心聯合加州大學洛杉磯分校圖書館、加州大學圣地亞哥分校圖書館、史密森學會、弗吉尼亞大學圖書館、伊利諾伊大學厄巴納香檳分校圖書館、數據監(jiān)管中心以及DataONE項目中心,推出了數據管理計劃生成工具DMPTool[3]。
2011年10月,DMPTool在線版本正式發(fā)布,該工具一經發(fā)布,便引起科研界及圖書館界的極大關注,并入選美國國會圖書館2011年十大數字保存發(fā)展項目。2013年,DMPTool項目組接受Alfred P.Sloan基金會、美國博物館和圖書館協會注資,開始了第二階段的研發(fā)工作。2014年5月,項目組正式發(fā)布DMPTool V2版本,相較版本1,版本2實現了諸多改良(見表1)。
系統的角色權限設計包括兩個維度:一是系統用戶的角色定義,包括角色大類(如操作員、管理員)和大類下的角色細分(如科研機構級別管理員、總系統管理員);二是職責和權限在不同角色大類和細分角色的分配。
升級版的DMPTool在角色權限方面做出了如下改良:(1)增設系統編輯員角色,包括資源編輯員和模板編輯員,前者負責幫助信息、鏈接信息、參考答案的日常維護和更新,后者負責數據計劃模板的日常維護和更新。(2)增設科研機構級別DMP復核員角色,負責對機構內提交的數據管理計劃進行統一檢查和審核。(3)對管理員角色進一步細分,增設科研機構級別管理員,負責管理、維護機構級別的DMPTool,及時收集反饋基層數據管理需求信息,協調發(fā)展科研機構與資助機構、總系統管理員的合作關系。
表1 DMPTool新舊版本對比分析表
升級版的DMPTool登錄界面包含三大模塊:公開化DMPS、DMPTool新聞和DMPTool幫助。該界面設計可以使用戶在正式使用工具前通過大致的瀏覽就可以初步掌握DMP的結構內容、DMPTool的發(fā)展動態(tài)及具體如何使用DMPTool。其中,幫助模塊最能集中體現升級版DMPTool的創(chuàng)新:(1) 增加FAQ(Frequently Asked Questions,常見問題解答);(2)專設針對系統管理員的Wiki幫助,并通過GitHub進行托管控制;(3)增加數據管理指導內容,相較舊版工具側重于數據計劃的生成,升級版的工具更側重于對科研人員數據管理能力的提升;(4)增加公開資源信息,公開資源信息包括各資助機構的項目信息、最新政策、資助動態(tài)等內容,該內容的加入賦予了DMPTool新的內涵和外延,除了數據管理計劃生成功能,DMPTool進一步彰顯了對科研機構、資助機構和科研人員三者信息溝通和合作的促進作用[4]。
舊版的數據管理計劃工具中,可供用戶參考復制的數據計劃模板大多是按照資助機構的數據管理政策制定,實際工作中,由于各科研機構對數據存儲、數據共享要求的差異,這些按照資助機構要求制定的模板并不能完全滿足科研人員以及科研機構數據管理計劃生成需求。因此,升級版的DMPTool中特別增設了科研機構DMP模板,該模板管理權限統一下放到科研機構層級的系統管理員。
數據政策、用戶需求的不同都會引發(fā)數據管理計劃的不同,而數據管理需求又會隨著科研領域、數據管理偏好、數據計劃用途等具體內容的變動而變化。DMPTool必須在統一的數據管理政策下,盡可能關注科研人員多樣化、個性化需求,才能實現應用工具的可持續(xù)化發(fā)展,因此,升級版的DMPTool進一步拓展了其自定義功能。(1)科研機構自定義。包括①機構基礎信息輸入、Logo設計;②機構授權,自定義設置不同的角色和權限,如模板編輯員、資源編輯員、復核員、管理員;③模板自定義,設計符合本機構數據政策、應用于不同領域或提交給不同資助機構的DMP模板。(2)科研人員自定義。這一模板大多是為了滿足用戶特定條件下的需求,如教師想設計一份用于大一本科生數據管理課堂教學的通用性DMP,或者項目中不同角色(PI或CO-PI)的科研人員需要從不同角度出發(fā)設計不同數據管理側重點的DMP,這些都可以通過用戶自定義功能實現[5]。
DMPTool工具是一款開源軟件,可免費獲取,用戶登錄注冊也不受任何限制。協助科研人員以最簡單直接的方式生成數據管理計劃,是DMPTool的項目宗旨之一??v觀整個DMPTool的使用步驟(如圖1),完美詮釋了在線應用工具的便捷性。
第一步,選擇DMP模板。包括三項內容:(1)選擇登陸方式(機構用戶或非機構用戶);(2)選擇科研項目資助機構,如NSF-AGS(NSF天文地理科學基金會)或 NSF-BIO(NSF生物科學基金會)等;(3)選擇所需復制的計劃模板,即開放共享的計劃、機構內共享計劃、用戶創(chuàng)建的歷史計劃。用戶應評估當前計劃需求,選擇適當的模板作為新計劃的制定基礎。
第二步,填寫數據計劃基礎信息。包括以下內容:填寫計劃名稱、項目申請?zhí)枴㈨椖刻岚附刂谷盏葍热?;增加項目合作者信息,設置項目合作方擁有對數據計劃編輯、預覽、下載的權限;設置數據計劃公開方式,包括僅項目申請人和合作者可見、機構內共享和公開存取3類。
第三步,完成DMP細節(jié)描述。通過答題的方式,完成數據格式、數據存儲方式、數據共享策略等內容的設置,每道問題都配答題指導、參考答案和相關性資源鏈接,能夠保證數據管理能力較弱的用戶也能詳細、客觀地作答。
第四步,自動生成科研項目數據管理計劃。DMPTool在綜合前3步信息的基礎上,自動生成報告,用戶只需選擇報告導出格式(txt/rtf/pdf等3類),便可預覽、審查系統形成的數據計劃,并根據實際需求做出相應調整。整個使用過程方便快捷,不僅有利于科研人員時間成本的節(jié)約,潛移默化中也有利于其數據管理能力的提升[6]。
先前的科研模式中,研究者、研究機構和資助機構三方對科研數據的管理需求被完全割裂,而DMPTool的出現,成為聯系三方科研數據管理需求的橋梁和紐帶。(1)研究者和研究機構間數據管理的有機聯系??蒲腥藛T可以通過DMPTool查看所屬機構的計劃示例,預覽科研機構的需求,查看計劃的最新動態(tài),另一方面,科研機構也可以利用DMPTool積極了解科研人員的數據管理水平及需求,利用工具中呈現的數據管理信息和政策,整合規(guī)范自身的數據管理政策,促進科研人員與機構圖書館、IT部門及其他數據管理部門的合作和創(chuàng)新。(2)研究者和資助機構間數據管理的有機聯系。DMPTool幾乎囊括了所有主要項目資助機構(NSF/HIN/DOE/NASA/USDA/DOD)的數據管理要求,并及時追蹤各機構的數據政策變更,科研人員可以通過DMPTool了解資助機構的數據管理需求,另一方面,資助機構也可以隨時通過對數據管理計劃的查看、編輯,及時掌握科研人員的需求動向,改良其數據管理要求和政策。(3)研究機構和資助機構間數據管理的有機聯系。科研人員制定的數據計劃可以通過科研機構的審核后提交至資助機構,強化了科研單位對資助機構的數據管理政策研究,另一方面,科研機構也可以通過DMPTool與資助機構探討數據管理相關政策,反饋科研人員的集中化數據管理需求,逐步實現數據政策的規(guī)范統一[7]。
DMPTool不僅能夠幫助用戶高效生成標準化數據管理計劃,還可以滿足用戶多樣化、個性化的數據管理需求。(1)對科研人員而言,用戶可以在標準化數據管理計劃中添加體現其個性化需求的元素,使得整個計劃在滿足資助機構、科研機構要求的同時體現用戶一些個性化、多元化的數據管理需求。(2)對科研機構而言,DMPTool管理員可以依據科研人員需求自定義其數據管理計劃工具,在現有功能的基礎上增加機構級別的信息服務功能,如數據存儲服務,不僅進一步完善數據管理計劃,更有利于其對科研數據的統一規(guī)范化管理[8]。(3)對資助機構而言,用戶可以依據資助機構的不同需求而提供不同的計劃版本,同時可以依據資助機構需求信息變更,及時調整數據計劃,保證計劃體現資助機構的專門性需求。
科研數據生命周期理論告訴我們,科研數據遵循計劃、采集、確認、描述、保存、分析的發(fā)展過程,要確??蒲袛祿l(fā)揮出更多價值,必須依據數據發(fā)展進程來管理數據。國外科研資助機構及科研機構很早就將提供數據管理計劃作為項目申請的硬性要求,我國也應積極設立數據管理計劃相關規(guī)范要求。首先,政府部門應積極引導科研數據的規(guī)范化管理和開放式存取,制定完善的數據管理政策,從政策層面進行數據計劃流程的規(guī)范和引導。其次,各科研資助管理機構應依據政府出臺政策制定相關的實施細則或操作指導,硬性規(guī)定項目申請必須附帶符合標準的數據管理計劃,同時從多方面提供資源,輔助其計劃制定。最后,科研機構同樣需要制定符合本機構數據管理需求的數據管理政策,協助科研人員制定數據計劃,促進科研數據的共享和傳播。
政府科研管理機關、科研人員、科研機構和資助機構共同構成了科研有機統一體。政府是科技創(chuàng)新的保護者、相關配套制度的建設者、重要基礎設施的投資者以及科技創(chuàng)新與產業(yè)政策的制定者;科研資助機構在政府相關政策指導下落實科研項目考核評估、促進產學研結合、優(yōu)化科研資源配置、引導科研成果創(chuàng)新;科研機構側重機構層面管理規(guī)章制度的制定和落實,組織申報各級、各類科研項目,負責科研成果的審核、評估和歸檔及其他面向本機構科研人員的科研服務項目;科研人員是最直接的科研成果產出者,利用政府、資助機構、科研機構提供的多方資源開展研究,形成豐富的科研成果。充分的信息共享和溝通是科研有機統一體高效運作的前提,DMPTool項目的成功之處也正是在于其實現了研究者、研究機構和資助機構的緊密聯系。我國也應通過統一科研平臺的構建,及時發(fā)布國家科研導向和政策扶持,反饋各類科研需求,保證科研人員的言路暢通和科研政策的上通下達。
DMPTool數據管理計劃生成工具的產生直接源于科研人員項目申報的需求,除了DMPTool,美國加州數字圖書館數據保存中心還設計有一系列滿足科研人員數據管理的工具(圖2)。
以數據生命周期為序,在數據計劃階段有DMPTool協助科研人員生成數據管理計劃,項目申請成功后,科研人員可以通過DataUp檢測數據格式、建立標準化元數據,EZID賦予科研數據統一化標識符,最后通過Merritt實現數據的長期存儲、管理和分享。整個數據管理過程中,科研人員還可使用Colectica進行數據追蹤。強有力數據管理工具箱保障了科研人員對數據的全過程及高效管理。我國科研相關機構也應在切實了解科研人員需求的基礎上,設計一系列數據管理應用工具,形成工具箱體系,實現科研人員對科研數據的全方位、高效化管理。
各科研機構、科研資助機構在實踐中都積累了豐富的科研數據管理經驗,科研人員也形成了較高的科研數據管理素養(yǎng),美國加州數字圖書館的DMPTool工具對三方資源進行了有效整合。(1)通過自定義功能的設置,鼓勵科研人員、科研機構在DMPTool平臺設計符合不同用途和需求的計劃模板,并實現模塊共享化管理;(2)DMPTool工具中整合了科研機構、資助機構的數據政策、常見問題、管理程序等信息,通過長期應用實踐的磨合,有利于更為統一規(guī)范的數據管理政策和科研數據環(huán)境的形成;(3)DMPTool平臺實現數據計劃的三級復核制度,并設有不同級別的數據計劃管理員,充分利用了一切可利用的資源實現了科研數據的高效管理。國內的科研數據管理也應在多方科研力量集結的基礎上,實現數據管理資源的有效整合和利用。
加州數字圖書館聯合其他7所科研機構研制的DMPTool數據管理計劃生成工具為我國數據管理提供了新視角,國內科研機構應在設立數據管理計劃標準化程序、切實了解科研人員需求的基礎上,促進科研人員、科研機構和資助機構的溝通交流,整合多方資源,設計強有力的數據管理工具箱,實現對科研數據高效管理。
[1] 丁寧.國外高??茖W數據生命周期管理模型比較研究及借鑒[J].圖書情報工作,2013(3):18-22.
[2] NSF.Grants.gov application guide:A guide for preparation and submission of NSF applications via grants.gov[EB/OL].(2011-01-18)[2014-05-21].http://www.nsf.gov/pubs/policydocs/grantsgovguide0111.pdf.
[3] Sallans,Andrew.DMPTool:a community tool[EB/OL].(2011-07-11)[2014-05-21].http://blog.dmptool.org/about-the-dmptool/.
[4] Lake,Sherry.DMPTool2:Improvements and Outreach[EB/OL].(2013-11-04) [2014-06-04].http://blog.dmptool.org/presentations-and-press/.
[5] Strasser,Carly.Expanded functionality for better data managementplanning[EB/OL].(2014-02-25)[2014-06-04].http://blog.dmptool.org/presentations-and-press/.
[6] Zing, Tao.DMPTool:Expert Resources and Support forDataManagementPlanning[EB/OL].(2013-09-06)[2014-06-04].http://blog.dmptool.org/presentationsand-press/.
[7] Sallans, Andrew.DMPTool:Integration with other open science software[EB/OL].(2013-05-23)[2014-06-04].http://blog.dmptool.org/presentations-and-press/.
[8] Abrams Stephen,Sallans Andrew.Enhancing DMP Tool:Further Stream lining The Data Management Planning Process[EB/OL].(2013-12-10)[2014-06-04].http://blog.dmptool.org/presentations-and-press/.