胡雪環(huán)等 屈寶強(qiáng)
(中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)
美國(guó)普渡大學(xué)圖書(shū)館的科學(xué)數(shù)據(jù)管理服務(wù)
胡雪環(huán)等 屈寶強(qiáng)
(中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)
對(duì)普渡大學(xué)的科學(xué)數(shù)據(jù)管理政策進(jìn)行解讀,在此基礎(chǔ)上對(duì)其主要政策內(nèi)容進(jìn)行整合并將之歸納為數(shù)據(jù)收集政策、數(shù)據(jù)保存政策、數(shù)據(jù)使用規(guī)定、數(shù)據(jù)管理與維護(hù)四大部分,進(jìn)一步總結(jié)出高校在制定數(shù)據(jù)管理政策時(shí)的注意事項(xiàng),從微觀層面為我國(guó)高校圖書(shū)館制定科學(xué)數(shù)據(jù)管理政策內(nèi)容提供具體參考和借鑒。
高校圖書(shū)館;科學(xué)數(shù)據(jù)管理;收集政策;保存政策;使用規(guī)定
作為高校教學(xué)和科研信息資源保障中心,圖書(shū)館應(yīng)充分利用自身優(yōu)勢(shì),積極探索符合本校的科學(xué)數(shù)據(jù)管理計(jì)劃和完善的數(shù)據(jù)管理政策,主動(dòng)承擔(dān)起高??茖W(xué)數(shù)據(jù)管理的重要職能,并將計(jì)劃的制定、政策的維護(hù)、版本的更新、數(shù)據(jù)管理與服務(wù)等工作納入正常業(yè)務(wù)范圍,以滿(mǎn)足科研人員、資助機(jī)構(gòu)以及學(xué)生對(duì)本??蒲袛?shù)據(jù)發(fā)現(xiàn)、使用、管理、保存和開(kāi)放共享的長(zhǎng)期需求。高校是科學(xué)研究的主要陣地之一,其科學(xué)數(shù)據(jù)的有效管理和保存對(duì)于追蹤高??蒲袛?shù)據(jù)來(lái)源、避免重復(fù)研究、促進(jìn)數(shù)據(jù)再利用和加快科學(xué)研究進(jìn)程等方面發(fā)揮著重要的作用。在E-science環(huán)境下,科學(xué)數(shù)據(jù)管理、保存和共享的需求越來(lái)越高,已引起各國(guó)政府和學(xué)校的高度重視。2007年,美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)啟動(dòng)了DataNet計(jì)劃,明確提出以圖書(shū)館為主體實(shí)施科學(xué)數(shù)據(jù)管理[1]。英、美等國(guó)多所高校也相繼制定了科學(xué)數(shù)據(jù)管理政策,比如:愛(ài)丁堡大學(xué)制定了研究數(shù)據(jù)管理政策,牛津大學(xué)制定了研究數(shù)據(jù)及記錄管理政策,斯坦福大學(xué)制定了研究數(shù)據(jù)保存、獲取政策,杜克大學(xué)制定了研究保存、共享、所有權(quán)政策等,從政策上確保了科研數(shù)據(jù)管理與服務(wù)的長(zhǎng)期有效開(kāi)展。在我國(guó),盡管部分高校圖書(shū)館已經(jīng)開(kāi)展了科學(xué)數(shù)據(jù)管理的實(shí)踐和探索,但是沒(méi)有像英、美等國(guó)諸多高校那樣制定了成熟的數(shù)據(jù)管理政策和指南。這種缺乏完善政策指導(dǎo)的實(shí)踐不利于高校科研數(shù)據(jù)的長(zhǎng)久管理與共享利用。
面對(duì)英、美等國(guó)高校比較成熟的科學(xué)數(shù)據(jù)管理政策和國(guó)內(nèi)高校系統(tǒng)相關(guān)政策規(guī)定的缺失,有必要對(duì)一些有代表性的高??茖W(xué)數(shù)據(jù)管理政策進(jìn)行深入的解讀和探究,從政策內(nèi)容的具體制定層面為我國(guó)高校圖書(shū)館科學(xué)數(shù)據(jù)管理政策的制定提供一定的范本和參考。普渡大學(xué)是美國(guó)典型的研究型大學(xué),并且較早開(kāi)展了科學(xué)數(shù)據(jù)管理與服務(wù)。其圖書(shū)館承擔(dān)了主要的數(shù)據(jù)管理工作且制定了完善的科學(xué)數(shù)據(jù)管理政策,并在實(shí)踐中不斷地得到更新與修訂。本文將對(duì)美國(guó)普渡大學(xué)圖書(shū)館的科學(xué)數(shù)據(jù)管理政策進(jìn)行分析,重點(diǎn)闡述普渡大學(xué)的數(shù)據(jù)收集政策、數(shù)據(jù)保存政策、研究倉(cāng)儲(chǔ)使用規(guī)定、數(shù)據(jù)管理與維護(hù)以及面臨的挑戰(zhàn)與風(fēng)險(xiǎn),并通過(guò)普渡大學(xué)圖書(shū)館數(shù)據(jù)管理政策的內(nèi)容,探知在政策制定中需要注意的若干關(guān)鍵問(wèn)題,從而形成幾點(diǎn)啟示,以供我國(guó)高校圖書(shū)館制定具體政策內(nèi)容時(shí)參考。
美國(guó)普渡大學(xué)是一所典型的研究型大學(xué),比較早地開(kāi)展了科學(xué)數(shù)據(jù)管理與服務(wù)。 在制定科學(xué)數(shù)據(jù)管理政策之初,普渡大學(xué)便明確規(guī)定了開(kāi)展數(shù)據(jù)管理工作的主要目的是向該??蒲腥藛T和學(xué)生提供數(shù)據(jù)資源和服務(wù),促進(jìn)科研數(shù)據(jù)管理、傳播和保存。具體目標(biāo)是:收集、發(fā)布和保存隸屬于普渡大學(xué)或者與普渡大學(xué)研究項(xiàng)目相關(guān)的數(shù)據(jù)集和數(shù)據(jù)文檔;幫助普渡大學(xué)的研究人員滿(mǎn)足基金資助機(jī)構(gòu)對(duì)管理、共享和保存研究數(shù)據(jù)的需求;為研究者、政策制定者及其他人發(fā)現(xiàn)和獲取研究數(shù)據(jù)集提供一種渠道和方式;提供可持續(xù)的保存環(huán)境,使存放的研究數(shù)據(jù)能夠支持研究的歷史記錄,并且方便獲取使用最新科研知識(shí)[2]。
當(dāng)前,普渡大學(xué)圖書(shū)館主要開(kāi)展8項(xiàng)數(shù)據(jù)管理服務(wù):(1)在線(xiàn)普渡大學(xué)研究資源庫(kù)(Purdue University Research Repository,簡(jiǎn)稱(chēng)PURR);(2)幫助科研人員制定數(shù)據(jù)管理計(jì)劃;(3)元數(shù)據(jù)處理及數(shù)據(jù)保存;(4)提供分布式管理中心,進(jìn)行專(zhuān)業(yè)的數(shù)據(jù)引用和高效科研培訓(xùn);(5)開(kāi)展課堂教學(xué)和實(shí)驗(yàn)數(shù)據(jù)管理指導(dǎo)和教育;(6)組織、獲取、保存和記錄大數(shù)據(jù);(7)數(shù)據(jù)咨詢(xún)服務(wù);(8)數(shù)字對(duì)象標(biāo)識(shí)符(DOI)服務(wù)[3]。PURR是由普渡大學(xué)圖書(shū)館和普渡大學(xué)信息技術(shù)部以及研究副校長(zhǎng)辦公室合作研發(fā)與提供支持,是開(kāi)展上述8項(xiàng)系列服務(wù)的重要平臺(tái),各項(xiàng)服務(wù)的開(kāi)展和相關(guān)說(shuō)明均被納入到該研究資源庫(kù)政策中進(jìn)行解釋和規(guī)定。
3.1 數(shù)據(jù)收集
(1)數(shù)據(jù)收集的特定對(duì)象
在收集政策中指出,PURR是一個(gè)提供服務(wù)和虛擬研究環(huán)境的機(jī)構(gòu)知識(shí)庫(kù),主要為普渡大學(xué)的研究人員和其直接相關(guān)的合作者提供數(shù)據(jù)管理支持,凡是普渡大學(xué)的教師、職員、學(xué)生和任何從普渡大學(xué)畢業(yè)的研究生,都可以創(chuàng)建項(xiàng)目和提交數(shù)據(jù)。非普渡大學(xué)的合作者則需要至少與一個(gè)有效的普渡大學(xué)注冊(cè)用戶(hù)有關(guān)(比如合作開(kāi)展科研工作等)才有資格提交數(shù)據(jù)集[4]。
(2)數(shù)據(jù)收集的學(xué)科范圍和條件
收集政策的目的是加強(qiáng)普渡大學(xué)所有學(xué)科領(lǐng)域研究數(shù)據(jù)的收集和管理,從各個(gè)領(lǐng)域和學(xué)科收集來(lái)的數(shù)據(jù)在PURR進(jìn)行發(fā)布或存檔需要滿(mǎn)足以下條件:數(shù)據(jù)的提供者是PURR指定的成員;被提交的數(shù)據(jù)必須是普渡大學(xué)、圖書(shū)館、PURR以及他們各自的政策和規(guī)定所允許的;被提交的數(shù)據(jù)必須是法律部門(mén)和法規(guī)條例所允許的;當(dāng)一個(gè)用戶(hù)提交一個(gè)數(shù)據(jù)集,他或她便授予大學(xué)非獨(dú)占許可權(quán),使普渡大學(xué)對(duì)數(shù)據(jù)集有永久管理、發(fā)布的權(quán)利[4]。
(3)數(shù)據(jù)收集的格式推薦
PURR的數(shù)據(jù)收集包括研究數(shù)據(jù)集和相關(guān)信息。其中,研究數(shù)據(jù)集通常是文件和元數(shù)據(jù)的集合,包括與研究數(shù)據(jù)相關(guān)的保存和顯示信息以及注釋和輔助內(nèi)容。所有的提交內(nèi)容將以數(shù)字化形式存在。提交的數(shù)據(jù)必須與普渡大學(xué)的科研項(xiàng)目和研究教學(xué)任務(wù)有關(guān),且接收的數(shù)據(jù)范圍更側(cè)重于原始數(shù)據(jù)的輸入輸出,如電子表格、傳感器和儀表數(shù)據(jù)、調(diào)查、記錄、圖片、視頻和軟件源代碼等[3]。另外,在數(shù)據(jù)格式推薦部分,不僅列出了PURR可接受的數(shù)據(jù)格式,而且針對(duì)不同的數(shù)據(jù)格式,指明了哪些適合于長(zhǎng)期持續(xù)存儲(chǔ),哪些是PURR支持但不利于長(zhǎng)期存儲(chǔ)的以及哪些是無(wú)法進(jìn)行長(zhǎng)期持續(xù)保存的數(shù)據(jù)格式,以指導(dǎo)用戶(hù)根據(jù)特定需求選擇合理的數(shù)據(jù)格式[5](表1)。
在進(jìn)行數(shù)據(jù)收集時(shí),由PURR的工作人員進(jìn)行文件格式識(shí)別,并驗(yàn)證文件的原始格式,未來(lái)任何有關(guān)數(shù)據(jù)的轉(zhuǎn)換和遷移工作都將包括原始文件格式信息和任何有關(guān)該對(duì)象數(shù)據(jù)集的歷次修改信息。
3.2 數(shù)據(jù)保存
PURR作為普渡大學(xué)的研究數(shù)據(jù)資源庫(kù),必須用來(lái)支持教學(xué)、科研等活動(dòng),因此,圖書(shū)館的一個(gè)關(guān)鍵使命就是要保存該校學(xué)術(shù)信息資源,負(fù)責(zé)識(shí)別和保存不斷增加的數(shù)字格式資源,使這些數(shù)據(jù)能夠支持大學(xué)的研究、教學(xué)和學(xué)習(xí)需要。
(1)數(shù)據(jù)保存參與者角色與職責(zé)分配
雖然圖書(shū)館員和檔案員在保存和提供學(xué)術(shù)資源訪(fǎng)問(wèn)方面擔(dān)任著主要責(zé)任,但是從當(dāng)前來(lái)看,數(shù)字資源的保存已經(jīng)成為所有利益相關(guān)者的共同責(zé)任。PURR指導(dǎo)委員會(huì)(包括圖書(shū)館館長(zhǎng)、研究副校長(zhǎng)以及信息技術(shù)部副校長(zhǎng)和首席信息官)要負(fù)責(zé)評(píng)估和批準(zhǔn)有關(guān)提交給PURR的資源內(nèi)容的相關(guān)政策和規(guī)程。檔案員和圖書(shū)館學(xué)科專(zhuān)家負(fù)責(zé)甄別和篩選長(zhǎng)期保存的數(shù)字內(nèi)容。而對(duì)于從事科學(xué)數(shù)據(jù)長(zhǎng)期保存的教職員工以及其他研究人員則有義務(wù)將其科研數(shù)據(jù)轉(zhuǎn)換成符合PURR要求的數(shù)據(jù)保存格式、元數(shù)據(jù)和相關(guān)配合行動(dòng)[5]。
此外,普渡大學(xué)圖書(shū)館、信息技術(shù)部和研究副校長(zhǎng)室等相關(guān)責(zé)任部門(mén)也在致力于通過(guò)合作發(fā)展的途徑使PURR成為一個(gè)持久可信的數(shù)據(jù)倉(cāng)儲(chǔ),積極倡導(dǎo)與其他大學(xué)、圖書(shū)館、機(jī)構(gòu)和組織的合作,進(jìn)一步就數(shù)字內(nèi)容保存的技術(shù)等方面進(jìn)行探討,以共同實(shí)現(xiàn)數(shù)字資源有效保存共享的愿景[5]。
圖書(shū)館的數(shù)字保存工作雖然有識(shí)別、保護(hù)、提供數(shù)據(jù)保存方法的責(zé)任以確??沙掷m(xù)訪(fǎng)問(wèn)選定的數(shù)字資產(chǎn)。但是并不意味著所有存儲(chǔ)在PURR里的數(shù)據(jù)資源將被永久保存和收錄。對(duì)于上傳到PURR的數(shù)據(jù)會(huì)有一個(gè)10年的基本保存期限;超出了10年的數(shù)據(jù)將根據(jù)長(zhǎng)期保存項(xiàng)目的相關(guān)標(biāo)準(zhǔn)由專(zhuān)業(yè)館員進(jìn)行篩選保留,而這一行動(dòng)的有效實(shí)施還要依賴(lài)于相關(guān)的待批準(zhǔn)的預(yù)算以及其他資源的保障[5]。因此,普渡大學(xué)圖書(shū)館必須考慮對(duì)這些數(shù)據(jù)進(jìn)行合理分類(lèi),并設(shè)定合理的優(yōu)先保存規(guī)則,目前,針對(duì)以下幾種數(shù)據(jù)將優(yōu)先享有保存資格[5]:與出版發(fā)表的論文或著作相關(guān)的數(shù)據(jù)集;獨(dú)立的數(shù)據(jù)出版物;有較高的研究教學(xué)價(jià)值的數(shù)據(jù)集;其他經(jīng)過(guò)篩選的數(shù)據(jù)文件和材料。
表1 數(shù)據(jù)格式推薦
(3)數(shù)據(jù)保存原則
該部分詳細(xì)列出了普渡大學(xué)數(shù)據(jù)保存具體遵循的原則,比如:遵守開(kāi)放檔案信息系統(tǒng)(OAIS)參考模型標(biāo)準(zhǔn)和其他數(shù)字保護(hù)標(biāo)準(zhǔn);尋求符合ISO 16363標(biāo)準(zhǔn)認(rèn)證要求的可信數(shù)字倉(cāng)儲(chǔ);遵守一切知識(shí)產(chǎn)權(quán)、版權(quán)和所有權(quán)的保護(hù)規(guī)定;建立安全的和充分的數(shù)據(jù)備份和災(zāi)難恢復(fù)保障等,以力求PURR能實(shí)現(xiàn)長(zhǎng)久地發(fā)展和持續(xù)訪(fǎng)問(wèn)的目標(biāo)[5]。
(4)數(shù)據(jù)保存標(biāo)準(zhǔn)
在開(kāi)展數(shù)據(jù)保存行動(dòng)時(shí),對(duì)于需要保存的數(shù)據(jù)進(jìn)行篩選和收錄的原則主要是基于定期檢查和更新的通用標(biāo)準(zhǔn)規(guī)范。同時(shí),對(duì)于篩選出來(lái)的用于持續(xù)保存的內(nèi)容要求能夠支持普渡大學(xué)的教學(xué)和學(xué)術(shù)研究,除此之外,要符合國(guó)家和國(guó)際館藏的發(fā)展和維護(hù)標(biāo)準(zhǔn)。其他有關(guān)數(shù)字保存形式和功能的標(biāo)準(zhǔn),由于對(duì)數(shù)字資源的持久有效保存有重要影響,在保存數(shù)據(jù)篩選原則和標(biāo)準(zhǔn)的制定中而被考慮。此外,增強(qiáng)普渡大學(xué)圖書(shū)館館藏的內(nèi)容范圍也是圖書(shū)館開(kāi)展數(shù)據(jù)保存行動(dòng)的指導(dǎo)方針之一。因此,針對(duì)保存在其他數(shù)據(jù)倉(cāng)儲(chǔ)中但對(duì)該校教學(xué)科研有重要影響的數(shù)據(jù)也會(huì)擇優(yōu)被PURR收錄保存[5]。
(5)數(shù)據(jù)保存級(jí)別
進(jìn)入PURR的每一類(lèi)數(shù)據(jù)對(duì)象都將根據(jù)數(shù)據(jù)集自身特征和保存目標(biāo)等按照某一特定類(lèi)型的保存策略進(jìn)行保存。PURR提供了3種級(jí)別的保存策略:位級(jí)保存(Bit-level Preservation),即基礎(chǔ)的保存級(jí)別;有限保存(Limited Preservation),即較高級(jí)別的保存;完全保存(Full Preservation),即最高級(jí)別的保存。每一個(gè)保存級(jí)別下都對(duì)應(yīng)著具體的保存行動(dòng),見(jiàn)表2所示。
3.3 數(shù)據(jù)使用
其中:式(10)為銷(xiāo)售商產(chǎn)品發(fā)貨量與進(jìn)貨量庫(kù)存量約束關(guān)系,式(11)為銷(xiāo)售商吞吐能力約束,式(12)為缺貨補(bǔ)充平衡關(guān)系。
普渡大學(xué)圖書(shū)館致力于其科研數(shù)據(jù)的開(kāi)放獲取,認(rèn)可開(kāi)放存取的柏林宣言的核心理念??稍L(fǎng)問(wèn)的用戶(hù)包括普渡大學(xué)的教師、研究人員、研究生,與普渡大學(xué)有合作的相關(guān)研究者;隸屬于其他研究機(jī)構(gòu)的教師、學(xué)生和研究人員;獨(dú)立學(xué)者和公眾等。雖然普渡大學(xué)致力于科研數(shù)據(jù)的開(kāi)放共享,但是,仍要遵守相關(guān)的知識(shí)產(chǎn)權(quán)法律法規(guī),部分機(jī)密性數(shù)據(jù)不會(huì)給予公開(kāi),部分不適合向大眾開(kāi)放的數(shù)據(jù)只能在小范圍內(nèi)公開(kāi)等。具體的使用條款、保證條款等簡(jiǎn)介如下。
(1)使用條款
在PURR使用條款部分,主要包括協(xié)議的修改說(shuō)明;注冊(cè),訪(fǎng)問(wèn)和終止用戶(hù)使用PURR的條件說(shuō)明;用戶(hù)在上傳數(shù)據(jù)時(shí)的隱私和保密選擇說(shuō)明;使用PURR必須遵循的行為規(guī)范和禁止行為說(shuō)明;普渡大學(xué)對(duì)于PURR用戶(hù)數(shù)據(jù)損壞或丟失等情況的免責(zé)聲明;在發(fā)生法律糾紛時(shí)所遵循的法律選擇和律師費(fèi)等情況說(shuō)明[8]。
(2)保證條款
使用普渡大學(xué)研究倉(cāng)儲(chǔ)必須同意其保證條款,該部分規(guī)定了數(shù)據(jù)發(fā)布者在發(fā)布數(shù)據(jù)前必須同意的系列條款,其中包括授予普渡大學(xué)在一定范圍內(nèi)的復(fù)制權(quán)、分發(fā)權(quán)等;同時(shí)要求數(shù)據(jù)發(fā)布者保證上傳的科研數(shù)據(jù)不侵犯他人知識(shí)產(chǎn)權(quán),不違反相關(guān)法律條款;在上傳的具體內(nèi)容里不應(yīng)包含任何軟件病毒或任何其他有可能破壞數(shù)據(jù)管理系統(tǒng)的程序代碼,也不能含有高風(fēng)險(xiǎn)的機(jī)密信息;涉及人類(lèi)敏感問(wèn)題的科研數(shù)據(jù)需征得IRB部門(mén)批準(zhǔn)等[9]。
(3)侵權(quán)說(shuō)明
由于數(shù)據(jù)的開(kāi)放共享,侵權(quán)行為在所難免。在侵權(quán)說(shuō)明部分,主要是指導(dǎo)PURR使用者如何按照合理的程序方式解決侵權(quán)問(wèn)題,比如:當(dāng)使用者發(fā)現(xiàn)版權(quán)侵犯行為時(shí),需要提交相應(yīng)的材料和收集足夠的證據(jù),最好是有完整的URL等事實(shí)證據(jù),以幫助快速定位內(nèi)容,維護(hù)相應(yīng)權(quán)益[10]。
表2 不同級(jí)別的保存策略及其具體保存行動(dòng)[7]
(4)訪(fǎng)問(wèn)聲明
為了盡可能地提高網(wǎng)站的可訪(fǎng)問(wèn)性和可用性,該部分主要列出了網(wǎng)站遵循的一系列指導(dǎo)方針和標(biāo)準(zhǔn)規(guī)范、技術(shù)測(cè)試規(guī)定等[11]。
3.4 數(shù)據(jù)管理與維護(hù)
PURR有責(zé)任保護(hù)其用戶(hù)提交的數(shù)據(jù)完整性,以確保數(shù)據(jù)能夠持續(xù)訪(fǎng)問(wèn)。因此,制定了完備的數(shù)據(jù)管理與維護(hù)措施[12]。
(1)元數(shù)據(jù)保存:每一個(gè)提交到PURR的數(shù)據(jù)集都將全面實(shí)現(xiàn)其元數(shù)據(jù)保存,PURR采用多個(gè)元數(shù)據(jù)標(biāo)準(zhǔn)以確保充分描述不同數(shù)據(jù)集的特殊格式和獨(dú)特性質(zhì)。Dublin Core Metadata Initiative用于提供發(fā)現(xiàn)和引用數(shù)據(jù);MODS (Metadata Object Description Schema)用于記錄數(shù)據(jù)集的創(chuàng)造者和訪(fǎng)問(wèn)權(quán)限; PREMIS(Preservation Metadata Maintenance Activity)用于記錄每個(gè)數(shù)據(jù)集所經(jīng)歷的保存事件和法律權(quán)利分配; METS(Metadata Encoding and Transmission Standard)用于表示數(shù)據(jù)文件的結(jié)構(gòu)和層次體系結(jié)構(gòu)。
(2)數(shù)據(jù)格式識(shí)別:對(duì)獲取的每個(gè)數(shù)據(jù)集進(jìn)行文件格式分析。采用技術(shù)注冊(cè)表, PRONOM和格式識(shí)別工具、DROID來(lái)驗(yàn)證每個(gè)數(shù)據(jù)集的格式,該信息用于記錄對(duì)象的整個(gè)生命周期中潛在的數(shù)據(jù)轉(zhuǎn)換、遷移和固定性檢查等。
(3)安全存儲(chǔ)和備份:所有PURR保存的數(shù)據(jù)都將被完整的復(fù)制,并備份到另外的網(wǎng)站,以預(yù)防災(zāi)難性的信息損失或者定期檢查時(shí)造成的數(shù)據(jù)丟失。
(4)固定性檢查:所有的PURR保存的數(shù)據(jù)都將定期進(jìn)行固定性檢查,以確保沒(méi)有數(shù)據(jù)丟失,并對(duì)已經(jīng)損壞的無(wú)用數(shù)據(jù)進(jìn)行定期清除。
(5)變換/標(biāo)準(zhǔn)化:由于提交到PURR的數(shù)據(jù)集在一開(kāi)始不是結(jié)構(gòu)化的數(shù)據(jù),所以必須對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的格式轉(zhuǎn)換和標(biāo)準(zhǔn)化處理,使之符合保存的基本格式要求。當(dāng)然,在可能的情況下,PURR會(huì)盡量保存數(shù)據(jù)的原生格式;即使因?yàn)殚L(zhǎng)期保存和標(biāo)準(zhǔn)化的需要必須轉(zhuǎn)換格式,轉(zhuǎn)化數(shù)據(jù)也將被記錄在其整個(gè)生命周期的數(shù)據(jù)元數(shù)據(jù)中。
(6)遷移:為了確保長(zhǎng)期保存和訪(fǎng)問(wèn)獲取,對(duì)于那些已過(guò)時(shí)的格式保存的數(shù)據(jù)將進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換遷移可能包括升級(jí)數(shù)據(jù)集到一個(gè)新的版本,轉(zhuǎn)換到一個(gè)新的文件格式或文件結(jié)構(gòu)。當(dāng)然,這些變化也會(huì)在描述數(shù)據(jù)集的元數(shù)據(jù)中有所記錄和體現(xiàn)。
3.5 數(shù)據(jù)管理挑戰(zhàn)和風(fēng)險(xiǎn)
數(shù)字資源的管理與保存涉及的內(nèi)容遠(yuǎn)遠(yuǎn)不只是資源的有無(wú),還包括技術(shù)、資金、人力等各個(gè)方面的因素。在政策部分,普渡大學(xué)圖書(shū)館也列出了其在進(jìn)行科學(xué)數(shù)據(jù)管理時(shí)面臨的各類(lèi)風(fēng)險(xiǎn)和挑戰(zhàn),主要包括以下幾點(diǎn)[6]:一是技術(shù)的識(shí)別以及跟上技術(shù)的發(fā)展變化;二是成本,主要包括涉及人員、設(shè)備、軟件和基礎(chǔ)設(shè)施的費(fèi)用以及其他各項(xiàng)費(fèi)用;三是開(kāi)發(fā)和維護(hù)一個(gè)成功的溝通框架,針對(duì)開(kāi)發(fā)商、管理員和用戶(hù)不斷變化的需求、實(shí)踐等,能及時(shí)充分地識(shí)別和應(yīng)對(duì);四是如何實(shí)現(xiàn)長(zhǎng)久的數(shù)據(jù)保存,保存計(jì)劃貫穿于整個(gè)數(shù)據(jù)管理過(guò)程,而完成整個(gè)項(xiàng)目數(shù)據(jù)的保存并非易事;五是適應(yīng)各種各樣的數(shù)據(jù)集,未來(lái)數(shù)據(jù)的存在會(huì)有更多類(lèi)型、格式、大小等,充滿(mǎn)復(fù)雜性。
PURR的發(fā)展雖然面臨諸多挑戰(zhàn),但是,隨著越來(lái)越多的基金資助機(jī)構(gòu)要求科研項(xiàng)目承擔(dān)者必須提交相應(yīng)的科研數(shù)據(jù)管理計(jì)劃,以描述其數(shù)據(jù)管理細(xì)節(jié),因此,PURR在幫助科研基金申請(qǐng)者滿(mǎn)足資助機(jī)構(gòu)的數(shù)據(jù)管理需求上有著巨大的優(yōu)勢(shì)。而且,PURR對(duì)收錄的數(shù)據(jù)集會(huì)分配相應(yīng)的數(shù)字資源唯一標(biāo)識(shí)符(DOI),以方便其他科研人員發(fā)現(xiàn)和引用數(shù)據(jù),這也給普渡大學(xué)提供了一個(gè)證明其科研影響力的良好機(jī)遇。
透過(guò)普渡大學(xué)圖書(shū)館數(shù)據(jù)管理政策的內(nèi)容,探知在政策制定中需要注意的若干關(guān)鍵問(wèn)題,僅供我國(guó)高校圖書(shū)館制定具體政策內(nèi)容時(shí)參考。
(1)明確各利益團(tuán)體的責(zé)任和義務(wù)??蒲袛?shù)據(jù)的管理、保存和利用涉及多方利益:科研人員或科研團(tuán)體、基金資助機(jī)構(gòu)、數(shù)據(jù)保存管理機(jī)構(gòu)、數(shù)據(jù)使用者等。在政策制定時(shí),一定要明確各方的責(zé)任和義務(wù)并進(jìn)行具體的文字規(guī)定,比如科研人員在提交數(shù)據(jù)時(shí)需要知悉哪些事項(xiàng),同意對(duì)哪些數(shù)據(jù)進(jìn)行處理的規(guī)定;數(shù)據(jù)保存機(jī)構(gòu)對(duì)于科研人員上傳的數(shù)據(jù)有哪些處理權(quán)限,對(duì)于不同保存級(jí)別的數(shù)據(jù)有哪些具體的管理行為;使用者在使用數(shù)據(jù)時(shí)需要遵循哪些版權(quán)規(guī)定等。只有這樣,才能有效避免因知識(shí)產(chǎn)權(quán)問(wèn)題帶來(lái)的系列數(shù)據(jù)管理和使用糾紛,保證科學(xué)數(shù)據(jù)從收集到保存利用的順利進(jìn)行。
(2)對(duì)數(shù)據(jù)保存中有可能導(dǎo)致的數(shù)據(jù)丟失或損壞問(wèn)題劃定責(zé)任歸屬。圖書(shū)館作為科研數(shù)據(jù)的具體管理和保存機(jī)構(gòu),有義務(wù)最大限度地保持?jǐn)?shù)據(jù)的完整性。但是在管理保存科學(xué)數(shù)據(jù)時(shí),由于數(shù)據(jù)的篩選、遷移和格式轉(zhuǎn)換等過(guò)程中會(huì)不可避免地出現(xiàn)一定的數(shù)據(jù)丟失,因此,針對(duì)數(shù)據(jù)丟失或者損壞的問(wèn)題,一方面要?jiǎng)澢遑?zé)任歸屬問(wèn)題,另一方面要對(duì)數(shù)據(jù)管理保存中可能出現(xiàn)的問(wèn)題在政策中予以明確說(shuō)明,避免由于此類(lèi)問(wèn)題而產(chǎn)生的數(shù)據(jù)丟失糾紛。
(3)制定全面的數(shù)據(jù)收集、篩選、保存標(biāo)準(zhǔn)和使用規(guī)定等。政策的制定是為了更有效地指導(dǎo)科學(xué)數(shù)據(jù)管理工作的開(kāi)展,高校圖書(shū)館在收集科學(xué)數(shù)據(jù)時(shí)主要有兩方面的考慮:一是要滿(mǎn)足數(shù)據(jù)使用者對(duì)共享利用的需求,二是要滿(mǎn)足圖書(shū)館進(jìn)行長(zhǎng)期數(shù)據(jù)保存的需求。因此,數(shù)據(jù)收集的范圍、數(shù)據(jù)篩選的標(biāo)準(zhǔn)、數(shù)據(jù)保存的標(biāo)準(zhǔn)和級(jí)別、數(shù)據(jù)的使用條款、訪(fǎng)問(wèn)聲明等必須作為政策制定的重點(diǎn)內(nèi)容加以細(xì)化。同時(shí),考慮到數(shù)據(jù)長(zhǎng)期保存的需要,在政策制定時(shí),需要對(duì)科學(xué)數(shù)據(jù)的管理與維護(hù)制定詳細(xì)的實(shí)施策略,比如:針對(duì)不同格式、不同類(lèi)型的文件要有完整的元數(shù)據(jù)配套方案;針對(duì)不同級(jí)別的科研數(shù)據(jù),必須制定有針對(duì)性的數(shù)據(jù)保存策略,以防止后期由于成本、人力和數(shù)據(jù)的快速增長(zhǎng)所導(dǎo)致的存儲(chǔ)容量問(wèn)題,針對(duì)不斷出現(xiàn)的新型數(shù)據(jù)格式及保存平臺(tái),要制定合理的數(shù)據(jù)遷移和固定性檢查措施,盡量減少數(shù)據(jù)丟失??傊?,在政策制定時(shí),建立完善的后期維護(hù)與檢查機(jī)制至關(guān)重要,是科學(xué)數(shù)據(jù)得以長(zhǎng)期保存和持續(xù)獲取訪(fǎng)問(wèn)的有效保障。
科學(xué)數(shù)據(jù)的長(zhǎng)期管理和共享利用是科研領(lǐng)域未來(lái)發(fā)展的必然趨勢(shì),高校作為科學(xué)數(shù)據(jù)產(chǎn)生的重要機(jī)構(gòu)。為了將來(lái)科學(xué)數(shù)據(jù)管理活動(dòng)的順利實(shí)施,應(yīng)該將政策的制定納為科研管理實(shí)踐的重要內(nèi)容之一。從當(dāng)前開(kāi)始,國(guó)內(nèi)各高校圖書(shū)館和相關(guān)負(fù)責(zé)領(lǐng)導(dǎo)應(yīng)該主動(dòng)增強(qiáng)科研人員對(duì)科學(xué)數(shù)據(jù)管理的重要性認(rèn)識(shí)和數(shù)據(jù)共享的自覺(jué)意識(shí)。圖書(shū)館要主動(dòng)承擔(dān)新的服務(wù)職能,重視學(xué)科館員和學(xué)科專(zhuān)家在數(shù)據(jù)篩選時(shí)的重要作用,定期開(kāi)展有效的數(shù)據(jù)培訓(xùn)工作,培養(yǎng)新型學(xué)科專(zhuān)家,嘗試牽頭擬定科學(xué)數(shù)據(jù)管理政策并負(fù)責(zé)相關(guān)解釋工作等,這也為圖書(shū)館在數(shù)字化環(huán)境下實(shí)現(xiàn)服務(wù)轉(zhuǎn)型提供了一條重要途徑。
科學(xué)數(shù)據(jù)的長(zhǎng)期管理和共享利用是科研領(lǐng)域未來(lái)發(fā)展的必然趨勢(shì),對(duì)于實(shí)現(xiàn)科學(xué)數(shù)據(jù)資源的有效增值,推動(dòng)科技自主創(chuàng)新,減少科技領(lǐng)域的資源浪費(fèi)具有積極作用[13]??茖W(xué)數(shù)據(jù)管理政策對(duì)于科學(xué)數(shù)據(jù)管理服務(wù)與實(shí)踐有著重要的指導(dǎo)作用。本文主要對(duì)普渡大學(xué)圖書(shū)館開(kāi)展的科學(xué)數(shù)據(jù)管理服務(wù)的政策內(nèi)容進(jìn)行了詳細(xì)的解讀與歸納分析,在此基礎(chǔ)上為我國(guó)研究型大學(xué)圖書(shū)館制定科學(xué)數(shù)據(jù)管理政策提出若干需注意的關(guān)鍵問(wèn)題,并呼吁高校圖書(shū)館工作人員應(yīng)在開(kāi)展科研數(shù)據(jù)管理實(shí)踐的伊始將政策問(wèn)題落到實(shí)處,以此為科研數(shù)據(jù)管理的長(zhǎng)期發(fā)展提供有效的政策保障。此外,筆者也會(huì)繼續(xù)關(guān)注國(guó)內(nèi)外科學(xué)數(shù)據(jù)管理政策制定的相關(guān)動(dòng)態(tài),為我國(guó)高校圖書(shū)館科學(xué)數(shù)據(jù)管理政策的制定提供參考。
[1]謝春枝,燕今偉.國(guó)內(nèi)外高??茖W(xué)數(shù)據(jù)管理和機(jī)制建設(shè)研究[J].圖書(shū)情報(bào)工作,2013,57(6): 11-17,38.
[2]PURR Digital Preservation Policy[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/digitalpreservation.
[3]Researchdata[EB/OL].[2015-05-09]. https://www.lib. purdue.edu/researchdata
[4]Collection Policy[EB/OL].[2015-05-09]. https://purr. purdue.edu/legal/collection-policy.
[5]File Format Recommendations[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/file-format-recommendations.
[6]PURR Digital Preservation Policy[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/digitalpreservation
[7]Preservation Support Policy[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/preservation-support-policy.
[8]Terms of Use [EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/terms.
[9]Purdue University Research Repository (PURR) Terms of Deposit [EB/OL].[2015-05-09]. https://purr.purdue. edu/legal/termsofdeposit.
[10]Copyrights[EB/OL].[2015-05-09]. https://purr.purdue. edu/legal/dmcapolicy.
[11]HUBzero Accessibility Statement[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/accessibility.
[12]Preservation Strategies[EB/OL].[2015-05-09]. https:// purr.purdue.edu/legal/preservation-strategies.
[13]王凱,彭潔,屈寶強(qiáng),等.科學(xué)數(shù)據(jù)管理與共享領(lǐng)域文獻(xiàn)計(jì)量研究[J].中國(guó)科技資源導(dǎo)刊,2015,47(4): 31-39.
Research on Scientific Data Management Policy in Purdue University Library
Hu Xuehuan, Qu Baoqiang
(Institute of Scientific and Technical Information of China, Beijing 100038)
This article mainly introduces the scientific data management policy in Purdue University. On this basis, summarizes the contents into four parts :data collection policy, data preservation policy, data use rules and data management and maintenance , Further summarize the considerations needed to be aware of when universities make data management policies ,in order to provide content references for the research data management policy of university library in our country.
academic library, scientific data management, collection policy, preservation policy, use rules
G350
A
10.3772/j.issn.1674-1544.2015.06.011
胡雪環(huán)*(1990-),女,中國(guó)科學(xué)技術(shù)信息研究所碩士研究生,研究方向:數(shù)字圖書(shū)館與數(shù)字出版;屈寶強(qiáng)(1980-),男,中國(guó)科學(xué)技術(shù)信息研究所副研究員,研究方向:文獻(xiàn)共享、數(shù)據(jù)共享。
2015年7月13日。