国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

可持續(xù)發(fā)展的科研數(shù)據(jù)管理信息基礎(chǔ)設(shè)施研究

2016-02-12 20:21上海海事大學(xué)圖書(shū)館上海201306
圖書(shū)館建設(shè) 2016年8期
關(guān)鍵詞:數(shù)據(jù)管理科研人員基礎(chǔ)設(shè)施

王 璞(上海海事大學(xué)圖書(shū)館 上海 201306)

可持續(xù)發(fā)展的科研數(shù)據(jù)管理信息基礎(chǔ)設(shè)施研究

王 璞(上海海事大學(xué)圖書(shū)館 上海 201306)

大數(shù)據(jù)科研環(huán)境下,對(duì)科研數(shù)據(jù)的高效管理、利用和長(zhǎng)期保存需要建設(shè)新型的信息基礎(chǔ)設(shè)施。Data Conservancy項(xiàng)目是美國(guó)國(guó)家科學(xué)基金會(huì)的DataNet計(jì)劃支持的首批關(guān)于數(shù)據(jù)信息基礎(chǔ)設(shè)施建設(shè)的項(xiàng)目。Data Conservancy項(xiàng)目組基于OAIS參考模型設(shè)計(jì)了一種面向服務(wù)的軟件體系架構(gòu),并開(kāi)發(fā)了數(shù)據(jù)管理軟件平臺(tái)。Data Conservancy實(shí)施者從技術(shù)選型及經(jīng)費(fèi)籌措的角度來(lái)探索項(xiàng)目的可持續(xù)發(fā)展策略。約翰·霍普金斯大學(xué)組建了專門的數(shù)據(jù)管理團(tuán)隊(duì)開(kāi)展數(shù)據(jù)管理服務(wù),挑戰(zhàn)與機(jī)遇并存。在新型科研環(huán)境下,圖書(shū)館要重塑角色,為科研人員提供超出其滿意度的科研數(shù)據(jù)管理服務(wù),并努力保持可持續(xù)發(fā)展及不斷進(jìn)化的能力。

信息基礎(chǔ)設(shè)施 數(shù)據(jù)管理 數(shù)據(jù)監(jiān)護(hù) 數(shù)據(jù)保存 可持續(xù)發(fā)展

在由大數(shù)據(jù)驅(qū)動(dòng)的科研第四范式下,科研數(shù)據(jù)不再僅僅是研究成果,而是成為科技進(jìn)步和學(xué)術(shù)創(chuàng)新的重要基礎(chǔ)和必要條件。在大數(shù)據(jù)科研環(huán)境下,人們面臨的一大挑戰(zhàn)就是:如何建設(shè)一種新型的信息基礎(chǔ)設(shè)施(Cyberinfrastructure),以實(shí)現(xiàn)對(duì)規(guī)模巨大、類型復(fù)雜、分布式的多學(xué)科數(shù)據(jù)的高效管理和利用[1]。鑒于此,美國(guó)國(guó)家科學(xué)基金會(huì)(National Science Foundation,簡(jiǎn)稱NSF)于2007年發(fā)布了“科研數(shù)據(jù)可持續(xù)保存與共享網(wǎng)絡(luò)伙伴計(jì)劃(DataNet)”項(xiàng)目指南,旨在建立面向科研數(shù)據(jù)的保存及共享模式[2]。NSF希望通過(guò)該計(jì)劃建立一批具有顯著示范效應(yīng)的新型信息基礎(chǔ)設(shè)施,以為長(zhǎng)期的科學(xué)研究提供可靠的數(shù)據(jù)保存、訪問(wèn)、集成和分析[3]。DataNet計(jì)劃自2009年起在5年時(shí)間內(nèi)投入1億美元用于支持以圖書(shū)館為主體開(kāi)展信息基礎(chǔ)設(shè)施及科研數(shù)據(jù)管理的研究與建設(shè)工作。由約翰·霍普金斯大學(xué)(Johns Hopkins University,簡(jiǎn)稱JHU)圖書(shū)館主持的Data Conservancy(數(shù)據(jù)保存,下文簡(jiǎn)稱DC)項(xiàng)目是首批獲得資助的兩個(gè)項(xiàng)目之一。本文以DC項(xiàng)目建設(shè)的兩項(xiàng)主要任務(wù)為線索,著重介紹DC軟件系統(tǒng)的技術(shù)框架以及DC可持續(xù)發(fā)展的策略,以及約翰·霍普金斯大學(xué)在DC項(xiàng)目基礎(chǔ)上開(kāi)展的科研數(shù)據(jù)管理服務(wù)的情況,以給予國(guó)內(nèi)科研數(shù)據(jù)管理信息基礎(chǔ)設(shè)施建設(shè)以及科研數(shù)據(jù)管理事業(yè)啟示。

1 Data Conservancy的技術(shù)框架

1.1 Data Conservancy概述

DC項(xiàng)目總部設(shè)立于約翰·霍普金斯大學(xué)的謝里丹圖書(shū)館(Sheridan Library),由G.Sayeed Choudhury擔(dān)任首席科學(xué)家。DC項(xiàng)目主要采用群體合作的形式,其團(tuán)隊(duì)成員來(lái)自美國(guó)的著名大學(xué)圖書(shū)館、國(guó)家數(shù)據(jù)中心、國(guó)家研究實(shí)驗(yàn)室、圖情學(xué)院與商業(yè)公司等10家機(jī)構(gòu)。DC項(xiàng)目試圖尋求一種制度性的解決方案,聯(lián)合科研數(shù)據(jù)管理涉及到的各利益相關(guān)者,研究、設(shè)計(jì)、實(shí)施數(shù)據(jù)管理的信息基礎(chǔ)設(shè)施,通過(guò)對(duì)科研數(shù)據(jù)的收集、保存和語(yǔ)義化的集成,實(shí)現(xiàn)跨學(xué)科的數(shù)據(jù)發(fā)現(xiàn)與融合。DC項(xiàng)目設(shè)定了4項(xiàng)任務(wù)[4]:①為支持跨學(xué)科研究,選擇天文學(xué)、地球科學(xué)、生命科學(xué)和社會(huì)科學(xué)這4門數(shù)據(jù)密集型學(xué)科,深入了解科研數(shù)據(jù)管理工具和方法,并比較分析其相關(guān)性和差異點(diǎn);②開(kāi)發(fā)并實(shí)施一個(gè)用于科研數(shù)據(jù)管理服務(wù)的信息基礎(chǔ)設(shè)施;③與科研群體加強(qiáng)交流與合作,深入探討數(shù)據(jù)管理技能培訓(xùn)的需求,促進(jìn)圖書(shū)館科研數(shù)據(jù)館員人才及隊(duì)伍的發(fā)展;④探索一種用于長(zhǎng)期的科研數(shù)據(jù)管理的可持續(xù)發(fā)展模式。

1.2 Data Conservancy軟件系統(tǒng)特征

面對(duì)日益復(fù)雜的科研數(shù)據(jù)管理環(huán)境和需求,科研機(jī)構(gòu)不僅需要先進(jìn)的技術(shù)解決方案,更面臨組織架構(gòu)變革及管理創(chuàng)新上的嚴(yán)峻挑戰(zhàn)。DC項(xiàng)目組認(rèn)為:網(wǎng)絡(luò)及軟硬件基礎(chǔ)設(shè)施、學(xué)科信息及數(shù)據(jù)環(huán)境、數(shù)據(jù)服務(wù)設(shè)計(jì)、組織架構(gòu)創(chuàng)新、數(shù)據(jù)政策及可持續(xù)發(fā)展策略都是數(shù)據(jù)管理解決方案的重要組成部分,而其功能核心是DC軟件系統(tǒng)(Data Conservancy Software,簡(jiǎn)稱DCS)[5]。

DCS的設(shè)計(jì)面向大數(shù)據(jù)的應(yīng)用環(huán)境,借鑒成熟的數(shù)據(jù)模型,支持各種學(xué)科數(shù)據(jù)的管理及關(guān)聯(lián)使用,并且能夠方便地與外部系統(tǒng)交互。DCS主要的產(chǎn)品特征包括[6]:①?gòu)募夹g(shù)上實(shí)現(xiàn)數(shù)據(jù)溯源(Data Provenance),確保數(shù)據(jù)的可持續(xù)管理與長(zhǎng)期保存;②針對(duì)特定的學(xué)科環(huán)境,靈活定制人機(jī)界面;③參考PLANETS數(shù)據(jù)模型,方便管理和存儲(chǔ)多種類型的數(shù)據(jù)資源;④允許外部應(yīng)用程序通過(guò)“數(shù)據(jù)檢索與取用API”構(gòu)建基于DCS核心組件的新型應(yīng)用;⑤具有特征抽取框架,即DCS可根據(jù)數(shù)據(jù)集的時(shí)間、空間、類別等特征值進(jìn)行關(guān)聯(lián)匹配,從不同的數(shù)據(jù)源對(duì)數(shù)據(jù)進(jìn)行抽取和匯聚,以用于實(shí)現(xiàn)特定的研究目的;⑥擴(kuò)展性極強(qiáng)的存儲(chǔ)架構(gòu)設(shè)計(jì),可支持?jǐn)?shù)以百萬(wàn)計(jì)數(shù)字對(duì)象的管理與存檔。

1.3 DCS技術(shù)框架

DCS的開(kāi)發(fā)借鑒了開(kāi)放存檔信息系統(tǒng)(Open Archival Information System,簡(jiǎn)稱OAIS)參考模型作為軟件技術(shù)框架結(jié)構(gòu)的基礎(chǔ)[7]。DCS的技術(shù)框架包含4個(gè)層級(jí),每一層級(jí)可與相鄰的層級(jí)互相通信,但是不能跨層級(jí)通信[5,8]:①第一層,應(yīng)用層。應(yīng)用程序通過(guò)應(yīng)用程序接口(API)接入服務(wù)層使用特定的服務(wù)。②第二層,API層。DCS提供一系列可被客戶端程序調(diào)用的API。DCS的系統(tǒng)功能通過(guò)API與軟件服務(wù)進(jìn)行通信。API層定義了技術(shù)規(guī)范,用于說(shuō)明如何實(shí)現(xiàn)數(shù)據(jù)攝取、檢索和取用服務(wù)的接入和調(diào)用。API通過(guò)HTTP的請(qǐng)求服務(wù)來(lái)實(shí)現(xiàn)調(diào)用。③第三層,服務(wù)層。服務(wù)以模塊化的方式進(jìn)行設(shè)計(jì),包括數(shù)據(jù)的攝取、索引、檢索和取用等。應(yīng)用程序通過(guò)API來(lái)調(diào)用這些服務(wù)。服務(wù)模塊以Java Web應(yīng)用的形式進(jìn)行分發(fā),并使用了Apache Solr的全文檢索套件。④第四層,數(shù)據(jù)存檔層。存檔服務(wù)使用存檔模塊API對(duì)用戶的數(shù)據(jù)進(jìn)行存檔或者取用。

2 DC項(xiàng)目信息基礎(chǔ)設(shè)施可持續(xù)發(fā)展的策略

大型科研信息基礎(chǔ)設(shè)施的建設(shè)需要投入大量的資金,如DC項(xiàng)目的建設(shè)經(jīng)費(fèi)就達(dá)到了驚人的2 000萬(wàn)美元[9]。為了保障高價(jià)值、具有不可替代性的科研數(shù)據(jù)資源的長(zhǎng)期有效性管理和利用,DC項(xiàng)目組必須全面考慮信息基礎(chǔ)設(shè)施可持續(xù)的長(zhǎng)期發(fā)展策略,包括采用可持續(xù)演進(jìn)的開(kāi)放性技術(shù)、多渠道的經(jīng)費(fèi)來(lái)源模式、人力資源和技能的不斷補(bǔ)充和更新等[10]。

2.1 技術(shù)的可持續(xù)發(fā)展

技術(shù)的可持續(xù)發(fā)展是信息基礎(chǔ)設(shè)施的重要依賴因素之一,體現(xiàn)在技術(shù)的可靠性、適應(yīng)性及可擴(kuò)展性上。計(jì)算平臺(tái)要能夠適應(yīng)快速變化的技術(shù)環(huán)境與用戶需求,采用更經(jīng)濟(jì)的計(jì)算解決方案,如使用租賃的云計(jì)算和存儲(chǔ)模式,能夠大幅縮減軟硬件成本。DCS采用開(kāi)源軟件技術(shù),基于Linux環(huán)境開(kāi)發(fā)可以安裝在支持Java運(yùn)行環(huán)境的任何硬件設(shè)備和操作系統(tǒng)上。DCS以面向服務(wù)的架構(gòu)來(lái)設(shè)計(jì)模塊化的框架和技術(shù)組件,并通過(guò)開(kāi)放型接口和API實(shí)現(xiàn)層級(jí)和服務(wù)的松散耦合,有利于技術(shù)的無(wú)縫銜接及整合,同時(shí)提供了不同技術(shù)系統(tǒng)的互操作機(jī)制[11]。信息基礎(chǔ)設(shè)施的一項(xiàng)重要功能是通過(guò)數(shù)據(jù)溯源技術(shù)實(shí)現(xiàn)數(shù)據(jù)的長(zhǎng)期保存,并確保原始數(shù)據(jù)和派生數(shù)據(jù)的真實(shí)性、可追溯性及可重用性[12]。萬(wàn)維網(wǎng)聯(lián)盟(World Wide Web Consortium,簡(jiǎn)稱W3C)的數(shù)據(jù)溯源孵化器小組在最終報(bào)告里將“數(shù)據(jù)溯源”定義為:“為源數(shù)字對(duì)象創(chuàng)建一條記錄,內(nèi)容包括該對(duì)象生成以及后續(xù)衍變及傳遞過(guò)程中所涉及到的各種實(shí)體及處理方法?!保?3]DCS定義了一個(gè)4層的數(shù)據(jù)管理模型,使用溯源流(provenance stream)與世系服務(wù)(lineage services)確保了數(shù)據(jù)在整個(gè)生命周期中的透明度,并保障數(shù)據(jù)的可持續(xù)利用[14]。

2.2 經(jīng)濟(jì)的可持續(xù)發(fā)展

充足的資金保障是信息基礎(chǔ)設(shè)施可持續(xù)發(fā)展的基本條件,從政府機(jī)構(gòu)獲取項(xiàng)目建設(shè)經(jīng)費(fèi)是主要資金來(lái)源,但是在項(xiàng)目結(jié)束之后如果不能持續(xù)的獲得資金投入則往往難以為繼。謝里丹圖書(shū)館積極向那些獲得NSF基金項(xiàng)目比較多的學(xué)院大力推介圖書(shū)館的DC項(xiàng)目以及數(shù)據(jù)管理服務(wù),爭(zhēng)取院長(zhǎng)的支持并獲得經(jīng)費(fèi)資助的承諾。2011年2月,圖書(shū)館與工程學(xué)院、藝術(shù)與科學(xué)學(xué)院、醫(yī)學(xué)院、商學(xué)院等學(xué)院的院長(zhǎng)終于就DMS(Data Management Services,科研數(shù)據(jù)管理服務(wù))的專項(xiàng)經(jīng)費(fèi)達(dá)到了一致意見(jiàn)[15]。根據(jù)最終建議,DMS的服務(wù)費(fèi)用來(lái)源被分成兩種類型:一種是在基金申請(qǐng)階段,圖書(shū)館提供數(shù)據(jù)管理計(jì)劃的撰寫指導(dǎo)以及咨詢服務(wù),這部分服務(wù)費(fèi)用由學(xué)院經(jīng)費(fèi)承擔(dān);另一種是面向成功獲得基金支持的項(xiàng)目,圖書(shū)館協(xié)助科研人員保障后續(xù)數(shù)據(jù)管理計(jì)劃的順利執(zhí)行并為每個(gè)項(xiàng)目提供2TB的數(shù)據(jù)存儲(chǔ)空間以及5年的數(shù)據(jù)保存服務(wù),圖書(shū)館收取2%的項(xiàng)目經(jīng)費(fèi)作為服務(wù)費(fèi)。美國(guó)研究圖書(shū)館協(xié)會(huì)(Association of Research Libraries,簡(jiǎn)稱ARL)2013年的一份關(guān)于圖書(shū)館開(kāi)展科研數(shù)據(jù)管理服務(wù)情況的調(diào)研報(bào)告指出[16]:高達(dá)84%的數(shù)據(jù)倉(cāng)儲(chǔ)系統(tǒng)依賴學(xué)校撥款,而依靠基金會(huì)贊助或者向用戶收費(fèi)都只有較低的比例。

除了從NSF等基金管理機(jī)構(gòu)以及學(xué)校獲取經(jīng)費(fèi)以外,DC項(xiàng)目組也認(rèn)識(shí)到需要學(xué)習(xí)和創(chuàng)新其他的經(jīng)費(fèi)來(lái)源模式[16]。例如,①會(huì)員制。作為國(guó)際知名的社會(huì)科學(xué)數(shù)據(jù)倉(cāng)儲(chǔ)系統(tǒng),美國(guó)校際社會(huì)科學(xué)數(shù)據(jù)共享聯(lián)盟(In t eruniversity Consortium for Political and Social Research,簡(jiǎn)稱ICPSR)是通過(guò)會(huì)員制獲取資金的典范。除了從政府和私人基金會(huì)獲得贊助以外,收取會(huì)員費(fèi)已經(jīng)成為ICPSR的重要資金來(lái)源[17]。②增值性服務(wù)。在建立合理定價(jià)的基礎(chǔ)上,通過(guò)為用戶提供增值性的產(chǎn)品和服務(wù)獲取收益,包括數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)保存、元數(shù)據(jù)方案制訂、高級(jí)技能培訓(xùn)課程等。③科研基金。NSF從2012年起就允許科研人員將項(xiàng)目經(jīng)費(fèi)用于“研究資料與成果及其他附屬材料(包括數(shù)據(jù))的準(zhǔn)備、出版、傳播以及共享”[18]。NSF作為美國(guó)最重要的科研基金來(lái)源,無(wú)疑是政策引領(lǐng)的風(fēng)向標(biāo)。可以預(yù)見(jiàn),從科研項(xiàng)目的研究基金里撥款用于科研數(shù)據(jù)管理的支出將成為未來(lái)的一種重要趨勢(shì)。

3 約翰·霍普金斯大學(xué)的科研數(shù)據(jù)管理

3.1 數(shù)據(jù)管理服務(wù)與團(tuán)隊(duì)構(gòu)成

作為DC項(xiàng)目的主要執(zhí)行機(jī)構(gòu),謝里丹圖書(shū)館首先安裝使用了DCS系統(tǒng),并于2011年7月正式開(kāi)展科研數(shù)據(jù)管理服務(wù)[17]。NSF要求基金申請(qǐng)人自2011年1月開(kāi)始必須提交數(shù)據(jù)管理計(jì)劃(Data Management Plan,簡(jiǎn)稱DMP)作為基金申請(qǐng)書(shū)的附件[19]。因此,謝里丹圖書(shū)館的DMS包括兩項(xiàng)主要內(nèi)容:①幫助科研人員撰寫DMP,并提供咨詢與指導(dǎo)服務(wù);②協(xié)助科研人員切實(shí)執(zhí)行DMP內(nèi)容,利用DCS搭建的數(shù)據(jù)倉(cāng)儲(chǔ)系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)的存檔與共享。經(jīng)過(guò)幾年的實(shí)踐,謝里丹圖書(shū)館積累了豐富的科研數(shù)據(jù)管理經(jīng)驗(yàn)。David S.Fearon在2015年“新英格蘭地區(qū)圖書(shū)館員e-Science研討會(huì)”上的演講資料表明[20],截止到2015年4月,JHU累計(jì)有942人參與了數(shù)據(jù)管理培訓(xùn)課程;2014年,全校共有545人參加了20場(chǎng)數(shù)據(jù)管理技能培訓(xùn)班。培訓(xùn)班的主題包括:如何撰寫DMP、數(shù)據(jù)管理最佳實(shí)踐案例分析、隱私數(shù)據(jù)的處理方法、電子表格數(shù)據(jù)的管理與分享等。JHU制定并發(fā)布了校級(jí)的數(shù)據(jù)管理政策,并面向全校教員規(guī)劃了相應(yīng)的科研數(shù)據(jù)管理培訓(xùn)課程,這都標(biāo)志著DMS已經(jīng)上升到了校級(jí)層面科研管理的高度[21]。

DMS團(tuán)隊(duì)人員配置科學(xué)合理,包括數(shù)據(jù)咨詢館員、高級(jí)技術(shù)顧問(wèn)、軟件工程師、系統(tǒng)管理員以及服務(wù)經(jīng)理等。數(shù)據(jù)咨詢館員是整個(gè)服務(wù)團(tuán)隊(duì)的核心角色,直接面向科研人員,承擔(dān)著包括DMP撰寫的指導(dǎo)、協(xié)助DMP的后續(xù)執(zhí)行及數(shù)據(jù)存檔與共享等重要職責(zé)。JHU的數(shù)據(jù)咨詢館員通常具有某一學(xué)科的博士學(xué)位以及圖情學(xué)科的碩士學(xué)位,參加過(guò)數(shù)據(jù)管理的專業(yè)課程培訓(xùn),并具備經(jīng)驗(yàn)豐富的用戶服務(wù)技巧以及數(shù)據(jù)處理的實(shí)際經(jīng)驗(yàn)。

3.2 挑戰(zhàn)與機(jī)遇

在開(kāi)展DMS服務(wù)的初期,謝里丹圖書(shū)館不可避免地會(huì)遇到各種挑戰(zhàn)。美國(guó)各個(gè)主要基金會(huì)有不同的數(shù)據(jù)政策和規(guī)定,對(duì)DMP內(nèi)容的要求各不相同,而且不同學(xué)科的數(shù)據(jù)特性差異極大,給數(shù)據(jù)咨詢館員的技能要求帶來(lái)很大挑戰(zhàn)。因此,圖書(shū)館員和科研人員必須建立緊密的合作關(guān)系,發(fā)揮各自學(xué)科優(yōu)勢(shì),共同面對(duì)數(shù)據(jù)管理問(wèn)題。新服務(wù)的推廣與營(yíng)銷非常必要,圖書(shū)館要讓忙碌的大學(xué)科研人員認(rèn)識(shí)到DMS的重要性和價(jià)值,逐漸培養(yǎng)并擴(kuò)大用戶基礎(chǔ),這是比數(shù)據(jù)服務(wù)本身更具有挑戰(zhàn)性的工作。隨著DMS的深入開(kāi)展,圖書(shū)館的服務(wù)范圍從NSF擴(kuò)展到了美國(guó)國(guó)立衛(wèi)生研究院(National Institutes of Health,簡(jiǎn)稱NIH)、美國(guó)國(guó)家人文基金會(huì)(National Endowment for the Humanities,簡(jiǎn)稱NEH)、美國(guó)國(guó)防部(United States Department of Defense,簡(jiǎn)稱DOD)等其他重要基金管理機(jī)構(gòu)。從軟件系統(tǒng)的角度來(lái)看,謝里丹圖書(shū)館的數(shù)據(jù)倉(cāng)儲(chǔ)系統(tǒng)體現(xiàn)出了基于DCS架構(gòu)的功能特性和創(chuàng)新方法。DCS實(shí)現(xiàn)了跨學(xué)科的數(shù)據(jù)集成方法,為當(dāng)前數(shù)據(jù)密集型的科研與發(fā)現(xiàn)環(huán)境提供了重要借鑒。

4 Data Conservancy的價(jià)值與啟示

DC項(xiàng)目的愿景是建設(shè)一個(gè)示范性的、可持續(xù)發(fā)展的科研數(shù)據(jù)信息基礎(chǔ)設(shè)施,以應(yīng)對(duì)當(dāng)前大數(shù)據(jù)科研環(huán)境下的挑戰(zhàn),幫助科學(xué)家快速、有效地解決21世紀(jì)重大的科研問(wèn)題。DC項(xiàng)目成功地構(gòu)建了一個(gè)學(xué)科無(wú)關(guān)性的數(shù)據(jù)信息基礎(chǔ)設(shè)施,并從信息技術(shù)、經(jīng)費(fèi)來(lái)源以及人才培養(yǎng)等方面來(lái)探討可持續(xù)發(fā)展的關(guān)鍵策略。DC項(xiàng)目在以下幾個(gè)方面顯著影響了科研數(shù)據(jù)管理的研究與實(shí)踐:①在更大范圍內(nèi),促成不同領(lǐng)域科學(xué)之間的廣泛合作,起到橋梁的作用,有顯著的示范效應(yīng),為學(xué)科融合與合作起到革命性的推動(dòng)作用。②利用數(shù)據(jù)關(guān)聯(lián)與數(shù)據(jù)溯源技術(shù),更容易構(gòu)建知識(shí)關(guān)聯(lián)系統(tǒng),從而更容易解決重大的科學(xué)難題。③以開(kāi)放存取為主的數(shù)據(jù)倉(cāng)儲(chǔ)鼓勵(lì)更多的科研人員參與到科研協(xié)作中來(lái),加速信息的傳播與交流。④建立一種標(biāo)準(zhǔn)的合作模式,為共同解決科技問(wèn)題、乃至社會(huì)重大問(wèn)題提供數(shù)據(jù)依據(jù)。

圖書(shū)館在大數(shù)據(jù)時(shí)代將扮演更多與科研數(shù)據(jù)管理相關(guān)的重要角色,其功能和職責(zé)將從科研生命周期的下游(學(xué)術(shù)出版后)向上游(學(xué)術(shù)出版前)拓展和延伸[22-23]。具體來(lái)說(shuō),在下游的科研周期內(nèi),圖書(shū)館的作用在于數(shù)據(jù)選擇、數(shù)據(jù)處理、元數(shù)據(jù)方案規(guī)劃以及數(shù)據(jù)的管理與保存等服務(wù)。而在上游的科研周期內(nèi),通過(guò)從科研初始階段就與科研人員的密切合作,圖書(shū)館可以在信息基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)管理原型和架構(gòu)、標(biāo)準(zhǔn)規(guī)范甚至政策的制定中發(fā)揮作用。

就高校來(lái)說(shuō),在信息基礎(chǔ)設(shè)施建設(shè)以及數(shù)據(jù)管理的整個(gè)過(guò)程中,圖書(shū)館始終要勇于承擔(dān)主導(dǎo)者的角色,在校領(lǐng)導(dǎo)的支持和推動(dòng)下,積極聯(lián)合其他利益相關(guān)者(包括IT部門、科研管理部門、學(xué)院、重點(diǎn)實(shí)驗(yàn)室等),就科研數(shù)據(jù)管理的重要意義達(dá)成共識(shí)。再不能因循守舊,沿著原先的思路來(lái)設(shè)計(jì)新環(huán)境下的信息基礎(chǔ)設(shè)施,IT系統(tǒng)專家、科研人員、工程師、科研管理者以及圖書(shū)館員需要緊密協(xié)作,共同分析應(yīng)用環(huán)境,考慮各方面因素,設(shè)計(jì)可擴(kuò)展的隨需應(yīng)變的解決方案,而不僅僅是著眼于解決技術(shù)難題。為應(yīng)對(duì)當(dāng)前及未來(lái)之挑戰(zhàn),圖書(shū)館要善于利用數(shù)據(jù)資源、服務(wù)內(nèi)容及信息基礎(chǔ)設(shè)施這三者之間的關(guān)系,使其有機(jī)融合并充分發(fā)揮數(shù)據(jù)管理服務(wù)之效能。在新型科研環(huán)境下,圖書(shū)館要重塑角色,為科研人員提供超出其滿意度的科研數(shù)據(jù)管理服務(wù),并努力保持可持續(xù)發(fā)展及不斷進(jìn)化的能力。

[1]Edwards P, Jackson S, Bowker G, et al.Understanding Infrastructure: Dynamics, Tensions, and Design [EB/OL].[2015-09-05].http://deepblue.lib.umich.edu/handle/2027.42/49353.

[2]National Science Foundation.Sustainable Digital Data Preservation and Access Network Partners (DataNet) [EB/OL].[2015-09-10].http://www.nsf.gov/funding/pgm_summ.jsp?pims_id=503141.

[3]Jae L, Jianting Z, Zimmerman A, et al.DataNet: An Emerging Cyberinfrastructure for Sharing, Reusing and Preserving Digital Data for Scientific Discovery and Learning[J].AIChE Journal,2009, 55(11):2757-2764.

[4]Mayernik M, Choudhury S, DiLauro T, et al.The Data Conservancy Blueprint for Data Management[EB/OL].[2015-09-15].http://dataconservancy.org/community/blueprint.

[5]Mayernik M, Choudhury S, DiLauro T, et al.The Data Conservancy Instance: Infrastructure and Organizational Services for Research Data Curation[EB/OL].[2015-09-18].http://www.dlib.org/dlib/september12/mayernik/09mayernik.html.

[6]Data Conservancy.Key Features of the Data Conservancy Software [EB/OL].[2015-09-20].http://dataconservancy.org/software.

[7]Consultative Committee for Space Data Systems (CCSDS).Reference Model for an Open Archival Information System (OAIS)Recommendation for Space Data System Standards[EB/OL].[2015-09-20].http://public.ccsds.org/publications/archive/ 650x0m2.pdf.

[8]Varvel V.Data Conservancy CyberInfrastructure Early Development Case Study [EB/OL].[2015-09-25].https://www.ideals.illinois.edu/handle/2142/30655.

[9]JHU Office of Communications.Sheridan Libraries Awarded $20 Million Grant[EB/OL].[2015-09-28].http://releases.jhu.edu/ 2009/10/02/sheridan-libraries-awarded-20-million-grant/.

[10]Lavoie B.Sustainable Research Data[M].London: Facet Publishing, 2012:67-82.

[11]Choudhury S, Hanisch R.The Data Conservancy: Building a Sustainable System for Interdisciplinary Scientific Data Curation and Preservation[EB/OL].[2015-10-05].https://jscholarship.library.jhu.edu/handle/1774.2/34018.

[12]Waters D, Garrett J.Preserving Digital Information, Report of the Task Force on Archiving of Digital Information[EB/OL].[2015-10-07].http://www.clir.org/pubs/reports/pub63waters garrett.pdf.

[13]Gil Y, Cheney J, Groth P, et al.Provenance XG Final Report: W3C Incubator Group Report[EB/OL].[2015-10-10].http://www.w3.org/2005/Incubator/prov/XGR-prov-20101214.

[14]Mayernik M, Dilauro T, Duerr R, et al.Data Conservancy Provenance, Context, and Lineage Services:Key Components for Data Preservation and Curation[J].Data Science Journal, 2013,12(22):158-171.

[15]Shen Y, Varvel V.Developing Data Management Services at the Johns Hopkins University[J].The Journal of Academic Librarianship, 2013(39):552-557.

[16]Association of Research Libraries.SPEC Kit 334: Research Data Management Services[EB/OL].[2015-10-10].http://publications.arl.org/Research-Data-Management-Services-SPEC-Kit-334/.

[17]Inter-University Consortium for Political and Social Research.Membership in ICPSR[EB/OL].[2015-10-15].https://www.icpsr.umich.edu/icpsrweb/content/membership/index.html.

[18]National Science Foundation.Award and Administration Guide,Chapter V- Allowability of Costs[EB/OL].[2015-10-17].http://www.nsf.gov/pubs/policydocs/pappguide/nsf11001/aag_5.jsp.

[19]National Science Foundation.Dissemination and Sharing of Research Results [EB/OL].[2015-10-20].http://www.nsf.gov/ bfa/dias/policy/dmp.jsp.

[20]Fearon D S.Origin and Development of Johns Hopkins Data Management Services[EB/OL].[2015-10-22].http://escholarship.umassmed.edu/escience_symposium/2015/program/2.

[21]Johns Hopkins University Data Management Services.JHU Policies[EB/OL].[2015-10-23].http://dmp.data.jhu.edu/ resources/jhu-policies.

[22]Gold A.Cyberinfrastructure, Data, and Libraries, Part1 A Cyberinfrastructure Primer for Librarians[EB/OL].[2015-10-26].http://www.dlib.org/dlib/september07/gold/09gold-pt1.html.

[23]Gold A.Cyberinfrastructure, Data, and Libraries, Part2 Libraries and the Data Challenge: Roles and Actions for Libraries[EB/OL].[2015-10-28].http://www.dlib.org/dlib/september07/gold/ 09gold-pt2.html.

Research on the Sustainable Cyberinfrastructure for Scientific Data Management

In the era of big data, it is necesary to develop a new-type cyberinfrastructure for scientific data management, using and long-term preservation.Data Conservancy project is one of DataNet initiative awards for building data cyberinfrastructure funded by the National Science Foundation.Based on OAIS reference model, Data Conservancy project team designed service-oriented software architecture, and developed sicentific data management platform.The executor of Data Conservancy explores a sustainable development strategy from the perspective of technology selection and funding.The Johns Hopkins University Data Management Services (JHU DMS) is described as an example of how the Data Conservancy can be deployed by a professional group, which faces challenges and opportunities.In the new scientic research environment, the library should remodel its role, provide scientifc data management service for researchers, and keep motivition on sustainable development and evolution.

Cyberinfrastructure; Data management; Data curation; Data Conservancy(DC); Sustainable development

G252

A

王 璞 男,1977年生,上海海事大學(xué)圖書(shū)館信息技術(shù)部主任,館員。

2015-12-23 ]

猜你喜歡
數(shù)據(jù)管理科研人員基礎(chǔ)設(shè)施
科技部等五部門聯(lián)合發(fā)文開(kāi)展減輕青年科研人員負(fù)擔(dān)專項(xiàng)行動(dòng)
農(nóng)業(yè)基礎(chǔ)設(shè)施建設(shè)有望加速
企業(yè)級(jí)BOM數(shù)據(jù)管理概要
科研人員揭示油桃果實(shí)表皮不長(zhǎng)毛的奧秘
公募基礎(chǔ)設(shè)施REITs與股票的比較
定制化汽車制造的數(shù)據(jù)管理分析
科研人員破譯黑豬肉特征風(fēng)味物質(zhì)
海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實(shí)踐
CTCS-2級(jí)報(bào)文數(shù)據(jù)管理需求分析和實(shí)現(xiàn)
企業(yè)科研人員激勵(lì)問(wèn)題及對(duì)策研究
苍梧县| 温州市| 宜章县| 湖北省| 永修县| 通道| 伊川县| 阿拉善左旗| 西昌市| 沙河市| 乐平市| 横峰县| 汨罗市| 兴宁市| 丰都县| 隆德县| 同仁县| 米易县| 鄂州市| 滨海县| 邵武市| 绥滨县| 克什克腾旗| 巴东县| 新干县| 福建省| 大洼县| 镇康县| 嵊泗县| 黄龙县| 翁源县| 和林格尔县| 和硕县| 安陆市| 曲靖市| 龙岩市| 南阳市| 大埔县| 淮安市| 山阴县| 昌平区|