陳建新
(江蘇食品職業(yè)技術(shù)學(xué)院圖書館 江蘇淮安 223003)
隨著信息社會的發(fā)展,產(chǎn)生于科學(xué)實(shí)驗(yàn)、科學(xué)研究過程之中以及日常信息行為、社交網(wǎng)絡(luò)、移動終端的數(shù)據(jù)海量增加,由于數(shù)據(jù)產(chǎn)生來源、存儲媒介的不同,使得數(shù)據(jù)的類型、存在形態(tài)和結(jié)構(gòu)都豐富多樣,隨著隱藏在這些數(shù)據(jù)背后的巨大價值被發(fā)現(xiàn)和利用,數(shù)據(jù)的科學(xué)價值逐漸被人們重視,致使科學(xué)研究工作向著數(shù)據(jù)密集型研究轉(zhuǎn)變,科研人員必須對大量的科學(xué)數(shù)據(jù)進(jìn)行收集、分析、管理、保存和共享。作為社會信息、文獻(xiàn)的收藏、利用、加工、服務(wù)機(jī)構(gòu)的圖書館,在科學(xué)研究進(jìn)入到以數(shù)據(jù)為基礎(chǔ),以數(shù)據(jù)密集為主要研究范式特征的大數(shù)據(jù)時代,科學(xué)數(shù)據(jù)服務(wù)值得關(guān)注和研究,也必將是未來圖書館服務(wù)的主要組成部分。
信息社會的發(fā)展,使得科研環(huán)境也向信息化、網(wǎng)絡(luò)化與數(shù)字化方向發(fā)展,在重構(gòu)的科研環(huán)境下,各種實(shí)驗(yàn)及設(shè)備、計(jì)算機(jī)及儀器產(chǎn)生的原生科學(xué)數(shù)據(jù)指數(shù)增加,其中包含著大量未被重視和處理或只出版公布了最終實(shí)驗(yàn)結(jié)果而對實(shí)驗(yàn)過程數(shù)據(jù)沒有記錄的數(shù)據(jù),而事實(shí)上這些數(shù)據(jù)也有著大量的科學(xué)研究價值,因此,科學(xué)數(shù)據(jù)作為一個傳統(tǒng)的概念,隨著數(shù)據(jù)科學(xué)的興起以及在數(shù)字化科研背景下第四科學(xué)研究范式的形成,受到了越來越多科研人員的重視,其含義、組成及存在形態(tài)也都在發(fā)生著變化,如從科學(xué)數(shù)據(jù)來源來看,其既包括科研、實(shí)驗(yàn)過程中的實(shí)驗(yàn)數(shù)據(jù)、計(jì)算機(jī)中的存貯數(shù)據(jù)等數(shù)字化數(shù)據(jù),如實(shí)驗(yàn)記錄數(shù)據(jù)等,也包括原始的非數(shù)字形式數(shù)據(jù),如神經(jīng)圖像等;從數(shù)據(jù)組成類型與格式來看,其既包括傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)值型數(shù)據(jù)、多媒體數(shù)據(jù),也包括大數(shù)據(jù)時代的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù),如文本數(shù)據(jù)、HTML 數(shù)據(jù)、社交數(shù)據(jù)等。
實(shí)現(xiàn)對需要進(jìn)一步研究方可發(fā)現(xiàn)其蘊(yùn)含價值和內(nèi)容的科學(xué)數(shù)據(jù)的存儲、共享、利用與服務(wù)隨著科學(xué)數(shù)據(jù)大規(guī)模的產(chǎn)生而顯得愈發(fā)緊迫和必要,因?yàn)榭茖W(xué)研究已不再是獨(dú)立的觀察某一實(shí)驗(yàn)或領(lǐng)域的數(shù)據(jù),學(xué)科間交叉合作研究和學(xué)科內(nèi)繼續(xù)研究成為了科研發(fā)展趨勢,在這種大環(huán)境下,科學(xué)數(shù)據(jù)成為科研機(jī)構(gòu)、科研人員學(xué)術(shù)交流的基本單元。作為社會知識服務(wù)機(jī)構(gòu)的圖書館特別是為用戶提供科研、 教學(xué)支撐的高校圖書館向用戶提供科學(xué)數(shù)據(jù)服務(wù),能有效保護(hù)數(shù)據(jù)免于丟失、提高數(shù)據(jù)曝光度,傳播和出版成果、實(shí)現(xiàn)數(shù)據(jù)共享、對科學(xué)質(zhì)疑公開、鼓勵觀點(diǎn)多樣性、節(jié)約科研成本、完成研究資助方的要求等。
2012 年6 月,美國大學(xué)與研究圖書館協(xié)會出版了《學(xué)術(shù)圖書館與科學(xué)數(shù)據(jù)服務(wù)》白皮書報(bào)告,該報(bào)告調(diào)查了美國和加拿大的大學(xué)與研究圖書館協(xié)會的351 所成員館的科學(xué)數(shù)據(jù)服務(wù)情況,結(jié)果顯示盡管目前只有少數(shù)的美國、 加拿大的大學(xué)與研究圖書館協(xié)會成員館開展科學(xué)數(shù)據(jù)服務(wù),但也顯示許多高校圖書館準(zhǔn)備在未來一到兩年內(nèi)開展科學(xué)數(shù)據(jù)服務(wù)?,F(xiàn)有的科學(xué)數(shù)據(jù)服務(wù)以情報(bào)咨詢類服務(wù)為主,如科學(xué)數(shù)據(jù)服務(wù)培訓(xùn)、數(shù)據(jù)管理計(jì)劃、數(shù)據(jù)查找與引用等,很多高校圖書館還將科學(xué)數(shù)據(jù)服務(wù)嵌入到科研過程中,鼓勵圖書館員直接參與到項(xiàng)目的過程之中。此外,科學(xué)數(shù)據(jù)的技術(shù)服務(wù)也是服務(wù)的主要類型之一,如提供數(shù)據(jù)標(biāo)識、數(shù)據(jù)更新、技術(shù)支持等服務(wù)。但由于技術(shù)服務(wù)涉及到了科學(xué)數(shù)據(jù)的內(nèi)容、存在形態(tài)、創(chuàng)建與更改等方面,對館員的技術(shù)素養(yǎng)要求較高,因而開展此項(xiàng)服務(wù)的圖書館數(shù)量較少,而大多數(shù)圖書館只是計(jì)劃在兩年內(nèi)提供此類服務(wù)。值得一提的是,在提供科學(xué)數(shù)據(jù)服務(wù)的圖書館中,盡管大多數(shù)圖書館傾向于讓學(xué)科館員(71.1%)擔(dān)任數(shù)據(jù)館員職務(wù),但也更愿意對現(xiàn)有員工進(jìn)行相關(guān)業(yè)務(wù)培訓(xùn)后重新上崗來從事此項(xiàng)服務(wù),如參加課程進(jìn)修、內(nèi)部交流等培訓(xùn)方式,只有較少比例的圖書館愿意采取雇傭新員工的方式來開展此項(xiàng)服務(wù)。
作為以社會或機(jī)構(gòu)信息組織、服務(wù)、加工為主要職責(zé)的圖書館,因其服務(wù)的用戶在科研過程之中、所藏文獻(xiàn)信息開發(fā)之后均能產(chǎn)生大量的科學(xué)數(shù)據(jù),故而其蘊(yùn)含著大量的科學(xué)數(shù)據(jù),嵌入式服務(wù)、學(xué)科服務(wù)的深入開展及大數(shù)據(jù)時代的到來,使得圖書館的科學(xué)數(shù)據(jù)含量變得更為豐富多樣,圖書館如何開發(fā)、挖掘自身的科學(xué)數(shù)據(jù),搭建自己的科學(xué)數(shù)據(jù)開發(fā)、存儲、共享、服務(wù)平臺,變得尤為重要。因此,可以預(yù)見在圖書館的科學(xué)數(shù)據(jù)服務(wù)中,以科學(xué)數(shù)據(jù)的收集、整理、組織為主要服務(wù)內(nèi)容的科學(xué)數(shù)據(jù)開發(fā)服務(wù)將得到圖書館的重視和開展,用以更深的揭示文獻(xiàn)資源和隱含的數(shù)據(jù)價值。
大量數(shù)據(jù)的產(chǎn)生,使得實(shí)現(xiàn)便捷的存儲與獲取成為了圖書館和用戶的一大問題,云計(jì)算的出現(xiàn)似乎解決了海量的存儲、高速的運(yùn)算問題,但云計(jì)算天性存在的不安全性和高價格并不是所有圖書館或用戶都能解決的,圖書館通過自建或合建自身科學(xué)數(shù)據(jù)的管理存儲庫來實(shí)現(xiàn)科學(xué)數(shù)據(jù)的收集、共享與服務(wù)成為必然。如康奈爾大學(xué)圖書館建立的DataStaR 就是一個臨時的存儲庫,用戶可以上傳數(shù)據(jù)、自主選擇數(shù)據(jù)共享對象、數(shù)據(jù)出版等,同時支持小型研究團(tuán)體的數(shù)據(jù)共享;普渡大學(xué)圖書館的D2C2是一個分布式數(shù)據(jù)保存項(xiàng)目,其中e-Data 作為數(shù)據(jù)管理服務(wù)的試驗(yàn)平臺,圖書館員和各個領(lǐng)域的研究者合作進(jìn)行數(shù)據(jù)收集; 澳洲國立大學(xué)建立的超級計(jì)算機(jī)設(shè)備(Australian National University Supercomputing Facility,簡稱ANUSF) ,也提供了大量項(xiàng)目范圍內(nèi)的數(shù)據(jù)存儲服務(wù)。同時,從社會及圖書館事業(yè)發(fā)展的角度來看,合作與共享也是未來發(fā)展的主旋律,因此,圖書館尋求機(jī)構(gòu)間或科研單位的合作存儲服務(wù)也將是發(fā)展的一大趨勢,如哈佛—麻省理工數(shù)據(jù)中心( Harvard-MIT Data Center,HMDC) 就是由兩所學(xué)校聯(lián)合建立的數(shù)據(jù)倉儲中心,以供兩所高校的教師存儲、獲取數(shù)據(jù)。
在已經(jīng)到來的大數(shù)據(jù)時代,數(shù)據(jù)的挖掘、分析與組織將是圖書館等信息服務(wù)機(jī)構(gòu)的主要內(nèi)容,因此可以預(yù)見,通過對科學(xué)數(shù)據(jù)的分析來達(dá)到對科學(xué)數(shù)據(jù)的增值與深度揭示將是未來圖書科學(xué)數(shù)據(jù)服務(wù)的主要的內(nèi)容之一,如對科學(xué)數(shù)據(jù)的關(guān)聯(lián)度分析、可視化分析、聚類分析等。如哈佛大學(xué)的“Dataverse Network”項(xiàng)目除包括有科學(xué)數(shù)據(jù)的出版、共享外,還包括有參考、抽取和分析等內(nèi)容[8]。
技術(shù)的發(fā)展與海量信息環(huán)境中用戶需求的變化,使得圖書館的發(fā)現(xiàn)服務(wù)也發(fā)生著變化,目前主要以資源名稱檢索和鏈接,如數(shù)據(jù)檢索、數(shù)據(jù)導(dǎo)航等,來揭示資源存在與實(shí)現(xiàn)服務(wù)。其途徑也將隨著數(shù)據(jù)來源、類型、存在形態(tài)等的變化而借鑒谷歌、百度、搜狐等一站式搜索引擎和Google Scholar、SCIRUS、INFOMINE 等 學(xué) 術(shù) 搜 索 引 擎理念,實(shí)現(xiàn)一站式的資源發(fā)現(xiàn)服務(wù)將會是圖書館未來信息服務(wù)的發(fā)展方向之一。而這一服務(wù)類型主要就是科學(xué)數(shù)據(jù)服務(wù),如科學(xué)數(shù)據(jù)的集成融匯服務(wù)等。知識發(fā)現(xiàn)服務(wù)系統(tǒng)的開發(fā)與大量應(yīng)用將加速發(fā)現(xiàn)服務(wù)的發(fā)展,目前已開發(fā)和在圖書館大量應(yīng)用的發(fā)現(xiàn)系統(tǒng)有Primo、EBSCO Discovery Service(EDS)、Encore 等,OCLC 也推出了自己的一站式知識資源發(fā)現(xiàn)與服務(wù)系統(tǒng)Worldcat Local,這些系統(tǒng)通過類似Google 的簡單檢索框,采用統(tǒng)一路徑以實(shí)現(xiàn)對圖書館各種資源的發(fā)現(xiàn)和獲取。圖書館界特別是高校圖書館已開始引進(jìn)和應(yīng)用這些資源發(fā)現(xiàn)服務(wù)系統(tǒng),如北京大學(xué)圖書館、浙江大學(xué)圖書館、西安交通大學(xué)圖書館以及北京師范大學(xué)圖書館引進(jìn)了Summon 系統(tǒng), 清華大學(xué)圖書館、上海交通大學(xué)圖書館、中科院高能所圖書館、 農(nóng)科院圖書館、 中國社科院圖書館引進(jìn)了Primo 系統(tǒng)。
近年來,隨著科學(xué)數(shù)據(jù)服務(wù)在美國等發(fā)達(dá)國家的發(fā)展,我國圖書館界也開始對科學(xué)數(shù)據(jù)服務(wù)進(jìn)行了探索,如中科院國家科學(xué)圖書館提出并開展的科學(xué)數(shù)據(jù)與科技文獻(xiàn)跨界集成服務(wù)、數(shù)據(jù)融合技術(shù)的研究和開發(fā),利用數(shù)據(jù)SRU 技術(shù)實(shí)現(xiàn)了科技文獻(xiàn)、科學(xué)數(shù)據(jù)、字典等的服務(wù)融合;北京大學(xué)圖書館等還通過引入和應(yīng)用信息資源發(fā)現(xiàn)系統(tǒng),來向用戶提供知識發(fā)現(xiàn)等服務(wù)。同時,我國學(xué)者還對圖書館特別是高校圖書館的科學(xué)數(shù)據(jù)服務(wù)進(jìn)行了學(xué)術(shù)研究,提出了多種服務(wù)模式。筆者以為,我國圖書館的科學(xué)數(shù)據(jù)服務(wù),可以借鑒美國等發(fā)達(dá)國家的科學(xué)數(shù)據(jù)服務(wù),開展以數(shù)據(jù)引用、數(shù)據(jù)查找等內(nèi)容為主的咨詢服務(wù),幫助科研人員對科學(xué)數(shù)據(jù)進(jìn)行快速的查找與利用,在具有一定科學(xué)數(shù)據(jù)服務(wù)的基礎(chǔ)上延伸到其它高端領(lǐng)域,如技術(shù)支持、 數(shù)據(jù)關(guān)聯(lián)等,最終實(shí)現(xiàn)對科學(xué)數(shù)據(jù)的深度分析、價值挖掘等服務(wù),擴(kuò)大圖書館在科研支撐、數(shù)據(jù)保存于傳播、知識創(chuàng)造與應(yīng)用中的作用。
西方的部分高校圖書館把科學(xué)數(shù)據(jù)服務(wù)也稱作為數(shù)據(jù)監(jiān)管(data curation)服務(wù),因而在2012 年美國大學(xué)與研究圖書館協(xié)會研究規(guī)劃與評估委員會的報(bào)告中將數(shù)據(jù)監(jiān)管服務(wù)列為2012 年學(xué)術(shù)圖書館的十大趨勢之一。從美國的科學(xué)數(shù)據(jù)服務(wù)來看,一方面其服務(wù)人員主要是從內(nèi)部挖掘,通過圖書館員的學(xué)術(shù)內(nèi)部交流、課程進(jìn)修來使其達(dá)到科學(xué)數(shù)據(jù)服務(wù)的基本素養(yǎng);另一方面,圖書館專門設(shè)立數(shù)據(jù)館員崗位,通過對崗位的設(shè)置要求來促使數(shù)據(jù)館員來提高自身的服務(wù)技能與素養(yǎng)。我國圖書館特別是高校圖書館應(yīng)借鑒這種崗位設(shè)置模式,設(shè)計(jì)數(shù)據(jù)館員管理制度,重視人才培養(yǎng)與素質(zhì)教育,如數(shù)據(jù)館員的勝任條件、進(jìn)修課程等,如愛丁堡大學(xué)的數(shù)據(jù)館員管理政策明確指出:“學(xué)校為科學(xué)數(shù)據(jù)館員提供培訓(xùn)、支持、建議和適當(dāng)?shù)闹笇?dǎo)方針和指導(dǎo)”。
[1]錢鵬.高??茖W(xué)數(shù)據(jù)管理研究[D].南京:南京大學(xué),2012.
[2]ANU data management manual: Managing digitalresearch data at the Australian National University[EB/OL].[2012-11-29].http://ilp.Anu.edu.au/dm/ANU_DM_Manual_v1.03.pdf.
[3]Academic Libraries and Research Data Services: Current Practices and Plans for the Future[EB/OL].[2012-11-29].http://www.acrl.ala.org/acrlinsider/archives/6297.
[4]DataStaR[EB /OL].[2012-03-15].http: / /datastar.Mannlib.Cornell.edu /.
[5]D2C2[EB/OL].[2012-03-15].http://d2c2.lib.purdue.edu/.
[6]ANU supercomputer facility[EB /OL].[2010-09-01].http://anusf.anu.edu.au /.
[7]Harvard-MIT Data Center[EB /OL].[2012-03-15].http: / /hmdc.harvard.edu /.
[8]An open-source application for publishing,citing and discovering research data[EB /OL].[2012-03-15].http: / /thedata.org/book/features.
[9]北京大學(xué)啟用Serials Solutions Summon 發(fā)現(xiàn)服務(wù)[EB/OL].[2012-12-10].http://www.serialssolutions.com/news/serialssolutions-peking-university-summon-simplified.
[10]Prim 資源發(fā)現(xiàn)與獲取系統(tǒng)案例[EB/OL].[2012-12-10].http://www.exlibris.com.cn/support/casestudy.Html.
[11]項(xiàng)英,李向軍.高校圖書館資源發(fā)現(xiàn)服務(wù)系統(tǒng)應(yīng)用研究[J].情報(bào)科學(xué), 2012,(11):1682-1685.
[12]李春旺.圖書館集成融匯服務(wù)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2009,( 12) : 1-6.
[13]李春旺,王小梅,王昉等.基于SRU 的集成服務(wù)平臺設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2007,( 2) :12 -15.
[14]師榮華,劉細(xì)文.基于數(shù)據(jù)生命周期的圖書館科學(xué)數(shù)據(jù)服務(wù)研究[J].圖書情報(bào)工作, 2011, 55(1): 39-42.
[15]肖瀟,呂俊生.E-science 環(huán)境下國外圖書館科學(xué)數(shù)據(jù)服務(wù)研究進(jìn)展[J].圖書情報(bào)工作, 2012, 56(17):53-59.
[16]ACRL Research Planning and Review Committee.2012 Top Ten Trends in Academic Libraries[EB/OL].[2013-01-07].http://crln.acrl.org/content/73/6/311.full.pdf+html.
[17]Research Data Management Policy [EB/OL].[2013-05-28].http://www.ed.ac.uk/schools-departments/informationservices/about/policies-and-regulations/research-data-policy.