黃鑫 鄧仲華
摘 要:隨著大數(shù)據(jù)時代的來臨,海量科學數(shù)據(jù)的爆發(fā)使得圖書館科學數(shù)據(jù)服務面臨諸多挑戰(zhàn),而“互聯(lián)網(wǎng)+”的提出為圖書館科學數(shù)據(jù)服務的發(fā)展提供了思路。在“互聯(lián)網(wǎng)+”視角下,科學數(shù)據(jù)開發(fā)服務、科學數(shù)據(jù)語義檢索服務、科學數(shù)據(jù)存儲服務、科學數(shù)據(jù)分析服務、科學數(shù)據(jù)參考咨詢服務、科學數(shù)據(jù)開放存取平臺服務以及個性化科學數(shù)據(jù)服務將成為圖書館科學數(shù)據(jù)服務的發(fā)展趨勢。在開展這些數(shù)據(jù)服務時,需注意個人隱私保障和數(shù)據(jù)安全、數(shù)據(jù)版權(quán)問題。
關(guān)鍵詞:互聯(lián)網(wǎng)+ ;科學數(shù)據(jù);圖書館;數(shù)據(jù)服務;數(shù)據(jù)密集型科研環(huán)境
中圖分類號: G252 文獻標識碼: A DOI:10.11968/tsyqb.1003-6938.2016075
Research on Library Scientific Data Service under the Perspective of “Internet+”
Abstract With the approaching of the big data era, the outbreak of massive scientific data makes library scientific data service faces many challenges, but “Internet+” provides a guideline for the development of library science data service. The features of“Internet+”and library integration are analyzed at first, then the status of library science data services development is summarized, and finally these features are used to research into the library science data service under the perspective of“Internet+”. The new directions of the library science data service under the perspective of "Internet+" are proposed and some issues are emphasized which need to be solved.
Key words Internet+; scientific data; library; data service; data-intensive research environment
科學研究正在向數(shù)據(jù)密集型科研轉(zhuǎn)變,科學數(shù)據(jù)在科學研究中的地位與日俱增。圖書館作為傳統(tǒng)文獻信息的聚集中心和服務機構(gòu),提出了科學數(shù)據(jù)服務的概念,即圖書館提供給研究者的科學數(shù)據(jù)相關(guān)服務?,F(xiàn)有的圖書館科學數(shù)據(jù)服務在數(shù)據(jù)資源、硬件基礎設施、數(shù)據(jù)互操作性、數(shù)據(jù)長期保存、服務受眾和服務協(xié)同性等方面存在很多難題。“互聯(lián)網(wǎng)+”是李克強總理多次強調(diào),由國務院認定的國家發(fā)展新戰(zhàn)略,其核心理念是跨界融合,萬物相連?!盎ヂ?lián)網(wǎng)+”的提出給圖書館科學數(shù)據(jù)服務所面臨的難題提供了新的解決思路,對圖書館科學數(shù)據(jù)服務發(fā)展具有重要意義,本文將從“互聯(lián)網(wǎng)+”與圖書館的融合特征入手,探討“互聯(lián)網(wǎng)+”視角下的圖書館科學數(shù)據(jù)服務新發(fā)展。
1 “互聯(lián)網(wǎng)+”與圖書館
2015年7月,李克強總理簽批國務院第40號文件《關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導意見》,由此正式掀起我國各界“互聯(lián)網(wǎng)+”的熱潮[1]?!盎ヂ?lián)網(wǎng)+”的“+”不是行業(yè)間簡單的疊加,而是互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)的深度融合。在公共服務體系中,互聯(lián)網(wǎng)可以對公共服務資源進行優(yōu)化和集成,提高公共服務資源利用率,提升服務過程的互動性?!盎ヂ?lián)網(wǎng)+”與公共服務業(yè)的深度融合將引領公共服務模式創(chuàng)新,形成網(wǎng)絡經(jīng)濟與實體經(jīng)濟協(xié)同互動的發(fā)展新格局。圖書館“互聯(lián)網(wǎng)+”即是傳統(tǒng)圖書館與互聯(lián)網(wǎng)的深度融合,互聯(lián)網(wǎng)的平等、開放、高效、互動、去中心的特點將對圖書館的資源融合、結(jié)構(gòu)變革、服務創(chuàng)新具有重要的引導作用,圖書館應該積極引入“互聯(lián)網(wǎng)+”的理念,才能適應網(wǎng)絡和信息化時代數(shù)據(jù)的爆發(fā),滿足各類用戶不斷發(fā)展的新需求?!盎ヂ?lián)網(wǎng)+”的跨界連接與融合理念對圖書館發(fā)展的推動作用主要體現(xiàn)在三個方面:(1)資源的融合。傳統(tǒng)的圖書館資源以自身館藏資源為主,以合作共享資源為輔,“互聯(lián)網(wǎng)+”環(huán)境下的圖書館可以實現(xiàn)資源的深度融合和跨界聯(lián)合,深度融合是指圖書館依托互聯(lián)網(wǎng)將館藏的跨學科、跨領域數(shù)據(jù)和信息資源進行有效集成,進一步方便用戶檢索獲取,跨界聯(lián)合是指圖書館與商業(yè)、政府、公益、醫(yī)療等機構(gòu)的跨界聯(lián)合,以政策和協(xié)議為基礎,通過數(shù)據(jù)庫的連接來共享數(shù)據(jù)和信息;(2)組織融合。傳統(tǒng)環(huán)境下的圖書館各機構(gòu)之間大多各司其職,聯(lián)系不夠緊密,而圖書館“互聯(lián)網(wǎng)+”將促進圖書館內(nèi)部各機構(gòu)之間的深層融合連接,館長辦公室、采編、技術(shù)、出版、服務等機構(gòu)之間以互聯(lián)網(wǎng)為基礎的技術(shù)融合和組織融合在提高館員工作效率、提升服務質(zhì)量等方面具有重要意義;(3)服務融合。圖書館“互聯(lián)網(wǎng)+”促進圖書館各類服務的融合,如文獻檢索服務和數(shù)據(jù)檢索服務的融合,圖書館以互聯(lián)網(wǎng)為基礎,使用元數(shù)據(jù)制定、統(tǒng)一標識符等技術(shù)將館藏文獻和數(shù)據(jù)進行語義集成,用戶在獲取文獻的同時也可以獲取相關(guān)的科學數(shù)據(jù),服務融合對提升服務質(zhì)量、提升用戶體驗等方面具有重要作用。
2 圖書館科學數(shù)據(jù)服務的發(fā)展困境
數(shù)據(jù)是科研活動的基礎產(chǎn)出,是科學出版的重要內(nèi)容,也是科學研究活動的基本信息資源,類型上包括數(shù)值、事實和文字型數(shù)據(jù)[2]??茖W數(shù)據(jù)服務是以科學數(shù)據(jù)為基礎的服務方式,類型上包括科學數(shù)據(jù)開發(fā)服務、科學數(shù)據(jù)檢索服務、科學數(shù)據(jù)參考咨詢服務、科學數(shù)據(jù)計算服務以及科學數(shù)據(jù)存儲服務等??茖W數(shù)據(jù)服務的內(nèi)容是向用戶提供所需科學數(shù)據(jù),目的是協(xié)助用戶開展科學研究,提高科學數(shù)據(jù)的利用率。科學數(shù)據(jù)服務是一種跨界服務、動態(tài)服務、嵌入服務,既能滿足用戶需求,也符合圖書館等圖書情報機構(gòu)自身發(fā)展的需要,是圖書館一項重要的新興服務。但是,隨著大數(shù)據(jù)時代的來臨,在數(shù)據(jù)密集型科研范式所帶來的海量科學數(shù)據(jù)的沖擊下,圖書館科學數(shù)據(jù)服務面臨著困境:(1)數(shù)據(jù)資源匱乏。在圖書館館藏資源中,文獻資源仍然占主導地位,數(shù)據(jù)資源的缺乏有很多原因,一是圖書館傳統(tǒng)信息中心的地位被削弱,科研機構(gòu)逐漸建立自己的數(shù)據(jù)倉儲,不再以圖書館作為數(shù)據(jù)存儲中心[3];二是科研人員上傳意愿不足,數(shù)據(jù)是科研人員和科研機構(gòu)的重要戰(zhàn)略資源,具有高價值,數(shù)據(jù)上傳后的安全問題、版權(quán)問題都是阻礙科研人員上傳科學數(shù)據(jù)的重要因素[4];(2)缺乏硬件基礎設施。在大數(shù)據(jù)時代,科學數(shù)據(jù)正在呈現(xiàn)爆發(fā)式增長,原始科學數(shù)據(jù)集的采集、傳輸、計算和存儲需要強大的計算中心、高通量網(wǎng)絡傳輸設備、大型云存儲中心的支持[5]。圖書館作為科研服務機構(gòu),理應向科研團隊提供科學大數(shù)據(jù)集的計算和存儲服務,但無論是建設大型計算中心、云存儲中心還是高通量網(wǎng)絡傳輸設施都需要大量資金的支持,這無疑是圖書館數(shù)據(jù)服務所面臨的困境[7];(3)數(shù)據(jù)長期保存面臨挑戰(zhàn)[8-10]。科學數(shù)據(jù)的長期保存對于科學數(shù)據(jù)的復用、深度挖掘以實現(xiàn)科研創(chuàng)新具有重要意義。現(xiàn)在,科學大數(shù)據(jù)呈指數(shù)型增長,大量半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的存儲給圖書館帶來了挑戰(zhàn),數(shù)據(jù)的長期保存難題主要包括兩個方面:一是數(shù)據(jù)篩選難題,并不是所有的科學數(shù)據(jù)都值得長期保存,如何依托強大的硬件設施和合理的軟件工具對科學數(shù)據(jù)進行有效篩選,是圖書館亟待解決的問題;二是數(shù)據(jù)組織難題,多學科跨領域數(shù)據(jù)繁雜,圖書館缺乏領域?qū)<襾碛行Ч芾砗徒M織科學數(shù)據(jù);(4)數(shù)據(jù)互操作性不足[11]?,F(xiàn)有的圖書館科學數(shù)據(jù)缺乏互操作性,一是因為數(shù)據(jù)間的關(guān)聯(lián)不足,現(xiàn)有圖書館的科學數(shù)據(jù)集大多獨立存儲,數(shù)據(jù)與數(shù)據(jù)之間、數(shù)據(jù)與文獻之間缺乏語義關(guān)聯(lián)。數(shù)據(jù)互操作性的缺失會影響用戶體驗,用戶在訪問某一科學數(shù)據(jù)集的同時難以依據(jù)語義關(guān)系轉(zhuǎn)向另一相關(guān)數(shù)據(jù)集,同時也不利于圖書館數(shù)據(jù)資源整合,阻礙圖書館的數(shù)據(jù)服務發(fā)展;二是由于缺乏統(tǒng)一的數(shù)據(jù)標準,數(shù)據(jù)間的格式不統(tǒng)一會阻礙科研進程,不同的數(shù)據(jù)分析軟件對輸入數(shù)據(jù)的格式有著不同的要求,當科學數(shù)據(jù)的格式不能作為數(shù)據(jù)分析軟件的輸入格式,科研工作流的效率就會減緩;三是互操作協(xié)議問題,跨機構(gòu)的科學數(shù)據(jù)互操作需要合理的協(xié)議來保障,制定數(shù)據(jù)互操作協(xié)議有利于保護數(shù)據(jù)安全和維護各方權(quán)益,對促進跨機構(gòu)科學數(shù)據(jù)交流良性發(fā)展起重要作用;(5)服務對象具有局限性[12]。現(xiàn)有的圖書館科學數(shù)據(jù)服務主要對象是科研工作者,服務目的是支持科研創(chuàng)新。但隨著移動互聯(lián)網(wǎng)的發(fā)展,開放存取理念的普及,高校圖書館的服務對象不應局限于科研工作者,而應同時向普通民眾開放,如將科學數(shù)據(jù)可視化之后向兒童展示以促進科學啟蒙教育,這在提升科學數(shù)據(jù)價值,加深科學研究項目的意義,發(fā)展惠民服務等方面具有重要意義;(6)服務缺乏協(xié)作性[13]。現(xiàn)有的圖書館科學數(shù)據(jù)服務缺乏協(xié)作性,多為獨自向用戶提供服務。如果用戶提出的服務需求不能被滿足,圖書館大多會轉(zhuǎn)向拒絕服務而非尋求機構(gòu)協(xié)作來滿足用戶需求。隨著數(shù)據(jù)密集型科研范式的到來,科學數(shù)據(jù)量的不斷增長,圖書館無法獨自擁有所有的科學數(shù)據(jù)資源,在數(shù)據(jù)資源、硬件資源、平臺技術(shù)方面轉(zhuǎn)向機構(gòu)協(xié)作是必然的發(fā)展趨勢,如圖書館與圖書館之間的協(xié)作、圖書館與科研機構(gòu)的協(xié)作、圖書館與商業(yè)機構(gòu)的協(xié)作、圖書館與政府機構(gòu)的協(xié)作等。
3 “互聯(lián)網(wǎng)+”視角下的圖書館科學數(shù)據(jù)服務
本文將在“互聯(lián)網(wǎng)+”的視角下針對現(xiàn)有科學數(shù)據(jù)服務發(fā)展困境探討圖書館科學數(shù)據(jù)服務的發(fā)展趨勢,包括基于數(shù)據(jù)資源融合的科學數(shù)據(jù)開發(fā)服務、引入數(shù)據(jù)關(guān)聯(lián)技術(shù)的科學數(shù)據(jù)語義檢索服務、基于機構(gòu)合作的分布式科學數(shù)據(jù)存儲服務、依靠基礎設施融合的科學數(shù)據(jù)分析服務、面向科研創(chuàng)新的科學數(shù)據(jù)參考咨詢服務、科學數(shù)據(jù)開放存取平臺服務以及基于情景感知與融合的個性化科學數(shù)據(jù)服務(見圖1)。
3.1 基于數(shù)據(jù)資源融合的科學數(shù)據(jù)開發(fā)服務
科學數(shù)據(jù)資源的融合對于改善圖書館科學數(shù)據(jù)資源匱乏的難題具有重要意義。圖書館科學數(shù)據(jù)開發(fā)服務是指圖書館對其自身擁有的科學數(shù)據(jù)和其他合作科研機構(gòu)的科學數(shù)據(jù)進行統(tǒng)一收集和整理,通過構(gòu)建科學數(shù)據(jù)共享平臺向用戶提供服務的過程[14]。如密歇根大學[15]、加州大學伯克利分校[16]、麻省理工學院[17]等國外高校圖書館對學校內(nèi)各科研機構(gòu)的社會科學數(shù)據(jù)進行收集和整理后通過服務平臺統(tǒng)一提供給用戶,科學數(shù)據(jù)開發(fā)服務在提高科學數(shù)據(jù)利用率,方便科研數(shù)據(jù)獲取,提升科研效率方面具有重要意義?,F(xiàn)在,隨著嵌入式服務和學科化服務的發(fā)展,大數(shù)據(jù)時代所帶來的海量半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)給圖書館科學數(shù)據(jù)開發(fā)帶來了巨大的挑戰(zhàn),如何對海量科學數(shù)據(jù)進行有效的組織是圖書館面臨的難題。不同于傳統(tǒng)圖書館科學數(shù)據(jù)開發(fā)服務對各學科、領域和行業(yè)科學數(shù)據(jù)資源的簡單疊加,“互聯(lián)網(wǎng)+”要求圖書館對跨學科、跨領域的科學數(shù)據(jù)進行更深更廣的有機融合,包括兩個方面:一是技術(shù)融合,以網(wǎng)絡硬件和軟件為基礎,通過元數(shù)據(jù)制定等技術(shù)對不同學科間、領域間的科學數(shù)據(jù)進行語義關(guān)聯(lián),更深層次的對科學數(shù)據(jù)資源進行開發(fā);二是組織融合,通過與科研機構(gòu)、政府機構(gòu)、公益機構(gòu)等組織跨界合作,共享數(shù)據(jù),來實現(xiàn)更廣程度上的科學數(shù)據(jù)資源開發(fā)。
3.2 引入數(shù)據(jù)關(guān)聯(lián)技術(shù)的科學數(shù)據(jù)語義檢索服務
數(shù)據(jù)關(guān)聯(lián)技術(shù)可以有效增強數(shù)據(jù)互操作性?,F(xiàn)在,隨著數(shù)據(jù)在科研活動中的地位和重要性與日俱增,科學數(shù)據(jù)檢索服務也逐漸成為圖書館服務的重要項目,是科研人員獲取所需科學數(shù)據(jù)的重要渠道,而基于語義的科學數(shù)據(jù)檢索是發(fā)展趨勢。如大英圖書館使用RDF格式編輯館藏目錄的xml文件,并對外界開放[18];歐洲國家圖書館的European資源門戶通過關(guān)聯(lián)數(shù)據(jù)試點的形式對文本、圖像、視頻和音頻進行關(guān)聯(lián)并向用戶提供開放檢索服務[19]。另外,德國歐洲分子生物學實驗室開發(fā)了科學術(shù)語全自動化標注Reflect[20]瀏覽器插件,可以對學術(shù)文獻中的基因、分子、蛋白質(zhì)等術(shù)語進行語義標注,并外鏈至相關(guān)的基因、分子和蛋白質(zhì)數(shù)據(jù)庫。然而,國內(nèi)圖書館在科學數(shù)據(jù)檢索服務方面仍然存在一些難題:一是科學數(shù)據(jù)資源有限,圖書館可供檢索的數(shù)據(jù)資源以自身館藏為主,缺乏與其他科研機構(gòu)的連接;二是檢索技術(shù)有限,可供檢索的科學數(shù)據(jù)往往是獨立的,缺乏數(shù)據(jù)集之間、數(shù)據(jù)庫之間的映射和連接?!盎ヂ?lián)網(wǎng)+”的理念提供了有效的解決方案,在科學數(shù)據(jù)檢索資源方面,圖書館與其他科研機構(gòu)、政府機構(gòu)、商業(yè)機構(gòu)、公益機構(gòu)等的跨界合作可以使圖書館脫離依靠自身館藏數(shù)據(jù)提供檢索的局面,在檢索技術(shù)方面,元數(shù)據(jù)描述、數(shù)字對象唯一標識符等數(shù)據(jù)關(guān)聯(lián)技術(shù)可以實現(xiàn)科學數(shù)據(jù)與數(shù)據(jù)、數(shù)據(jù)與文獻之間的連接,圖書館使用SPARQL語言可以實現(xiàn)跨領域間的科學數(shù)據(jù)語義檢索,URI標識的唯一性也可辨識不同領域的同一事物。
3.3 基于機構(gòu)合作的分布式科學數(shù)據(jù)存儲服務
基于機構(gòu)合作的分布式科學數(shù)據(jù)存儲服務為現(xiàn)有圖書館所面臨的缺乏硬件基礎設施、數(shù)據(jù)長期保存等難題提供了解決方案。傳統(tǒng)意義上的圖書館科學數(shù)據(jù)存儲服務即是建立科學數(shù)據(jù)倉儲,為科研用戶提供科學數(shù)據(jù)保存服務??茖W數(shù)據(jù)存儲服務可以實現(xiàn)科學數(shù)據(jù)的共享和復用,對于科學發(fā)現(xiàn)和創(chuàng)新具有重要意義,也是國內(nèi)外各圖書館的重要服務內(nèi)容。如普渡大學圖書館則是使用科學數(shù)據(jù)管理服務平臺對各領域的科學數(shù)據(jù)進行統(tǒng)一收集和保存[21];康奈爾大學圖書館與華盛頓大學合作建立了Datastar[22]數(shù)據(jù)存儲庫,科研用戶可以選擇上傳自己的科研數(shù)據(jù),該庫試圖收集、分析和比較科研用戶的數(shù)據(jù)偏好,致力于建設一個基于語義技術(shù)的開放共享數(shù)據(jù)平臺。在傳統(tǒng)互聯(lián)網(wǎng)環(huán)境下,圖書館科學數(shù)據(jù)存儲以館內(nèi)自建數(shù)據(jù)庫和院系共建數(shù)據(jù)庫為主,主要服務對象是校內(nèi)科研人員。但隨著數(shù)據(jù)密集型科學研究范式的興起,海量原始科學數(shù)據(jù)的爆發(fā)式增長給圖書館帶來了巨大的數(shù)據(jù)存儲壓力,圖書館無法獨自應對昂貴的硬件設備,數(shù)據(jù)的組織、維護、安全等難題?!盎ヂ?lián)網(wǎng)+”視角下的圖書館科學數(shù)據(jù)存儲形式將是以機構(gòu)合作為基礎的分布式存儲。首先,以機構(gòu)合作為基礎的分布式存儲可以分擔數(shù)據(jù)存儲硬件設備的開銷,也可減輕數(shù)據(jù)組織、維護的壓力;其次,基于機構(gòu)合作的分布式科學數(shù)據(jù)存儲方案可以深化圖書館與其他科研機構(gòu)、政府等機構(gòu)、公益機構(gòu)和商業(yè)機構(gòu)等的合作關(guān)系,將科學數(shù)據(jù)服務對象擴大至更多非科研用戶,增加服務受眾,擴大服務范圍,進一步實現(xiàn)“互聯(lián)網(wǎng)+”普惠服務;最后,各類跨界機構(gòu)所擁有的領域?qū)<铱梢詫Ω髯灶I域內(nèi)科學數(shù)據(jù)集進行高效地組織和監(jiān)護,有利于多領域科學數(shù)據(jù)的長期保存。
3.4 依靠基礎設施融合的科學數(shù)據(jù)分析服務
基礎設施融合可以解決現(xiàn)有圖書館科學數(shù)據(jù)服務缺乏硬件基礎設施的難題。幾乎所有的科學研究實驗室都需要通過分析處理數(shù)據(jù)來得到科研成果??茖W數(shù)據(jù)的分析服務是科研工作者的重要需求之一。圖書館科學數(shù)據(jù)的分析服務是指圖書館向科研用戶提供科學數(shù)據(jù)的計算、統(tǒng)計等服務,需要一定的軟件工具和硬件設施為基礎。服務內(nèi)容包括數(shù)據(jù)抽取、關(guān)聯(lián)分析、聚類分析、可視化分析、統(tǒng)計分析等[23]。如哈佛大學和麻省理工學院建立了聯(lián)合數(shù)據(jù)中心Harvard-MIT Data Center,向校內(nèi)科研工作者提供數(shù)據(jù)計算和分析服務,包括硬件基礎設施服務和軟件服務等[24]。隨著科學研究進入數(shù)據(jù)密集型時代,多個領域的科學正在從衛(wèi)星、電話、高通設備、傳感器等數(shù)據(jù)采集設施獲取海量科學數(shù)據(jù),這些原始科學數(shù)據(jù)必須通過計算和分析來實現(xiàn)其價值,科研工作者需要可支持大型數(shù)據(jù)集分析的高性能計算中心來計算和處理科學數(shù)據(jù)。現(xiàn)有互聯(lián)網(wǎng)環(huán)境下的圖書館無力獨自建設高性能計算中心來支持海量科學數(shù)據(jù)的分析服務,而“互聯(lián)網(wǎng)+”視角下的圖書館科學數(shù)據(jù)分析服務可以通過基礎設施融合來解決這個難題,一方面,圖書館通過與其他科研、商業(yè)、政府等機構(gòu)的合作,簽訂硬件設備共享協(xié)議來建立更為強大的計算中心,為科研活動帶來足夠的計算能力;另一方面,圖書館可根據(jù)科研用戶的需求收集、購買、自主開發(fā)科學數(shù)據(jù)分析軟件,然后將學科內(nèi)、跨學科的數(shù)據(jù)分析軟件關(guān)聯(lián)起來,實現(xiàn)科研軟件的融合,按照科研活動的生命周期推薦給科研用戶。
3.4 面向科研創(chuàng)新的嵌入式科學數(shù)據(jù)管理咨詢服務
“互聯(lián)網(wǎng)+”的跨界融合理念可以增強圖書館科學數(shù)據(jù)咨詢服務的協(xié)同性。圖書館科學數(shù)據(jù)參考咨詢服務即是圖書館組建科學數(shù)據(jù)參考咨詢團隊通過非正式科學交流方式嵌入到科研項目數(shù)據(jù)的規(guī)劃、采集、計算、存檔、發(fā)布和長期保存一系列流程中,幫助用戶解決各種科學數(shù)據(jù)相關(guān)的問題,以支持科研創(chuàng)新。服務內(nèi)容主要包括制定數(shù)據(jù)管理規(guī)劃、數(shù)據(jù)發(fā)現(xiàn)與檢索咨詢、數(shù)據(jù)安全及版權(quán)咨詢、數(shù)據(jù)分析軟件開發(fā)、數(shù)據(jù)出版、數(shù)據(jù)政策咨詢等。圖書館科學數(shù)據(jù)參考咨詢服務是推動科研創(chuàng)新的重要服務內(nèi)容,國外開設科學數(shù)據(jù)參考咨詢服務的高校圖書館較為先進,并已建立專門的服務網(wǎng)頁,有步驟有計劃地引導科研人員在科研活動中進行科學數(shù)據(jù)管理,麻省理工學院圖書館社會科學數(shù)據(jù)中心[17]在網(wǎng)站首頁右側(cè)列出了數(shù)據(jù)管理服務專家的姓名、肖像照、聯(lián)系方式,用戶可直接點擊“How can I help you”來獲取咨詢服務;耶魯大學[25]、澳大利亞昆士蘭大學[26]使用Lib Guides系統(tǒng)來引導用戶制定數(shù)據(jù)管理計劃、數(shù)據(jù)需求和共享等數(shù)據(jù)管理問題。國內(nèi)圖書館在此項服務上并不完善,多數(shù)圖書館僅在網(wǎng)站上公布了館員的電子郵件或其他聯(lián)系方式,需要用戶主動聯(lián)系咨詢,在與用戶交互方面存在不足?!秶鴦赵宏P(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導意見》中指出:互聯(lián)網(wǎng)應與公共服務領域深入融合和創(chuàng)新發(fā)展,創(chuàng)新網(wǎng)絡化公共服務模式,大幅提升公共服務能力[1]。國內(nèi)圖書館的科學數(shù)據(jù)參考咨詢服務應重視“互聯(lián)網(wǎng)+”指導思想,大力發(fā)展參考咨詢服務創(chuàng)新,實現(xiàn)服務思想創(chuàng)新、服務體系創(chuàng)新和服務內(nèi)容創(chuàng)新:(1)在服務思想創(chuàng)新方面,圖書館應將傳統(tǒng)被動服務思想積極轉(zhuǎn)換為主動服務思想,將傳統(tǒng)獨立服務思想轉(zhuǎn)換為協(xié)作服務思想;(2)在服務體系創(chuàng)新方面,圖書館應以互聯(lián)網(wǎng)為基礎,一方面,通過開發(fā)科學交流軟件、建立服務社區(qū)等方式加深圖書館館員、領域?qū)<?、?shù)據(jù)專家等與科研用戶的融合連接,全面了解科研用戶在科研活動各個階段的不同數(shù)據(jù)需求,并針對性的提供數(shù)據(jù)服務;另一方面,圖書館應重視機構(gòu)間協(xié)作服務,積極發(fā)展與其他圖書館、科研、政府和商業(yè)機構(gòu)的深度合作,為科研用戶提供更全面的服務資源;(3)在服務內(nèi)容創(chuàng)新方面,增加數(shù)據(jù)引用服務、數(shù)據(jù)關(guān)聯(lián)服務等創(chuàng)新服務內(nèi)容。
3.5 科學數(shù)據(jù)開放存取平臺服務
開放存取OA是一種學術(shù)信息免費共享的理念與出版機制,是指允許用戶不受經(jīng)濟、法律和技術(shù)的限制免費獲取公共網(wǎng)絡上的論文以進行閱讀、下載、復制、打印和搜索等[27]。《柏林宣言》指出開放存取的內(nèi)容不僅包括原始的科學研究成果,也包括原始的科學數(shù)據(jù)??茖W數(shù)據(jù)的開放存取在加速科研進程、擴大科學數(shù)據(jù)影響、提高科研效率、縮短科研數(shù)據(jù)出版時間、提高數(shù)據(jù)引用速度和引用率、提高科學交流效率等方面具有重要意義。國內(nèi)科學數(shù)據(jù)開放平臺如中國地質(zhì)科學院數(shù)據(jù)網(wǎng)[28],集成了中國地質(zhì)科學院50年來積累的地質(zhì)科學數(shù)據(jù)資源,向外界提供基礎地質(zhì)科學數(shù)據(jù)的開放獲取服務。國外開放科學數(shù)據(jù)共享平臺如PubMed Central[29]、美國國家醫(yī)學圖書館平臺NLM[30]提供生命科學和醫(yī)學科學文獻和科學數(shù)據(jù)的開放獲取??茖W數(shù)據(jù)的開放存取依托平臺而實現(xiàn),作為多學科科研信息資源的集中地,在“互聯(lián)網(wǎng)+”的視角下,圖書館建設科學數(shù)據(jù)開放共享平臺具有必要性:一是加強跨界融合,與政府、企業(yè)、科研機構(gòu)等深度合作,以實現(xiàn)更多科學數(shù)據(jù)資源的開放;二是提供科學數(shù)據(jù)的提交、審核、專家評議、出版、發(fā)布和交流等服務,以滿足科研用戶對科學數(shù)據(jù)的各種需求;三是關(guān)系結(jié)構(gòu)重組,實現(xiàn)服務創(chuàng)新,在科學數(shù)據(jù)開放存取平臺上,每位科研用戶不僅是服務獲得者,也同時是服務提供者,關(guān)系結(jié)構(gòu)的重組有利于科學數(shù)據(jù)交流生態(tài)環(huán)境的良性發(fā)展。
3.6 基于情景感知與融合的個性化科學數(shù)據(jù)服務
情景感知融合技術(shù)和個性化服務理念在實現(xiàn)圖書館民主化數(shù)據(jù)訪問,增加科學數(shù)據(jù)服務受眾方面具有重要作用。在“互聯(lián)網(wǎng)+”環(huán)境下,個人是連接融合的最小細胞,萬物互聯(lián)和信息爆炸不會把個人淹沒,反而會帶來個人的凸顯,每個人的個性將更容易識別,移動設備如智能手機、平板電腦的普及使得個人的地理位置、情景需求、行為趨向等數(shù)據(jù)更容易被采集和感知。圖書館應以互聯(lián)網(wǎng)為基礎,采集和融合每個用戶各類情景數(shù)據(jù),快速理解和相應用戶需求,實現(xiàn)人與人、人與物、人與服務、人與場景的連接,構(gòu)建基于情景感知與融合的個性化科學數(shù)據(jù)服務?!盎ヂ?lián)網(wǎng)+”視角下的圖書館服務是以人為本的普惠服務,圖書館科學數(shù)據(jù)服務的對象不僅僅是科研工作者,還包括普通民眾,民主化的數(shù)據(jù)訪問是“互聯(lián)網(wǎng)+”圖書館科學數(shù)據(jù)服務的特征,體現(xiàn)了“互聯(lián)網(wǎng)+”人人受益的思想。如微軟全球望遠鏡WWT,任何人都可以通過轉(zhuǎn)動鏡頭和縮放來觀察浩瀚的宇宙,開始自己的太空旅行,還可以在感興趣的位置獲取相關(guān)論文[31]。
4 需要注意的兩個問題
4.1 個人隱私保障和數(shù)據(jù)安全問題
“互聯(lián)網(wǎng)+”與圖書館的融合為現(xiàn)有圖書館科學數(shù)據(jù)服務所面臨的數(shù)據(jù)資源匱乏、數(shù)據(jù)服務缺乏協(xié)調(diào)性、服務受眾局限性等諸多難題提供了解決思路,但個人隱私和數(shù)據(jù)安全問題在“互聯(lián)網(wǎng)+”的影響下被進一步放大,密切的跨界連接、數(shù)據(jù)開放共享會導致個人隱私缺乏保護,數(shù)據(jù)安全問題日益加劇。要在“互聯(lián)網(wǎng)+”環(huán)境下保障個人隱私和數(shù)據(jù)安全,一是要依靠國家政策法規(guī),政府發(fā)布的政策和國家法規(guī)是保障“互聯(lián)網(wǎng)+”環(huán)境下個人隱私和數(shù)據(jù)安全的重要手段,《國務院關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導意見》是政府首次發(fā)布“互聯(lián)網(wǎng)+”相關(guān)文件,其中列出了“互聯(lián)網(wǎng)+”的總體思路、發(fā)展目標和重點行動,顯示出政府將“互聯(lián)網(wǎng)+”列入國家戰(zhàn)略的決心,圖書館應結(jié)合自身需求,積極推動相關(guān)國家政策的發(fā)布和法律法規(guī)的形成;二是要完善數(shù)據(jù)互操作協(xié)議,圖書館以互聯(lián)網(wǎng)為基礎,與科研機構(gòu)、政府機構(gòu)和公益機構(gòu)建立更多連接,實現(xiàn)數(shù)據(jù)共享的同時,應積極開發(fā)與機構(gòu)間的數(shù)據(jù)互操作協(xié)議,完善的數(shù)據(jù)互操作協(xié)議可以統(tǒng)一數(shù)據(jù)操作標準,防止誤操作或惡意操作造成用戶隱私泄露,威脅數(shù)據(jù)安全。
4.2 數(shù)據(jù)版權(quán)問題
科學數(shù)據(jù)的采集、管理、計算、存儲和發(fā)布過程都需要大量資金的支持,其本身具有價值。在當今社會,知識產(chǎn)權(quán)受到特別重視,數(shù)據(jù)版權(quán)發(fā)展雖處于初級階段,但其重要性是不言而喻的。數(shù)據(jù)版權(quán)涉及數(shù)據(jù)資源歸屬、增值、引用等問題。“互聯(lián)網(wǎng)+”以跨界融合、萬物互聯(lián)為根本,機構(gòu)之間的密切交流合作所帶來的數(shù)據(jù)版權(quán)問題愈發(fā)嚴峻。如何有效應對“互聯(lián)網(wǎng)+”時代數(shù)據(jù)版權(quán)問題,健全相關(guān)法律法規(guī)是關(guān)鍵,圖書館應積極推動數(shù)據(jù)相關(guān)法律法規(guī)的制定,嚴格區(qū)分數(shù)據(jù)版權(quán)歸屬、規(guī)范數(shù)據(jù)引用,權(quán)衡各方利益,避免機構(gòu)間糾紛對“互聯(lián)網(wǎng)+”數(shù)據(jù)服務生態(tài)環(huán)境發(fā)展產(chǎn)生不利影響。
5 結(jié)語
“互聯(lián)網(wǎng)+”理念的提出為社會經(jīng)濟、文化和服務的創(chuàng)新發(fā)展提供了理論基礎,融合連接、創(chuàng)新驅(qū)動、結(jié)構(gòu)重組、開放共享和以人為本五個特征對于圖書館科學數(shù)據(jù)的發(fā)展有重要引導作用?!盎ヂ?lián)網(wǎng)+”在解決現(xiàn)有圖書館數(shù)據(jù)服務難題的同時也帶來了諸多挑戰(zhàn),如個人隱私、數(shù)據(jù)安全和數(shù)據(jù)版權(quán)等問題,如何應對新的挑戰(zhàn)是圖書館科學數(shù)據(jù)服務接下來需要考慮的問題。
參考文獻:
[1] 中國政府網(wǎng).關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導意見[EB/OL].[2016-05-16].http://www.gov.cn/zhengce/content/2015-07/04/content_10002.htm.
[2] 張曉林.顛覆數(shù)字圖書館的大趨勢[J].中國圖書館學報,2011(9):4-12.
[3] 肖瀟,呂俊生.E-science環(huán)境下國外圖書館科學數(shù)據(jù)服務研究進展[J].圖書情報工作,2012,56(17):53-58.
[4] Borgman,Christine L.The Conundrum of Sharing Research Data[J].Journal of the American Society for Information Science and Technology,2012,63(6):1059-1078.
[5] Vivien Marx.The big challenges of big data[J].Nature,2013(498):255-259.
[6] 肖瀟,呂俊生.圖書館嵌入式學科化科學數(shù)據(jù)服務研究[J].圖書館學研究,2012,56(21):85-89.
[7] Luce R.The role of academic research libraries in the digital data universe[EB/OL].[2016-05-20].https://www-s.cic.net/programs/centerforlibraryinitiatives/Archive/ConferencePresentation/Conference2008/e-ScienceSpeakerPresentations/RickLucePPTpres13May08.pdf.
[8] 余文婷,吳丹.基于數(shù)據(jù)關(guān)聯(lián)的開放科學數(shù)據(jù)長期保存利用研究[J].信息資源管理學報,2014(2):87-92.
[9] Pinfield S,Cox A M,Smith J.Research Data Management and Libraries:Relationships,Activities,Drivers and Influences[J].PLOS ONE,2014(12):1-28.
[10] 徐坤,曹錦丹.高校圖書館參與科學數(shù)據(jù)管理研究[J].圖書館論壇,2014(5):92-98.
[11] Shotton D,Portwin K,Klyne G,et al.Adventures in Semantic Publishing:Exemplar Semantic Enhancements of a Research Article[J].PLOS Comput Biol,2009,5(4):1-17.
[12] 朱彩萍.高校圖書館提供科學數(shù)據(jù)服務的途徑與內(nèi)容[J].圖書與情報,2014(3):97-99.
[13] Cox A M, Pinfield S. Research data management and libraries: Current activities and future priorities[J].Journal of Librarianship and Information Science,2014,46(4):299-316.
[14] 陳建新.科學數(shù)據(jù)服務:圖書館服務的新領域[J].圖書與情報,2013(4):93-95.
[15] NADAC[EB/OL].[2016-05-20].http://www.icpsr.umich.edu/icpsrweb/NADAC/.
[16] UC DATA[EB/OL].[2016-05-20].http://ucdata.berkeley.edu/.
[17] Social Science Data Services[EB/OL].[2016-05-20].http://libguides.mit.edu/ssds.
[18] Collection metadata service in THE BRITISH LIBRARY [EB/OL].[2016-05-20].http://www.bl.uk/bibliographic/download.html#basicbnb.
[19] Linked Open Data Pilot[EB/OL].[2016-05-20].http://www.europeana.eu/.
[20] Reflect[EB/OL].[2016-05-21].http://reflect.ws.
[21] D2C2[EB/OL].[2016-05-26].https://www.lib.purdue.edu/researchdata/.
[22] Datastar[EB/OL].[2016-05-26].http://datastar.mannlib.cornell.edu/.
[23] 洪程.國外科學數(shù)據(jù)服務現(xiàn)狀研究[J].圖書館雜志,2012(10):31-33.
[24] Harvard-MIT Data Center[EB/OL].[2016-05-20].http://projects.iq.harvard.edu/user-services.
[25] Yale University Library[EB/OL].[2016-05-20].http://guides.library.yale.edu/.
[26] UQ Library Guides[EB/OL].[2016-05-20].http://guides.library.uq.edu.au/.
[27] Budapest Open Access Initiative[EB/OL].[2016-05-06].http://www.budapestopenaccessinitiative.org/read.
[28] 中國地質(zhì)科學院數(shù)據(jù)網(wǎng)[EB/OL].[2016-05-22].http://www.geoscience.cn/.
[29] PMC[EB/OL].[2016-05-22].http://www.ncbi.nlm.nih.gov/pmc/.
[30] National Library of Medicine[EB/OL].[2016-05-20].https://www.nlm.nih.gov/.
[31] Tony Hey,Stewart Tansley,Kristin Tolle.The Fourth Paradigm: Data-Intensive Scientific Discovery[M].Microsoft research,redmond,Washington,2009:1-13.
作者簡介:黃鑫(1990-),男,武漢大學信息管理學院博士研究生,研究方向:數(shù)據(jù)密集型科研范式、科學數(shù)據(jù)管理、科學交流;鄧仲華(1957-),男,武漢大學信息管理學院教授,博士生導師,研究方向:知識組織與信息系統(tǒng)。