国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國內外高校圖書館科研數(shù)據管理工具應用現(xiàn)狀調查

2019-08-07 00:55劉昆雄秦順孔鵬
新世紀圖書館 2019年6期
關鍵詞:雙一流高校圖書館

劉昆雄 秦順 孔鵬

摘 要 數(shù)據科學時代,科研數(shù)據管理工具對推動科研工作發(fā)展、增強高校核心競爭力具有重要作用。論文基于DataONE數(shù)據生命周期模型,將科研數(shù)據管理工具分為數(shù)據管理計劃、存儲、分析、標識與引用工具,并對19所“雙一流”和10所世界一流大學圖書館科研數(shù)據管理工具應用現(xiàn)狀展開調研。驗證了國內外高校圖書館科研數(shù)據管理工具開發(fā)應用具有片面性與完整性的巨大偏離、個性化與標準化并存、開源成為主要趨勢的特點。據此提出高校圖書館應重視數(shù)據全生命周期的工具開發(fā)與應用,增強自主研發(fā)能力,注重標準化體系建設的措施。

關鍵詞 雙一流? 世界一流大學? 高校圖書館? 科研數(shù)據管理工具

分類號 G321

DOI 10.16810/j.cnki.1672-514X.2019.06.013

Abstract In the era of data science, scientific research data management tools play an important role in promoting the development of scientific research and enhancing the core competitiveness of university. Based on the DataONE data life cycle model, the research data management tools are divided into data management planning, storage, analysis, identification and reference tools. Then it investigates the application of scientific research data management tools in 19 “Double First-class” and 10 World-class? university libraries. It is proved that the development and application of scientific research data management tools in university libraries at China and abroad have following characteristics: the huge deviation of one-sided and integrality, the coexistence of individualization and standardization, and the open source as the main trend of the development and application of the research data management tools in university libraries. Accordingly, it puts forward that university library should attach the importance of development and application of data life cycle tools, enhance the independent research and development capability, and pay attention to the construction of standardization system.

Keywords Double first-class. World-class university. University library. Scientific research data management tools.

0 引言

科研數(shù)據是科學數(shù)據的重要組成部分,同時也是推進科技創(chuàng)新的戰(zhàn)略資源。為加強和規(guī)范科學數(shù)據管理,保障科學數(shù)據安全,提高開放共享水平,更好地支撐國家科技創(chuàng)新、經濟社會發(fā)展和國家安全,我國于2018年3月17日公開發(fā)布實施《科學數(shù)據管理辦法》[1]。其中,提出通過科學數(shù)據網絡管理與共享利用平臺的建設,推動科學數(shù)據采集、匯交、保存和共享利用,實現(xiàn)科學數(shù)據的最大化價值。目前,我國已建成系列科學數(shù)據管理與共享平臺,但高校圖書館對科研數(shù)據管理工具[2]的應用關注仍在起步階段?;诖?,本文擬以部分“雙一流”[3]和世界一流大學圖書館[4]為例,選取國內19所高校和世界排名前10的大學為調查對象,自2018年5月23日至2018年7月15日進入每所高校圖書館的科研支持頁面,從數(shù)據管理計劃工具、數(shù)據存儲工具、數(shù)據分析工具、數(shù)據標識與引用工具4個方面,統(tǒng)計國內外高校圖書館科研數(shù)據管理工具的應用情況,并對國內外應用現(xiàn)狀進行對比分析,探尋高校圖書館科研數(shù)據管理工具建設與應用的特點,提出我國高校圖書館優(yōu)化科研數(shù)據管理工具應用的相關策略。

1 國內外高校圖書館科研數(shù)據管理工具應用現(xiàn)狀

科研數(shù)據管理工具是實施科研數(shù)據管理的工具、平臺或系統(tǒng)的總稱。數(shù)字化科研(E-Research)環(huán)境下,科研數(shù)據管理工具成為輔助開展科研數(shù)據管理的重要基礎和保障[2]。經調查發(fā)現(xiàn),國內高校圖書館科研數(shù)據管理工具建設與應用處于起步階段。如表1所示,19所“雙一流”建設高校圖書館中有4所建立了科學數(shù)據共享平臺,以采用開源軟件二次研發(fā)、合作研發(fā)為主要途徑。北京大學圖書館走自主研發(fā)路線,建立學科開放數(shù)據導航,并采用GIS地理信息系統(tǒng)進行地理信息數(shù)據采集與共享。此外,中國人民大學圖書館等17所高校館采用Thomson Scientific開發(fā)的學科數(shù)據統(tǒng)計分析工具ESI(Essential? Science Indicators)進行學科態(tài)勢追蹤、學科競爭力分析,助力高??蒲邪l(fā)展和建設一流學科。

2 國內外高校圖書館科研數(shù)據管理工具功能分析

基于DataONE數(shù)據生命周期模型[5],對科研數(shù)據管理計劃、存儲、分析、標識與引用4個類型的工具進行分類調查并揭示其具體功能。國內外高校圖書館的科研數(shù)據管理工具及其主要功能主要有以下幾個方面。

2.1 數(shù)據管理計劃工具

數(shù)據管理計劃(Data Management Plan,DMP)是概要介紹研究過程及研究項目完成后數(shù)據處理方式的正式文件[6],數(shù)據管理計劃工具即是為輔助制定數(shù)據管理計劃的工具。在調查的10所世界一流大學圖書館中,DMPtool、DMPonline和UKDS應用較多,其中又以DMPtool應用最為普遍(見表3)。

(1)DMPTool由加利福尼亞大學數(shù)字圖書館開發(fā),該工具創(chuàng)建數(shù)據管理計劃分為三個部分:計劃概述、計劃細節(jié)、計劃預覽[7]。目前共計有235個機構,30 555個用戶使用,發(fā)布了27 087個計劃[8]。此外,還發(fā)布了5個參考模板以供科研人員參考使用:包括數(shù)字策展中心(Digital Curation Centre)、生物科學(NSF-BIO)、社會行為經濟科學(NSF-SBE)、國家糧食和農業(yè)研究所(USDA-NIFA)和通用(NIH-GEN)。美國高校圖書館多使用DMPtool提供數(shù)據管理計劃服務。

(2)DMPonline由數(shù)字管理中心(DCC)提供。目前共計有89個國家,203個組織,17 622為用戶使用,共計發(fā)布了23 083個計劃[9]。DMPonline提供定制的指導和示例,幫助研究人員編寫數(shù)據管理計劃。

(3)UKDS(UK Data Service)由ESRC資助開發(fā),提供超過6000個用于研究和教學目的的數(shù)據集,并提供數(shù)據管理計劃服務。英國的劍橋大學圖書館、牛津大學圖書館應用了DMPonline和UKDS開展數(shù)據管理計劃服務。

2.2 數(shù)據存儲工具

數(shù)據存儲是數(shù)據開發(fā)利用的前提。在諸多的數(shù)據存儲工具應用中,其中ICPSR、GIS、Dspace、Dataverse為英美等國世界一流高校應用較為多的數(shù)據存儲工具(系統(tǒng)或平臺),其主要功能見表4。而Dspace、Dataverse作為開源軟件,被我國武漢大學、同濟大學、復旦大學3所高校圖書館選擇使用,合作或自主二次開發(fā)了系列科學數(shù)據管理與共享平臺。

(1)ICPSR(Inter-University Consortium for Political and Social Research,國際大學政治和社會研究聯(lián)合會) 搭建了ICPSR data平臺,致力于為社會科學研究界提供數(shù)據存儲和訪問,涉及10 000多項研究,5 000 000個變量,72 000種出版物,服務于全球776個成員機構[10]。

(2)GIS(Geographic Information System,地理信息系統(tǒng))的開發(fā)應用具有戰(zhàn)略意義,受到國外各大高校的重視,在調研的29所國內外高校圖書館中,有8所參與了GIS的開發(fā)應用。GIS最早于Roger Tomlinson[11]的“A Geographic Information System for Regional Planning”一文中被提及,發(fā)展至今已涉及地理信息數(shù)據獲取、存儲、挖掘與分析等多個層次。北京大學圖書館提供GIS數(shù)據服務,構建了中國歷史地名數(shù)據庫、中國歷史地理信息系統(tǒng),具體采集內容及服務主要涉及公共領域的GIS空間數(shù)據、現(xiàn)有數(shù)據轉換(如AutoCAD數(shù)據向ArcGIS數(shù)據轉換)、對數(shù)字化衛(wèi)星影像或數(shù)字正射影像(如Google earth)進行矢量化、在掃描紙質地圖或下載電子地圖的圖片文件的基礎上進行矢量化、通過地址或名稱查找XY坐標,利用XY坐標文本文件創(chuàng)建GIS數(shù)據、野外調查(如GPS數(shù)據)[12]。

2.3 數(shù)據分析工具

步入大數(shù)據時代,催生了一門新的學科即數(shù)據科學。海量數(shù)據極富研究價值,需要開發(fā)相關的技術和工具,支撐從數(shù)據采集、數(shù)據管理到數(shù)據分析以及數(shù)據可視化整個數(shù)據處理周期[13]。目前,ESI、R、SPSS、Stata為較為普遍的科研數(shù)據分析工具(見表5)。

(1)R是用于統(tǒng)計分析、繪圖的語言和操作環(huán)境,類似于S(Programming language) 語言和環(huán)境。R提供各種統(tǒng)計(線性和非線性建模,經典統(tǒng)計測試,時間序列分析,分類,聚類……)和圖形技術,并且具有高度可擴展性,擁有類似LaTeX的文檔格式。S語言通常是統(tǒng)計方法研究的首選工具,R則提供參與該活動的開源途徑[14]。

(2)SPSS(IBM SPSS Statistics) 是由IBM公司開發(fā)的統(tǒng)計分析軟件。具體功能有:描述性統(tǒng)計、雙變量統(tǒng)計、數(shù)值結果的預測、識別組的預測(因子分析、聚類分析)、地理空間分析、R擴展(GUI) 等。

(3)Stata功能強大且與SPSS類似,功能涉及數(shù)據管理、時間序列、聚類分析等。Stata為11個學科提供數(shù)據分析預測模型,以公共政策學科為例,提供了因果推斷、固定樣本數(shù)據、多級混合效果模型、結構方程模型(SEM)、線性二元和計數(shù)回歸、生存分析、邊際效應和邊際手段、貝葉斯分析等12種統(tǒng)計分析支持[15]。

2.4 數(shù)據標識與引用工具

3 國內外高校圖書館科研數(shù)據管理工具應用特點

經上述調查分析可以發(fā)現(xiàn),國內外高校圖書館在科研數(shù)據管理工具應用情況上具有以下幾個方面的特點。

3.1 應用的片面性與數(shù)據管理生命周期有巨大偏離

國內高校圖書館科研數(shù)據管理工具建設偏向科研數(shù)據管理與共享,往往服務于學科建設發(fā)展,在諸多領域仍處于開發(fā)和應用空白,具有一定的片面性;國外高校圖書館的科研數(shù)據管理工具建設則涉及科研數(shù)據管理生命全周期(計劃—存儲—分析—標識—引用),具有完整性。

3.2 科研數(shù)據管理工具建設的個性化與標準化并存

10所世界一流高校圖書館皆具有較強的研發(fā)能力,尤其在科研數(shù)據存儲工具、系統(tǒng)和平臺開發(fā)上,多為自主研發(fā)。如MIT和HP Labs聯(lián)合開發(fā)的Dspace為武漢大學、同濟大學認同,展開了二次研發(fā);哥倫比亞大學自主開發(fā)了Academic Commons、CIESIN;國內外8所高校圖書館自主研發(fā)了GIS。此外,科研數(shù)據管理工具應用注重標準化,通過UUID、EZID、DROID等規(guī)范科學數(shù)據引用。

3.3 開源軟件成為開發(fā)與應用的主要趨勢

除了一些商業(yè)性質的科研數(shù)據管理工具,其余多為開源軟件。諸多科研數(shù)據管理工具為基于GitHub平臺和特定語言框架(JAVA、Python等) 開發(fā),GitHub是一個開源開發(fā)平臺,支持托管和審查代碼,管理項目,并與數(shù)百萬其他開發(fā)人員一起構建軟件[17]。

4 對我國高校圖書館科研數(shù)據管理工具應用的啟示

國內“雙一流”大學要向世界一流大學層次靠攏,需要圖書館在助力科研方面作出詳盡規(guī)劃,特別是在科研數(shù)據管理工具建設與應用上積極借鑒國外先進經驗。目前,我國高校圖書館在科研數(shù)據管理工具建設上存在開發(fā)和應用貧弱、不重視完整性、缺乏個性化和標準化等問題。針對國內高校圖書館科研數(shù)據管理工具應用現(xiàn)狀和存在的問題,筆者提出以下建議。

4.1 重視數(shù)據全生命周期工具的開發(fā)與應用

國外科研數(shù)據管理工具開發(fā)和應用基本覆蓋數(shù)據全生命周期,且功能強大,能融入科研工作的全周期之中。工具資源供給應成為國內高校圖書館服務的一大拓展領域。數(shù)據科學時代,科研數(shù)據管理工具的開發(fā)和應用應引起國內高校圖書館的重視,針對科研數(shù)據管理工具開發(fā)應用的片面性問題,需加強科研數(shù)據管理工具開發(fā)應用的戰(zhàn)略規(guī)劃,基于數(shù)據計劃、收集、保證、描述、保存、發(fā)現(xiàn)、集成、分析、標識與引用的生命周期組織和提供科研數(shù)據管理工具相關服務,逐步填補服務空白。

4.2 增強自主研發(fā)能力

我國高校圖書館的自主研發(fā)能力普遍較弱,增強科研數(shù)據管理的自主研發(fā)能力至少需從兩個方面努力:其一是建設一支高精尖研發(fā)隊伍,并予以經費、研發(fā)軟硬件設施支持。隊伍人員可由圖書館技術部門研發(fā)人員、本??蒲谢蚣夹g研發(fā)人員、社會技術人員等組成,研發(fā)隊伍具有優(yōu)質研發(fā)能力和人員構成多元化的特征。其二是樹立開放意識,加強館際、國際合作。以開放的姿態(tài)學習他館經驗同樣是提升自身能力的重要方式,國外科研數(shù)據管理工具開發(fā)多為開源形式,在保持個性化的同時積極吸收了前人成果,復旦大學、同濟大學等高校圖書館極具開放意識,開展了館際、國際合作,值得借鑒。

4.3 注重標準化體系建設

數(shù)據組織存儲、共享交換、分析處理、標識與引用皆以標準化為運行條件,我國科技部、財政部先后在基礎科學、農業(yè)、林業(yè)、海洋、氣象、地震、地球系統(tǒng)科學、人口與健康8個領域支持建成了國家科技資源共享服務平臺[18],編寫了科學數(shù)據元數(shù)據標準、數(shù)據匯交管理辦法、數(shù)據共享技術標準與規(guī)范、科學數(shù)據引用規(guī)范等標準化文檔支撐科學數(shù)據管理與共享。為構建有序的科學數(shù)據使用環(huán)境,2017年12月29日國家質量監(jiān)督檢驗檢疫總局、國家標準化管理委員會發(fā)布了《GB/T 35294—2017信息技術 科學數(shù)據引用》[19]的國家標準,通過“通用科學數(shù)據引用格式”和“基于OID的科學數(shù)據引用方式”規(guī)范科學數(shù)據引用。高校圖書館在科研數(shù)據管理工具建設與應用過程中,應推動標準化體系建設,規(guī)范個性化開發(fā),實現(xiàn)有序的科研數(shù)據開發(fā)利用。

參考文獻:

國務院辦公廳.關于印發(fā)科學數(shù)據管理辦法的通知[EB/OL].[2018-05-20].http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.

馬建玲,曹月珍.研究數(shù)據管理工具發(fā)展研究[J].圖書館學研究,2014(15):40-47.

教育部,財政部,國家發(fā)展改革委.關于公布世界一流大學和一流學科建設高校及建設學科名單的通知[EB/OL].[2018-05-23].http://www.moe.gov.cn/srcsite/A22/moe_843/201709/t20170921_314942.html.

Shanghai Ranking Consultancy. Academic ranking of world universities 2017[EB/OL].[2018-05-23].http://www.shanghairanking.com/ARWU2017.html.

DataONE. Data life cycle[EB/OL].[2018-07-10].https://www.dataone.org/data-life-cycle.

鄧珞華.圖書情報教學[M].長春:東北師范大學出版社,1983.

王凱,彭潔,屈寶強.國外數(shù)據管理計劃服務工具的對比研究[J].情報雜志,2014,33(12):203-206.

University of California. DMPTool[EB/OL].[2018-07-12].https://dmptool.org/.

DDC. DMPonline[EB/OL].[2018-07-12].https://dmponline.dcc.ac.uk/.

ICPSR. ICPSR data[EB/OL].[2018-07-13].https://www.icpsr.umich.edu/icpsrweb/ICPSR/.

TOMLINSON R F. A geographic information system for regional planning[J].Journal of Geography (Chigaku Zasshi),1969,78(1):45-48.

北京大學.GIS數(shù)據服務[EB/OL].[2018-07-13].http://www.lib.pku.edu.cn/portal/cn/fw/sjfw/gis.

楊京,王效岳,白如江,等.大數(shù)據背景下數(shù)據科學分析工具現(xiàn)狀及發(fā)展趨勢[J].情報理論與實踐,2015,38(3):134-137.

The R Foundation.What is R?[EB/OL].[2018-07-13].https://www.r-project.org/about.html.

StataCorp LLC. Features for public policy analysts[EB/OL].[2018-07-13].https://www.stata.com/disciplines/public-policy/.

MIT Libraries. Citation management and writing tools:Citation management tools[EB/OL].[2018-07-13].https://libguides.mit.edu/cite-write/citetools.

GitHub, Inc. Built for developers[EB/OL].[2018-07-14].https://github.com/.

馮華.科學數(shù)據,如何科學管理[N].人民日報,2018-04-08(002).

國家質量監(jiān)督檢驗檢疫總局,國家標準化管理委員會.信息技術 科學數(shù)據引用[EB/OL].[2018-07-14].http://c.gb688.cn/bzgk/gb/showGb?type=online&hcno=A495CA355BAF00D962AA8DD84C3B2C16.

猜你喜歡
雙一流高校圖書館
“雙一流”為“青椒”打造更大舞臺
高校圖書館閱讀推廣案例分析
微信公眾平臺在高校圖書館信息服務中的應用研究
高校圖書館閱讀推廣活動研究
試論高校圖書館在網絡環(huán)境沖擊下的人文建設
高校圖書館閱讀推廣實踐探討
高校圖書館電子資源的宣傳與推廣
“雙一流”后,高校改革何處去?
高?!半p一流”能否打破身份制
“雙一流”需 從去行政化做起