張莉婧?張新新
【摘要】 ?數(shù)據(jù)出版是促進(jìn)數(shù)據(jù)共享的有效措施之一。隨著大數(shù)據(jù)科學(xué)范式的興起、數(shù)字出版數(shù)據(jù)化發(fā)展的推動(dòng)以及5G技術(shù)的落地,科學(xué)數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,數(shù)據(jù)共享逐漸成為科學(xué)研究領(lǐng)域的熱點(diǎn)話題,數(shù)據(jù)出版為數(shù)據(jù)共享開辟新路徑。從數(shù)據(jù)出版實(shí)踐經(jīng)驗(yàn)來看,現(xiàn)階段,我國數(shù)據(jù)出版仍處于發(fā)展階段。不同背景下學(xué)者對(duì)數(shù)據(jù)出版的定義理解不同,但已初步形成數(shù)據(jù)出版流程和數(shù)據(jù)出版模式。5G環(huán)境下,數(shù)據(jù)出版面臨的數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)共享以及數(shù)據(jù)引用等問題將得到有效解決,數(shù)據(jù)出版將發(fā)生翻天覆地的變化。
【關(guān) ?鍵 ?詞】數(shù)據(jù)出版;科學(xué)數(shù)據(jù);5G;數(shù)據(jù)共享;云數(shù)據(jù)庫;VR出版
【作者單位】張莉婧,中地?cái)?shù)媒(北京)科技文化有限責(zé)任公司;張新新,武漢大學(xué)信息管理學(xué)院,地質(zhì)出版社。
【中圖分類號(hào)】G230 【文獻(xiàn)標(biāo)識(shí)碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2019.23.001
隨著5G時(shí)代的來臨、大數(shù)據(jù)以及出版業(yè)數(shù)字化轉(zhuǎn)型升級(jí)的迅猛發(fā)展,數(shù)據(jù)共享變得尤為重要,數(shù)據(jù)出版將成為出版界和科學(xué)研究領(lǐng)域日益關(guān)注的熱點(diǎn)問題??茖W(xué)數(shù)據(jù)是信息時(shí)代開發(fā)利用潛力最大的戰(zhàn)略性、基礎(chǔ)性科技資源,已成為解決復(fù)雜科學(xué)問題的關(guān)鍵要素,以及驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)和決策支持的新型基礎(chǔ)設(shè)施[1]。在此背景下,2019年11月8日,國際科學(xué)理事會(huì)數(shù)據(jù)委員會(huì)(CODATA)正式發(fā)布《科研數(shù)據(jù)北京宣言》。宣言依據(jù)公共科研數(shù)據(jù)開展多邊合作的廣泛社會(huì)意義提出十條原則。其中一條原則指出,“全球數(shù)據(jù)同盟與開放數(shù)據(jù)的FAIR(可發(fā)現(xiàn)、可獲取、可互操作、可重用)原則”,F(xiàn)AIR原則作為一套國際化方法,旨在提高科學(xué)數(shù)據(jù)管理、監(jiān)管和出版,以此順應(yīng)我國開放科研數(shù)據(jù)趨勢,而數(shù)據(jù)共享是開放科研數(shù)據(jù)的一種形式。數(shù)據(jù)共享可以將研究成果再現(xiàn)及驗(yàn)證,讓公眾應(yīng)用現(xiàn)有的數(shù)據(jù)提出新的科學(xué)問題,從而不斷提升科學(xué)研究和創(chuàng)新水平。數(shù)據(jù)出版是推動(dòng)數(shù)據(jù)開放、數(shù)據(jù)共享的重要手段和激勵(lì)機(jī)制。
一、研究背景
數(shù)據(jù)作為對(duì)事實(shí)觀察的結(jié)果,貫穿于整個(gè)科學(xué)領(lǐng)域,在科研學(xué)術(shù)活動(dòng)中扮演著不可或缺的角色。數(shù)據(jù)不再僅僅是科學(xué)研究的結(jié)果,正在慢慢轉(zhuǎn)變?yōu)榭茖W(xué)研究的基礎(chǔ)性材料,科學(xué)研究將圍繞數(shù)據(jù)進(jìn)行。數(shù)據(jù)因具有可重復(fù)利用的特性決定了其共享的價(jià)值大大超過了其本身所擁有的科研價(jià)值。隨著互聯(lián)網(wǎng)的快速發(fā)展,大數(shù)據(jù)時(shí)代新科學(xué)范式的興起,受到數(shù)字出版的數(shù)據(jù)化發(fā)展的推動(dòng),科學(xué)數(shù)據(jù)的采集成本正在逐漸降低,各種數(shù)據(jù)的容量正在呈指數(shù)級(jí)增長,數(shù)據(jù)的共享與復(fù)用逐漸成為科學(xué)研究領(lǐng)域的熱點(diǎn)話題。
1.大數(shù)據(jù)時(shí)代新科學(xué)范式的興起
2013年被譽(yù)為大數(shù)據(jù)元年,隨著浙江人民出版社《大數(shù)據(jù)時(shí)代》一書的出版,大數(shù)據(jù)領(lǐng)域掀起了一股出版熱潮,此后,大數(shù)據(jù)一直作為熱門話題滲透各行各業(yè)?!叭绾螌⒋髷?shù)據(jù)的數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)引、數(shù)據(jù)計(jì)算、數(shù)據(jù)建模、數(shù)據(jù)應(yīng)用、數(shù)據(jù)服務(wù)等產(chǎn)業(yè)鏈,與出版業(yè)的編輯、校對(duì)、印制、發(fā)行等流程進(jìn)行無縫銜接,是考究數(shù)字出版智庫水準(zhǔn)的重要標(biāo)尺之一?!盵2]人類科學(xué)研究范式經(jīng)歷了以科學(xué)實(shí)驗(yàn)為主的第一范式——經(jīng)驗(yàn)科學(xué),以理論總結(jié)和理性概括為主的第二范式——理論科學(xué),以仿真和模擬為主的第三范式——計(jì)算科學(xué),現(xiàn)在發(fā)展到以科學(xué)數(shù)據(jù)為主的第四范式,即大數(shù)據(jù)時(shí)代的新科學(xué)范式——數(shù)據(jù)密集型科學(xué)。數(shù)據(jù)密集型科學(xué)的出現(xiàn),意味著數(shù)據(jù)不僅是科學(xué)研究的對(duì)象,還是科學(xué)研究的工具;計(jì)算機(jī)不僅能做模擬仿真,還能進(jìn)行分析歸納,得出理論。數(shù)據(jù)密集型科學(xué)轉(zhuǎn)變了科學(xué)研究方法,研究人員可通過大量的已知數(shù)據(jù)計(jì)算得出之前未知的理論。
大數(shù)據(jù)時(shí)代,新科學(xué)范式的興起導(dǎo)致科學(xué)數(shù)據(jù)在容量上呈爆發(fā)式增長,在結(jié)構(gòu)上更多趨于呈現(xiàn)非結(jié)構(gòu)化和半結(jié)構(gòu)化的復(fù)雜形態(tài),并形成以科學(xué)數(shù)據(jù)為核心的科研過程[3]。數(shù)據(jù)密集型科學(xué)研究已經(jīng)成為科學(xué)研究領(lǐng)域的主導(dǎo)方式,其數(shù)據(jù)量之大、發(fā)展速度之快已經(jīng)超出人們預(yù)想,社會(huì)各界會(huì)越來越重視數(shù)據(jù)的價(jià)值。數(shù)據(jù)共享是數(shù)據(jù)密集型科學(xué)研究的必經(jīng)之路,數(shù)據(jù)出版為完善我國科學(xué)數(shù)據(jù)共享機(jī)制開拓新途徑。
2.數(shù)字出版的數(shù)據(jù)化發(fā)展
數(shù)字出版經(jīng)過多年的發(fā)展,主要經(jīng)歷了數(shù)字化、碎片化以及數(shù)據(jù)化發(fā)展三個(gè)階段,目前正在經(jīng)歷智能化發(fā)展階段。不同的階段催生出不同的數(shù)字出版新業(yè)態(tài),同時(shí)產(chǎn)生典型的數(shù)字出版產(chǎn)品,不同階段之間也存在著交叉發(fā)展。如今,數(shù)字出版是智能化與數(shù)據(jù)化共同發(fā)展階段,數(shù)據(jù)化發(fā)展推動(dòng)智能化發(fā)展的出現(xiàn)。
2013年至今,是數(shù)字出版的數(shù)據(jù)化發(fā)展階段。從數(shù)字出版產(chǎn)業(yè)鏈的角度分析,這一階段的主要特征有以下方面:圍繞知識(shí)體系邏輯,以圖書資源為基礎(chǔ),以移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、語義分析等高新技術(shù)為支撐,以為用戶提供個(gè)性化、定制化、交互式的知識(shí)服務(wù)為新的產(chǎn)品形態(tài),呈現(xiàn)數(shù)據(jù)化出版和智能化出版態(tài)勢。
數(shù)字出版的數(shù)據(jù)化發(fā)展階段,催生了數(shù)據(jù)出版的新業(yè)態(tài)。數(shù)據(jù)出版是指以數(shù)據(jù)作為生產(chǎn)要素,將文字、圖片、音視頻、游戲、動(dòng)漫等都當(dāng)作數(shù)據(jù)的表現(xiàn)形式,其圍繞著數(shù)據(jù)挖掘、采集、標(biāo)引、存儲(chǔ)、計(jì)算開展出版工作,通過數(shù)據(jù)模型的構(gòu)建,最終上升到數(shù)據(jù)應(yīng)用和數(shù)據(jù)服務(wù)的層面[4]。
3.5G技術(shù)的落地
2019年6月6日,工信部頒發(fā)了首張5G牌照,5G開始正式進(jìn)入規(guī)?;逃秒A段。5G通信技術(shù)憑借高速率、泛在網(wǎng)、低功耗、低延時(shí)、高可靠和大容量等特點(diǎn),將加速整個(gè)社會(huì)的智能化發(fā)展,開啟萬物互聯(lián)的智能媒體時(shí)代。毋庸置疑,數(shù)據(jù)出版領(lǐng)域也將發(fā)生巨大變革。5G時(shí)代,計(jì)算機(jī)的性能將更加強(qiáng)大,借助計(jì)算機(jī)對(duì)海量數(shù)據(jù)進(jìn)行計(jì)算和挖掘已成為必然,幫助科研人員發(fā)現(xiàn)隱藏在紛繁數(shù)據(jù)之中的重要關(guān)聯(lián)關(guān)系,成為第四范式數(shù)據(jù)密集型科學(xué)研究的核心問題,而數(shù)據(jù)出版成為解決科學(xué)問題的關(guān)鍵。
隨著5G技術(shù)的落地,一方面,5G技術(shù)將驅(qū)動(dòng)數(shù)據(jù)共享,在科學(xué)研究領(lǐng)域,只要開展科學(xué)研究活動(dòng),都將沒有選擇地被卷入到科學(xué)數(shù)據(jù)的主體隊(duì)伍中。在此背景下,有效調(diào)動(dòng)作為產(chǎn)生科學(xué)數(shù)據(jù)、應(yīng)用科學(xué)數(shù)據(jù)的科研人員的主動(dòng)性、積極性,成為科學(xué)數(shù)據(jù)共享的關(guān)鍵。另一方面,5G技術(shù)將賦能數(shù)據(jù)出版,給數(shù)據(jù)共享帶來便利,優(yōu)化數(shù)據(jù)出版流程,使數(shù)據(jù)存儲(chǔ)、用戶引用更方便。
二、數(shù)據(jù)出版的主要流程和模式
數(shù)據(jù)出版與數(shù)據(jù)共享是相輔相成的關(guān)系,數(shù)據(jù)出版是促進(jìn)數(shù)據(jù)共享的重要手段,數(shù)據(jù)共享是驅(qū)動(dòng)數(shù)據(jù)出版的重要因素。對(duì)數(shù)據(jù)出版的研究最早始于2005年國外學(xué)者對(duì)數(shù)據(jù)共享和出版制度的關(guān)注,早期對(duì)數(shù)據(jù)出版的研究主要聚焦于數(shù)據(jù)出版的價(jià)值分析和實(shí)踐經(jīng)驗(yàn)的介紹。在互聯(lián)網(wǎng)技術(shù)的推動(dòng)下,數(shù)據(jù)出版實(shí)踐逐漸開展。不同實(shí)踐背景下,學(xué)者對(duì)數(shù)據(jù)出版的定義有所不同,在實(shí)踐過程中也總結(jié)了一套完整的數(shù)據(jù)出版流程和數(shù)據(jù)出版模式。此外,出版過程中的各種問題也隨之暴露,如數(shù)據(jù)的存儲(chǔ)問題、服務(wù)問題和引用問題等。
1.數(shù)據(jù)出版的定義
正如吉姆·格雷(Jim Gray)所說:“所有科學(xué)文獻(xiàn)都上網(wǎng),所有科學(xué)數(shù)據(jù)都上網(wǎng),而且它們之間具備可互操作性?!盵5](如圖1)數(shù)據(jù)出版業(yè)也需要將數(shù)據(jù)上傳到互聯(lián)網(wǎng),但并不是簡單地將數(shù)據(jù)上傳,而是需要學(xué)術(shù)出版的流程規(guī)范。雖然數(shù)據(jù)出版的研究已經(jīng)相對(duì)比較成熟,但不同研究背景的學(xué)者對(duì)數(shù)據(jù)出版的定義有著不同的理解。在學(xué)術(shù)界,學(xué)者的共識(shí)是數(shù)據(jù)出版就是與科學(xué)研究產(chǎn)生的數(shù)據(jù)有關(guān)的出版活動(dòng),但是針對(duì)該出版與科研論文出版是否一致,不同的學(xué)者有不同的觀點(diǎn)。劉闖等學(xué)者認(rèn)為,該出版過程與科研論文發(fā)表過程相同,需要經(jīng)過同行專家評(píng)審方可正式出版,出版之后才能對(duì)科學(xué)數(shù)據(jù)成果引用與評(píng)價(jià)[6]。張小強(qiáng)等學(xué)者認(rèn)為,數(shù)據(jù)出版是學(xué)術(shù)界新的出版形式,其出版與科研論文的出版不能完全等同,因?yàn)閿?shù)據(jù)出版的過程中包括對(duì)科研數(shù)據(jù)及有關(guān)的信息進(jìn)行評(píng)議和編輯[7]。還有些學(xué)者認(rèn)為,數(shù)據(jù)出版與論文出版完全不同,是指將科研數(shù)據(jù)通過任何形式上傳到互聯(lián)網(wǎng)并允許其他使用的行為,其出版過程沒有科研論文出版那么正式。數(shù)據(jù)出版的不同定義在國內(nèi)外都有一定的代表性,這從側(cè)面反映了學(xué)界對(duì)數(shù)據(jù)出版概念存在爭議。
筆者認(rèn)為,數(shù)據(jù)出版與科研論文出版既有相同之處也有不同之處。數(shù)據(jù)出版與科研論文的出版過程一樣嚴(yán)格,為了避免出現(xiàn)學(xué)術(shù)不端的行為,保障科學(xué)研究成果的知識(shí)產(chǎn)權(quán),激勵(lì)更多的科學(xué)家參與數(shù)據(jù)出版,二者均需要經(jīng)過嚴(yán)格的審批才可出版。而數(shù)據(jù)出版區(qū)別于科研論文出版主要在于出版模式,數(shù)據(jù)出版模式相對(duì)多樣化,筆者將在下文闡述。
2.數(shù)據(jù)出版的主要流程
簡單來說,數(shù)據(jù)出版是指學(xué)者將科學(xué)研究生產(chǎn)的科學(xué)數(shù)據(jù),按照數(shù)據(jù)出版機(jī)構(gòu)格式要求提交,專家從科學(xué)研究角度對(duì)所提交的數(shù)據(jù)進(jìn)行審議,學(xué)者依據(jù)審議結(jié)果修改之后再次提交數(shù)據(jù),沒有問題之后,出版機(jī)構(gòu)創(chuàng)建標(biāo)準(zhǔn)和永久的數(shù)據(jù)引用信息對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)、發(fā)布,供其他學(xué)者引用。根據(jù)國內(nèi)外的數(shù)據(jù)出版實(shí)踐經(jīng)驗(yàn),數(shù)據(jù)出版主要流程歸結(jié)為以下五個(gè)基本環(huán)節(jié):數(shù)據(jù)生產(chǎn)、數(shù)據(jù)提交、數(shù)據(jù)審核、數(shù)據(jù)發(fā)布及數(shù)據(jù)引用,流程圖見圖2。
詳細(xì)流程說明如下:
(1)數(shù)據(jù)生產(chǎn)。在5G時(shí)代背景下,任何領(lǐng)域的科學(xué)研究均會(huì)產(chǎn)生大量的科研數(shù)據(jù),所以科學(xué)研究的過程就是數(shù)據(jù)生產(chǎn)的過程。數(shù)據(jù)生產(chǎn)的主力軍是科學(xué)研究者,輔以數(shù)據(jù)生產(chǎn)工具和平臺(tái)。
(2)數(shù)據(jù)提交,即學(xué)者將原始數(shù)據(jù)和科研過程產(chǎn)生的數(shù)據(jù),按數(shù)據(jù)出版機(jī)構(gòu)格式要求以數(shù)據(jù)論文或解釋說明的形式上傳。例如,《中國科學(xué)數(shù)據(jù)》期刊要求學(xué)者在提交數(shù)據(jù)時(shí)提交數(shù)據(jù)用途、元數(shù)據(jù)、數(shù)據(jù)文件,要求學(xué)者在提交元數(shù)據(jù)時(shí)提交數(shù)據(jù)集標(biāo)題、數(shù)據(jù)集作者、數(shù)據(jù)集關(guān)鍵詞、數(shù)據(jù)集摘要等基本信息。數(shù)據(jù)文件可以任何文件格式上傳,但只有200MB以內(nèi)的數(shù)據(jù)可直接上傳,否則需要使用FTP上傳。
(3)數(shù)據(jù)審核,又稱同行審議,是數(shù)據(jù)出版的關(guān)鍵步驟。避免出現(xiàn)數(shù)據(jù)造假和學(xué)術(shù)不端的行為是數(shù)據(jù)出版的重要目標(biāo),但數(shù)據(jù)質(zhì)量評(píng)估一直是難以解決的復(fù)雜問題。數(shù)據(jù)質(zhì)量并不是通過專家簡單瀏覽就能確定的,需要通過實(shí)驗(yàn)的檢驗(yàn)和應(yīng)用,所以數(shù)據(jù)審核對(duì)專家的知識(shí)儲(chǔ)備和投入時(shí)間成本要求相對(duì)較高。
(4)數(shù)據(jù)發(fā)布。數(shù)據(jù)審核通過后,數(shù)據(jù)出版機(jī)構(gòu)需要給數(shù)據(jù)賦予永久性的唯一標(biāo)識(shí)符,包括DOI、URL等,并將數(shù)據(jù)公布出版平臺(tái),同時(shí)對(duì)數(shù)據(jù)進(jìn)行永久性存儲(chǔ),最大限度地為其他學(xué)者對(duì)數(shù)據(jù)的引用提供可能。
(5)數(shù)據(jù)引用。數(shù)據(jù)出版的目的是數(shù)據(jù)共享,方便其他研究者對(duì)數(shù)據(jù)的復(fù)用,數(shù)據(jù)引用是數(shù)據(jù)出版的核心目標(biāo)。更多的專著、論文、報(bào)告等形式研究成果以引用的方式引用已發(fā)布的數(shù)據(jù),需要數(shù)據(jù)出版機(jī)構(gòu)、評(píng)審專家以及作者密切合作。
3.數(shù)據(jù)出版的模式
依據(jù)不同的劃分維度,數(shù)據(jù)出版的模式各有不同。本文從數(shù)據(jù)出版機(jī)構(gòu)出發(fā),將數(shù)據(jù)出版模式主要?jiǎng)澐譃閮煞N(見圖3):第一種是數(shù)據(jù)中心出版模式,將科學(xué)數(shù)據(jù)直接提交到數(shù)據(jù)中心;第二種是出版商出版模式,將科學(xué)數(shù)據(jù)以數(shù)據(jù)附屬于論文或論文附屬于數(shù)據(jù)的形式提交到期刊單位。
(1)數(shù)據(jù)中心出版模式。該模式下的數(shù)據(jù)中心是指具有數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)發(fā)布功能的科研機(jī)構(gòu)、大學(xué)或?qū)iT的數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)。數(shù)據(jù)中心的數(shù)據(jù)出版將數(shù)據(jù)和數(shù)據(jù)的描述信息存儲(chǔ)在同一服務(wù)器上,學(xué)者引用時(shí)數(shù)據(jù)與數(shù)據(jù)的描述信息將同步出現(xiàn),方便學(xué)者獲取數(shù)據(jù)。這種出版模式對(duì)數(shù)據(jù)規(guī)范性、數(shù)據(jù)質(zhì)量、數(shù)據(jù)格式、數(shù)據(jù)穩(wěn)定性及數(shù)據(jù)獨(dú)立性要求相對(duì)較高,但各數(shù)據(jù)中心的互操作性較差。比較典型的數(shù)據(jù)中心出版模式是全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng),該系統(tǒng)于2017年榮獲“聯(lián)合國世界信息峰會(huì)獎(jiǎng)”,從2014年6月創(chuàng)辦至今,已有995位作者參與出版,共出版數(shù)據(jù)集656個(gè)、數(shù)據(jù)量258GB。數(shù)據(jù)出版中心出版模式是大部分學(xué)者的選擇。
(2)出版商出版模式,又可稱為期刊出版。該出版模式與傳統(tǒng)論文出版模式類似,主要由期刊出版單位負(fù)責(zé)數(shù)據(jù)質(zhì)量和學(xué)術(shù)質(zhì)量的把控。依據(jù)出版成果可分為數(shù)據(jù)附屬于論文、論文附屬于數(shù)據(jù)兩種形式。這種出版模式對(duì)數(shù)據(jù)規(guī)范性、數(shù)據(jù)質(zhì)量、數(shù)據(jù)格式、數(shù)據(jù)穩(wěn)定性及數(shù)據(jù)獨(dú)立性要求相對(duì)較弱,對(duì)上傳的數(shù)據(jù)容量有一定的限制。典型的期刊單位是《全球變化數(shù)據(jù)學(xué)報(bào)》,該學(xué)報(bào)是在全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)的基礎(chǔ)上于2017年創(chuàng)辦的季刊,截至目前已發(fā)布數(shù)據(jù)論文245篇。出版商出版模式是少部分學(xué)者的選擇。
三、 5G對(duì)數(shù)據(jù)出版的新推動(dòng)
5G構(gòu)建了超寬帶、低延遲、高密度、高可靠、高可信的泛在計(jì)算與通信基礎(chǔ)設(shè)施,形成人、機(jī)、物三元融合的萬物互聯(lián)空間;5G為VR/AR、人工智能等技術(shù)的加速發(fā)展創(chuàng)造了條件,將人們對(duì)互聯(lián)網(wǎng)的體驗(yàn)推向制高點(diǎn),5G的問世和發(fā)展在互聯(lián)網(wǎng)信息時(shí)代是一座重要的里程碑。5G時(shí)代,互聯(lián)網(wǎng)體驗(yàn)會(huì)更加豐富,海量數(shù)據(jù)存儲(chǔ)和智能化處理會(huì)更加便捷。具體到數(shù)據(jù)出版,5G技術(shù)將分別從數(shù)據(jù)庫存儲(chǔ)、數(shù)據(jù)共享及數(shù)據(jù)引用三方面產(chǎn)生新推動(dòng)。
1.云數(shù)據(jù)庫助力數(shù)據(jù)存儲(chǔ)
1G時(shí)代依靠關(guān)系型數(shù)據(jù)庫滿足基本需求,2G時(shí)代開源數(shù)據(jù)庫產(chǎn)品初露鋒芒,3G時(shí)代非關(guān)系型數(shù)據(jù)庫應(yīng)對(duì)數(shù)據(jù)暴增,4G時(shí)代“分布式+關(guān)系型”數(shù)據(jù)庫應(yīng)對(duì)視頻存儲(chǔ)。5G時(shí)代,數(shù)據(jù)洪流隨即涌現(xiàn),人們對(duì)數(shù)據(jù)存儲(chǔ)和分析計(jì)算的需求將不斷提高,隨著云計(jì)算技術(shù)的不斷成熟,大部分應(yīng)用將要部署到云上,云數(shù)據(jù)庫開始崛起。數(shù)據(jù)庫上云是必然趨勢,即云數(shù)據(jù)庫將成為5G時(shí)代數(shù)據(jù)存儲(chǔ)的關(guān)鍵。
據(jù)Gartner預(yù)測,5G時(shí)代,云數(shù)據(jù)庫將主導(dǎo)數(shù)據(jù)存儲(chǔ)市場,到2022年將會(huì)有75%的數(shù)據(jù)庫被部署或遷移到云平臺(tái),只有5%的數(shù)據(jù)庫會(huì)繼續(xù)部署在內(nèi)部環(huán)境中。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),國內(nèi)領(lǐng)先的云服務(wù)廠商——阿里云目前已將40萬個(gè)數(shù)據(jù)庫成功遷移至云端。在數(shù)據(jù)出版中,從數(shù)據(jù)生產(chǎn)、存儲(chǔ)到引用的各個(gè)環(huán)節(jié),數(shù)據(jù)庫都至關(guān)重要。而5G環(huán)境下,云數(shù)據(jù)庫的重要性更是不言而喻,它將助力數(shù)據(jù)存儲(chǔ),推動(dòng)數(shù)據(jù)出版進(jìn)一步發(fā)展。
當(dāng)前,從事數(shù)據(jù)出版服務(wù)的數(shù)據(jù)中心或期刊出版單位大部分是通過自建數(shù)據(jù)庫的方式存儲(chǔ)數(shù)據(jù),根據(jù)存儲(chǔ)需求自行搭建數(shù)據(jù)庫、購買服務(wù)器、備份數(shù)據(jù)、修復(fù)安全漏洞及維護(hù)數(shù)據(jù)庫,需要耗費(fèi)大量的人力和物力成本,但資源利用率依然很低,當(dāng)多個(gè)用戶同時(shí)訪問同一數(shù)據(jù)庫時(shí)會(huì)出現(xiàn)阻塞現(xiàn)象。此外,缺乏統(tǒng)一的自建數(shù)據(jù)庫標(biāo)準(zhǔn)給各數(shù)據(jù)中心和期刊出版單位的數(shù)據(jù)共享帶來極大不便,對(duì)數(shù)據(jù)出版有一定的阻礙作用。5G時(shí)代,云數(shù)據(jù)庫存儲(chǔ)將解決自建數(shù)據(jù)庫遭遇的問題,在大量減少成本的同時(shí),加強(qiáng)資源利用率,數(shù)據(jù)中心或期刊出版單位依據(jù)企業(yè)需求購置專業(yè)數(shù)據(jù)庫支持服務(wù),可實(shí)現(xiàn)輕松部署,保障數(shù)據(jù)的高可靠性。同時(shí),云數(shù)據(jù)庫存儲(chǔ)可為眾多數(shù)據(jù)倉儲(chǔ)庫建立鏈接提供便捷,實(shí)現(xiàn)以關(guān)聯(lián)數(shù)據(jù)的發(fā)布方式提高數(shù)據(jù)的可發(fā)現(xiàn)性[8],加強(qiáng)數(shù)據(jù)共享,助力數(shù)據(jù)存儲(chǔ),提高數(shù)據(jù)出版商的出版積極性,為數(shù)據(jù)出版發(fā)展持續(xù)提供動(dòng)力。
2.超高速驅(qū)動(dòng)數(shù)據(jù)共享
相比4G,5G將以全新的網(wǎng)絡(luò)架構(gòu),提供至少十倍于4G的峰值速率、毫秒級(jí)的傳輸時(shí)延和千億級(jí)的連接能力,打開了一條更寬的移動(dòng)通信之路。5G的目標(biāo)是在所有地點(diǎn)提供無處不在的高數(shù)據(jù)速率連接——無論移動(dòng)還是靜止,5G將允許用戶組訪問特定的數(shù)據(jù)。這意味著今后數(shù)據(jù)庫將有覆蓋廣泛多樣的傳輸系統(tǒng)、高速度的移動(dòng)數(shù)據(jù)訪問能力。
據(jù)調(diào)查,相比歐美國家,現(xiàn)階段我國數(shù)據(jù)共享模式處于發(fā)展階段,作為科學(xué)數(shù)據(jù)的生產(chǎn)者、使用者和管理者——科研人員數(shù)據(jù)共享意愿相對(duì)低下。影響科研人員數(shù)據(jù)共享意愿的因素諸多,如個(gè)人背景、國家政策、共享成本、技術(shù)支撐及數(shù)據(jù)質(zhì)量等,其中,共享成本是關(guān)鍵因素之一。對(duì)科研數(shù)據(jù)進(jìn)行共享需要占據(jù)科研人員原本就不充裕的時(shí)間,因此,有效解決數(shù)據(jù)共享成本是提高科研人員數(shù)據(jù)共享積極性的有效手段。
目前,不同數(shù)據(jù)出版商的數(shù)據(jù)上傳和下載方式不同,但對(duì)所上傳的數(shù)據(jù)容量都有一定限制。當(dāng)數(shù)據(jù)量較大時(shí),受網(wǎng)絡(luò)帶寬限制,上傳速度會(huì)相對(duì)較慢。數(shù)據(jù)上傳和下載實(shí)質(zhì)上是對(duì)數(shù)據(jù)庫的訪問,而影響數(shù)據(jù)庫訪問速度的因素有很多,其中,網(wǎng)絡(luò)速度是客觀因素之一,這可通過提高移動(dòng)數(shù)據(jù)訪問的能力來優(yōu)化數(shù)據(jù)庫性能,進(jìn)而節(jié)省數(shù)據(jù)上傳和下載所需的時(shí)間成本。5G技術(shù)的超高速移動(dòng)數(shù)據(jù)訪問能力有效地解決了這一問題。超高速為數(shù)據(jù)上傳與下載節(jié)省成本,有效地提高了科研人員數(shù)據(jù)共享意愿,進(jìn)而驅(qū)動(dòng)數(shù)據(jù)共享,直接影響數(shù)據(jù)出版的發(fā)展。
3.VR出版加強(qiáng)數(shù)據(jù)引用
2016年被業(yè)界稱為“VR元年”,2019年被業(yè)界稱為“5G元年”,5G與VR強(qiáng)強(qiáng)聯(lián)合,必將重塑各個(gè)行業(yè)。VR出版通過將虛擬現(xiàn)實(shí)技術(shù)與傳統(tǒng)出版物相結(jié)合的方式實(shí)現(xiàn)出版,帶給讀者一種接觸式的閱讀體驗(yàn)。VR出版物可以為人們提供全景式閱讀,帶來跨時(shí)空的閱讀體驗(yàn),讓讀者與作者、自然“對(duì)話”。5G技術(shù)的出現(xiàn)將給VR出版帶來革新。
VR技術(shù)應(yīng)用數(shù)據(jù)出版的場景包括科學(xué)研究領(lǐng)域的數(shù)據(jù)建模、數(shù)據(jù)仿真等場景??茖W(xué)研究是一項(xiàng)既復(fù)雜又困難的工作,其產(chǎn)生的科研數(shù)據(jù)相對(duì)比較抽象,需要一定的研究理論做支撐,這也是數(shù)據(jù)出版商要求提交數(shù)據(jù)描述的重要原因??茖W(xué)研究者如果想復(fù)用已出版的數(shù)據(jù),需要花費(fèi)大量時(shí)間反復(fù)通讀數(shù)據(jù)描述、應(yīng)用數(shù)據(jù)、推敲理論,但依然會(huì)出現(xiàn)數(shù)據(jù)誤用。VR出版可還原科研數(shù)據(jù)產(chǎn)生的整個(gè)過程以及數(shù)據(jù)產(chǎn)生的實(shí)驗(yàn)效果,數(shù)據(jù)引用者通過瀏覽就能理解數(shù)據(jù)的真諦,節(jié)省大量成本。可見,VR出版可以加強(qiáng)數(shù)據(jù)引用,實(shí)現(xiàn)數(shù)據(jù)出版目標(biāo)。
四、結(jié)語
數(shù)據(jù)出版作為一種數(shù)據(jù)共享機(jī)制,可推動(dòng)數(shù)據(jù)共享、復(fù)用、挖掘增值服務(wù),保障數(shù)據(jù)知識(shí)產(chǎn)權(quán),影響社會(huì)科學(xué)創(chuàng)新。由于數(shù)據(jù)庫存儲(chǔ)困難、數(shù)據(jù)共享成本較大、數(shù)據(jù)引用復(fù)雜等因素,我國的數(shù)據(jù)出版仍處于發(fā)展階段,亟須加快數(shù)據(jù)出版的步伐。5G技術(shù)的落地,云數(shù)據(jù)庫助力數(shù)據(jù)存儲(chǔ),超高速驅(qū)動(dòng)數(shù)據(jù)共享,VR出版加強(qiáng)數(shù)據(jù)引用,有效解決了數(shù)據(jù)出版當(dāng)前面臨的嚴(yán)峻問題,從根本上推動(dòng)科學(xué)研究者參與數(shù)據(jù)共享的積極性,促進(jìn)我國數(shù)據(jù)出版的快速發(fā)展。
|參考文獻(xiàn)|
[1]國際數(shù)據(jù)委員會(huì)2019年學(xué)術(shù)大會(huì)在京召開[EB/OL].(2019-11-22)[2019-11-25].http://www.scichi.cn/content.php?id=4443.
[2]張新新. 數(shù)字出版高端智庫建構(gòu)綜述[J]. 科技與出版,2017(1):17-23
[3]黃鑫. 基于服務(wù)內(nèi)容的科學(xué)數(shù)據(jù)服務(wù)用戶滿意度研究[D]. 武漢:武漢大學(xué)博士學(xué)位論文,2017.
[4]廖文峰,張新新. 數(shù)字出版發(fā)展三階段論[J]. 科技與出版,2015(7):87-90.
[5]徐麗芳,叢挺. 數(shù)據(jù)密集、語義、可視化與互動(dòng)出版:全球科技出版發(fā)展趨勢研究[J]. 出版科學(xué),2012(4):73-80.
[6]劉闖. 論全球變化科學(xué)研究數(shù)據(jù)出版[J]. 地理學(xué)報(bào),2014(1):1-3.
[7]張小強(qiáng),李欣. 數(shù)據(jù)出版理論與實(shí)踐關(guān)鍵問題[J].中國科技期刊研究,2015(8):813-821.
[8]段青玉,王曉光.人文社科數(shù)據(jù)出版平臺(tái)FAIR原則應(yīng)用調(diào)查研究[J].科技與出版,2019(4):6-11.