国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于元數(shù)據(jù)的計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)研究

2022-04-18 08:04趙正宜韓德隆楊一凡張加濤王亭亭劉宇東盧祝華
中國科技資源導(dǎo)刊 2022年2期
關(guān)鍵詞:數(shù)據(jù)管理計(jì)量科學(xué)

陶 毅 蘇 爽 趙正宜 田 鋒 韓德隆 楊一凡 張加濤 王亭亭 劉宇東 盧祝華

(1. 中國計(jì)量科學(xué)研究院國家計(jì)量科學(xué)數(shù)據(jù)中心,北京 100029;2. 中國計(jì)量科學(xué)研究院,北京 100029;3. 山東省計(jì)算中心(國家超級(jí)計(jì)算濟(jì)南中心),山東濟(jì)南 250014)

0 引言

科學(xué)數(shù)據(jù)是科學(xué)研究的重要產(chǎn)物。隨著信息技術(shù)的發(fā)展,在數(shù)據(jù)中心、物聯(lián)網(wǎng)等信息基礎(chǔ)設(shè)施的支持下,科學(xué)數(shù)據(jù)的管理共享、價(jià)值挖掘逐漸成為科學(xué)研究的重要環(huán)節(jié)。作為最基本、最活躍的一類科技資源,科學(xué)數(shù)據(jù)具有客觀性、多結(jié)構(gòu)性、分散性、時(shí)效性、共享性、易傳遞性和再創(chuàng)造性等特點(diǎn),貫穿于科研活動(dòng)的全過程。2009年,圖靈獎(jiǎng)獲得者Jim Gray提出科學(xué)研究第四范式,即數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn),進(jìn)一步突顯了科學(xué)數(shù)據(jù)在科研活動(dòng)中的重要性[1]。目前,科學(xué)數(shù)據(jù)在科學(xué)研究過程中的重要作用和在知識(shí)創(chuàng)新中的戰(zhàn)略地位已經(jīng)得到越來越多的認(rèn)同,正逐步成為支撐國家科技創(chuàng)新的重要資源[2]??茖W(xué)數(shù)據(jù)的匯交管理、長(zhǎng)期保存和共享應(yīng)用是解決科學(xué)數(shù)據(jù)分散重復(fù)問題,促進(jìn)科學(xué)數(shù)據(jù)流轉(zhuǎn)、利用和增值的有效路徑,對(duì)于推動(dòng)科學(xué)研究和科技成果產(chǎn)出,更好地發(fā)揮國家科研投入產(chǎn)出效益,提高我國科技創(chuàng)新水平具有重要意義[3]。本文將在分析國內(nèi)外科學(xué)數(shù)據(jù)管理現(xiàn)狀的基礎(chǔ)上,概述我國計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)匯交和計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng),對(duì)今后科學(xué)數(shù)據(jù)匯交工作提出建議。

1 國內(nèi)外科學(xué)數(shù)據(jù)管理現(xiàn)狀

1.1 國外科學(xué)數(shù)據(jù)管理現(xiàn)狀

隨著科學(xué)數(shù)據(jù)價(jià)值的日益凸顯,越來越多的國際組織開始關(guān)注科學(xué)數(shù)據(jù)可實(shí)現(xiàn)的價(jià)值、知識(shí)產(chǎn)權(quán)保護(hù)及數(shù)據(jù)共享參與各方的權(quán)利和責(zé)任等方面,以多種形式制定了不同領(lǐng)域的數(shù)據(jù)開放指南、標(biāo)準(zhǔn)規(guī)范等。如《北極數(shù)據(jù)管理原則與實(shí)踐聲明》鼓勵(lì)聲明范圍內(nèi)科學(xué)數(shù)據(jù)的開放,同時(shí)明確了數(shù)據(jù)共享的倫理要求[4];《發(fā)展中國家數(shù)據(jù)共享原則》對(duì)數(shù)據(jù)的共享提出了持續(xù)性要求,有效提升了數(shù)據(jù)的可獲取性,促進(jìn)了發(fā)展中國家開展或者參與更多科學(xué)研究[5]。

作為全球科學(xué)數(shù)據(jù)共享工作的開拓者,美國于20世紀(jì)90年代開始提供全球變化研究數(shù)據(jù)的共享服務(wù)[6];2013年,白宮出臺(tái)《提高聯(lián)邦資助科學(xué)研究成果獲取》備忘錄,要求政府資助科研項(xiàng)目所取得的成果對(duì)外免費(fèi)開放[7]。英國出臺(tái)了《開放科研數(shù)據(jù)協(xié)議》,提出科研數(shù)據(jù)在被提供給其他人員使用分析前,其形式不僅要符合法律和道德的規(guī)范要求,還應(yīng)符合所處學(xué)科和監(jiān)管的規(guī)范要求[8]。此外,法國、日本等國家均公布了促進(jìn)科學(xué)數(shù)據(jù)開放的政策法規(guī),可見科學(xué)數(shù)據(jù)的管理和開放已成為發(fā)達(dá)國家進(jìn)一步提升科技水平的重要舉措。

目前,國外已建設(shè)了大量成熟的科技平臺(tái),如DataStaR、DataCite、GBIF等,為科學(xué)數(shù)據(jù)的開放共享提供了有效保障。在科學(xué)數(shù)據(jù)倉儲(chǔ)方面,美國、英國和加拿大等國家的數(shù)據(jù)倉儲(chǔ)設(shè)施建設(shè)較多,且主要隸屬于政府和機(jī)構(gòu),在學(xué)科分布上數(shù)量占比較高的學(xué)科為生物、環(huán)境、地球科學(xué)、多學(xué)科科學(xué)等[9]。元數(shù)據(jù)是數(shù)據(jù)倉儲(chǔ)的重要組成部分,其作用類似數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)字典,保存了邏輯數(shù)據(jù)結(jié)構(gòu)、文件、地址和索引等信息。以康奈爾大學(xué)的DataStaR為例,該系統(tǒng)主要由數(shù)據(jù)集存儲(chǔ)庫、語義元數(shù)據(jù)存儲(chǔ)庫、開源工具和內(nèi)容轉(zhuǎn)移協(xié)議組成,其必備元數(shù)據(jù)元素包括所有者、創(chuàng)建者、題名、識(shí)別符、元數(shù)據(jù)與數(shù)據(jù)獲取許可、文件級(jí)元數(shù)據(jù)等;可選元素包括聯(lián)系人員、與研究小組的關(guān)系、與其他資源的關(guān)系、時(shí)間范圍等,DataStaR元數(shù)據(jù)方案中需用戶輸入或選擇的元素較少,支持信息資源的自動(dòng)發(fā)現(xiàn)和互操作[10]。在平臺(tái)結(jié)構(gòu)方面,以英美社會(huì)科學(xué)領(lǐng)域數(shù)據(jù)管理與共享服務(wù)平臺(tái)為例,其結(jié)構(gòu)在邏輯上主要由數(shù)據(jù)庫、元數(shù)據(jù)庫、平臺(tái)網(wǎng)站、后臺(tái)管理4個(gè)部分組成,如圖1所示[11]。

圖1 英美科學(xué)數(shù)據(jù)管理與共享服務(wù)平臺(tái)整體架構(gòu)

盡管目前科學(xué)數(shù)據(jù)倉儲(chǔ)、管理平臺(tái)建設(shè)較為廣泛,但是科研人員仍是科學(xué)數(shù)據(jù)匯交、共享的重要主體。有研究指出,目前科研人員對(duì)數(shù)據(jù)的共享積極性仍不高,如Federer等[12]對(duì)2014—2016年間發(fā)表在PLOS ONE期刊上的47 593篇論文進(jìn)行了分析,發(fā)現(xiàn)只有約20%的論文公開了相關(guān)數(shù)據(jù)??蒲腥藛T共享數(shù)據(jù)積極性較差的原因是多方面的,Pierce等[13]認(rèn)為共享數(shù)據(jù)的回報(bào)與期望值之間的差距是阻礙科研人員共享數(shù)據(jù)的主要因素之一。

1.2 國內(nèi)科學(xué)數(shù)據(jù)管理現(xiàn)狀

我國政府高度重視科學(xué)數(shù)據(jù)對(duì)科技發(fā)展的作用,相關(guān)政策環(huán)境不斷完善。2007年修訂的《中華人民共和國科學(xué)技術(shù)進(jìn)步法》明確提出,利用財(cái)政性資金設(shè)立的科學(xué)技術(shù)研究開發(fā)機(jī)構(gòu),應(yīng)當(dāng)建立有利于科學(xué)技術(shù)資源共享的機(jī)制,促進(jìn)科學(xué)技術(shù)資源的有效利用。在此之后,氣象、海洋、地震科學(xué)等領(lǐng)域相繼出臺(tái)了指導(dǎo)本領(lǐng)域信息、數(shù)據(jù)管理的辦法、標(biāo)準(zhǔn)。為進(jìn)一步加強(qiáng)和規(guī)范科學(xué)數(shù)據(jù)管理,2018年出臺(tái)的《科學(xué)數(shù)據(jù)管理辦法》提出堅(jiān)持“開放為常態(tài),不開放為例外”的基本原則,明確要求政府預(yù)算資金資助的各級(jí)科技計(jì)劃(專項(xiàng)、基金等)項(xiàng)目科學(xué)數(shù)據(jù)向科學(xué)數(shù)據(jù)中心匯交。同年,科技部、財(cái)政部聯(lián)合印發(fā)了《國家科技資源共享服務(wù)平臺(tái)管理辦法》,將承接科技計(jì)劃項(xiàng)目實(shí)施所形成的科學(xué)數(shù)據(jù)的匯交、整理和保存作為國家科學(xué)數(shù)據(jù)中心重點(diǎn)任務(wù)之一。近年來,我國科研投入持續(xù)增長(zhǎng),大量科研項(xiàng)目的開展加速了科研數(shù)據(jù)的積累。據(jù)不完全統(tǒng)計(jì),截至2017年年底,我國有效管理與保存的科學(xué)數(shù)據(jù)約為83.72 PB,覆蓋地球與環(huán)境科學(xué)、天文與空間科學(xué)等領(lǐng)域[14]。目前,我國已建設(shè)了包括國家計(jì)量科學(xué)數(shù)據(jù)中心在內(nèi)的20個(gè)國家科學(xué)數(shù)據(jù)中心,具體如表1所示。同時(shí),我國還建成了30個(gè)國家生物種質(zhì)與實(shí)驗(yàn)材料資源庫。這些數(shù)據(jù)中心和資源庫已成為促進(jìn)各領(lǐng)域科技創(chuàng)新的重要?jiǎng)恿υ慈?/p>

表1 我國已建成的國家科學(xué)數(shù)據(jù)中心

我國科學(xué)數(shù)據(jù)匯交流程較為完備。針對(duì)科技計(jì)劃項(xiàng)目形成的科學(xué)數(shù)據(jù),國家科技基礎(chǔ)條件平臺(tái)中心制定了數(shù)據(jù)匯交的基本流程,包括科學(xué)數(shù)據(jù)匯交計(jì)劃制定、科學(xué)數(shù)據(jù)制備、科學(xué)數(shù)據(jù)提交、科學(xué)數(shù)據(jù)審核、科學(xué)數(shù)據(jù)匯總、科學(xué)數(shù)據(jù)發(fā)布與共享,以及科學(xué)數(shù)據(jù)使用與維護(hù)更新等,如圖2所示[15]。

圖2 我國科學(xué)數(shù)據(jù)匯交流程

為了進(jìn)一步規(guī)范科學(xué)數(shù)據(jù)的匯交、共享等流程,提高科學(xué)數(shù)據(jù)管理成效,我國出臺(tái)了一系列國家標(biāo)準(zhǔn),如表2所示,有效規(guī)范了科學(xué)數(shù)據(jù)管理工作。在數(shù)據(jù)匯交方面,根據(jù)《科技計(jì)劃項(xiàng)目形成的科學(xué)數(shù)據(jù)匯交 技術(shù)與管理規(guī)范》要求,科學(xué)數(shù)據(jù)匯交內(nèi)容包括科技項(xiàng)目執(zhí)行過程中產(chǎn)生的科學(xué)數(shù)據(jù)實(shí)體、科學(xué)數(shù)據(jù)描述信息和科學(xué)數(shù)據(jù)輔助工具軟件,其中科學(xué)數(shù)據(jù)輔助工具軟件是指科技計(jì)劃形成的用于科學(xué)數(shù)據(jù)處理、加工和分析的專門輔助軟件工具等。項(xiàng)目實(shí)施中采購的工具軟件可不必匯交,但需提供與匯交數(shù)據(jù)處理相關(guān)的工具軟件使用說明;提交的科學(xué)數(shù)據(jù)輔助工具軟件包括軟件工具本身或網(wǎng)絡(luò)調(diào)用接口和屬性信息,應(yīng)符合相關(guān)軟件安全規(guī)定。屬性信息主要包括軟件名稱、用途、開發(fā)工具、運(yùn)行環(huán)境、開發(fā)單位、版本號(hào)、使用手冊(cè)等[16]。科研數(shù)據(jù)的處理依賴于各種輔助軟件工具,標(biāo)準(zhǔn)對(duì)數(shù)據(jù)匯交中應(yīng)提供的輔助工具軟件信息進(jìn)行了詳細(xì)要求,有效避免了軟件差異所導(dǎo)致的數(shù)據(jù)分析誤差。

表2 科學(xué)數(shù)據(jù)管理領(lǐng)域國家標(biāo)準(zhǔn)

我國在科學(xué)數(shù)據(jù)管理政策制度、平臺(tái)建設(shè)、標(biāo)準(zhǔn)規(guī)范等方面已開展了大量工作,取得了一定成效。以國家基礎(chǔ)科學(xué)數(shù)據(jù)共享服務(wù)平臺(tái)為例,其數(shù)據(jù)累計(jì)下載總量已超過2 290.42 TB,但是,與我國科學(xué)研究整體規(guī)模相比,當(dāng)前科學(xué)數(shù)據(jù)的匯交、共享水平仍有較大提升空間。目前,國內(nèi)科研人員與同事或合作者私下共享數(shù)據(jù)的情況更為普遍,公開共享數(shù)據(jù)意愿較低[17]。研究顯示,數(shù)據(jù)共享態(tài)度、主觀規(guī)范是影響科研人員共享數(shù)據(jù)的直接因素,感知行為控制、感知風(fēng)險(xiǎn)、感知有用性等為間接影響因素[18]??蒲腥藛T之間信任程度的高低對(duì)科學(xué)數(shù)據(jù)共享的實(shí)現(xiàn)具有重要影響,多數(shù)研究者能夠充分認(rèn)識(shí)到科學(xué)數(shù)據(jù)對(duì)科研活動(dòng)的重要性,但是在共享自身數(shù)據(jù)時(shí)存在較多顧慮,如對(duì)數(shù)據(jù)錯(cuò)用、濫用、保密等方面的擔(dān)憂等[19]。

為提升我國科學(xué)數(shù)據(jù)匯交、共享水平,除了進(jìn)一步完善政策環(huán)境和管理機(jī)制,還應(yīng)加強(qiáng)科學(xué)數(shù)據(jù)匯交、管理平臺(tái)建設(shè),通過功能完備、穩(wěn)定可靠、方便易用的平臺(tái)系統(tǒng)助力培育科學(xué)數(shù)據(jù)素養(yǎng),引導(dǎo)科研人員開展數(shù)據(jù)共享,為我國科研水平的進(jìn)一步提升提供堅(jiān)實(shí)數(shù)據(jù)支撐。

2 計(jì)量科學(xué)數(shù)據(jù)的匯交

國家計(jì)量科學(xué)數(shù)據(jù)中心(以下簡(jiǎn)稱“中心”)是承擔(dān)計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)匯集、管理、開放共享和保存的重要基礎(chǔ)設(shè)施。中心負(fù)責(zé)管理的計(jì)量科學(xué)數(shù)據(jù)資源主要包含標(biāo)準(zhǔn)參考數(shù)據(jù)、計(jì)量科研數(shù)據(jù)、計(jì)量基標(biāo)準(zhǔn)數(shù)據(jù)、計(jì)量檢測(cè)數(shù)據(jù)和計(jì)量信息數(shù)據(jù)等五類[20]。與其他科研領(lǐng)域相比,計(jì)量領(lǐng)域的科研項(xiàng)目重點(diǎn)關(guān)注計(jì)量基標(biāo)準(zhǔn)裝置建立、國家標(biāo)準(zhǔn)物質(zhì)研制、國際比對(duì)實(shí)現(xiàn)等效及測(cè)量和校準(zhǔn)能力實(shí)現(xiàn)國際互認(rèn)等方面。計(jì)量領(lǐng)域科研項(xiàng)目的成果類型包括實(shí)驗(yàn)裝置、標(biāo)準(zhǔn)物質(zhì)、科技文獻(xiàn)、新技術(shù)新方法、數(shù)據(jù)庫及各類報(bào)告、標(biāo)準(zhǔn)、規(guī)程規(guī)范等,在成果形成過程中會(huì)產(chǎn)生大量科學(xué)數(shù)據(jù),這些數(shù)據(jù)將成為計(jì)量科學(xué)數(shù)據(jù)實(shí)體的重要組成部分。

為落實(shí)《科學(xué)數(shù)據(jù)管理辦法》和《國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目綜合績(jī)效評(píng)價(jià)工作規(guī)范(試行)》相關(guān)要求,進(jìn)一步規(guī)范計(jì)量領(lǐng)域國家科技計(jì)劃項(xiàng)目科學(xué)數(shù)據(jù)匯交,提高科學(xué)數(shù)據(jù)共享開放水平,中心自主研發(fā)了計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)(以下簡(jiǎn)稱“系統(tǒng)”)。作為計(jì)量科學(xué)數(shù)據(jù)向中心匯交的唯一端口,系統(tǒng)是為科研項(xiàng)目承擔(dān)單位、項(xiàng)目負(fù)責(zé)人、課題負(fù)責(zé)人、專家、國家計(jì)量科學(xué)數(shù)據(jù)中心以及國家科技計(jì)劃項(xiàng)目管理專業(yè)機(jī)構(gòu)等各角色提供服務(wù)的統(tǒng)一信息化系統(tǒng)平臺(tái),可提供科學(xué)數(shù)據(jù)分類編目與標(biāo)識(shí)、加工整理和管理維護(hù)等功能。系統(tǒng)所管理的國家科技計(jì)劃項(xiàng)目(以下簡(jiǎn)稱“項(xiàng)目”)是指以中央財(cái)政投入為主的國家自然科學(xué)基金、國家科技重大專項(xiàng)、國家重點(diǎn)研發(fā)計(jì)劃、技術(shù)創(chuàng)新引導(dǎo)專項(xiàng)(基金)、基地和人才專項(xiàng)等科技計(jì)劃(專項(xiàng)、基金)項(xiàng)目[21]。系統(tǒng)所管理的科學(xué)數(shù)據(jù)是指項(xiàng)目實(shí)施過程中產(chǎn)生的計(jì)量科學(xué)數(shù)據(jù)。具體包括通過基礎(chǔ)研究、應(yīng)用研究、試驗(yàn)開發(fā)等產(chǎn)生的數(shù)據(jù),以及通過觀測(cè)監(jiān)測(cè)、考察調(diào)查、檢驗(yàn)檢測(cè)等方式取得并可用于科學(xué)研究活動(dòng)的原始數(shù)據(jù)及其衍生數(shù)據(jù)。在信息化不斷向各行業(yè)領(lǐng)域滲透的背景下,系統(tǒng)實(shí)現(xiàn)了計(jì)量科學(xué)數(shù)據(jù)匯交的數(shù)字化,建立了集科學(xué)數(shù)據(jù)采集接入、交換匯聚、共享融合、管理運(yùn)維等功能于一體的數(shù)據(jù)服務(wù)平臺(tái),為計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)匯交、管理和共享提供了面向業(yè)務(wù)應(yīng)用和共享服務(wù)支撐的底座能力。

3 計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)的構(gòu)建

3.1 元數(shù)據(jù)理念

元數(shù)據(jù)(Metadata)是描述數(shù)據(jù)及其環(huán)境的數(shù)據(jù),可用于數(shù)據(jù)的發(fā)現(xiàn)、互操作、質(zhì)量控制等[22]??茖W(xué)數(shù)據(jù)的元數(shù)據(jù)是以科學(xué)數(shù)據(jù)為描述對(duì)象的元數(shù)據(jù),是對(duì)科學(xué)數(shù)據(jù)開展描述、組織、出版等工作的重要工具,可以幫助用戶快速搜索發(fā)現(xiàn)并了解數(shù)據(jù)集基本情況,對(duì)于促進(jìn)科學(xué)數(shù)據(jù)共享有著重要的意義[23]。根據(jù)《科技平臺(tái) 資源核心元數(shù)據(jù)》,元數(shù)據(jù)元素(Metadata Element)是元數(shù)據(jù)的基本單元,如科研項(xiàng)目名稱是定義科研項(xiàng)目的一個(gè)元數(shù)據(jù)元素。元數(shù)據(jù)實(shí)體(Metadata Entity)則是一組說明數(shù)據(jù)相同特性的元數(shù)據(jù)元素或?qū)嶓w的集合,如科研項(xiàng)目是由科研項(xiàng)目名稱、科研項(xiàng)目編碼、項(xiàng)目負(fù)責(zé)人等元素或?qū)嶓w的集合[24]。

元數(shù)據(jù)的應(yīng)用和管理貫穿科學(xué)數(shù)據(jù)匯交業(yè)務(wù)、運(yùn)行管理、標(biāo)準(zhǔn)規(guī)范、安全和數(shù)據(jù)質(zhì)量等方面。作為系統(tǒng)的基礎(chǔ)之一,元數(shù)據(jù)實(shí)體設(shè)計(jì)的質(zhì)量直接影響到整個(gè)系統(tǒng)的質(zhì)量,必須最大限度地規(guī)避冗余、遞歸、重復(fù)等問題。以科研項(xiàng)目為例,首先對(duì)科研項(xiàng)目實(shí)體從定義、描述、中文名等進(jìn)行定義,然后對(duì)元數(shù)據(jù)實(shí)體所包含的元數(shù)據(jù)元素或?qū)嶓w通過標(biāo)識(shí)、中文名、英文名等進(jìn)行定義。對(duì)于需要使用專用軟件查看的科學(xué)數(shù)據(jù),系統(tǒng)設(shè)計(jì)了軟件元數(shù)據(jù)實(shí)體,包含軟件所屬科學(xué)數(shù)據(jù)、軟件名稱、開發(fā)單位、運(yùn)行環(huán)境、開發(fā)工具、用途等要素。表3所示為系統(tǒng)元數(shù)據(jù)實(shí)體設(shè)計(jì)的要素,其中項(xiàng)目負(fù)責(zé)人、項(xiàng)目承擔(dān)單位等元數(shù)據(jù)實(shí)體都是獨(dú)立定義的單位。

表3 科研項(xiàng)目元數(shù)據(jù)實(shí)體

3.2 系統(tǒng)結(jié)構(gòu)框架

系統(tǒng)基于計(jì)量科學(xué)數(shù)據(jù)運(yùn)行管理體系、標(biāo)準(zhǔn)規(guī)范體系、安全保障體系和質(zhì)量保證體系構(gòu)建,系統(tǒng)邏輯架構(gòu)可分為云基礎(chǔ)服務(wù)層(包含基礎(chǔ)設(shè)施、數(shù)據(jù)系統(tǒng)和商用基礎(chǔ)系統(tǒng)軟件)、服務(wù)層、應(yīng)用層和展示層,如圖3所示。其中,系統(tǒng)最底層為基礎(chǔ)設(shè)施層,其次是數(shù)據(jù)系統(tǒng)層和商用基礎(chǔ)系統(tǒng)軟件層。這3層充分利用了中心建設(shè)的私有云設(shè)施構(gòu)建,也可統(tǒng)稱為云基礎(chǔ)服務(wù)層。

圖3 系統(tǒng)架構(gòu)

服務(wù)層是系統(tǒng)的關(guān)鍵部分,其所包含的數(shù)據(jù)管理平臺(tái)不僅是服務(wù)層的核心,也是系統(tǒng)的核心。數(shù)據(jù)管理平臺(tái)貫穿科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)治理管理、元數(shù)據(jù)管理、數(shù)據(jù)安全管理和數(shù)據(jù)生命周期管理,具有計(jì)量科學(xué)數(shù)據(jù)匯聚、數(shù)據(jù)融合、數(shù)據(jù)組織、數(shù)據(jù)服務(wù)等功能和服務(wù)能力。智能服務(wù)平臺(tái)是使用數(shù)據(jù)挖掘技術(shù)、傳統(tǒng)AI或創(chuàng)新的學(xué)習(xí)型模型,通過標(biāo)準(zhǔn)化的統(tǒng)一接口提供服務(wù)。數(shù)據(jù)即服務(wù)(Data as a Service,DaaS)是指在運(yùn)行管理、標(biāo)準(zhǔn)規(guī)范、安全保障以及質(zhì)量保證等體系規(guī)范下,對(duì)科研數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)等實(shí)現(xiàn)統(tǒng)一的數(shù)據(jù)即服務(wù),數(shù)據(jù)挖掘、分析以及人工智能等應(yīng)用產(chǎn)生的數(shù)據(jù)成果,同樣以DaaS的業(yè)務(wù)模式提供服務(wù)。工作流引擎同樣位于服務(wù)層,為科學(xué)數(shù)據(jù)匯交各流程提供工作流技術(shù)支撐。

在運(yùn)行管理、標(biāo)準(zhǔn)規(guī)范、安全保障以及質(zhì)量保證體系下,針對(duì)計(jì)量科學(xué)數(shù)據(jù)的特點(diǎn),構(gòu)建以數(shù)據(jù)管理平臺(tái)為核心、分層架構(gòu)的系統(tǒng)框架,可以有效支撐計(jì)量科學(xué)數(shù)據(jù)匯交業(yè)務(wù)的在線運(yùn)行,在提升數(shù)據(jù)匯交、管理水平的基礎(chǔ)上,進(jìn)一步實(shí)現(xiàn)計(jì)量科學(xué)數(shù)據(jù)的增值和安全共享。

3.3 系統(tǒng)角色及用例

根據(jù)科學(xué)數(shù)據(jù)匯交要求,系統(tǒng)的主要角色有系統(tǒng)管理員、科學(xué)數(shù)據(jù)管理員、科學(xué)數(shù)據(jù)主管、數(shù)據(jù)中心主任、項(xiàng)目承擔(dān)單位等10個(gè)。各角色的簡(jiǎn)要說明如表4所示。

系統(tǒng)各角色之間的關(guān)系及其相關(guān)用例如圖4所示。以下主要是6個(gè)用例的具體功能。

圖4 系統(tǒng)用例圖

(1)匯交計(jì)劃制定和評(píng)審。由項(xiàng)目負(fù)責(zé)人制定匯交計(jì)劃,然后由專家評(píng)審計(jì)劃,匯交計(jì)劃及專家評(píng)審結(jié)果交由項(xiàng)目承擔(dān)單位、科學(xué)數(shù)據(jù)管理員進(jìn)行形式審查,審查通過后報(bào)送項(xiàng)目管理機(jī)構(gòu)審核。

(2)匯交方案制定和評(píng)審。其相關(guān)流程與匯交計(jì)劃制定和評(píng)審用例基本相同。

(3)科學(xué)數(shù)據(jù)匯交和審核。包含項(xiàng)目目標(biāo)/成果/考核指標(biāo)的信息管理,以及課題信息管理、指標(biāo)映射管理、數(shù)據(jù)集管理、數(shù)據(jù)提交和各級(jí)審核。

(4)科學(xué)數(shù)據(jù)管理。主要包含元數(shù)據(jù)管理、科學(xué)數(shù)據(jù)架構(gòu)和模型管理、科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)管理、科學(xué)數(shù)據(jù)質(zhì)量管理、科學(xué)數(shù)據(jù)安全管理等功能。

(5)統(tǒng)計(jì)分析。面向主題,通過數(shù)據(jù)選取、數(shù)據(jù)清洗、數(shù)據(jù)加載、數(shù)據(jù)加工計(jì)算處理等過程,使用報(bào)表工具展示統(tǒng)計(jì)分析結(jié)果。該用例可引入人工智能、數(shù)據(jù)挖掘等技術(shù),一方面通過智能化模型挖掘計(jì)量科學(xué)數(shù)據(jù)的隱含價(jià)值,另一方面通過知識(shí)積累和智能場(chǎng)景化學(xué)習(xí)的結(jié)合感知客戶需求,提供智能化統(tǒng)計(jì)分析服務(wù)。

(6)數(shù)據(jù)共享管理。根據(jù)數(shù)據(jù)的安全級(jí)別提供科學(xué)數(shù)據(jù)共享服務(wù),部分統(tǒng)計(jì)分析結(jié)果將共享到門戶網(wǎng)站。

3.4 科學(xué)數(shù)據(jù)匯交技術(shù)流程

在計(jì)量科學(xué)數(shù)據(jù)匯交業(yè)務(wù)流程中,參與角色較多的主要流程為匯交計(jì)劃審核、匯交方案審核、匯交數(shù)據(jù)審核及匯交憑證審批。所有流程都是基于工作流引擎實(shí)現(xiàn)的,可滿足定制化需求,系統(tǒng)在提供以上功能的同時(shí),重點(diǎn)關(guān)注、優(yōu)化科學(xué)數(shù)據(jù)在系統(tǒng)內(nèi)的流轉(zhuǎn)、管理。在業(yè)務(wù)流程的基礎(chǔ)上,技術(shù)流程可分為數(shù)據(jù)接口、數(shù)據(jù)安全管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、科學(xué)數(shù)據(jù)管理、計(jì)量科學(xué)數(shù)據(jù)匯交門戶5個(gè)部分,如圖5所示。

圖5 計(jì)量科學(xué)數(shù)據(jù)匯交技術(shù)流程

在技術(shù)流程中,數(shù)據(jù)接口、數(shù)據(jù)安全管理、數(shù)據(jù)標(biāo)準(zhǔn)管理和科學(xué)數(shù)據(jù)管理在系統(tǒng)運(yùn)行中起到了重要作用。

(1)數(shù)據(jù)接口。通過數(shù)據(jù)接口可獲取元數(shù)據(jù)查詢服務(wù);科研人員在用戶界面錄入的數(shù)據(jù)、上傳的文件通過數(shù)據(jù)接口進(jìn)入系統(tǒng);線下匯交的科研數(shù)據(jù)通過數(shù)據(jù)接口的“其他來源”進(jìn)入系統(tǒng);建有科研項(xiàng)目管理系統(tǒng)的單位可直接調(diào)用本系統(tǒng)接口,實(shí)現(xiàn)科研數(shù)據(jù)的在線匯交。

(2)數(shù)據(jù)安全管理。由元數(shù)據(jù)算法管理、秘鑰版本管理、保密策略管理等子模塊組成,根據(jù)密級(jí)對(duì)數(shù)據(jù)進(jìn)行分級(jí)管理。

(3)數(shù)據(jù)標(biāo)準(zhǔn)管理。在數(shù)據(jù)標(biāo)準(zhǔn)方面,經(jīng)過標(biāo)準(zhǔn)發(fā)布、執(zhí)行、監(jiān)控和集合等過程形成數(shù)據(jù)標(biāo)準(zhǔn),最終由該模塊統(tǒng)一管理。

(4)科學(xué)數(shù)據(jù)管理。在邏輯類型方面,經(jīng)過數(shù)據(jù)注冊(cè)、發(fā)布、運(yùn)營和評(píng)估等過程形成邏輯模型,最終由該模塊統(tǒng)一管理。

4 計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)的應(yīng)用及成效

4.1 科學(xué)數(shù)據(jù)共享

系統(tǒng)匯交數(shù)據(jù)共享技術(shù)架構(gòu)如圖6所示。對(duì)科學(xué)數(shù)據(jù)進(jìn)行分類、編目、標(biāo)識(shí)、保存、加工、整理及管理與維護(hù),形成科學(xué)數(shù)據(jù)及其目錄,通過門戶網(wǎng)站對(duì)外公布,推動(dòng)科學(xué)數(shù)據(jù)的共享、再利用。在數(shù)據(jù)共享方式方面,目前數(shù)據(jù)匯交系統(tǒng)提供了完全開放共享、協(xié)議共享、不予共享3種數(shù)據(jù)共享方式。完全開放共享數(shù)據(jù)指提供給國家計(jì)量科學(xué)數(shù)據(jù)中心且無附加共享利用條件約束的科學(xué)數(shù)據(jù)資源;協(xié)議共享數(shù)據(jù)指按約定的協(xié)議條件共享利用的科學(xué)數(shù)據(jù)資源;不予共享數(shù)據(jù)指不宜共享利用的科學(xué)數(shù)據(jù)資源。此外,對(duì)于涉密數(shù)據(jù),項(xiàng)目承擔(dān)單位負(fù)責(zé)按照相應(yīng)程序定密,經(jīng)國家科技計(jì)劃專業(yè)機(jī)構(gòu)審批后,按照相應(yīng)的保密要求進(jìn)行管理。對(duì)于項(xiàng)目承擔(dān)單位申請(qǐng)保護(hù)的科學(xué)數(shù)據(jù),在保護(hù)期滿后,系統(tǒng)將根據(jù)其開放條件、開放對(duì)象和審核程序等對(duì)外公開并提供共享與服務(wù)。

圖6 計(jì)量科學(xué)數(shù)據(jù)共享模式技術(shù)架構(gòu)

從數(shù)據(jù)共享的角度來看,計(jì)量科學(xué)數(shù)據(jù)匯交入庫后,在邏輯上處于數(shù)據(jù)層,可進(jìn)一步分為非結(jié)構(gòu)化的科學(xué)數(shù)據(jù)、非結(jié)構(gòu)化的云存儲(chǔ)、傳統(tǒng)數(shù)倉、人工智能數(shù)倉以及云數(shù)據(jù)倉庫等。為了提供高質(zhì)量的開放共享服務(wù),系統(tǒng)構(gòu)建了共享微服務(wù)層,更高層的Web交互查詢、目錄服務(wù)、數(shù)據(jù)可視化等,可以通過Restful API,也可以直接通過JDBC等驅(qū)動(dòng)直接訪問數(shù)據(jù),為科學(xué)數(shù)據(jù)的進(jìn)一步開放共享提供技術(shù)保障。

隨著系統(tǒng)中科學(xué)數(shù)據(jù)總量的不斷增加,數(shù)據(jù)量將超過用戶可以接受的程度,導(dǎo)致用戶難以在海量數(shù)據(jù)中定位所需信息,出現(xiàn)“信息過載”的問題,阻礙數(shù)據(jù)的共享、再利用。針對(duì)這一可能出現(xiàn)的問題,中心正在基于知識(shí)圖譜、人工智能開發(fā)數(shù)據(jù)推薦技術(shù),通過對(duì)用戶研究領(lǐng)域、瀏覽記錄等進(jìn)行分析,為用戶推薦可能感興趣的科學(xué)數(shù)據(jù)、科研項(xiàng)目等信息,從而促進(jìn)科學(xué)數(shù)據(jù)的共享、再利用。

4.2 平臺(tái)應(yīng)用效果

計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)已于2021年6月投入運(yùn)行,系統(tǒng)截圖如圖7所示。截至2021年9月,系統(tǒng)已登記注冊(cè)機(jī)構(gòu)350家、機(jī)構(gòu)管理員113名、用戶107名,實(shí)現(xiàn)了對(duì)計(jì)量領(lǐng)域192個(gè)項(xiàng)目/課題科學(xué)數(shù)據(jù)的匯交,極大地提升了計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)管理水平。

圖7 計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)截圖

通過對(duì)系統(tǒng)已有數(shù)據(jù)的分析可以發(fā)現(xiàn),目前系統(tǒng)匯交的計(jì)量科學(xué)數(shù)據(jù)中60%以上為儀器制造類數(shù)據(jù),包括測(cè)試數(shù)據(jù)、比對(duì)數(shù)據(jù)、論文、專利、測(cè)試報(bào)告等。在科學(xué)數(shù)據(jù)共享服務(wù)方面,目前系統(tǒng)服務(wù)對(duì)象主要為項(xiàng)目組成員、計(jì)量領(lǐng)域/跨領(lǐng)域科研人員以及計(jì)量領(lǐng)域第三方實(shí)驗(yàn)室,并根據(jù)三類服務(wù)對(duì)象的不同需求,系統(tǒng)提供了不同的共享服務(wù)方案。

(1)項(xiàng)目組成員。主要需求為項(xiàng)目數(shù)據(jù)的系統(tǒng)存儲(chǔ)和整理加工,以便后續(xù)開展成果轉(zhuǎn)化和推廣應(yīng)用。針對(duì)這一需求,中心將基于匯交系統(tǒng)將深入分析每個(gè)匯交項(xiàng)目,與項(xiàng)目組建立密切聯(lián)系,根據(jù)需求為其提供定制化的信息推送服務(wù)。

(2)計(jì)量領(lǐng)域/跨領(lǐng)域科研人員。主要需求為特定科學(xué)數(shù)據(jù)的獲取及分析。這一需求可由匯交系統(tǒng)自身的數(shù)據(jù)檢索功能實(shí)現(xiàn),此外中心還將基于匯交數(shù)據(jù)定期編制計(jì)量領(lǐng)域各細(xì)分方向的研究報(bào)告,為用戶提供數(shù)據(jù)共享、分析服務(wù)。

(3)計(jì)量領(lǐng)域第三方實(shí)驗(yàn)室。主要需求為計(jì)量行業(yè)發(fā)展趨勢(shì)、細(xì)分領(lǐng)域的技術(shù)指標(biāo)及市場(chǎng)需求分析。針對(duì)這一需求,中心將通過匯交系統(tǒng)開展數(shù)據(jù)分析,為用戶提供定制化的分析報(bào)告。

5 對(duì)科學(xué)數(shù)據(jù)匯交工作的建議

5.1 堅(jiān)持標(biāo)準(zhǔn)先行

基于數(shù)據(jù)生命周期管理角度,圍繞科學(xué)數(shù)據(jù)產(chǎn)生、匯交、管理、應(yīng)用等各環(huán)節(jié),在現(xiàn)有科學(xué)數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)體系基礎(chǔ)上,細(xì)化制定適合計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)管理的標(biāo)準(zhǔn),實(shí)現(xiàn)對(duì)計(jì)量科學(xué)數(shù)據(jù)更加規(guī)范、統(tǒng)一、高效的管理。

5.2 強(qiáng)化技術(shù)支撐

提高科學(xué)數(shù)據(jù)共享平臺(tái)的管理水平,通過數(shù)據(jù)標(biāo)簽等手段對(duì)科學(xué)數(shù)據(jù)實(shí)行分級(jí)分類管理,運(yùn)用數(shù)據(jù)認(rèn)證技術(shù)加強(qiáng)對(duì)數(shù)據(jù)完整性的核驗(yàn),在實(shí)現(xiàn)對(duì)科學(xué)數(shù)據(jù)合理管控的同時(shí)保證數(shù)據(jù)的可用性。強(qiáng)化平臺(tái)數(shù)據(jù)處理能力,為科研人員提供在線數(shù)據(jù)分析服務(wù)。嘗試引入?yún)^(qū)塊鏈技術(shù),憑借其不可篡改、可追溯的特點(diǎn),強(qiáng)化科學(xué)數(shù)據(jù)保護(hù)能力,減少學(xué)術(shù)不端、侵犯知識(shí)產(chǎn)權(quán)等事件的發(fā)生,提升科研人員共享科研數(shù)據(jù)的意愿。

5.3 培育數(shù)據(jù)共享生態(tài)

圍繞科學(xué)數(shù)據(jù)的共享和應(yīng)用,舉辦科學(xué)數(shù)據(jù)大會(huì)、科學(xué)數(shù)據(jù)應(yīng)用大賽等活動(dòng),為科研人員提供交流科學(xué)數(shù)據(jù)共享、應(yīng)用經(jīng)驗(yàn)的平臺(tái),營造良好的科學(xué)數(shù)據(jù)共享、應(yīng)用氛圍。此外,以科學(xué)數(shù)據(jù)為中心,通過知識(shí)圖譜、人工智能等技術(shù)進(jìn)一步分析科研機(jī)構(gòu)、科研人員之間的聯(lián)系,發(fā)現(xiàn)潛在合作機(jī)會(huì),推動(dòng)同一研究領(lǐng)域的科研人員、機(jī)構(gòu)之間形成高度互信的合作關(guān)系,在此基礎(chǔ)上逐步培育數(shù)據(jù)提供者、數(shù)據(jù)管理者、數(shù)據(jù)使用者密切協(xié)作的科學(xué)數(shù)據(jù)共享生態(tài)。

5.4 推動(dòng)科學(xué)數(shù)據(jù)市場(chǎng)化配置

強(qiáng)調(diào)需求導(dǎo)向,完善科學(xué)數(shù)據(jù)供需對(duì)接相關(guān)功能,暢通科研人員尋求、獲取科學(xué)數(shù)據(jù)的渠道,通過需求帶動(dòng)數(shù)據(jù)共享。研究根據(jù)數(shù)據(jù)性質(zhì)完善產(chǎn)權(quán)性質(zhì),探索建立規(guī)范化數(shù)據(jù)交易平臺(tái),如對(duì)于政府資金支持下產(chǎn)生的科學(xué)數(shù)據(jù),其交易收入可用于支持平臺(tái)運(yùn)作;對(duì)于非政府資金支持科研項(xiàng)目所取得的數(shù)據(jù),其收益歸數(shù)據(jù)生產(chǎn)者,以此進(jìn)一步激發(fā)科研人員和科研機(jī)構(gòu)創(chuàng)造、共享科研數(shù)據(jù)的積極性。

6 結(jié)語

本文對(duì)我國計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)匯交和計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)及其數(shù)據(jù)共享與應(yīng)用進(jìn)行闡釋,并且計(jì)量科學(xué)數(shù)據(jù)匯交系統(tǒng)的總體框架和基于元數(shù)據(jù)的開發(fā)理念在系統(tǒng)建設(shè)過程中得到了充分的驗(yàn)證,系統(tǒng)技術(shù)思路和架構(gòu)滿足了計(jì)量科學(xué)數(shù)據(jù)匯交需求。目前,系統(tǒng)已部署上線,成功完成了多個(gè)計(jì)量科研項(xiàng)目的科學(xué)數(shù)據(jù)匯交工作。隨著計(jì)量科學(xué)數(shù)據(jù)匯交工作的進(jìn)一步深入,國家計(jì)量科學(xué)數(shù)據(jù)中心將繼續(xù)探索區(qū)塊鏈、人工智能等新一代信息技術(shù)在科學(xué)數(shù)據(jù)匯交領(lǐng)域的應(yīng)用,提升計(jì)量領(lǐng)域科學(xué)數(shù)據(jù)管理水平,為計(jì)量科學(xué)數(shù)據(jù)的開放共享和價(jià)值挖掘提供有力支撐。

猜你喜歡
數(shù)據(jù)管理計(jì)量科學(xué)
基于大數(shù)據(jù)管理的管道智慧檢驗(yàn)系統(tǒng)的研發(fā)及應(yīng)用
企業(yè)級(jí)BOM數(shù)據(jù)管理概要
定制化汽車制造的數(shù)據(jù)管理分析
計(jì)量檢定在食品行業(yè)中的重要性
CPMF-I 取樣式多相流分離計(jì)量裝置
CTCS-2級(jí)報(bào)文數(shù)據(jù)管理需求分析和實(shí)現(xiàn)
點(diǎn)擊科學(xué)
科學(xué)大爆炸
計(jì)量自動(dòng)化在線損異常中的應(yīng)用
科學(xué)拔牙
元阳县| 高要市| 镇平县| 易门县| 宁南县| 于都县| 台中市| 南汇区| 仙桃市| 兴隆县| 沭阳县| 渝中区| 阳泉市| 江源县| 诸暨市| 上高县| 洞口县| 四川省| 夹江县| 灵山县| 资中县| 襄城县| 正镶白旗| 兴化市| 崇信县| 榕江县| 醴陵市| 临海市| 环江| 呈贡县| 盖州市| 临清市| 申扎县| 安达市| 饶平县| 邯郸市| 泰安市| 雷州市| 蒙阴县| 九台市| 屏东市|