国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向科學數(shù)據(jù)保存的科學數(shù)據(jù)評價指標體系研究

2022-01-20 09:42:18孟銀濤趙蕾霞于倩倩
農(nóng)業(yè)圖書情報學刊 2021年12期
關(guān)鍵詞:數(shù)據(jù)管理指標體系權(quán)重

孟銀濤,趙蕾霞,于倩倩

(1.國際關(guān)系學院圖書館,北京 100091;2.河北經(jīng)貿(mào)大學圖書館,石家莊 050061;3.中國科學院文獻情報中心,北京 100190)

1 引言

科學數(shù)據(jù)在支撐科學研究、促進社會經(jīng)濟發(fā)展、服務國家創(chuàng)新方面發(fā)揮了越來越重要的作用。當前,以大數(shù)據(jù)、云計算為代表的現(xiàn)代信息技術(shù)方興未艾,人工智能、5G 網(wǎng)絡等技術(shù)被廣泛應用于國計民生的各個行業(yè),這些技術(shù)的應用離不開包括科學數(shù)據(jù)在內(nèi)的底層數(shù)據(jù)支持。隨著科學研究的迅猛發(fā)展,科學數(shù)據(jù)也呈爆發(fā)式增長趨勢,科學數(shù)據(jù)價值的實現(xiàn)離不開高效的科學數(shù)據(jù)管理。

科學數(shù)據(jù)管理是指利用計算機、信息和網(wǎng)絡等技術(shù)對科學數(shù)據(jù)進行收集、存儲、加工處理和共享應用的過程[1]??茖W數(shù)據(jù)管理貫穿科學數(shù)據(jù)生命周期的全過程。國外科學數(shù)據(jù)管理研究開展的較早,并發(fā)展迅速。1960 年美國成立國家大氣研究中心,開始對地球科學數(shù)據(jù)的建模、收藏和保存工作[2]。2013 年12 月,歐盟啟動“地平線2020”計劃,旨在整合歐盟各國的科研資源,提升歐盟科技競爭力,提高科技成果轉(zhuǎn)化效率,進一步推動歐盟“開放科學”戰(zhàn)略[3]。20 世紀80 年代以來,中國也逐漸提高對科學數(shù)據(jù)管理的重視。1982年,中國科學院最早提出了建設(shè)科學數(shù)據(jù)庫項目[4],1999 年,科技部啟動了科技基礎(chǔ)數(shù)據(jù)庫建設(shè)[5]。2018年3 月國務院頒布了《科學數(shù)據(jù)管理辦法》[6],2019年2 月,中國科學院編制《中國科學院科學數(shù)據(jù)管理與開放共享辦法(試行)》[7],這些舉措為加強科學數(shù)據(jù)管理,保障科學數(shù)據(jù)安全,提高科學數(shù)據(jù)開放共享水平提供了制度規(guī)范。

然而,并非所有的科學數(shù)據(jù)都需要保存和管理,科學數(shù)據(jù)受研究人員科研水平、科研設(shè)備、研究方法等因素的影響,數(shù)據(jù)質(zhì)量良莠不齊,長期保存數(shù)據(jù)和組織、描述、維護數(shù)據(jù)的成本也比較高,對科學數(shù)據(jù)進行評估和篩選是科學數(shù)據(jù)高效管理的前提保障。

2 研究回顧

科學數(shù)據(jù)評價是科學數(shù)據(jù)高效管理的重要環(huán)節(jié)。國內(nèi)外已有相當數(shù)量機構(gòu)和學者圍繞科學數(shù)據(jù)質(zhì)量、安全、影響力等方面做了相關(guān)研究。

2.1 國外研究回顧

國外學者和機構(gòu)從科學數(shù)據(jù)利益相關(guān)者、數(shù)據(jù)質(zhì)量、學科屬性等多個維度對科學數(shù)據(jù)評價方法進行了探討。在科學數(shù)據(jù)質(zhì)量評價方面,國外學者提出了數(shù)據(jù)評估框架[8];分析了評估數(shù)據(jù)質(zhì)量的方法,指出每種方法適用的信息系統(tǒng)類型[9];制定層次化數(shù)據(jù)質(zhì)量框架,并構(gòu)建數(shù)據(jù)質(zhì)量的動態(tài)評估流程[10];提出了醫(yī)療數(shù)據(jù)可信性評估模型(Medical Data Trustworthiness Assessment Model,MDTA),用以提升醫(yī)療數(shù)據(jù)的可信性[11],等等,這些研究豐富了科學數(shù)據(jù)評價方法,促進了數(shù)據(jù)質(zhì)量的提高??茖W數(shù)據(jù)安全既包括數(shù)據(jù)本身安全,也包括科學數(shù)據(jù)管理和服務參與者、工具及外部運行條件安全,在科學數(shù)據(jù)安全上,美國制定《隱私影響評估指南》[12],英國制定《隱私影響評估實踐指導守則》[13]等,旨在從制度層面強化數(shù)據(jù)安全。在科學數(shù)據(jù)影響力評價上,國外一些機構(gòu)構(gòu)建了指標體系,如KE(Knowledge Exchange,歐洲知識交流)的數(shù)據(jù)影響力計量概念模型[14],DUI(Data Usage Index,數(shù)據(jù)使用索引)[15]等。

實踐層面,美國政府于2002 年頒布“數(shù)據(jù)質(zhì)量法案”,以立法形式保障數(shù)據(jù)質(zhì)量[16];威爾士政府于2004年頒布了旨在提高所有普通醫(yī)療實踐信息質(zhì)量的《數(shù)據(jù)質(zhì)量倡議框架》[17]。英國布里斯托大學參照數(shù)據(jù)特殊科學性或歷史性、數(shù)據(jù)唯一性、重用價值、不易復制性、經(jīng)濟原因等多個維度制定了問答式《研究數(shù)據(jù)評估指南》,為研究人員和數(shù)據(jù)管理人員提供數(shù)據(jù)評估參考[18]。美國國家海洋和大氣管理局(NOAA)發(fā)布了“信息質(zhì)量 指南”[19],荷蘭ELEFTHERIA 等[20]于2018年12 月制定了“基于FAIR 原則的DANS EASY 知識庫評估方法”等。

2.2 國內(nèi)研究回顧

國內(nèi)學者利用引文分析法、生命周期理論、網(wǎng)絡與實地調(diào)查分析等多種研究方法,對科學數(shù)據(jù)質(zhì)量的評估方法進行研究:①基于計量數(shù)據(jù)的評價研究,如丁楠等借鑒引文分析方法,選取數(shù)據(jù)發(fā)布量、數(shù)據(jù)被引量、數(shù)據(jù)平均被引頻次及h 指數(shù)等指標,構(gòu)建了基于引用的數(shù)據(jù)評價體系[21];余厚強等梳理了替代計量數(shù)據(jù)生產(chǎn)流程,構(gòu)建了以準確性、及時性、復現(xiàn)性、透明性和一致性為評估維度的一級數(shù)據(jù)質(zhì)量評估體系和其下屬的二級指標體系,并歸納出具體的終端評估維度[22]。②面向科學數(shù)據(jù)中心的評價研究,如江洪等選取國內(nèi)外15 家科學數(shù)據(jù)中心的科學數(shù)據(jù)質(zhì)量評價指標,引入科學數(shù)據(jù)生命周期理論構(gòu)建了由數(shù)據(jù)管理計劃、數(shù)據(jù)收集管理等5 個維度組成的科學數(shù)據(jù)質(zhì)量評價指標模型[23]。③面向數(shù)據(jù)選擇與可用性評價研究,如崔旭等對數(shù)據(jù)選擇與評價的關(guān)鍵構(gòu)成要素,包括選擇與評價政策、評價標準和評價決策過程進行了分析,并研究了數(shù)據(jù)創(chuàng)建者、數(shù)據(jù)管理者等角色的職能定位[24];李曉彤等通過對北京、廣州和哈爾濱三地1 900 多個數(shù)據(jù)集的調(diào)查分析,歸納出影響數(shù)據(jù)可用性的16 類質(zhì)量問題,進而構(gòu)建包括完整性、準確性等7個質(zhì)量維度和度量指標[25]。④面向開放數(shù)據(jù)質(zhì)量評價的研究,如周潔借鑒信息資源質(zhì)量評價指標體系和澳大利亞開放數(shù)據(jù)官方網(wǎng)站提供的數(shù)據(jù)質(zhì)量控制指標,構(gòu)建了由研究數(shù)據(jù)固有的內(nèi)在質(zhì)量等4 個一級指標和16 個二級指標構(gòu)成的研究數(shù)據(jù)的質(zhì)量評價指標框架[26]。

實踐層面,科技部2005 年發(fā)布了《科學數(shù)據(jù)共享工程質(zhì)量管理規(guī)范》,旨在指導“科學數(shù)據(jù)共享工程”數(shù)據(jù)、服務、運行管理及共享工程建設(shè)的質(zhì)量管理,在一定程度上規(guī)范了數(shù)據(jù)質(zhì)量評價的過程、方法及數(shù)據(jù)質(zhì)量評價報告的內(nèi)容。2018 年3 月國務院頒布了《科學數(shù)據(jù)管理辦法》[27],為科學數(shù)據(jù)管理提供了制度保障。

總體上,國外科學數(shù)據(jù)評價研究具有一定的深度,從科學數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、數(shù)據(jù)影響力層面構(gòu)建了科學數(shù)據(jù)評價模型,并在政府層面立法保障科學數(shù)據(jù)評估;國內(nèi)學者從多角度、利用多種方法對科學數(shù)據(jù)質(zhì)量進行研究,并從數(shù)據(jù)選擇與可用性、數(shù)據(jù)質(zhì)量、科學數(shù)據(jù)生命周期角度創(chuàng)建科學數(shù)據(jù)評價方法。總結(jié)國內(nèi)外研究現(xiàn)狀,尚未有學者從科學數(shù)據(jù)保存角度去研究科學數(shù)據(jù)評價和構(gòu)建指標體系,科學數(shù)據(jù)保存是數(shù)據(jù)管理和服務的保障,是科學數(shù)據(jù)生命周期中的重要階段,直接影響科學數(shù)據(jù)的高效服務。為了支撐科學數(shù)據(jù)價值的持續(xù)、高質(zhì)量地發(fā)揮,立足科學數(shù)據(jù)長期保存及有效利用,基于科學數(shù)據(jù)長期保存生命周期,著眼于科學數(shù)據(jù)長期保存的鑒別、接收、保存、利用核心關(guān)鍵流程,文章從前人研究和網(wǎng)絡調(diào)研的基礎(chǔ)上,建立“面向科研數(shù)據(jù)保存的科學數(shù)據(jù)評價指標體系”,構(gòu)建包含“多因素”的科學數(shù)據(jù)評價指標體系;在專家調(diào)查法和層次分析法的基礎(chǔ)上對指標體系進行改進和權(quán)重設(shè)計,以期完善科學數(shù)據(jù)評價指標體系,為科學數(shù)據(jù)管理工作提供參考。

3 科學數(shù)據(jù)評價指標體系構(gòu)建

科學數(shù)據(jù)保存是數(shù)據(jù)共享利用的前提,是科學數(shù)據(jù)高質(zhì)量、高效率服務的基礎(chǔ)。研究在調(diào)研國內(nèi)外理論研究和實踐進展的基礎(chǔ)上,遴選出可能影響科學數(shù)據(jù)保存的指標,再通過專家調(diào)查法進行甄別完善,最后制定科學數(shù)據(jù)評價體系。

3.1 指標選取調(diào)研與分析

對科學數(shù)據(jù)遴選和保存是科學數(shù)據(jù)管理的前提,制定面向科學數(shù)據(jù)保存的數(shù)據(jù)評價指標體系是為了幫助數(shù)據(jù)管理人員、研究人員根據(jù)科學數(shù)據(jù)的價值對其進行分類,篩選出有價值的數(shù)據(jù)進行存儲。調(diào)研發(fā)現(xiàn),科學數(shù)據(jù)保存受多重因素影響,概括起來包括:①政策法律法規(guī)的要求,西方主要國家和地區(qū)如美國、歐盟、英國等都出臺了數(shù)據(jù)保護法律法規(guī),此外,相當數(shù)量的科研項目是受機構(gòu)、團體或個人資金資助,資助方往往對數(shù)據(jù)保存提出要求。②科學數(shù)據(jù)的質(zhì)量對數(shù)據(jù)保存與利用有極為重要的影響,保存失真、準確性低、質(zhì)量不可靠的數(shù)據(jù)毫無意義,此外,科學研究迅猛發(fā)展,理論技術(shù)與方法不斷更新,數(shù)據(jù)時效性等指標也顯著影響數(shù)據(jù)的質(zhì)量。③外部條件對科學數(shù)據(jù)管理的影響,數(shù)據(jù)存儲平臺、讀取設(shè)備和相關(guān)技術(shù)會對數(shù)據(jù)存取造成影響,一些研究數(shù)據(jù)可能會涉及到個人隱私、政治話題或商業(yè)信息,等等,這些外部條件會對科學數(shù)據(jù)保存造成一定的障礙。

3.1.1 影響科學數(shù)據(jù)保存的政策法律因素

數(shù)據(jù)管理人員、研究人員在決定是否保留和共享科學數(shù)據(jù)時往往受到多個政策影響:①研究經(jīng)費政策,大多數(shù)研究資助者均建議或要求研究人員在項目結(jié)束時應該保留和共享哪些數(shù)據(jù),例如,UKRI 要求“具有公認長期價值的數(shù)據(jù)應該得到保存,并保持訪問和利用,以供未來研究使用[28]”;②“數(shù)據(jù)保護法”的要求,例如,美國、威爾士等國家和地方政府立法要求保存科學數(shù)據(jù);③數(shù)據(jù)中心政策,項目負責人所屬機構(gòu)的科學數(shù)據(jù)中心一般要求其保留研究數(shù)據(jù);④學術(shù)出版商要求,在數(shù)據(jù)出版的趨勢下,越來越多的學術(shù)出版商要求保留和共享研究出版物數(shù)據(jù),例如,英國《自然》雜志將“作者在適當情況下向讀者迅速提供材料、數(shù)據(jù)和相關(guān)協(xié)議”列為學術(shù)出版前提條件之一。

3.1.2 影響科學數(shù)據(jù)保存的內(nèi)容質(zhì)量因素

結(jié)合對英美高校和科研機構(gòu)科學數(shù)據(jù)管理政策和實踐分析,歸納出影響科學數(shù)據(jù)內(nèi)容質(zhì)量因素可分為5類:①數(shù)據(jù)具有特殊科學性價值。科學數(shù)據(jù)具有重要的科學意義、社會意義或文化意義,可以從當前研究價值的證據(jù)中推斷出未來潛在用途。②數(shù)據(jù)的唯一性。在現(xiàn)有科學條件下,科研人員進行創(chuàng)新性或首創(chuàng)性科學研究形成的數(shù)據(jù)集的信息源是唯一或最完整的,如果數(shù)據(jù)集丟失,此信息將面臨風險。③數(shù)據(jù)具有較高的重用潛力。這些數(shù)據(jù)可能會引起廣泛的興趣,其可靠性和來源已得到保證。例如,數(shù)據(jù)與縱向研究有關(guān),采用了得到廣泛支持的技術(shù)格式,有足夠的元數(shù)據(jù),任何倫理問題都已得到解決。④數(shù)據(jù)不易復制。復制數(shù)據(jù)不可行,或者復制數(shù)據(jù)的成本非常高。例如,基于大量觀察得到的科學數(shù)據(jù),由于數(shù)據(jù)量大且未經(jīng)格式化處理,數(shù)據(jù)復制較難實現(xiàn)。⑤保留數(shù)據(jù)有很強的經(jīng)濟理由。管理和保存數(shù)據(jù)的成本和技術(shù)條件可控,在根據(jù)潛在未來收益進行評估時,成本可以接受。

3.1.3 影響科學數(shù)據(jù)保存的支撐因素

科學數(shù)據(jù)保存支撐因素是指能夠影響科學數(shù)據(jù)存儲、讀取和利用的外部環(huán)境因素,該因素與法律法規(guī)規(guī)定、隱私保護、存儲環(huán)境、存儲技術(shù)、數(shù)據(jù)讀取工具等相關(guān):①科學數(shù)據(jù)在存儲環(huán)境、條件與技術(shù)上有無障礙或問題。②科學數(shù)據(jù)的讀取是否受到法律、法規(guī)、政策或隱私限制的制約。③科學數(shù)據(jù)存儲、讀取是否依賴于專業(yè)技術(shù)或?qū)S迷O(shè)備。

3.2 指標體系選取與構(gòu)建

3.2.1 指標初步選取

根據(jù)2.1 部分的調(diào)研,在匯總可能影響科學數(shù)據(jù)保存的因素的基礎(chǔ)上,將影響因素按影響程度、性質(zhì)和作用分為強制性因素、內(nèi)容因素和支撐因素,初步選取法定因素、重用價值等8 個一級指標,政策引用、學術(shù)引用、數(shù)據(jù)準確性等34 個二級指標。

3.2.2 指標體系的完善

指標選取后,邀請科學數(shù)據(jù)管理領(lǐng)域研究專家對指標科學性進行評價,根據(jù)專家建議,將一些內(nèi)容有交叉的指標進行合并和去重,增加一些體系中缺少但有價值的指標。例如,“法律強制保存”和“法律禁止”都是對法律因素的概括,將二者合并為“法律要求”;一級指標“存儲限制”下“資金保障”和“存儲環(huán)境保障”均是對存儲條件的要求,故二者合并為“存儲條件保障”;去掉“技術(shù)限制”指標下內(nèi)容有重復的“格式多樣性”指標。此外,在“數(shù)據(jù)可靠性”指標下增加“數(shù)據(jù)純凈性”指標,該指標能夠反映數(shù)據(jù)有無噪音及噪音的大小。最終確定指標體系為8 個一級指標,32 個二級指標,此指標體系能夠基本覆蓋科學數(shù)據(jù)評價的指標空間,如圖1 所示。

圖1 面向科學數(shù)據(jù)保存的科學數(shù)據(jù)評價指標體系Fig.1 Evaluation index system of scientific data for scientific data preservation

3.3 評價指標的含義

3.3.1 強制性因素

強制性因素是指必須依照法律適用、不能以個人意志予以變更和排除適用的因素,主體沒有自行選擇的余地。強制性因素包含法定因素和政策因素2 個一級指標,該指標反映的是科學數(shù)據(jù)相關(guān)法律、法規(guī)和政策,以及科研資助方對科學數(shù)據(jù)保存的影響。該指標包含“法律要求”“數(shù)據(jù)政策”“政策引用”等7 個二級指標。

3.3.2 內(nèi)容因素

內(nèi)容因素反映了科學數(shù)據(jù)的質(zhì)量,科學數(shù)據(jù)內(nèi)容的好壞決定科學數(shù)據(jù)質(zhì)量,是評判數(shù)據(jù)價值的重要因素。此類目包含“重用價值”“研究價值”和“數(shù)據(jù)可靠性”3 個一級指標,“重用價值”指科學數(shù)據(jù)能夠被重復利用的價值,該指標共包含“不可復制性”“研究興趣”“特殊學術(shù)價值”3 個二級指標,即科學數(shù)據(jù)是否容易獲取、是否可以推動研究興趣、是否具有引導開創(chuàng)性學術(shù)價值的作用,決定了該數(shù)據(jù)或數(shù)據(jù)集是否具有重用價值?!把芯績r值”體現(xiàn)了科學數(shù)據(jù)在科學研究中能夠發(fā)揮的作用,該指標價值體現(xiàn)在數(shù)據(jù)的引用價值、增加已有數(shù)據(jù)集的價值、推進當前研究進展、預測未來研究方向上,共包含“學術(shù)引用”等4 個二級指標。數(shù)據(jù)可靠性反映了數(shù)據(jù)自身的質(zhì)量,如果某一數(shù)據(jù)或數(shù)據(jù)集自產(chǎn)生之初就是錯誤、不可靠或是失去時效的,那么保存該數(shù)據(jù)毫無意義,數(shù)據(jù)可靠性由數(shù)據(jù)的準確、時效、完整、安全、純凈、元數(shù)據(jù)、價值量、長期價值等8 個二級指標組成。

3.3.3 支撐因素

支撐因素是指讀取、訪問或使用數(shù)據(jù)時的保障性因素,該指標包含“存儲限制”“訪問限制”“技術(shù)限制”3 個一級指標?!按鎯ο拗啤狈从沉丝茖W數(shù)據(jù)在保存過程中可能會遇到的障礙因素,例如科學數(shù)據(jù)中心的存儲環(huán)境、資金保障,科學數(shù)據(jù)結(jié)構(gòu)和技術(shù)標準是否與數(shù)據(jù)中心的標準相匹配等均會影響科學數(shù)據(jù)保存,該指標共包含“易存儲性”等3 個二級指標?!霸L問限制”反映了數(shù)據(jù)用戶在使用科學數(shù)據(jù)時是否會受到各類限制,這些限制可能會來自政策法律、個人倫理、商業(yè)協(xié)議等,例如對病人醫(yī)療數(shù)據(jù)進行分析,雖然可能會推動醫(yī)學進展,但該行為涉及病人隱私權(quán),在讀取和利用這類數(shù)據(jù)時不得不采取審慎態(tài)度,該指標包含“隱私許可”等4 個二級指標?!凹夹g(shù)限制”是指在科學數(shù)據(jù)存取過程中所遇到的技術(shù)障礙或所需要的技術(shù)設(shè)備,科學數(shù)據(jù)存取越簡單、越不依賴于復雜技術(shù)設(shè)備,則該數(shù)據(jù)越有可能長期保存,從而發(fā)揮其長期價值,該指標包含“技術(shù)適用性”等3 個二級指標。具體指標含義如表1 所示。

表1 科學數(shù)據(jù)評價指標釋義表Table 1 Interpretation table of evaluation indicators for scientific data

4 層次分析法與應用原理

4.1 層次分析法

層次分析法(Analytic Hierarchy Process,簡稱AHP),是指將一個復雜的多目標決策問題作為一個系統(tǒng),將目標分解為多個目標或準則,進而分解為多指標的若干層次,通過定性指標模糊量化方法算出層次單排序和總排序,以作多指標、多方案優(yōu)化決策的系統(tǒng)方法[29]。層次分析法將定性與定量方法結(jié)合起來,量化專家經(jīng)驗,以提高決策效率。

4.2 層次分析法原理及步驟

4.2.1 建立層次結(jié)構(gòu)模型

將決策的目標、考慮的因素和決策對象按它們之間的相互關(guān)系分為最高層、中間層和最低層,繪出層次結(jié)構(gòu)圖(圖1),在科學數(shù)據(jù)評價體系中,最高層、中間層和最低層分別對應目標層和一二級指標。

4.2.2 構(gòu)建判斷矩陣

在確定各層次因素之間的權(quán)重時,定性的結(jié)果不易被接受,因而通常采取一致矩陣法,讓因素兩兩相互比較,采用相對尺度,減少不同性質(zhì)的因素相互比較的困難,以提高準確度。如對法定因素和政策因素進行兩兩對比,并按其重要性程度評定等級。aij為要素i 與要素j 重要性比較結(jié)果,按兩兩比較結(jié)果構(gòu)成的矩陣稱作判斷矩陣。判斷矩陣的性質(zhì):aij=1/aji。表2 為因素比例標度表。

表2 因素比例標度表Table 2 Factor proportional scale

4.2.3 一致性檢驗

一致性檢驗是指對由不同樣本計算的各平均值或方差進行檢驗,即確定在一定顯著性水平下各平均值或各方差之間是否有顯著性差異,若無顯著性差異,則各平均值或各方差是一致的,稱為一致性檢驗。

判斷矩陣最大特征根λmax的特征向量,經(jīng)歸一化(使向量中各元素之和等于1)后記為W,λmax對應于歸一化特征向量W 的分向量W1,W2,…,Wn就是本層級指標相對重要性的權(quán)重值,即指標單排序權(quán)重。能否確認層次單排序,需要進行一致性檢驗,即對矩陣A確定不一致的允許范圍。n 階一致陣的唯一非零特征根為n;n 階正互反陣A 的最大特征根λ≥n,當且僅當λ=n 時,A 為一致矩陣。

一致性指標用CI 計算,CI 越小,說明一致性越大。定義一致性指標為:CI=(λ-n)/(n-1)。CI=0,有完全的一致性;CI 接近于0,有滿意的一致性;CI越大,越不一致。為衡量CI 的大小,引入隨機一致性指標RI,RI=(CI1+CI2…+CIn)/n,隨機一致性指標RI和判斷矩陣的階數(shù)有關(guān),一般情況下,矩陣階數(shù)越大,則出現(xiàn)一致性隨機偏離的可能性也越大,其對應關(guān)系如表3 所示。

表3 平均隨機一致性指標標準值RITable 3 Average random consistency index standard value RI

在檢驗判斷矩陣是否具有滿意的一致性時,還需將CI 和隨機一致性指標RI 進行比較,得出檢驗系數(shù)CR,CR=CI/RI。如果CR<0.1,則認為該判斷矩陣通過一致性檢驗,否則就不具有滿意一致性。

5 實證分析

文章采用網(wǎng)絡調(diào)查法和專家調(diào)查法選取科學數(shù)據(jù)評價指標,再通過專家打分,依靠專家智慧來評判指標重要性,最后運用層次分析法計算各指標權(quán)重。

5.1 專家選取

文章構(gòu)建指標體系的目的是為了確定影響科學數(shù)據(jù)評價因素的重要性,科學數(shù)據(jù)評價屬于科學數(shù)據(jù)管理工作的重要一環(huán),需要多方參與才能完成。據(jù)此,文章選取科學數(shù)據(jù)管理領(lǐng)域研究專家、數(shù)據(jù)分析專家、科學數(shù)據(jù)中心管理人員、科研人員、圖書館員等各2名,組建一個由10 名科學數(shù)據(jù)管理專家組成的評估團隊,這些專家均在各自領(lǐng)域?qū)茖W數(shù)據(jù)管理有研究,并對科學數(shù)據(jù)評價有一定的認識和理解。

5.2 指標權(quán)重計算

通過構(gòu)建判斷矩陣,先確定每一位專家對體系中指標權(quán)重的打分情況,再按照各專家排序向量加權(quán)幾何平均的方法確定指標的最終權(quán)重,各判斷矩陣均通過一致性檢驗。具體指標權(quán)重如表4 所示。

表4 面向科學數(shù)據(jù)保存的科學數(shù)據(jù)評價指標體系及權(quán)重Table 4 Evaluation index system and weight of scientific data for scientific data preservation

5.3 指標權(quán)重重要性分析

5.3.1 一級指標權(quán)重分析

經(jīng)計算得出一級指標權(quán)重從高到低排序為:“數(shù)據(jù)可靠性(0.299 7)”“研究價值(0.245 2)”“法定因素(0.148 3)”“重用價值(0.095 2)”“政策因素(0.0934)”“訪問限制(0.0496)”“技術(shù)限制(0.0416)”“存儲限制(0.027 1)”??梢钥闯觥皵?shù)據(jù)可靠性”和“研究價值”兩個一級指標的權(quán)重相加超過了0.5,說明科學數(shù)據(jù)的內(nèi)容質(zhì)量對科學數(shù)據(jù)評價有非常大的影響。“法定因素”“重用價值”和“政策因素”緊隨其后排在了第二梯隊,“重用價值”屬于內(nèi)容質(zhì)量,“法定因素”和“政策因素”排名靠前說明與數(shù)據(jù)有關(guān)的法律法規(guī)和政策對科學數(shù)據(jù)管理特別是數(shù)據(jù)存儲方面有重要影響,也是科學數(shù)據(jù)評價的重要指標?!霸L問限制”“技術(shù)限制”和“存儲限制”都屬于支撐因素,指標權(quán)重排在最后,隨著社會經(jīng)濟和科技不斷發(fā)展,技術(shù)和軟硬件設(shè)備對科學數(shù)據(jù)保存的影響在逐漸降低,而非技術(shù)因素如“商業(yè)限制”“隱私許可”等對科學數(shù)據(jù)保存的影響在逐漸增加。

5.3.2 二級指標權(quán)重分析

(1)二級指標權(quán)重概括分析。二級指標共32 個,權(quán)重排名前三位的分別為“價值累加(0.128 2)”“數(shù)據(jù)準確性(0.111 5)”和“法律要求(0.064 6)”,說明在科學數(shù)據(jù)評價中數(shù)據(jù)的內(nèi)容質(zhì)量和數(shù)據(jù)準確性是最為重要的,科學數(shù)據(jù)管理者也需要投入更多關(guān)注;在非內(nèi)容因素方面,與數(shù)據(jù)有關(guān)的法律法規(guī)對科學數(shù)據(jù)評價與管理至關(guān)重要,隨著國內(nèi)立法不斷完善,科學數(shù)據(jù)管理者應熟知并依照法律法規(guī)開展科學數(shù)據(jù)管理與服務。二級指標權(quán)重具體排名如圖2 所示。

圖2 科學數(shù)據(jù)評價指標體系二級指標權(quán)重排序圖Fig.2 Second-level index weight ranking chart of scientific data evaluation index system

(2)二級指標權(quán)重分類說明。“法定因素”指標下“法律要求(0.064 6)”權(quán)重最高,說明科學數(shù)據(jù)保存受到法律法規(guī)約束;“政策因素”中“合同義務(0.030 1)”權(quán)重最高,科學研究各相關(guān)方往往會簽署合同或協(xié)議,內(nèi)容包含科學數(shù)據(jù)是否保留;“重用價值”中“特殊學術(shù)價值(0.051 1)”權(quán)重最高,在數(shù)據(jù)密集型科學研究范式中,科學數(shù)據(jù)的作用引人矚目,可以有效支持開創(chuàng)性學術(shù)研究;“研究價值”中“價值累加(0.128 2)”權(quán)重最高,當科學數(shù)據(jù)能夠增進已有數(shù)據(jù)集的價值時,數(shù)據(jù)應當被保存;“數(shù)據(jù)可靠性”中“數(shù)據(jù)準確性(0.111 5)”“數(shù)據(jù)時效性”權(quán)重排名靠前,在專家看來,科學數(shù)據(jù)是否準確可靠、是否具有時效性能夠深度影響數(shù)據(jù)去留?!爸我蛩亍彪m然在總指標體系中權(quán)重排名靠后,但其中一些指標仍然在科學數(shù)據(jù)評價中占有重要位置,例如,“商業(yè)限制(0.020 8)”“技術(shù)適用性(0.016 2)”“條件適應性(0.011 6)”分別在各自的一級指標中權(quán)重最高,這些因素對科學數(shù)據(jù)評價的影響也不容忽視。

綜上所述,文章構(gòu)建的科學數(shù)據(jù)評價指標體系反映了專家對影響科學數(shù)據(jù)保存的因素的相對重要性進行了判斷,可用于指導科學數(shù)據(jù)保存工作,同時也對科研人員有所啟示:在科學研究中,應盡可能獲取全面、準確、價值大的數(shù)據(jù),以備后續(xù)研究或其他工作使用。

5.4 研究結(jié)論與建議

作為科學數(shù)據(jù)管理基礎(chǔ)的科學數(shù)據(jù)評估與保存是一項涉及眾多單位、較為復雜的工作,科學數(shù)據(jù)中心是科學數(shù)據(jù)的管理和保存單位,對科學數(shù)據(jù)質(zhì)量負有直接責任,但由于科學研究專深性強,產(chǎn)生的數(shù)據(jù)數(shù)量龐大,需要對該領(lǐng)域有較深研究才能甄別科學數(shù)據(jù)質(zhì)量,對科學數(shù)據(jù)的評價依賴于科研人員的深度參與。此外,政府部門、科研資助單位應分別在各自職能范圍對科學數(shù)據(jù)管理提出要求并予以支持。基于文章的研究發(fā)現(xiàn),提出以下對策和建議。

5.4.1 政府及社會各方力量應積極推動科學數(shù)據(jù)管理立法工作

根據(jù)文章研究結(jié)論,法律因素在指標體系中權(quán)重排名靠前,是科學數(shù)據(jù)保存關(guān)鍵因素之一??偨Y(jié)美國等西方國家的科學數(shù)據(jù)管理經(jīng)驗,多數(shù)都制定了完備的法律,讓科學數(shù)據(jù)管理各方有法可循,提升科學數(shù)據(jù)管理效率。在國內(nèi),2018 年4 月出臺的《科學數(shù)據(jù)管理辦法》明確了中國科學數(shù)據(jù)管理的總體原則、主要職責、數(shù)據(jù)采集匯交與保存、共享利用、保密與安全等方面內(nèi)容[30],填補了中國科學數(shù)據(jù)管理的法規(guī)空白,對提高科學數(shù)據(jù)管理水平,服務國家創(chuàng)新具有重要意義。同時,我們應當認識到行政法規(guī)的法律效力相較于法律偏低,法規(guī)的強制力不足,政府和社會各方力量應積極推動科學數(shù)據(jù)管理立法,規(guī)范科學數(shù)據(jù)管理各方的權(quán)利及義務,讓科學數(shù)據(jù)更好的服務于國家科技創(chuàng)新和經(jīng)濟社會發(fā)展。

5.4.2 提升科研能力,規(guī)范學術(shù)倫理,提高科學數(shù)據(jù)質(zhì)量

研究發(fā)現(xiàn),科學數(shù)據(jù)質(zhì)量和價值對科學數(shù)據(jù)管理和保存有至關(guān)重要的影響??茖W數(shù)據(jù)質(zhì)量與科研人員研究水平和學術(shù)倫理道德相關(guān),提高科學數(shù)據(jù)質(zhì)量一方面需要提升科研人員的研究能力,提升科研團隊的研究水平;另一方面,應規(guī)范科研人員學術(shù)倫理,防止出現(xiàn)學術(shù)造假現(xiàn)象,避免產(chǎn)生虛假科學數(shù)據(jù),這些需要政府、社會、科研機構(gòu)等單位多方參與。

5.4.3 發(fā)展數(shù)據(jù)存儲與安全技術(shù),推動科學數(shù)據(jù)共享與長期保存

在指標體系中,雖然技術(shù)因素在總權(quán)重中排名并不靠前,但數(shù)據(jù)存儲、加工、標引、讀取等技術(shù)對科學數(shù)據(jù)保存的影響也非常大,存儲環(huán)境、軟硬件設(shè)備安全等問題可能會對科學數(shù)據(jù)保存帶來毀滅性影響。此外,元數(shù)據(jù)標引、異構(gòu)數(shù)據(jù)間的共享與利用、數(shù)據(jù)安全技術(shù)等也在很大程度上影響科學數(shù)據(jù)管理與保存,應重視對這些技術(shù)的開發(fā)與利用。

6 總結(jié)與展望

在開放科學環(huán)境下,存儲及利用科學數(shù)據(jù)的意義重大,科學研究、經(jīng)濟發(fā)展、社會治理、國家創(chuàng)新等都需要大量的數(shù)據(jù)做支撐,這些需求離不開高效的科學數(shù)據(jù)管理,也依賴于科學數(shù)據(jù)評價指標體系甄別和遴選最有價值的數(shù)據(jù)。受研究能力和客觀條件影響,本研究有3 點不足:①科研人員參與數(shù)據(jù)評價工作的積極性會顯著影響科學數(shù)據(jù)評價體系的高效運用;②指標體系尚缺少量化指標;③評價體系無法完全滿足個性化評價需求,科學數(shù)據(jù)管理主體應依據(jù)自身需求和特色制定合適的評價標準。

在未來研究中,本研究將進一步挖掘影響科學數(shù)據(jù)評價的因素,探尋面向科學數(shù)據(jù)管理全領(lǐng)域的科學數(shù)據(jù)評價指標體系,并確定指標量化標準,增加定量指標比重,力求通過對指標的實際應用來進一步驗證和補充指標體系。

猜你喜歡
數(shù)據(jù)管理指標體系權(quán)重
企業(yè)級BOM數(shù)據(jù)管理概要
定制化汽車制造的數(shù)據(jù)管理分析
海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實踐
權(quán)重常思“浮名輕”
當代陜西(2020年17期)2020-10-28 08:18:18
CTCS-2級報文數(shù)據(jù)管理需求分析和實現(xiàn)
為黨督政勤履職 代民行權(quán)重擔當
基于公約式權(quán)重的截短線性分組碼盲識別方法
電信科學(2017年6期)2017-07-01 15:44:57
層次分析法在生態(tài)系統(tǒng)健康評價指標體系中的應用
供給側(cè)改革指標體系初探
層次分析法權(quán)重的計算:基于Lingo的數(shù)學模型
河南科技(2014年15期)2014-02-27 14:12:51
全州县| 兴化市| 榆中县| 永德县| 南澳县| 客服| 炉霍县| 哈尔滨市| 乌兰察布市| 滦平县| 灌云县| 江门市| 大渡口区| 芷江| 东乌珠穆沁旗| 老河口市| 内江市| 赤水市| 铜梁县| 济源市| 湖南省| 榆树市| 和田县| 汶川县| 巨野县| 抚顺县| 桃园市| 蒲江县| 德兴市| 宁蒗| 茂名市| 石景山区| 湘潭市| 边坝县| 馆陶县| 石城县| 延安市| 汾西县| 南京市| 三门县| 阿拉善左旗|