国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高??蒲许椖恐芷谥袛?shù)據(jù)質(zhì)量控制模式探究

2020-07-04 12:32:11唐晶屈文建
知識管理論壇 2020年1期
關(guān)鍵詞:數(shù)據(jù)質(zhì)量

唐晶 屈文建

摘要:[目的/意義]旨在為高校科研項目周期中數(shù)據(jù)質(zhì)量控制提供一種有效控制途徑與方法。[方法/過程]圍繞科研項目周期和數(shù)據(jù)質(zhì)量控制周期構(gòu)建數(shù)據(jù)質(zhì)量控制架構(gòu)體系,并在此體系之下從認知、管理、流程3個視角分別實施數(shù)據(jù)質(zhì)量控制,引入質(zhì)量差距模型、企業(yè)架構(gòu)模型和流程分析等控制方法,剖析高??蒲许椖恐芷谥锌蒲袛?shù)據(jù)質(zhì)量控制機理。[結(jié)果/結(jié)論] 構(gòu)建了適用于科研項目周期中高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系及其數(shù)據(jù)質(zhì)量控制模式,為高??蒲袛?shù)據(jù)質(zhì)量控制提供理論支撐。

關(guān)鍵詞:數(shù)據(jù)質(zhì)量? ? 科研項目周期? ? 科研環(huán)境? ? 質(zhì)量差距模型? ? 企業(yè)架構(gòu)模型

分類號:G250

引用格式:唐晶, 屈文建. 高校科研項目周期中數(shù)據(jù)質(zhì)量控制模式探究[J/OL]. 知識管理論壇, 2020, 5(1): 24-35[引用日期]. http://www.kmf.ac.cn/p/197/.

1? 引言

隨著第四科研范式環(huán)境即數(shù)據(jù)密集型科研環(huán)境的形成,科研數(shù)據(jù)量成指數(shù)型迅猛增長,數(shù)據(jù)表現(xiàn)形式多樣,對于科研人員來說,其所需存儲、處理的數(shù)據(jù)量驚人,數(shù)據(jù)來源和數(shù)據(jù)結(jié)構(gòu)繁多復(fù)雜,為推動科研項目的進程帶來了很大的阻礙[1]。且科研項目中充斥的數(shù)據(jù)資源來源復(fù)雜、存儲結(jié)構(gòu)多樣,各個科研項目團隊的數(shù)據(jù)共享技術(shù)兼容性差、數(shù)據(jù)管理意識不足,導(dǎo)致科研數(shù)據(jù)質(zhì)量低下、利用率不高。而高校具有得天獨厚的科研數(shù)據(jù)資源優(yōu)勢,是產(chǎn)生、利用科研數(shù)據(jù)從事科學(xué)研究的主力軍,因此,高校更需要加強數(shù)據(jù)密集型科研環(huán)境下數(shù)據(jù)質(zhì)量控制,并以此為基礎(chǔ)探索、構(gòu)建、完善國內(nèi)高校在數(shù)字化科研背景下的科研數(shù)據(jù)管理架構(gòu)與體系。

回顧國內(nèi)外高??蒲袛?shù)據(jù)質(zhì)量控制的研究歷程,研究成果集中于理論體系的建立以及實踐應(yīng)用。在高校科研數(shù)據(jù)質(zhì)量控制理論體系構(gòu)建方面,DAMA將數(shù)據(jù)質(zhì)量控制分為10個職能域,成為當(dāng)前較為被認可的數(shù)據(jù)管理知識體系[1];包冬梅等創(chuàng)新性地提出了高校圖書館數(shù)據(jù)治理框架——CALib框架,促進了高校圖書館數(shù)據(jù)資源有效利用[2];屈文建等基于Krantz理論建立了高校科研數(shù)據(jù)質(zhì)量控制架構(gòu)并剖析其作用機制,為高校科研團隊控制科研數(shù)據(jù)提供了有效理論支撐[3]。在實踐應(yīng)用方面,馬波等通過借鑒和總結(jié)歐美高校圖書館的科研數(shù)據(jù)管理實踐經(jīng)驗,提出了加強數(shù)據(jù)治理意識與基礎(chǔ)設(shè)施構(gòu)建、人才培養(yǎng)等策略,以期提高國內(nèi)高校科研數(shù)據(jù)治理水平[4];徐慧芳等通過調(diào)研國內(nèi)科研數(shù)據(jù)管理實踐并進行SWOT分析,從多個視角提出了國內(nèi)高校圖書館有效實施科研數(shù)據(jù)服務(wù)與質(zhì)量控制的途徑[5]。然而通過對已有研究的梳理可以發(fā)現(xiàn),在數(shù)字化科研背景下,科研數(shù)據(jù)管理作為高校圖書館及科研機構(gòu)新的業(yè)務(wù)生長點,其數(shù)據(jù)質(zhì)量控制模式在應(yīng)付海量的數(shù)據(jù)規(guī)模時還有較大的提升空間。

基于此,本文圍繞科研項目周期構(gòu)建高校科研數(shù)據(jù)質(zhì)量控制架構(gòu)體系,并從認知、管理、流程3個視角提出高??蒲袛?shù)據(jù)質(zhì)量控制模式,為促進我國科研機構(gòu)、圖書館等開展科研數(shù)據(jù)質(zhì)量工程提供理論參考。

2? 科研項目周期中實行數(shù)據(jù)質(zhì)量控制的必要性

2.1? 科研項目周期內(nèi)涵及其相關(guān)數(shù)據(jù)活動

科研項目生命周期是一種管理學(xué)意義上的項目生命周期,描述科研項目“計劃—立項—實施—結(jié)題”的發(fā)展階段和歷程。為便于后續(xù)研究,本文采用陸玉泉提出的科研項目生命周期劃分方法,將科研項目周期劃分為科研構(gòu)思、科研實施、成果整理和成果發(fā)表4個階段[6],如圖1所示,基于此來研究科研項目周期中的高校科研數(shù)據(jù)質(zhì)量控制。

(1)科研構(gòu)思階段??蒲袠?gòu)思階段是科研項目選題和申報立項的基礎(chǔ),它體現(xiàn)了科研項目團隊的研究能力和科研項目的新穎性、前沿性。這一階段的數(shù)據(jù)活動主要是數(shù)據(jù)資源采集。項目團隊需要進行大量科研數(shù)據(jù)搜集、確定項目干系人、科研項目選題及數(shù)據(jù)質(zhì)量規(guī)劃等前期研究相關(guān)工作,其中數(shù)據(jù)搜集來源主要依靠共享聯(lián)盟、主動上傳和直接獲取等方式[7],采集內(nèi)容包括但不限于:相關(guān)科研文獻資料閱讀、國內(nèi)外發(fā)展方向與研究動態(tài)跟蹤、技術(shù)可行性分析、市場調(diào)研等。

(2)科研實施階段。在科研實施階段,項目團隊需要根據(jù)科研構(gòu)思階段完成的科研規(guī)劃來進行學(xué)術(shù)論文撰寫、科學(xué)實驗開展等相關(guān)科研活動。這一階段是科研數(shù)據(jù)生產(chǎn)、發(fā)現(xiàn)的黃金時期,需要按照前期行動中得到的數(shù)據(jù)準則嚴格規(guī)范新建數(shù)據(jù),采取合適的數(shù)據(jù)處理工具對數(shù)據(jù)進行預(yù)處理,盡可能在早期獲得較高質(zhì)量的數(shù)據(jù)。

(3)成果整理階段。得到原始科研數(shù)據(jù)后,需借助數(shù)據(jù)挖掘、數(shù)據(jù)庫、數(shù)據(jù)質(zhì)量檢測識別等技術(shù)工具對數(shù)據(jù)進行提取、整合和挖掘,得到更精準的實驗結(jié)果,并以此為根據(jù)撰寫科研成果。對科研數(shù)據(jù)進行整合、分析與可視化,使其更直觀地反映事物之間的真實聯(lián)系是成果整理階段的工作重心。

(4)成果發(fā)表階段。經(jīng)過前期的努力與錘煉,項目團隊的科研成果成形,經(jīng)修改、調(diào)整后進入評議、審查和發(fā)表階段。這一階段主要由項目評審小組對科研成果質(zhì)量進行評議,審核通過后將科研數(shù)據(jù)上傳至共享聯(lián)盟等科研數(shù)據(jù)共享平臺,進行數(shù)據(jù)的存檔和分享,同時科研項目團隊在經(jīng)短暫休整后著手下一個科研項目的開展。

2.2? 科研項目周期中高??蒲袛?shù)據(jù)質(zhì)量問題及原因

科研數(shù)據(jù)作為高??蒲许椖恐芷谥械闹匾M成,盡管其質(zhì)量控制的重要性不斷被學(xué)者強調(diào),但在高??蒲许椖繉嵺`中仍存在諸多問題。數(shù)據(jù)錯誤、不完整、不一致、不及時是高??蒲袛?shù)據(jù)質(zhì)量的主要問題(見表1),其原因分為以下幾種:①科研數(shù)據(jù)來源復(fù)雜且類型多樣[6]。科研項目團隊成員大多來自不同學(xué)科,擁有不同學(xué)科背景,由此而生的科研數(shù)據(jù)來源復(fù)雜且未能有統(tǒng)一數(shù)據(jù)規(guī)范,數(shù)據(jù)孤島現(xiàn)象加劇,給數(shù)據(jù)的采集和整理帶來不小挑戰(zhàn)。②科研數(shù)據(jù)規(guī)模偏小。高??蒲许椖繄F隊產(chǎn)生的科研數(shù)據(jù)規(guī)模不大,但項目團隊數(shù)量眾多,使得項目團隊在數(shù)據(jù)發(fā)現(xiàn)中很難檢索到高質(zhì)量數(shù)據(jù)。③科研數(shù)據(jù)質(zhì)量控制意識不足。項目團隊成員的數(shù)據(jù)質(zhì)量管理的習(xí)慣尚未養(yǎng)成,在科研數(shù)據(jù)搜集能力、數(shù)據(jù)共享意識、數(shù)據(jù)安全意識等方面還存在一定欠缺。

綜合科研項目周期中數(shù)據(jù)質(zhì)量問題剖析和原因分析可知,要將無序、信息混亂的科研數(shù)據(jù)序化整合以供高校科研項目團隊重復(fù)利用,就必須針對存在的質(zhì)量問題提出一套基于準確性、完整性、一致性和及時性的可靠數(shù)據(jù)質(zhì)量評估標準,構(gòu)建數(shù)據(jù)質(zhì)量工程的實踐架構(gòu)體系,實現(xiàn)科研數(shù)據(jù)的創(chuàng)新增值、科研項目管理的效率提升和項目團隊質(zhì)量控制意識的提高。

2.3? 實施高校科研數(shù)據(jù)質(zhì)量控制的意義

結(jié)合高??蒲袛?shù)據(jù)自身特點、科研數(shù)據(jù)需求及科研環(huán)境等多方面情況,本文認為在高??蒲许椖恐芷谥袑嵤?shù)據(jù)質(zhì)量控制的意義主要表現(xiàn)在以下幾個方面:

(1)促進跨學(xué)科科研數(shù)據(jù)的組織與融合。由于科研項目研究的需要和項目成員自身學(xué)科背景的異質(zhì)性,科研數(shù)據(jù)普遍具有學(xué)科交叉和關(guān)聯(lián)的特點,這一特征使得數(shù)據(jù)管理相關(guān)標準難以制定或缺乏普適性,造成科研數(shù)據(jù)利用率低下。在科研項目周期中實施數(shù)據(jù)質(zhì)量控制有助于實施數(shù)據(jù)多維度組織,從不同維度對科研項目周期中不同階段的科研數(shù)據(jù)進行組織與分類,提高科研數(shù)據(jù)利用率。

(2)滿足高??蒲许椖繄F隊對高質(zhì)量數(shù)據(jù)的需求。對于高??蒲许椖繄F隊人員而言,有缺陷的、不完整的或誤導(dǎo)性的數(shù)據(jù)極有可能造成科學(xué)實驗的失敗,造成科研成本急劇上升,甚至項目無法結(jié)題。而準確、完整的科研數(shù)據(jù)在推動科研項目進程方面可起到事半功倍的效用,緩解項目團隊的科研壓力,提高數(shù)據(jù)的研究和使用價值。

(3)融入第四科研范式環(huán)境的必然要求。全新的科研范式下科研數(shù)據(jù)成為科學(xué)研究的基礎(chǔ)性資源[8]。已有的科研數(shù)據(jù)是新研究的寶貴資產(chǎn),對已有數(shù)據(jù)的整合、挖掘和再利用為學(xué)術(shù)研究提供了一種新的資源[9]。由此而生的高密集科研大數(shù)據(jù)對傳統(tǒng)的科研數(shù)據(jù)管理造成了巨大沖擊,因此在科研項目周期中構(gòu)建高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系、提高科研數(shù)據(jù)質(zhì)量是融入第四科研范式環(huán)境的必然要求。

3? 科研項目周期中高校科研數(shù)據(jù)質(zhì)量控制架構(gòu)體系

高??蒲袛?shù)據(jù)質(zhì)量控制是一項時間跨度長、過程復(fù)雜的項目,在科研項目周期的不同階段,科研數(shù)據(jù)的來源、質(zhì)量要求和控制方法也不同。本研究從科研項目周期和質(zhì)量控制階段兩個角度構(gòu)建高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系,如圖2所示。高??蒲许椖恐芷谥械南嚓P(guān)數(shù)據(jù)活動涉及項目規(guī)劃者、數(shù)據(jù)采集者等5類數(shù)據(jù)質(zhì)量角色,他們在促進科研項目順利開展的同時,從評估、認知和行動3個階段開展數(shù)據(jù)質(zhì)量控制活動,根據(jù)評估階段產(chǎn)生的科研數(shù)據(jù)質(zhì)量評估結(jié)果確定數(shù)據(jù)質(zhì)量問題產(chǎn)生的根本原因,并從認知、管理、流程3個視角制定科研數(shù)據(jù)質(zhì)量提高方案,從而形成科研數(shù)據(jù)質(zhì)量控制周期,不斷提高科研數(shù)據(jù)質(zhì)量。

3.1? 高??蒲袛?shù)據(jù)質(zhì)量控制過程中相關(guān)角色

科研項目周期中主要涉及項目規(guī)劃者、數(shù)據(jù)采集者、技術(shù)支持者、數(shù)據(jù)分析者和記錄管理人員這5類角色,他們與科研項目和質(zhì)量控制周期緊密相連,影響著科研數(shù)據(jù)的質(zhì)量和價值。

(1)項目規(guī)劃者。規(guī)劃者一般包括科研項目中的項目主持人、數(shù)據(jù)架構(gòu)師等人,主要在科研構(gòu)思階段收集科研項目數(shù)據(jù)需求,擬定科研項目數(shù)據(jù)管理規(guī)劃,將數(shù)據(jù)質(zhì)量提高融入項目設(shè)計和體系架構(gòu)中,以便減少風(fēng)險、抓住機遇和合理地分配資源。

(2)數(shù)據(jù)采集者。主要是指科研項目團隊中實施科研實驗或搜集數(shù)據(jù)的人員,他們掌握著數(shù)據(jù)的最初來源,作為數(shù)據(jù)質(zhì)量角色的重要組成部分承擔(dān)捕獲、創(chuàng)建或維護數(shù)據(jù)的職責(zé)。

(3)技術(shù)支持者。主要指項目團隊中數(shù)據(jù)庫管理員、IT支持者等人員,開發(fā)科研數(shù)據(jù)存儲平臺,實施元數(shù)據(jù)管理并建立數(shù)據(jù)有效性規(guī)則,在邏輯上形成完整的資源體系,使科研數(shù)據(jù)在物理存儲上具有整體性和關(guān)聯(lián)性、在空間上具有較強的擴展性。

(4)數(shù)據(jù)分析者。知識工作者在成果整理階段運用數(shù)據(jù)挖掘、數(shù)據(jù)建模等數(shù)據(jù)分析技術(shù),對原始科研數(shù)據(jù)進行深入分析,識別、檢測并清洗錯誤、無效等低質(zhì)量數(shù)據(jù),對高質(zhì)量的數(shù)據(jù)進行整理、分析,挖掘科研數(shù)據(jù)背后事物之間的潛在聯(lián)系,得出理想的科研成果。

(5)記錄管理人員。記錄管理人員在整個科研項目周期和質(zhì)量控制周期中負責(zé)采集科研數(shù)據(jù)與規(guī)范存檔記錄,并明確其在生命周期各階段的狀態(tài)。由于數(shù)據(jù)通常分散在項目團隊不同成員手中,因此建立科研數(shù)據(jù)在每個周期階段的狀態(tài)、操作、環(huán)境信息等完整的文檔記錄更為重要,以便減少科研數(shù)據(jù)在項目周期中的流失,加強了科研數(shù)據(jù)的管理與控制[10]。

3.2? 數(shù)據(jù)質(zhì)量控制周期

數(shù)據(jù)質(zhì)量控制周期通過評估、溯因和行動3個高層步驟,為討論和著手思考“控制”提供一種簡單的方法[11]。在評估階段,需要評判當(dāng)前科研項目環(huán)境和數(shù)據(jù),并將其與需求和預(yù)期相比較;在溯因階段,了解數(shù)據(jù)和信息的真實狀態(tài)、對科研的影響和根本原因是重點;前兩個階段的順利進行為行動階段打下堅實基礎(chǔ),數(shù)據(jù)質(zhì)量管理人員在這一階段除了糾正當(dāng)前科研數(shù)據(jù)錯誤之外,還需預(yù)防未來信息和科研數(shù)據(jù)質(zhì)量問題。評估是溯因的關(guān)鍵,溯因?qū)⒁鹦袆?,行動又由定期評估來核實,由此,科研數(shù)據(jù)質(zhì)量控制得以良性循環(huán)。

3.2.1? 評估階段

評估階段是整個質(zhì)量控制周期的基礎(chǔ),也是高校科研項目周期得以持續(xù)的前提。在這一階段主要包括科研數(shù)據(jù)的需求和環(huán)境分析、定義數(shù)據(jù)質(zhì)量維度和數(shù)據(jù)質(zhì)量評估3個方面。有效的規(guī)劃是確保任何科研項目成功實施必不可少的要素,對科研數(shù)據(jù)的需求和環(huán)境進行全面分析將使科研項目實施真正做到有的放矢和更有針對性;根據(jù)科研項目周期中的數(shù)據(jù)質(zhì)量問題并結(jié)合以往研究,定義科研數(shù)據(jù)質(zhì)量維度包括正確性、完整性、一致性和及時性4個維度,統(tǒng)一規(guī)范科研項目周期中數(shù)據(jù)質(zhì)量控制的標準和測量方法,以便后續(xù)數(shù)據(jù)質(zhì)量評估的順利開展。

3.2.2? 溯因階段

找出科研數(shù)據(jù)質(zhì)量問題的根本原因并有針對性地制定提高方案是溯因階段的重中之重。數(shù)據(jù)管理人員收集所有與低數(shù)據(jù)質(zhì)量相關(guān)的背景信息,追蹤和回溯科研數(shù)據(jù)在科研項目周期里流通的路徑并進行捕獲和比較,對質(zhì)量問題進行優(yōu)先級分類,最終確定數(shù)據(jù)質(zhì)量問題的根本原因。若根本原因引起的質(zhì)量問題超出了預(yù)先的數(shù)據(jù)質(zhì)量評估維度,則需返回評估階段重新對數(shù)據(jù)需求和環(huán)境進行分析;若根本原因在預(yù)計質(zhì)量問題范圍內(nèi),需要確定根本原因發(fā)生的階段,提出解決根本原因的具體建議,并對若干建議劃分優(yōu)先等級,確定質(zhì)量提高方案。

3.2.3? 行動階段

行動階段的目的是糾正當(dāng)前科研數(shù)據(jù)錯誤,同時采取手段預(yù)防未來科研數(shù)據(jù)錯誤。由溯因階段輸入至行動階段的質(zhì)量提高方案主要包括質(zhì)量差距模型、企業(yè)架構(gòu)模型和流程分析3種模式。從認知視角來看,引入質(zhì)量差距模型,認知并分析期望的科研數(shù)據(jù)質(zhì)量和實際感知的科研數(shù)據(jù)質(zhì)量之間的差距,對于正確把握質(zhì)量問題產(chǎn)生的根本原因具有關(guān)鍵作用;從管理視角來看,隨著跨學(xué)科趨勢的增強,高??蒲许椖扛鼜娬{(diào)跨部門性的協(xié)同合作,在企業(yè)架構(gòu)的模型上實施高??蒲袛?shù)據(jù)質(zhì)量控制能從科研團隊層面為數(shù)據(jù)質(zhì)量控制活動提供保障;從流程視角來看,高校科研數(shù)據(jù)質(zhì)量水平還與項目周期中各個環(huán)節(jié)息息相關(guān),因此本研究還引入流程分析,從微觀角度有計劃、有組織地把控高??蒲袛?shù)據(jù)質(zhì)量。這3個視角提出的科研數(shù)據(jù)質(zhì)量改進流程和數(shù)據(jù)糾正方法,為科研項目周期中高??蒲袛?shù)據(jù)質(zhì)量控制提供了理論思路和實踐基礎(chǔ)。

4? 科研項目周期中高??蒲袛?shù)據(jù)質(zhì)量控制模式分析

為確保數(shù)據(jù)管理方可以自始至終控制科研項目周期中的科研數(shù)據(jù)質(zhì)量,在產(chǎn)生實質(zhì)影響前盡早識別、排序和修復(fù)數(shù)據(jù)缺陷,本文基于高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)體系的三大階段,提出了科研項目周期中高??蒲袛?shù)據(jù)質(zhì)量控制總模式,如圖3所示。該模式闡述了在高校科研數(shù)據(jù)質(zhì)量控制架構(gòu)體系下數(shù)據(jù)質(zhì)量控制的具體模式及流程。評估階段和溯因階段是在全項目周期中實時監(jiān)測科研活動中的數(shù)據(jù)質(zhì)量,依據(jù)科研數(shù)據(jù)質(zhì)量規(guī)則及維度對數(shù)據(jù)質(zhì)量進行評估后,找出數(shù)據(jù)質(zhì)量問題并根據(jù)問題的性質(zhì)、出現(xiàn)的階段進行分類編號。在行動階段,數(shù)據(jù)管理人員將從認知視角出發(fā),引入質(zhì)量差距分析模型,將實際的數(shù)據(jù)質(zhì)量與項目團隊期望的數(shù)據(jù)質(zhì)量進行比較,進行質(zhì)量差距分析,從而深入測量、嚴密評判各類數(shù)據(jù)質(zhì)量問題并找到根本原因,為科研團隊制定數(shù)據(jù)質(zhì)量控制決策提供關(guān)鍵依據(jù);從管理視角來看,數(shù)據(jù)管理人員根據(jù)基于質(zhì)量差距模型的科研數(shù)據(jù)質(zhì)量控制模式排查出來的質(zhì)量問題根本原因,將數(shù)據(jù)質(zhì)量控制整合為企業(yè)架構(gòu)的固有組件,從宏觀上提出解決科研項目中跨學(xué)科、跨部門的數(shù)據(jù)質(zhì)量控制和協(xié)同監(jiān)管問題的方法,為科研項目周期中的高校科研數(shù)據(jù)質(zhì)量控制活動提供理論支撐和數(shù)據(jù)治理規(guī)范;最后,數(shù)據(jù)管理人員從流程視角上對整個科研項目周期進行數(shù)據(jù)質(zhì)量問題監(jiān)測與跟蹤,從微觀層面確保問題能得到及時有效的處置,并提高項目流程管理效率?,F(xiàn)對各視角下數(shù)據(jù)質(zhì)量控制模式進行剖析。

4.1? 基于質(zhì)量差距模型的高??蒲袛?shù)據(jù)質(zhì)量控制模式

營銷學(xué)家A. Parasuraman和L. Berry等人提出服務(wù)質(zhì)量差距模型,通過對顧客感知的實際服務(wù)質(zhì)量與期望服務(wù)質(zhì)量的差距比較來分析存在的質(zhì)量問題[12],J. R. Evans提出“客戶驅(qū)動質(zhì)量”方法,主張從需求的角度提升數(shù)據(jù)質(zhì)量[13]。在高??蒲许椖恐芷谥?,對科研數(shù)據(jù)管理人員和項目團隊進行數(shù)據(jù)質(zhì)量差距分析是發(fā)現(xiàn)數(shù)據(jù)質(zhì)量根本原因、實現(xiàn)數(shù)據(jù)質(zhì)量有效提高的關(guān)鍵前提。質(zhì)量差距分析模型主要是通過項目團隊期望的數(shù)據(jù)質(zhì)量和其實際感知的數(shù)據(jù)質(zhì)量的差距,進行根本原因分析,從而精準修復(fù)數(shù)據(jù)質(zhì)量問題,實現(xiàn)提高科研數(shù)據(jù)質(zhì)量的目的,具體如圖4所示:

影響項目團隊成員期望的數(shù)據(jù)質(zhì)量因素一般包括歷史數(shù)據(jù)的可靠性、科研機構(gòu)的宣傳力度以及科研數(shù)據(jù)的需求程度等,這些因素的相互作用構(gòu)成了科研項目周期中項目團隊對科研數(shù)據(jù)質(zhì)量的期望指數(shù);而項目團隊實際感知到的數(shù)據(jù)質(zhì)量的形成來源于數(shù)據(jù)采集質(zhì)量的可靠性、數(shù)據(jù)質(zhì)量標準制定的科學(xué)性、對科研數(shù)據(jù)的分析能力和團隊成員的數(shù)據(jù)素養(yǎng)。數(shù)據(jù)質(zhì)量控制人員通過用戶調(diào)查法、問卷調(diào)查法多種方式了解這兩者之間的差距,并根據(jù)調(diào)查結(jié)果進行質(zhì)量差距分析。質(zhì)量差距分析內(nèi)容由數(shù)據(jù)質(zhì)量期望差距、數(shù)據(jù)質(zhì)量標準差距、數(shù)據(jù)質(zhì)量傳遞差距、溝通質(zhì)量差距和整體感知質(zhì)量差距構(gòu)成,其中整體感知質(zhì)量差距是整個模型分析的關(guān)鍵,前4個差距的大小直接影響著科研項目團隊感知的科研數(shù)據(jù)質(zhì)量差距的大小,因而在進行質(zhì)量控制時應(yīng)盡量縮小前4個差距。數(shù)據(jù)控制人員通過質(zhì)量差距分析列出來的差距清單,進行快速配置測試或查詢,記錄下可能需要糾正的數(shù)據(jù)集,進行質(zhì)量根本原因分析。識別錯誤源和理解錯誤的引入是根本原因分析的重點,主要通過在整個科研項目周期中重復(fù)識別數(shù)據(jù)“進時有效、出時無效”的處理階段,精準定位數(shù)據(jù)活動中數(shù)據(jù)錯誤源的位置,在此基礎(chǔ)上更進一步分析數(shù)據(jù)質(zhì)量缺陷造成的原因,了解引入錯誤的方式。將數(shù)據(jù)質(zhì)量原因按優(yōu)先級分類,有助于將業(yè)務(wù)價值與高質(zhì)量數(shù)據(jù)關(guān)聯(lián)起來,同時還能發(fā)現(xiàn)少量在評估階段疏漏的質(zhì)量問題,促進數(shù)據(jù)質(zhì)量控制體系的改進。若問題原因在預(yù)計范圍內(nèi),則需要采取數(shù)據(jù)糾正與清理、根本原因消除、監(jiān)測和預(yù)防等修復(fù)質(zhì)量方法,以提高科研數(shù)據(jù)質(zhì)量。

4.2? 基于企業(yè)架構(gòu)模型的高??蒲袛?shù)據(jù)質(zhì)量控制模式

高??蒲许椖繄F隊成員大多來自于不同院系,學(xué)科背景的異質(zhì)性使得科研數(shù)據(jù)內(nèi)容綜合性強、跨學(xué)科性強,數(shù)據(jù)難以分類、有序儲存;同時高??蒲袛?shù)據(jù)質(zhì)量控制需要多個部門共同協(xié)作,具有跨部門性,因此從管理角度來說還需要構(gòu)建一套適應(yīng)高校科研數(shù)據(jù)特征的數(shù)據(jù)質(zhì)量控制模式。企業(yè)架構(gòu)是一種按照一定系統(tǒng)設(shè)計原則進行組織的理論框架,在信息資源集成[14]、數(shù)據(jù)治理[15]等方面得到廣泛應(yīng)用,因此可將企業(yè)架構(gòu)模型引入高??蒲袛?shù)據(jù)質(zhì)量控制模式。企業(yè)架構(gòu)的內(nèi)容一般包括業(yè)務(wù)架構(gòu)、應(yīng)用架構(gòu)、數(shù)據(jù)架構(gòu)和技術(shù)架構(gòu)4層[16],將其應(yīng)用于科研數(shù)據(jù)質(zhì)量工程實踐中,具體如圖5所示。

技術(shù)層是整個企業(yè)架構(gòu)模式的基礎(chǔ),涉及到網(wǎng)絡(luò)傳輸基本服務(wù)、IT基礎(chǔ)設(shè)施設(shè)備、大數(shù)據(jù)處理技術(shù)和智力支持等要素。其中網(wǎng)絡(luò)傳輸和IT基礎(chǔ)設(shè)施設(shè)備為支撐整個科研數(shù)據(jù)活動和質(zhì)量控制活動提供了保障,大數(shù)據(jù)處理技術(shù)是數(shù)據(jù)密集型科研環(huán)境下獲取高質(zhì)量數(shù)據(jù)不可或缺的支撐點,為數(shù)據(jù)質(zhì)量控制提供強大的技術(shù)支持,包括數(shù)據(jù)關(guān)聯(lián)分析、用戶行為智能預(yù)測、知識圖譜分析、聚類分析等,可實現(xiàn)對原始科研數(shù)據(jù)的有效處理。

數(shù)據(jù)層具體可分為數(shù)據(jù)采集、數(shù)據(jù)質(zhì)量控制和數(shù)據(jù)存儲3個方面,該層面主要是為科研項目提供多維化的科研數(shù)據(jù)來源,并運用數(shù)據(jù)處理工具和技術(shù)對數(shù)據(jù)進行預(yù)處理和規(guī)范化存儲。數(shù)據(jù)采集方面,凡是能滿足項目團隊科研需要的資源都成為數(shù)據(jù)采集的對象,這些多維化數(shù)據(jù)來源主要包括共享聯(lián)盟資源、網(wǎng)絡(luò)資源和項目歷史資源,項目團隊根據(jù)科研需要從中提取知識,并將其應(yīng)用到實際科研活動之中。但鑒于數(shù)據(jù)質(zhì)量的良莠不齊,應(yīng)當(dāng)按照數(shù)據(jù)質(zhì)量控制周期的循環(huán)步驟對采集的數(shù)據(jù)進行質(zhì)量控制,經(jīng)評估后確定數(shù)據(jù)質(zhì)量根本原因、確定質(zhì)量提高方案,從而預(yù)防和糾正數(shù)據(jù)錯誤,完成數(shù)據(jù)預(yù)處理工作。同時,還應(yīng)設(shè)置必要的數(shù)據(jù)存儲規(guī)范,對數(shù)據(jù)進行統(tǒng)一格式化后再存檔至科研數(shù)據(jù)存儲平臺。

應(yīng)用層主要是根據(jù)業(yè)務(wù)層和數(shù)據(jù)層提供的數(shù)據(jù)質(zhì)量控制方案進一步提高數(shù)據(jù)質(zhì)量,即對科研數(shù)據(jù)進行提取、整合和深入挖掘。其中數(shù)據(jù)提取是指對科研數(shù)據(jù)進行選擇和清洗,保證原始數(shù)據(jù)的準確性和及時性;數(shù)據(jù)整合是指對數(shù)據(jù)進行過濾和合并,降低數(shù)據(jù)的冗余性;數(shù)據(jù)挖掘是通過挖掘模式和算法應(yīng)用對科研數(shù)據(jù)下的潛在知識內(nèi)容進行挖掘和分析,最終得到理想的科研數(shù)據(jù)成果。

業(yè)務(wù)層則是為提高科研項目周期中的數(shù)據(jù)質(zhì)量而形成的集成視窗,對整個項目中的數(shù)據(jù)活動進行實時監(jiān)測和維護。除此之外,還需在科研構(gòu)思階段進行需求和環(huán)境分析,如收集數(shù)據(jù)需求、制定數(shù)據(jù)規(guī)范和數(shù)據(jù)管理規(guī)劃等,同時制定適用于整個架構(gòu)的科研數(shù)據(jù)標準,為科研數(shù)據(jù)質(zhì)量的評估、控制提供有效且統(tǒng)一的尺度。

4.3? 基于流程分析的高校數(shù)據(jù)質(zhì)量控制模式

科研數(shù)據(jù)質(zhì)量包括過程數(shù)據(jù)質(zhì)量和結(jié)果數(shù)據(jù)質(zhì)量,結(jié)果質(zhì)量的好壞反映在科研項目過程的各個環(huán)節(jié)上,只有改善過程數(shù)據(jù)質(zhì)量才能促使結(jié)果質(zhì)量的提高。因此,需要對科研項目周期中的高校科研數(shù)據(jù)質(zhì)量控制進行流程分析,從微觀的角度有計劃、有組織、持續(xù)地進行質(zhì)量改進,達到期望數(shù)據(jù)質(zhì)量的要求,如圖6所示。

在科研構(gòu)思階段,數(shù)據(jù)資源采集、需求環(huán)境分析和質(zhì)量評估標準的確定是規(guī)劃者和記錄管理人員的重點工作。數(shù)據(jù)資源的采集來源于科研數(shù)據(jù)共享平臺,采集過程中從源頭上保證數(shù)據(jù)的準確性與完整性是數(shù)據(jù)質(zhì)量控制的重點;需求環(huán)境分析中主要是了解項目團隊的科研數(shù)據(jù)質(zhì)量需求、前沿性分析等,此時科研數(shù)據(jù)的準確性和及時性是規(guī)劃者的主要需求;在制定數(shù)據(jù)質(zhì)量評估標準時,規(guī)劃者和記錄管理人員需要充分考慮數(shù)據(jù)質(zhì)量需求,確保標準的可靠性和科學(xué)性。

在科研實施階段,生產(chǎn)者通過科研活動產(chǎn)生原始實驗數(shù)據(jù),由技術(shù)支持者根據(jù)數(shù)據(jù)質(zhì)量評估結(jié)果,運用大數(shù)據(jù)處理技術(shù)進行數(shù)據(jù)預(yù)處理,包括科研數(shù)據(jù)去重、糾正錯誤數(shù)據(jù)、統(tǒng)一存儲格式等內(nèi)容,得到符合科研數(shù)據(jù)標準規(guī)范的結(jié)構(gòu)化數(shù)據(jù)。這一階段中嚴謹科學(xué)的科研活動是影響后續(xù)數(shù)據(jù)質(zhì)量的根本要素,數(shù)據(jù)預(yù)處理的正確操作是提高科研數(shù)據(jù)質(zhì)量的基本前提。

在成果整理階段,從數(shù)據(jù)發(fā)現(xiàn)上升到知識發(fā)現(xiàn)、從數(shù)據(jù)采集到數(shù)據(jù)創(chuàng)造是這一階段的主旋律。數(shù)據(jù)的提取、整合和挖掘依賴于技術(shù)支持者對數(shù)據(jù)處理技術(shù)的嫻熟掌控和知識工作者的數(shù)據(jù)素養(yǎng),兩者的協(xié)同作用才能得到更精準的科研實驗結(jié)果,才能更深入地揭示事物間潛在關(guān)聯(lián)和規(guī)律。

在成果發(fā)表階段,知識工作者對成果整理階段的科研數(shù)據(jù)進行知識整合與挖掘,得到論文報告基本雛形。剔除部分偏離正常值的數(shù)據(jù),對科研成果進行適度修改調(diào)整后存入科研數(shù)據(jù)存儲庫中??蒲袛?shù)據(jù)存儲庫將數(shù)據(jù)結(jié)構(gòu)化,保證關(guān)聯(lián)數(shù)據(jù)的一致性,并實時更新數(shù)據(jù),將高質(zhì)量的科研成果存檔、共享至科研數(shù)據(jù)共享平臺。

5? 結(jié)論

大數(shù)據(jù)時代下,科學(xué)研究第四范式歸根結(jié)底是對海量數(shù)據(jù)的挖掘與控制[6],科研數(shù)據(jù)的質(zhì)量控制也就成了科研人員根據(jù)科研數(shù)據(jù)進行深入研究的關(guān)鍵所在。本研究從科研項目周期內(nèi)涵及相關(guān)數(shù)據(jù)活動闡述了引入數(shù)據(jù)質(zhì)量控制的必要性,并從科研項目周期和質(zhì)量控制階段兩個角度構(gòu)建高校科研數(shù)據(jù)質(zhì)量控制架構(gòu)體系,在深入剖析體系中各部分的功能和特點基礎(chǔ)上,從認知、管理和流程三大視角構(gòu)建了各有側(cè)重又綜合協(xié)同的數(shù)據(jù)質(zhì)量控制模式及流程,為高校科研項目周期中的科研數(shù)據(jù)質(zhì)量控制提供了理論支撐和有效途徑。

參考文獻:

[1] DAMA國際.DAMA數(shù)據(jù)管理知識體系指南[M]. 北京:清華大學(xué)出版社, 2012:4-9.

[2] 包冬梅, 范穎捷, 李鳴.高校圖書館數(shù)據(jù)治理及其框架[J]. 圖書情報工作, 2015, 59(18):134-141.

[3] 屈文建, 唐晶, 陳旦芝.高??蒲袛?shù)據(jù)質(zhì)量控制架構(gòu)與機制研究[J]. 情報理論與實踐, 2018, 41(11):45-50.

[4] 馬波, 李宇.歐美國家高校圖書館科研數(shù)據(jù)管理實踐及啟示[J]. 圖書館工作與研究, 2018(8):17-24.

[5] 徐慧芳.中國科研數(shù)據(jù)管理實踐現(xiàn)狀調(diào)研及對圖書館的啟示[J]. 圖書館學(xué)研究, 2019(17):45-53.

[6] 陸玉泉. 大數(shù)據(jù)時代高??蒲袛?shù)據(jù)服務(wù)模式與建設(shè)路徑研究[D]. 南京: 南京航空航天大學(xué), 2017.

[7] 熊文龍, 李瑞婻.基于科學(xué)數(shù)據(jù)管理的圖書館數(shù)據(jù)服務(wù)研究[J]. 圖書情報工作, 2014, 58(22):48-53.

[8] 孫繼周.E - Science 環(huán)境下高校圖書館開展科學(xué)數(shù)據(jù)管理與共享的路徑研究[J]. 圖書館, 2016(5): 66-71.

[9] MARCHIONINI G, 楊冠燦, 蘆昆.科研數(shù)據(jù)管理: 保障數(shù)據(jù)質(zhì)量, 促進 iSchools 新科學(xué)研究[J]. 圖書情報知識, 2013(4): 4-9.

[10] 丁寧, 馬浩琴.國外高??茖W(xué)數(shù)據(jù)生命周期管理模型比較研究及借鑒[J]. 圖書情報工作, 2013, 57(6):18-22.

[11] MCGILVRAY D.數(shù)據(jù)質(zhì)量工程實踐[M]. 曹建軍, 刁興春, 張健美, 譯.北京: 電子工業(yè)出版社, 2010.

[12] MBA 智庫百科.諾伯特維納的控制[EB/OL]. [2012-04-14]. http//wiki.mbalib.com/wiki/Control_theory.

[13] EVANS J R, LINDSAY W M. The management and control of quality[M]. 5th ed.St.Paul:West, 2002.

[14] 屈文建, 周小渝, 孟書榮.基于企業(yè)架構(gòu)的數(shù)字圖書館科技信息資源集成服務(wù)研究[J]. 圖書館學(xué)研究, 2017(13):32-39.

[15] 郭路生, 劉春年.大數(shù)據(jù)時代應(yīng)急數(shù)據(jù)質(zhì)量治理研究[J]. 情報理論與實踐, 2016, 39(11):101-105.

[16] CIOCouncil. Federal Enterprise Architecture Framework [EB/OL]. [2016-02-03]. http://www.enterprise-architecture.info/Images/Documents/Federal%20EA%20Framework.pdf.

作者貢獻說明:

唐? 晶:提出研究思路,設(shè)計研究方案,撰寫論文;

屈文建:提出研究思路,指導(dǎo)論文修改。

Abstract: [Purpose/significance] This paper aims to provide an effective control approach and method for the data quality control in the scientific research project cycle of universities. [Method/process] It built a data quality and quality control architecture system around the scientific research project cycle and the data quality control cycle, and implemented data quality control from the perspectives of cognition, management, and process under this system, and introduced quality gap models and companies. Control methods such as architecture model and process analysis analyzed the data quality control mechanism in the scientific research project cycle of universities. [Result/conclusion] A scientific research data quality control architecture system and a data quality control model suitable for the scientific research project cycle were established, which provided theoretical support for the quality control of scientific research data in universities.

Keywords: data quality? ? research project cycle? ? research environment? ? quality gap model? ? enterprise architecture model

猜你喜歡
數(shù)據(jù)質(zhì)量
電子商務(wù)平臺數(shù)據(jù)質(zhì)量控制系統(tǒng)及仿真模型分析
基于大數(shù)據(jù)背景下提高供電局數(shù)據(jù)質(zhì)量對策分析
強化統(tǒng)計執(zhí)法提高數(shù)據(jù)質(zhì)量
淺析統(tǒng)計數(shù)據(jù)質(zhì)量
中國市場(2016年40期)2016-11-28 04:58:19
金融統(tǒng)計數(shù)據(jù)質(zhì)量管理的國際借鑒與中國實踐
時代金融(2016年27期)2016-11-25 19:02:25
淺談統(tǒng)計數(shù)據(jù)質(zhì)量控制
提高政府統(tǒng)計數(shù)據(jù)質(zhì)量,增強政府公信力
企業(yè)統(tǒng)計工作之我見
統(tǒng)計學(xué)在質(zhì)量管理中的應(yīng)用研究
商(2016年13期)2016-05-20 09:28:35
關(guān)于突發(fā)環(huán)境事件應(yīng)急監(jiān)測的問題分析及措施
丽江市| 天门市| 白山市| 永春县| 额尔古纳市| 新化县| 莱阳市| 鄂尔多斯市| 达拉特旗| 乃东县| 莱芜市| 南靖县| 天门市| 清远市| 泽库县| 宣化县| 天峨县| 清水县| 永和县| 襄垣县| 垣曲县| 万全县| 马关县| 紫金县| 南乐县| 武汉市| 安福县| 盐城市| 读书| 佛坪县| 申扎县| 景德镇市| 太谷县| 西盟| 四川省| 明水县| 札达县| 博兴县| 会东县| 深水埗区| 克东县|