国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高校數(shù)據(jù)治理的探索與實(shí)踐

2018-01-18 12:55劉波鄒恒華許維勝
電子技術(shù)與軟件工程 2017年21期
關(guān)鍵詞:數(shù)據(jù)治理數(shù)據(jù)質(zhì)量信息化建設(shè)

劉波++鄒恒華++許維勝

摘 要本文簡(jiǎn)要闡述了當(dāng)前數(shù)據(jù)治理發(fā)展趨勢(shì)和國(guó)內(nèi)高校在數(shù)據(jù)治理方面的研究現(xiàn)狀,總結(jié)了高校在數(shù)據(jù)治理方面的實(shí)施思路;并以同濟(jì)大學(xué)為例,介紹了其在數(shù)據(jù)治理方面的方案設(shè)計(jì)與內(nèi)容建設(shè),著重分析了人員信息整合路徑、基于主數(shù)據(jù)平臺(tái)的人員主數(shù)據(jù)模型設(shè)計(jì),為業(yè)務(wù)和管理提供高質(zhì)量的數(shù)據(jù)支持。

【關(guān)鍵詞】數(shù)據(jù)治理 信息化建設(shè) 數(shù)據(jù)質(zhì)量 主數(shù)據(jù)管理 人員信息整合

1 引言

近年來(lái),以社交網(wǎng)絡(luò)、電子商務(wù)、位置服務(wù)為代表的新型信息傳播方式的逐漸成熟,伴隨著移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計(jì)算等新興技術(shù)的快速發(fā)展與應(yīng)用,各類(lèi)終端設(shè)備、媒介網(wǎng)絡(luò)不間斷的記錄人類(lèi)活動(dòng)的信息行為,引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長(zhǎng)和數(shù)據(jù)模式的高度復(fù)雜化。當(dāng)前,數(shù)據(jù)已成為企業(yè)、國(guó)家的一項(xiàng)重要資產(chǎn);同時(shí),海量、多源異構(gòu)、價(jià)值密度低為特點(diǎn)的數(shù)據(jù),也向傳統(tǒng)數(shù)據(jù)管理模式提出挑戰(zhàn),數(shù)據(jù)治理也由此而生。

2 國(guó)內(nèi)高校數(shù)據(jù)治理研究現(xiàn)狀

我國(guó)高校信息化經(jīng)過(guò)十多年的發(fā)展,目前大多數(shù)高校已完成校園網(wǎng)絡(luò)、信息系統(tǒng)、數(shù)字平臺(tái)的建設(shè)。由于在建設(shè)初期,信息系統(tǒng)建設(shè)多以業(yè)務(wù)部門(mén)牽頭分別進(jìn)行,缺乏全校統(tǒng)一的系統(tǒng)規(guī)劃和數(shù)據(jù)標(biāo)準(zhǔn),導(dǎo)致很多高校雖然已經(jīng)積累了大量的業(yè)務(wù)數(shù)據(jù),但普遍存在數(shù)據(jù)質(zhì)量不高、冗余數(shù)據(jù)大量存在、數(shù)據(jù)可用性不高和各業(yè)務(wù)部門(mén)之間數(shù)據(jù)共享難度較大等問(wèn)題,這些問(wèn)題已經(jīng)嚴(yán)重制約高校日常管理和教學(xué)水平的提升。因此亟需通過(guò)針對(duì)高校個(gè)性化場(chǎng)景需求研究,建設(shè)一套全校級(jí)別的數(shù)據(jù)治理流程體系來(lái)進(jìn)行數(shù)據(jù)的全生命周期管理。

當(dāng)前,國(guó)內(nèi)已有部分學(xué)者在高校數(shù)據(jù)治理領(lǐng)域做了相關(guān)研究。李錚錚等針對(duì)數(shù)據(jù)存儲(chǔ)管理等提出了抓好頂層設(shè)計(jì)、制度與標(biāo)準(zhǔn)編制、關(guān)鍵技術(shù)研究和安全保密建設(shè)等關(guān)鍵環(huán)節(jié),加強(qiáng)數(shù)據(jù)工程建設(shè)的觀點(diǎn);李勇軍結(jié)合具體項(xiàng)目實(shí)踐闡述了核心準(zhǔn)則中“組織”和“整合”在大數(shù)據(jù)治理中的實(shí)際應(yīng)用,揭示了高校組織中的數(shù)據(jù)信息標(biāo)準(zhǔn)建設(shè)以及信息化管理項(xiàng)整合的重要性。許曉東認(rèn)為高等教育數(shù)據(jù)治理可以分為數(shù)據(jù)的獲取和抽取、整合和分析、解釋和預(yù)測(cè)幾個(gè)階段,數(shù)據(jù)治理對(duì)于高校組織決策制定、提高大學(xué)教學(xué)質(zhì)量、提高管理效率具有重大意義;趙安新從數(shù)據(jù)融合的視角探討高校數(shù)據(jù)融合的路徑及其治理框架,從而為互聯(lián)網(wǎng)+高等教育的信息化建設(shè)提供思路探討。李林提出了數(shù)據(jù)治理的RACI模型,介紹了主數(shù)據(jù)管理實(shí)施過(guò)程與數(shù)據(jù)質(zhì)量評(píng)估辦法。包冬梅等在其設(shè)計(jì)的CALib 模型的實(shí)施與評(píng)估中,討論了數(shù)據(jù)治理成熟度評(píng)估的意義??梢钥闯?,國(guó)內(nèi)學(xué)者多從不同的層面,結(jié)合管理創(chuàng)新和技術(shù)實(shí)踐推進(jìn)高校范圍內(nèi)的數(shù)據(jù)治理思路。

3 高校數(shù)據(jù)治理的實(shí)施思路

3.1 業(yè)務(wù)問(wèn)題分析

在實(shí)施數(shù)據(jù)治理之前,首先要對(duì)高校信息化建設(shè)目前存在的問(wèn)題進(jìn)行梳理,從而制定治理目標(biāo)和策略。我國(guó)高校在信息化建設(shè)過(guò)程中,普遍積累了大量數(shù)據(jù),這些數(shù)據(jù)包括:人事數(shù)據(jù)、科研數(shù)據(jù)、設(shè)備數(shù)據(jù)、學(xué)生數(shù)據(jù)、教務(wù)數(shù)據(jù)、圖書(shū)館數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)等,這些數(shù)據(jù)分散于各個(gè)業(yè)務(wù)系統(tǒng)中,難以滿足學(xué)校各類(lèi)管理、教學(xué)的需要。

3.2 確定目標(biāo)愿景

隨著教育信息化的快速發(fā)展,高校各類(lèi)業(yè)務(wù)與日常管理急需數(shù)據(jù)提供支持。但數(shù)據(jù)治理不能一蹴而就,需要根據(jù)緊急狀況和業(yè)務(wù)需求確定治理的短期目標(biāo)和長(zhǎng)期愿景。

3.3 制定成熟度評(píng)估

為保證數(shù)據(jù)治理效果,高校需制定階段性的數(shù)據(jù)治理內(nèi)容,選擇有效的治理指標(biāo),制定符合高校的成熟度模型。在保證現(xiàn)有業(yè)務(wù)正常運(yùn)轉(zhuǎn)的前提下,逐步推進(jìn)數(shù)據(jù)治理框架,使得各項(xiàng)業(yè)務(wù)逐漸過(guò)渡到新的業(yè)務(wù)框架上。成熟度評(píng)估是組織對(duì)數(shù)據(jù)治理狀況的考量,已經(jīng)學(xué)者和機(jī)構(gòu)從不同視角提出了成熟度模型。IBM信息治理委員會(huì)選取了11個(gè)信息治理指標(biāo),提出了包括目標(biāo)、支持要素、核心準(zhǔn)則、支持準(zhǔn)則的成熟度模型。Gartner 設(shè)計(jì)的6 階段的成熟度模型中,給出了每個(gè)階段的行動(dòng)方案。續(xù)瑾成建議成熟度評(píng)估最好每年執(zhí)行一次,及時(shí)了解當(dāng)前成熟度水平。高校在制定成熟度評(píng)估時(shí),應(yīng)結(jié)合自身當(dāng)前關(guān)注點(diǎn),從組織制度、角色職責(zé)、數(shù)據(jù)質(zhì)量、流程管理、信息監(jiān)管、技術(shù)職稱等多方位考慮,制定符合自己的成熟度評(píng)估模型。

3.4 加強(qiáng)頂層設(shè)計(jì)

高校數(shù)據(jù)治理不是僅僅靠信息部門(mén)就能完成的,需要學(xué)校自上而下進(jìn)行推進(jìn)。校領(lǐng)導(dǎo)、信息部門(mén)以及各業(yè)務(wù)部門(mén)協(xié)作方可推進(jìn),因此需要從人員意識(shí)、組織、職責(zé)等進(jìn)行設(shè)計(jì),以確保數(shù)據(jù)治理達(dá)到理想效果。

3.5 元數(shù)據(jù)管理

元數(shù)據(jù)是關(guān)于數(shù)據(jù)的描述信息,包括專(zhuān)業(yè)術(shù)語(yǔ)、業(yè)務(wù)規(guī)則、字段信息、數(shù)據(jù)使用及權(quán)限管理等。元數(shù)據(jù)決定信息架構(gòu)如何滿足業(yè)務(wù)需求,因此在數(shù)據(jù)治理過(guò)程中,元數(shù)據(jù)的管理就成為信息治理計(jì)劃的關(guān)鍵。

3.6 數(shù)據(jù)標(biāo)準(zhǔn)制定

數(shù)據(jù)標(biāo)準(zhǔn)是各方就共用業(yè)務(wù)術(shù)語(yǔ)的定義,以及這些術(shù)語(yǔ)的數(shù)據(jù)命名與描述方法達(dá)成的協(xié)議,它應(yīng)包括數(shù)據(jù)如何存儲(chǔ)、交換、表示方式以及信息共享規(guī)則。高校在數(shù)據(jù)治理初期,應(yīng)制定自己的數(shù)據(jù)標(biāo)準(zhǔn),按照數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)庫(kù)管理和業(yè)務(wù)系統(tǒng)更新。

除此之外,數(shù)據(jù)治理還需要借助平臺(tái)、工具和技術(shù)手段等,結(jié)合實(shí)際業(yè)務(wù)分模塊推進(jìn)數(shù)據(jù)的質(zhì)量提升與數(shù)據(jù)管控。

4 同濟(jì)大學(xué)數(shù)據(jù)治理的探索與實(shí)踐

4.1 治理實(shí)施方案設(shè)計(jì)與內(nèi)容建設(shè)

經(jīng)過(guò)十多年的建設(shè),同濟(jì)大學(xué)陸續(xù)上線了50多個(gè)業(yè)務(wù)系統(tǒng),積累了大量的數(shù)據(jù),存儲(chǔ)在各業(yè)務(wù)系統(tǒng)中。當(dāng)前主要存在的問(wèn)題有:

(1)數(shù)據(jù)分散管理,維護(hù)成本高;

(2)數(shù)據(jù)交換效率不高,部門(mén)口徑不一;

(3)主數(shù)據(jù)質(zhì)量不高;

(4)無(wú)法實(shí)現(xiàn)精細(xì)管理,缺乏全景視圖。

為解決該問(wèn)題,同濟(jì)大學(xué)結(jié)合信息化建設(shè)目標(biāo),提出通過(guò)數(shù)據(jù)整合、流程整合、服務(wù)整合,推進(jìn)數(shù)據(jù)治理。通過(guò)激活歷史數(shù)據(jù),實(shí)現(xiàn)歷史數(shù)據(jù)質(zhì)量提升與數(shù)據(jù)整合,構(gòu)建全校統(tǒng)一的基礎(chǔ)數(shù)據(jù)服務(wù)體系。統(tǒng)一規(guī)劃業(yè)務(wù)流程,改進(jìn)現(xiàn)有開(kāi)發(fā)模式,提供開(kāi)放的開(kāi)發(fā)平臺(tái)與應(yīng)用管理平臺(tái)。對(duì)于現(xiàn)有業(yè)務(wù)服務(wù)進(jìn)行整合,分別建設(shè)PC端和移動(dòng)綜合門(mén)戶,提升師生體驗(yàn)。具體如圖1,在該目標(biāo)之下,同濟(jì)大學(xué)陸續(xù)啟動(dòng)了數(shù)據(jù)倉(cāng)庫(kù)建設(shè)、數(shù)據(jù)標(biāo)準(zhǔn)制定、業(yè)務(wù)流程整合、人員信息整合、主數(shù)據(jù)管理平臺(tái)以及綜合門(mén)戶的建設(shè)。endprint

首先,對(duì)現(xiàn)有業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進(jìn)行分析,結(jié)合國(guó)家標(biāo)準(zhǔn)、教育部標(biāo)準(zhǔn),參考美國(guó)教育標(biāo)準(zhǔn),提出了符合高校的數(shù)據(jù)標(biāo)準(zhǔn)。標(biāo)準(zhǔn)內(nèi)容包括:教職工、學(xué)生、教學(xué)、機(jī)構(gòu)、財(cái)務(wù)、項(xiàng)目、協(xié)議、活動(dòng)、資源、代碼十大主題。通過(guò)數(shù)據(jù)標(biāo)準(zhǔn)管理,確保數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,以供全校層面進(jìn)行高效集成與共享。

建設(shè)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)存儲(chǔ)經(jīng)過(guò)抽取、轉(zhuǎn)換和加載( ETL ) 的大量歷史數(shù)據(jù),并利用聯(lián)機(jī)分析處理( OLAP) 、數(shù)據(jù)挖掘等方法進(jìn)行分析以支持決策,數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)可一定程度上解決高校面臨的“信息孤島”問(wèn)題,并為各類(lèi)數(shù)據(jù)統(tǒng)計(jì)分析提供基礎(chǔ)數(shù)據(jù)平臺(tái)。根據(jù)事先制定的規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn),進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì),通過(guò)ETL工具對(duì)業(yè)務(wù)系統(tǒng)里的數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取、轉(zhuǎn)換、裝載,在數(shù)據(jù)裝載前,需要對(duì)業(yè)務(wù)系統(tǒng)里存在的“臟數(shù)據(jù)”進(jìn)行預(yù)處理,即數(shù)據(jù)清洗。數(shù)據(jù)清洗工作主要包括:標(biāo)準(zhǔn)化處理、空值處理、不一致數(shù)據(jù)處理、重復(fù)數(shù)據(jù)處理等。

SOA,即面向服務(wù)的架構(gòu),它包含運(yùn)行環(huán)境、編程模型、架構(gòu)風(fēng)格和實(shí)施理論等,它的核心是服務(wù)。SOA的理念是業(yè)務(wù)驅(qū)動(dòng),采用松耦合的、靈活的體系架構(gòu)來(lái)滿足隨需的業(yè)務(wù)需求。通過(guò)引入SOA架構(gòu),可有效整合高校業(yè)務(wù)部門(mén)的零件化資源,并將此封裝成專(zhuān)屬服務(wù),注冊(cè)在企業(yè)服務(wù)總線(ESB)上,供其他業(yè)務(wù)部門(mén)消費(fèi)。建設(shè)基于ESB的數(shù)據(jù)交換平臺(tái),遷移老交換平臺(tái)作業(yè),實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)、批量交換。

人作為高校里非常重要的組成部分,各業(yè)務(wù)系統(tǒng)的運(yùn)轉(zhuǎn)執(zhí)行與信息更新也是以人員信息為重要基礎(chǔ)而存在的,因此保證各業(yè)務(wù)系統(tǒng)里人員信息的準(zhǔn)確非常重要。因此啟動(dòng)了人員信息整合和基于主數(shù)據(jù)平臺(tái)的人員主數(shù)據(jù)模型建設(shè),分別在4.2和4.3節(jié)中詳細(xì)介紹。

4.2 高校人員信息整合

高校在信息化建設(shè)過(guò)程中,業(yè)務(wù)部門(mén)根據(jù)自身業(yè)務(wù)需求建設(shè)了各類(lèi)業(yè)務(wù)管理系統(tǒng),如人事、教務(wù)、就業(yè)、研究生系統(tǒng)等,所有在校和離校的師生信息都分類(lèi)存儲(chǔ)在這些系統(tǒng)中,由業(yè)務(wù)部門(mén)自行維護(hù),出現(xiàn)一個(gè)人員的不同角色、不同時(shí)期的信息存儲(chǔ)分散,不便于高校對(duì)人員進(jìn)行信息統(tǒng)一管理。通過(guò)對(duì)分散的人員信息進(jìn)行整合,為每個(gè)人員分配一個(gè)唯一編號(hào),將該人員各階段的經(jīng)歷串聯(lián)起來(lái),建立綜合性人員信息庫(kù),實(shí)現(xiàn)跨業(yè)務(wù)、跨時(shí)間和跨信息系統(tǒng)的人員信息整合平臺(tái),有效提高人員數(shù)據(jù)質(zhì)量,同時(shí)為業(yè)務(wù)運(yùn)行和數(shù)據(jù)綜合服務(wù)提供基礎(chǔ)數(shù)據(jù)支持。如圖2所示,展示了高校人員信息整合過(guò)程。

4.2.1 數(shù)據(jù)選取

在源頭業(yè)務(wù)系統(tǒng)中,選取人事、教務(wù)、研究生等系統(tǒng)中有關(guān)師生的基本信息,如姓名、證件類(lèi)型、證件號(hào)、人員類(lèi)別、人員狀態(tài)、源編號(hào)(職工號(hào)、學(xué)號(hào))、性別、國(guó)家、民族、開(kāi)始日期、結(jié)束日期,并在設(shè)計(jì)的過(guò)程中增加了輔助描述字段,如系統(tǒng)來(lái)源、人員有效ID、處理日期、識(shí)別標(biāo)志等。

4.2.2 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理是定期將所選取的人員數(shù)據(jù)通過(guò)數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)加載到基礎(chǔ)數(shù)據(jù)存儲(chǔ)層,選取增量變化的數(shù)據(jù)進(jìn)入人員整合算法處理階段。數(shù)據(jù)清洗,主要包括去掉姓名中的空值,身份證15位轉(zhuǎn)18位、校驗(yàn)碼轉(zhuǎn)為大寫(xiě)等。

4.2.3 人員整合算法處理

通過(guò)系統(tǒng)識(shí)別和人工識(shí)別的方式對(duì)選取的人員字段進(jìn)行判斷,如滿足條件,則分配人員唯一編號(hào),如不滿足,則進(jìn)入人工識(shí)別通道,通過(guò)人工分析,補(bǔ)全相關(guān)字段,再進(jìn)行系統(tǒng)識(shí)別。通常,姓名、證件類(lèi)型和證件號(hào)(簡(jiǎn)稱“名號(hào)類(lèi)”)可以唯一確定一個(gè)人,因此在系統(tǒng)識(shí)別時(shí),設(shè)置系統(tǒng)識(shí)別的判定條件為“名類(lèi)號(hào)”全不空。 上述步驟只能為 “名號(hào)類(lèi)”全不為空的人員分配唯一編號(hào)。如出現(xiàn)證件號(hào)少于18位,類(lèi)號(hào)相同姓名不同;證件類(lèi)型不同姓名相同等特殊情況,則不能進(jìn)行識(shí)別,此邏輯還為其分配人員唯一編號(hào)。出現(xiàn)此類(lèi)情況多因?yàn)樵搭^系統(tǒng)數(shù)據(jù)存在錯(cuò)誤或者登記不一致。此時(shí)則需要對(duì)人工通知源頭系統(tǒng)進(jìn)行核對(duì)和修改,改善其數(shù)據(jù)質(zhì)量。

4.2.4 可疑數(shù)據(jù)人工處理

人員關(guān)鍵信息有缺失、或與其它人員的關(guān)鍵信息有沖突時(shí),需要進(jìn)行人工修正或確認(rèn),對(duì)于需要修正的數(shù)據(jù),源頭業(yè)務(wù)管理人員對(duì)信息進(jìn)行補(bǔ)全或糾正后,重新進(jìn)入人員整合算法;對(duì)于需要確認(rèn)的數(shù)據(jù),確認(rèn)無(wú)誤后進(jìn)入人員信息庫(kù)。

4.2.5 人員信息庫(kù)的應(yīng)用

通過(guò)整合后的高質(zhì)量人員信息庫(kù)可用于跨部門(mén)的綜合應(yīng)用、交叉分析有了可能,提高相關(guān)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)質(zhì)量,更準(zhǔn)確地完成學(xué)校各層面的數(shù)據(jù)服務(wù)和分析決策。

4.3 主數(shù)據(jù)管理

4.3.1 主數(shù)據(jù)與主數(shù)據(jù)管理

高校各源頭系統(tǒng)存儲(chǔ)的人員(教師、學(xué)生)、課程、科研項(xiàng)目、教室等實(shí)體數(shù)據(jù)往往需要跨系統(tǒng)、應(yīng)用、業(yè)務(wù)流程中共享使用,這類(lèi)數(shù)據(jù)被稱為主數(shù)據(jù)。如源頭系統(tǒng)中數(shù)據(jù)質(zhì)量低,將直接導(dǎo)致整個(gè)架構(gòu)體系無(wú)法發(fā)揮應(yīng)有的作用。通過(guò)主數(shù)據(jù)管理,實(shí)現(xiàn)數(shù)據(jù)的真正可用。

主數(shù)據(jù)管理包含了流程、治理、政策、標(biāo)準(zhǔn)和工具,用于統(tǒng)一定義和管理組織的關(guān)鍵數(shù)據(jù),并實(shí)現(xiàn)單點(diǎn)的引用。從內(nèi)容上講,通過(guò)使用去重、標(biāo)準(zhǔn)化數(shù)據(jù)、整合規(guī)則等手段減少進(jìn)入系統(tǒng)的差錯(cuò)數(shù)據(jù),以形成創(chuàng)建主數(shù)據(jù)的權(quán)威源。因此主數(shù)據(jù)管理的目標(biāo)是把關(guān)鍵和共享數(shù)據(jù)從源系統(tǒng)中抽取成為中樞,并保證在持續(xù)使用和維護(hù)這些數(shù)據(jù)的應(yīng)用中唯一。

4.3.2 主數(shù)據(jù)建模

實(shí)現(xiàn)有效的主數(shù)據(jù)管理,需要一套適合業(yè)務(wù)和實(shí)際需求的主數(shù)據(jù)模型。IBM MDM產(chǎn)品提出了核心域模型,在客戶、產(chǎn)品、賬戶和位置信息等方面進(jìn)行了完善的定義,該模型主要適用于符合金融、保險(xiǎn)和制造等行業(yè),高校作為相對(duì)特殊的小社會(huì),需要根據(jù)高校的實(shí)際管理特點(diǎn)和數(shù)據(jù)現(xiàn)狀,對(duì)現(xiàn)有模型進(jìn)行匹配和擴(kuò)展,并根據(jù)該模型重新開(kāi)發(fā)新的數(shù)據(jù)服務(wù)。

高校主數(shù)據(jù)主要包括: 與教學(xué)、科研及行政管理相關(guān)的關(guān)鍵數(shù)據(jù),如人員信息描述、組織機(jī)構(gòu)、科研成果、設(shè)備資產(chǎn)、課程等; 描述實(shí)體之間關(guān)系的數(shù)據(jù),如指導(dǎo)關(guān)系、選課關(guān)系和聘用關(guān)系等。在對(duì)數(shù)據(jù)進(jìn)行梳理后,結(jié)合高校業(yè)務(wù)場(chǎng)景,設(shè)計(jì)了面向高校的人員主數(shù)據(jù)模型。如圖3,對(duì)高校人員基本信息、組織信息、層級(jí)關(guān)系、關(guān)系角色、通訊地址信息、等進(jìn)行了個(gè)性化描述,基本描述了高校人員全景。endprint

值得注意的是,各高校主數(shù)據(jù)模型及內(nèi)容并沒(méi)有嚴(yán)格統(tǒng)一的標(biāo)準(zhǔn),信息化建設(shè)不同時(shí)期,主數(shù)據(jù)模型也不相同。因此在主數(shù)據(jù)管理過(guò)程中,要根據(jù)高校實(shí)際業(yè)務(wù)對(duì)主數(shù)據(jù)模型進(jìn)行持續(xù)擴(kuò)展與更新,以適合實(shí)際需求。

4.3.3 主數(shù)據(jù)匹配識(shí)別與應(yīng)用

與傳統(tǒng)數(shù)據(jù)庫(kù)存儲(chǔ)的簡(jiǎn)單邏輯判斷規(guī)則所不同,一般主數(shù)據(jù)平臺(tái)還具有數(shù)據(jù)匹配與識(shí)別功能。在此基礎(chǔ)上,基于自我學(xué)習(xí)的概率匹配算法提出了適用于高校主數(shù)據(jù)場(chǎng)景的可疑重復(fù)處理法??梢芍貜?fù)處理(SDP, Suspect Duplicate Processing )是對(duì)多個(gè)系統(tǒng)中現(xiàn)有的數(shù)據(jù),進(jìn)行搜索、匹配和處理可疑重復(fù)項(xiàng)的過(guò)程。如圖4所示,通過(guò)對(duì)從各業(yè)務(wù)系統(tǒng)中采集到的人員片段進(jìn)行可疑重復(fù)處理,經(jīng)過(guò)SDP過(guò)程處理的數(shù)據(jù)進(jìn)入MDM中,形成一份組織內(nèi)可信賴的、一致性的關(guān)鍵數(shù)據(jù),稱為“黃金記錄”。主數(shù)據(jù)系統(tǒng)則實(shí)時(shí)/準(zhǔn)實(shí)時(shí)將“黃金記錄”分發(fā)給其他需要共享的業(yè)務(wù)系統(tǒng)里,同時(shí)又可以將業(yè)務(wù)系統(tǒng)中的有更改的主數(shù)據(jù)信息同步過(guò)來(lái)進(jìn)行自我判斷,保證主數(shù)據(jù)的高質(zhì)量。

5 結(jié)論與展望

本文以當(dāng)前快速發(fā)展的新技術(shù)為切入點(diǎn),闡述了國(guó)內(nèi)高校在信息化建設(shè)過(guò)程中累積的數(shù)據(jù)問(wèn)題以及國(guó)內(nèi)學(xué)者在數(shù)據(jù)治理問(wèn)題上的研究概況,從而提出了高校在數(shù)據(jù)治理過(guò)程中,應(yīng)該遵循的思路。以同濟(jì)大學(xué)為例,介紹了其在數(shù)據(jù)治理方面的方案設(shè)計(jì)與內(nèi)容建設(shè),并且詳細(xì)介紹了其針對(duì)高校人員信息進(jìn)行的人員信息整合過(guò)程和基于主數(shù)據(jù)平臺(tái)的人員主數(shù)據(jù)模型設(shè)計(jì),從而為需要共享的業(yè)務(wù)系統(tǒng)提供實(shí)時(shí)的、高質(zhì)量的人員信息數(shù)據(jù)。除人員數(shù)據(jù)外,高校還存在組織機(jī)構(gòu)數(shù)據(jù)、科研數(shù)據(jù)、教學(xué)數(shù)據(jù)等,需要做進(jìn)一步地治理。

數(shù)據(jù)治理是一個(gè)長(zhǎng)期的過(guò)程,需要結(jié)合高校具體情況和實(shí)際需求,逐步實(shí)現(xiàn)對(duì)高校數(shù)據(jù)資產(chǎn)的有效管控。利用數(shù)據(jù)治理的成果,為師生提供更優(yōu)質(zhì)的服務(wù)體驗(yàn),為管理者提供專(zhuān)屬的業(yè)務(wù)支持和專(zhuān)題全景視圖,提高高校管理效率和決策水平。另外,高校在數(shù)據(jù)治理過(guò)程中,應(yīng)注重?cái)?shù)據(jù)隱私保護(hù)與數(shù)據(jù)安全防范,通過(guò)技術(shù)手段、制度規(guī)范和監(jiān)督機(jī)制促使數(shù)據(jù)資產(chǎn)合理的為高校管理和發(fā)展服務(wù)。

參考文獻(xiàn)

[1]李錚錚,莊孝彰.大數(shù)據(jù)時(shí)代高等院校教育數(shù)據(jù)建設(shè)研究[J].中國(guó)科技信息,2016(13):124-126.

[2]李勇軍,彭琳.大數(shù)據(jù)治理在高校信息化管理中的探究[J]中國(guó)管理信息化,2016,19(03):185-187.

[3]許曉東,王錦華.高等教育的數(shù)據(jù)治理研究[J].高等工程教育研究,20155:25-30.

[4]趙安新.高校數(shù)據(jù)融合路徑及其治理框架的探討[J].管理信息化,2016(23):75-77.

[5]李林,錢(qián)丹丹.高校信息化數(shù)據(jù)治理探討[J].管理信息化,2017(09):66-68.

[6]包冬梅,范穎捷,李鳴.高校圖書(shū)館數(shù)據(jù)治理及其框架[J].圖書(shū)情報(bào)工作作,2015,59(18):134-141.

[7]匡斌,譯. Soares,S.Big data governance:an emerging imperative [M].北京:清華大學(xué)出社,2014,28-35.

[8]張紹華,潘蓉.大數(shù)據(jù)治理與服務(wù)[M].上海:上??茖W(xué)技術(shù)出版社,2016,

[9]續(xù)瑾成.企業(yè)數(shù)據(jù)治理及其統(tǒng)一流程[J].中國(guó)管理信息化,2016,9(16):5-57

[10]INMON W H,Building the data warehouse[M]Indianapolis:John Wiley&Sons,2005.

[12]王紫瑤,男俊杰.SOA核心技術(shù)及應(yīng)用[M].北京:電子工業(yè)出版社,2008,4-15.

作者簡(jiǎn)介

章浩(1992-),男,陜西省商洛市人。在讀研究生。

劉波(1979-),男,江西省上饒市人。博士。

鄒恒華(1977-),女,江西省宜春市人。助理工程師。

許維勝(1966-),男,山東省臨邑縣人。教授,博導(dǎo)。

作者單位

1.同濟(jì)大學(xué)電子與信息工程學(xué)院 上海市 201804

2.同濟(jì)大學(xué)信息化辦公室 上海市 200092

3.同濟(jì)大教育技術(shù)與計(jì)算中心 上海市 200092endprint

猜你喜歡
數(shù)據(jù)治理數(shù)據(jù)質(zhì)量信息化建設(shè)
淺談統(tǒng)計(jì)數(shù)據(jù)質(zhì)量控制
大數(shù)據(jù)治理模型與治理成熟度評(píng)估研究
大數(shù)據(jù)時(shí)代城市治理:數(shù)據(jù)異化與數(shù)據(jù)治理
平泉县| 孟州市| 科技| 炎陵县| 绥阳县| 文成县| 九龙县| 雷波县| 县级市| 南乐县| 千阳县| 田东县| 鸡东县| 长寿区| 崇明县| 柘城县| 安西县| 萝北县| 孟州市| 富顺县| 赞皇县| 红桥区| 大兴区| 邯郸县| 中西区| 嵩明县| 蕉岭县| 原阳县| 罗源县| 天镇县| 吴旗县| 麻城市| 丽水市| 财经| 太仓市| 平乐县| 繁昌县| 宁津县| 内黄县| 普陀区| 莱阳市|