王加年 徐晴
摘 要:在教育領(lǐng)域中,管理和決策越來越依賴于數(shù)據(jù)和分析,如何利用大數(shù)據(jù)科學(xué)決策是高校近年來信息化建設(shè)關(guān)注的主題。文章分析了高校共享數(shù)據(jù)中心平臺的理論知識和相關(guān)技術(shù),討論了面向服務(wù)的數(shù)據(jù)交互技術(shù)方法及共享數(shù)據(jù)中心的非技術(shù)因素。最后分析設(shè)計(jì)了面向主題域的常熟理工學(xué)院共享數(shù)據(jù)中心,并對其體系架構(gòu)及關(guān)鍵業(yè)務(wù)系統(tǒng)的數(shù)據(jù)流向做了詳細(xì)的分析敘述。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)交換;數(shù)據(jù)中心
中圖分類號:TP392 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-8454(2015)10-0010-03
大數(shù)據(jù)科學(xué)決策是高校治理體系和治理能力現(xiàn)代化的關(guān)鍵。在教育領(lǐng)域中,管理和決策越來越依賴于數(shù)據(jù)和分析,而非基于經(jīng)驗(yàn)和直覺,然而,目前大多數(shù)高校的管理模式中信息化的作用尚未充分體現(xiàn),盡管在長期的辦學(xué)過程中積累了大量的數(shù)據(jù),但這些寶貴的決策信息資源沒有得到相應(yīng)的整合和開發(fā),更談不上利用這些數(shù)據(jù)對學(xué)校的教學(xué)、科研、管理等各項(xiàng)事務(wù)進(jìn)行預(yù)測和分析。隨著大數(shù)據(jù)發(fā)展而帶來的教育政策研究與決策“用數(shù)據(jù)說話”的趨勢亦漸明顯,構(gòu)建共享數(shù)據(jù)中心,將這些海量、分散、異構(gòu)的數(shù)據(jù)資源集成起來達(dá)到共享、融合,通過多維度、多層次、多群體、多因素?cái)?shù)據(jù)分析并形成一定的應(yīng)用模式,從中分析和挖掘潛在的價值,去解決高校事業(yè)的瓶頸問題,是將大數(shù)據(jù)應(yīng)用于教育領(lǐng)域的重要舉措。
一、大數(shù)據(jù)時代的高校共享數(shù)據(jù)平臺的相關(guān)技術(shù)及理論
1.信息編碼標(biāo)準(zhǔn)
信息編碼標(biāo)準(zhǔn)是做好信息管理的基礎(chǔ),信息只有遵循一個統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行組織,才可能構(gòu)成一個可流通、可共享的信息庫。信息編碼標(biāo)準(zhǔn)是數(shù)字化校園中不同層次的系統(tǒng)尤其是應(yīng)用系統(tǒng)能夠相互訪問的基礎(chǔ)。數(shù)據(jù)交互過程中,各業(yè)務(wù)系統(tǒng)數(shù)據(jù)信息要按照信息編碼標(biāo)準(zhǔn)的數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)清洗和過濾,處理后的數(shù)據(jù)才會存儲到中心數(shù)據(jù)庫。信息編碼標(biāo)準(zhǔn)是學(xué)校信息化建設(shè)的必要條件;同時信息標(biāo)準(zhǔn)的水平也反映了學(xué)校信息化建設(shè)的水平和高度。
2.共享數(shù)據(jù)模型
共享數(shù)據(jù)中心主要完成學(xué)校各類跨地區(qū)、跨部門、跨系統(tǒng)的管理數(shù)據(jù)與信息資源的數(shù)據(jù)交互和共享,是各個業(yè)務(wù)系統(tǒng)數(shù)據(jù)交互的中轉(zhuǎn)站,是信息資源的存儲中心。由于各學(xué)校早期的信息化建設(shè)基本都是由業(yè)務(wù)部門主導(dǎo),缺乏統(tǒng)一規(guī)劃,沒有統(tǒng)一標(biāo)準(zhǔn)。同時考慮成本以及推倒重來的建設(shè)風(fēng)險(xiǎn)等因素,一般建議采用交集數(shù)據(jù)中心模式建立共享數(shù)據(jù)中心,即:各系統(tǒng)間的數(shù)據(jù)交互完全通過數(shù)據(jù)中心來完成;共享數(shù)據(jù)中心只對交互系統(tǒng)之間需要交互的數(shù)據(jù)建模,各系統(tǒng)沿用原有的權(quán)限模型,需要交互的數(shù)據(jù)在相關(guān)系統(tǒng)中獨(dú)立的存在,但所有數(shù)據(jù)有且只有唯一的維護(hù)源頭。
二、大數(shù)據(jù)時代的高校共享數(shù)據(jù)平臺總體設(shè)計(jì)
1.共享數(shù)據(jù)中心體系架構(gòu)(圖1)
(1)數(shù)據(jù)采集層
采集的數(shù)據(jù)主要包括基礎(chǔ)數(shù)據(jù),如人、財(cái)、物等基本信息;學(xué)校開展教與學(xué)主體事務(wù)的業(yè)務(wù)數(shù)據(jù),如教師教學(xué)、學(xué)生選課等;體現(xiàn)教師學(xué)生成長與發(fā)展的過程數(shù)據(jù)等。數(shù)據(jù)采集層主要完成上述相關(guān)數(shù)據(jù)的采集工作,其中大部分?jǐn)?shù)據(jù)隨著其相關(guān)的業(yè)務(wù)系統(tǒng)日常運(yùn)作過程而積累下來,還有一部分是相關(guān)管理人員手工錄入,或者電子表格批量導(dǎo)入。
(2)數(shù)據(jù)集成層
數(shù)據(jù)通常存儲在很多個不同的數(shù)據(jù)存儲系統(tǒng)中,從所有源中提取數(shù)據(jù)并將其合并到單個一致的數(shù)據(jù)集中確實(shí)有一定的難度。數(shù)據(jù)交換工具通過轉(zhuǎn)換功能對數(shù)據(jù)進(jìn)行清理、標(biāo)準(zhǔn)化及轉(zhuǎn)換,數(shù)據(jù)轉(zhuǎn)換為兼容格式后,就可以將其物理合并到一個數(shù)據(jù)集中,并且數(shù)據(jù)在合并成功且應(yīng)用轉(zhuǎn)換后,通常會被加載到一個或多個目標(biāo)。
數(shù)據(jù)集成層同時還負(fù)責(zé)加載數(shù)據(jù)庫中的維度表和事實(shí)數(shù)據(jù)表,處理 Analysis Services 多維數(shù)據(jù)集和維度,使用 Integration Services 任務(wù)和轉(zhuǎn)換來自動處理更新多維數(shù)據(jù)集和維度,使用戶始終獲得最新的數(shù)據(jù)。
(3)管理操作層
管理操作層的基礎(chǔ)數(shù)據(jù)主要來自各個業(yè)務(wù)系統(tǒng),有的統(tǒng)計(jì)指標(biāo)類數(shù)據(jù)是經(jīng)數(shù)據(jù)倉庫加工提供。管理操作層面向教育治理者日常管理,主要包括師資隊(duì)伍建設(shè)管理、師資結(jié)構(gòu)分析、學(xué)業(yè)預(yù)警、教學(xué)考核等。歸納如下:
為滿足日常管理,提供了以固定報(bào)表為主的綜合報(bào)表統(tǒng)計(jì)平臺。
為便于突發(fā)性和臨時查詢需要,提供了各大主題的綜合查詢平臺以及基于數(shù)據(jù)倉庫的靈活查詢功能。
為規(guī)范對外數(shù)據(jù)報(bào)送,提供了統(tǒng)一的對外數(shù)據(jù)報(bào)送接口。
2.主要業(yè)務(wù)系統(tǒng)數(shù)據(jù)流向
共享數(shù)據(jù)中心本身不會產(chǎn)生數(shù)據(jù),所有的業(yè)務(wù)數(shù)據(jù)的維護(hù)遵循數(shù)據(jù)生命周期按照“誰產(chǎn)生,誰維護(hù)”的原則,各自業(yè)務(wù)系統(tǒng)分別產(chǎn)生數(shù)據(jù),所有數(shù)據(jù)只有唯一的生產(chǎn)源頭。共享數(shù)據(jù)中心與各業(yè)務(wù)系統(tǒng)之間進(jìn)行交互,一方面保證基礎(chǔ)數(shù)據(jù)在各系統(tǒng)中的一致性,同時也對主要業(yè)務(wù)數(shù)據(jù)進(jìn)行積累沉淀。
以學(xué)生數(shù)據(jù)為例,學(xué)生的人頭數(shù)據(jù)以學(xué)籍系統(tǒng)為準(zhǔn),而學(xué)生的其它基礎(chǔ)數(shù)據(jù)又在學(xué)工系統(tǒng)中維護(hù)完善。數(shù)據(jù)共享中心既負(fù)責(zé)從學(xué)籍系統(tǒng)中抽取學(xué)生人頭數(shù)據(jù)推送學(xué)工系統(tǒng),同時又從學(xué)工系統(tǒng)中抽取完整的學(xué)生基礎(chǔ)數(shù)據(jù)存儲在數(shù)據(jù)中心,圖書系統(tǒng)、一卡通系統(tǒng)等業(yè)務(wù)系統(tǒng)從共享數(shù)據(jù)中心訂閱學(xué)生相關(guān)數(shù)據(jù)。其主要業(yè)務(wù)系統(tǒng)數(shù)據(jù)流向如圖2所示。
三、共享數(shù)據(jù)中心的非技術(shù)因素
1.數(shù)據(jù)質(zhì)量管理
數(shù)據(jù)是高校有效開展信息化管理和輔助決策分析的依據(jù),是實(shí)現(xiàn)高校治理現(xiàn)代化的重要保障,因此其質(zhì)量和時效性已經(jīng)越來越受到高度關(guān)注。提高數(shù)據(jù)信息的質(zhì)量,加強(qiáng)數(shù)據(jù)管理,不僅需要在高校日常工作中充分利用現(xiàn)代信息技術(shù),強(qiáng)化高校業(yè)務(wù)與信息技術(shù)的融合,還要依靠廣大師生的配合參與,必須循序漸進(jìn),穩(wěn)步推進(jìn)。
(1)從源頭治理,從數(shù)據(jù)錄入、內(nèi)部處理入手,把好數(shù)據(jù)質(zhì)量“入口關(guān)”;
(2)督促問題治理,部署檢查規(guī)則,實(shí)現(xiàn)問題數(shù)據(jù)發(fā)現(xiàn)、分發(fā)、治理、監(jiān)督、考核閉環(huán)管理,把好數(shù)據(jù)質(zhì)量“治理關(guān)”;
(3)做好規(guī)范管理,完善制度、規(guī)范流程、系統(tǒng)硬控制,把好數(shù)據(jù)質(zhì)量“流轉(zhuǎn)關(guān)”。
2.數(shù)據(jù)安全管理
大數(shù)據(jù)既意味著機(jī)遇,也蘊(yùn)涵著挑戰(zhàn)。數(shù)據(jù)安全管理問題,是高校應(yīng)用大數(shù)據(jù)面臨的最大風(fēng)險(xiǎn)。雖然共享數(shù)據(jù)中心模式數(shù)據(jù)管理,方便了數(shù)據(jù)分析和處理,但由于安全管理不當(dāng)所造成的大數(shù)據(jù)丟失和損壞,則將引發(fā)毀滅性的災(zāi)難。在使用數(shù)據(jù)過程中應(yīng)遵循以下原則:
(1)使用生產(chǎn)數(shù)據(jù)必須經(jīng)過申請和審批,開發(fā)測試環(huán)境使用生產(chǎn)數(shù)據(jù)必須進(jìn)行數(shù)據(jù)混淆。
(2)對生產(chǎn)用戶進(jìn)行嚴(yán)格的授權(quán)管理,防范非授權(quán)訪問生產(chǎn)數(shù)據(jù)。
(3)含敏感信息的生產(chǎn)數(shù)據(jù)應(yīng)使用專用郵箱傳輸?shù)取?/p>
(4)對生產(chǎn)數(shù)據(jù)建立和實(shí)施嚴(yán)格的備份機(jī)制。
四、總結(jié)
在大數(shù)據(jù)的支撐下,高校運(yùn)行過程的各種元素能夠?qū)崿F(xiàn)數(shù)字化的呈現(xiàn),數(shù)據(jù)得到實(shí)時流轉(zhuǎn)、存儲和整合,信息按照權(quán)限充分公開。大數(shù)據(jù)能夠聚焦于決策對象的微觀層面,將原本模糊的現(xiàn)象通過數(shù)據(jù)逐步清晰的描述出來,大數(shù)據(jù)是超越個體與局部的相對靜態(tài)視野,更容易發(fā)現(xiàn)問題所在、可能弱點(diǎn)和盲區(qū)的宏觀動態(tài)視野并且用于各項(xiàng)事務(wù)的預(yù)測和決策。本文討論了面向服務(wù)的數(shù)據(jù)交互技術(shù)方法、數(shù)據(jù)流向以及一些非技術(shù)因素,設(shè)計(jì)了面向主題域的共享式數(shù)據(jù)中心。本共享數(shù)據(jù)平臺成功應(yīng)用在常熟理工學(xué)院數(shù)字化校園建設(shè)項(xiàng)目中,通過數(shù)據(jù)交換、主題分析,為學(xué)校的科學(xué)決策提供了有力保障,推進(jìn)了學(xué)校的現(xiàn)代化治理能力和水平。
參考文獻(xiàn):
[1]姬倩倩,溫浩宇.公共交通大數(shù)據(jù)平臺架構(gòu)研究[J].電子科技,2015,(2):127-130.
[2]陳瑞.大數(shù)據(jù)時代基于共享平臺的信息服務(wù)工作研究[J].科技創(chuàng)業(yè)月刊,2015,(1):20-22.
[3]趙巍,劉丹,王歡.高等學(xué)校共享式數(shù)據(jù)中心設(shè)計(jì)與實(shí)現(xiàn)[J].長春理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,(1):132-135.
[4]陳霜葉,孟瀏今,張海燕.大數(shù)據(jù)時代的教育政策證據(jù):以證據(jù)為本理念對中國教育治理現(xiàn)代化與決策科學(xué)化的啟示[J].全球教育展望,2014,(2):121-128.
[5]張建.教育治理體系的現(xiàn)代化:標(biāo)準(zhǔn)、困境及路徑[J].教育發(fā)展研究,2014,(9):27-33.
[6]閻光才.高等教育治理體系與治理能力的現(xiàn)代化[J].蘇州大學(xué)學(xué)報(bào)(教育科學(xué)版),2014,(3):1-3.
(編輯:郭桂真)