摘要:該文主要介紹了構(gòu)建高職院校學(xué)生信息管理系統(tǒng)數(shù)據(jù)倉庫。首先分析目前的高職院校學(xué)生管理系統(tǒng)的現(xiàn)狀,為了適應(yīng)現(xiàn)代高校信息化的發(fā)展,建立統(tǒng)一的學(xué)生信息數(shù)據(jù)平臺,采用數(shù)據(jù)倉庫技術(shù),從大量的學(xué)生信息中獲取有效的信息,為高職院校管理者決策提供有力的依據(jù)。
關(guān)鍵詞:數(shù)據(jù)倉庫;學(xué)生信息管理系統(tǒng);OLAP
中圖分類號:TP311 文獻標(biāo)識碼:A 文章編號:1009-3044(2013)04-0674-03
Research on the Application of Data Warehouse in Higher Vocational Colleges Students' Information Management System
PENG Bing, LUO Wei
(Chenzhou Vocational Technology College, Chenzhou 423000, China)
Abstract:This paper mainly introduces the construction of higher vocational college students' information management system Data Warehouse. Firstly analyzes the current higher vocational college students' management system present situation, in order to adapt to modern university informatization development, establish unity of students' information data platform, using Data Warehouse technology, from a large number of students' information Obtaining effective information for higher vocational college managers provide a powerful basis to make decisions.
Key words:data warehouse; students' information management system; OLAP
近幾年來,隨著高職院校招生規(guī)模的不斷擴大,辦學(xué)層次趨向多樣化,有關(guān)學(xué)生的各種信息量也在大量增加,學(xué)生管理工作中面臨的問題也隨之凸顯出來。以往的學(xué)生信息數(shù)據(jù)庫設(shè)計有很多缺點,例如:各個系統(tǒng)大量的數(shù)據(jù)不一致、數(shù)據(jù)分析面狹窄、數(shù)據(jù)更新速度不快等,已經(jīng)不能適應(yīng)高職院校學(xué)生管理信息化要求。采用數(shù)據(jù)倉庫技術(shù)后,建立統(tǒng)一的學(xué)生信息管理系統(tǒng)數(shù)據(jù)平臺,從大量的學(xué)生信息中獲取有效的信息,為高職院校的管理者進行決策提供有力的依據(jù)。
1 數(shù)據(jù)倉庫相關(guān)概念
1.1數(shù)據(jù)倉庫
數(shù)據(jù)倉庫,英文名稱為Data Warehouse,可簡寫為DW。數(shù)據(jù)倉庫是一個可更好地支持企業(yè)或組織進行決策分析的,面向主題的、集成的、相對穩(wěn)定的、隨時間不變化的數(shù)據(jù)集合。
數(shù)據(jù)倉庫是為了進一步挖掘數(shù)據(jù)資源、為了決策需要而產(chǎn)生的,它并不是所謂的“大型數(shù)據(jù)庫”。不是簡單的靜態(tài)存儲,更像是一個動態(tài)的過程,這個過程涉及數(shù)據(jù)的收集、集中、整理和加工四個階段,在這個過程中,提煉出重要的有價值的與決策相關(guān)的信息,最終把這些信息和知識,提供給需要這些信息的決策者,為他們做出有利于企事業(yè)單位未來發(fā)展的正確決策提供技術(shù)支持。這也是為什么人們常常稱數(shù)據(jù)倉庫系統(tǒng)為決策支持系統(tǒng)的關(guān)鍵所在。
1.2數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是隨著數(shù)據(jù)庫和人工智能技術(shù)的發(fā)展而出現(xiàn)的一種全新的信息技術(shù)。一個數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、機器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)、數(shù)據(jù)庫、可視化技術(shù)等,智能地分析歷史的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調(diào)整策略,減少風(fēng)險,做出正確的決策。
數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報表、聯(lián)機應(yīng)用分析)的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識、數(shù)據(jù)挖掘所得到的信息應(yīng)具有先未知,有效和可實用三個特征。利用數(shù)據(jù)挖掘技術(shù)預(yù)測他可能感興趣的操作和數(shù)據(jù),提前預(yù)計算或預(yù)取數(shù)據(jù),提取對人們有用的信息或知識,從而提高分析操作的響應(yīng)時間。
1.3聯(lián)機分析處理(OLAP)
OLAP具有靈活的分析功能、直觀的數(shù)據(jù)操作和分析結(jié)果可視化表示等突出優(yōu)點,從而使用戶對基于大量復(fù)雜數(shù)據(jù)的分析變得輕松而高效,以利于迅速做出正確判斷。OLAP的目標(biāo)是滿足決策支持或多維環(huán)境特定的查詢和報表需求,因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。
數(shù)據(jù)倉庫用于數(shù)據(jù)的存儲和組織,數(shù)據(jù)挖掘則致力于知識的自動發(fā)現(xiàn),聯(lián)機分析處理集中于數(shù)據(jù)的分析。聯(lián)機分析處理和數(shù)據(jù)挖掘雖然是數(shù)據(jù)倉庫上獲取兩種不同目標(biāo)的數(shù)據(jù)增值技術(shù),前者是分析型的,后者是驗證型的,但這兩類技術(shù)如果能夠在一定程度上融合,會使分析操作智能化,使挖掘操作目標(biāo)化,從而全面提升商務(wù)智能技術(shù)的實用價值。因此可以說,基于數(shù)據(jù)倉庫的聯(lián)機分析處理技術(shù)與數(shù)據(jù)挖掘技術(shù)的融合和互補,將是商務(wù)智能技術(shù)發(fā)展的未來走向。
2 學(xué)生信息管理系統(tǒng)數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)分析
根據(jù)目前的信息化水平,設(shè)計基于數(shù)據(jù)倉庫的學(xué)生信息管理系統(tǒng),可以對現(xiàn)有的大量數(shù)據(jù)存儲進行加工,存儲,統(tǒng)計和分析,充分挖掘數(shù)據(jù)的潛能,有效地管理數(shù)據(jù),分析數(shù)據(jù),匯總數(shù)據(jù),最后方便高校管理者做出快捷的、準(zhǔn)確的決策。
設(shè)計學(xué)生信息管理系統(tǒng)數(shù)據(jù)倉庫的數(shù)據(jù)源通過ETL技術(shù)(數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、裝載)放到數(shù)據(jù)庫中。在此基礎(chǔ)上還要導(dǎo)入學(xué)生信息、學(xué)生成績、學(xué)生資助管理等信息,通過整理數(shù)據(jù)導(dǎo)入數(shù)據(jù)信息的工作,構(gòu)建學(xué)生信息管理數(shù)據(jù)倉庫體系結(jié)構(gòu)如圖1所示。
圖1 數(shù)據(jù)倉庫體系結(jié)構(gòu)
1 ) 數(shù)據(jù)源
數(shù)據(jù)源是整個數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),數(shù)據(jù)的存儲和管理是整個數(shù)據(jù)倉庫系統(tǒng)的核心和關(guān)鍵所在。包括學(xué)生相關(guān)的各類數(shù)據(jù)庫的信息及操作型數(shù)據(jù)庫中的各種業(yè)務(wù)數(shù)據(jù)和各類文檔數(shù)據(jù)等,主要來自招生部門的招生信息管理系統(tǒng),來自計財部門的學(xué)費收支系統(tǒng),來自教務(wù)部門的學(xué)籍管理系統(tǒng)和教務(wù)成績管理系統(tǒng)等等。
2 ) 數(shù)據(jù)存儲
在現(xiàn)有各種信息管理系統(tǒng)基礎(chǔ)上,對數(shù)據(jù)進行ETL(數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、裝載)過程,按照主題域進行組織,確定數(shù)據(jù)倉庫的物理存儲結(jié)構(gòu),同時組織存儲數(shù)據(jù)倉庫元數(shù)據(jù),包括數(shù)據(jù)倉庫的數(shù)據(jù)字典、數(shù)據(jù)轉(zhuǎn)換規(guī)則、數(shù)據(jù)加載頻率以及業(yè)務(wù)規(guī)則等信息。數(shù)據(jù)倉庫的管理包括數(shù)據(jù)的安全、備份、維護、恢復(fù)等工作。
3 )OLAP引擎
對分析需要的數(shù)據(jù)進行有效集成,按多維模型進行組織,以便進行多角度、多層次的分析,同時包括解析M DX 語句、返回分析結(jié)果。
4 ) 前端工具
主要包括各種報表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以數(shù)據(jù)挖掘及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應(yīng)用開發(fā)工具。其中數(shù)據(jù)分析工具主要針對OLAP服務(wù)器,報表工具、數(shù)據(jù)挖掘工具主要針對數(shù)據(jù)倉庫,同時也針對OLAP服務(wù)引擎,進行多維分析,匯總,形成圖表或報表的形式,管理人員可以清晰、直觀地看到分析結(jié)果。
3 數(shù)據(jù)倉庫的關(guān)鍵問題
3.1 確定數(shù)據(jù)分析主題
數(shù)據(jù)倉庫中的數(shù)據(jù)是面向主題的,確定數(shù)據(jù)分析主題能刻畫各個分析對象所涉及的學(xué)生各項數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系。由于數(shù)據(jù)倉庫的設(shè)計是一個螺旋發(fā)展的過程,使用主題開始要找到需要分析的主題域。主題是根據(jù)分析的要求來確定的,結(jié)合學(xué)生管理工作的需求來確定主題。例如,在學(xué)生信息管理數(shù)據(jù)倉庫中,為有效地實現(xiàn)對于學(xué)生基本情況、學(xué)習(xí)成績、課程、考證情況、困難補助等數(shù)據(jù)的綜合分析,應(yīng)按主題域重新組織數(shù)據(jù),同時完成各系統(tǒng)不同業(yè)務(wù)數(shù)據(jù)進行必要的轉(zhuǎn)換,方便進行決策分析。
3.2 事實表與維表的關(guān)系
事實表和維表的設(shè)計是數(shù)據(jù)倉庫建立的關(guān)鍵問題,高職院學(xué)生信息數(shù)據(jù)倉庫主要采用的是星型結(jié)構(gòu)的方式。如圖2所示,學(xué)生管理數(shù)據(jù)倉庫采用星形結(jié)構(gòu)設(shè)計,其優(yōu)點是設(shè)計簡單,檢索查詢方便,數(shù)據(jù)的存儲經(jīng)過預(yù)處理,只要掃描事實表就可以進行查詢,提高檢索查詢的效率,星形結(jié)構(gòu)比較直觀,更方便組合出多種查詢。
圖2 學(xué)生信息管理系統(tǒng)多維數(shù)據(jù)庫
3.3多維分析處理實現(xiàn)
多維分析主要完成對學(xué)生信息數(shù)據(jù)倉庫多維分析和數(shù)據(jù)展現(xiàn)部分的設(shè)計。以學(xué)生事實表考證維表分析為例,觀察學(xué)生技能考證的分析結(jié)果。如從某學(xué)年某學(xué)期觀察某個班級或某一專業(yè)的學(xué)生的某門課程技能考證的通過率,可以從這些數(shù)據(jù)分析中得出對某一個系或某一個專業(yè)班級的學(xué)風(fēng)好壞與技能考證通過率高低相關(guān);或者通過對考證的維度數(shù)據(jù)的選擇,得出不同年級同專業(yè)通過率比較,也就可以得出某班級學(xué)生掌握技能知識與學(xué)風(fēng)相關(guān)的某些假設(shè)的結(jié)論;還可以通過看他們的具體考證級別的比較,來驗證某課程學(xué)生掌握技能知識的差距具體原因。
4 結(jié)束語
建立高職院學(xué)生信息管理系統(tǒng)的數(shù)據(jù)倉庫的過程是比較繁瑣的,高職院學(xué)生管理工作相關(guān)的各個職能部門的操作型數(shù)據(jù)庫中,數(shù)據(jù)量大、數(shù)據(jù)定義分散、內(nèi)容雜、冗余多而且加上針對具體管理應(yīng)用需求的特點。所以,關(guān)于所有學(xué)生的數(shù)據(jù)必須要有效集中,進行統(tǒng)一組織、管理、存放,合理的數(shù)據(jù)規(guī)劃和整合,建立一致的數(shù)據(jù)平臺,為高職院學(xué)生管理的決策者或管理者決策支持分析系統(tǒng)提供足夠的信息支持。
參考文獻:
[1] 賀超波,陳啟買.數(shù)據(jù)倉庫與OLAP在高校教學(xué)決策中的應(yīng)用研究[J].計算機應(yīng)用與軟件,2009(6):93-95.
[2] 肖廣.基于數(shù)據(jù)倉庫的大規(guī)模教育考試學(xué)生信息管理決策系統(tǒng)[J].中國考試,2011(11):37-41.
[3] 林芳.高職院校學(xué)生管理系統(tǒng)數(shù)據(jù)倉庫的設(shè)計[J].信息與電腦,2011(5):86-89.
[4] 李祥杰.基于數(shù)據(jù)倉庫的學(xué)生管理決策支持系統(tǒng)設(shè)計與實現(xiàn)[D].黑龍江:黑龍江大學(xué),2010:11-13.
[5] 涂美彩.構(gòu)建基于網(wǎng)絡(luò)考試系統(tǒng)試題庫的OLAP分析模型[D].吉林:東北師范大學(xué),2009:8-9.
[6] 易昌松.基于數(shù)據(jù)倉庫的遠程開放教育招生決策支持系統(tǒng)的探索[J].中小企業(yè)管理與科技:下旬刊,2010(12):302-305.