国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于OLAP的高校數(shù)據(jù)分析與決策支持系統(tǒng)研究

2019-04-04 01:46唐秀忠陳洪磊陸玉發(fā)
現(xiàn)代電子技術(shù) 2019年2期
關(guān)鍵詞:決策支持數(shù)據(jù)倉庫數(shù)據(jù)分析

唐秀忠 陳洪磊 陸玉發(fā)

關(guān)鍵詞: OLAP; 數(shù)據(jù)分析; 決策支持; 聯(lián)機(jī)分析; 多維引擎; 數(shù)據(jù)倉庫

中圖分類號(hào): TN919?34; P20 ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2019)02?0155?04

Research on university data analysis and decision?making support system based on OLAP

TANG Xiuzhong, CHEN Honglei, LU Yufa

(School of Technology, Puer University, Puer 665000, China)

Abstract: Since the university data analysis and decision?making support system based on the Mahout has the disadvantages of low data processing rate and poor user satisfaction, a university data analysis and decision?making support system based on the OLAP is designed. The snowflake model is used to design the data warehouse module according to different topics, and reduce the time consumption of connection between dimension tables and the reaction table, so as to realize high?efficient query and processing of university data warehouse information. Analysis, induction and summarization of university data are realized by using the online analysis and processing module OLAP and performing operations of slicing, block cutting, drilling and rotation. In the software part of the system, the slicing module, cubic module and representation module are used to send the analysis result of the multidimensional analysis request to users in the form of report and graph by means of the OLAP multidimensional engine, so as to meet users′ needs of data analysis and decision?making analysis in colleges and universities. The experimental results show that the designed system has short time?consumption in associated content updating, analysis result query and file export, and a high actual user satisfaction.

Keywords: OLAP; data analysis; decision?making support; online analysis; multidimensional engine; data warehouse

0 ?引 ?言

近年來,隨著高等教育的快速發(fā)展,各大院校的教育管理信息系統(tǒng)已取得顯著的成效。不同的教育部門中會(huì)產(chǎn)生不同類型的數(shù)據(jù),從不同類型數(shù)據(jù)中提取出對(duì)高校決策分析有用的信息,成為當(dāng)前專家學(xué)者關(guān)注的熱點(diǎn)話題。OLAP(聯(lián)機(jī)處理技術(shù))是一種專門用于分析復(fù)雜問題的具體操作[1],能夠?yàn)闆Q策人員提供決策幫助,同時(shí)可以根據(jù)分析決策人員的使用需求快速、靈活、準(zhǔn)確地對(duì)海量數(shù)據(jù)進(jìn)行查詢、處理,將處理結(jié)果以通俗易懂的形式展現(xiàn)出來,方便決策人員制定正確的決策方案。因此,本文設(shè)計(jì)基于OLAP的高校數(shù)據(jù)分析與決策支持系統(tǒng),能夠加快管理決策者對(duì)高校數(shù)據(jù)分析與決策的速率。

1 ?基于OLAP的高校數(shù)據(jù)分析與決策支持系統(tǒng)

1.1 ?系統(tǒng)總體結(jié)構(gòu)設(shè)計(jì)

高校數(shù)據(jù)倉庫設(shè)計(jì)中的數(shù)據(jù)來自不同職能部門的業(yè)務(wù)數(shù)據(jù)庫,高校數(shù)據(jù)倉庫中不僅有與高校相關(guān)的內(nèi)部數(shù)據(jù)外還包括與高校無關(guān)的外部數(shù)據(jù)[2]。高校數(shù)據(jù)倉庫的建模工具需根據(jù)不同的主題來選擇。高校數(shù)據(jù)倉庫設(shè)計(jì)中,ETL工具利用高校數(shù)據(jù)模型進(jìn)行數(shù)據(jù)重組[3]。數(shù)據(jù)重組過程包括數(shù)據(jù)清洗、轉(zhuǎn)換以及保存入庫等操作。前端分析工具采用聯(lián)機(jī)分析處理OALP模塊對(duì)高校數(shù)據(jù)倉庫實(shí)行多維分析并對(duì)其中數(shù)據(jù)實(shí)施多種OLAP操作,包括對(duì)高校數(shù)據(jù)進(jìn)行切片、切塊、數(shù)據(jù)比較以及旋轉(zhuǎn)等處理,最終將數(shù)據(jù)處理結(jié)果以圖表的形式呈現(xiàn)給決策者。圖1為基于OLAP的高校數(shù)據(jù)分析與決策支持系統(tǒng)總體結(jié)構(gòu)圖。

1.2 ?數(shù)據(jù)倉庫模塊設(shè)計(jì)

高校各部門的業(yè)務(wù)數(shù)據(jù)大多以關(guān)系數(shù)據(jù)的形式保存,因此采用“雪花模型”設(shè)計(jì)高校數(shù)據(jù)分析與決策支持系統(tǒng)的數(shù)據(jù)倉庫?!把┗P汀睂儆诨陉P(guān)系型數(shù)據(jù)庫的一種,是面向OLAP的一種多維化信息組織模型[4]。本文依照教學(xué)情況對(duì)高校數(shù)據(jù)分析與決策支持系統(tǒng)的數(shù)據(jù)倉庫進(jìn)行設(shè)計(jì)。該數(shù)據(jù)倉庫設(shè)計(jì)選擇學(xué)院、時(shí)間、學(xué)生類型以及衡量指標(biāo)作為四個(gè)維度,高校學(xué)生類型[5]劃分為本科生、碩士生和博士生三種。圖2為以教學(xué)情況為主題設(shè)計(jì)的雪花模型圖。圖2中與中間教學(xué)情況反映表相關(guān)的四個(gè)維度均有各自的屬性,維度表與中間教學(xué)反映表的連接是通過維關(guān)鍵字。該“雪花模型”的核心為教學(xué)情況反映表,是保存真實(shí)教學(xué)情況數(shù)據(jù)的地方,且保存的真實(shí)數(shù)據(jù)均為數(shù)字屬性,如成績優(yōu)良率等。該表中涵蓋大量的主要教學(xué)數(shù)據(jù),可以通過掃描該表進(jìn)行數(shù)據(jù)查詢[6],提升了用戶的查詢效率便于后續(xù)決策工作的開展,同時(shí)與教學(xué)情況反映表相連的維表通常較小,與中間教學(xué)情況反映表的連接用時(shí)短,節(jié)約大量的數(shù)據(jù)處理用時(shí),實(shí)現(xiàn)對(duì)數(shù)據(jù)倉庫信息的高效查詢處理。

1.3 ?聯(lián)機(jī)分析處理OLAP模塊設(shè)計(jì)

聯(lián)機(jī)分析處理OLAP在數(shù)據(jù)倉庫信息分析處理后進(jìn)行,其通過切片、切塊、鉆取以及旋轉(zhuǎn)等操作實(shí)現(xiàn)面向數(shù)據(jù)的分析、歸納和總結(jié)[7]。本文對(duì)高校數(shù)據(jù)分析與決策支持系統(tǒng)聯(lián)機(jī)分析處理的實(shí)現(xiàn)需構(gòu)建多維的數(shù)據(jù)模型。構(gòu)建多維數(shù)據(jù)模型步驟如下:將高校數(shù)據(jù)分析與決策支持系統(tǒng)數(shù)據(jù)倉庫作為數(shù)據(jù)源,基于數(shù)據(jù)倉庫中的反應(yīng)表與維表,采用ORACLE BIEE維度編輯器和多維數(shù)據(jù)集構(gòu)建專用維度,并進(jìn)行維度共享[8],同時(shí)將維度間的層次關(guān)系進(jìn)行有效定義,實(shí)現(xiàn)用于決策分析的多維數(shù)據(jù)模型的構(gòu)建。多維數(shù)據(jù)模型有三種物理實(shí)現(xiàn)方式,分別是基于關(guān)系表ROLAP、基于多維數(shù)據(jù)庫的MOLAP和二者融合的HOLAP,系統(tǒng)設(shè)計(jì)時(shí)選擇二者融合的HOLAP,因?yàn)槠鋵OLAP和ROLAP兩種結(jié)構(gòu)的技術(shù)優(yōu)點(diǎn)進(jìn)行有機(jī)融合,能夠滿足用戶的復(fù)雜數(shù)據(jù)分析需求。

1.4 ?OLAP多維引擎設(shè)計(jì)

OLAP多維引擎可接收到用戶的多維分析請(qǐng)求,使用戶從多角度、多層面上對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行查詢,將多維分析請(qǐng)求轉(zhuǎn)化為數(shù)據(jù)倉庫中的SQL查詢,將獲取的數(shù)據(jù)發(fā)送給用戶。本文基于OLAP的高校數(shù)據(jù)分析與決策支持系統(tǒng)設(shè)計(jì)中,OLAP多維引擎主要由切片模塊、立方體模塊和表示模塊構(gòu)成[9]。OLAP多維引擎接收用戶的多維分析請(qǐng)求后的處理流程如圖3所示。圖3中過程1代表模塊在接收來自用戶的多維分析請(qǐng)求后,將該請(qǐng)求發(fā)送到立方體模塊;過程2中立方體模塊對(duì)該多維請(qǐng)求的維的層次進(jìn)行解析[10],并提取出該維上層次中的數(shù)據(jù),構(gòu)建出均勻的分組,并將分組結(jié)果作為參數(shù)調(diào)用的切片模塊;過程3中的切片模塊首先對(duì)分組情況進(jìn)行查看,假如分組后的度量數(shù)據(jù)已存在于數(shù)據(jù)庫中,此時(shí)應(yīng)構(gòu)建SQL語句,并直接提取該度量數(shù)據(jù),反之,可依照源數(shù)據(jù)中計(jì)算度量數(shù)據(jù)的相關(guān)公式計(jì)算求得度量數(shù)據(jù);過程4中切片模塊憑借循環(huán)調(diào)用切片模塊即可得到多維分析后的全部度量數(shù)據(jù);過程5即切片模塊將度量數(shù)據(jù)發(fā)送回立方體模塊;過程6表示模塊采用報(bào)表或圖形的形式將多維數(shù)據(jù)結(jié)果展示給用戶。根據(jù)以上模塊設(shè)計(jì)即可使高校管理決策者直觀地獲取以報(bào)表或圖片形式展現(xiàn)的多維數(shù)據(jù)分析結(jié)果。

2 ?實(shí)驗(yàn)分析

2.1 ?系統(tǒng)運(yùn)行功能測試

實(shí)驗(yàn)為驗(yàn)證本文基于OLAP的高校數(shù)據(jù)分析與決策支持系統(tǒng)的應(yīng)用性能,將本文系統(tǒng)、傳統(tǒng)基于Mahout的高校數(shù)據(jù)分析與決策支持系統(tǒng)和基于數(shù)據(jù)挖掘的高校數(shù)據(jù)分析與決策支持系統(tǒng)進(jìn)行對(duì)比試驗(yàn)。利用3臺(tái)同樣型號(hào)的計(jì)算機(jī)分別在一天中的12個(gè)時(shí)間段內(nèi)分別進(jìn)行更新關(guān)聯(lián)內(nèi)容用時(shí)測試、查看分析結(jié)果用時(shí)測試和文檔導(dǎo)出用時(shí)測試。本文系統(tǒng)與上述實(shí)驗(yàn)中的兩個(gè)系統(tǒng)在各個(gè)時(shí)間段內(nèi)的用時(shí)情況分別如圖4~圖6所示。

分析圖4三種系統(tǒng)在不同時(shí)刻下更新高校數(shù)據(jù)關(guān)聯(lián)內(nèi)容用時(shí)結(jié)果可知,本文系統(tǒng)更新關(guān)聯(lián)內(nèi)容曲線在三條曲線的最下方且曲線幾乎沒有波動(dòng),更新關(guān)聯(lián)內(nèi)容的用時(shí)基本在40 s左右,說明本文系統(tǒng)在不同時(shí)刻下更新與高校決策者關(guān)聯(lián)內(nèi)容的用時(shí)較短且系統(tǒng)穩(wěn)定性較強(qiáng)。分析基于Mahout的高校數(shù)據(jù)分析與決策支持系統(tǒng)和基于數(shù)據(jù)挖掘的高校數(shù)據(jù)分析與決策支持系統(tǒng)的更新關(guān)聯(lián)內(nèi)容曲線均遠(yuǎn)遠(yuǎn)高于本文系統(tǒng)曲線。其中基于Mahout的高校數(shù)據(jù)分析與決策支持系統(tǒng)的用時(shí)在60~70 s之間,更新用時(shí)變化波動(dòng)較大且耗時(shí)較長,因此可以得出,本文系統(tǒng)在更新與高校決策相關(guān)的內(nèi)容上效率較高。

從圖5三種系統(tǒng)在不同時(shí)刻下查看分析結(jié)果用時(shí)曲線可以看出,基于Mahout的高校數(shù)據(jù)分析與決策支持系統(tǒng)和基于數(shù)據(jù)挖掘的高校數(shù)據(jù)分析與決策支持系統(tǒng)查看分析結(jié)果用時(shí)曲線相差較少且多處發(fā)生重合。雖然這兩種系統(tǒng)的用時(shí)波動(dòng)較為平緩,但從用時(shí)情況可以看出,本文系統(tǒng)的分析用時(shí)遠(yuǎn)遠(yuǎn)低于另外兩個(gè)系統(tǒng),高校決策者可在短時(shí)間內(nèi)查看分析的結(jié)果。

系統(tǒng)向決策者展示的結(jié)果通常需要以PDF或表格的形式導(dǎo)出,因此測試文檔導(dǎo)出用時(shí)也是測量本文系統(tǒng)好壞的因素之一。從圖6中可以看出,本文系統(tǒng)的普遍文檔導(dǎo)出用時(shí)在5 s左右;基于Mahout的高校數(shù)據(jù)分析與決策支持系統(tǒng)的文檔導(dǎo)出用時(shí)比本文系統(tǒng)用時(shí)較多,該系統(tǒng)在不同時(shí)刻下的文件導(dǎo)出用時(shí)波動(dòng)較大;基于數(shù)據(jù)挖掘的高校數(shù)據(jù)分析與決策支持系統(tǒng)雖然文件導(dǎo)出用時(shí)波動(dòng)平緩,但該系統(tǒng)文件導(dǎo)出用時(shí)較長。因此對(duì)比曲線得出,本文系統(tǒng)在導(dǎo)出文檔的效率較高。

2.2 ?系統(tǒng)評(píng)價(jià)

實(shí)驗(yàn)采用專家評(píng)價(jià)法,對(duì)本文系統(tǒng)、基于Mahout的高校數(shù)據(jù)分析與決策支持系統(tǒng)和基于數(shù)據(jù)挖掘的高校數(shù)據(jù)分析與決策支持系統(tǒng)三種系統(tǒng)的應(yīng)用效果進(jìn)行評(píng)分,實(shí)驗(yàn)評(píng)價(jià)系統(tǒng)分?jǐn)?shù)為0~10分,在某高校內(nèi)隨機(jī)選取12位管理層決策者,讓12位決策者分別使用三種系統(tǒng)后,對(duì)系統(tǒng)進(jìn)行評(píng)判,平均評(píng)價(jià)結(jié)果如圖7所示。

分析圖7可以看出,本文系統(tǒng)在12位管理決策者使用后的平均評(píng)分結(jié)果均在9分以上,說明管理決策者對(duì)本文系統(tǒng)非常滿意;基于Mahout的高校數(shù)據(jù)分析與決策支持系統(tǒng)的評(píng)價(jià)得分均在7分左右波動(dòng);而對(duì)基于數(shù)據(jù)挖掘的高校數(shù)據(jù)分析與決策支持系統(tǒng),每一位管理決策者的得分均沒有達(dá)到及格水平。由此可知,本文系統(tǒng)曲線在最上方且遠(yuǎn)高于另外兩條曲線,說明本文系統(tǒng)具有較強(qiáng)的實(shí)際應(yīng)用效果。

3 ?結(jié) ?論

本文設(shè)計(jì)的基于OLAP的高校數(shù)據(jù)分析與決策支持系統(tǒng),根據(jù)決策主題來構(gòu)建數(shù)據(jù)倉庫,并對(duì)這些數(shù)據(jù)進(jìn)行聯(lián)機(jī)分析處理,準(zhǔn)確地對(duì)學(xué)校的運(yùn)行情況進(jìn)行統(tǒng)計(jì)分析。根據(jù)實(shí)驗(yàn)結(jié)果可知,所設(shè)計(jì)系統(tǒng)的更新關(guān)聯(lián)內(nèi)容用時(shí)、查看分析結(jié)果用時(shí)和文檔導(dǎo)出用時(shí)效率較高;根據(jù)專家的系統(tǒng)評(píng)價(jià)結(jié)果可知,所設(shè)計(jì)系統(tǒng)的實(shí)際應(yīng)用效果好,用戶滿意度較高。

參考文獻(xiàn)

[1] 侯杰,胡乃聯(lián),李國清,等.基于OLAP的礦業(yè)集團(tuán)生產(chǎn)運(yùn)營決策系統(tǒng)構(gòu)建研究[J].中國礦業(yè),2016,25(11):11?15.

HOU Jie, HU Nailian, LI Guoqing, et al. Construction of production operation & decision?making system for mining group based on OLAP [J]. China mining magazine, 2016, 25(11): 11?15.

[2] 滿毅,章炯民,徐曉錦.一種基于樸素貝葉斯算法的OLAP緩存機(jī)制[J].計(jì)算機(jī)工程與應(yīng)用,2017,53(6):85?90.

MAN Yi, ZHANG Jiongmin, XU Xiaojin. OLAP cache mechanism based on naive Bayesian [J]. Computer engineering and applications, 2017, 53(6): 85?90.

[3] 王澤奧,吳斌,吳心宇,等.大規(guī)模多維網(wǎng)絡(luò)數(shù)據(jù)分析框架的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)科學(xué)與探索,2017,11(12):1941?1952.

WANG Zeao, WU Bin, WU Xinyu, et al. Research and implementation of framework for large?scale multi?dimensional network analysis [J]. Journal of frontiers of computer science & technology, 2017, 11(12): 1941?1952.

[4] 徐揚(yáng),云夢妍,張瑾賢.大學(xué)生擇業(yè)決策支持系統(tǒng)研究[J].當(dāng)代教育與文化,2016,8(1):95?101.

XU Yang, YUN Mengyan, ZHANG Jinxian. Research on decision support system of undergraduate career choice [J]. Contemporary education and culture, 2016, 8(1): 95?101.

[5] 封超,郭曉.基于CBR的應(yīng)急情報(bào)智能決策支持系統(tǒng)研究[J].情報(bào)雜志,2017,36(10):36?40.

FENG Chao, GUO Xiao. Research on Emergency intelligence intelligent decision support system based on case?based reasoning [J]. Journal of intelligence, 2017, 36(10): 36?40.

[6] 王宗水,趙紅.大數(shù)據(jù)變革背景下的顧客網(wǎng)絡(luò)滿意度比較:基于OLAP可視化技術(shù)應(yīng)用視角[J].軟科學(xué),2015,29(5):106?110.

WANG Zongshui, ZHAO Hong. Comparison of customer online satisfaction comments in big data revolution: a view of OLAP visualization technology utility [J]. Soft science, 2015, 29(5): 106?110.

[7] 王會(huì)舉,覃雄派,王珊,等.面向大規(guī)模機(jī)群的可擴(kuò)展OLAP查詢技術(shù)[J].計(jì)算機(jī)學(xué)報(bào),2015,38(1):45?58.

WANG Huiju, QIN Xiongpai, WANG Shan, et al. Scalable OLAP queries processing towards large cluster [J]. Chinese journal of computers, 2015, 38(1): 45?58.

[8] 崔紅波,游進(jìn)國,簡興明,等.Spark環(huán)境下的分布式OLAP查詢[J].小型微型計(jì)算機(jī)系統(tǒng),2017,38(11):2517?2522.

CUI Hongbo, YOU Jinguo, JIAN Xingming, et al. Distributed OLAP query in Spark [J]. Journal of Chinese computer systems, 2017, 38(11): 2517?2522.

[9] 武慧娟,秦雯,孫鴻飛.激勵(lì)視角下高校智庫協(xié)同決策機(jī)制研究:以吉林省高校智庫建設(shè)為例[J].現(xiàn)代情報(bào),2017,37(3):8?12.

WU Huijuan, QIN Wen, SUN Hongfei. Research on collaborative decision mechanism of university think tank based the incentive perspective: taking the construction of university think tanks in Jilin Province as an example [J]. Modern information, 2017, 37(3): 8?12.

[10] 易魁,陳豪,趙志勇,等.小灣水電站工程安全分析與決策支持系統(tǒng)研究與構(gòu)建[J].水力發(fā)電,2017,43(3):123?127.

YI Kui, CHEN Hao, ZHAO Zhiyong, et al. Research and construction of engineering safety analysis and decision?making support system for Xiaowan hydropower station [J]. Water power, 2017, 43(3): 123?127.

猜你喜歡
決策支持數(shù)據(jù)倉庫數(shù)據(jù)分析
基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計(jì)
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
商業(yè)智能分析模式在醫(yī)保病人住院化管理當(dāng)中的應(yīng)用研究
新常態(tài)下集團(tuán)公司內(nèi)部審計(jì)工作研究
淺析大數(shù)據(jù)時(shí)代對(duì)企業(yè)營銷模式的影響
秦山核電應(yīng)急決策支持系統(tǒng)開發(fā)與研究
基于RFID的汽車零件銷售策略支持模型
基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實(shí)踐
米脂县| 丹江口市| 军事| 曲麻莱县| 临武县| 运城市| 百色市| 东海县| 尼木县| 江都市| 罗江县| 时尚| 清河县| 慈溪市| 东阳市| 逊克县| 龙泉市| 恩施市| 乐安县| 灵丘县| 绥德县| 射洪县| 盐源县| 韩城市| 石首市| 安泽县| 清徐县| 开阳县| 金溪县| 台东县| 辉县市| 巩留县| 大足县| 登封市| 札达县| 卓资县| 连江县| 泗阳县| 乌海市| 锡林浩特市| 凤阳县|