国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

談數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用與研究

2014-12-23 06:05程知
中國信息化 2014年15期
關(guān)鍵詞:資料庫信息庫數(shù)據(jù)倉庫

文|程知

隨著科學(xué)技術(shù)的迅猛發(fā)展,高等院校的教學(xué)質(zhì)量問題也隨即成為社會(huì)關(guān)注的重要課題,不斷完善,不斷更新,適應(yīng)新形式的發(fā)展刻不容緩。各種高校在教學(xué)管理的過程中,每天都會(huì)產(chǎn)生及其大量的數(shù)據(jù),目前形勢看來,高校的教學(xué)管理系統(tǒng)只是做出了更新、查詢、統(tǒng)計(jì)或是打印等操作,完全沒有運(yùn)用到數(shù)據(jù)挖掘技術(shù),即從如此海量的數(shù)據(jù)中挖掘出有益信息或是發(fā)現(xiàn)出其中所隱含的規(guī)律,這無疑造成了數(shù)據(jù)浪費(fèi)。因此,探討數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用與研究對于從數(shù)據(jù)庫中發(fā)掘有益信息、提高教學(xué)質(zhì)量、提高教師教學(xué)水平等方面有深遠(yuǎn)的意義。

數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘即在給定數(shù)據(jù)庫中提取出隱含信息。這些隱含信息一般包括人們事先所未知的以及其中潛在的信息資源。這些隱含信息資源可以有多種多樣的表現(xiàn)形式,類似于概念規(guī)則、定理規(guī)律或者是模式等,沒有一個(gè)確定的規(guī)則來定義是何種表現(xiàn)形式。一般來說,從這些隱含信息中提取出來的信息知識都兼?zhèn)溆行?、最終可理解性、新穎性,換句話說,所挖掘的信息知識是可運(yùn)用的、可理解的、可接受的,而且最佳的結(jié)果是能夠通過自然的語言來表現(xiàn)出來。

數(shù)據(jù)挖掘要運(yùn)用一定的算法,進(jìn)行有條不紊的操作,一般其操作過程分為幾個(gè)步驟,即數(shù)據(jù)預(yù)處理,數(shù)據(jù)挖掘,模式評估。鞏固知識以及運(yùn)用知識等。

數(shù)據(jù)預(yù)處理是在數(shù)據(jù)處理之前的準(zhǔn)備工作,這一步驟是數(shù)據(jù)處理的基礎(chǔ)。進(jìn)行數(shù)據(jù)挖掘的對象即數(shù)據(jù),這些數(shù)據(jù)是存儲(chǔ)在數(shù)據(jù)庫中的,是高校在長期的數(shù)據(jù)管理中產(chǎn)生的。但是可想而知,若籠統(tǒng)的對這些數(shù)據(jù)直接進(jìn)行操作一定是十分不方便的,因此,要提前進(jìn)行數(shù)據(jù)預(yù)處理。類似于清除數(shù)據(jù)噪聲等操作。這是數(shù)據(jù)挖掘中的第一步,也是十分關(guān)鍵的一步,它對于數(shù)據(jù)挖掘的效率以及準(zhǔn)確度都有很大的影響。數(shù)據(jù)預(yù)處理之后進(jìn)行數(shù)據(jù)挖掘,根據(jù)預(yù)定的要求選擇出合適科學(xué)的算法以及參數(shù),來對已經(jīng)準(zhǔn)備好的數(shù)據(jù)做分析,產(chǎn)生一個(gè)數(shù)據(jù)集。這就是數(shù)據(jù)挖掘后可能會(huì)出現(xiàn)的知識模型。數(shù)據(jù)挖掘中,大多數(shù)據(jù)都是歷屆學(xué)生的學(xué)習(xí)情況以及教師的教學(xué)情況,包括教學(xué)任務(wù)教學(xué)計(jì)劃、教師的教案等。這些復(fù)雜的數(shù)據(jù)內(nèi)容構(gòu)成了數(shù)據(jù)庫。在數(shù)據(jù)挖掘這一環(huán)節(jié)中,其對象是數(shù)據(jù)倉庫中的這些內(nèi)容,因而數(shù)據(jù)倉庫的系統(tǒng)體系結(jié)構(gòu)十分重要。針對高校的教務(wù)管理特點(diǎn),建立起與之相適應(yīng)的數(shù)據(jù)倉庫體系結(jié)構(gòu),類似的體系結(jié)構(gòu)包括中央數(shù)據(jù)倉庫、數(shù)據(jù)集市以及個(gè)人倉庫;根據(jù)不同的數(shù)據(jù)挖掘需求選取不同的數(shù)據(jù)庫體系結(jié)構(gòu);根據(jù)相應(yīng)的具體特征,完成針對各種目標(biāo)的數(shù)據(jù)挖掘目的。模式評估作為數(shù)據(jù)挖掘中的一個(gè)關(guān)鍵步驟,是由挖掘的算法形成的模式或者是規(guī)律,當(dāng)然也會(huì)出現(xiàn)沒有意義或者沒有實(shí)用價(jià)值的情況,還會(huì)出現(xiàn)不能真實(shí)反映出數(shù)據(jù)真正含義的情況,甚至顯示的內(nèi)容恰與實(shí)際情況相悖。這些現(xiàn)象都是會(huì)有幾率出現(xiàn)的,因此,進(jìn)行模式評估意義重大,一來使得挖掘數(shù)據(jù)的效果更有意義,二來還使得數(shù)據(jù)在反復(fù)的提取中能夠顯示出更有利的知識。鞏固知識以及運(yùn)用知識的層面,是對于數(shù)據(jù)挖掘結(jié)果的一致性檢查,旨在更大程度確保所挖掘的內(nèi)容與已知信息不碰撞,同時(shí),還能在運(yùn)用過程中不斷發(fā)現(xiàn)值得優(yōu)化的方面,更好地做出決策。

數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用與研究

1.原始資料庫

我們將電子在線答疑系統(tǒng)中保留的數(shù)據(jù)內(nèi)容稱為“原始資料庫”,然后將這一數(shù)據(jù)內(nèi)容保存在Web數(shù)據(jù)庫中,以便于接收學(xué)生們對于學(xué)科建設(shè)等相關(guān)內(nèi)容的咨詢,類似于學(xué)科性質(zhì)或者是相關(guān)知識等,包括學(xué)生們對于課題求解方法或者是求解步驟的咨詢。除此之外,數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用研究——原始資料庫,還發(fā)揮著記錄教師對于學(xué)科建設(shè)的建議以及看法的作用、解答實(shí)際問題的作用等。另外,原始資料庫中還存儲(chǔ)著學(xué)生的一些基本資料、老師授課的情況、教案備案信息等多種數(shù)據(jù)。這些數(shù)據(jù)信息在與之相應(yīng)的學(xué)院數(shù)據(jù)庫中的存取、存儲(chǔ)形成了原始資料庫的主要部分。利用數(shù)據(jù)挖掘技術(shù),能夠?qū)W(xué)生們對某一學(xué)科的感興趣程度或是相關(guān)問題進(jìn)行實(shí)時(shí)了解,從而教師可以實(shí)現(xiàn)正確的引導(dǎo),同時(shí)能夠把學(xué)生的問題以及相對應(yīng)的解決方案等數(shù)據(jù)進(jìn)行科學(xué)合理地存儲(chǔ),存儲(chǔ)到相應(yīng)的數(shù)據(jù)倉庫或者是數(shù)據(jù)集市等領(lǐng)域。這無疑為學(xué)科建設(shè)的發(fā)展起到了極大的推進(jìn)作用。

2.隨訪信息庫

學(xué)科建設(shè)工作的深入開展,使得數(shù)據(jù)挖掘技術(shù)在這一內(nèi)容中的應(yīng)用研究地位更加突出。隨訪工作量不斷增大,也使得數(shù)據(jù)挖掘的應(yīng)用與研究課題更加有意義。高校中的數(shù)據(jù)管理內(nèi)容不斷龐大起來,因此,數(shù)據(jù)的挖掘管理技術(shù)在其計(jì)算機(jī)學(xué)科建設(shè)等方面需要不斷的深入應(yīng)用研究。我們可以把電子在線答疑系統(tǒng)的數(shù)據(jù)稱為“原始資料庫”,對其進(jìn)行數(shù)據(jù)處理,然后建立相應(yīng)的“隨訪數(shù)據(jù)庫”。主要作用是師生等對于學(xué)科建設(shè)進(jìn)行相應(yīng)的跟蹤調(diào)查。把經(jīng)過清理處理的原始資料庫中相關(guān)的數(shù)據(jù)內(nèi)容歸納入隨訪信息庫內(nèi),換句話說,這一應(yīng)用研究對于教改信息資源等內(nèi)容的第二次開發(fā)有著重要影響。隨訪信息庫中,包含了學(xué)生的基本信息,如學(xué)生信息以及學(xué)生的學(xué)習(xí)情況,學(xué)生反映的一些實(shí)時(shí)情況等多種形式的數(shù)據(jù)信息。高校中的關(guān)于數(shù)據(jù)挖掘在計(jì)算機(jī)學(xué)科建設(shè)中的應(yīng)用研究中,隨訪數(shù)據(jù)庫的應(yīng)用基礎(chǔ)是原始資料庫,通過進(jìn)行有價(jià)值信息的篩選對隨訪數(shù)據(jù)庫進(jìn)行實(shí)時(shí)應(yīng)用,建成計(jì)算機(jī)學(xué)科建設(shè)的隨訪信息庫。

3.在線隨訪答疑

通過一系列的隨訪手段進(jìn)行相關(guān)隨訪,從而建立起一個(gè)能夠?qū)τ陔S訪進(jìn)行自動(dòng)處理的在線隨訪答疑系統(tǒng);這一系統(tǒng)所發(fā)揮的作用正是數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用研究。在線隨訪答疑的系統(tǒng)中的學(xué)生信息情況是與隨訪信息庫中的學(xué)生信息相一致的。高校信息系統(tǒng)中必然會(huì)產(chǎn)生大量的數(shù)據(jù)信息,對這些數(shù)據(jù)全部調(diào)用幾乎是不可能辦到的,即使辦到了,也是屬于無用功。在線隨訪答疑的應(yīng)用就針對這一現(xiàn)象發(fā)揮出作用。通過數(shù)據(jù)挖掘技術(shù)在學(xué)科建設(shè)中的應(yīng)用研究,能夠?qū)㈦S訪信息庫與原始資料庫相結(jié)合,從而能夠進(jìn)行具體科學(xué)的數(shù)據(jù)分析,實(shí)現(xiàn)清理以及挖掘操作,以便得到相應(yīng)的結(jié)論,比如具有代表性、具有科學(xué)的指導(dǎo)意義的教學(xué)案例等,繼而還可以將這一教學(xué)案例添加到相應(yīng)的教學(xué)案例庫中。這也為日后形成具有規(guī)模性的、輔導(dǎo)價(jià)值的教學(xué)案例系統(tǒng)、或指導(dǎo)信息庫打下基礎(chǔ)。由此形成師生之間的資源共享,信息共享,老師、學(xué)生都可以從此有所借鑒。

結(jié)語

總而言之,基于教學(xué)管理系統(tǒng)中建立的數(shù)據(jù)庫,結(jié)合學(xué)科建設(shè)中的具體教學(xué)要求,利用數(shù)據(jù)挖掘,提取出對于學(xué)科建設(shè)有利的數(shù)據(jù),找出在具體的教學(xué)環(huán)節(jié)中所表現(xiàn)出的薄弱環(huán)節(jié),繼而根據(jù)具體的形式,制定出對于學(xué)科建設(shè)有利的教學(xué)策略,使高校能夠?qū)崿F(xiàn)數(shù)據(jù)倉庫建設(shè)以及數(shù)據(jù)挖掘的研究應(yīng)用。計(jì)算機(jī)學(xué)科建設(shè)工作的開展力度不斷加大,數(shù)據(jù)挖掘技術(shù)也隨之凸顯出其優(yōu)勢,如何將數(shù)據(jù)挖掘在學(xué)科建設(shè)中得到更好的研究與應(yīng)用是推動(dòng)學(xué)科建設(shè)更加完善的前提與保障。數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用研究為教學(xué)和學(xué)科的研究工作提供了極大的方便。

猜你喜歡
資料庫信息庫數(shù)據(jù)倉庫
基于數(shù)據(jù)倉庫的數(shù)據(jù)傾斜解決方案研究
國家社科基金重大項(xiàng)目“‘古今字’資料庫建設(shè)與相關(guān)專題研究”成果鑒定會(huì)順利召開
借助BIM構(gòu)建動(dòng)態(tài)造價(jià)信息庫的新思路
實(shí)現(xiàn)科學(xué)教材中資料庫的教育價(jià)值
基于普元EOS平臺的信息庫的設(shè)計(jì)與實(shí)現(xiàn)
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
數(shù)據(jù)倉庫系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
大學(xué)生自建口譯資料庫初探
出土文獻(xiàn)數(shù)字化整理簡述
數(shù)據(jù)復(fù)用在存儲(chǔ)數(shù)據(jù)倉庫中的運(yùn)用
敖汉旗| 蛟河市| 腾冲县| 博湖县| 美姑县| 明光市| 剑川县| 商河县| 临夏市| 崇明县| 广元市| 栾川县| 越西县| 饶平县| 潞城市| 庐江县| 南雄市| 巧家县| 府谷县| 红原县| 定安县| 比如县| 临湘市| 舞阳县| 常熟市| 博客| 安多县| 六安市| 镇原县| 蒙城县| 八宿县| 隆德县| 肥城市| 凤山县| 正安县| 太原市| 乌兰浩特市| 清水河县| 邹平县| 新安县| 临安市|