国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于關(guān)聯(lián)規(guī)則興趣度的課程設(shè)置研究

2014-02-11 07:28李佐軍
大理大學學報 2014年6期
關(guān)鍵詞:置信度專業(yè)課數(shù)據(jù)挖掘

李佐軍

(臨滄師范高等??茖W校信息科學與技術(shù)系,云南臨滄 677000)

基于關(guān)聯(lián)規(guī)則興趣度的課程設(shè)置研究

李佐軍

(臨滄師范高等專科學校信息科學與技術(shù)系,云南臨滄 677000)

介紹數(shù)據(jù)挖掘和關(guān)聯(lián)規(guī)則的概念,引入一個關(guān)聯(lián)規(guī)則新的度量值——興趣度,并使用Visual FoxPro開發(fā)了一個關(guān)聯(lián)規(guī)則挖掘系統(tǒng)。在設(shè)定最小支持度、最小置信度和興趣度的條件下,使用挖掘系統(tǒng)對計算機專業(yè)學生的專業(yè)課成績進行關(guān)聯(lián)分析,通過分析找出它們間的內(nèi)在聯(lián)系,為課程設(shè)置提供依據(jù)。

關(guān)聯(lián)規(guī)則;興趣度;課程設(shè)置

隨著我國高校辦學規(guī)模的擴大和競爭的加劇,學校如何實現(xiàn)“全面貫徹黨的教育方針,堅持教育為社會主義現(xiàn)代化建設(shè)服務(wù)、為人民服務(wù),把立德樹人作為教育的根本任務(wù),培養(yǎng)德智體美全面發(fā)展的社會主義建設(shè)者和接班人”〔1〕的目標,關(guān)鍵是看專業(yè)培養(yǎng)目標,而專業(yè)培養(yǎng)目標主要體現(xiàn)在課程設(shè)置上。本文以計算機專業(yè)的課程設(shè)置為案例,使用關(guān)聯(lián)規(guī)則挖掘技術(shù)分析各課程間關(guān)系,確保課程設(shè)置合理,更好的為培養(yǎng)目標服務(wù)。

1 相關(guān)知識

1.1數(shù)據(jù)挖掘數(shù)據(jù)挖掘(Data Mining,DM),是從海量的歷史數(shù)據(jù)中獲取未知的,但又有利用價值的信息和知識的過程,是數(shù)據(jù)庫技術(shù)、概率與數(shù)理統(tǒng)計、人工智能等多門學科綜合而成的交叉學科〔2〕。從圖1可看出,預處理、挖掘和評估表示組成了數(shù)據(jù)挖掘過程,也構(gòu)成了知識發(fā)現(xiàn)的過程〔3〕。

圖1 數(shù)據(jù)挖掘步驟

按照不同挖掘角度來劃分,數(shù)據(jù)挖掘主要方法包括關(guān)聯(lián)規(guī)則、估計、預測、聚類、描述和可視化、分類、復雜數(shù)據(jù)類型挖掘(如Text、Web、圖形圖像、視頻音頻等)等〔4〕。

1.2關(guān)聯(lián)規(guī)則

1.2.1 關(guān)聯(lián)規(guī)則的定義 關(guān)聯(lián)規(guī)則是由R.A.Grawal等人在1993年的SIGMOD會議上提出來的,將關(guān)聯(lián)規(guī)則描述為:設(shè)I={i1,i2,…,in}是項目集,D是事務(wù)集,T是I上子集,TíI,TID標識單個事務(wù),則關(guān)聯(lián)規(guī)則就是形如(X?Y)的蘊含式,其中X∈I,Y∈I且,X叫做規(guī)則的條件,Y叫做規(guī)則的結(jié)果,表示為(X?Y)〔5〕。

1.2.2 關(guān)聯(lián)規(guī)則的閾值 為了提高關(guān)聯(lián)規(guī)則挖掘的準確率,引入了支持度(記為S)和置信度(記為C)兩個參數(shù),它們的計算式分別表示為(1)和(2)式。

其中D表示事務(wù)數(shù)據(jù)庫,N表示事務(wù)數(shù)據(jù)庫D中各項事務(wù)數(shù)的總和,Count(X)表示事務(wù)X在事務(wù)數(shù)據(jù)庫D中的出現(xiàn)次數(shù),Count(X∪Y)表示事務(wù)X與Y在事務(wù)數(shù)據(jù)庫D中同時出現(xiàn)的次數(shù)。支持度S反映出了事務(wù)X在事務(wù)數(shù)據(jù)庫D中出現(xiàn)的頻率,置信度C反映出了事務(wù)X出現(xiàn)時事務(wù)Y中出現(xiàn)的頻率。

在關(guān)聯(lián)規(guī)則(X?Y)中,發(fā)現(xiàn)有用關(guān)聯(lián)規(guī)則所必須滿足的最小支持閾值叫做最小支持度,表示為Min-S;同樣地,所必須滿足的最小可信度值稱為最小置信度,表示為Min-C。所以支持度用來衡量關(guān)聯(lián)規(guī)則在整個數(shù)據(jù)集中的重要性,置信度則用來表示關(guān)聯(lián)規(guī)則的可信程度。

1.3 Apriori算法

1.3.1 Apriori算法基本思想 Apriori算法是關(guān)聯(lián)規(guī)則的最經(jīng)典算法,是最有影響力的布爾型關(guān)聯(lián)規(guī)則挖掘頻繁項集的算法之一,是使用逐層搜索迭代算法由k項集探索生成(k+1)項集的過程〔6〕。Apriori算法的程序流程如圖2所示。

1.3.2 Apriori算法描述 由Apriori算法思想知道,Apriori算法是使用逐層搜索迭代方法在候選項集基礎(chǔ)上找出頻繁各項集的過程,其算法偽代碼如圖3所示。

2 興趣度

2.1興趣度的提出背景在關(guān)聯(lián)規(guī)則挖掘中,只使用支持度S和置信度C兩個基本參數(shù)是不能完全衡量規(guī)則的價值的,會導致滿足最小支持度和最小置信度的部分強關(guān)聯(lián)規(guī)則無使用價值;當最小支持度閾值和最小置信度閾值太小時,會產(chǎn)生相互矛盾的規(guī)則;當太大時,則將會遺漏有意義的規(guī)則〔7〕。所以,人們提出了關(guān)聯(lián)規(guī)則新的度量值——興趣度,來彌補支持度與置信度的不足,提高關(guān)聯(lián)規(guī)則挖掘的“抗干擾”能力。

圖2 Apriori算法流程圖

圖3 Apriori算法偽代碼

2.2興趣度設(shè)計目前,關(guān)于興趣度模型主要有概率興趣度模型、Symth函數(shù)興趣度模型、Gini指標興趣度模型、Piantesky-Shapiro興趣度模型、基于差異思想的興趣度模型等〔8〕。將應用一種由文獻〔9〕提出的興趣度模型,其定義如下:

設(shè)I={i1,i2,…,in}是項目集,D是事務(wù)數(shù)據(jù)庫,關(guān)聯(lián)規(guī)則(X?Y)的興趣度模型如(3)式所示。

其中,P(Y)=Count(Y)∕N,P(Y|X)=Count(X∪Y)∕Count(X),N表示事務(wù)數(shù)據(jù)庫D中各事務(wù)數(shù)的總和,所以(3)式變?yōu)椋?)式。

對于興趣度值I(X?Y)來說,其值越大挖掘出的關(guān)聯(lián)規(guī)則越有趣,參考價值也越高。

3 關(guān)聯(lián)規(guī)則在課程設(shè)置中的應用

3.1數(shù)據(jù)準備數(shù)據(jù)挖掘采用的原數(shù)據(jù)是我校計算機專業(yè)學生專業(yè)課成績,其結(jié)構(gòu)如表1所示。

表1 學生專業(yè)課成績表

3.2數(shù)據(jù)預處理采集的原始數(shù)據(jù)可能存在缺失、不合法等問題,不能直接作為數(shù)據(jù)挖掘的對象,必須對其進行預處理。對于成績數(shù)據(jù)的預處理主要包括數(shù)據(jù)合法性判斷、缺失數(shù)據(jù)處理、進一步離散化處理等操作。

對于合法性判斷,學生成績數(shù)據(jù)一般是0至100之間的數(shù)值數(shù)據(jù),若不是則標記為缺失數(shù)據(jù)。對于缺失數(shù)據(jù)處理,采用平均值填充的方法處理。對于進一步離散化處理,以每個科目的平均分作為界點將學生成績分為“優(yōu)良”與“一般”兩類,當成績在此門課成績平均值之上(含等于)的學生成績標記為“優(yōu)良”,反之則標記為“一般”。預處理后的學生專業(yè)課成績?nèi)绫?所示。

表2 學生專業(yè)課成績離散化結(jié)果

3.3關(guān)聯(lián)規(guī)則挖掘數(shù)據(jù)挖掘工具是采用以Visual FoxPro作為平臺而開發(fā)的成績分析系統(tǒng),其主要包括系統(tǒng)管理、算法驗證、數(shù)據(jù)預處理、數(shù)據(jù)離散化、關(guān)聯(lián)挖掘、數(shù)據(jù)查看等功能模塊。在關(guān)聯(lián)規(guī)則挖掘時,設(shè)定最小支持度、置信度和興趣度閾值后,顯示滿足閾值的規(guī)則,其結(jié)果如圖4所示。

圖4 關(guān)聯(lián)挖掘結(jié)果

3.4關(guān)聯(lián)規(guī)則挖掘結(jié)果分析

3.4.1 閾值選取 研究關(guān)聯(lián)規(guī)則挖掘涉及支持度、置信度、興趣度3個閾值參數(shù),支持度是衡量規(guī)則的重要性,置信度是衡量規(guī)則的可信程度,用來彌補支持度和置信度不足的興趣度是衡量用戶對規(guī)則感興趣程度的。當閾值設(shè)置得過低時,挖掘出來的規(guī)則越多,但是規(guī)則的有用程度就越低;反之,挖掘出來的規(guī)則就越少,但是卻會失去比較有用的規(guī)則;所以設(shè)置適合閾值是非常重要的〔10〕。因此,在實驗時多次輸入閾值進行測試對比后發(fā)現(xiàn)當支持度、置信度和興趣度閾值分別為10%、50%和2時顯示規(guī)則效果最好,顯示的科目信息比較完整,能反映出各專業(yè)成績間的關(guān)系,具體測試閾值如表3所示。

3.4.2 結(jié)果分析 當最小支持度、置信度和興趣度閾值分別為10%、50%和2時,其關(guān)聯(lián)挖掘結(jié)果如圖4所示。做進一步分析,可得如下結(jié)論。

第一,從規(guī)則1-10看出,數(shù)學基礎(chǔ)、電路技術(shù)對計算機專業(yè)課程的學習很重要,如操作系統(tǒng)、C語言程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫技術(shù)等。所以在課程設(shè)置時將數(shù)學基礎(chǔ)、電路技術(shù)作為其它專業(yè)基礎(chǔ)課程的先行課安排在第一學期,或第一學期的前半學期,并適當增加數(shù)學基礎(chǔ)、電路技術(shù)的課時。

表3 閾值對規(guī)則顯示的影響比較

第二,從規(guī)則11-15看出,計算機導論作為第一門專業(yè)課,對操作系統(tǒng)、C語言程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫技術(shù)、動畫設(shè)計等專業(yè)課學習影響很大。所以應適當增加計算機導論課時,任課教師也要正確引導學生學習計算機專業(yè)知識,提高學生學習興趣。

第三,從規(guī)則16-24看出,操作系統(tǒng)、C語言程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)3門課程對其他專業(yè)課的學習影響比較大。所以在課程設(shè)置時應適當增加此3門課程的課時,任課教師也要強化這3門課程教學。

第四,從規(guī)則25-30看出,各專業(yè)課間也相互影響,所以在設(shè)置時應該充分考慮各門專業(yè)課間的關(guān)系,使其相互滲透、相互促進。

由以上分析可總結(jié):在進行計算機專業(yè)課程設(shè)置時,首先將數(shù)學基礎(chǔ)、電路技術(shù)、計算機導論作為專業(yè)課程體系第一階段開設(shè),其次操作系統(tǒng)、C語言程序設(shè)計、數(shù)據(jù)結(jié)構(gòu)作為專業(yè)課程體系第二階段開設(shè),最后將數(shù)據(jù)庫技術(shù)、網(wǎng)頁制作等應用型專業(yè)課作為專業(yè)課程體系第三階段開設(shè)。通過規(guī)則的分析就可以得出計算機專業(yè)所開設(shè)課程的相關(guān)性,可以知道哪些課程應該先學,哪些課程應該后學,要學好后續(xù)的課程必須把相關(guān)的先行課程學好,這就為教育管理工作者進行指定教學計劃和教學方案提供了決策支持,也為學生選課和獲取某門課程好成績提供了方向性的指導意見〔11〕。

4 結(jié)束語

文章對關(guān)聯(lián)規(guī)則挖掘技術(shù)在課程設(shè)置中的應用進行研究探索,并在分析中引入興趣度閾值,大大提高了挖掘規(guī)則使用價值。文中以關(guān)聯(lián)規(guī)則挖掘算法進行了挖掘,找出一些客觀反映課程間關(guān)系的規(guī)則,并根據(jù)挖掘結(jié)果提出一些有益于課程設(shè)置的建議,為專業(yè)負責人進行課程設(shè)置提供新的依據(jù)。

〔1〕楊榮彬,李汝恒,胡永茂,等.論地方高校建筑學基礎(chǔ)教育課程的教學設(shè)計〔J〕.大理學院學報,2013,12(10):81-85.

〔2〕陳京民.數(shù)據(jù)倉庫原理、設(shè)計與應用〔M〕.北京:中國水利水電出版社,2004.

〔3〕李佐軍.關(guān)聯(lián)規(guī)則算法在招生中的應用研究〔J〕.普洱學院學報,2010,26(3):46-50.

〔4〕詹柳春.數(shù)據(jù)挖掘技術(shù)在高校招生錄取數(shù)據(jù)中的應用研究〔D〕.武漢:華南理工大學,2012.

〔5〕石偉勝,陳濤.關(guān)聯(lián)規(guī)則理論研究及其在教學中應用〔J〕.電腦知識與技術(shù),2006(26):162.

〔6〕HAN J W,KAMBER Micheline.數(shù)據(jù)挖掘概念及技術(shù)〔M〕.范明,孟小峰,譯.北京:機械工業(yè)出版,2008:147-154.

〔7〕董輝.基于興趣度的高職課程關(guān)聯(lián)規(guī)則挖掘〔J〕.吉首大學學報:自然科學版,2012,33(3):41-46.

〔8〕吳杰.基于興趣度的關(guān)聯(lián)規(guī)則挖掘〔D〕.長春:哈爾濱工業(yè)大學,2009.

〔9〕李永立,吳沖,王崑聲.一種新的關(guān)聯(lián)規(guī)則興趣度度量方法〔J〕.情報科學,2011,30(5):503-507.

〔10〕劉獨玉.關(guān)聯(lián)規(guī)則挖掘算法研究〔D〕.成都:電子科技大學,2007.

〔11〕黃秋勇.基于關(guān)聯(lián)規(guī)則挖掘的課程設(shè)置合理性分析〔J〕.電腦學習,2010(5):57-59.

〔12〕邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法〔M〕.北京:中國水利水電出版杜,2003.

(責任編輯 袁 霞)

A Study of Curriculum Setting Based on Association Rule Interestingness

LI Zuojun
(Department of Information Science&Technology,Lincang Teachers'College,Lincang,Yunnan 677000,China)

This paper mainly gives a general introduction to data mining,concept and algorithm of association rule and also introduces a new concept——association rule interestingness.Under the condition of defaulting minimum support,minimum confidence and interestingness,the author developed the software of association rule mining by using Visual FoxPro to make an analysis of computer majors'grades of their specialized courses with the hope that the relationship between the specialized courses could be found out,which can provide a scientific basis for curriculum setting.

association rule;interestingness;curriculum setting

TP311.1

A

1672-2345(2014)06-0020-04

10.3969∕j.issn.1672-2345.2014.06.006

臨滄師范高等??茖W校2011年度自然科學、基礎(chǔ)應用研究基金資助項目(LCSZL2010009)

2013-12-02

2014-02-21

李佐軍,講師,主要從事數(shù)據(jù)挖掘技術(shù)和教學管理研究.

猜你喜歡
置信度專業(yè)課數(shù)據(jù)挖掘
一種基于定位置信度預測的二階段目標檢測方法
硼鋁復合材料硼含量置信度臨界安全分析研究
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
中職《醫(yī)護英語》與專業(yè)課的結(jié)合教學探索
“導入課”在高校專業(yè)課實施“課程思政”的實踐與思考
正負關(guān)聯(lián)規(guī)則兩級置信度閾值設(shè)置方法
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應用
置信度條件下軸承壽命的可靠度分析
研究生專業(yè)課學分制教學改革探討
汝南县| 长春市| 蓬溪县| 榆林市| 自治县| 内乡县| 响水县| 留坝县| 闽清县| 水城县| 巴林右旗| 临沭县| 乳山市| 个旧市| 德令哈市| 镶黄旗| 侯马市| 新沂市| 秦皇岛市| 宝坻区| 哈密市| 达孜县| 当阳市| 凤阳县| 榆社县| 葵青区| 南宁市| 准格尔旗| 师宗县| 巴林右旗| 金川县| 西乌珠穆沁旗| 板桥市| 兴安盟| 阳朔县| 伊宁县| 禄劝| 永和县| 井冈山市| 宝应县| 元氏县|