国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

ID3算法在教學(xué)過(guò)程中的應(yīng)用

2011-01-23 09:25王和平
科學(xué)之友 2011年4期
關(guān)鍵詞:決策樹(shù)分類算法

龐 娜,王和平

(山西電力職業(yè)技術(shù)學(xué)院,山西 太原 030021)

ID3算法在教學(xué)過(guò)程中的應(yīng)用

龐 娜,王和平

(山西電力職業(yè)技術(shù)學(xué)院,山西 太原 030021)

在教學(xué)過(guò)程中,不同的學(xué)生適應(yīng)不同的教學(xué)方法,只有選擇合適的教學(xué)方法才能達(dá)到事半功倍的效果。本文使用決策樹(shù)算法中比較簡(jiǎn)單適用的ID3算法,通過(guò)使用訓(xùn)練數(shù)據(jù)計(jì)算信息增益從而選擇分裂屬性的次序,由此構(gòu)建決策樹(shù),并將構(gòu)建好的決策樹(shù)應(yīng)用于學(xué)生信息,對(duì)學(xué)生進(jìn)行分類。

ID3算法;決策樹(shù);分裂屬性;信息增益

教學(xué)其實(shí)也是一種藝術(shù),有多種方法,目的只有一個(gè),就是怎樣很好的引導(dǎo)學(xué)生朝著他們想要達(dá)到的方向前進(jìn),這個(gè)過(guò)程很漫長(zhǎng),在這過(guò)程中要采用很多不同的方法來(lái)教育學(xué)生。但是不同的學(xué)生所適用的教學(xué)方法是不同的:理科類學(xué)生要很有條理的去思考問(wèn)題,想辦法解決問(wèn)題;文科學(xué)生更多是通過(guò)感性的方式去理解事物;而工科的學(xué)生更多是通過(guò)實(shí)踐或?qū)嶒?yàn)數(shù)據(jù)來(lái)解釋某些現(xiàn)象。不同年齡階段的學(xué)生所適用的教學(xué)方法也不同:低年級(jí)的學(xué)生要接受更多的新事物、新概念,在講課時(shí)應(yīng)更多使用圖示、列表等形象的方法;高年級(jí)的學(xué)生已經(jīng)掌握了一定的基礎(chǔ)知識(shí),就應(yīng)更多的采用引導(dǎo)探究為主的方法,培養(yǎng)學(xué)生學(xué)習(xí)的積極性和主動(dòng)性。此外性別因素對(duì)學(xué)生的學(xué)習(xí)方法也有影響:男同學(xué)的動(dòng)手能力要強(qiáng)一些;而女同學(xué)則更擅長(zhǎng)語(yǔ)言文字的表達(dá)。因此選擇適當(dāng)?shù)慕虒W(xué)方法可以在很大程度上提高學(xué)生的學(xué)習(xí)效率,達(dá)到因材施教,事半功倍的效果。要對(duì)不同類型的學(xué)生使用不同的教學(xué)方法,首先要根據(jù)不同學(xué)生的特點(diǎn)對(duì)其做適當(dāng)?shù)姆诸悺?/p>

在求解分類問(wèn)題的方法中,決策樹(shù)是最有用的一種方法。一旦建好樹(shù),就可將其應(yīng)用于數(shù)據(jù)庫(kù)中的元組,并得到分類結(jié)果。使用決策樹(shù)求解分類問(wèn)題易于理解且高效,對(duì)大型數(shù)據(jù)庫(kù)具有很好的擴(kuò)展性。本文通過(guò)ID3 算法構(gòu)建決策樹(shù),并將構(gòu)建好的樹(shù)應(yīng)用于數(shù)據(jù)對(duì)學(xué)生進(jìn)行分類。

1 決策樹(shù)算法介紹

決策樹(shù)學(xué)習(xí)算法是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,通常用來(lái)形成分類器和預(yù)測(cè)模型,可以對(duì)未知數(shù)據(jù)進(jìn)行分類或預(yù)測(cè)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘等。決策樹(shù)主要適用于對(duì)具有多個(gè)屬性的數(shù)據(jù)進(jìn)行分類。決策樹(shù)算法在解決問(wèn)題時(shí)主要分為兩步:第一,構(gòu)建決策樹(shù);第二,將決策樹(shù)應(yīng)用于數(shù)據(jù)。

1.1 數(shù)據(jù)采集

決策樹(shù)構(gòu)造的輸入是一組帶有類別標(biāo)記的例子,構(gòu)造的結(jié)果是一棵二叉樹(shù)或多叉樹(shù)。決策樹(shù)中每個(gè)結(jié)點(diǎn)按屬性進(jìn)行標(biāo)記,每個(gè)弧被標(biāo)記為一個(gè)謂詞,這個(gè)謂詞可以應(yīng)用于相應(yīng)結(jié)點(diǎn)的屬性,每個(gè)葉節(jié)點(diǎn)被標(biāo)記為一個(gè)類。發(fā)生分裂的屬性叫做分列屬性,在構(gòu)建決策樹(shù)過(guò)程中首先要選擇最佳分裂屬性。影響學(xué)生的學(xué)習(xí)因素有很多,但是不能都作為分列屬性,如性格和社會(huì)環(huán)境雖然也會(huì)影響學(xué)生的學(xué)習(xí),但如果將其納入分裂屬性會(huì)使決策樹(shù)過(guò)于復(fù)雜,不利于對(duì)數(shù)據(jù)分類。經(jīng)過(guò)篩選我們選取年級(jí)、性別、科目作為分裂屬性,由此構(gòu)造決策樹(shù)。

通過(guò)對(duì)數(shù)據(jù)庫(kù)中學(xué)生信息數(shù)據(jù)進(jìn)行轉(zhuǎn)換、加載和處理,同時(shí)綜合考慮影響學(xué)生學(xué)習(xí)的主要因素選取如表1樣本數(shù)據(jù)集。

表1 用于學(xué)生分類的訓(xùn)練數(shù)據(jù)

表1中每一條記錄表示一個(gè)學(xué)生的信息,每一列表示學(xué)生一方面的屬性。其中性別、科目、年級(jí)作為分裂屬性,對(duì)學(xué)生是否適應(yīng)圖形、圖表演示的教學(xué)方法進(jìn)行判斷。

1.2 ID3算法的應(yīng)用

在構(gòu)造決策樹(shù)的過(guò)程中哪個(gè)屬性作為分列屬性,以及分裂屬性次序的選擇會(huì)影響算法的性能。根據(jù)分列屬性選擇方法的不同有不同的決策樹(shù)算法。常用的決策樹(shù)算法有ID3算法,C4.5算法和C5.0算法等。C4.5和C5.0算法主要用于解決連續(xù)數(shù)據(jù)的分類問(wèn)題。ID3算法則用于解決非連續(xù)數(shù)據(jù)的分類問(wèn)題。學(xué)生的信息屬于非連續(xù)數(shù)據(jù),因此選用ID3算法。

要構(gòu)建樹(shù)必須選擇分裂屬性的次序,ID3算法根據(jù)每個(gè)分裂屬性所產(chǎn)生信息增益的大小對(duì)其排序。

表1中共有18條記錄,訓(xùn)練數(shù)據(jù)的初始狀態(tài)為:適應(yīng)演示教學(xué)法的占(10/18),不適應(yīng)的占(8/18)。首先計(jì)算初始集合的熵為:如果選擇科目作為分列屬性,則文、理、工科均有6個(gè)學(xué)生,文科學(xué)生組成子集的熵為:

理科學(xué)生組成子集的熵為:

工科學(xué)生組成子集的熵為:

上述兩個(gè)熵的加權(quán)和為:

因此,用科目作為分裂屬性所得的信息增益為:

同樣,分別選擇年級(jí)、性別,作為分裂屬性,所得到的信息增益分別是0.0526和0。因此選擇年級(jí)作為第一分裂屬性,接下來(lái)是科目,最后是性別。

1.3 決策樹(shù)的生成

訓(xùn)練開(kāi)始時(shí)所有數(shù)據(jù)都在根結(jié)點(diǎn),然后遞歸地進(jìn)行數(shù)據(jù)劃分,最終生成一棵初始樹(shù)。通過(guò)前面的訓(xùn)練數(shù)據(jù)所生成的決策樹(shù),見(jiàn)圖1。

從圖1中可以看到,在對(duì)學(xué)生信息數(shù)據(jù)進(jìn)行分類時(shí)首先根據(jù)年級(jí)屬性可以將所有數(shù)據(jù)劃分成3個(gè)集合,每一個(gè)集合分別包含1,2,3年級(jí)的學(xué)生。具體每一個(gè)集合,又可以根據(jù)科目分為三類,分別表示各年級(jí)的文、理、工科學(xué)生子集合。最后可以根據(jù)性別確定每一個(gè)學(xué)生到底是否能適應(yīng)圖形、圖表演示的教學(xué)方法。

1.4 決策樹(shù)的應(yīng)用

在教學(xué)過(guò)程中存在有多種多樣的教學(xué)方法,如果直接按照不同的教學(xué)方法對(duì)學(xué)生分類,這樣所構(gòu)成的決策樹(shù)過(guò)于復(fù)雜,所以效率不高。本文通過(guò)改變表中第四列的數(shù)據(jù),可以得到學(xué)生對(duì)不同教學(xué)方法的適應(yīng)性。

教師在教學(xué)過(guò)程中通過(guò)將本班的學(xué)生信息輸入所構(gòu)建好的決策樹(shù)中,得到學(xué)生對(duì)不同教學(xué)方法的適應(yīng)程度,由此選擇適當(dāng)?shù)慕虒W(xué)方法。

2 結(jié)束語(yǔ)

決策樹(shù)算法是常用的分類方法,這種算法分類精度高,形成的模式簡(jiǎn)單,對(duì)噪聲數(shù)據(jù)有很好的健壯性。本文使用決策樹(shù)算法中比較簡(jiǎn)單的ID3算法構(gòu)造決策樹(shù),對(duì)數(shù)據(jù)庫(kù)中的學(xué)生信息進(jìn)行分類,從而找到適合于學(xué)生學(xué)習(xí)的教學(xué)方法。這種方法雖然理論清晰方法簡(jiǎn)單,但是只考慮了性格、年級(jí)、性別三個(gè)因素,而影響學(xué)生的學(xué)習(xí)有眾多的原因,因此教師在實(shí)際教學(xué)過(guò)程中還應(yīng)通過(guò)不斷的歸納總結(jié),積累經(jīng)驗(yàn)使得算法進(jìn)一步得到完善,使算法具有更強(qiáng)的實(shí)踐性和應(yīng)用性。

1 王莉.ID3算法的研究與應(yīng)用[J].福建電腦報(bào),2010(1)

2 Margaret H.Dunham.數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2005

Application of ID3 Mothod on Teaching Process

Pang Na,Wang Heping

In the process of education , different students adapt to different method, however only proper teaching method can get twice the result with half the effort.This paper classifies the students according to the ID3 classification algorithm.To choose the right order of the splitting attributes, the mothod gets the information gain of different attributes using the training data and then constructs a decision tree.At last applies the decision tree to the classification of the students.

ID3 method; decision tree;splitting attribute; information gain

G642

A

1000-8136(2011)06-0131-02

猜你喜歡
決策樹(shù)分類算法
哪種算法簡(jiǎn)便
分類算一算
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
根據(jù)問(wèn)題 確定算法
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
教你一招:數(shù)的分類
說(shuō)說(shuō)分類那些事
決策樹(shù)學(xué)習(xí)的剪枝方法
決策樹(shù)多元分類模型預(yù)測(cè)森林植被覆蓋
本溪市| 水富县| 新田县| 贡觉县| 城口县| 竹溪县| 大港区| 文昌市| 上栗县| 合川市| 罗城| 竹溪县| 宜君县| 女性| 武夷山市| 内江市| 波密县| 富平县| 工布江达县| 汝阳县| 申扎县| 类乌齐县| 渭源县| 石林| 简阳市| 池州市| 乡宁县| 思南县| 卫辉市| 武强县| 遂溪县| 呼伦贝尔市| 治多县| 新津县| 满洲里市| 丘北县| 依兰县| 嘉禾县| 松潘县| 怀柔区| 张家川|