崔新春, 王 婧, 崔秀明, 劉永林, 田維柱
(曲阜師范大學(xué) 1. 信息科學(xué)與工程學(xué)院 2.招生就業(yè)處, 山東 日照 276826)
目前我國(guó)對(duì)學(xué)困生的研究主要針對(duì)的是中小學(xué)生,很少涉及到高校學(xué)生。然而大學(xué)生作為一個(gè)特殊的社會(huì)群體,他們朝氣蓬勃、富有理想,是社會(huì)的精英、國(guó)家的棟梁、民族的希望。對(duì)他們培養(yǎng)的不合格會(huì)影響學(xué)生的一生,也會(huì)影響整體的教育質(zhì)量,甚至影響國(guó)家的發(fā)展命運(yùn),因此對(duì)高校學(xué)困生的研究也應(yīng)是不容忽視的重要問題。
1) 學(xué)困生概念的厘定
自1963年,美國(guó)特殊教育學(xué)家Kirk第一個(gè)提出“學(xué)業(yè)不良”LD (Learning Disabilities)的概念之后,該概念受到教育界和心理界的廣泛關(guān)注。近四十年來(lái)的研究,使人們對(duì)學(xué)習(xí)存在障礙或?qū)W習(xí)存在困難的學(xué)生有了較深入的認(rèn)識(shí)。然而目前在“學(xué)業(yè)不良”的界定上,國(guó)際上仍沒有統(tǒng)一的標(biāo)準(zhǔn)。在美國(guó),被廣泛認(rèn)可的定義是由美國(guó)學(xué)習(xí)困難聯(lián)邦委員制定的,他們把學(xué)習(xí)困難定義為:理解或運(yùn)用語(yǔ)言、讀、寫、推理和計(jì)算等方面能力的缺乏[1]。這一概念包括知覺缺陷、腦損傷、輕微腦功能失調(diào)、發(fā)展性失語(yǔ)癥等,但不包括視覺、聽覺或運(yùn)動(dòng)缺陷、智力落后、環(huán)境、文化及經(jīng)濟(jì)不利等因素造成的“學(xué)業(yè)不良”。
我國(guó)關(guān)于“學(xué)業(yè)不良”的研究起步較晚,80年代以來(lái)研究者對(duì)于這一群體的相關(guān)稱謂不盡統(tǒng)一,如“學(xué)習(xí)障礙”、“學(xué)習(xí)失能”、“學(xué)習(xí)困難”、“學(xué)業(yè)不良”等。根據(jù)我國(guó)的國(guó)情,國(guó)內(nèi)對(duì)于學(xué)困生的研究主要關(guān)注的是學(xué)生的學(xué)習(xí)結(jié)果(學(xué)習(xí)成績(jī)),現(xiàn)今在學(xué)術(shù)界主要持有“學(xué)業(yè)不良的絕對(duì)性,學(xué)業(yè)不良的相對(duì)性” 這兩方面的觀點(diǎn)[2]。“學(xué)業(yè)不良的絕對(duì)性”是指那些身心健康,智力正常,但是學(xué)習(xí)成績(jī)沒有達(dá)到教學(xué)大綱的最低標(biāo)準(zhǔn)者;而“學(xué)業(yè)不良的相對(duì)性”是指身心健康的情況下,學(xué)習(xí)成績(jī)和其智力的潛在能力的差異。
截止到今天,有關(guān)學(xué)業(yè)困難的討論和研究仍在繼續(xù),但在理論上對(duì)“學(xué)業(yè)不良的相對(duì)性”理念得到了基本的認(rèn)同。由于研究者根據(jù)現(xiàn)行的教育體系,將“學(xué)業(yè)不良”的具體界定概括為三種類型[3]:①學(xué)習(xí)成績(jī)未達(dá)到合格標(biāo)準(zhǔn)者(即學(xué)校規(guī)定學(xué)生達(dá)到的最低合格水平);②學(xué)生的學(xué)習(xí)成績(jī)與其潛在的智力能力具有一定的差距者;③因其心理出現(xiàn)了某些問題,身心出現(xiàn)障礙,沒有能發(fā)揮出自己潛在的能力者。因此,我們對(duì)“學(xué)業(yè)不良”的相對(duì)性定義為:當(dāng)前學(xué)業(yè)能力還沒有發(fā)揮出自身學(xué)習(xí)的潛在能力。存在這種現(xiàn)象的各個(gè)群體中包括個(gè)體本身學(xué)習(xí)成績(jī)比較差;還包括學(xué)習(xí)成績(jī)還行,但可以發(fā)揮得更好或是還沒發(fā)揮出潛能的學(xué)習(xí)者;另一個(gè)可能是存在著智力與成就之間的客觀差異,或是學(xué)習(xí)者自身存在的的主觀意向,處于一種感覺自己能力高卻沒有發(fā)揮出自己潛能的狀態(tài),而對(duì)自己的表現(xiàn)不是很滿意[4]。
基于上述分析,在本文的研究中,主要以大學(xué)生這一群體作為研究對(duì)象,采用上海教育科學(xué)研究院吳增強(qiáng)教授的定義,即“學(xué)習(xí)困難的學(xué)生是指智力正常,學(xué)習(xí)效果低下,未達(dá)到學(xué)校教育規(guī)定的基本要求的學(xué)生”。因此在本文中我們把學(xué)習(xí)成績(jī)作為學(xué)困生的主要參考標(biāo)準(zhǔn)。
2) 歸因理論
所謂歸因,是指人類的一種普遍需要,生活中的我們每個(gè)人都有一套從自身經(jīng)驗(yàn)所總結(jié)出來(lái)的行為原因與其行為之間的聯(lián)系的看法和觀念。1958年,海德(Heider)在他的著作《人際關(guān)系心理》中,提出了歸因理論。歸因理論最初只包含一個(gè)維度,即控制點(diǎn)(Locus Of Control)。之后,美國(guó)心理學(xué)家維納(B. Weiner),對(duì)行為結(jié)果的歸因進(jìn)行了系統(tǒng)的總結(jié),并把歸因定義為三個(gè)維度:內(nèi)部歸因和外部歸因(Internal Attribution, External Attribution)、穩(wěn)定性歸因和非穩(wěn)定性歸因(Stability Attribution, Unstability Attribution)、可控制歸因和不可控制歸因(Control Attribution, Uncontrollable Attribution)。
近年來(lái),隨著我國(guó)高等教育教學(xué)質(zhì)量的提升,教育部門和各高校也加強(qiáng)了相應(yīng)的研究,其中對(duì)于影響大學(xué)生成績(jī)因素的相關(guān)研究成果也愈加豐富。文獻(xiàn)[5]認(rèn)為大學(xué)生的上課出勤率,對(duì)期末考試成績(jī)具有明顯的正面影響。文獻(xiàn)[6]認(rèn)為大學(xué)生的學(xué)習(xí)觀及其內(nèi)生動(dòng)機(jī)、一般自我效能感、學(xué)習(xí)效能感與期末考試成績(jī)存在明顯的正相關(guān)關(guān)系,與其外生動(dòng)機(jī)多呈現(xiàn)為負(fù)相關(guān)關(guān)系。文獻(xiàn)[7]認(rèn)為學(xué)生個(gè)體城鄉(xiāng)間的教育質(zhì)量差異較為明顯。傳統(tǒng)的家庭因素依然對(duì)成績(jī)型教育有著較大的影響,非傳統(tǒng)家庭因素對(duì)學(xué)生學(xué)業(yè)成績(jī)的影響也比較大。文獻(xiàn)[8]發(fā)現(xiàn)積極情感因素中的師生關(guān)系、自尊心、學(xué)習(xí)興趣等因素和消極情感因素中害怕任務(wù)太難的焦慮、害怕犯錯(cuò)被批評(píng)的焦慮以及擔(dān)心犯錯(cuò)而不敢參加語(yǔ)言活動(dòng)的抑制心理,均對(duì)學(xué)生成績(jī)有著明顯的影響。然而,這些研究多從單一方面出發(fā),缺乏整體考慮和分析,為此本文引入了多個(gè)變量,就個(gè)人主客觀因素與其學(xué)習(xí)成績(jī)之間的關(guān)系進(jìn)行了探討。本文主要從“性別”、“是否戀愛”、“是否參加社團(tuán)和學(xué)生會(huì)”、“上課玩手機(jī)的時(shí)間”、“作業(yè)完成情況”和 “課堂學(xué)習(xí)效果”6個(gè)方面,探討它們與學(xué)習(xí)成績(jī)之間的關(guān)系。
本文首先對(duì)學(xué)困生的概念做一個(gè)概述,詳細(xì)介紹國(guó)內(nèi)外有關(guān)學(xué)困生的研究現(xiàn)狀及其發(fā)展背景;其次搜集了研究數(shù)據(jù),從中篩選出了學(xué)困生;最后對(duì)學(xué)困生進(jìn)行歸因分析,并采用ID3決策樹算法,對(duì)影響學(xué)困生的因素進(jìn)行了深度分析。得出學(xué)生課堂學(xué)習(xí)效果是影響學(xué)困生的主要因素。
本文的研究對(duì)象是我校信息科學(xué)與工程學(xué)院某專業(yè)的四屆368名畢業(yè)生。因?yàn)檠芯繉?duì)象均為高校學(xué)生,所以他們均接受過(guò)入學(xué)體檢,這就保證了他們不存在智力缺陷的問題。首先我們從學(xué)校教務(wù)處那里獲得了他們每個(gè)學(xué)期期末考試成績(jī),并將其作為實(shí)驗(yàn)數(shù)據(jù)。然后我們通過(guò)網(wǎng)絡(luò),在聊天群里讓他們填寫了調(diào)查問卷(我們向其保證調(diào)查問卷僅用于本次研究,不會(huì)向外泄露他們的任何信息),為了保證問卷的真實(shí)可靠性,并與我們獲得的數(shù)據(jù)進(jìn)行匹配,調(diào)查問卷采用記名的方式。對(duì)于影響學(xué)生成績(jī)的因素,我們選了如表1所示的幾個(gè)有代表性的問題進(jìn)行了調(diào)查。最后,通過(guò)仔細(xì)的核對(duì),得到了340份有效的調(diào)查問卷。
表1 高校學(xué)習(xí)情況調(diào)查表
(注:是否戀愛與是否參加社團(tuán)這兩項(xiàng)的回答為填寫是或否;上課玩手機(jī)時(shí)間填5分鐘、5-15分鐘或>15分鐘;作業(yè)完成情況填全部完成、基本完成或部分完成;課堂學(xué)習(xí)效果填很好、一般或較差。)
收集這些數(shù)據(jù)的目的在于找出我們定義的學(xué)困生,并分析導(dǎo)致學(xué)生學(xué)業(yè)困難的原因。此過(guò)程既可以人工手動(dòng)實(shí)現(xiàn),也可以編程自動(dòng)實(shí)現(xiàn)。若篩選的數(shù)據(jù)量相對(duì)較小,則手動(dòng)篩選相對(duì)簡(jiǎn)單;若篩選的數(shù)據(jù)量較大,則借助編程的方式來(lái)實(shí)現(xiàn)篩選。由于我們采集到的有效調(diào)查問卷只有340份,數(shù)據(jù)量并不大,因此我們并不需要用編程實(shí)現(xiàn)篩選。
具體步驟如下:首先將從教務(wù)處得到的研究對(duì)象的期末考試成績(jī)導(dǎo)入Excel表中;然后計(jì)算他們的平均成績(jī);最后利用Excel自帶的篩選功能,按期末成績(jī)平均分“小于60”、“大于等于60且小于75”、“大于等于75且小于90”和“大于等于90”的條件篩選,并將其定義為“優(yōu)良中差”四類學(xué)生。我們將期末成績(jī)平均分小于60的學(xué)生定義為學(xué)困生。接下來(lái)對(duì)這些學(xué)困生進(jìn)行歸因分析。
決策樹是以實(shí)例學(xué)習(xí)為基礎(chǔ)的一種算法。它需在一組無(wú)順序、無(wú)規(guī)律的數(shù)據(jù)中,推理并判斷出決策樹表現(xiàn)形式的分類規(guī)則。通常,我們所提到的決策樹分為兩種:一種是對(duì)分類型輸出變量實(shí)現(xiàn)分類的分類決策樹,簡(jiǎn)稱分類樹;另一種是對(duì)數(shù)值型輸出變量實(shí)現(xiàn)預(yù)測(cè)的回歸決策樹,簡(jiǎn)稱為回歸樹。兩者分類預(yù)測(cè)所實(shí)現(xiàn)形成的決策樹是一種類似于流程圖的結(jié)構(gòu)。它將分類和預(yù)測(cè)的結(jié)果都體現(xiàn)在葉節(jié)點(diǎn)上[9,10],如圖1所示。
圖1 決策樹算法流程圖
決策樹算法主要是用新變量以圖形或文本的表現(xiàn)形式,來(lái)描述或預(yù)測(cè)數(shù)據(jù)的一種算法。它采用自頂向下的遞歸方法,對(duì)輸入樣本訓(xùn)練集進(jìn)行分類學(xué)習(xí)。決策樹的主要算法包括:ID3算法、C4.5算法和CART算法。由于ID3算法是決策樹算法中最具有影響力的算法,因此本文采用ID3算法進(jìn)行數(shù)據(jù)挖掘。
1) ID3決策樹算法
ID3算法是一種貪心算法,它采用自上而下、分而治之的遞歸方式構(gòu)造一棵決策樹。ID3算法的核心內(nèi)容是:在決策樹各級(jí)節(jié)點(diǎn)上用信息增益(Information Gain)作為屬性的選擇標(biāo)準(zhǔn)來(lái)選擇屬性,使得我們?cè)诿恳粋€(gè)非葉子節(jié)點(diǎn)都能夠獲取被測(cè)試記錄的最大類別信息。
決策樹的分枝準(zhǔn)則,是構(gòu)建一個(gè)決策樹所面對(duì)的核心問題[11,12]。ID3決策樹以信息增益率為標(biāo)準(zhǔn)來(lái)確定最佳分組變量和分割點(diǎn)。其具體方法是:檢測(cè)所有的屬性,選擇信息增益最大的屬性產(chǎn)生決策樹節(jié)點(diǎn),并由該屬性的不同取值建立分支,然后再對(duì)各分支的子集遞歸調(diào)用該方法建立決策樹節(jié)點(diǎn)的分支,直到所有子集僅包含同一類別的數(shù)據(jù)為止。最后得到一棵決策樹,它可以用來(lái)對(duì)新的樣本進(jìn)行分類。
(1)通過(guò)計(jì)算每個(gè)屬性的信息增益,比較它們的大小,從而獲得具有最大信息增益的屬性。設(shè)S是數(shù)據(jù)樣本的集合,假設(shè)類標(biāo)號(hào)屬性具有m個(gè)不同值,并定義m個(gè)不同類Ci(i=1,2,…,m)。設(shè)Si是類Ci中的樣本數(shù)。對(duì)一個(gè)給定的樣本分類,所需的期望信息如下:
(1)
其中Pi=Si/S是任意樣本屬于Ci的概率。
(2)設(shè)屬性A具有v個(gè)不同值{a1,a2,…,av}。可以用屬性A將S劃分為子集{s1,s2,…,sv},其中sj上的樣本在屬性A上具有相同的值aj(j=1,2,…,v)。設(shè)Sij是子集Sj中類Ci的樣本數(shù),由A劃分的子集的熵或信息期望如下所示:
(2)
熵值越小說(shuō)明子集劃分的純度越高。
(3)對(duì)于給定的子集s,其信息期望為
(3)
上式中Pij=sij/s,是Sj中樣本屬于Ci的概率。
(4)在屬性A上分支將獲得的信息增益是:
Gain(A)=I(s1,s2,…,sm)-E(A)
(4)
2) ID3算法的偽代碼描述
ID3formtree(Y,Y_attribute list)如下:
(1)創(chuàng)建根節(jié)點(diǎn)N;
(2)If Y都屬于同一個(gè)類M then返回N作為葉節(jié)點(diǎn),以類M標(biāo)記;
(3)If Y_attributelist為空,則返回N作為葉節(jié)點(diǎn),標(biāo)記為Y中出現(xiàn)最多的類;
(4)For each Y_attribute list中的屬性,計(jì)算信息增益Gains;
(5)N的測(cè)試屬性test_attribute=Y_attribute list中具有最高信息增益的屬性;
(6)For each test_attribute的取值{
由節(jié)點(diǎn)N長(zhǎng)出一個(gè)新葉節(jié)點(diǎn);
If 新葉節(jié)點(diǎn)對(duì)應(yīng)的樣本子集Y’為空
則不再分裂此葉節(jié)點(diǎn),將其標(biāo)記為Y中出現(xiàn)最多的類;
else
在該葉節(jié)點(diǎn)上執(zhí)行ID3formtree(Y',Y_attributelist),
對(duì)它繼續(xù)分裂}.
其中,設(shè)Y代表當(dāng)前樣本集,用Y_attribute list表示當(dāng)前候選屬性集,侯選屬性集中的所有屬性都為離散型(連續(xù)型必需事先經(jīng)過(guò)預(yù)處理轉(zhuǎn)化為離散型)。
決策樹的生長(zhǎng)過(guò)程將反復(fù)上述過(guò)程,并不斷對(duì)樣本進(jìn)行分組,直到整個(gè)樹各分支的繼續(xù)分組不再有意義為止,一棵完整的決策樹就形成了。該過(guò)程是一種“貪心”搜索過(guò)程[13]。
本節(jié)以學(xué)校教務(wù)處獲得的數(shù)據(jù)和調(diào)查問卷獲得的數(shù)據(jù)作為訓(xùn)練樣本集,采用ID3算法獲得相應(yīng)的決策樹,通過(guò)有效數(shù)據(jù)處理,生成預(yù)測(cè)模型,對(duì)學(xué)困生成績(jī)的影響因素進(jìn)行挖掘分析。通過(guò)慮樣本數(shù)量及其代表因素的情況,對(duì)課堂學(xué)習(xí)效果和作業(yè)完成情況等屬性進(jìn)行分析,研究這些屬性與學(xué)困生成績(jī)之間存在的內(nèi)在聯(lián)系。
1) 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘中的一個(gè)重要步驟。因?yàn)楝F(xiàn)在的數(shù)據(jù)可能是臟數(shù)據(jù)并且有些數(shù)據(jù)缺失,或一些數(shù)據(jù)的格式不適用于決策樹算法,因此我們需要對(duì)這些原始數(shù)據(jù)進(jìn)行預(yù)處理。即對(duì)臟數(shù)據(jù)進(jìn)行數(shù)據(jù)清除,對(duì)缺失的進(jìn)行填補(bǔ),對(duì)冗余的數(shù)據(jù)進(jìn)行集成和刪選以及對(duì)不符合格式的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換。
本文的研究對(duì)象在統(tǒng)計(jì)的數(shù)據(jù)中籍貫是山東的學(xué)生占比為90%以上,因此這個(gè)屬性不具有辨識(shí)性,為了提高數(shù)據(jù)挖掘的效率,我們把這個(gè)屬性刪除。在調(diào)查時(shí)出現(xiàn)的缺失值,我們進(jìn)行了補(bǔ)充但是帶有部分主觀性,因此我們采用隨機(jī)插補(bǔ)的方法來(lái)消除補(bǔ)充缺失值的主觀性。
用于挖掘?qū)W困生的屬性較多,而我們所獲得數(shù)據(jù)有限,為了便于決策樹模型的建立,我們選擇了其中與成績(jī)相關(guān)較大的“性別”、“是否戀愛”、“是否參加社團(tuán)和學(xué)生會(huì)”、“上課玩手機(jī)的時(shí)間”、“作業(yè)完成情況”和 “課堂學(xué)習(xí)效果”這幾個(gè)屬性,作為判別學(xué)困生的依據(jù),生成新的學(xué)生成績(jī)基本數(shù)據(jù)表。如表2所示,經(jīng)過(guò)數(shù)據(jù)預(yù)處理后,有效的學(xué)生記錄共有340條。為了后面可以更好地對(duì)決策樹模型進(jìn)行評(píng)估預(yù)測(cè),在這里預(yù)留了三分之一的記錄作為測(cè)試數(shù)據(jù),三分之二的記錄作為建決策樹模型所需的訓(xùn)練集,共220條記錄。
2) 決策樹模型的建立
將從教務(wù)處獲得的學(xué)生期末成績(jī)劃分為四個(gè)等級(jí),即優(yōu)、良、中、差。期末成績(jī)平均分大于90的為優(yōu),大于75小于等于90的為良,大于60小于等于75的為中,小于60的為差(即本文中研究的學(xué)困生)。具體分類方法我們采用的系統(tǒng)聚類。利用這些整理好的數(shù)據(jù),以確定學(xué)生平均得分是否優(yōu)秀為
表2學(xué)生信息統(tǒng)計(jì)表
研究對(duì)象,建立決策樹模型,挖掘分析影響學(xué)困生成績(jī)的因素。具體方法如下:
(1)計(jì)算每個(gè)屬性的信息增益率。
(2)選擇信息增益比率最大的屬性作為根結(jié)點(diǎn),并按它的值劃分?jǐn)?shù)據(jù)集合,如果該屬性只有一個(gè)值則停止劃分。
(3)對(duì)劃分的每個(gè)子數(shù)據(jù)集遞歸執(zhí)行(1)~(2)。
接下來(lái)介紹具體的實(shí)現(xiàn)過(guò)程。
設(shè)C1為優(yōu),C2為良,C3為中,C4為差。樣本總數(shù)為340,其中C1類包含71個(gè)樣本,C2類包含94個(gè)樣本,C3類包含87個(gè)樣本,C4類包含88個(gè)樣本。為了計(jì)算每個(gè)屬性的信息增益,首先利用式(1)計(jì)算出所有的信息量。
I(s1,s2,s3.s4)=I(71,94,87,88)
接下來(lái)計(jì)算每個(gè)屬性(即每個(gè)待測(cè)因素)的信息熵。
(1)性別(gender)的信息熵
根據(jù)性別在優(yōu)、良、中、差四個(gè)類別的分布,由式(3)可以計(jì)算出在每個(gè)分布中對(duì)應(yīng)的信息熵。
對(duì)于gender=“男”:S11=33 ,S21=37 ,S31=43,S41=49
I(s11,s21,s31.s41)=I(33,37,43,49)
對(duì)于gender=“女”:S12=38,S22=57,S32=44,S42=54
I(s12,s22,s32.s42)=I(38,57,44,54)
由式(2)可計(jì)算出,若根據(jù)屬性gender對(duì)樣本集合進(jìn)行劃分,所需要的信息熵為
由此獲得利用屬性gender對(duì)樣本集合進(jìn)行劃分,所獲得的信息增益為
Gain(gender)=I(s1,s2,s3,s4)-E(gender)=1.988-1.005=-0.017
以此類推,由表2可以求得“是否戀愛(love)”、“是否參加社團(tuán)或?qū)W生會(huì)(activity)”、“上課玩手機(jī)的時(shí)間(phone)”、“作業(yè)完成情況(homework)”和“課堂學(xué)習(xí)效果(classroom learning)”這些屬性的信息增益分別為
Gain(love)=0.166,
Gain(activity)=-0.043,
Gain(phone)=0.378,
Gain(homework)=0.197,
Gain(classroom learning)=0.398。
通過(guò)上面的計(jì)算可知,“課堂學(xué)習(xí)效果(classroom learning)”的信息增益最大,所以選擇它作為測(cè)試屬性,用于產(chǎn)生當(dāng)前的分支節(jié)點(diǎn),如圖2所示。
3) 決策樹的分類規(guī)則
決策樹和推理規(guī)則的聯(lián)系極為密切。推理規(guī)則就是決策樹的文字形式,即邏輯比較。推理規(guī)則表達(dá)的是,輸入變量取值及不同輸入變量之間邏輯與或邏輯或關(guān)系與輸出變量取值的內(nèi)在聯(lián)系,一般表示形式為“如果<條件>則<結(jié)論>”。
每個(gè)葉節(jié)點(diǎn)都可以產(chǎn)生一條規(guī)則,其中,<條件>是從根節(jié)點(diǎn)到葉節(jié)點(diǎn)全部節(jié)點(diǎn)的條件組合,<結(jié)論>是葉節(jié)點(diǎn)上樣本輸出變量的類別。同時(shí),由此產(chǎn)生的多個(gè)推理規(guī)則之間是相互獨(dú)立,絕不干擾的,其排列的前后順序?qū)π聰?shù)據(jù)的分類預(yù)測(cè)結(jié)果不會(huì)產(chǎn)生影響。
在上述決策樹中,從根節(jié)點(diǎn)到每個(gè)葉節(jié)點(diǎn)都代表了一種分類。從圖2的決策樹中得出的推理規(guī)則如下:
Rules for 差 -contains 1 rule(s)
Rule 1 for 差(9; 0.889)
If 課堂學(xué)習(xí)效果 in [“C”]
and 作業(yè)完成情況 in [“B/C”]
圖2 影響學(xué)生成績(jī)因素的決策樹
and 是否戀愛 = A
Then 差
Rules for 良 -contains 3 rule(s)
Rule 1 for 良 (2; 1.0)
If 課堂學(xué)習(xí)效果 in[“A”]
and 上課玩手機(jī)時(shí)間 in [“A”]
and 作業(yè)完成情況= B或C
Then 良
Rule 2 for 良 (8; 1.0)
If 課堂學(xué)習(xí)效果 in[“A”]
and 上課玩手機(jī)時(shí)間 in[“B”“C”]
Then 良
Rule 3 for良(3;1.0)
If 課堂學(xué)習(xí)效果 in [“B”]
and 是否戀愛 = B
Then 良
Rules for 優(yōu) -contains 1 rule(s)
Rule 1 for 優(yōu)(5;0.8)
If 課堂學(xué)習(xí)效果 in[“A”]
and 上課玩手機(jī)時(shí)間 in[“A”]
and 作業(yè)完成情況 = A
Then 優(yōu)
Rules for 中 -contains 3 rule(s)
Rule 1 for中(19; 0.895)
If 課堂學(xué)習(xí)效果 in[“B”]
and 是否戀愛 =A
Then 中
Rule 2 for 中 (9; 1.0)
If 課堂學(xué)習(xí)效果 in[“C”]
and 作業(yè)完成情況 in[“A”]
Then 中
Rule 3 for 中 (6; 0.833)
If 課堂學(xué)習(xí)效果 in [“C”]
and 作業(yè)完成情況 in「“B”“C”]
and 是否戀愛 = B
Then 中
Default:中
由圖3可知,決策樹以學(xué)生“課堂學(xué)習(xí)效果”為第一個(gè)最佳分組變量,說(shuō)明學(xué)生課堂學(xué)習(xí)效果信息增益率最大,是決定學(xué)生平均成績(jī)的關(guān)鍵因素。在課堂學(xué)習(xí)效果節(jié)點(diǎn)下的最佳分組變量為 “上課玩手機(jī)時(shí)間”,以此類推分別是“作業(yè)完成情況”和“學(xué)生是否戀愛”。而“學(xué)生是否參加社團(tuán)”以及“性別”這兩個(gè)屬性,對(duì)學(xué)困生影響的信息增益率較小,都沒有進(jìn)入決策樹,說(shuō)明這兩個(gè)屬性不是導(dǎo)致學(xué)生學(xué)業(yè)困難的主要因素。
圖3 決策樹結(jié)果分析圖
從決策樹分析圖中可以直觀地看出,“課堂學(xué)習(xí)效果”是影響學(xué)生平均得分的關(guān)鍵因素,因此也是導(dǎo)致學(xué)困生產(chǎn)生的最主要原因。對(duì)于學(xué)困生來(lái)說(shuō),一定要注意上課時(shí)集中精力,認(rèn)真聽教師講課,跟隨教師思路積極思考,認(rèn)真對(duì)待每節(jié)課的重點(diǎn)難點(diǎn)。次要因素是“上課玩手機(jī)時(shí)間”,說(shuō)明學(xué)生在上課時(shí)一定要集中注意力,不能分心做其他的事情。最近幾年各大高校都在落實(shí)手機(jī)入袋的舉措,本文的結(jié)論為這一舉措的實(shí)施的必要性提供了有力的依據(jù)?!白鳂I(yè)完成情況”和“是否戀愛”這兩個(gè)屬性對(duì)學(xué)困生的影響不是很大。在研究中我們還發(fā)現(xiàn),無(wú)論學(xué)生平均成績(jī)是否優(yōu)異,男女生占比大致相同,而且都有部分學(xué)生在參加社團(tuán)或?qū)W生會(huì),這說(shuō)明“性別”和是“是否參加社團(tuán)或?qū)W生會(huì)”對(duì)學(xué)習(xí)成績(jī)的影響也并不大。
本文利用從學(xué)校教務(wù)處獲得的數(shù)據(jù)和調(diào)查問卷獲得的數(shù)據(jù)作為訓(xùn)練樣本集,采用ID3算法獲得相應(yīng)的決策樹,對(duì)我校大學(xué)生的一些學(xué)習(xí)行為進(jìn)行分類決策,通過(guò)有效數(shù)據(jù)處理,生成預(yù)測(cè)模型,對(duì)影響學(xué)困生成績(jī)的因素進(jìn)行挖掘分析。最后我們發(fā)現(xiàn)“課堂學(xué)習(xí)效果”是導(dǎo)致學(xué)困生的主要因素,“上課玩手機(jī)時(shí)間”是影響學(xué)困生的次要因素。針對(duì)這兩個(gè)因素,我們建議采取以下措施:
(1)明確教學(xué)目標(biāo),突出重難點(diǎn)。為了讓學(xué)生明確本節(jié)課的重點(diǎn),教師在上課開始時(shí),把本節(jié)要點(diǎn)提綱列出來(lái),以便引起學(xué)生的重視。
(2)激發(fā)學(xué)生興趣,營(yíng)造一個(gè)更加自由活躍的課堂環(huán)境。激發(fā)學(xué)生的自主性讓學(xué)生真正能參與到課堂教學(xué)中來(lái),而不是一味的教師講學(xué)生聽??梢試L試對(duì)換角色,讓學(xué)生自己成為授課者,從而提高學(xué)習(xí)效率。
(3)現(xiàn)在很多高校都在實(shí)施手機(jī)課上入袋的規(guī)定,本文的研究結(jié)果更為這一舉措實(shí)施的必要性提供了依據(jù)。手機(jī)入袋可以使學(xué)生更好地集中精力聽課,有效提高學(xué)習(xí)效率。
本研究存在以下不足:
(1)數(shù)據(jù)量不足。研究對(duì)象只是某專業(yè)的部分學(xué)生,而且通過(guò)問卷調(diào)查得到的信息的數(shù)據(jù)部分可能缺乏代表性,不能完全真實(shí)地反映眾多學(xué)生的實(shí)際情況。
(2)決策樹生成的分類規(guī)則會(huì)與實(shí)際情況存在一定的誤差。由于本文在數(shù)據(jù)收集的屬性選擇上具有主觀性,還存在許多影響學(xué)生的因素并沒有考慮,對(duì)學(xué)生調(diào)查問卷的內(nèi)容也不全面,因此存在挖掘的數(shù)據(jù)信息有可能不是最佳的數(shù)據(jù)集。
針對(duì)這兩點(diǎn)不足,我們將在以后的研究中豐富研究數(shù)據(jù),使數(shù)據(jù)更具客觀性,使研究結(jié)果更具權(quán)威性。