国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類分析技術的教師識別過程研究

2017-06-10 08:45:32陳春燕葉楓
淮南師范學院學報 2017年2期
關鍵詞:掌握情況分段試卷

陳春燕,葉楓

(蚌埠醫(yī)學院 衛(wèi)生管理系,安徽 蚌埠 233000)

基于聚類分析技術的教師識別過程研究

陳春燕,葉楓

(蚌埠醫(yī)學院 衛(wèi)生管理系,安徽 蚌埠 233000)

分析合肥10所學校學生的考試試卷,從試卷知識點和試卷成績兩個方面共提取5類特征,使用這5類特征進行教師識別,進而驗證教師對學生成績的影響。從試卷成績方面提取3類特征,分別是班級均得分率*試題難度、得分率分段比例、錯選項比例;從試卷知識點方面提取2類特征,分別是班級均掌握情況、知識點/抽象能力掌握情況分段比例。將這5類特征作為特征向量,使用聚類分析的方法進行教師識別,實驗結果表明識別正確率達到73%。

聚類分析;教師識別;特征提取

本文通過數(shù)據(jù)挖掘技術對學生考試試卷分析,對不同班級的任課教師進行識別,把這個過程稱之為教師識別。進一步驗證不同老師是否對學生的成績有影響,如果識別率高,可以間接說明老師對學生的成績有影響。數(shù)據(jù)為合肥10所學校學生的考試數(shù)據(jù),十所學校分別標記為A、B、C、D、E、F、G、H、I、J,每所學校的班級數(shù)分別是15、8、11、6、14、8、9、12、3、4。數(shù)據(jù)中包括每個班的人數(shù),試卷情況和每個學生每一題的得分情況。為了能夠順利完成識別任務,進行了以下五方面的工作。

一、學生診斷

學生診斷的主要工作是考察學生對知識點的掌握程度,使用DINA模型①Brian W Junker and Klaas Sijtsma,"Cognitive assessment models with few assumptions,and connections with nonparametric item response theory",Applied Psycho-logical Measurement,Vol.25,No.3,2001,pp.258-272. Louis V DiBello,Louis A Roussos,and William Stout,"31a review of cognitively diagnostic assessment and a summary of psychometric models",Handbook of statisticsNo1.26,2006,pp.979-1030.進行學生診斷。DINA模型以學生各小題得分以及各小題的考察知識點/抽象能力標注為輸入,通過數(shù)學模型來推導學生對知識點/抽象能力的不同掌握情況下的后驗概率,借助最大化似然度的方法來估計學生的具體掌握情況。DINA模型假設學生的知識點/抽象能力掌握程度是離散的二元值,即掌握或不掌握。在這里利用每一種掌握模式下的后驗概率來對結果進行平滑,將學生的掌握程度變?yōu)橐粋€連續(xù)的概率值(0~1之間),從而得到每一個學生的知識結構的量化分析,用Xitk表示學生對知識點的掌握程度,k表示第k個班級,i表示第i個學生,t表示第t個知識點。每個學生對于每個知識點的掌握程度,選取一小部分如表1所示。

表1 每個學生知識結構量化分析

二、試卷診斷

試卷診斷是確定試卷的難度系數(shù),本文中應用IRT模型進行試卷診斷。IRT模型以學生在試卷上的表現(xiàn)為輸入,答對為1,答錯為0。將學生在該題目上答對的概率用項目反應函數(shù)②戴海琦,羅照盛:《項目反應理論原理與當前應用熱點概覽》,《心理學探新》2013年第33期,第392-395頁。晏子:《心理科學領域內的客觀測量——Rasch模型之特點及發(fā)展趨勢》,《心理科學進展》2010年第8期,第1298-1305頁。表示,即用學生能力與該題難度的logistic函數(shù)來表示。然后用極大似然估計對IRT模型進行擬合,得出學生參數(shù)(能力)和試題參數(shù)(難度)①KONG Q C,MAO W J.,"Predicting popularity of forum threads based on dynamic evolution",Journal of Software,Vol.25,No.12,2014,pp.2767-2776.陳春燕,張鈺,常標等:《基于ARMA模型的在線電視劇流行度預測》,《計算機科學與探索》2016年第3期,第425-432頁。。試卷難度系數(shù),選取一小部分如表2所示。

表2 試卷難度系數(shù)

三、特征提取

共提取5類特征,學生成績在試卷方面的情況提取三類特征,試卷知識點情況提取兩類特征。

(一)試卷成績方面特征

1.班級均得分率*試題難度

首先計算每個學生在每道試題上的得分率(學生得分/試題分值),然后求班級在每道試題上的均得分率,最后乘以試題的難度,得到第一類特征T1,如公式(1)所示:

其中ri,j,k為學生在每道題上的實際得分,i指第i個學生,j指第j題,k指第k個班級,fj為第j題的試題分值,nk為第k個班級人數(shù),Dj為第j題的試題難度。

2.得分率分段比例

第二類特征是得分率分段比例,客觀題和主觀題分別計算??陀^題的得分只有兩種情況,完全得分或不得分,所以得分率只有0或者1,因此只需計算得分率為0的學生所占的比重,自然就有了得分率為1的學生的比重。主觀題的得分是連續(xù)值,得分率范圍為0~1,所以對學生的得分情況進行分段,本文中把主觀題得分率分為三段,分別為0、0~0.7、0.7~1,然后計算班級內落在每個分段上的學生所占的比重。

把第二類特征表示為T2,客觀題和主觀題分別計算。

客觀題分為兩段計算得分率分段比率,得分率為0的比例記為T20,得分率為1的比例記為T21,如公式(2)、(3)所示:

其中,T20為該題得分率為0的比例,T21為該題得分率為1的比例,S0jk為第k班第j題得分為0的學生人數(shù),nk為第k個班級的學生人數(shù)。

主觀題分為三段計算得分率分段比例,得分率為0的比例記為T20,得分率為0~0.7的比例記為T22,得分率為1的比例記為T21,如公式(2)、(4)、(5)所示:

其中,S7jk為第k班第j題得分率為0~0.7的學生人數(shù),nk為第k個班級的學生人數(shù)。

3.錯選項比例

第三類特征是錯選項比例,這類特征只針對選擇題,針對每個錯選項,計算班級內選該錯選項的學生所占的比重,每題正確選項有一個,錯選項有三個,因此第三類特征T3分三次計算,分別記為T3x,x取值為1、2、3。

第三類特征記為T3x,表示如公式(6)所示:

其中,Sjxk為第k班第j題選第x個錯選項的學生人數(shù),nk為第k個班級的學生人數(shù)。

(二)試卷知識點方面特征

1.班級均掌握情況

第1節(jié)學生診斷工作中,計算了每位同學,針對每個知識點/抽象能力的掌握情況。因為本文是要識別兩個班級的學生是否為同一名老師所帶,所以需要知道針對每個知識點/抽象能力,班級的平均掌握情況。

第四類特征記為T4,如公式(7)所示。

其中,Xitk為第k班第i個學生對第t個知識點的掌握程度,nk為第k個班級學生人數(shù)。

2.知識點/抽象能力掌握情況分段比例

知識點/抽象能力的掌握情況為連續(xù)值,取值范圍在0~1之間。為了有更好的區(qū)分度,本文中將知識點/抽象能力的掌握情況分段表示,分為四段,分別是0~0.35、0.35~0.5、0.5~0.55、0.55~1。針對每段計算班級內落在此段的學生比重,即為班級掌握情況分段比率。

第5類特征記為T5,本文把學生掌握情況分為四段,所以分四次計算。掌握情況在0~0.35、0.35~0.5、0.5~0.55、0.55~1之間的每班學生比例分別記為T50、T51、T52、T53,如公式(8)(9)、(10)、(11)所示。

其中,Q0t、Q3t、Q5t分別為第k班對第t個知識點,學生掌握情況落在0~0.35、0.35~0.5、0.5~0.55這三段中學生的人數(shù),nk為第k個班級學生人數(shù)。

四、特征分析

在選取特征過程中,使用TPP方法輔助特征的選擇②羅芬,丁樹良,胡小松等:《基于IRT若干參數(shù)估計方式的比較》,《江西師范大學學報》(自然科學版)2003年第27期,第56-60頁。,以T1特征為例,最初選取了班級均得分率,實驗表明聚類效果類間距離較大。把特征1作了改變,使用班級均得分率*試題難度,實驗結果表明比直接使用班級均得分率類內數(shù)據(jù)靠攏效果顯著。班級均得分率和班級均得分率*試題難度使用TPP方法結果如圖1所示。其它四類特征也使用TPP方法進行了分析,實驗表明本文所提取的5類特征進行聚類分析,數(shù)據(jù)靠攏效果都比較顯著。

圖1 班級均得分率VS班級均得分率*難度系數(shù)

五、教師識別

教師識別的過程其實就是做聚類分析的過程①ROGER W,ALEXANDRE T,INDIKA P.Autoregressive moving average models under exponential power distributions.Probstat forum,pp.65-77.張曉,周敏:《基于K-means算法的教師評價研究》,《伊犁師范學院學報》(自然科學版)2015年第4期,第59-63頁。,每個班級都抽取以上5類特征,用這五類特征表示班級,即選取這5類特征,使用EM算法進行聚類②Xu R,Wunsch D,"Survey of clustering algorithms,Neural Networks",IEEE Transactions on,Vol.16,No. 3,2005,pp.645-678.,將一個中學的所有班級劃分為了若干簇,同一個簇內的班級的授課教師相同。如果相同教師教的班級真在同一個簇,則這些班級識別正確,對應班級后加1。

實驗結果如表3所示,給出了合肥市A學校15個班級的數(shù)學課程的聚類結果,該校共有15個班級,有11個班級識別正確,4個班級識別錯誤,正確率達到了73%。

表3 合肥A學校15個班級識別結果

表3中共有4個班級沒有識別正確,如5班識別正確,但13班沒有識別出來,原因在于13班是快班,而5班是慢班,各題班級均得分率如圖2所示,由于快慢班的影響導致識別錯誤,下一步爭取消除快慢班的影響。

圖2 快慢班班級均得分率

六、總結

本文分析學生考試成績,試圖從考試成績中提取有效特征進行教師識別,在分析比較多種特征后,最終確定從試卷成績和試卷知識點方面提取5類特征進行聚類分析,用于識別兩個班的學生是否為一個老師所教。實驗準確率達到73%,還有部分班級沒有準確識別,原因是快慢班的影響,同一個老師同時帶一個快班和慢班,不能準確識別。下一階段的工作主要考慮消除快慢班的影響,爭取能夠把快慢班是由同一個老師教的情況準確識別。

Teacher recognition process research with clustering analysis technology

CHEN Chunyan,YE Feng

The paper analyzed the students'test papers in ten schools in Hefei.Five types of features were extracted from testing scores and examination paper knowledge.The five types of feature were used to proceed teacher recognition,judge whether teachers had an impact on students'achievement.The three types of features were mean scoring rate of class*item difficulty,scoring rate segment ratio and wrong option ratio from testing scores.The two types of features were class mean mastery and knowledge point mastery segment ratio from examination paper knowledge.Taking the five types of features as feature vector,the author used clustering analysis technology to proceed teacher recognition.The experimental results showed that the recognition accuracy reached 73%.

clustering analysis;teacher recognition;feature retraction

TP399

A

1009-9530(2017)02-0122-03

2017-01-04

安徽省高校人文社科研究重點項目(SK2017A0182)

陳春燕(1981-),女,蚌埠醫(yī)學院衛(wèi)生管理系講師,碩士。

猜你喜歡
掌握情況分段試卷
不同健康教育模式對女性人工流產術后保健知識掌握情況的影響研究
一類連續(xù)和不連續(xù)分段線性系統(tǒng)的周期解研究
分段計算時間
菏澤學院公共體育課學生籃球規(guī)則掌握情況及對策分析
體育時空(2017年5期)2017-06-17 16:22:18
Module5 A Trip Along the Three Gorges
Module5 Great People and Great Inventions of Ancient China
Module 4 Sandstorms in Asia
Module 1 Europe
3米2分段大力士“大”在哪兒?
太空探索(2016年9期)2016-07-12 10:00:04
淺談初中英語教學中有效運用信息反饋
五峰| 平顺县| 龙岩市| 九寨沟县| 南靖县| 和硕县| 宜兴市| 阿尔山市| 米易县| 吴忠市| 谢通门县| 宝清县| 海南省| 遂川县| 古丈县| 大埔县| 鄱阳县| 秦皇岛市| 芒康县| 淳安县| 恭城| 昌乐县| 永宁县| 万安县| 崇州市| 本溪| 青阳县| 铜川市| 竹北市| 平潭县| 辰溪县| 安多县| 清苑县| 瑞安市| 铁岭市| 广西| 乌恰县| 独山县| 丽江市| 平阴县| 庆城县|