路玥
摘 要: 傳統(tǒng)英語教師教學(xué)能力評價(jià)方法受主觀因素制約,無法排除人為因素造成的影響,導(dǎo)致評價(jià)結(jié)果不可靠。為此,提出基于數(shù)據(jù)挖掘的英語教師教學(xué)能力評價(jià)方法。依據(jù)特征變量離散化原則對數(shù)據(jù)采取匿名化編碼處理,對存在大量特征值的英語教師教學(xué)特征變量進(jìn)行離散化處理。對英語教師教學(xué)數(shù)據(jù)進(jìn)行粗糙集約簡處理,將需挖掘的英語教師教學(xué)數(shù)據(jù)庫采用粗糙集方法進(jìn)行處理,確定決策表,設(shè)定最小支持和最小置信度,通過關(guān)聯(lián)規(guī)則挖掘方法得出關(guān)聯(lián)規(guī)則,從而實(shí)現(xiàn)英語教師教學(xué)數(shù)據(jù)挖掘。通過主成分分析對挖掘的英語教師教學(xué)數(shù)據(jù)集結(jié)構(gòu)進(jìn)行描述,獲取評價(jià)指標(biāo)。對英語教師教學(xué)能力指標(biāo)進(jìn)行計(jì)算,依據(jù)指標(biāo)值評價(jià)英語教師教學(xué)能力。實(shí)驗(yàn)結(jié)果表明,所提方法評價(jià)結(jié)果可靠,可體現(xiàn)教師真實(shí)能力。
關(guān)鍵詞: 數(shù)據(jù)挖掘; 英語教師; 教學(xué)能力; 評價(jià); 約簡; 變量離散化
中圖分類號: TN911.1?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)11?0153?04
Research on data mining based teaching ability evaluation of English teachers
LU Yue
(Tianjin University of Technology, Tianjin 300202, China)
Abstract: The traditional teaching ability evaluation methods of English teachers are influenced by subjective factors, and cannot eliminate the influence of human factors, which lead to the unreliable evaluation results. Therefore, a data mining based new teaching ability evaluation method of English teachers is proposed. According to the discretization principle of characteristic variables, the data is treated with anonymous encoding, and the English teachers′ teaching characteristic variables with large eigenvalues are discretized. The rough set reduction processing was performed for the teaching data of English teachers. The English teachers′ teaching database needed mining is processed with rough set method to confirm the decision table and set the minimum support and minimum confidence. The association rules mining method is used to get the association rules, so as to realize the teaching data mining of English teachers. The structure of teaching data set of English teachers is described by means of principal component analysis to get the evaluation index. The teaching ability indicators of English teachers are calculated to evaluate the teaching ability of English teachers. The experimental results show that the method has reliable evaluation result, and can reflect the true ability of teachers.
Keywords: data mining; English teacher; teaching ability; evaluation; reduction; variable discretization
教學(xué)能力評價(jià)為學(xué)校管理的關(guān)鍵階段,有效完成英語教師教學(xué)能力評價(jià)有助于英語教師教學(xué)方法和內(nèi)容的改進(jìn),使得英語教師教學(xué)能力有所提升[1]。但教學(xué)能力評價(jià)是一個(gè)非常復(fù)雜的過程,所以對教學(xué)能力進(jìn)行科學(xué)的評價(jià)是非常困難而值得研究的問題[2]。
英語教師教學(xué)能力評價(jià)被教育部門和各高校廣泛關(guān)注,最初通過人工形式進(jìn)行評價(jià),評價(jià)結(jié)果不可靠,無法體現(xiàn)真實(shí)的英語教師教學(xué)能力[3]。之后常通過專家系統(tǒng)實(shí)現(xiàn)英語教師教學(xué)能力的評價(jià),然而由于與教學(xué)能力評價(jià)相關(guān)的因素較多,且專家系統(tǒng)容易受到自身水平的影響,無法排除人為因素導(dǎo)致的誤差,導(dǎo)致評價(jià)結(jié)果不可信[4]。
為了提高英語教師教學(xué)能力評價(jià)精度,本文提出基于數(shù)據(jù)挖掘的英語教師教學(xué)能力評價(jià)方法。經(jīng)實(shí)驗(yàn)驗(yàn)證,與其他方法相比,本文方法評價(jià)結(jié)果更加科學(xué),可體現(xiàn)英語教師真實(shí)的教學(xué)水平。
對全部英語教師教學(xué)樣本數(shù)據(jù)集進(jìn)行分析,因樣本數(shù)據(jù)集中數(shù)據(jù)種類繁多,存在很多不相關(guān)數(shù)據(jù)。所以,需對數(shù)據(jù)進(jìn)行篩選、離散化等預(yù)處理 ,以保證英語教師教學(xué)數(shù)據(jù)具有一定的規(guī)范性。本文遵循特征變量離散化原則,對表格采取匿名化編碼處理,對存在大量特征值的特征變量進(jìn)行離散化處理,由此提高英語教師教學(xué)數(shù)據(jù)挖掘效率,得到滿意的挖掘結(jié)果[5]。通過預(yù)處理得到的樣本向量為:
[Ui=ui1,ui2,…,uik,…,uiK] (1)
式中:[i∈1,M],[M]描述樣本集合大??;[uik]描述樣本集合中第[i]個(gè)樣本[Ui]的第[k]個(gè)屬性值。
為了減少計(jì)算量,本節(jié)對英語教師教學(xué)數(shù)據(jù)進(jìn)行粗糙集約簡處理。用[R=S,B=D?E,H,f]描述英語教師教學(xué)信息系統(tǒng)。其中,[S]表示有限對象集合,也就是論域,[D]表示條件屬性集,[E]表示決策屬性集,若[D?E]為空集,則認(rèn)為[R]是決策系統(tǒng),[H]表示[D]與[E]的值域;[fa,d∈Hd],[?d∈B],[a∈S。]由此,[S]中的對象[a]都能夠通過相應(yīng)屬性值[B]進(jìn)行描述,屬性值[B]代表[a]能夠得到的信息。在決策系統(tǒng)內(nèi),各條件屬性間通常具有一定的依附關(guān)系,即在不缺失關(guān)鍵信息的條件下,能夠通過最簡單的決策屬性對條件屬性集施行分類[6]。設(shè)[X]與[Y]是[S]中的等價(jià)關(guān)系[IND(X)],[Y]的[X]正域用[ZX(Y)]表示, [D1]表示條件屬性集[D]關(guān)于決策屬性集[E]的約簡。若符合以下條件:
1) [D1?D],[D1≠?];
2) [ZINDD1INDE=ZINDDINDE];
3) 不存在[D2?D1,]使[ZINDD2INDE=][ZINDD1INDE] 。
則[D]的全部[E]約簡集合可用[ξED]表示,[D]的全部[E]約簡的交集被稱作核,即[ψED=ξED]??刹捎肹D]關(guān)于[E]的任意約簡取代[D],不會(huì)對決策造成干擾。
本節(jié)采用粗糙集方法,將英語教師教學(xué)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘問題轉(zhuǎn)變成求解關(guān)鍵數(shù)據(jù)集與其他數(shù)據(jù)集間關(guān)聯(lián)規(guī)則的問題。
對象屬性[B]由條件屬性集[D]和決策屬性集[E]構(gòu)成,即[B=D?E]。把一個(gè)英語教師教學(xué)數(shù)據(jù)庫內(nèi)需求解關(guān)聯(lián)規(guī)則的數(shù)據(jù)集通過粗糙集方式描述出來,即求解[R=S,B,H,f]中[D?E]的問題,其中,[D?E=?]。
在上述分析的基礎(chǔ)上,給出英語教師教學(xué)數(shù)據(jù)挖掘過程。設(shè)集合[A]為條件屬性集[D]的子集,根據(jù)[A]確定的等價(jià)類被稱作特征集,用[F]表示。若[A]中存在[n]個(gè)特征表述,則視[F]為[n]元特征集,用[Fn]表示,其中,[Fn]為[n]元特征描述,其表達(dá)式如下:
[Fn=D1∧D2∧…∧Dn] (2)
設(shè)關(guān)聯(lián)規(guī)則最小支持度為[ε],若規(guī)則[Fn?E]的支持度高于[ε,]則認(rèn)為根據(jù)[Fn]得到的[n]元特征集為頻繁[n-]項(xiàng)集。用[Ln]描述頻繁[n-]項(xiàng)集集合, [Vn]為[n]元特征集合,被稱作[n]元候選集。
將需挖掘的英語教師教學(xué)數(shù)據(jù)庫采用粗糙集方法進(jìn)行處理,確定決策表[R],設(shè)定最小支持[ε]和最小置信度[λ]。通過關(guān)聯(lián)規(guī)則挖掘方法,得出[D1?E]的關(guān)聯(lián)規(guī)則,從而實(shí)現(xiàn)英語教師教學(xué)數(shù)據(jù)挖掘,過程如下,:
1) 輸入[D1,][E,][ε,][λ];
2) 計(jì)算得到元候選集[Vn];
3) 求出候選集[Vn]的支持度,并與支持度[ε]相比,將大于[ε]的項(xiàng)保留,將小于[ε]的項(xiàng)去除;
4) 求出每個(gè)[n]元特征集[Fn,]并進(jìn)行置信度判定,若大于置信度[λ],則跳至步驟5),反之仍保留在[Fn]中;
5) 刪掉[Fn,]把規(guī)則存至規(guī)則庫;
6) 采用交集運(yùn)算得到[Vn+1,]并將[Vn+1]中無關(guān)項(xiàng)刪除;
7) 對得到的集合進(jìn)行判定,若不為空集,則跳至步驟3);否則停止計(jì)算。
主成分分析法是一種把離散信息歸至指定指標(biāo)的統(tǒng)計(jì)分析方法,指定指標(biāo)即為主成分,通過主成分對挖掘的英語教師教學(xué)數(shù)據(jù)集結(jié)構(gòu)進(jìn)行描述,獲取評價(jià)指標(biāo)[7]。主成分分析具體過程為:
1) 對指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理;
2) 對指標(biāo)間的相關(guān)性進(jìn)行判定,計(jì)算各指標(biāo)權(quán)重;
3) 得出主成分?jǐn)?shù)量[N];
4) 對主成分進(jìn)行描述和命名,得到的評價(jià)指標(biāo)通常包括一級指標(biāo)和二級指標(biāo)。
主成分為可體現(xiàn)樣本成分的新變量,此變量能將與英語教師教學(xué)樣本信息主成分軸相應(yīng)的變量全部體現(xiàn)出來。
對英語教師教學(xué)能力指標(biāo)進(jìn)行評價(jià),評價(jià)指標(biāo)值越大,表明英語教師教學(xué)能力越強(qiáng)[8?9]。本節(jié)評價(jià)指標(biāo)值計(jì)算公式如下:
[Xi=j=1qQj?Pij] (3)
式中:[Xi]用于描述第[i]個(gè)英語教師教學(xué)能力評價(jià)值;[Qj]用于描述第[j]項(xiàng)指標(biāo)的綜合權(quán)重;[Pij]用于描述第[i]個(gè)英語教師第[j]項(xiàng)指標(biāo)通過歸一化處理后的評價(jià)值;[q]用于描述英語教師人數(shù)。
依據(jù)某學(xué)校的實(shí)際狀態(tài),本文設(shè)計(jì)的英語教師教學(xué)能力評價(jià)指標(biāo)包含5個(gè)一級指標(biāo),所有一級指標(biāo)均含有若干二級指標(biāo),通過本文方法對該校英語教師教學(xué)能力進(jìn)行評價(jià)。當(dāng)前該校英語教師教學(xué)質(zhì)量評價(jià)指標(biāo)如表1所示,限于篇幅,僅給出部分指標(biāo)。
為了驗(yàn)證本文方法的可行性與準(zhǔn)確性,在當(dāng)?shù)啬硨W(xué)校進(jìn)行實(shí)驗(yàn)驗(yàn)證,邀請10位英語教師參與實(shí)驗(yàn),通過本文方法對10位英語教師的教學(xué)能力進(jìn)行評價(jià)。首先對采集數(shù)據(jù)進(jìn)行離散化處理,結(jié)果用表2進(jìn)行描述。
通過本文方法求出權(quán)重,同時(shí)完成屬性約簡,結(jié)果用表3進(jìn)行描述。
依據(jù)權(quán)重和評價(jià)數(shù)據(jù)獲取10位英語教師教學(xué)能力評價(jià)結(jié)果,如表4所示。
通過本文方法對學(xué)校英語教師教學(xué)能力進(jìn)行評價(jià),結(jié)果如下:超過90分的教師占20%,超過80分低于90分的教師占30%,超過70分低于80分的教師占40%,低于70分的教師占10%。
為了驗(yàn)證本文方法的有效性,將傳統(tǒng)加權(quán)平均值方法和模糊數(shù)學(xué)方法作為對比進(jìn)行分析,加權(quán)平均值方法針對10位英語教師的評價(jià)結(jié)果如下:超過90分的教師占40%,超過80分低于90分的教師占40%,超過70分低于80分的教師占10%,低于70分的教師占10%。模糊數(shù)學(xué)方法針對10位英語教師的評價(jià)結(jié)果如下:超過90分的教師占70%,超過80分低于90分的教師占20%,超過70分低于80分的教師占10%,低于70分的教師占0%。顯然,采用本文方法得到的評價(jià)結(jié)果更加科學(xué)公正。
為了評價(jià)本文方法的優(yōu)劣,將傳統(tǒng)加權(quán)平均值方法和模糊數(shù)學(xué)方法作為對比,將三種方法評價(jià)結(jié)果和實(shí)際結(jié)果的相關(guān)系數(shù)看作衡量評價(jià)方法優(yōu)劣的標(biāo)準(zhǔn),結(jié)果如圖1所示。
分析圖1可得出以下結(jié)論:本文方法評價(jià)精度比傳統(tǒng)加權(quán)平均值方法和模糊數(shù)學(xué)方法高,這是因?yàn)榕c其他兩種方法相比,本文方法能夠提供更多體現(xiàn)英語教師教學(xué)能力的信息,大大增強(qiáng)了評價(jià)精度,得到的評價(jià)結(jié)果可反映英語教師的真實(shí)教學(xué)水平。
本文提出基于數(shù)據(jù)挖掘的英語教師教學(xué)能力評價(jià)方法。對英語教師教學(xué)數(shù)據(jù)進(jìn)行離散化處理,挖掘有效的英語教師教學(xué)數(shù)據(jù)。通過主成分分析對挖掘的英語教師教學(xué)數(shù)據(jù)集結(jié)構(gòu)進(jìn)行描述,獲取評價(jià)指標(biāo)。求出英語教師教學(xué)能力指標(biāo)值。經(jīng)實(shí)驗(yàn)驗(yàn)證,所提方法評價(jià)結(jié)果可靠,可體現(xiàn)教師真實(shí)能力。
參考文獻(xiàn)
[1] 尹亞晶.基于數(shù)據(jù)挖掘的體育評價(jià)決策支持系統(tǒng)開發(fā)與研究[J].現(xiàn)代電子技術(shù),2017,40(9):108?111.
YIN Yajing. Development and research on sports evaluation and decision support system based on data mining [J]. Modern electronics technique, 2017, 40(9): 108?111.
[2] 梅毅,熊婷,羅少彬.復(fù)雜屬性環(huán)境下NoSQL分布式大數(shù)據(jù)挖掘方法研究[J].科學(xué)技術(shù)與工程,2017,17(9):239?243.
MEI Yi, XIONG Ting, LUO Shaobin. Research on NoSQL distributed big data mining method in complex attribute environment [J]. Science technology and engineering, 2017, 17(9): 239?243.
[3] QI L, ZHENG Z. Trajectory prediction of vessels based on data mining and machine learning [J]. Journal of digital information management, 2016, 32(11): 131?134.
[4] 胡文紅,孫欣欣.基于時(shí)間序列的數(shù)據(jù)挖掘技術(shù)在城市內(nèi)澇災(zāi)害中的應(yīng)用研究[J].科技通報(bào), 2016,32(6):229?231.
HU Wenhong, SUN Xinxin. Study of data mining technology in application of city water logging based on time series [J]. Bulletin of science and technology, 2016, 32(6): 229?231.
[5] 楊可晗,馬瓊.大數(shù)據(jù)下提高遠(yuǎn)程教育質(zhì)量提取有效資源仿真[J].計(jì)算機(jī)仿真,2017,34(4):212?215.
YANG Kehan, MA Qiong. To improve the quality of distance education and the simulation of effective resources under the big data [J]. Computer simulation, 2017, 34(4): 212?215.
[6] 陳海建,戴永輝,韓冬梅,等.開放式教學(xué)下的學(xué)習(xí)者畫像及個(gè)性化教學(xué)探討[J].開放教育研究,2017,23(3):105?112.
CHEN Haijian, DAI Yonghui, HAN Dongmei, et al. Learner′s portrait and individualized teaching in open education [J]. Open education research, 2017, 23(3): 105?112.
[7] 蔡晶晶.高職青年英語教師教學(xué)能力核心指標(biāo)研究[J].無錫職業(yè)技術(shù)學(xué)院學(xué)報(bào),2014,13(1):51?54.
CAI Jingjing. Research on the key indicators of young English teachers′ teaching ability in higher vocational colleges [J]. Journal of Wuxi Institute of Technology, 2014, 13(1): 51?54.
[8] 陳春良,劉彥,張雅卿.基于IGAHP?熵?博弈論?Choquet積分的新型裝甲裝備通用質(zhì)量特性評價(jià)模型研究[J].計(jì)算機(jī)測量與控制,2015,23(7):2438?2442.
CHEN Chunliang, LIU Yan, ZHANG Yaqing. Research on establishing evaluation index system of new type armored equipment common quality characters based on RST?QFD?Bayes [J]. Computer measurement & control, 2015, 23(7): 2438?2442.
[9] EKMEK?I E. Comparison of native and non?native English language teachers′ evaluation of EFL learners′ speaking skills: conflicting or identical rating behaviour? [J]. English language teaching, 2016, 9(5): 98.