国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的學(xué)生成績(jī)預(yù)警模型研究

2022-06-07 08:01:30廊坊衛(wèi)生職業(yè)學(xué)院侯婧
內(nèi)江科技 2022年5期
關(guān)鍵詞:預(yù)警準(zhǔn)確率樣本

◇廊坊衛(wèi)生職業(yè)學(xué)院 侯婧

中國人民警察大學(xué) 賈南

對(duì)于學(xué)生學(xué)習(xí)成績(jī)進(jìn)行預(yù)警進(jìn)行提前預(yù)警有助于及時(shí)調(diào)整教學(xué)策略,對(duì)提升教學(xué)效果具有重要意義。傳統(tǒng)的學(xué)生成績(jī)預(yù)警方法在很大程度上依賴于設(shè)計(jì)者對(duì)測(cè)評(píng)指標(biāo)權(quán)重的設(shè)計(jì),存在主觀性強(qiáng)和誤差略高的問題。隨著教育大數(shù)據(jù)的不斷完善和人工智能技術(shù)的快速發(fā)展,基于機(jī)器學(xué)習(xí)算法的學(xué)生成績(jī)預(yù)警已成為可能。本文基于真實(shí)的學(xué)生學(xué)習(xí)情況數(shù)據(jù),通過特征選擇建立特征工程,采用K-近鄰法建立學(xué)生學(xué)習(xí)成績(jī)預(yù)警模型,利用訓(xùn)練集數(shù)據(jù)訓(xùn)練模型,并使用測(cè)試集數(shù)據(jù)來測(cè)試模型。結(jié)果表明,本文設(shè)計(jì)的基于K-近鄰算法的學(xué)生成績(jī)預(yù)警模型準(zhǔn)確率為90.5%,并得到了影響學(xué)生掛科的若干重要因素,可為教師及時(shí)調(diào)整教學(xué)策略、提升教學(xué)效果提供參考。

1 引言

近年來,大數(shù)據(jù)研究的快速發(fā)展,不斷影響著社會(huì)生活的各個(gè)領(lǐng)域。2015年8月31日,國務(wù)院印發(fā)了《關(guān)于促進(jìn)大數(shù)據(jù)行動(dòng)綱要的通知》,其中明確要求加大數(shù)據(jù)技術(shù)在教育領(lǐng)域的應(yīng)用。在人工智能時(shí)代,將大數(shù)據(jù)分析技術(shù)與時(shí)俱進(jìn)地應(yīng)用于教育教學(xué)研究中,不僅可為教學(xué)改革提供新的思路,也符合我國教育事業(yè)發(fā)展要求[1]。

在學(xué)生學(xué)習(xí)效果的評(píng)價(jià)體系中,掛科是較為重要的指標(biāo)。因此,對(duì)學(xué)生成績(jī)特別是掛科情況進(jìn)行預(yù)警具有重要意義。傳統(tǒng)的預(yù)警方法主要采用人為選取學(xué)生學(xué)習(xí)指標(biāo)、設(shè)置指標(biāo)權(quán)重的方法,具有較強(qiáng)的主觀性[2-3]。本文擬基于教育大數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)算法中的K近鄰算法建立模型[4-5],較客觀的對(duì)學(xué)生成績(jī)進(jìn)行預(yù)警,并對(duì)影響學(xué)生掛科與否的指標(biāo)重要性進(jìn)行排序分析,有助于提升教學(xué)效果。

2 算法介紹

K近鄰算法是機(jī)器學(xué)習(xí)中的典型算法。該算法1967年由Cover T和Hart P提出,是一種較易理解的分類算法。其原理為:假定存在一個(gè)帶有標(biāo)簽的數(shù)據(jù)樣本集合,即每個(gè)樣本的類型是已知的,用該集合作為訓(xùn)練集;現(xiàn)在要預(yù)測(cè)某個(gè)未知標(biāo)簽的新數(shù)據(jù)的類型,我們將已知標(biāo)簽的數(shù)據(jù)樣本按照其特征維度建立N維度坐標(biāo)系,將已知標(biāo)簽的數(shù)據(jù)樣本投放到N維空間中,對(duì)于要預(yù)測(cè)的未知標(biāo)簽樣本也按N維坐標(biāo)投放到坐標(biāo)系中,圈定距離其最近鄰的K個(gè)樣本,K個(gè)樣本中哪種標(biāo)簽類型最多,則認(rèn)為該未知樣本屬于這一類型。

K值的選取是K近鄰算法預(yù)測(cè)準(zhǔn)確率的重要指標(biāo),對(duì)于有已知經(jīng)驗(yàn)的情況,通常按照經(jīng)驗(yàn)對(duì)K值進(jìn)行設(shè)置;對(duì)于無已知經(jīng)驗(yàn)的情況,可遍歷K的取值(K一般為整數(shù),通常不大于20),取準(zhǔn)確率最大時(shí)的K值。

3 模型建立和實(shí)例驗(yàn)證

3.1 特征工程建立

為準(zhǔn)確預(yù)測(cè)學(xué)生掛科情況,本文選取章節(jié)測(cè)驗(yàn)、章節(jié)學(xué)習(xí)次數(shù)、作業(yè)、隨堂練習(xí)、綜合評(píng)分、教學(xué)視頻觀看時(shí)長(zhǎng)、參與討論次數(shù)、模擬考試和期末成績(jī)九個(gè)特征建立特征工程。其中前八個(gè)特征為自變量,期末成績(jī)?yōu)橐蜃兞?,即使用前八個(gè)變量預(yù)測(cè)學(xué)生的期末成績(jī)。其中期末成績(jī)按照是否大于60分劃分為“及格”和“不及格”,分別用1和0表示。

3.2 數(shù)據(jù)探索性分析

特征工程各特征之間若存在較強(qiáng)相關(guān)性則會(huì)影響預(yù)測(cè)準(zhǔn)確率,因此對(duì)各特征間的相關(guān)性進(jìn)行分析很有必要。表1為9個(gè)變量之間的相關(guān)系數(shù)矩陣,從其中可以看出,大部分變量之間不存在明顯的相關(guān)性。各變量與期末成績(jī)之間的相關(guān)系數(shù)處于0.005-0.34之間。

表1 各變量間相關(guān)系數(shù)矩陣

3.3 模型建立和訓(xùn)練

建立基于K近鄰算法的學(xué)生成績(jī)預(yù)警模型,首先從sklearn模塊中加KNeighborsClassifier,然后設(shè)置n_neighbors的值,從而實(shí)例化KNeighborsClassifier,實(shí)現(xiàn)模型建立[6]。數(shù)據(jù)集中70%的數(shù)據(jù)用于訓(xùn)練模型,剩余的30%用于測(cè)試模型。

4 結(jié)果分析

4.1 模型準(zhǔn)確率分析

K值是影響K近鄰算法的重要參數(shù),為取得最佳K值,本文分別測(cè)試了K取1-19之間全部數(shù)值時(shí)的模型的準(zhǔn)確率,如圖1所示。從圖中可以看出,隨著K值的逐漸變大,模型的準(zhǔn)確率逐漸提升,當(dāng)K取12時(shí),模型準(zhǔn)確率達(dá)到最大值90.5%。說明K近鄰算法建立的學(xué)生成績(jī)預(yù)警模型預(yù)測(cè)效果較好。

圖1 模型準(zhǔn)確率隨K值變化圖

4.2 特征重要性分析

除了得到較高準(zhǔn)確率,分析影響學(xué)生期末成績(jī)的影響因素也同樣重要。本文運(yùn)用隨機(jī)森林算法的feature_importances_屬性得到預(yù)測(cè)期末成績(jī)的八個(gè)特征的重要性排序[7],如圖2所示。從圖中可以看出影響預(yù)測(cè)精度的最重要的三個(gè)特征為“作業(yè)”、“教學(xué)視頻觀看時(shí)長(zhǎng)”、“模擬考試”,教師在教學(xué)過程中應(yīng)重點(diǎn)關(guān)注在這三個(gè)方面表現(xiàn)不佳的同學(xué)。

圖2 學(xué)生成績(jī)預(yù)警特征重要性排序圖

5 結(jié)束語

本文為解決學(xué)生成績(jī)預(yù)警問題,運(yùn)用機(jī)器學(xué)習(xí)中的K近鄰算法建立了學(xué)生成績(jī)預(yù)警模型,通過調(diào)整K值大小,模型最高準(zhǔn)確率為90.5%,具有較高的預(yù)測(cè)效果,對(duì)預(yù)測(cè)學(xué)生是否掛科具有一定指導(dǎo)意義。另外,影響學(xué)生掛科與否的最重要的三個(gè)特征分別為“作業(yè)”、“教學(xué)視頻觀看時(shí)長(zhǎng)”、“模擬考試”,教師在教學(xué)過程中應(yīng)重點(diǎn)關(guān)注在這三個(gè)維度表現(xiàn)欠佳的學(xué)生,及時(shí)予以針對(duì)性、個(gè)體化的教學(xué)指導(dǎo),以提升教學(xué)效果,降低掛科率。

猜你喜歡
預(yù)警準(zhǔn)確率樣本
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
法國發(fā)布高溫預(yù)警 嚴(yán)陣以待備戰(zhàn)“史上最熱周”
推動(dòng)醫(yī)改的“直銷樣本”
高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
園林有害生物預(yù)警與可持續(xù)控制
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
村企共贏的樣本
404 Not Found

404 Not Found


nginx
彰化县| 康定县| 岢岚县| 夏津县| 湖北省| 长兴县| 永嘉县| 永寿县| 敦化市| 陆良县| 萍乡市| 北流市| 虎林市| 广东省| 治多县| 句容市| 吉林省| 平阳县| 枝江市| 伊川县| 义马市| 武山县| 绥化市| 辽中县| 依兰县| 广平县| 呼图壁县| 靖边县| 兰考县| 彰化县| 通山县| 常山县| 昂仁县| 微山县| 托克逊县| 甘孜县| 鄂托克旗| 阳谷县| 咸宁市| 威远县| 醴陵市|