◎姜喜春 王永娟
(黑河學(xué)院理學(xué)院,黑龍江 黑河 164300)
統(tǒng)計(jì)學(xué)專業(yè)方向分流問題的研究
◎姜喜春 王永娟
(黑河學(xué)院理學(xué)院,黑龍江 黑河 164300)
使用Logistic模型依據(jù)113名新生的第一志愿數(shù)據(jù)和平均績(jī)點(diǎn)數(shù)據(jù)將這些學(xué)生按照專業(yè)方向A1和A2進(jìn)行分流.并按照給定的人數(shù)比率對(duì)分流結(jié)果調(diào)整,給出了最優(yōu)分流結(jié)果.使用快速聚類法根據(jù)兩個(gè)專業(yè)方向的學(xué)生的平均績(jī)點(diǎn)劃分新的行政班級(jí),按照相應(yīng)的人數(shù)比率要求進(jìn)行調(diào)整,給出了最后的劃分結(jié)果和分布曲線.
統(tǒng)計(jì)學(xué)專業(yè);方向分流;Logistic模型;快速聚類法
統(tǒng)計(jì)學(xué)專業(yè)方向分流,是指高校統(tǒng)計(jì)院系根據(jù)統(tǒng)計(jì)學(xué)專業(yè)人才培養(yǎng)的目標(biāo)不同,在開設(shè)后繼選修課程時(shí)有側(cè)重點(diǎn)地開設(shè)不同方向的專業(yè)選修課程,有的課程偏向于統(tǒng)計(jì)學(xué)算法開發(fā)和軟件的應(yīng)用,有的課程是在大數(shù)據(jù)時(shí)代背景下側(cè)重于數(shù)據(jù)挖掘方向等等.學(xué)生入校后,經(jīng)過一至兩年的專業(yè)基礎(chǔ)課程的學(xué)習(xí)后,再根據(jù)各自的興趣和雙向選擇的原則進(jìn)行專業(yè)方向分流.
(一)Logistic模型的建立
使用未分組的Logistic回歸模型,在盡量滿足第一志愿的情況下,考慮學(xué)生的績(jī)點(diǎn)進(jìn)行專業(yè)方向分流.Logistic回歸的思想是我們只需要知道一件事情是否發(fā)生了,然后,再用二元值(0,1)作為我們的解釋變量.從這個(gè)二元值中,程序預(yù)測(cè)出事件發(fā)生或者不發(fā)生的概率.如果預(yù)測(cè)概率大于0.5,則預(yù)測(cè)發(fā)生,反之則不發(fā)生.需要注意的是,Logistic回歸和系數(shù)的解釋與多元回歸的解釋不同.程序計(jì)算出Logistic系數(shù),比較事件發(fā)生與不發(fā)生的概率比[1].
(二)模型分析
計(jì)算得到分流后兩個(gè)專業(yè)學(xué)生的平均績(jī)點(diǎn)的均值分別是2.7 408和1.1 720.所以,在盡量滿足第一志愿的情況下將平均績(jī)點(diǎn)相對(duì)較低的10名學(xué)生分配到A2專業(yè)中去.從現(xiàn)在的A1專業(yè)中按照平均績(jī)點(diǎn)由低到高地選取十名第一志愿是A2專業(yè)的學(xué)生到A2專業(yè)中.綜上所述,A1專業(yè)最終分流后有68人,A2專業(yè)有45人.其中A1專業(yè)中第一志愿為A1的有51人,所以,錄取率為74%;A2專業(yè)中第一志愿為A2的有31人,錄取率為69%.
(一)快速聚類法求解
K-均值法,又叫快速聚類法,是Macqueen于1967年提出的,其思想是把每個(gè)樣品聚集到其最近形心類中去.首先,把樣品粗略分成K個(gè)初始類;其次,進(jìn)行修改,逐個(gè)分派樣品到其最近均值的類中去.重新計(jì)算接受新樣品的類和失去樣品的類的形心;最后,重復(fù)第2步,直到各類無元素進(jìn)出[2].
使用快速聚類法對(duì)A1專業(yè)方向?qū)W生按照指標(biāo)“平均績(jī)點(diǎn)”分類.分析SPSS的輸出結(jié)果,方差分析表中的F值為165.895,對(duì)應(yīng)的顯著性概率值接近零,說明了以變量“平均績(jī)點(diǎn)”分類效果顯著.最終將A1專業(yè)分成兩個(gè)行政班級(jí),并且每個(gè)班級(jí)都是34人,符合題目中的人數(shù)要求.
(二)行政班級(jí)成績(jī)分布曲線分析
研究A1專業(yè)方向新的行政班級(jí)成績(jī)分布曲線,并進(jìn)行對(duì)比.對(duì)A1專業(yè)方向?qū)W生總體的平均績(jī)點(diǎn)進(jìn)行正態(tài)性檢驗(yàn),并繪制A1專業(yè)方向?qū)W生總體的成績(jī)分布曲線.運(yùn)行結(jié)果h=0,說明A1專業(yè)方向全體學(xué)生的平均績(jī)點(diǎn)成正態(tài)分布,期望和方差分別為mu1=2.8 412,sigma1=0.5 419,對(duì)新的行政一班學(xué)生的平均績(jī)點(diǎn)進(jìn)行正態(tài)性檢驗(yàn),觀察運(yùn)行結(jié)果得h=0,說明A1專業(yè)行政方向一班全體學(xué)生的平均績(jī)點(diǎn)成正態(tài)分布.
綜上所述,A1專業(yè)方向兩個(gè)行政班級(jí)的成績(jī)均服從正態(tài)分布,而且每個(gè)班級(jí)的成績(jī)波動(dòng)都不大.他們的方差分別為0.3 087和0.2 728很有力地說明了這一點(diǎn).但兩個(gè)班級(jí)的平均成績(jī)有明顯差別,二班的平均成績(jī)?yōu)?.2 962,而一班的平均成績(jī)?yōu)?.3 862,這也說明了我們分班過程中主要考慮了成績(jī)因素.這樣在今后的教學(xué)中也能夠因材施教,培養(yǎng)出合格的大學(xué)生.
建立了Logistic模型,并給出了專業(yè)方向分流結(jié)果,并根據(jù)人數(shù)比例結(jié)合報(bào)名志愿進(jìn)行微調(diào).使用快速聚類法對(duì)分流后的專業(yè)方向A1,A2進(jìn)行了分班,并且進(jìn)行了調(diào)整,使最后結(jié)果滿足到了題目中對(duì)人數(shù)比例的要求.結(jié)合MATLAB軟件對(duì)新的行政班級(jí)成績(jī)分布曲線是否服從正態(tài)性進(jìn)行了檢驗(yàn),并做出相應(yīng)分析.
[1]何曉群.多元統(tǒng)計(jì)分析[M].北京:中國人民大學(xué)出版社,2012.
[2]李柏年,吳禮斌.MATLAB數(shù)據(jù)分析方法[M].北京:機(jī)械工業(yè)出版社,2012.
[3]徐瓊梅.統(tǒng)計(jì)學(xué)專業(yè)信息類課程設(shè)置研究[J].統(tǒng)計(jì)教育,2007(3):45-46.
黑龍江省教育科學(xué)規(guī)劃辦課題(GJB1214026);黑河學(xué)院教育科學(xué)研究項(xiàng)目(JYQ201601).