王靜
【摘 要】引入GA優(yōu)化算法對(duì)SVM模型的參數(shù)進(jìn)行優(yōu)化,把優(yōu)化后的算法應(yīng)用于高職學(xué)生綜合素質(zhì)評(píng)價(jià),構(gòu)建一個(gè)學(xué)生綜合素質(zhì)的評(píng)價(jià)模型。實(shí)驗(yàn)表明,優(yōu)化后的SVM模型泛化能力更好、預(yù)測(cè)的準(zhǔn)確率更高,能有效地對(duì)學(xué)生的綜合素質(zhì)進(jìn)行評(píng)價(jià)。
【關(guān)鍵詞】GA算法 SVM模型 綜合素質(zhì)評(píng)價(jià)
【中圖分類號(hào)】 G 【文獻(xiàn)標(biāo)識(shí)碼】A
【文章編號(hào)】0450-9889(2014)03C-0055-03
學(xué)生的綜合素質(zhì)是一個(gè)學(xué)校辦學(xué)水平的反映,如何對(duì)高職學(xué)生的綜合素質(zhì)進(jìn)行科學(xué)、合理地評(píng)價(jià)成為各個(gè)高職院校改革研究的重點(diǎn)。對(duì)學(xué)生綜合素質(zhì)的評(píng)價(jià)屬于非線性的數(shù)學(xué)問(wèn)題。支持向量機(jī)( Support Vector Machine,簡(jiǎn)稱SVM) 是一種新型的機(jī)器學(xué)習(xí)方法,具有良好泛化能力,在處理非線性問(wèn)題時(shí)更容易逼近問(wèn)題的解決。但SVM模型的分類性能受其參數(shù)的影響,這些參數(shù)的確定帶有很大的隨機(jī)性。為了解決這個(gè)問(wèn)題,引入具有智能全局搜索能力的遺傳算法 (Genetic Algorithm,簡(jiǎn)稱GA)對(duì)SVM模型的參數(shù)進(jìn)行優(yōu)化,構(gòu)造一個(gè)基于GA算法優(yōu)化的SVM模型(簡(jiǎn)稱GA-SVM模型)。實(shí)踐表明,在學(xué)生綜合素質(zhì)評(píng)價(jià)中GA-SVM模型具有更好的非線性逼近能力,具有一定的應(yīng)用前景。
一、GA優(yōu)化的SVM評(píng)價(jià)模型
(一) SVM模型的基本原理。SVM模型是一種新型的機(jī)器學(xué)習(xí)方法,它源于統(tǒng)計(jì)學(xué)和結(jié)構(gòu)最小化原則。它的基本思想是在有限的樣本中,對(duì)問(wèn)題的復(fù)雜性和算法繼續(xù)學(xué)習(xí)能力進(jìn)行折中,使模型獲得更好的泛化能力。如圖1所示。圖1中的實(shí)心點(diǎn)和空心點(diǎn)分別代表兩類不同的樣本,H1和H2是兩根平行于分類線的直線,H1和H2之間的距離稱為分類間隔(Margin)。
圖1 支持向量機(jī)原理示意圖
設(shè)樣本集(xi,yi)線性可分,其中i=1,2,L,n。n為樣本數(shù)量,輸入向量x∈Rd,類別標(biāo)號(hào)y∈[1,-1]。在d維空間中,線性判別函數(shù)的基本形式為g(x)=wgx+b。設(shè)分類面方程為,其中w是一個(gè)向量,該向量垂直于超平面,b稱為超平面偏置。我們把能將兩類樣本準(zhǔn)確區(qū)分,并且使得這兩類樣本之間的分類間隔最大的那個(gè)面稱為最優(yōu)分類面。求解最優(yōu)分類面,實(shí)際上就是找到w和b的最優(yōu)值,也就是在條件,i=1,....,n下,求解函數(shù)的最小化,即
(1)
在所有的樣本里,如果該樣本滿足,且與分離線(平面)的垂直距離最小,則稱之為支持向量。以上的討論都是假設(shè)所有的樣本是線性可分的情況下給出的。然而,在現(xiàn)實(shí)的應(yīng)用中,很多數(shù)據(jù)都是非線性的。為了解決非線性問(wèn)題,通過(guò)對(duì)公式(1)引入常數(shù)因子C和松弛因子,把每一個(gè)樣本點(diǎn)通過(guò)函數(shù)轉(zhuǎn)換到高維特征空間再對(duì)它們進(jìn)行線性回歸。則轉(zhuǎn)換公式可以表示為:
其中,i=1,....,n
對(duì)公式(2)引入拉格朗日函數(shù),把問(wèn)題轉(zhuǎn)化為對(duì)偶問(wèn)題。在給定的約束條件和(i=1,....,n)下,對(duì)求解,即
(3)
其中為拉格朗日乘子。對(duì)公式(3)求解,結(jié)果為:
(4)
運(yùn)用公式(4)即可求出樣本x的類別。
本文采用徑向基函數(shù)作為SVM模型的核函數(shù):
(5)
從公式(2)和公式(5)可以看出,SVM模型的整體性能很大程度上由常數(shù)因子C和徑向基函數(shù)的參數(shù)來(lái)決定。因此,為了能更好地選擇這兩個(gè)參數(shù),我們引入具有全局搜索能力的GA算法對(duì)這兩個(gè)參數(shù)進(jìn)行優(yōu)化,使得SVM模型具有更好的泛化能力和逼近精度。
(二)基于GA優(yōu)化的SVM評(píng)價(jià)模型。GA算法是一種模擬生物進(jìn)化過(guò)程的優(yōu)化算法,在該算法中,問(wèn)題的解空間用一種給定的編碼來(lái)表示,求解問(wèn)題的目標(biāo)作為算法的適應(yīng)度函數(shù)。GA算法在初始狀態(tài)會(huì)隨機(jī)產(chǎn)生一個(gè)編碼群體,在這個(gè)群體之上通過(guò)選擇算子、交叉算子以及變異算子完成整個(gè)算法的運(yùn)算機(jī)制。經(jīng)過(guò)算法的迭代,群體內(nèi)的個(gè)體不斷接近問(wèn)題的最優(yōu)解。
本文采用實(shí)數(shù)對(duì)GA算法進(jìn)行編碼,利用GA算法對(duì)SVM模型的常數(shù)因子C和徑向基函數(shù)的參數(shù)進(jìn)行優(yōu)化的基本步驟如下:
Step1:?jiǎn)栴}的初始化。隨機(jī)生成初始種群N,種群中染色體的編碼由C和組成,算法的最大迭代數(shù)為,迭代變量k=0。
Step2:進(jìn)行選擇操作。群體內(nèi)的每個(gè)染色體能否被選擇參與下一輪的進(jìn)化由選擇算子決定:
(6)
其中,是染色體的適應(yīng)度函數(shù),本文采用MAPE的倒數(shù)作為適應(yīng)度函數(shù),×100%,為實(shí)值, 為預(yù)測(cè)值。
Step3:進(jìn)行交叉操作。隨機(jī)生成一個(gè)數(shù)rc=random[0,1],若rc Step4:進(jìn)行變異操作。變異操作的算法為: 。其中,V和V'分別是父染色體和子染色體,N(0,1)是高斯變量且均值為0、方差=0;Pm是變異概率;是染色體V的適應(yīng)度函數(shù)。 Step5:當(dāng)時(shí),算法結(jié)束,輸出最優(yōu)的C和;否則,k=k+1,跳轉(zhuǎn)到Step2。 (三)基于SVM的多分類器。從SVM模型的基本理論來(lái)看,它本身就是一個(gè)二分器,僅能解決兩種不同類別的分類問(wèn)題。然而,現(xiàn)實(shí)中需要解決的往往都是多分類的問(wèn)題。有學(xué)者對(duì)基本的SVM模型進(jìn)行了推廣,使它能解決多種分類的問(wèn)題。實(shí)現(xiàn)SVM模型多種分類的基本思路是:構(gòu)造多個(gè)SVM的子分類器,每個(gè)子分類器都由兩種不同類別的樣本構(gòu)成,樣本的選擇是隨機(jī)的。對(duì)于一個(gè)有m個(gè)樣本的集合,則可構(gòu)造m(m-1)/2個(gè)子分類器。設(shè)有A和B兩類樣本組成的訓(xùn)練集,A集合的類別標(biāo)記為正,反之B集合的類別標(biāo)記為負(fù)。以此思想構(gòu)造的SVM多分類器需要解決的優(yōu)化問(wèn)題是 公式(7)需要滿足的條件為:
當(dāng)獲得子分類器后,就可以使用子分類器對(duì)樣本數(shù)據(jù)進(jìn)行測(cè)試。在測(cè)試的過(guò)程中,分別對(duì)m(m-1)/2個(gè)子分類器進(jìn)行測(cè)試,并統(tǒng)計(jì)各個(gè)樣本類別的分?jǐn)?shù),測(cè)試數(shù)據(jù)的類別即為測(cè)試過(guò)程中得分最高者所對(duì)應(yīng)的類別。
二、高職學(xué)生綜合素質(zhì)評(píng)價(jià)體系構(gòu)建
影響高職學(xué)生綜合素質(zhì)的因素很多,各因素之間的關(guān)系相互聯(lián)系又互有影響,因此整個(gè)評(píng)價(jià)過(guò)程是一項(xiàng)復(fù)雜的系統(tǒng)工程。為建立規(guī)范、合理、科學(xué)的評(píng)價(jià)指標(biāo)體系,必須堅(jiān)持評(píng)價(jià)的多維化、評(píng)價(jià)主體的多元化、評(píng)價(jià)方法的多樣性以及評(píng)價(jià)功能的多元化原則。當(dāng)前,各高職院校對(duì)學(xué)生綜合素質(zhì)的評(píng)價(jià)也進(jìn)行了多方面的探索,取得了很多經(jīng)驗(yàn)。通過(guò)廣泛查閱資料,在借鑒姚宏、葉寧《高職院校學(xué)生綜合素質(zhì)評(píng)價(jià)指標(biāo)體系研究》一文的基礎(chǔ)上,本文采用的學(xué)生綜合素質(zhì)評(píng)價(jià)體系如表1所示。
通過(guò)表1可以看到,影響學(xué)生綜合素質(zhì)的指標(biāo)很多。在以往的評(píng)測(cè)中,大多采用發(fā)放調(diào)查問(wèn)卷的形式收集相關(guān)數(shù)據(jù),最后由輔導(dǎo)員對(duì)每個(gè)學(xué)生的信息進(jìn)行統(tǒng)計(jì),這種方法所得數(shù)據(jù)可用性差,在這里我們對(duì)所有的指標(biāo)采取量化的方式進(jìn)行數(shù)據(jù)的收集。首先對(duì)所有一級(jí)指標(biāo)用A、B、C、D和E進(jìn)行區(qū)分,每個(gè)二級(jí)指標(biāo)都有相應(yīng)的編號(hào),實(shí)際使用的時(shí)候是一級(jí)指標(biāo)的字母加上對(duì)應(yīng)二級(jí)指標(biāo)的編號(hào)。如:A1、A2等。每個(gè)二級(jí)指標(biāo)的分值都是滿分10分,每個(gè)一級(jí)指標(biāo)都占總分值的20%,由此可知每一名學(xué)生的評(píng)價(jià)分值可以用如下公式來(lái)進(jìn)行計(jì)算:綜合素質(zhì)評(píng)價(jià)總分=A×20%+B×20%+C×20%+D×20%+E×20%。每一項(xiàng)一級(jí)指標(biāo)的分值都由它對(duì)應(yīng)的二級(jí)指標(biāo)來(lái)確定,比如C指標(biāo)對(duì)應(yīng)有6項(xiàng)二級(jí)指標(biāo),則C=(C1+C2+C3+C4+C5+C6)×100/60。評(píng)價(jià)的最終結(jié)果用Y來(lái)表示,總共分為優(yōu)秀、良好以及差三個(gè)等級(jí),為了便于SVM模型處理,這三個(gè)等級(jí)的分值分別是1、0和-1。參見(jiàn)表2。
三、具體應(yīng)用
(一)數(shù)據(jù)采集。考慮到每個(gè)人主觀性會(huì)造成在打分時(shí)存在不同程度的個(gè)人傾向,為了保證評(píng)價(jià)結(jié)果的科學(xué)性和權(quán)威性,采用教師和學(xué)生相結(jié)合,多人打分取平均值。具體做法是,按照表1的指標(biāo)設(shè)計(jì)調(diào)查表,對(duì)柳州職業(yè)技術(shù)學(xué)院財(cái)經(jīng)系2011級(jí)財(cái)會(huì)專業(yè)1班共43人進(jìn)行評(píng)價(jià)測(cè)試。組織該班級(jí)的任課教師共5人對(duì)全班43名同學(xué)進(jìn)行打分,學(xué)生則分為4組,每組11人,其中一組10人,每組同學(xué)互相打分。最終形成的數(shù)據(jù)如表3所示。
為了消除數(shù)據(jù)間的差異,使SVM模型具有更快的處理速度和處理精度,對(duì)采集到的所有樣本進(jìn)行歸一化處理,歸一化處理公式為:
(8)
(二)評(píng)價(jià)模型的具體應(yīng)用。本實(shí)驗(yàn)在P4 2.8GCPU、2G內(nèi)存的硬件條件下,在WinXp系統(tǒng)中采用matlab7進(jìn)行編程實(shí)現(xiàn)。取前35筆數(shù)據(jù)作為訓(xùn)練樣本,后8筆數(shù)據(jù)作為測(cè)試樣本。實(shí)驗(yàn)中用到的部分參數(shù)為:種群規(guī)模N=200,交叉率Pc=0.75,變異率Pm=0.05 。通過(guò)對(duì)SVM參數(shù)的優(yōu)化處理,最終建立SVM的綜合素質(zhì)評(píng)價(jià)模型。同時(shí)為了驗(yàn)證經(jīng)過(guò)GA優(yōu)化的SVM模型和未優(yōu)化的SVM模型性能上的差別,后8筆測(cè)試數(shù)據(jù)分別采用GA-SVM模型和SVM模型進(jìn)行測(cè)試,結(jié)果如表4、表5所示。
從表4、表5中可以看出,SVM模型和GA-SVM模型預(yù)測(cè)誤差都控制在2%以內(nèi),說(shuō)明它們?cè)谶M(jìn)行非線性數(shù)據(jù)預(yù)測(cè)中,預(yù)測(cè)精度很高。通過(guò)表4和表5的比較不難看出,通過(guò)GA優(yōu)化后的SVM模型比未優(yōu)化的SVM模型具有更好的泛化能力和預(yù)測(cè)精度。這是因?yàn)镚A-SVM模型在GA算法的優(yōu)化下,拓展了解的空間,在GA算法強(qiáng)大的全局搜索能力下得到了更優(yōu)化的參數(shù)C和 ,從而獲得更好的學(xué)習(xí)精度,提高了未知樣本的預(yù)測(cè)率。
綜上所述,學(xué)生綜合素質(zhì)是反映學(xué)校辦學(xué)質(zhì)量的一項(xiàng)重要指標(biāo),同時(shí)也是企業(yè)用人的一項(xiàng)重要指標(biāo)。因而,對(duì)學(xué)生綜合素質(zhì)評(píng)價(jià)一直是當(dāng)前高職院校改革和探索的問(wèn)題。本文利用GA算法對(duì)SVM模型的參數(shù)進(jìn)行了優(yōu)化,并成功地應(yīng)用于學(xué)生綜合素質(zhì)的評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明,優(yōu)化后的SVM模型泛化能力更好、預(yù)測(cè)的準(zhǔn)確率更高,具有一定的應(yīng)用前景。
【參考文獻(xiàn)】
[1]劉偉,孫林.基于支持向量機(jī)的課堂教學(xué)質(zhì)量評(píng)價(jià)[J].合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2010(7)
[2]周燕軍.基于遺傳算法的學(xué)生綜合素質(zhì)評(píng)價(jià)[J].長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4)
[3]李波.支持向量機(jī)在高校教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用研究[J].計(jì)算機(jī)仿真,2011(10)
[4]陳良堤,徐高歡.基于多分類SVM的教學(xué)質(zhì)量評(píng)價(jià)模型研究[J].黑龍江教育,2007( 11)
[5]姚宏,葉寧.高職院校學(xué)生綜合素質(zhì)評(píng)價(jià)指標(biāo)體系研究[J]. 四川教育學(xué)院學(xué)報(bào),2011(12)
[6]朱海林,宋承祥,劉弘,等.基于支持向量機(jī)的教學(xué)質(zhì)量評(píng)價(jià)研究[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4)
【基金項(xiàng)目】廣西教育科學(xué)“十二五”規(guī)劃課題 (2011C0187)
【作者簡(jiǎn)介】王 靜(1980- ),女,江蘇南京人,柳州職業(yè)技術(shù)學(xué)院財(cái)經(jīng)與物流系講師,研究方向:思政教育、職業(yè)技術(shù)教育。
(責(zé)編 盧 雯)
當(dāng)獲得子分類器后,就可以使用子分類器對(duì)樣本數(shù)據(jù)進(jìn)行測(cè)試。在測(cè)試的過(guò)程中,分別對(duì)m(m-1)/2個(gè)子分類器進(jìn)行測(cè)試,并統(tǒng)計(jì)各個(gè)樣本類別的分?jǐn)?shù),測(cè)試數(shù)據(jù)的類別即為測(cè)試過(guò)程中得分最高者所對(duì)應(yīng)的類別。
二、高職學(xué)生綜合素質(zhì)評(píng)價(jià)體系構(gòu)建
影響高職學(xué)生綜合素質(zhì)的因素很多,各因素之間的關(guān)系相互聯(lián)系又互有影響,因此整個(gè)評(píng)價(jià)過(guò)程是一項(xiàng)復(fù)雜的系統(tǒng)工程。為建立規(guī)范、合理、科學(xué)的評(píng)價(jià)指標(biāo)體系,必須堅(jiān)持評(píng)價(jià)的多維化、評(píng)價(jià)主體的多元化、評(píng)價(jià)方法的多樣性以及評(píng)價(jià)功能的多元化原則。當(dāng)前,各高職院校對(duì)學(xué)生綜合素質(zhì)的評(píng)價(jià)也進(jìn)行了多方面的探索,取得了很多經(jīng)驗(yàn)。通過(guò)廣泛查閱資料,在借鑒姚宏、葉寧《高職院校學(xué)生綜合素質(zhì)評(píng)價(jià)指標(biāo)體系研究》一文的基礎(chǔ)上,本文采用的學(xué)生綜合素質(zhì)評(píng)價(jià)體系如表1所示。
通過(guò)表1可以看到,影響學(xué)生綜合素質(zhì)的指標(biāo)很多。在以往的評(píng)測(cè)中,大多采用發(fā)放調(diào)查問(wèn)卷的形式收集相關(guān)數(shù)據(jù),最后由輔導(dǎo)員對(duì)每個(gè)學(xué)生的信息進(jìn)行統(tǒng)計(jì),這種方法所得數(shù)據(jù)可用性差,在這里我們對(duì)所有的指標(biāo)采取量化的方式進(jìn)行數(shù)據(jù)的收集。首先對(duì)所有一級(jí)指標(biāo)用A、B、C、D和E進(jìn)行區(qū)分,每個(gè)二級(jí)指標(biāo)都有相應(yīng)的編號(hào),實(shí)際使用的時(shí)候是一級(jí)指標(biāo)的字母加上對(duì)應(yīng)二級(jí)指標(biāo)的編號(hào)。如:A1、A2等。每個(gè)二級(jí)指標(biāo)的分值都是滿分10分,每個(gè)一級(jí)指標(biāo)都占總分值的20%,由此可知每一名學(xué)生的評(píng)價(jià)分值可以用如下公式來(lái)進(jìn)行計(jì)算:綜合素質(zhì)評(píng)價(jià)總分=A×20%+B×20%+C×20%+D×20%+E×20%。每一項(xiàng)一級(jí)指標(biāo)的分值都由它對(duì)應(yīng)的二級(jí)指標(biāo)來(lái)確定,比如C指標(biāo)對(duì)應(yīng)有6項(xiàng)二級(jí)指標(biāo),則C=(C1+C2+C3+C4+C5+C6)×100/60。評(píng)價(jià)的最終結(jié)果用Y來(lái)表示,總共分為優(yōu)秀、良好以及差三個(gè)等級(jí),為了便于SVM模型處理,這三個(gè)等級(jí)的分值分別是1、0和-1。參見(jiàn)表2。
三、具體應(yīng)用
(一)數(shù)據(jù)采集??紤]到每個(gè)人主觀性會(huì)造成在打分時(shí)存在不同程度的個(gè)人傾向,為了保證評(píng)價(jià)結(jié)果的科學(xué)性和權(quán)威性,采用教師和學(xué)生相結(jié)合,多人打分取平均值。具體做法是,按照表1的指標(biāo)設(shè)計(jì)調(diào)查表,對(duì)柳州職業(yè)技術(shù)學(xué)院財(cái)經(jīng)系2011級(jí)財(cái)會(huì)專業(yè)1班共43人進(jìn)行評(píng)價(jià)測(cè)試。組織該班級(jí)的任課教師共5人對(duì)全班43名同學(xué)進(jìn)行打分,學(xué)生則分為4組,每組11人,其中一組10人,每組同學(xué)互相打分。最終形成的數(shù)據(jù)如表3所示。
為了消除數(shù)據(jù)間的差異,使SVM模型具有更快的處理速度和處理精度,對(duì)采集到的所有樣本進(jìn)行歸一化處理,歸一化處理公式為:
(8)
(二)評(píng)價(jià)模型的具體應(yīng)用。本實(shí)驗(yàn)在P4 2.8GCPU、2G內(nèi)存的硬件條件下,在WinXp系統(tǒng)中采用matlab7進(jìn)行編程實(shí)現(xiàn)。取前35筆數(shù)據(jù)作為訓(xùn)練樣本,后8筆數(shù)據(jù)作為測(cè)試樣本。實(shí)驗(yàn)中用到的部分參數(shù)為:種群規(guī)模N=200,交叉率Pc=0.75,變異率Pm=0.05 。通過(guò)對(duì)SVM參數(shù)的優(yōu)化處理,最終建立SVM的綜合素質(zhì)評(píng)價(jià)模型。同時(shí)為了驗(yàn)證經(jīng)過(guò)GA優(yōu)化的SVM模型和未優(yōu)化的SVM模型性能上的差別,后8筆測(cè)試數(shù)據(jù)分別采用GA-SVM模型和SVM模型進(jìn)行測(cè)試,結(jié)果如表4、表5所示。
從表4、表5中可以看出,SVM模型和GA-SVM模型預(yù)測(cè)誤差都控制在2%以內(nèi),說(shuō)明它們?cè)谶M(jìn)行非線性數(shù)據(jù)預(yù)測(cè)中,預(yù)測(cè)精度很高。通過(guò)表4和表5的比較不難看出,通過(guò)GA優(yōu)化后的SVM模型比未優(yōu)化的SVM模型具有更好的泛化能力和預(yù)測(cè)精度。這是因?yàn)镚A-SVM模型在GA算法的優(yōu)化下,拓展了解的空間,在GA算法強(qiáng)大的全局搜索能力下得到了更優(yōu)化的參數(shù)C和 ,從而獲得更好的學(xué)習(xí)精度,提高了未知樣本的預(yù)測(cè)率。
綜上所述,學(xué)生綜合素質(zhì)是反映學(xué)校辦學(xué)質(zhì)量的一項(xiàng)重要指標(biāo),同時(shí)也是企業(yè)用人的一項(xiàng)重要指標(biāo)。因而,對(duì)學(xué)生綜合素質(zhì)評(píng)價(jià)一直是當(dāng)前高職院校改革和探索的問(wèn)題。本文利用GA算法對(duì)SVM模型的參數(shù)進(jìn)行了優(yōu)化,并成功地應(yīng)用于學(xué)生綜合素質(zhì)的評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明,優(yōu)化后的SVM模型泛化能力更好、預(yù)測(cè)的準(zhǔn)確率更高,具有一定的應(yīng)用前景。
【參考文獻(xiàn)】
[1]劉偉,孫林.基于支持向量機(jī)的課堂教學(xué)質(zhì)量評(píng)價(jià)[J].合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2010(7)
[2]周燕軍.基于遺傳算法的學(xué)生綜合素質(zhì)評(píng)價(jià)[J].長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4)
[3]李波.支持向量機(jī)在高校教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用研究[J].計(jì)算機(jī)仿真,2011(10)
[4]陳良堤,徐高歡.基于多分類SVM的教學(xué)質(zhì)量評(píng)價(jià)模型研究[J].黑龍江教育,2007( 11)
[5]姚宏,葉寧.高職院校學(xué)生綜合素質(zhì)評(píng)價(jià)指標(biāo)體系研究[J]. 四川教育學(xué)院學(xué)報(bào),2011(12)
[6]朱海林,宋承祥,劉弘,等.基于支持向量機(jī)的教學(xué)質(zhì)量評(píng)價(jià)研究[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4)
【基金項(xiàng)目】廣西教育科學(xué)“十二五”規(guī)劃課題 (2011C0187)
【作者簡(jiǎn)介】王 靜(1980- ),女,江蘇南京人,柳州職業(yè)技術(shù)學(xué)院財(cái)經(jīng)與物流系講師,研究方向:思政教育、職業(yè)技術(shù)教育。
(責(zé)編 盧 雯)
當(dāng)獲得子分類器后,就可以使用子分類器對(duì)樣本數(shù)據(jù)進(jìn)行測(cè)試。在測(cè)試的過(guò)程中,分別對(duì)m(m-1)/2個(gè)子分類器進(jìn)行測(cè)試,并統(tǒng)計(jì)各個(gè)樣本類別的分?jǐn)?shù),測(cè)試數(shù)據(jù)的類別即為測(cè)試過(guò)程中得分最高者所對(duì)應(yīng)的類別。
二、高職學(xué)生綜合素質(zhì)評(píng)價(jià)體系構(gòu)建
影響高職學(xué)生綜合素質(zhì)的因素很多,各因素之間的關(guān)系相互聯(lián)系又互有影響,因此整個(gè)評(píng)價(jià)過(guò)程是一項(xiàng)復(fù)雜的系統(tǒng)工程。為建立規(guī)范、合理、科學(xué)的評(píng)價(jià)指標(biāo)體系,必須堅(jiān)持評(píng)價(jià)的多維化、評(píng)價(jià)主體的多元化、評(píng)價(jià)方法的多樣性以及評(píng)價(jià)功能的多元化原則。當(dāng)前,各高職院校對(duì)學(xué)生綜合素質(zhì)的評(píng)價(jià)也進(jìn)行了多方面的探索,取得了很多經(jīng)驗(yàn)。通過(guò)廣泛查閱資料,在借鑒姚宏、葉寧《高職院校學(xué)生綜合素質(zhì)評(píng)價(jià)指標(biāo)體系研究》一文的基礎(chǔ)上,本文采用的學(xué)生綜合素質(zhì)評(píng)價(jià)體系如表1所示。
通過(guò)表1可以看到,影響學(xué)生綜合素質(zhì)的指標(biāo)很多。在以往的評(píng)測(cè)中,大多采用發(fā)放調(diào)查問(wèn)卷的形式收集相關(guān)數(shù)據(jù),最后由輔導(dǎo)員對(duì)每個(gè)學(xué)生的信息進(jìn)行統(tǒng)計(jì),這種方法所得數(shù)據(jù)可用性差,在這里我們對(duì)所有的指標(biāo)采取量化的方式進(jìn)行數(shù)據(jù)的收集。首先對(duì)所有一級(jí)指標(biāo)用A、B、C、D和E進(jìn)行區(qū)分,每個(gè)二級(jí)指標(biāo)都有相應(yīng)的編號(hào),實(shí)際使用的時(shí)候是一級(jí)指標(biāo)的字母加上對(duì)應(yīng)二級(jí)指標(biāo)的編號(hào)。如:A1、A2等。每個(gè)二級(jí)指標(biāo)的分值都是滿分10分,每個(gè)一級(jí)指標(biāo)都占總分值的20%,由此可知每一名學(xué)生的評(píng)價(jià)分值可以用如下公式來(lái)進(jìn)行計(jì)算:綜合素質(zhì)評(píng)價(jià)總分=A×20%+B×20%+C×20%+D×20%+E×20%。每一項(xiàng)一級(jí)指標(biāo)的分值都由它對(duì)應(yīng)的二級(jí)指標(biāo)來(lái)確定,比如C指標(biāo)對(duì)應(yīng)有6項(xiàng)二級(jí)指標(biāo),則C=(C1+C2+C3+C4+C5+C6)×100/60。評(píng)價(jià)的最終結(jié)果用Y來(lái)表示,總共分為優(yōu)秀、良好以及差三個(gè)等級(jí),為了便于SVM模型處理,這三個(gè)等級(jí)的分值分別是1、0和-1。參見(jiàn)表2。
三、具體應(yīng)用
(一)數(shù)據(jù)采集??紤]到每個(gè)人主觀性會(huì)造成在打分時(shí)存在不同程度的個(gè)人傾向,為了保證評(píng)價(jià)結(jié)果的科學(xué)性和權(quán)威性,采用教師和學(xué)生相結(jié)合,多人打分取平均值。具體做法是,按照表1的指標(biāo)設(shè)計(jì)調(diào)查表,對(duì)柳州職業(yè)技術(shù)學(xué)院財(cái)經(jīng)系2011級(jí)財(cái)會(huì)專業(yè)1班共43人進(jìn)行評(píng)價(jià)測(cè)試。組織該班級(jí)的任課教師共5人對(duì)全班43名同學(xué)進(jìn)行打分,學(xué)生則分為4組,每組11人,其中一組10人,每組同學(xué)互相打分。最終形成的數(shù)據(jù)如表3所示。
為了消除數(shù)據(jù)間的差異,使SVM模型具有更快的處理速度和處理精度,對(duì)采集到的所有樣本進(jìn)行歸一化處理,歸一化處理公式為:
(8)
(二)評(píng)價(jià)模型的具體應(yīng)用。本實(shí)驗(yàn)在P4 2.8GCPU、2G內(nèi)存的硬件條件下,在WinXp系統(tǒng)中采用matlab7進(jìn)行編程實(shí)現(xiàn)。取前35筆數(shù)據(jù)作為訓(xùn)練樣本,后8筆數(shù)據(jù)作為測(cè)試樣本。實(shí)驗(yàn)中用到的部分參數(shù)為:種群規(guī)模N=200,交叉率Pc=0.75,變異率Pm=0.05 。通過(guò)對(duì)SVM參數(shù)的優(yōu)化處理,最終建立SVM的綜合素質(zhì)評(píng)價(jià)模型。同時(shí)為了驗(yàn)證經(jīng)過(guò)GA優(yōu)化的SVM模型和未優(yōu)化的SVM模型性能上的差別,后8筆測(cè)試數(shù)據(jù)分別采用GA-SVM模型和SVM模型進(jìn)行測(cè)試,結(jié)果如表4、表5所示。
從表4、表5中可以看出,SVM模型和GA-SVM模型預(yù)測(cè)誤差都控制在2%以內(nèi),說(shuō)明它們?cè)谶M(jìn)行非線性數(shù)據(jù)預(yù)測(cè)中,預(yù)測(cè)精度很高。通過(guò)表4和表5的比較不難看出,通過(guò)GA優(yōu)化后的SVM模型比未優(yōu)化的SVM模型具有更好的泛化能力和預(yù)測(cè)精度。這是因?yàn)镚A-SVM模型在GA算法的優(yōu)化下,拓展了解的空間,在GA算法強(qiáng)大的全局搜索能力下得到了更優(yōu)化的參數(shù)C和 ,從而獲得更好的學(xué)習(xí)精度,提高了未知樣本的預(yù)測(cè)率。
綜上所述,學(xué)生綜合素質(zhì)是反映學(xué)校辦學(xué)質(zhì)量的一項(xiàng)重要指標(biāo),同時(shí)也是企業(yè)用人的一項(xiàng)重要指標(biāo)。因而,對(duì)學(xué)生綜合素質(zhì)評(píng)價(jià)一直是當(dāng)前高職院校改革和探索的問(wèn)題。本文利用GA算法對(duì)SVM模型的參數(shù)進(jìn)行了優(yōu)化,并成功地應(yīng)用于學(xué)生綜合素質(zhì)的評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明,優(yōu)化后的SVM模型泛化能力更好、預(yù)測(cè)的準(zhǔn)確率更高,具有一定的應(yīng)用前景。
【參考文獻(xiàn)】
[1]劉偉,孫林.基于支持向量機(jī)的課堂教學(xué)質(zhì)量評(píng)價(jià)[J].合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2010(7)
[2]周燕軍.基于遺傳算法的學(xué)生綜合素質(zhì)評(píng)價(jià)[J].長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4)
[3]李波.支持向量機(jī)在高校教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用研究[J].計(jì)算機(jī)仿真,2011(10)
[4]陳良堤,徐高歡.基于多分類SVM的教學(xué)質(zhì)量評(píng)價(jià)模型研究[J].黑龍江教育,2007( 11)
[5]姚宏,葉寧.高職院校學(xué)生綜合素質(zhì)評(píng)價(jià)指標(biāo)體系研究[J]. 四川教育學(xué)院學(xué)報(bào),2011(12)
[6]朱海林,宋承祥,劉弘,等.基于支持向量機(jī)的教學(xué)質(zhì)量評(píng)價(jià)研究[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4)
【基金項(xiàng)目】廣西教育科學(xué)“十二五”規(guī)劃課題 (2011C0187)
【作者簡(jiǎn)介】王 靜(1980- ),女,江蘇南京人,柳州職業(yè)技術(shù)學(xué)院財(cái)經(jīng)與物流系講師,研究方向:思政教育、職業(yè)技術(shù)教育。
(責(zé)編 盧 雯)