盧錚松 李珂珂
【摘要】在研究生網(wǎng)上課程評價系統(tǒng)收集的大量數(shù)據(jù)基礎(chǔ)上,構(gòu)建了一種基于人工神經(jīng)網(wǎng)絡(luò)的多指標(biāo)課程評價模型,并將網(wǎng)上調(diào)查的結(jié)果以連接權(quán)的方式賦予該評價模型進(jìn)行訓(xùn)練。通過實際評價數(shù)據(jù)的驗證,該模型能夠準(zhǔn)確地按照實際評價的過程進(jìn)行工作。
【關(guān)鍵詞】評價模型;人工神經(jīng)網(wǎng)絡(luò);課程評價
【中圖分類號】G420 【文獻(xiàn)標(biāo)識碼】A 【論文編號】1009—8097(2009)10—0053—05
一 引言
目前,我國高等教育面臨著培養(yǎng)大批創(chuàng)新人才和為國家自主創(chuàng)新做出更大貢獻(xiàn)兩大任務(wù),對研究生教育已經(jīng)從注重培養(yǎng)數(shù)量轉(zhuǎn)變?yōu)樽⒅嘏囵B(yǎng)質(zhì)量。研究生的課程教學(xué)過程,是研究生培養(yǎng)質(zhì)量控制中一個重要環(huán)節(jié),因此對于研究生課程教學(xué)質(zhì)量的評估,也成為提高培養(yǎng)質(zhì)量的重要課題之一。
然而,對研究生課程教學(xué)質(zhì)量進(jìn)行評價,是一項復(fù)雜的系統(tǒng)工程。在課程評價中涉及的因素較多,在評價中通常采用的問卷調(diào)查,由于指標(biāo)和權(quán)重的確定帶有很大的主觀性,調(diào)查對象的反饋也存在部分無效信息或噪聲數(shù)據(jù),因此并不能完全客觀地反映課程教學(xué)水平的高低。
隨著研究生培養(yǎng)工作的不斷發(fā)展,在課程調(diào)查方面已經(jīng)積累了大量原始數(shù)據(jù)。通過數(shù)據(jù)挖掘技術(shù),利用已經(jīng)存在的大量研究生培養(yǎng)和課程調(diào)查數(shù)據(jù),將其轉(zhuǎn)換成有用的信息和知識,建立一個完善的研究生課程評價體系和課程評價模型,能夠為課程評價提供高效客觀的結(jié)論,并以此為參考,不斷提高研究生的課程教學(xué)質(zhì)量和培養(yǎng)質(zhì)量。
本文試圖在構(gòu)建研究生課程評價體系的基礎(chǔ)上,基于數(shù)據(jù)挖掘技術(shù),通過數(shù)據(jù)分析和機器學(xué)習(xí),提出一種基于人工神經(jīng)網(wǎng)絡(luò)的多指標(biāo)綜合評價模型。該評價模型不僅可以模擬調(diào)查者對課程進(jìn)行評價,而且還具有很強的容錯能力,非常適合大規(guī)模的評價系統(tǒng)。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,簡稱ANN)是近年發(fā)展起來的一門處理復(fù)雜系統(tǒng)的理論,其特有的信息處理能力和獨到的解算能力在很多方面都呈現(xiàn)出廣闊的應(yīng)用前景。ANN主要解決數(shù)據(jù)挖掘的分類和回歸任務(wù),它基于并行處理的機制,從結(jié)構(gòu)上對人類的思維過程進(jìn)行模擬,從而能實現(xiàn)人類思維的某些功能,如學(xué)習(xí)、邏輯推想、聯(lián)想記憶和自組織等[1]。相對于判定樹算法,ANN可以找出輸入屬性和可預(yù)測屬性之間平滑而連續(xù)的非線性關(guān)系。ANN已經(jīng)在信號處理、模式識別、目標(biāo)跟蹤、機器人控制、專家系統(tǒng)、組合優(yōu)化、網(wǎng)絡(luò)管理等眾多領(lǐng)域的應(yīng)用中獲得了引人注目的成果。特別是在解決非線性系統(tǒng)的問題的方面,具有獨特的優(yōu)勢。
二 研究生課程評價體系構(gòu)建
通過對某重點高校2007-2009年網(wǎng)上課程評價設(shè)計的調(diào)查問卷進(jìn)行總結(jié),以及對網(wǎng)上課程評價系統(tǒng)獲取的原始數(shù)據(jù)整理和匯總,并參考部分典型的課程教育質(zhì)量評價體系,可以從課程內(nèi)容、教學(xué)過程、教師情況等三個方面來構(gòu)建課程評價體系。具體的評價指標(biāo)詳見表1。
三 基于神經(jīng)網(wǎng)絡(luò)的研究生課程評價模型
1 BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建
目前人工神經(jīng)網(wǎng)絡(luò)的算法模型有很多種,其中BP神經(jīng)網(wǎng)絡(luò)是被廣泛應(yīng)用的一種重要網(wǎng)絡(luò)形式,主要用來進(jìn)行非線性系統(tǒng)的輸出輸入映射關(guān)系建模。其主要結(jié)構(gòu)是由一個輸入層,一個或多個隱含層,一個輸出層組成,各層由若干個神經(jīng)元(節(jié)點)構(gòu)成,每一個節(jié)點的輸出值由輸入值、作用函數(shù)和閾值決定[2]。
本文采用的是如圖1所示的隱含層為一層的三層BP神經(jīng)網(wǎng)絡(luò)模型。
(6)利用輸出層各單元的一般化誤差 與隱含層各單元的輸出 來修正連接權(quán) 和閾值 。
(7)利用隱含層各單元的一般化誤差 ,輸入層各單元的輸入 來修正連接權(quán) 和閾值 。
(8)隨機選取下一個學(xué)習(xí)樣本向量提供給網(wǎng)絡(luò),返回到步驟(2),直到m個訓(xùn)練樣本訓(xùn)練完畢。
(9)重新從m個學(xué)習(xí)樣本中隨機選取一組輸入和目標(biāo)樣本,返回步驟(2),直到網(wǎng)絡(luò)全局誤差E小于預(yù)先設(shè)定的一個極小值,即網(wǎng)絡(luò)收斂。如果學(xué)習(xí)次數(shù)大于預(yù)先設(shè)定的值,則網(wǎng)絡(luò)無法收斂。
(10)學(xué)習(xí)結(jié)束。
3 研究生課程評價模型中的BP神經(jīng)網(wǎng)絡(luò)設(shè)計
在研究生課程評價模型中的BP神經(jīng)網(wǎng)絡(luò)中,共有21個指標(biāo)作為輸入的神經(jīng)元;輸出層只有一個神經(jīng)元,即研究生培養(yǎng)質(zhì)量評價值,它是一個取值范圍是[0,1]的代數(shù)值。
隱含層的神經(jīng)元數(shù)目選擇是一個十分復(fù)雜的問題,往往需要根據(jù)設(shè)計者的經(jīng)驗和多次試驗來確定,因而不存在一個理想的解析式來表示,更不能機械地按照Kolmogorov定理來簡單地確定隱含層的神經(jīng)元數(shù)目。隱含層的神經(jīng)元數(shù)目與問題的要求、輸入和輸出單元的數(shù)目都有著直接關(guān)系。若隱含層節(jié)點數(shù)太少,網(wǎng)絡(luò)可能根本不能訓(xùn)練或網(wǎng)絡(luò)性能很差;若隱含層節(jié)點數(shù)太多,雖然可使網(wǎng)絡(luò)的系統(tǒng)誤差減小,但一方面使網(wǎng)絡(luò)訓(xùn)練時間延長,另一方面,訓(xùn)練容易陷入局部極小點而得不到最優(yōu)點,也是訓(xùn)練時出現(xiàn)“過擬合”的內(nèi)在原因。
本文的具體應(yīng)用當(dāng)中,根據(jù)下面的經(jīng)驗公式來確定隱含層節(jié)點數(shù)[4],在編程實現(xiàn)時分別選取高、中、低三個不同數(shù)值來觀察網(wǎng)絡(luò)性能,當(dāng)網(wǎng)絡(luò)的評價誤差最小時,網(wǎng)絡(luò)中間層的神經(jīng)元數(shù)目就是最佳值。
(7)
其中S為隱含層節(jié)點數(shù),m為輸入層節(jié)點數(shù),n為輸出層節(jié)點數(shù),S取值范圍為5~15。
根據(jù)公式(7),我們首先將隱含層神經(jīng)元數(shù)目設(shè)為5,然后逐步增加到10和15。多次試驗之后,通過對這3種情況下的誤差進(jìn)行對比,發(fā)現(xiàn)隱含層神經(jīng)元個數(shù)為10時,該B-P神經(jīng)網(wǎng)絡(luò)的預(yù)測性能最好。因此,本應(yīng)用中,隱含層神經(jīng)元數(shù)目設(shè)為10。
由于應(yīng)用神經(jīng)網(wǎng)絡(luò)模型需要進(jìn)行數(shù)據(jù)的預(yù)處理,即對輸入進(jìn)行歸一化。同時課程評價調(diào)查中定性因素較多,對于每個指標(biāo)的選項采用計分法,共分為1.0、0.7、0.5、0.3、0.1五個等級[5]。通過網(wǎng)絡(luò)評價系統(tǒng),讓指定范圍的研究生(如指定班級、指定專業(yè)等)對調(diào)查問卷進(jìn)行評價,得出各個指標(biāo)的評分值。
表2中以U5課程內(nèi)容包含信息量、U9對創(chuàng)造性思維的鼓勵程度和U18講解清晰邏輯性強三個指標(biāo)為例,說明評價指標(biāo)歸一化處理參考對照表。
四 研究生課程評價模型的應(yīng)用驗證
該應(yīng)用的樣本來自于天津大學(xué)研究生課程評價與調(diào)查系統(tǒng)2007年到2009年的課程評價調(diào)查數(shù)據(jù)。在2007年到2009年間,對當(dāng)年的一年級研究生進(jìn)行了15門課程共6次評價調(diào)查活動,共計2992人次參與了問卷調(diào)查,生成有效調(diào)查記錄2972份。在評價系統(tǒng)中可進(jìn)行調(diào)查結(jié)果的統(tǒng)計工作,統(tǒng)計頁面如圖2所示。
本文對調(diào)查結(jié)果進(jìn)行了適當(dāng)整理。首先將不同時期不同內(nèi)容的調(diào)查問卷按照評價體系指標(biāo)進(jìn)行了歸納,剔除了個別只針對具體課程的問題。其次是對各項評價指標(biāo)進(jìn)行了歸一化處理。最后,對單門課程的調(diào)查問卷結(jié)果進(jìn)行統(tǒng)計,得到每門參與調(diào)查課程各項指標(biāo)的平均得分。最后統(tǒng)計結(jié)果如表3所示。
將各項指標(biāo)的平均得分輸入BP神經(jīng)網(wǎng)絡(luò)模型中,進(jìn)行學(xué)習(xí)訓(xùn)練。通過對訓(xùn)練結(jié)果進(jìn)行測試,誤差達(dá)到所要求的范圍之內(nèi)則說明學(xué)習(xí)成功。一旦學(xué)習(xí)成功后,神經(jīng)網(wǎng)絡(luò)就可再現(xiàn)調(diào)查對象們作為整體的經(jīng)驗、知識和直覺思維,從而降低評價過程中的人為因素影響,較好的保證了模型計算的客觀性。
該應(yīng)用具體步驟如下:
(1)按照圖1的網(wǎng)絡(luò)設(shè)計結(jié)構(gòu),隱含層神經(jīng)元的傳遞函數(shù)為S型正切函數(shù)。由于輸出已經(jīng)被歸一化到區(qū)間[0,1]中。因此,輸出層神經(jīng)元的傳遞函數(shù)可以設(shè)定為S型對數(shù)函數(shù)。下面代碼片段用來創(chuàng)建一個符合本文應(yīng)用的BP網(wǎng)絡(luò)(本文所有代碼均為MATLAB7.1代碼):
threshold = [0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1];
net = newff ( threshold, [10,1], {'tansig','logsig'}, 'traingdx');
其中,threshold設(shè)定了網(wǎng)絡(luò)輸入向量的取值范圍[0,1],網(wǎng)絡(luò)所用的學(xué)習(xí)函數(shù)為traingdx,該函數(shù)以梯度下降法進(jìn)行學(xué)習(xí),并且學(xué)習(xí)速率是自適應(yīng)的[6]。
(2)利用參與調(diào)查課程的前10個樣本數(shù)據(jù)進(jìn)行訓(xùn)練。訓(xùn)練參數(shù)的設(shè)定中,訓(xùn)練次數(shù)為1000次,精度設(shè)為0.0001,其它參數(shù)取默認(rèn)值。網(wǎng)絡(luò)訓(xùn)練代碼如下:
net.trainParam.epochs =1000;
net.trainParam.goal=0.0001;
net=init(net);
net=train(net,P,T);
變量P和T分別表示網(wǎng)絡(luò)的輸入向量和目標(biāo)向量。訓(xùn)練結(jié)果如圖3所示,經(jīng)過478次訓(xùn)練后,網(wǎng)絡(luò)的目標(biāo)誤差達(dá)到要求。
圖3:實際的MATLAB7.1訓(xùn)練結(jié)果收斂圖
(3)利用后5個樣本數(shù)據(jù)進(jìn)行測試。測試代碼如下:
Y = sim(net,P_test);
測試結(jié)果如表4:
由表4可見,預(yù)測誤差達(dá)到預(yù)期效果。因此,該模型可以滿足實際的應(yīng)用要求[7]。
五 結(jié)論
由于對研究生課程進(jìn)行評價的因素相對較為復(fù)雜,各項目權(quán)重的衡量屬于非線性問題,因此盡管有較多的調(diào)查結(jié)果,但對于某門課程效果的評價過程還是比較困難的。本文通過分析具體調(diào)查項目和結(jié)果的基礎(chǔ)上,提出一種基于BP神經(jīng)網(wǎng)絡(luò)的課程評價模型。該模型通過BP網(wǎng)絡(luò)對歷史課程調(diào)查數(shù)據(jù)的分析和學(xué)習(xí),能夠?qū)ρ芯可n程進(jìn)行評價分析。通過實例驗證,該模型的評價效果達(dá)到了預(yù)期的要求。
此外,該課程評價模型在實際應(yīng)用中尚存在部分問題,主要是評價結(jié)果統(tǒng)計時的歸一化無法對定性指標(biāo)進(jìn)行處理,如“課程主要提高了哪方面的能力”這樣的問題無法納入該體系中,需要在今后的研究中進(jìn)一步完善。
參考文獻(xiàn)
[1] 徐宗本,張講社,鄭亞林.計算智能中的仿生學(xué):理論與算法[M].北京:科學(xué)出版社,2003:138-139.
[2] CALLAN R. Artificial Intelligence [M].黃厚寬, 田盛豐, 等譯.北京: 電子工業(yè)出版社, 2004:252-254.
[3] Lili Rong.Building a three-layer BP neural network by fuzzy rules [A].Proc of the 9th International Conference on Neural Information Processing[C], 2002:452-456.
[4] 周開利.神經(jīng)網(wǎng)絡(luò)模型及其MATLAB仿真程序設(shè)計[M].北京:清華大學(xué)出版社,2005:70-80.
[5] 龐玉成.基于人工神經(jīng)網(wǎng)絡(luò)的項目集成管理績效評價研究[J].施工技術(shù),2008,37(2):22-24.
[6] 馮楠,李敏強,寇紀(jì)淞,等.基于人工神經(jīng)網(wǎng)絡(luò)的IT項目風(fēng)險評價模型[J].計算機工程與應(yīng)用,2006(6):24-26.
[7] Liang Haifeng.An adaptive BP-network approach to short term load forecasting [A].
Proc of the 2004 IEEE International Conference on Electric Utility Deregulation [C].2004:1004-1019.