黃川騰 蒲爽 唐迪 李青
摘? ?要:人才培養(yǎng)方案是專業(yè)教育的總體設計與規(guī)劃,對保證人才培養(yǎng)質(zhì)量具有決定性作用。人才培養(yǎng)方案包含的培養(yǎng)目標、畢業(yè)要求、課程設置、教學大綱和評價體系有嚴密的邏輯關系,課程設置和課程結(jié)構(gòu)是人才培養(yǎng)方案落地的具體抓手。土木工程課程中的專業(yè)教育類課程包括數(shù)學課程群、力學課程群和設計課程群,文章選取各課程群中的代表性課程共計7門,以三個年級249名學生學習成績?yōu)檠芯繉ο螅褂藐P聯(lián)規(guī)則挖掘算法Apriori,深入探討數(shù)據(jù)挖掘技術(shù)的實現(xiàn)過程,明確課程間關聯(lián)關系的強弱。分析結(jié)果可為課程體系設置與結(jié)構(gòu)調(diào)整、課程體系重難點課程精準控制、教學方法改革和學情監(jiān)控與預測提供重要參考。
關鍵詞:關聯(lián)規(guī)則; Apriori;土木工程;課程;相關性分析
中圖分類號:G642 文獻標志碼:A 文章編號:1673-8454(2020)23-0055-05
一、引言
根據(jù)高校定位,培養(yǎng)符合行業(yè)和社會需求的人才,根本在于制定理念和思路清晰的專業(yè)人才培養(yǎng)方案。完整的人才培養(yǎng)方案應包括培養(yǎng)目標、畢業(yè)要求、課程體系、教學大綱和評價體系等五方面的內(nèi)容,從宏觀到微觀具有嚴密的邏輯關系,其中課程體系承上啟下,既是對培養(yǎng)目標和畢業(yè)要求的具體支撐又是對教學大綱和評價體系的明確引導??v觀各高校土木工程專業(yè)課程體系,均包含通識與素質(zhì)類、公共基礎類及工程素質(zhì)類課程?;诠W學科特點,公共基礎類中的數(shù)學課程群課程、工程素質(zhì)類中的力學課程群課程和設計課程群課程,在土木工程專業(yè)課程體系中都是本科各階段的核心課程,這些課程也是支撐土木工程專業(yè)素養(yǎng)的骨架,對學生專業(yè)素養(yǎng)培養(yǎng)目標的達成具有決定性意義。
本文從數(shù)學課程群中選取高數(shù)(上)、高數(shù)(下)、線性代數(shù),從力學課程群中選取理論力學、材料力學、結(jié)構(gòu)力學,從設計課程群中選取混凝土結(jié)構(gòu)設計原理共7門課作為研究對象。課程選取原則有三:其一,具有代表性。選取的課程均是課程群核心課程,同時也是碩士研究生入學考試課程,或者是考研復試的核心課程。其二,覆蓋面廣。所選課程開課時間有先后關系且涵蓋大一到大三,對課程的考察能夠反映學生在大學期間的學習行為習慣,分析結(jié)果能夠用于指導人才培養(yǎng)方案修訂及學情監(jiān)控與預測。其三,課程具備相關性分析的基礎前提,相關性分析結(jié)論具備指導意義。土木工程專業(yè)中,數(shù)學課程是力學課程的基礎,力學課程直接指導設計課程,各課程群課程內(nèi)容前后均有關聯(lián)。
本文選取土木工程專業(yè)7門核心課程,以三個年級249名學生學習成績?yōu)檠芯繉ο?,使用關聯(lián)規(guī)則挖掘算法Apriori,深入探討數(shù)據(jù)挖掘技術(shù)的實現(xiàn)過程,發(fā)掘課程間的強弱關聯(lián)關系。分析結(jié)果可為課程體系設置與結(jié)構(gòu)調(diào)整、課程體系重難點課程精準控制、教學方法改革和學生學情監(jiān)控與預測提供參考。
二、研究方法
課程相關性分析用于描述課程之間的關聯(lián)程度。目前課程相關性分析研究所采用的方法多以數(shù)據(jù)挖掘技術(shù)為基礎,主要有相關分析法、典型相關分析法和關聯(lián)規(guī)則分析法。[1]其中尤以Apriori算法為代表的關聯(lián)規(guī)則分析法應用最廣,關聯(lián)規(guī)則挖掘就是在交易數(shù)據(jù)、關系數(shù)據(jù)或其他信息載體中查找存在于項目集合或?qū)ο蠹现g的頻繁模式、關聯(lián)、相關性或因果結(jié)構(gòu)。[2]關聯(lián)挖掘是一種簡單、實用的分析技術(shù),是發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關聯(lián)性或相關性,從而描述一個事物中某些屬性同時出現(xiàn)的規(guī)律和模式。
1.基于關聯(lián)規(guī)則挖掘的Apriori算法
關聯(lián)規(guī)則挖掘的數(shù)據(jù)集記為D(一般為事務數(shù)據(jù)庫),D={t1,t2,…,tk,…,tn},tk={i1,i2,…,im,…,ip},tk(k=1,2,…,n)稱為事務(Transaction),im(m=1,2,…,p)稱為項(Item)。設I={i1,i2,…,im}是D中全體項組成的集合,I的任何子集X稱為D中的項集(Itemset),若X中有k項,則稱集合X為k項集(k-Itemset)。數(shù)據(jù)集D中包含項集X的事務數(shù)目稱為項集X的支持數(shù),記為?滓x。項集X的支持度記為support(X)。
support(X)=■×100%(1)
式(1)中|D|是數(shù)據(jù)集D的事務數(shù)。
若X、Y為項集,且X∩Y非空,X→Y稱為關聯(lián)規(guī)則,X、Y分別稱為關聯(lián)規(guī)則X→Y的前提和結(jié)論。關聯(lián)規(guī)則X→Y的支持度,記作support(X→Y)。
support(X→Y)=support(X∪Y)(2)
關聯(lián)規(guī)則X→Y的置信度記作confidence(X→Y)。
confidence(X→Y)=■×100%(3)
支持度描述了X和Y這兩個項目集合的并集在所有的事務記錄中出現(xiàn)的概率有多大。支持度和置信度可以比較直接地形容關聯(lián)規(guī)則的性質(zhì)。置信度是對關聯(lián)規(guī)則正確率的衡量,支持度是對關聯(lián)規(guī)則重要性的衡量。支持度說明了這條規(guī)則在所有事務中有多大的代表性,顯然支持度越大,關聯(lián)規(guī)則越重要。有些關聯(lián)規(guī)則的置信度雖然很高,但支持度卻很低,說明該關聯(lián)規(guī)則實用的機會很小,因此不重要。[2]鑒于事務數(shù)有限,多項集關系支持度過低,加之課程間二項集關系最具邏輯關系及指導意義,本文僅考察課程二項集相關關系。
2.數(shù)據(jù)處理
本文將基于學生各科成績進行課程相關性分析,濾除缺考、緩考、免考、違紀等情況,將2014-2016級249名學生的7門課程成績記為數(shù)據(jù)集D,共包含249條事務,每條事務tk為7項集。
表1展示了各學者利用Apriori算法進行相關性分析前對學生成績進行離散化處理的方法。上述學者均選用了課程綜合成績作為離散對象,且均采用按分數(shù)分段離散的方法。
由于大學課程綜合成績是由形成性考核(作業(yè)、考勤、課堂表現(xiàn)等)與終結(jié)性考核(期末考試)按一定比例共同組成的。江輝等[9]分析發(fā)現(xiàn)大多數(shù)課程的終結(jié)性考核成績與形成性考核成績不存在顯著線性相關關系。換句話講,因為形成性考核的加成,綜合成績并不能直接反映學生對課程知識的掌握程度。容易理解,一方面,形成性考核針對過程管理,重在考察學生對學習的態(tài)度和投入度,而學生為拉升綜合成績可能會通過其他手段(作業(yè)網(wǎng)絡搜索、抄襲,請人簽到等)提高平時成績分值;另一方面,任課教師為了綜合成績分布更合理,可能會人為調(diào)整各層次學生形成性考核成績。尤其是對于學困生,形成性考核成績對綜合成績的提升會非常顯著。為了直觀衡量學生知識能力水平,本文選用終結(jié)性考核(期末考試)卷面成績作為離散考察對象。
此外,由于不同科目、不同年級、不同任課教師在試卷出題難度、批閱習慣上均有很大不同,往往造成各課程成績均值和方差差異巨大,甚至某些課程成績不符合正態(tài)分布。因此,不能單純以“分數(shù)論高低、分優(yōu)劣”。針對同一科目,本文對同一班級全體學生終結(jié)性考核(期末考試)卷面成績?nèi)∷姆治粩?shù),排序后前25%為優(yōu)秀、中上25%為良、中下25%為中、末尾25%為差。分別用1、2、3、4表示。
最后,為方便描述,將高數(shù)(上)、高數(shù)(下)、線性代數(shù)、理論力學、材料力學、結(jié)構(gòu)力學和混凝土結(jié)構(gòu)設計原理7門課分別以字母A、B、C、D、E、F、G表示。例如,某學生材料力學成績排在全班前25%,則該生成績經(jīng)過數(shù)據(jù)處理后表示為E1。
三、挖掘結(jié)果
任意兩門課I、J,課程I開課早于課程J,如圖1(a)所示,兩門課的學生成績先后關系一共有16種,例如,I2→J4表示在課程I中成績?yōu)榱肌⒃谡n程J中成績?yōu)椴?。圖1(b)所示關系(In→Jn),表示課程間成績的延續(xù)性或者慣性,意味著在前后兩門課中學生取得相同等次的成績。圖1(c)所示關系(I1→J4或I4→J1),表示課程間成績的反轉(zhuǎn)性,意味著在前后兩門課中學生取得完全相反等次的成績。理論上說,兩門課聯(lián)系越緊密,知識點延續(xù)性越強,課程相關性越高,同一名學生考試成績的慣性越強、反轉(zhuǎn)的可能性越低,反之亦然。為了衡量學生課程成績的慣性和反轉(zhuǎn)性,定義慣性指數(shù)和反轉(zhuǎn)指數(shù)如下。
Kin=■support(I1→Ji)(4)
Kre=support(I1→J4)+support(I4→J1)(5)
表2完整地展示了本文所選7門核心課程之間的關聯(lián)分析結(jié)果。圖2展示了7門核心課程之間的反轉(zhuǎn)指數(shù)和慣性指數(shù)。
四、結(jié)果分析
根據(jù)本校人才培養(yǎng)方案,本文所選土木工程專業(yè)7門核心課程,具有一致的先后關系,涵蓋大一至大三。從表2中的關聯(lián)分析結(jié)果和圖2中的反轉(zhuǎn)指數(shù)及慣性指數(shù)可以發(fā)現(xiàn)以下一些現(xiàn)象和規(guī)律。
(1)核心課程之間存在較為顯著的成績等級固化現(xiàn)象。成績等級固化普遍存在于本文所選7門核心課程之間,證明了土木工程專業(yè)數(shù)學課程群、力學課程群以及設計課程群課程緊密的關聯(lián)性。固化現(xiàn)象尤其存在于優(yōu)生和差生群體,各門課之間“優(yōu)”和“差”兩個等次置信度幾乎都在40%以上,其中confmax=conf(F4→G4)=65.1%, confmin=conf(A4→F4)=39.4%。盡管“良”和“中”兩個等次的支持度和置信度均小于“優(yōu)”和“差”,但若將“良”和“中”合并,將“優(yōu)良中差”四級評判變?yōu)椤皟?yōu)中差”三級評判,一個有趣的現(xiàn)象是,三級評判的“中”等次,以“高數(shù)(上)→高數(shù)(下)”為例,support(A中→B中)=31.3%,conf(A中→B中)=63.4%,說明成績中等的學生在“良”和“中”這兩個層級范圍內(nèi)流動性非常大,反映出這部分學生的學習效果對課程特點、教學方法甚至教師個人魅力的敏感度最高。
(2)課程群內(nèi)課程相關性顯著高于課程群間課程,力學課程與設計課程相關性顯著高于數(shù)學課程與力學課程相關性。如表2所示,盡管總體上7門核心課程成績等級固化現(xiàn)象很明顯,其一體現(xiàn)在成績等級慣性的置信度較高,其二也表現(xiàn)在成績等級反轉(zhuǎn)(1→4,4→1)的支持度和置信度都非常低。但固化趨勢在課程群之間課程與課程群內(nèi)課程仍存在不同。圖2完整展示了7門核心課程之間學生成績的反轉(zhuǎn)指數(shù)Kre及慣性指數(shù)Kin,圖3展示了反轉(zhuǎn)指數(shù)Kre及慣性指數(shù)Kin序列圖。反轉(zhuǎn)指數(shù)越低、慣性指數(shù)越高,可以認為課程關聯(lián)性越強。如圖所示,課程群內(nèi)課程、力學課程與設計課程表現(xiàn)出顯著的強關聯(lián)特征。其中一個非常有趣的現(xiàn)象是,結(jié)構(gòu)力學與設計課程(F→G)的關聯(lián)性顯著高于其他課程,同時,數(shù)學課程對結(jié)構(gòu)力學的影響顯著低于對理論力學和材料力學的影響,這充分反映出結(jié)構(gòu)力學課程獨特的特征,這種現(xiàn)象可以解釋為結(jié)構(gòu)力學對桿系結(jié)構(gòu)內(nèi)力、變形的求解對設計課程的重要性,但求解過程并不需要深入的數(shù)學知識(實質(zhì)上,靜定結(jié)構(gòu)力學與超靜定結(jié)構(gòu)力學部分運算難度確實只限于四則運算)。
(3)數(shù)學課程群和力學課程群的抓手分別是高數(shù)(上)和材料力學。從表2中可知,數(shù)學課程群中,“高數(shù)(上)→高數(shù)(下)”以及“高數(shù)(上)→線性代數(shù)”在各等次成績(In→Jn)的置信度中較“高數(shù)(下)→線性代數(shù)”占有優(yōu)勢;類似地,在力學課程群中,“材料力學→結(jié)構(gòu)力學”在各等次成績(In→Jn)的置信度中較“理論力學→材料力學”和“理論力學→結(jié)構(gòu)力學”占有優(yōu)勢。此外,從圖3中反轉(zhuǎn)指數(shù)和慣性指數(shù)可知,“高數(shù)(上)→高數(shù)(下)”以及“材料力學→結(jié)構(gòu)力學”的關聯(lián)性在數(shù)學課程群以及力學課程群中是最高的。最后,從課程教學內(nèi)容上,高數(shù)(上)著力構(gòu)建一元函數(shù)微積分學,高數(shù)(下)進一步把一元函數(shù)微積分學推廣到多元函數(shù)微積分學上。[10-12]材料力學以桿件為對象結(jié)合截面應力分布重點講解了計算簡圖、彎矩、剪力、軸力、變形等知識點,結(jié)構(gòu)力學以桿系結(jié)構(gòu)為對象進一步拓展和強化了結(jié)構(gòu)內(nèi)力(彎矩、剪力、軸力)和變形的計算方法。因此對于高數(shù)(上)與高數(shù)(下)、材料力學與結(jié)構(gòu)力學,后者知識體系是前者的傳承和推廣。
五、結(jié)語
本文在土木工程專業(yè)數(shù)學課程群、力學課程群和設計課程群中選擇了7門代表性課程,以三個年級249名學生學習成績?yōu)檠芯繉ο螅褂藐P聯(lián)規(guī)則挖掘算法Apriori,深入探討數(shù)據(jù)挖掘技術(shù)的實現(xiàn)過程,提出了課程成績慣性及反轉(zhuǎn)的概念,構(gòu)建了慣性指數(shù)和反轉(zhuǎn)指數(shù),結(jié)合課程間的支持度和置信度,發(fā)掘了課程間的關聯(lián)關系。得到了核心課程之間存在較為顯著的成績等級固化現(xiàn)象、課程群內(nèi)課程相關性顯著高于課程群間課程、力學課程與設計課程相關性顯著高于數(shù)學課程與力學課程相關性、數(shù)學課程群和力學課程群的抓手分別是高數(shù)(上)和材料力學等結(jié)論。分析結(jié)果可為科學進行課程體系設置與結(jié)構(gòu)調(diào)整、準確把控課程體系中的核心課程、有的放矢地進行教學方法改革、學情監(jiān)控與預測提供重要參考,也是筆者利用大數(shù)據(jù)算法進行教學研究的積極探索。
參考文獻:
[1]宋小敏,張國防,邢淑蘭,汪鎖田.基于數(shù)據(jù)挖掘的課程相關性分析方法[J].山西財經(jīng)大學學報,2012(S3):240,257.
[2]朱明編.數(shù)據(jù)挖掘?qū)д揫M].合肥:中國科學技術(shù)大學出版社,2011:102.
[3]趙峰,劉博妍.基于改進Apriori算法的大學生成績關聯(lián)分析[J].齊齊哈爾大學學報(自然科學版),2018(1):11-15.
[4]崔學文.關聯(lián)規(guī)則挖掘算法Apriori在學生成績分析中的應用[J].河北北方學院學報(自然科學版),2011(1):44-47.
[5]王華,劉萍.改進的關聯(lián)規(guī)則算法在學生成績預警中的應用[J].計算機工程與設計, 2015(3):679-682,752.
[6]吳小東,曾玉珠.基于Apriori算法的高校學生成績數(shù)據(jù)挖掘[J].廊坊師范學院學報(自然科學版),2019(1):31-36.
[7]吳飛青,吳成玉,方偉,孫炯,王媛媛.基于數(shù)據(jù)挖掘的成績相關性實證分析[J].電氣電子教學學報,2019(4):1-4.
[8]姚雙良.數(shù)據(jù)挖掘在高校課程相關性中的應用研究[J].科技通報,2012(12):232-234.
[9]江輝,周凌,葉雪飛.形成性與終結(jié)性考核成績相關關系分析[J].中國遠程教育, 2011(8):58-62.
[10]同濟大學數(shù)學系編.高等數(shù)學(第七版)(上、下冊)[M].北京:高等教育出版社,2014.
[11]孫訓方,方孝淑,關來泰編.材料力學1(第五版)[M].北京:高等教育出版社,2009.
[12]蕭允徽,張來儀主編.結(jié)構(gòu)力學(I)(第3版)[M].北京:機械工業(yè)出版社,2018.
(編輯:王天鵬)