邵俊明+楊勤麗
(1.電子科技大學 計算機科學與工程學院,四川 成都 611731;
2.電子科技大學 資源與環(huán)境學院,四川 成都 611731)
摘 要:針對當前數(shù)據(jù)挖掘課程教學中工程應用與理論創(chuàng)新的脫節(jié)問題,分析數(shù)據(jù)挖掘課程本身的特點和當前教學現(xiàn)狀,從提高本科生創(chuàng)新能力的人才培養(yǎng)模式角度出發(fā),提出在教學內(nèi)容的前沿性、教學方式的多元性及實驗教學的多梯度性改革,達到因材施教、工程應用與理論創(chuàng)新的有機統(tǒng)一,有效提高學生的學習興趣及學習效果。
關鍵詞:數(shù)據(jù)挖掘;理論創(chuàng)新;多元教學;多梯度實驗
0 引 言
在當前大數(shù)據(jù)時代背景下,如何從海量數(shù)據(jù)中挖掘并提煉出對人們真正有用的知識,是大數(shù)據(jù)研究的難點問題,同時也是目前數(shù)據(jù)挖掘面臨的關鍵和核心問題[1]。數(shù)據(jù)挖掘作為當前計算機專業(yè)的一個前沿課程,是一個綜合性的交叉課程,也是重要的學術研究方向,其內(nèi)容涉及多方面基礎理論學科和應用性強的技術領域,是提高計算機專業(yè)學生應用實踐能力和理論創(chuàng)新能力的載體課程,在整個計算機專業(yè)的學習中具有極為重要的地位。
1 教學現(xiàn)狀
數(shù)據(jù)挖掘作為一門同時具備應用性和學術性的課程,早期屬于計算機專業(yè)研究生培養(yǎng)的專業(yè)課程,但隨著數(shù)據(jù)挖掘在各個領域的廣泛應用,現(xiàn)已成為計算機專業(yè)本科培養(yǎng)的專業(yè)選修課之一。目前,數(shù)據(jù)挖掘課程在教學內(nèi)容、教學方法和實驗教學模式上存在諸多不足之處。
(1)教學內(nèi)容陳舊。目前的教學內(nèi)容一般根據(jù)某本數(shù)據(jù)挖掘教科書進行講解,由于數(shù)據(jù)挖掘技術的快速發(fā)展,一本教科書往往很難全面概括數(shù)據(jù)挖掘的內(nèi)容、方法和技術。
(2)基礎理論算法與實驗教學脫節(jié)。當前的教學路線往往是使本科學生從了解和掌握數(shù)據(jù)挖掘的基本任務開始,然后講授數(shù)據(jù)挖掘的各種基本算法,最后上機實驗。這一教學方式側(cè)重于以應用為主,主要目標在于培養(yǎng)計算機工程的應用人才。然而,由于基礎理論算法與實驗教學分開講解,使得學生缺乏對使用數(shù)據(jù)挖掘解決實際問題的能力。
(3)理論創(chuàng)新意識的缺乏。在當前的本科教學中側(cè)重工程實踐能力的培養(yǎng),忽略理論創(chuàng)新的培養(yǎng)。在數(shù)據(jù)挖掘課程中,理論創(chuàng)新是指學生對所學的數(shù)據(jù)挖掘算法有自己的見解,能有意識地思考目前數(shù)據(jù)挖掘面臨的問題并提出新的數(shù)據(jù)挖掘算法。
(4)實驗教學僵化。當前的實驗教學往往是固定的幾個算法驗證性實驗,對于不同學習能力的人而言,實驗教學往往很難達到理想的效果。
目前,對日新月異的科技發(fā)展、以科技創(chuàng)新和技術升級為核心特征的激烈國際競爭,我國自主創(chuàng)新能力較為薄弱的問題已經(jīng)越來越成為信息化發(fā)展的瓶頸[2],這也給數(shù)據(jù)挖掘教學帶來巨大挑戰(zhàn),即教師如何在教學過程中提高學生的理論創(chuàng)新能力?
2 教學方法的改革
2.1 教學內(nèi)容的前沿性與統(tǒng)一性
作為一門新興的前沿課程,該門課程內(nèi)容、方法和技術仍處于發(fā)展和探索階段。通過固定的教材去系統(tǒng)地傳授數(shù)據(jù)挖掘的內(nèi)容顯然是不太合理的。因此,與傳統(tǒng)學科不同,數(shù)據(jù)挖掘教學內(nèi)容需要進行更新,并根據(jù)學生的接受能力進行甄別篩選。同時,要求任課教師在不斷發(fā)展的新技術與相對穩(wěn)定的教材中尋找一條貫穿整個教學內(nèi)容的主線,在講課的過程中,結(jié)合數(shù)據(jù)挖掘研究進展,配合自己的研究成果,把最新的技術融入到課堂中。此外,由于數(shù)據(jù)挖掘是多學科的交叉課程,內(nèi)容涉及統(tǒng)計學、算法、數(shù)據(jù)庫、機器學習、模式識別、可視化等,而本科生的知識體系薄弱,在短時間難以透徹理解各部分內(nèi)容。因此,教學過程中教師應合理設計教學大綱和方案,有機地統(tǒng)一教學內(nèi)容,讓學生對數(shù)據(jù)挖掘有一個整體的了解。建立不同數(shù)據(jù)挖掘任務之間的相互關聯(lián),同時以項目講解的方式將數(shù)據(jù)挖掘涉及的數(shù)據(jù)預處理、聚類分析、分類預測、噪聲檢測、關聯(lián)規(guī)則挖掘等有機結(jié)合在一起。
2.2 理論創(chuàng)新的多元教學
針對現(xiàn)有本科生教學中理論創(chuàng)新意識的缺乏,嘗試進行多元化教學模式,主要從以下4個方面展開。
(1)區(qū)分教學內(nèi)容的難易度,將教學內(nèi)容分為基礎內(nèi)容與進階內(nèi)容。在講授中注重基礎內(nèi)容的原理性,并有意識地讓學生接觸一些前沿性的理論拓展知識。比如在講解分類算法時,首先專注幾個經(jīng)典的分類算法,如K—最鄰近、決策樹、樸素貝葉斯和支持向量機等。同時,在此基礎上,給學生講述目前分類的一些前沿方法,如集成學習、深度學習和遷移學習等。
(2)以問題為驅(qū)動教學。在講解聚類算法時,可以通過“物以類聚,人以群分”的思想展開,具體介紹K—MEANS和DBSCAN兩個具有代表性的聚類算法,讓學生思考數(shù)據(jù)挖掘不同算法提出的原因、基本思想和優(yōu)劣性,初步引導學生的自我思考、自我學習的創(chuàng)新思維能力。同時,針對數(shù)據(jù)具有的高維性,讓學生進一步思考“高維詛咒”問題及在此問題上展開的子空間聚類的研究。
(3)建立“教研統(tǒng)一”研究式教學方法,利用教師現(xiàn)有科研促進和服務于教學,探索形成“科研嵌入”理論教學內(nèi)容。將教師在自己的研究與教學內(nèi)容進行有機結(jié)合,豐富教學內(nèi)容,拓寬學生視野,提高學生實踐能力和創(chuàng)新能力,實現(xiàn)科研成果融入教學。這樣既提高了學生學習知識的興趣性,又培養(yǎng)了潛在的科學素養(yǎng)。此外,在整個教學環(huán)節(jié)中布置兩個任務,一是讓學生進行數(shù)據(jù)挖掘的文獻調(diào)研(主要涉及數(shù)據(jù)挖掘的歷史、現(xiàn)狀、面臨的挑戰(zhàn)及當前的行業(yè)應用),二是在課程結(jié)束后進行主題研究報告,每個學生選擇自己感興趣的一個主題進行,研究報告的目的是讓學生深入理解所學內(nèi)容,為后續(xù)的科研工作打下基礎。
(4)教學模式由傳統(tǒng)“填鴨式”向“互動式”教學轉(zhuǎn)變。通過研討方式引導學生去思考,激發(fā)學生的求知欲,充分調(diào)動其學習的積極性和主觀能動性。通過具體實例,讓學生知道算法的應用場合,提高學習興趣和效率。
2.3 多梯度實驗教學
實驗教學是使學生在實踐環(huán)節(jié)將數(shù)據(jù)挖掘課程中學習的理論算法應用于實踐,幫助學生理解和掌握知識,提高動手能力。傳統(tǒng)的上機實驗往往是側(cè)重幾個經(jīng)典算法的實現(xiàn),如KMEANS、KNN、ID3決策樹和LOF算法等。然而,數(shù)據(jù)挖掘是一門工程應用性較強的學科,這種算法驗證實驗很難讓學生體會到數(shù)據(jù)挖掘的實際應用,因此,從基礎能力培養(yǎng)、工程應用及創(chuàng)新研究3個方面設計多梯度實驗。
首先,按照由淺入深的原則設計2個經(jīng)典算法實現(xiàn),如KMEANS和 ID3決策樹。這個實驗為算法型實驗,主要是幫助學生通過實驗更好地了解所學算法,學生也可以自己選擇聚類分析和分類預測的任意兩個算法進行實現(xiàn)。
其次,設計一個簡單綜合型實驗,比如垃圾郵件的分類系統(tǒng),要求學生完成從數(shù)據(jù)收集、數(shù)據(jù)預處理到整個系統(tǒng)的實現(xiàn)。主要考查學生綜合運用數(shù)據(jù)挖掘知識,解決實際問題的能力,注重工程能力的培養(yǎng)。
最后是創(chuàng)新算法的實驗設計,比如子空間聚類算法的實現(xiàn)。這個實驗注重部分學生創(chuàng)新能力的培養(yǎng),尤其是致力于以后從事科學研究的學生。學生可以根據(jù)自己的愛好,選擇算法型實驗和綜合型實驗,也可以選擇算法型實驗和創(chuàng)新算法設計實驗。多梯度實驗的目的主要是希望針對不同學生的學習興趣及將來的發(fā)展方向,給出合適的實驗教學。實驗的整體難度由易到難,層層深入,有利于學生實踐能力和創(chuàng)新能力的培養(yǎng)。
3 結(jié) 語
當前,數(shù)據(jù)挖掘正處在快速發(fā)展的過程中,各個領域的大量應用使得對數(shù)據(jù)挖掘這門課程的工程應用能力要求越來越高,需要學生具有更好的創(chuàng)新能力,因此,數(shù)據(jù)挖掘課程的教學也同樣需要調(diào)整教學內(nèi)容和教學手段來緊跟其發(fā)展的步伐?;诖?,我們提出在課程內(nèi)容的前沿性、教學模式的多元性及實驗教學的多梯度性上進行改革,從而達到在培養(yǎng)學生工程實踐能力的同時,提高其創(chuàng)新思維能力。
基金項目:電子科技大學“互聯(lián)網(wǎng)+”課程建設教改專項。
第一作者簡介:邵俊明,男,教授,研究方向為數(shù)據(jù)挖掘、機器學習及在交叉學科的應用研究, junmshao@uestc.edu.cn。
參考文獻:
[1]涂新莉, 劉波, 林偉偉. 大數(shù)據(jù)研究綜述[J]. 計算機應用研究, 2014, 31(6): 1612-1616.
[2]應必娣. 培養(yǎng)學生創(chuàng)新能力的教學改革[J]. 實驗室科學, 2015(3): 228-230.
(編輯: 郭田珍 )