黃道斌 潘媛媛 王培培 畢迎春 葉明全
摘要:文章以醫(yī)學(xué)數(shù)據(jù)挖掘課程為例,從教學(xué)現(xiàn)狀出發(fā),分析該課程在醫(yī)學(xué)本科院校中的教學(xué)現(xiàn)狀和存在的問題,探討了如何提升醫(yī)學(xué)信息工程和信息管理與信息系統(tǒng)等專業(yè)本科生的數(shù)據(jù)挖掘理論基礎(chǔ),實(shí)踐能力和綜合素養(yǎng)等,并應(yīng)用數(shù)據(jù)挖掘技術(shù)解決醫(yī)學(xué)相關(guān)的實(shí)際問題的能力。在實(shí)際教學(xué)中已取得了一些較好的效果,為醫(yī)學(xué)院校的新工科建設(shè)提供了良好的示范作用。
關(guān)鍵詞:醫(yī)學(xué)數(shù)據(jù)挖掘;教學(xué)改革;成績評價(jià);案例轉(zhuǎn)化
中圖分類號(hào):G642? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)17-0128-03
隨著醫(yī)院信息化的快速發(fā)展和數(shù)據(jù)挖掘技術(shù)在其他領(lǐng)域的不斷應(yīng)用,很多醫(yī)學(xué)院校都意識(shí)到數(shù)據(jù)挖掘技術(shù)的重要性,都開設(shè)了數(shù)據(jù)挖掘相關(guān)課程,這為畢業(yè)生在工作中應(yīng)用相關(guān)技術(shù)奠定了基礎(chǔ)。目前,醫(yī)院信息科擁有大量的醫(yī)療數(shù)據(jù),但沒有被開發(fā)利用,如何從這些數(shù)據(jù)中挖掘出有用的信息,已成為很多醫(yī)院和醫(yī)療軟件公司要解決的問題。因此,醫(yī)學(xué)本科院校培養(yǎng)的信息人才,擁有數(shù)據(jù)挖掘技能已成為一種趨勢,在專業(yè)改革和課程改革中,數(shù)據(jù)挖掘技術(shù)將占十分重要的地位[1]。數(shù)據(jù)挖掘課程在我校已開設(shè)多年,該課程是一門融合了概率論、高等數(shù)學(xué)、機(jī)器學(xué)習(xí)和現(xiàn)代醫(yī)學(xué)信息等學(xué)科的交叉學(xué)科,其目的是發(fā)現(xiàn)海量醫(yī)學(xué)數(shù)據(jù)中的模式與規(guī)律。目前在數(shù)據(jù)挖掘教學(xué)改革過程中,多所高校都進(jìn)行了該課程的教改[2-5],主要經(jīng)典的數(shù)據(jù)挖掘算法有:決策樹、貝葉斯、關(guān)聯(lián)規(guī)則、聚類,支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等,這些算法已經(jīng)在醫(yī)學(xué)數(shù)據(jù)挖掘中得到了成功的應(yīng)用,都顯示出各自獨(dú)特的優(yōu)越性,它們在各類疾病的診療、醫(yī)學(xué)教研以及醫(yī)院的管理等方面會(huì)發(fā)揮重大作用。下面我們將結(jié)合我校相關(guān)專業(yè)在進(jìn)行數(shù)據(jù)挖掘教學(xué)中的情況闡述下教學(xué)的困惑與改革的想法。
1 教學(xué)現(xiàn)狀分析
我校開設(shè)數(shù)據(jù)挖掘課程始于2013信息管理與信息系統(tǒng)專業(yè)開設(shè)的“醫(yī)學(xué)數(shù)據(jù)挖掘”;2018年,根據(jù)數(shù)據(jù)挖掘發(fā)展現(xiàn)狀,結(jié)合課程實(shí)際教學(xué)情況,結(jié)合技術(shù)發(fā)展動(dòng)態(tài),充實(shí)了相關(guān)的技術(shù)內(nèi)容,構(gòu)建了《醫(yī)學(xué)數(shù)據(jù)挖掘》新的課程體系,后期又將課程名稱調(diào)整為《生物醫(yī)學(xué)數(shù)據(jù)挖掘》,他們之間主要在案例選擇上有細(xì)微差別,下文中我們將課程統(tǒng)稱為醫(yī)學(xué)數(shù)據(jù)挖掘。這門課早期主要面向信息管理與信息系統(tǒng)專業(yè)學(xué)生,后面擴(kuò)展到醫(yī)學(xué)信息工程與智能醫(yī)學(xué)工程專業(yè),目前每年必修課學(xué)習(xí)人數(shù)約120~150人。通過多年的教學(xué)實(shí)踐,學(xué)生基本能掌握數(shù)據(jù)挖掘的基本概念,熟悉數(shù)據(jù)挖掘的各種經(jīng)典算法以及利用算法的主要步驟和具體實(shí)現(xiàn)方法,了解相關(guān)技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用;在實(shí)踐上能夠利用數(shù)據(jù)挖掘工具WEKA軟件平臺(tái),同時(shí)部分學(xué)生還能使用Python高級(jí)語言實(shí)現(xiàn)簡單編程對實(shí)際數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)數(shù)據(jù)挖掘的具體操作。下面就教學(xué)中出現(xiàn)曾經(jīng)出現(xiàn)的問題簡單列舉如下:
1.1 教材問題,教材的選用對課程很重要
目前可選的數(shù)據(jù)挖掘教材很多,但偏向醫(yī)學(xué)方向的數(shù)據(jù)挖掘教材卻很少,沒有特別合適的。不管是老師還是學(xué)生,對教材都不是十分滿意。理論教學(xué)采用傳統(tǒng)數(shù)據(jù)挖掘教材代替,同時(shí)補(bǔ)充醫(yī)學(xué)應(yīng)用案例的方式來組織教學(xué),案例與算法理論的存在不一致的地方。在實(shí)際教學(xué)過程中教材發(fā)揮的作用非常有限,得通過各種途徑來做知識(shí)的補(bǔ)充。
1.2 學(xué)生先導(dǎo)課程知識(shí)掌握薄弱
醫(yī)學(xué)數(shù)據(jù)挖掘是《高等數(shù)學(xué)》《線性代數(shù)》《概率統(tǒng)計(jì)》《Python程序設(shè)計(jì)語言》等先修課程的實(shí)踐應(yīng)用和拓展。醫(yī)學(xué)本科院校中學(xué)生在數(shù)學(xué)與程序設(shè)計(jì)等方面,掌握得不是非常好,在理論教學(xué)過程中對算法的理解有難度,導(dǎo)致部分學(xué)生因理解困難出現(xiàn)厭學(xué)情緒。
1.3 教學(xué)過程理論部分偏重,教學(xué)模式單一
理論教學(xué)內(nèi)容一般根據(jù)數(shù)據(jù)挖掘教材進(jìn)行講解,授課重心傾向于如何使得學(xué)生了解和掌握數(shù)據(jù)挖掘的各種算法,而輕視了實(shí)驗(yàn)與實(shí)踐教學(xué),從而使得學(xué)生在實(shí)際解決問題能力不強(qiáng)。
1.4實(shí)驗(yàn)設(shè)計(jì)方式單一,實(shí)驗(yàn)主要以驗(yàn)證性的為主
試驗(yàn)課使用的是WEKA平臺(tái),其優(yōu)點(diǎn)是入手相對容易,使用者可以在很短的時(shí)間內(nèi)完成一個(gè)簡單的數(shù)據(jù)挖掘任務(wù),同時(shí)該款軟件在實(shí)際工程中也有應(yīng)用,這是我們當(dāng)初選擇這個(gè)作為實(shí)驗(yàn)平臺(tái)的重要原因。但在實(shí)驗(yàn)教學(xué)中過程中發(fā)現(xiàn)采用WEKA軟件平臺(tái)來實(shí)施實(shí)驗(yàn)教學(xué)存在一個(gè)很嚴(yán)重的問題,雖然它封裝了很多算法,可以直接通過點(diǎn)擊鼠標(biāo)來完成實(shí)驗(yàn),但學(xué)生過分依賴傻瓜式的操作,無法通過實(shí)驗(yàn)了解算法的實(shí)際運(yùn)算過程,從而導(dǎo)致實(shí)驗(yàn)教學(xué)不能很好地鞏固理論教學(xué)的知識(shí)點(diǎn),實(shí)驗(yàn)與理論之間存在很大的間隔。
1.5 完整的數(shù)據(jù)挖掘案例缺失
應(yīng)用數(shù)據(jù)挖掘技術(shù)到不同的領(lǐng)域,涉及的過程很多,比如數(shù)據(jù)的預(yù)處理,特征提取,模型訓(xùn)練,結(jié)果解析等。因?yàn)樯蠈?shí)驗(yàn)課時(shí)間的關(guān)系,老師事先把數(shù)據(jù)處理好,只讓學(xué)生運(yùn)行理論課程算法,這樣能保證實(shí)驗(yàn)課學(xué)生能做出結(jié)果,但太過于理想,不利于學(xué)生將數(shù)據(jù)挖掘技術(shù)應(yīng)用于實(shí)際項(xiàng)目。
1.6 學(xué)生學(xué)習(xí)的主動(dòng)性不強(qiáng),課程成績評價(jià)機(jī)制簡單
以往的教學(xué)主要以老師講授為主,學(xué)生被動(dòng)聽課,參與度不高,而且數(shù)據(jù)挖掘算法理解難度較大,學(xué)生的積極性不高,部分學(xué)生學(xué)習(xí)態(tài)度不端正,設(shè)計(jì)的課程考核機(jī)制不能有效地促進(jìn)學(xué)生的學(xué)習(xí)積極性。
2 課程改革思路
進(jìn)行課程改革目標(biāo)是希望通過本課程的改革,使得學(xué)生在理論上掌握數(shù)據(jù)挖掘的基本概念,熟悉數(shù)據(jù)挖掘的各主要功能以及實(shí)現(xiàn)數(shù)據(jù)挖掘的主要步驟和具體實(shí)現(xiàn)方法,在實(shí)踐上能夠利用數(shù)據(jù)挖掘算法,實(shí)現(xiàn)對醫(yī)學(xué)數(shù)據(jù)的信息挖掘的具體操作。通過理論教學(xué)和實(shí)驗(yàn)的訓(xùn)練,培養(yǎng)學(xué)生理論和實(shí)際相結(jié)合的實(shí)際運(yùn)用能力。下面我們主要從如下幾方面來解決教學(xué)實(shí)踐過程中的問題。
2.1 醫(yī)學(xué)數(shù)據(jù)挖掘教材與教學(xué)內(nèi)容選擇
醫(yī)學(xué)數(shù)據(jù)挖掘作為數(shù)據(jù)挖掘在醫(yī)學(xué)上面的擴(kuò)展,不管是在教材選擇方面還是在授課內(nèi)容方面不同的院校都側(cè)重點(diǎn)不一樣,很明顯通過傳統(tǒng)的數(shù)據(jù)挖掘教材來執(zhí)行教學(xué)計(jì)劃十分的不合適,主要原因有二:傳統(tǒng)數(shù)據(jù)挖掘教材主要面向計(jì)算機(jī)等專業(yè)學(xué)生,其學(xué)生的數(shù)學(xué)素養(yǎng)較高,在算法講授上更容易接受,對于醫(yī)學(xué)院校的學(xué)生,在掌握的能力上有所欠缺,其次是傳統(tǒng)教材更注重算法原理推導(dǎo),而對于醫(yī)學(xué)專業(yè)學(xué)生更注重算法的應(yīng)用性,綜合上述兩點(diǎn),我們的采用策略是理論講解以教材為主,盡可能使理論算法通俗易懂,避免學(xué)生陷入復(fù)雜的數(shù)學(xué)推導(dǎo);而對于案例設(shè)計(jì)以醫(yī)學(xué)背景的數(shù)據(jù)集合為主,重點(diǎn)突出不同數(shù)據(jù)挖掘算法應(yīng)用在不用醫(yī)學(xué)數(shù)據(jù)上的效果。未來的教學(xué)我們將整理近幾年的教學(xué)資料形成授課講義。教學(xué)內(nèi)容的選擇上我們沒有像有些院校把不同領(lǐng)域的前沿算法在課堂上講授給學(xué)生,我們課程的指導(dǎo)原則是以最基礎(chǔ)的數(shù)據(jù)挖掘算法為基礎(chǔ),在內(nèi)容選擇以經(jīng)典算法為主,比如關(guān)聯(lián)規(guī)則算法(Apriori算法),聚類,決策樹,樸素貝葉斯算法,神經(jīng)網(wǎng)絡(luò),支持向量機(jī)等。最新的相關(guān)算法以課后擴(kuò)展閱讀的方式提供給學(xué)有余力的同學(xué)。我們的這種選擇不管從學(xué)生素質(zhì)還是培養(yǎng)目標(biāo)來看,都更加合理。
2.2 鼓勵(lì)學(xué)生以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),參加各類科研與大創(chuàng)項(xiàng)目
將所學(xué)的算法應(yīng)用到實(shí)際的場景中,是對學(xué)生積極性的極大促進(jìn)[4]。從目前幾屆的學(xué)生情況來看,通過參加各類競賽和項(xiàng)目的同學(xué),不但算法理論掌握扎實(shí), 也極大地培養(yǎng)了學(xué)生動(dòng)手實(shí)踐能力,為后續(xù)應(yīng)用數(shù)據(jù)挖掘算法打下了很好基礎(chǔ)。后續(xù)的教學(xué)改革中,我們將繼續(xù)引導(dǎo)對學(xué)生朝這方面努力,將所學(xué)的理論算法落地應(yīng)用。目前已有多名同學(xué)申請了大學(xué)生科研項(xiàng)目和省級(jí)大創(chuàng)項(xiàng)目,同時(shí)還有同學(xué)以所學(xué)知識(shí)參加全國計(jì)算機(jī)設(shè)計(jì)大賽、人工智能挑戰(zhàn)賽等賽事。通過這些活動(dòng)極大地促進(jìn)學(xué)生的學(xué)習(xí)積極性。
2.3 轉(zhuǎn)化授課教師科研項(xiàng)目用于案例教學(xué)
醫(yī)學(xué)數(shù)據(jù)挖掘授課教師主要從事數(shù)據(jù)挖掘方向科研,有很多科研項(xiàng)目用到了數(shù)據(jù)挖掘算法,比如SVM,決策樹,貝葉斯算法等,對于這些項(xiàng)目如果直接照搬過來給學(xué)生用,難度較大,學(xué)生難以掌握,因此需要把相對復(fù)雜的科研算法經(jīng)過精簡后作為案例教學(xué),這是我們課程組一致認(rèn)為只有教師自己把算法理解通透并應(yīng)用到了實(shí)際場景,才能在授課的時(shí)候把算法應(yīng)用講解透。目前我們已經(jīng)成功地把基因特征選擇的相關(guān)算法應(yīng)用在案例教學(xué)上,學(xué)生非常感興趣,讓學(xué)生體會(huì)到所學(xué)知識(shí)的力量,后續(xù)我們將加大案例轉(zhuǎn)化這方面工作,把更多老師的工作整理成教學(xué)案例。
2.4 理論教學(xué)設(shè)計(jì)
數(shù)據(jù)挖掘是理論性較強(qiáng)的課程,理論教學(xué)是學(xué)生掌握相關(guān)算法的重要環(huán)節(jié),要完成課堂教學(xué),必須從學(xué)生的特點(diǎn),教材,授課目標(biāo),教學(xué)策略等方面展開。根據(jù)醫(yī)學(xué)院校學(xué)生特點(diǎn),我們采取課前發(fā)布本章所需的背景知識(shí),比如講解貝葉斯算法的時(shí)候,把相關(guān)的條件概率,全概率公式提前讓學(xué)生復(fù)習(xí)了解,從而保證理論教學(xué)過程中的重點(diǎn)思想的理解。課堂教學(xué)我采取的策略是把基本算法講透,擴(kuò)展算法適當(dāng)介紹的策略,課后我們鼓勵(lì)學(xué)生利用網(wǎng)絡(luò)教學(xué)資源,學(xué)習(xí)理論課程的網(wǎng)絡(luò)視頻資料,教師在整個(gè)教學(xué)過程中始終定位為一名引導(dǎo)者,堅(jiān)持做到課堂教學(xué)與自主學(xué)習(xí)的相互促進(jìn),及時(shí)作業(yè)鞏固對課程的學(xué)習(xí)也是必要的,對于有能力的同學(xué),推送相關(guān)的學(xué)術(shù)論文。
2.5 實(shí)驗(yàn)教學(xué)層次設(shè)計(jì)
實(shí)驗(yàn)教學(xué)是理論教學(xué)的有效補(bǔ)充,兩者相互促進(jìn),缺一不可。后期實(shí)驗(yàn)主要分三個(gè)層次,驗(yàn)證性實(shí)驗(yàn)主要通過WEKA來完成;其次是設(shè)計(jì)性實(shí)驗(yàn),主要通過Python來實(shí)現(xiàn),促進(jìn)學(xué)生對算法工作原理的掌握;最后是綜合性實(shí)驗(yàn)設(shè)計(jì),通過對數(shù)據(jù)的預(yù)處理,比如異常數(shù)值處理、歸一化等技術(shù),然后做特征選擇,模型訓(xùn)練,直到跑出預(yù)測結(jié)果。上述的每個(gè)過程對學(xué)習(xí)效果都會(huì)有影響,讓學(xué)生能深入各個(gè)環(huán)節(jié)。具體如表1所示:
2.6 改革成績評價(jià)機(jī)制,學(xué)習(xí)過程考核與期末測試相結(jié)合
以前成績評價(jià)是以考試成績加平時(shí)成績?yōu)橹鞯姆绞竭M(jìn)行,發(fā)現(xiàn)有很多的弊端,主要原因是平時(shí)成績記分方式簡單,流于形式,不能很好地起到促進(jìn)學(xué)習(xí)過程的作用。為了更加有效地促進(jìn)學(xué)習(xí),我們設(shè)計(jì)的形成性評價(jià)方案包含如下幾個(gè)部分:期末考試成績占70%(學(xué)校要求不能低于這個(gè)標(biāo)準(zhǔn),授課老師認(rèn)為60%更加合適),過程性的成績占30%。30%的過程性成績由15%的平時(shí)成績,10%的綜合作業(yè)成績,以及5%的考勤。其中平時(shí)成績主要體現(xiàn)平實(shí)作業(yè),檢驗(yàn)學(xué)生及時(shí)消化和鞏固理論試驗(yàn)教學(xué)內(nèi)容,這個(gè)相當(dāng)于階段性的測試成績。授課教師可以通過這項(xiàng)成績發(fā)現(xiàn)教學(xué)中的問題,把問題解決在萌芽狀態(tài)。10%的綜合作業(yè)成績主要體現(xiàn)綜合大作業(yè)的完成度,主要考查學(xué)生利用所學(xué)知識(shí)分析解決實(shí)際問題的能力。這種過程性設(shè)計(jì),將考核目標(biāo)朝多元化方向發(fā)展,使得學(xué)生更加注重學(xué)習(xí)的過程。
3 總結(jié)
在教育部大力發(fā)展新工科的背景下,醫(yī)學(xué)數(shù)據(jù)挖掘作為醫(yī)學(xué)院校中的信息類專業(yè)的專業(yè)課,順應(yīng)了人才培養(yǎng)目標(biāo)要求。我們的教改從教材選用、教學(xué)內(nèi)容,實(shí)驗(yàn)設(shè)計(jì)以及多層次評價(jià)等多個(gè)方面進(jìn)行了改革與探索。實(shí)踐表明,明確了教學(xué)內(nèi)容,授課方式和輔助手段,培養(yǎng)了學(xué)生的自主學(xué)習(xí)能力,提升了學(xué)生的實(shí)踐動(dòng)手能力,在合理的課程評價(jià)體系下,很好地促進(jìn)了學(xué)生的學(xué)習(xí)進(jìn)程??傊@門課程的教學(xué)改革,雖然我們?nèi)〉昧艘恍┏煽?,但還有很多不足的地方,我們將堅(jiān)持改進(jìn)與創(chuàng)新,不斷完善課程。
參考文獻(xiàn):
[1] 葛曉燕.數(shù)據(jù)挖掘課程混合式教學(xué)改革探索[J].電腦與電信,2021(6):43-46.
[2] 湯顯,石蘊(yùn)玉.新工科背景下數(shù)據(jù)挖掘課程教學(xué)改革與探索[J].教育教學(xué)論壇,2019(42):141-142.
[3] 李?yuàn)檴櫍钪?新形勢下本科數(shù)據(jù)挖掘課程教學(xué)的反思與改革[J].新校園(上旬),2017(6):105-106.
[4] 修宇,劉三民.基于“競賽驅(qū)動(dòng)”的數(shù)據(jù)挖掘課程教學(xué)改革探索[J].福建電腦,2018,34(2):75-76,79.
[5] 邵俊明,楊勤麗.理論創(chuàng)新驅(qū)動(dòng)的數(shù)據(jù)挖掘課程教學(xué)改革[J].計(jì)算機(jī)教育,2017(4):92-93,97.
收稿日期:2021-12-24
基金項(xiàng)目:皖南醫(yī)學(xué)院校級(jí)精品開放課程“醫(yī)學(xué)數(shù)據(jù)挖掘”(2018kfkc08);“互聯(lián)網(wǎng)+創(chuàng)新教育”下醫(yī)學(xué)信息基礎(chǔ)課程混合式教學(xué)模式研究(2019jyxm25);省級(jí)“六卓越、一拔尖”卓越人才培養(yǎng)創(chuàng)新項(xiàng)目(2020zyrc159); 安徽省新工科研究與實(shí)踐項(xiàng)目(2020-24); 皖南醫(yī)學(xué)院示范實(shí)驗(yàn)實(shí)訓(xùn)中心(2020sxzx01); 皖南醫(yī)學(xué)院校級(jí)教學(xué)研究項(xiàng)目“大數(shù)據(jù)背景下醫(yī)學(xué)數(shù)據(jù)挖掘課程實(shí)踐教學(xué)研究”(2018JYXM10);2021年度皖南醫(yī)學(xué)院教學(xué)質(zhì)量與教學(xué)改革工程線上課程(2021ylkc03);2020年安徽省高等學(xué)校省級(jí)教學(xué)示范課(2460)
作者簡介: 黃道斌(1981—),男,江西永豐人,講師,碩士,主要研究方向?yàn)閿?shù)據(jù)挖掘,機(jī)器學(xué)習(xí),深度學(xué)習(xí)。