何寶琴
(廈門醫(yī)學(xué)院)
近年來(lái),各大醫(yī)院都積極進(jìn)行信息化建設(shè)工作,同時(shí)社會(huì)中也涌現(xiàn)出了一批互聯(lián)網(wǎng)醫(yī)院,全面推進(jìn)智慧醫(yī)院建設(shè)已成為必然趨勢(shì)[1],這就意味著將來(lái)要在醫(yī)院、醫(yī)療行業(yè)工作的醫(yī)學(xué)生們,除了學(xué)好醫(yī)學(xué)專業(yè)知識(shí)外,也應(yīng)掌握計(jì)算機(jī)技能。對(duì)于醫(yī)學(xué)生而言,其了解計(jì)算機(jī)知識(shí)的核心方式是計(jì)算機(jī)公共課,然而由于醫(yī)學(xué)專業(yè)的特殊性,學(xué)生學(xué)習(xí)壓力大、課程量大,所以在實(shí)踐的過(guò)程中也遇到了一定的困難,有關(guān)問(wèn)題主要體現(xiàn)在三方面:第一,對(duì)于醫(yī)學(xué)生來(lái)說(shuō)很多計(jì)算機(jī)的理論知識(shí)比較晦澀難懂,因此在學(xué)習(xí)的時(shí)候有排斥心理,對(duì)計(jì)算機(jī)課程的學(xué)習(xí)興趣比較低;第二,由于計(jì)算機(jī)不是醫(yī)學(xué)的核心專業(yè),醫(yī)學(xué)生普遍不重視計(jì)算機(jī)課程,投入時(shí)間也比較少[2];第三,學(xué)生來(lái)自于全國(guó)各省份地區(qū),計(jì)算機(jī)水平差異較大。這些原因?qū)е掠?jì)算機(jī)教學(xué)未能取得良好的效果。由此可見(jiàn),了解學(xué)生的學(xué)習(xí)意愿并激發(fā)他們的學(xué)習(xí)興趣,針對(duì)計(jì)算機(jī)公共課進(jìn)行改革具有一定的必要性與重要的意義[3],計(jì)算機(jī)教師應(yīng)積極思考這一問(wèn)題,主動(dòng)迎接挑戰(zhàn)。基于此,本研究面向大一醫(yī)學(xué)生進(jìn)行了調(diào)查,共采集了731名學(xué)生與計(jì)算機(jī)學(xué)習(xí)意愿相關(guān)的信息與數(shù)據(jù),并通過(guò)文本可視化的方式針對(duì)調(diào)查結(jié)果進(jìn)行了分析,確定了與計(jì)算機(jī)學(xué)習(xí)意愿相關(guān)的影響因素,并結(jié)合有關(guān)理論與筆者的思考,提出了改革計(jì)算機(jī)公共課的具體建議與對(duì)策。
隨著數(shù)字時(shí)代的到來(lái),數(shù)據(jù)量從TB級(jí)別跨向PB、EB級(jí)別[4],而人腦并不擅長(zhǎng)處理如此大量的信息,因此利用機(jī)器的計(jì)算能力對(duì)海量數(shù)據(jù)進(jìn)行分析挖掘成為一種趨勢(shì)。文本可視化作為數(shù)據(jù)挖掘的一種重要技術(shù),涉及了文本挖掘、統(tǒng)計(jì)分析、數(shù)據(jù)可視化等技術(shù),它對(duì)人和機(jī)器都具有可讀性。文本可視化是以動(dòng)態(tài)或靜態(tài)的視覺(jué)符號(hào)、圖形圖像展示文字中的內(nèi)涵及規(guī)律[5],常見(jiàn)的文本可視化包括圖形、圖表、詞云、地圖、網(wǎng)絡(luò)、時(shí)間線等形式,它使人們能夠通過(guò)視覺(jué)的方式觀察數(shù)據(jù),了解其中潛藏的有價(jià)值的信息。本文分為四個(gè)步驟進(jìn)行文本數(shù)據(jù)可視化,包括信息收集、數(shù)據(jù)預(yù)處理、文本挖掘、數(shù)據(jù)可視化,具體流程見(jiàn)圖1。
圖1 文本可視化流程
信息收集是指根據(jù)系統(tǒng)需求或用戶需要利用各種設(shè)備、網(wǎng)絡(luò)抓取、問(wèn)卷調(diào)查等各種方式采集原始數(shù)據(jù)的過(guò)程。本研究基于網(wǎng)絡(luò)調(diào)查了大一醫(yī)學(xué)生學(xué)習(xí)計(jì)算機(jī)知識(shí)的意愿,內(nèi)容為主觀題“你對(duì)大學(xué)計(jì)算機(jī)這門課程有什么建議或意見(jiàn)?”被調(diào)查者共有731人,均為大一醫(yī)學(xué)生,入學(xué)時(shí)間為2020年,專業(yè)涵蓋臨床醫(yī)學(xué)、麻醉學(xué)、精神醫(yī)學(xué)、口腔醫(yī)學(xué)、藥學(xué)等,其中男生261人,女生470人。調(diào)查問(wèn)卷的發(fā)放數(shù)量為731份,全部順利回收。對(duì)于收集的數(shù)據(jù),本文利用python進(jìn)行數(shù)據(jù)預(yù)處理、文本挖掘以及數(shù)據(jù)可視化。
本文中回收的答卷為文本信息,文本數(shù)據(jù)屬于非結(jié)構(gòu)化數(shù)據(jù)的一種,非結(jié)構(gòu)化數(shù)據(jù)具有結(jié)構(gòu)不規(guī)則、不完整、沒(méi)有預(yù)定義模型等特點(diǎn),非結(jié)構(gòu)化的數(shù)據(jù)在數(shù)據(jù)存儲(chǔ)、管理以及分析挖掘上都會(huì)比結(jié)構(gòu)化數(shù)據(jù)面對(duì)更多的挑戰(zhàn)。由于文本數(shù)據(jù)的非結(jié)構(gòu)化的特殊性,其數(shù)據(jù)預(yù)處理步驟尤為重要。我們所收集完成的原始數(shù)據(jù)質(zhì)量并不高,存在不一致、重復(fù)、不完整、含噪聲等問(wèn)題,因此不能直接用于數(shù)據(jù)分析,需要先進(jìn)行預(yù)處理。我們進(jìn)行如下預(yù)處理過(guò)程:第一,數(shù)據(jù)清洗,去除無(wú)效數(shù)據(jù)。首先作答時(shí)間小于10秒視為無(wú)效答卷,其次答案毫無(wú)意義,例如“無(wú)”“沒(méi)有”“沒(méi)建議”“好”也視為無(wú)效答卷。我們將回收的731份答卷進(jìn)行清洗后得到有效答卷657份。第二,標(biāo)準(zhǔn)化,文本數(shù)據(jù)是一種復(fù)雜、不規(guī)則的數(shù)據(jù)類型,它除了包括中文字以外,還會(huì)出現(xiàn)標(biāo)點(diǎn)符號(hào)、表情包、阿拉伯?dāng)?shù)字等,而這些字符會(huì)干擾我們數(shù)據(jù)分析的結(jié)果,需要在預(yù)處理時(shí)過(guò)濾掉。第三,中文糾錯(cuò),對(duì)文本中的錯(cuò)別字進(jìn)行糾錯(cuò)。
文本挖掘是通過(guò)自然語(yǔ)言處理技術(shù)將非結(jié)構(gòu)化信息轉(zhuǎn)換為結(jié)構(gòu)化信息,并挖掘其中規(guī)律,進(jìn)行文本處理包括以下步驟:第一,進(jìn)行詞語(yǔ)切分,即將每個(gè)句子拆分為一系列的詞,具體來(lái)講,便是把一句話分為若干個(gè)詞。第二,無(wú)意義詞匯過(guò)濾,在分析學(xué)生學(xué)習(xí)意愿過(guò)程中,類似于“老師”“希望”“以后”這些詞匯都是沒(méi)有分析意義的,需要將這些詞匯過(guò)濾掉。第三,相似詞聚類,在中文中,很多詞匯是相似的,例如“操作”“上機(jī)”“實(shí)踐”等詞匯在我們當(dāng)前語(yǔ)境下意思相同,即操作計(jì)算機(jī),因此需要把這些相似的詞匯進(jìn)行聚類。
通過(guò)可視化處理可以將數(shù)據(jù)轉(zhuǎn)換為相應(yīng)的圖形,目前數(shù)據(jù)可視化已成為了一種新的學(xué)科,文本可視化屬于該領(lǐng)域的一個(gè)重要分支,是指通過(guò)圖像以及圖形等展示文本信息,讓讀者能夠比較直觀、快速地獲取文章中內(nèi)涵與規(guī)律。詞云是最近比較熱門的文本數(shù)據(jù)可視化技術(shù)[6],它是一種漂亮、有創(chuàng)意和強(qiáng)大的文本可視化工具之一。詞云是一個(gè)基于關(guān)鍵詞的文本內(nèi)容可視化,它的核心技術(shù)是把文章中的重要詞語(yǔ)提煉出來(lái),并按照頻率在二維空間上以不同的字體大小美觀地排版,使讀者能夠迅速?gòu)脑~云圖中掌握海量文本的核心信息。詞頻分析主要研究的是某個(gè)詞匯出現(xiàn)的頻次,能夠幫助我們從大量的主觀意見(jiàn)中抓住關(guān)鍵點(diǎn)。在研究學(xué)生計(jì)算機(jī)學(xué)習(xí)意愿的過(guò)程中引入詞云分析技術(shù),能夠幫助我們更快、更準(zhǔn)確地找到學(xué)生們最關(guān)注的問(wèn)題和最迫切的學(xué)習(xí)需求。我們根據(jù)詞頻生成詞云圖,如圖2所示,在圖中顯示的文字越大,說(shuō)明其出現(xiàn)頻次越高。從圖中,不用去看調(diào)查數(shù)據(jù)的文本,就很容易知道學(xué)生們的最核心需求是什么。與此同時(shí),用戶可以設(shè)計(jì)詞云的形狀、色彩、方向等,使得詞云更加美觀,可以稱之為一個(gè)兼具審美特征和文學(xué)元素的藝術(shù)作品。
圖2 計(jì)算機(jī)學(xué)習(xí)意愿詞云圖
從圖2我們可以得到以下信息:第一,出現(xiàn)頻率最高的詞匯是“操作”,這里的“操作”指的是學(xué)生在計(jì)算機(jī)上進(jìn)行實(shí)踐。不難得出對(duì)于上課形式,大部分的學(xué)生希望有更多的上機(jī)操作機(jī)會(huì),而不是大量的理論知識(shí)。第二,圖2中多次出現(xiàn)“辦公”“實(shí)用”“軟件”等高頻詞匯,可見(jiàn)對(duì)于課程內(nèi)容,學(xué)生們希望課堂更加注重實(shí)用性,以辦公軟件或常用軟件為主。第三,在圖2中多次出現(xiàn)關(guān)鍵詞匯“簡(jiǎn)單”“慢”“基礎(chǔ)”“生動(dòng)”等,我們能夠看出,有部分同學(xué)認(rèn)為計(jì)算機(jī)是枯燥難懂的知識(shí),對(duì)于計(jì)算機(jī)的學(xué)習(xí)還沒(méi)開(kāi)始就已經(jīng)出現(xiàn)畏難情緒,學(xué)生們希望老師在上課時(shí)能以通俗易懂且具有趣味性的方式講述。針對(duì)上述現(xiàn)象,筆者結(jié)合觀察與總結(jié)的經(jīng)驗(yàn),提出了計(jì)算機(jī)公共課改革的三方面建議。
在教學(xué)改革過(guò)程中,學(xué)生是否有興趣學(xué)習(xí)是教學(xué)改革是否成功、教學(xué)是否能達(dá)到理想效果的關(guān)鍵因素,基于上述學(xué)習(xí)意愿的分析結(jié)果,本文提出三點(diǎn)激發(fā)學(xué)生學(xué)習(xí)興趣的建議。
第一,大學(xué)計(jì)算機(jī)公共課課程內(nèi)容體系可采用理實(shí)結(jié)合模式,并且理論不應(yīng)該與實(shí)踐完全脫節(jié),以實(shí)踐為基礎(chǔ)才能激發(fā)學(xué)生的學(xué)習(xí)欲望,充分發(fā)揮主觀能動(dòng)性。在計(jì)算機(jī)公共課中,計(jì)算機(jī)編碼、計(jì)算機(jī)工作原理、網(wǎng)絡(luò)原理、計(jì)算思維這幾個(gè)部分都屬于偏理論的章節(jié),對(duì)于醫(yī)學(xué)生而言比較抽象難懂,以純理論的講解,學(xué)生的接受度不高,可以在講述時(shí)結(jié)合實(shí)踐。例如筆者在進(jìn)行字符編碼教學(xué)時(shí),先給學(xué)生們發(fā)了一份亂碼的文檔,請(qǐng)同學(xué)們分析亂碼產(chǎn)生的原因,再結(jié)合計(jì)算機(jī)編碼原理講述亂碼產(chǎn)生的過(guò)程,最后學(xué)生們自己動(dòng)手修復(fù)亂碼文檔。在這個(gè)過(guò)程中學(xué)生們學(xué)習(xí)興趣濃厚,同時(shí)也體驗(yàn)到發(fā)現(xiàn)問(wèn)題、分析問(wèn)題、解決問(wèn)題的科學(xué)思維過(guò)程。
第二,對(duì)于教學(xué)難點(diǎn),可以結(jié)合案例或?qū)W生感興趣的熱點(diǎn)新聞事件深入淺出地講解,把枯燥的知識(shí)點(diǎn)轉(zhuǎn)換為學(xué)生感興趣的內(nèi)容。例如,筆者在講述DNS的工作原理時(shí),結(jié)合了當(dāng)下互聯(lián)網(wǎng)中最常見(jiàn)的一些網(wǎng)絡(luò)詐騙手段、廣告彈出現(xiàn)象以及常見(jiàn)網(wǎng)絡(luò)故障來(lái)講述,學(xué)生在聽(tīng)這部分內(nèi)容時(shí),學(xué)習(xí)興致很高,不但掌握了理論知識(shí),更提高了防騙意識(shí)。
第三,與專業(yè)結(jié)合。對(duì)于醫(yī)學(xué)生來(lái)說(shuō),沒(méi)有興趣的主要原因之一是沒(méi)有意識(shí)到計(jì)算機(jī)對(duì)于醫(yī)學(xué)的重要性。針對(duì)這一問(wèn)題,可以在計(jì)算機(jī)課程教學(xué)中結(jié)合醫(yī)學(xué)專業(yè)案例與專業(yè)前沿技術(shù),將計(jì)算機(jī)在醫(yī)療上最新的研究進(jìn)展與應(yīng)用融入課程知識(shí)體系中,這樣能夠大大提升學(xué)生的學(xué)習(xí)興趣。例如將人工智能與智慧醫(yī)療相結(jié)合,將網(wǎng)絡(luò)原理與互聯(lián)網(wǎng)醫(yī)院相結(jié)合等。
2006年周以珍教授提出了一個(gè)改變計(jì)算機(jī)教學(xué)理念的概念——計(jì)算思維[7],自此大學(xué)計(jì)算機(jī)公共課漸漸地從原來(lái)的以技能教學(xué)為主向以計(jì)算思維的培養(yǎng)為主傾斜,全國(guó)高校計(jì)算機(jī)基礎(chǔ)課程教育正掀起計(jì)算思維改革的熱潮[8]。一線教師們已經(jīng)意識(shí)到新變化的意義和重要性,越來(lái)越重視計(jì)算思維內(nèi)容的教學(xué)。然而計(jì)算思維是一個(gè)比較抽象的概念,它指的是利用計(jì)算機(jī)科學(xué)的基本概念來(lái)解決問(wèn)題、設(shè)計(jì)系統(tǒng)和理解人類行為的思維過(guò)程,只是單純地講述概念與理論對(duì)醫(yī)學(xué)生來(lái)說(shuō)較為難以理解與接受。因此對(duì)于計(jì)算思維的培養(yǎng),需要分析醫(yī)學(xué)生的特點(diǎn)與實(shí)際,融入課程知識(shí)與實(shí)踐。例如在講解計(jì)算機(jī)硬件原理時(shí)結(jié)合排序、遞歸思想,在EXCEL函數(shù)講解時(shí)融入算法理念,采取這種方式不但能提高知識(shí)的接受程度,并且可以讓學(xué)生們真正實(shí)踐計(jì)算思維,而不是停留于理論。
由于學(xué)生來(lái)自于全國(guó)各個(gè)省份,初中、高中計(jì)算機(jī)課程難度與課時(shí)均不同,有些偏遠(yuǎn)地區(qū)的學(xué)生甚至從未接觸過(guò)計(jì)算機(jī),因此在教學(xué)過(guò)程中如何設(shè)置課程難度成為亟需解決的問(wèn)題。目前常見(jiàn)的做法是分層次教學(xué)[9],即在開(kāi)課前進(jìn)行計(jì)算機(jī)水平測(cè)試,依據(jù)測(cè)試結(jié)果進(jìn)行分班,根據(jù)學(xué)生計(jì)算機(jī)水平來(lái)設(shè)置課程難度。這樣的分層次教學(xué)雖然能夠有效解決計(jì)算機(jī)水平差異較大的問(wèn)題,但并不是每個(gè)學(xué)校和專業(yè)都有條件實(shí)施分層次教學(xué)。在醫(yī)學(xué)院校實(shí)施分層次難度較大,其主要原因是醫(yī)學(xué)生普遍課多,每個(gè)班課表差異較大,分班時(shí)難以協(xié)調(diào)上課時(shí)間。因此,針對(duì)這兩種不同的情況我們采取不同的策略。首先,有條件實(shí)施分層次教學(xué)的學(xué)校優(yōu)先采用分層次教學(xué)法,該方法已經(jīng)在實(shí)踐中被證明能夠有效解決學(xué)生計(jì)算機(jī)水平差異問(wèn)題。其次,無(wú)法實(shí)現(xiàn)分層次教學(xué)的學(xué)校,可以采用線上線下結(jié)合的教學(xué)方式。對(duì)于比較基礎(chǔ)且大部分同學(xué)都已經(jīng)掌握的內(nèi)容,采用線上學(xué)習(xí)與測(cè)試,測(cè)試通過(guò)的學(xué)生可以不用學(xué)習(xí)這部分內(nèi)容,而基礎(chǔ)較差的學(xué)生在線上自學(xué)并通過(guò)測(cè)試。這樣既照顧到基礎(chǔ)比較薄弱的學(xué)生,也能夠讓已經(jīng)掌握該內(nèi)容的學(xué)生不用重復(fù)學(xué)習(xí)。
本文基于文本可視化的方式研究分析了大一醫(yī)學(xué)生的計(jì)算機(jī)知識(shí)學(xué)習(xí)意愿,總結(jié)了醫(yī)學(xué)生的特點(diǎn)與實(shí)際,分析了其學(xué)習(xí)的需求,并結(jié)合有關(guān)理論與筆者的思考提出了具體的改進(jìn)建議。針對(duì)文中提到的課改建議,筆者進(jìn)行了實(shí)踐檢驗(yàn),結(jié)果表明,新的教學(xué)方式得到了學(xué)生們的普遍好評(píng)與認(rèn)可。由于計(jì)算機(jī)技術(shù)本身的不斷發(fā)展,社會(huì)對(duì)計(jì)算機(jī)技能需求的不斷變化,以及學(xué)生計(jì)算機(jī)水平的逐年提高,計(jì)算機(jī)公共課教學(xué)改革還需要繼續(xù)研究、探索和實(shí)踐,任重而道遠(yuǎn)。