馮宇 肖源源
摘? ?要:自然語言處理是(Natural Language Processing,NLP)一種人工智能技術(shù),可對大學(xué)生評教內(nèi)容、情感以及相關(guān)影響因素進行量化分析。隨著人工智能技術(shù)與教育教學(xué)逐步走向深度融合,研究其在評教領(lǐng)域的適用性有助于教育工作者更好地利用此項技術(shù)服務(wù)于教育教學(xué)。文章基于技術(shù)原理與第四代教育評價理論就適用性問題開展討論。研究表明,自然語言處理技術(shù)在大學(xué)生評教的理論與實際應(yīng)用層面均體現(xiàn)出良好的適用性。
關(guān)鍵詞:自然語言處理;評教;適用性;大學(xué)生;第四代評估理論
中圖分類號:G640 文獻標(biāo)志碼:A 文章編號:1673-8454(2019)23-0063-04
自然語言處理是利用電子計算機對人類特有的書面形式和口頭形式自然語言信息進行各種類型處理和加工的技術(shù)。這種技術(shù)現(xiàn)在已經(jīng)形成一門專門的邊緣性交叉學(xué)科,它涉及語言學(xué)、數(shù)學(xué)和計算機科學(xué),橫跨文科、理科和工科三大知識領(lǐng)域[1]。
近年來,國家對人工智能(Artificial Intelligence,AI)相關(guān)技術(shù)在教育領(lǐng)域內(nèi)的相關(guān)研究高度重視。強調(diào)應(yīng)不斷地推進AI在教育各個領(lǐng)域的應(yīng)用,促進現(xiàn)代教育技術(shù)與教育教學(xué)深度融合。[2]在國家的倡導(dǎo)與推動下,自然語言處理在評教領(lǐng)域的應(yīng)用研究開始得到了越來越多學(xué)者的關(guān)注。
本文查詢了CNKI數(shù)據(jù)庫中公開發(fā)布的學(xué)術(shù)論文,其結(jié)果表明自然語言處理相關(guān)技術(shù)在評教領(lǐng)域的研究成果不多。成果主要為情感詞典與神經(jīng)網(wǎng)絡(luò)的設(shè)計與分析,均為技術(shù)層面的探討。檢索非結(jié)構(gòu)化文本數(shù)據(jù)在評教中可能涉及到的關(guān)鍵字,關(guān)于評語的有5篇、情感分析的有31篇。情感詞典法主要有袁陽基于半監(jiān)督集成學(xué)習(xí)的學(xué)生評教情感進行了分類模型有關(guān)研究[3];張捷則探討了學(xué)生情感分析在課程教學(xué)評價中的作用與實施路徑[4];機器學(xué)習(xí)方法方面的研究則有孔凡華的基于模糊綜合評價法的中學(xué)學(xué)生評教模型[5]和張俊飛的基于改進樸素貝葉斯算法實現(xiàn)評教評語情感分析[6]。以上研究尚未討論技術(shù)方法層面在評教理論與應(yīng)用中的適用性問題。
自然語言處理作為一種文本量化分析技術(shù),理論上是可以用于學(xué)生評教文本數(shù)據(jù)的量化分析的??紤]到評教構(gòu)成要素與學(xué)生心理行為的復(fù)雜性,自然語言處理作為一種新的技術(shù)要很好地適用于大學(xué)生評教還需進行一定的理論與實證研究。本文從第四代評估理論自然語言處理的基本原理入手,結(jié)合具體案例,討論了自然語言處理在評教領(lǐng)域內(nèi)的理論價值,旨在分析自然語言處理的文本量化結(jié)果與評教目的、評教內(nèi)容、評教主體客體等維度的契合與適宜程度。
一、自然語言處理基本原理與方法
自然語言處理是基于腦科學(xué)的一種仿生技術(shù),包含語言解析、語義理解和語言生成,其整體邏輯如圖1所示。具體用途包括語義分析和語音識別。
腦科學(xué)認為,人類大腦左半球中的布羅卡氏區(qū)和韋尼克氏區(qū)是其運動語言中樞,功能是使語言映象轉(zhuǎn)變?yōu)檎f話所必需的肌肉運動。布羅卡氏區(qū)負責(zé)生成語言的形式與結(jié)構(gòu),即語言的處理與話語的生成;而韋尼克氏區(qū)則負責(zé)語言的內(nèi)在邏輯與含義,即負責(zé)語言的解析;另外信息的搜索、推理和決策是由大腦前額葉完成[7]。本文主要討論語義分析部分,側(cè)重于文本內(nèi)容挖掘的詞云和情感分析。
當(dāng)前自然語言處理中涉及語義分析的主要方法有詞云、情感分類、語義網(wǎng)絡(luò)等。其中比較有代表性的是情感分類,方法主要分為情感詞典和機器學(xué)習(xí)兩類。情感詞典基于分詞引擎對學(xué)生評教評語進行切詞,經(jīng)去除停用詞,再匹配正負面情感詞庫,來計算學(xué)生評教記錄的正負面情感強度,亦可將二者相減,得到情感極性;機器學(xué)習(xí)則通過標(biāo)注詞性,并在此基礎(chǔ)之上進行句法分析,模型上使用較多的有卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、支持向量機等。以卷積神經(jīng)網(wǎng)絡(luò)為例,可通過設(shè)定多層的神經(jīng)網(wǎng)絡(luò),進行一系列的卷積池化過程來提取最顯著的特征,最后用全連接層來進行情感分類。從相關(guān)文獻所描述的實際應(yīng)用效果上看,在部署得當(dāng)?shù)臈l件下,兩種方法沒有明顯的優(yōu)劣之分。
二、自然語言處理在理論層面的適用性
第四代評價理論包含響應(yīng)式聚焦和建構(gòu)主義方法論兩大核心思想。對于評教而言:一是可通過響應(yīng)式聚焦(responsive focusing),把學(xué)生的主張、焦慮、爭議等作為組織要素,在多元價值體系框架內(nèi),來提取課堂教學(xué)中存在的不良問題或有益經(jīng)驗;二是通過建立一種評估者和利益相關(guān)者的協(xié)商互動模式來實施整個程序[9]。自然語言處理很好地適應(yīng)了評教理論的現(xiàn)實要求,可通過提取評教文本中的負面情感極性評語來找出問題,在反饋渠道暢通的情況下,可通過積極互動,來達到優(yōu)化評教效果的目的。
學(xué)生評教與專家評價、同行評教以及教師自評一道共同構(gòu)成了評教的多元價值體系,本質(zhì)上是一種對教師課堂教學(xué)全過程的情感與心理建構(gòu)。自然語言處理通過情感分類算法,最終得到的情緒方面內(nèi)容是其重要的組成部分,兩者內(nèi)涵上均體現(xiàn)出高度一致。評教與情感密切相關(guān),學(xué)生評教文本反映的是其對課堂教學(xué)的主觀認識。自然語言處理得出的量化分析結(jié)果是將文本所蘊含的情感強度,情感極性作為新設(shè)變量,與原數(shù)據(jù)集構(gòu)成新的矩陣,所得到的統(tǒng)計量與情感密切相關(guān),體現(xiàn)了學(xué)生對課堂教學(xué)的心理變化。綜上,自然語言處理作為文本量化分析的一種有效方法,與評教的理論內(nèi)涵、數(shù)據(jù)形式具有很好的一致性,適用于當(dāng)前大規(guī)模的學(xué)生評教文本量化分析。從而可以實現(xiàn)方法與理論層面的統(tǒng)一。
三、自然語言處理在實踐層面的適用性
評教在當(dāng)前教育教學(xué)實踐中,作為內(nèi)部質(zhì)量保障體系中的重要環(huán)節(jié),涉及的利益相關(guān)者主要有學(xué)生、教師、管理者,他們構(gòu)成了評教在實踐層面的三個重要支點。學(xué)生按照行政指令,通過反思自身的學(xué)習(xí)效果,來對課程或者任課教師進行評價,既滿足其對課堂教學(xué)情況進行傾訴的情感需要,也在一定程度上體現(xiàn)了學(xué)生的滿意程度;教師也需要通過學(xué)生評教來幫助其把握教學(xué)效果,調(diào)適自身的行為,來進一步改進教學(xué);管理者通常站在學(xué)校層面來思考問題,希望評教能夠幫助其評價教師教學(xué),用于職稱評定與績效考核等。因此,自然語言處理要在評教實踐層面具備一定的適用性,就必須在一定程度滿足評教利益相關(guān)者的訴求,符合現(xiàn)實需要,擁有較好的使用體驗,方才具備實踐層面上的現(xiàn)實價值。自然語言處理在評教中應(yīng)重點服務(wù)以下三個方面:
1.彰顯學(xué)生評教主體地位
學(xué)生評教的積極性不高是評教飽受質(zhì)疑的一個重要原因。支撐學(xué)生參與評教的兩類原因有兩個:一是行政上的強制。強制措施能夠保證一定的參評率,但也需看到,特定課堂教學(xué)對學(xué)生的作用是不可逆的,評教結(jié)果對學(xué)生不存在直接影響,也無法觸及其現(xiàn)實利益。二是體現(xiàn)學(xué)生權(quán)利。事實上,各高校評教結(jié)果普遍沒有面向?qū)W生進行反饋,即便反饋也最多公布任課教師的評教得分,學(xué)生無法尋找到自身對課堂教學(xué)評價的歷史痕跡,使得作為評教主體的學(xué)生存在感不強,彰顯權(quán)利的訴求沒有得到充分尊重。
2.促進教師專業(yè)化發(fā)展
排除個別學(xué)生的干擾信息,從總體來把握課堂教學(xué)情況,是任課教師普遍需要的。教師需要從學(xué)生那里得知學(xué)生對課堂教學(xué)的反饋信息,尤其是涉及情感認同的信息。課上的好不好,學(xué)生最有發(fā)言權(quán)。評教對于教師來說,最大的一個難點就是從評教整體中得出學(xué)生關(guān)注什么內(nèi)容、存在哪些典型問題、應(yīng)聚焦哪個方面予以改進。部分課程的情感得分與極性如表1所示。
通過自然語言處理,教師可就學(xué)生評教中的情感得分來了解自身的授課水平。將數(shù)據(jù)集中的情感極性做簡單的篩選,即可提取負面評語。部分課程評語如表2所示。
參照情感極性表,可提取負面評語并將其直接反饋給任課教師,供其改進教學(xué)方式方法。自然語言處理中的語義網(wǎng)絡(luò)及詞云技術(shù),能夠從總整體上提取評教文本特征,給教師提供參考,有利于任課教師有針對性地改進教學(xué)。
3.幫助管理者理順評教相關(guān)影響因素
管理者普遍關(guān)心的是教學(xué)質(zhì)量好不好,學(xué)生是否滿意等方面內(nèi)容,在制定政策和進行決策時,需要這一類的信息作為參考。自然語言處理能以較低的成本提取所有評教記錄中的負面評價,改變了以往評教文本特征提取困難的問題,并通過公開發(fā)布評教結(jié)果,激發(fā)學(xué)生參與評教的熱情,彰顯學(xué)生評教的主體地位。譬如可以繪制評教評語的詞云。它是按照一定的運算模型對所分析的文本,調(diào)用分詞引擎對語句進行處理,并統(tǒng)計分詞后各詞出現(xiàn)的頻率,形成詞頻表,如表3所示。
繪制詞云時,程序根據(jù)各詞出現(xiàn)頻率的大小來排布結(jié)構(gòu)。頻率越高的詞,將分布在詞云的中心位置,字體也較大,體現(xiàn)了該詞在文本中的重要程度。
自然語言處理能夠基于情感因素對評教文本進行分析,可以輔助管理者了解學(xué)生訴求,進而對教學(xué)質(zhì)量、學(xué)生滿意度做出估計,為解決教育教學(xué)中現(xiàn)實存在的問題提供依據(jù)。
四、討論建議
基于本文對大學(xué)生評教文本的量化分析結(jié)果,可得出以下結(jié)論:一是自然語言處理可有效適用于大學(xué)生評教文本分析,在大規(guī)模數(shù)據(jù)集中具有優(yōu)勢;二是自然語言處理對文本情感因素的提取,較好地符合了第四代評價理論的內(nèi)在要求,可把學(xué)生情感作為組織要素,提取課堂教學(xué)中存在的問題;三是對學(xué)生評價評語進行自然語言處理,有助于彰顯學(xué)生權(quán)利,輔以面向?qū)W生的結(jié)果反饋,有助于提升學(xué)生評教的積極性;四是教師、管理者可結(jié)合分析結(jié)果,進一步了解學(xué)生的所思所想。
綜合上述問題與討論,本文認為自然語言處理技術(shù)在學(xué)生開放式評教領(lǐng)域內(nèi)能夠有所作為,但要從根本上解決問題,單純依靠技術(shù)效果是有限的,相關(guān)建議如下。
1.廣泛利用自然語言處理等現(xiàn)代化教育技術(shù),用數(shù)據(jù)說話,形成科學(xué)合理的診斷式評價機制
是否具備較強的科學(xué)計算能力,是衡量高校教育現(xiàn)代化水平的重要方面。其有助于高校從大量的信息稀疏數(shù)據(jù)中提取真正有價值內(nèi)容。本文認為學(xué)生評語在內(nèi)容維度、情感強度等方面存在“總體無效,局部有效”的問題,其解決方案是通過現(xiàn)代化的數(shù)據(jù)分析手段從海量的數(shù)據(jù)中找出有價值的部分并加以分析。實證結(jié)果表明:真正有高價值的數(shù)據(jù)只占總評語記錄的2%,是一個非常小的比例,但是它所蘊含的信息是非常大的,有助于迅速找出問題所在并及時反饋給各利益相關(guān)者,為改進暴露出的問題提供參考。要認識到評教是幫助存在缺陷的課程找到問題,并通過不斷地查找問題、分析問題、解決問題、反饋問題,來閉環(huán)教學(xué)質(zhì)量監(jiān)控主要環(huán)節(jié),最終促進教學(xué)質(zhì)量的持續(xù)改進。
2.加強管理隊伍建設(shè),打造高度專業(yè)化的教學(xué)管理隊伍
一流的大學(xué)呼喚一流的教學(xué)管理隊伍。沒有高度專業(yè)化的教學(xué)管理隊伍,其教育教學(xué)運行與管理狀況將會是低效且無能的。新技術(shù)在管理層面的應(yīng)用將極大推動高等教育的現(xiàn)代化水平。教育管理有其自身的特殊性,不能簡單參照企業(yè)管理的思路與標(biāo)準(zhǔn)進行實施。學(xué)生評教機制的優(yōu)化關(guān)鍵在高校管理層面。然而管理隊伍自身的建設(shè)并不樂觀,據(jù)了解,部分高校將每年新進人員的指標(biāo)全部劃撥到教學(xué)一線,以改善師資學(xué)歷結(jié)構(gòu),管理人員的補充只能從教師隊伍中補充。這部分人員往往被認為不適宜從事教學(xué)工作,就被分流至管理隊伍中去。且管理隊伍中因干部個人發(fā)展需要,人員流失嚴(yán)重,這勢必會傷害高校的長遠發(fā)展。因此,加大管理隊伍的人才引進,提高待遇與職業(yè)榮譽已刻不容緩。
3.加強開放式評教的研究,強化信息雙向反饋,并在適當(dāng)?shù)姆秶枰怨?/p>
開放式評教與封閉式評教都是評教工作的重要組成部分,不應(yīng)有所偏廢。尤其是評語,學(xué)生以敘事、情感表達等方式,描述了對課堂教學(xué)的基本看法。它從定性評價的角度對基于指標(biāo)體系的定量評價形成了有效的補充。就本文對學(xué)生評語的實證研究經(jīng)驗來看,其中所蘊含的教學(xué)能力、師德師風(fēng)、學(xué)習(xí)效果、情感傾向等內(nèi)容,對指導(dǎo)教師改進教學(xué)、促進管理者優(yōu)化機制有著重要的參考價值。將評語的相關(guān)內(nèi)容及時進行反饋,有利于強化各利益相關(guān)者對教學(xué)質(zhì)量的監(jiān)督。缺少結(jié)果反饋的評教機制,其課堂教學(xué)質(zhì)量的高低也只能更多地取決于教師的“良心”。很多高校以保護教師隱私為名,人為阻斷了評教結(jié)果的雙向反饋,是不利于及時獲取信息并改進教學(xué)的。
4.應(yīng)關(guān)注學(xué)生評價的情感因素,集體對評教行為和評教機制進行糾偏
評教體現(xiàn)出了學(xué)生對課堂教學(xué)的情感判斷,源于當(dāng)前大學(xué)生特定的心理狀態(tài),這個是很難改變的現(xiàn)實情況。如果學(xué)生普遍具有較高的思想認識和評教能力,或許能夠做到對課堂教學(xué)質(zhì)量的客觀評價。但是本文認為這是一個短期內(nèi)無法解決的問題,所以評教所得到的結(jié)果只會是一個對課堂教學(xué)的滿意度評價(或許還能通過技術(shù)手段對數(shù)據(jù)進行處理,提取出能夠反映質(zhì)量的學(xué)生評價)。因此各利益相關(guān)者有必要正確認識這一點,將評教結(jié)果更多地視為指針而非量尺。更多地基于問題導(dǎo)向去不斷解決暴露出的問題,促使更多人群關(guān)注教學(xué)質(zhì)量,而不僅僅認為只是管理者的職責(zé)。這樣才能提高認真參與評教學(xué)生的占比,促成更多學(xué)生進行有效的、高價值的評價,提高學(xué)生評教的信效度。這一狀況改善得越好,評教工作就越具有公信力,也就越能形成良好的質(zhì)量文化。
參考文獻:
[1]付習(xí)濤.言語行為與自然語言處理[J].湖南第一師范學(xué)報,2004(2):5-9.
[2]佚名.國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》 人工智能發(fā)展鋪就快軌[J].中國戰(zhàn)略新興產(chǎn)業(yè),2017(33):14.
[3]袁陽.基于半監(jiān)督集成學(xué)習(xí)的學(xué)生評教情感分類模型研究[D].廣州:華南理工大學(xué),2018.
[4]張捷,陳付龍,張佩云.學(xué)生情感分析在課程教學(xué)評價中的作用與實施探討[J].電腦知識與技術(shù),2019,15(4):184-188.
[5]孔凡華.基于模糊綜合評價法的中學(xué)學(xué)生評教模型[J].現(xiàn)代中小學(xué)教育,2017,33(2):80-84.
[6]張俊飛.基于改進樸素貝葉斯算法實現(xiàn)評教評語情感分析[J].現(xiàn)代計算機(專業(yè)版),2018(32):3-6.
[7]申小龍.索緒爾“語言”和“言語”概念研究[J].中國海洋大學(xué)學(xué)報(社會科學(xué)版),2004(6):65-74.
[8]鄭捷.NLP漢語自然語言處理原理與實踐[M].北京:電子工業(yè)出版社,2017.
[9]古貝,林肯著;秦霖,蔣燕玲等譯.第四代評估[M].北京:中國人民大學(xué)出版社,2008:9-79.
(編輯:王曉明)