蔣興超 史釙鐳
摘? ?要:長久以來,母語寫作評價都依賴于教師評價,存在種種弊端。人工智能時代的來臨,為母語寫作評價帶來了機遇。展望人工智能評價與教師評價的現(xiàn)狀與未來,檢視人工智能評價和教師評價的實驗與糾偏,可以發(fā)現(xiàn)人工智能評價和教師評價的未來將相互依賴與共存。
關(guān)鍵詞:母語寫作;人工智能評價;教師評價
人工智能時代的到來,以其便捷、智能、高效的優(yōu)勢,無孔不入。長久以來,母語寫作評價都依賴于教師評價,存在種種弊端。人工智能可以替代教師,評價母語寫作嗎?人工智能寫作評價,已廣泛運用于英語寫作,母語寫作也能運用嗎?本文基于人工智能評價研究的基礎(chǔ)與現(xiàn)狀,進行如下三層構(gòu)想。
一、展望,人工智能評價與教師評價的現(xiàn)狀與未來
(一)母語寫作評價的現(xiàn)狀與不足
母語寫作評價,包括定量評分和定性評語兩種評價方式。定量評價是對學(xué)生作文賦分或定級的評價,而定性評價是針對作文整體或局部進行或褒揚優(yōu)點或指明不足的評語性評價。兩種評價都從字、詞、句、篇等方面進行量衡,主要涵蓋內(nèi)容、結(jié)構(gòu)和表達三個維度。
現(xiàn)行的兩種評價都是以教師為主導(dǎo)的評價(以下簡稱教師評價)。其缺點是評價者個人主觀性較強,同一篇文章不同評價者的評價結(jié)果往往相差較大——這容易挫傷學(xué)生寫作的積極性,誤導(dǎo)學(xué)生寫作的方向;數(shù)量極大的考卷容易讓評價者產(chǎn)生閱卷疲勞,降低評價質(zhì)量,教師也無法真實地把握學(xué)生寫作中存在的問題與不足,難以對癥下藥等——這嚴重影響作文教學(xué),降低了作文評價的效能。在此背景下,便捷高效的人工智能寫作評價(以下簡稱人工智能評價),成為母語寫作評價的時代之需。
(二)人工智能評價的原理與優(yōu)勢
人工智能視域下的寫作評價是借助人工智能技術(shù)領(lǐng)域中一個分支,即自然語言處理(Natural Language Processing,簡稱NLP)技術(shù)。而自然語言處理技術(shù),就是人工智能寫作評價的核心技術(shù)。
自然語言即人類日常使用的語言,比如口語表達或書面文本。自然語言處理,就是利用電子計算機為工具對人類特有的書面和口頭形式的自然語言進行各種類型的處理和加工的技術(shù)。以自然語言處理技術(shù)為主的各種自然語言處理系統(tǒng),包括機器翻譯系統(tǒng)、自然語言理解系統(tǒng)、自動檢索系統(tǒng)、文字自動識別系統(tǒng)、數(shù)據(jù)庫系統(tǒng)等。[1]
人工智能評價的基本原理是基于語言學(xué)專家開發(fā)的大型詞法、句法和語義規(guī)則庫,用人工智能技術(shù)對作文語境、詞法、句法、語義以及篇章等進行多維度分析,從而解析作文的篇章結(jié)構(gòu)、主題、通順度、豐富度、修辭手法、錯別字和語病等。
人工智能寫作評價基本過程主要分為六步。第一步,獲取。采用紙質(zhì)文本掃描及文字識別技術(shù)獲取原始文本并轉(zhuǎn)為數(shù)字文件。第二步,標準化。對文本進行預(yù)處理,去除無關(guān)內(nèi)容,保留待分析內(nèi)容。第三步,分解詞。采用分詞技術(shù)將文本按詞組分開,并構(gòu)造文本樹。第四步,詞法分析。對名詞、動詞、形容詞、副詞、介詞等進行定性。第五步,語法分析。分析主語、謂語、賓語、定語、狀語、補語等句子元素。第六步,語義分析。分析句子、語段、文章的內(nèi)涵,將其含義正確地表達出來?;谶@六步,人工智能評價和教師評價一樣,進行定量評分和定性評語兩種評價。[2]
人工智能評價的優(yōu)點是:智能,高效,評價穩(wěn)定高,評價更公平,為教師、教學(xué)提供海量寫作數(shù)據(jù),更易對學(xué)生寫作中存在的問題對癥下藥。
(三)人工智能評價的探索與機遇
國內(nèi)人工智能評價的探索與建設(shè)有兩類:一類是針對英語寫作的評價,另一類是針對母語寫作的評價。
先說針對英語寫作評價的探索。最具代表性的是北京詞網(wǎng)科技有限公司開發(fā)的批改網(wǎng),已累計批改作文超5.3億篇。批改網(wǎng)是智能批改英語作文的在線服務(wù)系統(tǒng),它通過將學(xué)生的作文和海量標準語料庫進行對比分析,能在1.2秒內(nèi)對英語作文給出分數(shù)、總評、按句糾錯的批改反饋。該系統(tǒng)能有效幫助教師提高工作效率,幫助學(xué)生有效提高英文寫作能力。[3]針對英語寫作評價的研究十分廣泛,技術(shù)已十分成熟,被廣泛運用到教學(xué)實踐中。
再說針對母語寫作評價的嘗試。中國語言智能研發(fā)中心發(fā)布了一款智能批改系統(tǒng)——IN課堂語文作文批改系統(tǒng),它使用可以擴展的“知識庫”來解釋學(xué)生作文的“一般邏輯”和“含義”,突出需要改進的文體、結(jié)構(gòu)和主題領(lǐng)域的問題。系統(tǒng)能夠讀懂文意,注意到段落是否偏離主題。測試效果尚佳。[4]但這一技術(shù)尚屬實驗研究階段,還未得到科學(xué)、廣泛的認同。百度AI面向中小學(xué)學(xué)校教育,搭建百度智慧課堂云平臺,為中小學(xué)教學(xué)提供了各種智能化服務(wù),其中作文智能評閱系統(tǒng),整合百度教育AI能力,嘗試智能評閱服務(wù)。
隨著人工智能技術(shù)的日臻成熟,相信人工智能將會成熟、廣泛地運用到母語寫作評價中,扮演十分重要的角色。
二、檢視,人工智能評價和教師評價的實驗與糾偏
(一)人工智能評價的原理學(xué)習(xí)與系統(tǒng)建構(gòu)
深諳人工智能評價的方法原理。人工智能評價的方法原理,涵蓋了信息采集技術(shù)、分解詞技術(shù)、詞法分析技術(shù)、語法分析技術(shù)、語義分析技術(shù)和標準化制定技術(shù),這些技術(shù)融合了計算機、母語寫作、評價研究、數(shù)據(jù)收集與分析等多個跨界領(lǐng)域。只有了解、研究、深諳這些技術(shù)與方法原理,才能建構(gòu)科學(xué)的人工智能評價體系,在反復(fù)實驗和糾偏的過程中才容易得心應(yīng)手。
建構(gòu)科學(xué)、高效、便捷的人工智能評價體系。構(gòu)建科學(xué)、高效、便捷的人工智能評價體系有兩種方式:一、基于國內(nèi)已有的實驗評測系統(tǒng)平臺,對其進行實驗、檢驗和再建;二、根據(jù)人工智能評價的方法原理,重新開發(fā)新的評測系統(tǒng)平臺。無論何種方式,都需要多學(xué)科跨界技術(shù)的支撐和深度融合,特別是人工智能技術(shù)和母語寫作的專業(yè)評價之間的互融、共建。母語寫作的人工智能評價,可借鑒成熟的外語寫作人工智能評價;母語寫作有別于外語寫作特殊的言語表達,更要求互融、共建的溫度與效度。
(二)人工智能評價與教師評價的對照與修正
兩種評價對照與修正的路徑。首先,在多個地區(qū)、多所學(xué)校選擇多個生源層次不同的實驗班級,作為實驗研究對象。其次,選取多種任務(wù)、多種類型、多種文體的寫作,作為參照數(shù)據(jù)。然后,以教師評價和人工智能評價兩種評價方式,分別進行賦分評價和評語評價。接著,對教師評價和人工智能評價進行對照分析。最后,以教師評價為基準,對人工智能評價存在的缺陷與不足進行修正、優(yōu)化。對照、修正路徑如圖1。
[實驗班級][教師評價][人工智能評價][對照、修正][基準][優(yōu)化策略
實施方案
][實踐檢驗
]
圖1
兩種評價的多輪對照、修正與完善。上述對照、修正的路徑,需多次、反復(fù)試驗才能提高人工智能評價的準確性與穩(wěn)定性。多次、反復(fù)試驗,離不開如下幾大要素:一、寫作類型、文題與文體的多次轉(zhuǎn)換;二、教師評價主體的多元構(gòu)成,多次輪換;三、寫作主體的多元組成,多樣式寫作的變換。在寫作主體、評價主體、寫作內(nèi)容的多次調(diào)配、組合和變換后,兩者評價的數(shù)據(jù)對照才更具可靠和穩(wěn)定?;诖?,修正和完善人工智能評價才更有價值和意義。
(三)人工智能評價與教師評價效度一致性的檢驗
人工智能評價的效度一致性檢驗。檢驗人工智能評價效度的具體方案如下:首先選擇三個層次大致相同的教學(xué)班級,分別作為實驗班級、對照班級1和對照班級2;然后,三個班級共同執(zhí)行相同的寫作任務(wù);實驗班級的寫作評價由人工智能評價和教師評價共同完成,對照班級1的寫作評價由人工智能評價完成,對照班級2的寫作評價由教師評價完成;接著將實驗班級、對照班1和對照班2的評價結(jié)果進行三方對比、分析;三方數(shù)據(jù)對比、分析后,再對學(xué)生和教師進行問卷調(diào)查、觀察和訪談,了解、探究深層次原因,對人工智能評價進行完善;最后通過寫作測驗,再次檢驗人工智能評價效度的穩(wěn)定性。檢驗人工智能評價效度一致性如圖2。
[實驗班級][對照班級1][對照班級2][教師評價][人工智能評價][效果檢驗][調(diào)整與完善][人工智能評價+
教師評價][寫作測驗][效度一致性檢驗][問卷調(diào)查
課堂觀察
個別訪談][實驗探究]
圖2
成熟的人工智能評價系統(tǒng)建設(shè)。人工智能評價體系建設(shè)路徑為:系統(tǒng)開發(fā)——實驗、對照、修正——多輪檢視與完善——效度一致性檢驗——再實驗、修正、完善——成熟模式。在多輪動態(tài)、變化的實驗、檢視中不斷修正和完善,以至日臻成熟。這是人工智能評價走向成熟、得以推廣的最為重要的環(huán)節(jié),否則人工智能評價的準確性和穩(wěn)定性都將大大降低,人工智能評價也終將是紙上談兵。
三、融合,人工智能評價和教師評價依賴與共存
(一)人工智能評價給教師評價提供精準反饋
準確、穩(wěn)定和成熟的人工智能評價,能給教師評價提供海量數(shù)據(jù),作出精準診斷,反饋突出問題和典型案例,有利于教師精準化指導(dǎo),有利于寫作教學(xué)的精深化推進,還有利于教師評價的精細化開展。
人工智能評價提供海量數(shù)據(jù)?;ヂ?lián)網(wǎng)的便捷與普及,使學(xué)生寫作愈加擁抱和融入人工智能評價。長而久之,人工智能評價就能為教師提供海量的評價數(shù)據(jù)。海量數(shù)據(jù)涵蓋了各種類型寫作的真實樣態(tài)、某一文體寫作的現(xiàn)存問題、某類問題的癥結(jié)之處、某個地區(qū)的寫作狀況、某所學(xué)校的整體水平、某個學(xué)生的大致走向……這些海量數(shù)據(jù)直觀地呈現(xiàn)了寫作水平、優(yōu)點與不足,為及時矯正、精準推進提供了極大便利。
人工智能評價能作出精準診斷。人工智能評價精準診斷主要包括三個層面:一是對地域整體水平的診斷,比如這個地區(qū)寫議論文可能說理不夠有力,那個地區(qū)寫記敘文描寫不夠細致;二是對某類主題、文體、任務(wù)驅(qū)動寫作的水平診斷,例如親情類主題寫作、演講稿的寫作、情境任務(wù)類寫作問題主要集中在哪里;三是對學(xué)生個人寫作水平的診斷,比如某個學(xué)段、某種文體、某種類型的寫作,以前和現(xiàn)在比是否有變化。這些診斷,為教師評價的刻意、集中關(guān)注提供了便利。
人工智能評價還反饋突出問題和典型案例。人工智能評價反饋學(xué)生寫作中出現(xiàn)的某類突出的問題,比教師評價更容易及時、準確地找到短板,促使教師針對突出問題集中深研、改進和再評價,以至突破。人工智能評價發(fā)現(xiàn)學(xué)生寫作的共性優(yōu)點和典型案例,也容易被發(fā)現(xiàn)和放大,促進學(xué)生整體寫作水平的發(fā)展。
(二)教師評價能補位人工智能評價的溫度關(guān)懷
人工智能評價是以教師評價為基準反復(fù)實驗、檢校和優(yōu)化后的智能標準化的評價。標準化的缺陷是缺少個性化,缺少溫度。教師評價便補位了人工智能評價的這一短板。
教師評價的情感融入。人工智能評價的層級賦分和評語生成,有固化的思維與樣式;而教師評語則有情感融入,這是人工智能評價所無法相比的。教師針對學(xué)生寫作的內(nèi)容,可以有深層次的對話和互動,或觸發(fā)情思,或交流技法,或引動思考……融入情感的評價,更有溫度和價值。歸根結(jié)底,評價不是目的,而是手段,是為了將學(xué)生引向精神追求的高地,是為了激發(fā)學(xué)生寫作的興味,是為了促進學(xué)生寫作能力的全面提升。而教師評價,無疑才更符合評價的終極追求。
教師評價的個性化輔導(dǎo)。和教師評價相比,人工智能評價更顯得臉譜化、平庸化和平面化。教師評價能針對學(xué)生個體寫作,進行立體的、多層面的、個性化的交互和指導(dǎo)。人工智能評價根據(jù)字詞、句、段、篇評價語句、文段的連貫和文意情感的表達狀況,而教師評價則能跨越這些平面的、淺表的評價,更加走向深層,更容易和學(xué)生個體形成深度交互,有利于學(xué)生個體的重審和再修,更易于學(xué)生個體的能力成長。
(三)人工智能評價與教師評價的融合發(fā)展
互補互鑒。人工智能評價發(fā)展到成熟和高階階段,將會和教師評價形成互補互鑒的局面。當大批量的作文批改降低了教師評價的效率與質(zhì)量時,人工智能評價能發(fā)揮評價的客觀性、穩(wěn)定性與高效率。當學(xué)生個體寫作需要精細化、個性化的輔助時,教師評價的溫度、深層交互的優(yōu)勢就會派上用場。兩種評價互為補充,共生共存。
因需而評。人工智能評價和教師評價,各有所長,各有優(yōu)勢。因不同的評價需要,選擇不同的評價方式,是較為可取的做法。比如,大型考場作文批改,適宜采用人工智能評價,避免教師評價的主觀性和隨意性,發(fā)揮人工智能評價的客觀性和穩(wěn)定性,這樣更公平。再比如,要解決班級長久以來存在的某一類寫作問題時,適合采用教師評價,這樣更容易集中發(fā)現(xiàn)問題,深究問題,攻克問題。再例如,常規(guī)寫作訓(xùn)練,為了提高批改效率,及時發(fā)現(xiàn)問題,先采用人工智能評價,后采用教師評價,兩者結(jié)合效率更高。
聯(lián)動、融合發(fā)展。人工智能評價經(jīng)過反復(fù)實驗、檢視和完善后逐漸走向成熟,但也不是一成不變的。教育改革的不斷發(fā)展,也倒逼母語寫作評價的變革發(fā)展。教師評價發(fā)展,必然聯(lián)動人工智能評價的再調(diào)整與再適用,以至兩種評價的再融合和再發(fā)展。到那時,評價就邁上了更高的臺階。
參考文獻:
[1]李彥峰. 人工智能在自然語言處理中的應(yīng)用[J]. 襄陽職業(yè)技術(shù)學(xué)院學(xué)報,2018(4):71-78.
[2]趙玉想. 單句句子成分及其分析[J].中學(xué)生閱讀(高中教研版),2013(11):63.
[3]王薇.句酷批改網(wǎng)在大學(xué)英語寫作教學(xué)中的可行性研究——以西南財經(jīng)大學(xué)天府學(xué)院為例[J]. 教育現(xiàn)代化2018(6):329-332.
[4]杜孟航. 人工智能在智能批改中的應(yīng)用分析[J]. 科技傳播,2019(4): 133-134.
教學(xué)月刊·中學(xué)版(語文教學(xué))2019年11期