国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智能寫(xiě)作評(píng)價(jià)及其技術(shù)發(fā)展

2021-12-29 00:00:00榮維東李自然

摘要: 智能寫(xiě)作評(píng)價(jià)是指使用計(jì)算機(jī)等現(xiàn)代技術(shù)對(duì)作文進(jìn)行自動(dòng)化評(píng)價(jià)的系統(tǒng)。隨著計(jì)算機(jī)及人工智能領(lǐng)域關(guān)鍵技術(shù)的不斷突破,國(guó)外智能寫(xiě)作評(píng)價(jià)系統(tǒng)的發(fā)展和應(yīng)用已進(jìn)入深水區(qū)。通過(guò)對(duì)國(guó)外相對(duì)成熟的寫(xiě)作評(píng)分系統(tǒng)的介紹與分析,文章對(duì)中文智能寫(xiě)作評(píng)價(jià)系統(tǒng)的關(guān)鍵詞提取技術(shù)、神經(jīng)網(wǎng)絡(luò)模型、語(yǔ)料庫(kù)進(jìn)行分析和介紹,指出我國(guó)中文智能寫(xiě)作評(píng)價(jià)面臨的困難,并對(duì)智能寫(xiě)作評(píng)價(jià)系統(tǒng)的發(fā)展與優(yōu)化進(jìn)行思考。

關(guān)鍵詞:人工智能;寫(xiě)作評(píng)價(jià);中文寫(xiě)作;技術(shù)進(jìn)展

寫(xiě)作評(píng)價(jià)指評(píng)價(jià)者依據(jù)一定的目標(biāo)和標(biāo)準(zhǔn),對(duì)寫(xiě)作過(guò)程和結(jié)果進(jìn)行價(jià)值判斷的過(guò)程。智能寫(xiě)作評(píng)價(jià)又叫“自動(dòng)作文評(píng)分”(automated essay scoring,AES),屬于“基于自然語(yǔ)言應(yīng)用處理的教育評(píng)價(jià)方法”[1]。它是指使用計(jì)算機(jī)等現(xiàn)代技術(shù)對(duì)作文進(jìn)行自動(dòng)化評(píng)價(jià)的系統(tǒng),在國(guó)外始于20世紀(jì)60年代,發(fā)展到今天已經(jīng)相對(duì)成熟。但由于漢語(yǔ)寫(xiě)作的特殊性和復(fù)雜性,中文智能寫(xiě)作評(píng)價(jià)仍存在語(yǔ)義理解不準(zhǔn)確、評(píng)分細(xì)則不清晰、評(píng)分系統(tǒng)不完善等問(wèn)題。本文擬介紹國(guó)外主流智能寫(xiě)作評(píng)價(jià)系統(tǒng)以及中文寫(xiě)作評(píng)價(jià)關(guān)鍵技術(shù)進(jìn)展,并對(duì)我國(guó)中文智能寫(xiě)作評(píng)價(jià)的發(fā)展進(jìn)行思考。

一、國(guó)外智能寫(xiě)作評(píng)價(jià)系統(tǒng)發(fā)展概述

目前,國(guó)外著名的自動(dòng)作文評(píng)價(jià)系統(tǒng)主要有四種:PEG(project essay grade)、E-rater、IntelliMetric、IEA(the intelligent essay assessor)[2]。它們有一些共同的特點(diǎn):一般是先構(gòu)建評(píng)分操作模型,確定一組可度量的特性;然后對(duì)這些特征建模,使其生成最大化分?jǐn)?shù),并與一些外部標(biāo)準(zhǔn)形成對(duì)應(yīng)關(guān)系;最后,使用單獨(dú)的數(shù)據(jù)集進(jìn)行模型測(cè)試和驗(yàn)證,以檢查模型性能和模型的通用性并對(duì)其微調(diào)。當(dāng)模型顯示出在不同的真實(shí)數(shù)據(jù)集間有評(píng)分一致性和準(zhǔn)確性的水平,它便可以使用。

(一)PEG:由關(guān)注文本表層特征到關(guān)注復(fù)雜文本特征

PEG是埃利斯·佩奇(Ellis Page)等人于1966年應(yīng)美國(guó)大學(xué)委員會(huì)請(qǐng)求而研發(fā)的第一個(gè)自動(dòng)作文評(píng)價(jià)系統(tǒng),其目的是使大規(guī)模寫(xiě)作評(píng)分更加實(shí)際而高效。早期版本主要關(guān)注文章可量化的淺層語(yǔ)言學(xué)特征,基本不涉及內(nèi)容評(píng)判。修訂版于20世紀(jì)90年代發(fā)布,開(kāi)始使用自然語(yǔ)言處理工具,如語(yǔ)法檢查器和詞性標(biāo)記語(yǔ),能夠關(guān)注更豐富和更復(fù)雜的文本特性,更能顯示作者潛在的寫(xiě)作能力。

(二)E-rater:通過(guò)文本與數(shù)據(jù)庫(kù)信息匹配進(jìn)行評(píng)價(jià)

E-rater是由美國(guó)教育考試服務(wù)中心(ETS)于1998年開(kāi)發(fā)的專(zhuān)用智能寫(xiě)作評(píng)價(jià)系統(tǒng)。它依賴自然語(yǔ)言處理(NLP)和信息檢索(IR)提取文本特征的技術(shù),如應(yīng)用標(biāo)準(zhǔn)化(單詞)頻率指數(shù),使用基于向量空間模型的內(nèi)容向量分析來(lái)評(píng)估主題寫(xiě)作內(nèi)容,根據(jù)語(yǔ)篇分類(lèi)圖式和非詞匯句法結(jié)構(gòu)線索表示術(shù)語(yǔ),對(duì)于文本相關(guān)信息進(jìn)行標(biāo)簽匹配,結(jié)合ETS的數(shù)據(jù)庫(kù)審核考生的寫(xiě)作質(zhì)量。目前,主要考查學(xué)生作文的五大方面,即文章組織和發(fā)展、語(yǔ)法、用詞、格式、語(yǔ)言風(fēng)格。

(三)IntelliMetric:首個(gè)廣泛使用人工智能技術(shù)的作文評(píng)分軟件

它由卓越學(xué)習(xí)公司(Vantage Learning)于1998年發(fā)布,充分模擬人工評(píng)分過(guò)程,不斷通過(guò)人工校正其自動(dòng)給分點(diǎn),通過(guò)分析給分點(diǎn)之間的聚合關(guān)系,模擬人工從整體上評(píng)判作文的過(guò)程。它首先對(duì)給分點(diǎn)(包括主要的、次要的、聚群的和分散的)進(jìn)行標(biāo)記賦值,之后使用神經(jīng)合成方法訓(xùn)練系統(tǒng)獲取評(píng)分規(guī)則,建立評(píng)分模型,并使用專(zhuān)利技術(shù)減小誤差。據(jù)說(shuō)這是一個(gè)關(guān)注文章類(lèi)型、構(gòu)造等整體模式進(jìn)行評(píng)分的系統(tǒng),能夠達(dá)到令人滿意的高匹配的評(píng)閱結(jié)果。

(四)IEA:強(qiáng)調(diào)事實(shí)意義和內(nèi)容評(píng)價(jià)

IEA是在1998年由美國(guó)培生知識(shí)分析技術(shù)公司(KAT)基于潛在語(yǔ)義分析技術(shù)開(kāi)發(fā)的。潛在語(yǔ)義分析是指一種用于文本索引和信息提取的復(fù)雜統(tǒng)計(jì)技術(shù),2004年被培生(PTE)英語(yǔ)學(xué)術(shù)考試用來(lái)為學(xué)生的書(shū)面回答打分。

目前可用的四個(gè)AES系統(tǒng)中,IEA是唯一聲稱(chēng)可以基于語(yǔ)義內(nèi)容測(cè)量事實(shí)知識(shí)和意義的寫(xiě)作評(píng)估系統(tǒng),評(píng)價(jià)內(nèi)容時(shí)優(yōu)先考慮其事實(shí)意義的重要性。

其他智能寫(xiě)作評(píng)價(jià)系統(tǒng)還有加州測(cè)試局設(shè)計(jì)的Bookette、美國(guó)研制的AutoScore、BETSY貝葉斯作文評(píng)分系統(tǒng)等。

現(xiàn)有的智能寫(xiě)作評(píng)價(jià)系統(tǒng)多采用多種屬性來(lái)描述文章的特征,一般包括語(yǔ)法、書(shū)寫(xiě)規(guī)范、詞匯復(fù)雜性、風(fēng)格、組織和內(nèi)容的發(fā)展,使用的主要方法是自然語(yǔ)言處理(NLP),如詞性標(biāo)注(POS)、句法分析、句子碎片化、話語(yǔ)分割、命名實(shí)體識(shí)別、內(nèi)容向量分析(CVA)等。評(píng)價(jià)文章語(yǔ)義的主要分析方法有潛在語(yǔ)義分析(LSA)、潛在狄克雷分配(LDA)和內(nèi)容向量分析(CVA)[3]。

上述智能寫(xiě)作評(píng)價(jià)系統(tǒng)大多采用潛在語(yǔ)義分析技術(shù),它是一種推理語(yǔ)義的機(jī)器學(xué)習(xí)方法?,F(xiàn)今,英語(yǔ)智能寫(xiě)作評(píng)價(jià)系統(tǒng)早已商用并有大量實(shí)驗(yàn)數(shù)據(jù)支撐,但仍存在兩個(gè)爭(zhēng)議:一是文章的整體質(zhì)量取決于哪些重要內(nèi)容;二是機(jī)器能否用來(lái)把握文章內(nèi)容的意義。這同樣是中文智能寫(xiě)作評(píng)價(jià)系統(tǒng)需要問(wèn)答的問(wèn)題。

二、我國(guó)漢語(yǔ)智能寫(xiě)作評(píng)價(jià)技術(shù)進(jìn)展

教育部考試中心于1998年和1999年先后邀請(qǐng)美國(guó)ETS和英國(guó)劍橋大學(xué)考試委員會(huì)的專(zhuān)家來(lái)華,介紹他們網(wǎng)上評(píng)卷和軟件及自動(dòng)評(píng)卷系統(tǒng),希望能夠改進(jìn)我國(guó)的自動(dòng)評(píng)分現(xiàn)狀。技術(shù)的發(fā)展,也使智能寫(xiě)作評(píng)價(jià)系統(tǒng)的開(kāi)發(fā)成為可能。關(guān)鍵詞句提取技術(shù)、智能評(píng)價(jià)系統(tǒng)中的人工智能、大規(guī)模語(yǔ)料庫(kù)的發(fā)展與完善,是智能寫(xiě)作評(píng)價(jià)系統(tǒng)成功開(kāi)發(fā)的前提。使用智能系統(tǒng)輔助人工教學(xué)及評(píng)價(jià)是未來(lái)教育的發(fā)展趨勢(shì),相關(guān)技術(shù)與理論的發(fā)展、支持必定是重要的推動(dòng)器。

(一)中文智能寫(xiě)作評(píng)分實(shí)踐介紹

寫(xiě)作自動(dòng)評(píng)分系統(tǒng)開(kāi)始時(shí)更多適合于英語(yǔ),對(duì)于類(lèi)似中文、日文等黏著性語(yǔ)言,開(kāi)發(fā)寫(xiě)作自動(dòng)評(píng)分系統(tǒng)多了一重困難,即如何將單詞正確地細(xì)分到最小單位——詞素,以便提取量化文章特征。隨著計(jì)算機(jī)自然語(yǔ)言處理研究的發(fā)展,目前已開(kāi)發(fā)出比較成熟的計(jì)算機(jī)工具來(lái)完成分詞工作,為這一問(wèn)題提供了解決方法。

中文寫(xiě)作自動(dòng)評(píng)分研究業(yè)已起步,部分學(xué)者開(kāi)始大膽嘗試,主要體現(xiàn)在兩個(gè)方面:一是積極關(guān)注和介紹英文寫(xiě)作自動(dòng)評(píng)分系統(tǒng),借鑒學(xué)習(xí)它的理論和方法;二是開(kāi)展嘗試性研究,對(duì)各種中文寫(xiě)作自動(dòng)評(píng)分的方法進(jìn)行實(shí)踐驗(yàn)證,探索開(kāi)發(fā)中文寫(xiě)作評(píng)分系統(tǒng)的可能性[4]

1.中文作文智能評(píng)測(cè)系統(tǒng)及漢語(yǔ)寫(xiě)作教學(xué)綜合智能訓(xùn)練系統(tǒng)

由中國(guó)語(yǔ)言智能研究中心等機(jī)構(gòu)在北京聯(lián)合發(fā)布的中文作文智能評(píng)測(cè)系統(tǒng)及漢語(yǔ)寫(xiě)作教學(xué)綜合智能訓(xùn)練系統(tǒng)根據(jù)學(xué)習(xí)類(lèi)型可分為三部分:基于打分、評(píng)級(jí)、糾錯(cuò)等功能,從語(yǔ)料庫(kù)中挖掘打分細(xì)則、評(píng)級(jí)參數(shù)、常規(guī)范式,使得作文批改更客觀、科學(xué);將作文導(dǎo)入漢語(yǔ)作文智能評(píng)測(cè)系統(tǒng);系統(tǒng)借助語(yǔ)言大數(shù)據(jù),自動(dòng)評(píng)級(jí)、打分、糾錯(cuò),提供范例,對(duì)作文進(jìn)行批閱[5]。

2.漢語(yǔ)測(cè)試電子評(píng)分員

國(guó)內(nèi)一些學(xué)者也開(kāi)始了實(shí)證研究方面的嘗試。如張晉軍等提出“漢語(yǔ)測(cè)試電子評(píng)分員”的設(shè)想,并進(jìn)行了實(shí)驗(yàn)檢驗(yàn),隨機(jī)選取700份中國(guó)少數(shù)民族漢語(yǔ)水平等級(jí)考試(MHK)三級(jí)作文預(yù)測(cè)卷,并編寫(xiě)程序?qū)@些作文進(jìn)行評(píng)分,最后將人工評(píng)分和電子評(píng)分員的自動(dòng)評(píng)分結(jié)果進(jìn)行比較,發(fā)現(xiàn)電子評(píng)分員與人工評(píng)分的一致性達(dá)到較高水平,相關(guān)度為0.842。

3.中文寫(xiě)作自動(dòng)化評(píng)分系統(tǒng)(ACES)

中國(guó)臺(tái)灣學(xué)者林素穗等對(duì)非同步式網(wǎng)絡(luò)教學(xué)評(píng)價(jià)進(jìn)行研究,設(shè)計(jì)出漢語(yǔ)作文自動(dòng)評(píng)分程序。該程序是從語(yǔ)法層面,通過(guò)提取學(xué)生作文中的字詞進(jìn)行評(píng)價(jià),沒(méi)有語(yǔ)意分析的成分,使用的是向量空間模型評(píng)分方法,但未見(jiàn)報(bào)道實(shí)驗(yàn)進(jìn)程和結(jié)果。最近中國(guó)臺(tái)灣研發(fā)出一套中文寫(xiě)作自動(dòng)化評(píng)分系統(tǒng)(ACES),能自動(dòng)分析初中基準(zhǔn)測(cè)試考生的作文程度,并給予6個(gè)等級(jí)的評(píng)分。

4.智能評(píng)價(jià)系統(tǒng)實(shí)驗(yàn)

陳一樂(lè)針對(duì)智能化的中文寫(xiě)作評(píng)價(jià)系統(tǒng)進(jìn)行實(shí)驗(yàn),包括以下一些要點(diǎn):第一,構(gòu)建一個(gè)盡可能龐大詳細(xì)的語(yǔ)料資源庫(kù),涵蓋和高考語(yǔ)文作文相關(guān)的諸多語(yǔ)料,對(duì)這些語(yǔ)料去雜、標(biāo)注、分類(lèi)以及整理;第二,找到合理的評(píng)價(jià)方式評(píng)判系統(tǒng)的效果;第三,找到影響中文寫(xiě)作評(píng)分的關(guān)鍵淺層語(yǔ)言特征,包括變換的長(zhǎng)度特征、詞匯豐富度特征、段落特征;第四,探索能表征文章的深層語(yǔ)言特征,包括情感詞特征、引用特征、篇章特征;第五,深度學(xué)習(xí)相關(guān)方法,試圖以自動(dòng)表示文章特征而非啟發(fā)的方式進(jìn)行有選擇性的人工發(fā)現(xiàn)、抽取[6]

通過(guò)分析我國(guó)目前智能寫(xiě)作評(píng)價(jià)系統(tǒng)發(fā)展,可以看到自動(dòng)評(píng)分研究正努力朝著語(yǔ)義分析的方向發(fā)展,真正做到對(duì)語(yǔ)義的理解還要得到認(rèn)知科學(xué)的大力支持。未來(lái)智能寫(xiě)作評(píng)分研究中關(guān)于認(rèn)知過(guò)程的研究成分會(huì)逐漸加大,注重寫(xiě)作評(píng)價(jià)的心理過(guò)程將成為研究發(fā)展方向。

(二)漢語(yǔ)寫(xiě)作智能評(píng)價(jià)的關(guān)鍵性技術(shù)

1.關(guān)鍵詞句提取技術(shù)

關(guān)鍵詞句提取在文本處理的許多領(lǐng)域如文本聚類(lèi)、文本摘要和信息檢索中都是一項(xiàng)重要技術(shù)。當(dāng)下,關(guān)鍵詞句提取技術(shù)更是在NLP領(lǐng)域有著重要地位。目前,文本處理領(lǐng)域主要有基于隱含主題模型(LDA)、基于TFIDF詞頻統(tǒng)計(jì)和基于詞圖模型的三種關(guān)鍵詞句提取技術(shù)。

(1)詞匯及語(yǔ)句:蔡黎等提出了一種用文本中所有詞語(yǔ)的使用難度系數(shù)之和作為寫(xiě)作水平特征的計(jì)算方法。彭星源等提出了一個(gè)假設(shè)以文本中所有詞匯得分之和為文本總分為前提的計(jì)算方程[7]。語(yǔ)句層面,有人提出通過(guò)與詞語(yǔ)搭配提取進(jìn)行語(yǔ)法識(shí)別,并根據(jù)句長(zhǎng)以及語(yǔ)句包含詞語(yǔ)難度進(jìn)行簡(jiǎn)單的難度特征分析。這些計(jì)算方法和程式主要考慮到文本中詞句選用的難度及匹配度,而對(duì)于深層次詞語(yǔ)的靈活使用以及詞語(yǔ)、語(yǔ)句的創(chuàng)意表達(dá)等較為個(gè)性化的寫(xiě)作手法,智能寫(xiě)作還未能完全顧及。這也是智能寫(xiě)作評(píng)價(jià)系統(tǒng)不能完全取代人工評(píng)判的原因之一。

(2)修辭手法:有學(xué)者基于形式規(guī)則的方法,結(jié)合排比句位置、結(jié)構(gòu)和標(biāo)點(diǎn)等特征,設(shè)計(jì)了一系列關(guān)于排比句的識(shí)別和篩選算法[8]。陳一樂(lè)使用倒排索引結(jié)構(gòu)抽取出候選引用句,再結(jié)合模糊匹配(動(dòng)態(tài)規(guī)劃)的算法對(duì)引用進(jìn)行判別[9]。鞏捷甫對(duì)引用資源語(yǔ)料庫(kù)的構(gòu)建和引用特征的查找識(shí)別等工作進(jìn)行完善和豐富,嘗試使用深度學(xué)習(xí)方法解決文章中包含比喻、擬人手法的語(yǔ)句自動(dòng)識(shí)別[10]。比喻、排比、擬人、引用這些寫(xiě)作手法常用于我們平時(shí)的寫(xiě)作訓(xùn)練,一定程度上更加適合中小學(xué)常見(jiàn)的語(yǔ)句訓(xùn)練,為進(jìn)一步的修辭手法分析、計(jì)算提供了可能。

(3)主旨或中心論點(diǎn):當(dāng)前,語(yǔ)言分析處理認(rèn)為關(guān)鍵詞代表文本主題。蔡黎等使用Text Rank 結(jié)合詞頻 TF(term frequency)計(jì)算主題特征值;劉明楊在此基礎(chǔ)上采用無(wú)監(jiān)督的LDA(latent dirichlet allocation)主題模型輸出文章的主題關(guān)鍵詞;鞏捷甫結(jié)合訓(xùn)練LDA產(chǎn)生的模型矩陣和詞向量的方法進(jìn)行主題詞的擴(kuò)展;等等[11]。大部分學(xué)者分析主旨和中心論點(diǎn)時(shí)采用了提取主題詞這一方法,這對(duì)于主題明顯、簡(jiǎn)練的議論文和說(shuō)明文有一定的實(shí)踐價(jià)值,但對(duì)于記敘文或抒情散文等主題詞較為隱晦的文章可能需要進(jìn)一步的設(shè)想和建構(gòu)。

(4)語(yǔ)義特征:有學(xué)者借助HowNet提出一種基于文學(xué)義素特征的智能寫(xiě)作評(píng)價(jià)方法,并將段落間的概念關(guān)系融入其中。王耀華等提出了兩種文本語(yǔ)義離散度特征表示方法——“基于距離”“基于中心”,并使用統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)模型獲得這兩項(xiàng)特征的向量化表示[12]。語(yǔ)義特征的計(jì)算與分析能對(duì)文本整體的段落布局與整體思想內(nèi)容的表達(dá)進(jìn)行評(píng)判,這對(duì)于分析文章的整體思路布局有一定的幫助。

2.基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型

近年來(lái),自然語(yǔ)言處理領(lǐng)域基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型建構(gòu)取得很大進(jìn)展。作為模型輸入的詞向量訓(xùn)練最常用的方法有Word2vec以及 Glove 等,在大規(guī)模語(yǔ)料中通過(guò)目標(biāo)詞和上下文詞語(yǔ)的共現(xiàn)訓(xùn)練得到詞向量[13]。鞏捷甫嘗試使用深度學(xué)習(xí)方法解決文章中包含比喻、擬人修辭手法的語(yǔ)句自動(dòng)識(shí)別,借助Word2vec、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN訓(xùn)練出二元分類(lèi)模型。語(yǔ)言處理領(lǐng)域內(nèi)的神經(jīng)網(wǎng)絡(luò)模型建構(gòu)成功與否,大概率就決定中文智能寫(xiě)作評(píng)分系統(tǒng)能否成功應(yīng)用。

3.語(yǔ)料庫(kù)開(kāi)發(fā)是智能寫(xiě)作評(píng)價(jià)的基礎(chǔ)

語(yǔ)料庫(kù)是指按一定原則取樣獲得的大規(guī)模電子文本匯集,語(yǔ)料庫(kù)軟件包括詞匯索引工具、自動(dòng)和人工標(biāo)注工具、文本整理工具、口語(yǔ)轉(zhuǎn)寫(xiě)工具、統(tǒng)計(jì)分析工具等[14]。Hownet是一個(gè)中文語(yǔ)義知識(shí)庫(kù),其重要的工作是義原的歸納和總結(jié)。義原是最基本、不易再分割的意義最小單位,每個(gè)詞語(yǔ)都可由一個(gè)或若干義原來(lái)表示[15]。因此,諸如Hownet等中文語(yǔ)料庫(kù)的開(kāi)發(fā)是中文智能寫(xiě)作評(píng)價(jià)系統(tǒng)的重要基石。

三、漢語(yǔ)智能寫(xiě)作評(píng)價(jià)存在的問(wèn)題

由于中文在語(yǔ)音、詞匯及語(yǔ)法等方面與英語(yǔ)有著很大差別,其智能寫(xiě)作評(píng)價(jià)在語(yǔ)言處理及模型建構(gòu)方面還存在很多問(wèn)題。

(一)詞句識(shí)別困難

漢語(yǔ)字詞無(wú)明確的分離符號(hào),需要聯(lián)系上下文自行理解,且存在二字、四字或多字詞語(yǔ)。漢語(yǔ)處理首先要識(shí)別詞語(yǔ),這是智能語(yǔ)義信息處理的一項(xiàng)基礎(chǔ)工作。它不僅要識(shí)別常用詞語(yǔ)、短句,還要注意一詞多義、詞語(yǔ)的特殊用法以及語(yǔ)句因斷句產(chǎn)生的歧義和新詞識(shí)別等實(shí)際困難。

(二)語(yǔ)法類(lèi)型較多

中文存在某些特定的語(yǔ)法形態(tài),如意合類(lèi)較為抽象的語(yǔ)法識(shí)別,涉及語(yǔ)境、上下文理解等問(wèn)題。在寫(xiě)作文本中,往往出現(xiàn)特殊形式的語(yǔ)法結(jié)構(gòu),這需要智能寫(xiě)作評(píng)價(jià)系統(tǒng)基于大量真實(shí)的文本進(jìn)行分析與識(shí)別,才能真正從技術(shù)層面分析和處理漢語(yǔ)語(yǔ)法的各種類(lèi)型。

(三)語(yǔ)義分析復(fù)雜

中文詞匯及短語(yǔ)類(lèi)型中,一詞多義、同音、同義、近義、歇后語(yǔ)等現(xiàn)象較為常見(jiàn),這就給語(yǔ)義分析帶來(lái)不小的困難。在整體篇章及結(jié)構(gòu)架設(shè)層面,中文寫(xiě)作語(yǔ)義的理解分析涉及更多的引經(jīng)據(jù)典、詞義蘊(yùn)含省略、行文思路以及情節(jié)構(gòu)思等問(wèn)題,語(yǔ)義理解更為復(fù)雜。這更需要構(gòu)建智能寫(xiě)作評(píng)價(jià)系統(tǒng)時(shí)從學(xué)生實(shí)際出發(fā),具體分析。

(四)實(shí)際應(yīng)用缺乏驗(yàn)證

2020年底,有媒體報(bào)道部分省市在高考等考試中已經(jīng)開(kāi)始針對(duì)語(yǔ)文作文等主觀性命題引入機(jī)器閱卷[16],這傳達(dá)出智能寫(xiě)作評(píng)價(jià)已有重大進(jìn)展。但隨后也有媒體發(fā)聲認(rèn)為人工智能評(píng)判作文還不夠“資格”[17]。這正是智能寫(xiě)作評(píng)價(jià)面臨的兩難局面。實(shí)際應(yīng)用中,還應(yīng)考慮寫(xiě)作個(gè)性化以及多樣化的問(wèn)題,這樣才能更好地基于不同文本進(jìn)行寫(xiě)作評(píng)價(jià)。

(五)適用效果有待驗(yàn)證

正是因?yàn)橹悄芑瘜?xiě)作評(píng)價(jià)發(fā)展進(jìn)程中還有亟待解決的難題,其真實(shí)的評(píng)價(jià)效率及準(zhǔn)確性等需要進(jìn)一步分析,貿(mào)然應(yīng)用可能得到的結(jié)果并不完全有效。今后,對(duì)不同年級(jí)、不同寫(xiě)作體裁和類(lèi)型的文本,還應(yīng)分別進(jìn)行可行性驗(yàn)證,這樣才能確保智能寫(xiě)作評(píng)價(jià)的真實(shí)性和有效性。

四、對(duì)漢語(yǔ)智能寫(xiě)作評(píng)價(jià)的建議

(一)盡快成立漢語(yǔ)寫(xiě)作智能評(píng)價(jià)專(zhuān)門(mén)機(jī)構(gòu),開(kāi)展研究和通力合作

智能寫(xiě)作評(píng)價(jià)是一項(xiàng)涉及很多學(xué)科領(lǐng)域、需要通力協(xié)作的系統(tǒng)工程,首先,國(guó)家要給予高度重視,成立專(zhuān)門(mén)機(jī)構(gòu),開(kāi)展基礎(chǔ)研究。比如,建設(shè)一個(gè)數(shù)量龐大且資源詳細(xì)的語(yǔ)料資源庫(kù),并對(duì)大量的語(yǔ)料文件進(jìn)行整理分析、逐項(xiàng)特征提取,分類(lèi)進(jìn)行語(yǔ)言處理,這很可能是一個(gè)基礎(chǔ)工作。其次,基于深度學(xué)習(xí)技術(shù)、神經(jīng)網(wǎng)絡(luò)模型、人工智能技術(shù)等,對(duì)漢語(yǔ)作文的語(yǔ)義結(jié)構(gòu)、情感風(fēng)格、內(nèi)容旨意進(jìn)行具體和擬人化分析。再次,設(shè)計(jì)合理、有效的評(píng)分標(biāo)準(zhǔn)細(xì)則,涵蓋基礎(chǔ)技能考查及發(fā)展能力評(píng)價(jià)。最后,根據(jù)分?jǐn)?shù)進(jìn)行反向考量,對(duì)其評(píng)分做出具體反饋,給出得分。每一步都充滿艱辛,需要依托各項(xiàng)技術(shù)的發(fā)展及革新。

(二)積極開(kāi)展實(shí)驗(yàn)研究,不斷開(kāi)展技術(shù)攻關(guān)

漢語(yǔ)智能寫(xiě)作評(píng)價(jià)是一個(gè)新生事物,也是一項(xiàng)龐大及持續(xù)性較長(zhǎng)的工作,需要有專(zhuān)業(yè)知識(shí)的人才,開(kāi)展專(zhuān)項(xiàng)核心關(guān)鍵技術(shù)研究與攻關(guān)?,F(xiàn)今開(kāi)發(fā)智能寫(xiě)作評(píng)價(jià)系統(tǒng)需要考慮的問(wèn)題主要有:科學(xué)合理的評(píng)價(jià)指標(biāo)體系;可應(yīng)用的詞句識(shí)別技術(shù);合理的評(píng)價(jià)模型;適當(dāng)?shù)挠?jì)算、統(tǒng)計(jì)方法;深度融合的機(jī)器學(xué)習(xí)、人工智能等技術(shù)的發(fā)展。這些技術(shù)、理論的成功開(kāi)發(fā)和應(yīng)用,才會(huì)為漢語(yǔ)智能寫(xiě)作評(píng)價(jià)系統(tǒng)的更好發(fā)展帶來(lái)可能。這對(duì)中國(guó)的語(yǔ)文教育和考試評(píng)價(jià)、減輕教師批改作文的負(fù)擔(dān)、我國(guó)漢語(yǔ)教育科學(xué)化與智能化建設(shè)、提高我國(guó)軟實(shí)力都具有極其重要的意義。

(三)大力開(kāi)展循證實(shí)踐研究,不斷提升漢語(yǔ)智能寫(xiě)作評(píng)價(jià)水平

現(xiàn)階段,對(duì)于智能寫(xiě)作評(píng)價(jià)的大規(guī)模實(shí)踐驗(yàn)證分析獲得的經(jīng)驗(yàn)數(shù)據(jù)還不夠豐富,仍需要不斷開(kāi)展循證實(shí)踐。這種循證實(shí)踐不僅包括作文客觀的語(yǔ)篇指標(biāo)(如內(nèi)容、結(jié)構(gòu)、語(yǔ)言等),還包括文體類(lèi)型的識(shí)別、評(píng)價(jià)的價(jià)值取向設(shè)定等。這種評(píng)價(jià)很可能不僅僅是基于大數(shù)據(jù)統(tǒng)計(jì)的人工智能式判斷,因?yàn)閮r(jià)值判斷是一個(gè)主觀甚至個(gè)性化的事物。中文智能寫(xiě)作評(píng)價(jià)更加復(fù)雜,其真正落地應(yīng)用任重而道遠(yuǎn)。

參考文獻(xiàn)

[1] Kenton W. Murray,Naoki Orii.Automatic Essay Scoring[M]. Lawrence Erlbaum Associates,London,2003.

[2] Kaja Zupanc, Zoran Bosnic.Advances in the Field of Automated Essay Evaluation[J].Informatica,2015:383-395.

[3] 曹亦薇,楊晨.使用潛語(yǔ)義分析的漢語(yǔ)作文自動(dòng)評(píng)分研究[J].考試研究,2007(1):63-71.

[4] 楊晨,曹亦薇.作文自動(dòng)評(píng)分的現(xiàn)狀與展望[J].中學(xué)語(yǔ)文教學(xué),2012(3):78-80.

[5] 段栩雯.漢語(yǔ)作文自動(dòng)評(píng)級(jí)、打分和糾錯(cuò)智能評(píng)測(cè)系統(tǒng)發(fā)布[J].江西教育,2017(14):25.

[6][9]陳一樂(lè).基于回歸分析的中文作文自動(dòng)評(píng)分技術(shù)研究[D].哈爾濱工業(yè)大學(xué),2016.

[7][8]吳恩慈,田俊華.漢語(yǔ)作文自動(dòng)評(píng)價(jià)及其關(guān)鍵技術(shù)——來(lái)自作文自動(dòng)評(píng)價(jià)(AEE)的經(jīng)驗(yàn)[J].教育測(cè)量與評(píng)價(jià),2019(8): 45-54.

[10]馬創(chuàng)新,梁社會(huì).面向語(yǔ)言分析的語(yǔ)料庫(kù)技術(shù)平臺(tái)建設(shè)[J].智能計(jì)算機(jī)與應(yīng)用,2019,9(4):100-103.

[11]周錦章,崔曉暉.基于詞向量與TextRank的關(guān)鍵詞提取方法[J].計(jì)算機(jī)應(yīng)用研究,2019,36(4):1051-1054.

[12]李紀(jì)扣,韓建宇,王嫄.基于相似度融合算法的主觀題自動(dòng)閱卷機(jī)制[J].天津科技大學(xué)學(xué)報(bào),2019,34(1):76-80.

[13]高思丹,袁春風(fēng).語(yǔ)句相似度計(jì)算在主觀題自動(dòng)批改技術(shù)中的初步應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2004(14):132-135.

[14]張仰森,鄭佳,李佳媛.一種基于語(yǔ)義關(guān)系圖的詞語(yǔ)語(yǔ)義相關(guān)度計(jì)算模型[J].自動(dòng)化學(xué)報(bào),2018,44(1):87-98.

[15]陳洋,羅智勇.一種基于Hownet的詞向量表示方法[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,55(1):22-28.

[16]9省高考針對(duì)語(yǔ)文、英語(yǔ)作文等主觀性命題引入機(jī)器閱卷[EB/OL].https://www.thepaper.cn/newsDetail_forward_10374752.

[17]人工智能判作文還不夠“資格”[EB/OL].https://news.cctv.com/2021/01/04/ARTImmyqtw5mhvkHtP4dnN9I210104.shtml.

(作者榮維東系西南大學(xué)教師教育學(xué)院教授、博士生導(dǎo)師;李自然系廣東省深圳市寶安區(qū)龍騰小學(xué)教師)

責(zé)任編輯:孫建輝

泾源县| 驻马店市| 涿鹿县| 淮滨县| 威远县| 陆良县| 台山市| 孟州市| 天峻县| 新化县| 南汇区| 普兰县| 梅河口市| 西畴县| 方正县| 文昌市| 台北市| 平度市| 都匀市| 萨迦县| 元朗区| 安国市| 海伦市| 游戏| 阿克| 刚察县| 永昌县| 清原| 潜江市| 乌拉特前旗| 张家口市| 平山县| 循化| 鄄城县| 甘南县| 弥勒县| 金寨县| 酒泉市| 临泉县| 高邮市| 松原市|