国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)作文自動(dòng)評(píng)分系統(tǒng)的評(píng)述和發(fā)展

2014-03-13 05:24:19吳曉萍
文教資料 2014年34期
關(guān)鍵詞:人工自動(dòng)作文

吳曉萍

(閩江學(xué)院,福建 福州 350108)

網(wǎng)絡(luò)作文自動(dòng)評(píng)分系統(tǒng)的評(píng)述和發(fā)展

吳曉萍

(閩江學(xué)院,福建 福州 350108)

基于計(jì)算機(jī)網(wǎng)絡(luò)的作文自動(dòng)評(píng)分系統(tǒng)能夠在一定程度上解決教師作文評(píng)閱負(fù)擔(dān)重和人工評(píng)分存在主觀影響的問(wèn)題。本文對(duì)國(guó)內(nèi)外出現(xiàn)的作文自動(dòng)評(píng)分系統(tǒng)及相關(guān)研究現(xiàn)狀做了評(píng)述,認(rèn)為依靠計(jì)算機(jī)系統(tǒng)評(píng)閱作文的信度和效度還有待進(jìn)一步證實(shí)。

作文自動(dòng)評(píng)分系統(tǒng) 英語(yǔ)寫作 作文自動(dòng)評(píng)閱 人工評(píng)分

1.引言

寫作是語(yǔ)言學(xué)習(xí)的四大技能之一。在語(yǔ)言測(cè)試中,作文常常作為檢測(cè)學(xué)習(xí)者綜合應(yīng)用能力的手段。英語(yǔ)寫作和評(píng)閱是我國(guó)高校英語(yǔ)寫作教學(xué)中的重要環(huán)節(jié),然而,大量英語(yǔ)教師反映作文評(píng)閱是最費(fèi)時(shí)費(fèi)力的工作。另外,由于作文評(píng)閱帶有極大的主觀性,即在作文評(píng)閱過(guò)程中分?jǐn)?shù)的給定依靠評(píng)閱人的主觀判斷。而大規(guī)模評(píng)閱過(guò)程中評(píng)閱人個(gè)人因素可能會(huì)影響對(duì)作文質(zhì)量的客觀評(píng)價(jià),從而影響作文得分。近幾十年來(lái),隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,自然語(yǔ)言處理技術(shù)得到了很好的發(fā)展,國(guó)內(nèi)外相繼開(kāi)發(fā)出了一些作文自動(dòng)評(píng)分系統(tǒng),使長(zhǎng)期困擾英語(yǔ)教師的作文評(píng)閱難題有望得到解決。

2.作文自動(dòng)評(píng)分系統(tǒng)的簡(jiǎn)介

作文自動(dòng)評(píng)價(jià)系統(tǒng) (AEAS,Automated Essay Assessment System)是一個(gè)通過(guò)計(jì)算機(jī)和網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)書面作文進(jìn)行評(píng)估打分并提出改善建議的應(yīng)用軟件,主要應(yīng)用于大規(guī)模作文測(cè)試評(píng)分。該系統(tǒng)的應(yīng)用大大改善了教師批改作文耗時(shí)耗力的狀況,具有快捷、省力等優(yōu)勢(shì)。而且,計(jì)算機(jī)評(píng)分不存在人為因素的干擾,評(píng)閱結(jié)果更具客觀性。近年來(lái),國(guó)外許多考試研發(fā)機(jī)構(gòu)均已將計(jì)算機(jī)自動(dòng)評(píng)閱系統(tǒng)應(yīng)用于作文評(píng)分過(guò)程。一些大規(guī)模國(guó)際化英語(yǔ)考試,如托福、GMAT等也已開(kāi)始廣泛應(yīng)用計(jì)算機(jī)自動(dòng)作文評(píng)閱系統(tǒng)。目前,國(guó)內(nèi)出現(xiàn)了一些依托網(wǎng)絡(luò)的英語(yǔ)作文自動(dòng)評(píng)閱系統(tǒng),比較知名的有“冰果智能作文評(píng)閱系統(tǒng)”和“句酷批改網(wǎng)”等。這些系統(tǒng)不僅可以為學(xué)生的作文評(píng)分,還能利用計(jì)算機(jī)智能識(shí)別技術(shù),快速找出作文中的錯(cuò)誤,并通過(guò)網(wǎng)絡(luò)實(shí)時(shí)反饋給學(xué)生。

3.自動(dòng)作文評(píng)價(jià)系統(tǒng)的研究綜述

3.1 國(guó)外研究現(xiàn)狀

自動(dòng)作文評(píng)價(jià)系統(tǒng)在上個(gè)世紀(jì)60年代就已經(jīng)在國(guó)外開(kāi)始研發(fā)。目前國(guó)外已經(jīng)成功研發(fā)出了如PEG,IEA,E-rater,IntelliMetric,Jess等多種作文自動(dòng)評(píng)分系統(tǒng)。梁茂成和文秋芳對(duì)國(guó)外最具代表性的三種作文自動(dòng)評(píng)分系統(tǒng):PEG(Pmjeet Essay Grade)、IEA(Intelligent Essay Assessor)和E-rater進(jìn)行了述評(píng)。PEG是資格最老的作文自動(dòng)評(píng)分軟件,PEG基于淺層的語(yǔ)法特征,主要對(duì)作文形式進(jìn)行分析,其不足在于只衡量作文的語(yǔ)言質(zhì)量,并未涉及作文內(nèi)容和篇章結(jié)構(gòu)。而IEA注重對(duì)作文內(nèi)容的分析,能合理客觀地分析作文內(nèi)容的質(zhì)量,不足的是其未顧及作文的語(yǔ)言質(zhì)量,對(duì)文章的篇章結(jié)構(gòu)也不做分析。在用GMAT作文所做的一次試驗(yàn)中,IEA與人工閱卷的基本一致性在85%到91%之間[1]。然而,對(duì)作文進(jìn)行評(píng)分一般要從語(yǔ)言、內(nèi)容和篇章結(jié)構(gòu)三個(gè)主要方面對(duì)作文的整體質(zhì)量加以衡量。以上兩種系統(tǒng)的評(píng)分效度受到較多質(zhì)疑。E-rater是ETS(Educational Testing Service)開(kāi)發(fā)的一套作文自動(dòng)評(píng)分系統(tǒng),從1999年開(kāi)始已被應(yīng)用于GMAT的作文評(píng)分環(huán)節(jié)。E-rater采用的是整體評(píng)分方式,而非傳統(tǒng)的分析性評(píng)分方式。由于綜合使用了統(tǒng)計(jì)方法和自然語(yǔ)言處理技術(shù),E-rater提取的反映作文質(zhì)量的語(yǔ)言特征更符合人工評(píng)分標(biāo)準(zhǔn)。據(jù)稱,E-rater應(yīng)用于GMAT的寫作評(píng)分時(shí),與人工評(píng)分的一致性高于97%[2]。相對(duì)于PEG和IEA,E-later既注重形式又注重內(nèi)容,考慮到了更多的作文評(píng)分要素,因而更符合寫作測(cè)試的要求。梁茂成、文秋芳認(rèn)為雖然這些評(píng)分系統(tǒng)在訓(xùn)練及作文人工評(píng)分方法和機(jī)器評(píng)分效度等方面存在一些問(wèn)題,但不可否認(rèn)的是這些作文自動(dòng)評(píng)分系統(tǒng)為我國(guó)自主開(kāi)發(fā)作文自動(dòng)評(píng)分系統(tǒng)提供了借鑒[3]。

3.2 國(guó)內(nèi)研究現(xiàn)狀

我國(guó)對(duì)基于計(jì)算機(jī)的自動(dòng)作文評(píng)價(jià)系統(tǒng)的研究起步較晚。最早涉足自動(dòng)作文評(píng)分領(lǐng)域的是梁茂成。他開(kāi)發(fā)的“大規(guī)??荚囉⒄Z(yǔ)作文自動(dòng)評(píng)分系統(tǒng)”已于2005年申請(qǐng)了國(guó)家專利,并得到了很多知名學(xué)者的肯定。他的研究采用220篇已評(píng)分的作文樣本,以其中120篇樣本作文為基礎(chǔ)得到評(píng)分模型后,再通過(guò)另外100篇作文樣本對(duì)該模型的可信度進(jìn)行了交叉驗(yàn)證[4]。梁茂成的建模方法兼顧了PEG和lEA的長(zhǎng)處,取得了較高的評(píng)分準(zhǔn)確率,與人工評(píng)分相關(guān)系數(shù)高。但由于作文樣本來(lái)源數(shù)量少,范圍窄,且提取的特征主要是文本淺層特征,未涉及文章的句法結(jié)構(gòu)及搭配和詞塊的使用,因而有待于進(jìn)一步驗(yàn)證與加強(qiáng)。

國(guó)內(nèi)一些企業(yè)開(kāi)發(fā)了適用于高校的英語(yǔ)作文自動(dòng)評(píng)分系統(tǒng)。2009年,浙江大學(xué)外語(yǔ)學(xué)院與杭州一家網(wǎng)絡(luò)科技公司聯(lián)合開(kāi)發(fā)了一款名為“冰果英語(yǔ)智能作文評(píng)閱系統(tǒng)”的計(jì)算機(jī)自動(dòng)評(píng)閱系統(tǒng)。據(jù)稱該智能評(píng)閱系統(tǒng)的準(zhǔn)確率可達(dá)到95%。但部分使用該系統(tǒng)的老師表示電腦打分與人工打分有出入,而學(xué)生則反映電腦無(wú)法指出作文錯(cuò)誤所在。由于該系統(tǒng)側(cè)重作文整體評(píng)分,只給出總體得分和評(píng)語(yǔ),而沒(méi)有指出單詞拼寫、語(yǔ)法和篇章結(jié)構(gòu)等方面的錯(cuò)誤,因此該系統(tǒng)還需進(jìn)一步改進(jìn)。

目前各高校正在推廣的另一款作文自動(dòng)評(píng)閱系統(tǒng)叫句酷批改網(wǎng)(www.pigai.org),是一項(xiàng)基于語(yǔ)料庫(kù)和云計(jì)算的在線英語(yǔ)作文自動(dòng)評(píng)改系統(tǒng)。該系統(tǒng)的原理是比較學(xué)生作文和標(biāo)準(zhǔn)語(yǔ)料庫(kù)之間的差距,并通過(guò)固定的算法得出分?jǐn)?shù)和評(píng)語(yǔ)。對(duì)于每篇作文,該系統(tǒng)除了生成總分外,還可得出詞匯、句子、篇章和內(nèi)容四個(gè)方面的分?jǐn)?shù)。同時(shí),對(duì)文章生成總體的評(píng)語(yǔ),還能通過(guò)比對(duì)語(yǔ)料庫(kù)生成信息,對(duì)拼寫錯(cuò)誤、語(yǔ)法錯(cuò)誤、中式英語(yǔ)、高分句型和易混詞匯等做出點(diǎn)評(píng)和提出修改建議。學(xué)生可以根據(jù)這些反饋信息對(duì)自己的作文進(jìn)行多次修改,在不斷修改的過(guò)程中提高作文水平。因此,該系統(tǒng)在減輕教師批改英語(yǔ)作文工作量的同時(shí)還能提高學(xué)生的英語(yǔ)寫作能力。此外,教師還可以在自動(dòng)評(píng)閱的基礎(chǔ)上對(duì)機(jī)器生成的分?jǐn)?shù)和評(píng)語(yǔ)進(jìn)行人工修改和補(bǔ)充,做到機(jī)器智能和人工智能互補(bǔ)。

目前,對(duì)以句酷網(wǎng)為代表的在線寫作自動(dòng)評(píng)分系統(tǒng)的使用,國(guó)內(nèi)一些語(yǔ)言研究者如石曉玲、顧成華等做了相關(guān)實(shí)證研究,通過(guò)實(shí)驗(yàn)和問(wèn)卷調(diào)查發(fā)現(xiàn)該系統(tǒng)在使用過(guò)程中的一些問(wèn)題。例如,石曉玲認(rèn)為,在線寫作自動(dòng)評(píng)改系統(tǒng)的實(shí)時(shí)反饋能力有效激發(fā)了學(xué)生的寫作興趣,增加了作文的修改頻次,達(dá)到了以評(píng)促學(xué)的目的。但由于系統(tǒng)自身的技術(shù)特點(diǎn),僅在詞匯和語(yǔ)法層面給予學(xué)生幫助,在篇章結(jié)構(gòu)、內(nèi)容邏輯性和連貫性層面的優(yōu)勢(shì)并不明顯[5]。顧成華認(rèn)為,為了降低網(wǎng)上批改不恰當(dāng)?shù)狞c(diǎn)評(píng)對(duì)學(xué)生帶來(lái)的不良影響,教師必須添加人工批閱意見(jiàn),需要花費(fèi)很多時(shí)間在電腦上錄入,反而增加了教師的工作量[6]。

4.作文自動(dòng)評(píng)分系統(tǒng)存在的問(wèn)題及未來(lái)發(fā)展

基于計(jì)算機(jī)網(wǎng)絡(luò)的作文自動(dòng)評(píng)閱系統(tǒng)雖然對(duì)減輕教師評(píng)估作文負(fù)擔(dān)和避免人工評(píng)分的主觀性有很大幫助,然而,短時(shí)內(nèi)在線自動(dòng)評(píng)閱仍無(wú)法完全替代人工評(píng)閱。目前,自動(dòng)評(píng)分系統(tǒng)只能針對(duì)學(xué)生的語(yǔ)法、詞匯難度及句法進(jìn)行基本評(píng)價(jià)考核,而對(duì)學(xué)生作文的語(yǔ)義、內(nèi)容與主題的關(guān)聯(lián)度,以及作文是否符合任務(wù)要求等卻無(wú)法判斷。因此,作文自動(dòng)評(píng)閱系統(tǒng)的評(píng)分只是對(duì)作文語(yǔ)言質(zhì)量的一個(gè)大概評(píng)估,無(wú)法全面評(píng)估學(xué)生的英文寫作水平。

梁茂成等認(rèn)為,作文自動(dòng)評(píng)分系統(tǒng)在對(duì)評(píng)分模型進(jìn)行訓(xùn)練時(shí),應(yīng)該最大限度地模擬人工評(píng)分過(guò)程,使用分析型評(píng)分方法以提高作文評(píng)分信度。分析型評(píng)分雖然耗時(shí)費(fèi)力,但若組織為數(shù)不多的幾名資深評(píng)分員采用分析型評(píng)分方法對(duì)訓(xùn)練集作文進(jìn)行精細(xì)評(píng)分,考慮作文的語(yǔ)言質(zhì)量、內(nèi)容質(zhì)量和篇章結(jié)構(gòu)質(zhì)量等評(píng)分要素,以相對(duì)較小的投入對(duì)計(jì)算機(jī)評(píng)分模型加以訓(xùn)練,換取大規(guī)??荚囍休^高的評(píng)分信度,理所當(dāng)然是值得的[3]。

盡管現(xiàn)行開(kāi)發(fā)的電子評(píng)閱系統(tǒng)與人工評(píng)分已有較高的相關(guān)系數(shù),但依靠計(jì)算機(jī)系統(tǒng)評(píng)閱作文的信度和效度還有待進(jìn)一步證實(shí)。如何將計(jì)算機(jī)客觀評(píng)價(jià)學(xué)生作文與教師主觀評(píng)價(jià)巧妙結(jié)合起來(lái),在省時(shí)省力的同時(shí)兼顧作文評(píng)分的信度和效度,是未來(lái)語(yǔ)言教育者需要解決的問(wèn)題。

[1]Valenti,S.,F(xiàn).Neri&A.Cucchiarelli.An Overview of Current Research on Automated Essay Scoring[J].Journal of Information Technology Education,2003(2):319-330.

[2]Burstein,J.The E-rater scoring engine:Automated essay scoring with natural language processing[C].M.D.Shermis &J.Burstein.Automated Essay Scoring:A Cross-disciplinary Perspective.Mahwah,NJ:Lawrence Edbaum Associates,2003:113-122.

[3]梁茂成,文秋芳.國(guó)外作文自動(dòng)評(píng)分系統(tǒng)評(píng)述及啟示[J].外語(yǔ)電化教學(xué),2007(5):18-24.

[4]梁茂成.中國(guó)學(xué)生英語(yǔ)作文自動(dòng)評(píng)分模型的構(gòu)建[D].南京:南京大學(xué)博士論文,2005.

[5]石曉玲.在線寫作自動(dòng)評(píng)改系統(tǒng)在大學(xué)英語(yǔ)寫作教學(xué)中的應(yīng)用研究——以句酷批改網(wǎng)為例[J].現(xiàn)代教育技術(shù),2012(10):67-71.

[6]顧成華.基于句酷批改網(wǎng)的大學(xué)英語(yǔ)寫作教學(xué)實(shí)證研究[J].云南社會(huì)主義學(xué)院學(xué)報(bào),2012(3):213-214.

猜你喜歡
人工自動(dòng)作文
人工3D脊髓能幫助癱瘓者重新行走?
軍事文摘(2022年8期)2022-11-03 14:22:01
人工,天然,合成
人工“美顏”
自動(dòng)捕盜機(jī)
基于STM32的自動(dòng)喂養(yǎng)機(jī)控制系統(tǒng)
紅批有聲作文
紅批有聲作文
紅批作文
紅批作文
新型多孔鉭人工種植牙
唐河县| 徐水县| 施秉县| 三明市| 济南市| 奉化市| 萍乡市| 垣曲县| 祁连县| 朝阳区| 和硕县| 鹤山市| 玛多县| 正镶白旗| 比如县| 台安县| 安阳市| 梓潼县| 迁安市| 盐城市| 古丈县| 平罗县| 甘谷县| 开鲁县| 萍乡市| 龙岩市| 枣庄市| 诏安县| 大名县| 子长县| 那坡县| 光山县| 盱眙县| 藁城市| 施甸县| 武夷山市| 大连市| 巴塘县| 东光县| 嵩明县| 海原县|