国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

文本情感計(jì)算系統(tǒng)“小菲”的設(shè)計(jì)及其在教育領(lǐng)域文本分析中的應(yīng)用

2016-11-03 10:49賈積有楊柏潔
關(guān)鍵詞:小菲文本分析

賈積有+楊柏潔

摘 要:文本情感計(jì)算是近年來(lái)人工智能、教育技術(shù)與學(xué)習(xí)科學(xué)等領(lǐng)域出現(xiàn)的一個(gè)研究熱點(diǎn)。文章在界定相關(guān)概念、分析相關(guān)研究的基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于漢語(yǔ)文本的情感計(jì)算系統(tǒng)“小菲”。該系統(tǒng)依照Ekman心理模型將情感分為6種類別:氣憤、厭惡、恐懼、愉悅、悲傷和驚訝;每種情感的強(qiáng)度取值范圍為[-18,18];構(gòu)建了擁有32879條情感詞語(yǔ)的情感詞典《小菲詞典》,每條詞語(yǔ)標(biāo)注了6種情感極性和相應(yīng)的情感強(qiáng)度;然后建構(gòu)了詞語(yǔ)和短語(yǔ)、句子三個(gè)級(jí)別的情感計(jì)算模型,可以判別情感極性和計(jì)算情感強(qiáng)度。作為嘗試,該系統(tǒng)處理了一次慕課中產(chǎn)生的377條調(diào)查問(wèn)卷反饋數(shù)據(jù),計(jì)算F值(查準(zhǔn)率和召回率的加權(quán)幾何平均值)為88.7%。該結(jié)果初步證明:該系統(tǒng)可以用于慕課等在線學(xué)習(xí)產(chǎn)生的大規(guī)模交互文本的自動(dòng)情感識(shí)別,具有較好的應(yīng)用情景。

關(guān)鍵詞:文本情感計(jì)算;情感詞典;教育文本;文本分析

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2016)14-0074-05

一、情感與學(xué)習(xí)

情感(sentiment)是由非中性事物引起的并反作用于這個(gè)事物的非中性的意圖和行為[1],是人類最慣常、最重要的體驗(yàn)。人類的認(rèn)知和情感是相互影響和作用的,對(duì)兩者的研究密不可分。

情感及情感信息對(duì)于學(xué)習(xí)者的學(xué)習(xí)效果有重要的影響。積極的情感可以提高學(xué)習(xí)效率,而消極的情感卻可能造成學(xué)習(xí)的失敗[2]。許多學(xué)習(xí)行為是從好奇心和入迷開(kāi)始的,人在處于“興趣”與“愉悅”的情感狀態(tài)下,學(xué)習(xí)效率最高,學(xué)習(xí)效果最好;積極的情感促進(jìn)大腦的活動(dòng)性,在學(xué)習(xí)過(guò)程中表現(xiàn)為學(xué)習(xí)動(dòng)力,從而還可以產(chǎn)生一系列積極情感狀態(tài),如興趣、關(guān)注以及參與行為,它們?cè)趯W(xué)習(xí)過(guò)程中都起著重要的作用。而在“乏味”與“厭倦”的情感下,學(xué)習(xí)多數(shù)則是會(huì)失敗的,尤其學(xué)習(xí)的孤獨(dú)感和焦慮常常影響學(xué)習(xí)者的信心[3]。消極的情感抑制大腦的機(jī)動(dòng)性,在學(xué)習(xí)的過(guò)程中表現(xiàn)為學(xué)習(xí)的阻力,如厭倦、疲勞、無(wú)聊等都會(huì)影響學(xué)習(xí)的認(rèn)知過(guò)程。

認(rèn)知心理學(xué)家Simon[4]和Norman[5]認(rèn)識(shí)到了情感在學(xué)習(xí)效果方面發(fā)揮著重要作用。他們發(fā)現(xiàn)哪怕只有很少的一點(diǎn)積極情緒,不僅可以讓人感覺(jué)良好,而且還可以產(chǎn)生一種思維,這種思維會(huì)更有創(chuàng)造性更靈活地解決問(wèn)題以及更有效更果斷地做出決定。這項(xiàng)研究在不同年齡不同職業(yè)的人群中得到了驗(yàn)證。

在學(xué)習(xí)過(guò)程中,教師如果能夠識(shí)別學(xué)生的情感狀態(tài),并做出相應(yīng)的反饋,就可以激發(fā)其積極的情感,使學(xué)生內(nèi)心產(chǎn)生對(duì)教師的好感、依賴和敬慕,進(jìn)而產(chǎn)生學(xué)習(xí)熱情,使其處于興奮狀態(tài),促進(jìn)學(xué)習(xí)水平的提高,從而達(dá)到最好的學(xué)習(xí)效果[6]。

網(wǎng)絡(luò)學(xué)習(xí)具有特殊性,師生在物理空間上的分離,導(dǎo)致師生之間不能通過(guò)傳統(tǒng)的表情、眼神和肢體等方式進(jìn)行情感交流和反饋。教師得不到學(xué)生的情感狀態(tài)信息,學(xué)生得不到教師的反饋,學(xué)生學(xué)習(xí)效果就會(huì)受到影響。因此,在網(wǎng)絡(luò)教學(xué)系統(tǒng)中如何獲得學(xué)習(xí)者的情感,具有重要的研究?jī)r(jià)值[7]。

網(wǎng)絡(luò)學(xué)習(xí)環(huán)境下,獲取學(xué)習(xí)者情感的技術(shù)包括語(yǔ)音識(shí)別、人臉表情識(shí)別、身體姿勢(shì)和運(yùn)動(dòng)的識(shí)別等[8]。這些技術(shù)一般需要使用特殊的傳感器來(lái)采集學(xué)習(xí)者數(shù)據(jù)[9][10]。當(dāng)然,慕課等大規(guī)模在線學(xué)習(xí)方式中能快速直接獲得學(xué)習(xí)情感信息的介質(zhì)仍然是文本,如討論區(qū)、BBS、博客、調(diào)查反饋等交流活動(dòng)中的文本。這些文本情感信息反映了學(xué)習(xí)者在學(xué)習(xí)過(guò)程中的情感狀態(tài)。

慕課等在線學(xué)習(xí)平臺(tái)學(xué)員數(shù)量眾多,討論區(qū)產(chǎn)生的文本數(shù)據(jù)龐大。而人數(shù)有限的教師和助教很難實(shí)時(shí)、準(zhǔn)確地辨別文本的情感狀態(tài),并給出恰當(dāng)?shù)姆答?。因此,很有必要設(shè)計(jì)一個(gè)文本情感計(jì)算系統(tǒng),它能自動(dòng)或半自動(dòng)地分析文本情感、篩選文本信息,幫助教師針對(duì)學(xué)習(xí)者的情感狀態(tài)快速做出恰當(dāng)?shù)姆答仭?/p>

二、文本情感計(jì)算

1.概念

情感計(jì)算(Affective Computing)是人工智能的一個(gè)分支領(lǐng)域。美國(guó)麻省理工學(xué)院Picard于1997年首先提出了“情感計(jì)算”的概念[11],并將其定義為關(guān)于情感、情感產(chǎn)生以及影響情感方面的計(jì)算。情感計(jì)算的目的在于使設(shè)計(jì)的系統(tǒng)和設(shè)備能夠識(shí)別、理解和處理情感。

認(rèn)知語(yǔ)言學(xué)認(rèn)為人類能夠通過(guò)語(yǔ)言的表達(dá)反映出認(rèn)知的過(guò)程和結(jié)果,同時(shí)反映出真實(shí)的情感。既然語(yǔ)言能夠反映出情感,那么文本也當(dāng)然可以[12]。因此,從認(rèn)知語(yǔ)言學(xué)的理論上來(lái)講,文本中包含了一定的情感信息。

文本情感計(jì)算是情感分析領(lǐng)域的核心問(wèn)題之一,其任務(wù)是借助計(jì)算機(jī)幫助用戶快速獲取、整理和分析相關(guān)文本信息,對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理[13]。文本情感計(jì)算的研究包括極性分類(Polarity Classification)和強(qiáng)度計(jì)算(Intensity Classificaiton)兩個(gè)方面。

2.情感極性分類

情感極性分類的工作就是判別情感的種類。情感種類的集合構(gòu)成了情感模型。在多種情感模型中,OCC模型和Ekman模型被廣泛使用。

Ortony、Clore和Collins于1988年提出了著名的認(rèn)識(shí)評(píng)價(jià)情感模型OCC( Ortony, Clore, Collins)模型[14]。這個(gè)模型根據(jù)三類起因和事件的結(jié)果,提出了22種情感類別:高興,幸災(zāi)樂(lè)禍,妒忌,遺憾,充滿希望,害怕,快樂(lè),悲傷,驕傲,羨慕,害羞,責(zé)備,喜歡,討厭,自滿,感激,悔恨,生氣,滿意,悲觀,放松和失望。但是OCC模型被實(shí)際應(yīng)用的情況并不多,主要是因?yàn)榍楦蟹诸愡^(guò)于復(fù)雜。Ekman于1992年提出可以將情感分為氣憤(Anger)、厭惡(Disgust)、恐懼(Fear)、愉悅(Happiness)、悲傷(Sadness)和驚訝(Surprise)六種類型[15]。這6種情感是組成所有情感的基本單位,人類的所有情感均可由這6種情感衍生而來(lái)。同時(shí),相較OCC模型的22種類別劃分,Ekman模型的情感極性維度相對(duì)較少,實(shí)際應(yīng)用時(shí)相對(duì)簡(jiǎn)單。因此,我們也采用Ekman情感模型來(lái)為文本分類。

3.情感強(qiáng)度

情感強(qiáng)度計(jì)算是能夠反映文本情感極性的強(qiáng)弱程度的一個(gè)指標(biāo),因?yàn)樵诿恳环N情感種類內(nèi),會(huì)有情感程度強(qiáng)弱之分。目前在文本情感計(jì)算領(lǐng)域,針對(duì)情感強(qiáng)度計(jì)算的量化問(wèn)題并沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)。Wilson和Wiebe將情感強(qiáng)度標(biāo)注為3個(gè)級(jí)別:低、中、高[16]。Choi和Cardie將情感強(qiáng)度以具體數(shù)值計(jì)算,取值范圍為[0,10],數(shù)值越高,情感表達(dá)越強(qiáng)烈[17]。我們?cè)O(shè)定情感的強(qiáng)弱取值范圍為區(qū)間[-18,18]。在區(qū)間[0,18],數(shù)值越大表明該情感越強(qiáng)烈;數(shù)值為0時(shí),表示沒(méi)有情感;在[-18,0)區(qū)間,數(shù)值負(fù)號(hào)表示情感極性相反,即為取“非”操作。例如“anger”的非為“not anger”,即為“不憤怒”。數(shù)值絕對(duì)值越大表明該情感的相反極性情感越強(qiáng)烈。我們規(guī)定,取非操作的情感與原有6種情感之間相互獨(dú)立,不存在關(guān)聯(lián)。例如,“不憤怒”不一定為“高興”,而“高興”一定是“不憤怒”。

4.文本情感計(jì)算的層次性

文本情感計(jì)算層次代表情感計(jì)算的研究領(lǐng)域和范圍。根據(jù)文本信息的語(yǔ)法結(jié)構(gòu)可以將其分成4個(gè)層次:詞語(yǔ)、短語(yǔ)、句子和篇章。4個(gè)層次之間具有強(qiáng)烈的繼承關(guān)系,詞語(yǔ)是短語(yǔ)的基礎(chǔ),短語(yǔ)是句子的基礎(chǔ),而句子又是篇章的基礎(chǔ)。文本情感計(jì)算的研究是由最底層的詞語(yǔ)層次開(kāi)始,逐漸過(guò)渡到篇章層次,環(huán)環(huán)相扣。

因?yàn)榫W(wǎng)絡(luò)學(xué)習(xí)的文本大都較短,少于150字;文本內(nèi)容一般由兩三句話構(gòu)成,句子層次的文本情感計(jì)算可以滿足研究分析要求。又因?yàn)樵~語(yǔ)層次和短語(yǔ)層次是句子層次的研究基礎(chǔ),我們的情感分類工作集中在三個(gè)層次進(jìn)行:詞語(yǔ)、短語(yǔ)和句子。

詞語(yǔ)層次是文本情感計(jì)算的基礎(chǔ),主要任務(wù)是發(fā)現(xiàn)并提取文本中帶有情感色彩的詞語(yǔ),并且確定其情感極性和情感強(qiáng)度值。詞語(yǔ)層次的工作主要圍繞情感詞典的構(gòu)建來(lái)進(jìn)行。詞典中詞語(yǔ)的數(shù)量和詞語(yǔ)的屬性直接決定了系統(tǒng)的性能。詞語(yǔ)的屬性是指情感極性和情感強(qiáng)度。為大規(guī)模的詞語(yǔ)標(biāo)識(shí)出其情感極性和強(qiáng)度的最原始的方法就是人工標(biāo)注,雖然準(zhǔn)確但耗時(shí)耗力。使用基于統(tǒng)計(jì)的有監(jiān)督和無(wú)監(jiān)督的機(jī)器學(xué)習(xí)方法可以實(shí)現(xiàn)詞語(yǔ)情感的半自動(dòng)標(biāo)注。

用已有詞典擴(kuò)充構(gòu)建詞典的方法就是有監(jiān)督的詞典擴(kuò)展方法。大部分國(guó)外的詞典擴(kuò)充研究都是基于WordNet(http://wordnet.princeton.edu)和 General Inquirer(http://wjh.harvard.edu/~inquirer)兩種詞典,而大部分國(guó)內(nèi)的詞典研究是基于《知網(wǎng)》(http://www.keenage.com)和《同義詞詞林》兩種詞典。

Turney和Littman的無(wú)監(jiān)督學(xué)習(xí)法使用一種點(diǎn)互信息和信息檢索相結(jié)合的計(jì)算方法,來(lái)判定待定詞與種子詞之間的信息量。種子集合是由具有正面情感極性和具有負(fù)面情感極性的示例詞構(gòu)成[18]。在中文處理方面,Zhang等人利用情感標(biāo)注語(yǔ)料中抽取的上下文模板,在未知語(yǔ)料中計(jì)算模板與詞語(yǔ)之間的關(guān)系,進(jìn)而判斷詞語(yǔ)的情感極性[19]。

由于名詞、動(dòng)詞、形容詞和副詞等不同詞性的組合能夠產(chǎn)生不同種類的短語(yǔ),短語(yǔ)層次的情感分析主要關(guān)注短語(yǔ)具有何種情感極性以及其強(qiáng)度如何。

句子的分析包括兩種方式: 基于規(guī)則的方法和基于統(tǒng)計(jì)的方法。基于規(guī)則的情感計(jì)算主要依靠語(yǔ)法規(guī)則完成,常見(jiàn)的語(yǔ)法規(guī)則有兩類:一類是通過(guò)語(yǔ)法分析器得到句子的語(yǔ)法關(guān)系樹(shù),利用語(yǔ)法關(guān)系樹(shù)制定相關(guān)規(guī)則。另一類是使用短語(yǔ)模板,依據(jù)不同短語(yǔ)模板的組合形成規(guī)則來(lái)計(jì)算句子的情感。

Turney的研究表明英文中某些短語(yǔ)模式的形容詞和副詞攜帶情感信息[20]。這一重要結(jié)論推動(dòng)了基于規(guī)則的研究方法的發(fā)展。宋光鵬依據(jù)Turney的結(jié)論,并在其5種短語(yǔ)模板的基礎(chǔ)上進(jìn)行了改進(jìn),加入了判斷否定情感傾向的詞和相應(yīng)的語(yǔ)句連詞。最終歸納形成了適合中文的短語(yǔ)模板語(yǔ)法規(guī)則。通過(guò)語(yǔ)法規(guī)則模板直接進(jìn)行匹配,就能夠計(jì)算出句子的情感極性和強(qiáng)度[21]。

基于統(tǒng)計(jì)的情感計(jì)算需要通過(guò)訓(xùn)練集找到相關(guān)特征項(xiàng),使用貝葉斯分類、最大熵分類和支持向量機(jī)等統(tǒng)計(jì)方法計(jì)算句子情感極性。在中文方面,F(xiàn)ei等通過(guò)無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法得到短語(yǔ)模式,利用短語(yǔ)模式對(duì)文本情感極性進(jìn)行分類[22]。

三、系統(tǒng)設(shè)計(jì)

在情感計(jì)算領(lǐng)域中,基于統(tǒng)計(jì)和基于規(guī)則的兩大方法都各有所長(zhǎng)。因此,我們以基于規(guī)則的方法為主,配合基于統(tǒng)計(jì)的方法,構(gòu)造一個(gè)文本情感計(jì)算系統(tǒng),并將之命名為“小菲”(英語(yǔ)單詞Feeling的音譯)。該系統(tǒng)擁有自己的情感詞典,按照詞語(yǔ)、短語(yǔ)和句子三個(gè)層次進(jìn)行情感識(shí)別和綜合計(jì)算。下面介紹這些模塊。

1.情感詞典建構(gòu)

情感詞典建構(gòu)包括整合專業(yè)研究機(jī)構(gòu)發(fā)布的詞典,擴(kuò)充已有詞典容量和手動(dòng)標(biāo)注詞語(yǔ)情感強(qiáng)度三項(xiàng)工作。詞典來(lái)源包括《知網(wǎng)》、《中文通用情感詞典》、《同義詞詞林?jǐn)U展版》、《學(xué)生褒貶義詞典》和《中文情感詞匯本體庫(kù)》。通過(guò)整理這些專業(yè)詞典的內(nèi)容,將它們?nèi)诤蠟橐徊吭~典,包含27561詞條。

擴(kuò)充詞典容量使用基于統(tǒng)計(jì)的方法完成,利用有監(jiān)督的機(jī)器學(xué)習(xí)方法從《同義詞林?jǐn)U展版》擴(kuò)展詞典的褒貶詞語(yǔ),利用無(wú)監(jiān)督的機(jī)器學(xué)習(xí)方法從網(wǎng)絡(luò)中擴(kuò)展詞典的網(wǎng)絡(luò)詞語(yǔ)。由四名研究助理完成手動(dòng)標(biāo)注詞語(yǔ)情感極性和情感強(qiáng)度的工作,手動(dòng)共標(biāo)注了8589條詞語(yǔ)。最終將32879條詞語(yǔ)整合到一部情感詞典中,并命名為《小菲詞典》。

2.系統(tǒng)流程

按照情感計(jì)算的發(fā)展模式,從詞語(yǔ)級(jí)別開(kāi)始,經(jīng)過(guò)短語(yǔ)級(jí)別,最后到達(dá)句子級(jí)別,從而實(shí)現(xiàn)句子情感極性分類和情感強(qiáng)度計(jì)算的功能。

系統(tǒng)在情感計(jì)算之前,需要對(duì)句子做初步整理,例如刪除多余的空格、逗號(hào)標(biāo)點(diǎn)等。然后使用中科院計(jì)算所分詞軟件ICTCLAS(http://www.ictclas.org)對(duì)句子分詞,獲得構(gòu)成句子的若干短語(yǔ)。

短語(yǔ)級(jí)別的主要工作是使用基于規(guī)則的方法構(gòu)造短語(yǔ)情感模板。有一些短語(yǔ)能夠攜帶情感信息,可以構(gòu)造為短語(yǔ)情感模板。

副詞對(duì)詞語(yǔ)也有修飾作用,會(huì)導(dǎo)致情感強(qiáng)度和情感極性發(fā)生變化。所以將副詞分為程度副詞和否定副詞兩類進(jìn)行處理。程度副詞不改變情感極性,而是影響情感強(qiáng)度。否定副詞既改變情感極性,又影響情感強(qiáng)度。

當(dāng)句子長(zhǎng)度較短的時(shí)候,語(yǔ)法省略現(xiàn)象嚴(yán)重,不宜使用過(guò)于復(fù)雜的判斷模型。直接使用詞語(yǔ)、短語(yǔ)匹配的方法計(jì)算情感反而較為準(zhǔn)確。對(duì)于較長(zhǎng)的句子,就使用簡(jiǎn)單句的情感計(jì)算模型和句子關(guān)系模型來(lái)計(jì)算句子的情感。

句子包括復(fù)合句和簡(jiǎn)單句。復(fù)合句是由簡(jiǎn)單句和關(guān)系連詞構(gòu)成,不同的關(guān)系連詞構(gòu)成了不同的句子關(guān)系類型,如“并列”、“轉(zhuǎn)折”和“遞進(jìn)”等關(guān)系。不同的句子關(guān)系類型情感的計(jì)算方法也不盡相同。比如轉(zhuǎn)折關(guān)系,句子的主要情感是靠轉(zhuǎn)折詞之后的簡(jiǎn)單句表達(dá)。因此,句子級(jí)別的情感計(jì)算,首先判斷該句子是否是復(fù)合句。如果是的話,就找出其中的連詞,根據(jù)連詞確定句子關(guān)系,根據(jù)該關(guān)系和簡(jiǎn)單句的情感計(jì)算結(jié)果確定復(fù)合句的情感極性和強(qiáng)度值。

簡(jiǎn)單句的情感計(jì)算是使用語(yǔ)法分析器Stanford Parser(http://nlp.stanford.edu/software/lex-parser.shtml)來(lái)分析分詞之后的句子,得到句子各個(gè)成分,也就是短語(yǔ)。然后根據(jù)短語(yǔ)情感模板和短語(yǔ)之間的組合方式確定簡(jiǎn)單句的情感計(jì)算模型。

3.編程語(yǔ)言

系統(tǒng)使用JAVA、Mysql、ICTCLAS和Stanford Parser等開(kāi)源環(huán)境和工具構(gòu)建。JAVA語(yǔ)言是通用的編程語(yǔ)言,不受操作系統(tǒng)的限制,與其他各類系統(tǒng)的接口支持都很完善。因此,本系統(tǒng)使用JAVA語(yǔ)言實(shí)現(xiàn)文本情感計(jì)算模型和各系統(tǒng)之間的數(shù)據(jù)交換處理。Mysql是一個(gè)關(guān)系型數(shù)據(jù)庫(kù)管理器,情感詞典和句子類型等表格都保存在Mysql數(shù)據(jù)庫(kù)中,通過(guò)JAVA語(yǔ)言進(jìn)行調(diào)用。ICTCLAS是中科院提供的支持JAVA調(diào)用的分析系統(tǒng)。為更好地識(shí)別情感詞和句子關(guān)聯(lián)詞,我們擴(kuò)展了ICTCLAS的自定義詞典,將《副詞詞典》、《小菲詞典》和句子關(guān)系類型導(dǎo)入到ICTCLAS的自定義詞典中。Stanford Parser是依存語(yǔ)法關(guān)系分析器,輸入的數(shù)據(jù)是經(jīng)過(guò)分詞后的簡(jiǎn)單句,輸出的結(jié)果是簡(jiǎn)單句的依存語(yǔ)法關(guān)系數(shù)據(jù)。它本身是用Java語(yǔ)言實(shí)現(xiàn)的,方便調(diào)用。

四、在教育領(lǐng)域文本情感分析的初步嘗試

關(guān)于文本分析的性能,有一系列評(píng)測(cè)指標(biāo),包括查準(zhǔn)率P(Precision)、召回率R(Recall)和F值等。

P為查準(zhǔn)率,是衡量某一檢索系統(tǒng)的信號(hào)噪聲比的一種指標(biāo),即檢出的正確數(shù)據(jù)數(shù)目與檢出的全部數(shù)據(jù)數(shù)目的百分比。R為召回率,是檢索系統(tǒng)從數(shù)據(jù)集中檢出的正確數(shù)據(jù)數(shù)目和數(shù)據(jù)集中所有正確數(shù)據(jù)數(shù)目的比率。

F值是查準(zhǔn)率和召回率的加權(quán)幾何平均值,是情感計(jì)算系統(tǒng)最重要的評(píng)測(cè)指標(biāo)之一。F值計(jì)算方法如下:

F=

為測(cè)試該系統(tǒng)的性能,我們選取了一個(gè)小樣本的文本,以便既可以人工標(biāo)注,又可以讓系統(tǒng)自動(dòng)識(shí)別,并比較兩者的結(jié)果。2013年北京大學(xué)“新媒體與教育”暑期學(xué)校創(chuàng)新教學(xué)模式,使用慕課的方式展開(kāi)學(xué)習(xí)[23]。在課程結(jié)束時(shí),通過(guò)MOOC平臺(tái)收集了學(xué)員對(duì)本次暑期學(xué)校的反饋和建議,共377條,其中來(lái)自面授學(xué)員的201條,來(lái)自在線學(xué)習(xí)學(xué)員的176條。我們先人工標(biāo)注了這些反饋的情感極性和強(qiáng)度,然后使用“小菲”系統(tǒng)進(jìn)行了自動(dòng)計(jì)算;測(cè)評(píng)結(jié)果算得F=88.7%,在文本情感分析領(lǐng)域?qū)儆谳^好的結(jié)果。

五、在教育領(lǐng)域的應(yīng)用前景

盡管本系統(tǒng)在小樣本的教育文本情感計(jì)算測(cè)試中結(jié)果很好,但是它仍然存在一些缺陷,需要進(jìn)一步完善提高:目前的三萬(wàn)多條情感詞還不能完全覆蓋浩瀚的中文詞語(yǔ),應(yīng)該持續(xù)添加新詞,比如新出現(xiàn)的網(wǎng)絡(luò)語(yǔ)言,改善ICTCLAS分詞結(jié)果,增加關(guān)于世界的常識(shí)性知識(shí),等等。

隨著人工智能技術(shù)的發(fā)展,文本情感計(jì)算技術(shù)逐步成熟,可以廣泛應(yīng)用于慕課等在線教育的多種文本交互區(qū)域的情感分析,如討論區(qū)、調(diào)查反饋、聊天室、BBS等。可以實(shí)時(shí)監(jiān)控參與者的情感變化,及早發(fā)現(xiàn)學(xué)生反映的問(wèn)題并及時(shí)給予恰當(dāng)?shù)姆答?;也可以用于事后分析學(xué)生在學(xué)習(xí)活動(dòng)和過(guò)程中的情感變化,因材施教,實(shí)施個(gè)性化教學(xué)。這也必然減少教師和助教的大量寶貴時(shí)間和精力,提高在線學(xué)習(xí)的教學(xué)效率。我們將在這些方面繼續(xù)探索,深入研究。

參考文獻(xiàn):

[1]楊巍峰.對(duì)情緒情感定義的管見(jiàn)——兼與楊澤民同志商榷[J].心理學(xué)探新, 1986 (3): 35-39.

[2]盧家嵋.情感教學(xué)心理學(xué)[M].上海:上海教育出版社, 2000.

[3]A.C.Graesser, B.Medaniel, P.Chipma,ect.Detetion of Emotions during learning with AutoTutor [R]. Department of Psychology, 2006: 285-290.

[4]H.Simon.Motivational and emotional controls of cognition:in Models of Thought[M]. New Haven:Yale University Press,1967.

[5]D.Norman.Twelve issues for cognitive science[A].In Norman DA(Ed): Perspectives on cognitive seience[C]. Erlbaum, Hillsdale, NJ. 1981.

[6]R.W.Picard, S.Papert,ect. Affective leaming- a manifesto[J].BT Technology Joumal, 2004, 22(4): 253-269.

[7]唐偉志,賈云.遠(yuǎn)程教育中情感缺失問(wèn)題的對(duì)策研究[J].甘肅廣播電視大學(xué)學(xué)報(bào), 2012 (2): 1-4.

[8]J.Tao,T.Tan and R.W.Picard.Affective Computing: A Review[A].LNCS3784. German: Springer-Verlag Berlin/Heidelberg[C], 981~995. 2005.

[9]傅小蘭.電子學(xué)習(xí)中的情感計(jì)算[J].計(jì)算機(jī)教育, 2004 (12): 27-30.

[10]付彥飛,牛秦洲,閾小梅.基于情感計(jì)算的個(gè)性化E-Learning系統(tǒng)的研究[J].微計(jì)算機(jī)信息, 2010 (36): 241-244.

[11]R. Picard. Affective Computing[M]. Cambridge: MIT Press,1997.

[12]陳文萃.從認(rèn)知看情感表達(dá)的隱喻概念[J].南華大學(xué)學(xué)報(bào),2009(9): 112-142.

[13]B.Pang,L.Lee.Opinion Mining and Sentiment Analysis[J].Foundations and Trends in Information Retrieval,2008(1-2):1-135.

[14]A.Ortony,G.Clore,A.Collins.The Cognitive Structure of Emotions[M]. Cambridge: Cambridge University Press,1988.

[15]P. Ekman. An argument for basic emotions[J]. Cognition and Emotion, 1992, 6(3-4):169-200.

[16]T.Wilson,J.Wiebe.Annotating Opinions in the World Press[A].In: Proceedings of the 4th ACLSIGdial Workshop on Discourse and Dialogue (SIGdial2003) [C]. 13-22, 2003.

[17]Choi, Y., and Cardie, C. Learning with Compositional Semantics as Structural Inferencefor Subsentential Sentiment Analysis [A]. In Proceedings of the Conference on Empirical Methods in Natural Language Processing[C]. pp. 793–801. 2008.

[18]P.D.Turney and M.L.Littman.Measuring praise and criticism: Inference ofsemantic orientation from association[J].ACM Transactions on Information Systems,2003 (4):315-346.

[19]C.Zhang,W.Zuo,T. Peng, F.He.Sentiment Classification of Chinese Reviews Using Machine Learning Methods Based on String Kernel[A].Third International Conference on Convergence and Hybrid Information Technology[C]. 2008.

[20]Turney, P D. Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews[DB/OL]. http://arxiv.org/abs/cs/0212032.

[21]宋光鵬.文本的情感傾向分析研究[D].北京:北京郵電大學(xué),2008.

[22]Z.Fei,J.Liu,G.Wu.Sentiment Classification Using Phrase Patterns[A].In: Proceedings of Fouth International Conference onComputer and Information Technology[C]. 2004.

[23]賈積有,王愛(ài)華,吳筱萌,等.一次中規(guī)模在線開(kāi)放式課程的設(shè)計(jì)與實(shí)踐[A].第十屆北京論壇教育分論壇“高等教育的全球參與和知識(shí)共享”論文集(2013年11月)[C],141-156.(編輯:魯利瑞)

猜你喜歡
小菲文本分析
媽媽的秘密
感謝老公的情人
感謝老公的情人
感謝老公的情人
投資者情緒短期對(duì)股票市場(chǎng)的影響研究
維護(hù)正統(tǒng)還是觀念復(fù)辟?
我國(guó)地方紀(jì)錄片的出路研究
初中英語(yǔ)聽(tīng)說(shuō)課教學(xué)實(shí)踐探索
以符號(hào)矩陣?yán)碚摐\析《鬼魅丹青》
《化學(xué):概念與應(yīng)用》專題作業(yè)設(shè)計(jì)分析及啟示