国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向商品評論的二元情感認知模型

2018-09-18 09:19:46黃永峰
中文信息學(xué)報 2018年8期
關(guān)鍵詞:知識庫常識詞語

陳 放, 王 顆, 梁 爽,黃永峰

(清華大學(xué) 電子工程系 新一代網(wǎng)絡(luò)技術(shù)與應(yīng)用實驗室,北京 100084)

0 引言

隨著電子商務(wù)的不斷普及,互聯(lián)網(wǎng)已經(jīng)成為了商品銷售的重要渠道。許多消費者在完成交易后會在購物網(wǎng)站上發(fā)表商品評論。消費者可以通過瀏覽商品評論,了解商品的總體質(zhì)量、各方面特點、售后服務(wù)和交易風險等信息。商家可以通過收集商品評論,獲知商品的用戶體驗,從而加快產(chǎn)品升級,改善售后服務(wù),提高核心競爭力。電子商務(wù)交易規(guī)模的不斷擴大使得網(wǎng)絡(luò)商品評論的數(shù)量迅速膨脹。海量的商品評論已經(jīng)超出了人工收集和處理的能力,因此需要計算機自動從大規(guī)模評論文本中全面、精煉地篩選出有價值的信息。

本文主要關(guān)注面向商品評論的細粒度情感分析研究。其目標是將評論文本轉(zhuǎn)化為<評價對象,評價詞語>形式的結(jié)構(gòu)化表達,并分析其表達出的情感傾向[1-2]。限制計算機理解人類語言和情感的一個重要因素是,計算機不具備人類社會的常識[3]。這里的“常識”不僅包括常識性知識,還包括常識性推理。目前,很多情感分析系統(tǒng)使用大量評論語料訓(xùn)練情感計算模型,語料中隱含的知識通過訓(xùn)練過程記憶在模型的參數(shù)中,用戶無法直接感知和修正。本文提出的情感認知模型與這類情感計算模型有所不同。首先,通過學(xué)習(xí)大規(guī)模評論語料,將其中的常識性知識保存在知識庫中。然后,基于知識庫進行常識性推理,分析用戶的情感傾向。顯式的知識庫表達模式不僅可以讓模型進行增量學(xué)習(xí),還方便用戶修正、重用知識。

本文首先介紹二元情感認知模型的總體設(shè)計;然后,依次闡述“二元情感常識庫”和“評價體系知識庫”的定義和構(gòu)建方法,該部分體現(xiàn)了模型學(xué)習(xí)和記憶常識性知識的過程;最后,展示在上述兩個知識庫的支持下情感分析引擎的應(yīng)用方法,該部分體現(xiàn)了模型應(yīng)用已有知識進行常識性推理的過程。

1 相關(guān)工作

1.1 二元情感常識庫

二元情感常識庫主要涉及評價觀點抽取和情感傾向判別方面的研究。Hu和Liu[4]先使用關(guān)聯(lián)規(guī)則挖掘商品屬性,再利用詞語的共現(xiàn)關(guān)系,將商品屬性附近的形容詞提取出來作為評價詞語,最后利用WordNet中形容詞的近義詞和反義詞集,判斷評價詞語的情感傾向。該方法的缺點在于沒有考慮評價對象的領(lǐng)域相關(guān)性以及評價搭配之間的語法關(guān)聯(lián),抽取結(jié)果中存在很多噪聲。Popescu和Etzioni[5]首先利用點互信息量(PMI)抽取商品屬性,然后通過若干人工制定的語法規(guī)則模板識別評價詞語,最后使用松弛標記算法確定評價搭配的情感傾向。如果模板制定合理,評價搭配抽取具有較高的準確率。但由于模板的覆蓋率有限,該方法的召回率相對偏低。Zhuang等人[6]通過有標注語料學(xué)習(xí)評價對象和評價詞語的詞性標簽和依存句法關(guān)系,再根據(jù)學(xué)習(xí)到的模板抽取無標注評論文本中的評價搭配。該方法能夠從訓(xùn)練數(shù)據(jù)中自動獲得語法規(guī)則模板,但模板的質(zhì)量很大程度上依賴于訓(xùn)練使用的評論語料。另一類方法將二元搭配抽取建模為一個序列標注任務(wù),使用有標注數(shù)據(jù)訓(xùn)練模型,同時識別句子中出現(xiàn)的商品屬性和評價詞語。Li等人[7]使用詞例、詞性和句法依存關(guān)系等特征構(gòu)建了條件隨機場(CRF)模型,對評價對象、評價觀點和情感傾向進行聯(lián)合抽取。Liu等人[8]使用雙向LSTM網(wǎng)絡(luò)抽取評價搭配,該方法的優(yōu)勢在于無需人工制定模型特征。然而,基于統(tǒng)計的方法普遍存在對文本語義信息利用不足的缺點[9]。同時,為了取得較好的實驗效果,此類方法通常需要大量的有標注數(shù)據(jù),且跨領(lǐng)域適用性較差。

1.2 評價體系知識庫

評價體系知識庫主要涉及商品屬性層次結(jié)構(gòu)構(gòu)建方面的研究。Yu等人[10]使用樹形結(jié)構(gòu)描述商品屬性之間的層次關(guān)系。該方法首先利用網(wǎng)絡(luò)上的商品描述等領(lǐng)域先驗知識,構(gòu)建出一棵粗粒度的初始屬性樹,然后將其他商品屬性加入樹結(jié)構(gòu)的過程建模成一個函數(shù)優(yōu)化問題,通過最小化屬性樹的整體誤差得到最終的商品屬性樹。該方法的優(yōu)點在于構(gòu)建結(jié)果層次結(jié)構(gòu)清晰,能夠看出各個屬性之間的關(guān)系。但該方法構(gòu)建的精細屬性樹的準確性很大程度上依賴于初始樹結(jié)構(gòu)的合理性。此外,由于該方法在初始化屬性樹時需要借助領(lǐng)域先驗知識,因此不具有很好的跨領(lǐng)域適用性。Shi等人[11]對屬性詞語向量化后進行層次聚類,得到商品屬性的樹形結(jié)構(gòu)描述。該方法的優(yōu)點在于不需要領(lǐng)域先驗知識,具有很好的通用性。但其構(gòu)建的樹結(jié)構(gòu)固定為二叉樹,結(jié)構(gòu)不合理,且屬性樹的準確性較差,一些不具備從屬關(guān)系的商品屬性也作為父子結(jié)點出現(xiàn)。Kim等人[12]基于Blei等人[13]提出的nCRP模型進行屬性樹抽取。然而,該方法的計算復(fù)雜度太高,實用性較差。

2 二元情感認知模型

2.1 模型設(shè)計

本文提出的二元情感認知模型旨在從自由文本形式的商品評論中提取結(jié)構(gòu)化的評價觀點,進而分析消費者的情感傾向,模型框架如圖1所示。

圖1 二元情感認知模型框架

(1) 情感分析引擎: 以評論文本作為輸入,在“評價體系知識庫”和“二元情感常識庫”的支持下,識別評論文本中的顯式觀點,并對隱式情感進行推斷,輸出結(jié)構(gòu)化的評價觀點。

(2) 二元情感常識庫: 記錄了<商品屬性,評價詞語>形式的二元情感常識及其情感傾向,能夠幫助分析引擎進行顯式評價觀點挖掘。

(3) 評價體系知識庫: 記錄了商品的常見屬性、屬性的層次關(guān)系和評價權(quán)重,能夠幫助分析引擎進行隱式情感推斷。

模型對不同類型商品的大規(guī)模評論語料進行學(xué)習(xí),將每一類商品的情感常識和評價體系知識保存在兩個知識庫中,提供給情感分析引擎使用。上述學(xué)習(xí)過程也是知識庫的構(gòu)建過程,知識庫中的知識可以被修正和重用。情感分析引擎利用“二元情感常識庫”中的知識提取消費者的評價觀點,然后按照商品的評價體系將其層次化地展示出來。另外,情感分析引擎還可以借助“評價體系知識庫”的層次化組織結(jié)構(gòu)對消費者深層情感進行推斷。

2.2 二元情感常識庫的構(gòu)建方法

2.2.1 二元搭配抽取

二元搭配是指消費者在商品評論中談?wù)摰木唧w對象以及描述它的詞語,本文將其定義為<商品屬性,評價詞語>。本文首先利用斯坦福句法分析器Stanford Parser得到評論文本的詞性標簽和依存句法關(guān)系,然后按照一定的語法規(guī)則抽取二元搭配。

依存句法分析通過依存句法樹來描述句子的句法結(jié)構(gòu),句子中的詞語作為樹的結(jié)點,詞語間的依存關(guān)系作為樹的邊。Stanford Parser依存句法分析的輸出格式為“Reln(Gov, Dep)”,其中Gov表示核心詞,Dep表示從屬詞,Reln表示兩者之間的依存關(guān)系。在對商品評論完成詞性標注和依存句法分析后,本文使用表1中的語法規(guī)則提取評論文本中出現(xiàn)的二元搭配。其中,POS表示單詞詞性,Reln表示依存關(guān)系,Target表示商品屬性,Modifier表示評價詞語。

表1 二元搭配抽取規(guī)則

2.2.2 情感傾向判斷

本文將二元搭配的情感傾向分為積極、消極和中立三類,結(jié)合通用情感詞典和人機交互進行情感傾向判別。

在二元搭配<商品屬性,評價詞語>中,評價詞語很大程度上反映了消費者的褒貶態(tài)度。一類評價詞語本身帶有強烈的情感色彩,并且在搭配不同商品屬性時,其情感傾向保持不變,這一類評價詞語稱為“通用情感詞”。例如,“good”總是表達積極的情感,而“bad”總是表達消極的情感。本文使用伊利諾伊大學(xué)Bing Liu研究小組提供的通用情感詞典“Opinion Lexicon”進行情感傾向判別。該詞典較為完整地收錄了常見的通用情感詞,包括2 006個積極詞語和4 783個消極詞語。如果二元搭配中的評價詞語屬于通用情感詞,則根據(jù)通用情感詞典將評價搭配分類為積極或消極;如果評價詞語不屬于通用情感詞,則進行進一步的判斷。

與通用情感詞不同,另一類評價詞語本身并不帶有情感色彩,但在與特定的商品屬性搭配時,卻能表達出一定的情感,并且這種情感隨著搭配對象的變化而改變。例如,“big”本身并沒有情感傾向,但在手機領(lǐng)域中,它在描述“screen”時表達出積極的情感,而在描述“problem”時卻表達出消極的情感。針對這一現(xiàn)象,本文將包含非通用情感詞的二元搭配挑選出來,人工標注其中領(lǐng)域?qū)S卸钆涞那楦袃A向,最后將其余二元搭配分類為中立。

至此,二元情感常識庫的構(gòu)建全部完成。圖2展示了智能手機領(lǐng)域二元情感常識庫的部分實例。

圖2 智能手機領(lǐng)域二元情感常識庫實例

2.3 評價體系知識庫的構(gòu)建方法

2.3.1 商品屬性及從屬關(guān)系抽取

商品屬性一般為名詞或名詞短語。在評論文本中,屬性名詞通常與帶有情感色彩的情感詞(常為形容詞)共同出現(xiàn),并被情感詞所修飾。根據(jù)這一特點,本文使用Qiu和Liu[14]提出的“Double Propagation”算法提取商品屬性。

為了得到商品屬性之間的關(guān)聯(lián),本文使用Stanford Parser對評論語料進行依存句法分析,并根據(jù)表2中的語法規(guī)則抽取屬性間的從屬關(guān)系。其中,Reln表示依存關(guān)系,Targets表示商品屬性集合,F(xiàn)ather表示父屬性,Child表示子屬性。使用這樣兩條簡單的規(guī)則足以抽取出大量從屬關(guān)系,它們基本可以滿足標簽抽取及屬性樹精細化的需求。因此,本文沒有采用其他更復(fù)雜的規(guī)則,以免產(chǎn)生過多噪聲。

表2 從屬關(guān)系抽取規(guī)則

根據(jù)上述規(guī)則抽取出的從屬關(guān)系中,一個屬性可以存在多個父屬性和子屬性。從屬關(guān)系整體上較為可靠,但存在較多噪聲。為了避免這些噪聲的影響,本文在利用從屬關(guān)系提取標簽詞及校正屬性樹時僅使用其共現(xiàn)頻率等統(tǒng)計特征,詳見2.3.2。

2.3.2 屬性樹初始化

屬性樹的初始化過程將商品屬性構(gòu)建成一個初步的層次結(jié)構(gòu)。本文首先將屬性詞向量化,并以此為基礎(chǔ)對屬性進行層次聚類,最后利用抽取的從屬關(guān)系為二叉樹中的非葉子結(jié)點提取類別標簽。

本文用語境向量表示屬性詞。具體地,假設(shè)有n個屬性詞F1,F2,...,Fn,則每個屬性詞的語境向量是一個n維向量,F(xiàn)j的語境向量的第k維是評論語料中同時包含F(xiàn)j和Fk的句子數(shù)量。

對于向量化后的屬性詞,使用自頂向下的層次聚類方法生成層次結(jié)構(gòu)。本文使用明尼蘇達大學(xué)George Karypis等人提供的CLUTO聚類工具箱進行聚類操作。為了實現(xiàn)自適應(yīng)的分類,本文根據(jù)Shi等人[7]的方法,采用類內(nèi)相似度閾值來控制分類,并自頂向下二分實現(xiàn)聚類。類內(nèi)相似度的定義如下:

具體聚類方法如下:

令C1,C2,...,Ck分別表示聚類得到的k類屬性,C1∪C2∪…∪Ck=F(F為所有屬性詞的集合),記C={C1,C2,…,Ck}是各屬性類構(gòu)成的集合。

(0) 令C={C1}={F};

(1) 計算C中各類別的類內(nèi)相似度IS;

(2) 設(shè)定閾值th(實驗中取0.7),記C中類內(nèi)相似度IS

(3) 對C′中的m類屬性分別用CLUTO工具箱進行二分類,得到新的2m類屬性,記作集合C″;

(4) 令C=C-C′+C″;

(5) 重復(fù)1—4步驟,直至集合C不再變化,所得C={C1,C2,...,Ck},即為最終聚類結(jié)果。

上述方法得到的二叉屬性樹中,所有屬性詞均出現(xiàn)在葉子節(jié)點,非葉子節(jié)點沒有定義??紤]到非葉子節(jié)點是其子孫節(jié)點的總體概括,本文提出如下方法提取類別標簽:

記“主—從”屬性對集合為R=m∈F,s∈F},其中m為主屬性,s為從屬性,F(xiàn)為商品屬性集合。

(1) 對某一屬性類的屬性詞集合Ck,根據(jù)屬性詞之間的從屬關(guān)系,將該類別所有屬性詞的所有主屬性詞加入標簽詞候選集合M={m|?s∈Ck,s.t.∈R};

(2) 對每一個候選詞m∈M,計算其作為該類屬性詞標簽的得分,如式(3)所示。

其中,freq(s)freq(s)freq(s)表示屬性詞s在評論語料庫中出現(xiàn)的頻次,freq()freq()freq()表示“m-s”作為主從關(guān)系的屬性在評論語料庫中出現(xiàn)的頻次;

(3) 將候選詞按得分從高到低排序,最高得分的候選詞作為該類屬性的標簽。

2.3.3 屬性樹精細化

經(jīng)初始化得到的屬性樹存在樹結(jié)構(gòu)不準確、精確度不高的問題。因此,本文提出以下五條規(guī)則,用以對初始的屬性樹進行校正、完善和修剪,具體如下:

(1) 所有孩子節(jié)點均非葉子節(jié)點的節(jié)點,應(yīng)被其孩子節(jié)點取代;

(2) 在非葉子節(jié)點出現(xiàn)的屬性詞,應(yīng)從葉子節(jié)點中刪除;

(3) 刪除與兄弟節(jié)點及父節(jié)點之間均無從屬關(guān)系的葉子節(jié)點;

(4) 僅有一個孩子節(jié)點的節(jié)點,應(yīng)被其孩子節(jié)點取代;

(5) 同名的非葉子兄弟節(jié)點合并。

其中,規(guī)則(1)、(4)、(5)主要用于改善樹形結(jié)構(gòu),增加屬性樹的寬度、減少屬性樹深度;規(guī)則(2)、(3)主要用于剔除可能錯誤分類的葉子節(jié)點,提高屬性樹的精確性。

2.3.4 屬性權(quán)重設(shè)置

商品具有多方面的屬性,消費者對重要屬性的評價很大程度上決定了其對商品整體的情感態(tài)度,而次要屬性則對整體評價的影響較小。因此,本文通過對商品屬性賦予不同的權(quán)值,描述該屬性在評價體系中的重要程度。

一般來說,某種屬性在評論語料中被消費者提到的次數(shù)越多,則說明該屬性受關(guān)注的程度越高,對消費決策的影響越大,其重要性也就越強。因此,本文規(guī)定屬性的權(quán)重正比于其在語料庫中出現(xiàn)的頻率。同時,考慮到屬性樹的層次結(jié)構(gòu)特點,本文使用歸一化的相對頻率設(shè)置屬性權(quán)重,屬性Fi的歸一化權(quán)重wFi可以根據(jù)式(4)計算。

其中,N(Fi)表示Fi在評論語料中出現(xiàn)的次數(shù),mFi表示Fi的父屬性。上述屬性權(quán)重設(shè)置方式使得同一父節(jié)點下所有子節(jié)點的權(quán)重之和為1,方便進行情感推斷。

至此,評價體系知識庫的構(gòu)建全部完成。圖3展示了智能手機領(lǐng)域評價體系知識庫的部分實例。

圖3 智能手機領(lǐng)域評價體系知識庫實例

2.4 情感分析引擎的應(yīng)用2.4.1 觀點挖掘

商品評論中最有價值的信息是消費者對商品各方面屬性的具體評價。觀點挖掘通過分析自由文本形式的商品評論,輸出結(jié)構(gòu)化的評價觀點。這使得評論文本中重要信息的表達更加簡潔、直觀,也簡化了信息的進一步加工處理。本文提出了一種基于“二元情感常識庫”的觀點挖掘方法,用于提取出商品評論中出現(xiàn)的顯式評價觀點,輸出<商品屬性,評價詞語>形式的二元搭配及其情感傾向。例如,從評論“這款手機的屏幕很清晰,但電池壽命不長”中,可以得到積極的評價搭配<屏幕,清晰>,以及消極的評價搭配<電池壽命,不長>。

由于“二元情感常識庫”記錄了商品相關(guān)的先驗知識,本文得以將觀點挖掘簡化為一個信息檢索任務(wù)。對于一條評論語句,算法首先定位其中出現(xiàn)的商品屬性,然后以屬性詞為中心,考察一定長度的文本窗口內(nèi)是否存在能與屬性詞組成二元搭配的評價詞語。如果這樣的二元搭配在“二元情感常識庫”中出現(xiàn),則將其抽取出來作為評價觀點,并根據(jù)“二元情感常識庫”確定評價觀點的情感傾向。

2.4.2 情感推斷

目前的情感分析研究大多只能識別文本中顯式表達的情感,無法對深層的隱含情感進行推斷,從而限制了計算機的情感理解能力。情感推斷有著十分重要的意義: 在情感能夠推斷的條件下,計算機獲取的信息將更加全面,對人的情感“理解”將更加深刻。本文提出了一種基于“評價體系知識庫”的情感推斷方法,對商品評論中未出現(xiàn)的屬性進行情感傾向推斷。例如,對于評論“這款手機拍攝的照片有些模糊”,如果具備類似于“照片清晰度是相機質(zhì)量的評價指標之一”的常識性知識,那么便可以推斷出消費者對手機“相機”有負面的評價。

評價體系知識庫的樹形結(jié)構(gòu)描述了商品屬性之間的內(nèi)在聯(lián)系,父節(jié)點是子節(jié)點的總體概括,子節(jié)點是父節(jié)點的具體表征。因此,父節(jié)點的情感傾向可以根據(jù)其所有已知情感傾向的子節(jié)點推斷得出。

首先,情感分析引擎提取出評論中的<商品屬性,評價詞語>,并通過二元情感常識庫確定其情感傾向,從而確定該屬性的情感得分,如式(5)所示。

其中,oFi表示已知屬性Fi的情感傾向,1表示積極,0表示中立,-1表示消極。未知屬性的情感傾向通過其子屬性情感傾向的加權(quán)和得到,如式(6)所示。

其中,F(xiàn)k表示待推斷的商品屬性,mFi表示Fi的父屬性,scoreFi表示屬性的情感得分,wFi表示屬性的權(quán)重。根據(jù)待推斷屬性情感得分的正負,便可以推斷出消費者對商品高層次屬性的潛在情感傾向。

3 實驗

3.1 二元搭配情感判別實驗

實驗使用的數(shù)據(jù)是從亞馬遜網(wǎng)站上爬取的智能手機商品評論,共涉及63件商品,105 978篇評論文檔,從中抽取出了2 556條二元搭配。

本文分別統(tǒng)計了包含通用情感詞和非通用情感詞的二元搭配中積極、消極和中立類別的比例,結(jié)果如表3所示。

表3 二元搭配的情感傾向分布

從實驗結(jié)果可以看出,絕大多數(shù)包含通用情感詞的二元搭配表現(xiàn)出積極或消極的情感傾向;大部分包含非通用情感詞的二元搭配不帶有情感色彩,但也有一部分二元搭配能夠表達積極或消極的情感態(tài)度。為了提高知識庫的完整性和準確性,文本對這部分專有搭配的情感傾向進行人工標注后加入知識庫。情感傾向判別的實驗結(jié)果如表4所示。

表4 情感傾向判別實驗結(jié)果

由于大部分二元搭配包含通用情感詞,且包含非通用情感詞的二元搭配中情感中立類別較多,因此僅使用通用情感詞典便可以得到不錯的分類結(jié)果。結(jié)合人工標注的領(lǐng)域?qū)S星楦写钆浜?,二元搭配情感分類的準確率進一步提升。

3.2 商品屬性樹構(gòu)建實驗

實驗使用的數(shù)據(jù)是從亞馬遜網(wǎng)站上爬取的商品評論,涉及智能手機和筆記本電腦兩個領(lǐng)域。數(shù)據(jù)規(guī)模如表5所示。

表5 商品屬性樹構(gòu)建實驗數(shù)據(jù)規(guī)模

本文根據(jù)商品屬性樹的各個父子節(jié)點之間是否符合上下級關(guān)系來評價樹結(jié)構(gòu)的準確性。設(shè)屬性樹中共有N對父子節(jié)點,其中父節(jié)點是子節(jié)點正確主屬性的有n對,本文以正確父子節(jié)點對所占的比例n/N來衡量屬性樹的整體正確率。本文以Shi等人[7]的方法作為基準,對比屬性樹的構(gòu)建效果,結(jié)果如表6、表7所示。

從實驗結(jié)果可以看出,本文提出的屬性樹構(gòu)建算法在智能手機和筆記本電腦數(shù)據(jù)集上的準確率均高于基準方法。其中,初始屬性樹采用了Shi的方法對屬性詞提取語境向量,并二分聚類得到樹形結(jié)構(gòu),因此樹形結(jié)構(gòu)相同。但本文基于從屬關(guān)系的統(tǒng)計特征進一步提取了類別標簽,得到了更為準確的結(jié)果。而精細屬性樹則是在初始屬性樹上基于本文提出的五條規(guī)則進行樹形結(jié)構(gòu)對的校正和不恰當節(jié)點的濾除,因此準確性進一步提高。

表6 智能手機數(shù)據(jù)集實驗結(jié)果

表7 筆記本電腦數(shù)據(jù)集實驗結(jié)果

3.3 情感推斷實驗

實驗使用的數(shù)據(jù)是從車主之家網(wǎng)站上爬取的汽車領(lǐng)域的商品評論,評論數(shù)量超過20萬條,每條評論帶有1~5分的用戶評分。本文隨機選取若干包含二元搭配的評論,制作了三個規(guī)模較小的測試數(shù)據(jù)集,每個數(shù)據(jù)集約有1萬條評論,每條評論根據(jù)用戶評分標注了整體情感傾向(小于3分為消極,大于3分為積極)。

為了驗證情感分析引擎的有效性,本文首先對評論文本進行顯式觀點挖掘,抽取其中出現(xiàn)的二元搭配,并確定其情感傾向。然后根據(jù)情感推斷算法計算屬性樹根節(jié)點的情感得分,若得分大于0,則認為整條評論的情感為積極;若得分小于0,則認為整條評論的情感為消極。實驗結(jié)果如表8所示。

表8 情感推斷實驗結(jié)果

從實驗結(jié)果可以看出,情感推斷算法得出情感傾向與消費者實際表達的情感傾向基本一致,從而驗證了該算法的有效性。

4 結(jié)論

本文提出了一種面向商品評論的二元情感認知模型。該模型從大規(guī)模評論文本中學(xué)習(xí)領(lǐng)域先驗知識,存儲在知識庫中,并可以通過人機交互的方式對知識進行更新和修正。模型中的情感分析引擎在“二元情感常識庫”和“評價體系知識庫”的指導(dǎo)下,能夠?qū)ι唐吩u論進行顯式觀點挖掘和隱式情感推斷。本文還介紹了“二元情感常識庫”和“評價體系知識庫”的具體構(gòu)建流程,以及情感分析引擎的使用方法。實驗驗證了知識庫構(gòu)建方法的可行性和情感分析引擎的有效性。

本文初步提出了“二元情感常識庫”和“評價體系知識庫”的基本構(gòu)建方法,其中涉及的諸多細節(jié)還需要進一步的改進和完善,如二元搭配和從屬關(guān)系的抽取規(guī)則、評價單元的情感傾向判別等。另外,未來還需要在更多領(lǐng)域和更大規(guī)模的數(shù)據(jù)集上對模型進行測試。

猜你喜歡
知識庫常識詞語
容易混淆的詞語
找詞語
靠不住的常識
文苑(2020年11期)2020-11-19 11:45:11
基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機設(shè)計中的應(yīng)用
近視600度以上,這5條常識務(wù)必知道
詞語欣賞
高速公路信息系統(tǒng)維護知識庫的建立和應(yīng)用
基于Drupal發(fā)布學(xué)者知識庫關(guān)聯(lián)數(shù)據(jù)的研究
圖書館研究(2015年5期)2015-12-07 04:05:48
回歸常識
河南電力(2015年5期)2015-06-08 06:01:56
一枚詞語一門靜
左云县| 勐海县| 阿荣旗| 丁青县| 昆明市| 夏邑县| 松阳县| 郯城县| 穆棱市| 巫溪县| 时尚| 上栗县| 弥渡县| 巴里| 缙云县| 伊宁县| 兴国县| 西宁市| 萍乡市| 平顶山市| 遂宁市| 修文县| 时尚| 小金县| 内江市| 东明县| 龙南县| 扬州市| 龙胜| 桃源县| 石城县| 海兴县| 普格县| 扎鲁特旗| 祥云县| 唐河县| 教育| 永川市| 本溪| 海淀区| 新昌县|