崔雪蓮,那日薩,劉曉君
(大連理工大學(xué) 系統(tǒng)工程研究所,遼寧 大連 116023)
互聯(lián)網(wǎng)的發(fā)展帶來了電子商務(wù)的發(fā)展和壯大,大部分電子商務(wù)網(wǎng)站提供消費(fèi)者評(píng)論功能,激勵(lì)用戶分享消費(fèi)后的體驗(yàn)[1]。隨著文本情感分析研究的興起,越來越多的學(xué)者從在線文本評(píng)論挖掘消費(fèi)者情感信息[2-4],以期得到更加真實(shí)的消費(fèi)者購買體驗(yàn)及其偏好。
評(píng)論情感分析又稱評(píng)論挖掘或意見挖掘,是指通過自動(dòng)分析某種商品評(píng)論的文本內(nèi)容,發(fā)現(xiàn)消費(fèi)者對(duì)該商品的褒貶態(tài)度和意見[5]。傳統(tǒng)的機(jī)器學(xué)習(xí)方法在應(yīng)用于情感分類時(shí),分類效果不穩(wěn)定,且大部分為有監(jiān)督方法,需要一定數(shù)量的經(jīng)過標(biāo)注的訓(xùn)練樣本,而人工標(biāo)注過程相對(duì)耗時(shí)費(fèi)力,且領(lǐng)域移植性差,效率相應(yīng)比較低。因此,無監(jiān)督學(xué)習(xí)算法成為在線評(píng)論情感分析的重要研究方向[6]。
近年來,基于主題模型的無監(jiān)督情感傾向分析越來越受到學(xué)者的青睞,其中最有影響、應(yīng)用效果最好的當(dāng)屬LDA 模型[7],該模型是一種典型的無監(jiān)督生成式主題模型。為實(shí)現(xiàn)情感分類通常的方法是在LDA 主題模型中,加入不同的情感隱變量層,即可獲得不同類型的主題情感混合模型[4,8-9]。
然而,現(xiàn)有的主題情感混合模型,雖然能同時(shí)抽取文檔的主題和情感信息,但受主觀性文檔中局部否定以及主題數(shù)目的影響,模型的情感分類效果及穩(wěn)定性并不理想[10]。事實(shí)上,文本情感分類本質(zhì)上仍是一種文本分類問題,利用已有的文本分類方法可以有效解決情感分類問題。Pang等[11]將傳統(tǒng)的文本分類方法SVM(Support Vector Machines)、NB (Naive Bayes)以 及ME(Maximum Entropy Classification)等應(yīng)用于電影評(píng)論情感分類,取得了比較理想的結(jié)果;同時(shí)也指出,將評(píng)論的所有句子不加區(qū)分地作為同一個(gè)話題的描述,會(huì)導(dǎo)致評(píng)論情感極性判別錯(cuò)誤。鑒于此,基于主題模型的文本分類方法不斷涌現(xiàn)[12-13],該類方法通過LDA 等主題模型將文本表示為主題分布形式,通過比較兩篇文本的主題得到其相似度,并基于相似度實(shí)現(xiàn)文本分類。該類方法有效地解決了文本分類問題中特征稀疏的問題,應(yīng)用到情感分類中,張佳明等[14]通過主題模型挖掘微博文檔中的隱含主題,并通過情感詞典分析隱含主題的情感分布,進(jìn)而獲得整條微博的情感傾向。在產(chǎn)品評(píng)論的短文本情感分類問題上,消費(fèi)者評(píng)論主題存在有限性和差異性,主題內(nèi)容的差異性會(huì)導(dǎo)致評(píng)論情感相似性的計(jì)算誤差。為了弱化主題內(nèi)容對(duì)情感分類的干擾,本文引入理想評(píng)論,并構(gòu)造正、負(fù)向代表評(píng)論集,通過比較評(píng)論和理想評(píng)論的主題相似性,獲得評(píng)論的情感傾向。采用LDA 主題模型挖掘在線評(píng)論的隱含主題,結(jié)合情感詞典計(jì)算主題的情感極性。并根據(jù)主題的情感極性構(gòu)造具有強(qiáng)烈感情色彩的理想評(píng)論,通過計(jì)算評(píng)論和理想評(píng)論的主題相似度,構(gòu)建正、負(fù)向代表評(píng)論集,進(jìn)而計(jì)算得到每條評(píng)論的情感傾向值,實(shí)現(xiàn)在線評(píng)論的自動(dòng)情感分類。
給定產(chǎn)品評(píng)論文檔集D={d1,d2,…,d M},其中:M為文檔數(shù)目;d i為第i條評(píng)論。評(píng)論d i具有情感傾向,本文研究問題僅限于對(duì)文檔的正、負(fù)情感極性分類。評(píng)論文檔集可以進(jìn)一步表示為
其中,Si表示評(píng)論d i的情感傾向,Si=1表示對(duì)應(yīng)的評(píng)論d i情感極性為正向,Si=-1表示對(duì)應(yīng)的評(píng)論d i情感極性為負(fù)向。本文的研究問題即是求解向量(S1,S2,…,SM),即判斷每條評(píng)論的情感傾向,將評(píng)論進(jìn)行情感分類。
本文通過計(jì)算每條評(píng)論和理想評(píng)論的主題相似度獲得評(píng)論的情感傾向值,為使問題更加清楚,以下給出主題、評(píng)論及理想評(píng)論的相關(guān)定義:
D——評(píng)論集
N——評(píng)論集含有的詞數(shù)
R——一條評(píng)論的向量表示
z——主題
k——評(píng)論集的主題數(shù)
T——評(píng)論的主題向量
θR——評(píng)論R在k個(gè)主題上概率分布
φz——主題z的詞分布
Twordszi——主題zi的代表詞
Dpos,Dneg——正、負(fù)向代表評(píng)論集
λ——相似度閾值
Hennig-Thurau等[15]定義在線產(chǎn)品評(píng)論為:潛在的、當(dāng)前的以及過去的消費(fèi)者公開發(fā)布在網(wǎng)絡(luò)上的對(duì)某個(gè)產(chǎn)品或企業(yè)的正向或負(fù)向的陳述。消費(fèi)者在線產(chǎn)品評(píng)論主要圍繞產(chǎn)品特征進(jìn)行評(píng)價(jià),包括產(chǎn)品屬性特征,如電腦屏幕、系統(tǒng)等,也包含產(chǎn)品購買平臺(tái)特征,如物流、服務(wù)等,并通常伴有情感表達(dá)。由于在線產(chǎn)品評(píng)論通常比較簡短,所含詞語較少,隨意性較強(qiáng),完整性較差,一條評(píng)論所評(píng)價(jià)的產(chǎn)品特征數(shù)目較少,導(dǎo)致產(chǎn)品特征向量稀疏。而且,由于評(píng)論巨大的數(shù)據(jù)量,產(chǎn)品特征提取本身已是一項(xiàng)艱難的任務(wù),將對(duì)應(yīng)的觀點(diǎn)與產(chǎn)品特征匹配又進(jìn)一步提升了對(duì)算法技術(shù)的要求,且經(jīng)常需要領(lǐng)域本體的支持[16]。因此,本文引入主題的概念,將一條評(píng)論表示為一個(gè)主題分布向量。具體地,主題的描述性定義如下:
定義1主題。一個(gè)主題可由產(chǎn)品特征、特征觀點(diǎn)及情感3個(gè)維度描述,以“電腦散熱性能”主題為例,“CPU 溫度高”“風(fēng)扇噪聲大”,包含了對(duì)不同產(chǎn)品特征CPU、風(fēng)扇,及對(duì)應(yīng)的觀點(diǎn)的情感表達(dá)。記第i個(gè)主題為z i,對(duì)應(yīng)的情感傾向?yàn)?}=1表示正向情感極性=0表示負(fù)向情感極性。
本文中,以主題作為基本情感極性單位,每個(gè)主題的情感傾向?yàn)檎蚧蜇?fù)向。基于主題情感極性構(gòu)建理想評(píng)論,首先定義評(píng)論:
定義2評(píng)論。假設(shè)整個(gè)評(píng)論文檔集D共包含k個(gè)主題,則一條評(píng)論R可以表示為一個(gè)多維向量R=T=(t1,t2,…,tk),其中,ti∈[0,1],表示評(píng)論R屬于第i個(gè)主題z i的概率。
若兩條評(píng)論的主題概率分布相似,則認(rèn)為兩條評(píng)論相似,而且兩條評(píng)論的情感傾向值近似。因此,可以通過評(píng)論間的主題相似性判別評(píng)論情感傾向。Turney[5]在計(jì)算情感詞的情感傾向值時(shí),通過計(jì)算該情感詞和正向詞“excellent”的關(guān)系值及其與負(fù)向詞“poor”的關(guān)系值的差值獲得。借鑒此思想,本文在計(jì)算每條評(píng)論的情感傾向值時(shí),通過計(jì)算每條評(píng)論和具有強(qiáng)烈正向情感的正向評(píng)論的關(guān)系值及其與具有強(qiáng)烈負(fù)向情感的負(fù)向評(píng)論的關(guān)系值差值獲得。相比于詞之間的關(guān)系,評(píng)論之間的關(guān)系更為復(fù)雜,為了突出情感維度的關(guān)系,本文構(gòu)造評(píng)論文檔集D上的兩條理想評(píng)論和分別稱為理想正向評(píng)論和理想負(fù)向評(píng)論。具體定義:
定義3理想評(píng)論。理想正向評(píng)論即為包含且僅包含所有正向情感表達(dá)的主題的評(píng)論,而理想負(fù)向評(píng)論即為包含且僅包含所有負(fù)向情感表達(dá)的主題的評(píng)論。即
其中,0<ti<1,若=1,則ti=0;
其中,0<ti<1,若=0,則ti=0。
第1節(jié)中將評(píng)論表示為主題向量,并且引入了具有強(qiáng)烈情感傾向的理想評(píng)論。在此基礎(chǔ)上,通過計(jì)算每條評(píng)論和理想評(píng)論的主題相似性,獲得每條評(píng)論的情感傾向值,進(jìn)而構(gòu)造一種基于主題相似性的情感分類模型,自動(dòng)對(duì)在線評(píng)論進(jìn)行情感分類,具體的模型結(jié)構(gòu)如圖1所示。
圖1 基于主題相似性的情感分類模型總體結(jié)構(gòu)
為獲得評(píng)論文檔集的主題,采用LDA 主題模型方法訓(xùn)練評(píng)論集。
潛在狄利克雷分配模型(Latent Dirichlet Allocation,LDA)由Blei等[7]提出,它是一個(gè)“文檔-主題-詞”的3層貝葉斯生成式模型,其特點(diǎn)是參數(shù)空間的規(guī)模與語料庫大小無關(guān),適合于處理大規(guī)模語料庫,在文本分析領(lǐng)域應(yīng)用廣泛。
LDA 模型中,語料庫中的每一篇文檔可以表示為若干主題構(gòu)成的一個(gè)概率分布,而每個(gè)主題又可表示為若干個(gè)詞構(gòu)成的一個(gè)概率分布。如圖2 所示,各文檔的主題概率分布服從參數(shù)為α的Dirichlet分布,而各主題的詞分布服從參數(shù)為β的Dirichlet分布。
圖2 LDA 的圖模型表示
具體地,對(duì)于語料庫中的每篇文檔,LDA 模型的文檔生成過程為:
(1)對(duì)于每篇文檔d,從參數(shù)為α的Dirichlet分布中選擇主題參數(shù)θd;
(2)對(duì)于文檔d中的單詞,從參數(shù)為θd的多項(xiàng)式主題分布中產(chǎn)生一個(gè)主題;從參數(shù)為的多項(xiàng)式單詞分布中產(chǎn)生單詞;
(3)重復(fù)上述步驟,直至生成整個(gè)文檔。
將評(píng)論文檔集D,輸入LDA 模型,訓(xùn)練可以得到文檔集D的k個(gè)主題;同時(shí),每篇評(píng)論r∈D被表示為k個(gè)主題的概率向量分布,實(shí)現(xiàn)了評(píng)論的主題表示;而每個(gè)主題z也被表示為一個(gè)詞向量,隱含著不同的產(chǎn)品特征和對(duì)應(yīng)的聲明及情感表達(dá)。
對(duì)于給定的評(píng)論集D,其中并不包含理想評(píng)論,需要自動(dòng)生成。以下給出生成該評(píng)論集上的理想評(píng)論的具體方法。
(1)以Gibbs抽樣方法訓(xùn)練評(píng)論集D得到評(píng)論LDA 模型,產(chǎn)生k個(gè)主題,評(píng)論在主題上的分布為θ,主題在詞上的分布為φ;θR表示評(píng)論R在k個(gè)主題上概率分布。
(2)計(jì)算主題z的情感傾向值。?z=(?z1,?z2,…,?zN)表示主題z的詞分布,N是評(píng)論集D中的所有詞,結(jié)合情感詞典(臺(tái)灣大學(xué)情感詞典),主題z的情感傾向值計(jì)算公式為
其中:x i為決策變量,若第i詞為褒義詞,則x i=1,若為貶義詞,則x i=-1,若不在詞典內(nèi),則x i=0;Sz>0,表示主題z為正向情感,否則為負(fù)向情感。
(3)構(gòu)造近似理想評(píng)論。?z為所有詞屬于主題z的概率,取概率值大于p0的詞作為主題z的代表詞,表示為;取所有正向主題zi的,所有詞構(gòu)成一條理想正向評(píng)論;取所有負(fù)向主題zi的,所有詞構(gòu)成一條理想負(fù)向評(píng)論。
(4)將理想評(píng)論輸入LDA 模型,估計(jì)它們的主題分布,得到理想評(píng)論的主題表示。
由LDA 模型得到每條評(píng)論以及理想評(píng)論的主題向量為:
每條評(píng)論可量化為各自的主題概率分布為:
以評(píng)論和理想評(píng)論之間的主題相似度差值作為判別評(píng)論情感傾向的依據(jù),具體地,評(píng)論R∈D的情感傾向值可由下式計(jì)算:
由于理想評(píng)論包含主題數(shù)較多,而普通評(píng)論通常較為簡短,所包含的主題數(shù)較少,即使具有相同的情感傾向,但是由于兩者對(duì)應(yīng)的主題概率分布的差別,由式(2)計(jì)算得到的相似度會(huì)有所降低,進(jìn)而,由式(1)計(jì)算得到的評(píng)論情感傾向值也會(huì)有偏差。為了降低此偏差,分別以正、負(fù)向表示評(píng)論集Dpos、Dneg代替正、負(fù)向理想評(píng)論。給定閾值λ∈[0,1],若sim(R,>λ,則R∈Dpos;若>λ,則R∈Dneg。評(píng)論R∈D的情感傾向值可由下式計(jì)算:
若sentiment(R)>0,則評(píng)論R情感傾向?yàn)檎?;若sentiment(R)≤0,則評(píng)論R情感傾向?yàn)樨?fù)向。
具體地,評(píng)論集D上的情感分類算法的步驟為:
(1)對(duì)評(píng)論集D進(jìn)行預(yù)處理。①采用中科院的分詞系統(tǒng)ICTCLAS 分詞;②剔除停用詞,得到評(píng)論集D′。
(2)以評(píng)論集D′作為訓(xùn)練數(shù)據(jù)集,輸入LDA模型獲得評(píng)論集D的主題分布矩陣θD等,以及評(píng)論集D的LDA 模型final-model。
(4)根據(jù)式(2)計(jì)算普通評(píng)論和理想評(píng)論的相似度,取相似度閾值λ,構(gòu)造正、負(fù)向代表評(píng)論集Dpos、Dneg。
(5)根據(jù)式(3)計(jì)算每條評(píng)論的情感傾向值sentiment(R),對(duì)所有評(píng)論進(jìn)行情感分類。
下載譚松波公布的關(guān)于計(jì)算機(jī)、酒店及圖書的情感分類數(shù)據(jù)集,并從數(shù)據(jù)堂下載關(guān)于手機(jī)的情感分類數(shù)據(jù)集。對(duì)4個(gè)數(shù)據(jù)集進(jìn)行整理:①剔除字?jǐn)?shù)在10字以下以及無效評(píng)論;②刪除情感標(biāo)注明顯不恰當(dāng)?shù)脑u(píng)論。整理后,共得到有效評(píng)論9 259條,每種數(shù)據(jù)集的大小和正負(fù)情感分布如表1所示。
表1 實(shí)驗(yàn)數(shù)據(jù)集
其中,數(shù)據(jù)集Corp1主要用于算法性能測(cè)試,而Corp2~4則主要用于驗(yàn)證算法的領(lǐng)域可移植性。
首先是情感詞典的構(gòu)建,本文采用臺(tái)灣大學(xué)情感詞典,從語料中提取在線產(chǎn)品評(píng)論中特有的表達(dá)情感的詞和短語,如“性價(jià)比高”“實(shí)惠”“節(jié)能”“退貨”“燙”“噪聲”“劃痕”等,擴(kuò)充為適用于本文研究的情感詞典。
其次,以LDA 模型發(fā)現(xiàn)評(píng)論集主題及每條評(píng)論的主題向量表示,參數(shù)設(shè)置為:α=0.625,β=0.01,主題數(shù)k=80(依據(jù)困惑度選?。螖?shù)10 000。本文所用LDA 工具包下載地址:http://jgibblda.sourceforge.net/#Griffiths04。
利用LDA 模型的文檔-主題矩陣θ可以得到第i條評(píng)論的k維主題向量θi,即R i=θi,i=1,2,…,M;利用主題-詞矩陣?可以得到第i個(gè)主題的N維詞向量?i,結(jié)合情感詞典,得到主題zi的情感傾向,i=1,2,…,k,具體如表2所示。限于空間,只列出計(jì)算機(jī)Corp1的部分主題。
表2 主題代表評(píng)論
依據(jù)主題情感極性及其詞向量分布?,由2.2節(jié)理想評(píng)論構(gòu)造方法分別構(gòu)造了近似理想正評(píng)論和近似理想負(fù)評(píng)論,并由該評(píng)論集的LDA模型得到兩條近似理想評(píng)論的主題向量:
計(jì)算向量θP和θN的皮爾遜相關(guān)相似度,值為-0.78,顯著負(fù)相關(guān),驗(yàn)證了本文提出的構(gòu)造近似理想評(píng)論方法的有效性。
利用基于主題相似性的情感分類模型對(duì)實(shí)驗(yàn)語料進(jìn)行情感分類。為了檢測(cè)閾值λ對(duì)最終分類結(jié)果的影響,在數(shù)據(jù)集Corp1上,取不同規(guī)模評(píng)論語料,研究了λ取值對(duì)分類結(jié)果的影響,利用F1值作為實(shí)驗(yàn)結(jié)果的評(píng)估標(biāo)準(zhǔn)。從評(píng)論集Corp1 中隨機(jī)抽取相應(yīng)規(guī)模的評(píng)論數(shù)(為簡便計(jì)算,正、負(fù)向評(píng)論數(shù)相同),獲得6個(gè)評(píng)論測(cè)試集,規(guī)模分別為:500、1 000、1 500、2 000、2 600和3 000。研究的λ取值范圍為[0,0.3],實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 不同規(guī)模評(píng)論預(yù)測(cè)結(jié)果F1值(子圖為固定λ值,語料規(guī)模增大對(duì)應(yīng)的F1值變化情況)
由圖3可以看出,雖然評(píng)論語料規(guī)模不同,但是,隨著閾值λ的增大,實(shí)驗(yàn)結(jié)果F1值總體呈波動(dòng)下降趨勢(shì)。在所研究的λ取值范圍內(nèi),實(shí)驗(yàn)結(jié)果的F1值在[0.723,0.817],若除去規(guī)模為500條評(píng)論的小規(guī)模測(cè)試集,F(xiàn)1值的波動(dòng)范圍僅為[0.761,0.805]??梢?,λ取值對(duì)具有一定規(guī)模的評(píng)論集的實(shí)驗(yàn)結(jié)果有影響,但是影響不大。在λ∈[0,0.03]時(shí),F(xiàn)1值均在0.785 以上,正負(fù)情感傾向判別結(jié)果較好。另外,由子圖可以發(fā)現(xiàn),對(duì)于固定的λ值,隨著評(píng)論語料規(guī)模的逐漸增大,F(xiàn)1值并未有明顯的規(guī)律,基本上是在某個(gè)固定值上下波動(dòng)。這說明,λ的取值與語料規(guī)模無明顯關(guān)系。
基于上述分析,本文中λ的取值方法為隨機(jī)取自區(qū)間[0,0.03]。表3所示為當(dāng)λ隨機(jī)取自區(qū)間[0,0.03]時(shí),在計(jì)算機(jī)評(píng)論集Corp1的評(píng)論情感分類的實(shí)驗(yàn)結(jié)果,以準(zhǔn)確率P、召回率R以及F1值作為評(píng)判實(shí)驗(yàn)結(jié)果的標(biāo)準(zhǔn),結(jié)果為10次實(shí)驗(yàn)的平均值。
表3 實(shí)驗(yàn)結(jié)果
由表3可以看出,當(dāng)λ在區(qū)間[0,0.03]內(nèi)隨機(jī)取值時(shí),計(jì)算機(jī)類評(píng)論集Corp1 的正、負(fù)情感傾向判別結(jié)果的準(zhǔn)確率P、召回率R以及F1值均在80%,且10次實(shí)驗(yàn)的結(jié)果變化幅度極小,F(xiàn)1值的變化幅度僅為0.001。因此,λ在區(qū)間[0,0.03]內(nèi)任意取值,可以降低程序計(jì)算的復(fù)雜度,在簡化實(shí)驗(yàn)過程的同時(shí)又不會(huì)降低算法性能。
為進(jìn)一步驗(yàn)證本文所提模型的有效性,將本文模型與其他情感分類模型進(jìn)行比較,包括ASUM 模型[4]、JST 模型[8]、Pang等[11]的方法和UTSU 模型[9],采用數(shù)據(jù)集Corp1。比較結(jié)果如圖4所示。
圖4 情感分類效果對(duì)比圖
5種方法中,Pang方法是有監(jiān)督的學(xué)習(xí)方法,其他4種均為無監(jiān)督的主題情感混合模型。由圖4可以看出,綜合考慮準(zhǔn)確率和召回率,效果最好的是Pang方法。但Pang方法是基于向量空間模型的有監(jiān)督學(xué)習(xí)方法,需要先對(duì)標(biāo)注好的樣本進(jìn)行訓(xùn)練才能測(cè)試。其他4種無監(jiān)督算法中,USTU 模型、ASUM模型以及本文提出的基于主題相似性的情感分類模型中,本文的結(jié)果明顯優(yōu)于其他模型,綜合評(píng)價(jià)指標(biāo)F1值比其他模型高3%~20%,驗(yàn)證了本文算法的有效性。綜合上述實(shí)驗(yàn),本文所提出的基于主題相似性的情感分類模型,在當(dāng)λ在區(qū)間[0,0.03]內(nèi)任意取值時(shí),評(píng)論的情感分類F1值可以達(dá)到比較理想的結(jié)果,能夠有效地判別評(píng)論的情感傾向。
為了進(jìn)一步驗(yàn)證本文所提出的基于主題相似性的無監(jiān)督情感分類方法具有較好的領(lǐng)域可移植性,分別在酒店、圖書及手機(jī)3類產(chǎn)品的數(shù)據(jù)集(見表1 Corp2~4)上進(jìn)行測(cè)試。算法參數(shù)設(shè)置與Corp1實(shí)驗(yàn)相同,參數(shù)λ隨機(jī)取自區(qū)間[0,0.03],情感分類結(jié)果如圖5所示。
圖5 領(lǐng)域可移植性實(shí)驗(yàn)結(jié)果
由圖5可以看出,本文方法在不同領(lǐng)域的評(píng)論上均展現(xiàn)了較好的性能,綜合F1值達(dá)到80%以上,充分說明了該方法在領(lǐng)域可移植上的優(yōu)越性。另外,在F1值表現(xiàn)上,酒店類評(píng)論達(dá)到85%以上,而圖書類和手機(jī)類均在80%左右。這是因?yàn)?,酒店類評(píng)論主題相對(duì)集中,基本圍繞地理位置、房間大小及衛(wèi)生、周邊環(huán)境等,因而理想評(píng)論能夠更全面地包含所有評(píng)論的主題;而圖書類評(píng)論中,消費(fèi)者大多會(huì)對(duì)圖書的內(nèi)容進(jìn)行評(píng)價(jià),由于圖書題材及內(nèi)容的廣泛性,使得構(gòu)造理想評(píng)論的全面性較低,進(jìn)而判別結(jié)果有所降低;同樣地,手機(jī)類產(chǎn)品的評(píng)論主題通常也較多,包括手機(jī)多樣的性能及用戶差異性體驗(yàn)等,因而F1值也在80%左右。
針對(duì)中文在線產(chǎn)品評(píng)論進(jìn)行情感傾向判別,即在篇章級(jí)別上判斷一條評(píng)論情感極性的正負(fù)。近年來,基于主題模型的無監(jiān)督情感傾向分析越來越受到學(xué)者的青睞,而現(xiàn)有主題情感混合模型中,由于主題分布和情感分布會(huì)有一個(gè)是局部分布,在線評(píng)論文檔的情感偏移或主題數(shù)目變化會(huì)導(dǎo)致局部分布不確定性增加,而使最終分類效果不佳且不穩(wěn)定。因此,本文在基于主題模型的文本分類方法的基礎(chǔ)上對(duì)情感分類問題進(jìn)行研究,采用最常用的LDA 主題模型,以情感詞典方法獲得主題的情感傾向,提出一種基于主題相似性的無監(jiān)督在線評(píng)論情感分類模型。為弱化主題內(nèi)容對(duì)情感分類的影響,引入理想評(píng)論并構(gòu)造理想評(píng)論代表集。通過計(jì)算評(píng)論和理想評(píng)論集的主題相似度,獲得在線評(píng)論的情感傾向值,實(shí)現(xiàn)情感分類。
為驗(yàn)證算法的有效性,在計(jì)算機(jī)、酒店、圖書及手機(jī)4個(gè)不同領(lǐng)域產(chǎn)品的評(píng)論數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明:①利用情感詞典及主題詞向量能有效判別主題的情感極性;②基于主題情感極性的近似理想評(píng)論構(gòu)造方法產(chǎn)生的理想正、負(fù)評(píng)論的相似度達(dá)-0.78,情感極性兩極化明顯;③在準(zhǔn)確率、召回率及F1值表現(xiàn)上,本文算法比Pang等[11]的有監(jiān)督算法低,但是優(yōu)于其他主題情感混合模型;④本文方法具有優(yōu)越的領(lǐng)域可移植性,在不同領(lǐng)域數(shù)據(jù)集上表現(xiàn)較好。
本文的研究結(jié)果在中文在線評(píng)論情感分類相關(guān)理論和實(shí)踐應(yīng)用中均具有一定的參考價(jià)值。①理論貢獻(xiàn)。基于文本相似性的情感分類方法通常是兩條評(píng)論相互比較,而本文引入理想評(píng)論并擴(kuò)充為理想評(píng)論集,通過比較評(píng)論和理想評(píng)論集內(nèi)所有評(píng)論的相似度得到每條評(píng)論的情感傾向值,豐富了在線評(píng)論情感分類方法和理論。②實(shí)踐貢獻(xiàn)。在線評(píng)論的情感極性反映了消費(fèi)者對(duì)購物體驗(yàn)的綜合情感,電子商務(wù)環(huán)境下,商家可以通過在線評(píng)論情感極性推測(cè)消費(fèi)者的再購意愿及行為,為制定個(gè)性化營銷策略提供參考依據(jù)。
以下兩個(gè)方面值得深入探討:①本文研究內(nèi)容限于在線評(píng)論篇章級(jí)別的情感分類問題,而現(xiàn)在更多的評(píng)論則是從多方面對(duì)商品進(jìn)行闡述,對(duì)在線評(píng)論進(jìn)行細(xì)粒度的情感分類將是下一步的研究重點(diǎn)。②本文研究方法為無監(jiān)督學(xué)習(xí),當(dāng)數(shù)據(jù)含有標(biāo)簽或部分有標(biāo)簽時(shí),如何利用標(biāo)簽信息改進(jìn)模型也是一個(gè)可行的研究方向。