張尚乾 劉知一
(中國電影科學(xué)技術(shù)研究所(中央宣傳部電影技術(shù)質(zhì)量檢測所),北京 100086)
隨著社交媒體平臺的興起以及廣泛使用,針對社交網(wǎng)絡(luò)文本數(shù)據(jù)的自然語言處理 (NLP)已成為當(dāng)前研究熱點。在電影方面,越來越多的人在電影論壇或影視網(wǎng)站上發(fā)表自己的評價及觀點,這些評價及觀點蘊(yùn)含著對影片、演職人員、電影產(chǎn)業(yè)、電影市場的情緒、認(rèn)知、態(tài)度、情感及行為傾向。一般來說,網(wǎng)絡(luò)口碑對消費(fèi)者的觀影選擇具有顯著影響,口碑評價越高,其票房收入越高。因此,對電影評價的情感分析,有助于了解觀眾的情感傾向,及時獲取觀眾的觀點和態(tài)度,對于電影輿情控制、刺激潛在消費(fèi)者觀影等都有非常重要的意義。
本文對中文影評進(jìn)行了本體特征和情感特征分析,并在此基礎(chǔ)上實現(xiàn)了影評文本級和特征級的情感分析。
文本情感分析又稱意見挖掘,簡單而言,是對帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過程。文本級情感分析目的是判斷文本層面的整體情感傾向,但評論文本的整體情感傾向可能與評價文本中的本體特征的情感傾向有差異。特征級情感分類是細(xì)粒度情感分類任務(wù),該任務(wù)的目標(biāo)是對于給定的短文本中出現(xiàn)的本體特征,推測出相應(yīng)本體特征對應(yīng)的情感極性,如正面、中立和負(fù)面。
情感分析方法主要包括基于詞典的方法、基于機(jī)器學(xué)習(xí)分類的方法、基于深度學(xué)習(xí)的方法?;谠~典的方法是以規(guī)則為主的方法,主要是構(gòu)建情感資源,形成詞典之后,根據(jù)情感詞典采用不同算法對文本的情感詞的權(quán)值進(jìn)行計算,實現(xiàn)對文本情感的分析,該類方法只考慮了情感詞對文本情感傾向性的影響,未考慮上下文相關(guān)的語義信息?;跈C(jī)器學(xué)習(xí)的方法主要是使用統(tǒng)計學(xué)方法提取文本中蘊(yùn)含的相關(guān)語言特征,將文本用特征向量表示之后,采用傳統(tǒng)機(jī)器學(xué)習(xí)的方法對文本進(jìn)行分類,Pang等使用電影評論作為基礎(chǔ)數(shù)據(jù),分別采用了機(jī)器學(xué)習(xí)方法中的樸素貝葉斯(NB)、最大熵(ME)和支持向量機(jī)(SVM)三種分類器實現(xiàn)了對影評數(shù)據(jù)的二分類,但是該類方法受情感特征提取方法的準(zhǔn)確性影響較大,從而直接影響最終的分類結(jié)果。基于深度學(xué)習(xí)的方法,一般采用詞向量表示的方法,對句子和篇章進(jìn)行向量化表示,深度學(xué)習(xí)網(wǎng)絡(luò)可有效學(xué)習(xí)文本的深層語義信息,但對于本體特征和情感特征關(guān)注不夠。常用于情感分析的深度學(xué)習(xí)模型有:循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)、長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)、門控循環(huán)單元 (Gated Recurrent Unit,GRU)網(wǎng)絡(luò)等。
由于深度學(xué)習(xí)具有優(yōu)秀的自編碼能力并能很好地建立從底層信號到高層語義的映射關(guān)系,所以本文選用深度學(xué)習(xí)模型做情感分類模型。但情感分析具有領(lǐng)域依賴性,縱使深度學(xué)習(xí)模型有較好的表現(xiàn),但不同的模型在不同領(lǐng)域的情感分類任務(wù)仍有區(qū)別,電影屬于體驗性產(chǎn)品,與普通商品不同,因此需要對影評進(jìn)行本體特征和情感特征分析。本文在文本級影評情感分析實驗時選用LSTM 模型作為基礎(chǔ)模型,在基礎(chǔ)模型上融合影評本體特征和情感特征,提高了文本級影評情感分類的準(zhǔn)確率;在特征級影評情感分析中,依據(jù)影評本體特征和情感特征對關(guān)鍵特征句進(jìn)行細(xì)粒度情感分析實驗,選用三個深度學(xué)習(xí)模型做情感分類,細(xì)粒度情感分析準(zhǔn)確率可達(dá)91.4%。
電影評價相對于商品評價更帶有主觀性和不確定性,觀影屬于虛擬性體驗消費(fèi),對電影的觀感更多是從故事、演技、特效等本體特征上表達(dá)觀點的,而這些評論中本體特征并不像實體商品屬性明確。在商品評論中,情感詞多為形容詞,現(xiàn)有的研究也多基于形容詞、名詞等情感詞進(jìn)行情感分析。在電影評論中,情感詞的詞性更為豐富,除了形容詞,還有動詞、名詞及口語化詞匯,電影評論中情感詞有詞性豐富、表達(dá)不規(guī)范等特性。因此,在文本級和特征級的影評情感分析都需要著重關(guān)注本體特征和情感特征。
在影評中包含多個對電影關(guān)鍵本體特征的評價,比如“節(jié)奏恰到好處”,這句話中“節(jié)奏”作為本體特征詞,對應(yīng)的情感特征詞為“恰到好處”,那么“節(jié)奏”和“恰到好處”是一對本體-情感特征對,本體和情感特征所在的短句稱為關(guān)鍵特征短句,從情感詞中可以看出該短句的情感屬于積極情感。關(guān)鍵特征句即能夠代表原長句的主要觀點的短句,是原長句的關(guān)鍵部分。經(jīng)分析,關(guān)鍵特征句可分為以下幾類:
類別一:句子表達(dá)對單一顯式影評本體的情感傾向。即句子中含有單一的顯式影評本體,且含有對應(yīng)的傾向性(褒義或貶義)的上下文無關(guān)情感詞。例如“影調(diào)舒服”,此觀點句包含單一評價對象“影調(diào)”和對應(yīng)的褒義情感傾向詞“舒服”,則此句的情感傾向性為正面;“劇情弱智”,此觀點句包含單一影評本體“劇情”和對應(yīng)的貶義情感傾向詞“弱智”,則此句的情感傾向性為負(fù)面。
類別二:句子表達(dá)對多個顯式影評本體的情感傾向。即句子中含有多個顯式影評本體,且含有對應(yīng)的傾向性 (褒義或貶義)的上下文無關(guān)情感詞。例如“音樂和畫面都好”,這句話包含兩個評價對象“音樂”和“畫面”,且情感傾向均為褒義,“好”,此句的情感傾向性為正面。
類別三:句子表達(dá)對某個隱式影評本體的情感傾向。句子中沒有明顯的影評本體,但表達(dá)了明顯的情感傾向?!拔覍嵲谑侨淌懿涣恕?這句未提及明確的評價對象,但包含“忍受不了”這一明顯貶義的情感短語,則此句的情感傾向性為負(fù)面。
經(jīng)以上分析,發(fā)現(xiàn)每篇語料的特征句可能有多個,每個特征句也可能包含多個本體特征。關(guān)鍵特征句是文本級情感分析的重要組成部分,也是細(xì)粒度情感分析的基礎(chǔ),以下兩小節(jié)分別對影評本體特征和情感特征做分析。
電影評價對象數(shù)目繁多且構(gòu)成形式復(fù)雜,但無論是名詞詞組或者名詞性從句中都會包含影評特有的本體特征詞。
本文基于從豆瓣網(wǎng)爬取的近期用戶影評評論,約0.9GB 文檔數(shù)據(jù),采用詞頻-逆文檔 (TF-IDF)和主題模型LDA 篩選出文檔中重要的電影本體詞語,經(jīng)去重篩選影評本體特征詞,舉例如表1所示。通過對影評本體特征分析,發(fā)現(xiàn)用戶發(fā)表觀點主要集中在以下四個方面,根據(jù)關(guān)注度排行由大到小依次為劇情、演員、后期以及整體。影評本體特征分布圖如圖1所示。
表1 影評本體特征詞
圖1 本體特征分布圖
除去本體特征,影評中常提到演職人員姓名,因此,本文從互聯(lián)網(wǎng)上爬取了演職人員姓名詞條,與人工篩選影評本體特征詞合并整理成影評本體特征詞集。
電影評論對上述本體特征評價時,會對本體特征表達(dá)情感傾向。影評中的情感詞,除去常規(guī)正面情感詞和負(fù)面情感詞,也會包含觀影常用的情感詞以及口語化和網(wǎng)絡(luò)化詞匯。
本文同樣采用TF-IDF和主題模型LDA 篩選出豆瓣影評中重要的情感詞語,經(jīng)去重篩選影評情感特征詞,舉例如表2所示。人工篩選影評情感特征詞與常用的正面和負(fù)面的情感詞 (知網(wǎng)Hownet和清華大學(xué)構(gòu)建中文褒貶義詞典)進(jìn)行整理去重,形成影評情感特征詞集。
表2 影評情感特征詞
3.4.1 基于關(guān)鍵特征的影評文本級情感分類模型
在文本級情感分類中,本文使用LSTM 模型,融合本體和情感特征,構(gòu)建了影評關(guān)鍵特征融合的LSTM 模型。該模型由詞向量構(gòu)建層、語義關(guān)系學(xué)習(xí)層、情感計算層組成。
3.4.1.1 詞向量構(gòu)建層
在本文的實驗中,詞向量采用從豆瓣網(wǎng)上爬取的314部電影的用戶評論,包括短評和長評,經(jīng)分詞后,利用Word2Vec的Skip-Gram 訓(xùn)練得到,每個詞向量為200維,對于未登錄詞,使用均勻分布隨機(jī)初始化詞向量,經(jīng)過訓(xùn)練,得到了一個包含149195個詞的詞向量空間。
3.4.1.2 語義關(guān)系學(xué)習(xí)層
3.4.1.3 情感計算層
情感計算層的主要任務(wù)是構(gòu)建情感分類器,獲取短文本影評的語義表示對于每一個情感標(biāo)簽的得分向量,并輸出短文本的最終情感標(biāo)簽,即正面或負(fù)面。將文本層產(chǎn)生的特征h作為情感分類的特征,利用Soft Max分類器,將文本影評進(jìn)行文本級情感分類,預(yù)測情感類別短文本影評的y',其計算方法見式(1)。
本文將y作為已知文本級影評的情感類別,將y'作為文本級影評的預(yù)測情感類別。為了更好地訓(xùn)練模型,衡量y分布和y'之間分布差異的目標(biāo)函數(shù)采用交叉熵代價函數(shù),如式(2)所示,并采用反向傳播機(jī)制對模型中的參數(shù)進(jìn)行訓(xùn)練和更新。
其中,D為訓(xùn)練數(shù)據(jù)集大小,C為類別數(shù),y'為預(yù)測類別,y為實際類別,λ‖θ‖為L2正則項。
3.4.2 基于關(guān)鍵特征的細(xì)粒度情感分類模型
在特征級影評情感分析中,對關(guān)鍵特征句的情感傾向性分析,也需要考慮影評特征詞、情感特征詞和其他詞語之間的語義依賴關(guān)系,本文采用Bi-GRU 對影評的語義依賴信息進(jìn)行獲取。GRU 模型作為LSTM 模型的一個變體,將LSTM 中的遺忘門、輸入門和輸出門縮減為重置門和更新門,使GRU 保持了LSTM 的效果同時又使結(jié)構(gòu)更加簡單。GRU 與LSTM 網(wǎng)絡(luò)中的記憶單元非常相似,它可以幫助GRU 學(xué)習(xí)到長期依賴的信息,并且由于訓(xùn)練參數(shù)較LSTM 少,所以訓(xùn)練速度更快。模型輸入層使用3.4.1.2小結(jié)的Word2Vec詞向量作為模型輸入,使用Bi-GRU 模型學(xué)習(xí)影評語義依賴,同樣使用Soft Max層作為分類模型的輸出,從而得到關(guān)鍵特征句相應(yīng)的情感傾向。
本文實驗語料來源為豆瓣網(wǎng)近期中國公映電影列表中314 部電影的影評,共26 萬余條,覆蓋喜劇、懸疑、科幻、推理等多種電影類型。影評按用戶評價星級分為1~5星,分別對應(yīng)五種情感傾向:很差、較差、還行、推薦、力薦。
為更清晰準(zhǔn)確地分析文本級影評的情感傾向性,我們將用戶評價星級為4~5星的短評定義為正面評價標(biāo)記情感傾向為+1,將用戶評價星級為1~2星的短評定義為負(fù)面評價標(biāo)記情感傾向為-1,舍棄不能明顯表達(dá)用戶情感傾向性的三星評價,最后去噪后整理得到21萬余條短評作為基于關(guān)鍵特征的影評文本級情感分析實驗語料。
從文本級情感分析實驗語料中隨機(jī)選取語料3755篇,人工篩選語料中的關(guān)鍵觀點句,并標(biāo)注關(guān)鍵觀點句的情感傾向,經(jīng)統(tǒng)計3755篇語料標(biāo)注的關(guān)鍵特征句個數(shù)為9019。將標(biāo)注所得的關(guān)鍵觀點句作為基于關(guān)鍵特征的影評細(xì)粒度情感分析實驗語料。
本文實驗采用自然語言處理領(lǐng)域中常用的正確率、召回率與F1值對關(guān)鍵特征句的分類結(jié)果及整體情感分類的結(jié)果進(jìn)行評價。
4.2.1 影評文本級情感分析實驗設(shè)置
(1)LSTM。標(biāo)準(zhǔn)的LSTM 模型,可以獲取到文本中前后的語義依賴關(guān)系。本實驗為后續(xù)實驗的基準(zhǔn)模型。
(2)T-LSTM。融合本體特征的LSTM 模型,在獲取短文本影評前后語義依賴關(guān)系的同時,關(guān)注影評本體特征。
(3)E-LSTM。融合情感詞特征的LSTM 模型,在獲取短文本影評前后語義依賴關(guān)系的同時,關(guān)注影評情感特征。
(4)ET-LSTM。融合本體特征及情感詞特征的LSTM 模型,在獲取短文本影評前后語義依賴關(guān)系的同時,關(guān)注影評情感特征及本體特征。
4.2.2 文本級影評情感分類實驗結(jié)果分析
影評文本級情感分析實驗結(jié)果對比如圖2所示,通過分析可得出:
圖2 影評文本級情感分析實驗結(jié)果對比
(a)對比實驗(2)模型在只引入影評本體特征時,好評及差評的F1 值對比實驗 (1)均有提高,本體特征增強(qiáng)有利于影評情感傾向性分析。
(b)對比實驗 (3)模型在只引入情感詞特征時,好評和差評的正確率較對比實驗 (1)均有提升,情感詞特征增強(qiáng)有利于情感傾向分析。
(c)在對比過本體特征和情感特征增強(qiáng)對文本級影評情感傾向性分析的影響后,我們?yōu)轵炞C本文提出基于關(guān)鍵特征融合的LSTM 模型的有效性,設(shè)置了對比實驗(4),對比實驗(4)的結(jié)果表明,在本體特征和情感特征聯(lián)合增強(qiáng),融合LSTM 提取的語義特征,在文本級影評情感分類中,對好評和差評的召回率和正確率都有提升,準(zhǔn)確率較基準(zhǔn)LSTM 模型提高4.6%,證明了實驗方法的有效性。
4.3.1 影評細(xì)粒度情感分析實驗設(shè)置
(1)RNN。用Word2Vec詞向量作為RNN 模型輸入,輸出用Soft Max層做預(yù)測,本實驗為后續(xù)實驗的基準(zhǔn)模型。
(2)Bi-LSTM。用Word2Vec詞向量作為Bi-LSTM 模型輸入,輸出用Soft Max層做預(yù)測。
(3)Bi-GRU。用Word2Vec 詞向量作為Bi-GRU 模型輸入,輸出用Soft Max層做預(yù)測。
4.3.2 影評細(xì)粒度情感分析實驗結(jié)果分析
影評細(xì)粒度情感分析實驗結(jié)果對比如圖3所示,通過分析可得出:
圖3 影評細(xì)粒度情感分析實驗結(jié)果對比
(a)同樣在詞向量輸入和Soft Max層作為基礎(chǔ)模型輸出的情況下,RNN 模型的訓(xùn)練效果在測試集上的與Bi-LSTM 和Bi-GRU 模型結(jié)果從信息抽取的三個方面都要較差些,原因是后者可以捕捉到前向和后向的雙向語義依賴關(guān)系。
(b)Bi-GRU 模型比Bi-LSTM 模型對總體觀點句的準(zhǔn)確率要稍高一些,Bi-GRU 模型的細(xì)粒度情感分析準(zhǔn)確率可達(dá)91.4%,而且Bi-GRU 模型實際訓(xùn)練速度也較快,Bi-GRU 更適合較句長較短的關(guān)鍵特征句的語義學(xué)習(xí)。
本文對中文影評進(jìn)行了本體特征和情感特征分析,并在此基礎(chǔ)上實現(xiàn)了影評文本級和特征級的情感分析。在影評本體特征分析中,發(fā)現(xiàn)觀影人對電影本體關(guān)注度較高的依次是劇情、演員、后期特征。在文本級影評情感分析中,提出基于關(guān)鍵特征的影評情感分析方法,對文本級情感分類的準(zhǔn)確率較基準(zhǔn)LSTM 模型提高4.6%。在特征級影評情感分析中,依據(jù)影評本體特征和情感特征,對關(guān)鍵特征所在短句進(jìn)行細(xì)粒度情感分析,細(xì)粒度情感分類結(jié)果準(zhǔn)確率可達(dá)91.4%。本文在情感分析實驗中,未區(qū)分電影類型。下一步研究,應(yīng)針對不同電影類型進(jìn)行深層次情感分析,挖掘觀眾對不同類型電影的情感偏好