基于在線評(píng)論情感分析和模糊認(rèn)知圖的產(chǎn)品差異性研究

2022-01-22 14:56段恒鑫葉曉慶

鄭州大學(xué)學(xué)報(bào)（理學(xué)版） 2022年1期

段恒鑫，劉盾,2，葉曉慶

(1.西南交通大學(xué) 經(jīng)濟(jì)管理學(xué)院成都 610031； 2.重慶郵電大學(xué) 計(jì)算智能重慶市重點(diǎn)實(shí)驗(yàn)室重慶 400065)

0 引言

隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展、在線支付的普及以及物流配送效率的提升，在線購物成為主流趨勢(shì)，電子商務(wù)成交量逐年增加[1]。然而，在電子商務(wù)飛速發(fā)展的同時(shí)，品牌之間的競(jìng)爭(zhēng)也日益嚴(yán)重，品牌想要沖出重圍，需要形成自身特色，并以此來提高品牌的競(jìng)爭(zhēng)力。為此，大多企業(yè)一般采取產(chǎn)品差異化戰(zhàn)略，通過突出品牌優(yōu)勢(shì)來吸引用戶，提高產(chǎn)品競(jìng)爭(zhēng)力。

產(chǎn)品差異性是用戶接受商家品牌與其他競(jìng)爭(zhēng)者之間的差異程度[2]。以化妝品品牌為例，企業(yè)針對(duì)不同目標(biāo)用戶，將旗下品牌按照“高端”、“輕奢”、“平價(jià)”進(jìn)行市場(chǎng)細(xì)分。例如，世界著名化妝品巨頭歐萊雅集團(tuán)旗下一線品牌有赫蓮娜；二線品牌有蘭蔻和碧歐泉；三線品牌有巴黎歐萊雅、科顏氏等。從企業(yè)角度，分析產(chǎn)品差異性可以幫助企業(yè)有效獲取用戶需求，精準(zhǔn)定位目標(biāo)用戶，核定市場(chǎng)細(xì)分，為生產(chǎn)安排提供反饋；從用戶角度，分析產(chǎn)品差異性可以給用戶更多的關(guān)于產(chǎn)品橫向?qū)Ρ刃畔?，輔助購買決策[3]。

在線評(píng)論是獲取商品評(píng)價(jià)的重要渠道，對(duì)企業(yè)和用戶來說都有重要意義。借助互聯(lián)網(wǎng)平臺(tái)交互性、個(gè)性化、便捷性等特點(diǎn)，越來越多的用戶愿意在網(wǎng)絡(luò)社區(qū)或電子商務(wù)網(wǎng)站上瀏覽和發(fā)布信息，以達(dá)到產(chǎn)品信息交流和購物體驗(yàn)分享的目的。對(duì)于用戶而言，在線評(píng)論反映了產(chǎn)品的真實(shí)信息，可以幫助用戶進(jìn)行購買決策；對(duì)于企業(yè)而言，在線評(píng)論中蘊(yùn)藏著有關(guān)產(chǎn)品、服務(wù)質(zhì)量和用戶情感態(tài)度等豐富的信息，是企業(yè)獲取用戶需求的重要來源。因此，近年來，在線評(píng)論逐漸成為商家和電子商務(wù)平臺(tái)關(guān)注的焦點(diǎn)[4]。一方面，在線評(píng)論直接反映了用戶對(duì)產(chǎn)品的滿意度；另一方面，在線評(píng)論間接地反映了用戶的主要需求，是實(shí)現(xiàn)品牌差異性分析的有效信息。

然而，如果要實(shí)現(xiàn)精準(zhǔn)的品牌差異性分析，我們不但需要挖掘用戶主要關(guān)注屬性，還要獲取用戶對(duì)不同屬性的情感傾向以及屬性間的關(guān)系?；诖?，本文提出了基于在線評(píng)論情感分析和模糊認(rèn)知圖的產(chǎn)品差異化分析模型。該模型首先通過機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)技術(shù)從在線評(píng)論中挖掘用戶關(guān)注的屬性，進(jìn)行情感判斷，再通過模糊認(rèn)知圖(fuzzy cognitive map, FCM)獲取用戶對(duì)產(chǎn)品不同屬性的情感傾向，以此獲得產(chǎn)品差異性分析的綜合評(píng)價(jià)。

1 相關(guān)理論

1.1 LDA主題模型

LDA是由Blei等[5]提出的文本主題提取模型，用于直接提取文本中具有語義解釋性的主題特征。在LDA中存在一個(gè)假設(shè)，即用戶在編輯評(píng)論文本時(shí)，在他的意識(shí)中會(huì)存在一些主題元素，而這些主題中會(huì)存在不同的詞或句，通過主題-詞選擇來構(gòu)成用戶產(chǎn)生的在線評(píng)論，LDA具體模型如圖1所示。其中：k表示提取主題的數(shù)；N表示在線評(píng)論包含的詞數(shù)量；wm,n表示第m篇文檔的第n個(gè)詞；tm,n表示第m篇文檔第n個(gè)主題；φk表示各主題下對(duì)應(yīng)的詞概率分布；θm表示各文檔下對(duì)應(yīng)的主題分布。假設(shè)整體在線評(píng)論存在V個(gè)非重復(fù)詞匯，根據(jù)上述模型，可計(jì)算相應(yīng)的聯(lián)合概率分布為

圖1 LDA模型

當(dāng)超參數(shù)α、β給定時(shí)，可通過吉布斯采樣對(duì)LDA中參數(shù)θm和φk進(jìn)行估計(jì)求解：

通過對(duì)參數(shù)θm和φk進(jìn)行求解，可獲得各在線評(píng)論文本的主題分布和各主題下的詞分布，由此來實(shí)現(xiàn)基于LDA的在線評(píng)論主題提取。

1.2 長短期記憶網(wǎng)絡(luò)(LSTM)

LSTM是Hochreiter等[6]提出的一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)，主要為了解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸的問題。LSTM通過一個(gè)記憶單元與三個(gè)門(遺忘門、更新門、輸出門)結(jié)構(gòu)來實(shí)現(xiàn)對(duì)每個(gè)單元狀態(tài)的控制[7]，其結(jié)構(gòu)如圖2所示。與循環(huán)神經(jīng)網(wǎng)絡(luò)相比，長短期記憶LSTM有2個(gè)傳輸狀態(tài)：c1(cell state)，h1(hidden state)。循環(huán)神經(jīng)網(wǎng)絡(luò)中的h1就是LSTM中的c1，這也是LSTM的關(guān)鍵。LSTM利用門的結(jié)構(gòu)來精確控制加入或移除信息到記憶狀態(tài)。

圖2 LSTM結(jié)構(gòu)圖

1.3 模糊認(rèn)知圖(FCM)

模糊認(rèn)知圖(fuzzy cognitive map, FCM) 是一種利用現(xiàn)有知識(shí)和專家經(jīng)驗(yàn)來模擬復(fù)雜系統(tǒng)的方法[8]。模糊認(rèn)知圖利用接近于人類認(rèn)知的方式描述一個(gè)系統(tǒng)，通過強(qiáng)調(diào)因果連接和圖的結(jié)構(gòu)來表示知識(shí)，同時(shí)利用規(guī)則的形式將專家知識(shí)和從數(shù)據(jù)中獲得的有用知識(shí)合并在一起[9]。在網(wǎng)絡(luò)管理[10]、故障分析[11]、專家決策[12]等領(lǐng)域有廣泛應(yīng)用。在模糊認(rèn)知圖中，用有向弧表示概念節(jié)點(diǎn)之間的關(guān)系，從原因指向結(jié)果[13]，其主要結(jié)構(gòu)如圖3所示。在模糊認(rèn)知圖中，集合Ci(i=1,2,…,n)代表一組有語義的概念節(jié)點(diǎn)，其中n代表節(jié)點(diǎn)個(gè)數(shù)。節(jié)點(diǎn)間的有向弧表示兩者間的因果關(guān)系，權(quán)重Wij(-1≤Wij≤1)的大小表示原因節(jié)點(diǎn)對(duì)結(jié)果結(jié)點(diǎn)的影響程度[14]。當(dāng)0

圖3 FCM結(jié)構(gòu)圖

2 基于在線評(píng)論情感分析和模糊認(rèn)知圖的分析模型

在本小節(jié)中，為了挖掘用戶對(duì)品牌特定屬性的情感傾向，探索品牌差異性，我們構(gòu)建了一種基于情感分析和模糊認(rèn)知圖的在線評(píng)論分析模型。該分析模型主要有四個(gè)步驟：第一，利用LDA提取用戶關(guān)注屬性；第二，通過LSTM與概念語言術(shù)語集挖掘用戶對(duì)不同屬性的情感傾向；第三，構(gòu)造FCM挖掘?qū)傩灾g的關(guān)系；第四，基于EBM獲取綜合評(píng)價(jià)。為了更清楚地描述上述流程，圖4給出該模型的基本模型框架圖。

圖4 基本模型框架圖

2.1 挖掘用戶關(guān)注屬性

本文利用LDA模型對(duì)評(píng)論文本進(jìn)行主題提取，并根據(jù)LDA獲取的文本主題分布來確定用戶關(guān)注屬性。首先，將處理后的評(píng)論文本輸入LDA模型，為每個(gè)主題詞分配一個(gè)屬性；其次，遍歷所有主題詞，根據(jù)Gibbs抽樣公式對(duì)每個(gè)單詞的屬性分布進(jìn)行重采樣和更新，直到結(jié)果收斂；最后，合并類似主題并給出相應(yīng)屬性命名，并據(jù)此構(gòu)造每條評(píng)論文本在不同屬性下的文本-屬性矩陣。

2.2 屬性情感分析

為了挖掘用戶對(duì)品牌特定屬性的情感傾向，本文采用LSTM對(duì)每個(gè)評(píng)論文本的情感進(jìn)行分析，并對(duì)文本信息進(jìn)行量化。通過情感分析，每個(gè)評(píng)論文本都有一個(gè)介于0到1之間的情感得分，1表示最積極的情感，0表示最消極的情感。因此，每一個(gè)分?jǐn)?shù)代表了評(píng)論文本的情感程度，可利用情感得分評(píng)估用戶對(duì)不同品牌的滿意度。為了更清晰地衡量用戶的情感態(tài)度，本文利用PLTSs來評(píng)估用戶對(duì)不同屬性的情感。在PLTSs的框架下，可以將滿意度分為5個(gè)等級(jí)：(1, 0.8)；(0.8, 0.6)；(0.6, 0.4)；(0.4, 0.2)；(0.2, 0)[16]，它們分別對(duì)應(yīng)了“非常滿意”、“滿意”、“一般”、“不滿意”、“非常不滿意”5種語言術(shù)語集。據(jù)此，本文將情感得分按照5個(gè)等級(jí)進(jìn)行劃分，相應(yīng)的情感分析過程可分為以下4個(gè)步驟。

步驟1 對(duì)每條評(píng)論文本進(jìn)行預(yù)處理，并得到屬性及主題詞；

步驟2 用訓(xùn)練集數(shù)據(jù)訓(xùn)練LSTM模型，并利用訓(xùn)練好的模型計(jì)算每條評(píng)論的得分；

步驟3 利用PLTSs將情感得分劃分到5個(gè)等級(jí)中；

步驟4 將5個(gè)情感水平百分比標(biāo)準(zhǔn)化為滿意度。

2.3 屬性關(guān)系挖掘

為了進(jìn)一步挖掘?qū)傩灾g的關(guān)系，我們進(jìn)一步通過模糊關(guān)聯(lián)規(guī)則進(jìn)行屬性關(guān)系挖掘，建立描述屬性相互關(guān)系的FCM模型。其中，用Aj→Al表示屬性Aj和Al(j≠l)之間的模糊關(guān)聯(lián)規(guī)則，M為評(píng)論數(shù)量，vij和vil分別表示文本Texti(i=1,2,…,M)對(duì)屬性Aj和Al的影響，其值分別等于文本Texti屬于Aj、Al的概率。根據(jù)文獻(xiàn)[17]，可以計(jì)算Aj→Al的支持度、置信度和提升度分別為

(1)

(2)

lift(Aj→Al)=conf(Aj→Al)/supp(Al)，

(3)

其中：supp(Aj→Al)為支持度，用于描述屬性Aj和Al同時(shí)出現(xiàn)的可能性；conf(Aj→Al)為置信度，它刻畫了Aj對(duì)Al的影響；lift(Aj→Al)為支持度，它可以衡量模糊關(guān)聯(lián)規(guī)則的極性。

在構(gòu)建基于關(guān)聯(lián)規(guī)則的FCM模型時(shí)，需要設(shè)立一個(gè)最小支持度與最小置信度，用于刪除支持度小于最小支持度、置信度小于最小置信度的關(guān)聯(lián)規(guī)則。在其余的關(guān)聯(lián)規(guī)則中，選擇置信度作為關(guān)聯(lián)規(guī)則的絕對(duì)權(quán)重，用提升度確定權(quán)重的極性。對(duì)于每個(gè)關(guān)聯(lián)規(guī)則Aj→Al，如果lift(Aj→Al)=1，則Aj與Al相互獨(dú)立；如果lift(Aj→Al)>1，則Aj與Al正相關(guān)；如果lift(Aj→Al)<1，則Aj與Al負(fù)相關(guān)；在本文中，最小置信度設(shè)為0.25，最小支持度為0.30?；谏鲜龇治?，可以構(gòu)造相應(yīng)的模糊認(rèn)知圖，具體分為3個(gè)步驟。

步驟1 根據(jù)公式(1)～(3)，計(jì)算supp(Aj→Al)、conf(Aj→Al)與lift(Aj→Al)；

步驟2 刪除支持度小于最小支持度的規(guī)則，刪除置信度小于最小置信度的規(guī)則；

步驟3 根據(jù)lift(Aj→Al)計(jì)算出該關(guān)聯(lián)規(guī)則的權(quán)重。

2.4 總體評(píng)價(jià)

Itj=B·Ptj.

(4)

在FCM中，中心度被用來描述確定屬性重要性的度量，它可以利用屬性的索引值Indegree(Aj)和出度值Outdegree(Aj)計(jì)算權(quán)重信息。這里，屬性的度中心性定義為

Degreecentrality(Aj)=Outdegree(Aj)+Indegree(Aj)，

(5)

其中：索引值等于指向該屬性的所有關(guān)聯(lián)規(guī)則的權(quán)重之和；出度值等于從該屬性中指出的所有關(guān)聯(lián)規(guī)則的權(quán)重之和。如果一個(gè)屬性具有更高的度中心性，那么它在FCM圖中應(yīng)該扮演更重要的角色。據(jù)此，我們可以進(jìn)一步規(guī)范化屬性Aj的度中心性，并計(jì)算中心度的權(quán)重為

(6)

作為聚合算子的典型代表之一，BM算子(bonferroni mean operator)不僅可以計(jì)算每種屬性的重要性，而且能夠有效地捕獲屬性間的內(nèi)在聯(lián)系，因而常常被應(yīng)用到多屬性群決策問題中。然而，雖然BM算子考慮了屬性之間的相互作用，但這種交互是非定向的。對(duì)于FCM而言，每個(gè)關(guān)聯(lián)規(guī)則表示屬性之間的因果關(guān)系?；谏鲜龇治?，對(duì)于一個(gè)特定的品牌，我們使用了改進(jìn)的EBM算子來測(cè)量滿意度得分。

對(duì)于第t個(gè)品牌，基于EBM的計(jì)算結(jié)果，分別使用乘法屬性計(jì)算每個(gè)屬性Aj的滿意度得分，

(7)

(8)

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)

為了驗(yàn)證所提出方法的有效性，選取京東商城化妝品真實(shí)數(shù)據(jù)進(jìn)行驗(yàn)證，爬取了2016年6月至2020年6月京東商城中歐萊雅、雅詩蘭黛、資生堂和愛茉莉太平洋4個(gè)化妝品品牌的在線評(píng)論數(shù)據(jù)。經(jīng)過數(shù)據(jù)清洗后有效評(píng)論為156 956條，其中包含111 365條正向評(píng)論和47 591條負(fù)向評(píng)論。平均每條評(píng)論長度為154字，經(jīng)過Jieba分詞后平均分詞數(shù)為54個(gè)。文本情感極性標(biāo)簽分別用1和0表示，1代表正向評(píng)論，0代表負(fù)向評(píng)論。所有有效評(píng)論數(shù)據(jù)集包含4個(gè)大品牌，每個(gè)大品牌下均有一級(jí)、二級(jí)、三級(jí)產(chǎn)品。如雅詩蘭黛旗下一級(jí)產(chǎn)品有海藍(lán)之謎；二級(jí)產(chǎn)品有雅詩蘭黛、悅木之源；三級(jí)產(chǎn)品有朗仕等，其數(shù)據(jù)分布如表1所示。

表1 4個(gè)品牌評(píng)論數(shù)據(jù)分布表

3.2 實(shí)驗(yàn)結(jié)果分析

3.2.1屬性挖掘根據(jù)圖4的提出的框架模型，利用LDA對(duì)在線評(píng)論進(jìn)行主題提取，可以得到價(jià)格(A1)、性價(jià)比(A2)、效果(A3)、物流(A4)、售后(A5)5個(gè)屬性，每一個(gè)屬性及其對(duì)應(yīng)的主要關(guān)鍵詞如表2所示。如在“價(jià)格”主題下，有“劃算”、“便宜”、“優(yōu)惠”等關(guān)鍵詞；售后主題下則有“客戶”、“保障”、“服務(wù)態(tài)度”等關(guān)鍵詞。

表2 評(píng)論主題與核心關(guān)鍵詞表

根據(jù)表2提取的5個(gè)主題，分別計(jì)算每條在線評(píng)論對(duì)5個(gè)屬性的概率分布，得到的文本-屬性概率矩陣結(jié)果如表3所示。以Text2為例，它對(duì)A1、A4的概率值分別為0.453 6、0.237 4，這說明第2條在線評(píng)論對(duì)應(yīng)“性價(jià)比”概率為0.453 6，對(duì)應(yīng)“物流”關(guān)鍵詞的概率為0.237 4。

根據(jù)表3，可以分別計(jì)算文本-屬性概率矩陣中每一行的最大值，其代表該文本的主屬性，如：Text1的主屬性為“價(jià)格”；Text2的主屬性為“價(jià)格”；Text3的主屬性為“物流”等。此外，可以據(jù)此簡(jiǎn)單統(tǒng)計(jì)各屬性下評(píng)論的主屬性分布情況，其中涉及價(jià)格屬性33 129條、性價(jià)比屬性55 513條、效果屬性8 598條、物流屬性7 965條、售后屬性53 751條。顯而易見地，在所有評(píng)論中，“性價(jià)比”和“售后”兩條主屬性的評(píng)論數(shù)量均超過5萬條，這說明所有評(píng)論對(duì)“性價(jià)比”和“售后”兩個(gè)屬性最為關(guān)注。然后，根據(jù)LSTM計(jì)算每條文本的情感分布，也可以計(jì)算每一條文本的情感得分情況，如：Text1的情感得分為0.808 0；Text2的主屬性情感得分為0.033 4；Text3的情感得分為0.102 6等?？梢钥吹?，每一條文本的輸出概率在0和1之間，其數(shù)字大小含義為：如果該條評(píng)論得分越高，就越接近正向評(píng)論；得分越低，則越接近負(fù)向評(píng)論。進(jìn)一步地，通過LDA和LSTM計(jì)算的結(jié)果并結(jié)合 PLTSs，可以計(jì)算各個(gè)屬性的總體滿意度比例，如表4所示。

表3 文本-屬性概率矩陣

表4 屬性的總體滿意度比例表

3.2.2屬性關(guān)系分析根據(jù)表3和公式(1)～(3)，可計(jì)算相應(yīng)的置信度和提升度矩陣，計(jì)算結(jié)果如表5和表6所示。根據(jù)表5～6可以繪制總體FCM。在圖5中，箭頭代表兩屬性的關(guān)聯(lián)。在總體模糊認(rèn)知圖中，其他幾個(gè)屬性均與屬性“售后”有關(guān)聯(lián)，由此可見，該屬性在分析在線評(píng)論中具有很重要的意義。根據(jù)公式(4)～(7)，可以分別計(jì)算不同品牌和不同產(chǎn)品等級(jí)的屬性綜合評(píng)分，如表7所示。

表5 總體置信度矩陣

表6 總體提升度矩陣

圖5 總體FCM

最后，根據(jù)品牌和產(chǎn)品等級(jí)數(shù)據(jù)，通過公式(1)～(3)分別構(gòu)建相應(yīng)的FCM，結(jié)果如圖6所示。一方面，通過圖6(a)可以發(fā)現(xiàn)，不同品牌間屬性關(guān)系存在差異。如品牌“歐萊雅”的“價(jià)格”、“性價(jià)比”和“物流”屬性對(duì)“售后”屬性有正向關(guān)系；品牌“雅詩蘭黛”的“價(jià)格”、“性價(jià)比”、“效果”屬性對(duì)“售后”屬性有正向關(guān)系，“售后”對(duì)“物流”有正向關(guān)系，“售后”對(duì)“效果”有負(fù)向關(guān)系；另一方面，由圖6(b)可以得到，不同產(chǎn)品等級(jí)間屬性關(guān)系差異較大，一級(jí)產(chǎn)品的屬性“物流”、“效果”與“售后”存在正向關(guān)系，而“價(jià)格”與“售后”存在負(fù)向關(guān)系，一級(jí)產(chǎn)品價(jià)格較高，用戶在購買時(shí)更看重產(chǎn)品質(zhì)量與效果。

圖6 不同品牌和不同產(chǎn)品等級(jí)FCM

3.2.3綜合評(píng)價(jià) 根據(jù)表7～8和公式(8)，可以得到不同品牌和不同產(chǎn)品等級(jí)的最終加權(quán)滿意度得分，其品牌得分排序情況：歐萊雅(0.903 1)<雅詩蘭黛(0.919 5)<資生堂(0.952 6)<愛茉莉太平洋(1.021 8)；從等級(jí)角度，則有一級(jí)產(chǎn)品(1.010 7)>二級(jí)產(chǎn)品(0.952 1)>三級(jí)產(chǎn)品(0.852 1)。為了更加方便地對(duì)其進(jìn)行比較，我們將不同品牌屬性和不同產(chǎn)品等級(jí)得分進(jìn)行匯總，結(jié)果如圖7所示。

表7 不同品牌的屬性評(píng)分表

由圖7(a)，從品牌角度，在綜合滿意度最高的愛茉莉太平洋中，“性價(jià)比”、“售后”是其應(yīng)該關(guān)注的屬性。根據(jù)其模糊認(rèn)知圖，可以發(fā)現(xiàn)，“效果”、“價(jià)格”與“售后”呈明顯正相關(guān)，品牌方應(yīng)多關(guān)注這兩個(gè)屬性；在資生堂中，“效果”、“價(jià)格”則需要引起高度關(guān)注；在雅詩蘭黛中，“價(jià)格”是其主要優(yōu)勢(shì)，需要在“物流”、“售后”方面投入更多精力；在歐萊雅中，各項(xiàng)屬性均落后于其他三個(gè)品牌。由圖7(b)從用戶角度，三個(gè)產(chǎn)品的等級(jí)呈現(xiàn)出了明顯的大小關(guān)系。一級(jí)產(chǎn)品在除“價(jià)格”以外的幾個(gè)屬性上均優(yōu)于其他兩種產(chǎn)品；二級(jí)產(chǎn)品則在“售后”屬性上落后于三級(jí)產(chǎn)品。

表8 不同產(chǎn)品等級(jí)的屬性評(píng)分表

圖7 不同品牌和不同等級(jí)屬性得分圖

基于上述分析，從品牌等級(jí)角度來看，一級(jí)產(chǎn)品的各項(xiàng)指標(biāo)遠(yuǎn)遠(yuǎn)高于二級(jí)和三級(jí)產(chǎn)品，驗(yàn)證了“差異化”營銷的有效性。同時(shí)，在所有屬性中，“售后”屬性表現(xiàn)最差，這說明所有品牌都需要對(duì)這一指標(biāo)采取措施用以提升顧客滿意度。

3.3 情感分析結(jié)果對(duì)比

為了進(jìn)一步驗(yàn)證本文所用LSTM算法的有效性，我們選取情感分析常用的支持向量機(jī)(SVM)，樸素貝葉斯(Naive Bayesian)、卷積神經(jīng)網(wǎng)(CNN)、極限梯度提升算法(XGBoost)作為基準(zhǔn)算法。這里，我們采用精度(Precision)、召回率(Recall)和F1值三個(gè)指標(biāo)作為評(píng)價(jià)標(biāo)準(zhǔn)來衡量不同算法在情感分析過程中的表現(xiàn)情況，算法所用公式為

Precision=TP/(TP+FP)；

(9)

Recall=TP/(TP+FN)；

(10)

F1=2precision·recall/(precision+recall)。

(11)

結(jié)果匯總?cè)绫?所示。無論是在Precision、Recall還是F1值的表現(xiàn)上，LSTM相較其他算法都取得了較好的預(yù)測(cè)效果，這也間接說明本文利用LSTM進(jìn)行情感分析是合理和有效的。

表9 算法結(jié)果匯總表

4 結(jié)論與展望

為了幫助企業(yè)發(fā)現(xiàn)市場(chǎng)的差異化需求，對(duì)某產(chǎn)品或服務(wù)進(jìn)行有效創(chuàng)新和改進(jìn)，本研究以化妝品市場(chǎng)為例，針對(duì)差異性產(chǎn)品，分別從品牌和用戶兩個(gè)維度，挖掘產(chǎn)品差異化特征，分析用戶滿意度，對(duì)差異化產(chǎn)品的競(jìng)爭(zhēng)性進(jìn)行探討，并提出相應(yīng)的改進(jìn)建議。首先，利用LDA挖掘用戶所關(guān)心的產(chǎn)品特征；其次，利用長短期記憶和概率語言術(shù)語集更準(zhǔn)確地測(cè)度了用戶對(duì)不同產(chǎn)品特征的情感；然后，利用模糊認(rèn)知圖和關(guān)聯(lián)規(guī)則進(jìn)一步研究了各產(chǎn)品特征之間的相互關(guān)系，構(gòu)建了特征之間的關(guān)系圖；最后，通過EBM算子對(duì)決策信息進(jìn)行聚合，得到最終綜合評(píng)價(jià)?？偠灾疚乃岢龅哪Ｐ秃头椒軌?qū)⒃诰€評(píng)論的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為定量信息，獲得產(chǎn)品特征的滿意度評(píng)價(jià)，并在主題提取、情感分析、以及綜合評(píng)價(jià)方面取得了一定的效果。在未來研究中，一方面可以將數(shù)據(jù)的時(shí)序性引入到研究中，根據(jù)時(shí)間動(dòng)態(tài)變化來探索動(dòng)態(tài)的用戶滿意度變化，并分析產(chǎn)品差異性變化趨勢(shì)；另一方面，考慮到模糊認(rèn)知圖只是衡量屬性關(guān)系的一種形式，后續(xù)還可以探討其他模型來實(shí)現(xiàn)相關(guān)任務(wù)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡