段恒鑫, 劉 盾,2, 葉曉慶
(1.西南交通大學(xué) 經(jīng)濟(jì)管理學(xué)院 成都 610031; 2.重慶郵電大學(xué) 計(jì)算智能重慶市重點(diǎn)實(shí)驗(yàn)室 重慶 400065)
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展、在線支付的普及以及物流配送效率的提升,在線購物成為主流趨勢(shì),電子商務(wù)成交量逐年增加[1]。然而,在電子商務(wù)飛速發(fā)展的同時(shí),品牌之間的競(jìng)爭(zhēng)也日益嚴(yán)重,品牌想要沖出重圍,需要形成自身特色,并以此來提高品牌的競(jìng)爭(zhēng)力。為此,大多企業(yè)一般采取產(chǎn)品差異化戰(zhàn)略,通過突出品牌優(yōu)勢(shì)來吸引用戶,提高產(chǎn)品競(jìng)爭(zhēng)力。
產(chǎn)品差異性是用戶接受商家品牌與其他競(jìng)爭(zhēng)者之間的差異程度[2]。以化妝品品牌為例,企業(yè)針對(duì)不同目標(biāo)用戶,將旗下品牌按照“高端”、“輕奢”、“平價(jià)”進(jìn)行市場(chǎng)細(xì)分。例如,世界著名化妝品巨頭歐萊雅集團(tuán)旗下一線品牌有赫蓮娜;二線品牌有蘭蔻和碧歐泉;三線品牌有巴黎歐萊雅、科顏氏等。從企業(yè)角度,分析產(chǎn)品差異性可以幫助企業(yè)有效獲取用戶需求,精準(zhǔn)定位目標(biāo)用戶,核定市場(chǎng)細(xì)分,為生產(chǎn)安排提供反饋;從用戶角度,分析產(chǎn)品差異性可以給用戶更多的關(guān)于產(chǎn)品橫向?qū)Ρ刃畔?,輔助購買決策[3]。
在線評(píng)論是獲取商品評(píng)價(jià)的重要渠道,對(duì)企業(yè)和用戶來說都有重要意義。借助互聯(lián)網(wǎng)平臺(tái)交互性、個(gè)性化、便捷性等特點(diǎn),越來越多的用戶愿意在網(wǎng)絡(luò)社區(qū)或電子商務(wù)網(wǎng)站上瀏覽和發(fā)布信息,以達(dá)到產(chǎn)品信息交流和購物體驗(yàn)分享的目的。對(duì)于用戶而言,在線評(píng)論反映了產(chǎn)品的真實(shí)信息,可以幫助用戶進(jìn)行購買決策;對(duì)于企業(yè)而言,在線評(píng)論中蘊(yùn)藏著有關(guān)產(chǎn)品、服務(wù)質(zhì)量和用戶情感態(tài)度等豐富的信息,是企業(yè)獲取用戶需求的重要來源。因此,近年來,在線評(píng)論逐漸成為商家和電子商務(wù)平臺(tái)關(guān)注的焦點(diǎn)[4]。一方面,在線評(píng)論直接反映了用戶對(duì)產(chǎn)品的滿意度;另一方面,在線評(píng)論間接地反映了用戶的主要需求,是實(shí)現(xiàn)品牌差異性分析的有效信息。
然而,如果要實(shí)現(xiàn)精準(zhǔn)的品牌差異性分析,我們不但需要挖掘用戶主要關(guān)注屬性,還要獲取用戶對(duì)不同屬性的情感傾向以及屬性間的關(guān)系?;诖?,本文提出了基于在線評(píng)論情感分析和模糊認(rèn)知圖的產(chǎn)品差異化分析模型。該模型首先通過機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)技術(shù)從在線評(píng)論中挖掘用戶關(guān)注的屬性,進(jìn)行情感判斷,再通過模糊認(rèn)知圖(fuzzy cognitive map, FCM)獲取用戶對(duì)產(chǎn)品不同屬性的情感傾向,以此獲得產(chǎn)品差異性分析的綜合評(píng)價(jià)。
LDA是由Blei等[5]提出的文本主題提取模型,用于直接提取文本中具有語義解釋性的主題特征。在LDA中存在一個(gè)假設(shè),即用戶在編輯評(píng)論文本時(shí),在他的意識(shí)中會(huì)存在一些主題元素,而這些主題中會(huì)存在不同的詞或句,通過主題-詞選擇來構(gòu)成用戶產(chǎn)生的在線評(píng)論,LDA具體模型如圖1所示。其中:k表示提取主題的數(shù);N表示在線評(píng)論包含的詞數(shù)量;wm,n表示第m篇文檔的第n個(gè)詞;tm,n表示第m篇文檔第n個(gè)主題;φk表示各主題下對(duì)應(yīng)的詞概率分布;θm表示各文檔下對(duì)應(yīng)的主題分布。假設(shè)整體在線評(píng)論存在V個(gè)非重復(fù)詞匯,根據(jù)上述模型,可計(jì)算相應(yīng)的聯(lián)合概率分布為
圖1 LDA模型
當(dāng)超參數(shù)α、β給定時(shí),可通過吉布斯采樣對(duì)LDA中參數(shù)θm和φk進(jìn)行估計(jì)求解:
通過對(duì)參數(shù)θm和φk進(jìn)行求解,可獲得各在線評(píng)論文本的主題分布和各主題下的詞分布,由此來實(shí)現(xiàn)基于LDA的在線評(píng)論主題提取。
LSTM是Hochreiter等[6]提出的一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),主要為了解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸的問題。LSTM通過一個(gè)記憶單元與三個(gè)門(遺忘門、更新門、輸出門)結(jié)構(gòu)來實(shí)現(xiàn)對(duì)每個(gè)單元狀態(tài)的控制[7],其結(jié)構(gòu)如圖2所示。與循環(huán)神經(jīng)網(wǎng)絡(luò)相比,長短期記憶LSTM有2個(gè)傳輸狀態(tài):c1(cell state),h1(hidden state)。循環(huán)神經(jīng)網(wǎng)絡(luò)中的h1就是LSTM中的c1,這也是LSTM的關(guān)鍵。LSTM利用門的結(jié)構(gòu)來精確控制加入或移除信息到記憶狀態(tài)。
圖2 LSTM結(jié)構(gòu)圖
模糊認(rèn)知圖(fuzzy cognitive map, FCM) 是一種利用現(xiàn)有知識(shí)和專家經(jīng)驗(yàn)來模擬復(fù)雜系統(tǒng)的方法[8]。模糊認(rèn)知圖利用接近于人類認(rèn)知的方式描述一個(gè)系統(tǒng),通過強(qiáng)調(diào)因果連接和圖的結(jié)構(gòu)來表示知識(shí),同時(shí)利用規(guī)則的形式將專家知識(shí)和從數(shù)據(jù)中獲得的有用知識(shí)合并在一起[9]。在網(wǎng)絡(luò)管理[10]、故障分析[11]、專家決策[12]等領(lǐng)域有廣泛應(yīng)用。在模糊認(rèn)知圖中,用有向弧表示概念節(jié)點(diǎn)之間的關(guān)系,從原因指向結(jié)果[13],其主要結(jié)構(gòu)如圖3所示。在模糊認(rèn)知圖中,集合Ci(i=1,2,…,n)代表一組有語義的概念節(jié)點(diǎn),其中n代表節(jié)點(diǎn)個(gè)數(shù)。節(jié)點(diǎn)間的有向弧表示兩者間的因果關(guān)系,權(quán)重Wij(-1≤Wij≤1)的大小表示原因節(jié)點(diǎn)對(duì)結(jié)果結(jié)點(diǎn)的影響程度[14]。當(dāng)0 圖3 FCM結(jié)構(gòu)圖 在本小節(jié)中,為了挖掘用戶對(duì)品牌特定屬性的情感傾向,探索品牌差異性,我們構(gòu)建了一種基于情感分析和模糊認(rèn)知圖的在線評(píng)論分析模型。該分析模型主要有四個(gè)步驟:第一,利用LDA提取用戶關(guān)注屬性;第二,通過LSTM與概念語言術(shù)語集挖掘用戶對(duì)不同屬性的情感傾向;第三,構(gòu)造FCM挖掘?qū)傩灾g的關(guān)系;第四,基于EBM獲取綜合評(píng)價(jià)。為了更清楚地描述上述流程,圖4給出該模型的基本模型框架圖。 圖4 基本模型框架圖 本文利用LDA模型對(duì)評(píng)論文本進(jìn)行主題提取,并根據(jù)LDA獲取的文本主題分布來確定用戶關(guān)注屬性。首先,將處理后的評(píng)論文本輸入LDA模型,為每個(gè)主題詞分配一個(gè)屬性;其次,遍歷所有主題詞,根據(jù)Gibbs抽樣公式對(duì)每個(gè)單詞的屬性分布進(jìn)行重采樣和更新,直到結(jié)果收斂;最后,合并類似主題并給出相應(yīng)屬性命名,并據(jù)此構(gòu)造每條評(píng)論文本在不同屬性下的文本-屬性矩陣。 為了挖掘用戶對(duì)品牌特定屬性的情感傾向,本文采用LSTM對(duì)每個(gè)評(píng)論文本的情感進(jìn)行分析,并對(duì)文本信息進(jìn)行量化。通過情感分析,每個(gè)評(píng)論文本都有一個(gè)介于0到1之間的情感得分,1表示最積極的情感,0表示最消極的情感。因此,每一個(gè)分?jǐn)?shù)代表了評(píng)論文本的情感程度,可利用情感得分評(píng)估用戶對(duì)不同品牌的滿意度。為了更清晰地衡量用戶的情感態(tài)度,本文利用PLTSs來評(píng)估用戶對(duì)不同屬性的情感。在PLTSs的框架下,可以將滿意度分為5個(gè)等級(jí):(1, 0.8);(0.8, 0.6);(0.6, 0.4);(0.4, 0.2);(0.2, 0)[16],它們分別對(duì)應(yīng)了“非常滿意”、“滿意”、“一般”、“不滿意”、“非常不滿意”5種語言術(shù)語集。據(jù)此,本文將情感得分按照5個(gè)等級(jí)進(jìn)行劃分,相應(yīng)的情感分析過程可分為以下4個(gè)步驟。 步驟1 對(duì)每條評(píng)論文本進(jìn)行預(yù)處理,并得到屬性及主題詞; 步驟2 用訓(xùn)練集數(shù)據(jù)訓(xùn)練LSTM模型,并利用訓(xùn)練好的模型計(jì)算每條評(píng)論的得分; 步驟3 利用PLTSs將情感得分劃分到5個(gè)等級(jí)中; 步驟4 將5個(gè)情感水平百分比標(biāo)準(zhǔn)化為滿意度。 為了進(jìn)一步挖掘?qū)傩灾g的關(guān)系,我們進(jìn)一步通過模糊關(guān)聯(lián)規(guī)則進(jìn)行屬性關(guān)系挖掘,建立描述屬性相互關(guān)系的FCM模型。其中,用Aj→Al表示屬性Aj和Al(j≠l)之間的模糊關(guān)聯(lián)規(guī)則,M為評(píng)論數(shù)量,vij和vil分別表示文本Texti(i=1,2,…,M)對(duì)屬性Aj和Al的影響,其值分別等于文本Texti屬于Aj、Al的概率。根據(jù)文獻(xiàn)[17],可以計(jì)算Aj→Al的支持度、置信度和提升度分別為 (1) (2) lift(Aj→Al)=conf(Aj→Al)/supp(Al), (3) 其中:supp(Aj→Al)為支持度,用于描述屬性Aj和Al同時(shí)出現(xiàn)的可能性;conf(Aj→Al)為置信度,它刻畫了Aj對(duì)Al的影響;lift(Aj→Al)為支持度,它可以衡量模糊關(guān)聯(lián)規(guī)則的極性。 在構(gòu)建基于關(guān)聯(lián)規(guī)則的FCM模型時(shí),需要設(shè)立一個(gè)最小支持度與最小置信度,用于刪除支持度小于最小支持度、置信度小于最小置信度的關(guān)聯(lián)規(guī)則。在其余的關(guān)聯(lián)規(guī)則中,選擇置信度作為關(guān)聯(lián)規(guī)則的絕對(duì)權(quán)重,用提升度確定權(quán)重的極性。對(duì)于每個(gè)關(guān)聯(lián)規(guī)則Aj→Al,如果lift(Aj→Al)=1,則Aj與Al相互獨(dú)立;如果lift(Aj→Al)>1,則Aj與Al正相關(guān);如果lift(Aj→Al)<1,則Aj與Al負(fù)相關(guān);在本文中,最小置信度設(shè)為0.25,最小支持度為0.30?;谏鲜龇治?,可以構(gòu)造相應(yīng)的模糊認(rèn)知圖,具體分為3個(gè)步驟。 步驟1 根據(jù)公式(1)~(3),計(jì)算supp(Aj→Al)、conf(Aj→Al)與lift(Aj→Al); 步驟2 刪除支持度小于最小支持度的規(guī)則,刪除置信度小于最小置信度的規(guī)則; 步驟3 根據(jù)lift(Aj→Al)計(jì)算出該關(guān)聯(lián)規(guī)則的權(quán)重。 Itj=B·Ptj. (4) 在FCM中,中心度被用來描述確定屬性重要性的度量,它可以利用屬性的索引值Indegree(Aj)和出度值Outdegree(Aj)計(jì)算權(quán)重信息。這里,屬性的度中心性定義為 Degreecentrality(Aj)=Outdegree(Aj)+Indegree(Aj), (5) 其中:索引值等于指向該屬性的所有關(guān)聯(lián)規(guī)則的權(quán)重之和;出度值等于從該屬性中指出的所有關(guān)聯(lián)規(guī)則的權(quán)重之和。如果一個(gè)屬性具有更高的度中心性,那么它在FCM圖中應(yīng)該扮演更重要的角色。據(jù)此,我們可以進(jìn)一步規(guī)范化屬性Aj的度中心性,并計(jì)算中心度的權(quán)重為 (6) 作為聚合算子的典型代表之一,BM算子(bonferroni mean operator)不僅可以計(jì)算每種屬性的重要性,而且能夠有效地捕獲屬性間的內(nèi)在聯(lián)系,因而常常被應(yīng)用到多屬性群決策問題中。然而,雖然BM算子考慮了屬性之間的相互作用,但這種交互是非定向的。對(duì)于FCM而言,每個(gè)關(guān)聯(lián)規(guī)則表示屬性之間的因果關(guān)系?;谏鲜龇治?,對(duì)于一個(gè)特定的品牌,我們使用了改進(jìn)的EBM算子來測(cè)量滿意度得分。 對(duì)于第t個(gè)品牌,基于EBM的計(jì)算結(jié)果,分別使用乘法屬性計(jì)算每個(gè)屬性Aj的滿意度得分, (7) (8) 為了驗(yàn)證所提出方法的有效性,選取京東商城化妝品真實(shí)數(shù)據(jù)進(jìn)行驗(yàn)證,爬取了2016年6月至2020年6月京東商城中歐萊雅、雅詩蘭黛、資生堂和愛茉莉太平洋4個(gè)化妝品品牌的在線評(píng)論數(shù)據(jù)。經(jīng)過數(shù)據(jù)清洗后有效評(píng)論為156 956條,其中包含111 365條正向評(píng)論和47 591條負(fù)向評(píng)論。平均每條評(píng)論長度為154字,經(jīng)過Jieba分詞后平均分詞數(shù)為54個(gè)。文本情感極性標(biāo)簽分別用1和0表示,1代表正向評(píng)論,0代表負(fù)向評(píng)論。所有有效評(píng)論數(shù)據(jù)集包含4個(gè)大品牌,每個(gè)大品牌下均有一級(jí)、二級(jí)、三級(jí)產(chǎn)品。如雅詩蘭黛旗下一級(jí)產(chǎn)品有海藍(lán)之謎;二級(jí)產(chǎn)品有雅詩蘭黛、悅木之源;三級(jí)產(chǎn)品有朗仕等,其數(shù)據(jù)分布如表1所示。 表1 4個(gè)品牌評(píng)論數(shù)據(jù)分布表 3.2.1屬性挖掘 根據(jù)圖4的提出的框架模型,利用LDA對(duì)在線評(píng)論進(jìn)行主題提取,可以得到價(jià)格(A1)、性價(jià)比(A2)、效果(A3)、物流(A4)、售后(A5)5個(gè)屬性,每一個(gè)屬性及其對(duì)應(yīng)的主要關(guān)鍵詞如表2所示。如在“價(jià)格”主題下,有“劃算”、“便宜”、“優(yōu)惠”等關(guān)鍵詞;售后主題下則有“客戶”、“保障”、“服務(wù)態(tài)度”等關(guān)鍵詞。 表2 評(píng)論主題與核心關(guān)鍵詞表 根據(jù)表2提取的5個(gè)主題,分別計(jì)算每條在線評(píng)論對(duì)5個(gè)屬性的概率分布,得到的文本-屬性概率矩陣結(jié)果如表3所示。以Text2為例,它對(duì)A1、A4的概率值分別為0.453 6、0.237 4,這說明第2條在線評(píng)論對(duì)應(yīng)“性價(jià)比”概率為0.453 6,對(duì)應(yīng)“物流”關(guān)鍵詞的概率為0.237 4。 根據(jù)表3,可以分別計(jì)算文本-屬性概率矩陣中每一行的最大值,其代表該文本的主屬性,如:Text1的主屬性為“價(jià)格”;Text2的主屬性為“價(jià)格”;Text3的主屬性為“物流”等。此外,可以據(jù)此簡(jiǎn)單統(tǒng)計(jì)各屬性下評(píng)論的主屬性分布情況,其中涉及價(jià)格屬性33 129條、性價(jià)比屬性55 513條、效果屬性8 598條、物流屬性7 965條、售后屬性53 751條。顯而易見地,在所有評(píng)論中,“性價(jià)比”和“售后”兩條主屬性的評(píng)論數(shù)量均超過5萬條,這說明所有評(píng)論對(duì)“性價(jià)比”和“售后”兩個(gè)屬性最為關(guān)注。然后,根據(jù)LSTM計(jì)算每條文本的情感分布,也可以計(jì)算每一條文本的情感得分情況,如:Text1的情感得分為0.808 0;Text2的主屬性情感得分為0.033 4;Text3的情感得分為0.102 6等??梢钥吹?,每一條文本的輸出概率在0和1之間,其數(shù)字大小含義為:如果該條評(píng)論得分越高,就越接近正向評(píng)論;得分越低,則越接近負(fù)向評(píng)論。進(jìn)一步地,通過LDA和LSTM計(jì)算的結(jié)果并結(jié)合 PLTSs,可以計(jì)算各個(gè)屬性的總體滿意度比例,如表4所示。 表3 文本-屬性概率矩陣 表4 屬性的總體滿意度比例表 3.2.2屬性關(guān)系分析 根據(jù)表3和公式(1)~(3),可計(jì)算相應(yīng)的置信度和提升度矩陣,計(jì)算結(jié)果如表5和表6所示。根據(jù)表5~6可以繪制總體FCM。在圖5中,箭頭代表兩屬性的關(guān)聯(lián)。在總體模糊認(rèn)知圖中,其他幾個(gè)屬性均與屬性“售后”有關(guān)聯(lián),由此可見,該屬性在分析在線評(píng)論中具有很重要的意義。根據(jù)公式(4)~(7),可以分別計(jì)算不同品牌和不同產(chǎn)品等級(jí)的屬性綜合評(píng)分,如表7所示。 表5 總體置信度矩陣 表6 總體提升度矩陣 圖5 總體FCM 最后,根據(jù)品牌和產(chǎn)品等級(jí)數(shù)據(jù),通過公式(1)~(3)分別構(gòu)建相應(yīng)的FCM,結(jié)果如圖6所示。一方面,通過圖6(a)可以發(fā)現(xiàn),不同品牌間屬性關(guān)系存在差異。如品牌“歐萊雅”的“價(jià)格”、“性價(jià)比”和“物流”屬性對(duì)“售后”屬性有正向關(guān)系;品牌“雅詩蘭黛”的“價(jià)格”、“性價(jià)比”、“效果”屬性對(duì)“售后”屬性有正向關(guān)系,“售后”對(duì)“物流”有正向關(guān)系,“售后”對(duì)“效果”有負(fù)向關(guān)系;另一方面,由圖6(b)可以得到,不同產(chǎn)品等級(jí)間屬性關(guān)系差異較大,一級(jí)產(chǎn)品的屬性“物流”、“效果”與“售后”存在正向關(guān)系,而“價(jià)格”與“售后”存在負(fù)向關(guān)系,一級(jí)產(chǎn)品價(jià)格較高,用戶在購買時(shí)更看重產(chǎn)品質(zhì)量與效果。 圖6 不同品牌和不同產(chǎn)品等級(jí)FCM 3.2.3綜合評(píng)價(jià) 根據(jù)表7~8和公式(8),可以得到不同品牌和不同產(chǎn)品等級(jí)的最終加權(quán)滿意度得分,其品牌得分排序情況:歐萊雅(0.903 1)<雅詩蘭黛(0.919 5)<資生堂(0.952 6)<愛茉莉太平洋(1.021 8);從等級(jí)角度,則有一級(jí)產(chǎn)品(1.010 7)>二級(jí)產(chǎn)品(0.952 1)>三級(jí)產(chǎn)品(0.852 1)。為了更加方便地對(duì)其進(jìn)行比較,我們將不同品牌屬性和不同產(chǎn)品等級(jí)得分進(jìn)行匯總,結(jié)果如圖7所示。 表7 不同品牌的屬性評(píng)分表 由圖7(a),從品牌角度,在綜合滿意度最高的愛茉莉太平洋中,“性價(jià)比”、“售后”是其應(yīng)該關(guān)注的屬性。根據(jù)其模糊認(rèn)知圖,可以發(fā)現(xiàn),“效果”、“價(jià)格”與“售后”呈明顯正相關(guān),品牌方應(yīng)多關(guān)注這兩個(gè)屬性;在資生堂中,“效果”、“價(jià)格”則需要引起高度關(guān)注;在雅詩蘭黛中,“價(jià)格”是其主要優(yōu)勢(shì),需要在“物流”、“售后”方面投入更多精力;在歐萊雅中,各項(xiàng)屬性均落后于其他三個(gè)品牌。由圖7(b)從用戶角度,三個(gè)產(chǎn)品的等級(jí)呈現(xiàn)出了明顯的大小關(guān)系。一級(jí)產(chǎn)品在除“價(jià)格”以外的幾個(gè)屬性上均優(yōu)于其他兩種產(chǎn)品;二級(jí)產(chǎn)品則在“售后”屬性上落后于三級(jí)產(chǎn)品。 表8 不同產(chǎn)品等級(jí)的屬性評(píng)分表 圖7 不同品牌和不同等級(jí)屬性得分圖 基于上述分析,從品牌等級(jí)角度來看,一級(jí)產(chǎn)品的各項(xiàng)指標(biāo)遠(yuǎn)遠(yuǎn)高于二級(jí)和三級(jí)產(chǎn)品,驗(yàn)證了“差異化”營銷的有效性。同時(shí),在所有屬性中,“售后”屬性表現(xiàn)最差,這說明所有品牌都需要對(duì)這一指標(biāo)采取措施用以提升顧客滿意度。 為了進(jìn)一步驗(yàn)證本文所用LSTM算法的有效性,我們選取情感分析常用的支持向量機(jī)(SVM),樸素貝葉斯(Naive Bayesian)、卷積神經(jīng)網(wǎng)(CNN)、極限梯度提升算法(XGBoost)作為基準(zhǔn)算法。這里,我們采用精度(Precision)、召回率(Recall)和F1值三個(gè)指標(biāo)作為評(píng)價(jià)標(biāo)準(zhǔn)來衡量不同算法在情感分析過程中的表現(xiàn)情況,算法所用公式為 Precision=TP/(TP+FP); (9) Recall=TP/(TP+FN); (10) F1=2precision·recall/(precision+recall)。 (11) 結(jié)果匯總?cè)绫?所示。無論是在Precision、Recall還是F1值的表現(xiàn)上,LSTM相較其他算法都取得了較好的預(yù)測(cè)效果,這也間接說明本文利用LSTM進(jìn)行情感分析是合理和有效的。 表9 算法結(jié)果匯總表 為了幫助企業(yè)發(fā)現(xiàn)市場(chǎng)的差異化需求,對(duì)某產(chǎn)品或服務(wù)進(jìn)行有效創(chuàng)新和改進(jìn),本研究以化妝品市場(chǎng)為例,針對(duì)差異性產(chǎn)品,分別從品牌和用戶兩個(gè)維度,挖掘產(chǎn)品差異化特征,分析用戶滿意度,對(duì)差異化產(chǎn)品的競(jìng)爭(zhēng)性進(jìn)行探討,并提出相應(yīng)的改進(jìn)建議。首先,利用LDA挖掘用戶所關(guān)心的產(chǎn)品特征;其次,利用長短期記憶和概率語言術(shù)語集更準(zhǔn)確地測(cè)度了用戶對(duì)不同產(chǎn)品特征的情感;然后,利用模糊認(rèn)知圖和關(guān)聯(lián)規(guī)則進(jìn)一步研究了各產(chǎn)品特征之間的相互關(guān)系,構(gòu)建了特征之間的關(guān)系圖;最后,通過EBM算子對(duì)決策信息進(jìn)行聚合,得到最終綜合評(píng)價(jià)??偠灾疚乃岢龅哪P秃头椒軌?qū)⒃诰€評(píng)論的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為定量信息,獲得產(chǎn)品特征的滿意度評(píng)價(jià),并在主題提取、情感分析、以及綜合評(píng)價(jià)方面取得了一定的效果。在未來研究中,一方面可以將數(shù)據(jù)的時(shí)序性引入到研究中,根據(jù)時(shí)間動(dòng)態(tài)變化來探索動(dòng)態(tài)的用戶滿意度變化,并分析產(chǎn)品差異性變化趨勢(shì);另一方面,考慮到模糊認(rèn)知圖只是衡量屬性關(guān)系的一種形式,后續(xù)還可以探討其他模型來實(shí)現(xiàn)相關(guān)任務(wù)。2 基于在線評(píng)論情感分析和模糊認(rèn)知圖的分析模型
2.1 挖掘用戶關(guān)注屬性
2.2 屬性情感分析
2.3 屬性關(guān)系挖掘
2.4 總體評(píng)價(jià)
3 實(shí)驗(yàn)結(jié)果與分析
3.1 實(shí)驗(yàn)數(shù)據(jù)
3.2 實(shí)驗(yàn)結(jié)果分析
3.3 情感分析結(jié)果對(duì)比
4 結(jié)論與展望