国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于在線評(píng)論情感分析和模糊認(rèn)知圖的產(chǎn)品差異性研究

2022-01-22 14:56段恒鑫葉曉慶
關(guān)鍵詞:置信度售后文本

段恒鑫, 劉 盾,2, 葉曉慶

(1.西南交通大學(xué) 經(jīng)濟(jì)管理學(xué)院 成都 610031; 2.重慶郵電大學(xué) 計(jì)算智能重慶市重點(diǎn)實(shí)驗(yàn)室 重慶 400065)

0 引言

隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展、在線支付的普及以及物流配送效率的提升,在線購物成為主流趨勢(shì),電子商務(wù)成交量逐年增加[1]。然而,在電子商務(wù)飛速發(fā)展的同時(shí),品牌之間的競(jìng)爭(zhēng)也日益嚴(yán)重,品牌想要沖出重圍,需要形成自身特色,并以此來提高品牌的競(jìng)爭(zhēng)力。為此,大多企業(yè)一般采取產(chǎn)品差異化戰(zhàn)略,通過突出品牌優(yōu)勢(shì)來吸引用戶,提高產(chǎn)品競(jìng)爭(zhēng)力。

產(chǎn)品差異性是用戶接受商家品牌與其他競(jìng)爭(zhēng)者之間的差異程度[2]。以化妝品品牌為例,企業(yè)針對(duì)不同目標(biāo)用戶,將旗下品牌按照“高端”、“輕奢”、“平價(jià)”進(jìn)行市場(chǎng)細(xì)分。例如,世界著名化妝品巨頭歐萊雅集團(tuán)旗下一線品牌有赫蓮娜;二線品牌有蘭蔻和碧歐泉;三線品牌有巴黎歐萊雅、科顏氏等。從企業(yè)角度,分析產(chǎn)品差異性可以幫助企業(yè)有效獲取用戶需求,精準(zhǔn)定位目標(biāo)用戶,核定市場(chǎng)細(xì)分,為生產(chǎn)安排提供反饋;從用戶角度,分析產(chǎn)品差異性可以給用戶更多的關(guān)于產(chǎn)品橫向?qū)Ρ刃畔?,輔助購買決策[3]。

在線評(píng)論是獲取商品評(píng)價(jià)的重要渠道,對(duì)企業(yè)和用戶來說都有重要意義。借助互聯(lián)網(wǎng)平臺(tái)交互性、個(gè)性化、便捷性等特點(diǎn),越來越多的用戶愿意在網(wǎng)絡(luò)社區(qū)或電子商務(wù)網(wǎng)站上瀏覽和發(fā)布信息,以達(dá)到產(chǎn)品信息交流和購物體驗(yàn)分享的目的。對(duì)于用戶而言,在線評(píng)論反映了產(chǎn)品的真實(shí)信息,可以幫助用戶進(jìn)行購買決策;對(duì)于企業(yè)而言,在線評(píng)論中蘊(yùn)藏著有關(guān)產(chǎn)品、服務(wù)質(zhì)量和用戶情感態(tài)度等豐富的信息,是企業(yè)獲取用戶需求的重要來源。因此,近年來,在線評(píng)論逐漸成為商家和電子商務(wù)平臺(tái)關(guān)注的焦點(diǎn)[4]。一方面,在線評(píng)論直接反映了用戶對(duì)產(chǎn)品的滿意度;另一方面,在線評(píng)論間接地反映了用戶的主要需求,是實(shí)現(xiàn)品牌差異性分析的有效信息。

然而,如果要實(shí)現(xiàn)精準(zhǔn)的品牌差異性分析,我們不但需要挖掘用戶主要關(guān)注屬性,還要獲取用戶對(duì)不同屬性的情感傾向以及屬性間的關(guān)系?;诖?,本文提出了基于在線評(píng)論情感分析和模糊認(rèn)知圖的產(chǎn)品差異化分析模型。該模型首先通過機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)技術(shù)從在線評(píng)論中挖掘用戶關(guān)注的屬性,進(jìn)行情感判斷,再通過模糊認(rèn)知圖(fuzzy cognitive map, FCM)獲取用戶對(duì)產(chǎn)品不同屬性的情感傾向,以此獲得產(chǎn)品差異性分析的綜合評(píng)價(jià)。

1 相關(guān)理論

1.1 LDA主題模型

LDA是由Blei等[5]提出的文本主題提取模型,用于直接提取文本中具有語義解釋性的主題特征。在LDA中存在一個(gè)假設(shè),即用戶在編輯評(píng)論文本時(shí),在他的意識(shí)中會(huì)存在一些主題元素,而這些主題中會(huì)存在不同的詞或句,通過主題-詞選擇來構(gòu)成用戶產(chǎn)生的在線評(píng)論,LDA具體模型如圖1所示。其中:k表示提取主題的數(shù);N表示在線評(píng)論包含的詞數(shù)量;wm,n表示第m篇文檔的第n個(gè)詞;tm,n表示第m篇文檔第n個(gè)主題;φk表示各主題下對(duì)應(yīng)的詞概率分布;θm表示各文檔下對(duì)應(yīng)的主題分布。假設(shè)整體在線評(píng)論存在V個(gè)非重復(fù)詞匯,根據(jù)上述模型,可計(jì)算相應(yīng)的聯(lián)合概率分布為

圖1 LDA模型

當(dāng)超參數(shù)α、β給定時(shí),可通過吉布斯采樣對(duì)LDA中參數(shù)θm和φk進(jìn)行估計(jì)求解:

通過對(duì)參數(shù)θm和φk進(jìn)行求解,可獲得各在線評(píng)論文本的主題分布和各主題下的詞分布,由此來實(shí)現(xiàn)基于LDA的在線評(píng)論主題提取。

1.2 長短期記憶網(wǎng)絡(luò)(LSTM)

LSTM是Hochreiter等[6]提出的一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),主要為了解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸的問題。LSTM通過一個(gè)記憶單元與三個(gè)門(遺忘門、更新門、輸出門)結(jié)構(gòu)來實(shí)現(xiàn)對(duì)每個(gè)單元狀態(tài)的控制[7],其結(jié)構(gòu)如圖2所示。與循環(huán)神經(jīng)網(wǎng)絡(luò)相比,長短期記憶LSTM有2個(gè)傳輸狀態(tài):c1(cell state),h1(hidden state)。循環(huán)神經(jīng)網(wǎng)絡(luò)中的h1就是LSTM中的c1,這也是LSTM的關(guān)鍵。LSTM利用門的結(jié)構(gòu)來精確控制加入或移除信息到記憶狀態(tài)。

圖2 LSTM結(jié)構(gòu)圖

1.3 模糊認(rèn)知圖(FCM)

模糊認(rèn)知圖(fuzzy cognitive map, FCM) 是一種利用現(xiàn)有知識(shí)和專家經(jīng)驗(yàn)來模擬復(fù)雜系統(tǒng)的方法[8]。模糊認(rèn)知圖利用接近于人類認(rèn)知的方式描述一個(gè)系統(tǒng),通過強(qiáng)調(diào)因果連接和圖的結(jié)構(gòu)來表示知識(shí),同時(shí)利用規(guī)則的形式將專家知識(shí)和從數(shù)據(jù)中獲得的有用知識(shí)合并在一起[9]。在網(wǎng)絡(luò)管理[10]、故障分析[11]、專家決策[12]等領(lǐng)域有廣泛應(yīng)用。在模糊認(rèn)知圖中,用有向弧表示概念節(jié)點(diǎn)之間的關(guān)系,從原因指向結(jié)果[13],其主要結(jié)構(gòu)如圖3所示。在模糊認(rèn)知圖中,集合Ci(i=1,2,…,n)代表一組有語義的概念節(jié)點(diǎn),其中n代表節(jié)點(diǎn)個(gè)數(shù)。節(jié)點(diǎn)間的有向弧表示兩者間的因果關(guān)系,權(quán)重Wij(-1≤Wij≤1)的大小表示原因節(jié)點(diǎn)對(duì)結(jié)果結(jié)點(diǎn)的影響程度[14]。當(dāng)0

圖3 FCM結(jié)構(gòu)圖

2 基于在線評(píng)論情感分析和模糊認(rèn)知圖的分析模型

在本小節(jié)中,為了挖掘用戶對(duì)品牌特定屬性的情感傾向,探索品牌差異性,我們構(gòu)建了一種基于情感分析和模糊認(rèn)知圖的在線評(píng)論分析模型。該分析模型主要有四個(gè)步驟:第一,利用LDA提取用戶關(guān)注屬性;第二,通過LSTM與概念語言術(shù)語集挖掘用戶對(duì)不同屬性的情感傾向;第三,構(gòu)造FCM挖掘?qū)傩灾g的關(guān)系;第四,基于EBM獲取綜合評(píng)價(jià)。為了更清楚地描述上述流程,圖4給出該模型的基本模型框架圖。

圖4 基本模型框架圖

2.1 挖掘用戶關(guān)注屬性

本文利用LDA模型對(duì)評(píng)論文本進(jìn)行主題提取,并根據(jù)LDA獲取的文本主題分布來確定用戶關(guān)注屬性。首先,將處理后的評(píng)論文本輸入LDA模型,為每個(gè)主題詞分配一個(gè)屬性;其次,遍歷所有主題詞,根據(jù)Gibbs抽樣公式對(duì)每個(gè)單詞的屬性分布進(jìn)行重采樣和更新,直到結(jié)果收斂;最后,合并類似主題并給出相應(yīng)屬性命名,并據(jù)此構(gòu)造每條評(píng)論文本在不同屬性下的文本-屬性矩陣。

2.2 屬性情感分析

為了挖掘用戶對(duì)品牌特定屬性的情感傾向,本文采用LSTM對(duì)每個(gè)評(píng)論文本的情感進(jìn)行分析,并對(duì)文本信息進(jìn)行量化。通過情感分析,每個(gè)評(píng)論文本都有一個(gè)介于0到1之間的情感得分,1表示最積極的情感,0表示最消極的情感。因此,每一個(gè)分?jǐn)?shù)代表了評(píng)論文本的情感程度,可利用情感得分評(píng)估用戶對(duì)不同品牌的滿意度。為了更清晰地衡量用戶的情感態(tài)度,本文利用PLTSs來評(píng)估用戶對(duì)不同屬性的情感。在PLTSs的框架下,可以將滿意度分為5個(gè)等級(jí):(1, 0.8);(0.8, 0.6);(0.6, 0.4);(0.4, 0.2);(0.2, 0)[16],它們分別對(duì)應(yīng)了“非常滿意”、“滿意”、“一般”、“不滿意”、“非常不滿意”5種語言術(shù)語集。據(jù)此,本文將情感得分按照5個(gè)等級(jí)進(jìn)行劃分,相應(yīng)的情感分析過程可分為以下4個(gè)步驟。

步驟1 對(duì)每條評(píng)論文本進(jìn)行預(yù)處理,并得到屬性及主題詞;

步驟2 用訓(xùn)練集數(shù)據(jù)訓(xùn)練LSTM模型,并利用訓(xùn)練好的模型計(jì)算每條評(píng)論的得分;

步驟3 利用PLTSs將情感得分劃分到5個(gè)等級(jí)中;

步驟4 將5個(gè)情感水平百分比標(biāo)準(zhǔn)化為滿意度。

2.3 屬性關(guān)系挖掘

為了進(jìn)一步挖掘?qū)傩灾g的關(guān)系,我們進(jìn)一步通過模糊關(guān)聯(lián)規(guī)則進(jìn)行屬性關(guān)系挖掘,建立描述屬性相互關(guān)系的FCM模型。其中,用Aj→Al表示屬性Aj和Al(j≠l)之間的模糊關(guān)聯(lián)規(guī)則,M為評(píng)論數(shù)量,vij和vil分別表示文本Texti(i=1,2,…,M)對(duì)屬性Aj和Al的影響,其值分別等于文本Texti屬于Aj、Al的概率。根據(jù)文獻(xiàn)[17],可以計(jì)算Aj→Al的支持度、置信度和提升度分別為

(1)

(2)

lift(Aj→Al)=conf(Aj→Al)/supp(Al),

(3)

其中:supp(Aj→Al)為支持度,用于描述屬性Aj和Al同時(shí)出現(xiàn)的可能性;conf(Aj→Al)為置信度,它刻畫了Aj對(duì)Al的影響;lift(Aj→Al)為支持度,它可以衡量模糊關(guān)聯(lián)規(guī)則的極性。

在構(gòu)建基于關(guān)聯(lián)規(guī)則的FCM模型時(shí),需要設(shè)立一個(gè)最小支持度與最小置信度,用于刪除支持度小于最小支持度、置信度小于最小置信度的關(guān)聯(lián)規(guī)則。在其余的關(guān)聯(lián)規(guī)則中,選擇置信度作為關(guān)聯(lián)規(guī)則的絕對(duì)權(quán)重,用提升度確定權(quán)重的極性。對(duì)于每個(gè)關(guān)聯(lián)規(guī)則Aj→Al,如果lift(Aj→Al)=1,則Aj與Al相互獨(dú)立;如果lift(Aj→Al)>1,則Aj與Al正相關(guān);如果lift(Aj→Al)<1,則Aj與Al負(fù)相關(guān);在本文中,最小置信度設(shè)為0.25,最小支持度為0.30?;谏鲜龇治?,可以構(gòu)造相應(yīng)的模糊認(rèn)知圖,具體分為3個(gè)步驟。

步驟1 根據(jù)公式(1)~(3),計(jì)算supp(Aj→Al)、conf(Aj→Al)與lift(Aj→Al);

步驟2 刪除支持度小于最小支持度的規(guī)則,刪除置信度小于最小置信度的規(guī)則;

步驟3 根據(jù)lift(Aj→Al)計(jì)算出該關(guān)聯(lián)規(guī)則的權(quán)重。

2.4 總體評(píng)價(jià)

Itj=B·Ptj.

(4)

在FCM中,中心度被用來描述確定屬性重要性的度量,它可以利用屬性的索引值Indegree(Aj)和出度值Outdegree(Aj)計(jì)算權(quán)重信息。這里,屬性的度中心性定義為

Degreecentrality(Aj)=Outdegree(Aj)+Indegree(Aj),

(5)

其中:索引值等于指向該屬性的所有關(guān)聯(lián)規(guī)則的權(quán)重之和;出度值等于從該屬性中指出的所有關(guān)聯(lián)規(guī)則的權(quán)重之和。如果一個(gè)屬性具有更高的度中心性,那么它在FCM圖中應(yīng)該扮演更重要的角色。據(jù)此,我們可以進(jìn)一步規(guī)范化屬性Aj的度中心性,并計(jì)算中心度的權(quán)重為

(6)

作為聚合算子的典型代表之一,BM算子(bonferroni mean operator)不僅可以計(jì)算每種屬性的重要性,而且能夠有效地捕獲屬性間的內(nèi)在聯(lián)系,因而常常被應(yīng)用到多屬性群決策問題中。然而,雖然BM算子考慮了屬性之間的相互作用,但這種交互是非定向的。對(duì)于FCM而言,每個(gè)關(guān)聯(lián)規(guī)則表示屬性之間的因果關(guān)系?;谏鲜龇治?,對(duì)于一個(gè)特定的品牌,我們使用了改進(jìn)的EBM算子來測(cè)量滿意度得分。

對(duì)于第t個(gè)品牌,基于EBM的計(jì)算結(jié)果,分別使用乘法屬性計(jì)算每個(gè)屬性Aj的滿意度得分,

(7)

(8)

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)

為了驗(yàn)證所提出方法的有效性,選取京東商城化妝品真實(shí)數(shù)據(jù)進(jìn)行驗(yàn)證,爬取了2016年6月至2020年6月京東商城中歐萊雅、雅詩蘭黛、資生堂和愛茉莉太平洋4個(gè)化妝品品牌的在線評(píng)論數(shù)據(jù)。經(jīng)過數(shù)據(jù)清洗后有效評(píng)論為156 956條,其中包含111 365條正向評(píng)論和47 591條負(fù)向評(píng)論。平均每條評(píng)論長度為154字,經(jīng)過Jieba分詞后平均分詞數(shù)為54個(gè)。文本情感極性標(biāo)簽分別用1和0表示,1代表正向評(píng)論,0代表負(fù)向評(píng)論。所有有效評(píng)論數(shù)據(jù)集包含4個(gè)大品牌,每個(gè)大品牌下均有一級(jí)、二級(jí)、三級(jí)產(chǎn)品。如雅詩蘭黛旗下一級(jí)產(chǎn)品有海藍(lán)之謎;二級(jí)產(chǎn)品有雅詩蘭黛、悅木之源;三級(jí)產(chǎn)品有朗仕等,其數(shù)據(jù)分布如表1所示。

表1 4個(gè)品牌評(píng)論數(shù)據(jù)分布表

3.2 實(shí)驗(yàn)結(jié)果分析

3.2.1屬性挖掘 根據(jù)圖4的提出的框架模型,利用LDA對(duì)在線評(píng)論進(jìn)行主題提取,可以得到價(jià)格(A1)、性價(jià)比(A2)、效果(A3)、物流(A4)、售后(A5)5個(gè)屬性,每一個(gè)屬性及其對(duì)應(yīng)的主要關(guān)鍵詞如表2所示。如在“價(jià)格”主題下,有“劃算”、“便宜”、“優(yōu)惠”等關(guān)鍵詞;售后主題下則有“客戶”、“保障”、“服務(wù)態(tài)度”等關(guān)鍵詞。

表2 評(píng)論主題與核心關(guān)鍵詞表

根據(jù)表2提取的5個(gè)主題,分別計(jì)算每條在線評(píng)論對(duì)5個(gè)屬性的概率分布,得到的文本-屬性概率矩陣結(jié)果如表3所示。以Text2為例,它對(duì)A1、A4的概率值分別為0.453 6、0.237 4,這說明第2條在線評(píng)論對(duì)應(yīng)“性價(jià)比”概率為0.453 6,對(duì)應(yīng)“物流”關(guān)鍵詞的概率為0.237 4。

根據(jù)表3,可以分別計(jì)算文本-屬性概率矩陣中每一行的最大值,其代表該文本的主屬性,如:Text1的主屬性為“價(jià)格”;Text2的主屬性為“價(jià)格”;Text3的主屬性為“物流”等。此外,可以據(jù)此簡(jiǎn)單統(tǒng)計(jì)各屬性下評(píng)論的主屬性分布情況,其中涉及價(jià)格屬性33 129條、性價(jià)比屬性55 513條、效果屬性8 598條、物流屬性7 965條、售后屬性53 751條。顯而易見地,在所有評(píng)論中,“性價(jià)比”和“售后”兩條主屬性的評(píng)論數(shù)量均超過5萬條,這說明所有評(píng)論對(duì)“性價(jià)比”和“售后”兩個(gè)屬性最為關(guān)注。然后,根據(jù)LSTM計(jì)算每條文本的情感分布,也可以計(jì)算每一條文本的情感得分情況,如:Text1的情感得分為0.808 0;Text2的主屬性情感得分為0.033 4;Text3的情感得分為0.102 6等??梢钥吹?,每一條文本的輸出概率在0和1之間,其數(shù)字大小含義為:如果該條評(píng)論得分越高,就越接近正向評(píng)論;得分越低,則越接近負(fù)向評(píng)論。進(jìn)一步地,通過LDA和LSTM計(jì)算的結(jié)果并結(jié)合 PLTSs,可以計(jì)算各個(gè)屬性的總體滿意度比例,如表4所示。

表3 文本-屬性概率矩陣

表4 屬性的總體滿意度比例表

3.2.2屬性關(guān)系分析 根據(jù)表3和公式(1)~(3),可計(jì)算相應(yīng)的置信度和提升度矩陣,計(jì)算結(jié)果如表5和表6所示。根據(jù)表5~6可以繪制總體FCM。在圖5中,箭頭代表兩屬性的關(guān)聯(lián)。在總體模糊認(rèn)知圖中,其他幾個(gè)屬性均與屬性“售后”有關(guān)聯(lián),由此可見,該屬性在分析在線評(píng)論中具有很重要的意義。根據(jù)公式(4)~(7),可以分別計(jì)算不同品牌和不同產(chǎn)品等級(jí)的屬性綜合評(píng)分,如表7所示。

表5 總體置信度矩陣

表6 總體提升度矩陣

圖5 總體FCM

最后,根據(jù)品牌和產(chǎn)品等級(jí)數(shù)據(jù),通過公式(1)~(3)分別構(gòu)建相應(yīng)的FCM,結(jié)果如圖6所示。一方面,通過圖6(a)可以發(fā)現(xiàn),不同品牌間屬性關(guān)系存在差異。如品牌“歐萊雅”的“價(jià)格”、“性價(jià)比”和“物流”屬性對(duì)“售后”屬性有正向關(guān)系;品牌“雅詩蘭黛”的“價(jià)格”、“性價(jià)比”、“效果”屬性對(duì)“售后”屬性有正向關(guān)系,“售后”對(duì)“物流”有正向關(guān)系,“售后”對(duì)“效果”有負(fù)向關(guān)系;另一方面,由圖6(b)可以得到,不同產(chǎn)品等級(jí)間屬性關(guān)系差異較大,一級(jí)產(chǎn)品的屬性“物流”、“效果”與“售后”存在正向關(guān)系,而“價(jià)格”與“售后”存在負(fù)向關(guān)系,一級(jí)產(chǎn)品價(jià)格較高,用戶在購買時(shí)更看重產(chǎn)品質(zhì)量與效果。

圖6 不同品牌和不同產(chǎn)品等級(jí)FCM

3.2.3綜合評(píng)價(jià) 根據(jù)表7~8和公式(8),可以得到不同品牌和不同產(chǎn)品等級(jí)的最終加權(quán)滿意度得分,其品牌得分排序情況:歐萊雅(0.903 1)<雅詩蘭黛(0.919 5)<資生堂(0.952 6)<愛茉莉太平洋(1.021 8);從等級(jí)角度,則有一級(jí)產(chǎn)品(1.010 7)>二級(jí)產(chǎn)品(0.952 1)>三級(jí)產(chǎn)品(0.852 1)。為了更加方便地對(duì)其進(jìn)行比較,我們將不同品牌屬性和不同產(chǎn)品等級(jí)得分進(jìn)行匯總,結(jié)果如圖7所示。

表7 不同品牌的屬性評(píng)分表

由圖7(a),從品牌角度,在綜合滿意度最高的愛茉莉太平洋中,“性價(jià)比”、“售后”是其應(yīng)該關(guān)注的屬性。根據(jù)其模糊認(rèn)知圖,可以發(fā)現(xiàn),“效果”、“價(jià)格”與“售后”呈明顯正相關(guān),品牌方應(yīng)多關(guān)注這兩個(gè)屬性;在資生堂中,“效果”、“價(jià)格”則需要引起高度關(guān)注;在雅詩蘭黛中,“價(jià)格”是其主要優(yōu)勢(shì),需要在“物流”、“售后”方面投入更多精力;在歐萊雅中,各項(xiàng)屬性均落后于其他三個(gè)品牌。由圖7(b)從用戶角度,三個(gè)產(chǎn)品的等級(jí)呈現(xiàn)出了明顯的大小關(guān)系。一級(jí)產(chǎn)品在除“價(jià)格”以外的幾個(gè)屬性上均優(yōu)于其他兩種產(chǎn)品;二級(jí)產(chǎn)品則在“售后”屬性上落后于三級(jí)產(chǎn)品。

表8 不同產(chǎn)品等級(jí)的屬性評(píng)分表

圖7 不同品牌和不同等級(jí)屬性得分圖

基于上述分析,從品牌等級(jí)角度來看,一級(jí)產(chǎn)品的各項(xiàng)指標(biāo)遠(yuǎn)遠(yuǎn)高于二級(jí)和三級(jí)產(chǎn)品,驗(yàn)證了“差異化”營銷的有效性。同時(shí),在所有屬性中,“售后”屬性表現(xiàn)最差,這說明所有品牌都需要對(duì)這一指標(biāo)采取措施用以提升顧客滿意度。

3.3 情感分析結(jié)果對(duì)比

為了進(jìn)一步驗(yàn)證本文所用LSTM算法的有效性,我們選取情感分析常用的支持向量機(jī)(SVM),樸素貝葉斯(Naive Bayesian)、卷積神經(jīng)網(wǎng)(CNN)、極限梯度提升算法(XGBoost)作為基準(zhǔn)算法。這里,我們采用精度(Precision)、召回率(Recall)和F1值三個(gè)指標(biāo)作為評(píng)價(jià)標(biāo)準(zhǔn)來衡量不同算法在情感分析過程中的表現(xiàn)情況,算法所用公式為

Precision=TP/(TP+FP);

(9)

Recall=TP/(TP+FN);

(10)

F1=2precision·recall/(precision+recall)。

(11)

結(jié)果匯總?cè)绫?所示。無論是在Precision、Recall還是F1值的表現(xiàn)上,LSTM相較其他算法都取得了較好的預(yù)測(cè)效果,這也間接說明本文利用LSTM進(jìn)行情感分析是合理和有效的。

表9 算法結(jié)果匯總表

4 結(jié)論與展望

為了幫助企業(yè)發(fā)現(xiàn)市場(chǎng)的差異化需求,對(duì)某產(chǎn)品或服務(wù)進(jìn)行有效創(chuàng)新和改進(jìn),本研究以化妝品市場(chǎng)為例,針對(duì)差異性產(chǎn)品,分別從品牌和用戶兩個(gè)維度,挖掘產(chǎn)品差異化特征,分析用戶滿意度,對(duì)差異化產(chǎn)品的競(jìng)爭(zhēng)性進(jìn)行探討,并提出相應(yīng)的改進(jìn)建議。首先,利用LDA挖掘用戶所關(guān)心的產(chǎn)品特征;其次,利用長短期記憶和概率語言術(shù)語集更準(zhǔn)確地測(cè)度了用戶對(duì)不同產(chǎn)品特征的情感;然后,利用模糊認(rèn)知圖和關(guān)聯(lián)規(guī)則進(jìn)一步研究了各產(chǎn)品特征之間的相互關(guān)系,構(gòu)建了特征之間的關(guān)系圖;最后,通過EBM算子對(duì)決策信息進(jìn)行聚合,得到最終綜合評(píng)價(jià)??偠灾疚乃岢龅哪P秃头椒軌?qū)⒃诰€評(píng)論的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為定量信息,獲得產(chǎn)品特征的滿意度評(píng)價(jià),并在主題提取、情感分析、以及綜合評(píng)價(jià)方面取得了一定的效果。在未來研究中,一方面可以將數(shù)據(jù)的時(shí)序性引入到研究中,根據(jù)時(shí)間動(dòng)態(tài)變化來探索動(dòng)態(tài)的用戶滿意度變化,并分析產(chǎn)品差異性變化趨勢(shì);另一方面,考慮到模糊認(rèn)知圖只是衡量屬性關(guān)系的一種形式,后續(xù)還可以探討其他模型來實(shí)現(xiàn)相關(guān)任務(wù)。

猜你喜歡
置信度售后文本
基于數(shù)據(jù)置信度衰減的多傳感器區(qū)間估計(jì)融合方法
文本聯(lián)讀學(xué)概括 細(xì)致觀察促寫作
一種基于定位置信度預(yù)測(cè)的二階段目標(biāo)檢測(cè)方法
2020廣州國際汽車零部件及售后市場(chǎng)展覽會(huì)成功舉辦
作為“文本鏈”的元電影
搭文本之橋 鋪生活之路 引習(xí)作之流
校核、驗(yàn)證與確認(rèn)在紅外輻射特性測(cè)量中的應(yīng)用
走進(jìn)文本 走近大師 走出文本 走向生活
郴州市| 土默特右旗| 麦盖提县| 翁牛特旗| 买车| 青海省| 靖西县| 安义县| 土默特左旗| 中宁县| 句容市| 和田市| 甘孜| 克东县| 治县。| 白河县| 宁河县| 建湖县| 瑞金市| 铜陵市| 诏安县| 安乡县| 灵武市| 张家川| 北海市| 商河县| 九江县| 海原县| 乐昌市| 乌拉特前旗| 顺义区| 凤翔县| 石台县| 灵宝市| 綦江县| 行唐县| 清水河县| 灵川县| 华蓥市| 凯里市| 巴青县|