王雨瀟,戰(zhàn)洪飛+,余軍合,王 瑞,郭劍鋒
(1.寧波大學(xué) 機(jī)械工程與力學(xué)學(xué)院,浙江 寧波 315211; 2.中國(guó)科學(xué)院 科技戰(zhàn)略咨詢研究院,北京 100190)
分析用戶對(duì)產(chǎn)品評(píng)價(jià)的準(zhǔn)確性在很大程度上影響企業(yè)的決策質(zhì)量,在產(chǎn)品生命周期縮短、用戶使用體驗(yàn)多樣化的市場(chǎng)環(huán)境下,如何為企業(yè)提供準(zhǔn)確的產(chǎn)品評(píng)價(jià)信息至關(guān)重要。傳統(tǒng)的產(chǎn)品評(píng)價(jià)通常以問(wèn)卷調(diào)查[1]、在線評(píng)論[2-3]等方式獲取用戶對(duì)產(chǎn)品屬性的感受,以此獲得產(chǎn)品的各方面表現(xiàn)。近年來(lái),隨著電子商務(wù)的快速發(fā)展,用戶的評(píng)價(jià)方式由產(chǎn)品功能評(píng)價(jià)逐漸向使用體驗(yàn)評(píng)價(jià)的方面轉(zhuǎn)移[4]。為了更好地反映產(chǎn)品在使用體驗(yàn)上的表現(xiàn),研究人員開始專注于分析影響用戶體驗(yàn)的因素,如林闖等[5]提出基于隱馬爾可夫的用戶體驗(yàn)質(zhì)量模型,用于更合理地描述用戶體驗(yàn)的過(guò)程;SONG等[6]基于在線評(píng)論,收集并歸納了影響用戶體驗(yàn)的因素,并與產(chǎn)品屬性進(jìn)行匹配,開發(fā)了評(píng)估框架,用于有效評(píng)估產(chǎn)品的使用體驗(yàn);SETCHI等[7]利用圖像模式來(lái)表達(dá)用戶與產(chǎn)品交互時(shí)的情感,以系統(tǒng)的方式評(píng)估用戶體驗(yàn)的影響因素,幫助企業(yè)改善產(chǎn)品設(shè)計(jì)實(shí)踐。但是,由于使用體驗(yàn)的影響因素由產(chǎn)品屬性產(chǎn)生,而屬性間存在關(guān)聯(lián)性,使得影響因素間具有邊界模糊性[8],這一原因?qū)е铝朔治鼋Y(jié)果的準(zhǔn)確度下降。為了提高準(zhǔn)確性,有學(xué)者通過(guò)引入專家或用戶的意見(jiàn)對(duì)指標(biāo)權(quán)重進(jìn)行修正[9-10],但仍沒(méi)有解決屬性間關(guān)聯(lián)關(guān)系問(wèn)題,因此,更多的研究人員開始考慮多因素間的關(guān)聯(lián)性。傳統(tǒng)的關(guān)聯(lián)關(guān)系分析通常直接使用專家賦值[11-12]的方法,由于過(guò)于依賴專家經(jīng)驗(yàn),主觀性過(guò)強(qiáng),有學(xué)者結(jié)合其他方法進(jìn)行分析,如耿秀麗等[13]基于專家組的打分結(jié)果,構(gòu)建復(fù)雜網(wǎng)絡(luò)來(lái)獲取多個(gè)因素間的關(guān)聯(lián)關(guān)系。為了以更加客觀的方式進(jìn)行分析,也有學(xué)者通過(guò)實(shí)驗(yàn)等方式獲得關(guān)聯(lián)關(guān)系,如EENDEBAK等[14]通過(guò)實(shí)驗(yàn)分析,利用正交陣列評(píng)估兩因素相互作用關(guān)系,為設(shè)計(jì)提供支持;也有學(xué)者基于歷史數(shù)據(jù),通過(guò)N-K模型對(duì)航空運(yùn)輸系統(tǒng)安全脆弱性的多因素進(jìn)行耦合分析[15]。但這些方法的適用范圍較窄,無(wú)法廣泛應(yīng)用于其他產(chǎn)品,且沒(méi)有結(jié)合用戶觀點(diǎn)進(jìn)行深入研究,而產(chǎn)品評(píng)論需要充分反映用戶態(tài)度,因此無(wú)法滿足產(chǎn)品評(píng)價(jià)分析的需要。
本文在前人研究的基礎(chǔ)上,結(jié)合電子商務(wù)時(shí)代的特點(diǎn),以在線評(píng)論為數(shù)據(jù)源,在分析用戶對(duì)各指標(biāo)的重視程度的基礎(chǔ)上,結(jié)合對(duì)指標(biāo)間關(guān)聯(lián)關(guān)系的思考,綜合兩方面因素構(gòu)建出改進(jìn)的相互作用關(guān)系矩陣,解決評(píng)價(jià)指標(biāo)間存在的模糊性問(wèn)題,以此得到更加準(zhǔn)確的評(píng)價(jià)結(jié)果。
本文提出的產(chǎn)品評(píng)價(jià)分析模型是以B2C網(wǎng)站上的在線評(píng)論作為數(shù)據(jù)源,由于評(píng)論數(shù)據(jù)是用戶對(duì)產(chǎn)品使用感受最直接的表達(dá)形式,以評(píng)論數(shù)據(jù)中的產(chǎn)品屬性詞作為評(píng)價(jià)指標(biāo)能夠充分反映用戶的觀點(diǎn)。在以往的研究中,評(píng)價(jià)指標(biāo)重要度的確定僅考慮單一因素的影響,容易造成結(jié)果偏差。為了進(jìn)行準(zhǔn)確量化,本文結(jié)合用戶的重視程度與指標(biāo)間的關(guān)聯(lián)程度,構(gòu)建改進(jìn)的相互作用關(guān)系矩陣,通過(guò)綜合考慮兩方面因素來(lái)提高分析結(jié)果的準(zhǔn)確性。最后通過(guò)分析評(píng)論數(shù)據(jù)中包含的用戶情感態(tài)度,確定各屬性表現(xiàn),計(jì)算出產(chǎn)品最終的評(píng)價(jià)得分,整體研究思路如圖1所示。
由于在線評(píng)論中包含了大量的無(wú)效評(píng)論,為了保證后續(xù)分析結(jié)果的準(zhǔn)確,首先需要對(duì)這些噪音數(shù)據(jù)進(jìn)行清理。噪音數(shù)據(jù)包括重復(fù)、字?jǐn)?shù)過(guò)少和無(wú)效評(píng)論,其中重復(fù)評(píng)論指同一個(gè)用戶連續(xù)進(jìn)行多次重復(fù)且相同的評(píng)論,這些評(píng)論會(huì)影響數(shù)據(jù)集中的情感比例,對(duì)分析結(jié)果造成偏差;對(duì)于字?jǐn)?shù)過(guò)少的敷衍評(píng)價(jià)文本和網(wǎng)站自動(dòng)生成的如“此用戶未填寫評(píng)價(jià)內(nèi)容”的無(wú)效評(píng)論缺少有效信息,無(wú)法用于分析,也需要進(jìn)行刪除,以此獲得初步預(yù)處理完的文本數(shù)據(jù)形成數(shù)據(jù)集。
本文以數(shù)據(jù)集中用戶提到的屬性詞作為評(píng)價(jià)指標(biāo),為了準(zhǔn)確識(shí)別這些詞,采用命名實(shí)體識(shí)別的方法從數(shù)據(jù)集中進(jìn)行抽取,將得到的所有屬性詞經(jīng)過(guò)詞頻統(tǒng)計(jì)和語(yǔ)義相似度計(jì)算進(jìn)行分類,最終確定評(píng)價(jià)指標(biāo)。本文提出的方法既考慮用戶對(duì)產(chǎn)品屬性的重視程度,同時(shí)對(duì)評(píng)價(jià)指標(biāo)間的關(guān)聯(lián)關(guān)系進(jìn)行分析。用戶關(guān)注的產(chǎn)品屬性詞出現(xiàn)頻率越高,表明用戶對(duì)該屬性的重視程度越高,因此可以以此來(lái)反映用戶對(duì)各評(píng)價(jià)指標(biāo)的重視程度。而屬性間的關(guān)聯(lián)關(guān)系雖然目前缺乏有效的手段直接測(cè)量,但是仍可以從評(píng)論數(shù)據(jù)中發(fā)現(xiàn)屬性間的關(guān)聯(lián)組合。從產(chǎn)品屬性影響用戶使用體驗(yàn)的角度進(jìn)行思考,當(dāng)屬性間的關(guān)聯(lián)性越強(qiáng),對(duì)體驗(yàn)產(chǎn)生的影響越接近,在評(píng)論中同時(shí)出現(xiàn)的概率也就越高。基于這一現(xiàn)象,使得通過(guò)對(duì)評(píng)論數(shù)據(jù)進(jìn)行分析,間接獲得產(chǎn)品屬性間潛在的關(guān)聯(lián)關(guān)系具有可行性。
為了有效結(jié)合兩方面因素的影響,基于兩者分析的結(jié)果構(gòu)建形成包含用戶觀點(diǎn)與屬性關(guān)聯(lián)性的綜合矩陣,根據(jù)該矩陣來(lái)準(zhǔn)確量化各評(píng)價(jià)指標(biāo)最終的權(quán)重系數(shù)。最后對(duì)評(píng)論集中所包含的用戶情感進(jìn)行分析,結(jié)合評(píng)價(jià)指標(biāo)權(quán)重計(jì)算出產(chǎn)品的綜合評(píng)價(jià)向量,以該向量確定產(chǎn)品最終得分。
本文提出的產(chǎn)品評(píng)價(jià)分析模型是從評(píng)論數(shù)據(jù)中挖掘用戶情感,并分析屬性間的關(guān)聯(lián)關(guān)系,建立適應(yīng)市場(chǎng)要求的產(chǎn)品評(píng)價(jià)體系,包括評(píng)價(jià)指標(biāo)確定、改進(jìn)矩陣構(gòu)建和評(píng)價(jià)結(jié)果分析3個(gè)部分。
以往的研究通常采用基于統(tǒng)計(jì)的方法和基于語(yǔ)義的方法抽取評(píng)論中的屬性詞,由于這些方法只能提取出特定詞性的詞語(yǔ),使得抽取結(jié)果中包含了大量無(wú)效的詞語(yǔ)。而BiLSTM(bi-directional long short term memory)結(jié)合條件隨機(jī)場(chǎng)(Conditional Random Fields, CRF)的命名實(shí)體識(shí)別方法是一種專用于從文本中識(shí)別出特定類型詞語(yǔ)的方法,如人名、地名等。該方法以BIO(begin, inner, other)的形式對(duì)訓(xùn)練集進(jìn)行逐字標(biāo)注,以B和I分別標(biāo)注需要類型詞的首字和非首字,以O(shè)標(biāo)注其他不需要的詞和標(biāo)點(diǎn)。將標(biāo)注完的訓(xùn)練集映射成詞向量并作為BiLSTM的輸入,通過(guò)神經(jīng)網(wǎng)絡(luò)的不斷訓(xùn)練自動(dòng)提取句子特征,最后以CRF層為預(yù)測(cè)的結(jié)果添加約束,保證預(yù)測(cè)的準(zhǔn)確性。本文通過(guò)此方法抽取評(píng)論數(shù)據(jù)中包含的屬性詞,通過(guò)詞頻統(tǒng)計(jì)選取頻次較高的幾種屬性詞作為候選詞,根據(jù)語(yǔ)義相似度合并同義詞,確定最終的評(píng)價(jià)指標(biāo)。該方法可以進(jìn)一步過(guò)濾未包含屬性詞的評(píng)論文本,提升數(shù)據(jù)的準(zhǔn)確度。
在以往的相互作用關(guān)系矩陣中,對(duì)角線上的元素代表產(chǎn)品屬性,每個(gè)屬性所在的行和列上的其他元素,分別代表該屬性對(duì)其他屬性的影響與被影響關(guān)系。該方法的原理是,某一屬性對(duì)于產(chǎn)品的重要程度,與該屬性對(duì)其他屬性的影響程度和被影響程度成正比關(guān)系。本文通過(guò)將用戶的重視系數(shù)引入該矩陣的主對(duì)角線,形成包含用戶觀點(diǎn)與指標(biāo)間關(guān)聯(lián)關(guān)系的改進(jìn)矩陣,結(jié)構(gòu)如圖2所示。
由此結(jié)構(gòu)圖可知,為了構(gòu)建出該矩陣,需要分別對(duì)用戶重視系數(shù)與指標(biāo)關(guān)聯(lián)程度進(jìn)行分析。
2.2.1 用戶重視系數(shù)確定
用戶重視系數(shù)基于評(píng)論數(shù)據(jù)中的屬性詞頻率,通過(guò)層次分析法(Analytic Hierarchy Process, AHP)計(jì)算獲得,首先需要確定各指標(biāo)所對(duì)應(yīng)的屬性詞數(shù)量。本文利用FastText將所有提取的屬性詞按照評(píng)價(jià)指標(biāo)進(jìn)行分類。FastText是一種用于訓(xùn)練語(yǔ)義模型和分類任務(wù)的方法,其特點(diǎn)是快速,且在詞匯表征上有著很好的效果。將所有評(píng)論數(shù)據(jù)作為語(yǔ)料訓(xùn)練語(yǔ)義模型,通過(guò)訓(xùn)練得到的模型對(duì)所有屬性詞與評(píng)價(jià)指標(biāo)進(jìn)行語(yǔ)義相似度計(jì)算,將屬性詞歸于相似度最高的指標(biāo),形成屬性詞集Ck={ck1,ck2,…,ckm}。其中:Ck表示第k個(gè)評(píng)價(jià)指標(biāo)的屬性詞集,ckm表示該指標(biāo)所包含的第m個(gè)屬性詞。以屬性詞集中的元素?cái)?shù)量作為依據(jù),參照比例標(biāo)度表,建立判斷矩陣A,通過(guò)式(1)和式(2)計(jì)算最大特征值λmax與對(duì)應(yīng)的特征向量W。
(1)
(2)
式(1)中:?ij表示判斷矩陣A歸一化之后第i行的各元素;wi表示第i行元素之和。式(2)中:(AW)i和Wi表示向量的第i個(gè)分量。通過(guò)式(1)得到的向量W′={w1,w2,…,wi}歸一化處理之后,即為所求的特征向量W。為了檢驗(yàn)該特征向量是否能夠表示為權(quán)重,需要檢驗(yàn)一致性條件。根據(jù)式(3)和式(4)分別得到一致性指標(biāo)和檢驗(yàn)系數(shù),當(dāng)檢驗(yàn)系數(shù)CR<0.1時(shí),滿足一致性條件,特征向量W中的元素可以作為評(píng)價(jià)指標(biāo)的權(quán)重。
(3)
(4)
式(4)中RI表示隨機(jī)一致性指標(biāo),可通過(guò)標(biāo)準(zhǔn)取值表獲得。
2.2.2 屬性間關(guān)聯(lián)關(guān)系分析
由于目前仍未有客觀有效的普適性方法度量產(chǎn)品屬性間的關(guān)聯(lián)程度,以往的屬性間影響程度通常以經(jīng)驗(yàn)法和專家半定量取值的方法獲取[16],也有學(xué)者提出通過(guò)建立模糊語(yǔ)義與三角模糊數(shù)之間的映射關(guān)系來(lái)量化關(guān)聯(lián)關(guān)系[17];還有學(xué)者采用因子分析從專家評(píng)價(jià)集中獲取維度與產(chǎn)品模塊之間的關(guān)聯(lián)[18]。但上述方法仍依賴于人員的知識(shí)與經(jīng)驗(yàn),帶有較強(qiáng)的主觀性。
FPGrowth是一種用于從數(shù)據(jù)集中挖掘出事物間潛在關(guān)聯(lián)的算法,如從交易記錄中發(fā)現(xiàn)商業(yè)規(guī)律,分析用戶的購(gòu)買行為。該方法將每條評(píng)論中所包含的屬性詞作為一個(gè)項(xiàng)集,利用這些項(xiàng)集構(gòu)建樹狀結(jié)構(gòu),從而分析項(xiàng)集中詞語(yǔ)之間的互相依賴和條件先驗(yàn)關(guān)系。通過(guò)支持度和置信度來(lái)度量事物間的關(guān)聯(lián)關(guān)系,得到一種數(shù)值化的度量描述,分別如式(5)和式(6)所示。
support(A?B)=P(A∪B),
(5)
(6)
其中,A?B表示A為B的先驗(yàn)條件;支持度表示某一項(xiàng)集出現(xiàn)的概率;置信度表示項(xiàng)集中提到A的同時(shí)提到B的可信度。本文將A?*作為屬性A對(duì)其他屬性的影響,并以支持度進(jìn)行表示。基于此思路對(duì)所有屬性進(jìn)行分析,最終可以獲得各屬性間的影響與被影響關(guān)系,并通過(guò)屬性間的影響與被影響關(guān)系來(lái)共同反映屬性間的關(guān)聯(lián)性。由于存在個(gè)人評(píng)價(jià)習(xí)慣等因素的影響,使得評(píng)論中存在一些無(wú)關(guān)聯(lián)或低關(guān)聯(lián)的詞對(duì)。為了減弱它們的影響,本文利用置信度來(lái)修正支持度,當(dāng)屬性A與屬性B關(guān)聯(lián)較小或無(wú)關(guān)聯(lián)時(shí),其支持度值與置信度值較小,通過(guò)兩者相乘可以進(jìn)一步減小屬性間的影響關(guān)系,以此獲得更加準(zhǔn)確的分析結(jié)果。最終影響程度的計(jì)算如式(7)所示。
(7)
原有通過(guò)相互關(guān)系矩陣確定權(quán)重的計(jì)算方法如式(8)~(10)所示。
(8)
(9)
(10)
其中:Wi表示第i個(gè)屬性的權(quán)重系數(shù);Ci表示第i個(gè)屬性對(duì)其他屬性的影響程度之和;Ei表示第i個(gè)屬性被其他屬性的影響程度之和。
根據(jù)式(8),屬性權(quán)重是通過(guò)某一屬性對(duì)其他屬性的影響與被影響程度之和與2倍的所有屬性間影響與被影響程度之比確定。在此過(guò)程中,可以認(rèn)為原有矩陣的對(duì)角線元素作為某一影響因子n參與計(jì)算,該影響因子與上述比值相乘,得到最終權(quán)重分配(如式(11)),其中n=1時(shí)即為式(8)所述情況。
(11)
為了在產(chǎn)品評(píng)價(jià)過(guò)程中結(jié)合用戶對(duì)屬性的重視程度,本文將重視系數(shù)引入原有矩陣的對(duì)角線中作為影響因子,形成改進(jìn)矩陣。通過(guò)用戶對(duì)屬性的重視系數(shù)和屬性的影響與被影響程度相結(jié)合的方式綜合考慮主客觀因素,以此確定各屬性最終的權(quán)重分配。
i,j=1,2,3,…,m。
(12)
式中Ii為用戶對(duì)第i個(gè)屬性的重視系數(shù)。
B=W·R。
(13)
為了直觀地表現(xiàn)產(chǎn)品綜合評(píng)價(jià)結(jié)果,建立值域?yàn)?~10的滿意度量表來(lái)直觀地反映用戶對(duì)產(chǎn)品的滿意度,其中結(jié)果為0時(shí)表示用戶極不滿意,為10時(shí)表示用戶極滿意。將用戶態(tài)度為滿意所對(duì)應(yīng)的元素b1通過(guò)式(14)映射到該區(qū)間內(nèi),得到最終的產(chǎn)品評(píng)價(jià)得分。
(14)
為了驗(yàn)證本文提出的評(píng)價(jià)分析模型的可行性,以電動(dòng)牙刷為例進(jìn)行實(shí)例驗(yàn)證。通過(guò)對(duì)比本文所提方法得到的分析結(jié)果與傳統(tǒng)方法得到的結(jié)果,分析其中形成權(quán)重分配結(jié)果不同的原因,驗(yàn)證本文提出的評(píng)價(jià)分析方法在考慮屬性間關(guān)聯(lián)性方面的有效性,并根據(jù)調(diào)研訪談結(jié)果分析形成該結(jié)果的原因。
本文選取京東商城的飛利浦HX6730電動(dòng)牙刷作為分析對(duì)象,使用八爪魚采集器,按照評(píng)價(jià)時(shí)間順序爬取該產(chǎn)品的評(píng)論數(shù)據(jù),共獲取5 000條評(píng)論文本。獲取的評(píng)論文本中包含大量重復(fù)、無(wú)效等噪音數(shù)據(jù),為了保證數(shù)據(jù)的有效性,首先通過(guò)Python編程語(yǔ)言對(duì)這些評(píng)論數(shù)據(jù)進(jìn)行清理,最終獲得初步處理后的數(shù)據(jù)3 165條。
3.2.1 產(chǎn)品屬性詞抽取及指標(biāo)確定
將標(biāo)注了產(chǎn)品屬性詞的語(yǔ)料集通過(guò)BiLSTM結(jié)合CRF的方法訓(xùn)練出一個(gè)判斷模型,利用該模型從在線評(píng)論中提取屬性詞,并通過(guò)詞云圖展示,如圖3所示。
由于數(shù)據(jù)來(lái)源于B2C網(wǎng)站,提取的屬性詞中包括部分對(duì)網(wǎng)站服務(wù)的詞,如“物流”、“包裝”和“服務(wù)”等。因此本文僅選取該款產(chǎn)品自身的屬性詞,通過(guò)詞頻統(tǒng)計(jì)分析,并剔除網(wǎng)站服務(wù)的詞語(yǔ),選取詞頻數(shù)前十的屬性詞作為評(píng)價(jià)維度,初步確定評(píng)價(jià)維度為{清潔,質(zhì)量,聲音,刷頭,振動(dòng),性價(jià)比,包裝,價(jià)格,噪音,充電}。合并同義詞后,最終確定8個(gè)評(píng)價(jià)維度,分別為質(zhì)量、刷頭、聲音、振動(dòng)、價(jià)格、電池、外觀、清潔能力。
3.2.2 用戶重視系數(shù)確定
將所有評(píng)論文本作為語(yǔ)料,通過(guò)FastText訓(xùn)練出語(yǔ)義模型,根據(jù)此模型將所有屬性詞與評(píng)價(jià)指標(biāo)進(jìn)行語(yǔ)義相似度計(jì)算,最終得到7個(gè)屬性詞集,各指標(biāo)對(duì)應(yīng)的屬性詞集如表1所示。
表1 部分分類結(jié)果表
通過(guò)統(tǒng)計(jì)屬性詞集中元素的數(shù)量,對(duì)照比例標(biāo)度表,建立判斷矩陣A,如表2所示。
表2 判斷矩陣A
其中判斷矩陣A的階數(shù)n=8,根據(jù)隨機(jī)一致性指標(biāo)RI標(biāo)準(zhǔn)取值表,其隨機(jī)一致性指標(biāo)RI=1.41,根據(jù)式(1)和式(2)計(jì)算得到最大特征值λmax≈8,CR=0<0.1,滿足一致性條件,因此計(jì)算得到的特征向量可以作為用戶對(duì)各屬性的重視系數(shù),最后結(jié)果為W={0.093,0.141,0.118,0.103,0.186,0.163,0.082,0.114}。
3.2.3 屬性間關(guān)聯(lián)關(guān)系分析及權(quán)重確定
通過(guò)FPGrowth算法對(duì)評(píng)論中包含的屬性詞進(jìn)行分析,計(jì)算得到各屬性詞對(duì)的支持度,根據(jù)式(6)計(jì)算出置信度,將兩者相乘后得到屬性間的關(guān)聯(lián)程度。將屬性的重視系數(shù)代入矩陣對(duì)角線,最終得到的改進(jìn)相互作用關(guān)系矩陣如表3所示。由式(5)可知,支持度是由屬性詞對(duì)共現(xiàn)的次數(shù)與有效評(píng)論數(shù)之比得到,而作為分母的有效評(píng)論數(shù)遠(yuǎn)遠(yuǎn)大于分子的數(shù)量,因此與置信度相乘后計(jì)算得到的關(guān)聯(lián)程度數(shù)值較小,為了便于展示,均以科學(xué)計(jì)數(shù)法表示,即×10-4。
表3 改進(jìn)的相互作用關(guān)系矩陣表 ×10-4
基于該矩陣,通過(guò)式(9)、式(10)和式(12)的計(jì)算,將結(jié)果歸一化后得到產(chǎn)品屬性最終的權(quán)重分配,如表4所示。
表4 最終各指標(biāo)權(quán)重分配表
將上述分析的結(jié)果與傳統(tǒng)未考慮屬性關(guān)聯(lián)性的結(jié)果進(jìn)行對(duì)比,結(jié)果如圖4所示。
由圖4不難發(fā)現(xiàn),在考慮了屬性間關(guān)聯(lián)性后各指標(biāo)權(quán)重發(fā)生了變化,以“外觀”指標(biāo)為例,大量的用戶在提及“外觀”的同時(shí)還對(duì)其他屬性進(jìn)行了評(píng)價(jià),則認(rèn)為“外觀”與其他屬性存在較多關(guān)聯(lián),分析結(jié)果表現(xiàn)為其權(quán)重值升高。
為了確定產(chǎn)品的評(píng)價(jià)等級(jí),本文以綜合評(píng)價(jià)向量來(lái)確定。上述步驟中已經(jīng)獲得了評(píng)價(jià)指標(biāo)的權(quán)重分配,還需要確定隸屬度矩陣。使用FastText進(jìn)行屬性詞分類的同時(shí),也將這些屬性詞所對(duì)應(yīng)的評(píng)論數(shù)據(jù)進(jìn)行了分類。由于好評(píng)與中評(píng)的邊界模糊,無(wú)法準(zhǔn)確區(qū)分,而評(píng)論的正負(fù)傾向有著明確的區(qū)分,因此本文對(duì)評(píng)論文本僅分為滿意與不滿意兩類。通過(guò)Bert預(yù)訓(xùn)練模型與正負(fù)訓(xùn)練語(yǔ)料集,對(duì)評(píng)論數(shù)據(jù)進(jìn)行極性判斷,得到積極評(píng)論數(shù)量與消極評(píng)論數(shù)量,歸一化之后作為隸屬度矩陣的元素,得到隸屬度矩陣
R=
將上述結(jié)果代入式(13),歸一化后得到產(chǎn)品綜合評(píng)價(jià)向量B={0.915,0.085}。將用戶態(tài)度為滿意所對(duì)應(yīng)的元素根據(jù)量表映射為0到10的值域,最終評(píng)價(jià)得分為9.15分,根據(jù)滿意度量表,該結(jié)果表明用戶的該款電動(dòng)牙刷的滿意度較高。
為了驗(yàn)證本文所述方法得到的分析結(jié)果的可信度,通過(guò)對(duì)用戶進(jìn)行調(diào)研來(lái)獲得較為客觀的評(píng)價(jià)數(shù)據(jù)。調(diào)研采用在線問(wèn)卷的形式進(jìn)行,為了確保問(wèn)卷內(nèi)容的有效性,參考國(guó)內(nèi)外文獻(xiàn)進(jìn)行設(shè)計(jì),并滿足分析對(duì)比的需求,最終形成本研究的調(diào)研問(wèn)卷。
調(diào)研問(wèn)卷包括用戶關(guān)注的產(chǎn)品屬性、關(guān)注這些屬性的原因以及用戶的情感態(tài)度3個(gè)部分。其中,第一部分的產(chǎn)品屬性確定來(lái)自于上述分析中獲取的產(chǎn)品屬性詞;第二部分的關(guān)注原因包括用戶對(duì)產(chǎn)品的使用體驗(yàn)、使用效果和使用壽命等因素,用于分析影響用戶做出選擇的主要因素;第三部分的用戶情感態(tài)度采用Likert五分量表進(jìn)行打分,從而獲得用戶對(duì)各屬性的情感態(tài)度。通過(guò)對(duì)這些調(diào)研數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,將其結(jié)果與本文的分析結(jié)果進(jìn)行對(duì)比,進(jìn)而驗(yàn)證分析結(jié)果的準(zhǔn)確性。
本次調(diào)研共收到215份調(diào)查結(jié)果,通過(guò)篩選,使用過(guò)該款電動(dòng)牙刷或相近產(chǎn)品的結(jié)果為189份。根據(jù)數(shù)據(jù)統(tǒng)計(jì)分析,用戶關(guān)注的產(chǎn)品屬性比重如表5所示。
表5 各屬性滿意度表
從表5可以看出,消費(fèi)者最關(guān)注的指標(biāo)是“聲音”,其原因是電動(dòng)牙刷相比普通牙刷會(huì)產(chǎn)生更大的聲音,成為影響體驗(yàn)的主要因素,該結(jié)果與調(diào)研結(jié)果中69%的用戶選擇的主要考慮因素為“使用體驗(yàn)”相符,同時(shí)也符合本文所述方法的分析結(jié)果。用戶的滿意度分析結(jié)果如表5所示,該結(jié)果與本文所述方法分析的結(jié)果差距小于5%,與本文分析結(jié)果相近,驗(yàn)證了本文提出的方法的可行性與可信度。
產(chǎn)品評(píng)價(jià)需要準(zhǔn)確反映出用戶對(duì)產(chǎn)品各方面的情感態(tài)度,而在線評(píng)論中包含了大量用戶的真實(shí)使用感受。本文在分析在線評(píng)論數(shù)據(jù)與產(chǎn)品評(píng)價(jià)方式的基礎(chǔ)上,提出一種將AHP與相互作用關(guān)系矩陣結(jié)合的方法,該方法通過(guò)引入對(duì)產(chǎn)品屬性間關(guān)聯(lián)關(guān)系的分析,解決評(píng)價(jià)指標(biāo)間的模糊性問(wèn)題,最后以電動(dòng)牙刷為例進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,從評(píng)論數(shù)據(jù)中可以挖掘出用戶關(guān)注的產(chǎn)品屬性,且通過(guò)文本構(gòu)建的改進(jìn)矩陣,在產(chǎn)品評(píng)價(jià)過(guò)程中綜合考慮了用戶觀點(diǎn)與屬性間的關(guān)聯(lián)關(guān)系,從而更加準(zhǔn)確地分析出各屬性的表現(xiàn)。因此本文所提方法可以為企業(yè)改善產(chǎn)品使用體驗(yàn)、進(jìn)行產(chǎn)品優(yōu)化升級(jí)提供支持。本文僅從用戶的評(píng)論中所提及的產(chǎn)品屬性詞中分析屬性間的關(guān)聯(lián)關(guān)系,存在一定的片面性,在后續(xù)的研究中,考慮將專利與評(píng)論兩種數(shù)據(jù)進(jìn)行融合,實(shí)現(xiàn)更加全面的關(guān)聯(lián)性分析。