顏紫欣 游凡毅 齊奕萌 首都經濟貿易大學管理工程學院
在當今的網絡信息時代,電子商務因其開放性、全球性、低成本和高效率的特點得以發(fā)展,現今已然成為人們生活中不可或缺的成分。從消費者的反饋中提取有效信息,并根據信息調整銷售模式以獲得更多利益是商家發(fā)展不可缺少的一步,消費者的反饋在不同電子商務平臺有著不同的表現形式,通常為評星(一共有五顆星,從最差到最好分別是一星到五星,消費者可根據使用感受決定星星的數量)和文本評論。
首先將數據進行預處理,刪除重復等無用數據,建立星級、評論、幫助評論三者關系的模型,其中評論為文本型數據,需要將其量化,在考慮vine與verified_purchase對評價有用性的影響,使用層次分析法得到各部分權重,得出該評論者反映的產品綜合評分,分析產品綜合評分的趨勢,以此反應產品聲譽的上升或下降。
以亞馬遜網站上的評論為研究對象,從評論(reviews)、評價星級(star ratings)、helpfulness rating的數字特征出發(fā),建立他們之間的關系模型。本文采用經過處理的文本情感數據作為評論文本的一個parameter,將其中的情感極性量化到[-1,1]的范圍內,數值越接近-1表明負面情感更強烈,數值越接近1表示積極情感更強烈。[1]亞馬遜通過讓消費者對產品打分(星級1-5星),1星表示極端差評,3星表示中性。[2]極端性值越接近-1表明負面情感更強烈,數值越接近1表示積極情感更強烈。由于文本評論過于復雜、不夠直觀,因而利用情感分析技術將文本評論數字化,利用加權平均算法式(1)計算,可有效提高通用領域情感分類的效率和準確率。
其中:
-Np:表達正面情感的詞匯數目
-Nn:表達負面情感的詞匯數目
-WPi:正面情感詞匯權值
-WPj:負面情感詞匯權值
本文利用其定性與定量相結合處理各種決策因素的特點,將層次分析法運用到評審意見的綜合評定上。本文將客戶評論綜合評分定義為目標層,將5個指標(評論文本、星級評定、幫助性評定、vine voices、驗證購買)定義為準則層,將每一個客戶回顧定義為方案層,建立層次結構模型,通過前面的數據處理,以及相關關系分析,構造各準則層的判斷矩陣如下(矩陣a~c)。
(a)Reviews and Ratings
(b)Other influencing factors
(c)Comprehensive Score
計算每個判斷矩陣的歸一化特征向量wk,最大特征值λmax和一致性比率CR,其中k為判斷矩陣a~c,通過了一致性檢驗,再對每個準則層的特征向量進行處理,得到每一個指標的權重,可以得到每一個用戶對于商品的總評分。
表1 吹風機的詞頻
其中:-:第j類的商品總平均分提取前百分之二十,這部分都是評價較高的商品類別。具有該種特征的商品就是不合格產品。
從表1中的詞頻數據可分析得到,消費者更注重吹風機的特殊專利技術 (“ionic”“turbo”“tourmaline”)、材質(“ceramic”)、功 率(“watt”)、顏色(“black”“blonde”)和便攜性(“l(fā)ight”)。同理,也篩選出了其他兩種產品的最受消費者關注的幾個特征:
微波爐——功率、size、加熱器、節(jié)能、轉盤
奶嘴——材質、形狀、口徑大小、軟硬度
本文首先從評論特征方面選取評論文本的情感極端性、評論的主觀性、評論長度進行研究。本文采用其中的情感極性量化,用5個星級評價測量消費者的對產品的態(tài)度。其次利用其定性與定量相結合處理各種決策因素的特點,將層次分析法運用到評審意見的綜合評定上。最后得到每一個用戶對于商品的總評分。