孫長(zhǎng)偉 任宗來(lái) 楊俊杰 龐坤亮
(國(guó)網(wǎng)中興有限公司 北京 100083)
目前,在電商服務(wù)網(wǎng)站上存在大量客戶生成的數(shù)據(jù),主要是評(píng)論數(shù)據(jù),這些用戶生成的評(píng)論數(shù)據(jù)已經(jīng)成為消費(fèi)者對(duì)商家的服務(wù)和商品進(jìn)行隱式反饋的主要形式。針對(duì)商品的評(píng)論數(shù)據(jù),不僅能幫助潛在消費(fèi)者進(jìn)行購(gòu)買分析,還能幫助商家分析其提供的商品和服務(wù)的優(yōu)缺點(diǎn),進(jìn)行優(yōu)化決策,以便進(jìn)一步提高其產(chǎn)品或服務(wù)的質(zhì)量。在這方面,已經(jīng)有大量研究得出結(jié)論:在線評(píng)論數(shù)據(jù)能顯著地決定商品的銷售情況和用戶的購(gòu)買意愿[1-2]。例如:研究表明網(wǎng)上關(guān)于書籍的評(píng)論能夠?qū)匿N售情況產(chǎn)生較大影響。在線評(píng)論具有多種形式,不僅有如“投票數(shù)量”、“打分”和“用戶參與評(píng)論的數(shù)量”等數(shù)值屬性[3-4],還有如“用戶可讀程度”和“文字量”等文本屬性[5],所有這些影響因子都有可能影響用戶的購(gòu)買決策。目前,研究人員都較多地關(guān)注在如何更好地利用在線評(píng)論的數(shù)值評(píng)分[6-7],而研究如何更好地利用評(píng)論文本內(nèi)容的工作相對(duì)較少[8-9]。
酒店作為一種特殊的商品,更多的是一種服務(wù),可以通過(guò)問(wèn)卷調(diào)查來(lái)獲取用戶的體驗(yàn)反饋。與傳統(tǒng)商品不同的是,傳統(tǒng)商品壞了可以有售后或維修服務(wù),商家也能及時(shí)獲得產(chǎn)品優(yōu)缺點(diǎn)的反饋。然而,酒店這種特殊商品其獲得用戶反饋特別困難,周期特別長(zhǎng)。幸運(yùn)的是,由于電子商務(wù)的發(fā)展,目前絕大多數(shù)的酒店都已經(jīng)上線,且具有大量的用戶評(píng)論,依據(jù)這些評(píng)論,可以及時(shí)地對(duì)酒店服務(wù)進(jìn)行分析,這有利于用戶決策和幫助酒店及時(shí)提升自身服務(wù)質(zhì)量。目前,已經(jīng)有部分研究開始通過(guò)酒店評(píng)論數(shù)據(jù)去評(píng)價(jià)酒店服務(wù)質(zhì)量,但已有工作粒度較粗,很難分析出酒店的細(xì)分服務(wù)質(zhì)量好與不好。
本文將通過(guò)細(xì)粒度的情感分析方法,對(duì)酒店的各個(gè)細(xì)分服務(wù)進(jìn)行評(píng)價(jià),從而使得用戶或酒店清晰知道細(xì)分服務(wù)的質(zhì)量,為決策提供堅(jiān)實(shí)的論據(jù)。
基于在線用戶生成的評(píng)論數(shù)據(jù)去研究酒店特征對(duì)客戶滿意度的影響,主要有基于領(lǐng)域?qū)<乙庖?jiàn)的研究方法、基于語(yǔ)法的研究方法和基于模型分析的研究方法等三種研究方法。
(1) 基于領(lǐng)域?qū)<乙庖?jiàn)的研究方法:主要根據(jù)酒店領(lǐng)域?qū)<业囊庖?jiàn)對(duì)酒店特征進(jìn)行篩選和評(píng)價(jià)。這類方法的缺點(diǎn)是專家意見(jiàn)難以全面反映消費(fèi)者的真實(shí)體驗(yàn),同時(shí),專家意見(jiàn)帶有較強(qiáng)的主觀性色彩,存在偏見(jiàn)[8-9]。
(2) 基于語(yǔ)法的研究方法:主要假設(shè)擁有越多形容詞修飾的特征詞,這些特征就越重要。因此,該類方法主要依賴句法依存關(guān)系去識(shí)別出特征詞的起到修飾作用的形容詞個(gè)數(shù),然后通過(guò)形容詞的聚類,統(tǒng)計(jì)計(jì)算出判別特征的重要度[10-11]。由于方法依賴于形容詞個(gè)數(shù),因此應(yīng)用范圍受限。
(3) 基于模型分析的研究方法:主要通過(guò)機(jī)器學(xué)習(xí)模型從大量數(shù)據(jù)中統(tǒng)計(jì)學(xué)習(xí)出特征與目標(biāo)之間的關(guān)系。這類方法由于在大量數(shù)據(jù)上進(jìn)行學(xué)習(xí),因此避免了主觀因素干擾,同時(shí)具有較強(qiáng)的普遍適用性[12-16]。例如,文獻(xiàn)[13]通過(guò)模型探索了情感極性對(duì)用戶消費(fèi)意愿的影響,該方法由于僅僅考慮情感極性而沒(méi)有考慮情感的強(qiáng)度,導(dǎo)致結(jié)果并不令人滿意。文獻(xiàn)[14]提出首先識(shí)別出最頻繁出現(xiàn)的名詞,然后通過(guò)自然語(yǔ)言處理技術(shù)自動(dòng)識(shí)別出產(chǎn)品的特征屬性,同時(shí)采用近義詞擴(kuò)充特征屬性進(jìn)而提升了效果。文獻(xiàn)[15]通過(guò)把亞馬遜的相機(jī)產(chǎn)品對(duì)應(yīng)的評(píng)論數(shù)據(jù)作為研究對(duì)象,采用計(jì)量模型的方法分析了消費(fèi)者的購(gòu)買意愿與產(chǎn)品特征評(píng)價(jià)的關(guān)系。
本文借鑒文獻(xiàn)[15]的研究思路,結(jié)合酒店特征情感和分類模型,細(xì)粒度地分析了酒店服務(wù)類型,從而可以知道消費(fèi)者的滿意度與酒店特征評(píng)價(jià)之間關(guān)系。
情感分析是指對(duì)文本數(shù)據(jù)進(jìn)行情感極性分析,判斷其情感極性是屬于“積極、消極或中立”中的哪一種,或判斷用戶的觀點(diǎn)是“贊同”或“反對(duì)”。這是目前NLP領(lǐng)域非常重要的研究方向之一[17]。情感分析技術(shù)已經(jīng)大量地在很多領(lǐng)域或場(chǎng)景中使用[18-21]。例如:在2010年,文獻(xiàn)[18]就開始運(yùn)用情感分析技術(shù)對(duì)評(píng)論數(shù)據(jù)進(jìn)行分析從而可以進(jìn)行商品的排序;Tumasjan等[19]在2011年在推特?cái)?shù)據(jù)上進(jìn)行情感分析用于對(duì)政治選舉的預(yù)計(jì),也有研究在評(píng)論(Movie reviews)及Blog文本數(shù)據(jù)上進(jìn)行情感分析以便預(yù)測(cè)電影銷售情況[20-21]。為了對(duì)特征的情感進(jìn)行預(yù)測(cè),Liu等[15]提出的特征情感預(yù)測(cè)模型先辨別出評(píng)論數(shù)據(jù)中商品的特有特征,然后為各個(gè)特征識(shí)別出數(shù)據(jù)的情感極性。還有研究通過(guò)頻繁名詞挖掘方法識(shí)別出相關(guān)的特征,然后為每個(gè)特征計(jì)算得到情感分?jǐn)?shù),可以為城市的各個(gè)服務(wù)行業(yè)構(gòu)建出觀點(diǎn)挖掘系統(tǒng),從而為商家提供決策依據(jù)[22-23]。本文將采用基于詞典的情感分析方法[24-27],計(jì)算得到酒店細(xì)粒度服務(wù)特征的情感分?jǐn)?shù),為后面細(xì)粒度服務(wù)分析提供基礎(chǔ)。
Word Embedding作為一種語(yǔ)義表示新方法,能把詞通過(guò)低緯向量進(jìn)行表示,從而使得詞之間的相似性可以通過(guò)向量操作很簡(jiǎn)單地計(jì)算出來(lái)。本文利用開源的向量生成工具(Word2Vec)將各個(gè)詞全部映射到一個(gè)低維向量空間,通常為150或300維度,從而通過(guò)計(jì)算兩個(gè)向量的相似度能夠表示所對(duì)應(yīng)文本的語(yǔ)義相似程度[28]。具體來(lái)說(shuō),先根據(jù)Word2Vec工具獲得評(píng)論數(shù)據(jù)所對(duì)應(yīng)3大類各自的特征維度,然后識(shí)別出有效特征,通過(guò)情感分析方法去獲得對(duì)應(yīng)的情感分?jǐn)?shù)。為了識(shí)別出特征,本文主要通過(guò)人工去標(biāo)記特征詞,再結(jié)合酒店領(lǐng)域的背景知識(shí)去決定所屬大類,例如:酒店評(píng)論“酒店很干凈”,通過(guò)各個(gè)類別所出現(xiàn)的特征詞,可將其標(biāo)為“酒店設(shè)施”類別;又如評(píng)論“酒店在市區(qū),交通很方便”,通過(guò)領(lǐng)域背景知識(shí)可將其歸為“交通情況”類別。為了實(shí)現(xiàn)上述設(shè)想,本文通過(guò)圖1所示的框架進(jìn)行研究。
圖1 研究框架
為了針對(duì)酒店評(píng)論數(shù)據(jù)進(jìn)行細(xì)粒度挖掘,我們對(duì)評(píng)論中可能針對(duì)的酒店服務(wù)進(jìn)行了細(xì)粒度的分析,如表1所示。主要從酒店設(shè)施、服務(wù)和周遭環(huán)境三個(gè)方面分別進(jìn)行細(xì)分,體現(xiàn)了一家酒店的主要服務(wù)細(xì)類。
表1 酒店服務(wù)的細(xì)粒度分類
對(duì)于酒店評(píng)論數(shù)據(jù),按句子進(jìn)行分詞和去除停用詞,包括連詞、介詞以及人稱代詞等。這里保留按照句子進(jìn)行索引和存儲(chǔ),即以句子為后續(xù)分類和情感分析處理方法的基本單元。
為了對(duì)數(shù)據(jù)進(jìn)行細(xì)粒度分類,需要標(biāo)注數(shù)據(jù)、選擇合適的特征和分類算法,下面分別對(duì)這三方面進(jìn)行論述:
(1) 數(shù)據(jù)標(biāo)注 為了將酒店評(píng)論數(shù)據(jù)分成句子,然后運(yùn)用分類算法將句子進(jìn)行分類。本文首先不僅根據(jù)標(biāo)點(diǎn)符號(hào)“,、.、!、”等來(lái)區(qū)分,還按照名詞實(shí)體作為區(qū)分點(diǎn),例如“… 熱水充足,空調(diào)給力,但wifi一般,甚至是不夠好,門口就是58路…”將被分為“熱水充足”“空調(diào)給力”“但wifi一般,甚至是不夠好”“門口就是58路”等短句子。然后,去掉完全沒(méi)有出現(xiàn)積極或消極情感詞的客觀句,如“兩個(gè)大人一個(gè)小孩”,接著去掉未包含酒店特征詞的句子,如“四合軒老北京菜 味道正宗 一個(gè)人干掉半只烤鴨很過(guò)癮”。通過(guò)對(duì)10 000條評(píng)論數(shù)據(jù)進(jìn)行人工標(biāo)注,平均評(píng)論數(shù)據(jù)有11個(gè)句子,共產(chǎn)生了110 326的標(biāo)注句子。標(biāo)注的時(shí)候?qū)⑦M(jìn)行兩個(gè)層次標(biāo)注,首先是針對(duì)大類進(jìn)行標(biāo)注,主要區(qū)分評(píng)論句子是酒店設(shè)施、服務(wù)、周遭環(huán)境和其他四大類中的哪一類,“其他”類別指與酒店服務(wù)類別無(wú)關(guān)的句子;其次,對(duì)句子進(jìn)行細(xì)粒度標(biāo)注,標(biāo)明是否是各個(gè)大類中的一個(gè)細(xì)類。
(2) 特征選擇 為了準(zhǔn)確地對(duì)酒店評(píng)論中的句子進(jìn)行細(xì)粒度分類,本文擬采用如下特征去表示數(shù)據(jù):
? 詞是否出現(xiàn),0/1特征。
? 詞的tf-idf特征:詞的詞頻(tf)和在數(shù)據(jù)集合中的頻率(df)是衡量詞重要性的重要方式,tf×idf(tf-idf)綜合衡量了詞的重要性。
? 利用Word2Vec工具對(duì)本文爬取的 7 183 763條酒店評(píng)論數(shù)據(jù)進(jìn)行訓(xùn)練(參數(shù)向量維度是150,訓(xùn)練窗口為10),得到所有詞的詞向量。通過(guò)該訓(xùn)練好的詞向量庫(kù),采用取平均值的方式計(jì)算每條數(shù)據(jù)記錄的向量表示,計(jì)算該向量與所要分類的類別的距離,形成距離向量,維度為所要分類的類別個(gè)數(shù)。
? 從酒店評(píng)論標(biāo)注數(shù)據(jù)中依據(jù)詞頻為每個(gè)類別抽取出相關(guān)詞,構(gòu)建了關(guān)聯(lián)字典;對(duì)評(píng)論數(shù)據(jù)進(jìn)行分詞,判斷是否有詞匯屬于某個(gè)類別對(duì)應(yīng)的集合,形成判斷向量,向量的維度為所要分類的類別個(gè)數(shù)。
(3) 分類算法 為了選擇合適的分類算法,本文擬選擇樸素貝葉斯和支持向量機(jī)兩種分類器進(jìn)行分類。
① 樸素貝葉斯:
假設(shè)有K個(gè)類別的數(shù)據(jù),樸素貝葉斯根據(jù)下式去判斷一個(gè)數(shù)據(jù)x=(x1,x2,…,xn)所屬的類別:
(1)
② 支持向量機(jī):
給定訓(xùn)練數(shù)據(jù)集合{(xi,yi);i=1,2,…,N},支持向量機(jī)的核心思想是認(rèn)為選擇最大化邊白的曲面可以最大可能地區(qū)分開數(shù)據(jù)點(diǎn),如圖2所示。
圖2 支持向量機(jī)算法的核心原理
為了求取最大邊白(Margin),可以歸結(jié)為下述的優(yōu)化問(wèn)題:
(2)
s.t.yi(ωTxi+b)≥1i=1,2,…,m
通過(guò)求取該優(yōu)化問(wèn)題,可以把最大邊白曲面的參數(shù)求取出來(lái),從而實(shí)現(xiàn)分類功能。
由于我們的分類是二級(jí)分類,本文將首先對(duì)大類進(jìn)行分類,然后再對(duì)細(xì)分類別進(jìn)行分類,在實(shí)驗(yàn)部分將詳細(xì)展示分類效果。
(3)
(4)
(5)
式中:WCi是句子Si的詞個(gè)數(shù)。而對(duì)某個(gè)類別的情感分析通過(guò)下式來(lái)計(jì)算:
Ci=∑Si
(6)
式(6)計(jì)算之后所得的情感分?jǐn)?shù)就是消費(fèi)者群體對(duì)相應(yīng)酒店某個(gè)類別的細(xì)粒度服務(wù)的情感評(píng)價(jià)。因此,通過(guò)匯總酒店的各個(gè)類別的情感分?jǐn)?shù),得到酒店細(xì)粒度服務(wù)的情感矩陣,由此可知消費(fèi)者對(duì)于特定酒店三大類及其22個(gè)細(xì)粒度服務(wù)的情感分?jǐn)?shù)。
從2018年1月至2月,通過(guò)對(duì)攜程和去哪兒網(wǎng)站的酒店目錄進(jìn)行數(shù)據(jù)爬取,抓取了包括酒店名字和對(duì)應(yīng)的評(píng)論數(shù)據(jù),評(píng)論數(shù)據(jù)包括用戶評(píng)分、評(píng)論編號(hào)、標(biāo)題和評(píng)論正文。經(jīng)過(guò)去除噪音、刪除無(wú)效數(shù)據(jù)等數(shù)據(jù)清洗操作最終整理得到632家酒店和總共7 183 763條酒店評(píng)論數(shù)據(jù)。同時(shí),針對(duì)所有酒店評(píng)論數(shù)據(jù)通過(guò)Word2Vec工具進(jìn)行訓(xùn)練(150維,窗口大小設(shè)置為10),得到每個(gè)詞對(duì)應(yīng)的向量用于后續(xù)分類等分析模塊中。最后,還在7 183 763條酒店評(píng)論數(shù)據(jù)集中隨機(jī)選取,然后人工標(biāo)注了10 000條評(píng)論數(shù)據(jù)。通過(guò)統(tǒng)計(jì),評(píng)論數(shù)據(jù)平均有11個(gè)句子,因此共產(chǎn)生了110 326的標(biāo)注句子,具體的標(biāo)注過(guò)程見(jiàn)3.3節(jié)。
對(duì)大類別和小類別分別采用兩個(gè)分類算法進(jìn)行分類,每次分類都將數(shù)據(jù)集合按照80%~20%進(jìn)行劃分,80%的部分作為訓(xùn)練數(shù)據(jù),而20%的部分作為測(cè)試數(shù)據(jù),實(shí)驗(yàn)結(jié)果如表2所示。表中所有結(jié)果均是采用10倍交叉驗(yàn)證所獲得的平均值。
表2 基于機(jī)器學(xué)習(xí)的特征分類效果比較
續(xù)表2
從表2中可以看出,支持向量機(jī)比樸素貝葉斯取得了更好的實(shí)驗(yàn)結(jié)果,后續(xù)將以支持向量機(jī)訓(xùn)練得到的分類模型作為后續(xù)模塊的支撐。
為了分析所選特征所起到的作用,本文逐個(gè)減去某特征然后進(jìn)行實(shí)驗(yàn),采用Precision評(píng)價(jià)指標(biāo),限于篇幅,圖3中只展示了一個(gè)大類和一個(gè)小類的實(shí)驗(yàn)結(jié)果,在其他類別上的實(shí)驗(yàn)結(jié)果的趨勢(shì)類似。
圖3 大類“酒店設(shè)施”和小類“前臺(tái)服務(wù)”在不同特征上的Precision值
該實(shí)驗(yàn)結(jié)果表明,tf-idf特征幾乎沒(méi)用,經(jīng)過(guò)分析,這很可能是由于句子太短,詞頻幾乎沒(méi)有差別;最有用的特征是“詞是否出現(xiàn)”這個(gè)特征;同時(shí),可以看到,本文提出的兩個(gè)新特征——詞向量距離和詞典距離特征也起到了重要作用。
為了識(shí)別出消費(fèi)者對(duì)酒店的服務(wù)的在意程度,本文分別對(duì)各個(gè)服務(wù)類別的評(píng)論極性進(jìn)行了統(tǒng)計(jì)分析,結(jié)果如表3所示??梢钥闯?,顧客對(duì)每個(gè)類別的情感表達(dá)有正有負(fù),其中:客房服務(wù)的最小值為-4.02,最大值為12.42,不管是從消極情感的強(qiáng)度還是積極情感的強(qiáng)度,其絕對(duì)值均是所有服務(wù)中最大的,表明情感最強(qiáng)烈;前臺(tái)服務(wù)的最小值為-4.82,最大值為14.37,情感強(qiáng)烈程度僅次于客房服務(wù)。在大類中,消費(fèi)者首先重視的是酒店設(shè)施,然后是周遭環(huán)境,再次是服務(wù),這和一般人的直覺(jué)有些不一致。通常會(huì)認(rèn)為服務(wù)應(yīng)該是最受顧客關(guān)心的,經(jīng)過(guò)仔細(xì)思考,其實(shí)這個(gè)結(jié)果是合理的,設(shè)想顧客到了酒店之后如果酒店設(shè)施完備,體驗(yàn)極佳,其實(shí)顧客較少需要酒店人員的服務(wù);反之,如果酒店設(shè)施問(wèn)題很大,再好的服務(wù)都不會(huì)使得顧客滿意。
表3 細(xì)粒度情感分析結(jié)果
從本文的情感分?jǐn)?shù)計(jì)算方法(式(3)-式(6))可知,所計(jì)算出的情感分?jǐn)?shù)理論上范圍在(-∞,+∞),但是一個(gè)句子的詞總數(shù)是有限的,因此,情感分?jǐn)?shù)一般不會(huì)太大和太小。另外,情感分?jǐn)?shù)的絕對(duì)值只表明用戶對(duì)于該項(xiàng)的情感強(qiáng)烈程度,絕對(duì)值越大表明用戶正面或負(fù)面的情感越強(qiáng)烈,反之越弱。
本節(jié)將展示一些分析案例來(lái)表明所提出的細(xì)粒度情感分析對(duì)于酒店的評(píng)估能起到重要支撐作用。從表4中的案例可以看出,該酒店部分服務(wù)沒(méi)有停車場(chǎng)、接機(jī)和租車等服務(wù),因此表格中這些服務(wù)的評(píng)價(jià)和情感分?jǐn)?shù)為空。同時(shí),也可以看出該酒店在衛(wèi)生狀況、前臺(tái)服務(wù)和環(huán)境噪音情況等服務(wù)類別的情感分?jǐn)?shù)分別是6.32、9.23和7.92,表明該酒店前臺(tái)服務(wù)比較好,衛(wèi)生情況也比較良好,同時(shí)整個(gè)酒店外界噪音較小。而該酒店在客房?jī)?nèi)設(shè)施的情感分?jǐn)?shù)只有1.73,仔細(xì)查看評(píng)論“就是洗衣機(jī)用不了;電動(dòng)的窗簾一個(gè)是壞了,關(guān)不上;就是衛(wèi)生間的潔具相對(duì)來(lái)說(shuō)感覺(jué)有點(diǎn)舊了,用起來(lái)不是很方便”,可知該酒店的哪些設(shè)施讓用戶感覺(jué)不好,有待提升。在房間隔音效果只取得了3.2的分?jǐn)?shù),仔細(xì)查看評(píng)論“房間隔音不好;環(huán)境一般,有吵聲,很影響休息”,這表明該酒店隔音效果不好,有待提升。通過(guò)該案例的分析,表明本文提出的方法可以為酒店管理層提供一種快速的細(xì)粒度酒店質(zhì)量評(píng)估,提升酒店服務(wù)水平。
表4 案例分析(犀客空間(北京國(guó)貿(mào)和喬麗致店))
續(xù)表4
本文針對(duì)目前酒店評(píng)論數(shù)據(jù)分析方法粒度較粗、缺乏細(xì)粒度情感分析的問(wèn)題,首先對(duì)評(píng)論數(shù)據(jù)進(jìn)行了細(xì)粒度分類,然后通過(guò)基于詞典的情感分析方法對(duì)酒店評(píng)論進(jìn)行極性判斷,從而獲得用戶對(duì)酒店服務(wù)的細(xì)粒度情感評(píng)價(jià)。本文方法能讓酒店管理層快速全面了解酒店服務(wù)質(zhì)量情況,有效提升了酒店管理效率和服務(wù)水平,推動(dòng)了酒店管理水平的提升。