呂曉將 姚亞男 劉曉鑫
(天津師范大學(xué)管理學(xué)院 天津 300380)
隨著信息技術(shù)的不斷發(fā)展,人工智能、云計(jì)算和物聯(lián)網(wǎng)等技術(shù)已經(jīng)廣泛應(yīng)用到教育、醫(yī)療和旅游等眾多領(lǐng)域。酒店業(yè)的相關(guān)研究人員目前正在各種不同的環(huán)境中測(cè)試和應(yīng)用智能技術(shù)。顧客對(duì)酒店的在線評(píng)論能夠反映顧客全面和真實(shí)的體驗(yàn)和看法,有效的在線評(píng)論可以影響潛在顧客對(duì)酒店的預(yù)訂意愿。文本分析法能夠?qū)υu(píng)論文本進(jìn)行客觀、系統(tǒng)、量化的分析和探索,對(duì)比研究能夠通過(guò)探索不同事物的差異探索出事物的本質(zhì)。
本文選擇日本Henn-na酒店和中國(guó)Flyzoo酒店作為在線評(píng)論數(shù)據(jù)的采集對(duì)象。Henn-na是世界上第一家使用類人機(jī)器人為顧客服務(wù)的酒店,自從開業(yè)吸引了世界各地的游客,在線顧客數(shù)量多、評(píng)論內(nèi)容豐富。Flyzoo是中國(guó)杭州一家采用全場(chǎng)景人臉識(shí)別技術(shù)的科技型酒店,通過(guò)手機(jī)軟件或酒店大堂的自助入住機(jī)辦理入住,顧客可以享受全場(chǎng)景人臉識(shí)別暢通無(wú)阻的極致體驗(yàn)。
文本分析是一種對(duì)顯性內(nèi)容進(jìn)行客觀、定量描述的研究方法,可以在相對(duì)較短的時(shí)間內(nèi)獲取顧客完整和真實(shí)的心理感知。本文通過(guò)技術(shù)手段抽取顧客評(píng)論中的特征詞并進(jìn)行量化表達(dá)酒店評(píng)論文本的內(nèi)容,具體包括數(shù)據(jù)爬取、數(shù)據(jù)預(yù)處理、詞頻分析、語(yǔ)義共現(xiàn)網(wǎng)絡(luò)分析和情感分析五個(gè)步驟。
數(shù)據(jù)分析采用開源軟件KH Coder對(duì)酒店在線評(píng)論進(jìn)行處理,KH Coder是由日本學(xué)者Koichi Higuchi開發(fā)的文本數(shù)據(jù)挖掘軟件,具有詞頻統(tǒng)計(jì)、詞性分析、關(guān)鍵詞檢索和可視化分析(網(wǎng)狀圖、散點(diǎn)圖、氣泡圖、折線圖、樹狀圖)等功能。
本文根據(jù)網(wǎng)站開通時(shí)間和客戶訪問(wèn)量選取國(guó)內(nèi)外主要旅游網(wǎng)站的在線評(píng)論,評(píng)論數(shù)據(jù)取自攜程旅行、去哪兒旅行、大眾點(diǎn)評(píng)和飛豬四個(gè)國(guó)內(nèi)常用的酒店平臺(tái),以及Booking和TripAdvisor兩個(gè)使用率較高的國(guó)外酒店平臺(tái)。考慮到評(píng)論時(shí)效性,時(shí)間范圍鎖定2018年12月18日—2021年4月18日。最終爬取有效評(píng)論數(shù)據(jù)共計(jì)3113條,如表1所示。
表1 在線評(píng)論來(lái)源匯總
詞頻分析通過(guò)統(tǒng)計(jì)網(wǎng)絡(luò)文本中詞匯出現(xiàn)的次數(shù)發(fā)現(xiàn)隱藏在文本中的核心信息。本文利用KH Coder提取整體評(píng)論中詞頻最高的50個(gè)關(guān)鍵詞,并通過(guò)Hanabi(花火樹圖)平臺(tái)將詞頻表生成詞云圖,如圖1和圖2所示:詞云圖中詞匯字體越大,表示該詞匯出現(xiàn)的頻次越高,字體越小則表示出現(xiàn)的頻次越低。
圖1 Flyzoo酒店在線評(píng)論詞云
圖2 Henn-na酒店在線評(píng)論詞云
圖1顯示:在Flyzoo酒店評(píng)論中,“房間”出現(xiàn)的頻次最高,字體較大的詞匯還有“機(jī)器人”“天貓精靈”,說(shuō)明顧客對(duì)酒店房間的整體情況非常關(guān)注?!爸悄堋薄白灾薄绑w驗(yàn)”“科技”“人臉識(shí)別”等使用頻次較高,體現(xiàn)了顧客對(duì)智能、無(wú)人酒店的整體認(rèn)知。
圖2顯示:“房間(room)”同樣也是Henn-na酒店評(píng)論中出現(xiàn)頻次最高的詞匯,說(shuō)明國(guó)內(nèi)外顧客非常關(guān)注Henn-na機(jī)器人酒店房間的整體情況,同時(shí)也說(shuō)明顧客對(duì)兩個(gè)酒店的主要關(guān)注部分是相同的;“機(jī)器人(robot)”和“AI”出現(xiàn)的頻次也很高,表明顧客對(duì)酒店智能機(jī)器人具有濃厚的興趣。
兩個(gè)酒店的語(yǔ)義共現(xiàn)網(wǎng)絡(luò)圖均呈現(xiàn)出整體分散、局部集中的特點(diǎn),F(xiàn)lyzoo和Henn-na評(píng)論語(yǔ)義共現(xiàn)網(wǎng)絡(luò)圖如圖3、圖4所示。
圖3 Flyzoo酒店評(píng)論語(yǔ)義共現(xiàn)網(wǎng)絡(luò)圖
圖4 Henn-na酒店評(píng)論語(yǔ)義共現(xiàn)網(wǎng)絡(luò)圖
從語(yǔ)義共現(xiàn)網(wǎng)絡(luò)圖的分析來(lái)看:兩個(gè)酒店的評(píng)論都關(guān)注酒店環(huán)境、辦理流程、位置設(shè)施、房間整體感知,以及智能體驗(yàn)這五個(gè)方面,顧客對(duì)兩個(gè)酒店給予了較為積極的評(píng)價(jià),但是兩個(gè)酒店也存在差異:
(1)顧客群體不同。Flyzoo酒店的顧客群體主要來(lái)自國(guó)內(nèi),以商務(wù)和家庭居多,而Henn-na酒店的國(guó)外游客群體較多,同時(shí)在國(guó)外顧客群中也有較多的中國(guó)游客。
(2)對(duì)智能的主要關(guān)注內(nèi)容不同。Flyzoo酒店的顧客對(duì)房間里天貓精靈的語(yǔ)音控制非常感興趣,而Henn-na酒店的顧客對(duì)前臺(tái)不同類型的機(jī)器人關(guān)注更多。
情感分析通過(guò)對(duì)主觀性文本、句子或短語(yǔ)的情感色彩進(jìn)行歸納、推理,從而識(shí)別出評(píng)論的情感類型:積極、中性和消極三種情感傾向(李春萍,2017)。本文首先結(jié)合通用的知網(wǎng)情感詞典(HowNet)和譚松波(2012)整理的酒店評(píng)論語(yǔ)料,構(gòu)建基本情感極性詞典(李勝宇等,2017)。其次,根據(jù)酒店在線評(píng)論的實(shí)際特點(diǎn)增加情感詞,新增的情感詞示例如表2所示。最后,基于構(gòu)建好的情感詞典,運(yùn)用KH Coder軟件中的交叉匯總分析功能對(duì)Flyzoo和Henn-na兩個(gè)酒店的在線評(píng)論進(jìn)行情感分析,分析結(jié)果如表3所示。
表2 部分人工新增情感詞
表3 在線評(píng)論情感分析
從表3整體來(lái)看,顧客積極情感比例為76.71% ,消極比例為19.82%,中性比例為6.39%。顧客積極情感占比最高,說(shuō)明顧客對(duì)兩個(gè)機(jī)器人酒店整體的感知較好。具體來(lái)看,在積極情感中,F(xiàn)lyzoo占比為79.12%,顯著高于Henn-na(71.59%);兩個(gè)酒店的消極情感占比也存在顯著性差異,F(xiàn)lyzoo酒店消極情感占比為22.01%,Henn-na酒店消極情感占比為15.16%,兩個(gè)酒店的消極情感都占有一定比重,需要引起重視;同時(shí),兩個(gè)酒店的中性情感占比都小于10%且存在顯著性差異,表明與Henn-na酒店的國(guó)際顧客群相比,F(xiàn)lyzoo酒店的主要中國(guó)顧客群在情感表達(dá)時(shí)更委婉含蓄。
本文針對(duì)主要旅游網(wǎng)站的顧客評(píng)論對(duì)機(jī)器人酒店的評(píng)價(jià)與感知進(jìn)行初步探索,在研究深度和研究方法的應(yīng)用方面存在不足和需要擴(kuò)展之處。首先,在樣本選擇方面,現(xiàn)階段具有智能、無(wú)人酒店體驗(yàn)的人數(shù)較少,因此不能全面地挖掘潛在顧客的體驗(yàn)反饋信息。其次,在獲取評(píng)論時(shí),只選擇了中國(guó)和日本兩個(gè)酒店,后續(xù)研究可以從多個(gè)國(guó)家收集樣本進(jìn)行全面的對(duì)比分析。最后,在線評(píng)論文本分析對(duì)機(jī)器人酒店的感知勾勒出一個(gè)基本的輪廓,但由于信息的碎片化,只能簡(jiǎn)略、局部的提供信息,無(wú)法深度揭示機(jī)器人特征、智能服務(wù)與顧客感知之間的復(fù)雜關(guān)系,未來(lái)需要結(jié)合扎根理論,以及現(xiàn)場(chǎng)觀察、酒店管理人員、員工、顧客的訪談數(shù)據(jù)進(jìn)一步探索。