(重慶市人文社科重點研究基地-網(wǎng)絡(luò)社會發(fā)展問題研究中心,重慶 400065)
近年,重慶市作為旅游新興地區(qū),旅游業(yè)取得了巨大發(fā)展,逐漸成為國內(nèi)極具知名度與吸引力的旅行目的地之一?!吧剿恰っ利愔亍焙汀靶星Ю铩ぶ聫V大”旅游形象知名度和美譽度不斷提升。旅游目的地形象對游客的旅游決策產(chǎn)生相當(dāng)大的影響,是吸引游客的關(guān)鍵因素。國內(nèi)外很多學(xué)者通過游客多方面感知來評價目的地的經(jīng)營管理狀況及城市的旅游競爭力,利用攜程網(wǎng)、馬蜂窩等UGC數(shù)據(jù)進行研究變得越來越普遍。游客生成的UGC數(shù)據(jù)一定程度上可以較為精準(zhǔn)地反映游客對旅游目的地的偏好、興趣和評價(陸利軍等,2019),其具有許多優(yōu)勢包括數(shù)據(jù)可用性、數(shù)據(jù)收集速度和簡單性,為學(xué)者提供了重要的參考依據(jù)。本文利用隱含狄利克雷分布(Latent Dirichlet Allocation,以下簡稱 LDA)主題模型,結(jié)合樸素貝葉斯模型兩種機器學(xué)習(xí)方法,以攜程網(wǎng)兩萬余條在線評論為基礎(chǔ),探究多類型目的地游客感知維度及其構(gòu)成因子,并進行目的地游客形象感知研究。此研究有助于(1)提升重慶市區(qū)域旅游業(yè)的整體實力和綜合競爭力(2)更好地指導(dǎo)目的地制定精準(zhǔn)有效的旅游市場營銷戰(zhàn)略;(3)輔助政府、旅游企業(yè)等的管理者進行科學(xué)決策具有一定的理論和實踐意義。
國外學(xué)者對目的地形象感知如何影響游客的行為和目的地決策進行研究(Verarebollo et al.2010)。Casadodiaz(2013)探索了西班牙貝尼多姆的目的地形象英國游客感知。結(jié)果表明,游客對目的地的印象非常積極,并且品牌形象和品牌忠誠度也非常高。此外,近來出現(xiàn)了與目的地游客感知相關(guān)的研究。我國學(xué)者關(guān)于游客感知的研究聚焦在文化遺產(chǎn)、森林康養(yǎng)及鄉(xiāng)村文化等方面。如從時間、空間和文化維度上研究“主客”對鄉(xiāng)村文化記憶空間的感知維度及影響效應(yīng)(呂龍等,2019)。蔡江瑩等(2019)建立居民影響感知、支持程度、社會距離、社區(qū)依戀的關(guān)系模型來揭示居民旅游影響感知對其態(tài)度的影響。近年來,特征提取或主題建模多被用于游客感知維度的識別,其最常見方法是LDA建模。LDA應(yīng)用在旅游方面,可以擴展到旅游活動中以獲得屬于某個主題的旅游活動的概率,從旅行文本、主題、詞匯與旅游之間的關(guān)系,有效地識別旅游活動的目的(Yuan et al.2016)。樸素貝葉斯是一個經(jīng)典的分類算法,也是情感分析的有力工具。Claster等人基于推特數(shù)據(jù)進行情緒分析和意見挖掘,有效的識別了民眾情緒信息,提出這種情緒分析對于廣告商、研究服務(wù)或產(chǎn)品的消費者、公司、政府、營銷人員或研究人員都是有用的(Clasteret al.2010)。盡管很多學(xué)者通過以上方法構(gòu)建目的地形象測量模型及分析目的地游客感知維度。但運用網(wǎng)絡(luò)爬蟲、計算語言學(xué)、數(shù)據(jù)挖掘、機器學(xué)習(xí)多種方法的組合來收集、分析和解釋數(shù)據(jù)仍然有限。
目前,主要旅游平臺包括攜程旅游網(wǎng)、美團網(wǎng)、途牛旅游網(wǎng)以及馬蜂窩旅游網(wǎng)等。在實際操作過程中發(fā)現(xiàn)馬蜂窩旅游上每個景點限制查看五頁有效評論;去哪兒旅行網(wǎng)系統(tǒng)大多為默認(rèn)好評;其他旅游網(wǎng)站的景點評論數(shù)據(jù)量非常有限。因此,最終選取攜程旅游網(wǎng)、美團網(wǎng)作為主要數(shù)據(jù)來源網(wǎng)站。本文對旅游網(wǎng)站關(guān)于重慶旅游的帖子進行搜索,確定了32個自然風(fēng)光(總共7500條評論)、10個展覽館(4360條評論)、7處公園(1411條評論)、19處景點(3293條評論)、6個游樂園(1075條評論)、11處溫泉(3616條評論)、8處文物古跡(1348評論),共22603條在線評論。
本研究使用了KNIME分析平臺對景點評論文本進行預(yù)處理和分析。數(shù)據(jù)預(yù)處理首先刪除評論文本中的標(biāo)點符號,然后,應(yīng)用多個過濾器:首先,使用數(shù)字過濾器從評論文本中刪除所有數(shù)字;其次,使用Jieba 分詞器對中文評論文本進行分詞;最后,使用停用詞過濾器去除不重要的停用詞。經(jīng)過數(shù)據(jù)預(yù)處理,共有22603份景點評論用于數(shù)據(jù)分析。
1.LDA分析
LDA分析步驟如下:確定維度的數(shù)量;提取維度;命名維度;統(tǒng)計每個維度中的評論數(shù)量;在維度和價值間進行交叉表分析(正面和負(fù)面評論),并計算預(yù)期和實際正面和負(fù)面評論之間的差異;畫圖比較維度。
2.樸素貝葉斯算法
使用樸素貝葉斯算法對評論進行情感分析的步驟如下:創(chuàng)建“詞袋”并計算詞頻;過濾掉不常用的詞匯;在劃分后的數(shù)據(jù)集上運行樸素貝葉斯算法(如果分類精度低于70%,重復(fù)步驟2);從LDA提取的維度中選擇詞匯;計算這些詞匯的價;使用價、顯著性和標(biāo)準(zhǔn)化權(quán)重繪制詞匯的氣泡圖,氣泡的大小表示每個詞匯在其相應(yīng)維度中的權(quán)重,更大的氣泡意味著詞匯與維度更為相關(guān)。
景點的LSVA表明,大多數(shù)為正面的特征詞:“不錯”、“花”、“環(huán)境”和“夜景”這幾個詞可能經(jīng)常出現(xiàn)在評論中,它們與人員和工作等特征詞相比并沒有特別的負(fù)面影響?!安诲e”、“孩子”和“玩”等特征詞在體驗方面最為突出。同樣,環(huán)境維度也體現(xiàn)了好玩和漂亮。然而,服務(wù)維度的特征詞大多為負(fù)面的。自然風(fēng)光的LSVA,與景點的LSVA不同的是,服務(wù)維度多為正面的特征詞,如不錯、服務(wù)和值得,然而,態(tài)度及人員表現(xiàn)為負(fù)面特征詞。環(huán)境維度的特征詞多為正面,方式維度的特征詞均為負(fù)面。溫泉的LSVA表明,在服務(wù)方面,不錯、環(huán)境和服務(wù)是非常突出的特征詞,然而唯一負(fù)面的特征詞為態(tài)度,主要表示在工作人員的服務(wù)及服務(wù)細(xì)節(jié)上。相比來看,環(huán)境維度的特征詞皆為正面的,體現(xiàn)在舒服、環(huán)境和開心等特征詞。此外,在項目維度上幾乎為負(fù)面特征詞,如,池子、設(shè)施和水。公園的LSVA,既有正面的特征詞也有負(fù)面的特征詞,孩子、不錯和好玩這幾個詞經(jīng)常出現(xiàn)在評論中。在人群維度,孩子、開心和喜歡等特征詞較為突出。服務(wù)維度幾乎為正面特征詞,環(huán)境和體驗兩個維度幾乎表現(xiàn)為負(fù)面。文物古跡的LSVA,不錯、值得、排隊這幾個詞可能經(jīng)常出現(xiàn)在評論中,不錯和風(fēng)景在服務(wù)維度是非常突出的特征詞。值得和時刻在商業(yè)維度也是高度顯著。然而,項目維度的特征詞大多為負(fù)面的,其中最為突出的為雪、小時等特征詞。游樂園的LSVA表明,在體驗維度均為正面的特征詞,其較為突出的是不錯、孩子和玩等特征詞。然而在服務(wù)維度大部分為負(fù)面的特征詞,比如,項目、工作人員和票等特征詞。展覽館的LSVA可以看出,在人群和環(huán)境維度上皆是正面的特征詞,這意味游客對于展覽館整體環(huán)境具有較高的滿意度。然而,物品建筑這個維度的特征詞幾乎為負(fù)面的,如,很小、不值和大小,這可能體現(xiàn)在展館的面積及票價上。
通過對重慶市旅游目的地游客感知維度識別、因子構(gòu)成及特征詞顯著性分析可以看出,游客對重慶市旅游景點的感知主要注重“環(huán)境”和“體驗”等方面,而對于旅游目的地的服務(wù)方面的要求是沒有體現(xiàn)的。同時,服務(wù)標(biāo)準(zhǔn)低、從業(yè)者服務(wù)意識不強等旅游服務(wù)質(zhì)量問題成為影響地區(qū)旅游業(yè)可持續(xù)發(fā)展及競爭的主要制約因素。此外,游客對重慶的感知更多體現(xiàn)在“風(fēng)景”“門票”相關(guān)內(nèi)容上,而對于旅游相關(guān)“產(chǎn)品”“文化”“從業(yè)人員”等方面關(guān)注較少。從游客感知角度來看,直接體現(xiàn)了目前重慶市旅游業(yè)在旅游產(chǎn)品、從業(yè)者管理規(guī)范等方面的不足。進一步加強旅游目的地產(chǎn)品創(chuàng)新、品牌打造、服務(wù)管理成為重慶市旅游優(yōu)質(zhì)發(fā)展的關(guān)鍵要素。