邱 燕
(黃山學院經濟管理學院,安徽黃山245041)
旅游景區(qū)的品質如何,應該由消費者說了算,信息化時代網絡評價是游客評價旅游服務質量的最重要,也是最有影響力的渠道之一。網絡具有參與主體多、傳播速度快、影響范圍廣等特點,一次負面輿情事件可能會對一個景區(qū)、一個城市甚至一個省份的旅游形象產生長時間不良影響。馬麗君研究顯示,“天價蝦”事件對2016年1—9月青島旅游網絡關注度造成171.1萬人次的損失,使2016年青島國內旅游客流量增速下降1%[1]。何少琪研究認為,2016年11月11日麗江打人毀容事件后,2017年1月24日—2月23日微博情感分析對麗江帶有負面情緒的網友占比超過一半,高于事件發(fā)生前33.5個百分點;事件發(fā)生4個月后,百度指數(shù)顯示的十個頭條中仍有4條是關于該事件的報道[2]。
網絡負面輿情會損害旅游目的地的形象,影響游客的出行選擇。因此,對于旅游經營主體和旅游管理部門,要實時關注網絡輿情,特別是負面輿情,及時發(fā)現(xiàn)旅游經營和監(jiān)督管理中存在的突出問題,針對性地采取改進措施。本文通過構建網絡負面口碑搜索關鍵詞體系,運用網絡搜索爬蟲技術爬取負面輿情信息,根據(jù)負面信息數(shù)量計算旅游城市網絡負面口碑指數(shù),為旅游服務質量評價提供新路徑,也為提升旅游監(jiān)督管理水平提供參考。
朱翠蘭認為,網絡口碑指通過互聯(lián)網計算機、手機等技術媒體,消費者或潛在消費者對他們已消費的產品或服務所進行的非正式溝通[3]。網絡口碑可分正面的和負面的,負面網絡口碑是游客在網絡平臺發(fā)表的關于旅游產品或服務的負面信息,這種信息建立在游客的不滿、失望情緒的基礎上,通常會對其他潛在游客的旅游決策行為提供否定性建議。邵一明研究了口碑方向和網絡口碑來源可信度對消費者購買意向的影響,研究結果表明,負面口碑比正面口碑對消費者的影響更大[4]。孫莉艷等對新浪微博中的旅游熱點事件進行研究,發(fā)現(xiàn)旅游景點微博負面口碑的傳播對公眾的出行意愿會形成巨大的負面影響[5]。武傳表運用文本分析方法和扎根理論,通過網絡文本收集游客對大連濱海旅游形象的評價和感受,研究發(fā)現(xiàn),游客負面點評主要有5個主類目、13個次類目的消極感知因素[6]。
現(xiàn)有網絡口碑研究文獻主要集中在文本研究和個體研究,還沒有運用網絡搜索技術對網絡口碑進行綜合性評價的文獻,網絡搜索技術在旅游行業(yè)主要用于預測旅游客流量。任樂運用網絡搜索數(shù)據(jù)對2013年2月至4月北京市國內旅游客流量進行預測,預測的平均誤差僅為5.1%,擬合優(yōu)度高達97.2%[7]。周曉麗以西安42個景區(qū)為對象,運用百度指數(shù)搜索引擎對旅游搜索行為進行研究,發(fā)現(xiàn)旅游者搜索行為對移動終端的依賴程度迅速上升,旅游者搜索行為在一個自然年度內呈規(guī)律性變化,在公共假日期間和暑期出現(xiàn)信息搜索高峰期[8]。李曉炫等提出一種基于網絡搜索的CLSI-EMD-BP預測模型,對九寨溝未來22周旅游客流量進行預測發(fā)現(xiàn),該預測誤差顯著低于時間序列、網絡搜索和BP神經網絡三個基準模型[9]。從現(xiàn)有研究結論看,通過網絡搜索獲取的信息能夠真實反映游客的出行意愿,具備較高的準確性和較強的可信度,通過網絡搜索預測旅游客流量或開展旅游服務質量評價具備較為成熟的信息數(shù)據(jù)條件。
游客外出旅游首先關注的是人身財產安全,只有基本的人身財產安全得到保障,才會追求服務質量、舒適程度等更高的消費體驗,因此本文從人身安全、財產安全、服務質量、順暢程度4個方面選取網絡負面口碑關鍵詞。
1.人身安全
人身安全是游客最為關注,也是最基本的安全保障。外出旅游涉及的人身安全因素較多,如交通安全、景區(qū)安全等,這些因地形、地質、天氣、海拔等原因導致的交通或景區(qū)安全風險具備客觀存在性,雖無法避免,但游客可以主動回避或加以防范。然而由于地方治安環(huán)境不佳,旅游監(jiān)督管理不嚴,導致惡意侵害游客利益的情況是游客難以接受的。如麗江游客被打、五臺山和尚打人等事件增加了游客的恐懼感,也嚴重損害了地區(qū)旅游形象。又如,當前旅游市場存在一些強制游客消費的現(xiàn)象,游客在遭受財產損失的同時,還可能升級為語言甚至肢體沖突,影響游客的安全感。此外旅游景區(qū)“拉客”現(xiàn)象也較為普遍,拉客影響游客的自主選擇權,在陌生環(huán)境下增加游客的不安全感。本文擬選擇“打人”“強制消費”“拉客”三個詞條作為反映游客人身安全方面的負面口碑關鍵詞。
2.財產安全
財產安全也是游客外出的一項基本安全保障,財產損失可能因自我管理不善出現(xiàn)財物丟失,也可能由于當?shù)刂伟箔h(huán)境不佳出現(xiàn)偷盜等情況,但更多是因高價消費、欺詐行為等導致游客財產受損,這也是游客最為關注、投訴最多的領域。比如,青島天價大蝦事件、東北雪鄉(xiāng)宰客、三亞宰客等事件在網絡持續(xù)發(fā)酵后,對當?shù)芈糜涡蜗笤斐闪碎L時間嚴重負面影響。本文擬選擇游客在網絡投訴中常用的“宰客”和“欺詐”兩個詞條作為反映游客財產安全方面的負面口碑關鍵詞。
3.服務質量
游客外出旅游時接觸最多的是旅行社、景區(qū)和商家,旅行社推出的低價團、零團費往往需要通過游客購物、增加自費項目等方式獲取利潤,近年來導游與游客之間的矛盾不斷增多,“黑導游”也成為游客對導游不滿的代名詞。景區(qū)和商家受當?shù)芈糜伪O(jiān)管比較嚴,服務相對規(guī)范,但是網絡中也常出現(xiàn)“最坑景點”“黑心商家”等吐槽景區(qū)和商家的詞匯。本文擬選擇“黑導游”“最坑景點”“黑心商家”三個詞條作為反映旅游服務主體服務質量方面的負面口碑關鍵詞。
4.順暢程度
中國人口眾多、假期集中,特別是國慶、五一小長假期間經常出現(xiàn)交通擁堵,山岳景區(qū)、主題公園出現(xiàn)長時間排隊,甚至游客滯留現(xiàn)象,嚴重影響游客的滿意度。比如,2018年春節(jié)受惡劣天氣影響,上萬車輛滯留??冢?018年國慶期間,黃山、樂山大佛景區(qū)游客排隊時間超過四五個小時,游客通過自媒體吐槽,網友相互轉發(fā),對游客出行選擇帶來較大負面影響。本文擬選擇“滯留”和“擁堵”兩個詞條作為反映旅游順暢程度方面的負面口碑關鍵詞。
網絡爬蟲(Python)技術是通過既定規(guī)則自動地抓取網頁信息的計算機程序,可以將目標網頁數(shù)據(jù)下載至本地計算機再進行數(shù)據(jù)分析[10]。本文選擇由中國電信開發(fā)的“輿情監(jiān)測評估系統(tǒng)”爬取網絡負面輿情信息,該系統(tǒng)基于爬蟲(Python)技術開發(fā)設計,針對互聯(lián)網上的新聞網站、論壇、主流視頻、微博、微信公眾號、主流新聞APP等各種文字內容進行采集,實時抓取信息。爬取主體規(guī)則中包含“主題標題”“地域關鍵詞”“人物關鍵詞”“主體事件關鍵詞”等設定選項。在“主題標題”欄中加入“旅游”關鍵詞,該關鍵詞始終不變;在“地區(qū)”欄中輪換輸入需要爬取的城市,如杭州、黃山等;在“主題事件”欄中輪換輸入負面口碑關鍵詞,如“宰客”“欺詐”等;因輿情事件涉及廣大游客,不針對特殊人物,因此“人物”欄不作設定。輿情監(jiān)測系統(tǒng)可以爬取一段時間以來的全部輿情信息,并按時間段統(tǒng)計信息數(shù)量,本文選擇2017年10月1日至2018年9月30日一個完整年度進行信息爬取和分析,按半個月為一個時間段,共計24個時間段統(tǒng)計輿情信息數(shù)量。
1.關鍵詞甄別
為進一步了解所選擇關鍵詞的科學性、有效性,通過輿情監(jiān)測系統(tǒng)按照上述規(guī)則分別爬取杭州、成都、桂林、黃山等10個城市2017年10月1日至2018年9月30日1個年度的數(shù)據(jù)(見表1)。從爬取信息總量來看,“擁堵”“欺詐”“滯留”的信息數(shù)量最多,分別達到14.8萬條、8.2萬條、6.2萬條;“最坑景點”“黑心商家”“黑導游”的信息數(shù)量最少,分別為325條、1 793條、4 262條。從爬取信息與旅游關聯(lián)度看,“宰客”“黑導游”“最坑景點”3個關鍵詞與旅游關聯(lián)度最高,涉及信息多數(shù)為游客投訴、發(fā)帖類信息?!皬娭葡M”“拉客”“滯留”3 個關鍵詞與旅游關聯(lián)度較高,部分信息涉及旅游攻略、旅游環(huán)境整治等內容。“打人”“欺詐”“黑心商家”“擁堵”4個關鍵詞與旅游關聯(lián)度一般,其中包含“欺詐”“黑心商家”的信息中部分發(fā)生在本地商業(yè)服務過程中,與游客并無直接關聯(lián);包含“打人”的信息中部分為本地治安類事件,涉及游客被打的信息較少;包含“擁堵”的信息多與本地城市交通擁堵相關,如杭州、成都等城市該類信息數(shù)量很多,但是涉及游客投訴、負面評價類信息較少。綜合考慮所爬取的信息數(shù)量以及與旅游關聯(lián)度情況,本文在最終確定搜索關鍵詞時,將信息數(shù)量過少以及與旅游關聯(lián)度不高的“打人”“最坑景點”“黑心商家”“擁堵”4個關鍵詞剔除,繼續(xù)保留“強制消費”“拉客”“宰客”“欺詐”“黑導游”“滯留”6 個關鍵詞。
表1 網絡負面口碑關鍵詞及爬取信息情況
2.數(shù)據(jù)清洗
在評價旅游城市負面口碑時,通過輿情監(jiān)測評估系統(tǒng)爬取的信息主要是文本信息,而文本形式具有非結構化特點,包含各種噪聲。移除噪聲通用的做法是準備一個噪聲詞典,再逐個迭代文本對象上的各個詞條,從而消除噪聲詞典中出現(xiàn)的標簽[11]。例如在搜索“宰客”關鍵詞時,有的信息中包含“不宰客”詞條,為正面評價類信息;有的信息是關于旅游攻略的信息,出現(xiàn)“怎樣避免宰客”詞條;有的輿情為旅游管理部門開展旅游環(huán)境整治的信息,出現(xiàn)“打擊宰客行為”詞條。因此,在噪聲詞典中加入“不宰客”“攻略”“整治”等關鍵詞,在已爬取的輿情信息中進行二次搜索,若信息中出現(xiàn)這些關鍵詞,就將該條信息移除,從而減少噪聲干擾,使保留下來的信息更有效。
3.數(shù)據(jù)標準化
通過去噪聲處理后,得到每個旅游城市不同負面口碑關鍵詞項下的輿情信息量,考慮到不同城市旅游市場規(guī)模差異較大,如果僅用負面口碑信息絕對數(shù)量衡量,不能真實反映游客權益被侵害的概率大小和影響程度,故需對數(shù)據(jù)進行相對化處理。由于負面口碑一般由游客在旅游體驗過程中產生,因此選擇旅游接待量做相對化處理,用“每百萬游客年度負面輿情數(shù)量”反應更為合理。以“宰客”關鍵詞為例,在計算某一城市(如杭州)的“每百萬游客年度負面輿情數(shù)量”時,用2017年10月1日—2018年9月30日期間爬取的“宰客”信息數(shù)量(條)除以該時間段杭州市游客接待量(百萬人)。其他關鍵詞計算方法同上。
在獲取各關鍵詞每百萬游客輿情數(shù)量后,還需要對數(shù)據(jù)進行標準化處理,從而保證結果之間具有可比性,本文采用0-1標準化方法。考慮到各指標均為正向指標,即指標值越大,網絡負面信息越多,說明該城市網絡負面口碑越差。因此,選擇正向標準化方法,計算方法如下:
4.確定權重
熵權法根據(jù)各指標所含信息量大小確定指標權重,能克服主觀賦權法的缺陷。本文考慮到關鍵詞所反映的信息較廣,且數(shù)據(jù)來自網絡爬取,所以采用熵權法對各關鍵詞賦權。以本文選取的10個旅游城市數(shù)據(jù)為樣本,按照熵權法計算得到各關鍵詞權重,6個關鍵詞權重在13%~20%之間,差距總體較小,其中“宰客”和“強制消費”權重相對較高,分別為19.4%和18.1%;“拉客”和“滯留”權重相對較小,分別為15.6%和13.9%;“欺詐”和“黑導游”適中,均為16.5%。
5.計算網絡負面口碑指數(shù)
得到各關鍵詞信息數(shù)量標準化結果以及各關鍵詞權重后,計算加權平均數(shù),進而得到各城市網絡負面口碑指數(shù)
其中,I N MIi表示該城市網絡負面口碑指數(shù),wj表示該關鍵詞權重,表示該城市該關鍵詞負面信息數(shù)量標準化后結果。
本文選取杭州、成都、蘇州、廈門、青島、桂林、黃山、張家界、三亞、麗江10個全國重點旅游城市作為研究對象,其中杭州、成都、蘇州、廈門、青島以城市商務旅游為主,桂林、黃山、張家界、三亞、麗江以景區(qū)或度假旅游為主,所選城市分布于東、中、西部,包含內陸和沿海城市,樣本分布于10個不同省份,具有較強的代表性。
通過輿情監(jiān)測系統(tǒng)爬取2017年10月1日至2018年9月30期間10個樣本城市的旅游網絡負面輿情,計算各階段輿情數(shù)量占比(圖1)。結果顯示網絡負面輿情數(shù)量與游客出行活動之間呈現(xiàn)顯著的正相關關系。國慶期間、元旦至春節(jié)期間為負面輿情最高發(fā)的時期,占比顯著高于平時;五一左右、暑假期間負面輿情數(shù)量占比也較高,3月、11月和12月為負面輿情相對較少的月份。負面輿情數(shù)量與游客出行活動量總體保持一致,說明通過網絡爬取的信息質量較高,與實際情況總體相符。
圖1 網絡負面輿情數(shù)量占比走勢圖
按照前述方法,計算得到各城市每百萬游客網絡負面輿情信息數(shù)量,對其進行標準化,并根據(jù)熵權法賦權,加權平均得到各城市網絡負面口碑指數(shù)(見表2)。結果顯示:(1)不同類型旅游城市網絡口碑指數(shù)差異明顯。觀光型旅游城市網絡負面口碑指數(shù)總體較低,黃山、張家界、桂林3市分別位居后三位;度假型旅游城市網絡負面口碑指數(shù)較高,三亞、麗江兩市分別位居第一位和第二位,其中三亞6個負面關鍵詞的“每百萬游客年度負面輿情數(shù)量”均為最高,麗江6個負面關鍵詞中有4個均位居第二;以城市商務旅游為主的大中型旅游城市的網絡負面口碑指數(shù)適中,如杭州、成都、蘇州等城市。(2)重大負面事件對網絡口碑指數(shù)影響明顯。以青島天價大蝦事件為例,雖然該事件已經過去兩年時間,但是青島“宰客”指數(shù)仍高居第三位。央視等媒體多次曝光麗江、香格里拉導游辱罵游客、強制游客購物等情況,麗江“強制消費”和“黑導游”指數(shù)均高居第二位。2018年春節(jié),海南因天氣原因大量游客滯留,直接導致2018年2月份上半月三亞“滯留”輿情信息1925條,占年度總量的61.1%,三亞“滯留”指數(shù)也遠高于其他城市。
表2十大旅游城市網絡負面口碑指數(shù)
中國旅游研究院按季發(fā)布游客滿意度調查報告,其中包含全國50個重點旅游城市滿意度調查結果,本文選取的10個城市均在列。查詢2017年四季度和2018年上半年10個旅游城市游客滿意度得分,加權平均后得到平均滿意度,將這10個城市網絡負面口碑指數(shù)與游客平均滿意度進行相關性分析,發(fā)現(xiàn)兩者相關系數(shù)為-0.711,呈較強的負相關關系。
本文運用網絡搜索爬蟲技術,通過負面口碑關鍵詞搜索輿情信息數(shù)量,得到的信息數(shù)與游客出行量之間呈顯著的正相關關系。其次,本文設計的旅游城市網絡負面口碑指數(shù)與游客滿意度調查結果之間呈較強的負相關關系。再次,網絡負面口碑指數(shù)與旅游城市類型存在關聯(lián)性,觀光旅游城市、商務旅游城市和度假旅游城市間呈遞增趨勢。
在此基礎上,作者認為可以通過建立旅游網絡輿情監(jiān)測評估系統(tǒng),及時抓取各地網絡負面輿情情況,根據(jù)信息抓取情況編制網絡負面口碑指數(shù),供旅游管理部門參考,適當向社會公開相關情況。同時,要高度重視并充分發(fā)揮負面輿情信息在提升旅游管理中的重要作用,強化負面輿情的監(jiān)測、引導和應對,針對負面輿情反映的問題,及時采取針對性的監(jiān)管措施,全面提升本地區(qū)旅游管理水平和旅游城市形象。