摘要:移動互聯(lián)網(wǎng)的快速發(fā)展,方便了人們在網(wǎng)絡(luò)上評述事情、表達(dá)觀點(diǎn)的同時,也在網(wǎng)絡(luò)空間中留下了能夠反映個體在現(xiàn)實(shí)空間中行為的大量電子足跡數(shù)據(jù)。可以說,保存在網(wǎng)絡(luò)空間中的電子足跡數(shù)據(jù)隱藏著個體在現(xiàn)實(shí)世界中的心態(tài)和情感秘密。那么,如何挖掘出隱藏在這些評論中的有用信息,給有關(guān)部門提供情報(bào)服務(wù)則顯得很有必要。然而,盡管有一些基于網(wǎng)絡(luò)評論數(shù)據(jù)進(jìn)行情感分析的研究,但很少有人能夠進(jìn)一步深入并歸類差評所折射出的現(xiàn)實(shí)空問中的具體問題而進(jìn)行分析。本文主要爬取“去哪兒網(wǎng)”上相關(guān)于青海旅游的評論數(shù)據(jù)重點(diǎn)進(jìn)行分析。利用Python中的Jieba對評論分詞,通過SnowNLP模塊計(jì)算情感極性,以此判斷游客對景點(diǎn)盼情感傾向性。通過分析得出游客在青旅游期間的情感態(tài)勢。然后,對負(fù)向情感較集中的評論內(nèi)容歸類統(tǒng)計(jì),分析差評所折射出來的在現(xiàn)實(shí)世界中引起人們不滿意的那些問題。同時,結(jié)合實(shí)測調(diào)研數(shù)據(jù)進(jìn)行比對,形成意見報(bào)告,為旅游主管部門在景點(diǎn)管理與下一步的規(guī)劃建設(shè)中提供服務(wù)。
關(guān)鍵詞:旅游;網(wǎng)絡(luò)評論;情感分析;大數(shù)據(jù);景區(qū)管理
中圖分類號:TP39 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2020)20-0023-05
Analysis of The Impact of Tourism Review Polarity cm Service Quality in Scenic Area
Tang Ming-hu
(Qinghai Nationalities University ,Xining 810007,China)
Abstract: The rapid development of mobile Internet not only facilitates people to comment on events and express views on the net-work. hut also a larg{e numher of electronic footprint data are left in cyberspace that can reflect the behavior of individuals in realworld. It can be said that the electronic footprint data stored in cyberspace hided the individual's mental and emotional secrets inthe real space. Therefore. it is necessary to dig the useful information hidden in these comments and provide intelligence servicesto the relevant departments. However, although there are some studies based on online comment data for emotional analysis, fewpeople can further deepen and categorize the specific problems in the real world reflected l)y the bad comments.This paper mainlyanalyzes the data of the tourism-related comments for Qinghai Provim:e. Using the Jieh a to analyze these comments, calculatingemotional polarity through snowNLP Module in Python, so as to judge the emotional tendency of the tourists to the scenic spots.Through the analysis, we get the emotional situation of tourists during the tourism in Qinghai.Then, the content of the negative emo-tion is statistically classified. and the problems that people are not satisfied in the real world. which are reflected by the bad com-ments. are analyzed. At the same time. combined with the actual survey data to form the opinion report, and providing services tothe tourism department for the scenic area management.
Key words:travel; network comments; sentiment analysis; big data; scenic area planning
旅游產(chǎn)業(yè)鏈的建構(gòu)促進(jìn)著區(qū)域各行業(yè)的社會經(jīng)濟(jì),帶動景點(diǎn)沿線與周邊區(qū)域的交通、住宿、餐飲、超市、工藝品等產(chǎn)業(yè)的蓬勃發(fā)展,形成多維度互聯(lián)互動機(jī)制[1]。其中,各景點(diǎn)作為旅游產(chǎn)業(yè)鏈的龍頭,牽引起下游產(chǎn)業(yè)鏈的拓展和延伸,促進(jìn)了區(qū)域經(jīng)濟(jì)發(fā)展,改善著地區(qū)居民的生活條件。然而,多維度互聯(lián)互動機(jī)制的內(nèi)在關(guān)聯(lián)性,使旅游產(chǎn)業(yè)鏈的興衰或可持續(xù)發(fā)展時常受社會多渠道經(jīng)營過程的牽制。例如景點(diǎn)規(guī)劃與建設(shè)的品質(zhì)、游客在游覽景點(diǎn)后的評價口碑等信息。尤其是游客的評價對景點(diǎn)后期的建設(shè)與發(fā)展至關(guān)重要,可以說是整個旅游產(chǎn)業(yè)鏈的生命主線,興衰受其深度影響[2]。異質(zhì)多源互聯(lián)互動機(jī)制的內(nèi)在關(guān)聯(lián)性對整個旅游產(chǎn)業(yè)鏈形成一榮俱榮,一損則廢的狀況。因此,如何科學(xué)、合理地設(shè)計(jì)出景區(qū)的規(guī)劃與建設(shè)方案,對整個產(chǎn)業(yè)鏈的持續(xù)發(fā)展有著決定性作用。
傳統(tǒng)意義下的景區(qū)規(guī)劃建設(shè),有時會存在調(diào)研數(shù)據(jù)不足、項(xiàng)目上馬建設(shè)倉促、模仿形式大于創(chuàng)新樣式、人口流量與建設(shè)規(guī)模不匹配、景區(qū)門票定價與當(dāng)?shù)鼐用裆畛杀久摴?jié)、從而使景點(diǎn)的后期開放與維護(hù)中出現(xiàn)成本太高、資源浪費(fèi)、難以維持正常營業(yè)等的問題。許多景區(qū)的建設(shè)往往是花費(fèi)了人力、物力、財(cái)力,但卻得不到游客的認(rèn)可和好評[3]。可以說,這種規(guī)劃與建沒是不科學(xué)、不合理的。
一個優(yōu)質(zhì)的景點(diǎn),本身的自然風(fēng)光和歷史文化底蘊(yùn)是內(nèi)涵。而如何保持內(nèi)涵的同時,創(chuàng)新性地建設(shè)景點(diǎn)則是其可持續(xù)發(fā)展的生命力。一個景點(diǎn)的規(guī)劃與建設(shè)是景區(qū)管理層的責(zé)任和義務(wù),其推廣誠然需要官方層面的大力宣傳,但更多還是游客依賴各種媒介對自身體驗(yàn)情感的正能量傳播。游客評價雖是民間個體真情實(shí)感的表露,但確是引導(dǎo)后續(xù)游客出行最重要的影響因素。景點(diǎn)的規(guī)劃建設(shè)與游客對景點(diǎn)的情感表述看似不同層的群體行為,實(shí)則為互聯(lián)互制。旅游主管部門對轄區(qū)景點(diǎn)的規(guī)劃與建沒,旅游群體集中反饋的旅游體驗(yàn)感受信息之間存在著潛在的關(guān)聯(lián)性[4-6]。
當(dāng)前,“互聯(lián)網(wǎng)+”時代,智能手機(jī)的普及,移動互聯(lián)網(wǎng)絡(luò)地快速發(fā)展,方便人們在網(wǎng)絡(luò)上發(fā)表照片、視頻、評論,以此抒發(fā)自己的情感。許多游客習(xí)慣于在出游前后、出游期間隨時隨地借助微博、微信朋友圈等發(fā)表大量出游信息,對景點(diǎn)風(fēng)景、服務(wù)、建筑設(shè)施、交通、餐飲、衛(wèi)生等諸多方面做卅真實(shí)評價,撰寫觀景感受。當(dāng)發(fā)表在網(wǎng)絡(luò)上的這些評論被大量瀏覽、轉(zhuǎn)發(fā)后,對景點(diǎn)后續(xù)游客的出行計(jì)劃產(chǎn)生影響[7-8]。2014年1月3日,互聯(lián)網(wǎng)上曝出“麗江導(dǎo)游辱罵游客、強(qiáng)迫購物”事件的視頻,在網(wǎng)絡(luò)上被大量轉(zhuǎn)載1。2018年6月20日,網(wǎng)名為“弧度美青海游”的一位游客在以旅游業(yè)為核心業(yè)務(wù)的“途?!本W(wǎng)站上發(fā)表“剛從青海回來,給大家總結(jié)一下青海旅游的騙局和陷阱”的長貼,評價了青海旅游期間的諸多遭遇,提醒和規(guī)勸后期出游者。截至本文撰寫完成時,瀏覽量已達(dá)到18491次2。
互聯(lián)網(wǎng)無時空約束的特性,使網(wǎng)絡(luò)評論信息的傳播速度遠(yuǎn)勝傳統(tǒng)媒體。而且處于虛擬網(wǎng)絡(luò)空間的用戶,相較于物理空間的面對面交流,更有意愿展示出自己內(nèi)心最真實(shí)的想法與看法,從而加大被評價景點(diǎn)信息傳播的廣度和深度。類似于電子商務(wù)網(wǎng)站上的虛假評論對企業(yè)造成的影響[9-12],網(wǎng)絡(luò)用戶的評價對新游客的出行決策具有非常大的影響力。直觀的表現(xiàn)就是景點(diǎn)的客流量會銳減,繼而對整個以景點(diǎn)為核心的產(chǎn)業(yè)鏈造成沖擊,景點(diǎn)的后期規(guī)劃與持續(xù)建設(shè)也出現(xiàn)問題[13,14]。因此,如果不考慮游客的實(shí)際感受,僅以行政手段實(shí)施的建設(shè),往往會出現(xiàn)“好心辦不成好事”的局面。作為旅游管理部門,如何將景點(diǎn)建成口碑高、人氣旺、負(fù)面信息少的高品質(zhì)產(chǎn)品應(yīng)該是他們期望的目標(biāo)。但傳統(tǒng)上,以行政政策為主要指向的建沒策略的制定與實(shí)施有時也會存在問題。例如,當(dāng)前諸多省市地出現(xiàn)的大量古城古街、玻璃棧道等景點(diǎn),就存在簡單模仿、復(fù)制,沒有地區(qū)特色和創(chuàng)新之處,失去了景點(diǎn)原本的多樣性。千篇一律的模式,造成景區(qū)缺乏吸引力,拖累了后期的持續(xù)性競爭力,只能慘淡經(jīng)營,甚至于難以為繼至無人問津。因此,盲目地借鑒并不切實(shí)際地?cái)U(kuò)張建設(shè),只會造成生態(tài)破壞、資源浪費(fèi)。如果景點(diǎn)管理與建設(shè)初期,通過調(diào)研并利用現(xiàn)有技術(shù)充分考慮網(wǎng)絡(luò)游客的評價和態(tài)度,針對性地設(shè)計(jì)建沒方案,實(shí)施改良措施,發(fā)揮群策群力作用,則會更加科學(xué)合理。
當(dāng)前,隨著大數(shù)據(jù)、機(jī)器學(xué)習(xí)技術(shù)的興起,提供了收集并分析旅游評論反饋出游客情感趨勢的機(jī)會和條件,從而對景點(diǎn)進(jìn)一步的建設(shè)與規(guī)劃提供參考[15]。例如,分析近期網(wǎng)絡(luò)評論數(shù)據(jù),出現(xiàn)青海塔爾寺景區(qū)電子導(dǎo)游設(shè)備不能播放,不能使用,但又要收費(fèi)的大量差評3。這說明投資建沒的電子導(dǎo)游沒備與景區(qū)大量的導(dǎo)游員之間產(chǎn)生了矛盾。如果景區(qū)管理層能夠及時關(guān)注網(wǎng)民評價,實(shí)時分析問題,投資建設(shè)的這些電子導(dǎo)游設(shè)備就不會形同擺設(shè),資源也就不會浪費(fèi)了。所以說,基于大數(shù)據(jù)分析技術(shù),面對多源異構(gòu)的多維數(shù)據(jù),如何實(shí)現(xiàn)有價值的信息挖掘,并對相關(guān)業(yè)務(wù)部門的工作規(guī)劃提供參考,則顯得極為重要[16-18]。
網(wǎng)絡(luò)用戶情感分析最關(guān)鍵的是去判斷評論信息的情感傾向,首要條件是搭建一個涵蓋青海省旅游景點(diǎn)評論的數(shù)據(jù)庫,依靠特征詞語、語氣句子等作為特征提取的方法,對不同的用戶評論進(jìn)行處理,計(jì)算出特征的權(quán)重,通過權(quán)重值來判斷用戶評論的情感極性。完成上述步驟以后就會得到經(jīng)過極性分析的分詞評論。通過對評論中的差評數(shù)據(jù)進(jìn)行篩選,按照差評中所指出的問題進(jìn)行細(xì)致的分析,進(jìn)行問題的分類和總結(jié),并依據(jù)評論中最熱門的問題,提出相關(guān)的建設(shè)性規(guī)劃意見。
本文針對青海省旅游景點(diǎn)的規(guī)劃與建設(shè),通過抓取來自互聯(lián)網(wǎng)上大型社交平臺中的相關(guān)評論數(shù)據(jù),經(jīng)過分析,挖掘出截取時間點(diǎn)期間非特定用戶對特定物和事的真實(shí)評價,研判用戶對景點(diǎn)關(guān)聯(lián)業(yè)務(wù)的情感趨勢,歸納匯總?cè)后w性情感偏向性,從而對應(yīng)找出特定景點(diǎn)關(guān)聯(lián)業(yè)務(wù)中存在問題,進(jìn)一步形成分析報(bào)告,對旅游相關(guān)部門制定規(guī)劃方案時提供技術(shù)支撐和成果參考。
1相關(guān)工作
隨著互聯(lián)網(wǎng)的快速發(fā)展,人們通過各種社交平臺、旅游網(wǎng)站發(fā)表帶有濃烈個人情感色彩的體驗(yàn)感受、產(chǎn)品評價等言論,如恐懼、憤怒、難過、失望、喜悅、開心等具有褒、貶意詞性。通過對這些評論的分析,確定情感似向性,了解人們對特定事件、景點(diǎn)的正向或負(fù)向看法[5,19]。旅游評論反映了游客的真實(shí)感受,怎樣把握用戶對旅游景點(diǎn)、當(dāng)?shù)芈糜畏?wù)的需求滿意程度,是目前旅游資源建設(shè)和管理所關(guān)注的問題,有著重要的現(xiàn)實(shí)意義[20]。當(dāng)前“互聯(lián)網(wǎng)+”大數(shù)據(jù)技術(shù)的發(fā)展,基于網(wǎng)絡(luò)旅游評論大數(shù)據(jù)的分析引起科研人員更多的關(guān)注[21]。尤其是基于文本的主體情感描述。情感分析也稱意見挖掘、傾向性分析,是對語句中表達(dá)情感的詞語進(jìn)行分類處理的過程[22,23]。研究表明旅游評論對后續(xù)游客的出行決策具有很大的影響力。為從海量的游客評論數(shù)據(jù)挖掘情報(bào)信息,給旅游管理部門調(diào)研游客的看法形成一條便捷、高效且真實(shí)的反饋通道,本文基于網(wǎng)絡(luò)游客對青海旅游評論語句重點(diǎn)分析他們的情感極性,推測用戶最不滿意的問題作為景區(qū)建設(shè)規(guī)劃的依據(jù)和突破口,以此提升景區(qū)服務(wù)質(zhì)量。
面對社會經(jīng)濟(jì)的發(fā)展帶動來的信息量的指數(shù)級增加,作為社會個體的注意力成為最稀缺的資源?;诎俣戎笖?shù)對網(wǎng)絡(luò)用戶在線搜索數(shù)據(jù)記錄的深入分析,發(fā)現(xiàn)網(wǎng)絡(luò)關(guān)注度與景點(diǎn)實(shí)地游客量呈正向關(guān)[24]。文獻(xiàn)[25]以攜程網(wǎng)旅游評論作為語料庫,建立基于逐點(diǎn)語義分析法的分類器和基于支持向量機(jī)、樸素貝葉斯、N元文法三種典型機(jī)器學(xué)習(xí)算法的分類器,分析了旅游評論情感傾向性。對游覽和娛樂、食宿和購物、交通三方面情感傾向性詞組歸類統(tǒng)計(jì),得出游客反映的旅行目的地存在的一些問題。文獻(xiàn)[26]重點(diǎn)分析攜程網(wǎng)上關(guān)于酒店的情感傾向性。也有以同程旅游網(wǎng)[6]、馬蜂窩[27]等網(wǎng)絡(luò)評論為分析數(shù)據(jù),構(gòu)建模型。其中文獻(xiàn)[27]以馬蜂窩游客對南京的在線評論文本為數(shù)據(jù),分析得出目的地形象維度重要性存在差異。王少兵等人[28]構(gòu)建“旅游形象屬性一觸發(fā)詞”詞表,計(jì)算了評論信息中旅游形象屬性的游客關(guān)注度。文獻(xiàn)[29]提出基于LDA( Latent Dirich-let Allocation)主題發(fā)現(xiàn)模型,以大眾點(diǎn)評、攜程及馬蜂窩中關(guān)于故宮的用戶評論為例,挖掘游客對景點(diǎn)故宮的關(guān)注及情感傾向。
以旅游目的地為研究目標(biāo),陳航等人[30]構(gòu)建了目的地品牌與旅游者情感關(guān)系的分析框架和目的地品牌評價指標(biāo)體系。根據(jù)不同情緒屬性的游客對于目的地品牌情感評價的差異來尋求目的地品牌管理中的不足。文獻(xiàn)[31]收集在線網(wǎng)絡(luò)上對菲律賓的Tweet推文,使用支持向量機(jī)和naive Bayes進(jìn)行情感分析。
以微博評論作為分析數(shù)據(jù)。文獻(xiàn)[32]基于貝葉斯分類算法研究微博旅游評論,實(shí)現(xiàn)基于本體的旅游網(wǎng)絡(luò)評論情感分析和預(yù)警系統(tǒng)。以游客視角來研究如何在網(wǎng)絡(luò)眾多信息中獲取所需資料,文獻(xiàn)[33]旨在幫助游客方便地從旅游社交網(wǎng)站中提取主觀信息,確定旅游領(lǐng)域作者的態(tài)度和整體調(diào)性。這可以減少搜尋有關(guān)資料所需的時間。以設(shè)計(jì)意見評論模塊,文獻(xiàn)[34]提出了一種模塊化的軟件幫助用戶了解網(wǎng)絡(luò)上所有的旅游意見。根據(jù)評論中所表達(dá)的情感,提出旅游評論的情感分類方法[35],構(gòu)建基于模糊方式的意見分類系統(tǒng)[36],基于評論或推特的城市交通和旅行信息分析[37]。
旅游評論中用戶對景點(diǎn)情感傾向性的分析實(shí)際上是給旅游主管部門提供了真實(shí)可靠的反饋信息,形成的反饋機(jī)制在景點(diǎn)規(guī)劃建設(shè)中具有重要意義。
2旅游評論情感分析框架
隨著智能手機(jī)的普及和移動互聯(lián)網(wǎng)絡(luò)的發(fā)展,旅游群體借助網(wǎng)絡(luò)發(fā)表對景點(diǎn)相關(guān)聯(lián)事物的直觀感受。大量的網(wǎng)絡(luò)電子足跡數(shù)據(jù)對于分析用戶的情感趨勢帶來便利,尤其是針對一些大型社交網(wǎng)站上用戶對旅游的評價,判斷用戶在旅游期間的情感態(tài)度,統(tǒng)計(jì)分析出群體集中關(guān)注的點(diǎn),挖掘出用戶意見最大的根源,形成分析報(bào)告呈交旅游管理部門,使景點(diǎn)的后期建設(shè)規(guī)劃具有參考依據(jù),從而及時解決存在問題,科學(xué)合理地設(shè)計(jì)規(guī)劃方案,避免盲目擴(kuò)張建設(shè)造成的資源浪費(fèi)。
鑒于網(wǎng)絡(luò)評論數(shù)據(jù)具有分散性和主題不確定性的特征,實(shí)驗(yàn)中運(yùn)用數(shù)據(jù)爬取技術(shù)、情感分析技術(shù)、數(shù)據(jù)可視化技術(shù)將碎片化的用戶評論整合在一起,形成一個相對完善的數(shù)據(jù)庫并轉(zhuǎn)換成對旅游建設(shè)管理者有用的直觀信息,以此為旅游地的建設(shè)提供有價值的參考意見。本文整體設(shè)計(jì)思路見圖1所示。
3實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
本文工作主要關(guān)注網(wǎng)絡(luò)評論中對景點(diǎn)相關(guān)事物的評價內(nèi)容,以此來判斷用戶對景點(diǎn)及其關(guān)聯(lián)附件的情感態(tài)度,然后統(tǒng)計(jì)分析出用戶評價最多、差評最多的共性問題,再分類統(tǒng)計(jì)、提煉具體內(nèi)容并給出指導(dǎo)意見?!叭ツ膬壕W(wǎng)”是集交通出行、酒店預(yù)訂的大型網(wǎng)站,用戶多,評論豐富,本文以此作為數(shù)據(jù)來源,創(chuàng)建Python頊目,通過Requests庫發(fā)送數(shù)據(jù)請求,取得的數(shù)據(jù)轉(zhuǎn)換成json格式,再抽出評論。
3.1數(shù)據(jù)預(yù)處理
編寫Python爬蟲抓取“去哪兒網(wǎng)”的評論元數(shù)據(jù)存在大量噪音,數(shù)據(jù)清洗處理主要完成除噪、去除不可用數(shù)據(jù)以及對此進(jìn)行規(guī)范表述等。表1是數(shù)據(jù)預(yù)處理與情感極性分析出來的正向、負(fù)向分類結(jié)果。其中,原始評論條數(shù)達(dá)14392條,涉及景點(diǎn)數(shù)共565個。清洗處理系統(tǒng)自動默認(rèn)評論,剩余5617條真實(shí)可用評論。在情感分析階段,基于白然語言處理的模型框架,進(jìn)行了分詞、詞性標(biāo)注、分句、主觀句提取等操作。
網(wǎng)絡(luò)中獲取的原始評論數(shù)據(jù)經(jīng)初步清理后存放于評論表。評論表結(jié)構(gòu)設(shè)計(jì)為景點(diǎn)ID、用戶ID、用戶名、評論內(nèi)容、評論日期、景點(diǎn)名稱。表2展示了從網(wǎng)絡(luò)獲取的評論保存于評論表的元數(shù)據(jù)樣例。對存儲青海全景所有景點(diǎn)的景點(diǎn)信息表結(jié)構(gòu)則設(shè)計(jì)為景點(diǎn)ID、景點(diǎn)名稱、景點(diǎn)簡介、景點(diǎn)網(wǎng)址、評論總數(shù)、景點(diǎn)地理位置。
3.2情感分析
使用Python中的SnowNLP模塊,根據(jù)詞意對評論進(jìn)行差評、好評的判斷,并使用Jieba分詞算法中的詞性表對評論進(jìn)行分詞操作,判斷m評論中詞語的詞性,并統(tǒng)計(jì)出各詞性、成語出現(xiàn)的個數(shù)。
3.2.1文本分詞
采用Jieba分詞中的全模式來進(jìn)行分詞,操作步驟如圖2所示。
進(jìn)行Jieba分詞首先需要將評論數(shù)據(jù)導(dǎo)入,將評論按詞性表進(jìn)行分詞清洗,得到新的分割后的數(shù)據(jù)。最后通過把評論庫中的評論進(jìn)行分詞操作就會得到按詞性分詞后的數(shù)據(jù)字典,并且統(tǒng)計(jì)各詞出現(xiàn)的次頻以及出現(xiàn)頻率較高的四字詞語,如圖3所示。
根據(jù)詞性表,分詞后的評論數(shù)據(jù)按詞性可以統(tǒng)計(jì)匯總。如評論語句“塔爾寺的手T建筑也讓人十分驚嘆”。經(jīng)過分詞統(tǒng)計(jì)為:“手工”一一名詞,“建筑”一一名詞,“也”一一副詞,“讓”一一動詞,“人”一一名詞,“十分”一一數(shù)量詞,“驚嘆”一一感嘆詞。同時,對評論中以字長為4的分詞也進(jìn)行了統(tǒng)計(jì),如只針對塔爾寺景點(diǎn)的一些評論中分詞,出現(xiàn)“藏傳佛教”有49個,“栩栩如生”有3個等詞匯。以此為例,評論數(shù)據(jù)分詞后的詞性統(tǒng)計(jì)和字長為4的四字詞分詞后的統(tǒng)計(jì)結(jié)果樣例見表3所示。
3.2.2用戶情感分析
抽取評論中的關(guān)鍵詞進(jìn)行情感極性的分析。如果關(guān)鍵字的情感傾向在0-0.5之間就將評論定義為差評,反之則為好評,表4展示了情感極性分析樣例。
通過對有效文本詞語數(shù)據(jù)的情感極性分析,以好評、差評為標(biāo)準(zhǔn),分別統(tǒng)計(jì)出4536條和1081條。評論中好評數(shù)要大于差評數(shù),說明青海的旅游建沒是值得肯定的,但是差評中反映出的問題也急需解決。這樣才能更好地使青海旅游業(yè)繼續(xù)發(fā)展下去。本文的最終目的,實(shí)際上就是要深入分析這些差評,從中挖掘出游客真正關(guān)注或不滿意的原因,找出引起不滿情緒的根源,提出解決對策,形成客觀合理的調(diào)研報(bào)告,給景區(qū)管理部門在管理和規(guī)劃建沒中建言獻(xiàn)策。
上述評論分詞及文本情感極性分析表結(jié)構(gòu)主要設(shè)計(jì)為景點(diǎn)ID、景點(diǎn)名稱、用戶評論、分詞結(jié)果、情感極性分值、評論等級。從表中可以看出,分詞合理,情感極性的判斷也是比較準(zhǔn)確的。
4基于差評的景區(qū)管理與建設(shè)
選取青海代表性景點(diǎn)塔爾寺為例,專項(xiàng)爬取該景點(diǎn)的評論總數(shù)11066條。通過可視化分析,可以看得出網(wǎng)絡(luò)評論整體上是正面的(見圖4)。但為給管理部門的建設(shè)規(guī)劃和景點(diǎn)管理提供參考,在情感分析基礎(chǔ)上,忽略了好評結(jié)果,重點(diǎn)關(guān)注所有差評信息。我們從所有差評中隨機(jī)抽取了20條評論,深入分析發(fā)現(xiàn),其中有6條評論涉及停車難問題;3條涉及網(wǎng)購票取票時窗口地址不明確;4條評價認(rèn)為,游客花錢了但有很多地方正在修繕,不讓進(jìn)人參觀;3條差評電子導(dǎo)游器問題;4條評論直接驚呼景區(qū)人太多!筆者就上述問題做了一番實(shí)地調(diào)研,發(fā)現(xiàn)網(wǎng)上評論基本符合事實(shí)!這說明游客在網(wǎng)絡(luò)上的評論,其真實(shí)性、可靠度是很高的。分析網(wǎng)絡(luò)評論,對景點(diǎn)建設(shè)規(guī)劃和日常管理提供參考是具有實(shí)際價值的,也是景點(diǎn)提升競爭力、吸引力的一個必然工作。
青海塔爾寺景點(diǎn)是青海最有名氣,對各地游客最有吸引力的景點(diǎn)。通過對網(wǎng)絡(luò)評論中出現(xiàn)差評內(nèi)容分析,具有代表性的問題主要存在于交通不便、票價設(shè)置不合理、導(dǎo)游管理不規(guī)范、景區(qū)過于商業(yè)化、停車位設(shè)置混亂等問題。簡單歸類,問題可劃分為硬件設(shè)施和軟件基礎(chǔ)兩個大類。
(1)硬件沒施:景區(qū)內(nèi)缺少標(biāo)識;高峰時期客流量過大、景區(qū)內(nèi)過于擁擠;交通不便利;路面和眾多景點(diǎn)一直處于維修狀態(tài),購票后不能參觀;景點(diǎn)文化信息介紹不充分、不詳細(xì);整體游玩時間較長,沒有供人們休息的場所;景區(qū)周邊存在黑停車場;景區(qū)店鋪存在“強(qiáng)買強(qiáng)賣”和“敲詐勒索”的現(xiàn)象。
(2)軟件基礎(chǔ):普遍存在門票價格過高;旅游體驗(yàn)感不強(qiáng);取票方式煩瑣;景區(qū)周邊存在“黑導(dǎo)游”;旅游高峰期導(dǎo)游講解應(yīng)付了事;部分導(dǎo)游普通話不標(biāo)準(zhǔn),聽不懂講解內(nèi)容;景點(diǎn)售票人員態(tài)度惡劣,沒有耐心等問題。
針對以上問題,擬提出下列建議可供相關(guān)建設(shè)部門參考。
(1)可以設(shè)立景區(qū)個性化標(biāo)識,方便游客游覽景區(qū)。高峰時期建議進(jìn)行人流的疏導(dǎo)和限流,給游客制造通暢的旅游環(huán)境,也為景點(diǎn)減小客流量壓力,避免不必要的損失。尤其是,對景點(diǎn)旅游線路的規(guī)劃,以“大景點(diǎn)、小環(huán)路”的思想,將進(jìn)入景點(diǎn)后游覽線路分散成幾路不同行進(jìn)路線的小環(huán)路,有導(dǎo)游、景點(diǎn)管理疏導(dǎo)人員帶隊(duì),以此緩解高峰時期的擁堵現(xiàn)象。
(2)修繕工程減免制度。對于正在修繕當(dāng)中的部分景觀,除督促相關(guān)部門加快景點(diǎn)部分設(shè)施修繕進(jìn)度外,對原票價中包含參觀的場景因修繕而造成無法正常觀景的,可動態(tài)適時地減免部分票款,并正面告知游客,以此舒緩游客不滿情緒。
(3)建議政府統(tǒng)一收繳、規(guī)劃景區(qū)周邊所有停車場?;诰包c(diǎn)停車場地不足且與游覽線路重疊,造成人、車混雜,風(fēng)險因子突升現(xiàn)象,建議政府景點(diǎn)為圓心,收繳并統(tǒng)一規(guī)劃景區(qū)周邊一定區(qū)域范圍內(nèi)的停車場地。以收入場地的面積按比例再反換收入所得。同時,加大打擊私白設(shè)立、經(jīng)營停車場的力度。
(4)取締亂要價、價格高的黑商店。對景區(qū)內(nèi)不合法商販進(jìn)行統(tǒng)一管理,實(shí)施電子明碼標(biāo)價,在線投訴平臺。以此加大處罰力度,加強(qiáng)統(tǒng)一管理。
(5)完善服務(wù)管理制度,對導(dǎo)游進(jìn)行規(guī)范化管理。對景區(qū)導(dǎo)游、售票人員進(jìn)行系統(tǒng)培訓(xùn),提升導(dǎo)游和售票人員的素質(zhì),加強(qiáng)電子監(jiān)管和取證力度,營造高品質(zhì)服務(wù)環(huán)境。
(6)增加景區(qū)二維碼講解、二維碼地圖。利用科技手段,打造數(shù)字旅游平臺,讓游客提前了解景點(diǎn)文化底蘊(yùn)與歷史背景,給游客呈現(xiàn)更好的實(shí)地旅游體驗(yàn)。
5結(jié)論
本文獲取對青海景點(diǎn)的旅游評論在線數(shù)據(jù),通過清洗、分詞、建模及情感分析等過程,實(shí)現(xiàn)以青海旅游景區(qū)評論數(shù)據(jù)為背景的游客情感趨勢挖掘,重點(diǎn)對網(wǎng)絡(luò)評論中差評文本進(jìn)行分類統(tǒng)計(jì),實(shí)施語義層的分析提純,最終形成合理、實(shí)用的建議方案,為景點(diǎn)相關(guān)部門在景區(qū)可持續(xù)管理、規(guī)劃和建設(shè)中提供參考依據(jù)。
注釋:
1. http://politics. people. com.cn/n/2014/0106/c70731-24027941.html.
2. https://www.tuniu.com/trips/12604550.
3. http://www.msweekly.com/show.html?id=101597.
參考文獻(xiàn):
[1]黃常鋒,孫慧,何倫志.中國旅游產(chǎn)業(yè)鏈的識別研究[J]].旅游學(xué)刊,2011,26(1):18-24.
[2]龔箭,楊舒悅.基于網(wǎng)絡(luò)評論的旅游目的地評價研究——以我國31個省市自治區(qū)為例[J].華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,52(2):279-286.
[3]李君軼.基于游客需求的旅游目的地網(wǎng)絡(luò)營銷系統(tǒng)評價——以我國省級旅游官網(wǎng)為例[J].旅游學(xué)刊,2010,25(8):45-51.
[4]張林,錢冠群,樊衛(wèi)國,等.輕型評論的情感分析研究[J].軟件學(xué)報(bào),2014,25(12):2790-2807.
[5]涂海麗,唐曉波.基于在線評論的游客情感分析模型構(gòu)建[J].現(xiàn)代情報(bào),2016,36(4):70-77.
[6]郭宇,王晰巍,李師萌,等.基于情感分析的社會網(wǎng)絡(luò)用戶影響力模型研究[J].情報(bào)學(xué)報(bào),2017(11):1139-1147.
[7]吳茂英,黃克己.網(wǎng)絡(luò)志評析:智慧旅游時代的應(yīng)用與創(chuàng)新[J].旅游學(xué)刊,2014,29(12):66-74.
[8]粟路軍,何學(xué)歡,胡東濱,等.服務(wù)質(zhì)量對旅游者抵制負(fù)面信息意愿的影響機(jī)制研究——基于Stimulus-Organism-Response(S-O-R)分析框架[J].旅游科學(xué),2017,31(6):30-51.
[9]Anclerson M, Magruder J.Leaming from the crowd: regressiondiscontinuitV estimates of the effects of an online review data-base[J].The Economic Journal,2012, 122(563):957-989.
[10]孟美任,丁晟春.虛假商品評論信息發(fā)布者行為動機(jī)分析[J].情報(bào)科學(xué),2013,31(10):100-104.
[11]楊敏.在線商品虛假評論對交易雙方的影響研究[J].現(xiàn)代經(jīng)濟(jì)信息,2016(1):159.
[12]李璐暘,秦兵,劉挺.虛假評論檢測研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2018,41(4):946-968.
[13]靜恩明,郭風(fēng)華,李仁杰,等.基于新浪旅游博客的河北省A級景區(qū)網(wǎng)絡(luò)關(guān)注度研究[J].地理與地理信息科學(xué),2015,31(3):118-122.
[14]李勇,蔣冠文,毛太田,等.基于情感挖掘和話題分析的旅游輿情危機(jī)演化特征——以“麗江女游客被打”事件為例[J].旅游學(xué)刊,2019,34(9):101-113.
[15]劉逸,保繼剛,朱毅玲.基于大數(shù)據(jù)的旅游目的地情感評價方法探究[J]地理研究,2017,36(6):1091-1105.
[16]郭建錦,郭建平.大數(shù)據(jù)背景下的國家治理能力建設(shè)研究[J].中國行政管理,2015(6):73-76.
[17]李燕萍,虞虎,王昊,等.面向大數(shù)據(jù)時代的城市規(guī)劃研究響應(yīng)與應(yīng)對方略[J].城市發(fā)展研究,2017,24(10):1-10.
[18]陳濤,劉慶龍.智慧旅游背景下的大數(shù)據(jù)應(yīng)用研究:以旅游需求預(yù)測為例[J].電子政務(wù),2015(9):6-13.
[19]張紫瓊,葉強(qiáng),李一軍.互聯(lián)網(wǎng)商品評論情感分析研究綜述[J].管理科學(xué)學(xué)報(bào),2010,13(6):84-96.
[20]劉丹萍,金程.旅游中的情感研究綜述[J].旅游科學(xué),2015,29(2):74-85.
[21]龍茂興,孫根年,馬麗君,等.區(qū)域旅游網(wǎng)絡(luò)關(guān)注度與客流量時空動態(tài)比較分析——以四川為例[J].地域研究與開發(fā),2011,30(3):93-97.
[22]周立柱,賀宇凱,王建勇.情感分析研究綜述[J].計(jì)算機(jī)應(yīng)用,2008,28(11):2725-2728.
[23]魏鏵,向陽,陳千.中文文本情感分析綜述[J].計(jì)算機(jī)應(yīng)用,2011.31(12):3321-3323.
[24]黃先開,張麗峰,丁于思.百度指數(shù)與旅游景區(qū)游客量的關(guān)系及預(yù)測研究——以北京故宮為例[J].旅游學(xué)刊,2013,28(11):93-100.
[25]鄭文英.旅行目的地中文評論的情感分析研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010.
[26]曹斌.互聯(lián)網(wǎng)上旅游評論的情感分析及其有用性研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2008.
[27]徐菲菲,刺利青,Ye Feng.基于網(wǎng)絡(luò)數(shù)據(jù)文本分析的目的地形象維度分異研究——以南京為例[J].資源科學(xué),2018,40(7):1483-1493.
[28]王少兵,吳升.基于景點(diǎn)在線評論文本的游客關(guān)注度和情感分析[J].貴州大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,34(6):69-73.
[29]黎崾,謝宗彥,張公鵬,等.基于LDA的游客網(wǎng)絡(luò)評論主題分類:以故宮為例[J].情報(bào)工程,2017,3(3):55-63.
[30]陳航,王躍偉.基于旅游者情感的目的地品牌評價研究——以互聯(lián)網(wǎng)旅游日記為例[J].人文地理,2018,33(2):154-160.
[31] Menchavez J C L,Espinosa K J P.Fun in the Phi:lippines:auto-matic identification and sentiment analysis of tourism-relatedtweets[C]//2015 IEEE International Conference on Data Min-ing Workshop (ICDMW). 14-17 Nov. 2015, Atlantic City, NJ,USA. IEEE. 2015:660-667.
[32] Yang Y X,Lin X L.Tourism network comments sentimentanalysis and early warning system based on ontology[J].lntelli-gent Computing rl'heories anrl Application,2016.
[33] Palakvangsa-Na-ayudhya S,Sriarunrungreung v,ThongprasanP.et al. Nebular: a sentiment classification system for the tour-ism business[C]//2011 Eighth Intemational Joint Conferenceon Computer Science and Software Engineering (JCSSE). 11-13 May 2011, Nakhon Pathom. Thailand. IEEE. 2011:293-298.
[34] Marrese-Taylor E.Velclsquez J D, Bravo-Marquez F.Opinionzoom:a modular tool to explore tourism opinions on the web[C]//2013 IEEE/WIC/ACM Internaticmal Joint Conferences onWeb Intelligence (WI) and Intelligent Agent Technologies(IAT). 17-20 Nov. 2013, Atlanta, CA, USA. IEEE, 2013:261-264.
[35] Colhon M. Badica C, bendre A. Relating the opinion holderand the review accuracy in sentiment analysis of' tourist re-views[J]. Knowledge Science, Engtineering and Management,2014.
[36] Afzaal M.Usman M,F(xiàn)ong A C M.et aI.Fuzzy aspect hasedopinion classification system for mining tourist reviews[J].Ad-vances in Fuzzy Systems, 2016,2016:1-14.
[37] Ali F,Kwak D.Khan P.et aI.Fuzzy ontology-based sentimentanalysis of transportation and City feature reviews for safe trav-eling[J].Transportation Research Part C:Emerging Technologies,2017.77:33-48.
收稿日期:2020-03-27
基金項(xiàng)目:本文系青海省應(yīng)用基礎(chǔ)研究項(xiàng)目“多層異質(zhì)復(fù)雜網(wǎng)絡(luò)的鏈路預(yù)測研究及其在青海旅游景點(diǎn)自動推薦中的應(yīng)用”(2018-ZJ-707)和教育部“春暉計(jì)劃”合作科研項(xiàng)目“耦合多元信息屬性關(guān)系的多層異質(zhì)復(fù)雜網(wǎng)絡(luò)鏈路預(yù)測研究”的研究成果之一。項(xiàng)目負(fù)責(zé)人:唐明虎
作者簡介:唐明虎(1974-),男,副教授,博士,研究方向:機(jī)器學(xué)習(xí)、社交網(wǎng)絡(luò)分析。