鄧 寧
(北京第二外國(guó)語學(xué)院 北京 100024)
旅游實(shí)證研究長(zhǎng)期以來主要依靠問卷調(diào)查等方式提供數(shù)據(jù)支撐。然而,傳統(tǒng)旅游研究方法存在以下幾點(diǎn)局限:(1)數(shù)據(jù)獲取的難度很大;(2)樣本獲取的公平性難以保證;(3)問卷結(jié)果的客觀性不確定。隨著社交網(wǎng)絡(luò)的流行和Web2.0的興起,基于用戶生成內(nèi)容的相關(guān)研究逐漸成為當(dāng)前旅游研究的熱門方向,同時(shí)也對(duì)旅游研究方法提出了新的要求。基于大數(shù)據(jù)的分析方法已逐漸應(yīng)用于旅游研究中,這種研究方法可在更大的樣本空間中對(duì)旅游者行為和目的地形象進(jìn)行分析,其所涉及的數(shù)據(jù)不僅具有更好的完整性,同時(shí)也是游客真實(shí)行為與感受的客觀反映,可以有效彌補(bǔ)傳統(tǒng)研究方法的不足。
然而,利用大數(shù)據(jù)進(jìn)行旅游研究本身對(duì)信息技術(shù)具有較高的依賴性。采用數(shù)據(jù)挖掘技術(shù)進(jìn)行旅游研究需要借助于成熟工具,或者依賴于研究團(tuán)隊(duì)成員的技術(shù)背景。對(duì)于絕大多數(shù)缺乏專業(yè)計(jì)算機(jī)技術(shù)背景的普通旅游研究者而言,如何利用信息技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行高效、準(zhǔn)確的處理和分析已經(jīng)成為制約旅游研究方法發(fā)展的瓶頸。
圖片是旅游研究領(lǐng)域非常重要的媒介,基于圖片的目的地形象和游客行為研究也成為當(dāng)前研究的熱點(diǎn),特別是隨著以Facebook、Twitter、微信為代表的社交網(wǎng)絡(luò)和以Instagram、Flickr為代表的圖片分享網(wǎng)站的興起,使得游客所發(fā)布的旅游圖片成為目的地形象傳播的重要載體,也為旅游研究提供了新的方法。目前基于社交圖片的旅游研究主要集中在以下幾個(gè)方面:(1)通過社交圖片判斷游客分布并分析目的地客流變化情況;(2)通過社交圖片所攜帶的數(shù)字足跡分析游客旅游軌跡及行為;(3)通過分析游客發(fā)布于社交媒體上的圖片,對(duì)比游客所感知的目的地形象與旅游目的地營(yíng)銷組織(Destination Marketing Organization,DMO)投射的形象之間的差異,以及由此衍生出對(duì)于目的地在線形象的探討等。
本研究面向社交網(wǎng)絡(luò)——Flickr所提供的圖片元數(shù)據(jù)(metadata)集合YFCC 100M,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)利用社交圖片元數(shù)據(jù)進(jìn)行旅游研究的數(shù)據(jù)挖掘與分析平臺(tái)——PMMS(Photo based Metadata Mining System)。PMMS 可以提供如下4種功能服務(wù)于基于圖片的旅游研究:(1)目的地?zé)狳c(diǎn)(Point of Interest, POI)分析;(2)游客歷史對(duì)比分析;(3)游客軌跡分析;(4)基于圖片的目的地形象感知分析。該平臺(tái)旨在為不具備專業(yè)計(jì)算機(jī)技術(shù)背景的旅游研究者提供一個(gè)便捷、高效的圖片元數(shù)據(jù)挖掘與分析工具,將大數(shù)據(jù)的研究方法與傳統(tǒng)旅游研究方法相結(jié)合,降低由于缺乏相關(guān)學(xué)科背景所造成的技術(shù)門檻。本平臺(tái)所提供的功能與目前旅游研究領(lǐng)域基于社交圖片的相關(guān)研究方向高度一致,僅需通過簡(jiǎn)單的配置即可完成海量目的地圖片元數(shù)據(jù)的分析與處理,降低了傳統(tǒng)旅游研究者學(xué)習(xí)編程及數(shù)據(jù)處理等知識(shí)的時(shí)間成本。
基于圖片的旅游研究由來已久,而圖片數(shù)據(jù)的來源和研究方法隨著時(shí)代的變化發(fā)生過幾次明顯的變革。早期的圖片研究多采用“游客受雇拍攝法”(Visitor Employed Photography,VEP)和“游客自愿拍攝法”(Visitor Self-employed Photography,VSEP)進(jìn)行圖片收集,其中前者通過給拍攝者發(fā)放相機(jī)進(jìn)行拍攝,后者則利用游客自帶設(shè)備進(jìn)行拍攝。VEP中拍攝者或多或少會(huì)受到研究者的外部影響并受限于拍攝器材數(shù)量而無法進(jìn)行大規(guī)模數(shù)據(jù)采集;VSEP則更能體現(xiàn)基于游客自身視角的目的地感知。特別是隨著數(shù)碼圖片和社交網(wǎng)絡(luò)的普及與發(fā)展,利用社交圖片及用戶所產(chǎn)生的內(nèi)容進(jìn)行旅游圖片研究逐漸成為主流。Stepchenkova S和Zhan F通過比較DMO與Flickr圖片內(nèi)容得到了秘魯目的地形象在兩種圖片方面所體現(xiàn)的差異;Hunter W C則對(duì)比了多個(gè)搜索引擎(Naver、Google、Baidu)上關(guān)于首爾的圖片,歸納出首爾在網(wǎng)絡(luò)上的目的地在線形象(online image);Stepchenkova S還通過分析 658張由美國(guó)游客拍攝的Flickr圖片及595張由韓國(guó)游客所拍攝的博客圖片,對(duì)比了美、韓兩國(guó)游客對(duì)俄羅斯旅游形象的感知差異。針對(duì)旅游目的地形象的圖片研究多采用內(nèi)容分析(content analysis)和符號(hào)分析(semiotic analysis)法,它們都是通過人工分析的方式對(duì)圖片內(nèi)容元素進(jìn)行解構(gòu),其中內(nèi)容分析多見于對(duì)圖片顯性內(nèi)容進(jìn)行分析,而符號(hào)分析則側(cè)重于對(duì)圖片隱性內(nèi)容的獲取。情感形象(affective image)作為圖片所蘊(yùn)含的隱性內(nèi)容,也成為激發(fā)旅游動(dòng)機(jī)的關(guān)鍵。Pan S、Lee J和 Tsai H屬于為數(shù)不多的探討旅游圖片內(nèi)容與情感形象之間關(guān)系的學(xué)者,其研究成果可用于目的地圖片營(yíng)銷的內(nèi)容推薦。
數(shù)碼圖片元數(shù)據(jù)中包含了圖片拍攝地點(diǎn)GPS位置信息,作為旅游者的數(shù)字足跡(footprint)為眾多旅游研究者所重視。?nder I、Koerbitz W和Hubmann-Haidvogel A以及 Vu H Q、Li G、Law R 等的研究都分別采用圖片 GPS 數(shù)據(jù)分析了游客的行為特征以及目的地POI識(shí)別和分布情況。其中Vu H Q、Li G、Law R等根據(jù)中國(guó)內(nèi)地游客在香港地區(qū)所拍攝圖片的數(shù)字足跡分析了其在香港的游覽行為、旅游熱點(diǎn)區(qū)域(Area of Interests,AOI)以及AOI之間游客流向關(guān)系等,可以為目的地營(yíng)銷、交通規(guī)劃等提供決策依據(jù)。楊敏和丁娟等人也采用數(shù)字足跡法分別分析了成都游客的時(shí)空特征和中國(guó)入境游客POI時(shí)空格局。利用圖片數(shù)字足跡進(jìn)行旅游研究有助于為區(qū)域旅游管理和規(guī)劃等提供參考,亦有研究將POI信息作為游客線路決策的推薦依據(jù)。
綜上所述,社交圖片已成為近年來研究游客行為和目的地感知的重要載體?;谏缃粓D片的旅游研究主要圍繞4個(gè)方面:(1)目的地?zé)狳c(diǎn)分析;(2)游客歷史對(duì)比分析;(3)游客軌跡分析;(4)基于圖片的目的地形象感知分析。本文所實(shí)現(xiàn)的PMMS支持的功能與以上研究方向高度契合,可作為一個(gè)通用的旅游大數(shù)據(jù)研究平臺(tái)服務(wù)于普通旅游研究者。
表1 Flickr數(shù)據(jù)集中每張圖片所含信息Tab. 1 Data ベelds for each photo in the Flickr dataset
Flickr是目前主流的圖片分享平臺(tái),其于2015年7月開源了一個(gè)針對(duì)學(xué)術(shù)研究的圖片集合——YFCC 100M,其中包括2004年至2014年間在Flickr上發(fā)布的超過1億張圖片的元數(shù)據(jù)(metadata),每條數(shù)據(jù)所包含的信息如表1所示。
YFCC 100M包括9 920萬張圖片和80萬個(gè)視頻文件的元數(shù)據(jù)信息,其中包含幾個(gè)與旅游研究密切相關(guān)的信息:(1)圖片標(biāo)題(title)/標(biāo)簽(tag)/描述(description),其中標(biāo)簽分為兩種,一種是由用戶上傳照片時(shí)定義的,一種是由相機(jī)、應(yīng)用根據(jù)拍攝內(nèi)容自動(dòng)生成的對(duì)于圖片內(nèi)容的描述信息;(2)拍攝時(shí)間(taken time),其中99.6%的圖片拍攝于2004年至2014年間;(3)地理位置(coordinates),總共有48 366 323張圖片和103 506個(gè)視頻具有地理位置信息,可以還原圖片拍攝地點(diǎn)的坐標(biāo)。
圖1 PMMS 系統(tǒng)整體框架Fig. 1 PMMS whole architecture
(1)系統(tǒng)整體框架
PMMS總體架構(gòu)如圖1所示,PMMS對(duì)于圖片元數(shù)據(jù)進(jìn)行分析依照以下順序進(jìn)行。
數(shù)據(jù)清洗:根據(jù)所配置的地理邊界及圖片拍攝坐標(biāo),對(duì)目的地所涉及的圖片元數(shù)據(jù)進(jìn)行過濾。例如:以意大利古城羅馬為例,其分析范圍大致位于東經(jīng)[12.3698,12.6173]、北緯[41.7929,41.8688]的矩形區(qū)域內(nèi),故通過數(shù)據(jù)清洗可以先得到一個(gè)與目標(biāo)目的地相關(guān)的元數(shù)據(jù)集合。
② 分析功能配置:根據(jù)所研究的方向,在PMMS支持的4種分析功能中選擇一種或幾種進(jìn)行系統(tǒng)配置。例如:輸入數(shù)字“1”代表“POI分析”;數(shù)字“2”代表“游客歷史對(duì)比分析”;數(shù)字“3”代表“游客軌跡分析”;數(shù)字“4”代表“基于圖片的目的地形象感知分析”。
③ 輸出結(jié)果:根據(jù)功能的不同輸出不同形式的結(jié)果,其中POI分析、游客歷史對(duì)比分析和游客軌跡分析最終以“拍攝坐標(biāo)、拍攝時(shí)間”的形式給出一組符合要求的數(shù)據(jù)集合,該結(jié)果可以非常方便地采用任意第三方Arc GIS工具軟件進(jìn)行可視化呈現(xiàn)。而基于圖片的目的地形象感知?jiǎng)t通過分析元數(shù)據(jù)中“標(biāo)簽/標(biāo)題/描述”和圖片評(píng)論并提取高頻詞的方式分別得到目的地認(rèn)知形象(cognitive image)和情感形象(affective image)。
(2)原型系統(tǒng)實(shí)現(xiàn)
PMMS采用程序設(shè)計(jì)語言Python 2.7進(jìn)行開發(fā),目前已經(jīng)實(shí)現(xiàn)了一個(gè)滿足上述4種基本功能的原型系統(tǒng),該系統(tǒng)包含5個(gè)文件共計(jì)203行代碼,已被上傳到世界最大開源社區(qū)GitHub供旅游研究者免費(fèi)使用。
在PMMS設(shè)計(jì)實(shí)現(xiàn)過程中還涉及以下幾個(gè)工具組件:
① Flickr接口(Application Programming Interface,API):使用了由 Alexis Mignon開發(fā)的python版本Flickr API,主要用于獲取指定圖片的評(píng)論數(shù)據(jù),并根據(jù)給定的照片序列號(hào)(photo ID)從Flickr下載原圖內(nèi)容。
②TextBlob:主流的英文語義分析工具,用于在目的地形象感知分析時(shí)對(duì)元數(shù)據(jù)中詞頻進(jìn)行統(tǒng)計(jì),以分析基于社交圖片的目的地形象。
(3)PMMS各項(xiàng)基本功能的實(shí)現(xiàn)原理
①POI分析
在旅游目的地進(jìn)行POI識(shí)別具有非常重要的研究意義,PMMS可通過提取數(shù)據(jù)圖片元數(shù)據(jù)中的地理位置信息分析得出圖片的拍攝地點(diǎn),進(jìn)而將游客較為集中的區(qū)域和拍攝地點(diǎn)視為旅游目的地的熱點(diǎn)區(qū)域。大量旅游研究已經(jīng)采用數(shù)字圖片所攜帶的數(shù)字足跡信息對(duì)游客分布進(jìn)行分析,并采用將坐標(biāo)點(diǎn)通過Arc GIS工具進(jìn)行可視化的方式對(duì)POI進(jìn)行識(shí)別,本文使用目前流行的Arc GIS工具——Carto對(duì)羅馬的圖片位置數(shù)據(jù)進(jìn)行可視化分析。
②游客歷史對(duì)比分析
表2 2006—2014年3個(gè)不同時(shí)間區(qū)間游客人數(shù)變化情況分析Tab. 2 Tourist number and percentages in three time intervals from 2006 to 2014
對(duì)旅游目的地游客歷史的對(duì)比分析,有助于了解目的地游客變化情況和未來發(fā)展趨勢(shì)。筆者將時(shí)間分為2006年至2008年、2009年至2011年、2012年至2014年這3個(gè)區(qū)間,將數(shù)據(jù)集中滿足地理范圍條件的圖片元數(shù)據(jù)按照拍攝時(shí)間分為3個(gè)集合,每個(gè)時(shí)間區(qū)間圖片的數(shù)量及所占比例如表2所示。
③游客軌跡分析
圖2 利用PMMS分析游客軌跡示意圖Fig. 2 The illustration of analyzing tourists’ movement using PMMS
游客游覽軌跡對(duì)于目的地線路規(guī)劃及游客行為研究具有重要意義,PMMS可以通過分析圖片元數(shù)據(jù)中的拍攝時(shí)間和位置坐標(biāo),得到該游客的游覽軌跡。通過分析圖片元數(shù)據(jù)中的3個(gè)關(guān)鍵信息——用戶ID、拍攝地點(diǎn)和拍攝時(shí)間,計(jì)算得到單個(gè)游客的圖片拍攝順序及拍攝地點(diǎn),具體分析步驟如圖2所示。
④目的地形象感知分析
目的地形象感知分析一直是旅游研究中最為活躍的研究方向之一。對(duì)于目的地的感知形象根據(jù)其形成的順序可以分為認(rèn)知形象和情感形象,其中認(rèn)知形象指旅游者對(duì)已知的特定旅游地的特性進(jìn)行評(píng)估或了解,從而在內(nèi)心生成的信念,而情感形象是人們對(duì)目的地各種屬性所產(chǎn)生的情感反應(yīng)。
圖3 利用PMMS進(jìn)行目的地形象感知分析示意圖Fig. 3 Illustration of destination perception using PMMS
旅游圖片作為游客對(duì)目的地感知最為直觀的形象,具有重要的研究?jī)r(jià)值,基于社交圖片的目的地形象感知分析已成為目的地形象研究的重要組成部分。以Flickr為例,其每條元數(shù)據(jù)記錄中所包含的“標(biāo)簽/標(biāo)題/描述”可以作為圖片發(fā)布者對(duì)于圖片內(nèi)容的概況和描述,包含了拍攝者視角下的目的地認(rèn)知形象;而Flickr中的圖片評(píng)論則可視為讀圖者對(duì)于圖片內(nèi)容所表達(dá)的情感,亦可視為情感形象的體現(xiàn)。如圖3所示,PMMS采用語義分析工具Textblob從游客發(fā)布圖片的“標(biāo)簽/標(biāo)題/描述”中過濾出出現(xiàn)頻率較高(>100次)的名詞以及圖片評(píng)論中詞頻較高(>30次)且情感極性強(qiáng)烈(>0.1)的形容詞分別構(gòu)建認(rèn)知形象和情感形象語料庫(kù)。因此,利用PMMS分析YFCC 100M中的圖片元數(shù)據(jù)及其評(píng)論可以作為目的地形象研究的重要手段。
本文以羅馬為例,說明如何利用PMMS所提供的4個(gè)基本功能服務(wù)于基于圖片的旅游研究。
選擇羅馬作為分析對(duì)象,意在表明PMMS的使用不受目的地選擇的限制,是一種通用的目的地研究分析工具。筆者根據(jù)羅馬城市邊界,將分析區(qū)域限定在東經(jīng)[12.3698,12.6173]、北緯[41.7929,41.8688]的矩形范圍內(nèi),即圖4矩形邊框所示。
圖4 羅馬主要城區(qū)范圍示意圖Fig. 4 Illustration of the Rome region in this study
(1)POI分析
圖5 基于圖片拍攝坐標(biāo)的羅馬POI分布圖Fig. 5 POI distribution in Rome based on Flickr photos
筆者將東經(jīng)[12.3698,12.6173]、北緯[41.7929,41.8688]作為YFCC 100M數(shù)據(jù)集合進(jìn)行數(shù)據(jù)清洗的地理范圍。對(duì)YFCC 100M中2006—2014年的數(shù)據(jù)進(jìn)行過濾,得到總計(jì)125 680條具有有效GPS坐標(biāo)的圖片元數(shù)據(jù)。隨后,將這些元數(shù)據(jù)坐標(biāo)導(dǎo)入Arc GIS 可視化工具Carto中,生成一幅基于圖片拍攝坐標(biāo)的POI熱力圖。如圖5所示,每一個(gè)點(diǎn)均代表一張圖片的拍攝地點(diǎn),顏色越深的區(qū)域代表在此處拍攝圖片數(shù)量越多,即可視為旅游人群集中的區(qū)域。從圖中可以看出,城市中心區(qū)域、羅馬古城遺址周邊的梵蒂岡城(Vatican City)、坎皮特利(Campitelli)、皮尼亞(Pigna)和雷格拉(Regola)圖片拍攝相對(duì)較為密集,也是羅馬城游客主要參觀游覽的景點(diǎn)。
通過對(duì)圖片數(shù)字足跡信息——GPS坐標(biāo)進(jìn)行可視化呈現(xiàn),可以分析目的地在游客分布、POI分布等方面的特征,對(duì)于旅游研究具有重要的價(jià)值,也是旅游目的地人流時(shí)空分析的基礎(chǔ)。
(2)游客歷史對(duì)比分析
圖6 2009—2011年與2012—2014年羅馬基于圖片坐標(biāo)的游客情況比較Fig. 6 Tourist comparison from 2009 to 2011 and 2012 to 2014 based on Flickr photos of Rome
將2009—2011年和2012—2014年內(nèi)的數(shù)據(jù)分別導(dǎo)入Arc GIS工具——Carto中進(jìn)行可視化呈現(xiàn),得到上述兩個(gè)時(shí)間段內(nèi)目的地游客分布的變化情況對(duì)比,如圖6所示。從結(jié)果看出,2012—2014年期間圖片數(shù)量明顯減少,這與Flickr用戶數(shù)量在此期間遞減有關(guān),但Tiburtina(圖中方框地點(diǎn))的游客數(shù)量從2012年至2014年卻有明顯的增長(zhǎng),這可能是與2011年羅馬在此地?cái)U(kuò)建了火車站,使其成為游客中轉(zhuǎn)的交通樞紐有關(guān)。
通過分析圖片數(shù)字足跡和拍攝時(shí)間信息,可以方便地對(duì)目的地人流情況進(jìn)行時(shí)間軸比較,有助于預(yù)測(cè)目的地客流情況隨時(shí)間變化的趨勢(shì),也可對(duì)目的地規(guī)劃和管理給出一定時(shí)間區(qū)間內(nèi)的效果評(píng)估,具有極高的研究?jī)r(jià)值。
(3)游客軌跡分析
實(shí)際分析過程中,本文限定每個(gè)用戶至少需要發(fā)布5張以上圖片才進(jìn)行軌跡分析,滿足該條件的游客占比約為48.8%。根據(jù)游客拍攝圖片的順序及地點(diǎn),最終得到每位游客的游覽軌跡。本文隨機(jī)選擇了3位游客的游覽線路進(jìn)行分析,并通過Carto進(jìn)行可視化,如圖7所示,其中方框內(nèi)的序號(hào)表示該游客游覽的順序。
圖7 3名游客在羅馬游覽軌跡示意圖Fig. 7 Movement of three tourists in Rome
通過圖7可以得到3名游客不同的游覽軌跡和游覽順序。其中,游客1在羅馬游覽期間居住于 Appio Claudio 酒店,先后游覽了 Piazza di Campitelli、INGV、Parco della Caffarella 和 Teatro Studio Borgna 等地,最終以 Scuola di Recitazione Fondamenta和 Teatro Anベtrione兩處的游覽結(jié)束行程;游客 2 由 EUR Magliana出 發(fā), 游 覽 景 點(diǎn) 包 括 Castel Sant’ Angelo、Rione IV Campo Marzio、Colonna Palace 和 Museo Storicodei Bersaglieri;游客 3 游覽路徑為 Anguillara Tower Torre Anguillara、Colosseum、Vatican City 以及 Palazzo Massimo alle Terme。
PMMS也可用于對(duì)具有特定屬性的游客群體進(jìn)行游覽軌跡的聚類分析,從而得到游客群體的旅游行為屬性,對(duì)于游客行為研究具有重要價(jià)值。
(4)目的地形象感知
①認(rèn)知形象分析:采用語義分析工具Textblob從游客發(fā)布圖片的“標(biāo)簽/標(biāo)題/描述”中取出出現(xiàn)頻率較高(>100次)的名詞,忽略某些無意義的詞后(例如travel等),得到針對(duì)羅馬的認(rèn)知形象語料庫(kù)。表3列出了排名前30位的高頻詞信息。根據(jù)表3中高頻詞還原圖片元數(shù)據(jù)完整內(nèi)容后得到,卡比托利歐廣場(chǎng)、真理之口和梵蒂岡是排名前3的景點(diǎn)。在羅馬游客眼中,羅馬的建筑和人文景點(diǎn)是最能夠代表羅馬形象的,游客所拍照片多數(shù)位于這些地方。通過對(duì)排名前40的認(rèn)知形象關(guān)鍵詞進(jìn)行分析可以發(fā)現(xiàn),游客對(duì)于羅馬形象的認(rèn)知主要涵蓋了建筑、人文、酒店、飲食和運(yùn)動(dòng)等多個(gè)方面。
表3 羅馬圖片元數(shù)據(jù)中的高頻名詞語料庫(kù)Tab. 3 High frequency nouns in Rome related photos’ metadata
②情感形象分析:通過英文詞頻分析工具Textblob對(duì)Flickr中羅馬相關(guān)圖片的評(píng)論進(jìn)行詞頻分析(詞頻>30次),并利用英文情感極性計(jì)算工具SentiWordNet對(duì)形容詞的情感極性(極性>0.1)進(jìn)行計(jì)算,最終得到一個(gè)關(guān)于羅馬目的地情感形象的語料庫(kù),如表4所示。從結(jié)果分析可知,排在前5位的形容詞分別是“偉大的”(great)、“美麗的”(beautiful)、“贊嘆的”(wonderful)、“驚奇的”(amazing)和“很贊的”(awesome)。由此可知,讀圖者根據(jù)羅馬社交圖片呈現(xiàn)的認(rèn)知形象所產(chǎn)生的情感形象以正面為主,以贊嘆、褒獎(jiǎng)的形容詞作為圖片評(píng)論的主要詞語。
表4 羅馬圖片評(píng)論中的高頻形容詞語料庫(kù)Tab. 4 High frequency adjectives in Rome related Flickr photos’ comments
值得指出的是,囿于篇幅所限,本文僅從UGC圖片分析工具的角度探討了利用大數(shù)據(jù)的方法進(jìn)行目的地?zé)狳c(diǎn)分析、游客歷史對(duì)比分析、游客軌跡分析以及基于圖片的目的地形象感知分析。上述均為較獨(dú)立的研究方向,圍繞各個(gè)問題所展開的深入探討不在本文范圍之內(nèi)。
本文介紹了一個(gè)面向普通旅游研究者進(jìn)行海量UGC圖片數(shù)據(jù)分析的通用平臺(tái)——PMMS,該平臺(tái)根據(jù)目前旅游圖片研究所涉及的主流研究方向,提供4種數(shù)據(jù)分析功能:(1)目的地?zé)狳c(diǎn)分析;(2)游客歷史對(duì)比分析;(3)游客軌跡分析;(4)基于圖片的目的地形象感知分析。PMMS的主要貢獻(xiàn)在于普通旅游研究者可利用其對(duì)目的地海量圖片元數(shù)據(jù)及評(píng)論進(jìn)行深入的挖掘與分析,省去了學(xué)習(xí)編程等計(jì)算機(jī)技術(shù)的成本,極大降低了在旅游研究中運(yùn)用計(jì)算機(jī)技術(shù)進(jìn)行數(shù)據(jù)挖掘的技術(shù)門檻,同時(shí)也為旅游研究者進(jìn)行社交圖片大數(shù)據(jù)分析提供了參考。本文以意大利首都羅馬為例說明了如何利用PMMS進(jìn)行相關(guān)旅游研究,驗(yàn)證了該平臺(tái)在旅游研究中的實(shí)際價(jià)值。
PMMS的設(shè)計(jì)與實(shí)現(xiàn)目前仍然處于較為初級(jí)的階段,后續(xù)研究工作希望從如下幾個(gè)方面深入開展:首先,目前PMMS僅支持單一數(shù)據(jù)源YFCC 100M,未來希望能兼容更多圖片數(shù)據(jù)集合;其次,PMMS目前僅支持基本的數(shù)據(jù)分析,在數(shù)據(jù)結(jié)構(gòu)可視化方面仍然需要借助第三方Arc GIS工具,將來可以整合可視化工具令其功能更完整;最后,在為旅游研究配置的用戶界面方面,希望PMMS將來更為友好,最終成為一個(gè)便捷、高效的圖片數(shù)據(jù)分析系統(tǒng)。
[1]Vu H Q, Li G, Law R, et al. Exploring the travel behaviors of inbound tourists to Hong Kong using geotagged photos [J]. Tourism Management, 2015(46): 222~232.
[2]Andraz J M, Rodrigues P M M. Monitoring tourism ぼows and destination management:Empirical evidence for Portugal [J]. Tourism Management, 2016(56):1~7.
[3]Li Q, Huang Z, Christianson K. Visual attention toward tourism photographs with text:An eye-tracking study [J]. Tourism Management, 2016(54): 243~258.
[4]Zhang L, Lan C, Qi F, et al. Development pattern, classiベcation and evaluation of the tourism academic community in China in the last ten years : From the perspective of big data of articles of tourism academic journals [J]. Tourism Management, 2017(58):235~244.
[5]Stepchenkova S, Zhan F. Visual destination images of Peru : Comparative content analysis of DMO and user-generated photography [J]. Tourism Management, 2013(36):590~601.
[6]Pan S, Lee J, Tsai H. Travel photos : Motivations, image dimensions, and affective qualities of places [J]. Tourism Management, 2014(40):59~69.
[7]Hunter W C. The social construction of tourism online destination image : A comparative semiotic analysis of the visual representation of Seoul [J]. Tourism Management, 2016(54): 221~229.
[8]張珍珍, 李君軼. 旅游形象研究中問卷調(diào)查和網(wǎng)絡(luò)文本數(shù)據(jù)的對(duì)比——以西安旅游形象感知研究為例 [J]. 旅游科學(xué), 2014, 28 (6):73~81.
[9]?nderI, Koerbitz W, Hubmann-Haidvogel A. Tracing tourists by their digital footprints:The case of Austria[ J]. Journal of Travel Research, 2014, 55( 5):566~573.
[10]Thomee B, Shamma D A, Friedland G, et al. YFCC100M : The new data in multimedia research[ J]. Communications of the ACM, 2016, 59( 2):64~73.
[11]Stepchenkova S. Cultural differences in pictorial destination images : Russia through the camera lenses of american and korean tourists[ J]. Journal of Travel Research,2015, 54(6): 758~773.
[12]Song S G, Kim D Y. A pictorial analysis of destination images on pinterest: The case of Tokyo, Kyoto, and Osaka, Japan[ J]. Journal of Travel & Tourism Marketing,2016, 33( 5):687~701.
[13]Jenkins O. Photography and travel brochures: The circle of representation[ J].Tourism Geographies, 2003, 5( 3):305~328.
[14]楊敏, 李君軼, 楊利. 基于旅游數(shù)字足跡的城市入境游客時(shí)空行為研究——以成都市為例[ J]. 旅游科學(xué), 2015( 3):59~68.
[15]丁娟, 李俊峰. 基于Web地理圖片的中國(guó)入境游客POI空間格局[ J]. 經(jīng)濟(jì)地理,2015( 6):24~31.
[16]Van L O, Schockaert S, Dhoedt B. Georeferencing Flickr resources based on textual meta-data[ J]. Information Sciences, 2013(238): 52~74.
[17]Baloglu S, McCleary KW. A model of destination image formation[ J]. Annals of Tourism Research, 1999, 26( 4):868~897.
[18]Andreu L, Bigné J E, Cooper C. Projected and perceived image of Spain as a tourist destination for British travellers[ J]. Journal of Travel & Tourism Marketing, 2000, 9(4):47~67.
[19]Smith W W, Li X R, Pan B, et al. Tracking destination image across the trip experience with smartphone technology[ J]. Tourism Management, 2015(48):113~122.
[20]Anand P, Holbrook M B, Stephens D. The formation of affective judgments: The cognitive-affective model versus the independence hypothesis[ J]. Journal of Consumer Research, 1988, 15( 3):386~391.
[21]Chen J S, Uysal M. Market positioning analysis: A hybrid approach[ J]. Annals of Tourism Research, 2002, 29( 4):987~1003.
[22]Donaire J A, Camprubí R, Galí N. Tourist clusters from Flickr travel photography[ J].Tourism Management Perspectives, 2014(11):26~33.
[23]Loria S. TextBlob: Simpliベed Text Processing[ Z]. Secondary TextBlob: Simpliベed Text Processing, 2014.