尹曾曾,毛端謙
(江西師范大學(xué)地理與環(huán)境學(xué)院,330022,南昌)
在網(wǎng)絡(luò)大數(shù)據(jù)盛行的背景下,基于位置的社交網(wǎng)絡(luò)數(shù)據(jù)受到越來越多的關(guān)注,許多學(xué)者都傾向于利用大數(shù)據(jù)來進行旅游研究。用戶利用自己的社交網(wǎng)絡(luò)平臺即時發(fā)布自己的位置、想法、圖片、文字、表情等內(nèi)容和信息,這一過程稱為簽到(check-in)。游客在進行旅游活動的過程中會隨時將自己旅行的見聞傳送在手機或電腦等社交媒體客戶端上面與大家分享,也可以自愿選擇是否共享位置信息。這一過程完全是由游客的主觀意愿進行的,可以充分體現(xiàn)游客在旅游過程中的想法和心情。新浪微博2019年第4季度財報顯示,2019年12月的月活躍用戶數(shù)為5.16億,較上年同期凈增約5 400萬;平均日活躍用戶數(shù)為2.22億,較上年同期凈增約2 200萬??梢娦吕宋⒉┑挠脩袅烤薮?,現(xiàn)勢性強大,活躍度充分,具有研究價值。
學(xué)者在研究利用社交媒體簽到大數(shù)據(jù)進行分析的過程中,獲得了許多成果。在國外,用戶主要使用Twitter、Facebook、Flickr等社交網(wǎng)站數(shù)據(jù)發(fā)表自己的簽到地理位置數(shù)據(jù);在國內(nèi)則可以通過電腦、手機等多種移動終端接入微信、新浪微博、騰訊微博、騰訊QQ等社交媒體,以文字、圖片、視頻等多媒體形式,實現(xiàn)信息的即時分享和傳播互動。對于簽到大數(shù)據(jù)的研究主要集中在城市網(wǎng)絡(luò)及空間結(jié)構(gòu)、城市熱點區(qū)域挖掘、城市居民時空行為分析、旅游地演化模式等方面,例如Hollenstein[1]等利用Flicker位置數(shù)據(jù)來描述城市功能區(qū)劃,量化了定位和地理信息處理中誤差和不精確的性質(zhì);Li[2]等分析了加利福尼亞州Twitter數(shù)據(jù)和Flicker照片在時間和空間上的分布特征;Paldino[3]等利用人們在不同地點拍攝的帶有地理標(biāo)記的照片中的信息比較了世界上10個最受歡迎的城市的居民和游客的空間行為;韓華瑞[4]利用2014年1—11月的55 933個POI、5 820 136次微博簽到數(shù)據(jù)量分析湖北省微博簽到活動空間差異;王曉夢[5]以北京市城6區(qū)為例使用2012—2015年微博簽到數(shù)據(jù),結(jié)合問卷調(diào)查與實地調(diào)研進行2次糾偏,逐年提取北京市6城區(qū)商業(yè)熱點地區(qū);萬穎樺[6]探討了江西省居民的微博活動量的空間分布特征、不同類別興趣點 POI ( Point of Interest) 微博簽到數(shù)據(jù)組成成分及其與人口的年齡結(jié)構(gòu)和性別結(jié)構(gòu)關(guān)系,并進行可視化表達;徐敏[7]等利用新浪微博簽到大數(shù)據(jù)研究城市旅游地的網(wǎng)絡(luò)結(jié)構(gòu)特征,分析旅游地節(jié)點的對外聯(lián)系強度,總結(jié)出復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)的演化模式。
由此可見,對于利用簽到大數(shù)據(jù)進行的研究大部分是以城市為研究區(qū)域,對城市的網(wǎng)絡(luò)結(jié)構(gòu)、熱點區(qū)域等內(nèi)容進行分析,而在旅游方面的研究相對較少,尺度也大部分是以省、市、景區(qū)內(nèi)為研究基礎(chǔ)的,很少有研究像婺源縣這樣的鄉(xiāng)村旅游地的簽到數(shù)據(jù)特征的文獻。因此這為研究婺源鄉(xiāng)村旅游提供了一個新的方向,有利于婺源鄉(xiāng)村旅游的建設(shè)和發(fā)展。通過獲取婺源縣游客在新浪微博的簽到數(shù)據(jù),并對游客的時空分布模式以及個體特征進行研究,有助于分析婺源游客的特征。之后婺源可以有針對性地對不同游客采取不同的策略,也有利于婺源完善自身的旅游形象,加快對婺源旅游的宣傳和營銷,吸引更多的游客。
婺源縣位于江西東北地區(qū),土地面積2 967 km2,今屬江西省上饒市下轄縣,與皖、浙2省交界,東距浙江衢州120 km,北距安徽黃山市89 km,是一顆處于皖、浙、贛3省交界處的綠色明珠。縣城森林覆蓋率達82%,是全國首批生態(tài)農(nóng)業(yè)旅游示范區(qū),是世界最大的文化生態(tài)公園。婺源以其文化和生態(tài)的優(yōu)勢,被海內(nèi)外譽為“中國最美的鄉(xiāng)村”。并被國內(nèi)各大網(wǎng)站評定為“中國50個一生中必到的地方”和“中國十大踏青好去處”。2001年10月,婺源全域以“婺源文化與生態(tài)旅游區(qū)”獲評國家3A級旅游景區(qū),是唯一的一個以縣城為單位命名的國家3A級景區(qū)。2005年被《中國地理》雜志評為“中國最美的鄉(xiāng)村古鎮(zhèn)之一”。全縣共有一個5A級景區(qū)江灣景區(qū),還有篁嶺、李坑、汪口、思溪延村、大鄣山臥龍谷、靈巖洞、水墨上河等14個4A級景區(qū),還有一批精品景區(qū)和景點。婺源的景點多而分散,分布在縣城中心紫陽鎮(zhèn)的東、西、北3個方向。
由于婺源縣作為以縣級為單位的3A級景區(qū),因此本文選取婺源的4A、5A級景區(qū)以及一些主要的景點、景區(qū)、旅游點、主要的交通樞紐點共99個作為旅游節(jié)點POI,并且記錄其經(jīng)緯度。在所有選取的POI位置所在的區(qū)域,分別選取X、Y最大值和最小值的矩形框內(nèi),X、Y每隔1 km獲取一個lat和lng,調(diào)用新浪微博“獲取附近地點”的API接口,獲取附近POI的微博簽到信息,獲取婺源縣從2011—2020年的旅游簽到數(shù)據(jù)共34 215條。之后對所獲取的數(shù)據(jù)進行清洗和篩選,去除簽到位置不明確、海外簽到數(shù)據(jù)、無效簽到數(shù)據(jù)以及游客簽到可能性較小的地點,例如學(xué)校、醫(yī)院、銀行、居民區(qū)、辦公樓等簽到數(shù)據(jù),最終獲得有效的婺源旅游簽到數(shù)據(jù)共24 712條,時間跨度為2012年1月1日至2020年6月1日。選擇所需要的旅游簽到信息和用戶具體信息,包括用戶昵稱、博文內(nèi)容、發(fā)布時間、簽到經(jīng)緯度地址、性別、所在地和注冊時間等。獲取的簽到數(shù)據(jù)樣本如表1。
表1 婺源縣旅游微博簽到數(shù)據(jù)樣本
2.1.1 總體簽到數(shù)量特征 由于微博簽到數(shù)據(jù)當(dāng)中的所在地(用戶歸屬地)只能顯示到市級單位,而婺源縣隸屬于江西上饒市,因此將歸屬地在江西上饒的都視為本地游客,其他城市的游客視為外地游客。根據(jù)對婺源縣獲取的有效旅游簽到數(shù)據(jù)進行分析(圖1),本地游客的簽到總量為1 692,外地游客的簽到總量為23 020,簽到率分別為7%和93%。女生簽到總量為16 227,男生簽到總量為8 485,男女生簽到總量的比例約為1:2。從2012—2019年各年度簽到總量來看,基本上是呈現(xiàn)逐年遞增的現(xiàn)象,并且增長的幅度也是逐年增大。只有2014年的簽到量是較上一年度下降的,其簽到量為1 036,低于2012年和2013年。簽到總數(shù)量最高的年份是2019年,簽到量為6 423。女生的簽到量每年都高于男生的簽到量,男女生簽到量最高的年份都是2019年,簽到比例也是1:2。外地游客的簽到量一直是遠高于本地游客的簽到量,本地游客的簽到量呈現(xiàn)平穩(wěn)小幅上升的狀態(tài),外地游客的簽到量也和簽到總量一樣逐年遞增,只出現(xiàn)了2014年的一個小的下降拐點。雖然2020年的數(shù)據(jù)只到6月1日,但是可以看出2020年游客的簽到量遠遠達不到往年同期游客簽到的水平。由于新冠肺炎疫情的爆發(fā),婺源縣所有A級景區(qū)及旅游點都從1月25日開始關(guān)閉,一直持續(xù)到2月下旬。經(jīng)市、縣文旅部門同意,決定于2月20日起婺源江灣、篁嶺、水墨上河、文公山、臥龍谷、靈巖洞、石門山峽谷、江嶺8個景區(qū)正式恢復(fù)對外開放,其他景區(qū)也將按規(guī)定陸續(xù)開放。雖然疫情過后逐漸復(fù)產(chǎn)復(fù)工,但是相對來說2020年的游客簽到情況還是受到了較大的影響,游客出行沒有往年那么活躍,旅游的熱度也在一時間迅速降低。
圖1 2012-2020年婺源縣旅游簽到量分布情況
2.1.2 總體簽到密度特征 將獲取到的婺源縣旅游簽到用戶的簽到信息以及婺源縣主要的景點景區(qū)導(dǎo)入Arcgis當(dāng)中,可以看到婺源縣旅游簽到用戶的簽到具體位置都是圍繞在主要的景區(qū)景點周圍,包括具體的觀景點、酒店、重要交通樞紐點等簽到點。利用Arcgis的核密度分析工具和自然間斷點分級法對旅游簽到用戶的簽到具體密度進行分析(圖2),可以看出簽到點較多的位置是在紫陽鎮(zhèn),主要是因為紫陽鎮(zhèn)是婺源縣城的中心,也是整個婺源旅游的交通中心。一般游客都會先抵達這里,再出發(fā)前往不同的目的地。從游客簽到的熱點來看,游客簽到最多的TOP10個景區(qū)景點分別是理坑、思溪延村、石城楓葉、彩虹橋、江灣、李坑、江嶺、靈巖洞、篁嶺和曉起。最受歡迎的就是理坑,理坑景區(qū)是中國歷史文化名村、省級重點文物保護單位,被文人學(xué)者贊為“理學(xué)淵源”。其次是思溪延村,整個古村落以明清古村落為主,具有深厚的歷史文化內(nèi)涵。理坑、靈巖洞、彩虹橋、思溪延村是婺源北線旅游最具代表性的景點,既有蘊含深刻歷史文化底蘊的古村落,又有豐富的自然美景,分布在“千年古鎮(zhèn)”清華鎮(zhèn)的周邊。婺源東線旅游是婺源縣旅游最受歡迎的路線——包括李坑、汪口、江灣、曉起、江嶺等地,還可以到篁嶺體驗婺源獨一無二的曬秋活動。東線旅游路線當(dāng)中包括了婺源保存最完好的徽州古建筑群,村落和景點基本上在一條道路之上,也有許多觀賞油菜花田的地點。而婺源西線旅游開發(fā)時間較晚,包括嚴田古樟景區(qū)、亞洲最大的野生鴛鴦越冬棲息地鴛鴦湖景區(qū)和適宜體驗婺源秋色的長溪村都是較為安靜清幽的旅游地點,相對來說旅游的簽到熱度不高。
圖2 婺源縣游客微博簽到密度圖
為了更好地分析婺源縣的旅游簽到數(shù)據(jù),根據(jù)氣候劃分的方法進行季節(jié)劃分,春季為3月、4月、5月,夏季為6月、7月、8月,秋季為9月、10月、11月,冬季為12月、1月、2月。圖3表明春秋季節(jié)的簽到率明顯高于冬夏季節(jié),春季是出游簽到最為頻繁的季節(jié),簽到率最高,達到了41%。每個季節(jié)外地游客簽到量都遠高于本地游客簽到量,尤其是春季,外地游客簽到量達到春季游客簽到總量的94%。主要是因為春季的江嶺萬畝梯田油菜花海、篁嶺五彩鮮花小鎮(zhèn)、繽紛櫻花等景象是婺源鄉(xiāng)村旅游品牌的重要名片之一。每年的3—4月是婺源油菜花的花期,也是婺源旅游的最佳季節(jié)。秋季簽到率也是較高的,達到全年簽到量的35%。秋季的“曬秋人家”是婺源特色極強的一種農(nóng)俗景觀,也入選了“最美中國符號”。秋季石城和長溪的紅楓葉指數(shù)較高,進入攝影佳期,也是大眾觀賞比較好的時期。婺源北線的自然山脈、沿線公路、村落的紅葉更是吸引了許多游客進行自駕觀賞游玩。冬季簽到量略低于夏季,簽到總量是4個季節(jié)當(dāng)中的最低點,說明游客在冬季出游的情況相對較少,活躍度較低。主要是因為受到氣候的影響,冬季出游的交通不便。對于本地游客來說,每個季節(jié)的簽到量相差并不大,簽到率也是春季最高,冬季最低。
圖3 婺源縣游客簽到數(shù)量季節(jié)性分布情況
將婺源縣2012—2020年的所有有效旅游簽到數(shù)據(jù)按照每年12個月份的簽到數(shù)據(jù)進行統(tǒng)計分析,獲取各個月份在每個年度的簽到占比情況。圖4顯示2012—2019年的每年3月、4月份是旅游簽到率都相對較高的月份,居于10%~30%之間。2012—2019年每年3月份和10月份的旅游簽到率相差并不大,占比率也較高,都在10%~25%之間。可以看出每年春秋季節(jié)的3月、4月和10月都是游客活躍度最高的月份,4月份簽到率最高的一年是2013年,達到29.35%。每年的1月、2月、6月、7月、8月、9月和12月的簽到率相對其他月份較低,都在10%以下。由于2020年只獲取到6月1日的簽到數(shù)據(jù),因此3月份和5月份的簽到率都相對較高,分別為34.97%和28.22%。
圖4 婺源縣2012—2020年各月份旅游簽到占比情況
在所獲取的婺源縣旅游簽到用戶信息當(dāng)中包括用戶ID、用戶的所在地、用戶性別、用戶注冊時間、用戶發(fā)文總量、用戶等級等各項具體信息,可以用來分析旅游簽到用戶的特征。為了分析婺源縣旅游簽到用戶的特征,選取用戶所在地、用戶性別、用戶注冊時間這3個內(nèi)容進行簡單地描述和分析,以獲取婺源縣簽到游客的特征。
2.4.1 游客來源特征 由于之前已經(jīng)將海外游客以及用戶歸屬地不明確的簽到信息進行了篩選,因此這里分析的是婺源縣的國內(nèi)游客來源特征,共包括省份及直轄市34個(圖5)。游客來源地最為集中的10個地方分別是江西省內(nèi)、北京市、浙江省、上海市、廣東省、江蘇省、上饒本地、湖北省、福建省、山東省,這10個地方的游客客源量都超過1 000。可見婺源縣除了對于本省內(nèi)地區(qū)的游客吸引力較大,還對北京、浙江、上海、廣州等經(jīng)濟實力穩(wěn)定和旅游發(fā)展迅速的大城市的游客吸引力較強。而游客來源地較少的地方是香港、寧夏、澳門和青海等地區(qū),來自港澳地區(qū)的游客出行相對來說沒有境內(nèi)游客那么便利,而寧夏和青海雖然處于中國境內(nèi),但是位于西北偏遠地區(qū),距離婺源縣較為遙遠,旅游交通并不方便。對于這些地區(qū)的游客來說,將婺源當(dāng)作旅游目的地的意愿并不強,也說明婺源縣旅游對于這些地區(qū)的吸引力相對要弱一些。
圖5 婺源縣簽到客源分布情況
2.4.2 游客性別特征 婺源縣旅游簽到用戶的性別特征較為明顯(圖6),不同季節(jié)下不同性別的游客量差異較大,而且基本上都是女性游客量遠高于男性游客量,說明女性游客微博簽到的活躍度高于男性游客。并且從季節(jié)簽到頻率來看的話,男女性游客都呈現(xiàn)春秋季節(jié)簽到率高于冬夏季節(jié)的簽到率的趨勢。但是從季節(jié)分布上來看,冬季男女性游客的簽到量基本持平,夏季女性游客簽到量稍高于男性游客,春秋季節(jié)女性游客簽到量差不多是男性游客簽到量的2倍,女性游客的活躍度遠遠超過男性游客的活躍度。
圖6 2012-2020年婺源簽到用戶不同季節(jié)的性別特征對比圖
從游客注冊時間來看(圖7),最早開始注冊新浪微博的時間是2009年,最新注冊時間是2020年。從微博門戶網(wǎng)站興起開始就有用戶在新浪微博注冊,并且在婺源縣的旅游景區(qū)景點打卡簽到。2009年男性注冊游客略多于女性注冊游客,距今來算注冊年限已達到11 a,是新浪微博的資深用戶。2009年的男女性注冊游客相對較少,主要是因為當(dāng)時微博剛剛開始運營,還未進入廣泛群眾的視野當(dāng)中。而從2010年開始微博的概念得到了廣泛的傳播,各大門戶網(wǎng)站也在這一年紛紛開通微博,中國的微博呈現(xiàn)高速增長的態(tài)勢。同樣,就婺源縣旅游簽到用戶情況來看,2010年男女性游客微博注冊量猛增,男女性注冊游客都較2009年相比呈爆炸性增長狀態(tài),2010年男女游客注冊總量是2009年的8倍,女性注冊游客從2009年的238人增加到2010年的2 880人,呈現(xiàn)10倍速增長情況。2011年依然保持男女游客微博注冊量高增長情況,男女性游客注冊數(shù)量都是從2009—2020年以來男女游客注冊數(shù)量的最高峰,女性注冊游客為3 757人,男性注冊游客為1 951人。2011年之后男女游客注冊量都呈現(xiàn)下降趨勢,從2010—2016年都是女性注冊游客數(shù)量高于男性注冊游客,2017—2020年則是男性注冊游客數(shù)量稍高于女性注冊游客數(shù)量。
圖7 婺源縣微博簽到游客注冊時間的性別特征對比表
根據(jù)獲取的婺源縣旅游簽到大數(shù)據(jù)來看,可以簡單分析游客簽到的特征和游客的具體信息特征。從總體游客簽到特征來看,婺源縣游客簽到總量基本呈現(xiàn)逐年遞增的狀態(tài),女性簽到總量高于男性簽到總量,外地游客簽到量遠高于本地游客。婺源縣游客簽到密度分布不均,主要的簽到密集點基本上是集中在理坑、思溪延村、石城紅楓、彩虹橋、江灣、李坑、江嶺等重要的景區(qū)范圍內(nèi)。作為中國最美鄉(xiāng)村,婺源縣春季有萬畝油菜花田、秋季有滿山紅楓林,以及保存完好的明清徽派古建筑群等這些自然的旅游名片為鄉(xiāng)村旅游的發(fā)展奠定了良好的基礎(chǔ)。從游客簽到季節(jié)性特征來看,春季是游客活躍度最高的季節(jié),3月份和4月份的簽到率相對更高。從簽到用戶的來源特征來看,除江西省內(nèi)用戶,大部分婺源縣簽到的外地游客是來自北京市、浙江省、上海市和廣東省等經(jīng)濟相對發(fā)達的地區(qū),香港、澳門、寧夏和青海等地區(qū)的用戶相對較少。從性別特征來看,女性用戶總體多于男性用戶,可以看出女性相對男性來說更加活躍,在婺源旅游簽到的數(shù)量也較多,尤其是在旅游旺季,出游簽到的可能性更高。因此婺源要加快塑造良好的旅游形象的步伐,加大旅游宣傳力度,尤其是對距離較遠地區(qū)加強宣傳,以吸引更多的客源。在線路設(shè)計和景區(qū)建設(shè)等方面盡可能地多滿足女性游客的需求,增強女性游客的重游意愿;同時也要加強對男性游客的關(guān)注,致力于吸引更多的男性游客。在婺源旅游春秋旺季時做好基礎(chǔ)設(shè)施建設(shè)和旅游安全防范工作,注重婺源旅游品牌推廣,將鄉(xiāng)村旅游品牌越做越好;冬夏淡季時推出更多的旅游活動,例如門票優(yōu)惠、項目免費體驗等,激起淡季游客的活躍性。