国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于UGC文本數(shù)據(jù)的大陸赴臺(tái)游客空間特征探究

2020-04-10 06:43趙梓軒許銳
旅游縱覽·行業(yè)版 2020年2期
關(guān)鍵詞:景點(diǎn)熱點(diǎn)片區(qū)

趙梓軒 許銳

本文以2011-2019年大陸赴臺(tái)自由行游客為研究對(duì)象,使用Python爬蟲技術(shù)抓取馬蜂窩、窮游網(wǎng)游記及行程文本數(shù)據(jù),運(yùn)用自適應(yīng)DBSCAN算法、社會(huì)網(wǎng)絡(luò)分析法,提取游客訪問景點(diǎn),探測旅游熱點(diǎn)AOI,并對(duì)出行時(shí)長為8日及15日的游客流動(dòng)情況進(jìn)行探究,以期總結(jié)經(jīng)驗(yàn),為類似研究及旅游規(guī)劃發(fā)展提供參考。研究表明,大陸赴臺(tái)游客旅游熱點(diǎn)AOI呈環(huán)島狀分布;8日游、15日游游客均以臺(tái)北為主要集散地,前者路徑成輻射狀分布,多到訪知名景點(diǎn),小眾景點(diǎn)較少涉及;后者多采用環(huán)島旅行方式,對(duì)臺(tái)灣地區(qū)人文風(fēng)情有更細(xì)致地游覽。

引言

近年來,人們的旅游意愿隨著生活水平的提升日益增強(qiáng),同時(shí)得益于網(wǎng)絡(luò)社交媒體的蓬勃發(fā)展,人們的旅行方式有了極大改變。游客通過平臺(tái)可實(shí)時(shí)發(fā)布自己的旅游見聞,與網(wǎng)友互動(dòng)、討論,并隨之產(chǎn)生了豐富的關(guān)于旅游目的地的信息數(shù)據(jù)。這些由游客編輯生成的數(shù)據(jù)形成了一種新的數(shù)據(jù)類型,用戶生成數(shù)據(jù)(User Generated Content,UGC)。該類數(shù)據(jù)中包含了大量有關(guān)旅游目的地的時(shí)空、情感等信息,有效解決了樣本規(guī)模問題的制約,逐漸成為現(xiàn)階段旅游行為研究的主要數(shù)據(jù)源。

從基于UGC數(shù)據(jù)挖掘游客時(shí)空行為提取旅游行為空間特征的具體研究方法上來看,主要包括旅游熱點(diǎn)提取和軌跡發(fā)現(xiàn)兩個(gè)關(guān)鍵步驟。在旅游熱點(diǎn)提取方面,早期研究多采用核密度分析方法探測城市旅游熱點(diǎn)。該方法能夠有效反映旅游熱點(diǎn)分布的大致趨勢,但無法對(duì)熱點(diǎn)與非熱點(diǎn)區(qū)域進(jìn)行準(zhǔn)確區(qū)分,難以進(jìn)一步研究游客在不同熱點(diǎn)之間的轉(zhuǎn)移路徑。近年來,相關(guān)研究聚焦于使用具有噪聲點(diǎn)濾除特性的DBSCAN聚類算法探測旅游熱點(diǎn)區(qū)域。秦靜、Vu等人分別使用P-DBSCAN識(shí)別北京、香港城市內(nèi)部AOI,探尋游客時(shí)空分布特征,準(zhǔn)確反映了游客在城市內(nèi)部的真實(shí)分布,并進(jìn)一步生成和分析游客流動(dòng)規(guī)律。但不難發(fā)現(xiàn),使用DBSCAN探測旅游熱點(diǎn)區(qū)域需人工指定參數(shù),存在客觀性不足的缺陷。

對(duì)于游客軌跡發(fā)現(xiàn),早期研究多采用問卷調(diào)查或旅游景區(qū)直接統(tǒng)計(jì)等形式進(jìn)行,受制于樣本大小,相關(guān)研究多集中在小尺度(縣區(qū)行政級(jí)別),對(duì)其內(nèi)部旅游流空間分布及游客流動(dòng)規(guī)律進(jìn)行刻畫,未能準(zhǔn)確反映游客在各旅游熱點(diǎn)之間的轉(zhuǎn)移,研究區(qū)域小且代表性不強(qiáng)。而使用UGC大數(shù)據(jù)能夠有效解決樣本制約,精細(xì)刻畫游客流動(dòng)規(guī)律。秦靜等針對(duì)此類現(xiàn)狀使用馬爾科夫鏈對(duì)北京市內(nèi)部游客流動(dòng)軌跡進(jìn)行推演,取得了良好的效果。不可忽視的,此類研究多采用具有地理標(biāo)記的游客照片數(shù)據(jù),對(duì)游客發(fā)布的大量無地理標(biāo)記的文本數(shù)據(jù)利用甚少,其中,如何有效利用文本數(shù)據(jù)成為新的問題。

綜上,針對(duì)以上問題,本文以臺(tái)灣地區(qū)為實(shí)證研究區(qū),選取大陸赴臺(tái)游客為研究對(duì)象,基于游客發(fā)布的行程、游記等文本UGC數(shù)據(jù),引入自適應(yīng)DBSCAN算法自動(dòng)求解閾值,提取旅游熱點(diǎn)區(qū)域,總結(jié)游客旅游趨勢。進(jìn)一步利用社會(huì)網(wǎng)絡(luò)分析法解析各旅游熱點(diǎn)AOI特征,探索臺(tái)灣地區(qū)旅游現(xiàn)狀。本文對(duì)大陸對(duì)臺(tái)開放自由行時(shí)段內(nèi)游客空間行為進(jìn)行研究,總結(jié)游客行為及市場規(guī)律,以期為類似科學(xué)研究及區(qū)域旅游發(fā)展提供思路及方案。

一、研究區(qū)概況及數(shù)據(jù)來源

(一)研究區(qū)概況

臺(tái)灣是我國第一大島,地處中國大陸東南部,屬亞熱帶-熱帶過渡區(qū),氣候宜人。全島山巒綿延,溪谷交錯(cuò),散落大安、墾丁、阿里山等諸多風(fēng)景名勝,自然環(huán)境優(yōu)美,風(fēng)光秀麗。較之于大陸等其他地域,臺(tái)灣島四面環(huán)海,對(duì)外交流相對(duì)繁盛,多元文化在此交融,造就了豐富的旅游資源,吸引了大量游客旅游觀光,極具研究價(jià)值。

(二)數(shù)據(jù)來源及預(yù)處理

本文使用Python爬蟲技術(shù),抓取2011年1月1日-2019年7月31日馬蜂窩、窮游網(wǎng)等旅游門戶網(wǎng)站大陸赴臺(tái)游客行程及游記文本數(shù)據(jù),抓取內(nèi)容包括:文本標(biāo)題、作者、來源地、出行日期、上傳日期、出行時(shí)長、花費(fèi)以及文本內(nèi)容共計(jì)8項(xiàng)信息。

數(shù)據(jù)預(yù)處理主要包括:廣告、營銷、純圖片游記數(shù)據(jù)剔除;同一游客分章游記合并;文本分詞及游覽景點(diǎn)按序提取;景點(diǎn)地理編碼及游客路徑生成4個(gè)步驟。經(jīng)爬蟲抓取和預(yù)處理,本文共計(jì)獲得窮游網(wǎng)行程數(shù)據(jù)3 279篇,馬蜂窩游記文本數(shù)據(jù)14 279篇。

二、研究方法

(一)自適應(yīng)的DBSCAN聚類

DBSCAN是一種典型的基于密度的聚類算法,從數(shù)據(jù)對(duì)象的分布密度出發(fā),通過一組“鄰域”參數(shù)(Eps,MinPts)刻畫樣本分布的緊密程度,具有發(fā)現(xiàn)任意形狀的聚類和有效識(shí)別噪聲點(diǎn)的特性,但DBSCAN算法需人為指定Eps和MinPts參數(shù),存在客觀性不夠、人工成本過高等缺陷。為此本文引入李文杰等人提出的自適應(yīng)的DBSCAN算法,該算法基于參數(shù)尋優(yōu)策略,分析數(shù)據(jù)集自身的分布特性,自動(dòng)求解Eps和MinPts參數(shù),并在實(shí)踐中取得了良好的效果。

(二)社會(huì)網(wǎng)絡(luò)分析法

社會(huì)網(wǎng)絡(luò)分析法是一種基于點(diǎn)、線、復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系的跨學(xué)科研究和思維方法,借助圖論、數(shù)理統(tǒng)計(jì)以及拓?fù)鋵W(xué)等定量研究方法,實(shí)現(xiàn)網(wǎng)絡(luò)內(nèi)部個(gè)體、區(qū)域以及系統(tǒng)結(jié)構(gòu)的整合,廣泛運(yùn)用于經(jīng)濟(jì)學(xué)、心理學(xué)等領(lǐng)域。近年來,該方法正逐步應(yīng)用于游客行為研究、旅游市場分析等領(lǐng)域。本研究引入該方法,構(gòu)建大陸赴臺(tái)游客旅游流空間特征網(wǎng)絡(luò)結(jié)構(gòu),借助Gephi軟件,對(duì)結(jié)果進(jìn)行可視化,用直觀網(wǎng)絡(luò)圖分析各旅游片區(qū)在整體網(wǎng)絡(luò)中的作用及中心地位。

三、結(jié)果分析

本文使用jieba庫對(duì)游客文本數(shù)據(jù)進(jìn)行分詞和詞性標(biāo)注,提取名詞部分,并依賴“臺(tái)灣旅游部門”及網(wǎng)絡(luò)公開景點(diǎn)名稱對(duì)結(jié)果進(jìn)行修正,例如將“故宮”“故宮博物館”“故宮博物院”等修正為“臺(tái)北故宮博物院”,依此建立臺(tái)灣地區(qū)旅游景點(diǎn)庫,通過地理編碼,實(shí)現(xiàn)文本景點(diǎn)數(shù)據(jù)向地理數(shù)據(jù)的轉(zhuǎn)換。經(jīng)提取及編碼,本文共計(jì)獲取景點(diǎn)2 786個(gè),并基于景點(diǎn)的經(jīng)緯度坐標(biāo),使用自適應(yīng)DBSCAN算法求取閾值,進(jìn)行聚類。經(jīng)實(shí)驗(yàn),當(dāng)Eps、MinPts分別為0.069 016 837 967 462 4、19.930 032 292 787 9時(shí),聚類效果最佳,最佳簇?cái)?shù)為18。

從可視化聚類結(jié)果(圖1)不難看出,受臺(tái)灣島中央山脈影響,旅游熱點(diǎn)AOI依附城市,呈環(huán)島狀分布。北部地區(qū)臺(tái)北、桃園、基隆3塊片區(qū)所占比重較大,三者間聯(lián)系緊密且有成片趨勢;南部地區(qū)旅游熱點(diǎn)AOI呈散落狀分布,各AOI之間相距較遠(yuǎn),AOI內(nèi)部點(diǎn)密度高,聯(lián)系緊密;東部海岸地區(qū),如宜蘭、花蓮、北回歸線標(biāo)志公園等,受山脈及臺(tái)灣島斷層海岸地形共同影響,AOI呈現(xiàn)狹長狀態(tài),沿地勢較緩區(qū)域分布;中部地區(qū)則形成了清境農(nóng)場、日月潭景區(qū)、阿里山風(fēng)景區(qū)為主的自然風(fēng)光類小型AOI。進(jìn)一步依據(jù)游客出行時(shí)長規(guī)律,本文選取8日游和15日游為代表,按照景點(diǎn)在游客文本出現(xiàn)的次序,提取并生成游客流動(dòng)軌跡圖。不難看出,8日游、15日游游客均喜好選擇臺(tái)北作為入境點(diǎn),流動(dòng)軌跡以臺(tái)北為中心呈放射狀分布,8日游游客平均到訪景點(diǎn)32個(gè),15日游客平均到訪景點(diǎn)48個(gè)。區(qū)別于8日游,15日游游客流動(dòng)軌跡稠密度高,縱橫交錯(cuò),涉及更多內(nèi)部景點(diǎn)及細(xì)小片區(qū),且有環(huán)島趨勢。

為更深層次地刻畫大陸赴臺(tái)游客空間特征,本文根據(jù)不同片區(qū)之間游客轉(zhuǎn)移數(shù)據(jù)建立矩陣(圖2),引入網(wǎng)絡(luò)分析方法,以聚類所得片區(qū)為節(jié)點(diǎn),節(jié)點(diǎn)間流入、流出游客數(shù)量為邊,采用力引導(dǎo)布局進(jìn)行可視化,對(duì)各片區(qū)之間內(nèi)在關(guān)系進(jìn)行探索。從直觀網(wǎng)絡(luò)圖上來看,8日游(圖3-a)出現(xiàn)單核心狀態(tài),臺(tái)北片區(qū)與花蓮片區(qū)有重疊現(xiàn)象,與桃園、基隆、墾丁和高雄片區(qū)構(gòu)成核心模塊,其余各片區(qū)與之聯(lián)系較為松散,清境農(nóng)場、彰化等小規(guī)模新興旅游片區(qū)聯(lián)系度低;結(jié)合各片區(qū)所處地理位置,充分反映出該類游客旅游觀光目的性強(qiáng),多選擇從旅游城市到旅游城市的游覽方式,對(duì)路徑上所包含的小眾旅游片區(qū)有所省略。區(qū)別于8日游游客,選擇15日游出行方式的游客,旅游觀光時(shí)間充裕,旅行活動(dòng)更為細(xì)致,對(duì)各片區(qū)的游覽也更加全面。圖3-b中,各片區(qū)之間均有聯(lián)系,構(gòu)成了多核心的網(wǎng)狀結(jié)構(gòu),游客對(duì)彰化、宜蘭等小眾旅游區(qū)也有不同程度的到訪。值得注意的是,臺(tái)北與基隆片區(qū)出現(xiàn)重疊現(xiàn)象,筆者認(rèn)為,二者在地理位置上趨近并有片區(qū)融合的趨勢,且片區(qū)內(nèi)部有較多旅游景點(diǎn),有較為充裕的旅游時(shí)間,使游客在以臺(tái)北、基隆片區(qū)構(gòu)成的小區(qū)域內(nèi)開展細(xì)致的旅游活動(dòng),出現(xiàn)頻繁往來的情況。

四、結(jié)論與建議

本文使用Python爬蟲技術(shù)抓取2011-2019年馬蜂窩、窮游網(wǎng)中大陸赴臺(tái)游客游記及行程文本數(shù)據(jù),引入自適應(yīng)DBSCAN探索游客旅游熱點(diǎn),并使用社會(huì)網(wǎng)絡(luò)分析法對(duì)8日游、15日游兩種旅行方式的游客流動(dòng)情況進(jìn)行了分析。結(jié)果顯示,大陸赴臺(tái)游客AOI片區(qū)在臺(tái)灣地區(qū)呈環(huán)島狀分布,人文類、自然風(fēng)景類AOI交雜。北部區(qū)域(臺(tái)北、桃園、基?。┯芯d延成片趨勢,南部區(qū)域則較為松散。大陸赴臺(tái)游客旅游流呈現(xiàn)以臺(tái)北片區(qū)為中心,放射狀分布,且有環(huán)島趨勢。8日游旅行模式中,游客旅游針對(duì)性更強(qiáng),表現(xiàn)為臺(tái)北、花蓮、基隆、墾丁、桃園、高雄六片區(qū)的直接流動(dòng)。15日游旅行模式中,臺(tái)北片區(qū)中心度雖有所下降但依舊處于核心位置,與基隆片區(qū)形成融合態(tài)勢,其余片區(qū)間游客流動(dòng)量增大;綠島片區(qū)在網(wǎng)絡(luò)中的地位上升,其余片區(qū)中心度僅有小幅增減。不難看出,游客在旅行時(shí)間充裕的情況下,對(duì)臺(tái)灣地區(qū)進(jìn)行更為細(xì)致地觀光游覽,對(duì)離島區(qū)域也展現(xiàn)出濃厚的興趣。

綜上,臺(tái)灣旅游部門應(yīng)加大對(duì)臺(tái)北片區(qū)內(nèi)部交通、文旅等基礎(chǔ)設(shè)施建設(shè),做好游客入境、集散等基礎(chǔ)服務(wù)工作;同時(shí),建設(shè)臺(tái)北、基隆、桃園區(qū)域級(jí)游覽區(qū),充分協(xié)調(diào)周邊資源,實(shí)現(xiàn)優(yōu)勢互補(bǔ)、市場互動(dòng);進(jìn)一步提升宜蘭、彰化、清境農(nóng)場、綠島等小眾旅游片區(qū)知名度、吸引力,為游客提供更為豐富的旅行體驗(yàn)。

(作者單位:1.福州大學(xué)數(shù)字中國研究院(福建);

2.福建工程學(xué)院信息科學(xué)與工程學(xué)院)

猜你喜歡
景點(diǎn)熱點(diǎn)片區(qū)
熱點(diǎn)
展望臨港新片區(qū)金融改革與創(chuàng)新
白塔寺片區(qū)地圖
熱點(diǎn)
打卡名校景點(diǎn)——那些必去朝圣的大學(xué)景點(diǎn)
結(jié)合熱點(diǎn)做演講
英格蘭十大怪異景點(diǎn)
沒有景點(diǎn) 只是生活
成武县| 墨玉县| 大竹县| 称多县| 灵丘县| 民乐县| 西青区| 宁明县| 三门县| 裕民县| 泸溪县| 垣曲县| 萨嘎县| 屏边| 黑山县| 巩义市| 新宁县| 普定县| 富平县| 台南县| 泉州市| 册亨县| 洛川县| 米泉市| 台中县| 林芝县| 理塘县| 汉寿县| 罗源县| 霍林郭勒市| 钟祥市| 沈阳市| 米脂县| 安丘市| 滦南县| 崇仁县| 平陆县| 进贤县| 宜都市| 嵊州市| 宜春市|