国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)技術(shù)的游客分析系統(tǒng)

2016-08-18 18:51:15鄭邦峰高飛鄭源杰
電腦知識與技術(shù) 2016年19期
關(guān)鍵詞:位置旅客大數(shù)據(jù)

鄭邦峰++高飛++鄭源杰

摘要:游客分析系統(tǒng)主要是通過采集手機信令數(shù)據(jù),并對該數(shù)據(jù)進行數(shù)據(jù)建模分析,針對海南省旅游特點將有用的數(shù)據(jù)內(nèi)容進行提取和匯總,根據(jù)手機實時位置信息有效分析出游客出行行為,實時反應(yīng)海南省旅游熱點旅客位置分布、來源地分布、出行動向、駐留信息、游客密度、團散信息、國際游客信息等。

關(guān)鍵詞: 大數(shù)據(jù);旅客;分析;位置

中圖分類號:TP311 文獻標(biāo)識碼:A 文章編號:1009-3044(2016)19-0014-02

Visitor Analysis System Based On Big Data Technology

ZHENG Bang-feng, GAO Fei, ZHENG Yuan-jie

(China Mobile Communication Group Hainan Co.,Ltd,Haikou 570125,China)

Abstract:Visitors analysis system is mainly through the acquisition of cellular signaling data, and the data of data modeling analysis, extract and summarize to the Hainan provincial tourism characteristics will be useful data. According to the real-time location information of the mobile phone effectively analyze the tourists travel behavior, real-time response in Hainan Province tourist hot spot passenger position distribution, source distribution, travel trends, information resides, visitor density, group scattered information, international visitors information etc.

Key words: big data; visitors; analysis; position

隨著海南旅游的迅速發(fā)展,大量的散客成為了旅游的主導(dǎo),傳統(tǒng)觀光游的項目比例日益減少。我國目前旅游行政法規(guī)及行業(yè)運營模式和管理均是建立在旅行社為主體的傳統(tǒng)觀光游基礎(chǔ)上的。

面對這種團散比變化的現(xiàn)狀,在新型旅游業(yè)態(tài)下, 當(dāng)前旅游行業(yè)迫切需要一套相對準(zhǔn)確、能夠?qū)崟r統(tǒng)計旅游信息的系統(tǒng),為旅游管理部門的分析決策、政策規(guī)劃提供輔助,為景區(qū)景點的客流量監(jiān)控、疏導(dǎo),游客駐留分析提供信息化手段,為旅行社、酒店分析游客來源地信息,規(guī)劃旅游線路提供可靠依據(jù)。

海南移動挖掘自身網(wǎng)絡(luò)數(shù)據(jù)資源,通過對海南移動Mc口(A接口+Iucs接口)信令數(shù)據(jù)的采集解析、建模分析、數(shù)據(jù)挖掘等,建設(shè)游客分析系統(tǒng)。

1 系統(tǒng)主要功能模塊

“全省游客數(shù)據(jù)及分布”模塊:該模塊以旅游目的地為基點,對全省實時和查詢時段內(nèi)游客的總量和在各市縣行政區(qū)域內(nèi)的分布狀況進行呈現(xiàn)和展示,為旅游管理部門精確掌握游客在各個目的地分布情況及變化趨勢提供有效參考。

“客源地分析”模塊:對游客的來源地信息進行統(tǒng)計分析,直觀分析出各省游客的比例情況,可以細分至地市層級,同時可按各省及重點地市分析,可包括港澳臺游客或外國游客。精確掌握客源分布情況,為旅游推廣、宣傳提供數(shù)據(jù)支撐。

“游客到達方式”模塊:根據(jù)游客初次“接入”海南移動網(wǎng)絡(luò)的具體基站位置,判斷游客是從機場、港口還是火車站抵達,進而對游客到達方式作出實時統(tǒng)計。

“游客駐留時長統(tǒng)計”模塊:分析統(tǒng)計游客在海南的駐留時間,按照駐留天數(shù)1天、2天、3天、4天及以上的時長進行分類統(tǒng)計,通過游客駐留的時間可以反映出各省份游客的旅游習(xí)慣,可以為精準(zhǔn)營銷提供相應(yīng)支撐。

“旅游線路分析”模塊:識別和采集各線路游客移動軌跡信息,挖掘頻繁和熱門的游覽線路,分析出游覽的熱點線路信息,可以得出不同各類型游客在旅游目的地的游覽線路選擇結(jié)果,并找到熱門線路等。

2 系統(tǒng)架構(gòu)

游客分析系統(tǒng)分為數(shù)據(jù)采集層、數(shù)據(jù)挖掘?qū)印?yīng)用層3個層級。其中數(shù)據(jù)采集層為最底層,主要采集海南移動Mc口信令數(shù)據(jù)。數(shù)據(jù)挖掘?qū)訛橹虚g層,對底層接入上來的數(shù)據(jù)完成數(shù)據(jù)清洗、轉(zhuǎn)換、壓縮、數(shù)據(jù)建模、存儲等工作。應(yīng)用層為最上層,實現(xiàn)相關(guān)部門的各種應(yīng)用。

數(shù)據(jù)采集層:負責(zé)系統(tǒng)與外部的一切數(shù)據(jù)交換業(yè)務(wù),包括與各種外部系統(tǒng)的數(shù)據(jù)交互適配,以及將來可能擴展到的其他數(shù)據(jù)來源的支持,都在本層做統(tǒng)一的規(guī)劃與實現(xiàn)。

數(shù)據(jù)挖掘?qū)樱罕緦訉崿F(xiàn)數(shù)據(jù)的統(tǒng)一管理、分析、預(yù)處理功能,使得數(shù)據(jù)支持通用的上層行業(yè)應(yīng)用。負責(zé)對獲取的信令數(shù)據(jù)進行清洗、入庫,形成上層應(yīng)用所需的各種數(shù)據(jù),并且能夠根據(jù)不同的模塊調(diào)用,計算出不同的分析成果。

應(yīng)用層:基于B/S架構(gòu),靈活的功能模塊部署機制,每個模塊都可以基于數(shù)據(jù)挖掘?qū)铀芴峁┑臄?shù)據(jù)靈活擴展。

3 基于大數(shù)據(jù)的游客行為計算和建模技術(shù)

3.1基于移動信令的協(xié)同定位技術(shù)

為了解決傳統(tǒng)無線定位技術(shù)中定位精度不高的問題,利用不同移動臺之間的協(xié)同通信對目標(biāo)移動臺進行協(xié)同定位,并利用非線性最優(yōu)化理論解決移動臺協(xié)同定位問題,將該問題轉(zhuǎn)化為線性最小二乘問題,最終利用Gauss-Newton算法估計目標(biāo)移動臺的位置。

3.1.1 移動網(wǎng)絡(luò)覆蓋與覆蓋場景匹配技術(shù)

為了保證為移動用戶提供連續(xù)的移動通信服務(wù),移動網(wǎng)絡(luò)信號需要覆蓋到城市空間上每一片區(qū)域,減少盲區(qū),而為了以最小的成本為更多用戶提供服務(wù),移動通信網(wǎng)絡(luò)覆蓋邏輯上被設(shè)計成由若干正六邊形的基站小區(qū)相互鄰接而構(gòu)成的面狀服務(wù)區(qū)。移動用戶總是會定期或不定期地主動或被動地和其中一個基站小區(qū)保持聯(lián)系。

覆蓋場景與移動蜂窩網(wǎng)絡(luò)中基站小區(qū),在空間分布上有規(guī)則地對應(yīng)著。因此,只要建立特定的匹配規(guī)則,處理好一對多、多對多、多對一的關(guān)系,就能根據(jù)移動用戶在移動蜂窩網(wǎng)絡(luò)中的出行情況,推斷出移動用戶在不同區(qū)域間的出行情況。

3.1.2 基于手機數(shù)據(jù)的出行鏈分析技術(shù)

利用時間序列的手機數(shù)據(jù)及移動網(wǎng)絡(luò)覆蓋與不同覆蓋場景區(qū)域的匹配關(guān)系,判斷移動用戶在各個區(qū)域的進、出、駐留情況,能夠直接分析得到各個移動用戶的出行鏈信息。

3.1.3 手機用戶空間分布及密度分析技術(shù)

利用對所有手機用戶時間序列手機數(shù)據(jù)的出行鏈分析成果,判斷每位手機用戶在各個統(tǒng)計時間段分別所處的空間位置區(qū)域,進而統(tǒng)計不同時間段各個空間位置區(qū)域內(nèi)手機用戶數(shù)量,并逐級擴樣至群體,統(tǒng)計當(dāng)前時間各個空間位置區(qū)域內(nèi)的人員數(shù)量,并計算當(dāng)前時間段內(nèi)各個空間位置區(qū)域內(nèi)對應(yīng)的人員密度。

3.1.4 手機用戶居住地、工作地識別技術(shù)

基于多天手機數(shù)據(jù)分析得到的手機用戶多天出行鏈信息,結(jié)合手機用戶作息時間規(guī)律,如夜間休息,白天工作,識別各個手機用戶的居住地區(qū)域及工作地區(qū)域。

3.1.5 通勤出行行為分析技術(shù)

利用長期歷史數(shù)據(jù),分析得到手機用戶居住地區(qū)域和工作地區(qū)域,并根據(jù)出現(xiàn)頻率和出行頻率,判斷居住地區(qū)域單一且工作地區(qū)域也單一的手機用戶群體是否具有通勤出行行為。

3.2數(shù)據(jù)挖掘與建模技術(shù)

3.2.1 團散客識別模型

模型目的:識別團隊游客和散客。

模型算法:團客通常有固定和相同的游覽線路。在游客識別和瀏覽線路識別基礎(chǔ)上,結(jié)合基于密度的搜索聚類方法DBNS算法和基于樣本學(xué)習(xí)的加權(quán)多點重合度算法MSOWL,通過進入和離開每一個景點的時間趨同性、人群規(guī)模識別團客和散客。

3.2.2 人群分類模型

模型目的:識別當(dāng)?shù)刈?,過路人群、工作人員以及真正游客。

模型算法:TWO STEP聚類算法結(jié)合業(yè)務(wù)規(guī)則的方法,對人群進行分類。

3.2.3 游覽線路挖掘模型

模型目的:識別和采集景點游覽線路,挖掘頻繁和熱門的游覽線路。

模式算法:采用改進的基于有向圖的GSP數(shù)據(jù)挖掘算法,挖掘頻繁游覽線路。

3.3 關(guān)鍵算法

基于密度的搜索聚類算法DBNS(Density-based Neighborhood Search Method)和基于樣本學(xué)習(xí)的加權(quán)多點重合度算法MSOWL(multiple-spot overlap ratio computing with weighting Based on Sample Learning)為針對智慧旅游所研發(fā)的特有算法。算法過程如下:

(1)第一個景點進入時間每分鐘是一個間隔,統(tǒng)計每個間隔上的人數(shù)。

(2)每5分鐘為一個進入時間中心點搜索區(qū)間,區(qū)間內(nèi)人數(shù)最多的對應(yīng)的分鐘為中心點(必須滿足10人以上,如不滿足,時間窗口往后平移一分鐘)。

(3)對中心點,搜索前后兩分鐘內(nèi)進入人群,并標(biāo)記為已搜索人群和已搜索區(qū)間;中心點前超過2分鐘如果人數(shù)大于10,也標(biāo)識為未搜索。

(4)對搜索人群觀察最后一個景點離開時間每分鐘的分布人數(shù),每5分鐘為一個中心點搜索區(qū)間,從第一個時間點開始,找到人數(shù)最多的點(必須滿足10人以上,如不滿足,時間窗口往后平移一分鐘),搜索前后兩分鐘內(nèi)的人群,這些人群標(biāo)識為同一批團客。中心點前超過2分鐘如果人數(shù)大于10,為離開時間比他們早的另一批團客。

(5)對未搜索離開時間的區(qū)間,進行下一個中心點的搜索,按同樣的方法找到下一批團客。

(6)未搜索進入?yún)^(qū)間的下一個區(qū)間的搜索,重復(fù)2-5的過程;中心點前超過2分鐘未搜索區(qū)間,不用尋找中心點,直接為一批人群。

(7)直到進入?yún)^(qū)間全部搜索完畢。

4 結(jié)束語

游客分析系統(tǒng)的客戶包括海南省旅游委、市縣旅游局、景區(qū)景點及旅游行業(yè)企業(yè),運用系統(tǒng)“客源地分析功能”,準(zhǔn)確掌握了國內(nèi)及國際游客客源地情況,在國內(nèi)、國際市場展開精準(zhǔn)營銷。由于有了實時、科學(xué)的數(shù)據(jù)支撐,旅游廣告布放、接待網(wǎng)點規(guī)劃都比以往更加有效。

(1)省旅游委行業(yè)監(jiān)管處運用系統(tǒng)的“團散客”分析功能,實時跟蹤旅游團的行程軌跡,對旅行社、導(dǎo)游進行監(jiān)管,避免黑景點以及黑消費點對游客滿意度的影響。

(2)省旅游委行業(yè)監(jiān)管處運用系統(tǒng)的“景區(qū)游客數(shù)量統(tǒng)計”功能,對黃金周海南主要景區(qū)景點游客數(shù)量進行實時統(tǒng)計匯總,制定景區(qū)人流量控制應(yīng)急預(yù)案,通過“信息發(fā)布”、“LED大屏公告”等手段對游客的游覽計劃進行合理的引導(dǎo)。

(3)省旅游委旅游資源開發(fā)出運用系統(tǒng)的“旅游線路分析”功能,開發(fā)新的熱點旅游線路。

參考文獻:

[1] 謝邦昌.數(shù)據(jù)挖掘Clementine應(yīng)用實務(wù)[M].北京:機械工業(yè)出版社, 2008:516.

[2] (美) Anand Rajaraman,Jeffrey David Ullman,王斌.大數(shù)據(jù):互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理[M]. 北京:人民郵電出版社,2012:258.

猜你喜歡
位置旅客大數(shù)據(jù)
非常旅客意見簿
我是人
故事大王(2018年3期)2018-05-03 09:55:52
互聯(lián)網(wǎng)環(huán)境下傳統(tǒng)媒體的場域變遷和“感應(yīng)”
中國廣播(2016年11期)2016-12-26 10:07:06
試論日語方位詞“橫”、 “隣”、“そば”、 “わき”、“かたわら”的區(qū)別
科技視界(2016年26期)2016-12-17 21:38:08
試論黃格勝山水畫作品之“留白”的理解和運用
中國喜劇類電影海報標(biāo)題文字設(shè)計研究
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
給小旅客的禮物
空中之家(2016年1期)2016-05-17 04:47:43
金旅客車
新西部(2009年9期)2009-10-27 10:22:14
丰顺县| 衢州市| 镇平县| 珠海市| 宝山区| 宜川县| 浦北县| 大化| 元谋县| 永康市| 仁布县| 沛县| 江安县| 永德县| 托克逊县| 汝州市| 潮州市| 鲁甸县| 聂荣县| 威远县| 镇巴县| 玛多县| 湘潭县| 永安市| 秀山| 涟源市| 浦江县| 尖扎县| 东兰县| 晋城| 黔江区| 黑山县| 南溪县| 霍林郭勒市| 丹东市| 益阳市| 海晏县| 杭州市| 都昌县| 抚州市| 宁化县|