姜攀
摘 要: 為了解決傳統(tǒng)PDA旅游導(dǎo)航系統(tǒng)存在旅游路線規(guī)劃不完善、導(dǎo)航功能差和響應(yīng)時(shí)間長的問題,設(shè)計(jì)基于數(shù)據(jù)挖掘的智能旅游導(dǎo)航系統(tǒng)。設(shè)計(jì)系統(tǒng)的總體結(jié)構(gòu)包括旅游信息智能推薦模塊、旅游行程規(guī)劃模塊、旅游信息資源庫以及數(shù)據(jù)挖掘處理模塊,系統(tǒng)中的旅游行程規(guī)劃模塊可根據(jù)游客自身需求,制定令游客滿意的旅游線路;系統(tǒng)中的數(shù)據(jù)挖掘模塊通過六大空間數(shù)據(jù)挖掘流程,深度挖掘游客感興趣的旅游信息,加快旅游數(shù)據(jù)挖掘速率。給出系統(tǒng)的功能結(jié)構(gòu),并基于旅游多維數(shù)據(jù)的數(shù)據(jù)集特性挖掘的實(shí)現(xiàn),挖掘出處于不同區(qū)域的旅游數(shù)據(jù),基于旅游危險(xiǎn)求助模塊的實(shí)現(xiàn),規(guī)避旅游導(dǎo)航過程中的危險(xiǎn)情況,得到智能旅游導(dǎo)航結(jié)果。實(shí)驗(yàn)結(jié)果說明所設(shè)計(jì)系統(tǒng)旅游路線規(guī)劃完善、導(dǎo)航性能強(qiáng)、響應(yīng)效率高。
關(guān)鍵詞: 數(shù)據(jù)挖掘; 智能旅游; 導(dǎo)航系統(tǒng); 旅游線路; 挖掘精度; 模塊設(shè)計(jì)
中圖分類號(hào): TN99?34; TP393 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)07?0147?05
Research on intelligent tourism navigation system based on data mining
JIANG Pan
(School of Information Engineering, Wuhan Business University, Wuhan 430056, China)
Abstract: In order to eliminate the problems of imperfect tourism route planning, poor navigation function and long response time exiting in traditional PDA tourism navigation system, an intelligent tourism navigation system based on data mining was designed. The overall structure of the system includes the intelligent recommendation module of tourism information, itinerary planning module, tourism information resource database and data mining processing module. The itinerary planning module of the system can formulate the tourism route satisfying the tourist according to the requirements of tourists. The data mining module of the system can deeply mine the tourism information interested by tourists through six?space data mining process, and accelerate the mining rate of tourism data. The functional structure of the system is given. The implementation of data set characteristic mining based on multidimensional tourism data can mine the tourism data of different regions. The implementation of the tourism risk rescue module can avoid the dangerous situation in the process of tourism navigation. The result of intelligent tourism navigation is obtained. The experimental results show that the designed system has perfect tourism route planning, strong navigation performance and high response efficiency.
Keywords: data mining; intelligent tourism; navigation system; tourism route; mining accuracy; module design
隨著城市智能旅游的發(fā)展日益增強(qiáng),旅游導(dǎo)航系統(tǒng)和旅游資源需求也越來越迫切。旅游業(yè)的發(fā)展能夠帶動(dòng)區(qū)域經(jīng)濟(jì)的高速增長,將不同區(qū)域的旅游資源進(jìn)行整合,為游客提供個(gè)人化、特色化的服務(wù),讓游客在短時(shí)間內(nèi)得到自己想要的旅游信息,并利用數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)挖掘[1]?;跀?shù)據(jù)挖掘的智能旅游導(dǎo)航系統(tǒng)能實(shí)現(xiàn)游客的旅游需求,傳統(tǒng)的PDA旅游導(dǎo)航系統(tǒng)存在旅游路線規(guī)劃不完善、導(dǎo)航功能差和響應(yīng)時(shí)間長的問題。因此,本文設(shè)計(jì)基于數(shù)據(jù)挖掘的智能旅游導(dǎo)航系統(tǒng),能夠完善旅游路線規(guī)劃,減少系統(tǒng)響應(yīng)時(shí)間,實(shí)現(xiàn)智能旅游導(dǎo)航。
1 基于數(shù)據(jù)挖掘的智能旅游導(dǎo)航系統(tǒng)設(shè)計(jì)
1.1 系統(tǒng)總體框架設(shè)計(jì)
本文設(shè)計(jì)的基于數(shù)據(jù)挖掘的智能旅游導(dǎo)航系統(tǒng)是在Java,Servlet和數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)上,建立的以瀏覽器/服務(wù)器為核心的基于數(shù)據(jù)挖掘的智能旅游導(dǎo)航系統(tǒng)。本文系統(tǒng)采用J2EE結(jié)構(gòu),包括邏輯結(jié)構(gòu)、表達(dá)結(jié)構(gòu)和數(shù)據(jù)庫。系統(tǒng)按照用戶接口處理分為旅游信息智能推薦模塊、旅游行程規(guī)劃模塊、旅游信息資源庫和數(shù)據(jù)挖掘處理模塊。游客進(jìn)入系統(tǒng)網(wǎng)站后,旅游信息智能推薦模塊根據(jù)游客的歷史瀏覽記錄為游客提供接近喜好的個(gè)性化界面。游客輸入旅游信息的關(guān)鍵字后,旅游信息智能推薦模塊對關(guān)鍵字進(jìn)行數(shù)據(jù)分析[2],將分析結(jié)果導(dǎo)入到旅游行程規(guī)劃模塊獲取規(guī)劃的旅游行程結(jié)果,實(shí)現(xiàn)旅游信息的數(shù)據(jù)挖掘,得到最終的導(dǎo)航結(jié)果,將系統(tǒng)的導(dǎo)航結(jié)果反饋給游客,實(shí)現(xiàn)系統(tǒng)的智能旅游導(dǎo)航功能。在旅游途中可能出現(xiàn)突發(fā)危險(xiǎn),旅游危險(xiǎn)求助模塊可提前預(yù)警突發(fā)狀況,讓游客提早防范[3]。系統(tǒng)各模塊間相互依賴、相互影響獲得滿足游客旅游需求的導(dǎo)航結(jié)果。系統(tǒng)總體框架如圖1所示。
1.2 旅游行程規(guī)劃模塊設(shè)計(jì)
本文系統(tǒng)中旅游行程規(guī)劃模塊實(shí)現(xiàn)功能有:基于旅游目的地?cái)?shù)據(jù)庫、旅游企業(yè)和旅游產(chǎn)品數(shù)據(jù)庫,按照游客的個(gè)人喜好、市場環(huán)境進(jìn)行數(shù)據(jù)挖掘和信息分類的結(jié)果。根據(jù)游客的目的地、出發(fā)地和預(yù)算等條件制定符合游客預(yù)期要求的旅游路線規(guī)劃[4]。旅游行程規(guī)劃模塊按結(jié)構(gòu)可分為數(shù)據(jù)層、服務(wù)層和表示層。
數(shù)據(jù)層包括的內(nèi)容有:游客的信息、旅游景點(diǎn)信息和旅行線路信息等,通過Oracle軟件建立可查詢路線的地圖數(shù)據(jù)庫;根據(jù)游客的行程規(guī)劃結(jié)果對其中的業(yè)務(wù)操作數(shù)據(jù)進(jìn)行邏輯上的識(shí)別和組織,業(yè)務(wù)操作內(nèi)容包括數(shù)據(jù)的輸入和編輯、空間資料的查詢分析和數(shù)據(jù)輸出,將得到的邏輯結(jié)果傳輸給游客,屬于服務(wù)層的內(nèi)容;表示層能夠根據(jù)游客不同的接受能力提供專屬的旅游服務(wù)[5]。智能處理模塊利用Apriori算法可初步對旅游數(shù)據(jù)進(jìn)行關(guān)聯(lián)挖掘,對挖掘的結(jié)果歸納整合,能夠?qū)β糜尉€路的規(guī)劃起到很好的補(bǔ)充作用。旅游行程規(guī)劃模塊設(shè)計(jì)流程如圖2所示。
圖2中,游客進(jìn)行旅游行程規(guī)劃時(shí),系統(tǒng)先對旅游行程規(guī)劃模塊進(jìn)行調(diào)用,在行程規(guī)劃表上填寫各種需求信息,基于旅游目的地?cái)?shù)據(jù)庫對游客需求進(jìn)行初步檢索,得到初步規(guī)劃結(jié)果,再通過調(diào)用智能模塊處理對初步規(guī)劃結(jié)果進(jìn)一步處理得到最終的旅游行程規(guī)劃結(jié)果,結(jié)束進(jìn)程。旅游行程規(guī)劃模塊根據(jù)游客的需求和智能模塊的共同作用,得到令游客滿意的旅游路線。
1.3 數(shù)據(jù)挖掘處理模塊設(shè)計(jì)
圖3為系統(tǒng)中數(shù)據(jù)挖掘處理模塊中的空間數(shù)據(jù)挖掘流程圖??臻g數(shù)據(jù)挖掘?qū)儆跀?shù)據(jù)挖掘的一種形式,是指從空間數(shù)據(jù)庫中篩選出一些能引起使用者興趣的空間模式或特征,以及隱藏在數(shù)據(jù)信息中的普遍數(shù)據(jù)??臻g數(shù)據(jù)挖掘的基本過程可分為六個(gè)步驟:數(shù)據(jù)選取,挖掘感興趣的對象及其屬性的關(guān)聯(lián)數(shù)據(jù);預(yù)處理,對不完整的數(shù)據(jù)進(jìn)行篩選的處理;數(shù)據(jù)轉(zhuǎn)換,對預(yù)處理產(chǎn)生的結(jié)果經(jīng)過數(shù)學(xué)轉(zhuǎn)換得到感興趣對象的特點(diǎn),經(jīng)過數(shù)學(xué)轉(zhuǎn)換可減少運(yùn)算步驟且轉(zhuǎn)換結(jié)果易于處理;數(shù)據(jù)挖掘,是空間數(shù)據(jù)挖掘的關(guān)鍵,對轉(zhuǎn)換結(jié)果進(jìn)行挖掘,獲得優(yōu)秀的數(shù)據(jù);模式的解釋和知識(shí)評估[6],通過計(jì)算支持度、置信度等對挖掘的數(shù)據(jù)進(jìn)行篩選,但最終結(jié)果還需要人判斷。本文系統(tǒng)設(shè)計(jì)的空間數(shù)據(jù)挖掘可深度挖掘游客感興趣的旅游信息,減少運(yùn)算步驟,加快旅游數(shù)據(jù)挖掘速率。
2 數(shù)據(jù)挖掘的智能旅游導(dǎo)航系統(tǒng)實(shí)現(xiàn)
2.1 功能實(shí)現(xiàn)
本文系統(tǒng)以游客為出發(fā)點(diǎn),具有旅游導(dǎo)航、酒店預(yù)定、交通設(shè)施、論壇發(fā)布、美食推薦等功能。具體本文系統(tǒng)實(shí)現(xiàn)的功能如圖4所示。系統(tǒng)服務(wù)的對象主要有游客、旅行社和政府部門,對游客來講可以根據(jù)自身的需求如時(shí)間、出行方式和資金范圍等做出線路選擇,也可以根據(jù)本系統(tǒng)發(fā)布的旅行社的旅行線路、交通和住宿條件等從中考慮。對于政府部門和旅行社,可以通過本系統(tǒng)加強(qiáng)旅游宣傳,讓游客了解當(dāng)?shù)氐娘L(fēng)景名勝,促進(jìn)旅游業(yè)的蓬勃發(fā)展[7],為旅游業(yè)的開發(fā)和管理提供依據(jù)。
由圖4可以看出系統(tǒng)可提供景區(qū)周邊地圖,也可給出推薦旅游路線,對酒店的預(yù)定可選擇景點(diǎn)附近的區(qū)域,選擇人數(shù)和價(jià)格都合適的酒店房間,打開導(dǎo)航系統(tǒng)可知附近有哪些地鐵及公交線路方便交通出行,用戶可以在系統(tǒng)的論壇上發(fā)布自己在旅行中的感想和發(fā)帖詢問一些旅游問題,美食推薦能夠引導(dǎo)游客品味當(dāng)?shù)氐淖涛?,發(fā)現(xiàn)新的味蕾。
2.2 旅游多維數(shù)據(jù)的數(shù)據(jù)集特性挖掘
假設(shè)系統(tǒng)中的旅游數(shù)據(jù)分布在多維的子空間中,處于同一空間的兩組旅游數(shù)據(jù)間的關(guān)聯(lián)程度越大,旅游數(shù)據(jù)的相關(guān)性就越強(qiáng)。對處于同一空間的旅游數(shù)據(jù)區(qū)分采用旅行數(shù)據(jù)樣本的關(guān)聯(lián)度來制作挖掘規(guī)則,當(dāng)旅游數(shù)據(jù)處于不同空間,根據(jù)子空間進(jìn)行關(guān)聯(lián)度確認(rèn)[8],進(jìn)而制作挖掘規(guī)則。
設(shè)置系統(tǒng)中旅游數(shù)據(jù)子空間的維度為[d,]先挖掘分布在不同空間的數(shù)據(jù)集,用[M]表示子空間矩陣,子空間矩陣[M]表示為:
假設(shè)兩個(gè)處于不同子空間[Mi(i≤d)]和[Mk(k≤d)]的旅游數(shù)據(jù)集為[Vi]和[Vk,][D(i,k)]表示兩個(gè)數(shù)據(jù)集的歐幾里得距離,因此,得出處于不同子空間的數(shù)據(jù)集的挖掘公式為:
式中:[σ]表示挖掘因子;[P(Vi)]和[P(Vk)]分別表示數(shù)據(jù)集[Vi]和[Vk]的挖掘頻率。
同一子空間的不同旅游數(shù)據(jù)集的挖掘,可用數(shù)據(jù)集的關(guān)聯(lián)度區(qū)分。根據(jù)式(1),式(2)求得[K1]和[K2,]根據(jù)[K1,][K2]求得同一空間數(shù)據(jù)集的關(guān)聯(lián)因子:
由式(3)得到旅游數(shù)據(jù)集的關(guān)聯(lián)因子[g(i,k)],進(jìn)而得到處于同一子空間下的數(shù)據(jù)集的挖掘公式為:
設(shè)[T(V)]為空間[Mi]中旅游數(shù)據(jù)集的關(guān)聯(lián)程度限定值,當(dāng)關(guān)聯(lián)因子[g(i,k)]的值大于[T(V)]時(shí),說明數(shù)據(jù)集的關(guān)聯(lián)性較強(qiáng),旅游數(shù)據(jù)集的區(qū)分公式可表示為:
反之,當(dāng)關(guān)聯(lián)因子[g(i,k)]的值小于[T(V)]時(shí),關(guān)聯(lián)性較弱,則區(qū)分公式分別為:
采用概率估算計(jì)算旅游數(shù)據(jù)挖掘頻率,概率估算公式為:
挖掘因子用[λ]表示,在0~1之間,[ζ]表示預(yù)期挖掘概率與實(shí)際挖掘情況之間的相對誤差[9],則提高旅游數(shù)據(jù)挖掘精度后的表達(dá)式為:
上述分析過程根據(jù)旅游多維數(shù)據(jù)的數(shù)據(jù)集特性挖掘?qū)μ幱诓煌涌臻g的旅游數(shù)據(jù)進(jìn)行挖掘,得到關(guān)聯(lián)度小的旅游數(shù)據(jù)挖掘方法,可挖掘出不同地域的旅游數(shù)據(jù),概率估算和挖掘因子的引入提高了旅游數(shù)據(jù)的挖掘精度。
2.3 旅游危險(xiǎn)求助模塊的實(shí)現(xiàn)
系統(tǒng)中的旅游危險(xiǎn)求助模塊為求救信號(hào)提供相應(yīng)支持,游客使用各種移動(dòng)終端設(shè)備向系統(tǒng)服務(wù)中心發(fā)出求救信號(hào),系統(tǒng)對求救信號(hào)分類,根據(jù)事件的緊急程度和受傷害情況分為一般情況、緊急情況和危險(xiǎn)情況三種等級。圖5是旅游救援流程圖,一般情況的救援主要采取對游客發(fā)送救援導(dǎo)航地圖或與當(dāng)?shù)芈?lián)系進(jìn)行聯(lián)合救援[10];緊急情況甚至危險(xiǎn)情況下,會(huì)將求救信號(hào)發(fā)送給醫(yī)院、消防救援等部門,給出專業(yè)的救助;發(fā)生大型自然災(zāi)害時(shí)應(yīng)向其他游客發(fā)出警告信息,避開危險(xiǎn)地帶。
3 實(shí)驗(yàn)分析
3.1 系統(tǒng)導(dǎo)航性能測試
本文系統(tǒng)導(dǎo)航功能主要對游客的“吃”、“購”、“娛”、“游”、“住”方面進(jìn)行導(dǎo)航。一種方式是名稱導(dǎo)航。根據(jù)搜索內(nèi)容,系統(tǒng)給出導(dǎo)航結(jié)果,為游客提供相關(guān)信息。如圖6所示是按名稱本文系統(tǒng)的導(dǎo)航檢索結(jié)果。圖6以西安城墻為例,用戶采用本文系統(tǒng)進(jìn)行檢索,由檢索結(jié)果可以看出輸入西安城墻,界面會(huì)顯示具體的門票價(jià)格、可停留時(shí)間和景點(diǎn)具體的信息介紹。還可對周邊的賓館、小吃等進(jìn)行搜索,根據(jù)搜索類型不同得到不同的導(dǎo)航結(jié)果,說明本文系統(tǒng)的導(dǎo)航能力加強(qiáng)。
游客還可根據(jù)專家推薦進(jìn)行旅游信息導(dǎo)航,游客將自己可接受的價(jià)格區(qū)間、游玩時(shí)間、住宿要求等信息輸入界面,對游客的綜合要求分析整理、制定符合游客需求的旅游方案。圖7是本文導(dǎo)航系統(tǒng)的專家推薦頁面。
從圖6,圖7可以看出,本文系統(tǒng)通過名稱導(dǎo)航結(jié)果和專家推薦的結(jié)果能夠?qū)τ慰偷男枨蠼o出詳盡的旅游規(guī)劃,包括對景點(diǎn)的歷史進(jìn)行詳細(xì)介紹。游客輸入關(guān)鍵信息,專家根據(jù)旅游資源庫的數(shù)據(jù)為游客制定住宿、景點(diǎn)游覽計(jì)劃和餐飲選擇等。
3.2 系統(tǒng)響應(yīng)時(shí)間測試
系統(tǒng)的響應(yīng)時(shí)間是從游客發(fā)出需求到系統(tǒng)做出響應(yīng)的過程花費(fèi)的時(shí)間。系統(tǒng)響應(yīng)時(shí)間測試應(yīng)在數(shù)據(jù)負(fù)載壓力最大期間,測試系統(tǒng)執(zhí)行任務(wù)的平均響應(yīng)時(shí)間如圖8所示。
由圖8可得,傳統(tǒng)系統(tǒng)和本文系統(tǒng)的平均響應(yīng)時(shí)間都逐漸增加,傳統(tǒng)的PDA旅游導(dǎo)航系統(tǒng)平均響應(yīng)用時(shí)在1.8~2.4 s左右,本文系統(tǒng)的平均響應(yīng)用時(shí)在1 s之內(nèi),用時(shí)遠(yuǎn)小于傳統(tǒng)系統(tǒng),證明本文系統(tǒng)的響應(yīng)速度快。
3.3 游客自我定位測試
游客可以在移動(dòng)手機(jī)終端上安裝本文設(shè)計(jì)的旅游導(dǎo)航系統(tǒng),系統(tǒng)則可對游客進(jìn)行定位。表1描述的是本文系統(tǒng)的定位功能測試結(jié)果。
游客移動(dòng)終端上的地圖軟件將用戶的位置信息發(fā)送到本文系統(tǒng)。一旦游客出現(xiàn)緊急情況,本文系統(tǒng)的旅游危險(xiǎn)求助模塊會(huì)立刻做出響應(yīng),判斷事件的危險(xiǎn)等級,從而對游客實(shí)施救援。
4 結(jié) 語
本文設(shè)計(jì)的基于數(shù)據(jù)挖掘的智能旅游導(dǎo)航系統(tǒng)可以完善旅游線路規(guī)劃、增強(qiáng)系統(tǒng)的導(dǎo)航功能、提高系統(tǒng)響應(yīng)速率,實(shí)現(xiàn)旅游數(shù)據(jù)的高效利用。
參考文獻(xiàn)
[1] 王立平,劉艷玲,任劍嵐.基于數(shù)據(jù)挖掘的煤炭設(shè)備管理智能分析模型研究[J].煤炭技術(shù),2014,33(2):237?239.
WANG Liping, LIU Yanling, REN Jianlan. Based on data mining coal equipment management intelligent analysis model [J]. Coal technology, 2014, 33(2): 237?239.
[2] 李菲.基于數(shù)據(jù)挖掘的商務(wù)智能系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2016,39(11):152?155.
LI Fei. Design and implementation of business intelligence system based on data mining [J]. Modern electronics technique, 2016, 39(11): 152?155.
[3] 肖堅(jiān)紅,嚴(yán)小文,周永真,等.基于數(shù)據(jù)挖掘的計(jì)量裝置在線監(jiān)測與智能診斷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電測與儀表,2014,51(14):1?5.
XIAO Jianhong, YAN Xiaowen, ZHOU Yongzhen, et al. Design and implementation of metering device online monitoring and intelligent diagnosis system based on data mining [J]. Electrical measurement & instrumentation, 2014, 51(14): 1?5.
[4] 吳曉英,明均仁.基于數(shù)據(jù)挖掘的大數(shù)據(jù)管理模型研究[J].情報(bào)科學(xué),2015,33(11):131?134.
WU Xiaoying, MING Junren. Research on the big data management model based on data mining [J]. Information science, 2015, 32(11): 131?134.
[5] 吳澎,朱家明,朱林波,等.基于多目標(biāo)規(guī)劃和智能優(yōu)化算法的旅游線路設(shè)計(jì)研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2016,46(15):105?114.
WU Peng, ZHU Jiaming, ZHU Linbo, et al. Research on the design of travel route based on the multi?objective programming and intelligent optimization algorithm [J]. Mathematics in practice and theory, 2016, 46(15): 105?114.
[6] 許峰,李帥帥,齊雪芹.大數(shù)據(jù)背景下旅游系統(tǒng)模型的重構(gòu)[J].旅游科學(xué),2016,30(1):48?59.
XU Feng, LI Shuaishuai, QI Xueqin. On the reconstruction of tourism system model in the background of big data [J]. Tourism science, 2016, 30(1): 48?59.
[7] 李東和,張鷺旭.基于TAM的旅游App下載使用行為影響因素研究[J].旅游學(xué)刊,2015,30(8):26?34.
LI Donghe, ZHANG Luxu. Model of influential factors for downloading and using tourism apps based on a technology acceptance model [J]. Tourism tribune, 2015, 30(8): 26?34.
[8] 高悅爾,陳舒婷,鄭承于,等.基于浮動(dòng)車數(shù)據(jù)的旅游景點(diǎn)周邊路網(wǎng)容量研究:以廈門島為例[J].地理科學(xué)進(jìn)展,2016,35(12):1529?1537.
GAO Yueer, CHEN Shuting, ZHENG Chengyu, et al. Road network capacity of tourist site′s periphery based on FCD: ta?king Xiamen island as an example [J]. Progress in geography, 2016, 35(12): 1529?1537.
[9] 徐程瑾,鐘章奇,王錚.基于GIS的京津冀核心旅游圈構(gòu)建研究[J].地域研究與開發(fā),2015,34(2):103?107.
XU Chengjin, ZHONG Zhangqi, WANG Zheng. Research on the construction of the optimum tourism circle in Jingjinji region based on GIS [J]. Areal research and development, 2015, 34(2): 103?107.
[10] 侯樂,楊輝華,樊永顯,等.基于ILS?CS優(yōu)化算法的個(gè)性化旅游線路研究[J].計(jì)算機(jī)科學(xué)與探索,2016,10(1):142?150.
HOU Le, YANG Huihua, FAN Yongxian, et al. Research on personalized trip itinerary based on ILS?CS optimization [J]. Journal of frontiers of computer science and technology, 2016, 10(1): 142?150.