陳建敏 徐蘇麗
摘要:隨著計算機網(wǎng)絡(luò)的飛速發(fā)展,大數(shù)據(jù)、人工智能等技術(shù)的逐漸成熟,人們對旅游的需求發(fā)生了變化,不再滿足于傳統(tǒng)的旅游方式,總是希望在有限時間里能瀏覽到最喜愛的旅游路線和得到更舒適的旅游體驗。本文從大數(shù)據(jù)、人工智能技術(shù)出發(fā),利用人工智能中的機器學(xué)習(xí)和深度學(xué)習(xí),并使用Python爬蟲機器獲取各種旅游行為等數(shù)據(jù),構(gòu)建出基于人工智能的智慧旅游大數(shù)據(jù)分析模型。旨在推動智慧旅游的快速落地,帶給旅游者舒適的旅游體驗,為旅游服務(wù)者節(jié)約成本提高效率。
關(guān)鍵詞:人工智能;大數(shù)據(jù);智慧旅游;個性化;需求
中圖分類號:TP311 文獻標(biāo)識碼:A
文章編號:1009-3044(2019)11-0189-02
隨著時代的發(fā)展,已經(jīng)進入了技術(shù)引領(lǐng)的時代。旅游等服務(wù)行業(yè)需求也越來越精細化,信息化的發(fā)展給游客的衣食住行帶來了巨大的便利,但是旅游不能僅僅只依靠便利的技術(shù),其關(guān)鍵在于旅游者的需求,如何滿足游客日益增長的個性化需求成為了社會研究的熱點。
1 智慧旅游的研究背景及其意義
歐盟早在2001年就開始實施“創(chuàng)建用戶友好的個性化移動旅游服務(wù)”項目。2005年,智慧旅游的最早提出國家之一的美國,斯丁波滑雪推出的游客定位裝置反饋系統(tǒng)就是智慧旅游。我國國家旅游局將2014年確定為了“智慧旅游年”,將大數(shù)據(jù)引入到旅游市場上來,改變了傳統(tǒng)的旅游模式,迫使旅游經(jīng)營模式改革,大大促進了旅游產(chǎn)業(yè)的建設(shè),誕生了以大數(shù)據(jù)為背景的智慧旅游新模式。
在2008年IBM“智慧地球”的背景下提出“智慧旅游”。智慧旅游的發(fā)展其關(guān)鍵在于服務(wù)本身,那么,對于旅游行業(yè)以及旅游者的各類行為以及趨勢分析成為發(fā)展智慧旅游的關(guān)鍵,獲取的信息數(shù)據(jù)越全名,數(shù)據(jù)分析得越精確,越能抓住旅游者的需求。在人工智能以及5G時代背景下,基于人工智能的智慧旅游大數(shù)據(jù)分析顯得尤為重要,從而從本質(zhì)上去促使智慧旅游的高速發(fā)展。
2 技術(shù)路線
智慧旅游,智慧是前提,離不開高尖端的技術(shù)支持。利用大數(shù)據(jù)、人工智能等技術(shù)以及硬件,實現(xiàn)旅游行業(yè)信息和旅游者行為信息的實時動態(tài)收集,整合并分析出用戶個性化的需求以及設(shè)計出適合旅游者的各類旅游方案。從旅游數(shù)據(jù)的收集到分析出旅游者的需求到數(shù)據(jù)整合、數(shù)據(jù)清理、數(shù)據(jù)分析、深度學(xué)習(xí)以及設(shè)計出合適的旅游方案,整個過程涉及到了大數(shù)據(jù)、人工智能等相關(guān)技術(shù)。
2.1 大數(shù)據(jù)以及Hadoop
按照麥肯錫全球研究所給出的定義,大數(shù)據(jù)通常情況下指的是其數(shù)據(jù)規(guī)模大到在獲取、存儲、分析、處理等超出了傳統(tǒng)數(shù)據(jù)管理工具能力的范疇的數(shù)據(jù)集合,其數(shù)據(jù)結(jié)構(gòu)包括結(jié)構(gòu)和和非結(jié)構(gòu)化。大數(shù)據(jù)只是為了實現(xiàn)某些企業(yè)或者其他利益群體的特定目標(biāo)或者運營策略而聚集的海量數(shù)據(jù)。大數(shù)據(jù)技術(shù)在于將這些海里數(shù)據(jù)經(jīng)過專業(yè)的處理,得出具有價值的信息。
大數(shù)據(jù)需要得到處理,提取信息,首先需要解決的問題就是數(shù)據(jù)存儲問題,Hadoop工具具有HDFS分布式文件系統(tǒng),其設(shè)計初衷就是為了可以橫跨成百上千臺機器用以存儲大量數(shù)據(jù),HDFS為我們提供了管理。解決了數(shù)據(jù)存儲問題,接下就是考慮如何處理海量數(shù)據(jù)。對于海量數(shù)據(jù)如果在單機上跑1P數(shù)據(jù)的話,需要跑幾天或者幾周的時間,為解決該問題,Hadoop建設(shè)初期引入了MapReduce框架,僅使用Map、Reduce兩個計算,然后它們中間由Shuffle串聯(lián)。Map階段,成百上千臺機器同時讀取我們需要處理的大數(shù)據(jù)文件的各個部分,所有機器都按照同樣的方法去處理產(chǎn)生結(jié)果。緊接著這些機器又啟動Reduce處理,最終能讓成百上千臺機器同時為我們操作,并按照Map針對每個步驟處理,然后Reduce又把所有結(jié)果匯總一起得到最終的結(jié)果。
自從用Hive分析數(shù)據(jù)過后,發(fā)現(xiàn)在Hive上跑MapReduce很慢,Spark框架應(yīng)運而生,其最重要優(yōu)點就是快,使用MapReduce計算時候,MapReduce任務(wù)需要多次迭代,迭代產(chǎn)生的結(jié)果每一次都需要保存到HDFS中,而HDFS本質(zhì)上也是占用硬盤空間的,也就是相當(dāng)于每次都將結(jié)果都存儲到了計算機硬盤上。而Spark不同,他每次運行的結(jié)果都存放在內(nèi)存中,在內(nèi)存中進行迭代運算,速度比MapReduce更快。
2.2 人工智能以及Python
人工智能(Artificial Intelligence),英文縮寫是AI,研究關(guān)鍵著眼于人的思維、意識,并將人的這些行為通過數(shù)學(xué)工具運算與分析讓機器模擬實現(xiàn)。人工智能包含常用機器學(xué)習(xí)和深度學(xué)習(xí)兩個很重要的模塊,而Python擁有Matplotlib、Numpy、Sklearn、Keras等大量的庫,像Pandas、Sklearn、Matplotlib這些庫都是做數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)建模和繪圖的庫,基本上機器學(xué)習(xí)中對數(shù)據(jù)的爬?。⊿crapy)、對數(shù)據(jù)的處理和分析(Pandas)、對數(shù)據(jù)的繪圖(Matplotlib)和對數(shù)據(jù)的建模(Sklearn)在Python中全都能找到對應(yīng)的庫來進行處理。
本文建立的模型對于數(shù)據(jù)的獲取,除了來自企業(yè)之外,其他數(shù)據(jù)均需要通過Python爬蟲技術(shù)從網(wǎng)絡(luò)上去爬取,這就需要利用Python中的Requests、Scrapy、Selenium、BeautifulSoup等庫。爬取數(shù)據(jù)之后才能進行機器學(xué)習(xí)和深度學(xué)習(xí),機器學(xué)習(xí)和深度學(xué)習(xí)以及整個人工智能領(lǐng)域所有模型和算法大部分使用Python為基礎(chǔ)語言的。
3 構(gòu)建基于人工智能的智慧旅游大數(shù)據(jù)分析模型
智慧旅游為的是給旅游者提供更加舒適的旅游體驗、更加滿足自己的旅游產(chǎn)品以及更加便捷的配套。為使得旅游能更加智慧化,滿足旅游者的個性化需求,以大數(shù)據(jù)、人工智能等技術(shù)為基礎(chǔ),構(gòu)造如圖1所示的基于人工智能的智慧旅游大數(shù)據(jù)分析模型。
4 模型分析
基于人工智能的智慧旅游大數(shù)據(jù)分析模型分為硬件資源層、數(shù)據(jù)處理層、大數(shù)據(jù)分析層、人工智能層、應(yīng)用服務(wù)層以及基礎(chǔ)云服務(wù)的五層兩級結(jié)構(gòu)。
4.1 硬件資源層
主要是為信息采集、構(gòu)建Hadoop集群、數(shù)據(jù)分析等提供硬件保障。
4.2 數(shù)據(jù)處理層
分為三個部分:Python爬蟲爬取數(shù)據(jù)、數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理,Python爬取用戶對于旅游、需求以及各大論壇中的信息數(shù)據(jù)進行爬取和匯總,對提取的數(shù)據(jù)進行清洗,去粗存精,最好按照最后深度學(xué)習(xí)模型需要,將所有數(shù)據(jù)預(yù)處理完成。
4.3 大數(shù)據(jù)分析層
是預(yù)處理之后的數(shù)據(jù)分析,基于Python,利用Pandas、Sklearn、Matplotlib、Numpy等庫對現(xiàn)有數(shù)據(jù)的特征、分布以及基礎(chǔ)信息進行分析。
4.4 人工智能層
根據(jù)不同景區(qū)和不同旅游地域,構(gòu)造出不同的深度學(xué)習(xí)模型,構(gòu)造訓(xùn)練集和測試機,利用訓(xùn)練集數(shù)據(jù)對模型進行調(diào)參和調(diào)優(yōu)。
4.5 應(yīng)用服務(wù)層
利用深度學(xué)習(xí)模型運行之后,對需要分析的數(shù)據(jù)動態(tài)給出兩個應(yīng)用服務(wù),分別是:用戶需求分析服務(wù)和個性化旅游資源服務(wù),為旅游服務(wù)提供者、旅行社、酒店、景區(qū)以及最核心的旅游者提供了各類智能化的服務(wù)。
4.6 整個模型
整個模型分為兩級,一級是整個數(shù)據(jù)構(gòu)建、分析、建模、深度學(xué)習(xí)過程,一級是基礎(chǔ)云服務(wù)支持?;A(chǔ)云服務(wù)為最終結(jié)果的產(chǎn)生提供了高速和精確的保障。
5 與傳統(tǒng)的方法比較
對比傳統(tǒng)的方法,利用數(shù)據(jù)挖掘的方法去實現(xiàn)智慧旅游,并不能完全發(fā)掘出旅游者的真正需求,同時也不能完全挖掘出整個旅游資源的合理整合,對于支付、交通等帶來的無限便利的同時,人們對服務(wù)有了更高的追求。傳統(tǒng)的方法對于服務(wù)上無法滿足所有顧客,旅游路線、旅游產(chǎn)品的設(shè)計僅僅依靠經(jīng)驗和少量數(shù)據(jù)得出的,需要投入大量的人力物力,結(jié)果并不一定讓旅游服務(wù)提供者和旅游服務(wù)體驗者都滿意。隨著人工智能技術(shù)的不斷成熟和發(fā)展,基于人工智能的智慧旅游大數(shù)據(jù)分析模型的構(gòu)建,能解決以上問題,能合理地高效地將旅游資源整合,為旅游者提供最優(yōu)最舒適的旅游服務(wù)。
6 結(jié)語
構(gòu)建基于人工智能的智慧旅游大數(shù)據(jù)分析模型,旨在促進旅游服務(wù)的個性化和旅游資源的最優(yōu)化利用。隨著人工智能不斷發(fā)展,5G網(wǎng)絡(luò)的快步“落地”,旅游者的實地體驗?zāi)J?,會增加猶如實體店試衣服一樣可以隨時隨地體驗旅游,配套更加智能化,服務(wù)更加精細化,這個將作為下一步研究的課題。
參考文獻:
[1]Loris Fichera,F(xiàn)abrizio Messina,Giuseppe Pappalardo,Corrado Santoro. A Python framework for programming autonomous robots using a declarative approach. Elsevierjournal,2017.
[2]馮琬婷. 基于文字識別視角分析人工智能機器學(xué)習(xí)中的文字識別方法. 電子技術(shù)與軟件工程[J],2017(13).
[3]孫彬,王東.文明旅游的大數(shù)據(jù)體系建設(shè)研究.中南林業(yè)科技大學(xué)學(xué)報(社會科學(xué)版),2017(05).
[4]唐穎,張鎰,柯彬彬.大學(xué)生窮游行為偏好及特征研究[J].嶺南師范學(xué)院學(xué)報, 2017(03).
【通聯(lián)編輯:唐一東】