国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)挖掘技術(shù)的智慧旅游推薦系統(tǒng)的設(shè)計(jì)研究

2022-01-11 09:42:48李偉
現(xiàn)代計(jì)算機(jī) 2021年32期
關(guān)鍵詞:余弦景區(qū)智慧

李偉

(六盤水師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,貴州 553000)

0 引言

隨著我國旅游產(chǎn)業(yè)規(guī)模不斷擴(kuò)大,旅游信息呈現(xiàn)爆炸性增長,導(dǎo)致游客很難獲取有價(jià)值的信息,旅游服務(wù)開始從傳統(tǒng)的信息化向智能化轉(zhuǎn)變。智慧旅游推薦系統(tǒng)從海量旅游信息資源中發(fā)現(xiàn)游客感興趣的信息,并將個(gè)性化需求信息推薦給對應(yīng)的游客用戶,因此推薦系統(tǒng)的研發(fā)對智慧旅游的發(fā)展具有重要意義。目前,國內(nèi)外主要從兩個(gè)方面對智慧旅游進(jìn)行研究:①通過具體的實(shí)例來展現(xiàn)智慧旅游的發(fā)展情況。②研究如何構(gòu)建智慧旅游體系[1]。Jeong H 分析用戶對景點(diǎn)的訪問信息,根據(jù)用戶的地理信息對旅游用戶進(jìn)行推薦[2]。Huang Y 利用貝葉斯網(wǎng)絡(luò)分析用戶的數(shù)據(jù),構(gòu)建智慧旅游推薦系統(tǒng)[3]。近年來智慧旅游推薦系統(tǒng)在我國快速發(fā)展起來,它是信息技術(shù)與旅游資源結(jié)合的產(chǎn)物,也是旅游發(fā)展理念的重大變革。但智慧旅游推薦系統(tǒng)仍存在很多問題,例如推薦系統(tǒng)的性能較差、推薦信息不準(zhǔn)確等。

本文研究利用大數(shù)據(jù)挖掘技術(shù),改進(jìn)基于項(xiàng)目的協(xié)同過濾算法,分析游客的歷史數(shù)據(jù)和游客與系統(tǒng)的交互行為來獲取游客的興趣,使用Mahout 實(shí)現(xiàn)分布式智慧旅游推薦系統(tǒng),為旅客提供高效的個(gè)性化服務(wù)信息推薦。

1 系統(tǒng)架構(gòu)

為了給游客提供精準(zhǔn)智能的個(gè)性化服務(wù),景區(qū)需要搭建智慧旅游推薦系統(tǒng)[4]?;诖髷?shù)據(jù)挖掘技術(shù)的智慧旅游推薦系統(tǒng)的總體架構(gòu)如圖1 所示,分為數(shù)據(jù)層、分析層和應(yīng)用層。數(shù)據(jù)層是推薦系統(tǒng)的數(shù)據(jù)來源,整合所有智慧旅游業(yè)務(wù)數(shù)據(jù),包括旅游資源、用戶信息和服務(wù)器日志等數(shù)據(jù);分析層使用大數(shù)據(jù)開源框架Hadoop,其兩大核心是HDFS 和MapReduce,在Hadoop 的基礎(chǔ)上采用Mahout 分布式程序?qū)崿F(xiàn)基于項(xiàng)目的協(xié)同過濾推薦;應(yīng)用層主要向終端用戶推送的服務(wù)有景點(diǎn)推薦、路線推薦和資訊推薦等。游客可以通過手機(jī)終端向系統(tǒng)請求服務(wù)信息,系統(tǒng)根據(jù)景區(qū)的實(shí)時(shí)狀況和游客特征向游客推送個(gè)性化推薦服務(wù),同時(shí)系統(tǒng)可以收集游客對推薦結(jié)果的反饋信息,從而改善推薦結(jié)果的準(zhǔn)確率。

圖1 智慧旅游推薦系統(tǒng)的總體架構(gòu)

2 關(guān)鍵技術(shù)

個(gè)性化推薦系統(tǒng)是建立在數(shù)據(jù)挖掘的基礎(chǔ)上的一種高級智能服務(wù),它組合各種軟件技術(shù)和工具為用戶推薦信息[5]。智慧旅游推薦系統(tǒng)向游客推薦其感興趣的旅游服務(wù)信息,為了保障推送的服務(wù)信息是游客真正需要的,系統(tǒng)首先需要收集游客的偏好,然后從信息庫中選擇與游客偏好匹配的項(xiàng)目,再推薦給游客。智慧旅游推薦系統(tǒng)的關(guān)鍵技術(shù)主要包括構(gòu)建游客興趣模型和推薦算法。

2.1 游客興趣建模

游客在智慧旅游推薦系統(tǒng)中分為顯性反饋和隱性反饋兩種行為。顯性反饋行為是游客已經(jīng)旅游的景點(diǎn)信息、路線信息和酒店信息等歷史數(shù)據(jù),其表現(xiàn)方式是對信息的評分和偏好。隱性反饋行為是游客對景點(diǎn)網(wǎng)上相關(guān)信息的瀏覽數(shù)據(jù),以及游客與系統(tǒng)的交互行為。

游客興趣模型包括:游客的姓名、性別和年齡等基本信息,游客對景點(diǎn)、酒店等的評分信息,游客當(dāng)前所在景點(diǎn)和路線等位置信息。

2.2 推薦算法

建立游客興趣模型以后,推薦系統(tǒng)對游客進(jìn)行個(gè)性化推薦還需要使用推薦算法對數(shù)據(jù)進(jìn)行分析處理。基于項(xiàng)目的協(xié)同過濾算法是根據(jù)用戶已有的信息,去推算出用戶可能含有或即將含有的信息[6]。系統(tǒng)采用的基于項(xiàng)目的協(xié)同過濾算法,將所有游客對某個(gè)景點(diǎn)的偏好作為一個(gè)向量來計(jì)算景點(diǎn)之間的相似度,得到景區(qū)的相似景區(qū)后,根據(jù)游客歷史偏好預(yù)測當(dāng)前游客還沒有表示偏好的景區(qū),計(jì)算得到一個(gè)排序的景區(qū)列表作為結(jié)果推薦。如圖2所示,對于景區(qū)1,根據(jù)所有游客的歷史偏好,喜歡景區(qū)1的游客都喜歡景區(qū)3,得出景區(qū)1 和景區(qū)3 比較相似,而用戶C 喜歡景區(qū)1,那么可以推斷出用戶C 可能也喜歡景區(qū)3。

圖2 基于項(xiàng)目的協(xié)同過濾算法

相似度的計(jì)算的方法主要有歐幾里德距離、皮爾遜相關(guān)系數(shù)和余弦相似度[7],本文利用余弦相似度來計(jì)算項(xiàng)目的相似度。但是余弦相似度方法忽略了不同用戶打分的嚴(yán)格程度,有的用戶偏向于給高分,而有的用戶偏向于給低分,本文改進(jìn)了余弦相似度,通過減去用戶打分的平均值來去除用戶打分習(xí)慣的影響,如公式為:

其中,Ri為用戶i的打分平均值,Rj為用戶j的打分平均值。

2.3 Mahout

Apache Mahout 中提供了協(xié)同過濾算法的實(shí)現(xiàn)[8],它是一個(gè)基于Java 實(shí)現(xiàn)的可擴(kuò)展和高效的推薦引擎,從數(shù)據(jù)處理能力上可以分為單機(jī)內(nèi)存算法實(shí)現(xiàn)和基于Hadoop的分步布算法實(shí)現(xiàn)。本文采用基于Hadoop的分步布算法,以來提高智慧旅游推薦系統(tǒng)的性能。在運(yùn)行時(shí)Mahout 分布式程序會(huì)把MapReduce 類型的程序包,自動(dòng)發(fā)布到Hadoop集群環(huán)境中執(zhí)行。

3 實(shí)驗(yàn)分析

為了檢驗(yàn)本文所提出方法的有效性,在Movie-Lens 數(shù)據(jù)集上進(jìn)行驗(yàn)證,并隨機(jī)抽取80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測試集。本文采用均方根誤差RMSE(root mean squared error)作為評價(jià)標(biāo)準(zhǔn),通過計(jì)算預(yù)測的用戶評分與實(shí)際的用戶評分之間的偏差來度量預(yù)測的準(zhǔn)確性。RMSE公式為:

其中,{P1,P2,…,PN}為N個(gè)項(xiàng)目的預(yù)測評分集合,{r1,r2,…,rN}為N個(gè)項(xiàng)目的實(shí)際評分集合。當(dāng)RMSE值越小時(shí),表示推薦質(zhì)量越高。實(shí)驗(yàn)采用余弦相似度和改進(jìn)的余弦相似度來計(jì)算項(xiàng)目之間的相似度,值的分布如圖3 所示,由圖可以看出余弦相似度分布較為均勻,而改進(jìn)的余弦相似度分布更加個(gè)性化。使用項(xiàng)目的評分值減去用戶評分的平均值,能夠真實(shí)反映出項(xiàng)目的差異特征,因此改進(jìn)的余弦相似度計(jì)算方法可以得到較高推薦質(zhì)量。

圖3 實(shí)驗(yàn)計(jì)算項(xiàng)目的相似度

4 結(jié)語

隨著大數(shù)據(jù)技術(shù)的發(fā)展和旅游信息數(shù)據(jù)的增長,搭建基于大數(shù)據(jù)挖掘技術(shù)的智慧旅游推薦系統(tǒng),利用大數(shù)據(jù)的分布式計(jì)算能力,能夠快速處理旅游信息數(shù)據(jù),實(shí)時(shí)的進(jìn)行智慧旅游服務(wù)信息推薦。因此,智慧旅游推薦系統(tǒng)具有良好的應(yīng)用前景,來為游客提供智能和高效的個(gè)性化信息推薦服務(wù)。

猜你喜歡
余弦景區(qū)智慧
云南發(fā)布一批公示 10家景區(qū)擬確定為國家4A級旅游景區(qū)
『摘牌』
雜文月刊(2019年24期)2020-01-01 08:32:10
“摘牌”
某景區(qū)留念
雜文月刊(2018年21期)2019-01-05 05:55:28
兩個(gè)含余弦函數(shù)的三角母不等式及其推論
分?jǐn)?shù)階余弦變換的卷積定理
圖像壓縮感知在分?jǐn)?shù)階Fourier域、分?jǐn)?shù)階余弦域的性能比較
有智慧的羊
離散余弦小波包變換及語音信號壓縮感知
智慧派
仙游县| 贵定县| 滁州市| 新兴县| 鄂州市| 潢川县| 文登市| 抚州市| 嘉定区| 武邑县| 仲巴县| 南城县| 乌什县| 平原县| 武功县| 安图县| 新宾| 莱州市| 称多县| 慈溪市| 大田县| 济宁市| 织金县| 曲沃县| 河北区| 留坝县| 堆龙德庆县| 闽侯县| 资溪县| 东辽县| 灵武市| 漯河市| 安溪县| 潞城市| 莱芜市| 汽车| 神农架林区| 临澧县| 阿合奇县| 岱山县| 枣庄市|