林甲祥,高敏節(jié),陳崇成,巫建偉,王雪平,張澤均
(1.福建農(nóng)林大學(xué)計(jì)算機(jī)與信息學(xué)院,福建福州 350002;2.福州大學(xué)福建省空間信息工程研究中心,空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室,福建福州 350108;
3.自然資源部第三海洋研究所海洋環(huán)境管理與發(fā)展戰(zhàn)略研究中心,福建廈門 361001)
隨著國(guó)民經(jīng)濟(jì)的增長(zhǎng)和人民生活水平的提高,游客的個(gè)性化旅游需求越來(lái)越強(qiáng)烈.然而由于游客群體的多樣化,在經(jīng)費(fèi)和時(shí)間的限制下,如何較好地選擇游客感興趣的景點(diǎn)、合理地規(guī)劃旅游路線,往往是游客或旅游營(yíng)銷部門既注重又亟待解決的問(wèn)題[1].利用關(guān)聯(lián)規(guī)則對(duì)旅游數(shù)據(jù)進(jìn)行挖掘,能夠?yàn)橛慰鸵?guī)劃旅游線路提供參考,已有學(xué)者開(kāi)展了基于關(guān)聯(lián)規(guī)則的智慧旅游相關(guān)理論和應(yīng)用研究.在算法的分布式并行化方面,典型工作如文獻(xiàn)[2]基于MapReduce框架對(duì)大數(shù)據(jù)環(huán)境下的定量關(guān)聯(lián)規(guī)則進(jìn)行了研究.在約束關(guān)聯(lián)規(guī)則方面,文獻(xiàn)[3-4]對(duì)考慮項(xiàng)集約束的關(guān)聯(lián)規(guī)則進(jìn)行研究,并對(duì)基于晶格結(jié)構(gòu)的類別關(guān)聯(lián)規(guī)則挖掘進(jìn)行了探索.文獻(xiàn)[5]對(duì)考慮項(xiàng)集約束的高效關(guān)聯(lián)規(guī)則挖掘進(jìn)行研究,通過(guò)剪枝各階頻繁項(xiàng)集生成過(guò)程中產(chǎn)生的不感興趣的項(xiàng)集和用戶不感興趣的規(guī)則,提高了算法挖掘的效率.文獻(xiàn)[6]對(duì)無(wú)時(shí)間約束的時(shí)空關(guān)聯(lián)規(guī)則挖掘進(jìn)行研究,并在全球恐怖主義事件挖掘中進(jìn)行了示范應(yīng)用.文獻(xiàn)[7]針對(duì)事件序列的有序性,提出了有順序約束的關(guān)聯(lián)規(guī)則挖掘方法KAPMiner.文獻(xiàn)[8]對(duì)綜合考慮類別約束和項(xiàng)集約束的關(guān)聯(lián)規(guī)則進(jìn)行研究,提出了單步驟式的類別數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘方法.國(guó)內(nèi),文獻(xiàn)[9]對(duì)顧及背景知識(shí)的多事件序列關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行研究,能在一定程度上改善經(jīng)典的MOWCATL算法存在的挖掘規(guī)則冗余或遺漏問(wèn)題.在基于關(guān)聯(lián)規(guī)則的智慧旅游方面,文獻(xiàn)[10]通過(guò)藍(lán)牙跟蹤數(shù)據(jù)對(duì)旅游勝地的參觀模式進(jìn)行挖掘,并在比利時(shí)根特地區(qū)進(jìn)行了示范應(yīng)用.文獻(xiàn)[11]將模糊聚類和關(guān)聯(lián)規(guī)則挖掘用于旅游景點(diǎn)分析和提高景點(diǎn)的游客吸引力研究中.文獻(xiàn)[12]針對(duì)多個(gè)約束條件的旅游行程規(guī)劃問(wèn)題,提出了一個(gè)基于時(shí)間框架的旅游行程規(guī)劃算法.文獻(xiàn)[13]基于聯(lián)合國(guó)世界旅游組織(UNWTO)統(tǒng)計(jì)的旅游文化數(shù)據(jù),使用關(guān)聯(lián)規(guī)則對(duì)游客與住宿服務(wù)之間的供需關(guān)系進(jìn)行了分析.
從考慮約束的數(shù)據(jù)挖掘角度出發(fā),對(duì)旅游景點(diǎn)和旅游線路進(jìn)行規(guī)劃的相關(guān)研究或成果報(bào)道還較少.本文以向用戶提供個(gè)性化、更加滿意、更加高效的旅游景點(diǎn)和路線推薦服務(wù)為目標(biāo),采用半監(jiān)督的方式,將用戶的具體需求以約束的方式融合到關(guān)聯(lián)規(guī)則挖掘中,通過(guò)與約束密切相關(guān)項(xiàng)的提取,為用戶制定個(gè)性化旅游路線和景點(diǎn)選擇提供相關(guān)的候選信息,并在實(shí)際數(shù)據(jù)集中開(kāi)展示范應(yīng)用研究.
基于項(xiàng)集約束的關(guān)聯(lián)規(guī)則挖掘中,規(guī)則的前件后件約束C是項(xiàng)集I的一個(gè)或者多個(gè)子集的集合,用于限制規(guī)則的前件或后件必須包含的內(nèi)容,記為C={cxx =1,2,…,s},其中cxI.相應(yīng)地,事務(wù)集T中包含約束ci的所有事務(wù)的集合稱為約束ci關(guān)聯(lián)的事務(wù)子集,簡(jiǎn)稱ci的約束子集,記為T(ci).
支持度(sup)和置信度(conf)常用于衡量關(guān)聯(lián)規(guī)則挖掘中規(guī)則的興趣度.對(duì)項(xiàng)集X,XI,X在事務(wù)集T中支持度是:T中包含X的事務(wù)的比率,稱為全集支持度,記為sup(X);而X在約束子集T(ci)中支持度是:T(ci)中包含X的事務(wù)的比率,稱為子集支持度,記為supT(ci)(X).
對(duì)于關(guān)聯(lián)規(guī)則AB,A∩B=,其在全集T上的支持度是T中既包含A又包含B的事務(wù)的比率,記為sup(AB);而其在約束子集T(ci)上的支持度是T(ci)中既包含A又包含B的事務(wù)的比率,記為supT(ci)(AB),如公式(1)所示.規(guī)則在全集T上的置信度是T中包含A的事務(wù)中也包含B的事務(wù)的比率,記為conf(AB);而其在約束子集T(ci)上的置信度是T(ci)中包含A的事務(wù)中也包含B的事務(wù)的比率,記為confT(ci)(AB),如公式(2)所示.其中, X表示集合X中元素的個(gè)數(shù).
約束關(guān)聯(lián)規(guī)則挖掘算法(constrained association rule mining,ConstrainARM)采用三階段的策略,首先尋找約束條件對(duì)應(yīng)的約束子集,然后在約束子集中尋找頻繁項(xiàng)集,最后在頻繁項(xiàng)集的基礎(chǔ)上產(chǎn)生滿足約束條件的關(guān)聯(lián)規(guī)則.算法引入約束子集的概念,以滿足約束條件的關(guān)聯(lián)規(guī)則挖掘?yàn)槟繕?biāo)導(dǎo)向,同時(shí)使用約束條件對(duì)待搜索的事務(wù)數(shù)據(jù)集、以及生成的關(guān)聯(lián)規(guī)則進(jìn)行有效剪枝,從而能夠降低數(shù)據(jù)集搜索的時(shí)間.
給定待挖掘的事務(wù)數(shù)據(jù)集T、前因后果約束集C、擬獲得的頻率最高的項(xiàng)或置信度最大的規(guī)則的數(shù)目topn,ConstrainARM算法進(jìn)行約束關(guān)聯(lián)規(guī)則挖掘的具體流程如圖1所示.
圖1 約束關(guān)聯(lián)規(guī)則挖掘算法的流程Fig.1 The flow of ConstrainARM algorithm
步驟1遍歷事務(wù)數(shù)據(jù)集T一趟,獲得約束集中每個(gè)約束ci對(duì)應(yīng)的約束子集T(ci).
步驟2對(duì)每個(gè)約束條件ci關(guān)聯(lián)的約束子集T(ci),進(jìn)行一趟遍歷,獲取每個(gè)‘項(xiàng)’出現(xiàn)的頻數(shù),并獲得出現(xiàn)頻數(shù)最高的topn(用戶給定的參數(shù))個(gè)項(xiàng)作為頻繁1項(xiàng)集L1.若總項(xiàng)數(shù)小于topn,則返回實(shí)際項(xiàng)數(shù).
步驟3從頻繁k項(xiàng)集Lk(k=1)開(kāi)始,進(jìn)行k項(xiàng)集的自連接,產(chǎn)生獲得候選k+1項(xiàng)集Ck+1;并遍歷約束子集T(ci),對(duì)Ck+1中的每個(gè)元素的出現(xiàn)頻次進(jìn)行計(jì)數(shù),從而確定頻繁k+1項(xiàng)集;若總項(xiàng)數(shù)小于topn,則返回實(shí)際項(xiàng)數(shù).遞歸此過(guò)程,直到獲得約束子集T(ci)的所有頻繁項(xiàng)集.
首先,建立“3T”原則導(dǎo)向下的信息發(fā)布制度。 設(shè)計(jì)科學(xué)全面的信息發(fā)布制度,是應(yīng)對(duì)網(wǎng)絡(luò)事件輿情危機(jī)的重要舉措之一。 傳統(tǒng)的由單一部門獨(dú)立進(jìn)行信息發(fā)布的方法存在著諸多問(wèn)題,如遇到涉及多主體的事務(wù)時(shí)會(huì)造成部門扯皮、溝通不暢、互相推卸發(fā)布職責(zé)。 而“3T”原則下信息發(fā)布機(jī)制的建立,首先建立信息發(fā)布常設(shè)機(jī)構(gòu),用以協(xié)調(diào)各部門聯(lián)動(dòng),對(duì)政府發(fā)布輿情進(jìn)行統(tǒng)籌安排。 機(jī)構(gòu)內(nèi)部依據(jù)發(fā)布流程設(shè)立分部以維持機(jī)構(gòu)運(yùn)行。 其次,建立與輿情發(fā)布相關(guān)的專家聯(lián)系咨詢制度,建構(gòu)發(fā)布機(jī)構(gòu)與民眾的溝通互動(dòng)機(jī)制,在常設(shè)機(jī)構(gòu)下組建一支高素質(zhì)的輿情發(fā)布隊(duì)伍。
步驟4根據(jù)獲得的約束子集T(ci)中的所有頻繁項(xiàng)集,產(chǎn)生符合ci約束的關(guān)聯(lián)規(guī)則,并將置信度最高的topn條規(guī)則作為強(qiáng)關(guān)聯(lián)規(guī)則返回,若規(guī)則的總數(shù)目小于topn,則返回實(shí)際規(guī)則數(shù)目.
步驟5循環(huán)執(zhí)行步驟2~4,獲得所有約束條件對(duì)應(yīng)的強(qiáng)關(guān)聯(lián)規(guī)則.
ConstrainARM算法的核心在于三個(gè)步驟.首先,獲取約束集C中的每個(gè)約束ci對(duì)應(yīng)的約束子集T(ci);然后,在約束子集中進(jìn)行頻繁項(xiàng)集的檢索;最后,在約束對(duì)應(yīng)的頻繁項(xiàng)集的基礎(chǔ)上,根據(jù)設(shè)置的算法參數(shù),獲得滿足約束條件的強(qiáng)關(guān)聯(lián)規(guī)則.其中,根據(jù)頻集產(chǎn)生符合約束條件ci的關(guān)聯(lián)規(guī)則且約束ci作為規(guī)則前件(事件原因)時(shí),條件概率是規(guī)則后件xm發(fā)生的可能性的大小;當(dāng)約束ci作為規(guī)則后件(事件結(jié)果)時(shí),則后驗(yàn)概率是規(guī)則前件xm引發(fā)結(jié)果ci的可能性的大小.根據(jù)條件概率公式和貝葉斯后驗(yàn)概率公式可知,約束條件ci作為規(guī)則前件或后件時(shí)xm發(fā)生的可能性相同.因?yàn)樽蛹疶(ci)中約束ci發(fā)生的概率P(ci)=1,因此ConstrainARM算法的核心任務(wù)在于獲得約束ci與xm的聯(lián)合概率P(xm∪ci),具體實(shí)現(xiàn)方法是在遍歷約束子集T(ci)時(shí)對(duì)項(xiàng)集xm的出現(xiàn)頻次進(jìn)行計(jì)數(shù).
以福州林景行信息技術(shù)有限公司實(shí)際運(yùn)營(yíng)的望路者旅游文化業(yè)務(wù)數(shù)據(jù)集為對(duì)象,本節(jié)對(duì)約束關(guān)聯(lián)規(guī)則挖掘在熱點(diǎn)旅游線路推薦中的應(yīng)用進(jìn)行示范應(yīng)用研究.
望路者旅游文化數(shù)據(jù)集由三張表格構(gòu)成.第一張:目的地表,遍布我國(guó)各省的13 400余個(gè)旅游景點(diǎn)的信息;第二張:總行程表,記錄了移動(dòng)端APP應(yīng)用程序保存的2016年6月1日至2018年4月16日期間游客出行的2 520余條旅游路線信息;第三張:行程每天安排表,記錄了每條旅游路線每天的信息,包含第幾天、旅游城市、途經(jīng)的景點(diǎn)等信息.
步驟一數(shù)據(jù)預(yù)處理.將望路者旅游文化數(shù)據(jù)的總行程表和行程每天安排表進(jìn)行融合,獲得2 520條旅游路線途經(jīng)的景點(diǎn)信息,如表1所示.
步驟二約束關(guān)聯(lián)規(guī)則挖掘.以表1匯總數(shù)據(jù)中每個(gè)游客途經(jīng)的景點(diǎn)為源數(shù)據(jù),以福州市國(guó)家5A級(jí)旅游景區(qū)“三坊七巷”為例,以“三坊七巷”為前件的關(guān)聯(lián)規(guī)則表示到三坊七巷的游客有很大可能隨后會(huì)到這些景點(diǎn);而以“三坊七巷”為后件的關(guān)聯(lián)規(guī)則表示到三坊七巷的游客,有很大可能是從這些景點(diǎn)游玩后來(lái)訪的,置信度的大小則標(biāo)示了規(guī)則可能性的大小.因而,以約束C={{三坊七巷}}、參數(shù)topn=12為例,對(duì)ConstrainARM算法進(jìn)行約束關(guān)聯(lián)規(guī)則挖掘的流程進(jìn)行介紹.
表1 旅游行程數(shù)據(jù)匯總表(部分?jǐn)?shù)據(jù))Tab.1 Summary of tourist itinerary of WCTSNOP(Partial data)
首先,對(duì)望路者旅游文化匯總數(shù)據(jù)(表1所示)進(jìn)行遍歷,獲得約束c1={三坊七巷}關(guān)聯(lián)的事務(wù)子集T(c1),約束子集中事務(wù)的數(shù)目 T(c1)=176.
然后,在約束子集T(c1)中進(jìn)行頻繁項(xiàng)集搜索.對(duì)k-階項(xiàng)集,至多獲取topn=12個(gè)項(xiàng)集作為k-階頻繁項(xiàng)集,最終獲得的k-階頻繁項(xiàng)集如表2所示.其中僅列出了支持?jǐn)?shù)超過(guò)3的2~4階頻繁項(xiàng)12項(xiàng),5階頻繁項(xiàng)9項(xiàng),6階頻繁項(xiàng)1項(xiàng),各頻繁項(xiàng)的支持?jǐn)?shù)見(jiàn)第2列.
最終,根據(jù)獲得的頻繁項(xiàng)集,產(chǎn)生符合約束要求的關(guān)聯(lián)規(guī)則,并計(jì)算規(guī)則在約束子集T(c1)中置信度,對(duì)每個(gè)約束條件獲取至多topn=12個(gè)置信度最高的規(guī)則作為強(qiáng)關(guān)聯(lián)規(guī)則.
根據(jù)ConstrainARM思想,以約束c1={三坊七巷}為前件或后件的規(guī)則置信度如表2第2列所示.
表2 約束子集T(c1)中的頻繁項(xiàng)集(約束項(xiàng)c1={三坊七巷}略)Tab.2 Frequent itemsets of T(c1)(c1={三坊七巷}is excluded)
以2階頻繁項(xiàng)為例,參數(shù)topn=12條件下獲得的關(guān)聯(lián)規(guī)則及其支持?jǐn)?shù)和置信度如表3所示.
表3 與約束項(xiàng)c1={三坊七巷}最相關(guān)的topn=12個(gè)景點(diǎn)Tab.3 The topn=12 most closest reated sites for constrained item c1={三坊七巷}
從表3可見(jiàn),到{三坊七巷}的游客,最有可能去的景點(diǎn)依次是鼓山、青云山、馬尾船政文化景區(qū)等.因而,對(duì)于到訪{三坊七巷}的游客,若只想到兩個(gè)景點(diǎn)游玩,可依次重點(diǎn)推薦這些景點(diǎn).而從表2可見(jiàn),若游客計(jì)劃游覽三個(gè)景點(diǎn),那么最優(yōu)的推薦是{馬尾船政文化景區(qū),青云山},其次是{青云山,云頂}.
ConstrainARM算法使用約束進(jìn)行數(shù)據(jù)篩選、生成約束子集需要遍歷一趟數(shù)據(jù)集,時(shí)間復(fù)雜度近似為O(c·n),其中c和n分別為約束和事務(wù)的數(shù)目.根據(jù)算法的策略,進(jìn)行密切相關(guān)的k階項(xiàng)集生成所耗費(fèi)的時(shí)間取決于參數(shù)topn,近似為topn!,因而總體時(shí)間復(fù)雜度約為O(c·n+topn!).
從上述挖掘結(jié)果可見(jiàn),ConstrainARM算法能夠正確、可靠地獲得符合約束條件的關(guān)聯(lián)規(guī)則.以約束c1={三坊七巷}為例,獲得的topn=12個(gè)景點(diǎn)都是福建省聞名的旅游景點(diǎn),尤其是鼓山、青云山、馬尾船政文化景區(qū)、鼓浪嶼等景區(qū),每年的游客接待量都名列前茅,可見(jiàn)約束挖掘結(jié)果與實(shí)際情況較為吻合.
算法層面上,ConstrainARM將數(shù)據(jù)集遍歷限定在約束關(guān)聯(lián)的事務(wù)子集T(c1)中,約束子集的規(guī)模T(c1)=176相對(duì)于數(shù)據(jù)集大小2 520條具有明顯的縮減,因而算法效率具有明顯的提高.一方面,由于約束子集T(c1)往往比完整數(shù)據(jù)集小得多,因而算法能夠大大降低頻繁項(xiàng)集搜索時(shí)多次遍歷數(shù)據(jù)集的大量時(shí)間開(kāi)銷,從而顯著提高算法的效率;另一方面,由約束引導(dǎo)下的規(guī)則生成也具有較為明確的用戶目標(biāo)導(dǎo)向性,避免了大量無(wú)意義規(guī)則的生成,也在一定程度上提高了算法的效率.
與傳統(tǒng)基于頻集的關(guān)聯(lián)規(guī)則挖掘算法相比,ConstrainARM算法不要求提供支持度sup和置信度conf閾值參數(shù),而要求提供擬獲得的頻率最高的項(xiàng)或置信度最大的規(guī)則的數(shù)目topn.此外,算法挖掘的目標(biāo)不同,傳統(tǒng)算法的目標(biāo)是尋找支持度和置信度高于指定閾值的強(qiáng)關(guān)聯(lián)規(guī)則,而ConstrainARM算法目標(biāo)是尋找符合指定約束的最有可能的至多topn個(gè)關(guān)聯(lián)項(xiàng).再者,算法的挖掘策略不同,傳統(tǒng)算法采用k項(xiàng)集自連接的方法產(chǎn)生候選k+1項(xiàng)集,并基于頻繁項(xiàng)集產(chǎn)生所有規(guī)則,而ConstrainARM算法只針對(duì)少數(shù)最可能最感興趣的項(xiàng)進(jìn)行高階候選項(xiàng)的連接與生成測(cè)試,因而候選項(xiàng)集的規(guī)模及其由此消耗的CPU處理時(shí)間低得多.
由于傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘算法和ConstrainARM算法的挖掘目標(biāo)及其采用的策略不同.因此以Apriori算法為例,對(duì)傳統(tǒng)算法在支持度sup=0.005,0.01和0.02時(shí)的候選與頻繁項(xiàng)集數(shù)(如表4)進(jìn)行研究,對(duì)支持度sup=0.01置信度分為conf=0.5,0.4,0.3和0.2時(shí)算法獲得的所有規(guī)則和強(qiáng)關(guān)聯(lián)規(guī)則數(shù)目(如表5)進(jìn)行研究,并對(duì)ConstrainARM算法在參數(shù)topn為12和15時(shí)候選規(guī)則和實(shí)際獲得的規(guī)則數(shù)目(如圖2)進(jìn)行研究.從而對(duì)兩種算法的挖掘效果和挖掘效率進(jìn)行對(duì)比分析.
表4 不同支持度時(shí)Apriori的候選和頻集項(xiàng)集數(shù)Tab.4 Ckand Lksizes with different sup for Apriori
表5 sup=0.01和不同置信度時(shí)Apriori的規(guī)則數(shù)Tab.5 Rule numbers with sup=0.01 and different conf for Apriori
從表4可見(jiàn),傳統(tǒng)算法Apriori在頻繁項(xiàng)集生成時(shí),將產(chǎn)生大量的候選項(xiàng)集,且隨著支持度的降低,候選項(xiàng)集的規(guī)模呈指數(shù)增長(zhǎng);從表5可見(jiàn),對(duì)支持度sup=0.01時(shí)獲得的頻繁項(xiàng)集,算法Apriori隨著置信度閾值的降低,獲得的強(qiáng)關(guān)聯(lián)規(guī)則數(shù)目不斷升高.從圖2可見(jiàn),ConstrainARM算法在挖掘topn個(gè)置信度最高的規(guī)則時(shí),也將產(chǎn)生一定數(shù)量的候選規(guī)則,但相對(duì)于Apriori算法的候選項(xiàng)集,其數(shù)目遠(yuǎn)遠(yuǎn)來(lái)得小.此外,Apriori算法獲得的挖掘目標(biāo)針對(duì)性不足,以圖2所示的參數(shù)sup=0.01和conf=0.4為例,獲得的118條強(qiáng)關(guān)聯(lián)規(guī)則無(wú)一滿足約束c1={三坊七巷}的挖掘需求,因其關(guān)聯(lián)的1階頻繁項(xiàng)中,“鼓山”的支持?jǐn)?shù)最高(為59,如表3所示),其在子集T(c1)中的置信度為0.335,并非置信度conf=0.4條件下的強(qiáng)關(guān)聯(lián)規(guī)則.換言之,子集上產(chǎn)生的規(guī)則,在全局T中的支持度與置信度的值均較低,因而許多與約束c1密切相關(guān)的項(xiàng)集往往不是傳統(tǒng)算法挖掘的潛在頻繁項(xiàng)集,進(jìn)而無(wú)法產(chǎn)生相對(duì)應(yīng)的規(guī)則.而為了獲得約束相關(guān)的規(guī)則,往往只能降低支持度和置信度的閾值,那么不可避免地導(dǎo)致大量無(wú)效候選項(xiàng)集和規(guī)則的生成,從而顯著降低算法的挖掘效率.
從上述分析可見(jiàn),提出的ConstrainARM算法,通過(guò)約束條件進(jìn)行數(shù)據(jù)剪枝和目標(biāo)限定,在降低候選項(xiàng)集等算法中間產(chǎn)物規(guī)模的同時(shí),提高了挖掘結(jié)果的針對(duì)性,在個(gè)性化旅游路線制定時(shí)的景點(diǎn)推薦中具有明顯的實(shí)際應(yīng)用價(jià)值.
圖2 不同topn值時(shí)ConstrainARM獲得的規(guī)則數(shù)Fig.2 Rule numbers with differenttopn for ConstrainARM
針對(duì)個(gè)性化旅游景點(diǎn)推薦提出了一個(gè)考慮約束的關(guān)聯(lián)規(guī)則挖掘ConstrainARM算法,并在福州林景行信息技術(shù)有限公司實(shí)際運(yùn)營(yíng)的望路者旅游文化業(yè)務(wù)數(shù)據(jù)集中開(kāi)展了應(yīng)用實(shí)驗(yàn)研究.結(jié)果表明,效率上,算法能夠正確獲得給定約束條件下的關(guān)聯(lián)規(guī)則,且通過(guò)提出的約束子集的概念,能夠?qū)㈥P(guān)聯(lián)規(guī)則挖掘所需的頻繁項(xiàng)集搜索限制在規(guī)模較小的約束子集中,一定程度上提高了算法的效率;效果上,對(duì)于每個(gè)景點(diǎn),即使受游客喜愛(ài)的熱度不高,但與之最相關(guān)的其它景點(diǎn)的獲得,能夠?yàn)榈酱司包c(diǎn)游玩的旅客在制定個(gè)性化旅游線路時(shí)提供較為科學(xué)的決策依據(jù).基于約束多級(jí)關(guān)聯(lián)規(guī)則的旅游景點(diǎn)聯(lián)動(dòng)和旅游路線規(guī)劃是下一步研究的重點(diǎn).