宋余慶 王立軍 呂 穎 謝從華
摘要:在分析類Apriori算法存在效率瓶頸的基礎(chǔ)上,提出了一個(gè)高效改進(jìn)算法——基于分類樹的關(guān)聯(lián)規(guī)則挖掘算法。該算法只需要兩次訪問數(shù)據(jù)庫(kù),把數(shù)據(jù)庫(kù)中的數(shù)據(jù)利用分類樹來存儲(chǔ),減少了訪問數(shù)據(jù)庫(kù)的次數(shù);并且由分類樹的全部或部分來求得頻繁項(xiàng)目集,減少了求頻繁項(xiàng)目集的比較次數(shù)。此算法通過結(jié)合Apriori和FP-tree兩種算法來提高挖掘效率,降低了挖掘算法的時(shí)間復(fù)雜度和空間復(fù)雜度,通過多次試驗(yàn)證明該算法比Apriori及其改良算法的挖掘效率高2到8倍。
關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;分類樹;頻繁項(xiàng)目集
中圖分類號(hào):TP317.4
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1671—7775(2006)01—0051—04