汪際和
【摘 要】在挖掘關(guān)聯(lián)規(guī)則的過程中,人們往往不僅關(guān)心項集出現(xiàn)的頻率而且關(guān)心項集的重要性,為此,本文應(yīng)用權(quán)重來綜合考慮項集的頻率和重要性,在構(gòu)建概念格的過程中應(yīng)用加權(quán)的值來更新概念和相應(yīng)的邊。
【關(guān)鍵詞】概念格;頻繁項集;建格算法
0 引言
概念格是由德國的數(shù)學(xué)家Wille.R于1982年提出的一種基于序理論的數(shù)據(jù)分析工具,由于它的特殊結(jié)構(gòu)等一些特點,在知識發(fā)現(xiàn),信息檢索等方面得到廣泛應(yīng)用。關(guān)聯(lián)規(guī)則的關(guān)鍵步驟是找出符合最小支持度條件的頻繁項集,體現(xiàn)于概念格中則表現(xiàn)為找出滿足條件的內(nèi)涵集之間的關(guān)聯(lián)性。而頻繁項集和概念格中的節(jié)點存在一種對應(yīng)關(guān)系,所以,尋找頻繁項集的過程可以看作是根據(jù)最小支持度構(gòu)建概念格的過程。
如何構(gòu)造和簡化概念格,一直是形式概念分析中的重要內(nèi)容,為了更好地構(gòu)建概念格,許多學(xué)者進行了大量研究并取得了比較豐碩的成果[3-6]。
3 結(jié)論
本算法綜合考慮了項集在事務(wù)數(shù)據(jù)庫中出現(xiàn)的頻率(即支持度)和重要性(即用權(quán)值表示),根據(jù)用戶對頻率和重要性的關(guān)心程度來設(shè)置權(quán)重?琢。當(dāng)然,在該算法中,由于加權(quán)頻繁項集的超集不一定頻繁,所以就不能對候選項集剪枝。另外,對于不同的項集可以動態(tài)地設(shè)置權(quán)重等。對它們的研究將是下一步的工作。
【參考文獻】
[1]Jiawei Han,Micheline Kamber.范明,孟小峰,譯.數(shù)據(jù)挖掘概念與技術(shù)(第二版)[M].北京:機械工業(yè)出版社,2008.
[2]Bernhard Ganter.Rudolf Wille.馬垣,等,譯.形式概念分析[M].北京:科學(xué)出版社,2007.
3]簡宋全,胡學(xué)鋼,蔣美華.擴展概念格的漸進式構(gòu)造[J].計算機工程與應(yīng)用,2001,37(15):132-134.
[4]王德興,胡學(xué)鋼,王浩.基于量化概念格的關(guān)聯(lián)規(guī)則挖掘[J].合肥工業(yè)大學(xué)學(xué)報,2002,25(5):678-682.
[5]張繼福,張素蘭,鄭鏈.加權(quán)概念格及其漸進式構(gòu)造[J].模式識別與人工智能,2005(2):171-176.
[6]翟悅,郭文書,王立娟.利用擴展概念格進行關(guān)聯(lián)分類的算法[J].遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版),2015,34(11):1280-1284.
[責(zé)任編輯:王楠]