李興寬
(云南民族大學(xué) 管理學(xué)院,云南 昆明 650500)
集值信息下的粗集與知識獲取
李興寬
(云南民族大學(xué) 管理學(xué)院,云南 昆明 650500)
在復(fù)雜的決策環(huán)境中,集值信息是不可避免的。在此情況下,專家往往也能給出滿意的決策。從集值信息系統(tǒng)中提取有用的規(guī)則,用于增強智能系統(tǒng)的知識庫,具有實際意義。粗集是處理不確定信息的有效方法,但它通常適用于完全決策表。本文對粗集理論在集值信息下進行了初步的拓展,為從集值決策表中挖掘知識提供一定的理論基礎(chǔ)。
粗集;集值信息;規(guī)則
集值信息系統(tǒng)是不完備的信息系統(tǒng),傳統(tǒng)的關(guān)系數(shù)據(jù)庫不支持含集值的元組,但在現(xiàn)實中,集值信息系統(tǒng)又是不可避免的,此時,有些信息往往難以得到。
傳統(tǒng)的粗集的研究對象是完全信息系統(tǒng),它能夠有效地利用約簡算法分析決策表,提取決策表中屬性之間存在的潛在模式。許多學(xué)者對空值型的信息系統(tǒng)進行了深入的研究[1-3],得到了一些很好的知識獲取方法,但關(guān)于集值信息下的粗集的研究卻很少。本文研究集值信息下粗集的有關(guān)性質(zhì)及知識獲取。
定義1稱(U,A,F(xiàn))為集值信息系統(tǒng)[4]。若 U={x1,x2,…,xn}為對象集,A={a1,a2,…,am}為屬性集,F(xiàn)={ft,|t≤m}為信息函數(shù)集。其中:
Vt為屬性 at的值域,P(Vt)表示 Vt的非空子集全體。
若A=C∪D,C為條件屬性集,D為決策屬性集 (其值域不含集值),則稱(U,C∪D,F(xiàn))為集值決策表。
定義2設(shè)(U,A,F(xiàn))為一個集值信息系統(tǒng),B?A,定義二元關(guān)系 RB={(x,y)∈U×U|ft(x)∩ft(y)≠φ,?at∈B}。記 SB(x)={y∈U|(x,y)∈RB}。
易知,RB是自反和對稱的,但未必是傳遞的。因此,RB是一個相容關(guān)系。記 U/RB={SB(x)|x∈U},U/RB中的元素叫相容類,U/RB中的相容類一般不構(gòu)成U的劃分。
定義3設(shè)(U,A,F(xiàn))為集值信息系統(tǒng),B?A。對任意X?U,記(X)=∪{SB(x)|(x)?X},(X)=∪{SB(x)| SB(x)∩X≠φ}。則(X)和(X)分別稱為 X在 RB下關(guān)于屬性集 B的下近似集和上近似集,,分別稱為下近似算子和上近似算子。
X的 RB邊界域、正域、負(fù)域分別為:
性質(zhì)1設(shè)(U,A,F(xiàn)) 為集值信息系統(tǒng),B,C?A,X?U,則有:
[1]討論了完備信息系統(tǒng)下的近似算子的遞推公式,對于集值信息下的近似算子,仍有下列遞推公式,它們可用于概念的遞增獲取。
性質(zhì)2設(shè)(U,A,F(xiàn))為集值信息系統(tǒng),B?A。若a?B,則
證明(1)設(shè)x∈RB∪{a}(X),若 x?RB(X)∪R{a}(X),則 x∈B(X)∩{a}(X)。
同理可得下面性質(zhì)3。
性質(zhì)3設(shè)(U,A,F(xiàn)) 為集值信息系統(tǒng),B?A。 若a?B,則
例1表1給出了一個協(xié)調(diào)的集值決策表(U,C∪D,F(xiàn))
其中U={x1,x2,x3},C={a,b},D={d},Va={1,2,3,4},Vb={1,2},Vd={1,2}
取X={x1,x3},用上述性質(zhì)2和性質(zhì)3分析表1,則有:
表1 協(xié)調(diào)的集值決策表
定義4對于集值決策表(U,C∪D,F(xiàn)),t1,t2∈U。若t1∈SB(t2),且C(t1)=C(t2)(即t1與t2的條件屬性相同),如果d(t1)=d(t2),則稱(U,C∪D,F(xiàn))是相容的,否則不相容。
定義5x∈U,B?C,若 SB(x)?di,則稱規(guī)則x→di是確定的,否則稱規(guī)則x→di是不確定的,其中di∈U/{d}。
定義6規(guī)則x→di的置信度定義為αB(di)=|SB(x)∩di|/|SB(x)|。
當(dāng)αB(di)=1時,規(guī)則x→di是確定的;
當(dāng)αB(di)<1時,規(guī)則x→di是不確定的。
例2對于表1給出的集值決策表,下列規(guī)則是確定的:
{1,2}→di,{3,4}→d=2,{2}→d=1。
下列規(guī)則是不確定的:
{1}→d=1,{1}→d=2。
在復(fù)雜的決策環(huán)境中,集值信息是不可避免的。在此情況下,從集值信息系統(tǒng)中提取有用的規(guī)則,用于增強智能系統(tǒng)的知識庫,具有實際意義。粗集是處理不確定信息的有效方法,但它通常適用于完全決策表。本文對粗集理論在集值信息下進行了初步的拓展,為從集值決策表中挖掘知識提供一定的理論基礎(chǔ)。
參考文獻
[1]張文修,梁怡,吳志偉.信息系統(tǒng)與知識發(fā)現(xiàn)[M].北京:科學(xué)出版社,2003.
[2]趙衛(wèi)東,曹文彬,戴偉輝.不完全信息下的粗集拓展[J].系統(tǒng)工程學(xué)報,2002,17(6):45-48.
[3]李仁璞,王正歐.規(guī)則不確定性的幾種度量及其相互關(guān)系[J].系統(tǒng)工程理論與實踐,2004,24(1):68-72.
[4]張文修,吳志偉.粗糙集理論與方法[M].北京:科學(xué)出版社,2001.
The rough set and knowledge discovery under set-valued information
Li Xingkuan
(The College of Management,Yunnan University of Nationalities,Kunming 650500,China)
Experts often have to make decisions with set-valued information under set-valued information underground and can give satisfactory solutions.Therefore,it is useful to extract meaningful rules from set-valued decision tables enhancing the quality of knowledge base of intelligent systems.As a method for dealing with indefinite information,previous rough set only concerns with complete decision tables.So the extension of rough set is necessary.In the paper, the problem is discussed, which provides theoretical foundation for mining knowledge from set-valued decision tables.
rough set;set-valued information;rules
TP18
A
1674-7720(2015)23-0014-02
李興寬.集值信息下的粗集與知識獲?。跩].微型機與應(yīng)用,2015,34(23):14-15.
2015-09-06)
李興寬(1977-),男,博士,副教授,主要研究方向:創(chuàng)新管理,粗糙集理論。