王小改,李巧艷,王 璐
(西安工程大學(xué)理學(xué)院,西安710048)
1982年波蘭數(shù)學(xué)家Z.Pawlak首次提出了粗糙集理論[1],這是一種處理不確定性和不精確性問題的新的數(shù)學(xué)工具,在數(shù)據(jù)挖掘、知識(shí)約簡(jiǎn)等方面得到成功的應(yīng)用.1983年Zakowski[2]從實(shí)際應(yīng)用出發(fā),提出了覆蓋粗糙集模型,并討論了相關(guān)的性質(zhì).2003年William Zhu和WANG Fei-yue[3]在覆蓋粗糙集的基礎(chǔ)上給出了約簡(jiǎn)的概念和方法,證明了一個(gè)覆蓋通過約簡(jiǎn)得到的最簡(jiǎn)覆蓋是唯一的,并且證明了最簡(jiǎn)覆蓋相同的兩個(gè)覆蓋產(chǎn)生相同的上、下近似.
定義1[4]設(shè)U是有限論域,集函數(shù)P∶2U→[0,1]成為概率側(cè)度,若
(1)P(U)=1,
(2)當(dāng)A∩B=?,有P(A∪B)=p(A)+p(B),
若P是U上的概率測(cè)度,稱A,B?U且P(B) >0,稱
為在事件B發(fā)生的情況下事件A發(fā)生的條件概率.
定義2 (覆蓋、覆蓋近似空間)設(shè)U是一個(gè)論域,C是U的一個(gè)子集族.如果C中的所有子集都不空,且∪C=U,則稱C是U的一個(gè)覆蓋,稱有序?qū)?<U,C>為覆蓋近似空間.
定義3[5](最小描述)設(shè) <U,C > 為一個(gè)覆蓋近似空間,x∈U,則稱
為x的最小描述.
定義4 (覆蓋下近似、上近似)設(shè)C={K1,K2,…,Kn}是論域U上的一個(gè)覆蓋,P為定義在U的子集類構(gòu)成的σ代數(shù)上的概率測(cè)度,記A=(U,C,P)為覆蓋概率近似空間,則對(duì)任意X?U,0≤β<α≤1,定義X的關(guān)于A=(U,C,P)依參數(shù)α,β的下近似和上近似分別為:
X 的關(guān)于 A=(U,C,P) 依參數(shù) α,β,的覆蓋邊界域?yàn)?Bn(X,α,β)=
定理1 對(duì)于定義4下的覆蓋上、下近似有如下性質(zhì):
文獻(xiàn)[6]介紹給出了粗糙集的數(shù)字特征.本節(jié)我們?cè)谖墨I(xiàn)[6]的基礎(chǔ)上討論定義4給出的覆蓋粗糙集的數(shù)字特征.
定義5 (集合的近似精度和粗糙度)設(shè)C是論域U上的一個(gè)覆蓋,對(duì)?X?U,稱集合X的α近似精度和ρ粗糙度分別為
對(duì)每一個(gè)X?U,有0≤α(X)≤1.當(dāng)α(X)=1時(shí),X的邊界域?yàn)榭占?,所以集合X是可定義的;當(dāng)α(X)<1時(shí),集合X有非空的邊界域,所以集合是不可定義的;當(dāng)集合X為空集時(shí),我們就定α(X)=α(?)=1.
X的α粗糙度與ρ近似精度恰恰相反,它反映了我們?cè)诟采wC對(duì)于集合X表達(dá)的范疇了解的不完全程度.
定義6 (近似分類精度和近似分類質(zhì)量)設(shè)C是論域U上的一個(gè)覆蓋,以及論域U上的一個(gè)劃分π(U)={X1,X2,X3,…,Xn} ∈ Π(U),且這個(gè)劃分獨(dú)立于覆蓋 C.其中子集 Xi(i=1,2,…,n) 是劃分π(U)的等價(jià)類.首先定義π(U)的下近似和上近似分別為:
定義7 (知識(shí)庫中系統(tǒng)參數(shù)的重要度)設(shè)C是論域U上的一個(gè)覆蓋,C表示描述覆蓋近似空間 <U,C>的一組數(shù)或單個(gè)的系統(tǒng)參數(shù).?X?U和獨(dú)立于系統(tǒng)參數(shù)C的論域U的一個(gè)劃分π(U)={X1,X2,…,Xn},定義集合X關(guān)于系統(tǒng)參數(shù)C的重要度和劃分π(U)關(guān)于系統(tǒng)參數(shù)C的重要度分別為
由定義,系統(tǒng)參數(shù)具有以下性質(zhì):
(1)?X?U,π(U)∈∏(U),0≤sigC(X)≤1;0≤sigC(π(U))≤1.
(2)當(dāng)sigC(X)=1時(shí),表明覆蓋C可精確描述出集合X.
(3)當(dāng)sigC(X)=0時(shí),表明覆蓋C無法判斷論域U中的任意元素是否屬于概念X.
(4)X系統(tǒng)參數(shù)C的重要度越大,表明用覆蓋C描述集合X的近似精度就越高.
(5)當(dāng)sigC(π(U))=1時(shí),表明覆蓋C可精確描述出劃分π(U),即劃分π(U)是比覆蓋C所表示的劃分更粗的劃分.
(6)當(dāng)sigC(π(U))=0時(shí),表明覆蓋C無法判斷論域U中的任意元素是否屬于劃分π(U)中的概念Xi(i=1,2,…,n).
(7)劃分π(U)系統(tǒng)參數(shù)C的重要度越大,表明用覆蓋C描述該劃分π(U)的似精度就越高.
(8)無論集合還是劃分,它的系統(tǒng)參數(shù)C的重要度越大,表明覆蓋C分類能力越強(qiáng).
(9)無論集合還是劃分,它的系統(tǒng)參數(shù)C的重要度隨著C的細(xì)劃而單調(diào)遞增.
定義8 設(shè)C是論域U上的一個(gè)覆蓋,
定理3 (1)集合X為C-可定義,或C-粗糙可定義,或C-全不可定義,當(dāng)且僅當(dāng) ~X為C-可定義的,或C-粗糙可定義,或C-全不可定義;
(2)X為C-外(或內(nèi))不可定義當(dāng)且僅當(dāng) ~X為C-外(或內(nèi))不可定義.
所以X為C-粗糙可定義? ~X為C-粗糙可定義.
綜上所述,集合X為C-可定義,或C-粗糙可定義,或C-全不可定義,當(dāng)且僅當(dāng) ~X為C-可定義的,或C-粗糙可定義,或C-全不可定義.
同理可證(2)成立.
本文提出了一種新的覆蓋粗糙集的上、下近似定義,并討論了其性質(zhì).同時(shí),研究了其數(shù)字特征與拓?fù)涮卣?,豐富了覆蓋粗糙集的研究.
[1]Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11:341 -356.
[2]Zakowski W.Approximation in the space(U,∏)[J].Demonstration Mathematic,1983,16:761 -769.
[3]William Zhu,WANG Fei-yue.Reduction and axiomization of covering generalized rough set[J].Information Sciences,2003,152:217 -230.
[4]孫秉珍,鞏增泰.變精度概率粗糙集模型[J].西北師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,41(4):23-26.
[5]Zhu W,Wang F Y.Reduction and axiomization of covering generalized rough sets[J].Information Sciences,2003,152:217 -230.
[6]苗奪謙,李道國(guó).粗糙集理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2008.34-57.