曹炳汝,劉 勇
(江南大學(xué)商學(xué)院,江蘇無錫214122)
·先進計算與數(shù)據(jù)處理·
基于集對勢優(yōu)勢關(guān)系的變精度粗糙集模型
曹炳汝,劉 勇
(江南大學(xué)商學(xué)院,江蘇無錫214122)
針對不完備信息系統(tǒng)含有偏好信息、噪音數(shù)據(jù)、模糊性等屬性的特點,利用集對分析、優(yōu)勢關(guān)系和變精度粗糙集,構(gòu)建一種在集對勢優(yōu)勢關(guān)系基礎(chǔ)上的變精度粗糙集模型。對存在屬性值缺失的序值信息系統(tǒng),利用集對分析方法,定義基于α聯(lián)系度系數(shù)的集對勢優(yōu)勢關(guān)系,代替變精度粗糙集模型的等價關(guān)系,并給出一種新的變精度粗糙集模型。實例分析結(jié)果驗證了該模型的有效性與合理性。
不完備信息系統(tǒng);優(yōu)勢關(guān)系;集對勢;粗糙集;屬性集
作為一種處理具有不精確性、不確定性和模糊性的方法[1],粗糙集基于等價關(guān)系(即滿足自反性、對稱性和傳遞性的關(guān)系),定義對象集的下、上近似,由于其具有強大的并行計算和數(shù)據(jù)處理能力,被廣泛地運用在知識發(fā)現(xiàn)、數(shù)據(jù)挖掘、決策分析和模式識別等領(lǐng)域[2-4]。粗糙集的研究對象是屬性值已知且離散的完備信息系統(tǒng),然而由于現(xiàn)實世界的復(fù)雜性、不確定性以及人類認(rèn)知的有限性,信息系統(tǒng)屬性值并不是都是已知的,一些屬性值存在缺失等問題,這樣一些信息系統(tǒng)往往是不完備序值信息系統(tǒng)。
為了處理不完備序值信息系統(tǒng),一些專家、學(xué)者嘗試?yán)貌煌姆绞?、方法從填補構(gòu)造完備信息系統(tǒng)和直接處理不完備信息系統(tǒng)2個方面著手展開研究。在填補和構(gòu)造完備信息系統(tǒng)方面,目前的研究主要是對不完備信息系統(tǒng)進行預(yù)處理,即根據(jù)不同的規(guī)則和屬性值特性,補全屬性值,使不完備序值信息系統(tǒng)變成完備信息系統(tǒng),而后再利用粗糙集方法進行決策分析、模式識別等[5]。此類處理不完備序值信息系統(tǒng)的方法容易造成不完備信息系統(tǒng)信息丟失。在直接處理不完備信息系統(tǒng)方面,主要是基于模糊集、灰色系統(tǒng)、集對分析等方法構(gòu)建模糊關(guān)系[6-7]、容差關(guān)系[8-10]、相似關(guān)系[11-12]、優(yōu)勢關(guān)系[13-16]的粗糙集模型,并利用其識別不完備信息系統(tǒng)中影響粗糙集分類的因素,獲取決策規(guī)則,而單單基于容錯關(guān)系、相似關(guān)系、優(yōu)勢關(guān)系的粗糙集在處理不完備信息系統(tǒng)進行分類時,當(dāng)條件屬性較多時,粗糙集集合的定義便會過于寬松,以致于難以滿足實際需要,鑒于此,一些專家、學(xué)者嘗試?yán)眉瘜Ψ治龇椒▽Σ煌陚湫畔⑾到y(tǒng)進行處理[17],構(gòu)建基于分析的粗糙集模型[18-20]。通過比較基于集對分析的粗糙集模型[21-23],可以發(fā)現(xiàn),其大多是從同一度、不確定性、對立度某一方面考慮對象的分類效果[24-25],而缺乏從整體考慮所有對象整體分類性能,使得分類結(jié)果與實際存在著偏差[26-27]。鑒于此,在借鑒和比較文獻[19,22,26-27]的集對勢相關(guān)研究成果的基礎(chǔ)上,本文針對不完備信息系統(tǒng)中含有偏好信息、噪音數(shù)據(jù)、模糊性等屬性的信息,構(gòu)建一種新的優(yōu)勢變精度粗糙集模型。
為了處理不完備序值信息系統(tǒng)的偏好屬性,Greco等學(xué)者提出了優(yōu)勢粗糙集理論,該理論能夠處理多標(biāo)準(zhǔn)決策分析中典型事例決策的不一致性問題,其利用優(yōu)勢關(guān)系代替粗糙集的不可分辨關(guān)系,并根據(jù)邏輯語句“if,…,then”表示的決策規(guī)則,由事例決策導(dǎo)出偏好模型[28-29]。借鑒優(yōu)勢粗糙集信息系統(tǒng),下面定義不完備序值信息系統(tǒng)下的優(yōu)勢關(guān)系。
2.1 不完備序值信息系統(tǒng)
定義1 設(shè)序值信息系統(tǒng)為S=(U,A,V,f),其中,U={x1,x2,…,xn}為有限非空集合,亦稱論域;A={AT∪D}為有限非空屬性集合,AT={a1,a2,…,am}為條件屬性集合;D={d1,d2,…,dp}為決策屬性集合;V=∪Va,對于a∈A,Va為屬性a的值域;f:U×A→V為信息函數(shù),對于?a∈A、?x∈U,f(x,a)∈Va,它指定了U中每一個對象的屬性值。對于序值信息系統(tǒng)S=(U,A,V,f),若至少一個對象x關(guān)于屬性a,使得f(x,a)∈Va為空值(用*表示),則稱序值信息系統(tǒng)S為不完備序值信息系統(tǒng),記作S*=(U,A,V,f),否則稱完備序值信息系統(tǒng)[18]。
定義2 在不完備序值信息系統(tǒng)S*=(U,A,V,f)中,令x,y∈U,B?AT,對于?a∈B,一般意義下的優(yōu)勢關(guān)系為:
定義3 在不完備序值信息系統(tǒng)為S*=(U,A,V,f)中,給定B?AT且x∈U,y∈U,關(guān)于x的B-優(yōu)勢集和B-劣勢集分別定義如下:
假設(shè)根據(jù)決策者,將對象集U分為有限數(shù)量的決策類,令Cl={Clt,t∈{1,2,…,n}},則:Cln?…?Clt?…?Cl1,將這些類別向上合并及向下合并可以得出:
2.2 基于閾值α的集對勢優(yōu)勢關(guān)系與優(yōu)勢類
作為一種刻畫確定性與不確定性及其轉(zhuǎn)化規(guī)律的一種系統(tǒng)分析工具,集對分析將被研究的客觀事物之確定性聯(lián)系和不確定性聯(lián)系作為一個整體來分析和處理。為有效描述和刻畫不完備序值信息系統(tǒng)的不確定性,在文獻[18-27]研究成果的基礎(chǔ)上,重新定義了集對勢優(yōu)勢關(guān)系及其優(yōu)勢類。
定義4 在不完備信息系統(tǒng)S*=(U,A,V,f)中,對于B?A,且,如果X,Y表示任意兩對象x,y∈U關(guān)于屬性集B所構(gòu)成的集合,H(X,Y)表示在優(yōu)勢關(guān)系下集合X,Y所構(gòu)成的集合對,則稱:
為y在屬性集合B上優(yōu)于x的聯(lián)系度。
定義5 在不完備信息系統(tǒng)S*=(U,A,V,f)中,對于B?A,如果μB(x,y)=a+b i+c j表示x,y關(guān)于屬性集B的聯(lián)系度,則稱優(yōu)勢度a與對立度c的比值:
為對象x,y關(guān)于屬性集B在優(yōu)勢關(guān)系下的集對勢。
若c=0,shi(H)B→∞,則稱集對H(X,Y)中對象x,y關(guān)于屬性集B在優(yōu)勢關(guān)系下具有無窮大勢,即x關(guān)于屬性集B遠遠優(yōu)于對象y,可簡記為shi(H)B→∞。
通過比較文獻[18-27]基于集對分析的粗糙集模型,可以發(fā)現(xiàn),其大多是利用集對聯(lián)系度從同一度、不確定性、對立度某一方面考慮對象的分類效果,而缺乏從整體考慮所有對象整體分類性能。當(dāng)在處理存在大量空值的不完備序值信息系統(tǒng)時,容易造成分類結(jié)果與實際存在偏差。鑒于此,在借鑒文獻[19,22,26-27]的集對勢相關(guān)研究成果的基礎(chǔ)上,并針對基于集對粗糙方法上下近似運算性質(zhì)不完善等問題,利用集對勢來定義集對勢優(yōu)勢關(guān)系。
定義6 在不完備序值信息系統(tǒng)S*=(U,A,V,f)中,對于?a∈A,?x,y∈U,B?AT,0.5≤α≤1,稱:
為對象x,y基于閾值α的集對勢優(yōu)勢關(guān)系,相應(yīng)地稱D-α(B)對象x,y基于閾值α的集對勢劣勢關(guān)系。
通常同一度閾值0≤α≤1,這里0.5≤α≤1是由同一趨勢的無窮大勢所滿足的條件推出,即a+b+c=1,a>b,c=0,所以a≥0.5,因為定義a≥α,所以0.5≤α≤1。顯然集對勢優(yōu)勢關(guān)系滿足自反性、對稱性、傳遞性。
定義7 在不完備序值信息系統(tǒng)為S*=(U,A,V,f)中,對于?a∈A,?x,y∈U,B?AT,0.5≤α≤1,稱:
為對象x,y基于閾值α的集對勢優(yōu)勢類。
為有效處理信息系統(tǒng)的噪聲數(shù)據(jù),Ziarko在粗糙集里通過引入一個閾值β來近似空間,提出了變精度粗糙集模型[30-32]?;谧兙饶P?,將集對勢優(yōu)勢關(guān)系替代變精度粗糙集模型的等價關(guān)系,構(gòu)建優(yōu)勢變精度粗糙集。相應(yīng)地,基于集對勢的優(yōu)勢變精度粗糙集的下近似和上近似可以做如下定義。
3.1 模型構(gòu)建
定義8 在不完備序值信息系統(tǒng)S*=(U,A,V, f)中,給定閾值0.5≤α≤1,0.5<β≤1,集合D,B?AT,則:
定義9 在不完備序值信息系統(tǒng)S*=(U,AT∪D,V,f)中,基于集對勢優(yōu)勢關(guān)系的變精度粗糙集的分類質(zhì)量為:
其中,γα,β(B,D)度量了論域中給定閾值α,β可能正確的分類知識在現(xiàn)有知識中的百分比。
3.2 模型性質(zhì)
定理1 在不完備序值信息系統(tǒng)S*=(U,A,V,f)中,給定任意閾值0.5≤α≤1,0.5<β≤1,對于集合,?B?AT,則有:
(3)的證明同(1),(4)的證明同(2)。
定理2 在不完備序值信息系統(tǒng)S*=(U,A,V,f)中,給定閾值0.5≤α≤1,0.5<β≤1,對于集合,則有:
(2)類似(1)證明,略。
定理3 在不完備序值信息系統(tǒng)S*=(U,A,V,f)中,對于?B?C,Clt?D,?t∈{1,2,…,n},及0.5≤α≤1,0.5<β≤1,則下列關(guān)系成立:
定理4 在不完備序值信息系統(tǒng)S*=(U,A,V,f)中,給定任意閾值0.5≤α≤1,0.5<β≤1,對于集合,則有:
(3)的證明類似于(1),(4)證明類似于(2)。
3.3 屬性約簡方法
屬性約簡方法步驟如下:
輸入 不完備信息系統(tǒng)S*=(U,A,V,f),集對勢閾值α和置信閾值β
輸出 不完備信息系統(tǒng)S*=(U,A,V,f)的一個約簡B
步驟1 令B=AT;
步驟2 求出系統(tǒng)分類質(zhì)量γα,β(B,D);
步驟3 對于每個屬性a∈B,計算γα,β(B-a,D)和屬性a的重要度Sigα(a);
步驟4 對于所有滿足γα,β(B-a,D)≥γα,β(AT,D)且Sigλ(a)最小,則B=B-{a};若γα,β(B-a,D)<γα,β(AT,D)且Sigλ(a)都相同,則選擇在所有對象取值中空值最多的屬性a,B=B-{a};
步驟5 如果對于每個屬性a∈B,γα,β(B-a,D)<γα,β(AT,D),轉(zhuǎn)步驟6,否則轉(zhuǎn)步驟3;
步驟6 輸出B,即不完備信息系統(tǒng)S*=(U,A,V,f)的一個約簡B。
表1 不完備信息系統(tǒng)
當(dāng)α=0.6時,基于優(yōu)勢關(guān)系,根據(jù)決策類對論域進行劃分,可得如下類別:
當(dāng)α=0.6,β=0.7時,根據(jù)所設(shè)計的屬性約簡方法,可得其中一個屬性約簡為{a1,a2,a3},由此約簡可得導(dǎo)出的相應(yīng)的決策規(guī)則。由以上計算可知,10對象全部被正確分類,即它們的分類質(zhì)量為100%。
為進一步說明模型的有效性與合理性,將文獻[6,16,19,26-27]所構(gòu)建的粗糙集模型分別記為模型1~模型5,當(dāng)α=0.6,β=0.7時,利用這5個模型計算,其計算結(jié)果如表2所示。根據(jù)表2的計算結(jié)果可知,基于這幾個模型得到的屬性約簡一致,而這所構(gòu)建的模型的分類質(zhì)量確是最高的。
表2 不同模型計算結(jié)果
根據(jù)上面的計算和分析可以看出,基于集對勢的優(yōu)勢變精度粗糙集模型通過調(diào)整參數(shù)α和β,具有一定的容錯性,并能夠?qū)崿F(xiàn)對對象的正確分類,挖掘決策信息表的知識,提取決策規(guī)則。
由于客觀世界的復(fù)雜性、不確定性以及人類認(rèn)知的有限性,所獲得信息系統(tǒng)往往為不完備信息系統(tǒng)。為此,本文構(gòu)建了一種基于集對勢的優(yōu)勢變精度粗糙集模型。實驗結(jié)果表明,本文模型能夠有效處理含有噪聲數(shù)據(jù)、偏好信息的不完備序值信息,提取決策規(guī)則,并且模型通過調(diào)整參數(shù)α,β具有一定的容錯能力。而對于含有灰色信息、模糊信息等不完備信息系統(tǒng),構(gòu)建基于集對勢的優(yōu)勢灰色變精度粗糙集模型,探討其適用范圍將是下一步研究的內(nèi)容。
[1] Pawlak Z.Rough Sets[J].International Journal of Information and Computing Sciences,1998,49(5):415-422.
[2] Pawlak Z,Skowron A.Rudiments of Rough Sets[J].Information Sciences,2007,177(1):3-27.
[3] Pawlak Z,Skowron A.Rough Sets:Some Extensions[J]. Information Sciences,2007,177(1):28-40.
[4] Pawlak Z,Skowron A.Rough Sets and Boolean Reasoning[J].Information Sciences,2007,177(1):41-73.
[5] Kryszkiewicz M.Rough Set Approach to Incomplete Information System s[J].Information Sciences,1998,112(1):39-49.
[6] Liu Y,Lin Y,Zhao H H.Variable Precision Intuitionistic Fuzzy Rough Set Model and Application Based on Conflict Distance[J].Expert System s,2015:32(2):220-227.
[7] 劉 勇,菅利榮.雜合灰色聚類與變精度粗糙模糊集的概率決策方法及應(yīng)用[J].管理工程學(xué)報,2013,27(3):110-117.
[8] Kryszkiewicz M.Rough Set Approach to Incomplete Information System s[J].Information Sciences,1998,112(1):39-49.
[9] Stefanow ski J,Tsoukias A.Incomplete Information Tables and Rough Classification[J].Computational Intelligence,2001,17(1):545-566.
[10] 王國胤.Rough集理論在不完備信息系統(tǒng)中的擴充[J].計算機研究與發(fā)展,2002,39(10):1238-1243.
[11] 顏錦江,黃 兵.不完備信息系統(tǒng)中基于相似度的變精度粗糙集模型[J].系統(tǒng)工程理論與實踐,2006,(10):67-72.
[12] Slowinski R,Vanderpooten D.A Generalized Definition of Rough Approximations Based on Similarity[J].IEEE Transactions on Know ledge and Data Engineering,2000,12(2):331-336.
[13] Greco S,Matarazzo B,Slowiski R.Rough Approximation by Dominance Relations[J].International Journal of Intelligent Systems,2002,17(1):153-171.
[14] Greco S,Matarazzo B,Slowiski R.Rough Sets Theory for Multi-criteria Decision Analysis[J].European Journal of Operational Research,2002,129(1):1-47.
[15] Shao M W,Zhang W X.Dom inance Relation and Rules in an Incomplete Ordered Information System[J].International Journal of Intelligent Systems,2005,20(2):13-27.
[16] Yang X B.Dominance-based Rough Set Approach and Know ledge Reductions in Incomplete Ordered Information System[J].Information Sciences,2008,178(4):1219-1234.
[17] 趙克勤.集對分析及其初步應(yīng)用[M].杭州:浙江科學(xué)技術(shù)出版社,2000.
[18] 謝 軍,宋余慶.不完備序值決策系統(tǒng)中的拓展粗集模型及集對分析[J].計算機科學(xué),2008,35(12):154-157.
[19] 黃 兵,周獻中.基于集對分析的不完備信息系統(tǒng)粗糙集模型[J].計算機科學(xué),2002,29(9):1-3.
[20] 黃 兵,周獻中.不完備信息系統(tǒng)中基于聯(lián)系度的粗集模型拓展[J].系統(tǒng)工程理論與實踐,2004,(1):88-92.
[21] 劉富春.基于限制容差關(guān)系的集對粗糙集模型[J].計算機科學(xué),2005,32(6):124-128.
[22] 劉富春.變集對聯(lián)系度的擴充粗糙集模型及其屬性約簡[J].計算機科學(xué),2006,33(3):185-187.
[23] Zhou Lei,Shu Lan.Rough Set Model Based on New set Pair Analysis[J].Fuzzy System s and Mathematics,2006,20(4):111-116.
[24] 徐 怡,李龍澍.基于(α,λ)聯(lián)系度容差關(guān)系的變精度粗糙集模型[J].自動化學(xué)報,2011,37(3):303-308.
[25] 陶 志,戴慧君,張 艷.不完備信息系統(tǒng)中集對粗糙集模型[J].計算機應(yīng)用,2008,28(7):1684-1685,1691.
[26] 徐 怡,李龍澍,李學(xué)俊.基于集對勢的擴充粗糙集模型[J].系統(tǒng)仿真學(xué)報,2008,20(6):1515-1518.
[27] 徐 怡,李龍澍.變精度集對勢粗糙集模型[J].控制與決策,2010,25(11):1732-1736.
[28] Greco S,Matarazzo B,Slowiski R.Rough Approximation by Dominance Relations[J].International Journal of Intelligent Systems,2002,17(2):153-171.
[29] Greco S,Matarazzo B,Slowiski R.Rough Sets Theory for Multi-criteria Decision Analysis[J].European Journal of Operational Research,2001,129(1):1-47.
[30] Ziarko W.Variable Precision Rough Set Model[J]. Journal of Computing and System Sciences,1993,46(1):39-59.
[31] Ziarko W.Analysis of Uncertain Information in the Framework of Variable Precision Rough Sets[J]. Foundations of Computing and Decision Sciences,1993,18(1):381-396.
[32] Ziarko W.Rough Sets,F(xiàn)uzzy Sets and Know ledge Discovery[M].Singapore:Springer,1999.
編輯索書志
Variable Precision Rough Set Model Based on Set Pair Situation Dominance Relationship
CAO Bingru,LIU Yong
(School of Business,Jiangnan University,Wuxi214122,China)
In order to deal with the incomplete information system with a variety of noise data,dominance information and other information,and acquire decision rules,the thought and method of the set pair theory,dominance relationship and variable precision rough set are used to construct a novel dominance variable precision rough set model based on set pair situation.With respect to the incomplete information system containing the missing attribute values,by utilizing the set pair analysis method,a set pair situation dominance relationship based on the threshold α connection degree is defined,and it is used to substitute the equivalence relationship of the variable precision rough set model,so that a novel variable precision rough set model based on the set pair situation is established,and its properties are researched.An example show s the feasibility and effectiveness of the proposed model.
incomplete information system;dominance relationship;set pair situation;rough set;attribute set
曹炳汝,劉 勇.基于集對勢優(yōu)勢關(guān)系的變精度粗糙集模型[J].計算機工程,2015,41(11):35-40.
英文引用格式:Cao Bingru,Liu Yong.Variable Precision Rough Set Model Based on Set Pair Situation Dominance Relationship[J].Computing Engineering,2015,41(11):35-40.
1000-3428(2015)11-0035-06
A
TP18
10.3969/j.issn.1000-3428.2015.11.007
江蘇省社會科學(xué)基金資助項目(14GLC008)。
曹炳汝(1960-),男,教授,主研方向:粗糙集,軟計算;劉 勇(通訊作者),副教授、博士。
2015-05-05
2015-07-11 E-m ail:clly1985528@163.com