国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于屬性一致度的屬性約簡(jiǎn)算法

2015-12-31 17:10:45達(dá)列雄鄧方安劉杰

達(dá)列雄 鄧方安 劉杰

摘要:在屬性一致度的概念和性質(zhì)基礎(chǔ)之上,提出一種基于屬性一致度的屬性約簡(jiǎn)算法。利用一致度構(gòu)造屬性間模糊相似矩陣,并用模糊聚類分析方法對(duì)屬性重要性作了分類,從而得到動(dòng)態(tài)屬性分類圖,得到了與粗糙集屬性約簡(jiǎn)方法完全一致的結(jié)果。最后,用實(shí)例表明算法的有效性。

關(guān)鍵詞:屬性一致度;屬性約簡(jiǎn);模糊聚類分析

中圖分類號(hào):TP182 文獻(xiàn)標(biāo)識(shí)碼:A

1引言

粗糙集在處理不精確、不相容、不完備數(shù)據(jù)中具有明顯的優(yōu)勢(shì)。粗糙集理論在模式識(shí)別、決策分析、數(shù)據(jù)分析處理、機(jī)器學(xué)習(xí)以及數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn)等多個(gè)領(lǐng)域得到了廣泛應(yīng)用。在當(dāng)前的粗糙集理論中,知識(shí)約簡(jiǎn)算法主要有三種:一種是按定義求解,而按照這種方法計(jì)算所有的約簡(jiǎn)已被證明是NP一完全問題,無法實(shí)際中得到應(yīng)用。另一種是1991年分辨矩陣求解,而這種方法在求解過程中,需要兩個(gè)不同決策對(duì)象的所有屬性值進(jìn)行逐一比較,這樣會(huì)產(chǎn)生海量矩陣元素,既占用非常大的存儲(chǔ)空問,且時(shí)空性能又差。近年來,很多學(xué)者對(duì)此方法作了大量改進(jìn),但還是存在一定的缺陷。2008年孟慶全,金傳山等從傳統(tǒng)的屬性依賴度概念出發(fā),對(duì)屬性集和屬性集依賴度兩個(gè)概念進(jìn)行了擴(kuò)展,提出了獨(dú)立于定義求解分辨矩陣法之外的新方法,即通過屬性依賴度求解屬性約簡(jiǎn)和知識(shí)核的新方法。而第三種屬性約簡(jiǎn)算法基本都是基于屬性重要性為主的一種算法,這類方法通常都會(huì)遇到如下兩個(gè)問題:

第一,屬性的重要性沒有統(tǒng)一的定義,使得約簡(jiǎn)結(jié)果存在一定的差別,甚至?xí)辜s簡(jiǎn)結(jié)果出現(xiàn)相互矛盾的情況;

第二,在約簡(jiǎn)屬性得重要性相等的情況下,其相對(duì)約簡(jiǎn)很難確定。

屬性相似度反映著粒度的相似程度,也反映著屬性之問的相似關(guān)系。為了解決以上存在的問題,夏克文博士從屬性相似度出發(fā),提出了一種基于屬性相似度的屬性約簡(jiǎn)算法,該算法不僅計(jì)算簡(jiǎn)便,同時(shí)還能區(qū)分不同約簡(jiǎn)的優(yōu)劣性,克服傳統(tǒng)的粗糙集屬性約簡(jiǎn)算法存在的缺點(diǎn)。

文獻(xiàn)雖然給出了一種基于屬性相似度的屬性約簡(jiǎn)算法,但該文只考慮了決策屬性與條件屬性之間的相似度問題。本文將定義條件屬性之間相似度及條件屬性與決策屬性問的一致度,利用一致度構(gòu)造屬性問的模糊相似矩陣,并用模糊聚類分析方法對(duì)屬性重要性做出分類,從而得到屬性的動(dòng)態(tài)分類圖,得到了與粗糙集屬性約簡(jiǎn)方法完全一致的結(jié)果。

2屬性一致度的概念與性質(zhì)

定義1 在一個(gè)信息系統(tǒng)(U,C,D)中,U為論域,即U={x1,x2,…,xn},C為條件屬性集,P,Q∈U,D為決策屬性集,定義屬性問的一致度(consistent degree)如下:

上述公式(1)對(duì)于條件屬性集C中的任意屬性與決策屬性問的一致度計(jì)算也適用。

條件屬性子集P∈C與D為決策屬性集的一致性σ(P,D)也可類似定義。

命題1在一個(gè)信息系統(tǒng)(U,C,D)中,U為論域,即U={x1,x2,…,xn},C為條件屬性集,且P,Q∈C,D為決策屬性集,屬性的一致度具有如下性質(zhì):

3一種基于屬性一致度的屬性約簡(jiǎn)算法

1)依據(jù)信息表,計(jì)算屬性的一致度。

2)依據(jù)屬性一致度,構(gòu)造屬性問關(guān)系模糊相似矩陣。

3)依據(jù)屬性問關(guān)系模糊相似矩陣,進(jìn)行模糊聚類分析。

4)依據(jù)聚類分析求屬性約簡(jiǎn),并確定核。

根據(jù)基于屬性一致度的屬性約簡(jiǎn)算法,通過表1樣本信息表,先給出對(duì)象集的按各個(gè)屬性的等價(jià)分類。按照定義1可得:

根據(jù)以上3.2給出的屬性問的一致度,可以構(gòu)造屬性問模糊相似矩陣:因?yàn)镽2≥R,因此R不是模糊等價(jià)矩陣。容易求得模糊相似矩陣R的傳遞閉包

這是一個(gè)模糊等價(jià)矩陣,求t(R)=R*的水平截集,得到動(dòng)態(tài)分類:

通過上面的例子,可以看出,條件屬性c2,c3與決策屬性D的一致度偏低,它們是必要屬性,構(gòu)成約簡(jiǎn)的核,c1,c4與決策屬性D的一致度高,在屬性約簡(jiǎn)時(shí),可以把條件屬性集中與決策屬性D一致度高的條件屬性約去,構(gòu)成最簡(jiǎn)屬性約簡(jiǎn)。

不難看出,{c1,c2,c3),{c4,c2,c3)是信息表1的兩個(gè)約簡(jiǎn),由于σ(c1,D)=0.8,

σ(c4,D)=1.0,因此{(lán)c4,c2,c3}是比{c1,c2,c3}更好的約簡(jiǎn),這與屬性分類動(dòng)態(tài)聚類圖是一致的。

4結(jié)束語

本文主要針對(duì)信息系統(tǒng)中的屬性相似度與屬性的約簡(jiǎn),對(duì)條件屬性之間的相似度、條件屬性與決策屬性間的一致度進(jìn)行定義,在此基礎(chǔ)之上,提出了一種基于屬性一致度的屬性約簡(jiǎn)算法。并根據(jù)給出的屬性一致度的基本性質(zhì),采用模糊聚類分析方法,對(duì)屬性重要性作了分類,得到了與粗糙集屬性約簡(jiǎn)方法一致的結(jié)果,表明了算法的有效性。

朔州市| 南宁市| 米易县| 拉萨市| 太原市| 徐州市| 阿克陶县| 遵义市| 桑植县| 青河县| 海宁市| 上思县| 蒙自县| 大城县| 郧西县| 绵竹市| 文山县| 开远市| 镇坪县| 长治县| 临安市| 昌黎县| 友谊县| 商水县| 卢湾区| 苏尼特左旗| 泰和县| 包头市| 运城市| 惠水县| 易门县| 鹤峰县| 曲麻莱县| 慈利县| 农安县| 景宁| 临澧县| 蒙自县| 华坪县| 东莞市| 旺苍县|