徐偉華,李澤峰,黃旭東
(西南大學(xué) 人工智能學(xué)院,重慶 400715)
1982年波蘭數(shù)學(xué)家Z.Pawlak[1-2]發(fā)表經(jīng)典論文Rough sets,標(biāo)志著粗糙集理論的誕生。粗糙集已經(jīng)逐漸成為人工智能中的一個重要分支[3]。近年來粗糙集理論廣泛應(yīng)用于各個領(lǐng)域,如計算機(jī)網(wǎng)絡(luò)[4]、圖像處理[5]、數(shù)據(jù)挖掘[6]和醫(yī)學(xué)科學(xué)[7]等。由于經(jīng)典的Pawlak粗糙集理論需要嚴(yán)格的等價關(guān)系,因此只能挖掘具有分類屬性的信息系統(tǒng)中的知識。為了處理其他屬性的信息系統(tǒng),研究人員將鄰域關(guān)系、模糊等價關(guān)系、優(yōu)勢關(guān)系和相似關(guān)系引入到了Pawlak粗糙集中,建立了鄰域粗糙集[8]、模糊粗糙集[9]、基于優(yōu)勢關(guān)系的粗糙集模型[10]和基于相似關(guān)系的粗糙集模型[11]。這些廣義粗糙集模型已廣泛應(yīng)用于屬性約簡[12-14]、規(guī)則提取[15]、決策理論[16-17]、增量學(xué)習(xí)[18]等。
屬性約簡是粗糙集理論中一個重要的研究范疇[3,19-20]。屬性約簡的原則是在不削弱分類器的分類能力的情況下,刪去不重要的屬性。通過刪去不重要的屬性,可以減少數(shù)據(jù)的計算量,提高運(yùn)算效率。目前,很多學(xué)者提出了一些新的屬性約簡算法,例如Hu等[21-22]提出的基于鄰域粗糙集模型的屬性約簡算法和基于模糊決策系統(tǒng)可分性的快速魯棒屬性約簡,Chen等[23]提出的區(qū)間值決策信息系統(tǒng)下的屬性約簡算法等。
在實際生活中,許多復(fù)雜問題都是基于模糊序關(guān)系的,甚至是不協(xié)調(diào)的。信息系統(tǒng)的序關(guān)系不同于等價關(guān)系的劃分,其結(jié)果往往對對象形成的是覆蓋而不是劃分。另外,不協(xié)調(diào)系統(tǒng)是指基于條件屬性和決策屬性所做出的樣本分類不一致的系統(tǒng)。因此,從這些復(fù)雜的信息系統(tǒng)中提取有效的確定性命題,屬性約簡是非常有必要的。在屬性約簡的過程中,人們往往對于部分關(guān)鍵屬性有所偏好。為了深入刻畫這一概念,本文在模糊序關(guān)系的基礎(chǔ)上,提出了屬性權(quán)重向量的概念,并利用屬性權(quán)重向量對關(guān)鍵屬性值的影響力進(jìn)行加強(qiáng),研究了這一復(fù)雜信息的分配約簡,所獲結(jié)果進(jìn)一步豐富了粗糙集理論。
決策信息系統(tǒng)是由若干個條件屬性和若干個決策屬性組成的一種特殊的信息系統(tǒng),其所研究的主要問題即為條件屬性和決策屬性之間的關(guān)系。下面將給出一些基本概念。
定義1[19]設(shè)I=(U,AT,DT,F,G)是一個5元決策屬性系統(tǒng);(U,AT,F)為3元信息系統(tǒng)。其中:稱AT為有限條件屬性集AT={a1,a2,…,an},DT為目標(biāo)屬性集DT={d1,d2,…,dm},U是有限對象集U={x1,x2,…,x|U|},F(xiàn)是U與AT的關(guān)系集,F={fk;U→Vk|k≤n},Vk是ak的有限值域;G是U與DT的關(guān)系集,G={gi;U→Vi|i≤m}};Vi是di的有限值域。
定義2[24]設(shè)I={U,AT,DT,F,G}為決策信息系統(tǒng),如果對任意f∈F,g∈G,a∈AT,以及?d∈DT,x∈U都有
f(x,a)=μa(x),
g(x,d)∈R(R為實數(shù)集),
其中,μa∶U→[0,1]稱為x∈U在條件屬性a下的隸屬度。則稱滿足上述條件的I為模糊決策信息系統(tǒng),用I+={U,AT∪DT,F,G}表示。
定義3設(shè)WT={w1,…wn}為對應(yīng)的條件屬性a(∈AT)所對應(yīng)的權(quán)重,其中:對于?wt∈Wt,有wt≥0,并且須滿足w1+w2+…+wn=1。下面給出A(?AT)的得分函數(shù)KA(x)的定義為
其中:J=|A|表示集合A中的元素個數(shù),μt=f(x,a),a∈A。
當(dāng)一個條件屬性越重要時,它所對應(yīng)的權(quán)重值也就越大;反之,它所對應(yīng)的權(quán)重值也就越小。
定義4[19]設(shè)I+={U,AT∪DT,F,G}是一個模糊決策信息系統(tǒng),對于?g∈G,?a∈AT,?d∈DT,?xi,xj∈U,都有
f(xi,a)≥f(xj,a)?Ka(xi)≥Ka(xj),
g(xi,d)≥g(xj,d),
則稱該系統(tǒng)為模糊序決策信息系統(tǒng)。
在條件屬性a的值域中可能存在遞增的偏序關(guān)系,也可能存在遞減的偏序關(guān)系。如果在某一個條件屬性的值域中存在遞增或遞減的偏序關(guān)系,則稱此條件屬性為模糊決策信息系統(tǒng)的一個準(zhǔn)則。全部的準(zhǔn)則構(gòu)成的集合稱之為準(zhǔn)則集。
下文中,只討論由遞增偏序關(guān)系構(gòu)成的優(yōu)勢關(guān)系。
下面在帶有屬性偏好的模糊序決策信息系統(tǒng)中給出的優(yōu)勢關(guān)系為
例1表1給出了一個帶有屬性偏好的模糊決策信息系統(tǒng)。U={x1,x2,…,x6},AT={a1,a2,a3},DT=syggg00,WT={w1,w2,w3},其中:w1=0.5,w2=0.3,w3=0.2。
根據(jù)帶有屬性偏好的模糊優(yōu)勢關(guān)系的定義可以得到:
下面給出帶有屬性偏好模糊序決策信息系統(tǒng)的分配函數(shù)的定義。
例2根據(jù)表1給出的帶有屬性偏好的信息系統(tǒng)計算分配約簡,記:
則有:
證明必要性:反證法。
證明必要性:
充分性:
由上面定理3和定義8有下面結(jié)論。
例3對于表1給出的帶有偏好的模糊決策信息系統(tǒng),接下來計算其分配辨識矩陣(見表2)。
由定理4可得
由以上公式可知該系統(tǒng)的分配約簡與例2中的結(jié)果是一致的。
現(xiàn)實生活中,決策者對系統(tǒng)的每個屬性可能具有不同重視程度。為此,本文在模糊序決策信息系統(tǒng)中結(jié)合權(quán)重向量的概念,對每個屬性賦予合適的權(quán)值,建立了一種新的權(quán)重函數(shù)。進(jìn)一步,提出模糊序決策信息系統(tǒng)的分配約簡,并給出其判定定理和求解方法。最后,通過實例驗證了該方法的有效性。然而在具體的應(yīng)用中,主要的分配約簡方法還是依靠專家系統(tǒng)的數(shù)據(jù)和決策者自身經(jīng)驗給出屬性的重要程度。如何科學(xué)的給出屬性的權(quán)重向量將是下一步研究的主要課題。