張凱+楊靖
摘 要:粗糙集理論是一種新的分析和處理不精確、不一致、不完整信息與知識的數(shù)學(xué)工具,為智能信息處理提供了有效的處理技術(shù),近年來,被廣泛應(yīng)用于專家系統(tǒng)、圖像處理、模式識別、決策分析等領(lǐng)域。文中介紹了關(guān)于粗糙集的基本理論,并對其在各領(lǐng)域的應(yīng)用情況進行了綜述。
關(guān)鍵詞:粗糙集理論;不確定性;知識約簡;粗糙模糊集
中圖分類號:TP18 文獻標(biāo)識碼:A 文章編號:2095-1302(2017)06-00-02
0 引 言
粗糙集理論由波蘭華沙理工大學(xué)Z.Pawlak教授于1982年首先提出,通過結(jié)合邏輯學(xué)和哲學(xué)中對不精確、模糊的定義,針對知識和知識系統(tǒng)提出了知識簡約、知識依賴、知識表達系統(tǒng)等概念,并在此基礎(chǔ)上形成了完整的理論體系——粗糙集理論。粗糙集理論把知識看作關(guān)于論域的劃分,認為知識是有粒度的,而知識的不精確性是由知識的粒度過大引起的。從1992年至今,每年都要以粗糙集為主題召開國際會議,近兩年,召開的關(guān)于粗糙集的會議有2015年國際粗糙集聯(lián)合會議(IJCRS2015)和2016年第十六屆中國粗糙集與軟計算聯(lián)合學(xué)術(shù)會議(CRSSC2016)。粗糙集越來越受到各行業(yè)專家和科研人員的重視,隨著對粗糙集理論研究的不斷加深,越來越多的領(lǐng)域開始運用粗糙集解決問題。
1 粗糙集理論
1.1 知識與知識系統(tǒng)
將研究對象構(gòu)成的集合記為U,這是一個非空有限集,稱為論域U,任何子集,稱其為U中的一個概念或范疇。把U中任何概念族都稱為關(guān)于U的抽象知識,簡稱知識。一個劃分定義為:X={X1,X2,…,Xn},,Xi≠φ,Xi∩Xj=φ,且i≠j,i,j=1,2,…,n;∪niXi=U。U上的一簇劃分稱為關(guān)于U的一個知識系統(tǒng)。
R是U上的一個等價關(guān)系,由它產(chǎn)生的等價類可記為[x]R={y|xRy,y∈U},這些等價類構(gòu)成的集合U/R={[x]R|x∈U}是關(guān)于U的一個劃分。若PR,且P≠φ,則∩P也是一種等價關(guān)系,稱為P上不可分辨關(guān)系,記為ind(P):。
1.2 粗糙集與不精確范疇
給定知識庫K=(U,Q),對于每個子集和一個等價關(guān)系R∈ind (Q),定義在知識系統(tǒng)U/R下集合X的下近似為:
上近似表示屬于X的對象組成的最小集合,即X的正域,記為POSR(X),而肯定不屬于X的對象組成的集合稱為X的負域,記為NEGR(X)。
在知識系統(tǒng)U/R下集合X的上近似為:
上近似是可能屬于X的對象組成的最小集合。集合X的邊界區(qū)域為:
邊界區(qū)域BNR(X)是根據(jù)知識R,U中既不能肯定包含于集合X,又不能肯定包含于集合的元素構(gòu)成的集合。
1.3 知識簡約與知識依賴
知識簡約,是在保持知識庫分類能力不變的條件下,刪除其中不相關(guān)或不重要的知識。令R為一簇等價關(guān)系,r∈C,若ind(R)=ind(R-r),則稱r為R中不必要的,若對于每一個r∈C都為R中必要的,則稱R為獨立的,否則稱R為依賴的。P中所有必要關(guān)系組成的集合稱為核,記為core (P)。
定義知識R對知識Q的依賴程度為:
顯然,0≤ξQ(R)≤1。當(dāng)ξQ(R)=1時,知識R完全依賴于知識Q;當(dāng)ξQ(R)→1時,說明定義知識R對知識Q的依賴程度高。ξQ(R)的大小從總體上反應(yīng)了知識R對知識Q的依賴程度。
1.4 知識表達系統(tǒng)
在粗糙集理論中,一個知識表達系統(tǒng)可表示為S=(U,R,V,f),為其中U為論域,R為屬性集合,V為屬性值集合,f為一個信息函數(shù),其對象的每個屬性賦予一個信息值。即。
決策表是一類特殊而重要的知識表達系統(tǒng)。設(shè)S=(U, R, V,f)為一個知識表達系統(tǒng),R=C∪D,C∩D=φ,稱C為條件屬性集,稱D為決策屬性集。具有條件屬性集和決策屬性集的知識系統(tǒng)稱為決策表。
2 粗糙集理論的應(yīng)用
粗糙集理論具有很強的實用性,目前在各領(lǐng)域已有諸多應(yīng)用。
2.1 故障診斷
文獻[1]中提出了一種基于粗糙集與證據(jù)理論的航空裝備故障診斷方法,利用粗糙集框架實現(xiàn)對故障診斷模型的構(gòu)造并對冗余信息進行簡約,通過邊界粗糙熵來衡量每個條件對決策的重要程度;文獻[2]利用變精度粗糙集和信息論中互信息增量的特性,針對傾轉(zhuǎn)旋翼機在過度轉(zhuǎn)換時的故障進行診斷,利用OMELM對變精度粗糙集屬性簡約進行故障分類。
2.2 圖像處理
粗糙集理論對不精確問題能夠提供較好的解決方法,文獻[3]將粗糙集理論與模糊聚類算法相結(jié)合用以解決圖像分割問題。文獻[4]依靠粗糙集對邊界區(qū)域近似有較好的解決能力,將粗糙集近似集與粒子群算法相結(jié)合來解決圖像分割問題,利用粗糙集理論得到圖像的最優(yōu)粒度,再通過粒度劃分得到圖像的近似集,從而利用近似集得到便捷的精準刻畫。
2.3 專家系統(tǒng)
粗糙集理論對規(guī)則的抽取有較好的應(yīng)用,因此能夠為專家系統(tǒng)的構(gòu)造提供理論基礎(chǔ)。文獻[5]利用粗糙集理論獲取知識,建立決策表,并利用可辨識矩陣對決策表進行條件屬性簡約,能夠獲得需要診斷的故障樹。
2.4 模式識別
文獻[6]中關(guān)于礦井突水問題,可利用粗糙集對非正態(tài)、非線性和高維數(shù)據(jù)的處理能力,對存在大量不明確對應(yīng)關(guān)系的特征進行簡約,剔除與決策無關(guān)的屬性,得到簡約樣本。
2.5 信息安全
在信息安全問題中,由于數(shù)據(jù)量大、信息種類繁多,無法形成統(tǒng)一閾值特性,所以很難針對不同種類的數(shù)據(jù)進行準確判斷。文獻[7]中提出了基于粗糙集合信息熵融合算法的入侵檢測方法,利用粗糙集分析復(fù)雜信息的能力,對多樣的入侵數(shù)據(jù)特征進行表達,構(gòu)建入侵特征集合,根據(jù)決策表求出必要的特征集合,以有效解決多樣數(shù)據(jù)檢測困難的問題,提高效率。
2.6 預(yù)測研究
文獻[8]將粗糙集與不同預(yù)測模型相結(jié)合,能夠更加準確的預(yù)測行業(yè)與個股新聞對股票價格的影響。文獻[9]將粗糙集與數(shù)據(jù)挖掘技術(shù)相結(jié)合來對滑坡變形階段進行預(yù)測,通過與多種方法對比,發(fā)現(xiàn)利用該方法計算的結(jié)果與專業(yè)人員現(xiàn)場勘查結(jié)果極度吻合。文獻[10]將模糊粗糙集理論與聚類算法相結(jié)合,對影響風(fēng)速的多種因素進行知識簡約,實驗證明該方法能夠有效提高風(fēng)速預(yù)測模型的精度。
2.7 決策分析
粗糙集理論在金融投資預(yù)測方面也起到了很大的作用,文獻[11]基于優(yōu)勢粗糙集建立了證券投資分析模型,能夠有效分析出股票的投資價值。文獻[12]運用多粒度粗糙集為決策問題提供了新的思路,將多粒度粗糙集運用到專家的綜合決策中并證明了研究的有效性。
2.8 風(fēng)險評估
每種風(fēng)險災(zāi)害都是由多種不確定因素引起的,并且各因素耦合度較高,均不利于對風(fēng)險的判斷。文獻[13]利用粗糙集對引起滑坡災(zāi)害風(fēng)險的多種因素進行表達,并建立決策表,證明了將粗糙集與GIS組合的方式能夠有效評估滑坡地質(zhì)災(zāi)害的風(fēng)險。文獻[14]利用直覺模糊粗糙集對自然災(zāi)害造成電網(wǎng)災(zāi)害的各種不確定因素進行評估,并成功應(yīng)用于遼寧雪災(zāi),取得了較好的效果。
3 結(jié) 語
在粗糙集理論發(fā)展的三十多年間,已取得了許多突破性研究成果,并成功運用到生活的各個方面。粗糙集能夠處理不完整、不精確的大量數(shù)據(jù),在實際應(yīng)用中,將粗糙集與各種不同分類方法相結(jié)合,能夠更快、更準確的提取出有用信息是未來研究的熱點之一。
參考文獻
[1]孫偉超,李文海,李文峰.融合粗糙集與D-S證據(jù)理論的航空裝備故障診斷[J].北京航空航天大學(xué)學(xué)報,2015,41(10):1902-1909.
[2]陳曉,王新民,黃譽,等.傾轉(zhuǎn)旋翼機飛控系統(tǒng)的變精度粗糙集-OMELM故障診斷方法[J].控制與決策,2015,35(3):433-440.
[3]馬文萍,黃媛媛,李豪,等.基于粗糙集與差分免疫模糊聚類算法的圖像分割[J].軟件學(xué)報,2014,25(11) : 2675-2689.
[4]姚龍洋,張清華,胡帥鵬,等.基于近似集與粒子群的粗糙熵圖像分割方法[J].計算機科學(xué)與探索,2016,10(5):699-708.
[5]李英順,姜雙雙,佟維妍,等.基于RST及FTA的綜合傳動裝置故障診斷專家系統(tǒng)的應(yīng)用研究[J].組合機床與自動化加工技術(shù),2014 (4):60-63.
[6]王江榮,黃建華,羅資琴,等.基于粗糙集的Logistic回歸模型在礦井突水模式識別中的應(yīng)用[J].煤田地質(zhì)與勘探,2015,43(6):70-74.
[7]何偉娜,褚龍現(xiàn),姜建國.混合型數(shù)據(jù)庫中入侵檢測技術(shù)仿真[J].計算機仿真,2015,32(11):425-428.
[8]徐偉,李韻喆.行業(yè)與個股新聞對股票價格影響的定量分析[J].經(jīng)濟界,2015(20):31-32.
[9]韓舸,龔?fù)瑓擎?,?利用粗糙集的滑坡分階段位移預(yù)測方法——以白家包滑坡為例[J].吉林大學(xué)學(xué)報(地球科學(xué)版), 2014,44(3): 925 -931.
[10]劉興杰,岑添云,鄭文書,等.基于模糊粗糙集與改進聚類的神經(jīng)網(wǎng)絡(luò)風(fēng)速預(yù)測[J].中國電機工程學(xué)報,2014,34(19):3162-3169.
[11]楊博翔.基于優(yōu)勢粗糙集的證券投資決策研究及應(yīng)用[J].山東農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版),2016,47(5):785-788.
[12]郭慶,吳磊.多粒度背景下直覺模糊信息系統(tǒng)的粗糙集及其決策[J].系統(tǒng)工程與電子技術(shù),2016,38(2):347-351.
[13]劉彥花,葉國華. 基于粗糙集與GIS的滑坡地質(zhì)災(zāi)害風(fēng)險評估[J].災(zāi)害學(xué),2015,30(2):108-114.
[14]劉鑫蕊,付倩,孫秋野,等.直覺模糊粗糙集理論在電網(wǎng)災(zāi)害評估中的應(yīng)用[J].中國電機工程學(xué)報,2015,35(22):5692-5702.