国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

粗 糙 集 理 論 的 研 究 述 評

2011-04-12 10:09:58霍桂利
關(guān)鍵詞:模糊集約簡粗糙集

□霍桂利

(山西建筑職業(yè)技術(shù)學(xué)院,山西 太原 030006)

一、粗糙集理論

在經(jīng)典邏輯中,只有真、假值之分,但在現(xiàn)實(shí)生活中有許多含糊現(xiàn)象并不能簡單地用真、假值來表示,如何表示和處理這些現(xiàn)象就成為一個研究領(lǐng)域。長期以來許多邏輯學(xué)家和哲學(xué)家就致力于研究含糊概念。早在1904年謂詞邏輯的創(chuàng)始人G.Frege就提出了含糊一詞,他把它們結(jié)到邊境線上,也就是說在全域上存在一些個體既不能在其某個子集上分類,也不能在該子集的補(bǔ)集上分類。

1965年,Zadeh提出了模糊集,不少理論計算機(jī)科學(xué)家和邏輯學(xué)家試圖通過這一理論解決G.Fewge的含糊概念,故無法計算出它的具體的含糊元素數(shù)目,如模糊集中的隸屬函數(shù)和模糊邏輯中的算子都是如此。時隔20年后的80年代初,波蘭的Pawlak針對G.Frege的邊界線區(qū)域思想提出了粗糙集,他把那些無法確認(rèn)的個體都?xì)w屬于邊界線區(qū)域,而這種邊界線區(qū)域被定義為上近似集和下近似集之差集。由于它有確定的數(shù)學(xué)公式描述,所以含糊元素數(shù)目是可以計算的,即在真假二值之間的含糊度是可以計算的。粗糙集理論主要特點(diǎn)在于它恰好反映了人們用粗糙集方法處理不分明問題的常規(guī)性,即以不完全信息或知識去處理一些不分明現(xiàn)象的能力,或依據(jù)觀察、度量到的某些不精確的結(jié)果而進(jìn)行分類數(shù)據(jù)的能力。80年代以來經(jīng)過許多計算機(jī)科學(xué)家和數(shù)學(xué)家的不懈研究,粗糙集已經(jīng)從理論上日趨完善,特別是由于80年代末和90年代初在知識發(fā)現(xiàn)等領(lǐng)域得到了成功的應(yīng)用而越來越受到國際上的廣泛關(guān)注。相對于其他處理不確定性和模糊性的理論工具而言,粗糙集理論有著許多不可替代的優(yōu)越性。經(jīng)過近幾年的研究和發(fā)展,它已經(jīng)在信息系統(tǒng)分析、人工智能及應(yīng)用、決策支持系統(tǒng)、知識與數(shù)據(jù)發(fā)現(xiàn)、模式識別與分類、故障檢測等方面取得了較為成功的應(yīng)用。

粗糙集概念在某種程度上與許多其他為處理含糊和不精確性問題而研制的數(shù)學(xué)工具有相似之處,主要區(qū)別在于Dempster-Shafer理論利用信度函數(shù)作為主要工具,而粗糙集理論利用集合——下近似集和上近似集。另一種關(guān)系存在于模糊集理論和粗糙集理論之間。粗糙集理論與模糊集理論多方面對照,不是和模糊集競爭,而是補(bǔ)充它??傊植诩碚摵湍:碚搶τ诓煌耆闹R來說它們是各自獨(dú)立的方法。此外,有一些關(guān)系存在于粗糙理論和辨別式分析之間,于Boolean推理方法之間,于決策分析之間。

粗糙集理論的主要優(yōu)勢之一是它不需要任何預(yù)備的或額外的有關(guān)數(shù)據(jù)信息,比如統(tǒng)計學(xué)中的概率分布,Dempster-Shafer理論中的基本概率賦值,或者模糊集理論中的隸屬度或概率值。必須指出,粗糙集理論也不是萬能的,對建模而言,盡管粗糙集理論對知識不完全的處理是有效的,但是,由于這個理論未包含處理不精確或不確定原始數(shù)據(jù)的機(jī)制。因此,單純地使用這個理論不一定能有效地描述不精確或不確定的實(shí)際問題,這意味著,需要其他方法補(bǔ)充。一般地說,由于證據(jù)理論與模糊集理論等具有處理不精確和不確定數(shù)據(jù)的方法(盡管在描述上不一定方便),因此,將他們與粗粗集理論構(gòu)成互補(bǔ)是自然的考慮。為了能更好地理解粗糙集理論的本質(zhì)和特點(diǎn),本文介紹粗糙集理論的一些基本定義,目的在于闡明粗糙集的思想本質(zhì),以及與其他處理不確定性和模糊性數(shù)學(xué)工具的不同之處。

二、粗糙集的擴(kuò)展模型

在數(shù)據(jù)中存基本粗糙集理論和其他處理不精確與不確定的方法相比具有獨(dú)特之處,然而仍然存在著某些片面性與不足之處。目前,大多數(shù)成功的應(yīng)用都從不同的側(cè)面對基本粗糙集理論進(jìn)行了拓廣?;敬植诩碚撌羌僭O(shè)對于已知的對象全域擁有必要知識的前提之下的,是處理模糊性和不確定性的一種數(shù)學(xué)工具,本質(zhì)上可認(rèn)為是一種三值邏輯(正區(qū)域、邊界區(qū)域和負(fù)區(qū)域)?;敬植诩碚撝饕嬖谝韵聠栴}:(1)對原始數(shù)據(jù)本身的模糊性缺乏相應(yīng)的處理能力;(2)對于粗糙集的邊界區(qū)域的刻畫過于簡單;(3)粗糙集理論的方法在可用信息不完全的情況下將對象歸類于某一具體的類,通常分類是確定的,但并未提供數(shù)理統(tǒng)計中所常用的在一個給定錯誤率的條件下將盡可能多的對象進(jìn)行分類的方法,而實(shí)際中常常遇到這類問題。

三、基于粗糙集的非單調(diào)邏輯

自粗糙集理論提出以來,粗糙集理論的研究者都很重視它的邏輯研究,試圖通過粗糙集建立粗糙邏輯,也相應(yīng)地發(fā)表了一系列的粗糙邏輯方面的論文。如Z.Pawlak于1987年發(fā)表了題為“Rough Logic”的論文,他在這篇論文中給出了其邏輯公式的語義解釋:真、假、粗糙真、粗糙假和粗糙非一致性。這5種值可視為不同的近似程度,但他們?nèi)狈Υ_切的數(shù)學(xué)描述,認(rèn)為研究粗糙邏輯——基于粗糙集的不精確推理邏輯——可能是最重要的課題。T.Y.Lin和Q.Liu等人基于拓?fù)鋵W(xué)觀念定義了粗糙下近似算子L和粗糙上近似算子H,這兩個算子的語法性質(zhì)分別與模態(tài)邏輯的必然算子□和可能算子◇十分相似,因而帶有L和H算子的邏輯公式被稱為粗糙邏輯公式,并建立了與模態(tài)邏輯相似的公理化粗糙邏輯演繹系統(tǒng)和相平行的演繹規(guī)則,但由于其定義的一階粗糙邏輯在語義上,就L和H而言是含糊的,無法從數(shù)學(xué)上給出解釋。但其畢竟指出了研究的方向,亦即必須給出L和H的數(shù)學(xué)意義,這樣才能使得由L和H構(gòu)成的邏輯公式也有相應(yīng)的數(shù)學(xué)意義。進(jìn)而,基于粗糙集理論定義了近似度λ*和λ*,它和基于專業(yè)領(lǐng)域的不精確數(shù)和經(jīng)驗(yàn)數(shù)一起組成粗糙數(shù),并討論了粗糙邏輯的性質(zhì)和λ∈[λ*,λ*]在邏輯公式解釋上的價值。另外,1996年底在日本召開的第5屆國際粗糙集研討會上提出了一種精度算子粗糙邏輯(AORL),并給出其歸結(jié)推理的過程。

四、與其他數(shù)學(xué)工具的結(jié)合

粗糙集與Fuzzy集并非是對立的理論,兩者既互相區(qū)別,又互相補(bǔ)充。從根本上講,粗糙集體現(xiàn)了集合中對象間的不可區(qū)分性,即由于知識的力度而導(dǎo)致的粗糙性;而Fuzzy集則對集合中子類的邊界的不清楚定義進(jìn)行模型化,它體現(xiàn)的是隸屬邊界的模糊性。它們處理的是兩種不同的模糊和不確定性,兩者的有機(jī)結(jié)合可能更好地處理不完全知識。D.Dudios和H.Prade由此提出了粗糙Fuzzy Set和Fuzzy粗糙Set的概念。其主要思想是當(dāng)?shù)葍r關(guān)系使模糊集合的論域變得粗糙時,定義此模糊集合的相應(yīng)上近似和下近似;或者把等價關(guān)系弱化為模糊相似關(guān)系,從而得到一個更具表達(dá)力的粗糙模型。并通過相似關(guān)系對模糊集合的上近似和下近似的性質(zhì)進(jìn)行了詳細(xì)研究,指明了在不分明性和模糊謂詞同時存在的情況下,F(xiàn)uzzy粗糙Set概念在邏輯推理方面的潛在用途。D.Dudios和H.Prade同時指出,Shafer的證據(jù)理論和Z.Pawlak的粗糙集理論是不同術(shù)語下的同一模型。A.Skowron和J.Grazymala-Buss給出了更具體的結(jié)論。他們認(rèn)為,粗糙集理論可以看作證據(jù)理論的基礎(chǔ)。并在粗糙集理論的框架上重新解釋了證據(jù)理論的基本概念,特別是用上近似和下近似的術(shù)語解釋了信念(belief)和似然(plausibility)函數(shù),進(jìn)而討論了兩者之間的互補(bǔ)問題。

五、粗糙集的實(shí)驗(yàn)系統(tǒng)

粗糙集理論已經(jīng)被證實(shí)在實(shí)踐中是非常有用的,從大量的現(xiàn)實(shí)生活中應(yīng)用的記錄來看已經(jīng)非常明顯。這一理論對于認(rèn)知科學(xué)尤為重要,在決策支持、專家系統(tǒng)、歸納推理、開關(guān)電路等方面有了重要的應(yīng)用。近年來,粗糙集理論在數(shù)據(jù)庫領(lǐng)域知識發(fā)現(xiàn)(KDD)中的應(yīng)用取得了較大的進(jìn)展,基于粗糙集理論的方法逐漸成為KDD主流方法之一。知識發(fā)現(xiàn)或數(shù)據(jù)庫的數(shù)據(jù)挖掘是AI的一個相對新的子領(lǐng)域,它涉及到從不斷增長的企業(yè)信息數(shù)據(jù)庫中挖掘出額外的非平凡的知識。在這方面,主要任務(wù)之一是內(nèi)部數(shù)據(jù)之間的關(guān)聯(lián)和關(guān)系。但是,盡管粗糙集理論對模糊和不完全知識的處理比較出色,但其對于原始模糊數(shù)據(jù)的處理能力較弱。因此和其他方法如模糊數(shù)學(xué)、神經(jīng)網(wǎng)絡(luò)等結(jié)合將會取得更好的效果?;诖植诩腒DD系統(tǒng)一般都由數(shù)據(jù)預(yù)處理、基于粗糙集或其擴(kuò)展理論的數(shù)據(jù)約簡、決策算法等部分組成。其大概思想是先進(jìn)行必要的數(shù)據(jù)預(yù)處理,為數(shù)據(jù)約簡做準(zhǔn)備,然后求出約簡或近似約簡,并在此基礎(chǔ)上根據(jù)值約簡等減少屬性和個體數(shù)目,最終提取規(guī)則并將之應(yīng)用于新對象的分類。

在過去幾年中,建立了不少基于粗糙集的KDD系統(tǒng),其中最有代表性的有LERS、ROSE、KDD-R和Rough Enough等。

LERS。LERS(Learning from Examples based on Rough Set)系統(tǒng)是美國Kansas大學(xué)開發(fā)的基于粗糙集的實(shí)例學(xué)習(xí)系統(tǒng)。它是用Common Lisp在VAX9000上實(shí)現(xiàn)的。LERS已經(jīng)為NASA的Johnson空間中心應(yīng)用了多年,它是作為一種開發(fā)專家系統(tǒng)的工具被應(yīng)用的,這種類型的專家系統(tǒng)大多數(shù)可能被應(yīng)用于醫(yī)療決策。此外,LERS還被廣泛地用于環(huán)境保護(hù)、氣候研究和醫(yī)療研究。

ROSE。波蘭Poznan科技大學(xué)基于粗糙集開發(fā)了ROSE(Rough Set data Explorer),用于決策分析。它是Rough Das & Rough Class系統(tǒng)的新版,其中Rough Das執(zhí)行信息系統(tǒng)數(shù)據(jù)分析任務(wù),Rough Class支持新對象的分類,這兩個系統(tǒng)已經(jīng)在許多實(shí)際領(lǐng)域中得到應(yīng)用。ROSE是運(yùn)行在PC兼容機(jī)Windows/NT上的交互式軟件系統(tǒng)。ROSE的計算模塊具有如下特征:數(shù)據(jù)校驗(yàn)和預(yù)處理;采用Fayyad和Irani離散化算法對連續(xù)值進(jìn)行自動離散化處理;用標(biāo)準(zhǔn)的粗糙集模型或可變精度粗糙集模型對條件屬性進(jìn)行定性評估;用Romanski和Skowron等人的算法發(fā)現(xiàn)屬性核及信息表的約簡;考察屬性對目標(biāo)分類的相對重要性;選擇最重要的屬性進(jìn)行目標(biāo)分類,刪除冗余屬性;用LEM2算法或Explore算法獲取決策規(guī)則;獲取規(guī)則的后處理;用決策規(guī)則對新目標(biāo)進(jìn)行分類;用K疊交叉驗(yàn)證方法對決策規(guī)則集進(jìn)行評價。

ROSE的信息表數(shù)據(jù)采用ISF(information system file)文件格式,是一種純文本格式。屬性分為條件屬性和決策屬性。

KDD-R。KDD-R是由加拿大的Regina大學(xué)開發(fā)的基于可變精度粗糙集模型,采用知識發(fā)現(xiàn)的決策矩陣方法開發(fā)了KDD-R系統(tǒng),這個系統(tǒng)被用來對醫(yī)學(xué)數(shù)據(jù)分析,以此產(chǎn)生癥狀與病癥之間新的聯(lián)系,另外它還支持電信工業(yè)的市場研究。該系統(tǒng)由四部分組成:數(shù)據(jù)預(yù)處理;基于VPRS模型的屬性依賴分析和消除冗余屬性;規(guī)則提??;決策。

六、粗糙集的展望

粗糙理論在許多實(shí)際生活中是完備和十分有用的。粗糙理論提供了在許多分枝上應(yīng)用的有效的方法。粗糙理論的粗糙邏輯的研究是值得重視的課題,因?yàn)檫@種邏輯將使單調(diào)邏輯非單調(diào)化,從而在AI的近似或不精確推理中將發(fā)揮出不可估量的作用,可見基于粗糙集方法的不精確推理的粗糙邏輯的研究將是十分有前途的。粗糙集理論的另一項(xiàng)重要的課題則是粗糙函數(shù)的理論和實(shí)踐的研究。粗糙函數(shù)的各種近似運(yùn)算,粗糙函數(shù)的基本性質(zhì),關(guān)于他的粗糙連續(xù),粗糙可導(dǎo),粗糙積分和粗糙穩(wěn)定性,粗糙函數(shù)控制及建立由粗糙是函數(shù)控制的離散動態(tài)系統(tǒng)等都是典型的問題,這些問題都要求在粗糙理論的模型下,給予公式化。這些問題的研究將對定性推理方法的研究有所貢獻(xiàn)。這些研究實(shí)質(zhì)上是使數(shù)學(xué)離散化。如此,連續(xù)數(shù)學(xué)也能被現(xiàn)代計算機(jī)所接受。

基于粗糙理論集的控制也是一個非常有前途的應(yīng)用領(lǐng)域,而粗糙集理論對于神經(jīng)網(wǎng)絡(luò)和遺傳算法的開發(fā)也很重要。如何將粗糙集理論,模糊集理論,證據(jù)理論和概率論等不確定的理論用一個同意的邏輯模型來解釋也是很值得研究的。

目前,粗糙集理論的研究還有幾個領(lǐng)域比較引人注目:(1)在繼承原始粗糙集模型的基本教學(xué)性質(zhì)的前提之下,研究如何擴(kuò)展模型,以更好地用于數(shù)據(jù)壓縮與信息分析等。(2)在分布式粗糙集環(huán)境下,不完全的或不確定的知識表示和多Agent之間知識轉(zhuǎn)換問題。(3)在特定代數(shù)結(jié)構(gòu)上,如何引入上近似與下近似的概念,并研究其數(shù)學(xué)性質(zhì),例如研究概念格結(jié)構(gòu)上的粗糙集運(yùn)算的定義以及相互關(guān)系等。(4)粗糙集理論與形式語言之間關(guān)系的研究等。

從數(shù)據(jù)庫知識發(fā)展角度看也有一些可能的研究方向和應(yīng)用領(lǐng)域:高效約簡算法。高效的簡約算法是粗糙集應(yīng)用于只是發(fā)展的基礎(chǔ),目前尚不存在一種非常有效的方法。因此,尋求快速的簡約算法及增量版本仍然是主要研究方向之一。大數(shù)據(jù)集問題。現(xiàn)實(shí)中的數(shù)據(jù)庫已經(jīng)越來越大,粗糙集理論如何應(yīng)付這一挑戰(zhàn)仍舊是一個問題。雖然現(xiàn)在已經(jīng)有一些有益的探索,但是還是沒有找到一種令人滿意的方法??赡艿慕鉀Q方案有采樣,并行化等,更需要發(fā)展相應(yīng)的算法。多方法融合。現(xiàn)在有許多種數(shù)據(jù)挖掘方法。實(shí)驗(yàn)表明,還沒有一種方法在所有的測試集上都表現(xiàn)出眾。因此多種方法的融合可能是進(jìn)一步提高分類效率的途徑之一。

參考文獻(xiàn):

[1]王清毅, 張波, 蔡慶生.目前數(shù)據(jù)挖掘算法的評價[J].小型微型計算機(jī)系統(tǒng),2000,(3).

[2]胡侃, 夏紹瑋.基于大型數(shù)據(jù)倉庫的數(shù)據(jù)采掘研究綜述[J].軟件學(xué)報,1998, (1).

[3]陸建海,劉海峰. 數(shù)據(jù)庫中廣義模糊關(guān)聯(lián)規(guī)則的挖掘[J].工程數(shù)學(xué)學(xué)報,2000,(1).

[4]馬洪文,王萬學(xué),李振江.廣義模糊關(guān)聯(lián)規(guī)則的挖掘[J].黑龍江商學(xué)院學(xué)報,2000,(2).

猜你喜歡
模糊集約簡粗糙集
基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
基于上下截集的粗糙模糊集的運(yùn)算性質(zhì)
基于二進(jìn)制鏈表的粗糙集屬性約簡
實(shí)值多變量維數(shù)約簡:綜述
基于模糊貼近度的屬性約簡
E-不變凸模糊集
多粒化粗糙集性質(zhì)的幾個充分條件
雙論域粗糙集在故障診斷中的應(yīng)用
兩個域上的覆蓋變精度粗糙集模型
E-廣義凸直覺模糊集①
土默特左旗| 莱州市| 莒南县| 格尔木市| 磐石市| 孝义市| 晋中市| 沙湾县| 千阳县| 鄢陵县| 阜平县| 荆门市| 瓮安县| 扎兰屯市| 灌云县| 镇远县| 鹿泉市| 墨玉县| 汽车| 崇文区| 越西县| 上高县| 长治县| 星子县| 鹰潭市| 中宁县| 新津县| 台州市| 阿拉尔市| 竹溪县| 昌黎县| 平和县| 娱乐| 湖口县| 米泉市| 赣州市| 桂林市| 洛隆县| 云南省| 万源市| 泸定县|