秦貞燕+王永麗+于慧慧+周杰
摘要:概率統計,模糊數學,灰色系統,粗糙集和未確知數學是目前存在的五種不確定性數學方法。本文針對不確定性信息及其數學方法的概念進行了闡述和分析,并且比較了五種方法的不同之處,使人們更清晰的認識和區(qū)分這五種不確定性數學方法及其應用領域。
關鍵詞:概率統計;模糊數學;灰色系統;粗糙集;未確知數學;不確定性信息
中圖分類號:TP273 文獻識別碼:A 文章編號:1001-828X(2016)009-000-03
Abstract: Probability statistics, fuzzy mathematics, gray system, rough sets and unascertained mathematics are five existing uncertainty mathematical methods at present. This text described and analyzed the concept and the mathematical methods of uncertain information,and compared the difference of five methods, to make people understand and distinguish these five uncertainty mathematical methods clearly.Probability statistics.
Keywords: Probability statistics; fuzzy mathematics; gray system; rough sets; uncertain information;
一、引言
經典數學的研究對象局限在確定性對象,因此人們又稱之為確定性數學。在信息多變的.時代,不確定現象無處不在,其存在形式各式各樣。人類在不斷認識世界和改造世界的過程中發(fā)現經典數學不再是解決問題的有效途徑。面對大量得不確定現象,如何從數學上定量的描述這些不確定現象,并研究不確定現象數量規(guī)律及優(yōu)化問題一直是人們追求的課題研究。在研究過程中,人們發(fā)現了信息的不確定性是多種多樣的,并將多樣的不確定性信息進行分類表述,就出現了信息的隨機性、模糊性、灰色性、粗糙性和未確知性,相關的概率統計、模糊數學、灰色系統、粗糙集和未確知數學學科也被專家一一提出,做了深入研究,并且取得良好的理論和應用成果[1,2,3]。
我們把研究自然社會中存在的不確定現象的數學理論和方法統稱為不確定數學。因此,概率統計、模糊數學、灰色系統、粗糙集和未確知數學學科都可以包含在不確定數學的范疇之中[4]。這五種學科是當前研究不確定性問題的不同的數學方法,這些學科的發(fā)展也就是反映了不確定性數學的發(fā)展。
二、不確定性信息
不確定性是指客觀事物在發(fā)展與聯系的過程中,存在無序的,或然的,未知的,近似的屬性。任何一個復雜的系統都存在不確定性因素,不確定性因素的產生不僅僅涉及主觀因素,還會涉及很多客觀因素,而且是兩者交互影響。由于信息的產生及其傳播的過程條件不同,不確定信息的表現會有不同的特征。根據這些不確定信息的表現特征,人們將已認識到的不確定性信息主要分為如下五種。
1.隨機信息
在隨機現象中,事件結果是確定的,由于偶然因素干擾,使得幾種確定結果呈或然性出現。即在某次試驗中事件在相同的情況下卻有不同的結果,這種試驗稱為隨機試驗。由隨機試驗得到的信息稱為隨機信息。如市場價格波動、彩票中獎情況等[5]。由隨機信息引起的不確定性稱為隨機不確定。
2.模糊信息
因為事物的復雜性,事物的自身概念外延不明確,即事物特征界限不明確,其概念不能準確的被描述和評定。事物從一方概念到另一方概念存在過渡的過程,它提供的很難說清邊界的的信息稱為模糊信息[6],如穩(wěn)定、不穩(wěn)定、健康、不健康等。由模糊信息引起的不確定性稱為模糊不確定。
3.灰色信息
在事物發(fā)展過程中,由于人們接收信息系統的能力有限,使得人們只能獲取事物發(fā)展的部分信息,而不能獲得全部的確切信息。即部分信息已知,部分信息未知[7]。這種外延明確內涵不明確的信息我們將之稱為灰色信息。如玉米的產量、金融市場中的股票市場等。由灰色信息引起的不確定稱為灰色不確定。
4.粗糙信息
由于不確定性,導致事物的不可辨性。事物的集合是明確,但其中所包含的元素是不明確的,這種信息被稱為粗糙信息。它與模糊信息的區(qū)別在于,模糊信息的集合邊界不確定。如人的外貌、人的品質。由粗糙信息引起的不確定性稱為粗糙不確定。
5.未確知信息
未確知信息是指因為條件的限制,在進行決策時,無法確知的信息[8]。這些信息既無隨機性,也無模糊性,它是由于決策者所掌握的信息不充足,不精確。以至不足以確定事物的真實狀態(tài)和數量關系。這種未確知信息可以帶來主觀認識上的不確定性。如地震的震源、一座已建成的建筑物的重量等。由未確知信息引起的不確定性稱為未確知不確定。
三、不確定性數學方法
1.概率統計
1657年,荷蘭著名數學家惠更斯就對隨機性進行研究,隨后前蘇聯數學家柯爾莫哥洛夫提出并建立的概率論。概率統計是以隨機現象為基礎。概率論是根據大量相同隨機現象的規(guī)律,對在隨機現象某一結果出現的的可能性給出客觀的科學的判斷,并且進行數量方面的描述[9]。
要研究一個隨機現象,首先要研究明白它服從的概率分布,但是在現實當中,有些隨機現象所服從的分布是什么概型可能完全不知道,有的根據現象自身的特點和已經發(fā)生出現的結果,我們可以推測出其服從的概型,卻不能確定其分布函數中所含的參數值。例如,某天某公路段所行駛每輛車的速度服從什么分布是完全不能知道的,某一商業(yè)部收購N件產品,每件產品不是合格就是不合格,顯然產品的是否合格得情況是服從二項分布,但分布中的參數P(不合格品率)卻是不知道的。為了要掌握上述車輛速度的分布、不合格品率,我們必須對這一公路上所行使的車輛速度及工業(yè)產品是否合格進行觀察和試驗。類似這種統計處理尋求參數值就是概率統計的應用之處。在數理統計的過程中,我們總需從待研究的全體對象中隨機或有目的地抽取一部分進行觀測或試驗以取得所需信息,從而對研究對象作出推斷。每個推斷都伴隨一定的概率用以表明推斷的可靠程度。像這種伴有一定概率的推斷稱為統計推斷[9]。數理統計中假設檢驗、參數估計、方差分析和回歸分析等思想也都達到成熟狀態(tài)并在氣象預測、保險工作、抽獎活動、質量判斷、游戲活動等方面得到了很好的應用。
2.模糊數學
1965年,扎德教授論文“模糊集合”的發(fā)表標志著模糊數學的誕生[10]。模糊集合的提出是模糊信息客觀存在的必然反映。面對模糊問題,如判斷生態(tài)環(huán)境是否文明,“生態(tài)文明”沒有一個確切衡量標準,怎樣才算是生態(tài)文明是無法說清楚的,也就不能用普通實數集合論里僅取0或1兩個值的特征函數來刻畫。為了解決類似問題中含有連續(xù)過渡的共性,扎德將普通集合論里的特征函數的取值范圍由{0,1}推廣到閉區(qū)間[0,1],用一個實數去度量它,這個實數值我們稱之為是隸屬度[6]。
定義1[6]設在論域U上給定了一個映射
則稱A為U上的模糊集,A(u)稱為A的隸屬度函數(或稱為u對A的隸屬度)。
隸屬度函數在模糊數學理論應用中占有至關重要的地位,是將模糊性運用數學方法來解決的關鍵媒介。隸屬度函數的確定,是一個比較復雜的問題,在許多實際情況下,通常根據經驗或統計規(guī)律來決定。
模糊數學有著相當豐富的研究內容,到目前為止,經典數學中的很多理論分支學科也進行模糊化,成為模糊數學學科的組成部分。如模糊關系、模糊矩陣、模糊變換、模糊拓撲空間、模糊圖論、模糊概率統計、模糊線性規(guī)劃、模糊邏輯、模糊變量、模糊博奕等。廣泛的模糊分支使模糊數學在生活中的很多方面得到了良好的應用。
3.灰色系統
1982年,鄧聚龍教授創(chuàng)立的灰色系統理論,是針對研究少數據、貧信息不確定性問題的新方法[7]?;疑到y的研究方法主要是通過對現有的“部分”已知信息的開發(fā),挖掘有效的信息,實現對系統運行行為、演化規(guī)律的正確描述和有效監(jiān)控。灰色系統理論重點研究的是具有“外延明確,內涵不明確”特點的對象。比如到2050年,中國將人口控制在15億到16億之間,這個“15億到16億之間”就是一個灰概念,其外延很清楚,但進一步問15億到16億之間的哪個具體值,則不清楚[11]。
灰色系統理論認為,盡管客觀事物的表面現象復雜,數據無序,它們總會蘊含著自身的特征規(guī)律,關鍵是如何選擇合適有效的方法去利用和挖掘信息。對數據構造不同的算子成是灰色系統處理信息的重要手段。
定義2 [11] 設初始數據序列為:X (0)(k)=(x(0)(1), x(0)(2), …, x(0)(n)),D為序列算子
X (0)D=(x(0)(1)d, x(0)(2)d, …, x(0)(n)d )
其中,。則稱D為X (0)的一次累加生成算子。X (0)D為X (0)的一次累加生成序列。
定義3[11] 設初始數據序列為:X (0)(k)=(x(0)(1), x(0)(2), …, x(0)(n)),D為序列算子
X (0)D=(x(0)(1)d, x(0)(2)d, …, x(0)(n)d )
其中:x(0)(k)d = x(0)(k)-x(0)(k-1);k=2,,3,…n
則稱D為X (0)的一次累減生成算子,X (0)D為X (0)的一次累減生成序列。
累加生成和累減生成是在灰色系統中使灰色信息變白化的一種方法,累加生成的數據可以用來描述灰色數據積累過程的發(fā)展勢態(tài),使不具有明顯規(guī)律的原始數據中蘊藏的累積特性充分顯現出來。累減生成也是在獲取增量信息時常用的一種手段,累減生成可以還原累加生成。累減生成與累加生成是一對互逆的序列算子,它們是構建GM(1,1)模型的理論基礎。
灰色系統在經典數學理論的基礎上生成了很多彼此相關的理論,包括灰數運算、灰色代數系統、灰色方程、灰色矩陣等。此外,灰色系統在實際應用方面也構建了許多經典模型,如用于系統診斷、分析的系統灰色關聯分析模型;用于解決系統要素和對象分類問題的灰色聚類評估模型;用于方案評估和選擇的灰靶決策和多目標加權灰靶決策模型,以及灰色規(guī)劃、灰色投入產出、灰色博弈、灰色控制等[7]。其中灰色系統理論在農業(yè)科學、經濟管理、環(huán)境與安全科學、天文和地球科學方面應用較為突出和廣泛。
4.粗糙集
在灰色系統成立的同時,1982年,Pawlak教授針對G.Frege的邊界線區(qū)域思想提出粗糙集理論[12]。與其他不確定方法不同,粗糙集的基本思想是用已有的知識庫中的知識和信息,通過等價關系來近似表示不確定的未知目標。上近似算子和下近似算子是粗糙集理論的基礎,是粗糙集依靠等價關系判定分類的手段。
定義4[13] 設U為一論域,R是U上的等價關系,對于任意XU,X基于等價關系R的下近似R(X )與上近似R(X )分別定義如下:
目前,粗糙集理論在現實中的應用研究主要集中在屬性約簡、規(guī)則獲取、基于粗糙集的計算智能算法等方面。粗糙集的知識約簡理論的發(fā)展為數據挖掘提供了一些有效的新方法。例如、數據分析法、基于信息熵的屬性約簡算法、動態(tài)約簡算法、增量式算法、可辨識矩陣算法等[12]。此外,粗糙集結合信息論、概念格、群體智能算法技術等也都有了顯著的的研究成果[14,15]。目前粗糙集理論的應用領域涉及決策分析系統、數據挖掘、模糊粗糙集控制、粗糙神經網,以及醫(yī)療診斷、專家系統等諸多方面。
5.未確知數學
1990年,我國學者王光遠教授提出了未確知信息,從而創(chuàng)立了未確知數學理論。未確知數學主要研究、表達和處理未確知信息的一種理論與方法。若想將未確知的事情變成已知,主觀概率和主觀隸屬度函數是未知數學的重要依據。所謂主觀概率[16],就是人們對某個未確知事件的各種可能情況為真幾率的主觀估計。因為有時候研究的是已發(fā)生的事件,因而沒有隨機性,又因為是一次性事件,因而主觀概率不存在任何統計的含義。主觀隸屬度[16]的產生是由于采用解決模糊性信息的手段來處理未確知的信息。例如,通過測量分析后,估計某一條河水的重量為3000噸左右。這個回答是用一個模糊量來估計大量液體的重量這個確定性的量。它純粹是回答者對該具體量的一種主觀上的粗略估計,因而稱為主觀隸屬度分布。
未確知數學也根據原數學的領域進行了推廣,建立了“未確知集合”、“未確知順序”、“未確知函數”、“未確知極限”等相關的數學內容。
四、五種不確定數學方法的比較
概率統計、模糊數學、灰色系統、粗糙集和未確知數學是當前存在的解決不確定問題的五種數學方法,他們彼此之間存有相似之處卻又彼此不同。而其研究對象都具有某種不確定性,這是他們的共同點。正是研究對象在不確定性上的區(qū)別,派生出五種各具特色的不確定性學科。綜上所述,我們可以把五種常用不確定性數學方法的區(qū)別歸納如表1所示。
五、小結
本文主要探討了五種不確定性數學方法的特點,并對其區(qū)別及其應用領域進行了總結。由于信息的復雜化,在很多情況下,多種不確定性信息相互參雜,因此出現了多種復合型不確定性數學方法。不確定數學方法應用領域非常廣泛,幾乎涉及到學科領域的各個角落,如經濟學、邏輯學、管理學、氣象學、醫(yī)學、情報學、系統論、控制論等方面,尤其在人工智能、工業(yè)生產、綜合評價、模式識別、聚類分析、層次分析等理論中應用顯著。概率統計和模糊數學理論提出較早,很多專家對這兩個不確定性數學方法內容研究深刻,所以該些方法的理論應用都達到了相對成熟的狀態(tài)。而灰色系統、粗糙集和未確知數學僅僅經過了二、三十年的研究,很多理論方法正在發(fā)展和完善過程中。
參考文獻:
[1]Wen-xiu Li,Dong-liang Qi,Shao-feng Zheng Fuzzy mathematics model and its numerical method of stability analysis on rock slope of opencast metal mine.Applied Mathematical Modelling, 2014.
[2]靖洪文,吳俊浩,馬波楊,圣奇.基于模糊灰色系統的深部巷道圍巖變形預測模型及應用[J].煤炭學報,2012.
[3]馬文萍,黃媛媛,李豪,李曉婷,焦李成.基于粗糙集與差分免疫模糊聚類算法的圖像分割[J].軟件學報,2014.
[4]李群..不確定性數學方法研究及其在經濟管理中的應用[D].大連理工大學,2002,1~2.
[5]王清印,劉志勇.不確定性信息的概念、類別及其數學表述[J].運籌與管理,2001.
[6]周浩亮.模糊數學基本理論及其應用[J].建井技術,1994(4、5).
[7]劉思峰.灰色系統理論的產生與發(fā)展[J].南京航空航天大學學報,2004.
[8]王光遠.未確知信息及其數學處理[J].哈爾濱建筑工程學院學報,1990.
[9]魏宗舒,黃先開.概率論與數理統計教程[M].北京:高等教育出版社,2008.
[10]石瑞民.模糊數學思想及與經典數學思想的辯證關系[J].中國人民公安大學學報,2003
[11]劉思峰,郭天榜,黨耀國.灰色系統理論及其應用(第七版)[M].北京:科學出版社,2014.i~ii.
[12]王國胤,姚一豫,于洪.粗糙集理論與應用研究綜述[J].計算機學報,2009.
[13]張文修,仇國芳.基于粗糙集的不確定決策[M].北京:清華大學出版社,2006.
[14]Li H R, Zhang W X, Wang H. Classification and reduction of attributes in concept lattices//Proceedings of the 2006 IEEE International Conference on Granular Computing (GrC.06). Georgia State University, Atlanta, USA, 2006:142-147.
[15]Liang J Y, Shi Z Z, Li D Y, Wireman M J. The information entropy, rough entropy and knowledge granulation in incomplete information systems. International Journal of General Systems, 2006, 34(1): 641-654.
[16]梁紅.未確知數學在地鐵工程施工安全評價中的應用研究[D].北京:中國地質大學,2010.28~19.
作者簡介:秦貞燕(1990–),女,山東濟寧,漢族,山東科技大學在讀研究生,研究方向:數據挖掘。王永麗(1977–),女,山東煙臺,漢族,山東科技大學副教授,主要從事最優(yōu)化理論與算法、支持向量機的研究。于慧慧(1991–),女,山東菏澤,漢族,山東科技大學在讀研究生,研究方向:分布式優(yōu)化。周 杰(1990–),男,山東濟寧,漢族,淄博礦助理工程師、技術員,工作方向:工程測繪。