李國平,楊風(fēng)暴,吉琳娜,王肖霞
(1.中北大學(xué) 信息與通信工程學(xué)院,山西 太原030051 ;2.中北大學(xué) 理學(xué)院,山西 太原 030051)
可能性理論是由美國著名控制論專家L.A.Zadeh 于1978年提出的,它可以描述模糊性和認(rèn)知不確定性,以及能量化不確定性[1].可能性分布是可能性理論中的一個(gè)重要概念,它在可能性理論中的作用如同概率分布在概率論中的作用一樣.用可能性分布構(gòu)造自然語言表示的命題和概念,從而可對它們進(jìn)行定量分析.因此,可能性分布的構(gòu)造會(huì)直接影響到可靠性分析,產(chǎn)品設(shè)計(jì)優(yōu)化等的結(jié)果.可能性分布的構(gòu)造方法文獻(xiàn)中常見的是利用構(gòu)造隸屬函數(shù)的方法直接生成相應(yīng)的可能性分布函數(shù)[2-3],也有用概率/可能性相容原理利用概率分布轉(zhuǎn)換為可能性分布[4-9].文獻(xiàn)[10]利用線性回歸得到了梯形模糊數(shù);文獻(xiàn)[11]通過乘冪型分布構(gòu)造了基于庫水位的壩體安全等級的可能性分布;文獻(xiàn)[12]介紹了基于可能性中值的可能性分布構(gòu)造方法;文獻(xiàn)[13]詳細(xì)描述了三角形和梯形可能性分布的具體情況.
在實(shí)際問題中,由于許多可能性分布規(guī)律符合線性回歸模型,且可能性分布一般描述一個(gè)自變量與因變量的對應(yīng)關(guān)系,故本文基于一元線性回歸構(gòu)造可能性分布.若多個(gè)自變量同時(shí)影響因變量時(shí),可將多元轉(zhuǎn)化為一元來考慮,因?yàn)橐辉€性回歸模型比多元線性回歸模型更容易建立,且計(jì)算復(fù)雜度低,在實(shí)際問題中更具普適性.然而,并非所有變量之間的關(guān)系都是線性的,若問題中觀測值的散點(diǎn)圖大致呈某一曲線,又存在某種變換,可將該曲線轉(zhuǎn)換成直線,就可以選擇該變換將具有約束條件的非線性回歸問題轉(zhuǎn)換成線性回歸問題[14],從而利用線性回歸的一些結(jié)果來解決這一問題.
可能性分布的構(gòu)造方法有很多,本文針對近似服從一條直線或曲線的一系列離散數(shù)據(jù),通過一元線性回歸構(gòu)造這類數(shù)據(jù)的可能性分布.
回歸分析就是建立變量間相關(guān)關(guān)系的具體的數(shù)學(xué)表達(dá)形式.在一元線性回歸分析中,通??紤]兩個(gè)變量:一個(gè)是自變量x,另一個(gè)是因變量y.對給定的x 值,y 值不能事先確定,故y 是隨機(jī)變量,具有不確定性.
假設(shè)y 與x 有如下的相關(guān)關(guān)系:
式中:a,b 為常數(shù);ε 是一個(gè)隨機(jī)變量且服從正態(tài)分布N(0,σ2),即ε~N(0,σ2).
式(1)稱為一元線性回歸模型.當(dāng)x 取固定數(shù)值時(shí),y~N(a+bx,σ2),y 的數(shù)學(xué)期望為E(y)=a+bx,回歸方程為
稱此方程為y 關(guān)于x 的回歸直線方程,它反映出了E(y)隨x 變化的規(guī)律.
這里,a 和b 的最小二乘估計(jì)為
σ2的無偏估計(jì)量
在前面的討論中,假設(shè)y 關(guān)于x 的回歸為x的線性函數(shù),然而在實(shí)際應(yīng)用中還需通過實(shí)踐來回答回歸方程所描述變量之間關(guān)系的合理性,也可用統(tǒng)計(jì)方法對回歸方程進(jìn)行檢驗(yàn).常用的有t檢驗(yàn)法,F(xiàn) 檢驗(yàn)法和r 檢驗(yàn)法,而且這三種檢驗(yàn)的結(jié)果是完全一致的[14].在實(shí)際的顯著性檢驗(yàn)中,任取一種加以應(yīng)用即可.
在實(shí)際問題中,有許多回歸模型中的自變量和因變量的關(guān)系并非是線性的,但因變量或因變量的轉(zhuǎn)換形式與某些未知參數(shù)的關(guān)系卻是線性的,可通過適當(dāng)?shù)淖兞看鷵Q,將非線性模型轉(zhuǎn)化為一元線性回歸模型.幾種常見的非線性模型及其線性化方法如表1 所示.
表1 幾種常見的非線性模型及其線性化方法Tab.1 Several kinds of common nonlinear model and its linearization method
基于一元線性回歸的可能性分布構(gòu)造的具體步驟如下:
1)根據(jù)實(shí)驗(yàn)或統(tǒng)計(jì)數(shù)據(jù)畫出散點(diǎn)圖.
2)根據(jù)散點(diǎn)圖中散點(diǎn)的分布特點(diǎn),從表1 幾種模型中選出最佳模型.
3)利用最小二乘法估計(jì)最佳模型中的未知參數(shù),進(jìn)而求出回歸方程.
4)利用上面提到的檢驗(yàn)法對回歸方程中的參數(shù)進(jìn)行回歸效果的顯著性檢驗(yàn).
5)將回歸方程轉(zhuǎn)化為可能性分布函數(shù).
設(shè)論域X=[0,100],在X 上定義一個(gè)“年老”的模糊集A,由于人們對“年老”的理解不一樣,因此選擇不同層次的人進(jìn)行問卷調(diào)查.在說明“年老”的含義后,請他們填調(diào)查表.統(tǒng)計(jì)結(jié)果顯示:不大于50 歲不是年老,大于70 歲人們才會(huì)認(rèn)為是“年老”,而區(qū)間[51,70]則是年齡的一個(gè)過渡期[15].人們認(rèn)為“年老”的可能性程度如表2所示,試求“年老”的可能性分布函數(shù).
表2 年齡[51-70]歲屬于“年老”的可能性程度Tab.2 Possibility degrees of age[51-70]belonging to the“old”
由表2 所給的數(shù)據(jù),可在二維直角坐標(biāo)系中畫出一個(gè)散點(diǎn)圖,如圖1 所示.
圖1 年齡[51-70]歲屬于“年老”的可能性程度散點(diǎn)圖Fig.1 Scatter plot of possibility degrees of age[51-70]belonging to the“old”
由散點(diǎn)圖可以看出,數(shù)據(jù)觀測點(diǎn)大致分布在一條直線附近,并圍繞直線上下波動(dòng),具有不確定性,這表明y 與x 之間存在一種線性關(guān)系.為此,可設(shè)由此可以建立y 對 x 的經(jīng)驗(yàn)回歸直線方程=-2.524 3 +0.050 4x.實(shí)際上,所謂經(jīng)驗(yàn)回歸直線方程,就是一條在最小二乘意義下擬合這些觀測數(shù)據(jù)的最優(yōu)直線.圖1 給出了原始數(shù)據(jù)的散點(diǎn)所擬合的直線.
下面用t 檢驗(yàn)法檢驗(yàn)上例中的回歸效果是否顯著(取α=0.05).
在α=0.05 下,檢驗(yàn)假設(shè)
檢驗(yàn)統(tǒng)計(jì)量為
拒絕域?yàn)?/p>
這里
所以,拒絕H0∶b=0,接受H1∶b ≠0,即認(rèn)為回歸效果是顯著的.從而“年老”的可能性分布函數(shù)為
式中:x 表示年齡且為自然數(shù).
本例也可用F 檢驗(yàn)法,r 檢驗(yàn)法對回歸效果進(jìn)行顯著性檢驗(yàn).通過計(jì)算,檢驗(yàn)結(jié)果完全一致.
以上討論了一元線性回歸的問題,在實(shí)際中常會(huì)遇到更為復(fù)雜的回歸問題,在某些情況下,可通過適當(dāng)?shù)淖兞縼碜儞Q,將它化成一元線性回歸處理,下面舉例說明.
設(shè)論域U={打火機(jī)},試用模糊統(tǒng)計(jì)試驗(yàn)建立A=“優(yōu)質(zhì)打火機(jī)”的可能性分布函數(shù).由于全國各地工廠的生產(chǎn)規(guī)模、生產(chǎn)水平和技術(shù)高低不同,人們對模糊概念“優(yōu)質(zhì)”的理解也不同,一般認(rèn)為打火機(jī)打火500 次就算質(zhì)量好了.作者向來自全國各地各階層的150 人進(jìn)行了問卷調(diào)查,在說明優(yōu)質(zhì)打火機(jī)的含義以后,請他們填寫表3.在收回詢問表后作出統(tǒng)計(jì),結(jié)果如表4 所示.
表3 “優(yōu)質(zhì)打火機(jī)”含義的調(diào)查表Tab.3 Questionnaire of the meaning of“high quality lighter”
表4 150 人對于“優(yōu)質(zhì)打火機(jī)”含義的統(tǒng)計(jì)Tab.4 The statistics of the meaning of“high quality lighter”for 150 persons
按表4 的累計(jì)頻率可以作出A(優(yōu)質(zhì)打火機(jī))的可能性分布函數(shù)的散點(diǎn)圖,如圖2 所示.由圖2可以看出,πA(x)隨x 的變化呈現(xiàn)對數(shù)規(guī)律,因此選擇對數(shù)模型πA(x)=a+bln x(b >0).令z=πA(x),t=ln x,則有z=a+bt,按表4 給出的數(shù)據(jù),計(jì)算得到表5.
表5 對數(shù)模型變換后的對應(yīng)值Tab.5 Corresponding values after logarithm model transformation
圖2 “優(yōu)質(zhì)打火機(jī)”的可能性分布散點(diǎn)圖Fig.2 Scatter plot of possibility distribution of“high quality lighter”
由表5 通過計(jì)算可得
因此線性回歸方程為
下面在顯著性水平α=0.05 下檢驗(yàn)假設(shè)H0∶b=0,H1∶b ≠0.采用r 檢驗(yàn)法進(jìn)行檢驗(yàn),現(xiàn)在n=15,n -2=13,查相關(guān)系數(shù)臨界值表[14],可得c=0.514,觀測值r=0.997 5,|r|=0.997 5 >0.514,所以拒絕H0∶b=0,即認(rèn)為z 關(guān)于t 的線性回歸效果是顯著的.將z=πA(x),t=ln x 代入=-2.267 2 +0.489 0t中,得到
把這條曲線畫在圖3 中,可見基本上反映了πA(x)與x 之間的變化規(guī)律.
圖3 “優(yōu)質(zhì)打火機(jī)”的可能性分布函數(shù)Fig.3 Possibility distribution function of“high quality lighter”
本例也可用F 檢驗(yàn)法,t 檢驗(yàn)法檢驗(yàn)回歸效果是否顯著.通過計(jì)算,檢驗(yàn)結(jié)果完全一致.
構(gòu)造可能性分布時(shí),若變量間確實(shí)存在且在數(shù)量上表現(xiàn)為不確定性的相互依存關(guān)系時(shí),就可以考慮利用回歸分析這種統(tǒng)計(jì)方法來處理.通過回歸效果的顯著性檢驗(yàn),不但能夠盡可能完整地描述信息的認(rèn)知不確定性,而且能夠盡可能貼切地對認(rèn)知不確定性進(jìn)行描述,減小其與真實(shí)分布的差異.此外,還可利用回歸方程得到的可能性分布進(jìn)行預(yù)測和控制.
[1]Zadeh L A.Fuzzy sets as a basis for a theory of possibility[J].Fuzzy Sets and Systems,1978,l(1):3-28.
[2]周新宇.基于多源信息不確定性的可能性融合方法研究[D].太原:中北大學(xué),2012.
[3]侯艷華.認(rèn)知不確定性條件下可能性分布的構(gòu)造方法研究[D].成都:電子科技大學(xué),2010.
[4]佟欣.基于可能性理論的模糊可靠性設(shè)計(jì)[D].大連:大連理工大學(xué),2005.
[5]Serrurier M,Prade H.An informational distance for estimating the faithfulness of a possibility distribution,viewed as a family of probability distributions,with respect to data[J].International Journal of Approximate Reasoning,2013,54:919-933.
[6]Masson M,Denoeux T.Inferring a possibility distribution from empirical data[J].Fuzzy Sets and Systems,2006,157(3):247-254.
[7]Mauris G.Infering a possibility distribution from very few measurements[J].ASC,2008,48:92-99.
[8]樊慶英,楊風(fēng)暴,王肖霞,等.一種尾礦庫風(fēng)險(xiǎn)評估的可能性處理方法[J].計(jì)算機(jī)與現(xiàn)代化,2012(12):24-26.Fan Qingying,Yang Fengbao,Wang Xiaoxia,et al.Possibility processing method on tailings pond risk assessment[J].Computer and Modernization,2012(12):24-26.(in Chinese)
[9]駱志高,何鑫,胥愛成,等.可能性理論在滾動(dòng)軸承復(fù)合故障診斷中的應(yīng)用[J].振動(dòng)與沖擊,2011,30(1):73-76.Luo Zhigao,He Xin,Xu Aicheng,et al.Application of possibility theory in rolling bearing compound fault diagnosis[J].Journal of Vibration and Shock,2011,30(1):73-76.(in Chinese)
[10]Garcia J M,Linares L J,Benitez L R,et al.Fuzzy numbers from raw discrete data using linear regression[J].Information Sciences,2013,233:1-14.
[11]吉琳娜,楊風(fēng)暴,王肖霞,等.基于庫水位的壩體安全等級的可能性分析方法[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(11):224-227.Ji Linna,Yang Fengbao,Wang Xiaoxia,et al.Possibility analysis method on safety levels of tailings dam based on reservoir water level[J].Computer Engineering and Applications,2013,49(11):224-227.(in Chinese)
[12]何俐萍.基于可能性度量的機(jī)械系統(tǒng)可靠性分析和評價(jià)[D].大連:大連理工大學(xué),2010.
[13]Serrurier M,Prade H.An informational distance for estimating the faithfulness of a possibility distribution,viewed as a family of probability distributions,with respect to data[J].International Journal of Approximate Reasoning,2013,54(7):919-933.
[14]趙穎.應(yīng)用數(shù)理統(tǒng)計(jì)[M].北京:北京理工大學(xué)出版社,2008.
[15]謝季堅(jiān).模糊數(shù)學(xué)方法及其應(yīng)用[M].武漢:華中科技大學(xué)出版社,2013.