馮衛(wèi)兵,韓 玉
(西安科技大學(xué) 理學(xué)院,陜西 西安 710054)
Vague集理論由Gau和Buehrer于1993年提出[1],Vague集相似度量方法是其重點(diǎn)研究?jī)?nèi)容,用于判斷兩個(gè)集合之間的相似程度,進(jìn)而判斷大量數(shù)據(jù)間的關(guān)系。目前,學(xué)者大多從支持度和反對(duì)度出發(fā)[2-11]研究Vague集的相似性度量方法。
文獻(xiàn)[5]通過(guò)對(duì)各元素取大取小來(lái)研究Vague集相似度量方法,文獻(xiàn)[6]通過(guò)包含度理論來(lái)研究相似度量,但是這兩種方法都只注重了數(shù)據(jù)之間的關(guān)系,沒(méi)有考慮到未知度因素,導(dǎo)致丟失了很多有用信息。文獻(xiàn)[7]對(duì)相似度量公式的每部分設(shè)置系數(shù),文獻(xiàn)[8]用函數(shù)來(lái)調(diào)節(jié)未知度系數(shù),以此提高相似度量公式的度量能力,但是系數(shù)的合理選取還需進(jìn)一步研究。
文獻(xiàn)[9]從二次投票出發(fā),考慮了二次投票中優(yōu)勢(shì)函數(shù)之差和兩端點(diǎn)之間的距離因素,但是并沒(méi)有考慮到二次投票后的未知度,造成一些數(shù)據(jù)無(wú)法有效區(qū)分。文獻(xiàn)[10-11]同樣從二次投票出發(fā),分別對(duì)二次投票后的支持度和反對(duì)度進(jìn)行取小,但該方法默認(rèn)二次投票的結(jié)果就是最終的結(jié)果,不會(huì)再有三次投票,這說(shuō)明其并沒(méi)有考慮到二次投票后的未知度,即認(rèn)為二次投票后不會(huì)存在棄權(quán)的結(jié)果。但事實(shí)上,二次投票后還是會(huì)存在三次投票的可能,所以導(dǎo)致某些度量結(jié)果與實(shí)際不符。目前為止,還是無(wú)法找到一個(gè)完美的Vague集相似度量方法,所以,繼續(xù)尋找新的Vague集相似度量計(jì)算方法是十分有必要的。
本文從二次投票出發(fā),同時(shí)考慮二次投票中支持度的包含關(guān)系、反對(duì)度的包含關(guān)系和未知度的包含關(guān)系,合理設(shè)置系數(shù),提出了一種基于包含關(guān)系的Vague集新相似度量方法,并驗(yàn)證本文方法具有較強(qiáng)的區(qū)分能力。并將新方法應(yīng)用于故障診斷等現(xiàn)實(shí)問(wèn)題中,充分地說(shuō)明了該方法的準(zhǔn)確性與合理性。
Vague值(集)的相關(guān)概念如下:
定義1[1]設(shè)有一論域X,X上的一個(gè)Vague集A是由一個(gè)真隸屬函數(shù)tA(x)和一個(gè)假隸屬函數(shù)fA(x)所確定的。tA(x)是從支持x的證據(jù)導(dǎo)出的x的隸屬度下界,fA(x)則是從反對(duì)x的證據(jù)導(dǎo)出的x的非隸屬度下界。πA(x)=1-tA(x)-fA(x)是Vague集A中元素x的未知程度。其中tA:X→[0,1],fA:X→[0,1],且對(duì)于?x∈X滿(mǎn)足tA(x)+fA(x)≤1。
定義2[1]若有x∈X,Vague集A在點(diǎn)x的Vague值為閉區(qū)間[tA(x),1-fA(x)]。當(dāng)Vague集只有一個(gè)時(shí),簡(jiǎn)寫(xiě)為x=[tx,1-fx]。
定義3[1]設(shè)A和B是論域X上的Vague集,?x∈X,將A和B上的Vague值分別表示為A=[tA(x),1-fA(x)]和B=[tB(x),1-fB(x)]。則有:
A∩B=[tA(x)∧tB(x),1-(fA(x)∨fB(x))];
A∪B=[tA(x)∨tB(x),1-(fA(x)∧fB(x))],
其中:∨和∧分別是取大和取小運(yùn)算。
為了可以更準(zhǔn)確地對(duì)Vague 值(集)之間的相似程度進(jìn)行度量,本文展開(kāi)了一系列討論。
假設(shè)有一個(gè)Vague值x=[tx,1-fx],那么可以將x用一個(gè)三元組(tx,fx,πx)進(jìn)行表示,tx、fx、πx分別為一次投票中支持、反對(duì)和棄權(quán)部分的大小??紤]到在二次投票中,投票人會(huì)受一次投票結(jié)果的影響進(jìn)行投票,所以最終可以將投票結(jié)果細(xì)化為(tx+πxtx,fx+πxfx,1-(tx+πxtx)-(fx+πxfx)),即表示二次投票中支持、反對(duì)和棄權(quán)的大小。
包含度理論[6]是描述相似度量的有效方法之一,但其通常會(huì)忽略未知度的影響。本文以二次投票為基礎(chǔ),借鑒包含度的理論,分別考慮了二次投票中支持度、反對(duì)度和未知度的包含關(guān)系,即對(duì)兩輪投票后的支持、反對(duì)和棄權(quán)部分同時(shí)取小再求和,在此基礎(chǔ)上提出了一種基于包含關(guān)系的Vague集新相似度量方法。
定義4 假設(shè)Vague集A上有Vague值x=[tx,1-fx]。tx是x的支持度,fx是x的反對(duì)度,πx=1-tx-fx是x的未知度,下面定義了新的二次投票中的支持度、反對(duì)度和未知度:
(Ⅰ)αx=tx+πxtx稱(chēng)為A中元素x的支持程度。
(Ⅱ)βx=fx+πxfx稱(chēng)為A中元素x的反對(duì)程度。
(Ⅲ)γx=1-(tx+πxtx)-(fx+πxfx)稱(chēng)為A中元素x的未知程度。
αx、βx和γx都可用投票模型來(lái)進(jìn)行解釋?zhuān)鏥ague值[0.2,0.5]表示在投票結(jié)果中,支持票占20%,反對(duì)票占50%,棄權(quán)票占30%。那么αx=0.2+0.3×0.2=0.26,可以解釋為:第1次投票支持票為20%,受第1次投票結(jié)果影響,第2次投票可能還會(huì)有0.3×0.2=0.06的人支持。
同理,βx=0.5+0.3×0.5=0.65,可解釋為:第1輪投票反對(duì)票為50%,受第1次投票結(jié)果影響,第2次投票可能還會(huì)有0.3×0.5=0.15的人反對(duì)。
同理,γx=1-0.26-0.65=0.09,可解釋為:第1輪投票反對(duì)票為30%,受第1次投票結(jié)果影響,第2次投票可能還會(huì)有0.09的人棄權(quán)。
定義5 假設(shè)Vague集A上有兩個(gè)Vague值x=[tx,1-fx],y=[ty,1-fy]。α、β、γ分別表示二次投票中的支持度、反對(duì)度和未知度。當(dāng)tx≠0,fx≠0,ty≠0,fy≠0時(shí),定義x和y的相似度MNEW1(x,y)為:
MNEW1(x,y)=λ1min(αx,αy)+λ2min(βx,βy)+λ3min(γx,γy)。
(1)
在該方法中,λ1、λ2定義為1或0。λ3定義為一個(gè)0~1的值,表示決策者在兩輪投票后對(duì)信息識(shí)別的態(tài)度。λ3=1表示兩輪投票后決策者的態(tài)度是完全支持。λ3=0表示兩輪投票后決策者的態(tài)度是完全不支持。這里選取λ1=λ2=1,表示每輪投票總會(huì)有支持和反對(duì)的票,選取λ3=1/3表示在兩輪投票后第3輪投票中棄權(quán)的概率是1/3。則確定系數(shù)后的相似度量公式如下:
MNEW1(x,y)=min(αx,αy)+min(βx,βy)+1/3min(γx,γy)。
(2)
當(dāng)tx=0或fx=0或ty=0或fy=0時(shí),式(2)不能很好地區(qū)分Vague集,定義x和y的相似度MNEW2(x,y)為:
(3)
最終得到x和y的相似度MNEW(x,y):
(4)
式(4)為本文提出的一種基于包含關(guān)系的Vague集新相似度量方法。
(5)
如果取wi=1/n,表明各元素的權(quán)重相同。
已有的Vague集相似度區(qū)分能力通常通過(guò)分類(lèi)數(shù)來(lái)定義。在已知相似度結(jié)果后,將數(shù)值相等的Vague集相似度量歸為同一類(lèi),這樣的類(lèi)別越多,表明Vague集相似度量方法在該相似度量結(jié)果中區(qū)分能力越好。但是僅僅通過(guò)分類(lèi)數(shù)這一個(gè)概念來(lái)度量Vague集相似度的區(qū)分能力顯得太片面。因此,本文在此基礎(chǔ)上,對(duì)小樣本和大樣本分別定義了新的區(qū)分能力公式。
定義7 設(shè)Vague集相似度為Mi(i=1,2,…,n),對(duì)于小樣本數(shù)據(jù),定義新的相似度區(qū)分能力為:
(6)
定義8 設(shè)有Vague集相似度Mi(i=1,2,…,n),對(duì)于大樣本數(shù)據(jù),定義新的相似度區(qū)分值為:
D=f×(AVS-AVST),
(7)
下面對(duì)部分相似度量性質(zhì)進(jìn)行證明。設(shè)有兩個(gè)Vague值x=[tx,1-fx],y=[ty,1-fy]。MNEW(x,y)表示x與y之間的相似度。則MNEW(x,y)滿(mǎn)足以下性質(zhì):
性質(zhì)1 0≤MNEW(x,y)≤1。
證明當(dāng)tx≠0,fx≠0,ty≠0,fy≠0時(shí),
因?yàn)镸NEW1(x,y)=min(αx,αy)+min(βx,βy)+1/3min(γx,γy);
min(αx,αy)=min(tx+πxtx,ty+πyty);
min(βx,βy)=min(fx+πxfx,fy+πyfy);
min(γx,γy)=min(1-(tx+πxtx)-(fx+πxfx),1-(ty+πyty)-(fy+πyfy)),
則有
0≤tx+πxtx+fx+πxfx+1/3(1-(tx+πxtx)-(fx+πxfx))≤1;
0≤ty+πyty+fy+πyfy+1/3(1-(ty+πyty)-(fy+πyfy))≤1,
所以,0≤MNEW1(x,y)≤1。
當(dāng)tx=0或fx=0或ty=0或fy=0時(shí),
αx-βx=tx+πxtx-(fx+πxfx)=tx(1+πx)-fx(1+πx)=(tx-fx)(2-tx-fx)=
-tx2+2tx+fx2-2fx=(fx-1)2-(tx-1)2,
因?yàn)?≤tx≤1,0≤fx≤1,0≤tx+fx≤1,
所以-1≤αx-βx≤1。
同理-1≤αy-βy≤1。即有0≤|αx-βx-(αy-βy)|≤2。
αx=tx+πxtx=tx(1+πx)=tx(2-tx-fx)=-tx2+(2-fx)tx,
因?yàn)?≤tx≤1,0≤fx≤1,0≤tx+fx≤1,
所以0≤αx≤1。
同理0≤βx≤1,0≤αy≤1,0≤βy≤1,即有0≤|αx-αy|+|βx-βy|≤2。
則0≤3|αx-βx-(αy-βy)|+3|αx-αy|+|βx-βy|≤12。
所以0+|γx-γy|+γx+γy≤3|αx-βx-(αy-βy)|+3|αx-αy|+|βx-βy|+
|γx-γy|+γx+γy≤12+|γx-γy|+γx+γy,
證得0≤MNEW2≤1。
綜上所述,0≤MNEW≤1。性質(zhì)1證畢。
性質(zhì)2 ?x,y∈A,MNEW(x,y)=MNEW(y,x)。
性質(zhì)4 當(dāng)x=y且γx=γy=0時(shí),有MNEW(x,y)=1。
性質(zhì)5 當(dāng)x=[0,0],y=[1,1]或x=[1,1],y=[0,0]時(shí),有MNEW(x,y)=0。
性質(zhì)6 當(dāng)x=[0,1]∈A且y=[1,1]∈A時(shí),令MNEW(x,y)的值為區(qū)間[0,1]的任意值,記為?[0,1]。
本文選取代表性數(shù)據(jù)[5,9-10]對(duì)新方法MNEW與已有的方法進(jìn)行比較,比較結(jié)果如表1所示。
表1中第9組Vague值[0,0]和[1,1]表示的是全部都反對(duì)與全部都支持的相似度為0;第10組Vague值[1,1]和[0.5,0.5]表示的是全部支持和一半支持一半反對(duì)的相似度為0.5;第11組Vague值[0,1]和[1,1]表示的是全部支持和全部棄權(quán)的相似度為[0,1]中的任何一個(gè)數(shù)。以這3組數(shù)據(jù)的相似度為前提構(gòu)造了新的相似度量公式,并對(duì)其進(jìn)行對(duì)比。
由表1可知:首先,MZX、MW和MG不滿(mǎn)足上述前提條件;對(duì)于第1組和第8組數(shù)據(jù),MZX和MJ無(wú)法區(qū)分;對(duì)于第12~14組數(shù)據(jù),MG、MZ和MLY的相似度都為1,但這幾組數(shù)據(jù)的Vague值是相等的,當(dāng)未知度為0時(shí)(第12組),未知度不產(chǎn)生任何影響,所有的度量結(jié)果都一樣為1;但當(dāng)未知度不為0時(shí)(第13~14組),MZX、MJ、MW和MNEW可以體現(xiàn)出未知性。且以第13組與第14組為例,MZX的區(qū)分度為0.895-0.857=0.038,MJ的區(qū)分度為0.8-0.7=0.1,MW的區(qū)分度為0.790-0.740=0.050,MNEW的區(qū)分度為0.893-0.760=0.133,顯然,MNEW的區(qū)分度大于MZX、MJ和MW的區(qū)分度。
表1 各相似度量的比較
由于前8組數(shù)據(jù)是以Vague值[0.4,0.8]為中心,分別取與0.4相近的0.3,與0.7和0.8相近的0.7,0.9為新的tx和1-fx與其進(jìn)行對(duì)比,所以前8組的相似度可以很好地代表各相似度的區(qū)分能力。下面結(jié)合定義7計(jì)算各Vague集相似度量方法的區(qū)分能力,計(jì)算結(jié)果如表2所示。
表2 各相似度量的區(qū)分能力
由表2可知:MZX、MLY和MNEW的區(qū)分度較高(都大于0.1),但相比較而言0.140>0.110>0.109,即MNEW>MLY>MZX,所以MNEW的區(qū)分度較好一些。
為了更好地說(shuō)明新相似度量公式的合理性和有效性,本文擴(kuò)大了數(shù)據(jù)范圍,對(duì)上述幾種Vague集相似性度量方法進(jìn)一步進(jìn)行研究。具體步驟[4]如下:
第1步:設(shè)有Vague值x=[tx,1-fx],其中0≤tx+fx≤1,以0.1為步長(zhǎng)找出[0,1]內(nèi)符合要求的所有子區(qū)間,由此得到了60個(gè)Vague值。
第2步:將60個(gè)Vague值兩兩進(jìn)行組合,得到3 600(60×60)組數(shù)據(jù),去掉重復(fù)的組合(下三角矩陣中的組合)后,得到1 830組組合數(shù)據(jù),將其稱(chēng)為數(shù)據(jù)集V。
第3步:結(jié)合文中給出的8種相似度量方法,對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行相似度的計(jì)算。得到了1 830個(gè)計(jì)算結(jié)果,將其稱(chēng)為相似度集M。
第4步:結(jié)合定義8計(jì)算每種相似度量方法的區(qū)分值,為便于數(shù)據(jù)對(duì)比,將區(qū)分度的結(jié)果擴(kuò)大一定倍數(shù)(此處不妨取1 000倍),結(jié)果如表3所示。
表3 各相似度量的區(qū)分值
由表3可知:在同樣的數(shù)據(jù)下,MZX、MW和MNEW的區(qū)分度較高(都大于60)。又因119.8>80.9>65.0,所以新提出的相似度量MNEW的區(qū)分能力更大一些。
隨著人工智能的發(fā)展,故障診斷等問(wèn)題[12-15]的解決方法有很多,與Vague相似度量的結(jié)合使得故障診斷等問(wèn)題被更有效地解決[16-20]。本文首先選取文獻(xiàn)[16]中的模式識(shí)別案例進(jìn)行討論。
設(shè)有標(biāo)準(zhǔn)模式Ai(i=1,2,3)和待識(shí)別模式B:
A1=([0.8,0.9],[0.3,0.4],[0.6,0.8]);A2=([0.1,0.6],[0.7,0.8],[0.8,0.9]);
A3=([0.8,0.9],[0.3,0.4],[0.6,0.8]);B=([0.4,0.5],[0.6,0.7],[0.8,1.0])。
用本文中提到的Vague集相似度量公式進(jìn)行計(jì)算,結(jié)果如表4所示。
表4 模式識(shí)別結(jié)果比較
由表4可以看出:MZX、MJ、MW、MG、MZ、MLY和新的Vague集相似度量公式MNEW的模式識(shí)別結(jié)果是一致的,都為A2>A3>A1,且與文獻(xiàn)[16]結(jié)果一致。因此,待識(shí)別模式B應(yīng)該屬于標(biāo)準(zhǔn)模式A2,表明MNEW的識(shí)別結(jié)果是合理的。
下面選取文獻(xiàn)[13]中的水輪機(jī)故障診斷案例進(jìn)行討論。水輪機(jī)常見(jiàn)故障如表5[13]中第1列所示,水輪機(jī)不同頻率如表5中第1行所示?,F(xiàn)將表5中譜峰能量值作為Vague值展開(kāi)計(jì)算。
表5 系統(tǒng)故障知識(shí)
取第1次待診斷檢測(cè)樣本的Vague 集為:
D1=[0.04,0.04]/x1+[0.95,0.95]/x2+[0.10,0.10]/x3+[0.07,0.07]/x4+[0.04,0.04]/x5。
另一個(gè)檢測(cè)樣本得到的Vague集為:
D2=[0.90,0.90]/x1+[0.25,0.25]/x2+[0.12,0.12]/x3+[0.15,0.15]/x4+[0.25,0.25]/x5。
用本文中提到的Vague集相似度量公式進(jìn)行計(jì)算,結(jié)果如表6所示。
表6 故障診斷結(jié)果
由表6可以直觀地看出:檢測(cè)樣本D1與A1的相似度最大(即屬于故障轉(zhuǎn)子不平衡)。檢測(cè)樣本D2與A4相似度最大(即屬于故障尾水管偏心渦帶)。該故障診斷結(jié)果與文獻(xiàn)[13]診斷結(jié)果一致,說(shuō)明MNEW的結(jié)果判斷正確。
下面選取文獻(xiàn)[9]中的空調(diào)系統(tǒng)選擇問(wèn)題進(jìn)行討論。已知有3種空調(diào)系統(tǒng)方案A1、A2和A3。3種準(zhǔn)則C1、C2和C3,分別為經(jīng)濟(jì)、功能和有效性。決策者評(píng)價(jià)結(jié)果如表7[9]所示。
表7 決策矩陣
由表7可得理想方案為:
I={[0.80,0.90],[0.75,0.95],[0.80,0.80]}。
計(jì)算各備選方案與理想方案在相應(yīng)準(zhǔn)則下的相似度,如表8所示。
表8 多準(zhǔn)則決策結(jié)果對(duì)比
由表8可知:在空調(diào)系統(tǒng)選擇問(wèn)題中,方案A1為最優(yōu)方案,且所得結(jié)論與文獻(xiàn)[9]一致,由此可見(jiàn)本文提出的相似度量方法MNEW是有效的。
隨著Vague集理論研究的不斷深入,尋找一個(gè)合理有效的相似度量方法也受到了人們重視。本文借助二次投票的含義,充分考慮了支持度、反對(duì)度和未知度3個(gè)方面的包含關(guān)系,給出Vague集相似度的一系列討論。此外,通過(guò)數(shù)值算例和模式識(shí)別、故障診斷、多準(zhǔn)則決策等應(yīng)用說(shuō)明了本文方法的有效性和可行性。所以認(rèn)為本文提出的Vague集相似度量方法可以廣泛應(yīng)用于模式識(shí)別、近似推理和決策系統(tǒng)等研究領(lǐng)域。最后,由于Vague集存在不確定性,為此下一步工作將重點(diǎn)討論未知度系數(shù)對(duì)相似度量影響的大小。