張秋穎 沈小芳
【摘要】本文提出了一種基于模糊聚類和模糊模式識別的故障診斷系統(tǒng)的診斷流程,并討論了將原始數(shù)據(jù)進行前期處理的方法,同時提出了使故障診斷系統(tǒng)具有自學習功能的方法.本文提出的方法不僅具有一定的學術價值,在實踐中也具有指導意義.最后,本文對以上的研究工作進行了總結,并提出了進一步的研究方向.
【關鍵詞】模糊聚類;模糊模式識別;故障診斷;自學習
引 言
基于模糊數(shù)學理論中的模糊聚類和模糊模式識別技術進行故障診斷是目前的研究熱點,文獻[1]研究了基于模糊聚類的柴油機故障診斷技術,其采用的是經典的模糊C均值聚類算法,該算法的一個明顯缺點是以歐式距離度量樣本間的距離,進而得出隸屬度,僅對球狀或橢球狀數(shù)據(jù)集(各向同性數(shù)據(jù)集)能得出較優(yōu)的分類結果,對其他類型數(shù)據(jù)集分類效果差,甚至與實際情況不符;文件[2][3]提出了改進的模糊C均值聚類故障診斷方法,即在計算樣本距離時乘以一個權值;文獻[4]以遺傳算法計算權值,其實質仍然是以歐式距離度量樣本間的距離.
結合上述介紹,本文主要研究的內容為:一是討論基于模糊數(shù)學理論的故障診斷流程,并提出將系統(tǒng)原始數(shù)據(jù)集變換為各向同性數(shù)據(jù)集的思想;二是提出一種故障診斷系統(tǒng)的自學習機制,使故障診斷系統(tǒng)真正具有智能性.
一、模糊聚類、模糊模式識別與故障診斷
設對某個系統(tǒng)進行故障診斷,采集系統(tǒng)數(shù)據(jù)m個,每隔一段時間記錄一組樣本,已記錄樣本n個,分別用x1,x2,…,xn表示,其中每個樣本的具體數(shù)據(jù)為:
xi=(xi1,xi2,…,xim)(i=1,2,…,n)(1)
于是可得原始數(shù)據(jù)矩陣如下表所示.
應用模糊聚類技術并結合實際情況,將上述n個樣本分為r類,其中,第j類的樣本數(shù)為nj,分別用x(j)1,x(j)2,…,x(j)nj表示,其中每個樣本的具體數(shù)據(jù)為:
x(j)i=(x(j)i1,x(j)i2,…,x(j)im)(i=1,2,…,nj,j=1,2,…,r) (2)
第j類的聚類中心為:
x-(j)=(x-(j)1,x-(j)2,…,x-(j)m)(3)
式中x-(j)k為第k個數(shù)據(jù)的平均值,即:
x-(j)k=1nj∑nji=1x(j)ik(k=1,2,…,m)(4)
將n個樣本分好類后,面對樣本xn+1,根據(jù)r個聚類中心,應用模糊模式識別技術,將樣本xn+1歸為r類中的某類或求出其隸屬于各類的隸屬度.
以上即是基于模糊數(shù)學理論的故障診斷系統(tǒng)的基本原理,其是模糊聚類和模糊模式識別的綜合運用過程.以下討論具體故障的診斷流程.
二、基于模糊數(shù)學理論的故障診斷流程
在給出故障診斷流程之前,先討論一下原始數(shù)據(jù)的前期處理.不同的數(shù)據(jù)一般有不同的量綱,為了使有不同量綱的量也能進行比較,需要對數(shù)據(jù)作適當?shù)淖儞Q,通常是歸一化處理,即將數(shù)據(jù)值壓縮到區(qū)間[0,1]上.
應用模糊聚類進行故障診斷,需要計算樣本之間的相似程度,而相似程度通常以樣本間的歐式距離為基礎.這就存在一個問題,即在某些情況下,歐式距離不能準確反映樣本之間的相似程度,甚至與事實不符.
如某系統(tǒng)的電壓、電流樣本x1,x2,x3,x4分布如圖1所示.從圖中可以直觀看出,若用歐式距離法計算樣本之間的相似程度,則樣本分類為{x1,x2},{x3,x4}.而實際情況中,若以系統(tǒng)的功率分類,則上述分類是符合事實的;若以系統(tǒng)表現(xiàn)出的電阻值分類,則符合事實的分類應為{x1,x3},{x2,x4}.
因此,若要進行符合事實的分類,在將原始數(shù)據(jù)歸一化處理之前,應去除原始數(shù)據(jù)之間的耦合性,使原始數(shù)據(jù)集變換為各向同性數(shù)據(jù)集.對于圖1所示的數(shù)據(jù),以系統(tǒng)功率分類時,應以UI為新數(shù)據(jù);以系統(tǒng)表現(xiàn)出的電阻值分類時,應以U/I為新數(shù)據(jù).而實際系統(tǒng)復雜多樣,且對同一系統(tǒng),不同的分類所關心的數(shù)據(jù)也不一樣,因此,并沒有統(tǒng)一的使原始數(shù)據(jù)集變換為各向同性數(shù)據(jù)集的方法,應具體問題具體分析.本文總結出以下幾種方法.
1.專家統(tǒng)計法
統(tǒng)計本領域內的專家意見,并進行綜合考慮.
2.加權法
不同的分類所關心的數(shù)據(jù)不同,對分類影響大的數(shù)據(jù)給予大的權值,對分類影響小的數(shù)據(jù)給予小的權值.
3.借用法
直接借用已有的客觀指標,如要將某些人按胖瘦分類,采集每人的身高、體重信息,則應采用國際通用的BMI指數(shù)(BMI=體重(kg)/身高2(m))方法進行數(shù)據(jù)變換.
4.倒推試湊法
如已事先知道樣本的分類情況,可采用倒推試湊法,哪種數(shù)據(jù)變換方法的分類效果最好,就采用哪種方法.
下面給出故障診斷流程,如圖2所示.圖中部分模塊說明如下:
1.數(shù)據(jù)歸一化模塊
將數(shù)據(jù)歸一化處理,可采用標準差變換、極差變換、對數(shù)變換等.
2.模糊聚類模塊
模糊聚類方法大體上有模糊C均值聚類方法及其改進方法和基于模糊相似矩陣的方法兩種.由于原始數(shù)據(jù)進行了各向同性變換,應用模糊C均值聚類方法可以得到較合理的分類.模糊C均值聚類方法是一個最優(yōu)化的搜索過程,可設置分類數(shù)的取值范圍.基于模糊相似矩陣的方法需要建立模糊相似矩陣,進而根據(jù)模糊相似矩陣進行聚類分析,模糊相似矩陣可以根據(jù)樣本間的歐氏距離計算.
3.聚類結果判斷
可根據(jù)實際情況、專家經驗等判斷聚類結果是否合理.若不合理,則修改數(shù)據(jù)處理方法或分類方法后重新聚類;若合理,則根據(jù)生成的聚類中心應用模糊模式識別技術進行故障診斷.
4.模糊模式識別
聚類完成后,進入故障診斷的循環(huán)過程,若沒有待診斷數(shù)據(jù),則系統(tǒng)延時后等待新數(shù)據(jù);若有待診斷數(shù)據(jù),則將該數(shù)據(jù)進行各向同性變換和歸一化變換后進入模糊模式識別模塊進行故障診斷.模糊模式識別方法主要有最大隸屬度原則和擇近原則兩種.根據(jù)模糊模式識別的結果就可判斷待診斷數(shù)據(jù)屬于模糊聚類結果中的某類,即完成了故障診斷.
三、故障診斷系統(tǒng)自學習功能的實現(xiàn)
智能化一直是故障診斷系統(tǒng)追求的目標,而智能化和非智能化的本質區(qū)別在于是否具有自學習功能.前面介紹的故障診斷系統(tǒng)是沒有自學習功能的,試想若存在某個待診斷數(shù)據(jù)不屬于任何分類或隸屬于各個分類的程度相同,此時又應如何進行故障診斷.存在這種情況的原因是,原始數(shù)據(jù)不可能包含系統(tǒng)運行的全部情況.也就是說,故障診斷只依賴于原始數(shù)據(jù)是遠遠不夠的,系統(tǒng)必須具有自學習功能,在故障診斷的同時進行自學習,以適應系統(tǒng)運行的全部情況.
圖3給出了實現(xiàn)自學習功能的一種方法.設待診斷數(shù)據(jù)xn+1對r個聚類中心的隸屬度或貼近度為[b1,b2,…,br],若滿足如下任一點,則判斷診斷結果不合理,進而將該數(shù)據(jù)作為一個新分類的聚類中心加入原始數(shù)據(jù).
1.bi 2.M=max1≤i≤rbi 3.Ad≤bi≤Au(i=1,2,…,r),式中Au=1r∑ri=1bi+c3,Ad=1r∑ri=1bi-c4(可取c3=c4=0.05). 若診斷結果合理,則輸出診斷結果用于進一步的決策,同時判斷是否將此次診斷的數(shù)據(jù)加入原始數(shù)據(jù).判斷的標準可為:當原始數(shù)據(jù)中某個分類的樣本個數(shù)nj 這樣,通過設置c1~c5幾個常數(shù),就實現(xiàn)了故障診斷系統(tǒng)的自學習,可自動生成新的故障類型,使系統(tǒng)具有一定的智能化水平. 四、結束語 自學習是智能化系統(tǒng)區(qū)別于非智能化系統(tǒng)的本質特性.本文在提出故障診斷流程的基礎上,增加了自學習機制,以使系統(tǒng)具備一定的智能化水平.當然,機器學習是人工智能領域的一個重要內容,需要進行系統(tǒng)、深入的研究. 【參考文獻】 [1]吳震宇,袁惠群.基于EMD和模糊聚類的柴油機故障診斷[J].東北大學學報(自然科學版),2009,12:1784-1787. [2]王英赫.基于模糊聚類的間歇過程故障診斷的研究[D].哈爾濱理工大學,2018. [3]王印松,商丹丹.改進的模糊聚類在控制系統(tǒng)故障診斷中的應用研究[J].計算機工程與科學,2018,2:326-330. [4]劉太洪,趙永雷.動態(tài)加權模糊聚類在變壓器故障診斷中的應用研究[J].電網與清潔能源,2016,4:89-92.