柴保明等
摘 要:故障診斷在知識智能獲取的方法發(fā)展一直比較緩慢。而隨著數(shù)據(jù)挖掘技術(shù)的逐步發(fā)展起來,它便成為知識獲取效率比較高的工具。文章對數(shù)據(jù)挖掘?qū)<蚁到y(tǒng)以及數(shù)據(jù)挖掘技術(shù)中常用的一些挖掘算法進行了介紹,并把實驗系統(tǒng)數(shù)據(jù)和數(shù)據(jù)挖掘?qū)<蚁到y(tǒng)相結(jié)合來闡明其原理。
關(guān)鍵詞:數(shù)據(jù)挖掘;價值知識;專家系統(tǒng)
引言
伴隨著制造業(yè)的迅猛發(fā)展以及和電子產(chǎn)業(yè)結(jié)合的不斷深入,工業(yè)化大生產(chǎn)一步步朝著智能化的方向發(fā)展,自動化也更加成熟。但它的系統(tǒng)設(shè)備結(jié)構(gòu)復(fù)雜性更大,功能也更強大,維修難度隨之也提高,所以系統(tǒng)故障產(chǎn)生的故障信息數(shù)據(jù)越來越巨大。這些數(shù)據(jù)量超出人工分析處理能力,因此對故障診斷方法的創(chuàng)新是作者一直不斷追求的。
1 數(shù)據(jù)挖掘技術(shù)
1.1 數(shù)據(jù)挖掘的目的與過程
數(shù)據(jù)挖掘主要有數(shù)據(jù)庫建立、機器學習、統(tǒng)計學等。它的目的是從長期存放在數(shù)據(jù)倉庫中海量的數(shù)據(jù)信息的集合中去發(fā)現(xiàn)那些未知的隱藏的知識。
1.2 數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則Apriori算法
在數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則的第一個算法便是Apriori算法,它使用基于支持度的剪枝技術(shù)以及系統(tǒng)控制候選項集指數(shù)增長是非常具有前瞻性的。它的頻繁項集產(chǎn)生算法的程序代碼過程為:
1.3 基于Apriori算法的故障診斷的改進
如果能把Apriori算法計算速度大幅提高,則整個算法的效率便會具有很大的上升空間。而運算效率以及提高產(chǎn)生候選項集有兩個主要步驟:一個是連接,一個是剪枝操作。因此,算法的改進方法如下:
1.3.1 數(shù)據(jù)庫優(yōu)化掃描
在每次計算過程中,如果k-1項集為非頻繁項集,則k項集為非頻繁項集。因此,將此k-1項集從數(shù)據(jù)庫中刪去,隨著k值的增加,刪除的事務(wù)隨之增多,這樣通過減少掃描數(shù)據(jù)庫的次數(shù)來提高算法的運行速度。
1.3.2 連接與剪枝優(yōu)化
2 數(shù)據(jù)挖掘的故障診斷專家系統(tǒng)
專家系統(tǒng)是在某個領(lǐng)域中,包含大量專家水平的知識與經(jīng)驗,它是一種計算機組成系統(tǒng)程序來模擬人類專家,運用人類專家的知識和解決問題的方法進行推理,然后通過智能方式解決某個領(lǐng)域內(nèi)一些復(fù)雜問題。
為了能更方便有效地發(fā)掘一些有用的價值信息和知識,把數(shù)據(jù)挖掘技術(shù)和專家系統(tǒng)結(jié)合起來,為解決傳統(tǒng)專家系統(tǒng)在知識獲取及推理等方面的難題,通過數(shù)據(jù)挖掘這些技術(shù)能力來攻克。而數(shù)據(jù)挖掘的專家系統(tǒng)框圖如圖2所示。
其中左側(cè)部分是系統(tǒng)的知識獲取。數(shù)據(jù)挖掘?qū)<蚁到y(tǒng)的知識源包括很多,其一是專家在現(xiàn)實中解決問題的一些實例;其二是對診斷設(shè)備發(fā)生故障保存的一些歷史數(shù)據(jù);其三是故障實驗的仿真數(shù)據(jù)等。它的運行過程如下:
首先,建立一個齒輪箱故障試驗仿真結(jié)果數(shù)據(jù)庫。采集過程如圖3所示。接著從采完的數(shù)據(jù)中排除一些不用的信息,從中精選出一些數(shù)據(jù)得到數(shù)據(jù)庫,該數(shù)據(jù)庫是組構(gòu)成關(guān)于該設(shè)備發(fā)生故障的樣本,再將數(shù)據(jù)從樣本空間映射到數(shù)據(jù)空間。
建立好樣本庫后,然后把數(shù)據(jù)中的不變特征采用通過預(yù)處理方法提取出來,這樣可以將其從數(shù)據(jù)空間轉(zhuǎn)變?yōu)樘卣骺臻g,然后再確定系統(tǒng)中所需的挖掘算法等,最后可以進行數(shù)據(jù)挖掘。
在右半部分為故障診斷,在運行過程中,輸入數(shù)據(jù)首先經(jīng)過數(shù)據(jù)預(yù)處理后,會經(jīng)過系統(tǒng)處理轉(zhuǎn)變成特征模式,接著進人到全局數(shù)據(jù)庫,再結(jié)合知識庫中的知識來進行運算推理。
在選擇好數(shù)據(jù)挖掘的算法后,對故障樣本庫進行多次挖掘,從而完成故障知識的獲取。表1、2、3為提取的部分齒輪箱故障振動仿真數(shù)據(jù)庫部分獲取。
這個系統(tǒng)在整個推理過程中,診斷程序為主要過程,還有控制知識信息負責一項,這樣可以增加診斷的智能性。在診斷完成后,系統(tǒng)模塊列出推理的一系列過程。
3 結(jié)束語
文章結(jié)合數(shù)據(jù)挖掘技術(shù),對其中的經(jīng)典算法進行研究改進,并在分析故障診斷專家系統(tǒng)在問題的基礎(chǔ)上,對專家系統(tǒng)和數(shù)據(jù)挖掘進行比較,得出一個專家系統(tǒng)和數(shù)據(jù)挖掘結(jié)合的診斷系統(tǒng),提高故障診斷的準確性。
參考文獻
[1]周麗麗.面向設(shè)備故障診斷的數(shù)據(jù)挖掘技術(shù)方法的研究[J].自動化技術(shù)與應(yīng)用,2015,2.
[2]朱向明.數(shù)據(jù)挖掘故障診斷專家系統(tǒng)[J].火力與指揮控制,2011,9.
[3]黃文虎.設(shè)備故障診斷原理、技術(shù)及應(yīng)用廠[M].北京:科學出版社,1996.
作者簡介:柴保明(1964,3-),男,河北邯鄲人,博士,教授,現(xiàn)任河北工程大學機電學院,副院長。
通訊作者:張韶(1988,1-),男,河北邯鄲人,碩士,現(xiàn)就讀于河北工程大學,專業(yè)為機械電子工程。