丁 萌,樊 偉,王子涵
(1.空軍工程大學(xué),陜西 西安 710000;2.大連理工大學(xué),遼寧 大連 116000)
數(shù)據(jù)挖掘在煙機(jī)設(shè)備管理中的應(yīng)用
丁 萌1,樊 偉1,王子涵2
(1.空軍工程大學(xué),陜西 西安 710000;2.大連理工大學(xué),遼寧 大連 116000)
針對(duì)人為發(fā)現(xiàn)煙機(jī)設(shè)備故障趨勢(shì)難度大的問題,運(yùn)用數(shù)據(jù)挖掘技術(shù)提取煙機(jī)設(shè)備中隱含的、人們事先不知道的但又是潛在有用的信息與知識(shí),并根據(jù)這些信息、知識(shí)對(duì)煙機(jī)設(shè)備故障問題進(jìn)行預(yù)測(cè)分析,將人為發(fā)現(xiàn)轉(zhuǎn)化為機(jī)器發(fā)現(xiàn),從而為企業(yè)提供設(shè)備維修方面的決策支持,減少設(shè)備維修時(shí)間與成本消耗。以卷接電機(jī)為實(shí)例,利用決策樹算法進(jìn)行分類,分類結(jié)果與人為經(jīng)驗(yàn)相符合,驗(yàn)證了數(shù)據(jù)挖掘技術(shù)在預(yù)測(cè)煙機(jī)設(shè)備故障趨勢(shì)中的可行性。
數(shù)據(jù)挖掘;決策樹;設(shè)備故障
目前,國內(nèi)大多數(shù)煙草企業(yè)煙機(jī)設(shè)備仍然采用“以人工定期計(jì)劃維修為主”的維修方式,且維修計(jì)劃費(fèi)用大的驚人,人工定制計(jì)劃也容易產(chǎn)生設(shè)備“欠修”、“過修”等問題。為能夠解決該問題,各煙草企業(yè)部署了MES系統(tǒng)或ERP系統(tǒng),但這些系統(tǒng)只是采用傳統(tǒng)的統(tǒng)計(jì)方法對(duì)采集數(shù)據(jù)進(jìn)行匯總,并沒有對(duì)數(shù)據(jù)進(jìn)行更專業(yè)、更深層次的分析、挖掘,導(dǎo)致對(duì)煙機(jī)設(shè)備的故障趨勢(shì)預(yù)測(cè)能力不足,只能定期管理維修工單作業(yè)[1]。針對(duì)以上情況,本文提出運(yùn)用數(shù)據(jù)挖掘技術(shù),即決策樹算法對(duì)海量采集數(shù)據(jù)進(jìn)行發(fā)掘,發(fā)現(xiàn)其內(nèi)在知識(shí)與規(guī)律,為設(shè)備的穩(wěn)定性夯實(shí)基礎(chǔ),提高機(jī)效,降低企業(yè)設(shè)備成本。
2.1 數(shù)據(jù)挖掘的概述
數(shù)據(jù)挖掘(data mining,DM)是一種決策支持過程[2],是從數(shù)據(jù)倉庫大量數(shù)據(jù)中提取出隱藏的、先前未知的、有價(jià)值的信息的非平凡過程。數(shù)據(jù)挖掘通過分析每一個(gè)數(shù)據(jù),通過數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示3個(gè)步驟從大量數(shù)據(jù)中尋找其規(guī)律特性,進(jìn)而為人們提供決策支持。
2.2 數(shù)據(jù)挖掘的方法
數(shù)據(jù)挖掘是人工智能與數(shù)據(jù)庫技術(shù)相結(jié)合的產(chǎn)物,主要用于海量數(shù)據(jù)的處理、分析、歸納、總結(jié),其中包含神經(jīng)網(wǎng)絡(luò)、決策樹、粗糙集、聚類、遺傳算法等幾種比較重要的方法。這些方法的側(cè)重點(diǎn)和用途都不盡相同,本文針對(duì)煙機(jī)設(shè)備(即煙機(jī)卷接設(shè)備)故障進(jìn)行預(yù)測(cè),根據(jù)決策樹方法的簡(jiǎn)易性與強(qiáng)有力的預(yù)測(cè)功能,選擇此方法對(duì)卷接設(shè)備故障樣本庫進(jìn)行挖掘,生成規(guī)則庫,為故障分類提供決策依據(jù),并達(dá)到預(yù)期的目的。
3.1 決策樹方法簡(jiǎn)介
決策樹是一種應(yīng)用較為廣泛的分類方法,它是對(duì)樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)與訓(xùn)練,得到具有價(jià)值、揭示數(shù)據(jù)內(nèi)部關(guān)聯(lián)規(guī)則的一種樹結(jié)構(gòu)。主要用于預(yù)測(cè)模型與歸納的知識(shí)表示形式。
3.2 決策樹的表示
決策樹通過樹的根以及相應(yīng)的葉子節(jié)點(diǎn)對(duì)實(shí)例進(jìn)行分類。樹上的每個(gè)節(jié)點(diǎn)是對(duì)實(shí)例某個(gè)屬性的測(cè)試,且該節(jié)點(diǎn)的每個(gè)后繼分支對(duì)應(yīng)該屬性的一個(gè)可能值。分類方法就是從樹的根節(jié)點(diǎn)開始,測(cè)試這個(gè)節(jié)點(diǎn)的屬性,接著按照給定實(shí)例的屬性值對(duì)應(yīng)的樹枝向下移動(dòng),然后重復(fù)上述過程直到葉子節(jié)點(diǎn)。圖1是一個(gè)典型的決策樹。這個(gè)決策樹根據(jù)卸盤機(jī)電機(jī)的溫度與電流來決定電機(jī)是否正常工作或報(bào)警。
3.3 C4.5算法
決策樹基本算法主要有ID3算法、C4.5算法、x2統(tǒng)計(jì)算法、并行決策樹算法等。根據(jù)本文的樣本集與這些算法廣泛應(yīng)用度,選擇C4.5算法對(duì)卷接設(shè)備數(shù)據(jù)進(jìn)行挖掘、分析設(shè)備樣本故障數(shù)據(jù),更好地預(yù)測(cè)[3]。
C4.5算法基本原理是計(jì)算每個(gè)屬性的信息增益比,把具有最高信息增益比的屬性作為給定集合的測(cè)試屬性,然后創(chuàng)建一個(gè)節(jié)點(diǎn),以此屬性為標(biāo)記,創(chuàng)建屬性每個(gè)值的分枝,最后按照此劃分樣本。
假設(shè)S是類標(biāo)記樣本訓(xùn)練集,類標(biāo)號(hào)Ci具有m個(gè)不同值(i=1,2…,m),CiS是Ci類的樣本集合,|S|和|CiS|分別指S和CiS中的樣本個(gè)數(shù)。
(1)對(duì)S中樣本分類所需的期望信息由下式給出:
(2)又假定按照屬性A劃分S中的樣本,且屬性A將S劃分成v個(gè)不同的類。在該劃分之后,為了得到準(zhǔn)確的分類還需下面式子度量:
(3)計(jì)算信息增益公式:
Gain(A)=INfo(S)-InfoA(S)
(4)在屬性A上得到的信息增益比為:
本文采用2012年、2013年兩年的卷接設(shè)備[5](卷煙機(jī)、接嘴機(jī)、裝盤機(jī)、電機(jī)等)數(shù)據(jù)作為初始樣本集,同時(shí)應(yīng)用聚類方法中的K-means算法進(jìn)行聚類。在確定各類的基礎(chǔ)上,對(duì)2014上半年的采集數(shù)據(jù)依據(jù)C4.5算法進(jìn)行分類。分類實(shí)驗(yàn)結(jié)果基本準(zhǔn)確,能夠起到預(yù)測(cè)卷接設(shè)備故障的效果。但由于卷接設(shè)備包括子設(shè)備較多,因此只論述卷接電機(jī)[16]的決策樹結(jié)構(gòu)。圖2給出了電機(jī)診斷決策樹結(jié)構(gòu),其中值4.4、3.23、1.93、3.17是原始卷接電機(jī)數(shù)據(jù)樣本通過C4.5算法得到。
數(shù)據(jù)挖掘作為一項(xiàng)比較先進(jìn)的數(shù)據(jù)處理技術(shù),在國內(nèi)得到了迅速的發(fā)展,也取得了較多成果,但在煙草行業(yè)的應(yīng)用極少,尤其是煙機(jī)設(shè)備的應(yīng)用方面。本文針對(duì)決策樹方法在煙機(jī)設(shè)備方面的應(yīng)用進(jìn)行了探討,并嘗試對(duì)設(shè)備的故障問題進(jìn)行了發(fā)掘。實(shí)踐證明,決策樹能夠很好地對(duì)故障問題進(jìn)行預(yù)測(cè)分析,在發(fā)現(xiàn)有價(jià)值的知識(shí)與信息方面取得了較好的效果。
[1]卿宇搏,莫學(xué)芳,吳上海.故障診斷技術(shù)綜述及發(fā)展趨勢(shì)[J].中國儲(chǔ)運(yùn),2012,(11):124-127.
[2]毛國君,段立娟,王實(shí).數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005:1-82.
[3]顏文娟.五種決策樹算法的比較研究[D].大連:大連理工大學(xué),2011.
[4]魯文波.基于聲場(chǎng)空間分布特征的機(jī)械故障診斷方法及其應(yīng)用研究[D].上海:上海交通大學(xué),2012.
[5]陶永峰.數(shù)據(jù)挖掘在煙草行業(yè)質(zhì)量管理中的應(yīng)用[D].武漢:武漢理工大學(xué),2007.
[6]黃愛輝.決策樹C4.5算法的改進(jìn)及應(yīng)用[J].科學(xué)技術(shù)與工程,2009,(01):34-36.
[7]吳澤樟,趙曉雷.煙草制絲設(shè)備偷停故障的分析與處理[J].企業(yè)技術(shù)開發(fā),2013,(04):49-50.
[8]超高.速卷接機(jī)多軸同步運(yùn)動(dòng)控制技術(shù)實(shí)驗(yàn)研究[D].湖南:湖南大學(xué),2013.
[9]林德民.批次控制技術(shù)在制絲線上的應(yīng)用[J].自動(dòng)化儀表,2013,(04):28-31.
[10]梁岳.狀態(tài)監(jiān)測(cè)系統(tǒng)在煙草制絲線的集成應(yīng)用[J].機(jī)電信息,2014,(27):133-134.
[11]何文婕,劉晉,王能友.制絲線監(jiān)控系統(tǒng)升級(jí)改造[J].中國包裝工業(yè),2014,(10):84.
[12]姜鑫,周彬.數(shù)據(jù)挖掘技術(shù)在水電廠主設(shè)備狀態(tài)檢修中的應(yīng)用研究[J].水電自動(dòng)化與大壩監(jiān)測(cè),2014,(04):45-47.
[13]紀(jì)懷猛.電力系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)[J].長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2014,(02):35-36.
[14]張迎春.基于數(shù)據(jù)挖掘技術(shù)的保護(hù)設(shè)備故障信息管理與分析系統(tǒng)[J].無線互聯(lián)科技,2014,(05):78-79.
[15]姚明鏡,張春良,岳夏.故障診斷技術(shù)在煙草機(jī)械中的應(yīng)用和發(fā)展趨勢(shì)[J].機(jī)械制造,2014,(06):71-72.
[16]王英卓.煙機(jī)發(fā)電機(jī)組油膜振蕩的診斷分析與處理[J].電工技術(shù),2014,(08):42-43.
[17]翁海寬,江劍.測(cè)試技術(shù)在設(shè)備故障診斷中的具體應(yīng)用[J].新技術(shù)新工藝,2015,(04):145-148.
[責(zé)任編輯:王榮榮 英文編輯:劉彥哲]
Data Mining in Hood Equipment Management
DING Meng,FAN Wei,WANG Zi-han
(1.The Air Force Engineering University,Xi’an,Shanxi 10000,China;2.Dalian University of Technology,Dalian,Liaoning 116000,China)
To the problem that it is very difficult to find failure trend,data mining technology is used to derive implicit but useful information and knowledge that people do not know in advance in tobacco machinery,and then tobacco machinery failure problems are predicatively analyzed based on the information and knowledge,thus transforming man-found to machine-found to provide decision support in equipment maintenance for enterprises and reducing maintenance time and cost consuming equipment.Taking making and plug assembling machine as example,the decision tree is used to classify cigarettes,and the result conforms to people’s experience.It verifies the feasibility of predicting failure trend in hood equipment by data mining.
data mining;decision tree;equipment failure
丁萌(1994-),女,河北唐山人,空軍工程大學(xué)2012級(jí)信息與導(dǎo)航學(xué)院信息工程專業(yè)學(xué)生。
TP 311.12
A
10.3969/j.issn.1673-1492.2015.06.006
來稿日期:2015-09-22