王杰曾 徐琳琳 劉 昭 徐如林 袁 林
1)中國建筑材料科學(xué)研究總院有限公司 北京 100024
2)瑞泰科技股份有限公司 北京 100024
3)河南瑞泰耐火材料科技有限公司 河南鄭州 451162
大數(shù)據(jù)分析或數(shù)據(jù)挖掘是指運用各種工具如數(shù)據(jù)分析和機器學(xué)習(一種人工智能方法)從大量的、模糊的數(shù)據(jù)中,提取隱含信息[1-6],并將該信息轉(zhuǎn)化為易于理解的模式再用于指導(dǎo)實踐。首先,數(shù)據(jù)挖掘之前,要花大力氣去理解項目背景和數(shù)據(jù)特性;挖掘之中,要優(yōu)選工具和優(yōu)化參數(shù);挖掘之后,要將所提取的信息轉(zhuǎn)化成為使用者易于理解的知識,去偽存真、去粗取精后,再交用戶使用。其次,用開源、免費的軟件如R代替昂貴的商業(yè)軟件。
本文中,講述利用R軟件分析堿性耐火磚生產(chǎn)企業(yè)的成型數(shù)據(jù),發(fā)現(xiàn)缺陷的產(chǎn)生規(guī)律,研究其治理方法,旨在通過舉一反三實現(xiàn)提高制造業(yè)產(chǎn)品質(zhì)量和經(jīng)濟效益。
某企業(yè)成立于2008年,以堿性定形耐火磚為主要產(chǎn)品。成立初,建設(shè)了一條年產(chǎn)15 000 t生產(chǎn)線,以桑德摩擦壓磚機和高溫燃氣隧道窯為生產(chǎn)設(shè)備。2010年又投資新建年產(chǎn)25 000 t以萊斯全自動油壓機(簡稱萊斯)和高溫燃氣隧道窯為生產(chǎn)設(shè)備的二線,并整合原料工段實現(xiàn)了配料自動化。
2012年,中國經(jīng)濟進入了“新常態(tài)”,高溫工業(yè)快速增長的勢頭戛然而止,耐火材料由賣方市場變?yōu)橘I方市場。由于成立晚,基礎(chǔ)薄,一方面缺乏技術(shù)工人,生產(chǎn)合格率不高;另一方面,缺乏強勢品牌,產(chǎn)品價格低下。為了改變現(xiàn)狀,該企業(yè)采取了三項措施:其一,完善全面質(zhì)量管理的檢測體系,其要點是:根據(jù)工藝特點,在生產(chǎn)流水線的每一重要環(huán)節(jié)設(shè)立檢測點;設(shè)定檢測項目;設(shè)定檢測方法。其二,完善全面質(zhì)量管理的考核制度,其要點是:對檢測結(jié)果進行統(tǒng)計再以此為據(jù)執(zhí)行考核制度,并將考核結(jié)果與員工收入掛鉤。其三,用微機分析檢測數(shù)據(jù),發(fā)現(xiàn)其中規(guī)律再進行針對性治理。
數(shù)據(jù)挖掘是從數(shù)據(jù)中挖掘有用信息的探索性過程。數(shù)據(jù)挖掘的第一步就是搜集和清洗有含金量的數(shù)據(jù),其開銷占整個挖掘項目的60%~70%。
數(shù)據(jù)為2014年某月的質(zhì)量統(tǒng)計報告。報告由質(zhì)量檢查員匯總每日的檢測結(jié)果,統(tǒng)計員再匯總各檢查員每日上報的結(jié)果產(chǎn)生。報告以WPS數(shù)據(jù)表(21列,61行)提交,61行分別是1行表頭和60行不同規(guī)格又14個品種的統(tǒng)計值,14個品種為:電半(電熔半再結(jié)合鎂鉻磚)-16、直(直接結(jié)合鎂鉻磚)-9A、鎂鐵(鎂鐵磚)、直-16、直-12、鎂鐵鋁(鎂鐵鋁尖晶石磚)、A型鎂鋁(鎂鋁磚)、B型鎂鋁、普鉻(普通鎂鉻磚)-16、直-22、C型鎂鋁、直-18、鎂鋁鉻(鎂鋁鉻磚)、直-14。21列表示不同屬性,分別是行業(yè)、品種、型號、出干燥器數(shù)量、出干燥器質(zhì)量、入窯數(shù)量、入窯質(zhì)量、麻面、斷面、公差、粘模、飛邊、邊角、裂紋、中心線偏差、雜質(zhì)、扭曲、廢品總數(shù)量、廢品總質(zhì)量、合格率、生產(chǎn)線。21個屬性中,需要解釋的名稱為:1)型號,是指給不同品種和不同磚型的編號,前面字母是指材質(zhì),比如MLJ為鎂鋁,Zmge為直接結(jié)合鎂鉻,后面數(shù)字代表不同磚型的尺寸,具體可到企業(yè)的磚型冊查找;2)邊角,是指成型過程中造成的邊角破裂等廢品;3)斷面,是指由于壓磚過程中彈性后效或排氣不及時造成的磚中間或三分之一處有層裂;4)公差,是指成型后磚型厚度方面跟要求客戶要求尺寸的誤差,指超過內(nèi)控標準的廢坯。
首先,將出干燥器的數(shù)量、出干燥器質(zhì)量、廢品總數(shù)量、廢品總質(zhì)量、合格率五個指標減縮為出干燥器質(zhì)量和合格率兩個,并將出干燥器質(zhì)量重新命名為產(chǎn)量,以減少問題的維數(shù)。其次,將表中的缺失值用0替換,刪除本月測試結(jié)果均為0的屬性“扭曲”,再刪除合格率為0的一個離群值。數(shù)據(jù)分析時,缺失值表示為Null。對Null,可由0、均值、前后值、回歸值等多種方法替代。如不加指定,軟件將按默認方式處理就可能造成較大誤差。同理,本月一次試驗的樣磚在烘烤時全部炸裂,合格率為零,其記錄也必須剔除。
數(shù)據(jù)探索是一種承上啟下的過程,其主要任務(wù)是初步地分析所準備的數(shù)據(jù),打下建模分析的基礎(chǔ),其主要工具有數(shù)據(jù)匯總、數(shù)據(jù)分布、相關(guān)分析、主成分分析等。本文中已將數(shù)據(jù)分布移入上節(jié),如將找出合格率為0的離群值全部刪除;并入下節(jié)建模的聚類分析和關(guān)聯(lián)分析結(jié)果。
其一,用R的rattle包[6]導(dǎo)入數(shù)據(jù),行業(yè)、品種、型號、生產(chǎn)線為離散型變量,再將其選定為輸入變量;同理,出干燥器質(zhì)量為數(shù)值輸入變量;麻面、公差、飛邊、粘模、雜質(zhì)、裂紋、邊角、斷面、中心線偏差為數(shù)值型中間變量;合格率為最終輸出變量。用Apriori算法,選定參數(shù)支持度大于或等于0.20、置信度大于或等于0.60,求得的規(guī)則顯示了生產(chǎn)組織的特點,見表1。由表1可見,有色行業(yè)用磚全部交一線生產(chǎn)(置信度為1);水泥行業(yè)用磚型號的66.7%交二線生產(chǎn),其余交一線;二線只生產(chǎn)水泥行業(yè)用磚;一線生產(chǎn)型號有69.2%為有色行業(yè)用磚,其余為水泥用磚;直-9A磚只限于水泥行業(yè)。
表1 關(guān)聯(lián)分析發(fā)現(xiàn)的生產(chǎn)組織規(guī)律
其二,用WPS表格的數(shù)據(jù)透視表求出合格率與品種、產(chǎn)量(以出干燥器質(zhì)量表示)的關(guān)系,以及各類缺陷出現(xiàn)的總次數(shù),其結(jié)果見圖1。由圖1(a)可知,對合格率影響最大的就是產(chǎn)量很大但合格率居中(93.5%)的鎂鐵鋁(即鎂鐵鋁尖晶石磚);產(chǎn)量居中但合格率中偏下(92.1%~91.6%)的是C型鎂鋁和直-18磚;產(chǎn)量低但合格率最低(88.9%~88.2%)的是鎂鋁鉻和直-14磚。
圖1 各種耐火磚的合格率與產(chǎn)量以及各種缺陷出現(xiàn)的總次數(shù)
其三,用軟件R繪出缺陷間的圖示相關(guān)系數(shù)[7],見圖2。由圖2(a)和圖1(b)可知,缺陷分為三類:中心線偏差、斷面(層裂)和麻面。由圖2(b)可知,K均值聚類分析[8]也證實缺陷可分三類。其中,第1類中心點的層裂的分值顯著偏高;第2類麻面、公差、飛邊、雜質(zhì)、裂紋、邊角的分值顯著偏高;第3類中心線偏差顯著偏高。主成分分析與之類似:第1類麻面、公差、飛邊、雜質(zhì)、裂紋、邊角的分值顯著偏高;第2類層裂的分值明顯偏高;第3類中心線偏差的分值顯著偏高。因此,如果忽略數(shù)量很少的中心線偏差,可認為堿性耐火材料的成型缺陷只分為麻面和層裂兩類。
圖2 耐火磚成型缺陷之間的相關(guān)系數(shù)矩陣和K均值聚類分析結(jié)果
由此,可作出小結(jié):1)治理的重點是提高產(chǎn)量大或合格率低的鎂鐵鋁尖晶石磚、C型鎂鋁磚、直-18磚、直-14磚、鎂鋁鉻磚等品種的合格率;2)提高合格率的主要途徑是設(shè)法減少層裂和麻面這兩類缺陷。由于層裂和麻面是兩類主要缺陷,其他缺陷或與它們高度相關(guān),或數(shù)量很少,控制了這兩類也就控制了全部缺陷。
模型用于表達輸入變量(原因變量)和輸出變量(結(jié)果變量)之間的數(shù)學(xué)關(guān)系或邏輯關(guān)系。本文,有1個結(jié)果變量——合格率;5個原因變量——行業(yè)、品種、型號、出干燥器質(zhì)量、生產(chǎn)線;9個中間變量——麻面、公差、飛邊、粘模、雜質(zhì)、裂紋、邊角、斷面、中心線偏差。首先,將所有關(guān)系分為三類:原因變量與結(jié)果變量、中間變量與原因變量、中間變量與結(jié)果變量。其次,逐一建立所述模型并解釋輸入變量與輸出變量的關(guān)系。最后,根據(jù)模型預(yù)測的正確率以及能否轉(zhuǎn)換成為專業(yè)技術(shù)人員易于理解的知識從中選擇優(yōu)勝者。例如,隨機森林和人工升級網(wǎng)絡(luò)模型的預(yù)測精度很高,但其因果關(guān)系難以表示為人易于理解的知識。如其他模型的精度滿足需求,只好將隨機森林和人工神經(jīng)網(wǎng)絡(luò)模型淘汰。此外,由于結(jié)果變量為強度性質(zhì),中間變量為容量性質(zhì),需將中間變量除以產(chǎn)量(例如出干燥器質(zhì)量),轉(zhuǎn)變?yōu)閺姸刃再|(zhì)的變量。
4.1.1 型號對合格率的影響
首先,將5個原因變量和1個結(jié)果變量導(dǎo)入軟件R,運用決策樹[9]方法分析的結(jié)果是按合格率多級多次分解后將最終型號分為三類:第2類平均合格率91%,第6類平均合格率97%,第7類平均合格率99%。接著,用WPS表格做出以型號為“行”,合格率平均值為“值”的數(shù)據(jù)透視表。其次,按合格率高低排序,在新列建立邏輯關(guān)系式:以91%和97%的均值(96%)、97%和99%的均值(98%)為分界線,將型號按對應(yīng)合格率的數(shù)值分為低中高三類。發(fā)現(xiàn)如下規(guī)律:1)合格率為低(86.4%~92.8%)的19個型號,除1個型號(或是企業(yè)磚型冊沒有注冊的特殊型號,或是最大尺寸為270~380 mm的大磚,或技術(shù)不熟練或工藝特殊如大量加廢磚的產(chǎn)品),其余正常;2)合格率居中(93.4%~98.0%)的27個型號,除合格率小于95.3% 的8個型號,除2個特殊型號,除1個尺寸偏大型號,其余正常;3)合格率為高(>98.0%)的13個型號,全為型號正常的產(chǎn)品。
4.1.2 品種對合格率的影響
如果選擇行業(yè)和品種為輸入變量、合格率為輸出變量,選擇決策樹模型,設(shè)置Max Depth(最大樹深度)為5,可以得到品種對合格率影響的決策樹,見圖3。
圖3 品種對合格率影響的決策樹
由圖3可知,在自動分類的41組品種(以n表示)中,品種不屬于A型鎂鋁、C型鎂鋁、鎂鐵鋁、普鉻-16、直-14、直-18、直-22的,合格率高(平均98%);品種屬于的,合格率低(平均92%),其中,普鉻-16、直-14、直-18三個品種的合格率最低(其平均值僅為90%)。
如以品種為“行”、以合格率平均值為“值”制作數(shù)據(jù)透視表,再以合格率高低排序,也可發(fā)現(xiàn)直-14、直-18磚多為有色行業(yè)用大磚或特殊磚型,因而合格率最低(90%);鎂鐵鋁磚和鎂鋁磚因工藝不完善、操作不熟練也導(dǎo)致合格率中等偏下(93%),但圖3對普鉻-16的分類不完全正確。
4.1.3 產(chǎn)量對合格率的影響
如果選擇產(chǎn)量(出干燥器質(zhì)量)和生產(chǎn)線為原因變量,選擇合格率為結(jié)果變量,以決策樹為模型,設(shè)置Max Depth為5,就可以得到產(chǎn)量對合格率影響的決策樹,見圖4。由圖4看出,在自動分類的41組品種中,9組大于或等于72 t數(shù)據(jù)的平均合格率最高,97%;17組產(chǎn)量<15 t數(shù)據(jù)的平均合格率為96%;余下15組合格率居中,15~72 t數(shù)據(jù)的平均合格率最低,僅92%。
圖4 產(chǎn)量對合格率影響的決策樹
如果以出干燥器產(chǎn)量為“行”、以合格率平均值為“值”制作數(shù)據(jù)透視表,再以合格率高低排序,發(fā)現(xiàn)產(chǎn)量>72 t的樣本,除了一個大量加入廢磚的C型鎂鋁MLJ-16的合格率為92.6%外,其余合格率為95.7%~98.5%。這說明產(chǎn)量大的產(chǎn)品為市場需求大、技術(shù)相對成熟的產(chǎn)品。如無特殊原因,合格率很高。在產(chǎn)量最低(<15 t)的27個型號中,含4個技術(shù)不夠成熟的鎂鋁、鎂鐵鋁材質(zhì)的型號,1個尺寸較大,1個不在冊的特殊型號,因而合格率居中。產(chǎn)量居中(15~72 t)的21個型號中,因含7個特殊、3個大尺寸和3個不成熟型號,合格率最低。
可見,型號、品種、產(chǎn)量均為影響合格率的重要因素。但是,三者之間存在的關(guān)聯(lián)可使問題復(fù)雜化。
首先,以9個中間變量(麻面、公差、飛邊、粘模、雜質(zhì)、裂紋、邊角、斷面、中心線偏差)為輸入,以合格率為輸出,將數(shù)據(jù)導(dǎo)入R,采用線性模型求出:有3個非常顯著的因子——麻面、公差和斷面;有2個一般顯著的因子——雜質(zhì)、邊角。
其次,以9個中間變量為輸入,以合格率為輸出,將數(shù)據(jù)導(dǎo)入R,采用決策樹模型求出缺陷類別對磚坯合格率的影響見圖5。由圖5可看出,如果斷面(層裂)產(chǎn)品≥1.5 t,平均合格率為91%;如果斷面產(chǎn)品<1.5 t,但麻面產(chǎn)品≥1 t,合格率為95%;只有斷面產(chǎn)品<1.5 t且麻面產(chǎn)品<1 t,才能保證合格率為98%。
圖5 缺陷類別對磚坯合格率的影響
以生產(chǎn)線、品種2個輸入變量為“行”,2個輸出變量(麻面產(chǎn)品、斷面產(chǎn)品)為“值”制作數(shù)據(jù)透視表,再選定某生產(chǎn)線后按麻面產(chǎn)品/t的數(shù)值大小排序,求得生產(chǎn)裝備和品種對缺陷率的影響,見圖6。
圖6 生產(chǎn)裝備和產(chǎn)品材質(zhì)對磚坯缺陷率的影響
如前所述,二線使用萊斯壓機成型,一線使用摩擦壓機成型;9個中間變量中,麻面和斷面是最重要的。由圖6看出,左端前面3個直-9A、鎂鐵鋁和鎂鐵磚是二線用萊斯壓機生產(chǎn)的;后面的都用一線摩擦壓磚機生產(chǎn)。由圖6可得:1)如使用萊斯壓機生產(chǎn),所制磚坯的單位缺陷數(shù)尤其是指標斷面產(chǎn)品顯著小于使用摩擦壓機的。2)如使用萊斯壓機生產(chǎn),但沒有調(diào)整好成型工藝參數(shù)如鎂鐵鋁磚,先進設(shè)備就難以發(fā)揮作用。3)如使用萊斯壓機生產(chǎn),但因磨損或料性調(diào)控不佳致使成型面粘連而產(chǎn)生麻面,如當月產(chǎn)量高達1 118 t的直-9A磚,先進設(shè)備也難以發(fā)揮作用。4)如使用摩擦壓機生產(chǎn),不僅平均合格率較低,而且麻面和層裂常常同時取高值。可見,麻面產(chǎn)生時伴隨著磨具成型面和磚大面的不均勻作用,不均勻作用又會引起層裂。5)如使用摩擦壓機生產(chǎn),但技術(shù)熟練且尺寸較小如直-9A磚,產(chǎn)生的缺陷數(shù)就相當于使用萊斯壓機生產(chǎn)的。
綜上所述,提高堿性耐火磚成型合格率的主要方向是想方設(shè)法減少產(chǎn)量很大但合格率居中的鎂鐵鋁磚,產(chǎn)量中但合格率中偏低的C型鎂鋁磚和直-18磚,以及產(chǎn)量低但合格率也最低的鎂鋁鉻磚和直-14磚的缺陷數(shù)。
堿性耐火磚的主要成型缺陷有麻面、層裂和中心線偏差三種。中心線偏差因數(shù)量較少可以忽略;層裂是相對獨立的,但與麻面輕度相關(guān);麻面與剩余其他缺陷強烈相關(guān)。整改的內(nèi)容是減少層裂和麻面這兩種主要缺陷。
其他措施為:1)型號是影響合格率的最重要因素。因此,要特別注意企業(yè)磚型冊上沒有注冊、工人生產(chǎn)經(jīng)驗缺乏的特殊磚型,或者最大尺寸等于或大于270~380 mm磚,或是操作不熟練的磚,應(yīng)加強對問題的指導(dǎo),組織有經(jīng)驗的師傅攻關(guān),再通過傳幫帶解決問題。2)品種是影響合格率的重要因素。凡合格率低下的品種,大都是不夠成熟,帶著未解決問題投入生產(chǎn)的品種。因此,應(yīng)通過持續(xù)的改進解決所發(fā)現(xiàn)的、前期開發(fā)遺留的問題。3)產(chǎn)量是影響合格率的重要因素。特別要注意市場需求大、產(chǎn)量大,技術(shù)不夠成熟而匆忙投入生產(chǎn)的型號,以及產(chǎn)量中等的其他問題型號。4)使用萊斯壓磚成型應(yīng)解決兩個問題:其一,因成型工藝不恰當引起的層裂問題;其二,因材料、維護或料性不當引起的麻面問題。5)使用摩擦壓磚機成型要解決三個問題:其一,發(fā)現(xiàn)問題品種、問題磚型后,組織科技人員和技術(shù)工人聯(lián)合攻關(guān),解決問題后再加以推廣;其二,關(guān)注問題品種、問題型號合格率的變化,如果操作工人中出現(xiàn)佼佼者,總結(jié)其操作經(jīng)驗加以推廣;其三,對問題型號和品種,嚴格控制其生產(chǎn)工藝,采用新的耐磨材料和潤滑劑,以提高成型質(zhì)量。
根據(jù)問題的特征和缺陷的規(guī)律采取針對性措施,有的放矢地解決了產(chǎn)品缺陷的問題。到2016年,總合格率從93%提高到96%,取得了很好效果。