魏 彥
(博世汽車部件(長沙)有限公司,長沙 410100)
隨著工業(yè)4.0 的發(fā)展,越來越多的生產(chǎn)過程數(shù)據(jù)通過智能傳感器得到了采集和存儲。如何將這些收集到的數(shù)據(jù)有效地輔助工藝生產(chǎn),成為制約工藝精益生產(chǎn)進(jìn)一步發(fā)展的一大難題。某工廠通過自主研發(fā),開發(fā)了一套收集點焊工藝過程參數(shù)變化和測試臺數(shù)據(jù)的設(shè)備管理系統(tǒng)。該系統(tǒng)可以對產(chǎn)品進(jìn)行識別、綁定、信息存儲,打通焊接過程和測試臺收集的數(shù)據(jù),將兩方面的數(shù)據(jù)通過產(chǎn)品唯一編碼進(jìn)行關(guān)聯(lián)。這樣的關(guān)聯(lián),使得通過累積大量數(shù)據(jù)來優(yōu)化工藝過程成為可能。
各車企和相應(yīng)零備件設(shè)備供應(yīng)商自動化程度在近年來有了很大地提高。機器人焊槍被廣泛應(yīng)用于焊裝線,其使用一段時間后需要更換新電極。自動線頻繁更換電極不僅降低了設(shè)備開通率、影響生產(chǎn)線的節(jié)拍和工廠產(chǎn)能,也浪費大量人力成本和物料成本,因此需要合理和科學(xué)地提升機器人焊槍的點焊電極壽命。電極焊接一定時間后,電極端部逐漸磨損成蘑菇狀,端面直徑增加,導(dǎo)致電流密度降低進(jìn)而影響焊點強度。針對機器人焊槍使用壽命提升,實際生產(chǎn)中主要有如下2種解決方案。
(1)電流遞增補償法。在特定焊點數(shù)內(nèi)逐漸增加電流。但該方法需要耗費更大的能量,加劇電極磨損,且只能按照事先通過實驗確定的電流遞增工藝方案進(jìn)行焊接,無法解決因不確定性電極磨損造成的焊點質(zhì)量下降。
(2)電極修磨法。通過修磨使電極端面恢復(fù)初始尺寸。但目前工廠均采用經(jīng)驗修磨時刻修磨,而修磨時刻(修磨間隔點)的選取會對電極壽命和焊接質(zhì)量產(chǎn)生很大影響。另外修磨參數(shù)選取過大會導(dǎo)致電極切削量過多降低電極壽命,而修磨參數(shù)選取過小會導(dǎo)致電極未被修復(fù)影響后續(xù)焊接質(zhì)量。機器人修磨累計達(dá)到一定數(shù)量(修磨總次數(shù))后,電極將達(dá)到最終壽命[1]。
本文采用自主開發(fā)的點焊UIR 傳感器收集到的數(shù)據(jù)和測試臺收集到的產(chǎn)品測試數(shù)據(jù)對關(guān)鍵工藝的易消耗品壽命進(jìn)行建模預(yù)測。在UIR系統(tǒng)工作過程中遵循2個守恒原則。(1)功率守恒。在焊接過程中,功率P=I2R。對于焊接不同焊件的時候,由于功率恒定,等效電阻R增大,則電流I就會降低;等效電阻R減小,電流就會升高。(2)能量守恒。在遵循功率守恒的情況下,UIR 系統(tǒng)確保實際焊點的能量與樣本焊點能量的關(guān)系是:E實際≥E樣本[2]。
某UIR 傳感器在很多的車企和相應(yīng)零備件設(shè)備供應(yīng)商得到了廣泛的應(yīng)用,在車企和相應(yīng)零備件制造商常用的解決方案基礎(chǔ)上,針對長時間采集到的傳感器數(shù)據(jù)進(jìn)行綜合性和系統(tǒng)性地分析,從大數(shù)據(jù)分析的角度,開創(chuàng)性地提出一個可行的易耗品壽命預(yù)測模型,這個模型可有效地提高如電極等易耗品的使用壽命、節(jié)省人力物力成本、提高產(chǎn)品質(zhì)量和工藝穩(wěn)定性。而且相比于傳統(tǒng)的電極壽命延長方法,這個方法并不需要對設(shè)備進(jìn)行停機維護(hù),可以通過后臺的監(jiān)控和計算,實現(xiàn)更穩(wěn)健和精確的電極壽命預(yù)測。
設(shè)備管理系統(tǒng)將針對每個焊接的產(chǎn)品,在點焊過程中采集多達(dá)上百個不同的變量。對數(shù)據(jù)的預(yù)處理和構(gòu)建特征工程分為以下幾個步驟。
參考工藝專家和實際數(shù)據(jù)情況,對點焊過程影響較小而且實際變化非常小的變量進(jìn)行了預(yù)處理。預(yù)處理之后的點焊過程變量保留了最重要的電流、電壓、動態(tài)電阻(動態(tài)電阻是指在點焊過程中上、下電極之間的等效電阻[2])、功率等過程信息。
因為皮爾森相關(guān)系數(shù)對異常值的敏感性[3]和工程原理上聚類分析的有效性,在進(jìn)行數(shù)據(jù)預(yù)處理和探索性統(tǒng)計分析的過程中,采用了動態(tài)的皮爾森相關(guān)系數(shù)以及基于主成分分析的動態(tài)聚類方法[4]。通過對時序數(shù)據(jù)的動態(tài)展示和分析,可以清楚地識別到某一時間段內(nèi),在數(shù)據(jù)中存在偏離實際工程原理的離群點或者異常值。圖1 所示為針對分段數(shù)據(jù)識別到的異常離群段。
動態(tài)皮爾森系數(shù)的定義如下:
式中:xit和yit分別為時間段t內(nèi),重要變量的取值;和分別為時間段t內(nèi),重要變量的n個觀察點的平均值。
圖1 分段數(shù)據(jù)識別到的異常離群段
圖2 基于主成分分析的K-means聚類來識別出數(shù)據(jù)中存在的重要離群點
針對某一時間段的異常值,在異常值處理中,除了采用傳統(tǒng)統(tǒng)計學(xué)上的異常值處理方法[5],參考了Breunig 為給定的數(shù)據(jù)定義的本地離群因子或者異常分?jǐn)?shù)(LOF)。對于任何給定的數(shù)據(jù)實例,LOF等于觀察點的k個最近鄰居的平均局部密度和數(shù)據(jù)實例本身的局部密度之比。在正常情況下,如果數(shù)據(jù)都位于某一個區(qū)域內(nèi),其局部密度將與其鄰居相似,而對于異常實例,其局部密度將低于其最近的局部密度。所以異常點將會有更高的LOF異常分?jǐn)?shù)[6],如圖2所示。
任何一個數(shù)據(jù)點A的k鄰域內(nèi)的LOF異常分?jǐn)?shù)如下:
其中
針對點焊過程采集到的數(shù)據(jù)的強相關(guān)性,參考了工藝專家對采集到的參數(shù)的理解,結(jié)合工藝專家的理解和采集到的數(shù)據(jù),參考LOF 方法的相關(guān)思路,采用穩(wěn)健回歸模型考慮離群值并自動獲知數(shù)據(jù)樣本是否異常值。其將固有地生成分類閾值,同時對參數(shù)偏差具有魯棒性[7]。通過計算LOF和基于相關(guān)性的穩(wěn)健回歸進(jìn)一步排除掉在數(shù)據(jù)采集和工藝過程中的可能異常點,保證大數(shù)據(jù)分析的準(zhǔn)確性。
結(jié)合點焊和測試臺數(shù)據(jù)的關(guān)聯(lián)性,綜合考慮在分類和回歸2種應(yīng)用場景下的隨機森林關(guān)聯(lián)建模。(1)針對分類問題,對于隨機森林中的每棵樹,記錄數(shù)據(jù)袋外部分(OOB)的預(yù)測準(zhǔn)確度。在置換每個預(yù)測變量后,同樣對預(yù)測準(zhǔn)確度進(jìn)行記錄。在所有樹上平均置換前后的預(yù)測準(zhǔn)確度之間的差異,并通過標(biāo)準(zhǔn)誤差將其標(biāo)準(zhǔn)化。(2)針對連續(xù)型變量的回歸,將對每棵樹,計算OOB的均方誤差(MSE)。
對于每棵樹的均方誤差RMSE定義如下:
式中:Yi為n個樣本點的觀察值;為相應(yīng)的預(yù)測值。
在對變量進(jìn)行置換后計算出RMSE,通過標(biāo)準(zhǔn)誤差對差異進(jìn)行平均并歸一化。如果變量的標(biāo)準(zhǔn)誤差等于0,則不進(jìn)行歸一化處理。經(jīng)過這樣的差異計算之后,可以將所有變量的重要性按這一指標(biāo)進(jìn)行從大到小的排序[8~10]。其中針對重要的等效電阻這個變量的重要性排序如圖3所示。
圖3 針對焊接過程中的12 個焊接點位的基于隨機森林模型建立的重要性排序
傳統(tǒng)的統(tǒng)計模擬本質(zhì)上都是確定性,但工程應(yīng)用的不確定性卻因許多原因而產(chǎn)生,例如由于制造過程、自然材料可變性、初始條件、系統(tǒng)的磨損或損壞以及系統(tǒng)周圍環(huán)境而引起的。此外,由于模型中的假設(shè)以及模擬中使用的數(shù)值逼近,建模過程本身可能會引入較大的不確定性。前者通常通過工業(yè)實際的模型驗證來解決,而后者則通過程序調(diào)優(yōu)和解決方案驗證來針對關(guān)鍵的變量變化進(jìn)行解決[11]。對變量的概率統(tǒng)計分布情況進(jìn)行研究,具體來說將參考變量的統(tǒng)計分布信息進(jìn)行探索性的擬合,是一種行之有效的擬合數(shù)值本身不確定性的方法。
進(jìn)一步對關(guān)鍵變量進(jìn)行分段可視化展示,對電極使用次數(shù)這個參數(shù)進(jìn)行PLC 端的程序錄入,消除了之前只靠人工紙質(zhì)記錄更換時間和次數(shù)的弊端,實現(xiàn)了對于電極壽命進(jìn)行了自動化跟蹤監(jiān)控。通過關(guān)鍵變量的可視化展示、結(jié)合相應(yīng)的數(shù)學(xué)模型擬合,發(fā)現(xiàn)諸如等效電阻的關(guān)鍵變量在一個電極使用周期里有著統(tǒng)計意義上顯著的變化規(guī)律,讓通過采集到的數(shù)據(jù)實現(xiàn)電極等消耗品壽命成為可能。
將采用偏度峰度圖(Cullen and Frey graph)對變量的統(tǒng)計分布進(jìn)行可視化的表示和擬合[12]。如圖4 所示,偏度峰度圖中的橫軸為偏度(sk)的無偏估計的平方,縱軸為峰度(kr)的無偏估計[13],觀察樣本的峰度、偏度計算定義如下:
式中:mk為關(guān)于樣本點的k階矩;n為樣本量;xi為觀察的數(shù)據(jù)值;xˉ為觀察數(shù)據(jù)的平均值。
圖4 關(guān)鍵變量的峰度偏度圖與可能的一些概率分布
為了考慮到數(shù)據(jù)的峰度和偏度估計值的不確定性,可以使用重抽樣方式在重抽樣的樣本上計算偏度和峰度值(通過對原始數(shù)據(jù)集進(jìn)行替換并通過隨機抽樣構(gòu)建)[14],并在偏度峰度圖上得以呈現(xiàn)。
如圖5 所示的上半部分的概率密度圖和累積分布圖是傳統(tǒng)的經(jīng)典擬合優(yōu)度圖。下半部分的兩個圖中,Q-Q 圖強調(diào)分布尾部的空缺,而P-P圖強調(diào)分布中心的空缺[15]。左上方是相應(yīng)的直方圖和密度函數(shù)、左下方是Q-Q 分布圖、右上方是經(jīng)驗和理論的累積分布函數(shù)、右下方是對應(yīng)的P-P 分布圖。如圖6所示,圖中不同的顏色和數(shù)字代表著不同的焊腳,橫軸代表的是產(chǎn)品數(shù),豎線代表的是電極的更換。
通過之前的概率分布擬合,結(jié)合相應(yīng)的假設(shè)檢驗、極大似然估計和矩估計,可以推斷關(guān)鍵工藝的分布函數(shù)。結(jié)合海量的數(shù)據(jù)擬合分布函數(shù)史可以推斷出每一次的電極更換周期中的概率分布曲線,從而找到相關(guān)變量的邊界值。結(jié)合關(guān)聯(lián)的測試臺數(shù)據(jù),可以分析驗證得出該邊界值將會是影響點焊工藝的關(guān)鍵因素。
對于每一段的焊接數(shù)據(jù),采用平滑樣條線回歸對數(shù)據(jù)進(jìn)行擬合。針對任一變量y和任何節(jié)點數(shù)據(jù)xi,將尋找使如下的懲罰殘差平方和(RSS)最小的,在區(qū)間[a,b]內(nèi)二次可導(dǎo)平滑樣條函數(shù)g(x)。
懲罰殘差平方和(RSS)的數(shù)學(xué)定義如下:
式中:λ為需要通過合理的方法確定的調(diào)整參數(shù)。
在實際應(yīng)用過程中,可以等效計算出相關(guān)的自由度。自由度選擇的傳統(tǒng)方法包括交叉驗證、馬洛斯CP、推導(dǎo)出使得達(dá)到均方誤差極小值的解析形式等方法。這里將用到一種基于平滑樣條回歸自身特性的似然函數(shù)假設(shè)檢驗方法,結(jié)合交叉驗證對調(diào)整參數(shù)進(jìn)行選擇[16]。如圖5所示為針對關(guān)鍵變量的基于3個不同的分布函數(shù)統(tǒng)計分布擬合圖,通過選取合適的平滑樣條函數(shù)可以實現(xiàn)對關(guān)鍵數(shù)據(jù)在未來時間內(nèi)的動態(tài)預(yù)測,將預(yù)測的范圍值和之前的邊界值進(jìn)行比較,計算得到相應(yīng)生產(chǎn)線的推薦電極使用次數(shù)。
圖5 關(guān)鍵變量的基于3個不同的分布函數(shù)統(tǒng)計分布擬合圖
對于基于大數(shù)據(jù)分析預(yù)測到的推薦電極使用次數(shù),在實際產(chǎn)線中進(jìn)行進(jìn)一步地工藝驗證,對驗證數(shù)據(jù)進(jìn)行模型的驗算和確認(rèn)。確認(rèn)過后的電極壽命將在產(chǎn)線得到放行和投入實際的生產(chǎn)應(yīng)用。更改后的電極壽命也實現(xiàn)了模型監(jiān)控和反饋,可以及時地進(jìn)行模型調(diào)優(yōu)和故障排除?,F(xiàn)在已經(jīng)在工廠數(shù)條不同的產(chǎn)線實現(xiàn)了電極壽命延長。圖6所示為實際生產(chǎn)中的等效電阻在電極更換周期內(nèi)的變化圖。
圖6 等效電阻在電極更換周期內(nèi)的變化圖
本文結(jié)合傳統(tǒng)的統(tǒng)計分析手段、豐富的大數(shù)據(jù)采集和先進(jìn)的機器學(xué)習(xí)算法,解決制造業(yè)中的痛點問題。在工廠原有的控制器和測試臺數(shù)據(jù)的基礎(chǔ)上,進(jìn)行了數(shù)據(jù)的整合和打通,打通之后的數(shù)據(jù)可以對質(zhì)量進(jìn)行預(yù)測。通過數(shù)據(jù)庫之間的關(guān)聯(lián)和PLC 設(shè)備的控制,實現(xiàn)了關(guān)鍵設(shè)備易耗品相關(guān)的有效數(shù)據(jù)識別、采集,并用機器學(xué)習(xí)的模型對本身存在的工程規(guī)律進(jìn)行擬合,可以在不對實際生產(chǎn)產(chǎn)生干擾的情況下,實現(xiàn)關(guān)鍵設(shè)備易耗品壽命的合理監(jiān)控和預(yù)測。
目前,這一方法已經(jīng)在某公司多條生產(chǎn)線的點焊電極更換上進(jìn)行實際應(yīng)用,用大數(shù)據(jù)分析和機器學(xué)習(xí)建模幫助實際生產(chǎn)降低成本、提高效率、提升產(chǎn)品質(zhì)量。接下來,在數(shù)據(jù)驅(qū)動的實際生產(chǎn)大數(shù)據(jù)分析中,正在對易耗品壽命進(jìn)行更加全面地系統(tǒng)性分析,考慮更多基于人工智能的數(shù)據(jù)采集方法,以實現(xiàn)彈性和自適應(yīng)的壽命預(yù)測。