呂逸夫 王美林
摘要:有效的能耗預(yù)測方法對智能制造有著重要的意義。傳統(tǒng)的能耗預(yù)測主要基于單臺設(shè)備各種指標(biāo)和機(jī)器學(xué)習(xí)算法來進(jìn)行能耗狀態(tài)的判斷,雖然預(yù)測效果在不斷地提高,但是對需要多個模塊協(xié)同作用的大型生產(chǎn)設(shè)備的能耗的預(yù)測效果時有不佳。提出了一種基于Pearson相關(guān)性分析、RNN算法的多模塊的大型生產(chǎn)設(shè)備的能耗預(yù)測方法,該方法首先計算不同模塊能耗的Pearson相關(guān)系數(shù),對不同模塊進(jìn)行分組,再為各個分組收集多種異常狀態(tài)下的數(shù)據(jù),使用LSTM、GRU等RNN算法進(jìn)行預(yù)測。實驗表明,提出的方法有較高準(zhǔn)確度、召回率、F1-score,對多模塊的大型生產(chǎn)設(shè)備的能耗預(yù)測具有顯著優(yōu)勢。
關(guān)鍵詞: 多模塊生產(chǎn)設(shè)備;能耗分析;Pearson相關(guān)系數(shù);RNN算法
中圖分類號:TP391? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)28-0004-04
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
Energy Consumption Analysis of Multi-Module Large-Scale Production Equipment Based on RNN
Lv Yi-fu,WANG Mei-ling
(School of Information Engineering, Guangdong University of Technology, Guangzhou 510000,China)
Abstract:Effective energy consumption prediction methods are of great significance to intelligent manufacturing. Traditional energy consumption forecasting is mainly based on various indicators of a single device and machine learning algorithms to judge the energy consumption status. Although the forecasting effect is constantly improving, the energy consumption of large-scale production equipment that requires the synergy of multiple modules is predicted The effect is sometimes poor. Proposes a multi-module energy consumption prediction method for large-scale production equipment based on Pearson correlation analysis and RNN algorithm. The method first calculates the Pearson correlation coefficient of the energy consumption of different modules, groups the different modules, and then collects for each group Data under a variety of abnormal conditions are predicted using RNN algorithms such as LSTM and GRU. Experiments show that the proposed method has high accuracy, recall rate, F1-score, and has significant advantages in energy consumption prediction for large-scale multi-module production equipment.
Key words:multi-module production equipment; energy consumption analysis; pearson correlation coefficient; RNN algorithm
1 引言
在智能生產(chǎn)中,能耗運(yùn)行狀態(tài)是大型生產(chǎn)設(shè)備的重要的監(jiān)控指標(biāo)。能耗高于正常指標(biāo)會導(dǎo)致能源浪費(fèi)或設(shè)備過載,進(jìn)而直接或間接地給企業(yè)帶來損失;能耗過低又會帶來產(chǎn)能不足,產(chǎn)品質(zhì)量不高等問題。在智能制造飛速發(fā)展的背景下,已有一些傳統(tǒng)企業(yè)針對大型設(shè)備進(jìn)行智能化改造實現(xiàn)能耗數(shù)據(jù)的采集,用于實現(xiàn)造智能化能耗監(jiān)控。針對采集的能耗數(shù)據(jù),人們開始嘗試使用大數(shù)據(jù)分析技術(shù)對設(shè)備電機(jī)能耗的狀態(tài)預(yù)測。
針對PVC大型壓延生產(chǎn)設(shè)備進(jìn)行智能化設(shè)備改造,實時采集電流、轉(zhuǎn)速等能耗數(shù)據(jù)進(jìn)行相關(guān)分析。PVC壓延設(shè)備主要用于生產(chǎn)PVC壓延薄膜和裝飾材料,其生產(chǎn)設(shè)備的主要包括有攪拌機(jī)、開煉機(jī)、過濾機(jī)等模塊。在生產(chǎn)工作中,不僅需要單個模塊的正常工作,還需要生產(chǎn)設(shè)備的各個模塊的協(xié)調(diào)工作。因此,各設(shè)備模塊的能耗狀態(tài)的關(guān)聯(lián)性分析,是多模塊大型設(shè)備能耗分析的一個難點。
目前已有許多機(jī)器學(xué)習(xí)技術(shù)被應(yīng)用于能耗分析,并取得了不錯的成果。程亞豪等人使用隨機(jī)森林、梯度提升機(jī)來進(jìn)行住宅能耗的預(yù)測,并在相應(yīng)數(shù)據(jù)集中有最小的均方根誤差RMSE(9.99)和RMSE(77.07)[1]。陳俊等使用LSTM、SVM、MLP、K近鄰等算法進(jìn)行虛擬機(jī)的能耗預(yù)測[2],劉建財?shù)炔捎眉山5乃枷氚袻R和SVR做集成經(jīng)樣本訓(xùn)練后得到 SLS 模型,進(jìn)行嵌入式設(shè)備能耗的預(yù)測[3]。近幾年,機(jī)器學(xué)習(xí)技術(shù)在能耗預(yù)測方面取得了長足的發(fā)展。這些研究多以一臺設(shè)備的數(shù)據(jù)進(jìn)行能耗分析實驗,沒有對需要多模塊協(xié)同工作的大型生產(chǎn)進(jìn)行深入研究。
總結(jié)現(xiàn)有的研究成果的同時,實驗團(tuán)隊針對PVC大型壓延生產(chǎn)設(shè)備,通過計算不同模塊能耗的Pearson相關(guān)系數(shù),對不同模塊進(jìn)行分組,再使用LSTM、GRU等RNN深度學(xué)習(xí)算法對各個分組中的所有模塊的能耗進(jìn)行綜合分析,并使用BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、LightGBM等傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行試驗與對比,討論RNN算法的多模塊的大型生產(chǎn)設(shè)備的能耗預(yù)測性能。
2.1 原始數(shù)據(jù)概況及數(shù)據(jù)來源
實驗團(tuán)隊所使用的實驗數(shù)據(jù)來源于工廠所使用的五輥PVC壓延機(jī)生產(chǎn)線,該生產(chǎn)線包含多個模塊:軋輪機(jī)模塊(包含軋輪機(jī)A、軋輪機(jī)B)、過濾機(jī)模塊、輥輪模塊(包含五個滾輪,分別記為1#輪至5#輪)、引取設(shè)備模塊(包含三個引取輪分別記為1號引取設(shè)備至3號引取設(shè)備)、壓花機(jī)模塊、冷卻輪模塊(包含五個冷卻輪,分別記為1#冷卻輪至5號冷卻輪)、帶料輪模塊、卷取輪模塊。
通過設(shè)備改造,PVC壓延設(shè)備使用內(nèi)置或外接的傳感器,實時采集各節(jié)點的運(yùn)行狀態(tài)數(shù)據(jù),包括各模塊多個采集節(jié)點的所采集的開關(guān)量、溫度、電流、轉(zhuǎn)速、壓力。原始數(shù)據(jù)樣式包含數(shù)據(jù)采集點、數(shù)據(jù)類型、數(shù)據(jù)值,數(shù)據(jù)采集頻率為1ms采集一次數(shù)據(jù),其樣式大致如下:
2.2 數(shù)據(jù)預(yù)處理
針對大型設(shè)備的能耗關(guān)聯(lián)系分析,實驗團(tuán)隊篩選出所有模塊采集節(jié)點電流變量進(jìn)行分析和處理。由于傳感器采集數(shù)據(jù)的頻率為1ms一次,導(dǎo)致數(shù)據(jù)量異常龐大,所以首先以1min為時間窗口進(jìn)行數(shù)據(jù)的聚合,統(tǒng)計每分鐘內(nèi)變量的平均值,通過與額定電壓相乘來獲取各模塊功率值。然后將聚合后數(shù)據(jù)組成全局狀態(tài)向量:SG<時間,軋A功率,軋B功率,過濾機(jī)功率...>。
該P(yáng)VC壓延生產(chǎn)線共包含19個模塊,所以該實驗數(shù)據(jù)包含20列,第一列是時間變量、剩下19列為每個設(shè)備的在該時刻的功率變量。其部分?jǐn)?shù)據(jù)如下:
2.3 基于相關(guān)性分析進(jìn)行分組
獲得SG以后,計算各模塊功率間的相關(guān)系數(shù),并利用相關(guān)系數(shù)對變量進(jìn)行分組。該實驗使用Pearson相關(guān)系數(shù)確定不同變量間的相關(guān)性,Pearson通過考察變量X、Y的線性關(guān)聯(lián)程度來分析變量的相關(guān)性[4],其公式為:
Cov(X,Y)表示變量X、Y的協(xié)方差:
計算得到各模塊的相關(guān)系數(shù)后,基于此分析結(jié)果對設(shè)備進(jìn)行分組,并獲得各分組狀態(tài)向量:Sn<時間變量,Sn節(jié)點1功率,Sn節(jié)點2功率,Sn節(jié)點3功率...>,其中Sn表示第n組的分組狀態(tài)。
實驗中,相關(guān)性分析的結(jié)果如下圖所示:
由該結(jié)果可知各模塊功率相關(guān)性如下:
① 由軋輪機(jī)A、壓花機(jī)、帶料輪、卷曲輪、冷卻1#~5#輪等模塊的功率相關(guān)程度高,可以組成一個分組;
② 1#~5#輪及取引1#~3#輪等模塊的功率相關(guān)程度高,組成一個分組;
③ 由于軋輪機(jī)B功率和別的模塊的功率相關(guān)性較低,可以單獨分析其能耗狀態(tài);
④ 由相關(guān)性分析結(jié)果得出,過濾機(jī)功率與其他模塊的功率相關(guān)性較低;然而可以看出過濾機(jī)的功率雖然起伏較大,但其狀態(tài)與軋輪機(jī)A所處的第一組設(shè)備功率走勢高度相似,所以仍然將過濾機(jī)放在軋輪機(jī)A所在組。
2.4 對數(shù)據(jù)進(jìn)行標(biāo)注
在進(jìn)行實驗之前,還需要為數(shù)據(jù)做標(biāo)注工作與特征工程。首先是標(biāo)注工作:根據(jù)每個數(shù)據(jù)所代表的生產(chǎn)健康狀況,為數(shù)據(jù)標(biāo)上相關(guān)標(biāo)注,形成新的狀態(tài)向量。
2.4.1 標(biāo)注數(shù)據(jù)來源
PVC壓延機(jī)中,卷取輪是整個生產(chǎn)過程的最后一個模塊,用于卷曲壓延膜成品,其狀態(tài)可反映出該時刻整個設(shè)備的產(chǎn)出的健康狀態(tài)[5];日常生產(chǎn)期間,卷曲輪主機(jī)開關(guān)在約95%的時間處于持續(xù)開啟狀態(tài),1.5%的時間處于持續(xù)關(guān)閉狀態(tài),另1.5%的時間處于間斷性開啟,開啟呈現(xiàn)周期性。在卷曲輪主機(jī)開關(guān)處于相應(yīng)狀態(tài)時,其轉(zhuǎn)速、電流有以下規(guī)律:
借助上面三種情況作為數(shù)據(jù)的健康程度初步判斷依據(jù)。將處于上表三種情況的數(shù)據(jù)標(biāo)注為健康狀態(tài),與之有明顯差異的數(shù)據(jù)標(biāo)注為非健康狀態(tài);收集大量健康的數(shù)據(jù)與部分非健康的數(shù)據(jù),簡單構(gòu)建機(jī)器學(xué)習(xí)算法并訓(xùn)練。使用該算法預(yù)測未標(biāo)注的實驗數(shù)據(jù),可得到各數(shù)據(jù)是健康的狀態(tài)的置信度,代表該數(shù)據(jù)為正常狀態(tài)的可能性[6],置信度低的數(shù)據(jù)可能有異常;分別獲得置信度高與置信度低的數(shù)據(jù),對比各時間分區(qū)內(nèi)的所有模塊電流平均值、方差并加以分析,以某次測試結(jié)果為例,進(jìn)行數(shù)據(jù)標(biāo)注的詳細(xì)講解。
測試以第一組的軋輪機(jī)A為例,從本次對比可以看出,置信度高的數(shù)據(jù)中,約有80%的時間內(nèi)軋輪機(jī)A電流在120~150之間,平均值約為126,其方差約為15.0,表示大部分時間軋輪機(jī)在平穩(wěn)工作,有較小的波動;而與之對比,置信度低的數(shù)據(jù)中,約有80%的時間內(nèi)軋輪機(jī)A電流在175~250之間,平均值約為189.3,其方差約為309.5,平均值和方差都偏高,可看出此數(shù)據(jù)波動異常巨大,且電流整體偏高,其他時間區(qū)間的對比也有類似的情況。以高置信度數(shù)據(jù)為標(biāo)準(zhǔn),通過對比低置信度數(shù)據(jù)各模塊功率的平均值,判斷該模塊的異常類型是功率偏高亦或是偏低。
2.4.2 對數(shù)據(jù)進(jìn)行標(biāo)注
基于上一步的分析,為每個數(shù)據(jù)標(biāo)上相應(yīng)的健康狀態(tài)向量,其中健康狀態(tài)向量如下,其中每個狀態(tài)可取值-1、0、1,分別代表電流過高、正常、過低:
Sn健康狀態(tài)向量
最后使用一個月的數(shù)據(jù)進(jìn)行初步檢測,選取所有低置信度的數(shù)據(jù)進(jìn)行,經(jīng)分析得到所有錯誤類型。以第1組為例,部分異常狀態(tài)標(biāo)注如下:
3 使用算法進(jìn)行訓(xùn)練與測試
使用RNN算法對數(shù)據(jù)進(jìn)行實驗,RNN是循環(huán)神經(jīng)網(wǎng)路(Recurrent Neural Network),它以序列數(shù)據(jù)為輸入,并且在演進(jìn)方向進(jìn)行遞歸的遞歸神經(jīng)網(wǎng)絡(luò)[7],可以記憶前面的數(shù)據(jù)信息,并應(yīng)用于當(dāng)前時刻輸出的計算中,從而產(chǎn)生了一個序列當(dāng)前的輸出與前面的輸出也有關(guān)的效果,所以RNN特別適合應(yīng)用于時間序列數(shù)據(jù)的預(yù)測。LSTM和GRU是目前最流行應(yīng)用最廣泛的RNN算法[8]。
實驗涉及3個分組,選取了生產(chǎn)過程中三組都處于正常生產(chǎn)狀態(tài)的2020年7月10日和11日此2天的數(shù)據(jù)做為正樣本,選取若干處于異常狀態(tài)的生產(chǎn)數(shù)據(jù)作為負(fù)樣本,由此得到訓(xùn)練集。并將同樣處于正常生產(chǎn)狀態(tài)的2020年7月12日此1天的數(shù)據(jù),按照1/50的比率抽取數(shù)據(jù)作為測試集中的正樣本,再選取若干數(shù)據(jù)作為測試集負(fù)樣本數(shù)據(jù)。
4 實驗結(jié)果
該實驗所解決的問題屬于分類問題,可使用Precision、Recall、F1-score這三個指標(biāo)來評估實驗的好壞[9],其公式如下:
其中TP:預(yù)測答案正確的次數(shù),F(xiàn)P:錯將負(fù)類預(yù)測為正類的次數(shù),F(xiàn)N:錯將正類預(yù)測為負(fù)類的次數(shù)[10];precision是準(zhǔn)確度,指被分類器判定正例中的正樣本的比重,recall是召回率,表示正類被預(yù)測出來的概率,F(xiàn)1-score用于平衡兩者的關(guān)系。
而在該實驗中,由于需要預(yù)測出異常狀態(tài),所以將所有異常匯總,并以其作為正例,而將處于正常狀態(tài)的樣本設(shè)為負(fù)例。獲得如下結(jié)果:
由上表可以看出,在三組中LSTM、GRU都有較高的準(zhǔn)確度和召回率和F1-score,表示這兩種RNN算法不僅能較為準(zhǔn)確地分類,且能保證異常情況能夠較好地被判斷出來;BP神經(jīng)網(wǎng)也有較高的準(zhǔn)確度和召回率,但對比RNN算法稍有遜色;另外隨機(jī)森林和LigthGBM等傳統(tǒng)機(jī)器學(xué)習(xí)算法的成績比起上面三種算法更低,且召回率并不高,表示這兩種算法可能會漏掉不少異常情況,導(dǎo)致沒法對生產(chǎn)線發(fā)出正確的預(yù)警。通過對比可以看出,RNN在本次實驗中取得了相對較好的成績。
5 結(jié)束語
此次實驗結(jié)合了PVC壓延機(jī)等多模塊大型生產(chǎn)設(shè)備中,不同模塊需要協(xié)同工作的特點,提出了使用相關(guān)性分析為模塊進(jìn)行分組的分析手段。并且結(jié)合設(shè)備能耗等指標(biāo)的時序性,采用了RNN算法來進(jìn)行相關(guān)實驗。并借助了大數(shù)據(jù)技術(shù)獲得了大量的實驗數(shù)據(jù),從而得以匯總出大量不同的能耗異常情況,進(jìn)而獲得更好的實驗成果??梢钥闯龃舜螌嶒炈峁┑乃悸肪哂幸欢ǖ目茖W(xué)性。
參考文獻(xiàn):
[1] 程亞豪,陳煥新,王江宇.基于機(jī)器學(xué)習(xí)的住宅能耗預(yù)測[J].制冷與空調(diào),2019,19(5):35-40.
[2] 陳俊,張芥,田紅珍,等.一種LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)建立虛擬機(jī)能耗模型的方法[J].傳感器與微系統(tǒng),2020,39(9):16-19,23.
[3] 章蓬偉,賈鈺峰,劉強(qiáng),等.基于數(shù)據(jù)挖掘技術(shù)的文本情感分析技術(shù)研究[J].信息通信,2020,33(1):77-78.
[4] 蔡靜,張明輝,朱宇婷,等.基于Pearson相關(guān)系數(shù)的貨運(yùn)車輛能耗模型研究[J].交通運(yùn)輸系統(tǒng)工程與信息,2018,18(5):241-246.
[5] 李國利.斜交輪胎三輥壓延生產(chǎn)線自動卷取設(shè)備改造[J].輪胎工業(yè),2019,39(5):306-307.
[6] 郭劍,林俊延,董樹龍,等.基于置信度得分模型的深度學(xué)習(xí)手勢肌電信號識別方法:CN110598676A[P].2019-12-20.
[7] Greff K,Srivastava R K,Koutník J,et al.LSTM:a search space odyssey[J].IEEE Transactions on Neural Networks and Learning Systems,2017,28(10):2222-2232.
[8] Fu R,Zhang Z,Li L.Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC).November 11-13,2016,Wuhan,China.IEEE,2016:324-328.
[9] Wang W X,F(xiàn)u Y T,Dong F,et al.Semantic segmentation of remote sensing ship image via a convolutional neural networks model[J].IET Image Processing,2019,13(6):1016-1022.
[10] Chiarugi F,Sakkalis V,Emmanouilidou D,et al.Adaptive threshold QRS detector with best channel selection based on a noise rating system[C]//2007 Computers in Cardiology.September 30 - October 3,2007,Durham,NC,USA.IEEE,2007:157-160.
【通聯(lián)編輯:唐一東】