李顯軍 趙小平 余德靖 趙亮
1. 貴州磷化(集團(tuán))有限責(zé)任公司 貴州 貴陽 550002 2. 華東理工大學(xué) 上海 200237
當(dāng)前磷化工行業(yè)都在逐步轉(zhuǎn)向以磷酸鐵鋰、磷酸鐵、六氟磷酸鋰為主要產(chǎn)品的新能源電池行業(yè),除此以外如磷酸和磷酸一銨等被廣泛應(yīng)用于化工、農(nóng)業(yè)、醫(yī)藥、食品、電子、建筑材料等領(lǐng)域[1]。在工業(yè)數(shù)字化轉(zhuǎn)型的背景下,如何使用機(jī)器學(xué)習(xí)算法對(duì)磷化工行業(yè)進(jìn)行賦能轉(zhuǎn)型是一個(gè)值得關(guān)注的問題。
在濕法磷酸生產(chǎn)中,反應(yīng)槽中的SO3濃度和P2O5濃度對(duì)磷酸生產(chǎn)是非常重要的,但由于人工化驗(yàn)時(shí)間較長、次數(shù)較少,分析結(jié)果不能及時(shí)、準(zhǔn)確地反映生產(chǎn)過程中每一時(shí)刻的實(shí)際情況[3]。為解決這個(gè)問題,提出了一種基于梯度提升決策樹的軟測(cè)量建模方法。該方法應(yīng)用于磷化工生產(chǎn)過程中的磷酸系統(tǒng)研究,可以輔助和指導(dǎo)生產(chǎn)操作。
磷酸工藝過程是一種制備磷酸鹽的工業(yè)化工過程,主要制備方法分為酸礦反應(yīng)的濕法磷酸和電爐加熱的熱法磷酸兩種。本文涉及的是濕法磷酸生產(chǎn)過程,目前濕法磷酸生產(chǎn)過程中采用的有硫酸、鹽酸、硝酸。根據(jù)產(chǎn)生物不同形態(tài)的硫酸鈣結(jié)晶體,濕法磷酸流程可細(xì)分為三個(gè)類別:無水物流程、二水物流程和半水物流程,即在酸礦反應(yīng)過程中分別生成無水硫酸鈣、二水硫酸鈣、半水硫酸鈣。
研究建模對(duì)象為濕法磷酸二水物流程的重點(diǎn)生產(chǎn)單元反應(yīng)槽模型。二水物流程是傳統(tǒng)的磷酸生產(chǎn)方法之一,具有生產(chǎn)效率高、反應(yīng)速度快等優(yōu)點(diǎn)。其主要反應(yīng)方程式如式 下:
反應(yīng)后的混合料液中含有一定量的雜質(zhì)磷酸溶液,以及固態(tài)的石膏和未被硫酸分解的含磷礦物。液態(tài)和固態(tài)可以通過過濾和洗滌來分離。
反應(yīng)過程中,給定的硫酸與過濾系統(tǒng)返回的磷酸在混合三通中混合。返回磷酸的流量和濃度由反應(yīng)槽中的料漿固含量和液相P2O5濃度決定,以控制反應(yīng)料漿的固含量在25%到35%之間,液相P2O5濃度約為28%。另外控制SO3濃度有利于減少晶間磷酸的損失,提高產(chǎn)品的轉(zhuǎn)換率。因此,對(duì)P2O5濃度和SO3濃度的監(jiān)控對(duì)磷酸生產(chǎn)過程來說至關(guān)重要。
集成學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種有監(jiān)督學(xué)習(xí)方法,其核心是通過組合多個(gè)學(xué)習(xí)器來增強(qiáng)預(yù)測(cè)精度。其原理是通過訓(xùn)練多個(gè)基學(xué)習(xí)器(weak learner),然后將它們組合成一個(gè)強(qiáng)學(xué)習(xí)器(strong learner)。在訓(xùn)練過程中,每個(gè)基學(xué)習(xí)器都會(huì)對(duì)樣本進(jìn)行學(xué)習(xí)并輸出預(yù)測(cè)結(jié)果,最后將這些預(yù)測(cè)結(jié)果進(jìn)行集成,得到最終的預(yù)測(cè)結(jié)果。
Friedman提出的梯度提升決策樹(GBDT)是一種集成學(xué)習(xí)算法,它通過將多個(gè)弱學(xué)習(xí)器重新組合構(gòu)成強(qiáng)學(xué)習(xí)器。
預(yù)測(cè)函數(shù)F是以若干個(gè)弱學(xué)習(xí)器加權(quán)的方式構(gòu)成加法模型,模型中x為輸入樣本,ht為第t棵回歸樹,ω是回歸樹的參數(shù),α表示每棵樹在預(yù)測(cè)函數(shù)中的權(quán)重:
對(duì)于N個(gè)樣本點(diǎn),尋求最優(yōu)模型等同于使損失函數(shù)L最小化。應(yīng)用求解算法歸結(jié)如下:
首先模型初始化,定義初始化基學(xué)習(xí)器為f0。同時(shí)定義
在每次迭代中都構(gòu)造一個(gè)基于回歸樹的基學(xué)習(xí)器,設(shè)根據(jù)磷化工反應(yīng)槽工業(yè)數(shù)據(jù)之間的差異將工業(yè)數(shù)據(jù)劃分為N類,并利用神經(jīng)網(wǎng)絡(luò)擬合出N個(gè)基學(xué)習(xí)器,因此對(duì)于模型的訓(xùn)練樣本為,相應(yīng)的預(yù)測(cè)目標(biāo)函數(shù)為
本文采用梯度提升決策樹對(duì)反應(yīng)槽的SO3濃度和P2O5濃度進(jìn)行軟測(cè)量建模。實(shí)驗(yàn)在英特爾i5筆記本電腦上進(jìn)行,硬件主板配置2.3GHz, 8G內(nèi)存和nvidia GeForce GTX 1060。軟件環(huán)境為Windows 10, Python 3.8, scikit-learn 1.1.0版本。
本實(shí)驗(yàn)采用的數(shù)據(jù)是由于儀表讀數(shù)波動(dòng)較大且存在異常,產(chǎn)生的粗大誤差對(duì)模型的預(yù)測(cè)性能產(chǎn)生很大影響,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。此處采用平均值濾波方法。訓(xùn)練集與驗(yàn)證集樣本的取樣時(shí)間為2022年3-7月上午8點(diǎn)至4月20日晚上20點(diǎn),采樣間隔12h。
在軟測(cè)量建模實(shí)踐中,輔助變量的選擇起著關(guān)鍵性的作用,直接影響到模型的精度和效果?;疑P(guān)聯(lián)分析法利用灰色關(guān)聯(lián)度的大小來確定各變量對(duì)系統(tǒng)主要行為的貢獻(xiàn)程度。計(jì)算步驟如下:
第一步:確定分析序列;
初始變量集可用Xi表示:
輸出變量表示為:
式中,Xi為原始數(shù)據(jù)變量集,Y為輸出變量集,k為數(shù)據(jù)量編號(hào),m和n分別為輸入、輸出變量個(gè)數(shù)。
第二步:無量綱化;
數(shù)據(jù)預(yù)處理階段,采用均值法對(duì)數(shù)據(jù)進(jìn)行無量綱化處理,使其在同一尺度下進(jìn)行分析。第三步:計(jì)算灰色關(guān)聯(lián)系數(shù);
式中,ρ取0.5。
第四步:計(jì)算關(guān)聯(lián)度值。
采用公式(10)計(jì)算關(guān)聯(lián)度。
本實(shí)驗(yàn)軟測(cè)量對(duì)象為磷酸生產(chǎn)反應(yīng)槽,通過數(shù)據(jù)采集獲取磷酸生產(chǎn)反應(yīng)槽各裝置數(shù)據(jù),并通過灰色關(guān)聯(lián)度算法來對(duì)反應(yīng)槽中的SO3濃度和P2O5濃度進(jìn)行關(guān)聯(lián)度分析。
將數(shù)據(jù)集80%作為訓(xùn)練集,分別對(duì)SO3和P2O5濃度作為目標(biāo)變量,使用GBDT算法對(duì)模型進(jìn)行分類,GBDT算法的基本思想是,通過迭代地生成多個(gè)決策樹,每個(gè)決策樹都是一個(gè)弱分類器,然后將這些決策樹的輸出進(jìn)行加權(quán)投票或平均,從而得到最終的預(yù)測(cè)結(jié)果。
本實(shí)驗(yàn)采取的三個(gè)常用的性能評(píng)估指標(biāo)用來判斷模型的優(yōu)缺點(diǎn),包括MSE、MAPE和R2。
其中是目標(biāo)值,是模型的預(yù)測(cè)值,N是測(cè)試集的樣本數(shù)。MSE和MAPE分別代表了預(yù)測(cè)值和實(shí)際值之間的誤差。R2代表預(yù)測(cè)值解釋了變量的方差的比例,是衡量模型預(yù)測(cè)與真實(shí)值擬合程度的重要指標(biāo)。對(duì)于MSE和MAPE,數(shù)值越低越好,而對(duì)于R方,數(shù)值越高越好[2]。
集成學(xué)習(xí)方法的梯度提升決策樹,成功建立了磷酸生產(chǎn)過程中關(guān)鍵單元的生產(chǎn)參數(shù)質(zhì)量模型。并對(duì)現(xiàn)場(chǎng)真實(shí)數(shù)據(jù)進(jìn)行了仿真研究,驗(yàn)證了模型的有效性。結(jié)果表明,使用梯度提升決策樹算法對(duì)濕法磷酸生產(chǎn)中的反應(yīng)槽SO3、P2O5濃度數(shù)據(jù)擬合效果非常理想,對(duì)曲線趨勢(shì)擬合效果極佳,達(dá)到預(yù)期目標(biāo),建立的模型對(duì)反應(yīng)槽的重點(diǎn)生產(chǎn)參數(shù)SO3和P2O5濃度的R方均能達(dá)到0.95以上,能夠應(yīng)用指導(dǎo)于實(shí)際生產(chǎn)過程,以提高磷化企業(yè)的經(jīng)濟(jì)效益。