王雅琳,黃凱華,伍鐵斌,謝文平,陽(yáng)春華
?
基于核偏最小二乘的砷鹽凈化除鈷過(guò)程鈷離子濃度軟測(cè)量
王雅琳,黃凱華,伍鐵斌,謝文平,陽(yáng)春華
(中南大學(xué) 信息科學(xué)與工程學(xué)院,湖南 長(zhǎng)沙,410083)
針對(duì)鋅濕法冶煉砷鹽凈化除鈷過(guò)程中鈷離子濃度無(wú)法在線檢測(cè)給生產(chǎn)優(yōu)化控制帶來(lái)困難的問(wèn)題,建立基于機(jī)理模型和核偏最小二乘(kernel partial least squares, KPLS)參數(shù)辨識(shí)的鈷離子濃度軟測(cè)量模型;考慮到過(guò)程具有時(shí)變性,根據(jù)所建立的軟測(cè)量模型特點(diǎn),提出一種雙向遞歸KPLS模型參數(shù)更新和濾波修正相結(jié)合的模型在線校正方法,以提高軟測(cè)量模型精度;同時(shí),采用基于主元分析和貝葉斯分類(lèi)的異常值在線檢測(cè)方法實(shí)現(xiàn)對(duì)參數(shù)辨識(shí)相關(guān)檢測(cè)量的實(shí)時(shí)異常值在線檢測(cè),保證用于參數(shù)更新數(shù)據(jù)的有效性。研究結(jié)果表明:所建鈷離子濃度軟測(cè)量模型跟蹤效果好,滿(mǎn)足實(shí)際生產(chǎn)過(guò)程預(yù)測(cè)精度要求,解決了鈷離子濃度無(wú)法在線檢測(cè)給優(yōu)化控制帶來(lái)的困難,可為生產(chǎn)過(guò)程的優(yōu)化控制提供指導(dǎo)。
砷鹽凈化除鈷過(guò)程;核偏最小二乘;軟測(cè)量;模型在線校正
在鋅濕法冶煉生產(chǎn)中,浸出后的硫酸鋅溶液中含有大量雜質(zhì)離子,必須通過(guò)凈化工序?qū)⑦@些雜質(zhì)離子濃度降至電解工藝允許范圍[1]。鈷離子(Co2+)對(duì)電解過(guò)程危害極大且最難清除,若電解液中Co2+質(zhì)量濃度不達(dá)標(biāo),則會(huì)使得電解過(guò)程電流效率降低,影響產(chǎn)品質(zhì)量[2]。砷鹽凈化除鈷過(guò)程通過(guò)添加砷鹽和鋅粉置換除去硫酸鋅溶液中的鈷離子,是凈化過(guò)程的一道關(guān)鍵工序。但由于該過(guò)程環(huán)境惡劣,出口Co2+質(zhì)量濃度無(wú)法在線檢測(cè),離線方式獲得的Co2+質(zhì)量濃度化驗(yàn)值存在滯后性?,F(xiàn)場(chǎng)操作人員往往根據(jù)滯后的Co2+質(zhì)量濃度信息憑人工經(jīng)驗(yàn)調(diào)節(jié)鋅粉量的添加,操作盲目,無(wú)法保證產(chǎn)品質(zhì)量且鋅粉消耗量大。因此,實(shí)現(xiàn)鈷離子質(zhì)量濃度的軟測(cè)量有著重要的現(xiàn)實(shí)意義,可為砷鹽凈化除鈷過(guò)程的優(yōu)化控制提供操作指導(dǎo)。凈化除鈷過(guò)程是一種液固兩相的長(zhǎng)流程化學(xué)反應(yīng)過(guò)程,具有影響因素多、非線性、生產(chǎn)數(shù)據(jù)存在噪聲大且變量間多重相關(guān)性強(qiáng)等特點(diǎn)。目前,針對(duì)非線性過(guò)程的常用預(yù)測(cè)方法有神經(jīng)網(wǎng)絡(luò)[3]、支持向量機(jī)[4?5]、核偏最小二乘[6]等。其中,基于神經(jīng)網(wǎng)絡(luò)的建模方法具有強(qiáng)大的處理非線性數(shù)據(jù)的能力,在復(fù)雜工業(yè)過(guò)程中得到了廣泛應(yīng)用[7]。但該方法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)難以確定,要求樣本數(shù)據(jù)量足夠大且最終解過(guò)于依賴(lài)初始值,收斂速度較慢,易陷入局部極小值點(diǎn)并出現(xiàn)過(guò)學(xué)習(xí)現(xiàn)象。支持向量機(jī)能有效克服神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)難以確定以及易陷入局部極小值點(diǎn)等問(wèn)題,目前被應(yīng)用于銻鹽凈化除鈷過(guò)程的鈷離子濃度預(yù)測(cè)。唐志杰等[8]針對(duì)銻鹽凈化除鈷過(guò)程提出了一種基于最小二乘支持向量機(jī)(least squares support vector machine, LS-SVM)和自回歸滑動(dòng)平均模型(auto-regressive and moving average model, ARMA)的鈷離子質(zhì)量濃度預(yù)測(cè)模型,仿真結(jié)果表明該方法比單一的LS-SVM模型精度高。但受鋅濕法冶煉凈化過(guò)程時(shí)變特性的影響,該模型的預(yù)測(cè)精度將隨時(shí)間的推移而變低,模型的自適應(yīng)能力較差。晏密英等[9][9]基于在線支持向量機(jī),分別建立2種不同核函數(shù)的在線支持向量機(jī)(support vector machine, SVM)子模型,通過(guò)熵值法智能融合策略確定鈷離子質(zhì)量濃度的組合預(yù)測(cè)模型,仿真結(jié)果表明了該方法的有效性,但砷鹽除鈷凈化過(guò)程的生產(chǎn)數(shù)據(jù)噪聲大,而基于SVM的模型對(duì)異常值非常敏感,且需對(duì)參數(shù)進(jìn)行優(yōu)化,計(jì)算復(fù)雜,訓(xùn)練時(shí)間長(zhǎng)。而KPLS在解決小樣本的非線性預(yù)測(cè)問(wèn)題中具有相當(dāng)大的優(yōu)勢(shì),該算法無(wú)需參數(shù)的優(yōu)化操作,計(jì)算簡(jiǎn)單,能有效描述非線性問(wèn)題[10],且模型參數(shù)更新也容易實(shí)現(xiàn)。為此,本文基于核偏最小二乘開(kāi)展砷鹽凈化除鈷過(guò)程的鈷離子質(zhì)量濃度軟測(cè)量研究,并考慮到實(shí)際生產(chǎn)過(guò)程中相關(guān)檢測(cè)量的測(cè)量噪聲大和過(guò)程具有時(shí)變特性的特點(diǎn),分別研究對(duì)相關(guān)檢測(cè)量的測(cè)量數(shù)據(jù)進(jìn)行異常值的在線檢測(cè)和對(duì)模型實(shí)行在線校正的方法。本文通過(guò)分析砷鹽凈化除鈷過(guò)程機(jī)理,建立一種基于機(jī)理和核偏最小二乘的鈷離子濃度預(yù)測(cè)模型。機(jī)理模型作為描述鈷離子沉淀過(guò)程的整體框架,核偏最小二乘用于辨識(shí)機(jī)理模型中的未知參數(shù),在充分考慮過(guò)程機(jī)理知識(shí)的同時(shí),還利用相關(guān)的數(shù)據(jù)信息,且模型結(jié)構(gòu)簡(jiǎn)單,易于工業(yè)應(yīng)用。由于砷鹽凈化除鈷過(guò)程的實(shí)際生產(chǎn)過(guò)程中相關(guān)檢測(cè)量的測(cè)量噪聲大,對(duì)相關(guān)檢測(cè)量的測(cè)量數(shù)據(jù)采用基于主元分析與貝葉斯理論的異常值在線檢測(cè)方法進(jìn)行異常值的在線檢測(cè)??紤]到過(guò)程受時(shí)變特性的影響,根據(jù)已建模型特點(diǎn),提出一種雙向遞歸KPLS模型參數(shù)更新和濾波修正相結(jié)合的模型在線校正方法,以提高軟測(cè)量模型精度。最后,采用工業(yè)數(shù)據(jù)進(jìn)行仿真驗(yàn)證,以說(shuō)明本文方法的有效性。
1 過(guò)程描述和軟測(cè)量總體框架
1.1 砷鹽凈化除鈷過(guò)程
某鋅冶煉集團(tuán)砷鹽凈化除鈷工藝流程如圖1所示。該工藝主要由4個(gè)除鈷反應(yīng)器和1個(gè)濃密機(jī)組成,其中,濃密機(jī)中的大部分底流返回到第1個(gè)反應(yīng)器中。此過(guò)程通過(guò)向除鈷反應(yīng)器中添加鋅粉和砷鹽將鈷離子從溶液中清除。其中,鋅粉作為還原劑,用于與溶液中的雜質(zhì)離子發(fā)生置換反應(yīng);砷鹽作為穩(wěn)定劑,與沉淀下來(lái)的單質(zhì)鈷形成穩(wěn)定的合金,使沉淀下來(lái)的鈷不易復(fù)溶。
圖1 砷鹽凈化除鈷工藝流程圖
在砷鹽凈化除鈷過(guò)程中,除銅后液中的殘留銅離子(Cu2+)起催化劑作用[11]。Cu2+首先沉淀并與單質(zhì)鋅粉形成Cu-Zn微電池,給除鈷反應(yīng)的進(jìn)行提供一個(gè)較大的陰極表面,促進(jìn)Co2+沉淀。隨著Cu2+質(zhì)量濃度的增加,除鈷速度加快,當(dāng)Cu2+質(zhì)量濃度增加到一定值時(shí),除鈷速率不再隨Cu2+質(zhì)量濃度的增加而加快。溶液中的砷鹽起穩(wěn)定劑作用,砷鹽與被沉淀的鈷、鎳形成穩(wěn)定的合金,使得沉淀的鈷不易復(fù)溶,同時(shí),這些合金又可為Co2+沉淀提供陰極表面,加快鈷沉淀速率。廢酸用來(lái)調(diào)節(jié)反應(yīng)器中溶液的pH,給除鈷反應(yīng)提供必要條件。濃密機(jī)中的絕大部分底流作為晶種返回到反應(yīng)器中,底流中含有大量合金成分,這些合金可促進(jìn)除鈷反應(yīng)的進(jìn)行[12]。鋅粉是除鈷反應(yīng)中的還原劑,直接影響除鈷效率,在實(shí)際生產(chǎn)過(guò)程中,鋅粉根據(jù)溶液中的氧化還原電位(ORP)自動(dòng)補(bǔ)充,其中,ORP越負(fù),表示添加的鋅粉越多。
1.2 鈷離子濃度軟測(cè)量總體框架
通過(guò)對(duì)生產(chǎn)過(guò)程的分析發(fā)現(xiàn):除銅后液中的大部分鈷離子在1號(hào)反應(yīng)器中沉淀除去,少量在2號(hào)反應(yīng)器中沉淀除去,3號(hào)和4號(hào)反應(yīng)器起微調(diào)作用,且2號(hào)、3號(hào)和4號(hào)反應(yīng)器中的反應(yīng)相對(duì)比較穩(wěn)定,因此,本文主要針對(duì)1號(hào)反應(yīng)器建立反應(yīng)器出口Co2+質(zhì)量濃度的軟測(cè)量模型。同理,所建立的方法可推廣到2號(hào)、3號(hào)和4號(hào)反應(yīng)器。
研究表明:鈷離子沉淀的動(dòng)力學(xué)特征遵循一階動(dòng)力學(xué)反應(yīng)方程[13]:
其中:k為沉淀速率系數(shù);為鈷離子沉淀的催化表面積;為反應(yīng)器中溶液的體積;為鈷離子的質(zhì)量濃度。
在實(shí)際生產(chǎn)過(guò)程中,溶液體積通常保持不變,可認(rèn)為是常數(shù)。反應(yīng)表面積為催化劑表面積或沉淀物Co-As和Ni-As等合金的表面積[14]。因此,砷鹽添加量、Cu2+質(zhì)量濃度、鎳離子(Ni2+)質(zhì)量濃度和底流返回量均對(duì)有直接影響,表現(xiàn)出非線性關(guān)系,難以用具體的數(shù)學(xué)表達(dá)式來(lái)描述。沉淀速率系數(shù)與ORP和pH以及溫度有關(guān),ORP直接反映鋅粉添加量,適量的鋅粉加快沉鈷速率,但沉鈷速率并不會(huì)隨鋅粉的過(guò)量添加而加快。在實(shí)際工業(yè)生產(chǎn)過(guò)程中,溶液溫度和pH基本保持不變,可近似為常量。從以上分析可以看出參數(shù)和難以通過(guò)機(jī)理研究獲得各參數(shù)與影響因素間的具體表達(dá)式。利用參數(shù)間的相乘關(guān)系,可將參數(shù),與綜合為1個(gè)反應(yīng)速率系數(shù),即。于是,機(jī)理模型可簡(jiǎn)化為
因此,實(shí)現(xiàn)鈷離子濃度預(yù)測(cè)的關(guān)鍵是實(shí)現(xiàn)各影響因素對(duì)參數(shù)的非線性回歸。而核偏最小二乘在解決小樣本數(shù)據(jù)的非線性回歸問(wèn)題中具有較大的優(yōu)勢(shì),能有效描述數(shù)據(jù)間的非線性關(guān)系。采用KPLS算法實(shí)現(xiàn)對(duì)參數(shù)的辨識(shí)是一種選擇。鈷離子濃度的軟測(cè)量模型建立后,考慮到砷鹽凈化除鈷過(guò)程受時(shí)變性因素影響,于是,根據(jù)所建立的軟測(cè)量模型特點(diǎn),提出一種雙向遞歸KPLS模型參數(shù)更新和濾波修正相結(jié)合的模型在線校正方法,以提高軟測(cè)量模型精度。同時(shí),為保證用于模型在線校正的數(shù)據(jù)有效性,對(duì)新樣本數(shù)據(jù)進(jìn)行異常值在線檢測(cè)。軟測(cè)量結(jié)構(gòu)的總體框架如圖2所示。
圖2 鈷離子濃度軟測(cè)量結(jié)構(gòu)
通過(guò)機(jī)理分析建立鈷離子濃度的機(jī)理模型,采用KPLS算法辨識(shí)機(jī)理模型中的反應(yīng)速率系數(shù)。對(duì)新樣本實(shí)行異常值的在線檢測(cè),當(dāng)樣本為異常值時(shí)對(duì)異常值情況進(jìn)行單獨(dú)處理,即根據(jù)過(guò)程變化緩慢的特點(diǎn),采用上一時(shí)刻的鈷離子濃度離線化驗(yàn)值直接輸出;否則,對(duì)機(jī)理模型實(shí)行在線校正并輸出鈷離子濃度。機(jī)理模型的在線校正包括2部分:KPLS模型的參數(shù)遞歸更新和機(jī)理模型的偏差量修正,兩者交替進(jìn)行。由于短時(shí)間內(nèi)過(guò)程對(duì)象的特征不會(huì)發(fā)生很大變化,因此,KPLS模型參數(shù)的更新基于滑動(dòng)窗方式進(jìn)行,滑窗長(zhǎng)度為。若檢測(cè)到已有個(gè)正常樣本數(shù)據(jù),則對(duì)KPLS模型參數(shù)進(jìn)行雙向遞歸更新;若檢測(cè)到正常樣本個(gè)數(shù)<,無(wú)需對(duì)模型參數(shù)進(jìn)行更新,則采用濾波修正法對(duì)模型計(jì)算值進(jìn)行偏差量的修正,從而實(shí)現(xiàn)鈷離子濃度的在線預(yù)測(cè)。
2 基于KPLS的軟測(cè)量模型參數(shù)辨識(shí)
KPLS算法是一種非線性回歸算法,它通過(guò)核函數(shù)方法將原始數(shù)據(jù)非線性映射到高維特征空間,然后在高維特征空間上對(duì)核矩陣進(jìn)行線性偏最小二乘,從而實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的非線性回歸。因此,KPLS模型的輸出為核矩陣的線性結(jié)構(gòu),即=(其中,為輸入向量構(gòu)成的核矩陣,為KPLS算法待求的系數(shù)矩陣,為模型輸出值)。
結(jié)合現(xiàn)場(chǎng)工藝,確定與參數(shù)相關(guān)的因素有除銅后液中的Cu2+質(zhì)量濃度()以及Ni2+質(zhì)量濃度()、砷鹽質(zhì)量濃度()、砷鹽流量((As))、底流流量(under)、底流密度()和ORP。這7個(gè)因素是與參數(shù)辨識(shí)相關(guān)的檢測(cè)量。因此,可得鈷離子濃度的軟測(cè)量模型為
式(3)表示通過(guò)相關(guān)檢測(cè)量測(cè)量數(shù)據(jù)采用KPLS算法辨識(shí)參數(shù)的過(guò)程,獲得參數(shù)與各影響因素間的關(guān)系式后,將其代入機(jī)理模型式(4)中,從而最終獲得基于機(jī)理和核偏最小二乘的鈷離子質(zhì)量濃度預(yù)測(cè) 模型。
3 異常值在線檢測(cè)
在實(shí)際工業(yè)應(yīng)用中,實(shí)際過(guò)程測(cè)量數(shù)據(jù)存在異常值,這些異常值會(huì)嚴(yán)重影響模型預(yù)測(cè)精度以及數(shù)據(jù)分析結(jié)果,因此,異常值在線檢測(cè)是模型在線預(yù)測(cè)中的關(guān)鍵部分。
本文采用基于主元分析和貝葉斯分類(lèi)的異常值在線檢測(cè)方法對(duì)過(guò)程數(shù)據(jù)異常值進(jìn)行在線檢測(cè)[15]。該方法充分利用了先驗(yàn)知識(shí)和數(shù)據(jù)信息,對(duì)多重相關(guān)性數(shù)據(jù)進(jìn)行異常值檢測(cè)時(shí)具有相當(dāng)大的優(yōu)勢(shì)。該方法將過(guò)程數(shù)據(jù)分為2類(lèi):正常信號(hào)和干擾信號(hào)。通過(guò)主元分析計(jì)算樣本數(shù)據(jù)的統(tǒng)計(jì)量;基于統(tǒng)計(jì)量和貝葉斯公式計(jì)算后驗(yàn)概率;根據(jù)所計(jì)算的后驗(yàn)概率,采用貝葉斯分類(lèi)方法進(jìn)行分類(lèi)。若檢測(cè)到屬于干擾信號(hào)的后驗(yàn)概率>0.5,則該數(shù)據(jù)屬于干擾信號(hào),需等待新樣本數(shù)據(jù),進(jìn)一步判斷該干擾信號(hào)為異常值還是過(guò)程變化引起的情況;若檢測(cè)到后驗(yàn)概率<0.5,則該數(shù)據(jù)屬于正常信號(hào)。屬于干擾信號(hào)的后驗(yàn)概率計(jì)算公式如下:
式中:0為發(fā)生干擾的先驗(yàn)概率;為條件下樣本數(shù)據(jù)的統(tǒng)計(jì)量所服從的概率密度函數(shù);為或,表示樣本發(fā)生后該樣本的統(tǒng)計(jì)量屬于的后驗(yàn)概率。其中,0和可通過(guò)先驗(yàn)知識(shí)和歷史測(cè)量數(shù)據(jù)獲得。
若檢測(cè)出異常值,則根據(jù)過(guò)程變化緩慢的特點(diǎn),采用上一時(shí)刻的鈷離子濃度離線化驗(yàn)值直接輸出,否則對(duì)模型實(shí)行在線校正并輸出預(yù)測(cè)值。
4 模型在線校正
由于過(guò)程對(duì)象具有時(shí)變性特點(diǎn),需對(duì)軟測(cè)量模型實(shí)行在線校正,將新樣本信息及時(shí)、有效地考慮到模型中。本文所建立的軟測(cè)量模型中,機(jī)理模型由砷鹽凈化除鈷機(jī)理決定,該模型結(jié)構(gòu)不會(huì)改變。但是,隨著時(shí)間的推移,辨識(shí)未知參數(shù)的KPLS模型將無(wú)法適應(yīng)新工況信息。基于此,提出一種雙向遞歸KPLS模型參數(shù)更新和濾波修正相結(jié)合的模型在線校正方法,這2種修正方法輪流進(jìn)行。
4.1 KPLS模型參數(shù)的雙向遞歸更新
當(dāng)生產(chǎn)過(guò)程中采集到長(zhǎng)度為的正常樣本數(shù)據(jù)塊時(shí),對(duì)KPLS模型參數(shù)進(jìn)行遞歸更新,減少計(jì)算復(fù)雜度。具體更新過(guò)程以單個(gè)樣本的方式進(jìn)行,計(jì)算簡(jiǎn)單,且避免了矩陣求逆。新樣本點(diǎn)引入到模型參數(shù)的更新過(guò)程即KPLS模型的前向遞歸學(xué)習(xí)過(guò)程,由前一時(shí)刻的參數(shù)遞歸求解增加新樣本數(shù)據(jù)后的參數(shù)+1;前向遞歸學(xué)習(xí)完之后,利用留一法[16]合理選擇舊樣本數(shù)據(jù)進(jìn)行裁剪,即:若剔除第個(gè)樣本數(shù)據(jù),則應(yīng)使剩下的數(shù)據(jù)辨識(shí)出的模型對(duì)第個(gè)樣本的預(yù)測(cè)誤差最小;裁剪掉1個(gè)舊樣本數(shù)據(jù)后,模型參數(shù)需再次更新,即KPLS模型的逆向遞歸學(xué)習(xí)過(guò)程,由前一時(shí)刻的參數(shù)+1遞歸求解剔除舊樣本數(shù)據(jù)后的參數(shù)。重復(fù)以上步驟,直至個(gè)數(shù)據(jù)均考慮到模型參數(shù)更新過(guò)程中為止,最后1次遞歸更新過(guò)程中計(jì)算出的參數(shù)即為引入塊式樣本數(shù)據(jù)塊后KPLS模型更新后的參數(shù)。
4.1.1 前向遞歸學(xué)習(xí)
若對(duì)當(dāng)前訓(xùn)練樣本引入一個(gè)新樣本數(shù)據(jù)?1,則可對(duì)核矩陣+1按如下方式進(jìn)行分塊:
式中:(,)為高斯核函數(shù)。由高斯核函數(shù)的性質(zhì)可知:,且滿(mǎn)足,于是有,即核矩陣為對(duì)稱(chēng)矩陣,且對(duì)角線上元素的值都為1。
根據(jù)矩陣分塊思想,+1可表示為
式中:為引入新樣本數(shù)據(jù)前的核矩陣;。
由分塊矩陣的求逆公式可計(jì)算出矩陣+1的逆矩陣,由于,于是,可得+1的遞推式為
4.1.2 逆向遞歸學(xué)習(xí)
若剔除第個(gè)樣本數(shù)據(jù),根據(jù)核函數(shù)的定義可知:核矩陣中的數(shù)據(jù)(,)都應(yīng)剔除,=或=。因此,關(guān)鍵是求矩陣剔除第行和第列數(shù)據(jù)后的逆矩陣。將核矩陣分塊成如下形式:
對(duì)核矩陣進(jìn)行初等變換:
4.1.3 留一法選擇舊樣本進(jìn)行剔除
剔除舊樣本數(shù)據(jù)的傳統(tǒng)方法是剔除最老的樣本點(diǎn),該樣本點(diǎn)常常被認(rèn)為所含的信息量最少,然而,該方法并沒(méi)有理論依據(jù)來(lái)確定剔除最老的樣本點(diǎn)后對(duì)模型帶來(lái)的影響最小。本文采用留一交叉驗(yàn)證法選擇舊樣本數(shù)據(jù)進(jìn)行剔除。
剔除第個(gè)樣本數(shù)據(jù)后,用剩下的?1組數(shù)據(jù)對(duì)模型參數(shù)進(jìn)行辨識(shí),對(duì)第個(gè)樣本數(shù)據(jù)進(jìn)行預(yù)測(cè)的預(yù)測(cè)誤差為
式中:b為矩陣的第個(gè)數(shù)據(jù);p為矩陣的第行第列數(shù)據(jù);=1, …,。
若剔除第個(gè)樣本數(shù)據(jù),則剩下的數(shù)據(jù)辨識(shí)出的模型對(duì)第個(gè)數(shù)據(jù)的預(yù)測(cè)誤差不僅與剔除樣本前的矩陣有關(guān),而且與剔除樣本前的矩陣密切相關(guān)。因此,為保證辨識(shí)模型的泛化能力,需剔除這樣的樣本點(diǎn),即剔除該樣本點(diǎn)后,使更新后的模型對(duì)該點(diǎn)的預(yù)測(cè)誤差最小,即滿(mǎn)足
4.2 偏差修正
由于實(shí)際生產(chǎn)過(guò)程存在流程長(zhǎng)、慣性大等特點(diǎn),本文采用濾波修正法根據(jù)離線化驗(yàn)值直接對(duì)所建立的軟測(cè)量模型輸出值進(jìn)行修正,其具體算法如下。
記時(shí)刻的預(yù)測(cè)偏差值為(),當(dāng)=0時(shí),將()置0,則
其中:()為時(shí)刻的人工化驗(yàn)值;為時(shí)刻的模型預(yù)測(cè)值。
記時(shí)刻的偏差修正量為(),將上一時(shí)刻及前面所有時(shí)刻的預(yù)測(cè)偏差進(jìn)行加權(quán),則可得模型偏差量的修正值為
5 工業(yè)驗(yàn)證
以某鋅冶煉集團(tuán)砷鹽凈化除鈷過(guò)程為對(duì)象,以1號(hào)反應(yīng)器為例,采用2組不同時(shí)間段下采集的生產(chǎn)數(shù)據(jù)進(jìn)行仿真,分別為2012年4月至5月初在現(xiàn)場(chǎng)采集到的200組數(shù)據(jù)和8月中旬在工業(yè)現(xiàn)場(chǎng)獲得的91組數(shù)據(jù)進(jìn)行仿真,前200組數(shù)據(jù)經(jīng)預(yù)處理后剩余180組正常數(shù)據(jù),共271組數(shù)據(jù)。
1) 將180組正常數(shù)據(jù)中的前100組數(shù)據(jù)作為模型訓(xùn)練樣本,后80組數(shù)據(jù)作為測(cè)試樣本,分別基于本文方法、單純基于KPLS方法以及單純基于PLS的方法建立模型并進(jìn)行仿真,仿真結(jié)果如圖3所示。
(a) 本文方法預(yù)測(cè)效果;(b) 本文方法相對(duì)誤差;(c) KPLS方法預(yù)測(cè)效果;(d) KPLS方法相對(duì)誤差;(e) PLS方法預(yù)測(cè)效果;(f) PLS方法相對(duì)誤差
圖3 不同方法的模型預(yù)測(cè)效果
Fig. 3 Predicted results of different models
從圖3可以看出:基于PLS方法的模型預(yù)測(cè)性能較差,表明輸入、輸出變量間難以用線性關(guān)系式準(zhǔn)確表示;基于KPLS方法的模型能大概跟蹤化驗(yàn)值趨勢(shì),但數(shù)值上還存在較大差別,表明KPLS模型能較好地描述輸入、輸出變量間的非線性關(guān)系,但仍然存在缺陷;基于本文方法的模型預(yù)測(cè)效果較好,表明該方法充分發(fā)揮了機(jī)理知識(shí)與KPLS算法的優(yōu)勢(shì)。
2) 采用271組數(shù)據(jù)進(jìn)行仿真,新獲得的91組數(shù)據(jù)進(jìn)行時(shí)序處理但不進(jìn)行異常值檢測(cè),采用前130組數(shù)據(jù)用于模型參數(shù)訓(xùn)練,后141組數(shù)據(jù)用于測(cè)試。在仿真過(guò)程中分2種情況進(jìn)行仿真:a) 在整個(gè)仿真過(guò)程中,模型不進(jìn)行任何更新也不進(jìn)行異常值的在線檢測(cè),其預(yù)測(cè)結(jié)果如圖4所示;b) 在預(yù)測(cè)過(guò)程中,對(duì)相關(guān)檢測(cè)量的測(cè)量數(shù)據(jù)異常值實(shí)行在線檢測(cè),若檢測(cè)到異常值,則該數(shù)據(jù)不用于模型更新,同時(shí),該點(diǎn)的預(yù)測(cè)值直接采用前一時(shí)刻的化驗(yàn)值進(jìn)行模型輸出,若為正常數(shù)據(jù),則對(duì)軟測(cè)量模型進(jìn)行在線校正,在線校正過(guò)程中設(shè)置滑動(dòng)窗口長(zhǎng)度為130,步長(zhǎng)為30,當(dāng)檢測(cè)到有30組正常樣本數(shù)據(jù)時(shí)就對(duì)模型參數(shù)進(jìn)行雙向遞歸更新,否則直接對(duì)軟測(cè)量模型計(jì)算值進(jìn)行修正,仿真結(jié)果如圖5所示。
圖4 無(wú)更新的軟測(cè)量模型預(yù)測(cè)結(jié)果
圖5 有更新的軟測(cè)量模型預(yù)測(cè)結(jié)果
圖4中采用圓圈“o”標(biāo)明的數(shù)據(jù)點(diǎn)是圖5中仿真檢測(cè)到的異常值,即在第59,75,76,77,98,124和 125個(gè)樣本點(diǎn)處,共檢測(cè)出7個(gè)異常值。從圖4可以看出:當(dāng)不進(jìn)行任何更新也不進(jìn)行異常值的在線檢測(cè)時(shí),在異常值處模型預(yù)測(cè)值與實(shí)際值偏差較大,且隨著時(shí)間的推移,模型預(yù)測(cè)性能變差,尤其對(duì)后面的數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí)誤差較大。由此可以看出模型在線應(yīng)用時(shí),異常值的在線檢測(cè)非常重要,且為了提高模型精度,需在模型中不斷考慮新樣本信息。
從圖5可以看出:模型參數(shù)總共更新4次,分別在樣本點(diǎn)第31,62,95和128個(gè)樣本點(diǎn)處進(jìn)行,檢測(cè)到7個(gè)異常值點(diǎn),在線校正模型在整個(gè)預(yù)測(cè)過(guò)程中跟蹤效果好。
本文采用指標(biāo)(WIA)、均方根誤差(RMSE) 和平均相對(duì)誤差(MAE)這3個(gè)指標(biāo)對(duì)所建立的模型性能進(jìn)行評(píng)價(jià)。
式中:y為人工化驗(yàn)值;為軟測(cè)量模型值;=1, 2, …,;為樣本點(diǎn)個(gè)數(shù)。
計(jì)算不同方法下的模型預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo)值,結(jié)果如表1所示。
表1 誤差分析結(jié)果對(duì)比
從表1可以看出:基于機(jī)理-KPLS算法的RMSE和MAE最小,WIA最大,說(shuō)明基于機(jī)理-KPLS算法的模型預(yù)測(cè)精度高,匹配效果好;采用在線校正的模型預(yù)測(cè)效果比模型未進(jìn)行校正的預(yù)測(cè)效果明顯要好很多,所建立的軟測(cè)量模型可以達(dá)到工藝要求的預(yù)測(cè)精度,能為過(guò)程優(yōu)化控制提供操作指導(dǎo)。隨著生產(chǎn)的進(jìn)行,模型通過(guò)不斷地在線矯正會(huì)獲得更高的精度,使誤差逐漸減小。
6 結(jié)論
1) 針對(duì)直接浸出砷鹽凈化除鈷過(guò)程鈷離子濃度無(wú)法在線檢測(cè)而給生產(chǎn)過(guò)程優(yōu)化控制帶來(lái)困難的問(wèn)題,對(duì)該過(guò)程中鈷離子濃度的軟測(cè)量進(jìn)行了研究。
2) 結(jié)合機(jī)理知識(shí)和過(guò)程數(shù)據(jù)建立了鈷離子濃度的預(yù)測(cè)模型。根據(jù)過(guò)程及所建立的模型特點(diǎn),提出了一種雙向遞歸KPLS模型參數(shù)更新和濾波修正相結(jié)合的模型在線校正方法,同時(shí),對(duì)過(guò)程數(shù)據(jù)異常值進(jìn)行在線檢測(cè)。
3) 該方法具有預(yù)測(cè)精度高、跟蹤效果好等特點(diǎn),能有效處理在線預(yù)測(cè)過(guò)程中的異常值,預(yù)測(cè)結(jié)果滿(mǎn)足現(xiàn)場(chǎng)工藝的檢測(cè)要求,可為該生產(chǎn)過(guò)程的控制、優(yōu)化工作提供操作指導(dǎo)。
[1] 劉永帥, 張旭. 濕法煉鋅凈化除鈷工藝現(xiàn)狀及發(fā)展趨勢(shì)[J]. 礦冶, 2012, 21(3): 65?69.
LUI Yongshuai, ZHANG Xu. Current situation and development of process of purification of cobalt during zinc hydrometallurgy[J]. Mining and Metallurgy, 2012, 21(3): 65?69.
[2] B?ckman O, ?stvold T. Products formed during cobalt cementation on zinc in zinc sulfate electrolytes[J]. Hydrometallurgy, 2000, 54(2): 65?78.
[3] Ahmad Z, Mat Noor R, Zhang J. Multiple neural networks modeling techniques in process control: A review[J]. Asia-Pacific Journal of Chemical Engineering, 2009, 4(4): 403?419.
[4] 張學(xué)工. 關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J]. 自動(dòng)化學(xué)報(bào), 2000, 26(1): 32?42.
ZHANG Xuegong. Introduction to statistical learning theory and support vector machines[J]. Acta Automatica Sinica, 2000, 26(1): 32?42.
[5] 丁世飛, 齊丙娟, 譚紅艷. 支持向量機(jī)理論與算法研究綜述[J]. 電子科技大學(xué)學(xué)報(bào), 2011, 40(1): 2?10.
DING Shifei, QI Bingjuan, TAN Hongyan. An overview on theory and algorithm of support vector machines[J]. Journal of University of Electronic Science and Technology of China, 2011, 40(1): 2?10.
[6] Rosipal R, Trejo L J. Kernel partial least squares regression in reproducing kernel hilbert space[J]. Journal of Machine Learning Research, 2001, 2(2): 97?123.
[7] Radhakrishnan V R, Mohamed A R. Neural networks for the identification and control of blast furnace hot metal quality[J]. Journal of Process Control, 2000, 10(6): 509?524.
[8] 唐志杰, 唐朝暉, 朱紅求. 一種基于多模型融合軟測(cè)量建模方法[J]. 化工學(xué)報(bào), 2011, 62(8): 2248?2252.
TANG Zhijie, TANG Zhaohui, ZHU Hongqiu. A multi-model fusion soft sensor modeling method[J]. CIESC Journal, 2011, 62(8): 2248?2252.
[9] 晏密英, 桂衛(wèi)華, 陽(yáng)春華. 基于智能融合策略的鈷離子濃度預(yù)測(cè)模型[J]. 控制與決策, 2011, 26(5): 707?711.
YAN Miying, GUI Weihua, YANG Chunhua. Prediction model of cobalt ion concentration based on intelligent fusion strategy[J]. Control and Decision, 2011, 26(5): 707?711.
[10] 宋海鷹, 桂衛(wèi)華, 陽(yáng)春華, 等. 基于核偏最小二乘法的動(dòng)態(tài)預(yù)測(cè)模型在銅轉(zhuǎn)爐吹煉中的應(yīng)用[J]. 中國(guó)有色金屬學(xué)報(bào), 2007, 17(7): 1201?1206.
SONG Haiying, GUI Weihua, YANG Chunhua, et al. Application of dynamical prediction model based on kernel partial least squares for copper converting[J]. The Chinese Journal of Nonferrous Metals, 2007, 17(7): 1201?1206.
[11] 王鴻振, 吳筱. 砷鹽凈化工藝的研究[J]. 中國(guó)有色冶金, 2011, 40(3): 20?23.
WANG Hongzhen, WU Xiao. Study on process of solution purification by As2O3[J]. China Nonferrous Metallurgy, 2011, 40(3): 20?23.
[12] 姜瀾, 王德全, 戴軍, 等. 降低砷凈液除鈷的鋅粉消耗[J]. 有色金屬, 2003, 55(1): 90?95.
JIANG Lan, WANG Dequan, DAI Jun, et al. Zinc powder consumption decrease in cobalt removal from zinc leaching solution with arsenic oxide[J]. Nonferrous Metals, 2003, 55(1): 90?95.
[13] N?si J. Statistical analysis of cobalt removal from zinc electrolyte using the arsenic-activated process[J]. Hydrometallurgy, 2004, 73(1): 123?132.
[14] Fugleberg S, Jarvinen A, Yllo E. Recent development in solution purification at outokumpu zinc plant, Kokkola[C]// International Symposium-World Zinc’93. Hobart, Tasmanic, 1993: 241?247.
[15] 王雅琳, 謝文平, 王曉麗, 等. 基于主元分析與貝葉斯分類(lèi)的異常值在線檢測(cè)方法研究[C]// 第32屆中國(guó)控制會(huì)議. 西安, 2013: 7803?7808.
WANG Yalin, XIE Wenping, WANG Xiaoli, et al. Study on online outlier detection method based on principal component analysis and bayesian classification[C]// Proceedings of the 32nd Chinese Control Conference. Xi’an, China, 2013: 7803?7808.
[16] Cawley G C, Talbot N L C. Preventing over-fitting during model selection via Bayesian regularization of the hyper-parameters[J]. Journal of Machine Learning Research, 2007, 8(4): 841?861.
Soft sensor based on kernel partial least squares for cobalt ion concentration in cobalt removal purification process with arsenic salt
WANG Yalin, HUANG Kaihua, WU Tiebin, XIE Wenping, YANG Chunhua
(School of Information Science and Engineering, Central South University, Changsha 410083, China)
Considering that the cobalt ion concentration in the cobalt removal purification process with arsenic salt can not be measured online, which makes it difficult to control and optimize the production process, a soft sensor model based on the mechanism and kernel partial least squares was built to predict cobalt ion concentration online. Considering the time-varying characteristics of the process, an online correction method was proposed to improve the precision of the soft sensor model by combining the bidirectional recursive KPLS model parameters update with the filtering correction. Meanwhile, in order to ensure the effectiveness of data samples which were used to model update, an online outlier detection method based on principal component analysis and Bayesian classification was adopted. The results show that the soft sensor model for cobalt ion concentration has good tracking performance. It meets the detection requirement for on-site process and solves the problem of optimal control, so it can provide effective operation guidance for control and optimization of the industrial process.
cobalt removal purification process with arsenic salt; kernel partial least squares; soft sensor; model online correction
TP274
A
1672?7207(2015)01?0141?08
2014?01?12;
2014?03?22
國(guó)家自然科學(xué)基金資助項(xiàng)目(61273187);國(guó)家科技支撐計(jì)劃項(xiàng)目(2012BAF03B05);高等學(xué)校博士學(xué)科點(diǎn)專(zhuān)項(xiàng)科研基金優(yōu)先發(fā)展領(lǐng)域課題(20110162130011);國(guó)家創(chuàng)新研究群體科學(xué)基金資助項(xiàng)目(61321003) (Project(61273187) supported by the National Natural Science Foundation of China; Project(2012BAF03B05) supported by the National Key Technology Support Program; Project(20110162130011) supported by Higher School Doctoral Research Fund of the Priority Areas of Development Project; Project(61321003) supported by the National Science Fund for Creative Research Groups)
王雅琳,博士,教授,從事復(fù)雜過(guò)程建模、優(yōu)化與控制研究;E-mail: ylwang@csu.edu.cn
10.11817/j.issn.1672?7207.2015.01.020
(編輯 陳燦華)