陳 溥
(柳州鐵道職業(yè)技術(shù)學(xué)院,廣西 柳州 545616)
目前,國(guó)內(nèi)外有關(guān)銅溶劑萃取過(guò)程中的建模研究較少,建立使用模型對(duì)于萃取過(guò)程中的自動(dòng)控制有重要意義[1-5]。建立關(guān)鍵生產(chǎn)指標(biāo)預(yù)測(cè)模型,對(duì)萃取過(guò)程的控制和優(yōu)化至關(guān)重要,但影響過(guò)程操作的重要?jiǎng)恿W(xué)傳質(zhì)速率無(wú)法測(cè)量。研究提出了一種適用于銅萃取過(guò)程中的結(jié)合機(jī)理模型和數(shù)據(jù)模型的混合模型。該模型由參數(shù)未知(傳質(zhì)速率)的機(jī)理模型和參數(shù)未知的數(shù)據(jù)預(yù)測(cè)模型組合而成。利用核偏最小二乘法(kernel partial least square,KPLS)建立傳質(zhì)速率預(yù)測(cè)模型,通過(guò)仿真與BP(back propagation)神經(jīng)網(wǎng)絡(luò)的混合模型進(jìn)行對(duì)比分析。
銅萃取過(guò)程可分解為萃取、洗滌、反萃取3個(gè)階段[6-7]。
萃取階段:含有銅離子的水相與有機(jī)相混合,銅離子被萃入到有機(jī)相[8]。洗滌階段:負(fù)載有機(jī)相用洗滌劑洗滌,將夾帶的金屬離子洗出有機(jī)相。反萃取階段:用反萃取劑對(duì)洗滌后有機(jī)相進(jìn)行反萃取,使銅離子返回水相。
影響銅溶劑萃取過(guò)程的因素有相比、溫度、水相pH、萃取劑濃度、被萃取金屬離子濃度等[9-10]。
銅萃取過(guò)程機(jī)理模型的未知參數(shù)實(shí)際上無(wú)法測(cè)量,所以,提出了一種混合模型。該模型將機(jī)理模型和數(shù)據(jù)模型相結(jié)合,由參數(shù)(傳質(zhì)速率)未知的機(jī)理模型和參數(shù)未知的數(shù)據(jù)預(yù)測(cè)模型組成[11]。用KPLS法分別建立數(shù)據(jù)預(yù)測(cè)模型。
動(dòng)態(tài)機(jī)理模型描述萃取過(guò)程中組分濃度隨時(shí)間的變化,是溶劑萃取過(guò)程控制系統(tǒng)的依據(jù),有助于實(shí)現(xiàn)組分濃度優(yōu)化控制。
在建立動(dòng)態(tài)模型之前,對(duì)于多級(jí)逆流萃取過(guò)程做出以下假設(shè):
1)兩相完全混合,并且僅在混合器中進(jìn)行傳質(zhì);
2)兩相不混溶,澄清器沒(méi)有返混和逆流現(xiàn)象;
3)傳質(zhì)系數(shù)、萃取平衡等溫線參數(shù)和效率參數(shù)不恒定,根據(jù)離線測(cè)量估算[12];
4)萃取過(guò)程中兩相體積不變;
5)萃取過(guò)程中各組分濃度隨時(shí)間變化,是時(shí)間的函數(shù)。
根據(jù)物料平衡關(guān)系,建立第i階段萃取過(guò)程的動(dòng)力學(xué)模型,見式(1)~(3)[13]。
(1)
(2)
ρoi(t)=f(ρa(bǔ)(i+1)(t-ti),ρa(bǔ)(i+1)(t),qa(t),qo(t),A,B)。
(3)
式中:Vi—i級(jí)混合澄清器中混合相體積,L;qa、qo—水相、有機(jī)相流量,m3/h;ρa(bǔ)(i+1)為i+1級(jí)澄清器出口水相中Cu2+質(zhì)量濃度,g/L;ρo(i-1)為i-1級(jí)澄清器出口的有機(jī)相Cu2+質(zhì)量濃度,g/L;t、ti—萃取、滯后時(shí)間,h;Ki為第i級(jí)傳質(zhì)系數(shù),L/s;ρoi(t)-ρo*i(t)為傳質(zhì)的驅(qū)動(dòng)力,kN/m3;ρo*i為第i級(jí)達(dá)到平衡時(shí)有機(jī)相中Cu2+質(zhì)量濃度(理想狀態(tài)),g/L,與上層Cu2+進(jìn)入水相的濃度、下一階段進(jìn)入有機(jī)相的濃度、水相和有機(jī)相的流量、效率參數(shù)(α)和平衡萃取線常數(shù)A、B之間存在未知的函數(shù)關(guān)系,當(dāng)i=N時(shí),Ki[ρoi(t)-ρo*i(t)]為傳質(zhì)速率,g/(L·h)。
用McCabe-Thiele圖計(jì)算平衡關(guān)系確定萃取級(jí)數(shù),萃取部分理論平衡值根據(jù)水相和有機(jī)相中Cu2+及水相和有機(jī)相流量比確定。萃取平衡值x*計(jì)算公式[14]為
(4)
式中:a=-qa/qo;b=ρo(i-1)-aρa(bǔ)(i+1),g/L。
α受有機(jī)相中試劑濃度和水相料液酸度影響。根據(jù)理論濃度平衡值x*(水相)和y*(有機(jī)相)、輸入的水相濃度和有機(jī)相中Cu2+質(zhì)量濃度ρin及實(shí)際Cu2+質(zhì)量濃度平衡值ρout估算每個(gè)萃取單元的萃取效率。見式(5),該值接近于1[15]。
(5)
當(dāng)萃取達(dá)到平衡時(shí),萃取過(guò)程處于穩(wěn)定狀態(tài),見式(6)[16]:
q(tend)[ρin(tend)-ρout(tend)]-
KiV[ρout(tend)-ρ*out(tend)]=0,
(6)
一般來(lái)說(shuō),ρout(tend)-ρ*out(tend)非常小。用ε表示,ρout(t)-ρ*out(t),導(dǎo)出傳質(zhì)系數(shù)K,見式(7)[17]:
(7)
傳質(zhì)系數(shù)受多種因素影響,如操作條件、反應(yīng)器尺寸等。在交叉參考微反應(yīng)器中,銅的傳質(zhì)系數(shù)為31.12~214.34 L/s[18];混合澄清器的K=50~400 L/s。
BP神經(jīng)網(wǎng)絡(luò)有3層,輸入層、輸出層和隱藏層,每層有多個(gè)節(jié)點(diǎn)[19]。節(jié)點(diǎn)是神經(jīng)元,神經(jīng)元之間的連接線為權(quán)重。基本BP網(wǎng)絡(luò)如圖1所示。
圖1 基本BP神經(jīng)網(wǎng)絡(luò)模型
假設(shè)輸入層、輸出層、隱含層節(jié)點(diǎn)數(shù)分別為r、m、n;xi為輸入層i神經(jīng)元的輸入值;zk、sk分別為隱含層第k個(gè)節(jié)點(diǎn)的輸出值和凈輸入值;yj、sj分別為輸出層j節(jié)點(diǎn)的實(shí)際輸出和凈輸入值;vik、wkj分別為輸入層i節(jié)點(diǎn)與隱含層k節(jié)點(diǎn)和隱含層k節(jié)點(diǎn)與輸出層j節(jié)點(diǎn)之間的連接權(quán)值。
正向傳輸過(guò)程中,輸出層和隱含層的輸出計(jì)算公式見(8)~(11)[20]。
zk=f(sk),k=1,2,……,n;
(8)
(9)
yj=f(sj),j=1,2,……,m;
(10)
(11)
在式(8)~(11)中,選擇激勵(lì)函數(shù)f(x)=1/(1+e-x),其導(dǎo)數(shù)為f’=f(1-f)。通常,誤差函數(shù)(也稱性能函數(shù))E可以評(píng)估網(wǎng)絡(luò)性能,E越小,網(wǎng)絡(luò)性能越好。見式(12),性能函數(shù)取均方誤差函數(shù)。
(12)
誤差反向傳播將誤差定義擴(kuò)展到隱含層至輸入層,見式(13)。
(13)
標(biāo)準(zhǔn)BP算法用梯度下降法來(lái)調(diào)整層間權(quán)重,見式(14)、(15)。
(14)
(15)
如果η較大,則修正速度快且易振蕩;η較小時(shí),則會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練時(shí)間長(zhǎng)且收斂速度慢。η取值范圍為0.01~0.8。BP算法流程如圖2所示。
圖2 BP算法流程
偏最小二乘法(partial least square,PLS)是一種多元統(tǒng)計(jì)數(shù)據(jù)分析方法,可以解決普通多元回歸方法無(wú)法解決的許多問(wèn)題[21]。偏最小二乘方法假定感興趣區(qū)域由一些潛在向量決定,這些向量是觀測(cè)值的線性組合。假設(shè)有向量個(gè)因變量{y1,y2,…,yq}和p個(gè)自變量{x1,x2,…,xp},觀測(cè)n個(gè)樣本點(diǎn)。X={x1,x2,…,xp}為輸入變量的n×p矩陣;Y={y1,y2,…,yq}為相應(yīng)輸出變量的(n×p)矩陣。
首先,從X和Y中提取得分向量t1和u1(t1為x1,x2,…,xp的線性組合,u1為y1,y2,…,yq的線性組合),要求t1和u1盡可能代表矩陣X和Y。
t1=Xw1;
(16)
u1=Yc1。
(17)
然后,建立X對(duì)t1、Y對(duì)u1的回歸方程,見式(18)(19),且滿足式(20)。
X=t1p1T+E1;
(18)
Y=u1q1T+F1;
(19)
u1=f1(t1)+r1,
(20)
式中,p1、q1分別為得分向量對(duì)應(yīng)的載荷向量。
殘差計(jì)算公式為(21)(22)。
E1=X-t1p1T;
(21)
F1=Y-u1q1T。
(22)
提取E1和F1得分向量,重復(fù)上述算法,直到得到第a個(gè)得分向量。殘差Ea和Fa幾乎沒(méi)有任何關(guān)鍵信息。
由于銅萃取過(guò)程的動(dòng)力學(xué)反應(yīng)為非線性,PLS算法無(wú)法解決該問(wèn)題,因此引進(jìn)核偏最小二乘法。該方法是在核希爾伯特空間(Reproducing Kemel Hilbert Space,RKHS)中建立的機(jī)器學(xué)習(xí)算法之一。用該方法建立模型的目的是最小化結(jié)構(gòu)風(fēng)險(xiǎn),即在(RKHS)中尋找最優(yōu)模型。KPLS遵循PLS基本思想,它們的區(qū)別在于PLS建立從屬變量(y)和自變量(x)之間的相關(guān)性,而KPLS僅將自變量(x)投影到RKHS上,并且在RKHS中找到Ф(x)和y的相關(guān)性。KPLS的本質(zhì)是在特征空間中構(gòu)建PLS模型,有效地獲得非線性回歸模型。
同樣,觀測(cè)n個(gè)樣本,所謂“核技術(shù)”,實(shí)際上是Ф(xi)TФ(xj)=K(xi,xj)??梢钥吹?,ФФT為所有映射的輸入數(shù)據(jù)點(diǎn){Ф(xi)}n(i=1)之間交叉內(nèi)積運(yùn)算的核Gram矩陣K(n×n),因此,可以用核函數(shù)來(lái)代替非線性映射。通常,當(dāng)提取t分量后,矩陣見式(23)。
K←(I-ttT)K(I-ttT)=
K-ttTK-KttT+ttTKttT,
(23)
式中,I為n維單位矩陣。對(duì)PLS算法的非線性校正也可以得到類似的KPLS算法。修正的結(jié)果是從KYYT和YYT矩陣中提取得分向量t、u,步驟如下:
步驟1,隨機(jī)設(shè)定初始值u(可設(shè)定為u等于Y列中的任意一列);
步驟2,根據(jù)t=ФФTu=Ku,計(jì)算得分向量;
步驟3,根據(jù)c=YTt計(jì)算系數(shù)向量;
步驟4,計(jì)算得分向量;
步驟5,重復(fù)2~5步,直到收斂;
步驟6,矩陣K和Y進(jìn)行縮并,K←(I-ttT)K(I-ttT),Y←Y-ttTY;
步驟7,返回步驟1,計(jì)算下一個(gè)t、u。
回歸系數(shù)矩陣B通過(guò)公式(24)計(jì)算得到,
B=ФTU(TTKU)-1TTY。
(24)
預(yù)測(cè)的訓(xùn)練數(shù)據(jù)見式(25),
Y*=ФB=TTTY。
(25)
KPLS算法流程如圖3所示。
圖3 KPLS算法流程
混合模型由參數(shù)未知(傳質(zhì)速率)的機(jī)理模型和參數(shù)未知的數(shù)據(jù)預(yù)測(cè)模型組成。通過(guò)BP神經(jīng)網(wǎng)絡(luò)和KPLS建立傳質(zhì)速率預(yù)測(cè)模型,并與機(jī)理模型形成混合模型。數(shù)據(jù)模型是黑盒模型。在未知傳質(zhì)速率模型結(jié)構(gòu)和相關(guān)參數(shù)情況下,可以獲得傳質(zhì)速率背后的過(guò)程變量之間的復(fù)雜關(guān)系,從而降低建模難度。在考慮過(guò)程的物理特性的同時(shí),機(jī)理模型和數(shù)據(jù)模型組合有效地利用了相關(guān)的數(shù)據(jù)信息。這種混合模式具有很高的精度,適合于實(shí)際工業(yè)生產(chǎn)過(guò)程,為銅溶劑萃取工藝先進(jìn)控制系統(tǒng)的開發(fā)和在線優(yōu)化奠定了基礎(chǔ)。銅萃取混合模型如圖4所示。
圖4 銅萃取過(guò)程混合模型
計(jì)算機(jī)為CPU i5-2450m,內(nèi)存為8 Gb。仿真軟件為matlab2018。實(shí)驗(yàn)室實(shí)際采集200組萃取過(guò)程穩(wěn)態(tài)數(shù)據(jù),100組用于訓(xùn)練,100組用于測(cè)試。為了驗(yàn)證和比較上述預(yù)測(cè)模型性能,利用以下3個(gè)性能指標(biāo)對(duì)各算法性能進(jìn)行評(píng)價(jià)。
1)均方根誤差(RMSE)
(26)
2)平均絕對(duì)誤差(MAE)
(27)
3)平均絕對(duì)百分比誤差(MAPE)
(28)
式中:xi和x*i分別為銅傳質(zhì)速率實(shí)際值和預(yù)測(cè)值,M為預(yù)測(cè)樣品總數(shù)。
建立傳質(zhì)速率黑箱模型,輸出傳質(zhì)速率預(yù)測(cè)值。黑箱模型的輸入對(duì)應(yīng)于傳輸速率估計(jì)值的影響因素。相同條件下,利用BP神經(jīng)網(wǎng)絡(luò)和KPLS對(duì)傳輸速率進(jìn)行建模。圖5為BP神經(jīng)網(wǎng)絡(luò)及KPLS黑箱模型預(yù)測(cè)效果??梢钥闯觯築P神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果良好,表明BP神經(jīng)網(wǎng)絡(luò)黑箱模型具有準(zhǔn)確的預(yù)測(cè)能力,非線性映射能力較好;但訓(xùn)練中收斂速度較慢,并且在訓(xùn)練集比較小時(shí),容易發(fā)生過(guò)擬合;KPLS將初始輸入映射到高維特征空間,有效解決了非線性回歸問(wèn)題。
a—BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型;b—KPLS預(yù)測(cè)模型。圖5 黑箱預(yù)測(cè)結(jié)果
2個(gè)數(shù)據(jù)模型性能指標(biāo)見表1。
表1 BP神經(jīng)網(wǎng)絡(luò)和KPLS數(shù)據(jù)模型預(yù)測(cè)性能指標(biāo)
數(shù)據(jù)模型的正確性在混合模型構(gòu)建中起重要作用。以上2種算法能夠準(zhǔn)確預(yù)測(cè)傳質(zhì)速率。由表1性能指標(biāo)對(duì)比結(jié)果看出,KPLS方法效果較好。數(shù)據(jù)模型的準(zhǔn)確性解決了傳質(zhì)速率無(wú)法測(cè)量的問(wèn)題,這為建立更接近實(shí)際過(guò)程的混合模型奠定了基礎(chǔ)。
對(duì)比單一模型和混合模型預(yù)測(cè)結(jié)果可以說(shuō)明上述銅萃取過(guò)程混合模型的有效性,對(duì)比結(jié)果如圖6所示,各模型的性能指標(biāo)見表2。
a—BP神經(jīng)網(wǎng)絡(luò);b—KPLS。
表2 單一模型和混合模型預(yù)測(cè)性能指標(biāo)
由圖6看出:機(jī)理模型能夠很好預(yù)測(cè)過(guò)程趨勢(shì);然而,由于萃取過(guò)程較為復(fù)雜,預(yù)測(cè)結(jié)果與實(shí)際值誤差較大;單一數(shù)據(jù)模型相對(duì)于機(jī)理模型需要考慮的因素更多,預(yù)測(cè)效果優(yōu)于機(jī)理模型。由于數(shù)據(jù)模型不使用已知的經(jīng)驗(yàn)知識(shí),僅依賴數(shù)據(jù)獲得輸入輸出之間的關(guān)系,純數(shù)據(jù)模型的泛化能力差,所以預(yù)測(cè)值和實(shí)際值誤差較大?;旌夏P蛯?shù)據(jù)模型和機(jī)理模型優(yōu)點(diǎn)相結(jié)合,精度較高,泛化能力強(qiáng),有良好的預(yù)測(cè)效果,對(duì)銅溶液萃取工藝先進(jìn)控制系統(tǒng)的開發(fā)和操作優(yōu)化有一定參考性。基于KPLS的混合模型性能較優(yōu),RMSE為0.066 52,MAE為0.043 12,MAPE為0.019 82;對(duì)銅溶液萃取工藝先進(jìn)控制系統(tǒng)的開發(fā)和操作優(yōu)化有一定參考性。
提出了一種混合模型,該模型由存在未知參數(shù)(傳質(zhì)速率)的機(jī)理模型和未知參數(shù)的數(shù)據(jù)預(yù)測(cè)模型組成,通過(guò)數(shù)據(jù)模型預(yù)測(cè)機(jī)理模型的未知參數(shù)(傳質(zhì)速率度)?;旌夏P托阅艿姆治鼋Y(jié)果表明,基于KPLS的混合模型性能較優(yōu),均方根誤差、平均絕對(duì)誤差、平均絕對(duì)百分比誤差都較低,可作為銅萃取過(guò)程中自動(dòng)控制系統(tǒng)開發(fā)的依據(jù)??紤]到實(shí)驗(yàn)室設(shè)備和數(shù)據(jù)規(guī)模,建模方法還處于初級(jí)階段,還有待進(jìn)一步完善。