劉鴻斌 宋留
摘 要:準(zhǔn)確預(yù)測出水水質(zhì)對造紙廢水處理過程具有重要意義,為此筆者提出一種基于相關(guān)向量機(jī)(RVM)的軟測量模型。首先,利用偏最小二乘法(PLS)提取實(shí)際造紙廢水處理過程數(shù)據(jù)的潛變量,解決過程變量的共線性和高維度問題,然后利用潛變量建立RVM預(yù)測模型。結(jié)果表明,與RVM模型相比,本文提出的PLS-RVM組合模型在對出水懸浮固形物(SS)的水質(zhì)預(yù)測測試時(shí),均方根誤差降低了7.76%,決定系數(shù)提高了12.32%;但對出水化學(xué)需氧量(COD)的預(yù)測測試效果提升并不明顯。此外,PLS-RVM模型的預(yù)測效果較PLS-LSSVM模型有顯著提升:對出水SS的預(yù)測,均方根誤差降低了9.16%,決定系數(shù)提高了15.29%;對出水COD的預(yù)測結(jié)果中,均方根誤差降低了9.29%,決定系數(shù)提高了18.34%。
關(guān)鍵詞:相關(guān)向量機(jī);降維方法;支持向量機(jī);造紙廢水處理;軟測量
中圖分類號(hào):TS736;X793
文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.11981/j.issn.1000-6842.2019.02.53
近年來,軟測量技術(shù)已成功地在精煉、化工、發(fā)電、食品加工、制漿造紙工業(yè)和城市與工業(yè)污染的監(jiān)測等領(lǐng)域得到應(yīng)用[1]。軟測量技術(shù)具備一系列優(yōu)點(diǎn):替代昂貴的硬件設(shè)備,降低生產(chǎn)成本;良好的兼容性,能與現(xiàn)有硬件傳感器并行工作;能夠?qū)崟r(shí)在線測量,克服某些硬件傳感器的滯后性,可以實(shí)現(xiàn)更全面、及時(shí)的監(jiān)測網(wǎng)絡(luò)。在造紙廢水處理的過程中,一些難以測量或不易在線測量的重要參數(shù),如出水化學(xué)需氧量與出水懸浮固形物濃度等,不僅是重要的出水指標(biāo),也是必要的檢測變量。為了提高造紙廢水處理的達(dá)標(biāo)率,提升系統(tǒng)穩(wěn)定性,需要對這些重要的檢測變量進(jìn)行監(jiān)測和控制,但是傳統(tǒng)的傳感器測量方法普遍存在著價(jià)格昂貴、維護(hù)難、穩(wěn)定性差、使用壽命短等問題[2]。針對這些問題,軟測量技術(shù)為實(shí)現(xiàn)污水處理過程出水水質(zhì)的實(shí)時(shí)檢測提供了一個(gè)很好的解決思路。
軟測量技術(shù)的核心是建立輸入變量與輸出變量之間的軟測量模型。其建模方法按照建模的機(jī)制劃分為兩大類[3]:一類是基于過程反應(yīng)機(jī)理的機(jī)理模型,該類模型通過分析過程的反應(yīng)機(jī)理,運(yùn)用物理、化學(xué)和生物等基本定理來表述過程的內(nèi)部規(guī)律,建立過程模型,但一般對象的反應(yīng)機(jī)理都比較復(fù)雜,并且由于工況與環(huán)境的影響,導(dǎo)致機(jī)理模型的預(yù)測性能大大降低;另一類是數(shù)據(jù)驅(qū)動(dòng)建模,該方法是通過輸入輸出數(shù)據(jù)建立與過程外特性等價(jià)的模型,因此不需要研究對象的內(nèi)部規(guī)律,只需獲得足夠多的數(shù)據(jù)即可建立對象的軟測量模型。數(shù)據(jù)驅(qū)動(dòng)建模有回歸分析模型、人工智能模型、統(tǒng)計(jì)學(xué)習(xí)理論模型及概率核函數(shù)模型等軟測量模型[3]。回歸分析建模方法主要有主元分析法(Principal Component Analysis, PCA)和偏最小二乘法(Partial Least Squares, PLS),旨在尋找多個(gè)變量間的函數(shù)關(guān)系,但局限于非線性較弱的對象。人工智能建模方法主要是人工神經(jīng)網(wǎng)絡(luò),汪瑤等[4]采用人工神經(jīng)網(wǎng)絡(luò)建模預(yù)測出水水質(zhì),但是神經(jīng)網(wǎng)絡(luò)易存在局部極小和泛化能力有限,而且權(quán)值不易在線調(diào)整等缺點(diǎn)。黃銀蓉等[5]利用基于統(tǒng)計(jì)學(xué)習(xí)理論的最小二乘支持向量機(jī)(Least Square Support Vector Machine, LSSVM)對污水處理的出水指標(biāo)進(jìn)行建模預(yù)測,但是支持向量機(jī)的核函數(shù)必須滿足Mercer條件,除核函數(shù)外,懲罰因子與不敏感損失區(qū)域半徑也會(huì)對模型的精度產(chǎn)生影響[6]。另外,支持向量基(SVM)的支持向量個(gè)數(shù)隨著訓(xùn)練樣本的增大呈線性增加,可能會(huì)產(chǎn)生過擬合問題及增加計(jì)算時(shí)間。宋留等[7]采用基于概率核函數(shù)的高斯過程模型預(yù)測出水水質(zhì),但是高斯過程受限于先驗(yàn)高斯分布的假設(shè)條件,實(shí)際過程的分布難以預(yù)知或不一定遵循高斯分布,因此受到限制。
相關(guān)向量機(jī)(Relevance Vector Machine, RVM)是Tipping[8]提出的一種基于貝葉斯框架的稀疏概率模型,是一種新的有監(jiān)督學(xué)習(xí)方法。與SVM相比,RVM核函數(shù)的選擇不受Mercer條件的限制,可以根據(jù)需要構(gòu)建核函數(shù),并且RVM是機(jī)率式預(yù)測的。此外相較于基于概率核函數(shù)的高斯過程模型,RVM避免了高斯過程局限于先驗(yàn)高斯分布的假設(shè)條件,且同樣能實(shí)現(xiàn)概率式預(yù)測。劉遵雄等[9]在解決電力負(fù)荷中期預(yù)測的問題上,提出了一種基于RVM的中期預(yù)測方法。韓中合等[6]把RVM回歸模型運(yùn)用到工業(yè)生產(chǎn)中短期風(fēng)速預(yù)測的問題上,取得了良好的預(yù)測效果。許玉格等[10]利用活性污泥水處理仿真基準(zhǔn)模型(BSM1)[11]得到的污水仿真數(shù)據(jù),建立出水水質(zhì)的RVM軟測量預(yù)測模型,并與LSSVM和神經(jīng)網(wǎng)絡(luò)(BP)模型比較,取得了比較滿意的污水處理出水水質(zhì)預(yù)測效果。
然而對于機(jī)器學(xué)習(xí)的回歸問題,隨著變量數(shù)量的增多,變量之間的相關(guān)性將會(huì)增強(qiáng),數(shù)據(jù)的可視化也會(huì)變得難以實(shí)現(xiàn)。變量的相關(guān)性或共線性會(huì)導(dǎo)致模型預(yù)測結(jié)果的方差變大,預(yù)測精度下降。在這種情況下,要很好地解釋模型中自變量對因變量的效應(yīng),是非常困難的。PCA與PLS作為進(jìn)一步簡化建模難度的有效工具,不僅能避免共線性的負(fù)面影響,而且能減少數(shù)據(jù)的維度[1]。近年來,PLS除作為化學(xué)計(jì)量學(xué)中的多元統(tǒng)計(jì)工具外,也從諸多降維方法中脫穎而出。PCA僅對自變量進(jìn)行主成分提取,從而忽略了自變量對因變量系統(tǒng)的解釋性。PLS降維的目的是找出與因變量有較大協(xié)方差的自變量的不相關(guān)線性轉(zhuǎn)換,即潛變量(Latent Variables)[12]。降維得到的潛變量,不僅對因變量具有最大解釋性,而且能反映因變量系統(tǒng)的信息,使得自變量對因變量的解釋效應(yīng)在模型中得到體現(xiàn)。
提高廢水處理過程出水水質(zhì)模型的精度已經(jīng)成為當(dāng)前研究的熱點(diǎn)。不同地區(qū)造紙廠所產(chǎn)生廢水的污染成分及特性會(huì)隨著原材料、生產(chǎn)工藝和廢水處理技術(shù)等影響因素的不同而有較大差異,基于數(shù)據(jù)驅(qū)動(dòng)的造紙廢水處理預(yù)測模型可以為制漿造紙廢水處理過程的優(yōu)化控制提供重要支撐。本文采用廣東東莞一家造紙廠的廢水處理數(shù)據(jù),首先使用PLS方法對原始過程變量進(jìn)行去共線性和降維處理,然后利用建立在貝葉斯框架下的RVM模型建立造紙廢水處理系統(tǒng)的PLS-RVM軟測量預(yù)測模型。
1 廢水處理過程建模
1.1 降維方法
PLS降維是將過程變量矩陣X∈Rn·m與質(zhì)量變量矩陣Y∈Rn·p投影到由少量潛變量(或得分矩陣)T=[t1,…,tK]∈Rn·K所構(gòu)成的低維空間中:
X=TPT+E
Y=TQT+F (1)
式中,P=[p1,…,pK]與Q=[q1,…,qK]分別表示X與Y的負(fù)載矩陣,E與F分別表示X與Y的殘差矩陣。即PLS將過程變量分解為兩個(gè)斜交投影的子空間:得分子空間(質(zhì)量相關(guān)子空間)與殘差子空間(質(zhì)量無關(guān)子空間)。由于PLS是一個(gè)迭代的過程,潛變量T不能直接由原始過程變量矩陣X得到,因此引入權(quán)重矩陣V=[v1,…,vK]=W(PTW)-1,使其滿足[13]:
T=XV(2)
式中,W=[w1,…,wK]是計(jì)算得分矩陣的權(quán)重矩陣。
1.2 RVM原理
類似于SVM,RVM模型的函數(shù)預(yù)測輸出[14]:
tn=y(xn;w)+εn=∑Ni=1wiK(xn;xi)+εn(3)
式中,εn是獨(dú)立的零均值,方差為σ2的高斯噪聲。K(xn,xi)表示核函數(shù),w=(w0,…,wn)T表示參數(shù)向量。假定目標(biāo)值t獨(dú)立分布,則RVM的似然概率估計(jì)為:
P(t|xn,w,σ2)=Ni=1N(wT(xn),σ2)
=(2πσ2)-N2exp{-12σ2‖t-Φw‖2} (4)
其中,Ф是訓(xùn)練樣本中的特征向量xi代入核函數(shù)中得到的結(jié)構(gòu)矩陣:
Φ=1K(x1,x1)…K(x1,xN)
1K(x2,x1)…K(x2,xN)
1K(xN,x1)…K(xN,xN) (5)
為避免出現(xiàn)在SVM中的支持向量過多而導(dǎo)致的過擬合問題,在RVM模型中需對權(quán)值wi進(jìn)行約束,使得其機(jī)率分布是在零周圍的正態(tài)分布:
p(w|α)=Ni=0N(wi|0,α-1i)
=Ni=0αi2πexp(-αiw2i2)(6)
式中,每個(gè)超參數(shù)αi與其相對應(yīng)的權(quán)值wi相關(guān),α=(α0,α1,…,αN)T。根據(jù)貝葉斯概率框架及似然估計(jì)分布,權(quán)重的后驗(yàn)概率分布為:
p(w|t,α,σ2)=(2π)-N+12|∑|-12exp{-12(w-m)T∑-1(w-m)} (7)
式中,后驗(yàn)協(xié)方差矩陣∑=(σ-2ΦTΦ+A)-1,均值m=σ-2∑ΦTt,矩陣A=diag(α0,α1,…,αN)。由于大多數(shù)的αi都是趨近于無窮的,與之對應(yīng)的后驗(yàn)分布協(xié)方差與均值則無限趨近于零:
limαi→∞∑=limαi→∞(A+σ-2ΦTΦ)-1=0limαi→∞m=0 (8)
即與αi相對應(yīng)的權(quán)值wi等于0,因此相應(yīng)的基函數(shù)(xi)將從結(jié)構(gòu)矩陣Ф去除,而保留下的非零權(quán)重所對應(yīng)的特征向量也就是相關(guān)向量。
對超參數(shù)進(jìn)行優(yōu)化αnew=1-αi∑iim2i=γim2i,σ2new=‖t-Φm‖2N-∑iγi。因此,對于新的輸入值x′,模型的預(yù)測分布:
P(tnew|x′,α,σ2)=N(mT(x′),σ2(x′))(9)
式中,均值mT(x′)為要求的估計(jì)值tnew,即:
tnew=mT(x′)(10)
1.3評(píng)價(jià)指標(biāo)
本文采用均方根誤差(Root Mean Square Error, RMSE)和決定系數(shù)(Determination Coefficient, R2)作為模型的評(píng)價(jià)指標(biāo),來比較不同模型的預(yù)測精度。R2和RMSE的表達(dá)式為:
R2=1-∑ni=1(yi-i)2∑ni=1(yi-)2 (11)
RMSE=∑ni=1(i-yi)2n (12)
式中,i是估計(jì)值,yi是真實(shí)值,是平均值。R2表示回歸平方和占總離差平方和的比重,比重越大,則回歸效果越好。即R2越接近1,代表輸入變量對輸出變量的解釋能力越強(qiáng),對數(shù)據(jù)擬合的效果也越好。RMSE是預(yù)測數(shù)據(jù)和原始數(shù)據(jù)對應(yīng)點(diǎn)誤差的平方和的均值的平方根,RMSE越接近于0,代表該模型預(yù)測效果越佳。
2 基于RVM廢水處理過程仿真預(yù)測模型
2.1 造紙廢水處理數(shù)據(jù)
廢水?dāng)?shù)據(jù)采集自廣東東莞的一家造紙廠廢水處理車間,測量數(shù)據(jù)顯示了造紙廢水處理的好氧段工況。數(shù)據(jù)包含170個(gè)樣本點(diǎn),8個(gè)廢水變量,分別是進(jìn)水化學(xué)需氧量(Chemical Oxygen Demand, COD)、出水COD、進(jìn)水懸浮固形物(Suspended Solids, SS)、出水SS、溶解氧量(DO)、流量(Q)、溫度(T)、pH值。選取120個(gè)樣本數(shù)據(jù)作為訓(xùn)練集,50個(gè)數(shù)據(jù)作為測試集,在MATLAB中分析處理該170個(gè)造紙廢水?dāng)?shù)據(jù)。其中,進(jìn)水COD、進(jìn)水SS、DO、Q、T、pH值作為輸入變量,出水COD和出水SS作為輸出變量構(gòu)建模型。
2.2 RVM預(yù)測模型
為了驗(yàn)證RVM對出水COD與出水SS的預(yù)測性能,用相同的數(shù)據(jù)進(jìn)行LSSVM建模預(yù)測。LSSVM的回歸模型如下式所示:
y(xn)=∑Ni=1φiK(xn,xi)+β (13)
其中,K(xn,xi)表示核函數(shù),本文采用徑向基核函數(shù)K(xi,xj)=exp(-xi,xj22σ2),σ為核寬度;φ與β利用PLS求得其近似值。
針對造紙廢水處理過程中多變量、時(shí)變性、非線性和復(fù)雜性等特點(diǎn),本文選取高斯核函數(shù)作為RVM的核函數(shù),迭代次數(shù)500。圖1和圖2分別表示RVM與LSSVM軟測量模型對出水COD及出水SS的預(yù)測結(jié)果。在對出水COD預(yù)測時(shí),RVM模型的RMSE為4.2658 mg/L,R2為0.5684;對出水SS預(yù)測時(shí),RMSE為0.7565 mg/L,R2為0.5478。與LSSVM模型相比,RVM模型對出水COD預(yù)測結(jié)果的RMSE降低了10.76%,R2提高了24.08%;在對出水SS的預(yù)測,RVM模型的RMSE降低了5.45%,R2提高了10.85%。
2.3 基于降維的RVM預(yù)測模型
通過降維得到的潛變量,不僅對因變量具有最大解釋性,而且能反映因變量系統(tǒng)的信息,使得自變量對因變量的解釋效應(yīng)在模型中得到體現(xiàn)。表1為PLS對輸入變量降維后的各個(gè)潛變量的累計(jì)貢獻(xiàn)率。對于PLS潛變量個(gè)數(shù)的確定目前尚無統(tǒng)一的方法。表1顯示,潛變量1~5捕獲了自變量85%以上的方差,但是潛變量4~6對響應(yīng)變量只占不到0.5%的方差,響應(yīng)變量累計(jì)貢獻(xiàn)率基本不變,說明后3個(gè)潛變量對響應(yīng)變量基本無影響??紤]到隨著變量的增多,模型的復(fù)雜性及建模難度也會(huì)隨之增大,因此本文選取前3個(gè)潛變量作為模型的輸入,對出水COD與出水SS建立PLS-RVM模型,并與PLS-LSSVM模型進(jìn)行對比。
圖3和圖4分別表示PLS-RVM與PLS-LSSVM模型預(yù)測的出水COD及出水SS的預(yù)測值與測量真實(shí)值。對于出水COD,PLS-LSSVM模型預(yù)測結(jié)果的RMSE為4.6311 mg/L,R2為0.4913;對于出水SS,PLS-LSSVM模型的RMSE為0.7682 mg/L,R2為0.5337。相較于PLS-LSSVM模型,在對出水COD的預(yù)測,PLS-RVM模型的RMSE降低了9.29%,R2提高了18.34%;在對出水SS的預(yù)測,PLS-RVM模型的RMSE降低了9.16%,R2提高了15.29%。
2.4 結(jié)果分析
表2顯示的是4種模型的預(yù)測性能對比結(jié)果,由此可以看出,基于PLS降維的模型其建模預(yù)測效果要優(yōu)于未降維模型的預(yù)測效果。對于出水COD模型,PLS-RVM訓(xùn)練模型的RMSE為3.6953 mg/L,R2為0.8143,相較于RVM模型,RMSE降低了23.76%,R2提高了19.64%;模型測試結(jié)果的RMSE為4.2010 mg/L,R2為0.5814,相較于RVM模型,RMSE與R2無明顯優(yōu)勢提升。對于出水SS模型,PLS-RVM訓(xùn)練模型的RMSE為0.6623 mg/L,R2為0.6981,相較于RVM模型,RMSE降低了8.04%,R2提高了8.57%;在模型測試時(shí)的RMSE為0.6978 mg/L,R2為0.6153,相較于RVM模型測試結(jié)果,RMSE降低了7.76%,R2提高了12.32%。此外,在模型訓(xùn)練時(shí),兩種出水水質(zhì)的RVM模型的訓(xùn)練結(jié)果的RMSE與R2要略差于LSSVM模型,但是在模型預(yù)測測試時(shí),其RMSE與R2要優(yōu)于LSSVM模型。而PLS-RVM模型無論是在訓(xùn)練擬合還是預(yù)測測試階段,其建模預(yù)測效果都要優(yōu)于PLS-LSSVM模型。說明在對數(shù)據(jù)進(jìn)行降維后,模型的建模難度和預(yù)測精度得到優(yōu)化,相比于LSSVM模型,RVM模型的泛化能力更強(qiáng),對樣本的測試能力優(yōu)于LSSVM模型。
3 結(jié) 論
本文提出了一種對造紙廢水出水水質(zhì)建模預(yù)測的軟測量模型。預(yù)測模型首先通過偏最小二乘法(PLS)對原始變量投影提取潛變量達(dá)到對數(shù)據(jù)降維的目的,然后采用相關(guān)向量機(jī)(RVM)模型對造紙廢水處理過程的出水水質(zhì)進(jìn)行建模和預(yù)測。對出水COD的預(yù)測模型,PLS-RVM建模訓(xùn)練的均方根誤差(RMSE)最小,為3.6953 mg/L,相較于RVM模型降低了23.76%;但是預(yù)測結(jié)果的RMSE為4.2010 mg/L,相較于RVM模型并無明顯優(yōu)勢提升。對于出水SS的預(yù)測模型,同樣PLS-RVM建模訓(xùn)練的RMSE最小,為0.6623 mg/L,相較于RVM模型降低了8.04%;其預(yù)測結(jié)果的RMSE為0.6978 mg/L,相較于RVM模型降低了7.76%。結(jié)果表明,本文提出的PLS-RVM組合模型能夠降低模型建立的復(fù)雜度并提高預(yù)測模型的泛化能力。
本文所述非線性建模方法適用于表征變量間的靜態(tài)關(guān)系,對于造紙廢水處理系統(tǒng)這種動(dòng)態(tài)特性很強(qiáng)的過程,如何將非線性方法與動(dòng)態(tài)建模方法(如多元時(shí)間序列分析法)相結(jié)合來提高模型的預(yù)測精度,是今后研究的方向。
參 考 文 獻(xiàn)
[1] Fortuna L, Graziani S, Rizzo A, et al. Soft sensors for monitoring and control of industrial processes [M]. Springer London, 2007, 128.
[2] Huang D P, Liu Y Q, Li Y. Soft sensor research and its application in wastewater treatment[J]. CIESC Journal, 2011, 62(1): 1.
黃道平, 劉乙奇, 李 艷. 軟測量在污水處理過程中的研究與應(yīng)用 [J]. 化工學(xué)報(bào), 2011, 62(1): 1.
[3] Cao P F, Luo X L. Modeling of soft sensor for chemical process[J]. Ciesc Journal, 2013, 64(3): 788.
曹鵬飛, 羅雄麟. 化工過程軟測量建模方法研究進(jìn)展 [J]. 化工學(xué)報(bào), 2013, 64(3): 788.
[4] Wang Y, Xu L, Yin W Z, et al. Soft sensor modeling of papermaking treatment processes based on ANN and LSSVR [J]. Transactions of China Pulp and Paper, 2017, 32(1): 50.
汪 瑤, 徐 亮, 殷文志, 等. 基于ANN和LSSVR的造紙廢水處理過程軟測量建模 [J]. 中國造紙學(xué)報(bào), 2017, 32(1): ?50.
[5] Huang Y R, Zhang S D. Online soft measurement for wastewater treatment based on MIMO least squares support vector machine [J]. Automation & Instrumentation, 2010(4): 15.
黃銀蓉, 張紹德. MIMO最小二乘支持向量機(jī)污水處理在線軟測量研究 [J]. 自動(dòng)化與儀器儀表, 2010(4): 15.
[6] Han Z H, Li Q J, Yuan Y M, et al. RVM based short-term wind speed prediction model [J]. Journal of Electric Power Science and Technology, 2017, 32(3): 38.
韓中合, 李秋菊, 苑一鳴, 等. 基于相關(guān)向量機(jī)的短期風(fēng)速預(yù)測模型 [J]. 電力科學(xué)與技術(shù)學(xué)報(bào), 2017, 32(3): 38.
[7] Song L, Yang C, Zhang H, et al. Soft sensor modeling of papermaking wastewater treatment process based on Gaussian process regression [J]. China Environmental Science, 2018, 38(7): 2564.
宋 留, 楊 沖, 張 輝, 等. 基于高斯過程回歸的造紙廢水處理過程軟測量建模[J]. 中國環(huán)境科學(xué), 2018, ?38(7): 2564.
[8] Tipping M E. Sparse Bayesian Learning and Relevance Vector Machine [J]. Journal of Machine Learning Research, ?2001, 1(3): 211.
[9] Liu Z X, Zhang D Y, Sun Q D, et al. Mid-term electric load prediction based on the relevant vector machine [J]. Journal of XIAN Jiaotong University, 2004, 38(10): 1005.
劉遵雄, 張德運(yùn), 孫欽東, 等. 基于相關(guān)向量機(jī)的電力負(fù)荷中期預(yù)測 [J]. 西安交通大學(xué)學(xué)報(bào), 2004, 38(10): 1005.
[10] Xu Y G, Cao T, Luo F. Wastewater effluent quality prediction model based on relevance vector machine [J]. Journal of South China University of Technology(Natural Science Edition), 2014, 42(5): 103.
許玉格, 曹 濤, 羅 飛. 基于相關(guān)向量機(jī)的污水處理出水水質(zhì)預(yù)測模型 [J]. 華南理工大學(xué)學(xué)報(bào) (自然科學(xué)版), 2014, ?42(5): 103.
[11] Liu D W, Shen W H. Introduction of the benchmark simulation model-1 for wastewater treatment [J]. Guangzhou Environmental Sciences, 2007, 22(1): 11.
劉大偉, 沈文浩. 廢水處理仿真基準(zhǔn)模型BSM1簡介 [J]. 廣州環(huán)境科學(xué), 2007, 22 (1): 11.
[12] Dong Y, Qin S J. Dynamic latent variable analytics for process operations and control [J]. Computers & Chemical Engineering, 2018, 114: 69.
[13] Peng K X, Ma L, Zhang K. Review of Quality-related Fault Detection and Diagnosis Techniques for Complex Industrial Processes [J]. ACTA Automatica Sinica, 2017, 43(3): 349.
彭開香, 馬 亮, 張 凱. 復(fù)雜工業(yè)過程質(zhì)量相關(guān)的故障檢測與診斷技術(shù)綜述 [J]. 自動(dòng)化學(xué)報(bào), 2017, 43(3): 349.
[14] Wong P K, Xu Q, Vong C M, et al. Rate-dependent hysteresis modeling and control of a piezostage using online support vector machine and relevance vector machine [J]. IEEE Transactions on Industrial Electronics, 2012, 59(4): 1988.
Prediction of Effluent Quality in Wastewater Treatment Systems Using Relevance Vector Machine
LIU HongbinSONG Liu1
(1. Jiangsu Co-Innovation Center of Efficient Processing and Utilization of Forest Resources, Nanjing Forestry University,
Nanjing, Jiangsu Province, 210037; 2. State Key Laboratory of Pulp and Paper Engineering,
South China University of Technology, Guangzhou, Guangdong Province, 510640)
(*E-mail: hongbinliu@njfu.edu.cn)
Abstract:Predicting effluent quality precisely is important for papermaking wastewater treatment processes. In this paper, a soft sensor model based on relevance vector machine (RVM) was proposed to predict the effluent quality in a papermaking wastewater treatment plant. The proposed method included two steps. In the first step, partial least squares (PLS) method was used to extract the latent variables of the papermaking process data, which could solve the problems of collinearity and high dimensionality in the process variables. A RVM model using the extracted latent variables was developed in the second step. The results showed that the prediction performance of the PLS-RVM was better than that of the RVM for the prediction of the effluent quality in a papermaking wastewater treatment plant. With regard to the prediction of effluent suspension solids (SS), the root mean square error (RMSE) was decreased by 7.76% and the determination coefficient (R2) was increased by 12.32%; however, the prediction results were not improved significantly for the prediction of effluent chemical oxygen demand (COD). In addition, the prediction performance of the PLS-RVM was better than that of the PLS-LSSVM model for both the effluent SS and the effluent COD. In terms of the prediction of the effluent SS, the RMSE was decreased by 9.16% and the R2 was increased by 15.29%. In terms of the prediction of the effluent COD, the RMSE was decreased by 9.29% and the R2 was increased by 18.34%.
Keywords:relevance vector machine; dimensionality reduction; support vector machine; papermaking wastewater treatment process; soft sensor