湯佳 李春青
1 引言(Introduction)
水污染的預(yù)防和治理已成為當(dāng)今世界日益嚴(yán)重的熱點(diǎn)問題。膜生物反應(yīng)器(MBR)作為一種將膜分離技術(shù)和生物反應(yīng)技術(shù)相結(jié)合的新型高效污水處理技術(shù),已被廣泛應(yīng)用于生活污水、有機(jī)廢水處理等領(lǐng)域[1,2]。膜污染會(huì)影響MBR膜分離單元的性能,縮短膜的使用壽命,增加MBR系統(tǒng)的運(yùn)行成本。因此研究膜污染的機(jī)理和預(yù)測控制方法,保證膜生物反應(yīng)器能夠在穩(wěn)定的低耗能條件下獲得較大膜通量是促進(jìn)MBR推廣應(yīng)用的關(guān)鍵[3,4]。
目前在MBR膜污染領(lǐng)域,常用的多種預(yù)測模型都存在一些缺陷,如對膜污染機(jī)理分析不夠透徹,預(yù)測精度差等問題。人工神經(jīng)網(wǎng)絡(luò)在預(yù)測領(lǐng)域有比較成熟的應(yīng)用,而相比較傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),RBF網(wǎng)絡(luò)具有唯一最佳逼近的特性且無局部極小值的問題,可以做更精準(zhǔn)高效的預(yù)測分析[5-7]。再引入遺傳算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù),彌補(bǔ)單一徑向基網(wǎng)絡(luò)模型的缺陷,就可以實(shí)現(xiàn)對膜污染更精準(zhǔn)的預(yù)測。
2 RBF神經(jīng)網(wǎng)絡(luò)(RBF neural network)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,即ANN),是由人工建立的,以有向圖為拓?fù)浣Y(jié)構(gòu)的動(dòng)態(tài)系統(tǒng),它從信息處理角度對人腦神經(jīng)單元網(wǎng)絡(luò)進(jìn)行抽象化,建立簡單模型,按不同的連接方式組成不同網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)以其特有的非線性適應(yīng)性信息處理能力,使之在模式識(shí)別、自動(dòng)控制、人工智能、預(yù)測估計(jì)等方面都有成功的應(yīng)用,表現(xiàn)出了良好的智能特性。
徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)是一種高效的前饋式神經(jīng)網(wǎng)絡(luò),它由輸入層、隱含層和輸出層構(gòu)成,具有其他前向網(wǎng)絡(luò)所不具有的最佳逼近性能,并且結(jié)構(gòu)簡單,訓(xùn)練速度快。該神經(jīng)網(wǎng)絡(luò)采用RBF作為隱單元的“基”構(gòu)成隱含層空間,將輸入矢量直接映射到隱空間而不需要權(quán)值連接。當(dāng)RBF的中心點(diǎn)確定后,映射關(guān)系也就隨之確定。隱含層空間到輸出空間的映射是線性的。
徑向基神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
RBF網(wǎng)絡(luò)的激活函數(shù)采用徑向基函數(shù),以輸入和權(quán)值向量之間的距離作為自變量,常見的隱含層節(jié)點(diǎn)的核函數(shù)為高斯函數(shù)。
(1)
其中,σ稱為基函數(shù)的擴(kuò)展常數(shù)或?qū)挾龋以叫?,徑向基函?shù)的寬度越小,基函數(shù)就越有選擇性。
3 遺傳算法(Genetic algorithm)
遺傳算法(Genetic Algorithms,簡稱GA或GAs)是由密歇根大學(xué)Joho H.Holland教授及其學(xué)生于20世紀(jì)60年代末到70年代初提出的一種經(jīng)典的智能算法。遺傳算法是一種基于群體尋優(yōu)的方法,具有全局搜索能力,初值無關(guān)性以及較快的收斂速度。具體過程如下:
Step1:采用隨機(jī)的方法或者其他方法產(chǎn)生一個(gè)初始種群。
Step2:根據(jù)問題的目標(biāo)函數(shù)構(gòu)造適值函數(shù)(Fitness Function)適值函數(shù)用來表征種群中每個(gè)個(gè)體對其生存環(huán)境的適應(yīng)能力。
Step3:根據(jù)適應(yīng)值的好壞,不斷選擇和繁殖,基因通過交叉和變異得到更新。
Step4:若干代后得到適應(yīng)值最好的個(gè)體即為最優(yōu)解。
4 遺傳算法優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)(Optimization of
RBF neural network based on genetic algorithm)
RBF神經(jīng)網(wǎng)絡(luò)具有最佳逼近性和全局最優(yōu)性,可以實(shí)現(xiàn)對MBR膜通量較為精確的預(yù)測。但是為了更好地選取相關(guān)參數(shù),引入遺傳算法對RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行合理優(yōu)化,其中包含四個(gè)參數(shù),分別是誤差、訓(xùn)練速度、最大神經(jīng)元數(shù)目以及神經(jīng)元的間隔,經(jīng)過遺傳算法尋優(yōu)后得到的最優(yōu)個(gè)體即為進(jìn)行RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練涉及的最優(yōu)參數(shù)。GA-RBF神經(jīng)網(wǎng)絡(luò)模型完成網(wǎng)絡(luò)訓(xùn)練后,再采用仿真數(shù)據(jù)檢測評(píng)估該網(wǎng)絡(luò)的優(yōu)化性能。
5 建立基于PCA的GA-RBF膜污染仿真預(yù)測模型
(A simulation model of GA-RBF membrane
pollution based on PCA is established.)
5.1 采用PCA進(jìn)行模型輸入?yún)?shù)選取
主成分分析(Principal Component Analysis,PCA)是一種掌握事物主要矛盾的統(tǒng)計(jì)分析方法,它通過矩陣特征值分析對初始數(shù)據(jù)進(jìn)行線性空間投影,從多元事物中解析出主要影響因素,從而達(dá)到簡化復(fù)雜的問題的目的。
膜污染的影響因素眾多,通過減少RBF網(wǎng)絡(luò)的輸入數(shù)來簡化RBF網(wǎng)絡(luò)結(jié)構(gòu),從整體上提高RBF網(wǎng)絡(luò)的性能。初選的六個(gè)膜污染影響因子為X={總阻力,MLSS,操作壓力,COD,PH,溫度}。
主成分分析法步驟為:
Step1:把初選的六個(gè)膜污染影響因子組成矩陣X。
Step2:對X數(shù)據(jù)標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化矩陣A。標(biāo)準(zhǔn)化后的數(shù)據(jù)陣每個(gè)列向量的均值為0,標(biāo)準(zhǔn)差為1,數(shù)據(jù)無量綱。
Step3:計(jì)算出協(xié)方差矩陣S。
Step4:計(jì)算協(xié)方差矩陣S的特征值λ與相應(yīng)的特征向量u,然后將特征值由大到小排列得到特征值矩陣V和特征向量矩陣U。
Step5:對特征值矩陣V分析,計(jì)算出貢獻(xiàn)率,確定主成分。通常選取貢獻(xiàn)率為85%—95%的m個(gè)主成分進(jìn)行綜合分析。
通過計(jì)算選取出主成分貢獻(xiàn)率在90%以上的三個(gè)污染因子即:MLSS、操作壓力及溫度,并以此作為RBF神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元。膜通量大小是表征膜污染程度的唯一指標(biāo),因此以膜通量作為RBF神經(jīng)網(wǎng)絡(luò)的唯一的輸出層神經(jīng)元。
5.2 建立基于GA-RBF的膜污染仿真預(yù)測模型
實(shí)驗(yàn)建立的GA-RBF膜污染預(yù)測模型如圖2所示。
實(shí)驗(yàn)步驟如下:
Step1:對RBF神經(jīng)網(wǎng)絡(luò)的四個(gè)參數(shù)編碼,為方便操作設(shè)定誤差、訓(xùn)練速度為實(shí)數(shù)編碼,最大神經(jīng)元數(shù)目、神經(jīng)元間隔為整數(shù)編碼,所有編碼得到的基因位串稱為一個(gè)個(gè)體。
Step2:隨機(jī)產(chǎn)生20個(gè)個(gè)體作為初始種群,構(gòu)建初始的交配池。
Step3:執(zhí)行RBF網(wǎng)絡(luò)訓(xùn)練,得到誤差百分比作為每個(gè)個(gè)體的適應(yīng)度。個(gè)體間基因進(jìn)行交叉和變異,保證基因多樣性。
Step4:采用輪盤賭選擇方式,篩選出適應(yīng)度高的個(gè)體,淘汰掉適應(yīng)度低的個(gè)體。
Step5:重復(fù)進(jìn)行(3)直到結(jié)束循環(huán),得到的個(gè)體為最佳個(gè)體。
Step6:訓(xùn)練完畢,最佳個(gè)體即為RBF網(wǎng)路最優(yōu)的參數(shù)值,進(jìn)行仿真測試,將實(shí)驗(yàn)數(shù)據(jù)與樣本數(shù)據(jù)對比分析。
6 預(yù)測結(jié)果與實(shí)驗(yàn)結(jié)果對比分析(Comparison of
the predicted results with the experimental
results)
實(shí)驗(yàn)數(shù)據(jù)全部來自于石家莊市某MBR污水處理廠的實(shí)驗(yàn)以及工業(yè)生產(chǎn)的歷史數(shù)據(jù),統(tǒng)一采用的是孔徑為0.2um的聚偏氟乙烯微濾膜處理污水方法。從實(shí)驗(yàn)數(shù)據(jù)中選取6組作為校驗(yàn)用樣本,其余24組作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本。
遺傳算法操作的初始參數(shù)為:選擇種群規(guī)模:sizepop=20;最大進(jìn)化代數(shù):maxgen=10;交叉率:pcross=0.8;變異率:pmutation=0.5.RBF訓(xùn)練誤差范圍是1e-4-1e-3;最大神經(jīng)元數(shù)目范圍值是80—150;顯示神經(jīng)元間隔范圍值是10—30;速度范圍值是10—25。
試驗(yàn)中得到遺傳算法代數(shù)與誤差曲線如圖3所示。
圖3顯示了網(wǎng)絡(luò)訓(xùn)練的誤差隨著遺傳代數(shù)增加表現(xiàn)出來的變化趨勢,隨著進(jìn)化代數(shù)增多誤差降低,進(jìn)化至第8代誤差僅為0.02871,到第8代以后圖像趨于緩和,基本已達(dá)到優(yōu)化極限,實(shí)驗(yàn)收斂速度很快,優(yōu)化效果明顯。
為更好地體現(xiàn)優(yōu)化效果,實(shí)驗(yàn)使用相同的樣本數(shù)據(jù)進(jìn)行測試,設(shè)置遺傳算法進(jìn)化到10代,分別對RBF網(wǎng)絡(luò)和GA-RBF網(wǎng)絡(luò)進(jìn)行訓(xùn)練。首先得到基于RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果,如圖4所示,RBF網(wǎng)絡(luò)的訓(xùn)練結(jié)果平均誤差值為0.1130,已經(jīng)能夠完成初步的膜通量預(yù)測。然后再進(jìn)行GA-RBF網(wǎng)絡(luò)訓(xùn)練,預(yù)測結(jié)果對比如圖5所示,經(jīng)過GA優(yōu)化參數(shù)之后的預(yù)測模型平均誤差值僅為0.0275.準(zhǔn)確度有非常明顯的提高。實(shí)驗(yàn)結(jié)果表明,經(jīng)過遺傳優(yōu)化過的RBF神經(jīng)網(wǎng)絡(luò)誤差明顯減小,得到的訓(xùn)練結(jié)果明顯優(yōu)于優(yōu)化前的結(jié)果,預(yù)測精度較為理想。預(yù)測誤差數(shù)據(jù)分析見表1。
7 結(jié)論(Conclusion)
由于膜污染過程具有非線性、參數(shù)時(shí)變性、隨機(jī)干擾等復(fù)雜的機(jī)理,造成預(yù)測研究過程十分困難,本文在用主成分分析法簡化輸入?yún)?shù)的基礎(chǔ)上,建立了RBF神經(jīng)網(wǎng)絡(luò)仿真模型,實(shí)驗(yàn)取得了良好的預(yù)測效果,誤差符合實(shí)驗(yàn)標(biāo)準(zhǔn)。由于預(yù)測精度是否準(zhǔn)確很大程度上取決于網(wǎng)絡(luò)模型參數(shù)的選取,因此引入遺傳算法,優(yōu)化RBF網(wǎng)絡(luò)相關(guān)參數(shù),建立基于遺傳算法優(yōu)化的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測模型并成功應(yīng)用于MBR膜污染仿真預(yù)測中,研究結(jié)果表明,遺傳算法優(yōu)化后的RBF神經(jīng)網(wǎng)絡(luò)不僅提高了預(yù)測速度,還明顯提高了預(yù)測精確度,從而能更好地實(shí)驗(yàn)對膜通量的檢測和控制。整個(gè)實(shí)驗(yàn)過程具有一定的理論價(jià)值和實(shí)踐意義,對MBR實(shí)際工程應(yīng)該可以起到積極的指導(dǎo)作用。
參考文獻(xiàn)(References)
[1] Yu Zhang,et al.Risk Assessment of Giardia from a Full Scale MBR Sewage Treatment Plant Caused by Membrane Integrity Failure[J].Journal of Environmental Sciences,2015(04):252-258.
[2] Kun Li,et al.Advanced Treatment of Municipal Wastewater
by Nanofiltration:Operational Optimization and Membrane Fouling Analysis[J].Journal of Environmental Sciences,2016(05):106-117.
[3] Hui Gong,et al.Membrane Fouling Controlled by Coagulation/Adsorption during Direct Sewage Membrane Filtration(DSMF)for Organic Matter Concentration[J].Journal of Environmental Sciences,2015(06):1-7.
[4] 韓永萍,等.MBR膜污染的形成及其影響因素研究進(jìn)展[J].膜科學(xué)與技術(shù),2013(01):102-110.
[5] 劉海萍.神經(jīng)網(wǎng)絡(luò)在CPI預(yù)測中的應(yīng)用[A].中國管理現(xiàn)代化研究會(huì).第五屆(2010)中國管理學(xué)年會(huì)——市場營銷分會(huì)場論文集[C].中國管理現(xiàn)代化研究會(huì),2010:7.
[6] Guo ShengPeng,et al.Task Space Control of Free-floating Space Robots Using Constrained Adaptive RBF-NTSM[J].Science China(Technological Sciences),2014(04):828-837.
[7] 王芹芹,雷曉云,高凡.基于主成分分析和RBF神經(jīng)網(wǎng)絡(luò)的融雪期積雪深度模擬[J].干旱區(qū)資源與環(huán)境,2014(02):175-179.
作者簡介:
湯 佳(1991-),女,碩士生.研究領(lǐng)域:MBR計(jì)算機(jī)模擬仿
真,大數(shù)據(jù)與云計(jì)算.
李春青(1962-),男,博士,教授.研究領(lǐng)域:MBR計(jì)算機(jī)模
擬仿真,大數(shù)據(jù)與云計(jì)算.