宋春寧 王保錄 周曉華,2
(廣西大學(xué)電氣工程學(xué)院1,廣西 南寧 530004;廣西工學(xué)院電子信息與控制工程系2,廣西 柳州 545006)
澄清工段是糖廠制糖過(guò)程中一個(gè)十分重要的生產(chǎn)工藝環(huán)節(jié)。澄清工藝中,將中和pH值和清汁pH值控制在要求的范圍內(nèi)是實(shí)現(xiàn)澄清技術(shù)優(yōu)化的主要指標(biāo)。該指標(biāo)對(duì)于獲得高質(zhì)量的清汁和提高糖回收率有著重要作用。而澄清工段是一個(gè)復(fù)雜的非線性系統(tǒng),具有非線性、多約束、時(shí)變大時(shí)滯、多輸入等特點(diǎn),這些特點(diǎn)對(duì)pH值的控制和澄清過(guò)程都有非常大的影響[1-3]。在分析糖廠澄清工段工藝流程和各種pH值影響因素的基礎(chǔ)上,提出了一種利用模糊神經(jīng)網(wǎng)絡(luò)模型的自適應(yīng)動(dòng)態(tài)規(guī)劃方法,從而解決了糖廠澄清工段中和pH值難以實(shí)現(xiàn)穩(wěn)定控制的問(wèn)題。
目前,我國(guó)大多數(shù)糖廠的澄清工段采用的是亞硫酸法生產(chǎn)工藝。在這個(gè)工藝過(guò)程中,蔗汁的pH值是一個(gè)很重要的指標(biāo),它將直接影響白糖的產(chǎn)量和質(zhì)量[1]。經(jīng)過(guò)壓榨工段得到的混合汁含有大量的雜質(zhì),如多糖、蛋白質(zhì)、各種氨基酸與有機(jī)酸,此外還含有很多的蔗屑和泥沙,成分非常復(fù)雜。澄清工段就是盡量分離去除非糖成分,得到純凈的蔗汁,并取得較好的糖分收回率。
亞硫酸法澄清過(guò)程是一個(gè)復(fù)雜的物理化學(xué)過(guò)程,可分為預(yù)灰、加熱、中和反應(yīng)、沉降過(guò)濾四個(gè)階段[2]。其過(guò)程流程如圖1所示。
圖1 蔗汁澄清過(guò)程流程圖Fig.1 Flow process of clarification wrokshop section in sugar refinery
影響中和pH值控制的因素主要有以下幾個(gè)。
①蔗汁流量不穩(wěn)定將直接影響后續(xù)的操作控制,如加石灰乳、SO2和H3PO4等操作。
②預(yù)灰pH值偏高或偏低,將對(duì)硫熏中和控制造成困難。
③石灰乳、SO2流量的影響。加入石灰量和SO2量過(guò)少或過(guò)多,則會(huì)使中和反應(yīng)不完全,使清汁中殘留的鈣鹽增加,導(dǎo)致輕質(zhì)純度下降。加入石灰量過(guò)多或硫熏不足,會(huì)導(dǎo)致蔗汁中還原糖的分解,清汁色值升高、純度降低。
上述是幾個(gè)客觀存在的影響因素,控制好這幾個(gè)因素是穩(wěn)定中和pH值的關(guān)鍵。
建立糖廠澄清工段模型主要有兩方面作用:①作為啟發(fā)式動(dòng)態(tài)規(guī)劃(heuristic dynamic programming,HDP)控制器的被控對(duì)象;②作為HDP控制器的模型網(wǎng)絡(luò)部分。在工業(yè)運(yùn)行數(shù)據(jù)中,包含反應(yīng)輸入條件及操作參數(shù)與工藝指標(biāo)之間關(guān)系的信息。在處理和解決問(wèn)題時(shí),模糊神經(jīng)網(wǎng)絡(luò)不需要給出對(duì)象的精確數(shù)學(xué)模型,它通過(guò)改變網(wǎng)絡(luò)結(jié)構(gòu),逐步適應(yīng)外界各種影響因素的作用,在高度非線性和不確定性的系統(tǒng)建模方面具有很大的潛力[5-7]。
根據(jù)糖廠澄清工段工藝機(jī)理分析,影響中和pH值這一工藝指標(biāo)的因素主要包括甘蔗榨量、蔗汁流量、預(yù)灰pH值、一次加熱溫度、硫熏強(qiáng)度、加灰量和二次加熱溫度等參數(shù)。因此,本文設(shè)計(jì)的模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of fuzzy neural network
模糊神經(jīng)網(wǎng)絡(luò)模型對(duì)于非線性問(wèn)題具有較強(qiáng)的擬合能力,但對(duì)于大時(shí)滯、參數(shù)分布和時(shí)變性等存在復(fù)雜的工業(yè)過(guò)程,特別是訓(xùn)練的樣本數(shù)據(jù)不足時(shí),僅依賴于模糊神經(jīng)網(wǎng)絡(luò)模型很難達(dá)到模型精度的要求。在正常的生產(chǎn)條件下,基于大量的工業(yè)運(yùn)行數(shù)據(jù)建立的模糊神經(jīng)網(wǎng)絡(luò)能夠很好地描述這一生產(chǎn)過(guò)程。而工況的判斷需要通過(guò)歷史數(shù)據(jù)獲得,令樣本數(shù)為M,某輸入變量xi的取值區(qū)間為Q,將Q分為m個(gè)子區(qū)間{Q1,Q2,…,Qm},由于大多數(shù)樣本是在生產(chǎn)正常的情況下獲得的,故可認(rèn)為某個(gè)子區(qū)間的樣本越多,其工況越正常。因此,根據(jù)各子區(qū)間所包含的樣本數(shù)占總樣本數(shù)的比例,糖廠澄清工段的工況歸納為以下三類。
其中,εmin和εmax是根據(jù)經(jīng)驗(yàn)確立的樣本比例參數(shù),在實(shí)際的工業(yè)生產(chǎn)中,正常的區(qū)間只有一個(gè)。輸入量的模糊隸屬度函數(shù)如圖3所示。其中 a2min、a1min、a1max和 a2max可通過(guò)歷史數(shù)據(jù)統(tǒng)計(jì)獲得,在 [a1min,a1max]內(nèi),工況正常;在(a2min,a1min)及(a1max,a2max)內(nèi),工況比較正常;其余范圍都屬于異常。由此可定義輸入變量xi的模糊論域?yàn)镋x,Ex表示適用模糊神經(jīng)網(wǎng)絡(luò)模型處理的范圍。Ex的隸屬函數(shù)形式為:
圖3 輸入量的模糊隸屬度函數(shù)Fig.3 Fuzzy membership functions of input
采用加權(quán)法計(jì)算模型的權(quán)重為:
式中:μi分別為模糊神經(jīng)網(wǎng)絡(luò)中r個(gè)輸入變量的隸屬度;βi為隸屬度權(quán)系數(shù),滿足0< βi<1且 β1+β2+…+βr=1,βi表示輸入變量對(duì)模型預(yù)測(cè)結(jié)果的影響程度,可通過(guò)對(duì)歷史數(shù)據(jù)的統(tǒng)計(jì)結(jié)果得到。
建立的糖廠澄清工段模型只有具有足夠的樣本數(shù)據(jù),才能反映出系統(tǒng)的內(nèi)在特性。根據(jù)采集的廣西某糖廠澄清工段1 000組實(shí)時(shí)數(shù)據(jù)的輸入輸出關(guān)系,可以采用神經(jīng)網(wǎng)絡(luò)建立其模型。部分實(shí)時(shí)數(shù)據(jù)如表1所示。
式中,X1,第一主成分變量;X2,第二主成分變量。將標(biāo)準(zhǔn)化后的反應(yīng)速率常數(shù)k2與X1和X2之間建立多元線性回歸模型,得到的回歸模型如式(5)所示:
表1 某糖廠澄清工段部分實(shí)時(shí)數(shù)據(jù)Tab.1 Partial real-time data of the clarifying workshop section in certain sugar refinery
將網(wǎng)絡(luò)的結(jié)構(gòu)、樣本數(shù)據(jù)作預(yù)處理和歸一化后,在Matlab7.0環(huán)境下,采用 Levenberg-Marquardt算法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到糖廠澄清工段模糊神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練曲線如圖4所示。
圖4 訓(xùn)練曲線Fig.4 Training curves
自適應(yīng)動(dòng)態(tài)規(guī)劃(adaptive dynamic programming,ADP)是指所有在擾動(dòng)或不確定條件下隨時(shí)間變化的最優(yōu)化神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),目的是近似貝爾曼動(dòng)態(tài)規(guī)劃方程中的代價(jià)函數(shù)(cost-to-go),從而避免“維數(shù)災(zāi)”問(wèn)題[8-9]。其基本思想是通過(guò)估計(jì)代價(jià)函數(shù)(cost-to-go)(或/和代價(jià)對(duì)狀態(tài)的微分函數(shù))來(lái)避免每個(gè)階段內(nèi)針對(duì)所有狀態(tài)和控制變量進(jìn)行精確計(jì)算,并通過(guò)與實(shí)際或仿真系統(tǒng)的相互作用來(lái)減少對(duì)模型的依賴性,提高上述估計(jì)的精度,從而更好地指導(dǎo)最優(yōu)(次優(yōu))策略的求取。自適應(yīng)動(dòng)態(tài)規(guī)劃典型結(jié)構(gòu)包含評(píng)價(jià)網(wǎng)絡(luò)、模型網(wǎng)絡(luò)和執(zhí)行網(wǎng)絡(luò)三部分[10]。根據(jù)評(píng)價(jià)網(wǎng)絡(luò)輸出的函數(shù)不同,現(xiàn)有的自適應(yīng)動(dòng)態(tài)規(guī)劃方法主要有三種類型:啟發(fā)式動(dòng)態(tài)規(guī)劃HDP、雙啟發(fā)式動(dòng)態(tài)規(guī)劃DHP和全局雙啟發(fā)式動(dòng)態(tài)規(guī)劃(global dual heuristic dynamic programming,GDHP)[11-12]。本文將使用 HDP 方法來(lái)控制糖廠澄清工段中和pH值。
HDP控制器結(jié)構(gòu)如圖5所示,它由評(píng)價(jià)網(wǎng)絡(luò)、模型網(wǎng)絡(luò)和執(zhí)行網(wǎng)絡(luò)三個(gè)基本模塊組成,每個(gè)網(wǎng)絡(luò)模塊都包含有前饋單元和反饋單元[10-13]。
圖5 HDP控制器結(jié)構(gòu)圖Fig.5 Structure of the HDP controller
圖5中,實(shí)線表示信號(hào)流向,虛線表示調(diào)整評(píng)價(jià)網(wǎng)絡(luò)和執(zhí)行網(wǎng)絡(luò)參數(shù)的反向傳播路徑。執(zhí)行網(wǎng)絡(luò)接收系統(tǒng)的狀態(tài)參數(shù)x(t),產(chǎn)生當(dāng)前狀態(tài)下的控制信號(hào)u(t),u(t)與系統(tǒng)當(dāng)前狀態(tài)參數(shù)x(t)一起送入模型網(wǎng)絡(luò);由模型網(wǎng)絡(luò)預(yù)測(cè)新的狀態(tài)x(t+1),x(t+1)信號(hào)作為評(píng)價(jià)網(wǎng)絡(luò)的唯一輸入信號(hào);最后評(píng)價(jià)網(wǎng)絡(luò)輸出J函數(shù)的近似值。受控對(duì)象為糖廠澄清工段模糊神經(jīng)網(wǎng)絡(luò)模型,它既作為控制器的被控對(duì)象(或受控系統(tǒng))受到執(zhí)行網(wǎng)絡(luò)輸出的控制信號(hào)u(t)的控制,也作為模型網(wǎng)絡(luò)預(yù)測(cè)新的狀態(tài)參數(shù)x(t+1)。此外,圖5中的U(t)為效用函數(shù),γ為折扣因子,Z-1為延遲環(huán)節(jié)。
評(píng)價(jià)網(wǎng)絡(luò)的輸入僅為模型網(wǎng)絡(luò)預(yù)測(cè)輸出的受控系統(tǒng)的狀態(tài)參數(shù)x(t+1)。由于系統(tǒng)的狀態(tài)參數(shù)只有中和pH值這一個(gè)量,所以評(píng)價(jià)網(wǎng)絡(luò)的輸入也只有一個(gè)量。令評(píng)價(jià)網(wǎng)絡(luò)的輸出為代價(jià)函數(shù)J,HDP的中心思想是訓(xùn)練評(píng)價(jià)網(wǎng)絡(luò),以近似貝爾曼最優(yōu)化方程中的代價(jià)函數(shù)J:
式中:γ為折扣因子,取值范圍是[0,1],在此取0.95;U(t)為效用函數(shù),用于給控制對(duì)象發(fā)出控制信號(hào)。在工業(yè)生產(chǎn)中,U(t)的選取決定了動(dòng)態(tài)優(yōu)化控制的優(yōu)劣。因此,為設(shè)計(jì)滿足系統(tǒng)要求的優(yōu)化控制器,U(t)必須能夠反映控制系統(tǒng)中各種各樣的問(wèn)題??紤]到不同的控制問(wèn)題效用函數(shù)的形式也是不同的,本文的控制對(duì)象是糖廠澄清工段中和pH值,目標(biāo)是將中和pH值穩(wěn)定在7.0~7.4,因此選擇的效用函數(shù)如下:
式中:X(t)為中和pH值;U(t)為效用函數(shù)。
采用評(píng)價(jià)網(wǎng)絡(luò)輸出代價(jià)函數(shù)J,使下面的誤差函數(shù)達(dá)到最小:
評(píng)價(jià)網(wǎng)絡(luò)的最小化目標(biāo)函數(shù)為:
采用式(6)所示的最小化目標(biāo)函數(shù)作為訓(xùn)練目標(biāo),可以訓(xùn)練一個(gè)評(píng)價(jià)網(wǎng)絡(luò)。采用梯度下降法,其權(quán)值的更新規(guī)則滿足以下公式:
式中:lc為評(píng)價(jià)網(wǎng)絡(luò)學(xué)習(xí)率,它是一個(gè)大于0小于1的數(shù);γ為折扣因子;wc為評(píng)價(jià)網(wǎng)絡(luò)的權(quán)值。
執(zhí)行網(wǎng)絡(luò)是HDP控制器的執(zhí)行者,其獲得系統(tǒng)的狀態(tài)參數(shù)后,執(zhí)行網(wǎng)絡(luò)輸出的控制信號(hào)不僅要改變系統(tǒng)的狀態(tài),還要與當(dāng)前系統(tǒng)的狀態(tài)參數(shù)一起送入評(píng)價(jià)網(wǎng)絡(luò),由評(píng)價(jià)網(wǎng)絡(luò)對(duì)其控制作用作出相應(yīng)的評(píng)價(jià)。
執(zhí)行網(wǎng)絡(luò)的訓(xùn)練最終是要確定權(quán)值矩陣Wa1和Wa2的值。與評(píng)價(jià)網(wǎng)絡(luò)訓(xùn)練不同,執(zhí)行網(wǎng)絡(luò)的訓(xùn)練目標(biāo)是最小化評(píng)價(jià)網(wǎng)絡(luò)輸出的代價(jià)函數(shù)J。通過(guò)評(píng)價(jià)網(wǎng)絡(luò)的輸出誤差,并經(jīng)過(guò)評(píng)價(jià)網(wǎng)絡(luò)反向傳播到執(zhí)行網(wǎng)絡(luò)來(lái)更新執(zhí)行網(wǎng)絡(luò)的權(quán)值,其算法如下:
式中:la為執(zhí)行網(wǎng)絡(luò)的學(xué)習(xí)率;wa為執(zhí)行網(wǎng)絡(luò)的權(quán)值。
模型網(wǎng)絡(luò)直接采用糖廠澄清工段的模糊神經(jīng)網(wǎng)絡(luò)模型,因此,其模型是確定的,不需再作訓(xùn)練。
利用澄清工段pH值模擬試驗(yàn)裝置分析試驗(yàn)結(jié)果,樣汁在反應(yīng)罐中與中和液中和,經(jīng)pH值檢測(cè)槽流到存儲(chǔ)罐進(jìn)行加熱。玻璃電極置于檢測(cè)槽內(nèi),測(cè)量中和后的混合汁pH值。本試驗(yàn)采用的樣汁pH值為6.5,堿液的pH值取12.27。pH值中和過(guò)程控制的目標(biāo)是使中和pH值為7.2,得到的中和pH值控制曲線結(jié)果如圖6所示。
圖6 中和pH值控制曲線Fig.6 Control curve of the neutralization pH value
從圖6可以看出,混合汁pH值從6.5上升到7.2的過(guò)程中,pH值的上升速度很快,且超調(diào)量較小。在18:03時(shí),向反應(yīng)罐中加大堿液的流量會(huì)造成劇烈的干擾。當(dāng)遇到劇烈干擾時(shí),系統(tǒng)的反應(yīng)速度非???,能夠使pH值迅速回到目標(biāo)值。
在系統(tǒng)地分析糖廠澄清工段工藝流程的基礎(chǔ)上,基于模糊神經(jīng)網(wǎng)絡(luò)模型和HDP控制器,構(gòu)建了模糊神經(jīng)網(wǎng)絡(luò)模型。試驗(yàn)表明,系統(tǒng)取得了較好的控制效果。
[1]陳維鈞,許斯欣.甘蔗制糖原理與技術(shù)第二分冊(cè)-蔗汁清凈[M].北京:中國(guó)輕工業(yè)出版社,2001.
[2]Blackwell J.Recent developments in the sugar industry[J].International Sugar Journal,2001(102):43-60.
[3]Beck K,Peters L,Papur P,et al.Application of soft-computing techniques in optimization and control of complex processes in sugar industry[J].International Sugar Journal,2002,1245(104):390-400.
[4]霍漢鎮(zhèn).低溫磷浮法——21世紀(jì)的制糖新工藝[J].廣西輕工業(yè),2001(1):21-26.
[5]周開(kāi)利,康耀紅.神經(jīng)網(wǎng)絡(luò)模型及其MATLAB仿真程序設(shè)計(jì)[M].北京:清華大學(xué)出版社,2005.
[6]李國(guó)勇,智能控制及其MATLAB實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005.
[7]張德豐.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2009.
[8]黃偉,魏鏡搜,王庭有,等.模糊智能控制在磨礦分級(jí)系統(tǒng)中的應(yīng)用研究[J].昆明理工大學(xué)學(xué)報(bào):理工版,2009,34(4):96-100.
[9]于軍琪,吳濤,黃永宣,等.磨礦分級(jí)系統(tǒng)溢流濃度的模糊智能控制[J].西安交通大學(xué)學(xué)報(bào):自然科學(xué)版,1999,33(9):1-9.
[10]Werbos P J.Stable adaptive control using new critic designs[EB/OL].[2011 - 09 - 18].http://arxiv.org/abs/adaporg/9810001v1.
[11]Prokhorov D V,Wunsch D C.Adaptive critic designs[J].IEEE Transactions on Neural Networks,1997,8(5):997-1007.
[12]Paul J.Tutorial on neural control,control theory and related techniques:from back propagation to brain-like intelligent systems[C]∥12th ICMCM & SC,1999.
[13]Liu W X,Venayagamoorthy G K,Wunsch D C.A heuristic-dynamicprogramming-based power system stabilizer for a turbogenerator in a single-machine power system[J].IEEE Transactions on Industry Applications,2005,41(5):1377-1385.