邵珠林, 曹萃文
(華東理工大學(xué) 能源化工過(guò)程智能制造教育部重點(diǎn)實(shí)驗(yàn)室,上海 200237)
隨著時(shí)代的進(jìn)步,各國(guó)越來(lái)越重視經(jīng)濟(jì)發(fā)展與環(huán)境保護(hù)之間的平衡。汽車尾氣的排放是環(huán)境污染的一大關(guān)鍵因素,汽車尾氣中含有的硫氧化物和氮氧化物等有害成分進(jìn)一步加劇了大氣污染[1],這對(duì)汽油生產(chǎn)工藝提出了更高的要求,汽油吸附脫硫(S Zorb)技術(shù)能夠有效脫除汽油中的硫化物,可使成品油的硫質(zhì)量分?jǐn)?shù)控制在10 μg/g以內(nèi)。因此,對(duì)S Zorb裝置進(jìn)行全流程機(jī)理建模和多個(gè)產(chǎn)品指標(biāo)操作優(yōu)化,對(duì)指導(dǎo)工業(yè)生產(chǎn)和環(huán)境保護(hù)具有重要的意義。
S Zorb技術(shù)作為一種成熟的脫硫工藝,具有氫耗少、脫硫深度高和辛烷值損失低的優(yōu)點(diǎn),已在中國(guó)多個(gè)煉油廠使用。一方面,S Zorb裝置的研究集中于故障的診斷分析:朱云霞等[2]提出了FCC汽油直進(jìn)裝置、再生風(fēng)線改造和增加閉鎖料斗的輔助硫化等措施,解決了中國(guó)石化燕山石化分公司S Zorb裝置運(yùn)行初期出現(xiàn)的換熱器積垢和吸附劑結(jié)塊問(wèn)題。另一方面集中在吸附脫硫反應(yīng)的機(jī)理研究:Bezverkhyy等[3]采用熱重分析法對(duì)噻吩與Ni/ZnO的吸附脫硫反應(yīng)進(jìn)行了反應(yīng)動(dòng)力學(xué)的描述;鄒亢等[4]研究了吸附劑對(duì)汽油辛烷值及脫硫能力的影響,并通過(guò)分子表征技術(shù)對(duì)吸附劑的物理性質(zhì)和化學(xué)性質(zhì)進(jìn)行了考察。
化工過(guò)程建模方法主要分為機(jī)理建模和數(shù)據(jù)驅(qū)動(dòng)建模。S Zorb裝置機(jī)理建模的研究得到了廣泛的開展。孟銳[5]針對(duì)鎮(zhèn)海煉化S Zorb裝置中低溫?zé)岬睦脝?wèn)題,提出了新的換熱網(wǎng)絡(luò),并利用Petro-Sim流程模擬軟件進(jìn)行測(cè)算,驗(yàn)證了該換熱網(wǎng)絡(luò)的有效性。蔣偉等[6]將構(gòu)建了汽油辛烷值辛烷值損失預(yù)測(cè)模型,有效地預(yù)測(cè)了脫硫率和辛烷值等關(guān)鍵指標(biāo)。李海明[7]建立了S Zorb裝置中反應(yīng)器和穩(wěn)定塔的動(dòng)力學(xué)模型、物料衡算模型和能量衡算模型,預(yù)測(cè)誤差達(dá)到了5%。機(jī)器學(xué)習(xí)和人工智能技術(shù)的不斷發(fā)展為化工過(guò)程建模提供了新的方法[8]。神經(jīng)網(wǎng)絡(luò)模型基于輸入輸出數(shù)據(jù)能夠?qū)Ψ蔷€性過(guò)程進(jìn)行表征,同時(shí)基于BP算法的網(wǎng)絡(luò)訓(xùn)練方法使得神經(jīng)網(wǎng)絡(luò)模型易于實(shí)現(xiàn)。但BP算法存在一定缺陷,會(huì)導(dǎo)致訓(xùn)練速率較慢且容易陷入局部最優(yōu),針對(duì)此問(wèn)題,Huang等[9]提出了極限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)模型,該模型具有單隱含層,隨機(jī)產(chǎn)生輸入層和隱含層的連接權(quán)重和閾值,在提高訓(xùn)練速率的同時(shí)保證了一定的預(yù)測(cè)精度。Deng等[10]針對(duì)ELM只考慮經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化和模型過(guò)擬合的問(wèn)題,引入L2正則化項(xiàng)對(duì)ELM模型進(jìn)行改進(jìn),提出了正則化極限學(xué)習(xí)機(jī)(Regularized extreme learning machine, RELM)模型。王改堂等[11]提出ELM嶺回歸的建模方法來(lái)預(yù)測(cè)延遲焦化粗汽油干點(diǎn),當(dāng)隱層節(jié)點(diǎn)為20時(shí)達(dá)到最優(yōu)預(yù)測(cè)精度,預(yù)測(cè)均方誤差為3.6729。與此同時(shí),智能優(yōu)化算法的引入對(duì)網(wǎng)絡(luò)模型進(jìn)一步優(yōu)化,Cai等[12]提出基于粒子群優(yōu)化算法的ELM模型對(duì)短期交通流量進(jìn)行預(yù)測(cè),通過(guò)引入粒子群搜索算法對(duì)網(wǎng)絡(luò)權(quán)值和閾值進(jìn)行優(yōu)化,提升了預(yù)測(cè)精度。目前針對(duì)S Zorb裝置數(shù)據(jù)驅(qū)動(dòng)建模的研究還十分有限,筆者引入了一種新型的群智能算法——麻雀搜索算法[13],該算法與現(xiàn)有的群智能算法相比具有很好的全局搜索能力和局部搜索能力,筆者基于該算法對(duì)正則化極限學(xué)習(xí)機(jī)進(jìn)行改進(jìn),建立了高精度的產(chǎn)品指標(biāo)預(yù)測(cè)模型。
在實(shí)際的生產(chǎn)過(guò)程中,煉油廠通常要兼顧多個(gè)工藝指標(biāo)以保證產(chǎn)品質(zhì)量,工藝指標(biāo)之間往往是相互影響的,不同的操作變量對(duì)不同的指標(biāo)影響程度也不盡相同。于曉棟等[14]利用Aspen Hysys進(jìn)行常壓塔靜態(tài)模擬,以最大化產(chǎn)品收益和最小化裝置能耗為優(yōu)化目標(biāo),利用非支配排序遺傳算法找到Pareto解集。焦云強(qiáng)[15]提出了煉油企業(yè)氫氣系統(tǒng)的多目標(biāo)設(shè)計(jì)策略,利用變權(quán)系數(shù)的加權(quán)法將多目標(biāo)優(yōu)化問(wèn)題轉(zhuǎn)化為單目標(biāo)優(yōu)化問(wèn)題,根據(jù)Pareto最優(yōu)前沿權(quán)衡投資成本和操作成本,給出優(yōu)化后的設(shè)計(jì)方案。
為實(shí)現(xiàn)S Zorb裝置產(chǎn)品指標(biāo)的在線預(yù)測(cè)和多目標(biāo)優(yōu)化分析,筆者根據(jù)某煉油廠S Zorb裝置的生產(chǎn)工藝和有限的過(guò)程數(shù)據(jù),通過(guò)相關(guān)性分析選取得到10個(gè)操作變量。結(jié)合實(shí)際的工藝參數(shù),建立了Aspen Plus的生產(chǎn)過(guò)程機(jī)理模型。然后對(duì)機(jī)理模型進(jìn)行有效性檢驗(yàn)和靈敏度分析,并建立SSA-RELM產(chǎn)品預(yù)測(cè)模型。最后將精制汽油流量、硫含量和氮含量作為優(yōu)化目標(biāo),給出了不同分區(qū)下多目標(biāo)在線操作優(yōu)化方案。
在實(shí)際的化工過(guò)程當(dāng)中,各變量之間具有高度的非線性和強(qiáng)耦合性,分析不同變量之間的相關(guān)性就變得十分復(fù)雜。梯度提升決策樹(Gradient boosting decision tree, GBDT)是基于決策樹模型的集成學(xué)習(xí)算法,因其具有較高精度,常被用于回歸預(yù)測(cè)當(dāng)中。Friedman[16]提出通過(guò)計(jì)算特征在每棵樹上的平均貢獻(xiàn)度來(lái)衡量特征的全局貢獻(xiàn)度,結(jié)點(diǎn)在分裂時(shí)的均方誤差損失值越大,特征的重要性越高。節(jié)點(diǎn)信息可以很好地反映操作變量對(duì)目標(biāo)變量的貢獻(xiàn)度,通過(guò)計(jì)算分裂節(jié)點(diǎn)的均方誤差損失值就可以得到相應(yīng)特征的貢獻(xiàn)度,該計(jì)算方法能夠充分地表征操作變量和目標(biāo)變量之間的相關(guān)性。
某煉油廠DCS系統(tǒng)每隔6 min采樣一次,共得到現(xiàn)場(chǎng)數(shù)據(jù)6720組,去除原始數(shù)據(jù)中的缺失值和錯(cuò)誤值,處理后得到6527組數(shù)據(jù)。根據(jù)工藝手冊(cè),對(duì)24個(gè)主要操作變量進(jìn)行相關(guān)性分析,分別建立24個(gè)操作變量與精制汽油產(chǎn)品流量和硫含量的GBDT模型,并根據(jù)節(jié)點(diǎn)信息計(jì)算各個(gè)特征對(duì)應(yīng)的特征貢獻(xiàn)度,通過(guò)等比例加權(quán)融合方法得到融合特征貢獻(xiàn)度,融合特征度的大小反映了相關(guān)性的大小。各操作變量的融合特征貢獻(xiàn)度如圖1所示。
F1—3# Feed flowrate; F2—Hydronaphtha flowrate;T1—Heating furnace inlet temperature;T2—Hot separator temperature;p1—Reactor pressure; T3—Gasoline temperature;F10—Steam flowrate; T4—Cold separator temperature;T5—Gas outlet temperature; p2—Hot separator pressure;T6—Regeneration temperature; F4—Deoxygenated water flowrate;F5—Gas flowrate; L1—Hot separator liquid level;F6—Regenerator N2 flow; p3—Cold separator pressure;T7—Reactor temperature; F7—H2S flow;p4—Regeneration pressure; s1—Capacity of regenerator;p5—Tower top pressure; L2—Cold separator liquid level;F8—N2 flowrate; F9—2# Feed flowrate圖1 基于GBDT融合特征貢獻(xiàn)度Fig.1 Fusion feature contribution based on GBDT
在圖1中,將24個(gè)操作變量的融合特征度按由大到小的順序進(jìn)行排序,從中選取10個(gè)具有較高特征貢獻(xiàn)度的操作變量:3#進(jìn)料流量(F1)、加氫石腦油進(jìn)料(F2)、加熱爐進(jìn)口溫度(T1)、熱分溫度(T2)、吸附脫硫反應(yīng)器壓力(p1)、產(chǎn)品汽油出裝置溫度(T3)、蒸汽進(jìn)裝置流量(F10)、冷分溫度(T4)、干氣出裝置溫度(T5)和熱分壓力(p2)。經(jīng)計(jì)算,這10個(gè)操作變量的特征貢獻(xiàn)度之和為0.975,所選操作變量能夠充分反映對(duì)目標(biāo)變量的貢獻(xiàn)度。
S Zorb吸附脫硫工藝以催化裂化(FCC)汽油為原料,F(xiàn)CC汽油中的硫化物與Ni和ZnO所組成的吸附劑發(fā)生吸附脫硫反應(yīng),噻吩類化合物中的硫原子直接被吸附劑所吸收形成金屬硫化物,反應(yīng)后的吸附劑通過(guò)后續(xù)的吸附再生反應(yīng)實(shí)現(xiàn)吸附劑的再生。王連山等[17]提出了38集總組分對(duì)物料進(jìn)行表征,建立了可靠的連續(xù)重整裝置的集總動(dòng)力學(xué)模型。在此基礎(chǔ)上,針對(duì)Aspen Plus機(jī)理模型,筆者采用42集總模型(烷烴19集總、烯烴10集總、芳烴5集總、硫化物6集總、氮化物2集總)對(duì)原料進(jìn)行表征[18],其中硫化物用噻吩硫、硫醚和硫醇進(jìn)行表征,氮化物用喹啉和吡啶進(jìn)行表征[19]。S Zorb裝置主要分為3個(gè)單元:吸附脫硫單元、吸附劑再生單元和產(chǎn)品穩(wěn)定單元。下面將結(jié)合圖2依次對(duì)3個(gè)主要單元進(jìn)行介紹。
(1)吸附脫硫單元:該單元的進(jìn)料包括新氫進(jìn)料(H2)、罐區(qū)補(bǔ)充進(jìn)料(FCC-1)、2號(hào)罐區(qū)進(jìn)料(FCC-2)、3號(hào)罐區(qū)進(jìn)料(FCC-3),以上進(jìn)料經(jīng)過(guò)加熱爐預(yù)熱進(jìn)入到吸附脫硫反應(yīng)器(Reactor)中,與吸附劑(Adsorb)發(fā)生吸附脫硫反應(yīng),同時(shí)反應(yīng)器內(nèi)還包含一定程度的烯烴加氫反應(yīng)和烯烴加氫異構(gòu)化反應(yīng)。反應(yīng)完成后,含硫吸附劑經(jīng)閥門(V-1)進(jìn)入到吸附劑再生單元。而氣相物流經(jīng)冷卻器(COOL-1)進(jìn)入熱分罐(SEP-1)進(jìn)行初次氣-液兩相的分離,液相進(jìn)入產(chǎn)品穩(wěn)定單元進(jìn)行精餾,而氣相物流經(jīng)冷卻器(COOL-2)再次換熱后進(jìn)入冷分罐(SEP-2),進(jìn)行第二次氣-液分離,分離后的氣相作為循環(huán)氫進(jìn)行循環(huán)利用,液相經(jīng)分離罐(B-2)脫水后進(jìn)入產(chǎn)品穩(wěn)定單元。
(2)吸附劑再生單元:在實(shí)際的生產(chǎn)過(guò)程中,吸附劑再生單元通過(guò)步序控制使脫硫反應(yīng)器(Reactor)中的吸附劑保持一定活性,筆者建模時(shí)暫未考慮吸附劑活性變化的影響。吸附脫硫反應(yīng)結(jié)束后,待生吸附劑中被吸附的硫原子主要以ZnS的形式存在,通過(guò)再生反應(yīng)器中氧化反應(yīng)重新得到具有吸附活性的ZnO,反應(yīng)產(chǎn)生的煙氣進(jìn)入SRU硫磺回收系統(tǒng)進(jìn)行處理。反應(yīng)后的固體吸附劑中含有一定成分的NiO,繼續(xù)在還原反應(yīng)器(CONV-2)中完成Ni的還原,最終得到再生的吸附劑。
H2—New hydrogen feed; FCC-1, FCC-2, FCC-3—1#, 2#, 3# Fluid catalytic cracking gasoline; Adsorb—Adsorbent feed; Air—Air feed;CIR-H2, RE-H2—Circulating hydrogen; Naphtha—Hydrogenated naphtha; WW-1, WW-2—Waste water; Fuel-Gas—Emission of fuel gas;New-Adsorb—Regenerative adsorbent; Gas—Dry gas; Product—Refined gasoline; MIX-1, MIX-2, MIX-3, MIX-4, MIX-5, MIX-6—Mixer;HEAT-1—Heater; COOL-1, COOL-2, COOL-3, COOL-4, COOL-5, COOL-6—Cooler; SEP-1—Hot separator;SEP-2—Cold separator; SEP-3, SEP-4, SEP-5, SEP-6—Separator; Reactor—Adsorption desulfurization reactor;CONV-1, CONV-2—Regenerative reactor; B-2, B-1—Separator; T-1—Distillation tower; V-1, V-2—Valve圖2 S Zorb工藝流程模擬Fig.2 Simulation of S Zorb process
(3)產(chǎn)品穩(wěn)定單元:經(jīng)過(guò)分離后的汽油與調(diào)合石腦油(FCC-4)混合進(jìn)入精餾塔(T-1),設(shè)定精餾塔的塔板數(shù)為30,汽油進(jìn)料為第12塔板。經(jīng)過(guò)精餾后得到精制汽油(Product),并排出干氣(Gas),建模過(guò)程中所涉及的參數(shù)均按照工藝手冊(cè)的要求設(shè)定。
Aspen Plus模型計(jì)算收斂之后,利用實(shí)際數(shù)據(jù)對(duì)模型的有效性進(jìn)行檢驗(yàn),保證后續(xù)生成擴(kuò)展數(shù)據(jù)集的可靠性。針對(duì)1.1節(jié)中某煉油廠DCS系統(tǒng)的6527組實(shí)際有效數(shù)據(jù),忽略掉測(cè)量變送裝置和各反應(yīng)器的反應(yīng)因素等造成的時(shí)滯,利用隨機(jī)抽樣的方法從每日0—12時(shí)和12—24時(shí)各隨機(jī)抽取1個(gè)樣本點(diǎn),共得到該月的56個(gè)測(cè)試樣本。將精制汽油流量和精制汽油硫含量作為有效性檢驗(yàn)的指標(biāo),對(duì)比仿真結(jié)果與實(shí)際數(shù)據(jù),繪制仿真數(shù)據(jù)與現(xiàn)場(chǎng)數(shù)據(jù)的對(duì)比圖像,同時(shí)計(jì)算2個(gè)有效性檢驗(yàn)指標(biāo)的均方誤差MSE、平均絕對(duì)誤差MAE。
圖3為精制汽油流量和硫含量實(shí)際值與仿真值的比較。由于建立機(jī)理模型的過(guò)程中未考慮實(shí)際生產(chǎn)過(guò)程中的損耗,因此在圖3仿真結(jié)果中預(yù)測(cè)值略大于實(shí)際值,但預(yù)測(cè)值的變化趨勢(shì)與實(shí)際值的變化趨勢(shì)保持一致,同時(shí)預(yù)測(cè)誤差保持在一定的范圍內(nèi)。在精制汽油流量的誤差計(jì)算結(jié)果中,MSE為6.747,MAE為6.612;在精制汽油硫含量的誤差計(jì)算結(jié)果中,MSE為0.261,MAE為0.219。以上2個(gè)產(chǎn)品指標(biāo)的驗(yàn)證結(jié)果證明了模型的有效性。
圖3 精制汽油流量和硫含量實(shí)際值與仿真值的比較Fig.3 Comparison of actual and simulation data of refined gasoline flowrate and its sulfur content(a) Refined gasoline flowrate (F3); (b) Sulfur mass fraction (w2(S)) of refined gasoline
通過(guò)Aspen Plus機(jī)理模型進(jìn)行靈敏度分析,對(duì)1.1節(jié)相關(guān)性分析得到的10個(gè)操作變量(3#進(jìn)料流量、加氫石腦油進(jìn)料、加熱爐進(jìn)口溫度、熱分溫度、吸附脫硫反應(yīng)器壓力、產(chǎn)品汽油出裝置溫度、蒸汽進(jìn)裝置流量、冷分溫度、干氣出裝置溫度和熱分壓力)進(jìn)行進(jìn)一步的篩選,找到對(duì)于Aspen Plus模型靈敏度高的變量作為輸入變量。將以上10個(gè)操作變量作為機(jī)理模型的自變量,計(jì)算當(dāng)自變量數(shù)值波動(dòng)1%時(shí)精制汽油流量和硫含量變化的百分比,通過(guò)該百分比的數(shù)值來(lái)反映機(jī)理模型對(duì)于自變量的靈敏度。經(jīng)計(jì)算,精制汽油流量和硫含量對(duì)產(chǎn)品汽油出裝置溫度、吸附脫硫反應(yīng)器壓力和蒸汽進(jìn)裝置流量不敏感,靈敏度的計(jì)算值近似為零,因此選擇其余7個(gè)操作變量為輸入變量。
由于目前所掌握的現(xiàn)場(chǎng)數(shù)據(jù)較為有限,在一定時(shí)間段內(nèi)的工況變化范圍較小,為保證數(shù)據(jù)驅(qū)動(dòng)建模過(guò)程中數(shù)據(jù)的完備性,運(yùn)行機(jī)理模型對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充??紤]到在實(shí)際的生產(chǎn)過(guò)程中原料油的批次不同,原料油中含硫化合物變動(dòng)較大,因此將進(jìn)料油的硫含量納入數(shù)據(jù)驅(qū)動(dòng)建模的輸入變量,結(jié)合1.3節(jié)靈敏度分析得到的7個(gè)輸入變量,共計(jì)得到8個(gè)輸入變量。
根據(jù)生產(chǎn)工藝的要求,各輸入變量在允許的范圍內(nèi)取值,同時(shí)根據(jù)對(duì)該煉油廠實(shí)際有效的6527組DCS數(shù)據(jù)進(jìn)行的統(tǒng)計(jì),找到在常規(guī)工況下各個(gè)輸入變量分布密集的區(qū)間和分布稀疏的區(qū)間。在分布密集的區(qū)間內(nèi)選取較多的點(diǎn),在分布稀疏的區(qū)間內(nèi)選取較少的點(diǎn)。詳細(xì)列出如下:原料油硫質(zhì)量分?jǐn)?shù)(410~450 μg/g,取值為{410,430,450}),3#進(jìn)料流量(60000~90000 kg/h,取值為{70000,80000,90000}),干氣出裝置溫度(不大于45 ℃,取值為{30.00,31.25,32.50,33.75,35.00,45.00}),熱分溫度(100~150 ℃,取值為{120,136,137,138,139,145}),冷分溫度(不大于45 ℃,取值{30.0,32.5,35.0,37.5,40.0,45.0}),加氫石腦油進(jìn)料(2000~5000 kg/h,取值為{2000,4000}),加熱爐進(jìn)口溫度(380~440 ℃,取值為{418,421,424,427,430}),熱分壓力(1.9~2.9 MPa,取值為{2.300,2.325,2.350,2.375,2.400,2.800})。Aspen Plus機(jī)理模型的輸出為:精制汽油質(zhì)量流量(kg/h)、精制汽油硫質(zhì)量分?jǐn)?shù)(μg/g)和精制汽油氮質(zhì)量分?jǐn)?shù)(μg/g),此3項(xiàng)為產(chǎn)品質(zhì)量相關(guān)的指標(biāo)。按照以上輸入變量的取值運(yùn)行Aspen Plus機(jī)理模型,得到111840組數(shù)據(jù)。擴(kuò)展數(shù)據(jù)集如表1所示。
極限學(xué)習(xí)機(jī)作為一種單隱層前饋神經(jīng)網(wǎng)絡(luò),與BP網(wǎng)絡(luò)模型相比,具有更快的訓(xùn)練速率,特別是在訓(xùn)練數(shù)據(jù)量大的情況下,具有明顯的優(yōu)勢(shì),適合在線的訓(xùn)練和多目標(biāo)的預(yù)測(cè)。假設(shè)有一訓(xùn)練數(shù)據(jù)集S={(x1,y1),(x2,y2),…,(xl,yl)},其中xi∈Rn表示n維輸入,yi∈Rm表示m維輸出,i=1,2,…,l,其中l(wèi)為數(shù)據(jù)的個(gè)數(shù)。假設(shè)隱層神經(jīng)元的個(gè)數(shù)為N,激活函數(shù)為G(x)的極限學(xué)習(xí)機(jī)可以表示為:
(1)
式(1)中:ωj是第j個(gè)神經(jīng)元的輸入權(quán)重;βj是第j個(gè)神經(jīng)元的輸出權(quán)重。式(1)可用矩陣表示為:
Y=H·β
(2)
式(2)中:H為隱含層的輸出;β為隱含層與輸出層的連接權(quán)值;Y為網(wǎng)絡(luò)的輸出。由于輸入層到隱含層的權(quán)值和閾值可以隨機(jī)賦值,則隱含層與輸出層之間的連接權(quán)值可以通過(guò)式(3)求解得到:
(3)
(4)
式(4)中,C為常數(shù),求解得到式(4)的解為:
(5)
式(5)中,I為單位矩陣。
表1 擴(kuò)展數(shù)據(jù)集Table 1 Extended database
在RELM的訓(xùn)練過(guò)程中,首先確定模型輸入神經(jīng)元的個(gè)數(shù)、輸出神經(jīng)元的個(gè)數(shù)和隱含層神經(jīng)元的個(gè)數(shù),然后隨機(jī)初始化輸入層到隱含層的權(quán)重和閾值,結(jié)合訓(xùn)練數(shù)據(jù)集計(jì)算β,最后利用訓(xùn)練好的RELM模型進(jìn)行預(yù)測(cè)。
麻雀搜索算法是一種新型的群智能優(yōu)化算法,該算法具有很好的局部搜索能力和全局搜索能力。通過(guò)與其他算法在收斂速率、精度和穩(wěn)定性對(duì)比,麻雀搜索算法均有很好的表現(xiàn)[20]。
麻雀搜索算法中將種群個(gè)體分為發(fā)現(xiàn)者和追隨者,發(fā)現(xiàn)者具有較高適應(yīng)度的值,指引追隨者的移動(dòng)。但是一旦麻雀察覺到捕食者,就會(huì)移動(dòng)到安全區(qū)域,每個(gè)追隨者在發(fā)現(xiàn)最好的食物來(lái)源時(shí)都有機(jī)會(huì)成為發(fā)現(xiàn)者,算法主要包括發(fā)現(xiàn)者的更新過(guò)程、追隨者位置的更新和反捕食位置的更新。發(fā)現(xiàn)者的位置更新公式如下:
(6)
(7)
式(7)中,Xworst為當(dāng)前歷史最差的位置;XP是發(fā)現(xiàn)者當(dāng)前的最優(yōu)位置;A為1×d維向量,向量元素隨機(jī)賦值1或-1,A+=AT(AAT)-1;P為麻雀種群的數(shù)量,根據(jù)上式完成追隨者的位置更新。為了防止陷入局部最優(yōu),提高全局搜索的能力,引入反捕食的策略。反捕食者的數(shù)目可以設(shè)定為種群數(shù)目的10%到20%,該群體的選擇方式如下:
(8)
極限學(xué)習(xí)機(jī)在進(jìn)行初始化時(shí),輸入層到隱含層的權(quán)值和閾值均為隨機(jī)生成,這就很難保證極限學(xué)習(xí)機(jī)發(fā)揮最優(yōu)的性能。針對(duì)這個(gè)問(wèn)題,筆者提出了基于數(shù)據(jù)驅(qū)動(dòng)SSA-RELM建模方法,在RELM模型的基礎(chǔ)上引入麻雀搜索算法,使得每個(gè)麻雀?jìng)€(gè)體中包含輸入層帶隱含層的連接權(quán)值信息和隱含層的閾值信息,通過(guò)尋找麻雀種群中最優(yōu)個(gè)體來(lái)得到最優(yōu)的網(wǎng)絡(luò)權(quán)值和閾值,適應(yīng)度函數(shù)用實(shí)際值和預(yù)測(cè)值的均方誤差來(lái)表示,均方誤差越小則個(gè)體的適應(yīng)度越高。利用麻雀搜索算法得到的最優(yōu)權(quán)值和閾值對(duì)RELM模型進(jìn)行初始化,進(jìn)而建立SSA-RELM的模型,算法步驟如下:
Step 1 將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,分別用于模型的訓(xùn)練和預(yù)測(cè);
Step 2 設(shè)置麻雀搜索算法的超參數(shù),如種群大小、最大迭代次數(shù)、預(yù)警值等,并對(duì)種群進(jìn)行隨機(jī)初始化;
Step 3 計(jì)算初始的個(gè)體適應(yīng)度、當(dāng)前最優(yōu)適應(yīng)度和最差適應(yīng)度,并按照適應(yīng)度對(duì)個(gè)體排序;
Step 4 按照2.2節(jié)公式依次進(jìn)行發(fā)現(xiàn)者、追隨者和反捕食者的位置更新;
Step 5 再次計(jì)算個(gè)體適應(yīng)度、全局最優(yōu)適應(yīng)度和全局最差適應(yīng)度;判斷是否到達(dá)最優(yōu)迭代次數(shù),是則跳轉(zhuǎn)Step 6,否則跳轉(zhuǎn)Step 4;
Step 6 利用最優(yōu)個(gè)體對(duì)RELM的權(quán)值和閾值進(jìn)行初始化,利用訓(xùn)練數(shù)據(jù)集求解輸出層連接權(quán)值β;
Step 7 使用訓(xùn)練好的模型進(jìn)行多目標(biāo)預(yù)測(cè)。
按照算法流程進(jìn)行數(shù)據(jù)驅(qū)動(dòng)建模,將擴(kuò)充數(shù)據(jù)集進(jìn)行隨機(jī)劃分,訓(xùn)練集數(shù)據(jù)占比80%,測(cè)試集數(shù)據(jù)占比20%。首先對(duì)麻雀搜索算法中的超參數(shù)進(jìn)行設(shè)定,種群數(shù)量設(shè)置為50,個(gè)體的維度為1440,每個(gè)個(gè)體都包含輸入層到隱含層的權(quán)重信息和隱含層的閾值信息,發(fā)現(xiàn)者數(shù)量設(shè)為群體數(shù)量的20%,最大迭代次數(shù)設(shè)置為100,個(gè)體每一維度的上界和下界分別取1和-1,使得網(wǎng)絡(luò)的權(quán)值在[-1,1]之間選取。同時(shí)對(duì)RELM的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行初始化設(shè)定,輸入層神經(jīng)元的個(gè)數(shù)為8,分別表示3#進(jìn)料流量、加氫石腦油流量、加熱爐進(jìn)口溫度、熱分溫度、冷分溫度、反應(yīng)器壓力、干氣出裝置溫度和原料硫含量,隱含層神經(jīng)元個(gè)數(shù)設(shè)為160,輸出層神經(jīng)元個(gè)數(shù)為3,分別表示精制汽油流量、氮含量和硫含量。分別按照2.3節(jié)建模過(guò)程建立RELM模型和SSA-RELM模型,并從測(cè)試集中隨機(jī)抽取112組數(shù)據(jù)進(jìn)行測(cè)試,2種模型的預(yù)測(cè)值與實(shí)際值的對(duì)比曲線和偏差曲線如圖4~圖9所示。對(duì)于圖4、圖6和圖8 可知,實(shí)際值和預(yù)測(cè)值擬合效果越好說(shuō)明精度越高;對(duì)于圖5、圖7和圖9,曲線的波動(dòng)幅度越小,說(shuō)明越靠近偏差為0的水平線,預(yù)測(cè)結(jié)果越精確,反之曲線的波動(dòng)幅度越大,預(yù)測(cè)結(jié)果越不精確。
F3—Refined gasoline flowrate圖4 不同預(yù)測(cè)模型下精制汽油流量的預(yù)測(cè)值和實(shí)際值Fig.4 Predicted and actual data of refined gasoline flowrate with using different prediction models(a) RELM model; (b) SSA-RELM model
F3—Refined gasoline flowrate圖5 不同預(yù)測(cè)模型下精制汽油流量預(yù)測(cè)偏差Fig.5 Difference of refined gasoline flowratewith using different prediction models
w2(S)—Sulfur mass fraction of refined gasoline圖6 不同預(yù)測(cè)模型下精制汽油硫含量的預(yù)測(cè)值和實(shí)際值Fig.6 Predicted and actual sulfur content of refined gasolinewith using different prediction models(a) RELM model; (b) SSA-RELM model
由圖5、圖7和圖9可以看出,對(duì)于3個(gè)指標(biāo)的預(yù)測(cè)結(jié)果,改進(jìn)后的SSA-RELM模型比RELM具有更高的預(yù)測(cè)精度。分別計(jì)算預(yù)測(cè)指標(biāo)的均方誤差MSE和平均絕對(duì)誤差MAE,計(jì)算結(jié)果如表2所示。由表2可知,SSA-RELM模型在RELM模型的基礎(chǔ)上進(jìn)一步提升了預(yù)測(cè)精度。在實(shí)際的生產(chǎn)過(guò)程中,改進(jìn)后的模型能夠?qū)崿F(xiàn)快速地多目標(biāo)預(yù)測(cè),為實(shí)際生產(chǎn)操作提供相應(yīng)的指導(dǎo),提高生產(chǎn)的穩(wěn)定性和產(chǎn)品汽油的質(zhì)量,增加煉油廠的經(jīng)濟(jì)效益。
w2(S)—Sulfur mass fraction of refined gasoline圖7 不同預(yù)測(cè)模型下精制汽油硫含量預(yù)測(cè)偏差Fig.7 Difference of sulfur content of refined gasolinewith using different prediction models
w3(N)—Nitrogen mass fraction of refined gasoline圖8 不同預(yù)測(cè)模型下精制汽油氮含量的預(yù)測(cè)值和實(shí)際值Fig.8 Predicted and actual nitrogen content of refinedgasoline with using different prediction models(a) RELM model; (b) SSA-RELM model
w3(N)—Nitrogen mass fraction of refined gasoline圖9 不同預(yù)測(cè)模型下精制汽油氮含量預(yù)測(cè)偏差Fig.9 Difference of nitrogen content of refined gasolinewith using different prediction models
表2 預(yù)測(cè)誤差計(jì)算結(jié)果Table 2 Calculation results of prediction error
S Zorb作為吸附脫硫裝置,該裝置的主要產(chǎn)品精制汽油的硫含量是最重要的指標(biāo),同時(shí)氮含量作為清潔燃料的指標(biāo)之一也應(yīng)適當(dāng)予以考慮,此外在以上2個(gè)指標(biāo)合格的情況下,精制汽油的流量越大可以保證獲得越多的合格產(chǎn)品。如何平衡好3個(gè)指標(biāo)之間的關(guān)系,以及如何對(duì)相應(yīng)的操作變量進(jìn)行調(diào)整,都是實(shí)際生產(chǎn)過(guò)程中需要考慮的關(guān)鍵問(wèn)題。
筆者將精制汽油產(chǎn)品流量、氮含量和硫含量3個(gè)指標(biāo)作為多目標(biāo)操作優(yōu)化分析的3個(gè)目標(biāo),以3#進(jìn)料和加氫石腦油進(jìn)料量的不同組合為例,分6個(gè)區(qū)((70000 kg/h,4000 kg/h)、(70000 kg/h,2000 kg/h)、(80000 kg/h,4000 kg/h)、(80000 kg/h,2000 kg/h)、(90000 kg/h,4000 kg/h)、(90000 kg/h,2000 kg/h))進(jìn)行了多目標(biāo)操作優(yōu)化分析。按照以上分區(qū)方式,利用Aspen Plus仿真共得到18000組數(shù)據(jù),每個(gè)操作區(qū)有3000組數(shù)據(jù)。
將每個(gè)分區(qū)的操作點(diǎn)對(duì)應(yīng)的目標(biāo)值在三維坐標(biāo)系中畫出。由于在多目標(biāo)優(yōu)化問(wèn)題中,各單目標(biāo)的優(yōu)化方向相互沖突,對(duì)于硫含量和氮含量的預(yù)期目標(biāo)應(yīng)越低越好,而對(duì)于精制汽油產(chǎn)品流量應(yīng)當(dāng)盡可能大,同時(shí)不同的目標(biāo)的量綱也不同。為了進(jìn)行綜合評(píng)價(jià),將3個(gè)目標(biāo)數(shù)據(jù)進(jìn)行了歸一化,并將精制汽油流量數(shù)據(jù)取為負(fù)值,使得多個(gè)目標(biāo)變化趨勢(shì)一致。然后,根據(jù)目標(biāo)空間中各目標(biāo)的分布情況,采用非支配排序的方法尋找Pareto前沿[21],各區(qū)的3個(gè)目標(biāo)分布情況如圖10所示。
F3—Refined gasoline flow; w2(S)—Sulfur mass fraction of refined gasoline; w3(N)—Nitrogen mass fraction of refined gasoline圖10 各分區(qū)的目標(biāo)空間及Pareto前沿Fig.10 Objective space and Pareto front in each partition zone(a) Partition zone 1: (F1=70000 kg/h, F2=4000 kg/h); (b) Partition zone 2: (F1=70000 kg/h, F2=2000 kg/h);(c) Partition zone 3: (F1=80000 kg/h, F2=4000 kg/h); (d) Partition zone 4: (F1=80000 kg/h, F2=2000 kg/h);(e) Partition zone 5: (F1=90000 kg/h, F2=4000 kg/h); (f) Partition zone 6: (F1=90000 kg/h, F2=2000 kg/h)
圖10(a)、(b)、(c)、(d)、(e)、(f)分別表示6個(gè)分區(qū),對(duì)應(yīng)的分區(qū)為:(70000 kg/h,4000 kg/h)、(70000 kg/h,2000 kg/h)、(80000 kg/h,4000 kg/h)、(80000 kg/h,2000 kg/h)、(90000 kg/h,4000 kg/h)、(90000 kg/h,2000 kg/h)。在每個(gè)子圖中,藍(lán)色點(diǎn)表示支配解,紅色點(diǎn)表示非支配解,在非支配解中選擇得到最優(yōu)操作點(diǎn)。假設(shè)硫含量、氮含量和產(chǎn)品流量這3個(gè)產(chǎn)品指標(biāo)權(quán)重相同,計(jì)算歸一化后的操作點(diǎn)到點(diǎn)(0,0,-1)的歐氏距離,將該距離作為操作點(diǎn)綜合評(píng)價(jià)指標(biāo),距離越小說(shuō)明該操作點(diǎn)越好,其中距離最小的點(diǎn)作為該分區(qū)的最優(yōu)操作點(diǎn),即為圖10中的P1到P6。各分區(qū)對(duì)應(yīng)的3個(gè)目標(biāo)重要程度相等時(shí)的最優(yōu)操作點(diǎn)及其目標(biāo)見表3。
從表3看到,操作點(diǎn)P5和P6的硫元素含量比限定值(不大于10 μg/g)高,因此在假設(shè)3個(gè)生產(chǎn)指標(biāo)等權(quán)重的情況下,并不能得到合格的產(chǎn)品。在實(shí)際生產(chǎn)中需要向著硫含量低的方向調(diào)整,在Pareto前沿上優(yōu)先選擇使得硫含量更低的其他操作點(diǎn)作為實(shí)際操作點(diǎn)以保證產(chǎn)品的質(zhì)量。
表3 圖10中各分區(qū)最優(yōu)操作點(diǎn)及目標(biāo)Table 3 Optimal operation point and target for each partition in Fig.10
最后,筆者對(duì)表3中的5個(gè)操作變量對(duì)3個(gè)目標(biāo)的影響程度進(jìn)行了Pearson相關(guān)性分析,結(jié)果如圖11所示。按照柱狀圖高度,可以依次排列5個(gè)操作變量的操作順序。柱形圖高度越高表明操作變量的優(yōu)先級(jí)越高,在對(duì)S Zorb裝置進(jìn)行調(diào)整時(shí),應(yīng)當(dāng)優(yōu)先調(diào)整該變量。
T1—Heating furnace inlet temperature; T2—Hot separatortemperature; T4—Cold separator temperature;T5—Gas outlet temperature; p2—Hot separator pressure;F3—Refined gasoline flow;w2(S)—Sulfur mass fraction of refined gasoline;w3(N)—Nitrogen mass fraction of refined gasoline圖11 操作變量的優(yōu)先級(jí)計(jì)算Fig.11 Priority calculation of operation variables
在實(shí)際操作中,利用2.3節(jié)數(shù)據(jù)驅(qū)動(dòng)模型對(duì)當(dāng)前操作點(diǎn)進(jìn)行實(shí)時(shí)預(yù)測(cè),如果預(yù)測(cè)值與Pareto前沿中最優(yōu)操作點(diǎn)有差距,則在本區(qū)內(nèi)調(diào)整當(dāng)前操作點(diǎn)向最優(yōu)操作點(diǎn)移動(dòng),按照優(yōu)先級(jí)依次調(diào)整干氣出裝置溫度、熱分壓力和熱分溫度,其次對(duì)加熱爐進(jìn)口溫度和冷分溫度進(jìn)行調(diào)整,按照該操作順序可使得當(dāng)前操作點(diǎn)迅速移動(dòng)到最優(yōu)操作點(diǎn),提高實(shí)際操作的速率和效率,保證生產(chǎn)裝置始終處于最優(yōu)且穩(wěn)定的狀態(tài)。
分別建立S Zorb裝置的機(jī)理模型和數(shù)據(jù)驅(qū)動(dòng)模型,實(shí)現(xiàn)了對(duì)吸附脫硫裝置在線產(chǎn)品預(yù)測(cè)和多目標(biāo)的操作優(yōu)化分析。
(1)根據(jù)實(shí)際的生產(chǎn)數(shù)據(jù),利用GBDT模型計(jì)算24個(gè)操作變量相對(duì)于產(chǎn)品流量和硫含量的特征貢獻(xiàn)度,再利用Aspen Plus軟件建立S Zorb裝置的機(jī)理模型,并通過(guò)有效性檢驗(yàn)和靈敏度分析得到機(jī)理模型輸入變量和輸出變量。
(2)通過(guò)運(yùn)行Aspen Plus機(jī)理模型擴(kuò)展數(shù)據(jù)集。利用麻雀搜索算法對(duì)正則化極限學(xué)習(xí)機(jī)進(jìn)行改進(jìn),以原料進(jìn)料流量和硫含量、加熱爐進(jìn)口溫度、加氫石腦油進(jìn)料流量、熱分壓力、熱分溫度、干氣出裝置溫度、冷分溫度為輸入,精制汽油的流量、硫含量和氮含量和干氣流量為輸出建立了SSA-RELM模型,在保證訓(xùn)練速率的情況下進(jìn)一步提高了預(yù)測(cè)精度,實(shí)現(xiàn)了產(chǎn)品指標(biāo)在線預(yù)測(cè)。
(3)最后通過(guò)對(duì)進(jìn)料分區(qū),分析了不同進(jìn)料情況下操作點(diǎn)的分布情況,找到了6個(gè)分區(qū)上Pareto最優(yōu)解和最優(yōu)操作點(diǎn),給出了實(shí)際操作過(guò)程中操作變量調(diào)整的優(yōu)先級(jí),從而實(shí)現(xiàn)精制汽油產(chǎn)品流量、硫含量和氮含量3個(gè)優(yōu)化目標(biāo)的在線操作指導(dǎo)。
(4)基于煉油廠實(shí)際的工藝手冊(cè)和有限的現(xiàn)場(chǎng)數(shù)據(jù)建立了S Zorb裝置模型。在后續(xù)的研究中,將進(jìn)一步探究在引入干擾變量和復(fù)雜進(jìn)料條件下的模型運(yùn)行狀態(tài),提升模型的抗干擾能力。