李傳真 王國慶 鄒麗
摘????? 要: 結合集團公司提出的加快建設數(shù)字化工廠的設想,利用過程工業(yè)大數(shù)據(jù)高階優(yōu)化對DCC裝置進行診斷分析,搭建軟件模型,論述現(xiàn)有數(shù)據(jù)建模方法,提升潛力并優(yōu)化工藝控制,達到降本增效的目的。最后,探討過程工業(yè)大數(shù)據(jù)高階優(yōu)化的特點和挑戰(zhàn),實現(xiàn)業(yè)務價值的提升。
關? 鍵? 詞:大數(shù)據(jù);神經(jīng)網(wǎng)絡;過程工業(yè);高階優(yōu)化
中圖分類號:TE319??? ???文獻標識碼: A?? ????文章編號: 1671-0460(2020)06-1162-04
High-order Optimization of Big Data in DCC Device?Based on Neural Network Algorithm
LI Chuan-zhen, WANG Guo-qing, ZOU Li
(CNOOC Dongfang Petrochemical Co., Ltd., Dongfang Hainan 572600, China)
Abstract: Combined with the idea of accelerating the construction of a digital factory proposed by the group company, high-order optimization of process industry big data was used to diagnose and analyze DCC devices, and a software model was built, existing data modeling methods were discussed to reduce costs and increase efficiency. Finally, the characteristics and challenges of high-level optimization of process industry big data were analyzed in order to realize the improvement of business value.
Key words: Big data; Neural network; Process industry; High-order optimization
當今社會信息技術飛速發(fā)展,衍生出A(artificial intelligence)、B(blockchain)、C(cloud Computing)、D(big Data)4大熱門專業(yè)。在過去十幾年,自動化及石油化工領域的專家學者已經(jīng)開發(fā)出適用于石油化工的排產軟件,用來優(yōu)化全廠加工流程,判斷產品結構的影響,進而提高企業(yè)經(jīng)濟效益。原有排產軟件一般都基于線性算法,適用于分析全廠簡單、清晰的流程。本課題嘗試通過使用Python3.0編程,利用神經(jīng)網(wǎng)絡算法處理過程工業(yè)大規(guī)模數(shù)據(jù),將計算機學科和大數(shù)據(jù)學科融合,繼而從海量數(shù)據(jù)中挖掘實際業(yè)務潛在問題,并通過建立優(yōu)化模型,找到現(xiàn)存問題突破口,實現(xiàn)業(yè)務價值提升。
1? 項目背景和實現(xiàn)目標
1.1? 項目背景
某公司設計以海南島周邊原油、凝析油和天然氣資源為依托,按照循環(huán)經(jīng)濟、清潔生產和綠色低碳的原則,采用催化裂解(DCC)技術生產乙烯、丙烯和碳四等重要化工原料,堅持走精細化工道路,下游延伸發(fā)展高技術含量、高附加值的化工新材料和高端精細化學品。一期為煉油裝置,二期為化工裝置,但由于二期工程丙烯腈工藝包轉讓受阻,二期項目僅有乙苯、苯乙烯裝置建成投產。現(xiàn)有流程是圍繞以DCC裝置為核心的燃油-化工型煉廠,煉油規(guī)模偏小,下游產業(yè)鏈延伸不夠,油品比重偏大,后續(xù)又新建兩套產品質量升級項目,造成了成本能耗進一步上升,抗風險能力不強。在丙烯腈項目建成投產前如何取得最大經(jīng)濟效益為公司急需解決的根本問題。
1.2 ?? ?預期實現(xiàn)目標
經(jīng)對全廠的經(jīng)濟利潤進行了分析,通過測算,汽柴油產品虧損嚴重,而提升經(jīng)濟效益主要依靠丙烯、苯乙烯和MTBE產品,能否提高丙烯、苯乙烯和MTBE 3種高價值產品的產量,主要取決全廠的核心——DCC裝置。DCC為國內首套增強型催化裂解 (DCC-plus) 裝置,采用北京石油化工研究院開發(fā)的多產丙烯的專利技術(Deep Catalytic Cracking),是以重質烴為原料、以丙烯為主產品、輕芳烴為副產品的化工型煉油工藝技術。與常規(guī)催化裂化最大的不同就是采取較高反應深度,使得乙烯、丙烯和異丁烯類高附加值產品收率大幅升高,最大限度地減少汽柴油產品產量,研究DCC裝置低碳烯烴產品收率的影響因素是項目的關鍵點。
1.3? 效益可行性分析
在保證裝置負荷相同,同時原油成本沒有增加的前提下,分別將干氣中乙烯、液化氣中丙烯質量分數(shù)以提高1%為單位目標進行效益分析。通過化驗分析,目前干氣中乙烯質量分數(shù)平均為35%,液化氣中丙烯含量平均為44%,提高1%后分別約為36%、45%。當前DCC裝置進料量約3 300 t·d-1,干氣產量約為300 t·d-1,乙烯產量約105 t·d-1;液化氣產量約為1 300 t·d-1,丙烯產量約573 t·d-1。在保證進料量相同的前提下,提升收率后乙烯理論產量應達到300×36%=108 t·d-1,丙烯產量應達到1 300×45%=585 t·d-1;丙烯每噸可盈利為1 000元,增加效益為(585-573)×1 000=12 000元·d-1。每噸乙烯可以生產乙苯約3.5 t,乙苯為中間產品后續(xù)繼續(xù)加工生產苯乙烯,每噸苯乙烯可盈利1 500元,苯乙烯增加效益約為3.5×(108-105)×94%×1 500=14 800元·d-1。全年總計盈利(12 000 +?? 14 800)×360=9 648 000元。
2? 神經(jīng)網(wǎng)絡機器算法的大數(shù)據(jù)高階優(yōu)化原理
在機器學習和認知科學領域,神經(jīng)網(wǎng)絡(neural network)是一種模仿人的大腦結構和功能的數(shù)學模型或計算模型,用于對函數(shù)進行估計或近似。其方法是將使用大量的神經(jīng)元構成神經(jīng)網(wǎng)絡,模擬思考。圖1、圖2為感知器和反應器感知器模擬示意圖
圖1、圖2的圓圈就代表一個感知器。它接受多個輸入(x1,x2,x3...),生成輸出(output),如同人體神經(jīng)末梢感受各種外部環(huán)境的變化進而產生電信號,達到控制相應的身體組織器官的效果。
基于本課題的研究,可以將干氣中乙烯、液化氣中丙烯含量建立一個神經(jīng)網(wǎng)絡運算,其神經(jīng)元就是影響其收率的各項操作指標。
為了簡化模型,我們約定每種輸入只有兩種可能:1 或 0。如果所有輸入可滿足干氣乙烯、液化氣丙烯質量分數(shù)達到36%、45%,表示各種條件都成立,輸出就是1;如果所有輸入為0,則表示條件不成立,輸出就是0。
除上述影響收率的各項操作指標外,其產品還會受到一些因素的影響,例如催化劑活性、催化劑加注量、原油成分改變等。這些因素對產品收率都或多或少產生影響,但影響程度各不相同。某些因素是決定性因素,另一些因素是次要因素。因此,可以給這些因素指定權重(weight),代表它們不同的重要性。
如:催化劑活性權重為4,催化劑加注量權重為2,原油成分權重為2。
3個權重總和即為4+4+2=10。
這時,還需要指定一個閾值(threshold)。閾值的高低代表了影響的強烈,閾值越低就表示收率越低,越高表示就收率越高。
上面的決策過程,使用數(shù)學表達如下:
式中,x表示各種外部因素,w表示對應的權重。
單個的感知器構成了一個簡單的決策模型,已經(jīng)可以拿來用了。石油化工加工過程中,實際的決策模型則要復雜得多,是由多個感知器組成的多層網(wǎng)絡圖3。
圖3中,左側底層感知器首先接收外部輸入信號,做出計算判斷后,傳遞給上層感知器作為輸入信號,上層感知器繼續(xù)計算判斷,直至得到最后的結果。
為了方便后面的討論,需要對上面的模型進行一些數(shù)學處理。
外部因素x1、x2、x3寫成矢量<x1, x2, x3>,簡寫為x。
權重w1、w2、w3 也寫成矢量(w1, w2, w3),簡寫為w。
定義運算w?x = ∑wx,即w和x的點運算,等于因素與權重的乘積之和。
定義b等于負的閾值b = -threshold,
感知器模型就變成了下面這樣:
其中,最困難的部分就是確定權重(w)和閾值(b)。目前為止,這兩個值都是主觀給出的,但現(xiàn)實中很難估計它們的值,必須有一種方法,可以找出答案。
這種方法就是試錯法。其他參數(shù)都不變,w(或b)的微小變動,記作Δw(或Δb),然后觀察輸出有什么變化。不斷重復這個過程,直至得到對應最精確輸出的那組w和b[1],這個過程稱為模型的訓練。而最終訓練出達到我們所需的輸出值(output)的各項輸入項(inputs),就是我們期望得到的生產工況圖4。
3? 工業(yè)大數(shù)據(jù)高階優(yōu)化
3.1? 數(shù)據(jù)基礎和來源
工業(yè)大數(shù)據(jù)的高階優(yōu)化工作基礎是收集數(shù)據(jù),石油化工企業(yè)都會部署了集散控制系統(tǒng)(DCS)、實驗室管理系統(tǒng)(LIMS)、制造執(zhí)行系統(tǒng)(MES)等系統(tǒng),這些系統(tǒng)配備了歷史數(shù)據(jù)服務器,儲存了至少一個生產運行周期的工況數(shù)據(jù),足以提供大量的數(shù)據(jù)供進行分析計算。我們通過收集包括DCS裝置位點數(shù)據(jù)、LIMS化驗數(shù)據(jù)、調度生產數(shù)據(jù)等相關歷史數(shù)據(jù),以干氣乙烯、液化氣丙烯質量分數(shù)達到36%、45%為目標,實際生產工況數(shù)據(jù)為主,輔以流程數(shù)據(jù)、實驗室數(shù)據(jù)、業(yè)務數(shù)據(jù)。清理原始數(shù)據(jù),按工況將不同來源數(shù)據(jù)進行匹配整合。初步分析數(shù)據(jù),發(fā)現(xiàn)、診斷裝置現(xiàn)存問題。
3.2? 分析建模
建模階段工作圍繞搭建符合某公司DCC實際運行工況和進料性質的大數(shù)據(jù)高階分析預測和優(yōu)化模型,以盡量準確擬合DCC裝置產率并尋找以目標優(yōu)化為導向的參數(shù)調優(yōu)方案。持續(xù)對項目準備階段所收集到的裝置及物料歷史數(shù)據(jù)進行深入研究和分析,探討生產環(huán)境所受各項限制條件對目標產率的影響,識別關鍵參數(shù)。搭建可行的收率預測的高階模型,利用神經(jīng)網(wǎng)絡機器算法搭建裝置感知器、權重和閾值。基于大數(shù)據(jù)模型尋優(yōu)結果,初步驗證方案可行性與調優(yōu)效果。在準確度達標的情況下,初步實施優(yōu)化模型,并評估優(yōu)化效果。
3.3? 模型評價與優(yōu)化
模型評價是指對于已經(jīng)建立的一個或多個模型,根據(jù)其模型的類別,使用不同的指標評價其性能優(yōu)劣的過程。模型的優(yōu)化則是指模型性能在經(jīng)過模型評價后已經(jīng)達到了要求,但在實際生產環(huán)境應用過程中,發(fā)現(xiàn)模型的性能并不理想,繼而對模型進行重構與優(yōu)化的過程[2]。
模型評價和優(yōu)化階段工作旨在持續(xù)優(yōu)化大數(shù)據(jù)高階分析預測和優(yōu)化模型的調優(yōu)能力,并完成產品化。基于初步實施階段結果,進一步與DCC裝置的生產、技術、設備、工藝等專家共同探討過程中的各類問題,設計并進行一系列參數(shù)調優(yōu)試驗,并將新生成數(shù)據(jù)投入到模型優(yōu)化和迭代過程中,由此不斷提高模型預測準確性與優(yōu)化能力。最終將根據(jù)實際模型使用員工的操作和應用需求設計軟件系統(tǒng)操作界面,并針對后續(xù)使用及維護過程編寫操作手冊,并提供對應的培訓。
4? 大數(shù)據(jù)高階優(yōu)化的特點及挑戰(zhàn)
4.1? 大數(shù)據(jù)高階優(yōu)化的特點
4.1.1 ?數(shù)據(jù)分析工具的選擇
本課題大數(shù)據(jù)高階分析預測和優(yōu)化模型選擇使用Python3.0編寫。編程腳本使用Python自帶的標準庫與眾多第三方庫。Python3.0軟件和標本庫可從互聯(lián)網(wǎng)上免費獲得和正常使用,不會造成模型開發(fā)與維護的額外成本。Python是一種廣泛使用的解釋型、跨平臺的通用型高級編程語言,擁有動態(tài)類型系統(tǒng)和垃圾回收功能,能夠自動管理內存使用,并且支持多種編程范式,且擁有一個巨大而廣泛的標準庫。Python解釋器本身幾乎可以在所有的操作系統(tǒng)中運行。
4.1.2 ?使用過程工業(yè)大數(shù)據(jù)
目前互聯(lián)網(wǎng)公司的大數(shù)據(jù)技術,基本通過很簡單的統(tǒng)計分析即可揭示部分信息。而工業(yè)大數(shù)據(jù)建模是面向過程工業(yè)決策、優(yōu)化、故障診斷、控制等應用,解決相對復雜數(shù)據(jù)建模問題,需要更深入的數(shù)據(jù)建模方法[3]。
4.1.3 ?更適宜工業(yè)生產挖潛增效
與傳統(tǒng)數(shù)據(jù)建模的排產軟件相比,排產軟件一般應用于全廠加工、效益測算、產品分布的粗略線性計算,這種計算完全屬于自動化學科,針對的是小變量規(guī)模、短時間段的規(guī)則采樣數(shù)據(jù)。而大數(shù)據(jù)高階優(yōu)化使用非線性運算的神經(jīng)網(wǎng)絡算法融合計算機學科和自動化學科,采樣數(shù)據(jù)范圍更大,測算精度更為嚴格,可應用于單裝置的生產優(yōu)化,更適宜企業(yè)挖潛增效。
4.2? 大數(shù)據(jù)高階優(yōu)化帶來的挑戰(zhàn)
4.2.1 ?基于大數(shù)據(jù)高階優(yōu)化的主動預測
本課題主要利用過程工業(yè)大數(shù)據(jù)在生產運行時產生的數(shù)據(jù)更好地改進過程運行、提高高價值產品收率,在后續(xù)的研究中,期望能通過數(shù)據(jù)的分析,實現(xiàn)大數(shù)據(jù)的主動預測,進而實現(xiàn)快速分析及執(zhí)行,降低錯誤決策的后果[4]。
4.2.2 ?多種算法建設和評估模型
考慮到石油化工生產屬于高危工業(yè)控制,如能從多種數(shù)學模型進行計算并驗證,將極大保證生產的安全性和平穩(wěn)性。目前除本課題使用的神經(jīng)網(wǎng)絡算法外,還有梯度提升回歸決策樹、隨機森林等多種機器算法。但除建模需要針對性的分析研究外,龐大的數(shù)據(jù)分析量對計算機配置的要求也要求很高。傳統(tǒng)的CPU不能滿足計算需求,必須使用專門為機器學習定制的GPU來計算。
5? 結束語
麥肯錫全球研究院發(fā)布的Big data:the next frontier for innovation,competition,and productivity指出過程工業(yè)可以從大數(shù)據(jù)分析和應用中提高生產力、降低功耗。以工業(yè)大數(shù)據(jù)為價值源,到2020年的總體價值將近1.3萬億美元[5]。隨著工業(yè)控制與信息技術的不斷發(fā)展,各類工業(yè)控制系統(tǒng)與信息技術不斷結合,存儲收集數(shù)據(jù)的能力大幅提高,如何管理和利用,使計算機學科和自動化學科有效融合,將收集到的繁雜數(shù)據(jù)去離群、去缺失,提高工業(yè)生產模型的準確性,進而研究大數(shù)據(jù)高階優(yōu)化的發(fā)展規(guī)律及預測趨勢走向,幫助企業(yè)生產管理人員提高收益、降低風險,將是未來過程工業(yè)大數(shù)據(jù)高階優(yōu)化的趨勢和潮流。
參考文獻:
[1]韓淼. 基于高斯過程的錢塘江涌潮預報算法研究[D]. 杭州:杭州電子科技大學,2018.
[2]翟高粵. 基于Python的數(shù)據(jù)分析概述[J].信息技術,2018(11):5-8.
[3]劉強,秦泗釗. 過程工業(yè)大數(shù)據(jù)建模研究展望[J]. 自動化學報,2016 (2):161-171.
[4]GE智能平臺. 工業(yè)大數(shù)據(jù)云利用大數(shù)據(jù)推動創(chuàng)新、競爭和增長[J].自動化博覽,2012(12):40-42.
[5]秦明,陳凱.工業(yè)大數(shù)據(jù)集成應用綜述[J]. 軟件導刊,2017(7):213-215.