鄒筱瑜 王福利 常玉清 鄭偉
過程運行狀態(tài)評價在過程安全運行的前提下,綜合考慮了產(chǎn)品質(zhì)量、物耗、能耗、經(jīng)濟收益等因素,對過程運行性能優(yōu)劣進行進一步評價,包括過程運行狀態(tài)優(yōu)性在線評價和非優(yōu)運行狀態(tài)原因追溯兩部分[1?5].優(yōu)性在線評價實時判斷運行性能優(yōu)劣程度,非優(yōu)原因追溯診斷導(dǎo)致非優(yōu)運行狀態(tài)的原因,指導(dǎo)操作人員進行生產(chǎn)調(diào)整.理想的運行狀態(tài)有助于提高綜合經(jīng)濟效益和生產(chǎn)效率、降低生產(chǎn)成本.因此,對過程運行性能優(yōu)劣評價的研究具有重要的理論和應(yīng)用價值.
傳統(tǒng)的過程運行性能評價方法可分為兩類:基于定量信息的評價方法和基于定性信息的評價方法,其中,定量信息指用數(shù)值大小描述的變量信息,定性信息指定性描述的變量信息,主要通過語義變量來描述.基于定量信息的評價方法處理以定量信息為主的過程性能評價問題.多元統(tǒng)計方法是一種應(yīng)用最廣泛的定量評價方法,適用于過程先驗知識較少的過程[6?8].Liu 等提出了基于主成分分析法(Principal component analysis,PCA)和多集合主成分分析法(Multi-set PCA,MsPCA)的運行狀態(tài)優(yōu)性在線評價方法[9?10],但此類方法并沒有考慮過程變量與評價指標(biāo)之間的關(guān)系.基于指標(biāo)預(yù)測的評價方法,雖避免了此問題,但所需數(shù)據(jù)量非常龐大[1?2].概率框架下的性能評價方法,如:基于高斯混合模型(Gaussian mixture model,GMM)[3,10]和貝葉斯理論(Bayesian theory)[11?12]的評價方法,已廣泛應(yīng)用于性能評價中.基于概率理論的評價方法需要先驗知識輔助確定概率密度函數(shù).不同于經(jīng)典方法過于嚴(yán)苛的要求,智能評價方法,如基于人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)的評價方法,由于其學(xué)習(xí)能力和非線性處理能力強,受到研究者的青睞[13?14].但是,此類方法容易陷入局部最優(yōu)值,可能出現(xiàn)過擬合現(xiàn)象.基于定性信息的評價方法處理以定性信息為主的過程性能評價問題.最常用的處理定性信息的方法有貝葉斯網(wǎng)(Bayesian network,BN)、模糊理論(Fuzzy theory)和粗糙集理論(Rough set,RS)等.BN 通過建立表示因果關(guān)系的網(wǎng)絡(luò)和概率表來進行性能評價,BN 的構(gòu)建通常需要大量過程因果知識[15?16].模糊理論通過隸屬度函數(shù)來進行評價,但隸屬度函數(shù)和判定閾值的選取尚無嚴(yán)格的理論指導(dǎo)[17?18].RS 在保持分類能力不變的前提下,對數(shù)據(jù)表進行約簡,去除冗余信息,提取啟發(fā)式規(guī)則,進行評價[19].但經(jīng)典RS 并未考慮數(shù)據(jù)與目標(biāo)概念之間的覆蓋關(guān)系,因此,概率粗糙集(Probabilistic rough set,PRS)應(yīng)運而生[20?22].PRS 定義了等價類與目標(biāo)概念的隸屬程度,以后驗概率的形式量化數(shù)據(jù)與目標(biāo)概念之間的覆蓋關(guān)系.
定量方法的優(yōu)勢在于:精度高,能夠建立變量之間的相關(guān)性,預(yù)測性能較好,是提取過程內(nèi)部特性的方法,適用于變量測量準(zhǔn)確的過程.但是,傳統(tǒng)定量方法解釋性差,在樣本數(shù)目少時,可能會出現(xiàn)病態(tài)的模型.定性方法的優(yōu)勢在于:解釋性強,可以處理不精確的信息,模型建立容易,適用于過程存在定性信息的過程.但是,傳統(tǒng)定性方法精度低,要求數(shù)據(jù)類型覆蓋所有可能的運行情況,是提取過程外部特性的方法,預(yù)測性能較差.若采用定性方法處理定量變量,需要將定量信息離散化,在信息離散化過程中,會損失有效信息,降低評價精度.綜上所述,定量與定性方法各有優(yōu)、劣勢,相輔相成.在實際流程工業(yè)生產(chǎn)中,既有定量變量,又有定性變量.由于定性、定量變量共存的問題,傳統(tǒng)評價方法難以直接應(yīng)用.
實際工業(yè)過程還可能面臨一個巨大的挑戰(zhàn),即流程工業(yè)特性.流程工業(yè)過程生產(chǎn)流程長,規(guī)模龐大,變量數(shù)目巨大,變量相關(guān)性復(fù)雜.一個流程工業(yè)生產(chǎn)過程,通常包含若干生產(chǎn)單元.同一個生產(chǎn)單元內(nèi),變量強耦合,不同生產(chǎn)單元間,變量弱耦合.生產(chǎn)過程從前至后,依序進行,每一個生產(chǎn)單元的生產(chǎn)時間不盡相同.因此,將傳統(tǒng)的評價方法直接應(yīng)用于流程工業(yè)過程,常常難以得到令人滿意的準(zhǔn)確率.流程工業(yè)過程生產(chǎn)周期長、變量眾多、機理復(fù)雜,難以建立準(zhǔn)確的全局模型.最常用的處理流程工業(yè)特性的方法就是將過程根據(jù)物理特性劃分層次和子塊,這種措施已廣泛應(yīng)用于安全性能評價中[23?24].Macgregor 等[25]和Jiang 等[26]分別提出了分塊的多元統(tǒng)計方法和分塊的概率論方法,來處理流程工業(yè)過程性能評價問題.相比于分塊方法,分層的性能評價方法更注重子塊之間的相關(guān)性[27].在分層或分塊性能評價思想的基礎(chǔ)上,研究者在質(zhì)量預(yù)測[28]、自適應(yīng)[29]等方向進行了進一步探索.但目前對流程工業(yè)過程優(yōu)性評價的研究還較少.傳統(tǒng)的分層分塊性能評價方法難以直接應(yīng)用于實際流程工業(yè)過程運行狀態(tài)評價中,主要原因如下:1)全流程的評價問題難以分解為子塊的評價問題;2)子塊的優(yōu)性難以定義;3)未考慮定量、定性變量共存問題.
本文提出一種基于兩層分塊混合模型的流程工業(yè)過程運行狀態(tài)評價方法.橫向上,將流程工業(yè)過程,根據(jù)其物理特性劃分子塊,將聯(lián)系緊密的設(shè)備或生產(chǎn)環(huán)節(jié)劃分至同一子塊內(nèi),將聯(lián)系相對較弱的設(shè)備或生產(chǎn)環(huán)節(jié)劃分至不同子塊;縱向上,形成兩個評價層次即子塊層和全流程層.本文所提兩層分塊方法與傳統(tǒng)方法不同之處在于,所提方法能夠評價子塊的優(yōu)劣程度,不需要顯式的全流程模型即可評價全流程的運行狀態(tài),并快速定位非優(yōu)的子塊.這種靈活的分層分塊評價方式,為混合模型的建立提供了便利.在一個子塊內(nèi),綜合考慮評價精度需求、定量和定性變量的比例、模型建立的復(fù)雜度,來選擇定量或者定性方法進行建模和評價.不失一般性的,本文假設(shè):以定量信息為主的子塊,采用GMM 進行建模,獲取子塊內(nèi)各運行狀態(tài)等級數(shù)據(jù)分布的概率密度函數(shù);以定性信息為主的子塊,采用PRS 進行建模,得到子塊內(nèi)各運行狀態(tài)等級的推理規(guī)則;于是,可以建立兩層分塊GMM-PRS (Gaussion mixture model-probabilistic rough set)模型.該混合模型的優(yōu)勢在于,根據(jù)子塊的數(shù)據(jù)特性,靈活地選用恰當(dāng)?shù)脑u價方法,可減少有效信息的損失,保證方法的有效性.最后,本文將所提基于兩層分塊GMM-PRS模型的評價方法應(yīng)用于國內(nèi)某黃金濕法冶煉過程中,驗證其有效性.此外,綜合經(jīng)濟效益是目前應(yīng)用最廣泛的過程運行狀態(tài)評價指標(biāo)之一,本文采用綜合經(jīng)濟效益為全流程運行狀態(tài)評價指標(biāo).
高斯分布是一種常見的數(shù)據(jù)分布,若高維空間點的分布近似為橢球體,則可用單一高斯密度函數(shù)來描述這些數(shù)據(jù)的分布特性.
令R1×J是服從高斯分布的J維過程數(shù)據(jù),該類數(shù)據(jù)的概率密度函數(shù)可以用高斯函數(shù)表示:
其中,參數(shù)θ{μ,Σ},μ為該類數(shù)據(jù)的均值向量,Σ為協(xié)方差矩陣[11].這些參數(shù)的取值決定了概率密度函數(shù)的特性,如函數(shù)的中心點、寬窄和形狀等.
一些過程數(shù)據(jù)不服從高斯分布,但可以用高斯混合模型描述其分布特性.假設(shè)該過程數(shù)據(jù)分布包含N個高斯分量,第n個高斯分量的概率密度函數(shù)表示為g(x|θn),其先驗概率為ωn,n1,2,···,N.則此過程概率密度函數(shù)為:
數(shù)據(jù)x屬于各高斯分量的概率可用貝葉斯理論求得:
其中,Cn表示第n個高斯成分.
RS是一種在不需要過程先驗知識的情況下進行推理的方法,針對定性數(shù)據(jù),可進行高效、準(zhǔn)確的推理.但是,RS存在沒考慮子集間相關(guān)性和定義過于嚴(yán)格的問題.因此,PRS應(yīng)運而生.
令U為目標(biāo)的非空有限集合,U稱作論域,A為一個有限的屬性集合,R是A的一個子集.對于任意,定義x在R上的等價類[x]R為[x]R(x,a)f(y,a)},其中,f(x,a)為x在屬性a上的取值.給定一個非空子集X ?U和一個等價類[x]R,可以計算如下概率:
其中,|S|表示集合S的基,即S中的元素個數(shù).P(X|[x]R)表示[x]R中,X的覆蓋程度.
給定閾值α和β,針對0≤β <α≤1的情況,X的下近似、上近似、R邊界域定義為:
針對αβ0的情況,X的下近似、上近似、R邊界域定義為:
X的下近似中,包含所有一定屬于X的元素;X的上近似中,包含所有可能屬于X的元素.如果邊界域BNR(X)為空,那么X稱為精確集;否則,X稱為粗糙集.如果取α1、β0,PRS退化為傳統(tǒng)RS.
根據(jù)流程工業(yè)特性,本文提出兩層分塊評價結(jié)構(gòu),并根據(jù)每個子塊的數(shù)據(jù)特性,分別用定量或定性方法,建立子塊評價模型.
過程運行狀態(tài)的優(yōu)劣通??煞从吃诰C合經(jīng)濟指標(biāo)(Comprehensiveeconomicindex,CEI)上,CEI越高,運行狀態(tài)越好,CEI 也成為了廣泛接受的運行狀態(tài)優(yōu)性評價指標(biāo)[23].傳統(tǒng)評價方法對過程變量x和評價指標(biāo)CEI可建立一個單模型:
為了降低流程工業(yè)過程運行狀態(tài)評價問題的規(guī)模、提高模型解釋性,本文提出如圖1所示的兩層分塊結(jié)構(gòu);并且,對以定量和定性信息為主的子塊,分別進行定量和定性建模.
在子塊層,一個流程工業(yè)過程根據(jù)其過程特性,劃分為多個有物理意義的子塊.子塊內(nèi),變量相關(guān)性強;子塊間,變量相關(guān)性弱.在全流程層,提取各子塊間的相關(guān)性.因此,兩層分塊結(jié)構(gòu)增強了模型解釋性,減少了問題規(guī)模,降低了建模難度,削弱了對子塊性能無關(guān)變量的影響,放大了對子塊性能有關(guān)變量的影響.
圖1 兩層分塊混合模型結(jié)構(gòu)示意圖Fig.1 The illustration of the two-level multi-block hybrid model structure
將過程進行橫向分塊、縱向分層后,得到了兩層分塊結(jié)構(gòu),再根據(jù)每個子塊的特性建立相應(yīng)評價模型,為全流程的評價提供基礎(chǔ).按照子塊的數(shù)據(jù)特性選擇適當(dāng)?shù)慕7椒?保證了模型的有效性和精度.高斯分布是一種常見的數(shù)據(jù)分布,若高維空間點的分布近似為橢球體,則可用單一高斯密度函數(shù)來描述這些數(shù)據(jù)的概率密度函數(shù).針對以定量信息為主的單模態(tài)過程,同一運行狀態(tài)等級的定量數(shù)據(jù)分布特性相似,近似服從單高斯分布,可視為所有定量數(shù)據(jù)分布的一個高斯成分.過程中,定性變量的數(shù)目和狀態(tài)種類都較少,因此,定性變量可能出現(xiàn)狀態(tài)組合種類不會很多,其分布可以用歷史數(shù)據(jù)進行學(xué)習(xí).而對于定性信息占主導(dǎo)地位的過程,定性變量數(shù)目多,相應(yīng)定性狀態(tài)的組合數(shù)目也會大幅增大.那么,基于GMM 的方法,會面臨組合爆炸、建模數(shù)量龐大的問題.也就是說,以定性變量為主的過程,不再適合用基于概率分布的方法來進行評價.Pawlak 教授提出的RS 理論是一種在不確定性存在的前提下,進行推理的方法,現(xiàn)已廣泛應(yīng)用于安全性評價和風(fēng)險評價等領(lǐng)域.為改進RS 無法處理不一致規(guī)則的問題,概率粗糙集PRS 方法應(yīng)運而生.PRS 是一種具有嚴(yán)格理論支撐并且應(yīng)用廣泛的定性信息處理方法,因此本文采用PRS 對以定性信息為主的子塊進行建模.值得注意的是,可選的子塊建模方法并不局限于GMM 和PRS 方法.
2.1.1 運行狀態(tài)等級確定
本文所述定性信息指用語義變量對變量狀態(tài)進行描述的信息,定量信息指用數(shù)值大小描述的變量信息.建模數(shù)據(jù)中,定量變量以變量取值的形式表示,定性變量以變量狀態(tài)等級序號的形式表示,如溫度的高、中、低三種狀態(tài),分別對應(yīng)狀態(tài)等級1、2、3.其中,定性變量狀態(tài)等級只與變量幅值大小趨勢相關(guān),與性能優(yōu)劣無關(guān).本文所使用的定量數(shù)據(jù)是經(jīng)過平滑處理后的數(shù)據(jù),定性數(shù)據(jù)根據(jù)其物理意義劃分為了不同狀態(tài),并用一系列連續(xù)的正整數(shù)對狀態(tài)等級進行區(qū)分.其中,平滑處理的原理是用一定長度的滑動窗口內(nèi)數(shù)據(jù)的平均水平來代表該滑動窗口的信息,這種預(yù)處理方法在一定程度上克服了噪聲的影響,使此均值更能反映滑動窗口內(nèi)的主要信息.針對變化快速或噪聲水平較低的過程,為避免過程動態(tài)特性被淹沒,滑動窗口長度不宜過長.針對變化緩慢或噪聲水平較高的過程,為減少系統(tǒng)正常波動導(dǎo)致的誤評價,滑動窗口長度不宜過短.
根據(jù)過程知識,建立兩層分塊結(jié)構(gòu)之后,基于兩層分塊GMM-PRS 的評價模型離線建立包括運行狀態(tài)等級確定和模型建立,其中,模型建立分定量GMM 和定性PRS 模型.
針對一個復(fù)雜的流程工業(yè)過程,在劃分單元子塊之后,如果各子塊存在獨立的評價指標(biāo),那么可以對每個子塊建立以子塊生產(chǎn)指標(biāo)為評價標(biāo)準(zhǔn)的模型,再在子塊生產(chǎn)指標(biāo)的基礎(chǔ)上,進行全流程的運行狀態(tài)評價.但是,本文旨在解決無子塊評價指標(biāo)的流程工業(yè)過程運行狀態(tài)優(yōu)性評價問題.此時,子塊的優(yōu)性定義變得十分困難.本文利用唯一的評價指標(biāo)– 全流程綜合經(jīng)濟指標(biāo)CEI,作為子塊運行狀態(tài)等級劃分標(biāo)準(zhǔn).企業(yè)通常會在一定周期內(nèi)對CEI 進行估算并作為生產(chǎn)考核的標(biāo)準(zhǔn),但是估算周期比較長,無法直接根據(jù)該估算結(jié)果實時指導(dǎo)生產(chǎn).所以,我們可以將CEI 視作定性變量,只需確定其在一定周期內(nèi)的定性狀態(tài).根據(jù)全流程CEI 的定性狀態(tài),過程運行狀態(tài)被劃分為若干等級,等級數(shù)目通常由過程評價的精度需求、過程檢測情況等因素共同決定.本文假設(shè)全流程綜合經(jīng)濟指標(biāo)包含N個狀態(tài),對應(yīng)的全流程運行狀態(tài)等級由1 至N,優(yōu)性依次降低.在劃分子塊后,就一個子塊的一類運行情況而言,定義此類運行情況下所能達到的最好全流程運行狀態(tài)等級為這種運行情況下該子塊的運行狀態(tài)等級.從另一個角度看,該運行情況下,當(dāng)其他子塊都處于最好匹配狀態(tài)時,該子塊使全流程所能達到的最好等級代表了該子塊所處運行情況的極限最好情況,是子塊所處運行情況固有特性的一種體現(xiàn).如圖2 所示,建模數(shù)據(jù)的運行狀態(tài)等級離線確定方法包括以下三個步驟:1)數(shù)據(jù)塊劃分,2)全流程層等級確定,3)子塊層等級確定.
1)數(shù)據(jù)塊劃分
令建模數(shù)據(jù)為RH×J,H表示樣本個數(shù),J表示變量個數(shù).根據(jù)變量和子塊之間的關(guān)系,將建模數(shù)據(jù)XXX劃分為I個子塊,用XXXiRH×Ji(i1,2,···,I)表示第i個子塊的建模數(shù)據(jù),Ji為第i個子塊的變量數(shù)目.
2)全流程層等級確定
根據(jù)全流程評價指標(biāo)CEI,過程運行狀態(tài)被劃分為若干等級,如:優(yōu)/良/中/差等.那么,每一個子塊數(shù)據(jù)XXXi,可以根據(jù)全流程評價指標(biāo)CEI,劃分為不同等級,記為其中,表示子塊i中全流程等級為n的數(shù)據(jù),i1,2,···,I,n1,2,···,N,I為子塊數(shù)目,N為全流程等級數(shù)目.
圖2 離線數(shù)據(jù)劃分示意圖Fig.2 The diagram of data processing
3)子塊層等級確定
由于全流程層運行狀態(tài)等級不能單獨取決于一個子塊的運行狀態(tài),所以,相似的子塊數(shù)據(jù)可能被標(biāo)記了不同的全流程層運行狀態(tài)等級.對于一個子塊:若該子塊運行于最優(yōu)運行狀態(tài),并且其他子塊運行于最優(yōu)匹配狀態(tài)時,全流程層運行狀態(tài)可能達到最優(yōu)等級;若該子塊運行于一個非優(yōu)運行狀態(tài)中,無論其他子塊是否運行于最優(yōu)匹配狀態(tài),全流程層運行狀態(tài)都不可能達到最優(yōu)等級.因此,一個子塊數(shù)據(jù)的子塊層運行狀態(tài)等級定義為:該子塊內(nèi)相同數(shù)據(jù)所能達到的最好全流程層運行狀態(tài)等級.所以,全流程層的等級數(shù)目和子塊層的等級數(shù)目相等.假設(shè)運行狀態(tài),等級1 到N的優(yōu)性依次降低.確定子塊層運行狀態(tài)等級n中數(shù)據(jù)的具體做法為:以全流程層等級n,n+1,···,N中數(shù)據(jù)為基礎(chǔ),將等級n+1,n+2···,N中與等級n中數(shù)據(jù)相似度大于閾值ε的數(shù)據(jù),從原來的等級中轉(zhuǎn)移至等級n的數(shù)據(jù)集中,更新后的等級n中的數(shù)據(jù)為子塊層運行狀態(tài)等級為n的數(shù)據(jù),記為,更新后的等級n+1,n+2,···,N中的數(shù)據(jù)為確定下一等級數(shù)據(jù)的基礎(chǔ).兩條數(shù)據(jù)的相似度定義如下:
x1,j(x2,j)是x1(x2)的第j個變量;若第j個變量為定量變量,是該變量的工藝最大值(最小值);若第j個變量為定性變量,|x1,j?x2,j|表示x1,j和x2,j對應(yīng)定性狀態(tài)等級的等級差值的絕對值;Aj是第j個變量的狀態(tài)等級數(shù)目,為變量數(shù)目.
根據(jù)上述三個步驟,子塊數(shù)據(jù)的全流程層等級和子塊層等級能相應(yīng)確定.由于上述等級劃分規(guī)則,并不需要建立顯式的全流程層模型.全流程層運行狀態(tài)等級由子塊層中最劣的子塊運行狀態(tài)等級決定,原因?qū)⒃诘? 節(jié)的全流程運行狀態(tài)在線評價方法中闡述.
2.2.1 定量建模
針對以定量信息為主的子塊,將每一個運行狀態(tài)等級的數(shù)據(jù)作為一個高斯分量,分別建立單高斯模型,擬合各等級數(shù)據(jù)的概率密度函數(shù).但由于少數(shù)定性變量的存在,無法直接建立高斯模型.
假設(shè)x來自于第i個子塊的第n個等級,即.令其中,表示定性變量,表示定量變量.根據(jù)定性變量狀態(tài)的不同,存在多種組合形式.以定量信息為主的子塊所含定性變量數(shù)目少,一個定性變量的狀態(tài)種類一般不會很多,不是每一種理論上存在的定性組合都會在實際應(yīng)用中出現(xiàn).所以,中可能出現(xiàn)的定性狀態(tài)組合種類一般不會很多.用表示中,定性變量對應(yīng)為的樣本的定量變量部分,其中,k1,2,···,K,K為定性變量組合的數(shù)目.假設(shè)則針對定性變量為的情況,第i個子塊第n個等級的概率密度函數(shù)可用高斯函數(shù)表示為:
其中,Num[ψ]表示矩陣ψ中的樣本個數(shù).
2.2.2 定性建模
針對以定性信息為主的子塊,采用PRS 進行建模.基于PRS 的離線建模包含以下三個主要步驟:1)數(shù)據(jù)預(yù)處理;2)決策表組織;3)屬性約簡.
1)數(shù)據(jù)預(yù)處理
PRS 是一種以定性或離散數(shù)據(jù)為基礎(chǔ)的推理方法,因此,需要將數(shù)據(jù)進行相應(yīng)預(yù)處理.針對定性數(shù)據(jù),為后文計算方便,將變量的各定性狀態(tài)用一系列整數(shù)表示.針對以定性信息為主的子塊中少數(shù)的定量數(shù)據(jù),需要將定量數(shù)據(jù)進行離散化,得到一系列離散數(shù)值.離散化處理方法很多,如等距離劃分、等頻率劃分、Naive Scaler 算法、基于斷點重要性的離散化算法、基于屬性重要性的離散化算法等[30].
2)決策表組織
決策表的每一列表示一個屬性,每個屬性的取值被劃分為若干離散狀態(tài).通常,屬性可分為條件屬性和決策屬性.決策表每一行代表論域中的一個元素和一種推理規(guī)則.以子塊內(nèi)過程變量為條件屬性,以子塊層運行狀態(tài)等級為決策屬性,分別建立各子塊決策表.
3)屬性約簡
屬性約簡目的在于簡化決策表,在保持分類能力不變的前提下,刪除對決策沒有影響的條件屬性.常用的屬性約簡方法有:一般約簡算法、基于差別矩陣和邏輯運算的屬性約簡算法、歸納屬性約簡算法等[30].
基于兩層分塊GMM-PRS 的過程運行狀態(tài)在線評價方法,先在子塊層,對各個子塊分別進行評價,再在全流程層,綜合各子塊信息得到最終評價結(jié)果.針對非優(yōu)運行狀態(tài),在非優(yōu)的子塊內(nèi)進行原因追溯.
用xt表示t時刻子塊i的數(shù)據(jù).若子塊i為以定量變量為主的子塊,xt可分解為xt中的定性變量取值與的相似度為sim針對等級n,如果max小于一個事先定義的判定閾值δ(0<δ ≤1),那么認(rèn)為xt不可能處于此等級,令否則,可以根據(jù)式(12)獲得.
若子塊i為以定性變量為主的子塊,在子塊內(nèi),首先,對定量變量進行離散化.然后,從歷史數(shù)據(jù)中得到xt的等價類[xt]R,其中,R為條件屬性集合.最后,根據(jù)式(4)計算[xt]屬于子塊層第n等級的概率:
其中,n1,2,···,N,i1,2,···,I.
t時刻,子塊i所處運行狀態(tài)等級為:
在獲得所有子塊的子塊層運行狀態(tài)等級后,全流程層運行狀態(tài)等級與子塊層最劣的子塊運行狀態(tài)等級相等.假設(shè)全流程層等級1 至N,優(yōu)性依次遞減.那么全流程層運行狀態(tài)等級表示為:
顯然,根據(jù)子塊等級定義,由于各子塊運行狀態(tài)等級被定義為相似度大于閾值ε的同類數(shù)據(jù)所能達到的歷史最好全流程層等級,所以全流程層運行狀態(tài)等級不可能比任何一個子塊的運行狀態(tài)等級更優(yōu).也就是說,全流程層運行狀態(tài)等級不會比子塊層最劣的子塊運行狀態(tài)等級更優(yōu).從另一個角度看,如果全流程層運行狀態(tài)等級比子塊層最劣的子塊運行狀態(tài)等級更劣,說明全流程層運行狀態(tài)等級比所有子塊運行狀態(tài)等級都更差.這種情況在實際生產(chǎn)中較少出現(xiàn),大部分子塊運行狀態(tài)應(yīng)與全流程運行狀態(tài)相一致.所以,定義全流程層運行狀態(tài)等級為子塊層最劣運行狀態(tài)等級,如式(15)所示.
針對以定性變量為主的子塊,直接在最優(yōu)運行狀態(tài)等級歷史數(shù)據(jù)中,查找與當(dāng)前非優(yōu)數(shù)據(jù)xt相似度最高的數(shù)據(jù),記為與上述追溯方法類似,用式(16)中的公式,計算變量貢獻率,貢獻率較大的屬性為非優(yōu)屬性.
濕法冶金過程是現(xiàn)代工業(yè)生產(chǎn)中金屬富集、分離與提取的重要手段和技術(shù).濕法冶金,又稱之為化學(xué)冶金,是相對于火法冶金和電解法冶金而言,一種利用液相環(huán)境的特點,通過一定的化學(xué)反應(yīng),進行目標(biāo)金屬的提煉和萃取的技術(shù).黃金濕法冶煉通過液相環(huán)境,將礦石中固相的金,浸出至礦漿中,形成液相的金氰絡(luò)合物離子.在浸出子塊中,氰化鈉是一種重要的添加藥劑,并通過影響浸出率來影響綜合經(jīng)濟效益.然后,通過洗滌進行固液分離,得到礦渣和富含金氰絡(luò)合物離子的貴液.其中,貴液經(jīng)過鋅粉,發(fā)生置換反應(yīng),得到金泥.在置換環(huán)節(jié)中,鋅粉的添加量和質(zhì)量對運行狀態(tài)影響較大.
本文將所提評價方法應(yīng)用于國內(nèi)某黃金濕法冶煉過程中,該過程可劃分為五個子塊:第一次浸出、第一次洗滌、第二次浸出、第二次洗滌和第二次置換,分別對應(yīng)子塊層的五個子塊.兩浸兩洗的工藝設(shè)置是為了提高浸出率.黃金濕法冶煉過程是一個復(fù)雜的流程工業(yè)過程,同時包含定量和定性變量.第一次浸出和第二次浸出子塊以定量信息為主,因此,用GMM 對這兩個子塊進行建模.第一次洗滌和第二次洗滌子塊以定性信息為主,因此,用PRS 對這兩個子塊進行建模.至于置換子塊,定性和定量信息大量共存,沒有某種信息占主導(dǎo)地位的現(xiàn)象.但是,其影響優(yōu)性的關(guān)鍵變量均為定性變量,故采用PRS 對置換子塊進行建模.
選取36 個過程變量,列于表1.根據(jù)綜合經(jīng)濟效益先將黃金濕法冶煉全流程層運行狀態(tài)劃分為優(yōu)、中、差3 個等級,分別對應(yīng)等級1、2、3.從濕法冶金仿真平臺,選取3 000 組數(shù)據(jù)進行離線建模,其中,每個等級的數(shù)據(jù)各1 000 組,建模數(shù)據(jù)量充分,可以建立準(zhǔn)確的離線模型.然后,確定每個子塊各個等級所包含的數(shù)據(jù),即確定數(shù)據(jù)子塊層等級.根據(jù)5個子塊的特性,分別建立GMM 或PRS 模型.設(shè)置相似度判定閾值ε0.9.
重新選取400 組數(shù)據(jù)進行在線測試,實驗設(shè)計如表2 所示.在實驗1 中,前100 組數(shù)據(jù)運行狀態(tài)等級為優(yōu)(等級1),后100 組數(shù)據(jù)由于氰化鈉添加量2 (子塊3,定量)不足,導(dǎo)致運行狀態(tài)等級變?yōu)椴?等級3).在實驗2 中,前100 組數(shù)據(jù)運行狀態(tài)等級為優(yōu),后100 組數(shù)據(jù)由于鋅粉添加量(子塊5,定性)過量,導(dǎo)致運行狀態(tài)等級變?yōu)橹?其中,在實際生產(chǎn)中,鋅粉添加量只能獲得8 小時的累積量,因此,在本實驗中,將該變量作為定性變量進行處理.用所提方法進行運行狀態(tài)在線評價和非優(yōu)原因追溯,以驗證其有效性.
表1 過程變量列表Table 1 The process variable list
表2 實驗設(shè)計Table 2 The experiment design
實驗1 的評價結(jié)果如圖3 所示,在評價時間內(nèi):子塊1、2、4、5 都處于等級1;子塊3 前100 個評價點處于等級1,后100 個評價點處于等級3;全流程運行狀態(tài)評價結(jié)果為前100 個評價點處于等級1,后100 個評價點處于等級3.顯然,評價結(jié)果與實際運行狀態(tài)等級設(shè)置一致.從第101 個評價點起,全流程運行狀態(tài)等級為非優(yōu)等級,導(dǎo)致全流程非優(yōu)的是子塊3,第二次浸出子塊.因此,在子塊3 中,進行非優(yōu)原因追溯.第101 個評價點的非優(yōu)原因追溯結(jié)果如圖4 所示,顯示非優(yōu)原因變量有第二次浸出氰化鈉添加量、第二次浸出后氰根離子濃度和第二次浸出后金氰絡(luò)合物離子濃度.事實上,由于第二次氰化鈉添加量不足,會導(dǎo)致第二次浸出后氰根離子和金氰絡(luò)合物離子濃度下降.因此,非優(yōu)原因追溯結(jié)果與實際情況一致.
圖3 實驗1 運行狀態(tài)等級在線評價結(jié)果Fig.3 The assessment result in Case 1
實驗2 的評價結(jié)果如圖5 所示,在評價時間內(nèi):子塊1、2、3、4 都處于等級1;子塊5 前100 個評價點處于等級1,后100 個評價點處于等級2;相應(yīng)的,全流程評價結(jié)果為前100 個評價點處于運行狀態(tài)等級1,后100 個評價點處于等級2.評價結(jié)果與實際運行狀態(tài)等級設(shè)置一致.然后,在非優(yōu)的子塊中,進行原因追溯.非優(yōu)的子塊為置換子塊,是一個定性建模的子塊,其追溯結(jié)果展示于圖6.實際上,鋅粉添加量過多,置換率已無法再提升,反而會增加置換物耗,降低總經(jīng)濟效益,導(dǎo)致運行狀態(tài)等級變?yōu)榉莾?yōu).
圖4 實驗1 子塊3 中非優(yōu)原因追溯結(jié)果Fig.4 The cause identification result within Sub-block 3 in Case 1
與傳統(tǒng)評價方法相比,兩層分塊GMM-PRS 主要在分層分塊和混合模型兩方面做了改進.分層分塊使得評價難度降低,解釋性強,可以直接在非優(yōu)子塊中進行原因追溯,快速定位原因變量.混合模型充分利用不同變量提供的信息,提高了評價精度.將PRS、兩層分塊PRS、GMM、兩層分塊GMM 和兩層分塊GMM-PRS 方法分別應(yīng)用于黃金濕法冶煉過程運行狀態(tài)評價中,經(jīng)過多次試驗,評價準(zhǔn)確率均值如表3 所示.其中,基于PRS 的評價,對全流程建立一個PRS 模型;基于兩層分塊PRS 的評價,將全流程進行層次和子塊的劃分,對每個子塊分別建立一個PRS 模型;基于GMM 的評價,針對全流程不同定性變量的組合,分別建立全流程的GMM;基于兩層分塊GMM 的評價,將全流程進行層次和子塊的劃分,在子塊內(nèi),針對不同定性變量的組合,分別建立GMM.從準(zhǔn)確率的對比可以看出,相比于PRS、兩層分塊PRS、GMM 方法,本文所提兩層分塊GMM-PRS 具有明顯優(yōu)勢.兩層分塊GMM 方法,由于應(yīng)用了本文所提的分層分塊和針對不同定性變量組合分別建立GMM 的思想,具有與兩層分塊GMM-PRS 相當(dāng)?shù)恼_率.但是,相比于兩層分塊GMM 方法,所提兩層分塊GMM-PRS 具有模型數(shù)量少、計算量小、計算時間短的優(yōu)勢.
圖5 實驗2 運行狀態(tài)等級在線評價結(jié)果Fig.5 The assessment result in Case 2
圖6 實驗2 子塊5 中非優(yōu)原因追溯結(jié)果Fig.6 The cause identification result within Sub-block 5 in Case 2
表3 不同方法評價準(zhǔn)確率對比Table 3 The assessment accuracy rate comparison of different methods
針對定量、定性變量共存的流程工業(yè)過程運行狀態(tài)評價問題,本文提出了基于兩層分塊混合模型的評價方法.將流程工業(yè)過程,根據(jù)其物理特性劃分為運行子塊,同時,形成了子塊層和全流程層,兩個評價層次.在子塊層,對于以定量信息為主的子塊,根據(jù)不同的定性變量狀態(tài)組合,分別建立GMM.對于以定性信息為主的子塊,將定量變量進行離散化,建立PRS 模型.全流程層運行狀態(tài)等級由子塊層最劣運行狀態(tài)等級決定.當(dāng)過程運行于非優(yōu)運行狀態(tài)等級,非優(yōu)的子塊可根據(jù)子塊運行狀態(tài)評價結(jié)果進行確定.在非優(yōu)的子塊內(nèi),本文提出了基于貢獻率的原因追溯方法.最后,本文將所提方法應(yīng)用于濕法冶金過程運行狀態(tài)評價中,并與傳統(tǒng)方法進行了比較.仿真結(jié)果證明了所提方法的有效性和優(yōu)勢.