劉鵬濤
(國家管網(wǎng)集團(tuán) 西部管道有限責(zé)任公司,甘肅 蘭州 730070)
壓縮機(jī)組作為天然氣管道系統(tǒng)的關(guān)鍵特種設(shè)備,通常由壓縮機(jī)本體、密封系統(tǒng)、潤(rùn)滑系統(tǒng)以及輔助子系統(tǒng)組成[1],各個(gè)子系統(tǒng)之間相互協(xié)調(diào)與配合,通過壓縮機(jī)本體對(duì)氣體做功的形式提升燃?xì)獾臏囟群蛪毫?為燃?xì)獾倪h(yuǎn)距離輸送提供了動(dòng)力保障。在燃?xì)夤艿篱L(zhǎng)輸?shù)倪^程中,通常利用數(shù)據(jù)采集與監(jiān)控系統(tǒng)[2](SCADA)實(shí)現(xiàn)壓縮機(jī)組監(jiān)控參數(shù)的數(shù)據(jù)采集、信號(hào)調(diào)節(jié)以及報(bào)警等任務(wù),為確保長(zhǎng)輸管道安全運(yùn)行和統(tǒng)一調(diào)度管理提供了保障。以國家管網(wǎng)集團(tuán)西部天然氣管道為例,沿線各個(gè)場(chǎng)站的壓縮機(jī)組監(jiān)控全部采用SCADA,實(shí)現(xiàn)遠(yuǎn)程監(jiān)視、控制、調(diào)度和管理各站的壓縮機(jī)組,提升了壓縮機(jī)組的透明度和可控性,大幅降低了事故維修成本,為西部天然氣管道的平穩(wěn)運(yùn)行提供了安全保障[3]。
然而,SCADA對(duì)于關(guān)鍵參數(shù)的報(bào)警只是基于當(dāng)參數(shù)取值達(dá)到設(shè)定值才發(fā)出報(bào)警,當(dāng)報(bào)警發(fā)生時(shí)需要值班人員立即采取措施,如果處理不及時(shí)或者處理不當(dāng)引發(fā)機(jī)組緊急停機(jī),嚴(yán)重影響生產(chǎn)安全。報(bào)警等級(jí)按重要程度分為低低報(bào)警、低報(bào)警、高報(bào)警和高高報(bào)警,其中低低報(bào)警和高高報(bào)警屬于停車值,低報(bào)和高報(bào)是預(yù)警值。在正常的生產(chǎn)運(yùn)行過程中,需要值班人員實(shí)時(shí)查看和分析關(guān)鍵參數(shù)的歷史曲線,結(jié)合工作經(jīng)驗(yàn)、現(xiàn)場(chǎng)環(huán)境以及歷史參數(shù)值波動(dòng)趨勢(shì),人為推斷當(dāng)前的參數(shù)取值是否將要達(dá)到報(bào)警值,確保機(jī)組的平穩(wěn)運(yùn)行。目前,國家管網(wǎng)集團(tuán)處于數(shù)字化轉(zhuǎn)型的關(guān)鍵時(shí)期,以自動(dòng)化代替手工、智能化驅(qū)動(dòng)模式創(chuàng)新迫在眉睫,如何利用流程運(yùn)行、AI算法和數(shù)據(jù)使這些關(guān)鍵點(diǎn)實(shí)現(xiàn)數(shù)字化、智能化轉(zhuǎn)型,成為急需突破的難點(diǎn)[4]。僅依據(jù)SCADA設(shè)定的報(bào)警值和歷史運(yùn)行數(shù)據(jù),以操作人員的工作經(jīng)驗(yàn)和專業(yè)素養(yǎng)來推斷機(jī)組的運(yùn)行狀態(tài),顯然不符合數(shù)字化轉(zhuǎn)型的策略。
近年來,隨著數(shù)字化、智能化技術(shù)普及,壓縮機(jī)組運(yùn)行過程中大量的歷史數(shù)據(jù)逐漸被挖掘和利用,以神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)算法在圖像識(shí)別[5]、機(jī)器翻譯[6]、自然語言處理[7]等方面的成功應(yīng)用,吸引了一大批研究學(xué)者投身于燃?xì)鈹?shù)據(jù)挖掘中[8-10]。2018年,Li等人[8]利用長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)挖掘進(jìn)氣溫度對(duì)排氣溫度的影響,利用規(guī)范變量分析將排氣溫度的變化作為評(píng)判壓縮機(jī)組的運(yùn)行性能的依據(jù)。與之不同,Li等人[9]采用遺傳算法與反向傳播神經(jīng)網(wǎng)絡(luò)訓(xùn)練機(jī)組歷史出口壓力數(shù)據(jù)并對(duì)其預(yù)測(cè),提出一種基于狀態(tài)參數(shù)學(xué)習(xí)的故障預(yù)測(cè)模型。雖然這些方法有效地預(yù)測(cè)了參數(shù)取值,但僅利用單個(gè)參數(shù)取值訓(xùn)練模型使其結(jié)果作為故障預(yù)警的依據(jù)并不可靠[10];此外當(dāng)數(shù)據(jù)分布的差異性較小時(shí),依據(jù)遺傳算法進(jìn)行特征提取會(huì)更加降低預(yù)警準(zhǔn)確性[11]。為降低數(shù)據(jù)噪聲,提高預(yù)警準(zhǔn)確度,Wang等人依據(jù)模糊C均值聚類去除壓縮機(jī)組運(yùn)行數(shù)據(jù)中的特征混疊,采用RNN訓(xùn)練壓縮機(jī)運(yùn)行過程中的振動(dòng)、壓力和溫度參數(shù)數(shù)據(jù),預(yù)測(cè)機(jī)組參數(shù)取值,提出了一種融合多源信息的壓縮機(jī)故障預(yù)警模型[12]。Qiu等人利用隱馬爾可夫模型的隱態(tài)分析獲得機(jī)組監(jiān)控參數(shù)隱含特征,通過深度置信網(wǎng)絡(luò)直接訓(xùn)練隱含特征來預(yù)測(cè)參數(shù)取值,以此評(píng)估壓縮機(jī)組的運(yùn)行狀態(tài)[13]。然而,SCADA是以秒為單位采集數(shù)據(jù)的[14],在較短的時(shí)間間隔內(nèi)會(huì)產(chǎn)生大量的重復(fù)數(shù)據(jù),當(dāng)數(shù)據(jù)規(guī)模較大時(shí),僅通過優(yōu)化算法模型降低數(shù)據(jù)冗余取得的預(yù)警效果并不明顯[15]。此外,Tian等人考慮時(shí)間效應(yīng)對(duì)機(jī)組參數(shù)取值的影響,通過設(shè)計(jì)時(shí)間特征提取策略,將參數(shù)在不同周期的表示特征重構(gòu)為時(shí)間序列,提出了一種基于深度置信網(wǎng)絡(luò)的時(shí)空特征融合故障診斷方法(STF-DBN)[16]。雖然該方法提升了預(yù)警準(zhǔn)確度,但是并沒有考慮不同子系統(tǒng)參數(shù)之間的隱含關(guān)聯(lián)。壓縮機(jī)組是由多個(gè)子系統(tǒng)組成的復(fù)雜集成運(yùn)行系統(tǒng),關(guān)鍵監(jiān)控參數(shù)取值必然會(huì)受到多個(gè)子系統(tǒng)參數(shù)的影響[17],如機(jī)組出口溫度和壓力受外界環(huán)境、動(dòng)力渦輪轉(zhuǎn)速、上游壓力和溫度、空冷系統(tǒng)等多種因素影響,當(dāng)這些影響因素發(fā)生變化時(shí),造成出口溫度的異常升高,進(jìn)而影響壓縮機(jī)組的正常運(yùn)行。
基于此,本文利用節(jié)點(diǎn)表示模型離散化機(jī)組監(jiān)控參數(shù)取值,將參數(shù)的連續(xù)取值轉(zhuǎn)化為不同時(shí)間點(diǎn)對(duì)應(yīng)的節(jié)點(diǎn)表示以此降低數(shù)據(jù)冗余。之后通過相關(guān)系數(shù)獲得各個(gè)時(shí)間點(diǎn)下關(guān)鍵參數(shù)節(jié)點(diǎn)的近鄰節(jié)點(diǎn)集,來量化關(guān)鍵節(jié)點(diǎn)與近鄰節(jié)點(diǎn)之間的隱含關(guān)聯(lián)。最后依據(jù)LSTM模型訓(xùn)練時(shí)序近鄰節(jié)點(diǎn)集,實(shí)現(xiàn)關(guān)鍵參數(shù)節(jié)點(diǎn)的取值預(yù)測(cè)。針對(duì)關(guān)鍵參數(shù)的取值預(yù)警,一方面可以減輕現(xiàn)場(chǎng)值班人員的工作負(fù)擔(dān)并降低臨時(shí)預(yù)警恐慌度;另一方面通過制定合理的設(shè)置處理方案,大幅減少誤操作帶來的經(jīng)濟(jì)損失,降低設(shè)備維修和處理成本,確保壓縮機(jī)組安全可靠運(yùn)行。
針對(duì)壓縮機(jī)組不同子系統(tǒng)監(jiān)控參數(shù)之間的時(shí)序相關(guān)性對(duì)關(guān)鍵參數(shù)取值的影響,同時(shí)為降低SCADA監(jiān)控參數(shù)取值的數(shù)據(jù)冗余,本文提出了基于循環(huán)神經(jīng)網(wǎng)絡(luò)壓縮機(jī)組性能預(yù)測(cè)模型,增強(qiáng)對(duì)機(jī)組參數(shù)的預(yù)警準(zhǔn)確度,模型實(shí)現(xiàn)流程如圖1所示,首先將SCADA監(jiān)測(cè)參數(shù)值離散化為節(jié)點(diǎn)表示,接著依據(jù)相關(guān)系數(shù)挖掘參數(shù)節(jié)點(diǎn)之間的隱含關(guān)聯(lián),獲得關(guān)鍵參數(shù)的時(shí)序近鄰節(jié)點(diǎn)集,之后將時(shí)序近鄰節(jié)點(diǎn)集作為L(zhǎng)STM網(wǎng)絡(luò)的輸入,通過不斷地訓(xùn)練網(wǎng)絡(luò)模型實(shí)現(xiàn)關(guān)鍵參數(shù)的取值預(yù)警。
圖1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)壓縮機(jī)組性能預(yù)測(cè)模型實(shí)現(xiàn)流程示意
SCADA以秒為單位獲取壓縮機(jī)組監(jiān)控參數(shù)數(shù)據(jù),同一個(gè)參數(shù)的取值在較短的時(shí)間間隔內(nèi)幾乎相同,這些相同的數(shù)據(jù)大幅增加了計(jì)算量。研究表明,在大量的時(shí)序的SCADA數(shù)據(jù)中,以間隔5 min為基準(zhǔn)取該段區(qū)間內(nèi)數(shù)據(jù)的平均值,可以獲得單個(gè)監(jiān)控參數(shù)精準(zhǔn)的預(yù)測(cè)結(jié)果[18]。為了提升計(jì)算效率,通過這種轉(zhuǎn)化方式,本文將時(shí)序的SCADA數(shù)據(jù)轉(zhuǎn)化為離散節(jié)點(diǎn)表示;同時(shí),考慮參數(shù)取值變化趨勢(shì)的差異性和預(yù)警監(jiān)測(cè)的及時(shí)性,將1 h內(nèi)獲得的12個(gè)區(qū)間離散值作為1組節(jié)點(diǎn)表示集合,由此給出了SCADA數(shù)據(jù)節(jié)點(diǎn)表示的定義描述。
經(jīng)過轉(zhuǎn)化之后,得到了不同時(shí)間點(diǎn)下各個(gè)監(jiān)控參數(shù)對(duì)應(yīng)的離散節(jié)點(diǎn)表示Sm×n×12,通過對(duì)Sm×n×12進(jìn)行近鄰節(jié)點(diǎn)集挖掘,可得到關(guān)鍵參數(shù)的時(shí)序近鄰節(jié)點(diǎn)集。
對(duì)關(guān)鍵參數(shù)的時(shí)序近鄰節(jié)點(diǎn)集挖掘是本文的核心,直接決定了模型預(yù)警的優(yōu)劣程度。在SCADA數(shù)據(jù)集當(dāng)中,并不是所有的監(jiān)控參數(shù)對(duì)關(guān)鍵參數(shù)的取值具有影響,并且在不同的時(shí)間節(jié)點(diǎn)下各個(gè)參數(shù)的取值呈現(xiàn)不同的特征,為降低無效數(shù)據(jù)對(duì)關(guān)鍵參數(shù)預(yù)警取值的干擾,同時(shí)考慮時(shí)間效應(yīng)對(duì)關(guān)鍵參數(shù)取值的影響,本文利用相關(guān)系數(shù)分析不同時(shí)間點(diǎn)內(nèi)各個(gè)參數(shù)節(jié)點(diǎn)的取值趨勢(shì),將與關(guān)鍵參數(shù)相關(guān)度較強(qiáng)的節(jié)點(diǎn)作為時(shí)序近鄰節(jié)點(diǎn)集。
1.2.1 相關(guān)系數(shù)
相關(guān)性分析作為一種統(tǒng)計(jì)方法,由于易理解、易擴(kuò)展等優(yōu)點(diǎn)常被用于定量描述節(jié)點(diǎn)之間的關(guān)聯(lián)程度[19],當(dāng)相關(guān)性為正時(shí),表明參數(shù)節(jié)點(diǎn)之間的取值趨勢(shì)相似;相反,取值趨勢(shì)相異。在SCADA數(shù)據(jù)集中,關(guān)鍵參數(shù)的取值并不只局限于其中一種關(guān)系。
(1)
依據(jù)相關(guān)系數(shù),本文將與關(guān)鍵參數(shù)相關(guān)性較強(qiáng)的節(jié)點(diǎn)表示作為近鄰節(jié)點(diǎn)集。
1.2.2 時(shí)序近鄰節(jié)點(diǎn)集挖掘
機(jī)組參數(shù)監(jiān)測(cè)值并不是一成不變的,而是隨時(shí)間變化。如進(jìn)口壓力和溫度,受天然氣成分和質(zhì)量,環(huán)境條件,中間站場(chǎng)壓縮機(jī)的轉(zhuǎn)速、啟停以及工作負(fù)荷等多種因素影響,在不同的時(shí)期呈現(xiàn)不同的變化。再如環(huán)境溫度,隸屬西北的作業(yè)區(qū)晝夜溫差較大,白天氣溫較高,而臨近夜晚氣溫緩慢下降,最大晝夜溫差可達(dá)30 ℃以上。考慮壓縮機(jī)組各個(gè)子系統(tǒng)之間的關(guān)聯(lián)性,關(guān)鍵參數(shù)近鄰節(jié)點(diǎn)集的元素組成并不固定。
圖2 單個(gè)LSTM的單元結(jié)構(gòu)示意
遺忘門決定了節(jié)點(diǎn)表示信息有多少可以被遺忘,如式(2)所示:
(2)
(3)
(4)
選擇某壓氣站場(chǎng)3臺(tái)RR離心壓縮機(jī)組的SCADA運(yùn)行監(jiān)測(cè)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)集來驗(yàn)證算法模型的可行性,自投產(chǎn)以來,該壓氣站的單臺(tái)壓縮機(jī)組最大連續(xù)運(yùn)行時(shí)間超過7×103h。為更好地訓(xùn)練模型,收集了該壓氣站典型的多次出口溫度過高異常事件作為訓(xùn)練數(shù)據(jù)集,事件的主要原因由動(dòng)力渦輪轉(zhuǎn)速和上游進(jìn)口溫度過高引起,次要原因包含潤(rùn)滑系統(tǒng)、密封系統(tǒng)、外界環(huán)境溫度過高等因素。SCADA數(shù)據(jù)集主要包含影響出站溫度的m=36個(gè)壓縮機(jī)監(jiān)控參數(shù)在n=2×103個(gè)時(shí)間點(diǎn)內(nèi)的取值,其中出站溫度正常和異常的時(shí)間點(diǎn)分別為1 793個(gè)和207個(gè)。
由于發(fā)生事件的時(shí)間間隔或長(zhǎng)或短,為了便于觀察與分析,給出了數(shù)據(jù)集中最近一次事件發(fā)生前后7.5 h內(nèi)的壓縮機(jī)出口溫度、動(dòng)力渦輪轉(zhuǎn)速、出口壓力和非驅(qū)動(dòng)端振動(dòng)取值變化,異常事件中壓縮機(jī)的參數(shù)取值如圖3所示,圖3中每個(gè)參數(shù)的取值是以間隔5 min為基準(zhǔn)的監(jiān)測(cè)平均值。事件中壓縮機(jī)的出口溫度已經(jīng)超過了50 ℃,此時(shí)已發(fā)生出口溫度高報(bào),需立即打開后空冷器,如果出口溫度超過60 ℃時(shí)會(huì)造成機(jī)組異常停機(jī)。
圖3 異常事件中壓縮機(jī)的參數(shù)取值示意
采用MAE(mean absolute error)和RMSE(root mean square error)作為評(píng)價(jià)指標(biāo)[21]來驗(yàn)證所提模型對(duì)出口溫度預(yù)警的準(zhǔn)確性。
(5)
(6)
為驗(yàn)證造成壓縮機(jī)出口溫度過高的主要影響因素,確定近鄰集合,壓縮機(jī)出口溫度與各個(gè)參數(shù)的相關(guān)系數(shù)見表1所列,給出了事件中壓縮機(jī)出口溫度與36個(gè)主要參數(shù)之間的相關(guān)系數(shù)。
表1 壓縮機(jī)出口溫度與各個(gè)參數(shù)的相關(guān)系數(shù)
從表1中可看出,動(dòng)力渦輪轉(zhuǎn)速、壓縮機(jī)進(jìn)口壓力和壓縮機(jī)非驅(qū)動(dòng)端y振動(dòng)速度值的關(guān)聯(lián)系數(shù)都大于0.6,表明具有較強(qiáng)的相關(guān)性,是影響出口溫度的直接原因,而剩余參數(shù)與壓縮機(jī)出口溫度的關(guān)聯(lián)系數(shù)都小于0.521,相關(guān)性較小,不作為近鄰節(jié)點(diǎn)的考慮范圍之內(nèi)。
考慮時(shí)間效應(yīng)對(duì)預(yù)測(cè)結(jié)果的影響,采用時(shí)間序列交叉驗(yàn)證法[22]將時(shí)序近鄰節(jié)點(diǎn)集劃分為大小相等的5等分,進(jìn)行四輪實(shí)驗(yàn),每輪實(shí)驗(yàn)增加一等分作為訓(xùn)練集訓(xùn)練所提模型。SCADA訓(xùn)練集與測(cè)試集見表2所列,列出了每一等分中正常運(yùn)行類與異常類的時(shí)間點(diǎn)個(gè)數(shù),來驗(yàn)證所提模型對(duì)壓縮機(jī)出口溫度預(yù)警的準(zhǔn)確性。
表2 SCADA訓(xùn)練集與測(cè)試集
預(yù)測(cè)結(jié)果見表3所列,得到了每一輪最終的預(yù)測(cè)結(jié)果,前兩輪MAE和RMSE的取值較低,第三輪和第四輪MAE和RMSE取值相對(duì)較高,第四輪取得最高值。由于采用時(shí)間序列交叉驗(yàn)證法,前兩輪訓(xùn)練模型時(shí)接觸較少數(shù)據(jù),可能還沒有充分學(xué)習(xí)到時(shí)間序列的隱含特征,MAE和RMSE的取值較高,預(yù)警的準(zhǔn)確度較差。隨著實(shí)驗(yàn)的進(jìn)行,模型獲得更多數(shù)據(jù)進(jìn)行訓(xùn)練并逐漸學(xué)習(xí)到時(shí)間序列的結(jié)構(gòu)特征,對(duì)出口溫度預(yù)警的準(zhǔn)確性逐漸上升??傮w來看,所提模型對(duì)出口溫度預(yù)警的MAE和RMSE平均取值分別為1.83和2.27,較低的MAE和RMSE值表示模型的預(yù)測(cè)結(jié)果與實(shí)際監(jiān)測(cè)值之間的差異相對(duì)較小,意味著所提模型在出口溫度預(yù)測(cè)方面具有較高準(zhǔn)確性。
表3 預(yù)測(cè)結(jié)果
為更直觀顯示所提模型的預(yù)測(cè)結(jié)果,異常事件中壓縮機(jī)出口溫度預(yù)測(cè)值與真實(shí)值的對(duì)比如圖4所示。
圖4 壓縮機(jī)出口溫度真實(shí)值與預(yù)測(cè)值對(duì)比示意
從圖4可看出,所提模型能夠捕捉到出口溫度過高的異常事件,預(yù)測(cè)的取值趨勢(shì)和實(shí)際監(jiān)測(cè)值一致,比較模型預(yù)測(cè)值與實(shí)際監(jiān)測(cè)值之間的MAE和RMSE誤差,分別為0.88和0.92,較小的MAE和RMSE表明模型對(duì)出口溫度預(yù)測(cè)值更加接近實(shí)際監(jiān)測(cè)值。由于考慮了不同時(shí)刻下影響出站溫度的主要因素,并將其作為近鄰節(jié)點(diǎn)集訓(xùn)練所提模型,提高了出站溫度預(yù)警的準(zhǔn)確性與泛化能力。
針對(duì)壓縮機(jī)組各子系統(tǒng)監(jiān)控參數(shù)之間的關(guān)聯(lián)性對(duì)關(guān)鍵參數(shù)取值的影響,以及考慮監(jiān)控參數(shù)取值的時(shí)序特征,提出了基于循環(huán)神經(jīng)網(wǎng)絡(luò)壓縮機(jī)組性能預(yù)測(cè)模型。利用轉(zhuǎn)化模型離散化監(jiān)測(cè)數(shù)據(jù)取值,降低了數(shù)據(jù)冗余和臟數(shù)據(jù)對(duì)模型的干擾,之后利用相關(guān)性分析獲得不同時(shí)間點(diǎn)內(nèi)各個(gè)監(jiān)控參數(shù)之間的相關(guān)度,接著依據(jù)時(shí)間效應(yīng)對(duì)關(guān)鍵參數(shù)取值的影響,將相關(guān)性較大的參數(shù)作為關(guān)鍵參數(shù)節(jié)點(diǎn)的時(shí)序近鄰節(jié)點(diǎn)集,并將其作為循環(huán)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集來預(yù)測(cè)關(guān)鍵參數(shù)的取值,以此判斷機(jī)組運(yùn)行狀態(tài)。通過分析機(jī)組關(guān)鍵參數(shù)的預(yù)測(cè)取值,可以事先了解和掌握機(jī)組的運(yùn)行狀態(tài),為后續(xù)調(diào)度提供可行的運(yùn)行方案,進(jìn)一步確保了機(jī)組的平穩(wěn)運(yùn)行。下一步,致力于將所提模型與基層站場(chǎng)實(shí)際相結(jié)合,通過研發(fā)預(yù)警系統(tǒng)實(shí)現(xiàn)管網(wǎng)數(shù)字化向智能化的轉(zhuǎn)型。