李 偉,薛永強(qiáng),賈 鑫,劉祥彪,徐海豐
(1.東北石油大學(xué) 機(jī)械科學(xué)與工程學(xué)院,大慶 163318; 2.中國石油天然氣集團(tuán)有限公司 工程和物裝管理部,北京 100007)
隨著經(jīng)濟(jì)的快速發(fā)展,我國對石油能源的需求不斷增加,而常壓儲(chǔ)罐作為石油的專用儲(chǔ)存容器,保障其長期安全穩(wěn)定運(yùn)行極為重要。儲(chǔ)罐所有部位中底板是最易腐蝕但也是最難檢測的部位,常規(guī)無損檢測方法在不開罐的前提下無法對儲(chǔ)罐底板進(jìn)行有效檢測和評價(jià),目前聲發(fā)射檢測是儲(chǔ)罐底板腐蝕狀態(tài)在線檢測的主要技術(shù)之一[1]。依據(jù)標(biāo)準(zhǔn) JB/T 10764-2007 《無損檢測 常壓金屬儲(chǔ)罐聲發(fā)射檢測及評價(jià)方法》 能夠?qū)?chǔ)罐的底板腐蝕情況做出評價(jià),該標(biāo)準(zhǔn)將儲(chǔ)罐底板腐蝕狀態(tài)劃分為5個(gè)等級(jí),其中1級(jí)最好,5級(jí)最差,然而標(biāo)準(zhǔn)中某些關(guān)鍵參數(shù)值的確定仍需依靠經(jīng)驗(yàn),這給儲(chǔ)罐底板腐蝕狀況的評價(jià)帶來了不確定因素,同時(shí)限制了聲發(fā)射檢測技術(shù)在儲(chǔ)罐底板腐蝕檢測中的推廣應(yīng)用。
隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,利用機(jī)器學(xué)習(xí)算法、統(tǒng)計(jì)方法對數(shù)據(jù)進(jìn)行分析,智能化評價(jià)儲(chǔ)罐底板的腐蝕狀態(tài),對擺脫對傳統(tǒng)經(jīng)驗(yàn)的依賴具有十分重要的意義。美國聲學(xué)物理公司基于其掌握的大量儲(chǔ)罐檢測數(shù)據(jù)研發(fā)了大型常壓金屬儲(chǔ)罐底板聲發(fā)射檢測專家評估系統(tǒng)(TANKPAC),目前已在全世界進(jìn)行了大規(guī)模應(yīng)用。國內(nèi),陳榮剛[2]通過遺傳算法優(yōu)化貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)了對儲(chǔ)罐底板腐蝕狀態(tài)的預(yù)測,并將儲(chǔ)罐的宏觀特征作為評價(jià)模型的輸入特征,提高模型預(yù)測的準(zhǔn)確率。張延兵等[3]、宋高峰等[4]、劉琪華等[5]等則利用BP神經(jīng)網(wǎng)絡(luò)及其優(yōu)化算法建立了儲(chǔ)罐底板腐蝕狀態(tài)的預(yù)測模型,實(shí)現(xiàn)了對儲(chǔ)罐底板腐蝕等級(jí)的預(yù)測。
儲(chǔ)罐底板腐蝕聲發(fā)射智能評價(jià)系統(tǒng)的建立需要大量的聲發(fā)射檢測數(shù)據(jù)支持,這不僅對數(shù)據(jù)的量有要求,數(shù)據(jù)的分布情況也同樣會(huì)影響智能評價(jià)系統(tǒng)的準(zhǔn)確性。儲(chǔ)罐底板腐蝕檢測數(shù)據(jù)庫中各等級(jí)樣本分布如圖1所示,可見,儲(chǔ)罐底板腐蝕狀況的實(shí)際分布情況往往并不均衡,其中1級(jí)(非常微小腐蝕)和4級(jí)(存在動(dòng)態(tài)腐蝕)的儲(chǔ)罐均只有20臺(tái),而大部分儲(chǔ)罐的聲發(fā)射評價(jià)等級(jí)為2級(jí)(存在少量腐蝕)和3級(jí)(存在中等腐蝕)。缺陷樣本在數(shù)據(jù)空間分布上存在差異,尤其是在底板腐蝕狀態(tài)極好和極差的儲(chǔ)罐聲發(fā)射檢測數(shù)據(jù)不足的情況下,往往會(huì)造成1,4,5等級(jí)的欠學(xué)習(xí)和2,3等級(jí)的過學(xué)習(xí),從而降低底板腐蝕狀態(tài)智能評價(jià)系統(tǒng)的準(zhǔn)確性。
圖1 儲(chǔ)罐底板腐蝕檢測數(shù)據(jù)庫中各等級(jí)樣本分布
針對以上問題,在結(jié)合專業(yè)人員相關(guān)經(jīng)驗(yàn)的基礎(chǔ)上,充分考慮了儲(chǔ)罐的宏觀特征和聲發(fā)射特征,并以可能的腐蝕導(dǎo)向?qū)μ卣鬟M(jìn)行了合理的預(yù)處理,同時(shí)提出采用過采樣技術(shù)來優(yōu)化樣本空間,改善數(shù)據(jù)集的平衡性。過采樣技術(shù)是一種廣泛應(yīng)用的數(shù)據(jù)增強(qiáng)方法,其中SMOTE算法是該領(lǐng)域影響力最大的過采樣方法,能大幅度改善數(shù)據(jù)集的平衡性[6],最后結(jié)合灰狼算法優(yōu)化的支持向量機(jī)(GWO-SVM),實(shí)現(xiàn)對儲(chǔ)罐底板腐蝕聲發(fā)射檢測等級(jí)的智能評價(jià)。
與試驗(yàn)數(shù)據(jù)不同,儲(chǔ)罐底板腐蝕的現(xiàn)場聲發(fā)射檢測數(shù)據(jù)非常珍貴,在246個(gè)樣本數(shù)據(jù)中,2,3級(jí)占83.7%,1,4級(jí)均僅占16.3%,存在樣本分布不均衡的情況,為提高后續(xù)模型的訓(xùn)練效果,采用SMOTE算法對少數(shù)類樣本進(jìn)行擴(kuò)充。SMOTE算法對距離較近的少數(shù)類樣本進(jìn)行線性插值生成新的少數(shù)類樣本,以實(shí)現(xiàn)數(shù)據(jù)平衡[7]。其主要計(jì)算過程為:① 對于每一個(gè)少數(shù)類樣本x,計(jì)算其到該類中其余所有樣本的歐氏距離并得到k近鄰;② 根據(jù)數(shù)據(jù)集的不平衡比例設(shè)置采樣倍率N,從少數(shù)類樣本x的k近鄰中隨機(jī)選擇若干個(gè)實(shí)例,假設(shè)選擇的近鄰樣本為xn;③ 將隨機(jī)選擇的樣本xn按照式(1)計(jì)算出新的樣本,并加入到數(shù)據(jù)集中。
xnew=x+rand(0,1)×(xn-x)
(1)
式中:x為少數(shù)類樣本;xnew為生成的新樣本;rand為隨機(jī)函數(shù)。
SVM(支持向量機(jī))是一種處理分類和回歸問題的監(jiān)督式機(jī)器學(xué)習(xí)算法。在樣本數(shù)據(jù)量不充足的情況下,與人工神經(jīng)網(wǎng)絡(luò)等其他需要大量數(shù)據(jù)訓(xùn)練的分類算法相比,具有更好的學(xué)習(xí)效果[8]。對于線性分類問題,其利用間隔最大化求解最優(yōu)分離超平面;對于非線性分類問題,其通過核函數(shù)將原空間的數(shù)據(jù)映射到新空間,在新的空間里用線性分類學(xué)習(xí)方法學(xué)習(xí)分類模型。對于非線性可分的SVM形式可描述為[9]
(2)
s.t.yi(wxi+b)≥1-ξi,i=1,2,1,…,N
(3)
(4)
(5)
式中:w為權(quán)值;b為誤差;C為懲罰因子;ξi為松弛變量;N為訓(xùn)練樣本數(shù);s.t.為約束條件;xi,xj為樣本;yi為類別號(hào);K(xi,xj)為核函數(shù);αi為拉格朗日乘子;sgn為判別函數(shù);f(x)為分類決策函數(shù);σ2為核函數(shù)參數(shù);g為內(nèi)部參數(shù),g=1/(2σ2)。
懲罰因子C和核函數(shù)內(nèi)部參數(shù)g共同決定了SVM模型的精度,依靠經(jīng)驗(yàn)確定SVM的參數(shù)難以使模型達(dá)到最大準(zhǔn)確率,因此對SVM的參數(shù)C和g進(jìn)行優(yōu)化,確定最優(yōu)值十分重要。
在眾多支持向量機(jī)的優(yōu)化方法中,灰狼優(yōu)化算法(GWO)與其他傳統(tǒng)方法相比具有在復(fù)雜空間的全局搜索能力,GWO算法是受狼群捕獵行為啟發(fā)而提出的群體優(yōu)化算法,優(yōu)化過程分為以下3個(gè)部分[10]。
(1) 包圍獵物。狼群在狩獵過程中需要確定獵物位置并包圍獵物,用數(shù)學(xué)方程描述為
D=|SXP(t)-X(t)|
(6)
X(t+1)=XP(t)-AD
(7)
A=2ar1-a
(8)
a=2-2t/T
(9)
S=2r2
(10)
式中:D為灰狼與獵物之間的距離;XP(t)為當(dāng)前最優(yōu)解即獵物位置;X(t)表示灰狼當(dāng)前位置;X(t+1)為迭代至t+1次時(shí)灰狼的位置;A和S為系數(shù);r1和r2為在 [0,1] 區(qū)間內(nèi)的隨機(jī)數(shù);a為收斂因子,隨著迭代次數(shù)增加從2線性遞減到0;T為最大迭代數(shù)。
(2) 狩獵過程。在狩獵時(shí),狼群的位置不斷變化,此過程在α狼、β狼、δ狼的引導(dǎo)下,計(jì)算ω狼群與前3個(gè)狼的距離并不斷更新位置,接近獵物,此過程的數(shù)學(xué)描述為
(11)
(12)
Xt+1=(X1+X2+X3)/3
(13)
式中:Dα,Dβ,Dδ分別為α,β,δ狼與其他狼之間的距離;Xα,Xβ,Xδ分別為α,β,δ狼的當(dāng)前位置;S1,S2,S3,A1,A2,A3為系數(shù);X1,X2,X3為普通灰狼向α,β,δ狼移動(dòng)的步長;Xt+1為迭代至t+1次時(shí)獵物的位置。
(3) 攻擊獵物。在最后階段,狼群攻擊追捕獵物即完成尋優(yōu)過程,獲取最優(yōu)解。在收斂因子a從2線性遞減到0的過程中,當(dāng)|A|≤1時(shí)狼群集中攻擊,捕獲獵物位置進(jìn)行局部搜索,當(dāng)|A|≥1時(shí)狼群發(fā)散,遠(yuǎn)離獵物進(jìn)行全局搜索。
首先利用SMOTE算法處理擴(kuò)充數(shù)據(jù)集,實(shí)現(xiàn)樣本數(shù)據(jù)的平衡,利用SVM算法進(jìn)行訓(xùn)練,并采用GWO算法優(yōu)化SVM算法中的參數(shù),從而得出使儲(chǔ)罐底板腐蝕等級(jí)評價(jià)精度最高的最佳參數(shù),優(yōu)化評價(jià)結(jié)果。SMOTE-GWO-SVM模型的流程圖如圖2所示。
圖2 SMOTE-GWO-SVM模型流程圖
儲(chǔ)罐聲發(fā)射檢測數(shù)據(jù)均來源于課題組所依托的國家認(rèn)證聲發(fā)射檢測實(shí)驗(yàn)室近年來進(jìn)行現(xiàn)場儲(chǔ)罐聲發(fā)射檢測所建立的數(shù)據(jù)庫。每條數(shù)據(jù)有兩類特征(宏觀特征和聲發(fā)射特征),共20個(gè)特征參數(shù),具體如表1所示。
表1中數(shù)據(jù)類型復(fù)雜,部分宏觀特征并不是數(shù)值型數(shù)據(jù),考慮到不同條件底板腐蝕的情況不同,因此并沒有直接采用one-hot編碼,而是以可能的腐蝕狀況為導(dǎo)向?qū)?chǔ)罐字符型宏觀特征進(jìn)行預(yù)處理,預(yù)處理結(jié)果如圖3所示(腐蝕速率為歸一化數(shù)值,無量綱)。處理分析如下所述。
表1 儲(chǔ)罐宏觀特征和聲發(fā)射特征數(shù)據(jù)
圖3 儲(chǔ)罐宏觀特征腐蝕導(dǎo)向預(yù)處理結(jié)果
(1) 儲(chǔ)存介質(zhì)。儲(chǔ)罐內(nèi)的各儲(chǔ)存介質(zhì)對儲(chǔ)罐的腐蝕程度不同,重質(zhì)儲(chǔ)罐的腐蝕程度比輕質(zhì)儲(chǔ)罐的腐蝕程度更嚴(yán)重[11]。
(2) 運(yùn)行溫度。對于絕大多數(shù)化學(xué)反應(yīng),反應(yīng)速率會(huì)隨溫度升高而加快[12]。
(3) 外觀腐蝕情況。外觀腐蝕情況包括罐壁、罐底邊緣板及焊縫腐蝕情況,防腐漆脫落情況等,外觀情況較差則儲(chǔ)罐腐蝕更嚴(yán)重[13]。
(4) 基礎(chǔ)完好情況。儲(chǔ)罐基礎(chǔ)無防滲層、表面有粘土、底部滲水、沉降等都會(huì)加重儲(chǔ)罐的腐蝕[14]。
(5) 保溫結(jié)構(gòu)。保溫層多為疏松多孔結(jié)構(gòu),易吸水,且保溫層下的水分冷凝難以蒸發(fā),與雜質(zhì)形成電解質(zhì)溶液更易造成儲(chǔ)罐腐蝕[15]。
(6) 材料類別。建造常壓儲(chǔ)罐所用材料多為低碳鋼和合金鋼,低碳鋼S和P的含量較高,而合金鋼添加了Mn,Cr,Ni等耐腐蝕元素,其耐蝕性比低碳鋼耐蝕性更好[16]。
(7) 儲(chǔ)罐結(jié)構(gòu)。浮頂儲(chǔ)罐浮盤支柱與儲(chǔ)罐底板接觸部位的涂層易受到破壞無法再次涂刷,且浮頂儲(chǔ)罐支柱易對底板造成沖擊,更易造成儲(chǔ)罐底板腐蝕[17]。
預(yù)處理后的數(shù)據(jù)宏觀特征和聲發(fā)射特征之間的量級(jí)相差較大,如果不進(jìn)行無量綱化處理會(huì)對后續(xù)計(jì)算造成較大影響,因此對數(shù)據(jù)進(jìn)行了歸一化處理,公式為
y=(x-xmin)/(xmax-xmin)
(14)
式中:x為樣本值;xmax,xmin分別為樣本的最大值和最小值;y為歸一化后的值,范圍在01之間且無量綱。
儲(chǔ)罐宏觀特征和聲發(fā)射預(yù)處理后的數(shù)據(jù)如表2所示(表中宏觀特征均已數(shù)據(jù)化)。
表2 儲(chǔ)罐外觀和聲發(fā)射數(shù)據(jù)預(yù)處理后的數(shù)據(jù)
為提高模型的訓(xùn)練效果,使用SMOTE算法進(jìn)行少數(shù)類樣本擴(kuò)容,將每個(gè)等級(jí)各20個(gè)原數(shù)據(jù)集樣本作為測試集,其余樣本和擴(kuò)充樣本作為訓(xùn)練集,同時(shí),采用GWO優(yōu)化算法對SVM算法的懲罰因子C和和核數(shù)參數(shù)g進(jìn)行優(yōu)化,以獲得最佳模型,經(jīng)試驗(yàn),最終尋參結(jié)果為C=3.97,g=1.79,圖4為SVM參數(shù)尋優(yōu)過程示意。
圖4 SVM參數(shù)尋優(yōu)過程示意
為驗(yàn)證SMOTE-GWO-SVM模型用于儲(chǔ)罐底板腐蝕等級(jí)評價(jià)的有效性,將未進(jìn)行SMOTE處理和SMOTE處理后數(shù)據(jù)的分類結(jié)果進(jìn)行對照,其中未經(jīng)過SMOTE處理的數(shù)據(jù)中1級(jí)、4級(jí)各10個(gè),2級(jí)、3級(jí)各20個(gè)原數(shù)據(jù)集樣本作為測試集,其余作為訓(xùn)練集。同時(shí)與BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林(RF)算法進(jìn)行分類準(zhǔn)確性對比,結(jié)果如表3所示,各個(gè)模型的混淆矩陣如圖5所示。
圖5 各預(yù)測模型的混淆矩陣
表3 各模型準(zhǔn)確率對比
由分析結(jié)果可知,在進(jìn)行SMOTE處理之前,儲(chǔ)罐底板腐蝕1級(jí)和4級(jí)的樣本數(shù)量較少,模型得不到充分訓(xùn)練,導(dǎo)致這兩類數(shù)據(jù)的分類準(zhǔn)確率極低。對數(shù)據(jù)集進(jìn)行SMOTE處理后,針對不平衡小樣本數(shù)據(jù)的分類準(zhǔn)確率有較明顯提升,準(zhǔn)確率從71.67%提升至96.25%。
從模型準(zhǔn)確率的角度分析,SOMTE-GWO-SVM模型的準(zhǔn)確率最高,從模型安全性的角度分析SOMTE-GWO-SVM模型將低腐蝕等級(jí)預(yù)測為高腐蝕等級(jí),雖然可能會(huì)提高后續(xù)儲(chǔ)罐的維護(hù)成本,但是更好地滿足了石化行業(yè)對安全性的高要求,因此采用SOMTE-GWO-SVM模型對儲(chǔ)罐底板腐蝕等級(jí)進(jìn)行預(yù)測,可滿足企業(yè)安全生產(chǎn)和維護(hù)要求。
儲(chǔ)罐典型聲發(fā)射特征參數(shù)分布如圖6所示(IQR為四分位距),可見,儲(chǔ)罐腐蝕情況越嚴(yán)重,聲發(fā)射參數(shù)中的定位事件密度、撞擊平均值、能量標(biāo)準(zhǔn)差和振鈴計(jì)數(shù)標(biāo)準(zhǔn)差就越大,這與儲(chǔ)罐聲發(fā)射檢測評價(jià)標(biāo)準(zhǔn)一致。標(biāo)準(zhǔn)將評定區(qū)域內(nèi)每小時(shí)出現(xiàn)的定位數(shù)和每個(gè)通道每小時(shí)出現(xiàn)的撞擊數(shù)作為儲(chǔ)罐底板腐蝕等級(jí)的評價(jià)依據(jù)。從圖6也可以看出,不同腐蝕等級(jí)的聲發(fā)射數(shù)據(jù)存在一定程度的重合區(qū)域,對于某一腐蝕等級(jí),儲(chǔ)罐個(gè)體數(shù)據(jù)之間可能存在差異,而智能評價(jià)模型對多維度數(shù)據(jù)(聲發(fā)射特征和宏觀特征)進(jìn)行學(xué)習(xí)和訓(xùn)練,避免了某個(gè)維度數(shù)據(jù)偏差給整體評價(jià)帶來影響。
圖6 儲(chǔ)罐典型聲發(fā)射特征參數(shù)分布
儲(chǔ)罐樣本不同特征的分布如圖7所示,圖中儲(chǔ)罐的腐蝕等級(jí)與儲(chǔ)罐的使用年限、運(yùn)行溫度、外觀腐蝕情況和儲(chǔ)罐基礎(chǔ)沉降情況呈正相關(guān)。不難理解,儲(chǔ)罐服役年限越長,儲(chǔ)罐底板累積腐蝕產(chǎn)物越多,服役狀態(tài)越差,而溫度越高,存儲(chǔ)介質(zhì)越容易與底板材料發(fā)生化學(xué)反應(yīng)。外觀腐蝕情況和儲(chǔ)罐沉降則體現(xiàn)了企業(yè)對儲(chǔ)罐的日常維護(hù)和維修情況,若外觀疏于維護(hù),罐內(nèi)底板的腐蝕狀態(tài)也不會(huì)太好。此外,儲(chǔ)罐腐蝕狀態(tài)與儲(chǔ)罐體積呈負(fù)相關(guān),即儲(chǔ)罐體積越大,底板腐蝕狀態(tài)越好。數(shù)據(jù)研究發(fā)現(xiàn),大型儲(chǔ)罐建造年限都比較短,同時(shí)由于建造費(fèi)用高,企業(yè)對大型儲(chǔ)罐的維護(hù)投入也較高,所以儲(chǔ)罐容積越大,儲(chǔ)罐底板越不容易腐蝕。
圖7 儲(chǔ)罐樣本不同特征分布
(1) 將儲(chǔ)罐宏觀信息和聲發(fā)射數(shù)據(jù)相結(jié)合,并以可能的腐蝕狀況導(dǎo)向?qū)?chǔ)罐宏觀信息進(jìn)行預(yù)處理,提高了數(shù)據(jù)的合理性。
(2) SMOTE-GWO-SVM智能評價(jià)模型能夠通過擴(kuò)充少數(shù)類數(shù)據(jù)集樣本,實(shí)現(xiàn)各類樣本空間的平衡,相對未采用SMOTE算法的智能評價(jià)模型,準(zhǔn)確率從71.67%提升至96.25%。
(3) 智能評價(jià)結(jié)果表明,儲(chǔ)罐腐蝕與聲發(fā)射參數(shù)中的定位事件密度、撞擊平均值、能量標(biāo)準(zhǔn)差和振鈴計(jì)數(shù)標(biāo)準(zhǔn)差呈正相關(guān),與外觀參數(shù)中的儲(chǔ)罐使用年限、運(yùn)行溫度和外觀腐蝕情況呈現(xiàn)正相關(guān)。
(4) 利用同時(shí)考慮聲發(fā)射特征和宏觀特征的智能評價(jià)模型對多維度數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)了對儲(chǔ)罐底板腐蝕狀態(tài)評價(jià)分級(jí),避免了某個(gè)維度數(shù)據(jù)偏差給整體評價(jià)帶來影響。