(上海海洋大學(xué) 信息學(xué)院,上海 201306)
多相流辨識廣泛應(yīng)用于石油、動力、能源等各種領(lǐng)域中。在自然界及工業(yè)檢測過程中,因?yàn)槎嘞嗔髁鲃犹卣鲝?fù)雜、隨機(jī)性較大,現(xiàn)今的數(shù)學(xué)模型都很難對其進(jìn)行完整描述,而測量的精確度也不高[1]。隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,電容層析成像技術(shù)(Electrical Capacitance Tomography,ECT)在多相流流動的在線檢測方面發(fā)展迅速[2]。該技術(shù)具有測量速度快、非侵入、成本低、適用范圍廣等特點(diǎn)[3]。但是迄今為止,多相流的在線檢測成像技術(shù)只有少數(shù)已商品化,且多適用于兩相流。而ECT技術(shù)應(yīng)用于在線測量與控制的過程中,經(jīng)常因?yàn)楸粶y管道中的相數(shù)未知而無法實(shí)現(xiàn)相數(shù)自適應(yīng)的分類算法,導(dǎo)致無法處理多種不同物質(zhì)混雜的多相流問題的情況。
目前針對以上問題,有研究者提出用遺傳算法作為學(xué)習(xí)算法的RBF神經(jīng)網(wǎng)絡(luò)可以用于ECT圖像重建[4-6],也有研究者提出用基于支持向量機(jī)(Support Vector Machine,SVM)的ECT圖像重建算法來解決此類問題[7],將ECT的圖像重建問題歸結(jié)為非線性軟間隔問題,利用SVM四層網(wǎng)絡(luò)的泛化性解決多相流問題。但這些方法都沒有從多相流相數(shù)自適應(yīng)的角度來解決圖像重建問題。
本文主要利用SVM與決策樹相結(jié)合的SVM決策樹方法在分類速度和分類精度上的優(yōu)勢,對電容層析成像圖像重建進(jìn)行研究,結(jié)果顯示,該算法能適應(yīng)多相流相數(shù)變化,即面對多相流,該算法有較高的圖像重建速度和精度。
在多分類問題中,會存在具有相同特征的樣本聚集在一個集合中的情況,而這些集合便是“類簇”,針對多相流進(jìn)行相數(shù)預(yù)測時,不同相數(shù)的樣本會對應(yīng)不同的類簇[8-9]。本文提出的預(yù)測模型就是圍繞類簇開展的,SVM決策樹(Decision Tree SVM,DTSVM)[10-13]的原理是:在對不同相數(shù)的樣本進(jìn)行分類時,把所有樣本歸為兩類,通過決策函數(shù)進(jìn)行計(jì)算,歸類計(jì)算所得的值,根據(jù)值的正負(fù)形成兩個子類,繼續(xù)循環(huán),直到把所有類別都?xì)w類到其所對應(yīng)的類簇,而SVM決策樹是通過支持向量機(jī)進(jìn)行決策分類。圖1是針對樣本數(shù)為4時,所采用的幾種不同SVM決策樹層次構(gòu)型。圖1(a)是當(dāng)對樣本無先驗(yàn)知識時采用的構(gòu)型;圖1(b)是當(dāng)對樣本有充分先驗(yàn)知識時采用的構(gòu)型,其思路是首先構(gòu)造一棵最優(yōu)的SVM決策樹,然后再在子類的基礎(chǔ)上繼續(xù)分類;圖1(c)是當(dāng)對樣本有部分先驗(yàn)知識時采用的構(gòu)型。因?yàn)楸疚膶颖緹o先驗(yàn)知識,所以在對相數(shù)進(jìn)行判斷時,選擇層次構(gòu)型1(圖1(a))對相數(shù)進(jìn)行分類。
圖1 4類問題對應(yīng)的SVM決策樹層次構(gòu)型
對于N類樣本的分類問題,一對一的支持向量機(jī)多分類方法在訓(xùn)練時分別需要構(gòu)建N(N-1)/2個支持向量機(jī)分類器,而一對多的支持向量機(jī)多分類方法在訓(xùn)練時分別需要構(gòu)建N個支持向量機(jī)分類器,而本文所采用的方法只需構(gòu)建N-1個支持向量機(jī)分類器。因此可以看出本文采用的分類器在分類效率上明顯優(yōu)于后兩種。
利用SVM決策樹實(shí)現(xiàn)自適應(yīng)相數(shù)預(yù)測的具體實(shí)驗(yàn)步驟如下:
① 訓(xùn)練集的選取。把A1~A2M-1種不同介質(zhì)形成的分布所對應(yīng)的電容值提取出來,作為實(shí)驗(yàn)的訓(xùn)練集Train。
② 單相樣本的預(yù)測。建立SVM分類器,分離單相樣本類和其他相數(shù)的樣本類,找出所有具有單相的樣本,單獨(dú)對單相的樣本進(jìn)行預(yù)測。
③M相樣本的預(yù)測。建立SVM分類器,分離M相的樣本類和其他相數(shù)樣本類,找出所有具有M相的樣本,單獨(dú)對M相的樣本進(jìn)行預(yù)測。
④K相樣本的預(yù)測。建立SVM分類器,分離K相的樣本和其他相數(shù)的樣本類,找出所有具有K相的樣本,單獨(dú)對K相樣本進(jìn)行預(yù)測;重復(fù)此步驟。
圖2為三相流對應(yīng)的基于SVM決策樹的自適應(yīng)相數(shù)預(yù)測模型,其中A1~A3是單相流,A4~A6是兩相流,A7是三相流。從圖中可看出,SVM1實(shí)現(xiàn)A1~A3與A4~A7的分類,SVM2實(shí)現(xiàn)A1與A2、A3分類,SVM4實(shí)現(xiàn)A2與A3分類,SVM3實(shí)現(xiàn)A7與A4~A6分類,SVM5實(shí)現(xiàn)A4與A5、A6分類,SVM6實(shí)現(xiàn)A5與A6分類,此模型實(shí)現(xiàn)了每種相數(shù)的自適應(yīng)。
圖2 三相流對應(yīng)的基于SVM決策樹的自適應(yīng)相數(shù)預(yù)測模型
將氣/油兩種物質(zhì)作為研究對象,對應(yīng)的介電常數(shù)分別為εg=1和εo=2.2。將管道內(nèi)其他介質(zhì)的介電常數(shù)設(shè)為εi,而管道內(nèi)樣本的相數(shù)會出現(xiàn)以下情況:單相流,單一介質(zhì)為εg、εo、εi;兩相流,任意兩種介質(zhì)的組合εg和εo、εg和εi、εi和εo;三相流,3種介質(zhì)的組合εg、εo和εi。
實(shí)驗(yàn)中,對8極板ECT系統(tǒng)進(jìn)行實(shí)驗(yàn)仿真,進(jìn)行數(shù)據(jù)采集。設(shè)管道壁的介電常數(shù)為2.5,對管道使用有限元剖分法,將其截面剖分為192個單元,并對極板電容進(jìn)行計(jì)算。
圖3 管道相數(shù)分類模型中SVM決策樹層次構(gòu)型
本實(shí)驗(yàn)采用8極板ECT系統(tǒng),極板間有28個獨(dú)立測量的電容值,將這28組電容值作為特征數(shù)據(jù),從中提取1356組數(shù)據(jù)作為測試樣本,提取5612組數(shù)據(jù)作為訓(xùn)練樣本,使用圖3中的層次構(gòu)型分類管道中存在的樣本。如圖4、圖5所示,樣本的介電常數(shù)εi∈[2.3,5.3],實(shí)驗(yàn)驗(yàn)證了SVM決策樹多分類方法進(jìn)行相數(shù)分類預(yù)測的可行性,其次與普遍使用的One-Versus-Rest(OVR)分類算法分析比較,在此區(qū)間中 SVM決策樹多分類預(yù)測精度更加理想。
圖4 測試集整體精度
圖5 不同類別測試集精度
由圖4可知,在區(qū)間εi∈[2.3,5.3]范圍內(nèi),對測試集整體精度的預(yù)測絕大部分超過97%。由圖5可知,在εi>2.4的區(qū)間上,對每一種類別的測試集的預(yù)測精度也都超過95%。由實(shí)驗(yàn)可知,SVM決策樹算法分類精度更高,而且性能穩(wěn)定,在分類效果和泛化能力上也更具有優(yōu)勢。
為了檢驗(yàn)SVM決策樹相數(shù)分類預(yù)測模型在各種物質(zhì)并存的情況下依然可以適用,如表1所示,選取氣、油、水(εg=1,εo=2.2和εw=80)作為實(shí)驗(yàn)對象進(jìn)行分類預(yù)測,SVM決策樹分類算法的測試集整體分類精度在97.42%左右,且基于SVM決策樹算法在不同相的分類精度比較中都高于OVR算法。如表1所示,運(yùn)行時間單位為s,SVM決策樹算法的分類速度也快于OVR算法。從表中可知,SVM決策樹算法不僅在分類精度上更優(yōu),而且在分類速度上相較于OVR算法也有顯著的提升。
表1 管道中相數(shù)分類精度結(jié)果
以上實(shí)驗(yàn)是通過分類不同的相數(shù)來分類管內(nèi)的不同狀態(tài)。本文在以上實(shí)驗(yàn)成果之上,繼續(xù)分析了基于SVM決策樹的自適應(yīng)相數(shù)預(yù)測模型,對優(yōu)化管內(nèi)相數(shù)的自適應(yīng)能力做了進(jìn)一步的探討。如果管道中存在三相,那么最多會出現(xiàn)A1~A7這7種可能。
單相流:A1:εg=1,A2:εo=2.2,A3:εw=80;
兩相流:A4:εg=1,εo=2.2,A5:εg=1,εw=80,A6:εo=2.2,εw=80;
三相流:A7:εg=1,εo=2.2,εw=80。
表2為管道中自適應(yīng)相數(shù)模型的分類精度結(jié)果。
表2 管道中自適應(yīng)相數(shù)模型的分類精度結(jié)果
根據(jù)表2可知,當(dāng)出現(xiàn)7種介質(zhì)共存的情況時,基于SVM決策樹的自適應(yīng)相數(shù)預(yù)測模型可以實(shí)現(xiàn)各相數(shù)之間的分類,SVM決策樹算法的泛化能力優(yōu)異,可以更好地解決相數(shù)自適應(yīng)問題。
本文建立基于SVM決策樹的自適應(yīng)相數(shù)ECT圖像重建算法的體系結(jié)構(gòu),更為直觀地分析SVM決策樹的自適應(yīng)相數(shù)ECT圖像重建算法,并對其進(jìn)行性能優(yōu)化,如圖6所示。把經(jīng)過相數(shù)自適應(yīng)的各類樣本分別進(jìn)行歸一化和圖像重建。
圖6 基于SVM決策樹自適應(yīng)相數(shù)ECT圖像重建算法的體系結(jié)構(gòu)
實(shí)驗(yàn)步驟如下。
(1) 訓(xùn)練集和測試集采集:選取訓(xùn)練集Train和測試集Test。
(2) 預(yù)處理數(shù)據(jù)。
在相數(shù)已經(jīng)得到確認(rèn)的情況下,分別使用并聯(lián)歸一化模型對樣本進(jìn)行歸一化處理,得到自適應(yīng)相數(shù)的電容歸一化模型,獲得了數(shù)據(jù)預(yù)處理后的訓(xùn)練集Train′和測試集Test′。
(3) 數(shù)據(jù)成像。
多相流圖像的重建是多分類問題,把不同介質(zhì)的灰度作為樣本的標(biāo)簽,進(jìn)行訓(xùn)練建模。設(shè)數(shù)據(jù)預(yù)處理后的訓(xùn)練集為Train′,選適當(dāng)?shù)暮撕瘮?shù)和適當(dāng)?shù)膮?shù)C,構(gòu)造并求解最優(yōu)化問題。
(1)
(2)
0≤αi≤Ci=1,…,N
(3)
得最優(yōu)解為
構(gòu)造決策函數(shù)為
圖7是分別利用兩種多相流自適應(yīng)算法下典型流型的重建得到的圖像,第一欄圖像為仿真實(shí)驗(yàn)的原始圖像,第二欄圖像為使用OVR算法進(jìn)行圖像重建所得圖像,第三欄為使用SVM決策樹自適應(yīng)算法后圖像重建所得圖像。從重建圖像可以看出:基于SVM決策樹自適應(yīng)相數(shù)的重建圖像效果優(yōu)于OVR算法,具有較高的準(zhǔn)確度,整體的重建精度得到了提升。
圖7 兩種多相流自適應(yīng)方法的重建圖像
電容層析成像系統(tǒng)已經(jīng)廣泛應(yīng)用于多相流檢測領(lǐng)域中,本文通過改進(jìn)SVM實(shí)現(xiàn)自適應(yīng)相數(shù)ECT圖像重建算法,基于SVM決策樹的相數(shù)自適應(yīng)模型可以很好地應(yīng)對實(shí)際應(yīng)用中存在的需求。為了驗(yàn)證算法的性能,通過基于SVM決策樹的自適應(yīng)相數(shù)預(yù)測模型進(jìn)行實(shí)驗(yàn)。該預(yù)測模型可以以較高的精度來區(qū)分管內(nèi)包含的介電常數(shù)差異不大的介質(zhì),且重建圖像的精度較高。該算法是解決相數(shù)不確定的多相流問題的一個有效途徑。