張華
(吉林建筑大學(xué)城建學(xué)院,長春 130011)
兩相流是一種廣泛存在于自然界和工業(yè)生產(chǎn)過程中的混合流動模式,特別在化工、石油、電力、核能及冶金等行業(yè)普遍存在。近年來,兩相流的研究逐步發(fā)展成為國際上研究的熱點(diǎn),其主要原因在于兩相流不僅在一系列現(xiàn)代工程中得到廣泛應(yīng)用,而且對促進(jìn)這些設(shè)備的發(fā)展和創(chuàng)新也起到了重要作用。因此兩相流的參數(shù)測量和流型識別具有重要的理論和工程意義[1]。小波包分析是在小波分析基礎(chǔ)上發(fā)展起來的更加精密的時(shí)頻分析方法,它在信號去噪、濾波、壓縮、非平穩(wěn)機(jī)械振動信號的分析與故障診斷、非平穩(wěn)信號的特征提取等方面具有重要應(yīng)用。支持向量機(jī)是統(tǒng)計(jì)學(xué)習(xí)理論中最年輕實(shí)用的內(nèi)容,是為適用于小樣本學(xué)習(xí)而提出的通用學(xué)習(xí)算法。本文以ERT系統(tǒng)和油/水兩相流的流型為研究基礎(chǔ),首先采用小波包分析對ERT系統(tǒng)測量的壓差波動信號進(jìn)行特征提取,然后通過計(jì)算類間不可分離程度為每個(gè)節(jié)點(diǎn)選取最易分的兩類構(gòu)造DDAG支持向量機(jī)多類分模型,最后將提取的特征數(shù)據(jù)輸入構(gòu)造好的分類模型進(jìn)行流型識別。
電阻層析成像系統(tǒng)主要由電阻傳感器陣列、數(shù)據(jù)采集系統(tǒng)、圖像重建計(jì)算機(jī)三部分組成[2]。系統(tǒng)結(jié)構(gòu)如圖1所示。ERT系統(tǒng)的工作原理通常是電流激勵、電壓測量。本文是基于12電極ERT系統(tǒng)采集的到電導(dǎo)率波動信號進(jìn)行處理,由于采用相鄰的激勵模式,所以一幅圖像共采集到N(N-3)個(gè)測量數(shù)據(jù),即12×9=108個(gè)。系統(tǒng)工作原理圖如圖2所示。
圖1 電阻層析成像系統(tǒng)結(jié)構(gòu)圖
圖2 系統(tǒng)工作原理圖
小波包分析是對非平穩(wěn)信號進(jìn)行特征提取的較好工具,它能夠?yàn)樾盘柼峁┮环N更加精密的分解方法。它在小波分析的基礎(chǔ)上將頻帶進(jìn)行多層次劃分,對多分辨率分析沒有細(xì)分的高頻部分進(jìn)一步分解,并能夠根據(jù)被分析信號的特征,自適應(yīng)地選擇相應(yīng)的頻帶,使之與信號頻譜相匹配,進(jìn)一步提高時(shí)頻分辨率[3]。
(1)對輸入信號S,采用db6小波濾波器,shanon熵值進(jìn)行三層小波包分解,從第三層中提取低頻到高頻8個(gè)頻率成分的信號特征[4]。
(3)利用公式
其中E滿足公式:
對所求得能量值做歸一化處理。
(4)用各頻段能量作為特征值,構(gòu)造特征向量,即
支持向量機(jī)是為適用于小樣本學(xué)習(xí)而提出的通用學(xué)習(xí)算法。它根據(jù)VC(Vapnik-Chervonenkis)理論[5],基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,從而能兼顧訓(xùn)練錯誤和泛化性能,開辟了機(jī)器學(xué)習(xí)算法的新天地。目前這種新的學(xué)習(xí)算法被建議用以代替多種傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)方法,已經(jīng)成為機(jī)器學(xué)習(xí)研究的熱點(diǎn),并在很多領(lǐng)域得到了成功的應(yīng)用。
由支持向量機(jī)定義,構(gòu)造非線性最優(yōu)超平面的問題轉(zhuǎn)化為一個(gè)較簡單的二次規(guī)劃:
訓(xùn)練完成后,計(jì)算下列函數(shù)的符號即可:
支持向量機(jī)最初是針對二類分類問題提出的,上述支持向量機(jī)原理只能解決兩個(gè)類別的分類問題。而實(shí)際應(yīng)用中常常是多個(gè)類別的分類問題[6]。常見的多類分類策略有一對一、一對多和DDAG[7],前兩種方法存在不可分區(qū)域。傳統(tǒng)的DDAGSVM在訓(xùn)練階段構(gòu)造K(K-1)/2個(gè)兩類分類器,在分類階段,將K(K-1)/2個(gè)兩類分類器構(gòu)造成一個(gè)二叉樹有向無環(huán)圖。對待分類樣本X,從樹型拓?fù)浣Y(jié)構(gòu)根節(jié)點(diǎn)開始,根據(jù)支持向量機(jī)決策函數(shù)的值決定走左節(jié)點(diǎn)或者是右節(jié)點(diǎn)。以此類推,直到達(dá)到葉結(jié)點(diǎn),此葉節(jié)點(diǎn)的類別就是待分類樣本X的類別。但是DDAG模型存在誤差累積的問題[8],即當(dāng)根節(jié)點(diǎn)產(chǎn)生分類錯誤時(shí)將會直接影響下層各節(jié)點(diǎn)的分類結(jié)果。解決誤差累積問題的一般方法是用馬氏距離或類中心間距離作為類間分離程度的度量,但是這兩種方法沒有考慮樣本空間分布的幾何狀況。要想正確的進(jìn)行類間分離程度度量還需要考慮樣本在空間的類內(nèi)分散度[9]。
首先,第i類和第 j類樣本的中心距離用
其次,第i類樣本的類內(nèi)分散度表示為:
由以上兩類樣本中心距離和兩類類內(nèi)分散度,得到兩類間不可分程度計(jì)算公式:
對ERT系統(tǒng)中的四種流型:點(diǎn)滴流、核心流、層流、環(huán)狀流進(jìn)行識別,采用改進(jìn)的DDAG方法構(gòu)造支持向量機(jī)多類分類模型。根據(jù)流型個(gè)數(shù)4,需要構(gòu)造4*(4-1)/2=6個(gè)SVM兩類分類器,如圖3所示。步驟如下(以判別1類為例):
第一步:設(shè)給定的訓(xùn)練集為{(x1,y1),(x2,y2),...,(xl,yl)},l代表用l組樣本數(shù)據(jù)進(jìn)行訓(xùn)練。
其中 xi∈Rn,yi∈{1,2,3,4},i=1,2,...,l。
第二步:根據(jù)以上得到的兩類間不可分離程度公式計(jì)算每兩種流型的不可分離值。選擇最小的值(可分離性最高)所對應(yīng)的兩種流型(假設(shè)為1和2)作為樹型拓?fù)浣Y(jié)構(gòu)根節(jié)點(diǎn)支持向量機(jī)要區(qū)分的兩類。
第四步:在某個(gè)節(jié)點(diǎn)的剩余類別中,重復(fù)第二步和第三步,直到達(dá)到葉子節(jié)點(diǎn),此節(jié)點(diǎn)所對應(yīng)的類別就是待分樣本X所屬的類別。
圖3 DDAGSVM多類分類模型
本實(shí)驗(yàn)采用MATLAB編程,在小波包工具箱和LS支持向量機(jī)工具箱基礎(chǔ)上修改得到。首先為每種流型隨機(jī)選取30個(gè)樣本進(jìn)行訓(xùn)練。由ERT系統(tǒng)工作原理可知每種流型由108個(gè)數(shù)據(jù)表示,經(jīng)過小波包分解變?yōu)?維數(shù)據(jù),將特征提取后的數(shù)據(jù)輸入DDAG支持向量機(jī)多類分類模型。在本實(shí)驗(yàn)中,支持向量機(jī)采用最小二乘支持向量機(jī)算法[10],對訓(xùn)練結(jié)果影響不大的核函數(shù)隨機(jī)選擇徑向基核函數(shù)。對訓(xùn)練結(jié)果影響較大的兩個(gè)參數(shù),一是控制對錯分樣本懲罰程度的可調(diào)參數(shù)gam,二是徑向基核函數(shù)的參數(shù)sig2,它們的選取采用代價(jià)較小的網(wǎng)格搜索法,即多次調(diào)整兩個(gè)參數(shù)的范圍和采樣間隔,找到最優(yōu)的組合。訓(xùn)練完成后,再為每種流型隨機(jī)選取30個(gè)樣本進(jìn)行測試。通過與以往基于其他策略的支持向量機(jī)多類分類模型比較,可得出DDAG支持向量機(jī)多類分類模型在ERT系統(tǒng)流型識別中具有較高的識別精度。實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)分析如表1所示。
表1 實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)分析
本文提出在ERT系統(tǒng)流型識別中采用小波包和改進(jìn)的DDAG支持向量機(jī)多類分類模型相結(jié)合方法進(jìn)行識別。實(shí)驗(yàn)結(jié)果證明在特征提取方式一樣的情況下,改進(jìn)的DDAG支持向量機(jī)多類分類模型在識別樣本時(shí)相比于其他多類分類模型的識別準(zhǔn)確率都要高,說明此種方法適用于兩相流流型識別的領(lǐng)域。
[1]王金龍,孫福龍,杜新.質(zhì)子交換膜燃料電池陰極氣液兩相流模型的建模及仿真[J].長春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2014,37(3):83-86.
[2]Dickin F J,Wang M.Electrical resistance tomography for process application[J].Measurement Science and Technology,1996,7(3):247-260.
[3]Elperin T,Klochko M.Flow regime identification in a two-phase flow using wavelet transform[J].Springer-Verlag,2002(32):674-682.
[4]周明月,杜麗敏,姜文龍.基于高階統(tǒng)計(jì)量的小波變換去噪算法[J].長春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,32(2):251-253.
[5]張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J].自動化學(xué)報(bào),2000,26(1):32-42.
[6]Qi Guohua,Dong Feng,Xu Yanbin,et al.Gas/Liquid two-phase flow regime identification in horizontal pipe using support vector machines[A].Proceedings of the Fourth International Conference on Machine Learing and Cybernetics,2005:1746-1751.
[7]余輝,趙輝.支持向量機(jī)多類分類算法新研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(7):185-189.
[8]趙亮.一種改進(jìn)的基于支持向量機(jī)的多類分類方法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(12):233-236.
[9]熊忠陽,陳玲,張玉芳.一種改進(jìn)的DDAGSVM多類分類方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010,19(12):219-222.
[10]Peng Zhenrui,Mi Gensuo.Voidage measurement of two-phase flow based on least squares support vectormachine[A].Proceedingofthe 6thWorld Congress on Intelligent Control and Automation,2006:4900-4903.