孫立軍,趙子輝,高靜宇,張晶瓊,邵?欣
基于RS-Stacking模型的科氏流量計兩相流測量研究
孫立軍1, 2,趙子輝1, 2,高靜宇1, 2,張晶瓊3,邵?欣4
(1. 天津大學(xué)電氣自動化與信息工程學(xué)院,天津 300072;2. 天津市過程檢測與控制重點實驗室,天津 300072;3. 英國謝菲爾德大學(xué)自動控制與系統(tǒng)工程學(xué)院,謝菲爾德 S1 3JD;4. 天津中德應(yīng)用技術(shù)大學(xué)智能制造學(xué)院,天津 300350)
為解決科氏流量計測量氣液兩相流的問題,本文提出一種新的建模方法對兩相流工況下科氏流量計的質(zhì)量流量測量值進(jìn)行矯正,并對氣相的體積含氣率進(jìn)行預(yù)測.對于DN10管徑,液相量程0~1000kg/h的科氏流量計,在質(zhì)量流量范圍為185~920kg/h、體積含氣率范圍為0~32.4%的兩相流工況下進(jìn)行了實驗,并分析科氏流量計兩相流工況下各特征與質(zhì)量流量和體積含氣率的關(guān)系.在小數(shù)據(jù)集下,為實現(xiàn)較高預(yù)測精度和泛化能力,利用科氏流量計內(nèi)部可觀測信號設(shè)計了Stacking集成模型.由于兩相流信號穩(wěn)定性較差,選用30s信號進(jìn)行處理作為模型的輸入.使用隨機(jī)搜索(RS)法進(jìn)行特征工程,以解決小數(shù)據(jù)集無法提供足夠數(shù)量且多樣的基模型問題.離線測試中,液相質(zhì)量流量預(yù)測模型相對誤差在±2.3%內(nèi),體積含氣率預(yù)測模型所有點絕對誤差均在±2%內(nèi).在線測試中,采用30s內(nèi)預(yù)測值平均值與真實值平均值進(jìn)行誤差計算,所有在建模范圍內(nèi)的工況點質(zhì)量流量預(yù)測相對誤差在-4.15%~2.70%內(nèi),體積含氣率預(yù)測的絕對誤差在±2%內(nèi).超出建模范圍的4個在線測試點,模型預(yù)測表現(xiàn)并未出現(xiàn)明顯下降.動態(tài)在線測試中,采用約455s內(nèi)預(yù)測值的平均值與真實值的平均值進(jìn)行誤差計算,質(zhì)量流量預(yù)測誤差為1.3%,體積含氣率預(yù)測誤差為-1.2%,證明本模型對液相質(zhì)量流量和體積含氣率大幅波動的情況可以進(jìn)行一定程度的跟隨預(yù)測.
科氏流量計;氣液兩相流測量;數(shù)據(jù)驅(qū)動建模;Stacking集成模型;隨機(jī)搜索法
科氏流量計根據(jù)科里奧利力原理制作,能直接測量質(zhì)量流量,在單相流工況下測量精度能達(dá)到0.1%,因此被廣泛使用.但氣液兩相流工況下,由于氣體影響振動阻尼、流體流動狀態(tài)復(fù)雜且變化迅速,導(dǎo)致測量誤差急劇增加.目前,矯正測量誤差常使用機(jī)理建模和數(shù)據(jù)驅(qū)動建模兩種方法.
Hemp等[1]于2003年提出最為經(jīng)典的氣泡模型,該模型認(rèn)為氣泡和液體振動幅度有明顯差異,氣泡和液體發(fā)生解耦,有部分液體質(zhì)量沒有作用在管壁上,導(dǎo)致表觀質(zhì)量流量小于真實值.Gysling[2]于2007年提出了氣動彈性模型,該模型考慮了氣泡的壓縮性和非均勻性影響,通過測量流體聲速,可以確定實時的氣動彈性模型參數(shù),從而得到準(zhǔn)確的測量相位差和測量管固有頻率.Basse[3]于2014年在氣泡模型的基礎(chǔ)上分析了粒子對振蕩流體產(chǎn)生的力,并通過這個力推導(dǎo)由于相位解耦引發(fā)的測量誤差的表達(dá)式.由于在不同管道形狀、流動型態(tài)、含氣體率的工況下,測量誤差差異較大,并表現(xiàn)出非線性、非單調(diào)性、影響因素復(fù)雜,機(jī)理分析建立的模型往往適用范圍較小、實際誤差校正效果有限[4].
基于數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)模型,可直接由實驗數(shù)據(jù)建立,并對未知的樣本數(shù)據(jù)進(jìn)行預(yù)測.由于機(jī)器學(xué)習(xí)具有構(gòu)建非線性模型的能力,實際的測量誤差矯正效果和泛化能力遠(yuǎn)優(yōu)于機(jī)理建模法.馬龍博等[5]使用支持向量機(jī)(support vector machine,SVM)對油水兩相流工況的雙U型科氏流量計進(jìn)行建模,矯正后總質(zhì)量流量誤差在±1%內(nèi),油水分相的質(zhì)量流量誤差在±8%內(nèi).Yue等[6]使用SVM進(jìn)行在線實時矯正,對于微彎DN25管徑的科氏流量計,在水流量35~95kg/min范圍內(nèi),修正后的質(zhì)量流量誤差在-2%~3%內(nèi).Liu等[7]所在團(tuán)隊搭建神經(jīng)網(wǎng)絡(luò)模型,根據(jù)科氏流量計內(nèi)部觀測信號,對科氏流量計的表觀質(zhì)量流量進(jìn)行矯正,實現(xiàn)質(zhì)量流量在1.5~3.5kg/h,密度降在0~30%范圍內(nèi),校正后質(zhì)量流量誤差在2%內(nèi).Hou等[8]使用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建液體質(zhì)量流量和流體密度的在線矯正模型,實現(xiàn)水流量3~15kg/min范圍內(nèi),體積含氣率至多25%時,流量誤差在±3.5%內(nèi),密度誤差在±1.5%內(nèi).Wang等[9]對比支持向量機(jī)、ANN、GP模型,建模結(jié)果顯示SVM預(yù)測結(jié)果更好,質(zhì)量流量預(yù)測模型在水平管道上93.49%的預(yù)測點相對誤差在±1%內(nèi),體積含氣率預(yù)測模型在水平管道上93.10%的預(yù)測點相對誤差在±1%內(nèi);質(zhì)量流量預(yù)測模型在垂直管道上96.17%的預(yù)測點相對誤差在±1%內(nèi),體積含氣率預(yù)測模型在垂直管道上94.25%的預(yù)測點相對誤差在±1%內(nèi).
上述研究構(gòu)建的模型,大多并未說明建模使用的數(shù)據(jù)集大小及模型的拓展預(yù)測能力.由于實際應(yīng)用中工況復(fù)雜,與實驗室中工況可能存在較大差異,且存在采集原始建模數(shù)據(jù)困難的問題,故建立使用小數(shù)據(jù)集建模的模型和探究模型的拓展預(yù)測能力對模型的實際應(yīng)用有著重要意義.大多模型僅針對液體質(zhì)量流量進(jìn)行矯正,未對體積含氣率進(jìn)行量化預(yù)測,且基本使用SVM模型和各種神經(jīng)網(wǎng)絡(luò)模型,以較少輸入特征量進(jìn)行建模.構(gòu)建神經(jīng)網(wǎng)絡(luò)模型往往需要較多的訓(xùn)練集樣本數(shù)據(jù),否則回歸效果可能無法達(dá)到目標(biāo)要求.雖然SVM模型在訓(xùn)練集規(guī)模較小時回歸效果較神經(jīng)網(wǎng)絡(luò)模型更好,但是SVM模型對超參數(shù)的設(shè)定和核函數(shù)的選擇十分敏感,在輸入特征變量較少的情況下,可能無法兼顧模型的回歸精度和泛化能力,泛化能力是指模型對未知數(shù)據(jù)集的預(yù)測能力.
為解決以上問題,本文使用快速響應(yīng)的轉(zhuǎn)換器以采集高精度科氏流量計的樣本數(shù)據(jù),利用小規(guī)模訓(xùn)練集進(jìn)行特征工程,結(jié)合隨機(jī)搜索法選擇輸入特征變量,構(gòu)建質(zhì)量流量范圍185~920kg/h、體積含氣率范圍0~32.4%的氣液兩相流質(zhì)量流量和體積含氣率的Stacking集成預(yù)測模型.同時,利用PyQt實現(xiàn)模型在上位機(jī)的在線連續(xù)預(yù)測和顯示,證明了該模型具有較高的預(yù)測精度、泛化能力和一定的跟隨預(yù)測能力.
實驗裝置如圖1所示,由水路和氣路兩條通道組成,以此形成氣液兩相流.水從水槽中抽出,打入水塔之中,形成壓力穩(wěn)定的水流,并依次流過液相標(biāo)準(zhǔn)表(渦輪流量計)、被檢表(科氏流量計)、換向器,最終流回水槽.水路通過氣動開關(guān)閥、電動調(diào)節(jié)閥、手閥控制流量大?。畾饴吠ㄟ^SV1開啟,由氣泵產(chǎn)生的氣體,經(jīng)過儲氣罐、調(diào)壓閥、緩沖罐、穩(wěn)壓閥、針閥,氣流量達(dá)到穩(wěn)定后,經(jīng)氣相標(biāo)準(zhǔn)表與水混合,形成氣液兩相流,再經(jīng)科氏流量計流回水槽,空氣從水中溢出.
圖1?兩相流實驗裝置示意
實驗中的科氏流量計選用Walsn VS 系列的DN10雙管科氏流量計,最大量程為1000kg/h,單相流工況下液相質(zhì)量流量的計量精度為0.1%,重復(fù)性優(yōu)于0.02%.快速響應(yīng)的轉(zhuǎn)換器使用本實驗室自行開發(fā)的基于ZYNQ的科氏流量計轉(zhuǎn)換器,轉(zhuǎn)換器的采集頻率達(dá)48kHz,科氏流量計的原始信號經(jīng)處理后與上位機(jī)進(jìn)行通信,通信頻率約為104Hz.液相標(biāo)準(zhǔn)表選取測量精度為0.3%的渦輪流量計,氣相標(biāo)準(zhǔn)表選用量程分別為0~600mL/min和0.04~0.4m3/h,儀表精度分別為1%和2.5%的Alicat氣體質(zhì)量流量計和浮子流量計.
水路使用水塔供水,以提供壓力穩(wěn)定的水流,減少液相波動影響信號的重復(fù)性.氣路的空氣壓力為0.6MPa,流量范圍為0~0.4m3/h,通過安裝緩沖罐、穩(wěn)壓閥、針型閥,穩(wěn)定了氣體流量,其波動范圍在?±10mL/min以內(nèi).
實驗?zāi)繕?biāo)是,在質(zhì)量流量范圍約185~920kg/h,體積含氣率范圍為0~32.4%的兩相流工況下,采集科氏流量計的信號,作為后續(xù)建模所用到的樣本數(shù)據(jù),標(biāo)準(zhǔn)表采集的數(shù)據(jù)作為樣本數(shù)據(jù)的標(biāo)簽值.為了觀察模型的實時預(yù)測能力,本研究選擇標(biāo)準(zhǔn)表法進(jìn)行實驗,雖稱重法測量誤差更小,但只能測量一段時間內(nèi)的平均測量誤差.
參照文獻(xiàn)[5-6]中使用科氏流量計表觀質(zhì)量流量、密度降進(jìn)行建模,科氏流量計兩振動傳感器的相位差直接與表觀質(zhì)量流量有關(guān),文獻(xiàn)[7]使用阻尼參與建模,文獻(xiàn)[10]提到兩相流工況下科氏流量計的固有頻率發(fā)生劇烈波動.由于轉(zhuǎn)換器采集得到的科氏流量計的多種信號均基于時域,而時域信號無法充分反映兩相流工況下流體波動情況,多項針對兩相流工況下的信號研究使用小波包分解得到頻域特征值[11-12].所以,本文在實驗中采集了上述各項數(shù)據(jù)在30s內(nèi)的平均值,同時對該段數(shù)據(jù)進(jìn)行3層小波包分解,記錄了上述數(shù)據(jù)小波包分解后最低頻率節(jié)點的能量.由于阻尼不是科氏流量計可以直接采集的數(shù)據(jù),故引入驅(qū)動增益間接反映阻尼的變化.驅(qū)動增益的計算公式為
式中:drv為科氏流量計的驅(qū)動幅值;SA及SB為科氏流量計兩傳感器的振動幅值.
實驗采用保持水路各閥門開度不變,改變氣體流量的方法,基本保證每組實驗中體積含氣率在0~32.4%范圍內(nèi)均勻取點,每個工況點進(jìn)行3次重復(fù)性實驗.使用基于PyQt的上位機(jī)圖形化用戶界面,讀取科氏流量計轉(zhuǎn)換器傳輸?shù)母黜棓?shù)據(jù),并進(jìn)行平均值、小波包分解等計算后導(dǎo)出.
由于科氏流量計在兩相流工況下數(shù)據(jù)重復(fù)性較差、干擾較多,直接使用原始數(shù)據(jù)進(jìn)行建模勢必會引入較多誤差而影響模型的預(yù)測精度,通過初步數(shù)據(jù)分析發(fā)現(xiàn)使用各組數(shù)據(jù)的30s平均值可以有效增加數(shù)據(jù)的重復(fù)性.故在實驗中采集了表觀質(zhì)量流量、表觀密度、科氏流量計固有頻率、科氏流量計驅(qū)動增益和科氏流量計兩傳感器相位差的30s平均值.實驗中共記錄414組數(shù)據(jù),在后續(xù)建模過程中,取其中300(72.5%)組數(shù)據(jù)作為訓(xùn)練集,剩余114(27.5%)組數(shù)據(jù)作為測試集,訓(xùn)練集和測試集分布如圖2所示.
根據(jù)組內(nèi)針對本文使用的科氏流量計進(jìn)行的流型仿真研究[10],通過Fluent數(shù)值模擬軟件對氣液兩相流下的科氏流量計測量管內(nèi)部流動型態(tài)進(jìn)行CFD仿真,可以大致判斷測量管內(nèi)部的流動型態(tài)變化.針對200kg/h、400kg/h、800kg/h 3個質(zhì)量流量下不同體積含氣率進(jìn)行流型仿真,其中發(fā)現(xiàn)質(zhì)量流量為200kg/h、體積含氣率大于20%時,科氏流量計測量管內(nèi)氣泡形狀發(fā)生變化,近似于塞狀流.而其他兩個質(zhì)量流量下的仿真結(jié)果表明,雖然氣泡隨體積含氣率上升變得更加密集,但流型并未發(fā)生明顯變化.在低質(zhì)量流量、高體積含氣率時,測量管內(nèi)發(fā)生流型變化,上、下游氣泡分布差異變大,氣泡分布逐漸趨于不對稱,從而使科氏流量計的相對測量誤差增加.這也解釋了圖3(b)中低質(zhì)量流量、高體積含氣率工況下原始相對測量誤差更大的原因.
圖2?測試集和訓(xùn)練集分布
圖3?質(zhì)量流量原始測量誤差
體積含氣率計算公式為
式中:g為氣相流量;l為液相流量.
根據(jù)式(2),在體積含氣率確定的情況下,氣相液相的質(zhì)量流量比為
根據(jù)氣液兩相流裝置的實驗原理,科氏流量計在兩相流工況下質(zhì)量流量的測量相對誤差計算公式和測量誤差計算公式分別為
式中:q,c為被檢科氏流量計表觀質(zhì)量流量;q,t為渦輪流量計瞬時流量.根據(jù)式(3),在本文進(jìn)行實驗的體積含氣率范圍內(nèi),體積含氣率32.4%時氣相液相的質(zhì)量流量比最大.此時,忽略氣體質(zhì)量對真實氣液兩相總質(zhì)量流量產(chǎn)生0.0618%誤差,故式(4)和式(5)可以忽略氣體質(zhì)量流量.
被檢科氏流量計的測量誤差及相對測量誤差與體積含氣率的關(guān)系如圖3所示.
類似于短時間(或加窗)傅里葉變換,小波包分解經(jīng)常被用做去噪和濾波,由于小波包分解可以自適應(yīng)地匹配頻帶和信號頻譜,該方法成為廣泛應(yīng)用的較高分辨率時頻分析方法[13-14].
小波包分解層數(shù)決定了分解后每部分的分辨率,且分辨率與小波分解層數(shù)呈指數(shù)關(guān)系.選擇太多層小波包分解,會導(dǎo)致低頻部分基本不存在能量,且計算時間大幅增加.通過初步信號分析發(fā)現(xiàn)選擇3層小波包分解計算時間較短,且每部分能量差異較大,適合進(jìn)行信號分析.
針對表觀質(zhì)量流量,使用3層小波包分解并重構(gòu)波形后,得到4組重構(gòu)后的波形,通過能量計算,發(fā)現(xiàn)除最高頻率的重構(gòu)波形幾乎沒有能量外,其余3組波形能量差異巨大,且大多數(shù)能量集中在頻率最低的波形內(nèi).通過比較液相質(zhì)量流量接近但體積含氣率不同的工況點下的兩個高頻段能量之和,可以發(fā)現(xiàn)隨體積含氣率上升,高頻段能量呈非線性的上升趨勢.由于液相質(zhì)量流量接近,可以合理推測是體積含氣率上升導(dǎo)致了高頻段能量上升.且對單相流工況進(jìn)行相同層數(shù)的小波包分解并波形重構(gòu),發(fā)現(xiàn)除最低頻波形外,其余3組重構(gòu)波形基本不存在能量.對比單相流和兩相流工況下的小波包分解能量,可以推斷氣泡振動產(chǎn)生的能量存在于高頻段部分,通過頻譜分析發(fā)現(xiàn)頻率范圍在40~65Hz之間.
小波包分解得到的低頻段信號能量,合理推斷可以去除部分氣泡振動對測量數(shù)據(jù)帶來的影響,得到穩(wěn)態(tài)部分能量.科氏流量計表觀質(zhì)量流量小波包分解最低頻率節(jié)點的能量與體積含氣率的關(guān)系如圖4所示,在相同液相質(zhì)量流量下兩者表現(xiàn)出一定的線性關(guān)系,不同質(zhì)量流量下低頻段能量差異較大且液相流量越大低頻段能量越高.除高液相質(zhì)量流量、低體積含氣率的幾個工況點,體積含氣率增加后低頻段能量變化不大.
為了間接反映測量管阻尼變化趨勢,根據(jù)式(1)引入驅(qū)動增益,兩相流工況下驅(qū)動增益與體積含氣率關(guān)系如圖5所示.在液相流量大致保持不變的情況下,體積含氣率增高的過程中,測量管阻尼比大幅上升,即科氏流量計的振動愈加困難,兩傳感器檢測到的振動越來越?。?/p>
圖4 表觀質(zhì)量流量小波包分解能量與體積含氣率關(guān)系
圖5?驅(qū)動增益與體積含氣率關(guān)系
Wolpert[15]于1992年提出Stacking堆疊集成模型,該集成模型由第1層的多個基模型和第2層的元模型組成,Stacking集成模型結(jié)構(gòu)如圖6所示.選取種類、參數(shù)、輸入變量不同的基模型對原始訓(xùn)練集進(jìn)行學(xué)習(xí),理論上可以利用不同基模型的優(yōu)點并互相彌補(bǔ)缺點,以提高模型預(yù)測結(jié)果的精度和泛化能力.由于多層學(xué)習(xí)的結(jié)構(gòu)很容易導(dǎo)致過擬合發(fā)生,故在基模型學(xué)習(xí)時使用折交叉驗證來降低過擬合風(fēng)險,同時,元模型應(yīng)選擇過擬合風(fēng)險較小的模型.
圖6?Stacking集成模型結(jié)構(gòu)
使用原始數(shù)據(jù)集進(jìn)行Stacking集成建模,以測試Stacking集成模型在兩相流實驗所采集到的樣本數(shù)據(jù)上的表現(xiàn)情況.得分使用均方誤差(MSE)、平均絕對誤差(MAE)(針對體積含氣率預(yù)測模型)、平均絕對百分比誤差(MAPE)(針對質(zhì)量流量預(yù)測模型)進(jìn)行衡量,計算方法分別為
式中:y為真實值;x為模型預(yù)測值、得分越小代表預(yù)測值越接近真實值.
首先選取了基于ARD先驗的貝葉斯線性回歸、梯度提升決策樹、RBF核的支持向量回歸(SVR)、線性核的支持向量回歸、多元線性回歸和多重感知機(jī)分別針對液相質(zhì)量流量和體積含氣率使用訓(xùn)練集使用K折交叉驗證選取最優(yōu)參數(shù)進(jìn)行建模并使用測試集回歸,計算各模型的測試得分.再將上述模型作為基模型,多元線性回歸作為元模型組成Stacking集成模型,計算Stacking集成模型的測試得分.各模型測試集得分結(jié)果如圖7所示,針對液相質(zhì)量流量和體積含氣率的兩項預(yù)測,Stacking集成模型的得分均優(yōu)于其他單一模型,證明Stacking模型在本文數(shù)據(jù)集上有著更為優(yōu)越的預(yù)測表現(xiàn).
為了使Stacking集成模型的預(yù)測結(jié)果有更好的表現(xiàn),需要準(zhǔn)確且多樣的基模型[16-17],通常使用不同的學(xué)習(xí)模型和參數(shù)構(gòu)建基模型.但本文數(shù)據(jù)集樣本數(shù)較少,且液相質(zhì)量流量作為標(biāo)簽較為離散,并不適合大部分樹模型進(jìn)行回歸預(yù)測,使用原始特征無法構(gòu)建出足夠多的基模型,故需要進(jìn)行特征工程,特征工程是指從原始數(shù)據(jù)提取可以描述數(shù)據(jù)集的建模特征過程.
圖7?各模型得分
先使用原始特征進(jìn)行基礎(chǔ)數(shù)學(xué)變換,包括乘除運算、指數(shù)對數(shù)運算,以構(gòu)造新特征,并將原始特征及新特征共1050個特征量構(gòu)成特征池.由于特征變量對模型預(yù)測精度提升的邊際成本遠(yuǎn)大于邊際收益,使用隨機(jī)搜索法進(jìn)行特征工程可以大幅節(jié)省訓(xùn)練時間. 特征工程流程如圖8所示,擬定基模型所需參數(shù)和輸入特征數(shù),根據(jù)輸入特征數(shù)在特征池中進(jìn)行隨機(jī)搜索次,并根據(jù)擬定的基模型參數(shù)對搜索的個新特征集進(jìn)行評估,選擇最優(yōu)一組,得到基模型,重復(fù)上述步驟共選出組基模型進(jìn)行Stacking集成.
液相質(zhì)量流量預(yù)測模型和體積含氣率預(yù)測模型具體組成如下:液相質(zhì)量流量模型由8個基模型組成,相同類型的基模型存在輸入特征量或超參數(shù)的不同,基模型進(jìn)行10折交叉驗證.基模型分別為:15個特征輸入的貝葉斯回歸、10個特征輸入的貝葉斯回歸、20個特征輸入的貝葉斯回歸、10個特征輸入的高斯核支持向量機(jī)、10個特征輸入的高斯核支持向量機(jī)、12個特征輸入的線性支持向量機(jī)、12個特征輸入的線性支持向量機(jī)、15個特征輸入的多元線性回歸.體積含氣率模型由7個基模型組成,相同類型的基模型也存在輸入特征量或超參數(shù)的不同,基模型進(jìn)行10折交叉驗證.基模型分別為:6個特征輸入的貝葉斯回歸、10個特征輸入的貝葉斯回歸、15個特征輸入的高斯核支持向量機(jī)、20個特征輸入的高斯核支持向量機(jī)、10個特征輸入的高斯核支持向量機(jī)、6個特征輸入的近鄰回歸、10個特征輸入的近鄰回歸.
圖8?基于隨機(jī)搜索法的特征工程流程
其中,新特征集的評估方法綜合模型的MSE、MAE、MAPE和超出預(yù)測誤差閾值(液相質(zhì)量流量模型為相對誤差2%,體積含氣率模型為絕對誤差1%)的預(yù)測點數(shù)量.
進(jìn)行基于隨機(jī)搜索法的特征工程后,針對液相質(zhì)量流量的預(yù)測模型MSE減少54.337%,MAPE減少32.429%,針對體積含氣率的預(yù)測模型MSE減少15.138%,MAE減少9.259%,證明特征工程對于改善模型預(yù)測表現(xiàn)有較為明顯的效果.
元模型選擇使用SVM對基模型的輸出進(jìn)行建模,并使用隨機(jī)搜索法添加了特征池中未被用到的特征.雖然這樣會降低模型的可解釋性,但通過調(diào)節(jié)元模型的超參數(shù),可以進(jìn)一步增加模型的預(yù)測表現(xiàn)并有效降低過擬合風(fēng)險.使用網(wǎng)格調(diào)參法對SVM進(jìn)行調(diào)參,根據(jù)測試集和訓(xùn)練集的MSE及超出預(yù)測誤差閾值的預(yù)測點數(shù)量進(jìn)行超參數(shù)選擇.最優(yōu)參數(shù)下,針對液相質(zhì)量流量的預(yù)測模型MSE為44.9,MAPE為0.00870,較使用多元線性回歸分別減少21.8%和9.17%;針對體積含氣率的預(yù)測模型MSE為1.14,MAPE為0.900,較使用多元線性回歸分別減少6.02%和4.17%.
兩模型離線對測試集預(yù)測誤差如圖9所示.
圖9?模型預(yù)測誤差
液相質(zhì)量流量模型相對誤差在±2.3%內(nèi),體積含氣率模型所有點絕對誤差均在±2%內(nèi).兩模型每組數(shù)據(jù)平均預(yù)測用時分別為0.066s和0.058s,滿足在線預(yù)測的需求.
使用PyQt搭建上位機(jī)在線預(yù)測界面,為防止界面卡頓,約0.45s進(jìn)行一次質(zhì)量流量修正和體積含氣率預(yù)測.在線預(yù)測的工況點分布如圖10所示,紅色虛線為訓(xùn)練集大致的建模范圍.
在線預(yù)測共測試了39個靜態(tài)工況點,即液相質(zhì)量流量和體積含氣率都相對穩(wěn)定的工況點,目的是測試模型的預(yù)測精度與穩(wěn)定性.其中35個點在模型的建模范圍內(nèi),4個點在模型的建模范圍外,以此測試預(yù)測模型在較穩(wěn)定工況下的泛化能力.每個工況點使用滑窗方式進(jìn)行數(shù)據(jù)采集,30s約預(yù)測600~800個數(shù)據(jù).
圖10?在線預(yù)測工況點分布
每組實驗的30s預(yù)測數(shù)據(jù)中均未出現(xiàn)顯著離群點或預(yù)測誤差劇烈波動的情況,證明模型的穩(wěn)定性較好.模型預(yù)測誤差與表觀值誤差分布如圖11所示,30s內(nèi)質(zhì)量流量預(yù)測值平均值與真實值平均值的相對誤差在-4.15%~2.70%內(nèi),質(zhì)量流量和體積含氣率較小時預(yù)測誤差明顯較小;模型預(yù)測前后測量誤差至多減少了96.4%,最少減少了12.2%.模型在低質(zhì)量流量時預(yù)測效果較好,在質(zhì)量流量小于約700kg/h時,所有在線測試點的相對誤差均在±3%內(nèi).在質(zhì)量流量變大時,模型預(yù)測誤差的方差也隨之變大,但表觀質(zhì)量流量誤差的方差卻隨之減小.這可能是由于液相質(zhì)量流量增大后流速變快,表觀質(zhì)量流量的值重復(fù)性變高,但例如密度、驅(qū)動增益等值重復(fù)性變差,特征工程后的新特征量重復(fù)性也隨之變差,故導(dǎo)致模型質(zhì)量流量較大時預(yù)測重復(fù)性變差.
圖11?質(zhì)量流量預(yù)測誤差和表觀誤差分布
在低質(zhì)量流量、高體積含氣率的工況下,質(zhì)量流量真值和體積含氣率波動劇烈,模型預(yù)測誤差雖較小,但無法實時反映真值的波動情況,如圖12所示.在高質(zhì)量流量進(jìn)行在線測試時,模型預(yù)測效果較差,推測因為高質(zhì)量流量時兩相流流動更為復(fù)雜,信號波動更加劇烈、重復(fù)性較差.
圖12 液相質(zhì)量流量270.5kg/h、體積含氣率21.43%工況下質(zhì)量流量真實值、預(yù)測值、表觀值曲線
體積含氣率模型預(yù)測誤差分布如圖13所示,所有工況下30s內(nèi)累積的體積含氣率預(yù)測值之和與真實值之和的絕對誤差在±2%內(nèi),其中預(yù)測值偏離真實值的最大絕對誤差為2.69%.與質(zhì)量流量模型不同的是,在低質(zhì)量流量、高體積含氣率的工況下,模型預(yù)測點不再呈現(xiàn)較為平穩(wěn)的狀態(tài),而是會劇烈波動,如圖14所示.這是由于液相流速相對較慢,體積含氣率較高,管內(nèi)流動狀況十分復(fù)雜,原始傳感器數(shù)據(jù)重復(fù)性差,故模型預(yù)測結(jié)果較為分散.
圖13?體積含氣率預(yù)測誤差分布
圖14 液相質(zhì)量流量270.5kg/h、體積含氣率21.43%工況下體積含氣率真實值、預(yù)測值曲線
由于實際工業(yè)現(xiàn)場應(yīng)用時,可能采集建模數(shù)據(jù)較為困難,發(fā)生預(yù)測工況略微超出建模范圍的情況.為驗證這種情況下本模型的預(yù)測情況,在建模范圍外進(jìn)行了4組靜態(tài)工況點的實驗,質(zhì)量流量和體積含氣率如圖10中紅色標(biāo)記點所示,2組實驗質(zhì)量流量超出建模范圍,2組實驗體積含氣率超出建模范圍.由于4個工況下兩模型預(yù)測表現(xiàn)類似,故只展示液相質(zhì)量流量949.9kg/h、體積含氣率11.22%工況下兩模型的預(yù)測曲線,如圖15所示.
圖15 液相質(zhì)量流量949.9kg/h、體積含氣率11.22%工況下曲線
質(zhì)量流量超出建模范圍的2組實驗,質(zhì)量流量修正后的預(yù)測誤差為4.7%和3.0%,較修正前11.5%和14.4%的測量誤差減小了59.3%和79.1%,體積含氣率預(yù)測誤差為-0.89%和2.58%,模型預(yù)測精度未有大幅度下降.體積含氣率超出建模范圍的2組實驗,質(zhì)量流量修正后的預(yù)測誤差為-2.1%和0.8%,較修正前7.3%和10.7%的測量誤差減小了77.1%和92.5%,體積含氣率預(yù)測誤差為-1.22%和-2.33%,模型質(zhì)量流量和體積含氣率預(yù)測精度與建模范圍內(nèi)的工況點相比沒有顯著下降.
此外,為了測試模型的動態(tài)跟隨能力,進(jìn)行了一組質(zhì)量流量范圍在440~485kg/h內(nèi),體積含氣率范圍在10%~28%內(nèi),共約455s的動態(tài)預(yù)測測試.相關(guān)數(shù)據(jù)如圖16所示,可見由于模型特征輸入均為30s數(shù)據(jù)進(jìn)行均值和小波包分解,預(yù)測存在一定的時延,但模型預(yù)測值在一定程度上跟隨真實值波動.動態(tài)測試中質(zhì)量流量預(yù)測誤差為1.3%,模型校正后質(zhì)量流量測量誤差減少84.6%,體積含氣率預(yù)測誤差為-1.2%.
圖16?動態(tài)測試曲線
為解決氣液兩相流工況下科氏流量計測量問題,設(shè)計了質(zhì)量流量范圍為185~920kg/h、體積含氣率范圍為0~32.4%的質(zhì)量流量修正模型和體積含氣率預(yù)測模型.在實驗采集的小規(guī)模數(shù)據(jù)集下使用Stacking集成模型,以提高預(yù)測的精度和泛化能力,同時利用隨機(jī)搜索法進(jìn)行特征工程,進(jìn)一步提高模型的預(yù)測表現(xiàn).離線測試質(zhì)量流量模型可以實現(xiàn)相對誤差在±2.3%內(nèi),體積含氣率模型所有點絕對誤差均在±2%內(nèi).
為進(jìn)一步驗證模型的泛化能力,進(jìn)行了3部分在線測試,分別為建模范圍內(nèi)測試、建模范圍外測試及動態(tài)測試.建模范圍內(nèi)的在線測試,質(zhì)量流量預(yù)測相對誤差在-4.15%~2.70%內(nèi),質(zhì)量流量和體積含氣率較小時預(yù)測誤差明顯較小;液相質(zhì)量流量和體積含氣率分別超出建模范圍的在線測試,模型預(yù)測表現(xiàn)并未明顯變差,證明本模型具有一定的“向外擴(kuò)展”能力;動態(tài)測試中采用約455s內(nèi)累積的預(yù)測值之和與真實值之和進(jìn)行誤差計算,質(zhì)量流量預(yù)測誤差為1.3%,體積含氣率預(yù)測誤差為-1.2%,且預(yù)測曲線證明本模型雖具有一定的時延,但可以跟隨液相質(zhì)量流量和體積含氣率波動.
本文提出的模型在兼顧預(yù)測精度的前提下,測試了在超出建模范圍的工況下的預(yù)測表現(xiàn),以及在工況發(fā)生變化時的預(yù)測精度和跟隨能力,證明了本模型在實際運行工況中有較好的實用性.
[1]Hemp J,Yeung H. Coriolis meters in two phase conditions[J]. IEEE Computing & Control Engineering,2003,14(4):36.
[2]Gysling D L. An aeroelastic model of Coriolis mass and density meters operating on aerated mixtures[J]. Flow Measurement and Instrumentation,2007,18(2):69-77.
[3]Basse N T. A review of the theory of Coriolis flowmeter measurement errors due to entrained particles[J]. Flow Measurement and Instrumentation,2014,37:107-118.
[4]徐浩然,徐科軍,張?倫,等. 科氏質(zhì)量流量計測量含氣液體流量關(guān)鍵技術(shù)綜述[J]. 計量學(xué)報,2021,42(4):483-494.
Xu Haoran,Xu Kejun,Zhang Lun,et al. Research on key technology of Coriolis mass flowmeter for measuring flow rate of gas containing liquid[J]. Acta Metrologica Sinic,2021,42(4):483-494(in Chinese).
[5]馬龍博,張宏建,周洪亮,等. 基于 Coriolis 流量計和 SVM 的油水兩相流質(zhì)量流量測量的研究[J]. 高校化學(xué)工程學(xué)報,2007,21(2):200-205.
Ma Longbo,Zhang Hongjian,Zhou Hongliang,et al. Mass flow measurement of oil-water two-phase flow based on Coriolis flow meter and SVM[J]. Journal of Chemical Engineering of Chinese Universities,2007,21(2):200-205(in Chinese).
[6]Yue J,Xu K J,Liu W,et al. SVM based measurement method and implementation of gas-liquid two-phase flow for CMF[J]. Measurement,2019,145:160-171.
[7]Liu R P,F(xiàn)uent M J,Henry M P,et al. A neural network to correct mass flow errors caused by two-phase flow in a digital Coriolis mass flowmeter[J]. Flow Measurement and Instrumentation,2001,12(1):53-63.
[8]Hou Q L,Xu K J,F(xiàn)ang M,et al. Gas-liquid two-phase flow correction method for digital CMF[J]. IEEE Transactions on Instrumentation and Measurement,2014,63(10):2396-2404.
[9]Wang L,Liu J,Yan Y,et al. Gas-liquid two-phase flow measurement using Coriolis flowmeters incorporating artificial neural network,support vector machine,and genetic programming algorithms[J]. IEEE Transactions on Instrumentation and Measurement,2016,66(5):852-868.
[10]劉?悅. 基于PSO-SVM的科氏流量計氣液兩相流測量模型研究[D]. 天津:天津大學(xué),2021.
Liu Yue. Research on Gas-Liquid Two-phase Flow Measurement Model Based on PSO-SVM for Coriolis Flowmeters[D]. Tianjin:Tianjin University,2021(in Chinese).
[11]孫?斌,周云龍. 基于支持向量機(jī)和小波包能量特征的氣液兩相流流型識別方法[J]. 中國電機(jī)工程學(xué)報,2005,25(17):93-99.
Sun Bin,Zhou Yunlong. Identification method of gas-liquid two-phase flow regime based on support vectormachine and wavelet packet energy feature[J]. Proceedings of the CSEE,2005,25(17):93-99(in Chinese).
[12]Li C,Sun L,Liu J,et al. Improvement of signal processing in Coriolis mass flowmeters for gas-liquid two-phase flow[J]. Frontiers of Information Technology & Electronic Engineering,2021,22(2):272-286.
[13]Gao Z K,Li S,Dang W D,et al. Wavelet multiresolution complex network for analyzing multivariate nonlinear time series[J]. International Journal of Bifurcation and Chaos,2017,27(8):1750123.
[14]Van Ommen J R,Sasic S,van der Schaaf J,et al. Time-series analysis of pressure fluctuations in gas-solid fluidized beds—A review[J]. International Journal of Multiphase Flow,2011,37(5):403-428.
[15]Wolpert D H. Stacked generalization[J]. Neural Networks,1992,5(2):241-259.
[16]Naimi A I,Balzer L B. Stacked generalization:An introduction to super learning[J]. European Journal of Epidemiology,2018,33(5):459-464.
[17]Sesmero M P,Ledezma A I,Sanchis A. Generating ensembles of heterogeneous classifiers using stacked generalization[J]. Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery,2015,5(1):21-34.
Coriolis Flowmeter for Two-Phase Flow Measurement Based on RS-Stacking Model
Sun Lijun1, 2,Zhao Zihui1, 2,Gao Jingyu1, 2,Zhang Jingqiong3,Shao Xin4
(1. School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China;2. Tianjin Key Laboratory of Process Measurement and Control,Tianjin 300072,China;3. Department of Automatic Control and Systems Engineering,The University of Sheffield,Sheffield S1 3JD,UK;4. Intelligent Manufacturing College,Tianjin Sino-German University of Applied Sciences,Tianjin 300350,China)
Coriolis flowmeters for single-phase flows have many industrial applications,but it remains a challenge to measure gas-liquid two-phase flows. Therefore,this paper proposes a new modeling method to accurately measure the mass flow rate using a Coriolis flowmeter and predict gas-volume fraction(GVF)under two-phase flow conditions. Based on a DN10 commercially available Coriolis flow sensor whose liquid mass flow range is 0 to 1000kg/h,random searching(RS)was exploited to conduct feature engineering,and the measurement signals of the prototype Coriolis flowmeter were used as inputs to develop a Stacking ensemble model. For the experiment,a liquid mass flow rate approximately ranging from 185 kg/h to 920 kg/h and GVF from 0 to 32.4% were considered to evaluate the model performance and analyze the relationship of observable signals of the Coriolis mass flowmeter and two-phase flow conditions. The Stacking model can provide more accurate predictions and achieve better generalization using a relatively small-scale dataset. Moreover,30 s measurement signals were used as inputs of the model,considering the poor stability of two-phase flow measurement using the Coriolis flowmeter. RS was employed to provide various large datasets for model training. In the offline test,relative errors of predicted mass flow rate values were found to be within ±2.3%,and all predicted GVF values were found to be within ±2% with respect to the reference. In the online test,the relative errors were calculated by averaging the predicted and actual values within a 30s time window. The relative errors of all predicted mass flow rate values were found to be within -4.15%—2.70%. Similarly,for GVF,all predicted values were found to be within ±2%. Outside the modeling range,four working conditions were tested,and the performance of the model did not show any dramatic decline. In the dynamic online test,the relative errors were calculated by averaging predicted and actual values within a time window of approximately 455 s. The average relative error of the predicted mass flow rate values was determined to be 1.3%,and the average error of predicted GVF was -1.2%,which proves that the proposed model can follow the transient fluctuations in the mass flow rate and GVF.
Coriolis flowmeter;gas-liquid two-phase flow measurement;data-driven modeling;Stacking ensemble model;random searching(RS) method
10.11784/tdxbz202208033
TH814.6
A
0493-2137(2023)11-1195-10
2022-08-27;
2023-01-19.
孫立軍(1974—??),男,博士,副教授.Email:m_bigm@tju.edu.cn
孫立軍,sunlijun@tju.edu.cn.
國家自然科學(xué)基金資助項目(62073240).
the National Natural Science Foundation of China(No.62073240).
(責(zé)任編輯:孫立華)