戰(zhàn)慶亮 白春錦 葛耀君
1)(大連海事大學(xué),交通運(yùn)輸工程學(xué)院,大連 116026)
2)(同濟(jì)大學(xué),土木工程防災(zāi)國家重點(diǎn)實(shí)驗(yàn)室,上海 200092)
流場的特征分析與表征研究對流動(dòng)機(jī)理的明確具有重要意義.然而湍流流場具有復(fù)雜的非定常時(shí)空演化特征,對其流場數(shù)據(jù)的低維表征有一定困難.針對此問題,本文提出了基于流場時(shí)程數(shù)據(jù)深度學(xué)習(xí)方法的湍流低維表征模型,實(shí)現(xiàn)了復(fù)雜流動(dòng)數(shù)據(jù)的降維表征.分別建立了基于一維線性卷積、非線性全連接和非線性卷積的自動(dòng)編碼方法,對非定常時(shí)程數(shù)據(jù)進(jìn)行降維并得到了低維空間到時(shí)域的解碼映射關(guān)系,實(shí)現(xiàn)了特征提取與壓縮.通過Re=2.2×104的方柱繞流場進(jìn)行了研究與驗(yàn)證,結(jié)果表明:時(shí)程深度學(xué)習(xí)方法可以有效地實(shí)現(xiàn)流場的低維表征,適用于復(fù)雜湍流問題;非線性一維卷積自編碼器對復(fù)雜流場的表征準(zhǔn)確性優(yōu)于全連接和線性卷積方法.本文方法是無監(jiān)督訓(xùn)練方法,可應(yīng)用于基于一點(diǎn)的傳感器數(shù)據(jù)處理中,是研究復(fù)雜流場特征的新方法.
高分辨率的湍流流場信息對于湍流的細(xì)觀結(jié)構(gòu)研究等問題至關(guān)重要,然而受限于傳感器尺度等因素,在實(shí)驗(yàn)中直接獲得高分辨率的湍流數(shù)據(jù)較為困難.同時(shí),湍流的直接數(shù)值模擬依賴于更多的計(jì)算網(wǎng)格,完整地保存和分析時(shí)-空高分辨率的數(shù)據(jù)難度大.針對這些問題,本文提出了一種基于時(shí)程深度學(xué)習(xí)的湍流流場數(shù)據(jù)表征與降維的研究方法.
對復(fù)雜流場數(shù)據(jù)進(jìn)行降維分析是一種有效的研究方法,其優(yōu)勢在于可以挖掘到流場時(shí)程潛在的流動(dòng)特征與規(guī)律.例如本征正交分解方法[1,2]可以依據(jù)能量的大小將流場時(shí)程分解為多階模態(tài),且每一階模態(tài)都可以表征流場的部分特征,實(shí)現(xiàn)流場的降維分析.動(dòng)態(tài)模態(tài)分解法[3,4]在處理多元時(shí)序模型時(shí),可以將下一個(gè)時(shí)刻的某個(gè)特征值看作上一個(gè)時(shí)刻所有特征值的線性組合,把一個(gè)高維動(dòng)態(tài)的系統(tǒng)降低至低維以簡化計(jì)算分析.然而湍流流場具有很強(qiáng)的非線性,此類基于矩陣分解的方法均采用線性變換無法完整地描述湍流的非線性特征,因而難以應(yīng)用于湍流問題的研究中.隨著計(jì)算機(jī)的發(fā)展,深度學(xué)習(xí)憑借其處理數(shù)據(jù)的高效性,已經(jīng)廣泛應(yīng)用于湍流問題的研究中[5].如嵌入流場不變性的高精度湍流模型[6]、流場特征的自動(dòng)識別[7]、以及基于深度學(xué)習(xí)的物理控制方程驅(qū)動(dòng)的流場求解[8]等.
另一方面,也有大量的學(xué)者對深度學(xué)習(xí)應(yīng)用在流場的表征模型進(jìn)行了研究[9],例如基于卷積神經(jīng)網(wǎng)絡(luò)的流場模態(tài)分解[10]和基于深度自編碼器的流場時(shí)域特性研究[11].這些研究都實(shí)現(xiàn)了通過低分辨率或者部分流場數(shù)據(jù)重構(gòu)出高精度、高分辨率的流場數(shù)據(jù),例如下采樣多尺度重構(gòu)模型[12],多通道路徑卷積模型[13]等.還有一些學(xué)者建立低維模型來表征少量信息點(diǎn)的物理信息與流場瞬態(tài)云圖之間的映射關(guān)系,進(jìn)而實(shí)現(xiàn)稀疏數(shù)據(jù)點(diǎn)的高分辨率重構(gòu)[14],例如泰森多邊形輔助重構(gòu)方法[15],淺層神經(jīng)網(wǎng)絡(luò)重構(gòu)方法[16].同時(shí),也有部分學(xué)者認(rèn)為長短期記憶人工神經(jīng)網(wǎng)絡(luò)可以更好地預(yù)測流場的非定常問題[17,18].然而,這些方法都是通過高分辨率的流場快照作為神經(jīng)網(wǎng)絡(luò)模型的輸入來實(shí)現(xiàn)復(fù)雜流場數(shù)據(jù)的低維表征,訓(xùn)練過程中都需要流場快照作為輸入樣本[19],進(jìn)而建立稀疏數(shù)據(jù)點(diǎn)與整場快照之間的聯(lián)系.
上述基于瞬態(tài)的流場快照數(shù)據(jù)的分析方法難以直接應(yīng)用到基于測點(diǎn)的傳感器數(shù)據(jù)處理中,其中文獻(xiàn)[20?22]提出了基于時(shí)程數(shù)據(jù)深度學(xué)習(xí)的方法,對流場特征提取進(jìn)行研究,對較低雷諾數(shù)情況下的測點(diǎn)時(shí)程進(jìn)行了有效的特征提取.在此基礎(chǔ)上,本文從時(shí)程數(shù)據(jù)的重構(gòu)角度出發(fā),提出了基于深度學(xué)習(xí)的湍流流場低維表征方法.通過一維卷積模型獲得時(shí)程數(shù)據(jù)的抽象特征,并通過全連接網(wǎng)絡(luò)實(shí)現(xiàn)特征壓縮,得到湍流數(shù)據(jù)的低維表征模型,可用于直接處理測點(diǎn)的時(shí)程數(shù)據(jù),而不需要流場快照信息,比傳統(tǒng)基于快照的表征方法具有重大優(yōu)勢.
目前主流的基于數(shù)據(jù)驅(qū)動(dòng)的流動(dòng)系統(tǒng)表征模型均基于流場的時(shí)程數(shù)據(jù)進(jìn)行特征提取與建模,采用基于圖像處理的深度學(xué)習(xí)方法對流場快照進(jìn)行特征的抽象與提取,進(jìn)而可對包含瞬態(tài)整場信息的低維模型進(jìn)行時(shí)變特征分析,得到其時(shí)間的演化規(guī)律.而本文采用了基于時(shí)程數(shù)據(jù)的特征提取方法(見圖1 所示),即面向不同測點(diǎn)位置處的時(shí)程樣本集,獲取時(shí)程特征隨空間位置的分布情況,進(jìn)而得到表征整個(gè)流場域的數(shù)據(jù)驅(qū)動(dòng)表征模型.
圖1 數(shù)據(jù)示意圖Fig.1.Data type for modeling.
流體計(jì)算區(qū)域如圖2 所示,流向長度Lx=40D,橫向長度Ly=20D,其中D為方柱邊長.上游來流區(qū)域長度10D,下游區(qū)域長度30D.x-y平面內(nèi)共計(jì)約11000 個(gè)網(wǎng)格,底層網(wǎng)格高度約為8×10–4.將平面網(wǎng)格展向拉伸30層,每層高度0.1,展向長度Lz=3D.入口邊界條件為速度入口,出口邊界條件為壓力出口,橫向兩界面設(shè)置為對稱邊界.來流速度U∞=0.33 m/s,Re=2.2×104,在遠(yuǎn)離方柱的流場區(qū)域采用較稀疏的網(wǎng)格,而近尾流區(qū)采用較密的網(wǎng)格保證模擬結(jié)果的可靠性,并可捕捉到較大尺度的尾流結(jié)構(gòu)特征,反映測點(diǎn)的流場時(shí)變特征.
圖2 整體計(jì)算域及平面網(wǎng)格劃分(a)整體計(jì)算域;(b)局部網(wǎng)格Fig.2.Global computational domain and plane grid settings:(a)Global computing domain;(b)local mesh.
使用數(shù)值模擬獲得流場中各測點(diǎn)的時(shí)程作為樣本數(shù)據(jù)集,流場的數(shù)值模擬采用自主開發(fā)的三維非結(jié)構(gòu)網(wǎng)格的流體計(jì)算程序zFlower 實(shí)現(xiàn)[23],采用三維非結(jié)構(gòu)化網(wǎng)格對空間進(jìn)行離散,使用有限體積方法離散不可壓縮流動(dòng)控制方程,保證空間與時(shí)間的離散具有二階精度.所得到的方柱升力、阻力系數(shù)時(shí)程和瞬態(tài)流場圖如圖3 所示.
圖3 數(shù)值模擬結(jié)果(a)升力與阻力系數(shù);(b)z=0 切面瞬時(shí)速度矢量圖;(c)y=0 切面瞬時(shí)速度矢量圖;(d)x=2 切面瞬時(shí)速度矢量圖Fig.3.Partial results of simulation:(a)Lift and drag coefficient;(b)sectional instantaneous velocity vector diagram at z=0;(c)sectional instantaneous velocity vector diagram at y=0;(d)sectional instantaneous velocity vector diagram at x=2.
在流體模擬計(jì)算過程中進(jìn)行了同步的流場數(shù)據(jù)采集,嵌入時(shí)程提取模塊將計(jì)算中各時(shí)間步的流場壓力與速度值分類保存,形成了各測點(diǎn)的壓力時(shí)程與速度時(shí)程集參數(shù).由于方柱尾部的時(shí)程更加豐富,在展向一層范圍內(nèi)選取7000 個(gè)測點(diǎn)隨機(jī)分布在流向距離棱柱–2D—+8D范圍內(nèi)、橫向–3D—+3D范圍內(nèi),分布如圖4(a)所示.
圖4 測點(diǎn)分布及時(shí)程結(jié)果(a)測點(diǎn)布置位置;(b)部分測點(diǎn)的流向速度結(jié)果Fig.4.Distributions of monitoring points and time history results:(a)Layout position of measure points;(b)flow velocity of some measure points.
為直觀地展示待訓(xùn)練樣本的數(shù)據(jù)特征,在壓力樣本集中隨機(jī)選取了6 條待訓(xùn)練的物理量時(shí)程進(jìn)行展示,如圖4(b)所示.由于測點(diǎn)位置不同,因而同一樣本集中的時(shí)程信號特征各異,這種具有復(fù)雜特征的流場時(shí)程數(shù)據(jù)特征的提取與識別難以通過傳統(tǒng)方法實(shí)現(xiàn).
采用的流動(dòng)表征模型原理如圖5 所示.對于復(fù)雜非線性動(dòng)力系統(tǒng),其樣本u(t)在空間的分布無規(guī)律可循且難以識別其特征.采用編碼器獲得從物理空間到“編碼空間”的變換關(guān)系,使得在新的編碼空間中,所有流場數(shù)據(jù)都可以通過相同的變化從編碼空間重構(gòu)到物理坐標(biāo)空間.這里的坐標(biāo)變換和數(shù)據(jù)重構(gòu)是通過時(shí)程數(shù)據(jù)的深度學(xué)習(xí)方法獲得的,分別對應(yīng)與自動(dòng)編碼的編碼器和解碼器.
圖5 表征模型的原理Fig.5.Methodology of the representation model.
基于深度學(xué)習(xí)的表征模型中,核心是對復(fù)雜系統(tǒng)的樣本數(shù)據(jù)進(jìn)行準(zhǔn)確地降維表征與還原.本文面向的是一維流場時(shí)程數(shù)據(jù),采用三種不同的方法實(shí)現(xiàn)特征的提取與低維表征,分別是全連接模型(multilayer perceptron autoencoder,MLP-AE)、線性卷積(linear convolutional neural autoencoder,LCN-AE)和非線性卷積(nonlinear convolutional neural autoencoder,NCN-AE)模型.不同模型對數(shù)據(jù)進(jìn)行特征提取的運(yùn)算方式不同,通常輸入與輸出的變換關(guān)系可表示為
其中xn為模型中第n層的時(shí)程輸出;wn與bn為第n層變換權(quán)重矩陣和偏移矩陣.具體地,對于全連接模型,其變換權(quán)重矩陣的特點(diǎn)是與上一層的所有神經(jīng)元都是相連的,而對于一維卷積模型,其變換權(quán)重矩陣是一個(gè)稀疏矩陣,單個(gè)節(jié)點(diǎn)僅同與其相鄰的上層神經(jīng)元的聯(lián)系的權(quán)重為非零值.特征解碼器的模型結(jié)構(gòu)與編碼器相同、順序相反,具體參數(shù)見表1和表2.需要指出的是,LCN-AE 模型與NCN-AE 模型的網(wǎng)絡(luò)參數(shù)相同,但各層未使用激活函數(shù)與偏移矩陣bn.
表1 非線性卷積自動(dòng)編碼模型參數(shù)Table 1.NCN-AE model parameters.
表2 全連接自動(dòng)編碼模型參數(shù)Table 2.MLP-AE model parameters.
以Re=2.2×104的方柱湍流流場時(shí)程數(shù)據(jù)為研究對象,建立輸入時(shí)程的自編碼降維模型,得到了物理空間坐標(biāo)的編碼,進(jìn)而通過編碼與解碼器實(shí)現(xiàn)湍流場時(shí)程的重構(gòu).
在訓(xùn)練模型時(shí),以均方誤差函數(shù)(MSE)為損失函數(shù),該函數(shù)對模型預(yù)測值與樣本真實(shí)值的誤差求平方并取平均值.誤差值越小,說明預(yù)測模型描述實(shí)驗(yàn)數(shù)據(jù)具有更好的精確度.訓(xùn)練時(shí)采用學(xué)習(xí)率為0.001的Adam 優(yōu)化器;設(shè)置批處理大小為16,訓(xùn)練次數(shù)為3000,同時(shí)當(dāng)50 步之內(nèi)誤差不下降時(shí)自動(dòng)停止訓(xùn)練.經(jīng)過迭代訓(xùn)練,得到了3 種深度模型在訓(xùn)練過程中的計(jì)算殘差曲線,如圖6 所示.
圖6 訓(xùn)練集的模型損失值(a)流向速度;(b)橫向速度;(c)展向速度;(d)速度絕對值Fig.6.Loss function of different models on training set:(a)Flow velocity;(b)lateral velocity;(c)spanwise velocity;(d)absolute value of velocity.
四組不同流場參數(shù)的結(jié)果均表明,非線性卷積模型的損失值最小,非線性多層感知網(wǎng)絡(luò)次之,而線性卷積模型的損失值最大.說明相同模型層數(shù)和結(jié)構(gòu)情況下非線性卷積模型精度最高,同時(shí)說明對于復(fù)雜的湍流流場,使用非線性激活函數(shù)是有必要的,深度學(xué)習(xí)模型的流場表征精度要遠(yuǎn)高于線性理論的結(jié)果.
為了直觀地展示不同方法的降維準(zhǔn)確度,同時(shí)找出流場中模型降維準(zhǔn)確度較低的局部區(qū)域,提出了一種無量綱化的誤差計(jì)算方法.誤差計(jì)算公式如下:
其中yi為原始樣本曲線;為重構(gòu)樣本曲線;Ai為樣本時(shí)程曲線的最大值與最小值相差的絕對值.由于流場中的時(shí)程曲線特征各異,該殘差可以評價(jià)不同流動(dòng)特征的樣本時(shí)程,更適合本文方法的驗(yàn)證.
將樣本的物理坐標(biāo)與該誤差相結(jié)合,并使用不同的顏色對誤差范圍進(jìn)行劃分:綠色表示無量綱后的誤差值小于1%,用藍(lán)色表示誤差為1%—5%之間,黃色表示誤差為5%—15%之間,橘黃色表示誤差為15%—30%之間,紅色表示誤差為30%—100%之間,得到誤差可視化結(jié)果如下.
由圖7—圖9 可知,本文方法對四種物理量均實(shí)現(xiàn)了較高精度的表征.本文所研究的高雷諾數(shù)方柱繞流中包含了層流流動(dòng)(遠(yuǎn)場和上游)、湍流尾流和不穩(wěn)定的流動(dòng)分離區(qū),驗(yàn)證了本文深度學(xué)習(xí)方法對復(fù)雜流動(dòng)過程的適用性.
圖7 線性卷積模型的誤差分布(a)流向速度;(b)橫向速度;(c)展向速度;(d)速度絕對值Fig.7.Distributions of relatively error using LCN-AE:(a)Flow velocity;(b)lateral velocity;(c)spanwise velocity;(d)absolute value of velocity.
圖8 全連接模型的誤差分布(a)流向速度;(b)橫向速度;(c)展向速度;(d)速度絕對值Fig.8.Distribution of relatively error using MLP-AE:(a)Flow velocity;(b)lateral velocity;(c)spanwise velocity;(d)absolute value of velocity.
圖9 非線性卷積模型的誤差分布(a)流向速度;(b)橫向速度;(c)展向速度;(d)速度絕對值Fig.9.Distributions of relatively error using NCN-AE:(a)Flow velocity;(b)lateral velocity;(c)spanwise velocity;(d)absolute value of velocity.
通過三種模型的誤差分布圖可以發(fā)現(xiàn),誤差較高的區(qū)域大多分布在流場的來流方向.這是因?yàn)樵谏嫌螀^(qū)域中流體幾乎不受柱體擾動(dòng),從而使得該區(qū)域內(nèi)測點(diǎn)的時(shí)程曲線振幅很小近似為直線,進(jìn)而導(dǎo)致上游區(qū)域的相對誤差較大.同時(shí),比較三種特征提取方法可以發(fā)現(xiàn),線性卷積模型的還原精度不如其余兩種方法,這也說明了對于復(fù)雜的湍流流動(dòng),采用非線性變換實(shí)現(xiàn)數(shù)據(jù)降維是有必要的.全連接方法略優(yōu)于線性卷積而差于非線性卷積方法,說明卷積層可以逐層提取輸入數(shù)據(jù)中所蘊(yùn)含的特征,對復(fù)雜流場時(shí)程特征提取具有更高的準(zhǔn)確性及訓(xùn)練的有效性.這與文獻(xiàn)[22]關(guān)于特征提取運(yùn)算的結(jié)論是一致的,各模型對不同流場變量計(jì)算的相對誤差平均值見表3 與圖10.
表3 不同模型的誤差散點(diǎn)圖均值Table 3.Mean relatively error of different models.
圖10 不同模型的誤差散點(diǎn)圖均值Fig.10.Mean relatively error of different models.
對表征模型精度最好的非線性卷積模型,在各物理參數(shù)測點(diǎn)中隨機(jī)選擇6 條時(shí)程,與模型的重構(gòu)結(jié)果進(jìn)行比較,如圖11 所示.
由圖11 可以看出,湍流場中的時(shí)程曲線無法找到共同的流動(dòng)特征,但非線性卷積模型建立的表征模型依然可以準(zhǔn)確地還原復(fù)雜湍流的流場時(shí)程信息,說明該表征模型提取的低維特征是有效的,可以將復(fù)雜的湍流時(shí)程壓縮為低維的編碼表征,并通過解碼器進(jìn)行時(shí)程的還原.
圖11 原始時(shí)程與重構(gòu)時(shí)程的比較(a)流向速度;(b)橫向速度;(c)展向速度;(d)速度絕對值;(e)流向速度的局部視圖;(f)橫向速度的局部視圖;(g)展向速度的局部視圖;(h)速度絕對值的局部視圖Fig.11.Comparision of original and reconstructed flow time history samples:(a)Flow velocity;(b)lateral velocity;(c)spanwise velocity;(d)absolute value of velocity;(e)partial view of flow velocity;(f)partial view of lateral velocity;(g)partial view of spanwise velocity;(h)partial view of absolute value of velocity.
本文采用了時(shí)程深度學(xué)習(xí)方法建立了高雷諾數(shù)湍流場的低維表征模型,分別采用了三種不同的時(shí)程特征提取方法實(shí)現(xiàn)數(shù)據(jù)降維,對四種流動(dòng)數(shù)據(jù)進(jìn)行了分析,結(jié)果表明,1)基于非線性卷積的深度學(xué)習(xí)模型對流場特征的識別精度高并且優(yōu)于其他兩種模型,可以準(zhǔn)確的提取到流場不同區(qū)域的流動(dòng)特征;2)基于線性卷積的深度學(xué)習(xí)模型對流場特征識別精度不如其他兩種模型,說明在復(fù)雜時(shí)程的數(shù)據(jù)降維中非線性變換是一種非常有效的方法;3)基于全連接方法的深度學(xué)習(xí)模型精度不如非線性卷積模型,難以準(zhǔn)確提取流場時(shí)程的特征.本文通過深度學(xué)習(xí)方法對流場時(shí)程數(shù)據(jù)進(jìn)行了特征提取與時(shí)程重構(gòu),證明了該方法適用于湍流場,可以有效的對流場進(jìn)行低維表征,是流場特征研究的新方法.