宮思吟,俞曉東,2,葛思涵,陳艷琳,鐘漢斌,2(通信作者)
(1 西安石油大學(xué)化學(xué)化工學(xué)院 陜西 西安 710065)
(2 西安石油大學(xué)西安市高碳資源低碳化利用重點(diǎn)實(shí)驗(yàn)室 陜西 西安 710065)
反應(yīng)器內(nèi)部存在復(fù)雜的流場(chǎng)傳遞行為,準(zhǔn)確預(yù)測(cè)反應(yīng)器中復(fù)雜的流體力學(xué)特征、傳熱過程以及各種瞬態(tài)行為,是化工領(lǐng)域的重點(diǎn)目標(biāo)之一。 計(jì)算流體力學(xué)(computational fluid dynamics,CFD) 可以利用電子計(jì)算機(jī)對(duì)復(fù)雜物理現(xiàn)象進(jìn)行計(jì)算和預(yù)測(cè),更精確地研究流體流動(dòng)、傳熱傳質(zhì)和化學(xué)反應(yīng)的基本規(guī)律。 然而,CFD 模擬方法涉及到大量的物理方程和反應(yīng)機(jī)理,這些方程和機(jī)理往往非常復(fù)雜,計(jì)算量巨大。 特別是在模擬具有復(fù)雜幾何形狀和多相流等特殊流體現(xiàn)象的反應(yīng)器時(shí),需要更長(zhǎng)的計(jì)算時(shí)間。 這不僅影響了模擬結(jié)果的實(shí)時(shí)性,而且也限制了模擬的規(guī)模和深度。 為了解決這一問題,研究者們開始將機(jī)器學(xué)習(xí)方法應(yīng)用于反應(yīng)器模擬中。 機(jī)器學(xué)習(xí)技術(shù)可以通過對(duì)已有歷史數(shù)據(jù)的分析和挖掘來建立反應(yīng)器的預(yù)測(cè)模型,跳過了繁雜的方程計(jì)算,加速計(jì)算速度并提高模擬精度。 本文總結(jié)了一些經(jīng)典的機(jī)器學(xué)習(xí)方法和通用建模過程,并依據(jù)多篇文獻(xiàn),闡述了機(jī)器學(xué)習(xí)方法在反應(yīng)器內(nèi)建模的應(yīng)用進(jìn)展。 重點(diǎn)關(guān)注反應(yīng)器內(nèi)流場(chǎng)的重建工作,以及從機(jī)器學(xué)習(xí)的視角來看有著相同原理的渦輪流場(chǎng)重建工作。
機(jī)器學(xué)習(xí)方法可以按照訓(xùn)練數(shù)據(jù)是否有標(biāo)記信息分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)三種。 監(jiān)督學(xué)習(xí)的數(shù)據(jù)集中包含了已有標(biāo)記的數(shù)據(jù),通過建立模型學(xué)習(xí)明確的輸出關(guān)系,就可以預(yù)測(cè)新的數(shù)據(jù)。 監(jiān)督學(xué)習(xí)的典型應(yīng)用包括分類和回歸問題。 分類問題是指將輸入數(shù)據(jù)劃分到事先定義好的類別中,如圖像分類、垃圾郵件過濾等;而回歸問題則是指預(yù)測(cè)一個(gè)連續(xù)值,如股票價(jià)格預(yù)測(cè)、房?jī)r(jià)預(yù)測(cè)等。 非監(jiān)督學(xué)習(xí)的任務(wù)是在沒有標(biāo)記數(shù)據(jù)的情況下,對(duì)數(shù)據(jù)進(jìn)行建模和分析,尋找數(shù)據(jù)中的結(jié)構(gòu)和模式。 非監(jiān)督學(xué)習(xí)的典型應(yīng)用包括聚類、異常檢測(cè)和降維等。 聚類是指將數(shù)據(jù)按照某種相似度度量的方法分成若干組,每組內(nèi)部數(shù)據(jù)的相似度要盡量高,組間的相似度盡量低。 異常檢測(cè)則是指在數(shù)據(jù)集中找出與其他數(shù)據(jù)不同的樣本。 而降維則是指將高維度數(shù)據(jù)映射到低維空間中,但要盡量保留數(shù)據(jù)中的關(guān)鍵特征和信息。 半監(jiān)督學(xué)習(xí)則介于監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)之間,其任務(wù)是在部分?jǐn)?shù)據(jù)有標(biāo)簽、部分?jǐn)?shù)據(jù)沒有標(biāo)簽的情況下,通過學(xué)習(xí)已知標(biāo)簽的數(shù)據(jù),為未標(biāo)注的數(shù)據(jù)建立模型。
圖1 展示了Brunton 等[1]總結(jié)的三種類別中各自包含的主要的方法。 其中,神經(jīng)網(wǎng)絡(luò)模型是目前最為強(qiáng)大的機(jī)器學(xué)習(xí)算法之一。 它模仿了人腦的神經(jīng)元結(jié)構(gòu),通過構(gòu)建多層的神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的處理和預(yù)測(cè)。 這里簡(jiǎn)單介紹一下神經(jīng)網(wǎng)絡(luò)中的一些基本的概念。 神經(jīng)元是神經(jīng)網(wǎng)絡(luò)中的基本單元,它接收一個(gè)輸入并產(chǎn)生輸出。 神經(jīng)元接收到的輸入與其對(duì)應(yīng)的權(quán)重進(jìn)行乘積之和,作為神經(jīng)元的激活值,再通過激活函數(shù)進(jìn)行非線性轉(zhuǎn)換,以實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)的建模。 多個(gè)神經(jīng)元按照一定規(guī)則組合成的層,可以用來提取輸入數(shù)據(jù)的不同特征。 神經(jīng)網(wǎng)絡(luò)從輸入開始進(jìn)行前向傳播,依次經(jīng)過多個(gè)層,直到輸出結(jié)果。 損失函數(shù)可以衡量模型預(yù)測(cè)結(jié)果與真實(shí)結(jié)果之間的差異,作為模型訓(xùn)練的目標(biāo)函數(shù)。 通過計(jì)算輸出結(jié)果與真實(shí)結(jié)果的誤差,將誤差反向傳播回神經(jīng)網(wǎng)絡(luò),更新權(quán)重,以提高模型的預(yù)測(cè)準(zhǔn)確率。 常見的神經(jīng)網(wǎng)絡(luò)模型包括多層感知機(jī)(multilayer perceptron,MLP)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)等。 其中,MLP 是最基本的神經(jīng)網(wǎng)絡(luò)模型,由多個(gè)全連接層組成,可用于分類和回歸等任務(wù);CNN 適用于處理圖像數(shù)據(jù),通過卷積層和池化層提取圖像的空間特征;RNN 則適用于處理序列數(shù)據(jù),如自然語言或天氣數(shù)據(jù)。
圖1 常用機(jī)器學(xué)習(xí)方法分類
當(dāng)使用機(jī)器學(xué)習(xí)方法解決某一問題時(shí),通常需要經(jīng)歷一些通用的建模步驟:收集數(shù)據(jù)、數(shù)據(jù)預(yù)處理、特征工程、模型選擇、訓(xùn)練模型、模型評(píng)估和模型優(yōu)化等。 首先需要根據(jù)研究的問題收集和整理相關(guān)的歷史數(shù)據(jù)。 數(shù)據(jù)通常需要經(jīng)過清洗和預(yù)處理才能用于模型的訓(xùn)練。 一般情況下,預(yù)處理包括對(duì)原始數(shù)據(jù)的清洗、轉(zhuǎn)換和歸一化[2]等操作,以保證數(shù)據(jù)的質(zhì)量和完整性。 清洗的重點(diǎn)是消除噪聲、缺失值和異常值等可能對(duì)數(shù)據(jù)造成影響的數(shù)據(jù)。 歸一化則是為了避免不同量綱對(duì)模型產(chǎn)生的影響。 不同的特征往往具有不同的量綱和取值范圍,如果不對(duì)特征進(jìn)行歸一化,那么量綱大的特征會(huì)對(duì)模型產(chǎn)生較大的影響,而量綱小的特征則會(huì)被忽略掉,從而影響模型的精度。 特征工程會(huì)尋找和提取與目標(biāo)變量相關(guān)的有效特征,從輸入信息的角度精益求精。 它不是必須的步驟,但它能夠提高模型的準(zhǔn)確性和泛化能力。 常見的特征工程方法包括特征選擇、特征變換、特征組合等。 將處理好的數(shù)據(jù)輸入到模型中,通過不斷地迭代來最小化預(yù)測(cè)誤差,讓模型逐漸優(yōu)化。通過驗(yàn)證數(shù)據(jù)集對(duì)訓(xùn)練出的模型的性能進(jìn)行評(píng)估,可以使用常見的指標(biāo)如均方誤差、準(zhǔn)確率、召回率、精確度等。 當(dāng)模型評(píng)估通過后,就可以將其部署到實(shí)際生產(chǎn)環(huán)境中,進(jìn)行實(shí)時(shí)預(yù)測(cè)。 訓(xùn)練和評(píng)估所使用的數(shù)據(jù)均是總數(shù)據(jù)集中不相交的子集,這也意味著建立模型之前必須對(duì)數(shù)據(jù)集進(jìn)行劃分。 通常將原始數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。 訓(xùn)練集用于模型的訓(xùn)練,驗(yàn)證集用于模型的選擇和調(diào)整,測(cè)試集用于評(píng)估模型的泛化性能。
對(duì)瞬態(tài)流場(chǎng)圖像預(yù)測(cè)任務(wù)進(jìn)行深度學(xué)習(xí)建模,一個(gè)客觀的經(jīng)驗(yàn)是從卷積神經(jīng)網(wǎng)絡(luò)入手,因?yàn)樗谔幚韴D像數(shù)據(jù)方面的表現(xiàn)非常出色。 在流場(chǎng)預(yù)測(cè)方向上,CNN 可以用于提取流場(chǎng)數(shù)據(jù)的空間特征,如渦旋、湍流結(jié)構(gòu)等,并且另一方面,CNN 在處理大量數(shù)據(jù)時(shí)具有良好的泛化能力,這使得它們能夠在訓(xùn)練數(shù)據(jù)之外的數(shù)據(jù)上產(chǎn)生準(zhǔn)確的預(yù)測(cè)。這對(duì)于流場(chǎng)預(yù)測(cè)是非常重要的,因?yàn)樵撊蝿?wù)往往需要在不同的操作條件下預(yù)測(cè)流場(chǎng)的行為。 通常情況下,單純使用CNN 的模型,即特征提取部分和流場(chǎng)重建(生成)部分均選擇CNN 的模型,其架構(gòu)一般多采用自編碼器。 自編碼器由編碼器和解碼器兩部分組成。 編碼器將原始數(shù)據(jù)映射到一個(gè)低維空間,該空間被稱為編碼空間;解碼器將編碼空間的數(shù)據(jù)重構(gòu)回原始空間或生成新的數(shù)據(jù)。
機(jī)器學(xué)習(xí)已經(jīng)成為一個(gè)備受關(guān)注的技術(shù),它在各個(gè)領(lǐng)域中都有廣泛的應(yīng)用。 一些研究者們也開始將機(jī)器學(xué)習(xí)應(yīng)用于化學(xué)化工領(lǐng)域,以期加速化學(xué)研究的進(jìn)程,提高化工產(chǎn)品的效率和品質(zhì)。 程全中等[3]從萃取、精餾、結(jié)晶、流態(tài)化等單元操作的應(yīng)用角度出發(fā),綜述了機(jī)器學(xué)習(xí)與化工結(jié)合的研究進(jìn)展。 朱禮濤等[4]則討論了機(jī)器學(xué)習(xí)在多相流設(shè)備(尤其是多相反應(yīng)器)中流動(dòng)、傳遞及反應(yīng)特性的研究現(xiàn)狀。
Bazai 等[5]建立了一個(gè)自編碼器模型,其內(nèi)部堆疊了多個(gè)CNN,并基于CFD 中的數(shù)值模擬結(jié)果進(jìn)行訓(xùn)練。 訓(xùn)練后的模型能夠預(yù)測(cè)流化床的瞬態(tài)體積分?jǐn)?shù)分布。 該研究表明,基于深度學(xué)習(xí)的模型在預(yù)測(cè)流化床瞬時(shí)流動(dòng)行為的速度比CFD 更快。 這是因?yàn)樯疃葘W(xué)習(xí)模型無需求解任何傳輸方程,計(jì)算量更小。 在完成訓(xùn)練過程后,該模型可以獨(dú)立于CFD 進(jìn)行預(yù)測(cè),即不需要再由CFD 提前進(jìn)行模擬計(jì)算以提供數(shù)據(jù)。 An 等[6]基于U-Net[7]網(wǎng)絡(luò)構(gòu)建了一個(gè)名為CFDNN 的深度學(xué)習(xí)求解器,用來預(yù)測(cè)空腔內(nèi)湍流燃燒的流場(chǎng)和燃燒場(chǎng)。 通過使用不同入口速度下的空腔火焰數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,并用訓(xùn)練集范圍內(nèi)不包含的入口速度進(jìn)行測(cè)試,證明了模型預(yù)測(cè)結(jié)果的可行性。 CFDNN預(yù)測(cè)結(jié)果的空間分布和時(shí)間分布與OpenFoam 的模擬結(jié)果非常吻合。 Jeon 等[8]在MLP 中引入了基于物理信息的損失函數(shù)和有限體積法,僅用先前兩個(gè)時(shí)間分布的流場(chǎng)就可以預(yù)測(cè)未來十幀的流場(chǎng)。 在傳統(tǒng)的機(jī)器學(xué)習(xí)中,損失函數(shù)通常是根據(jù)訓(xùn)練數(shù)據(jù)和期望輸出定義的。 在化工領(lǐng)域的許多應(yīng)用場(chǎng)景下,還有一些關(guān)于控制問題或物理定律的額外條件。 如果它們能夠被有效地納入模型中,就會(huì)約束假設(shè)空間(模型所屬的函數(shù)的集合)的范圍,模型就可以在更小的數(shù)據(jù)集上進(jìn)行訓(xùn)練。 物理信息損失函數(shù)通過懲罰與已知物理定律的偏差,將物理約束納入模型。 這在可用數(shù)據(jù)有限、有噪聲或不完整的問題中有明顯效果。
渦輪尾跡流場(chǎng)的預(yù)測(cè)是傳統(tǒng)CFD 模擬的另一個(gè)常見的應(yīng)用場(chǎng)景。 渦輪尾跡是渦輪機(jī)在工作時(shí)形成的空氣流動(dòng)的尾跡,其流場(chǎng)結(jié)構(gòu)非常復(fù)雜,與反應(yīng)器內(nèi)的流場(chǎng)一樣受到多種不確定因素的影響。 一些研究者已經(jīng)開始探索使用深度學(xué)習(xí)模型來預(yù)測(cè)和模擬渦輪尾跡流場(chǎng)。 Zhang等[9]利用六層CNN 的組合建立了一個(gè)編碼器模型,用以生成風(fēng)力渦輪機(jī)尾流的時(shí)間平均流場(chǎng)。 建立模型前先利用大渦模擬(large-eddy simulations,LES)生成CNN 編碼器模型的訓(xùn)練和驗(yàn)證數(shù)據(jù)。 模型的每個(gè)輸入樣本由五個(gè)瞬時(shí)速度場(chǎng)構(gòu)成,以反映湍流結(jié)構(gòu)的時(shí)間平均變化。 這項(xiàng)研究中詳細(xì)測(cè)試了CNN 模型重建風(fēng)力渦輪機(jī)周圍的時(shí)間平均流場(chǎng)的能力以及預(yù)測(cè)渦輪機(jī)功率輸出的能力。 預(yù)測(cè)的流場(chǎng)清楚地反映了LES 得到的渦輪尾跡的主要特征。CNN 預(yù)測(cè)得到的速度剖面與LES 時(shí)間平均結(jié)果吻合良好,總體相對(duì)誤差不超過3%。 同時(shí),該研究利用數(shù)據(jù)增強(qiáng)技術(shù)有效地解決了CNN 的位置敏感性問題。 在時(shí)間上,該研究所提出的總成本比LES 減少了88%。
CFD 和機(jī)器學(xué)習(xí)都是化工領(lǐng)域不同的工具,在化工領(lǐng)域中有各自的應(yīng)用場(chǎng)景和優(yōu)劣勢(shì)。 CFD 作為一種基于物理學(xué)原理的建模方法,能夠提供更精細(xì)和準(zhǔn)確的流場(chǎng)預(yù)測(cè)。 而機(jī)器學(xué)習(xí)可以通過學(xué)習(xí)歷史數(shù)據(jù)中的行為模式來預(yù)測(cè)新的結(jié)果,跳過了計(jì)算數(shù)值方程組的步驟,大大節(jié)省了預(yù)測(cè)時(shí)間,但由于缺乏可解釋性,它暫時(shí)還無法替代CFD 模擬。 將機(jī)器學(xué)習(xí)和CFD 結(jié)合起來可以實(shí)現(xiàn)更準(zhǔn)確和高效的流場(chǎng)預(yù)測(cè)。 因此,機(jī)器學(xué)習(xí)和CFD 在化工領(lǐng)域中將會(huì)有更多的應(yīng)用,并且這兩個(gè)領(lǐng)域也將會(huì)相互促進(jìn)。