孟憲澤, 付云朋, 袁俊生, 李 斌
(1.中國海洋大學 海洋化學理論與工程技術教育部重點實驗室,山東 青島 266100; 2.中國海洋大學 化學化工學院,山東 青島 266100; 3.河北工業(yè)大學 化工學院,天津 300130; 4.泉州師范學院 化工與材料學院,福建 泉州 362000)
水鹽體系相平衡的實驗與理論研究有助于指導鹽化工、煤化工、精細化工等行業(yè)的高鹽鹵水資源化利用工藝的形成與優(yōu)化[1-3]。數十年來,研究者通過繁瑣的實驗方法獲得了大量的相平衡數據。隨著Debye-Hückel理論的提出[4],通過熱力學理論估算水鹽體系的固-液相平衡溶解度開始進入人們的視野。半經驗半理論的Pitzer模型建立了滲透系數、活度系數和溶液超額Gibbs自由能之間的關系[5]。改進的Pitzer模型,如HMW模型、PSC模型等,將熱力學模型的適用范圍拓展到了混合電解質溶液體系,至今被廣泛采用[6-8]。Zhao和Song結合密度泛函理論提出了一種統計力學模型[9],成功預測了典型三元相圖,并被證明是一種通用高效的預測方法。考慮到離子水化效應,基于E-UNIFAC模型的Lu-M單級水化模型通過計算溶液各組分的活度系數來得到相平衡溶解度[10]。陸小華以Lu-M模型為基礎編制了電解質溶液相平衡計算軟件包PHEES,Yuan以HMW模型為基礎編制了簡單三元體系相平衡軟件CalPha,為相應三離子體系的溶解度預測提供了便利。
隨著人工智能技術的發(fā)展,神經網絡在預測、函數擬合、模式識別等方面的獨特優(yōu)勢引起人們的關注[11-13]。Elman神經網絡(Elman neural network, ENN)相對于經典的反向傳播神經網絡(back propagation neural network, BPNN)而言,引入了上下文單元(context units, CU)層,使之具有了短時記憶的特性,展現出更優(yōu)的學習能力和泛化能力。Wang,Li和Akhil等基于ENN的延時特點,將其應用于鋰離子電池壽命預測[14-15],X射線熒光光譜的分析[16]和室內空氣質量進行評估預測[17]。以上應用均顯示出ENN優(yōu)異的性能與泛化能力,而其在水鹽體系相平衡中的應用至今鮮有報道。
本文以溶解度數據的文獻值與ENN預測值的均方誤差(MSE)作為指標,考察了隱含層數,神經元數目,不同學習函數對模型訓練效果的影響,獲得了最優(yōu)的ENN拓撲結構。通過與文獻值、HMW模型計算值對比,分析了ENN在精確度和運算速度方面的優(yōu)勢。運用優(yōu)化的ENN-(2,3)GDX模型對未發(fā)表的15.0 ℃下NaCl-KCl-H2O體系、87.5 ℃下Na2SO4-MgSO4-H2O體系、60.0 ℃下KCl-K2SO4-H2O體系和60.0 ℃下NaCl-Na2CO3-H2O體系的平衡溶解度進行了預測。
ENN包含輸入層、隱含層和輸出層(見圖1)。相比于常見的BPNN,ENN在隱含層中增加了一個CU層,將前一步的輸出值作為一步延時算子,返回神經元作為線性加權。CU層增強了ENN對歷史信息的敏感性[18-19],提高了神經網絡應對突變的能力,特別適合于包含突變點的水鹽體系平衡溶解度的預測。
圖1 ENN模型拓撲結構
ENN隱含層神經元傳遞函數fj的數學表達如式1所示:
(1)
ENN輸出層神經元傳遞函數gj的數學表達如式2所示。輸出層(O)神經元不包含隱含層神經元中的延時算子。
(2)
本文收集了海水體系Na+, K+, Ca2+, Mg2+// Cl-, SO42-, CO32-, HCO3-, B4O72--H2O的15個三元子系統的數據[20-21]用于ENN的訓練,溫度范圍為0.0~150.0 ℃。系統組成與數據集信息如表1所示。按照80.0%和20.0%的比例將數據點隨機分配為訓練集和驗證集。訓練集用來訓練構建好的ENN模型,驗證集數據與模型預測值的均方誤差(MSE)作為評估模型性能的指標。
表1 數據點采集信息
以MgCl2-MgSO4-H2O體系為例,MgSO4的在溶液中的平衡濃度(CMS)受系統溫度(T)與MgCl2濃度(CMC)影響。視T與CMC為輸入參數,視CMS為有導師學習的輸出參數,如式3所示。以CMC作為輸出參數時表達式同理。
CMS=f(T,CMS)。
(3)
將數據集遵循80.0%、20.0%的比例隨機分配為訓練集和驗證集。訓練集的輸入參數和輸出參數一一對應,導入ENN進行訓練。驗證集的輸入參數導入訓練好的神經網絡進行訓練,將神經網絡的預測結果與驗證集的輸出參數求得MSE作為指標,用以驗證ENN模型性能。
影響ENN性能的因素主要包括網絡結構,訓練函數等。含有兩層以上隱含層的深層神經網絡已經被證實能夠提升淺層神經網絡的學習速率和收斂速率,且能夠在一定程度上提升預測結果的準確性[22]。此外,選取合適的訓練函數也能夠優(yōu)化收斂速率,避免陷于局部極小值,提升神經網絡預測精度。因此,有必要將ENN隱含層神經元數量與學習函數作為變量,以探究最優(yōu)神經網絡拓撲結構。常見的訓練函數包含L-M反向傳播算法(Levenberg-Marquardt backpropagation, L-M),帶動量的梯度下降的自適應學習率的反向傳播算法(Gradient descent with momentum and adaptive learning rate backpropagation, GDX)和自適應學習速率的梯度下降反向傳播算法(Gradient descent with adaptive learning rate backpropagation, GDA)[23]。隱含層設置為2層,每層神經元數量為2~5,訓練函數分別選用LM、GDX和GDA算法分三次建模,建模因素分布如表2所示。
表2 ENN建模因素分布
圖2所示為基于LM/GDX/GDA學習函數的神經網絡MSE熱力圖,橫坐標對應實驗因素(Factors No.),縱坐標對應三元水鹽子系統編號(System No.)。在預測結果精確度方面,圖2(b)具有較低的MSE,說明GDX學習函數在運算精度上具有優(yōu)勢。圖3所示為ENN-GDX的預測精度受神經網絡拓撲結構變化的影響。當layer Ⅰ 取值為2時,建模因素為F-1, F-8, F-9 和 F-16,逐漸增大layer Ⅱ 神經元數量,系統MSE值呈現先下降后升高的趨勢,F-8對應的2-3神經元結構MSE值為0.70×10-2,預測精確度最高。當layer取值為3時,建模因素為F-2, F-7, F-10 和 F-15,MSE值均大于1.00×10-2,說明Layer Ⅰ 為3的模型預測精度較低。當layer Ⅰ 取值為4時,建模因素為F-3, F-6, F-11 和F-14,參數F-6對應的神經網絡MSE值為0.76×10-2,性能優(yōu)于其他三組。當layer Ⅰ 取值為5時,建模因素為F-4, F-5, F-12 和 F-13,其中F-4和F-5的神經網絡MSE值為0.86×10-2。綜上所述,單純增大隱含層的神經元數量不是提高神經網絡性能的充分必要條件。最終,ENN的最優(yōu)拓撲結構設定為(2,3)-GDX,即隱含層Ⅰ包含2個神經元,隱含層Ⅱ包含3個神經元,學習函數采用GDX。
圖3 ENN-GDX模型子系統MSE平均值
參考圖2,以預測精度較低的NaCl-CaCl2-H2O (F-8,S-3)體系作為研究對象,將神經網絡的預測值對比文獻值和HMW模型的計算值,考察ENN-(2,3)GDX的網絡性能。HMW模型中,各溶質的活度系數依照公式(4)~(7)計算得出。
(a. LM學習函數 LM training function; b. GDX學習函數 GDX training function; c. GDA學習函數 GDA training function.)圖2 基于三種不同學習函數的ENN性能(MSE)分布圖
(4)
(5)
(6)
(7)
式中:C/C′和A/A′分別對應陽離子和陰離子;mC和ZC表示陽離子C的摩爾數和電荷量;Ψ是三元離子相互作用參數;φφ、φ和φ′是與離子強度有關的第二維里系數。上式中未知參數由公式(8)~(13)計算。
(8)
(9)
(10)
(11)
(12)
式中:Bφ和B是與離子強度有關的第二個維里系數;B′是B對離子強度的微分。水的活度系數由公式(13)得出。
lnαw=-φ∑(mi/55.51)。
(13)
圖4所示為25.0 ℃下NaCl-CaCl2-H2O體系平衡溶解度的模型計算值與文獻值[21]。ENN-(2,3)GDX模型的預測值取5次計算的平均(見表3)。CaCl2wt.%預測值相對文獻值的相對誤差為2.60%,NaCl wt.%為2.40%。紅色誤差棒為運用ENN-(2,3)GDX模型,在確定的NaCl濃度下預測的CaCl2濃度,藍色誤差棒為在確定的CaCl2濃度下與之平衡的NaCl濃度。橙色虛線表示運用HMW模型計算所得液相線。ENN-(2,3)GDX模型的預測值更接近于文獻值,預測誤差小于HMW模型。對于HMW模型而言,若離子相互作用參數與電解質的Pitzer參數是已知的,則可以通過編程實現快速運算,否則仍需要通過繁瑣實驗方法求得該溫度下的物理參數,然后再進行液相線的測算。而對于ENN模型,不存在物理參數的求解過程,因此在運算速度上具有優(yōu)勢。
表3 ENN-(2,3)GDX模型5次預測結果
圖4 25.0 ℃下NaCl-CaCl2-H2O體系液相線的文獻值和ENN-(2,3)GDX模型、HMW模型預測值
本文運用ENN-(2,3)GDX模型,對未知溫度體系的液相線進行預測。參考圖2中不同系統的MSE分布圖研究對象選擇為預測誤差偏高的四組系統:S-1、S-8、S-9和S-14。對應體系的預測溫度分別為15.0、87.5、60.0和60.0 ℃,預測結果取5次運算的平均值。預測結果如圖5和支撐文件表S1~S4所示。由圖5可知,在S-8,S-14體系中的液相線對應多種復雜的平衡固相,雖然ENN-(2,3)GDX模型的個別預測值的相對偏差較大,但共飽點的預測結果穩(wěn)定,預測液相線也能夠較好地符合隨溫度的變化趨勢。可以認為ENN-(2,3)GDX模型是一種有效的預測三元水鹽體系相平衡溶解度的神經網絡模型。
(ENN, Elman網絡預測值; exp., 實驗值 ENN, predicted value by Elman neural network; exp. experimental value.)圖5 S-1、S-8、S-9和S-14系統的預測液相線
運用Elman神經網絡建立了預測三元水鹽體系相平衡溶解度的ENN-(2,3)GDX模型。通過對比文獻中25.0 ℃下NaCl-CaCl2-H2O體系的預測液相線可知,ENN-(2,3)GDX模型在運算精度和速度方面均優(yōu)于傳統的HMW熱力學模型。對未發(fā)表的簡單和復雜三元體系:NaCl-KCl-H2O體系(15.0 ℃)、Na2SO4-MgSO4-H2O體系(87.5 ℃)、KCl-K2SO4-H2O體系(60.0 ℃)和NaCl-Na2CO3-H2O體系(60.0 ℃)的平衡溶解度進行了預測,結果顯示,神將網絡模型預測得到的液相線能夠較好地符合溫度變化趨勢,共飽點預測值穩(wěn)定,體現出ENN-(2,3)GDX模型在預測三元水鹽體系溶解度上的優(yōu)異性能。