任嘉輝,劉豫,劉朝,劉浪,李瑩
(1 重慶大學(xué)低品位能源利用技術(shù)及系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室,能源與動(dòng)力工程學(xué)院,重慶 400030; 2 污染控制與資源化研究國家重點(diǎn)實(shí)驗(yàn)室,江蘇南京 210023; 3 中國核動(dòng)力研究設(shè)計(jì)院中核核反應(yīng)堆熱工水力技術(shù)重點(diǎn)實(shí)驗(yàn)室,四川成都 610213)
臨界溫度(Tc)作為工質(zhì)能維持液相的最高溫度,是建立狀態(tài)方程的基礎(chǔ),也可以用于計(jì)算工質(zhì)其他物性如焓、熵、比熱容、黏度、熱導(dǎo)率等。同時(shí),臨界溫度是超臨界萃取過程中的重要參數(shù)。因此,獲取工質(zhì)準(zhǔn)確的臨界溫度具有重要的科學(xué)意義和工程價(jià)值[1?5]。實(shí)驗(yàn)是獲取臨界溫度最有效的方式。然而由于實(shí)驗(yàn)研究代價(jià)高昂、復(fù)雜性高,無法僅依靠實(shí)驗(yàn)手段獲得工質(zhì)的臨界溫度。因此,有必要提出一種能夠準(zhǔn)確預(yù)測(cè)工質(zhì)臨界溫度的理論模型。
臨界溫度的預(yù)測(cè)方法主要包括經(jīng)驗(yàn)公式法、狀態(tài)方程法和定量結(jié)構(gòu)?性質(zhì)關(guān)系法(quantitative structure?property relationship, QSPR)。經(jīng)驗(yàn)公式法采用一些易于測(cè)量的參數(shù),如沸點(diǎn)、密度等,建立相應(yīng)的關(guān)聯(lián)式得到臨界溫度。Reid 等[6]最早提出了臨界溫度與沸點(diǎn)的關(guān)聯(lián)式Tc=1.5Tb。周傳光等[7]基于沸點(diǎn)與對(duì)比密度,提出了部分化合物臨界溫度的關(guān)聯(lián)式,平均偏差為1.35%。王新紅等[8]以沸點(diǎn)、對(duì)比密度、相對(duì)分子質(zhì)量為參數(shù),提出了一個(gè)新的有機(jī)物臨界溫度計(jì)算模型,平均偏差為2.36%。經(jīng)驗(yàn)公式法形式簡(jiǎn)單、計(jì)算精度較高,但缺乏理論基礎(chǔ)。狀態(tài)方程法可以基于pVT數(shù)據(jù),擬合獲得工質(zhì)狀態(tài)方程中相應(yīng)參數(shù),而后反推得到物質(zhì)的臨界溫度。例如,Kontogeorgis 等[9]采用狀態(tài)方程法估算了6 種烷烴的Tc,絕對(duì)平均偏差均在2%以內(nèi)。Hsieh 等[10]依據(jù)同樣的思路,首先獲得Peng?Robinson(PR)狀態(tài)方程的參數(shù),進(jìn)而得到392種純物質(zhì)的臨界溫度,平均偏差為5.4%。狀態(tài)方程法需要已知工質(zhì)pVT數(shù)據(jù),且計(jì)算流程復(fù)雜,適用于密度數(shù)據(jù)較為豐富的物質(zhì)。定量結(jié)構(gòu)?性質(zhì)關(guān)系法(QSPR)根據(jù)分子結(jié)構(gòu)?物質(zhì)性質(zhì)之間的構(gòu)效關(guān)系,對(duì)物質(zhì)相關(guān)性質(zhì)進(jìn)行建模和預(yù)測(cè)。基團(tuán)貢獻(xiàn)法是QSPR 中最常用的一種方法,包括經(jīng)典的Lydersen 法[11]、Joback 法[12]等。這些方法假設(shè)分子性質(zhì)為各基團(tuán)貢獻(xiàn)的線性加和,而基團(tuán)貢獻(xiàn)度在不同分子中保持不變。這種線性加和的方法使用較方便,但沒有考慮不同基團(tuán)的位置信息,導(dǎo)致該方法不能有效區(qū)分同分異構(gòu)體。盡管 后 續(xù) 的 一 些 方 法 如Constantinou?Gani 法[13]、Marrero?Pardillo 法[14]等,通過引入多級(jí)基團(tuán)和鍵貢獻(xiàn)在一定程度上緩解了上述缺陷,但適用范圍依然有限。綜合分析以上方法可知,現(xiàn)有模型無法對(duì)常見工質(zhì)進(jìn)行準(zhǔn)確估算,須采用新的思路,以實(shí)現(xiàn)對(duì)包括同分異構(gòu)體工質(zhì)在內(nèi)的常見工質(zhì)臨界溫度的精準(zhǔn)預(yù)測(cè)。
分子結(jié)構(gòu)描述符[如分子指紋(molecular fingerprints, MF)[15]、拓?fù)渲笖?shù)(topological index, TI)[16]等]作為一種將分子結(jié)構(gòu)編碼為結(jié)構(gòu)化數(shù)據(jù)的方法,可以將一種物質(zhì)與其他物質(zhì)進(jìn)行明確區(qū)分。將分子描述符的概念引入QSPR 模型,有望解決工質(zhì)同分異構(gòu)體的區(qū)分問題。在實(shí)際使用中,分子描述符通常與機(jī)器學(xué)習(xí)方法(machine learning, ML)相結(jié)合,以構(gòu)建物質(zhì)特性預(yù)測(cè)模型[17?19]。近年來,隨著計(jì)算機(jī)性能的不斷提高,有學(xué)者將分子描述符和機(jī)器學(xué)習(xí)應(yīng)用于工質(zhì)物性[20?24]的預(yù)測(cè),預(yù)測(cè)效果良好。
本研究受上述分子描述符工作的啟發(fā),首先以分子指紋表征分子結(jié)構(gòu),并借助機(jī)器學(xué)習(xí)算法建立16 種臨界溫度的QSPR 預(yù)測(cè)模型。此外,為了進(jìn)一步提升本文模型的預(yù)測(cè)精度,本研究還將分子指紋與拓?fù)渲笖?shù)相結(jié)合,得到新的MF+TI?ML 模型(以分子指紋和拓?fù)渲笖?shù)表達(dá)分子結(jié)構(gòu),結(jié)合機(jī)器學(xué)習(xí)算法建立模型),以期取得良好的預(yù)測(cè)效果。
本研究中工質(zhì)的臨界溫度實(shí)驗(yàn)數(shù)據(jù)取自物理性質(zhì)設(shè)計(jì)研究所(DIPPR?801)[25]及相關(guān)文獻(xiàn)[26]。根據(jù)實(shí)驗(yàn)數(shù)據(jù)不確定度對(duì)其進(jìn)行篩選后,獲得了155 種工質(zhì)的Tc(本文所涉及工質(zhì)的詳細(xì)信息,參見文末附錄)。搭建的數(shù)據(jù)庫中,臨界溫度的范圍分布在190.56~583.00 K。數(shù)據(jù)庫中工質(zhì)可分為五種:烷烴、烯烴、鹵代烷烴、鹵代烯烴、醚類。為提升模型泛化能力,從每種類型工質(zhì)中選取其中70%的數(shù)據(jù)點(diǎn)進(jìn)入訓(xùn)練集,剩下的30%作為測(cè)試集。訓(xùn)練集用于建立工質(zhì)臨界溫度的模型,測(cè)試集用于評(píng)估模型的預(yù)測(cè)性能。
通過ChemDraw 程序獲得工質(zhì)分子的線性輸入規(guī)范(simplified molecular input line entry system,SMILES),隨后利用在線轉(zhuǎn)換工具ChemDes[27]將SMILES 字符串轉(zhuǎn)換為相同長(zhǎng)度的二進(jìn)制位串(即分子指紋)。為了研究不同長(zhǎng)度/類型的指紋對(duì)QSPR模型性能的影響,本文選擇了計(jì)算四種分子指紋,包括兩種Key 型指紋:MACCS(166 位)和Pubchem(881 位),一種Path 型指紋:Extended(1024 位)和一種Circular型指紋:Morgan(2048位)。
本文使用了四種機(jī)器學(xué)習(xí)算法,包括支持向量回 歸(support vector regression, SVR)、回 歸 樹(regression tree, RT)、隨機(jī)森林(random forest, RF)以及多層感知機(jī)(multi?layer perceptron,MLP)。
支持向量回歸通過核技巧將非線性數(shù)據(jù)映射到高維空間中,將非線性關(guān)系轉(zhuǎn)換為線性的形式,其精度取決于參數(shù)的選擇,例如核函數(shù)、寬度系數(shù)γ、不敏感損失系數(shù)ε、懲罰系數(shù)C等[28]。在本文中,將采用5折交叉驗(yàn)證和網(wǎng)格搜索確定參數(shù)的最佳組合。決策樹(decision tree, DT)利用多節(jié)點(diǎn)的樹結(jié)構(gòu)來描述各變量與目標(biāo)之間的非線性關(guān)系,回歸樹是決策樹的回歸版本。由于樹模型具有較高的方差,可能導(dǎo)致結(jié)果不穩(wěn)定,基于樹模型的集成學(xué)習(xí)算法隨機(jī)森林相對(duì)樹模型有較大的改進(jìn)[29],在物性預(yù)測(cè)中應(yīng)用較多。 人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)模擬神經(jīng)系統(tǒng)的結(jié)構(gòu),通過不斷調(diào)整神經(jīng)元間的權(quán)重和偏差,使整個(gè)網(wǎng)絡(luò)能更好地?cái)M合數(shù)據(jù)[30?34]。多層感知機(jī)(MLP)是一種前饋神經(jīng)網(wǎng)絡(luò),通過相互連接的人工神經(jīng)元和復(fù)雜的拓?fù)浣Y(jié)構(gòu)來模擬非線性關(guān)系[35]。本文利用深度學(xué)習(xí)庫Keras 搭建了具有雙隱層的MLP,并通過試錯(cuò)法確定了神經(jīng)元數(shù)、激活函數(shù)、學(xué)習(xí)率的最優(yōu)組合。
本文選用均方根偏差(RMSE)、絕對(duì)平均偏差(AAD)、決定系數(shù)(R2)評(píng)估模型的預(yù)測(cè)性能,相關(guān)定義式如下。
式中,m表示樣本個(gè)數(shù);yi和?分別表示工質(zhì)i臨界溫度的實(shí)驗(yàn)值和預(yù)測(cè)值;yˉ表示臨界溫度實(shí)驗(yàn)數(shù)據(jù)平均值。將評(píng)估指標(biāo)應(yīng)用于測(cè)試集時(shí),RMSE、AAD越低,R2越高,模型的表現(xiàn)越好。
將四種分子指紋(MACCS、Pubchem、Extended、Morgan)分別用作四種機(jī)器學(xué)習(xí)算法(SVR、RT、RF、MLP)的輸入特征,得到16 種臨界溫度的QSPR 模型。各模型在測(cè)試集中的預(yù)測(cè)性能(以絕對(duì)平均偏差A(yù)AD為評(píng)價(jià)指標(biāo))如圖1所示。
圖1 以不同指紋為輸入的各QSPR模型的預(yù)測(cè)精度Fig.1 Prediction accuracy of QSPR models with different fingerprints as inputs
從圖1 可以看出,以MACCS 指紋為輸入特征的模型預(yù)測(cè)性能較差,其中表現(xiàn)最好的MACCS?SVR(以MACCS 指紋為輸入,結(jié)合SVR 建立的模型)在測(cè)試集中的絕對(duì)平均偏差(AAD)也僅達(dá)到了7.49%。其原因是MACCS指紋長(zhǎng)度過短,包含的結(jié)構(gòu)信息有限,導(dǎo)致工質(zhì)某些結(jié)構(gòu)片段并不包含于MACCS指紋中。因此,以短位數(shù)的MACCS 為輸入,模型預(yù)測(cè)精度并不高。
Extended指紋結(jié)合SVR算法建立的模型在測(cè)試集的AAD 為7.36%。這是因?yàn)樵贑hemDes 中,Extended 指紋最大路徑長(zhǎng)度默認(rèn)設(shè)置為5 (即結(jié)構(gòu)片段包含的最大鍵數(shù)為5),導(dǎo)致許多線性路徑大于5 的分子具有相同的Extended 指紋。由于缺乏碳鏈長(zhǎng)于5 的工質(zhì)Tc的實(shí)驗(yàn)數(shù)據(jù),如果提高路徑最大長(zhǎng)度,特征維度會(huì)急劇增加,從而造成模型過擬合。因此目前來看Path 型指紋不是建立工質(zhì)QSPR 模型的最優(yōu)選擇。
Circular 型指紋Morgan 作為一種立體型指紋長(zhǎng)度最長(zhǎng),包含的結(jié)構(gòu)信息也最多,因此可以有效地表征分子結(jié)構(gòu),進(jìn)而有效區(qū)分工質(zhì)同分異構(gòu)體。綜合來看,雖然以Morgan 指紋為輸入特征的模型預(yù)測(cè)性能要比上述兩種類型的指紋好,但仍不理想。其原因可能是位數(shù)過長(zhǎng)導(dǎo)致了模型過擬合,因而Morgan 指紋也不適用于搭建樣本數(shù)較少的QSPR模型。
Pubchem?MLP 模型(Pubchem 指紋結(jié)合MLP 算法建立的模型)在訓(xùn)練集、測(cè)試集的AAD 分別為1.12%、4.76%。相比其他分子指紋而言,基于Pubchem 指紋的QSPR 模型預(yù)測(cè)表現(xiàn)最好。這說明Pubchem 指紋可以合理表征工質(zhì)的結(jié)構(gòu)信息,從而在有限的訓(xùn)練樣本中有效建立分子結(jié)構(gòu)與臨界溫度之間的構(gòu)效關(guān)系,準(zhǔn)確預(yù)測(cè)工質(zhì)臨界溫度。針對(duì)本文所研究的155 種工質(zhì),Pubchem?MLP 模型在工質(zhì)臨界溫度實(shí)驗(yàn)值和計(jì)算值的比較如圖2所示。
圖2 Pubchem?MLP模型在工質(zhì)臨界溫度實(shí)驗(yàn)值和計(jì)算值的比較Fig.2 Comparison between experimental and caculated values of Pubchem?MLP model
從結(jié)果來看,四種ML 算法建立的模型對(duì)工質(zhì)臨界溫度的綜合預(yù)測(cè)效果排序如下:SVR >MLP >RF >RT。SVR 模型預(yù)測(cè)精度最高且表現(xiàn)穩(wěn)定?;诩伤惴≧F 的模型相比RT,在預(yù)測(cè)精度上有了明顯的提高,但和SVR仍有較大差距。
Pubchem 指紋可以很好地表達(dá)工質(zhì)結(jié)構(gòu)。但由于該類型指紋需要預(yù)先指定子結(jié)構(gòu),可能會(huì)造成工質(zhì)中極少數(shù)同分異構(gòu)體(如順反異構(gòu)體)無法區(qū)分的問題。因此本文考慮在分子指紋的基礎(chǔ)上添加拓?fù)渲笖?shù),以“分子指紋+拓?fù)渲笖?shù)”(MF+TI)作為新型分子結(jié)構(gòu)描述符,采用效果較好的SVR 和MLP 算法,以期完全解決區(qū)分工質(zhì)中同分異構(gòu)體的問題。
拓?fù)渲笖?shù)是一種量化分子結(jié)構(gòu)的指標(biāo),通過對(duì)表征分子圖的矩陣執(zhí)行數(shù)值運(yùn)算獲得。這里引入拓?fù)渲笖?shù)(molecular topological index,MTI′),在MTI′的基礎(chǔ)上添加幾何校正數(shù)(geometric modification,GM)區(qū)分工質(zhì)中的同分異構(gòu)體,拓?fù)渲笖?shù)S的計(jì)算公式[16]如下:
式中,Dv、DV、Dw分別表示工質(zhì)結(jié)構(gòu)的價(jià)矩陣、頂點(diǎn)權(quán)重矩陣、鄰接矩陣;N表示分子的原子總數(shù);v表示價(jià)向量;MGF是用以區(qū)分異構(gòu)體的對(duì)角矩陣。文末附錄給出了拓?fù)渲笖?shù)的具體計(jì)算流程和案例。
采用新型描述符后兩種模型的回歸和預(yù)測(cè)性能如圖3、圖4 所示。可以看出引入拓?fù)渲笖?shù)S后,模型的預(yù)測(cè)精度明顯提升。Pubchem+TI?SVR 模型(新型描述符輸入SVR 算法建立的模型)在測(cè)試集的決定系數(shù)R2提高到0.8426,而Pubchem+TI?MLP 模型(新型描述符輸入MLP 算法建立的模型)在測(cè)試集的AAD 降低至3.99%,R2提高到0.9143。對(duì)比圖2、圖4 可以發(fā)現(xiàn),相比Pubchem?MLP 模型,Pubchem+TI?MLP 模型預(yù)測(cè)性能明顯提高。這表明引入拓?fù)渲笖?shù)得到的新型描述符可以很好地解決區(qū)分工質(zhì)中同分異構(gòu)體的問題,提升模型的預(yù)測(cè)性能。
圖3 Pubchem+TI?SVR 模型在工質(zhì)臨界溫度實(shí)驗(yàn)值和計(jì)算值的比較Fig.3 Comparison between experimental and caculated values of Pubchem+TI?SVR model
圖4 Pubchem+TI?MLP模型在工質(zhì)臨界溫度實(shí)驗(yàn)值和計(jì)算值的比較Fig.4 Comparison between experimental and caculated values of Pubchem+TI?MLP model
表1 給出了本文搭建的Pubchem+TI?MLP 模型在工質(zhì)各數(shù)據(jù)集、各物質(zhì)體系預(yù)測(cè)值和實(shí)驗(yàn)值的AAD。從表中可以看出,新提出模型對(duì)烷烴類工質(zhì)臨界溫度的回歸和預(yù)測(cè)都具有很高的精度,分別達(dá)到了0.90%和1.65%。模型對(duì)烯烴類工質(zhì)的擬合回歸效果很好,但預(yù)測(cè)效果較差。醚類、鹵代烷烴類、鹵代烯烴類工質(zhì)的計(jì)算精度相比上述兩類更低。從整個(gè)數(shù)據(jù)集來看,五種類型工質(zhì)的絕對(duì)平均偏差均低于3%,取得了很好的計(jì)算效果。
表1 本文模型在各數(shù)據(jù)集、各物質(zhì)體系的AADTable 1 AAD for each dataset and category of working fluids
圖5 給出了155 種工質(zhì)的相對(duì)偏差(ARD)分布情況,相對(duì)偏差的定義如式(8)所示:
圖5 工質(zhì)臨界溫度ARD分布情況Fig.5 Distribution of ARD for Tc of working fluids
其中ARD<3%的工質(zhì)有113 種,占比72.9%,ARD>9%的工質(zhì)僅7種,最大偏差為15.98%。
將新提出模型的計(jì)算結(jié)果與現(xiàn)有其他方法進(jìn)行對(duì)比,用于對(duì)比的經(jīng)典方法列在表2中,模型的比較結(jié)果如表3 所示。從表3 中可以看出,本文模型的計(jì)算精度最高,Lydersen 法和Joback 法次之,C?G法精度最低。基于沸點(diǎn)實(shí)驗(yàn)值的Joback 法計(jì)算工質(zhì)Tc精度很高。但必須注意的是,并非所有工質(zhì)都具有準(zhǔn)確的沸點(diǎn)數(shù)據(jù)。當(dāng)使用估算的沸點(diǎn)值(Testb)計(jì)算時(shí),Joback 法的計(jì)算效果明顯降低。C?G 法不需要使用沸點(diǎn)值,但該方法對(duì)工質(zhì)臨界溫度的預(yù)測(cè)精度較低。K?R 法將臨界溫度與分子量(Mw)、沸點(diǎn)關(guān)聯(lián),并給出了一個(gè)簡(jiǎn)單的線性方程,估算效果較好。然而,這種關(guān)聯(lián)缺乏理論基礎(chǔ),普適性較差。綜合來看,本文提出的Pubchem+TI?MLP 模型基于分子結(jié)構(gòu)計(jì)算工質(zhì)的臨界溫度,不僅無須沸點(diǎn)值,還獲得了最高的計(jì)算精度。
表2 現(xiàn)有預(yù)測(cè)臨界溫度的方法Table 2 Existing method for estimation of critical temperature
表3 提出模型與以往方法計(jì)算效果的對(duì)比Table 3 The comparisons between proposed model and previous methods
為了進(jìn)一步驗(yàn)證本文新提出模型和C?G 法在區(qū)分同分異構(gòu)體性能上的差異,表4 給出了C?G 二級(jí)基團(tuán)貢獻(xiàn)法和本文模型在區(qū)分各類同分異構(gòu)體(包括順反異構(gòu)、位置異構(gòu)和碳架異構(gòu))上的案例,其中表示本文模型計(jì)算值表示二級(jí)C?G 法計(jì)算值。
表4 C-G法和本文模型對(duì)同分異構(gòu)體的區(qū)分案例Table 4 Samples of isomers for the comparison of C-G method and the proposed model
從表4 中可以看出,本文模型對(duì)于各類同分異構(gòu)體的臨界溫度都取得了良好的預(yù)測(cè)精度。而C?G 法對(duì)于所有順反異構(gòu)體的臨界溫度預(yù)測(cè)結(jié)果完全一致,這表明C?G法無法區(qū)分順反異構(gòu)體。
表5給出了本文模型和C?G 二級(jí)基團(tuán)貢獻(xiàn)法對(duì)155 種工質(zhì)中三類同分異構(gòu)體計(jì)算結(jié)果的統(tǒng)計(jì)結(jié)果。從表5 中可以看出,C?G 法在碳架異構(gòu)體的計(jì)算表現(xiàn)良好,37 種碳架異構(gòu)體臨界溫度的AAD 為1.87%,但是由于不能辨別順反異構(gòu),對(duì)10種順反異構(gòu)體的計(jì)算精度較差。在位置異構(gòu)體臨界溫度的計(jì)算上,C?G 法的精度也較低。而本文提出的Pubchem+TI?MLP 模型不僅可以有效區(qū)分工質(zhì)中存在的各類同分異構(gòu)體,在計(jì)算精度上也遠(yuǎn)高于C?G法。本文模型對(duì)順反異構(gòu)體、位置異構(gòu)體、碳架異構(gòu)體臨界溫度計(jì)算值和實(shí)驗(yàn)值的AAD 分別為2.35%、2.51%、0.87%。
表5 C-G法和本文模型計(jì)算同分異構(gòu)體的統(tǒng)計(jì)結(jié)果Table 5 Statistical parameters of C-G method and the proposed model for the isomers
本文基于分子指紋和拓?fù)渲笖?shù),采用機(jī)器學(xué)習(xí)算法建立了工質(zhì)臨界溫度的Pubchem+TI?MLP 模型。將新模型應(yīng)用于155種常見工質(zhì)的臨界溫度預(yù)測(cè)中,取得了良好的計(jì)算精度,針對(duì)測(cè)試集預(yù)測(cè)的絕對(duì)平均偏差為3.99%。通過與經(jīng)典模型的比較可以得出,新模型不僅可以有效區(qū)分工質(zhì)中各類同分異構(gòu)體,其計(jì)算精度相比現(xiàn)有模型也更高。通過對(duì)模型進(jìn)一步分析還可看出,對(duì)指紋長(zhǎng)度的選擇,必須綜合考慮樣本總數(shù)以及數(shù)據(jù)集包含的物質(zhì)種類。在指紋類型的選擇上,Key 型指紋Pubchem 雖然在本文工質(zhì)的臨界溫度預(yù)測(cè)上表現(xiàn)最好,但其自身不能區(qū)分少數(shù)順反異構(gòu)體,需要引入拓?fù)渲笖?shù)以提高區(qū)分能力。長(zhǎng)度更長(zhǎng)的Path 型和Circular 型指紋對(duì)同分異構(gòu)體的區(qū)分能力更好,但不適用于樣本數(shù)少的數(shù)據(jù)集。隨著以后工質(zhì)實(shí)驗(yàn)數(shù)據(jù)的不斷補(bǔ)充,可考慮使用更長(zhǎng)的分子指紋搭建性能更加優(yōu)異的QSPR模型。
圖A1 本文模型計(jì)算流程示意圖
Fig.A1 Flow chart of the calculation of the proposed model
以1,1,1,2,3,3,3?七氟?2?甲氧基丙烷(E347mmy1)為例,其分子結(jié)構(gòu)如圖A2 所示,通過ChemDraw 轉(zhuǎn)換獲得E347mmy1 的SMILES 為COC(C(F)(F)F)(C(F)(F)F)F,ChemDes轉(zhuǎn)換分子線性輸入規(guī)范獲得Pubchem指紋[00100…01000…00000],通過查詢樣例文件,獲得其拓?fù)渲笖?shù)值15420,將Pubchem 和拓?fù)渲笖?shù)組合輸入到本文模型中,得到E347mmy1 的臨界溫度計(jì)算值436.41 K,其實(shí)驗(yàn)值為433.95 K。
圖A2 E347mmy1的分子結(jié)構(gòu)
Fig.A2 The molecualr structure of E347mmy1