国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

活性化合物熱穩(wěn)定性預(yù)測(cè)技術(shù)研究進(jìn)展

2019-01-19 23:12
關(guān)鍵詞:描述符過氧化物熱穩(wěn)定性

高 月

(1.應(yīng)急管理部化學(xué)品登記中心,山東 青島 266071;2. 中國石油化工股份有限公司青島安全工程研究院 化學(xué)品安全控制國家重點(diǎn)實(shí)驗(yàn)室,山東 青島 266071)

0 引言

活性化合物是不穩(wěn)定的,易發(fā)生劇烈反應(yīng)使化學(xué)能轉(zhuǎn)化為熱能或者機(jī)械能等具有潛在危害的物質(zhì)。在實(shí)際工業(yè)生產(chǎn)過程中,在反應(yīng)器、儲(chǔ)罐、以及運(yùn)輸中,活性化合物引起過許多嚴(yán)重的熱爆炸以及熱失控事故,在全球范圍內(nèi)造成大量人員傷亡[1]。常見的活性化合物包括有機(jī)過氧化物和硝基化合物,有機(jī)過氧化物廣泛用作引發(fā)劑、交聯(lián)劑和氧化劑等,過氧(—O—O—)官能團(tuán)的存在,使其在受熱或外力作用下易分解釋放出大量的熱,引發(fā)劇烈反應(yīng),導(dǎo)致熱爆炸[2];硝基化合物因具有硝基(—NO2),性質(zhì)不穩(wěn)定,有強(qiáng)氧化性,多硝基化合物有爆炸性,可用作炸藥。熱危害評(píng)估對(duì)上述活性化合物的安全使用、儲(chǔ)存和運(yùn)輸具有重要意義。熱穩(wěn)定性是活性化合物的固有屬性,在諸多評(píng)判熱穩(wěn)定性的參數(shù)中,起始放熱溫度(To)、分解熱(-ΔHd)和自加速分解溫度(SADT)是較為重要參數(shù)。起始放熱溫度(To)反映熱危害發(fā)生的可能性或敏感度,分解熱(-ΔHd)反映熱危害的嚴(yán)重性[1],自加速分解溫度(SADT)則是反映活性化合物在運(yùn)輸條件下熱危害的重要參數(shù)[3]。目前,最可靠的測(cè)定熱穩(wěn)定性參數(shù)并評(píng)估熱危害的方法主要是實(shí)驗(yàn)方法,例如差示掃描量熱法(DSC)、美國SADT測(cè)試、絕熱儲(chǔ)存實(shí)驗(yàn)法等。然而,實(shí)驗(yàn)方法存在著成本高、周期長、具有一定危險(xiǎn)性的局限性。在快速發(fā)展的現(xiàn)代工業(yè)中,有必要建立一種簡便、快速、可靠的理論預(yù)測(cè)方法來彌補(bǔ)實(shí)驗(yàn)方法的不足。當(dāng)前,將活性化合物的分子結(jié)構(gòu)與其熱穩(wěn)定性參數(shù)進(jìn)行關(guān)聯(lián),并基于兩者的內(nèi)在聯(lián)系預(yù)測(cè)其熱穩(wěn)定性方法是重要的理論預(yù)測(cè)方法,也是研究的熱點(diǎn)。本文主要闡述基于活性化合物分子結(jié)構(gòu)預(yù)測(cè)熱穩(wěn)定性的方法及其研究進(jìn)展。

1 熱穩(wěn)定性預(yù)測(cè)的早期研究

早在20世紀(jì)80年代,美國材料與實(shí)驗(yàn)協(xié)會(huì)(ASTM)基于Benson的基團(tuán)貢獻(xiàn)法[4],開發(fā)了一款簡單預(yù)測(cè)活性危害的工具(CHETAH)[5]。1982年,Mohan等[6]針對(duì)6種有機(jī)過氧化物,論證了CHETAH的活性危害準(zhǔn)則(氧平衡、最大分解熱、燃燒熱與分解熱之差)與爆炸性的關(guān)聯(lián);2011年,Sato等[7]研究發(fā)現(xiàn)CHETAH準(zhǔn)則和自反應(yīng)物質(zhì)爆炸性之間確實(shí)存在相互關(guān)聯(lián)。但是,CHETAH軟件提供的是物質(zhì)的最大分解熱,不是實(shí)際的實(shí)驗(yàn)測(cè)試的分解熱,應(yīng)用中具有一定局限性。

2 QSPR在熱穩(wěn)定性預(yù)測(cè)領(lǐng)域的應(yīng)用情況

2007年,為了改善市場上化學(xué)品信息的管理,歐盟REACH法規(guī)[8](化學(xué)品注冊(cè)、評(píng)估、許可和限制)提出了對(duì)生產(chǎn)或進(jìn)口的化學(xué)品理化、毒理、生態(tài)毒理性質(zhì)評(píng)估的要求,為幫助企業(yè)應(yīng)對(duì)這一要求,ECHA(歐洲化學(xué)品管理局)頒布了技術(shù)指南[9-10],并提出了考慮測(cè)試順序的理化性質(zhì)通用測(cè)試規(guī)則。就有機(jī)過氧化物而言,其爆炸性質(zhì)通過聯(lián)合國《關(guān)于危險(xiǎn)貨物運(yùn)輸?shù)慕ㄗh書——實(shí)驗(yàn)和標(biāo)準(zhǔn)手冊(cè)》[11]推薦的實(shí)驗(yàn)測(cè)定,而有機(jī)過氧化物的熱穩(wěn)定性作為爆炸甄別程序中的重要參數(shù)同樣是必不可少的。出于安全和技術(shù)原因,針對(duì)有機(jī)過氧化物這類的不穩(wěn)定物質(zhì),實(shí)驗(yàn)測(cè)試的實(shí)施具有一定的難度,因此,開發(fā)預(yù)測(cè)方法將會(huì)極大地加快熱穩(wěn)定性相關(guān)的研究進(jìn)程,并且?guī)椭髽I(yè)滿足REACH法規(guī)對(duì)注冊(cè)期限的要求??紤]到REACH法規(guī)的要求,Lewis等[12]提倡使用強(qiáng)大的計(jì)算機(jī)輔助的從頭計(jì)算法(abinitio method)技術(shù),來獲取化學(xué)品分類的關(guān)鍵性質(zhì)的預(yù)測(cè)方法,從而替代危險(xiǎn)、昂貴的實(shí)驗(yàn)方法。在實(shí)驗(yàn)替代方法中,REACH法規(guī)和ECHA技術(shù)指南[9-10]中明確推薦定量結(jié)構(gòu)-活性/性質(zhì)相關(guān)性(QSAR/QSPR)方法獲取相關(guān)信息。為支持QSPR技術(shù)的開發(fā)和應(yīng)用,OECD(經(jīng)濟(jì)合作與發(fā)展組織)提出了驗(yàn)證QSPR模型的5項(xiàng)原則[13],以便對(duì)該技術(shù)進(jìn)行監(jiān)管。

定量結(jié)構(gòu)-性質(zhì)相關(guān)性(QSPR)方法,是通過將分子結(jié)構(gòu)參數(shù)與所研究化學(xué)品性質(zhì)的實(shí)驗(yàn)數(shù)據(jù)之間的內(nèi)在定量關(guān)系關(guān)聯(lián),建立分子結(jié)構(gòu)參數(shù)和性質(zhì)之間的構(gòu)效關(guān)系模型,從而基于分子結(jié)構(gòu)信息預(yù)測(cè)化合物性質(zhì)的方法[14]。在化合物熱穩(wěn)定性的QSPR預(yù)測(cè)領(lǐng)域,早期研究人員采用量子化學(xué)計(jì)算和QSPR理論相結(jié)合的方法建立關(guān)聯(lián)模型,由于量子化學(xué)計(jì)算的成本高、耗費(fèi)時(shí)間長,且需要專業(yè)人員具備專業(yè)知識(shí),采用專業(yè)軟件計(jì)算,不利于工程人員應(yīng)用,因此后續(xù)研究人員開發(fā)了基于簡便算法的QSPR方法,從應(yīng)用的角度對(duì)其進(jìn)行了改良。

2.1 基于量子力學(xué)的QSPR研究情況

2003年,Saraf等[15]針對(duì)量熱法測(cè)量的19種硝基化合物的DSC數(shù)據(jù),基于量子化學(xué)計(jì)算,研究分子結(jié)構(gòu)和起始放熱溫度To以及分解熱(-ΔHd)之間的定量關(guān)系,采用最小二乘回歸分析方法建立了硝基化合物的To和-ΔHd的QSPR預(yù)測(cè)模型。該研究中,Saraf等首先基于量子力學(xué)的密度泛函理論(DFT),采用Gaussian軟件計(jì)算獲得表征分子結(jié)構(gòu)的分子描述符,建立的To預(yù)測(cè)模型的平均絕對(duì)累積誤差為6%。由于在該過程中,優(yōu)化分子結(jié)構(gòu)需要花費(fèi)超級(jí)計(jì)算機(jī)CPU時(shí)間約1 h,因此,Saraf等又采用AM1半經(jīng)驗(yàn)量子化學(xué)計(jì)算方法快速獲得相關(guān)的分子描述符,以此建立的To預(yù)測(cè)模型的平均絕對(duì)累積誤差為7%,但所需成本相對(duì)較低。

2008年,F(xiàn)ayet等[16]針對(duì)22種硝基芳香族化合物,基于DFT計(jì)算獲得5個(gè)電性相關(guān)的分子描述符,建立-ΔHd的QSPR線性預(yù)測(cè)模型。該研究中,F(xiàn)ayet等對(duì)比了5個(gè)描述符對(duì)-ΔHd的單一相關(guān)性,最終建立的多元線性回歸方程的決定系數(shù)R2為0.86。隨后,2010年,在前期研究的基礎(chǔ)上,F(xiàn)ayet等[17]又利用DFT和AM1這2種方法分別計(jì)算擴(kuò)充了分子描述符的種類和數(shù)量并建模,對(duì)比發(fā)現(xiàn)AM1模型節(jié)省計(jì)算時(shí)間,但是DFT模型描述符與熱穩(wěn)定性的相關(guān)性更直接。2011年,F(xiàn)ayet等[18]將研究對(duì)象擴(kuò)充為77種硝基芳香族化合物,依然采用DFT計(jì)算獲得分子描述符,最終建立7種變量的多元線性回歸方程,模型的決定系數(shù)R2為0.77,預(yù)測(cè)系數(shù)Rext2為0.70。

2011年,Lu等[19]針對(duì)16種有機(jī)過氧化物,采用偏最小二乘法(PLS)和多元線性回歸方法(MLR)分別建立To和-ΔHd的預(yù)測(cè)模型。除了常規(guī)的全局、局部以及DFT分子描述符,建模中還采用了濃度、過氧官能團(tuán)數(shù)量等其他附加描述符。該研究中,由于數(shù)據(jù)有限,16種有機(jī)過氧化物全部用作訓(xùn)練集,未進(jìn)行外部驗(yàn)證,僅對(duì)模型進(jìn)行了內(nèi)部交叉驗(yàn)證;與MLR預(yù)測(cè)模型相比,PLS分析獲得To的13元線性預(yù)測(cè)模型,和-ΔHd的5元線性預(yù)測(cè)模型,具有更強(qiáng)的實(shí)驗(yàn)數(shù)據(jù)相關(guān)性、更好的預(yù)測(cè)能力。

2.2 優(yōu)化的QSPR預(yù)測(cè)研究情況

由于上述熱穩(wěn)定性的QSPR研究中,獲取分子描述符的方法均采用量子化學(xué)計(jì)算,在進(jìn)行工業(yè)水平的應(yīng)用推廣上受限,因此后續(xù)研究人員研究開發(fā)了更簡便、計(jì)算成本更低的分子描述符。

2013年,F(xiàn)ayet等[20]在研究硝基芳香族化合物-ΔHd的QSPR預(yù)測(cè)方法過程中,嘗試使用Codessa軟件計(jì)算簡單2D結(jié)構(gòu)的分子描述符,包括反映分子構(gòu)成的最簡單的組成描述符,以及拓?fù)涿枋龇?,所有分子描述符都不需要?jīng)過復(fù)雜的量子化學(xué)計(jì)算。依據(jù)42種硝基芳香族化合物的數(shù)據(jù)庫,分別基于組成描述符、拓?fù)涿枋龇约敖M成和拓?fù)浠旌厦枋龇?,建立?個(gè)-ΔHd線性預(yù)測(cè)模型,其中基于組成描述符以及組成和拓?fù)浠旌厦枋龇?個(gè)預(yù)測(cè)方程的預(yù)測(cè)性能和穩(wěn)健性,均優(yōu)于僅基于拓?fù)涿枋龇念A(yù)測(cè)模型,說明-ΔHd受硝基官能團(tuán)數(shù)量等組成描述符的影響較大;另外,與Fayet等之前研究的基于量子化學(xué)計(jì)算的預(yù)測(cè)模型相比,基于混合組成和拓?fù)涿枋龇念A(yù)測(cè)模型的預(yù)測(cè)能力與之相似,而不需要昂貴、費(fèi)時(shí)、復(fù)雜的計(jì)算。

2014年,張尹炎等[1]針對(duì)63種硝基芳香族化合物和16種有機(jī)過氧化物,采用遺傳算法結(jié)合多元線性回歸的方法(GA-MLR)分別建立To的預(yù)測(cè)模型。由于前人量子化學(xué)計(jì)算分子描述符的局限性,為了研究更便于工業(yè)應(yīng)用的預(yù)測(cè)模型,采用分子描述符計(jì)算軟件DRAGON 2.1獲得更簡單、成本更低的描述符,例如拓?fù)涿枋龇?、組成描述符、原子中心碎片、官能團(tuán)等,然后利用GA-MLR方法篩選與To具有最優(yōu)定量關(guān)系的描述符,并分別建立硝基芳香族化合物和有機(jī)過氧化物的To預(yù)測(cè)模型。采用內(nèi)部交叉驗(yàn)證和外部驗(yàn)證硝基芳香族化合物的To預(yù)測(cè)模型的預(yù)測(cè)能力和適用性,而有機(jī)過氧化物預(yù)測(cè)模型由于選用物質(zhì)少,所有數(shù)據(jù)用作訓(xùn)練集,只進(jìn)行了內(nèi)部交叉驗(yàn)證。驗(yàn)證結(jié)果表明,與Saraf等[15]和Lu等[19]建立的模型相比,采用簡便分子描述符建立模型的預(yù)測(cè)能力更好。

2014年,潘勇等[21]采用GA-MLR方法建立了41種不同類型有機(jī)過氧化物的SADT預(yù)測(cè)模型。由于有機(jī)過氧化物的SADT實(shí)驗(yàn)數(shù)據(jù)難以獲取,因此,建模的數(shù)據(jù)樣本來自不同的文獻(xiàn),當(dāng)存在不同數(shù)據(jù)源中相同物質(zhì)的SADT數(shù)據(jù)不同時(shí),則采納最新的數(shù)據(jù)。與上述To的預(yù)測(cè)研究相類似,潘勇等采用計(jì)算軟件DRAGON 5.4獲取分子描述符,利用GA-MLR方法篩選與SADT具有最優(yōu)定量關(guān)系的描述符,并建立了有機(jī)過氧化物SADT的6元線性預(yù)測(cè)模型,驗(yàn)證了模型具有良好的預(yù)測(cè)能力和穩(wěn)定性,同時(shí),采用均值效應(yīng)(ME)法研究分子描述符對(duì)預(yù)測(cè)模型的貢獻(xiàn)程度。

經(jīng)過長期的理論研究和線性方法建模的探索,許多學(xué)者開始采用非線性建模方法來深入探索分子結(jié)構(gòu)與化合物性質(zhì)之間的復(fù)雜關(guān)系。在諸多的非線性建模方法中,支持向量機(jī)(SVM)方法因其嚴(yán)格的理論基礎(chǔ)和適用于小樣本等明顯優(yōu)勢(shì),成為了QSPR研究領(lǐng)域中適用性很強(qiáng)的建模方法[22-23]。目前,已有學(xué)者將SVM方法應(yīng)用于熱穩(wěn)定性的QSPR預(yù)測(cè)研究中。2017年,馬繼濤等[2]以46種有機(jī)過氧化物及其SADT數(shù)據(jù)作為研究數(shù)據(jù)樣本,采用最佳多元線性回歸(B-MLR)和SVM方法建立預(yù)測(cè)模型,SVM模型的性能優(yōu)于B-MLR模型,以此證明有機(jī)過氧化物SADT與分子結(jié)構(gòu)間存在較強(qiáng)的非線性關(guān)系。同年,Wang等[24]基于50種有機(jī)過氧化物,采用SVM方法建立了SADT的非線性預(yù)測(cè)模型,并驗(yàn)證了模型具有很好的擬合能力、穩(wěn)定性和外部預(yù)測(cè)能力。2018年,何培等[25]在前期的SADT預(yù)測(cè)研究基礎(chǔ)上,將有機(jī)過氧化物的樣本量擴(kuò)展至71種,數(shù)據(jù)來源于不同的參考文獻(xiàn)。與大部分熱穩(wěn)定性預(yù)測(cè)研究的建模方法不同,在該研究中,分別采用MLR和SVM方法建立有機(jī)過氧化物的SADT預(yù)測(cè)的線性和非線性模型,對(duì)比了MLR模型和SVM模型的預(yù)測(cè)結(jié)果。經(jīng)過驗(yàn)證,SVM模型在預(yù)測(cè)能力、穩(wěn)健性和適用性方面比MLR更優(yōu)越。

3 分析與討論

3.1 早期熱穩(wěn)定性預(yù)測(cè)方法的局限性

早期熱穩(wěn)定性預(yù)測(cè)研究主要是基于官能團(tuán)特性,例如,ASTM軟件開發(fā)的CHETAH軟件[5],基于Benson的基團(tuán)貢獻(xiàn)法預(yù)測(cè)活性化學(xué)品的最大分解熱,Benson方法存在一定的局限性,如果出現(xiàn)數(shù)據(jù)庫以外的基團(tuán)或者錯(cuò)誤的基團(tuán),那么Benson方法就可能失效。雖然,早期預(yù)測(cè)方法具有局限性,但是,對(duì)熱穩(wěn)定性預(yù)測(cè)研究起到了重要的推動(dòng)作用。

3.2 QSPR的應(yīng)用分析及存在的問題

3.2.1 基于量子力學(xué)的QSPR方法

量子化學(xué)計(jì)算的分子描述符一般具有明確的物理意義,并且前人的研究已經(jīng)證實(shí)基于量子化學(xué)計(jì)算建立的構(gòu)效關(guān)系模型能夠正確的反映分子結(jié)構(gòu)和熱穩(wěn)定性之間的關(guān)系。然而,量子化學(xué)計(jì)算在QSPR預(yù)測(cè)研究領(lǐng)域具有明顯的應(yīng)用局限性:1)計(jì)算成本高,且耗時(shí);2)需要具備專業(yè)知識(shí),使用專業(yè)軟件進(jìn)行計(jì)算,不便于在工業(yè)人員中進(jìn)行廣泛的推廣;3)量子化學(xué)計(jì)算的描述符不具有通用性,依賴于選用的化學(xué)物質(zhì)的結(jié)構(gòu)特性。

3.2.2 優(yōu)化的QSPR預(yù)測(cè)方法

簡單、計(jì)算成本更低的分子描述符的研究,對(duì)熱穩(wěn)定性的QSPR預(yù)測(cè)方法的推廣應(yīng)用起到了進(jìn)一步的推動(dòng)作用,并且張尹炎等[1]的研究已經(jīng)表明,選用簡單的分子描述符(組成描述符、拓?fù)涿枋龇?建立的熱穩(wěn)定性預(yù)測(cè)模型能獲得更好的預(yù)測(cè)結(jié)果。但是,由于起步較晚,相關(guān)研究仍需要進(jìn)一步完善。

1)數(shù)據(jù)樣本的選取

可靠的數(shù)據(jù)樣本是建立可靠的熱穩(wěn)定性預(yù)測(cè)模型的保障,為降低模型在推廣應(yīng)用中的不確定性,需要保證數(shù)據(jù)的統(tǒng)一性,因此,為了最大程度的降低數(shù)據(jù)樣本的差異對(duì)預(yù)測(cè)模型的影響,數(shù)據(jù)樣本最好源自同一并權(quán)威的數(shù)據(jù)源。由于活性化合物熱穩(wěn)定性測(cè)試數(shù)據(jù)難以獲取,所以在同一公開的數(shù)據(jù)源的數(shù)據(jù)樣本量少的情況下,有的研究人員綜合不同的數(shù)據(jù)源形成建模的數(shù)據(jù)樣本集,不同數(shù)據(jù)源的數(shù)據(jù)樣本的差異性不可避免的會(huì)對(duì)預(yù)測(cè)模型的應(yīng)用造成影響。

同時(shí),數(shù)據(jù)樣本的量也是影響模型性能的重要因素。以Lu等[19]和張尹炎等[1]的16種有機(jī)過氧化物的To預(yù)測(cè)研究為例,由于數(shù)據(jù)樣本量少,全部數(shù)據(jù)用作訓(xùn)練集,無法對(duì)模型進(jìn)行外部驗(yàn)證,從而無法印證模型對(duì)數(shù)據(jù)樣本以外的物質(zhì)的預(yù)測(cè)能力,因此,對(duì)模型的適用性存疑。另外,數(shù)據(jù)樣本量的不足也會(huì)影響模型的普適性。

2)分子描述符的選取

分子描述符用來表征分子結(jié)構(gòu),是建立熱穩(wěn)定性QSPR預(yù)測(cè)模型的基礎(chǔ)。分子描述符的種類繁多、數(shù)量龐大,選取合適的、與熱穩(wěn)定性相關(guān)性最好的分子描述符是預(yù)測(cè)模型成功的關(guān)鍵,也是QSPR研究中的難題之一。為避免經(jīng)驗(yàn)法選取分子描述符主觀性強(qiáng)的問題,應(yīng)該選用統(tǒng)計(jì)學(xué)中的變量篩選方法,包括逐步回歸法(向前選擇和向后選擇)、遺傳算法、粒子群算法和蟻群算法等等。在熱穩(wěn)定性QSPR研究領(lǐng)域中,分子描述符選取方法應(yīng)更多的選用遺傳算法、蟻群算法等強(qiáng)大的擇優(yōu)算法,獲取與熱穩(wěn)定性最密切相關(guān)的分子描述符。

當(dāng)建模數(shù)據(jù)樣本少,而分子描述符過多時(shí),有可能存在過度擬合的風(fēng)險(xiǎn)。例如,Lu等[19]建立的模型數(shù)據(jù)樣本來自16種有機(jī)過氧化物,但是建模的分子描述符有13個(gè)。Tropsha等[26]在他們的研究中曾提出,只有訓(xùn)練集的化學(xué)物質(zhì)樣本數(shù)量超過描述符的5倍時(shí),QSPR模型才是有效的。

3)QSPR建模方法的選擇

熱穩(wěn)定性QSPR建模是將分子描述符作為輸入?yún)?shù),通過數(shù)學(xué)建模方法,建立分子描述符和熱穩(wěn)定性參數(shù)(To,-ΔHd,SADT)定量關(guān)系模型的方法。目前,在熱穩(wěn)定性QSPR預(yù)測(cè)研究中,常用的建模方法主要是MLR,PLS和SVM等。MLR和PLS等線性建模方法是熱穩(wěn)定性預(yù)測(cè)的前期研究常用的方法,算法簡單,但是適用于模擬分子結(jié)構(gòu)與性質(zhì)之間的線性關(guān)系或者近似線性關(guān)系,而SVM等方法建立的是非線性模型,何培、潘勇等[25]在有機(jī)過氧化物SADT預(yù)測(cè)研究中,已經(jīng)證實(shí)SVM方法建立的模型預(yù)測(cè)效果優(yōu)于MLR的模型,說明非線性建模方法能更好的反映分子結(jié)構(gòu)和熱穩(wěn)定性之間復(fù)雜的關(guān)系。在熱穩(wěn)定性QSPR預(yù)測(cè)領(lǐng)域,非線性建模方法應(yīng)用較少,仍需要進(jìn)一步研究,改善預(yù)測(cè)模型的準(zhǔn)確性,以此推進(jìn)QSPR預(yù)測(cè)方法的應(yīng)用推廣。

4 結(jié)論

1)建立量子化學(xué)計(jì)算的分子描述符數(shù)據(jù)庫。量子化學(xué)計(jì)算的分子描述符具有明確的物理意義,雖然計(jì)算成本高、耗時(shí)、專業(yè)性強(qiáng),但也是必不可少的描述符。為節(jié)省計(jì)算時(shí)間,便于基于量子化學(xué)計(jì)算的QSPR研究工作的進(jìn)一步開展,應(yīng)該針對(duì)不同的活性化合物進(jìn)行專門的量子化學(xué)分子描述符計(jì)算,建立量子化學(xué)分子描述符數(shù)據(jù)庫,節(jié)省后續(xù)QSPR研究時(shí)間,避免重復(fù)性工作。

2)擴(kuò)充活性化合物熱穩(wěn)定性參數(shù)數(shù)據(jù)樣本。具有權(quán)威性的、同一數(shù)據(jù)來源的、盡可能多的數(shù)據(jù)樣本,可以保證熱穩(wěn)定性預(yù)測(cè)模型的可靠性和普適性。針對(duì)目前活性化合物熱穩(wěn)定性參數(shù)(To,-ΔHd,SADT等)實(shí)驗(yàn)數(shù)據(jù)少,來源不一致的問題。應(yīng)該采用統(tǒng)一的實(shí)驗(yàn)測(cè)試方法,擴(kuò)充數(shù)據(jù)樣本的數(shù)量,避免數(shù)據(jù)源不一致帶來的不確定性。

3)研究強(qiáng)大的分子描述符篩選算法。為了從大量分子描述符中,提取與熱穩(wěn)定性最密切相關(guān)的分子描述符,需要研究強(qiáng)大的分子描述符篩選算法。以GA為例,作為一種尋找全局或近全局最優(yōu)解的強(qiáng)大擇優(yōu)算法,非常適合解決這一問題。后續(xù)熱穩(wěn)定性預(yù)測(cè)研究中,應(yīng)該選用強(qiáng)大的分子描述符篩選方法。同時(shí),控制樣本數(shù)量和描述符數(shù)量的比例,避免出現(xiàn)過度擬合,造成模型適用性的降低。

4)研究能正確反映分子結(jié)構(gòu)和熱穩(wěn)定性之間非線性關(guān)系的非線性建模方法。為了更好地反映分子結(jié)構(gòu)和熱穩(wěn)定性之間復(fù)雜的非線性關(guān)系,應(yīng)進(jìn)一步研究基于神經(jīng)網(wǎng)絡(luò)或SVM等非線性建模方法建立熱穩(wěn)定性預(yù)測(cè)模型,并從擬合能力、穩(wěn)定性、預(yù)測(cè)能力、應(yīng)用域等方面進(jìn)行全面的評(píng)價(jià)與驗(yàn)證[27-28],綜合驗(yàn)證分析模型的性能,評(píng)價(jià)模型的應(yīng)用域,保證預(yù)測(cè)化合物處于模型應(yīng)用域范圍內(nèi),從而獲得準(zhǔn)確有效且預(yù)測(cè)能力更好、適用性更強(qiáng)的QSPR預(yù)測(cè)模型。

猜你喜歡
描述符過氧化物熱穩(wěn)定性
芝麻種子中內(nèi)源性蛋白酶的熱穩(wěn)定性及其運(yùn)用
Co3O4納米酶的制備及其類過氧化物酶活性
對(duì)某些無機(jī)物熱力學(xué)穩(wěn)定性的教學(xué)研究*
有機(jī)過氧化物的危險(xiǎn)特性及預(yù)防
基于AKAZE的BOLD掩碼描述符的匹配算法的研究
歐洲共同語言參考標(biāo)準(zhǔn)在中國高校學(xué)術(shù)英語寫作教學(xué)適用性的研究:可理解性,可行性和有用性
基于深度學(xué)習(xí)的局部描述符
DLC涂層的制備及內(nèi)應(yīng)力、熱穩(wěn)定性改善措施研究現(xiàn)狀
以碳量子點(diǎn)為過氧化物模擬酶的葡萄糖測(cè)定方法
一種基于PCIE總線的改進(jìn)分散集聚DMA的設(shè)計(jì)
五台县| 平安县| 龙门县| 武胜县| 瑞金市| 搜索| 蓬莱市| 昆明市| 保定市| 苏州市| 长沙县| 丽江市| 房产| 新郑市| 揭东县| 攀枝花市| 昌都县| 山阳县| 合水县| 石柱| 册亨县| 和田市| 天全县| 商河县| 珲春市| 平湖市| 扎兰屯市| 香港 | 阿拉善左旗| 巴中市| 浠水县| 康保县| 钟祥市| 麦盖提县| 桑日县| 科尔| 应城市| 胶南市| 泽州县| 仲巴县| 文昌市|