姚明海,李勁松
(渤海大學(xué) 信息科學(xué)與技術(shù)學(xué)院,遼寧 錦州121013)
分子篩因其獨(dú)特的結(jié)構(gòu)特征,大量應(yīng)用于氣體的吸附、分離和凈化方面,以及石油煉制中催化和離子交換方面.目前,對(duì)于無(wú)機(jī)微孔材料如何定向合成的問(wèn)題仍然是國(guó)內(nèi)外材料領(lǐng)域和分子工程學(xué)領(lǐng)域研究熱點(diǎn)[1-3].在過(guò)去幾年里,諸多學(xué)者試圖通過(guò)將數(shù)據(jù)挖掘思想和方法引入到分子篩問(wèn)題中,建立相關(guān)預(yù)測(cè)模型來(lái)對(duì)無(wú)機(jī)微孔材料進(jìn)行更好地定向合成,一些數(shù)學(xué)統(tǒng)計(jì)方法已經(jīng)大量使用于化學(xué)分子材料分析問(wèn)題中并取得了部分研究成果,但是關(guān)于開(kāi)放的骨架磷酸鋁定向合成的預(yù)測(cè)實(shí)驗(yàn)和相關(guān)數(shù)據(jù)仍然較少.文獻(xiàn)[4]將支持向量機(jī)運(yùn)用于各種催化劑來(lái)預(yù)測(cè)催化性能的實(shí)驗(yàn).實(shí)驗(yàn)結(jié)果說(shuō)明,與各種決策樹(shù)相比,在一定催化條件下支持向量機(jī)取得更好的分類性能.齊妙等人在合成參數(shù)對(duì)實(shí)驗(yàn)產(chǎn)物類型影響的預(yù)測(cè)實(shí)驗(yàn)中,采取了將Logistic回歸與偏最小二乘法相結(jié)合的統(tǒng)計(jì)方法(PLS-LR)[5].
近年來(lái),國(guó)內(nèi)學(xué)者開(kāi)始尋找開(kāi)放骨架磷酸鋁結(jié)構(gòu)與合成因子之間的對(duì)應(yīng)關(guān)系.在文獻(xiàn)[6]和[7]中,齊妙等人分別提出了利用加權(quán)融合思想的特征選擇方法和基于隨機(jī)子空間的特征選擇方法來(lái)分析定向合成(12,6)元環(huán)分子篩的合成因子的重要程度.這些方法為利用數(shù)據(jù)挖掘思想和特征選擇來(lái)進(jìn)行實(shí)驗(yàn)分析和預(yù)測(cè)合成參數(shù)對(duì)相應(yīng)合成產(chǎn)物間對(duì)應(yīng)關(guān)系的有效性和可行性提供了證明.吉林大學(xué)的“無(wú)機(jī)合成與制備國(guó)家重點(diǎn)實(shí)驗(yàn)室”創(chuàng)建了磷酸鋁合成反應(yīng)的數(shù)據(jù)庫(kù),供國(guó)內(nèi)外的諸多學(xué)者和科研人員免費(fèi)使用,為分子篩的設(shè)計(jì)與定向合成相關(guān)研究提供了數(shù)據(jù)基礎(chǔ).該數(shù)據(jù)庫(kù)的建立不僅為分子篩的預(yù)測(cè)與定向合成提供了相關(guān)的實(shí)驗(yàn)數(shù)據(jù)和基礎(chǔ)信息,還開(kāi)辟了如何設(shè)計(jì)和定向合成無(wú)機(jī)微孔材料的新通道.但是,在實(shí)驗(yàn)中發(fā)現(xiàn)大約29%的數(shù)據(jù)有不同情況的缺失.為了進(jìn)一步完善數(shù)據(jù)庫(kù)信息,減少對(duì)實(shí)驗(yàn)結(jié)果的影響,文獻(xiàn)[8]提出了利用BP神經(jīng)網(wǎng)絡(luò)建立補(bǔ)值模型對(duì)缺失數(shù)據(jù)進(jìn)行估計(jì)補(bǔ)值,通過(guò)大量的實(shí)驗(yàn)證明了補(bǔ)值算法具有一定的有效性和可行性,但是該文在對(duì)凝膠組成建模過(guò)程中僅考慮了摩爾比關(guān)系而沒(méi)有考慮到溶劑和模板劑的影響.文獻(xiàn)[9]證明即使同樣的摩爾比值,使用不同模板劑或溶劑生成的結(jié)構(gòu)也會(huì)不同.所以為了更好的建立凝膠組成補(bǔ)值模型,應(yīng)當(dāng)考慮進(jìn)溶劑和模板劑因素.因此本文在國(guó)內(nèi)外學(xué)者的研究基礎(chǔ)上,將研究重點(diǎn)放在了建立更精確的預(yù)測(cè)和補(bǔ)值模型上,在完善數(shù)據(jù)庫(kù)的同時(shí),為定向合成提供指導(dǎo).
本文首先通過(guò)大量隨機(jī)實(shí)驗(yàn),選擇出能提供正確分類信息的樣本;然后使用這些樣本建立更精確的預(yù)測(cè)模型和補(bǔ)值模型,并利用補(bǔ)值模型對(duì)部分錯(cuò)誤樣本進(jìn)行矯正;最后利用得到的預(yù)測(cè)模型和補(bǔ)值模型建立定向合成(12,6)元環(huán)分子篩的預(yù)測(cè)系統(tǒng).
為了更好的挖掘定向合成分子篩的規(guī)律,建立更精確的判別模型,給定向合成提供指導(dǎo)性意見(jiàn),本文在充分分析了國(guó)內(nèi)外學(xué)者研究工作的基礎(chǔ)上,以定向合成(12,6)元環(huán)分子篩為目標(biāo),建立更精確的判別系統(tǒng).該系統(tǒng)流程圖如圖1所示.
從圖1可以看出,本文的工作主要包括系統(tǒng)構(gòu)建和系統(tǒng)測(cè)試兩部分,核心工作是構(gòu)建分子篩定向合成預(yù)測(cè)系統(tǒng).該過(guò)程首先對(duì)原始樣本數(shù)據(jù)進(jìn)行篩選,得到能夠?qū)?gòu)建判別模型提供有用信息的富信息數(shù)據(jù)和提供錯(cuò)誤信息或無(wú)法提供信息的負(fù)信息數(shù)據(jù).然后利用富信息數(shù)據(jù)構(gòu)建SVM判別模型和BP補(bǔ)值模型.基于判別模型和補(bǔ)值模型構(gòu)建分子篩定向合成預(yù)測(cè)系統(tǒng).最后通過(guò)分子篩定向合成預(yù)測(cè)系統(tǒng)實(shí)現(xiàn)分子篩定向合成反應(yīng)的預(yù)測(cè).同時(shí),可以利用補(bǔ)值模型實(shí)現(xiàn)負(fù)信息數(shù)據(jù)的矯正.
從文獻(xiàn)[6-7]可以發(fā)現(xiàn),不管是經(jīng)典的預(yù)測(cè)方法或特征選擇方法等對(duì)定向預(yù)測(cè)的準(zhǔn)確率都無(wú)法超過(guò)90%,這與其他領(lǐng)域(如生物認(rèn)證、生物信息學(xué))動(dòng)輒95%甚至100%的準(zhǔn)確率相差甚遠(yuǎn).遺憾的是造成識(shí)別率不高的原因至今還無(wú)法查明.本文僅給出部分分析與猜測(cè).首先,該數(shù)據(jù)庫(kù)除了收錄吉林大學(xué)“無(wú)機(jī)合成與制備國(guó)家重點(diǎn)實(shí)驗(yàn)室”的按照統(tǒng)一標(biāo)準(zhǔn)記錄的研究結(jié)果外,還整理收錄了1936年至今的大量會(huì)議、專利、學(xué)位論文、文獻(xiàn)期刊上的研究成果,這些研究成果可能由于各種原因造成了實(shí)驗(yàn)數(shù)據(jù)的偏差;其次,由于是不同的科研機(jī)構(gòu)的研究成果,使得在記錄的過(guò)程中有些實(shí)驗(yàn)數(shù)據(jù)沒(méi)有記錄或是沒(méi)有精確記錄;再次,為了更好地利用數(shù)據(jù)挖掘方法建立預(yù)測(cè)模型,眾多學(xué)者普遍對(duì)這些數(shù)據(jù)進(jìn)行了預(yù)處理,從原始數(shù)據(jù)中選出認(rèn)為重要的參數(shù)用于后續(xù)實(shí)驗(yàn),這一過(guò)程可能忽略了一些還沒(méi)有被認(rèn)識(shí)到但是非常重要的合成因子(如溫度、時(shí)間等);最后,定向合成實(shí)驗(yàn)有著非常復(fù)雜的反應(yīng)過(guò)程,不是簡(jiǎn)單輸入與輸出的關(guān)系,可能還需要中間過(guò)程,但是現(xiàn)階段對(duì)中間過(guò)程的描述并不多.以上這些僅是對(duì)造成目前眾多學(xué)者的研究結(jié)果識(shí)別率不高進(jìn)行的初步分析.因?yàn)槎虝r(shí)間內(nèi)無(wú)法對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行重新實(shí)驗(yàn)驗(yàn)證,目前僅能在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上進(jìn)行實(shí)驗(yàn)研究,因此為了避免存在偏差的數(shù)據(jù)對(duì)建立預(yù)測(cè)模型的影響,本文在數(shù)據(jù)預(yù)處理階段對(duì)數(shù)據(jù)進(jìn)行了篩選.數(shù)據(jù)篩選階段的具體方法是將現(xiàn)有數(shù)據(jù)樣本分別作為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),根據(jù)正確分類情況將數(shù)據(jù)分為對(duì)預(yù)測(cè)能夠提供有用信息的富信息數(shù)據(jù)和對(duì)預(yù)測(cè)建模無(wú)法提供幫助的負(fù)信息數(shù)據(jù).具體算法描述如下:
給定正樣本集X+和負(fù)樣本集X-,迭代次數(shù)n0和n1.
支持向量機(jī)(Support Vector Machine,SVM)[10]是尋找一個(gè)超平面來(lái)對(duì)樣本進(jìn)行分割,分割的原則是間隔最大化,最終轉(zhuǎn)化為一個(gè)凸二次規(guī)劃問(wèn)題的分類模型,能有效解決局部極小點(diǎn)、全局最優(yōu)解、非線性和高維數(shù)等相關(guān)問(wèn)題,在機(jī)器學(xué)習(xí)、模式識(shí)別、文本分類等領(lǐng)域廣泛應(yīng)用并成為研究熱點(diǎn)問(wèn)題[11-13].算法描述如下:
輸出:權(quán)重向量w,二次解a*,
函數(shù)f 既是由超平面表示的決策規(guī)則
在文獻(xiàn)[6-8]中均采用了SVM作為判別分類器,展示了不錯(cuò)的分類性能,因此本文在構(gòu)建判別模型過(guò)程中選用SVM作為分類器.具體判別模型算法如下:
給定正樣本集XP和負(fù)樣本集XN,迭代次數(shù)n.
BP神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力[14],以任意精度逼近任何非線性連續(xù)函數(shù),適合于求解內(nèi)部機(jī)制復(fù)雜的問(wèn)題.此外,BP神經(jīng)網(wǎng)絡(luò)具有將學(xué)習(xí)成果應(yīng)用于新知識(shí)的泛化能力、魯棒性、容錯(cuò)性以及高度自學(xué)習(xí)和自適應(yīng)的能力.鑒于BP神經(jīng)網(wǎng)絡(luò)存在的諸多優(yōu)勢(shì)及磷酸鋁合成反應(yīng)數(shù)據(jù)的各項(xiàng)參數(shù)之間存在相關(guān)性的特點(diǎn),本文采用了BP神經(jīng)網(wǎng)絡(luò)的補(bǔ)值方法.本文BP神經(jīng)網(wǎng)絡(luò)選取三層結(jié)構(gòu)(輸入層、中間層、輸出層)來(lái)訓(xùn)練樣本并形成模型.在實(shí)驗(yàn)訓(xùn)練樣本中的數(shù)據(jù)Y篩選出k個(gè)不含參數(shù)缺失信息的樣本y1,y2,…,yk,再?gòu)臉颖緮?shù)據(jù)中篩選出第h個(gè)參數(shù)缺失信息的樣本yj用作實(shí)驗(yàn)測(cè)試樣本. BP神經(jīng)網(wǎng)絡(luò)的補(bǔ)值方法在應(yīng)用于缺失值估計(jì)時(shí),一般分為兩個(gè)階段進(jìn)行,即模型的訓(xùn)練階段與缺失值的估計(jì)階段. 在模型訓(xùn)練階段,每個(gè)實(shí)驗(yàn)訓(xùn)練樣本y1,y2,…,yk中,將p-h(p全體參數(shù))個(gè)數(shù)據(jù)參數(shù)視為BP神經(jīng)網(wǎng)絡(luò)的輸入量,該模型的輸出結(jié)果為實(shí)驗(yàn)訓(xùn)練樣本的第h個(gè)數(shù)據(jù)參數(shù),構(gòu)建三層BP神經(jīng)網(wǎng)絡(luò)模型. 在缺失值估計(jì)階段,通過(guò)將實(shí)驗(yàn)測(cè)試樣本yj的p-h個(gè)數(shù)據(jù)參數(shù)放入BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型中,該模型的輸出結(jié)果即為數(shù)據(jù)缺失值yjh的相應(yīng)估計(jì)值.
文獻(xiàn)[8]將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到磷酸鋁合成反應(yīng)數(shù)據(jù)的缺失值處理上,當(dāng)完備數(shù)據(jù)較多、缺失率較小時(shí),BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的越充分,對(duì)數(shù)據(jù)參數(shù)間相應(yīng)關(guān)系的建模就越精確,實(shí)驗(yàn)結(jié)果補(bǔ)值的相應(yīng)誤差就越小.但是,該方法在補(bǔ)值過(guò)程中僅考慮了合成材料的摩爾比,沒(méi)有考慮到溶劑和模板劑對(duì)合成結(jié)果的影響.因此本文對(duì)補(bǔ)值方法進(jìn)行了重新的設(shè)計(jì),在補(bǔ)值過(guò)程中充分考慮了溶劑和模板劑對(duì)合成結(jié)果的影響.
本文選用了磷酸鋁合成反應(yīng)數(shù)據(jù)庫(kù)(http://zeobank.jlu.edu.cn/)數(shù)據(jù),采用同文獻(xiàn)[7]相同的數(shù)據(jù)處理方式,以定向合成(12,6)元環(huán)結(jié)構(gòu)作為目標(biāo)開(kāi)展實(shí)驗(yàn).實(shí)驗(yàn)結(jié)果得到生成(12,6)元環(huán)結(jié)構(gòu)的合成物398條視為正樣本,884條(不包含(12,6)元環(huán)結(jié)構(gòu))的合成物視為負(fù)樣本.每個(gè)樣本中有21維含反應(yīng)物屬性的參數(shù),參數(shù)說(shuō)明如表1所示.
經(jīng)過(guò)對(duì)實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)和篩選后發(fā)現(xiàn),共有432條樣本存在不同程度的錯(cuò)誤判別,其中正樣本186條,錯(cuò)誤統(tǒng)計(jì)分布如圖2所示.在全部被錯(cuò)誤判別的樣本中有9條樣本錯(cuò)誤率為100%,全部為正樣本被錯(cuò)誤判別為負(fù)樣本.為了后續(xù)試驗(yàn)的順利進(jìn)行,本文將錯(cuò)誤率大于0.3的樣本定為負(fù)信息樣本,共132條,其中正樣本86條,允許錯(cuò)誤率不大于0.3的樣本參與后續(xù)試驗(yàn).
經(jīng)過(guò)數(shù)據(jù)篩選后剩余樣本數(shù)量為1150條,其中正樣本312條.為了建立預(yù)測(cè)模型用于后續(xù)實(shí)驗(yàn),必須充分利用現(xiàn)有數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練.因此,本文在樣本的選擇上正負(fù)樣本的數(shù)量比設(shè)置為1:1.但是,訓(xùn)練和測(cè)試的樣本數(shù)量會(huì)發(fā)生改變,嘗試不同的訓(xùn)練樣本數(shù)量,達(dá)到預(yù)測(cè)性能的最大化.這里嘗試將每類訓(xùn)練樣本的數(shù)量Nr分別取為150,200,250和300四種數(shù)量.實(shí)驗(yàn)結(jié)果如圖3所示.
圖3顯示了預(yù)測(cè)準(zhǔn)確率隨訓(xùn)練樣本數(shù)量增加而變化的曲線圖.由圖3可以看出經(jīng)過(guò)篩選樣本后構(gòu)建的分類器的準(zhǔn)確率非常高,隨著訓(xùn)練樣本數(shù)量的增加準(zhǔn)確率升高超過(guò)了99%.考慮到運(yùn)行時(shí)間以及避免過(guò)擬合的情況發(fā)生,本文選用由正負(fù)樣本各選200個(gè)作為訓(xùn)練樣本得到的SVM模型作為判別模型.
文獻(xiàn)[8]通過(guò)大量的隨機(jī)實(shí)驗(yàn)證明了BP補(bǔ)值算法的有效性,但是該方法沒(méi)有考慮到溶劑和模板劑的組成.從文獻(xiàn)[7]通過(guò)對(duì)合成因子重要性的分析可以知道溶劑和模板劑在磷酸鋁合成反應(yīng)過(guò)程中發(fā)揮著重要作用.因此本文結(jié)合文獻(xiàn)[7]對(duì)合成因子的重要性的分析,提出在建立補(bǔ)值模型時(shí)增加F6和F12這兩個(gè)合成因子來(lái)標(biāo)明溶劑和模板劑的成分.
本文采取均方誤差根(normalized root mean squared error,NRMSE)的標(biāo)準(zhǔn)來(lái)對(duì)補(bǔ)值模型進(jìn)行評(píng)價(jià),公式如下:
其中,ytrue是真實(shí)值,yestimated是通過(guò)補(bǔ)值方法獲得的估計(jì)值.NRMSE值越小說(shuō)明算法性能越好,誤差越小.
文獻(xiàn)[8]雖然使用了BP、KNN、LS和SVD四種補(bǔ)值方法,但是補(bǔ)值效果較好的是BP補(bǔ)值方法和KNN補(bǔ)值方法.因此本文在提出新的補(bǔ)值模型構(gòu)建理論后同文獻(xiàn)[8]使用的BP補(bǔ)值模型和KNN補(bǔ)值模型進(jìn)行對(duì)比.表2列出了不同的補(bǔ)值模型在不同的缺失率下的實(shí)驗(yàn)結(jié)果.由實(shí)驗(yàn)結(jié)果可以看出本文提出的模型構(gòu)建理論在缺失率較低時(shí),得到補(bǔ)值誤差有了明顯的降低.針對(duì)F2參數(shù),BP補(bǔ)值方法下降更顯著.隨著缺失率增加訓(xùn)練樣本的減少,BP補(bǔ)值方法的性能有所降低.同時(shí)從表2可以看出考慮了溶劑和模板劑影響的KNN算法明顯好于文獻(xiàn)[8]中的KNN算法.KNN補(bǔ)值方法依然展現(xiàn)了不隨缺失率增大而發(fā)生較大波動(dòng)的特點(diǎn),但是,相對(duì)于BP補(bǔ)值方法來(lái)說(shuō),KNN補(bǔ)值方法的缺陷在于補(bǔ)值過(guò)程中要完全依賴于數(shù)據(jù)集,而B(niǎo)P補(bǔ)值方法則不需要.
為了對(duì)BP補(bǔ)值模型的性能有更直觀的對(duì)比,本文將各種方法在不同缺失率獲得的平均NRMSE在圖4中進(jìn)行了展示.由圖中可以看出本文提出的融入了溶劑和模板劑信息的BP補(bǔ)值方法和KNN補(bǔ)值方法補(bǔ)值誤差明顯降低.在缺失率較低的情況下,本文得到BP補(bǔ)值模型具有最低的錯(cuò)誤率,補(bǔ)值性能最高.因?yàn)锽P模型構(gòu)建后不再受到樣本庫(kù)的影響,而KNN模型的補(bǔ)值依賴數(shù)據(jù)集,考慮到系統(tǒng)的可擴(kuò)展性,本文提出的系統(tǒng)選用BP補(bǔ)值模型.
表2 不同缺失率下各種補(bǔ)值方法的均方誤差根(NRMSE)
在補(bǔ)值模型建立后,本文還進(jìn)行了對(duì)被錯(cuò)誤判別的正樣本進(jìn)行矯正工作.經(jīng)矯正后,原有錯(cuò)誤率不同的186條正樣本有149條樣本被矯正,矯正率達(dá)到80.1%,正樣本的判定準(zhǔn)確率也從84.38%上升到85.74%.
在上述模型構(gòu)建上兩個(gè)關(guān)鍵模型的建立雖然極大的方便了使用者,但是為了方便更多的科研工作者的使用,本文建立了用于定向合成(12,6)元分子篩的定向合成預(yù)測(cè)系統(tǒng).該系統(tǒng)主界面如圖5(a)所示.界面由4個(gè)可編輯文本框、兩個(gè)下拉菜單、兩個(gè)按鈕和一個(gè)輸出顯示區(qū)域幾部分組成.四個(gè)可編輯文本框?qū)?yīng)的是反應(yīng)物的凝膠組成,其中Al2O3是必填項(xiàng),只有這項(xiàng)填入數(shù)值后后續(xù)菜單和按鈕才能被激活使用,而其他三個(gè)摩爾值允許使用者不填.當(dāng)存在摩爾值未填寫(xiě)情況而使用者又要求進(jìn)行預(yù)測(cè)判斷時(shí)系統(tǒng)自動(dòng)調(diào)用補(bǔ)值估計(jì)機(jī)制.兩個(gè)下拉菜單分別顯示的可選的溶劑和模板劑種類,也是必選項(xiàng).預(yù)測(cè)結(jié)果在顯示區(qū)域顯示.
該系統(tǒng)為可執(zhí)行程序,用戶可以直接運(yùn)行,不需要預(yù)先打開(kāi)任何編程軟件.此外系統(tǒng)還以excel表格形式自動(dòng)對(duì)每次的判別過(guò)程進(jìn)行保存,包括輸入的凝膠組成、溶劑和模板劑的成分、判別結(jié)果和未填參數(shù)后的系統(tǒng)給出的各參數(shù)估計(jì)推薦值,方便了后續(xù)的實(shí)驗(yàn)記錄.
在系統(tǒng)構(gòu)建完成后,對(duì)系統(tǒng)進(jìn)行了簡(jiǎn)單測(cè)試.效果圖如圖5所示.圖5(a)為系統(tǒng)主界面,用戶需要首先填入Al2O3的摩爾量來(lái)激活溶劑的菜單(圖5(b)),其他三個(gè)摩爾量該系統(tǒng)允許用戶不確定輸入.選擇溶劑后激活模板劑菜單(圖5(c)),再選擇模板劑后激活執(zhí)行按鈕(圖5(d)),這時(shí)就達(dá)到了該系統(tǒng)運(yùn)行的最低條件,用戶可以繼續(xù)輸入其余摩爾量也可以選擇在此條件下進(jìn)行估計(jì)預(yù)測(cè).當(dāng)用戶僅輸入了Al2O3、溶劑和模板劑的種類后,系統(tǒng)會(huì)根據(jù)用戶的輸入給出推薦的實(shí)驗(yàn)參數(shù)值(如圖5(e)).圖5(g)和圖5(h)分別是用戶輸入全部參數(shù)后,系統(tǒng)直接給出的判斷結(jié)果.圖5(f)是當(dāng)用戶的輸入不符合實(shí)際情況時(shí)系統(tǒng)的錯(cuò)誤提示.該系統(tǒng)簡(jiǎn)單、直觀、快捷、便利,用戶在使用時(shí)無(wú)需進(jìn)行任何培訓(xùn)就可直接使用,為科研工作者提供了幫助.
為了更好地為分子篩的定向合成服務(wù),本文在總結(jié)國(guó)內(nèi)外學(xué)者大量研究工作的基礎(chǔ)上,建立了一個(gè)簡(jiǎn)單、易用的定向合成預(yù)測(cè)系統(tǒng).在建立的過(guò)程中首先對(duì)數(shù)據(jù)進(jìn)行篩選,通過(guò)篩選后的數(shù)據(jù)構(gòu)建更精確的預(yù)測(cè)模型和補(bǔ)值估計(jì)模型.在建立補(bǔ)值估計(jì)模型時(shí),提出新的模型設(shè)計(jì)方案,考慮了溶劑和模板劑對(duì)合成結(jié)果的影響,使補(bǔ)值模型更精確.
本文系統(tǒng)的構(gòu)建,將為分子篩如何定向合成以及后續(xù)工作者的相關(guān)研究提供相應(yīng)的幫助與基礎(chǔ),在建立系統(tǒng)的過(guò)程中也為數(shù)據(jù)庫(kù)的完善做出了貢獻(xiàn).同時(shí)這一模式也可以向其他行業(yè)擴(kuò)展.但是本文還存在僅針對(duì)單一種類定向合成研究這一局限,在今后會(huì)將該系統(tǒng)擴(kuò)展到判斷更多分子篩結(jié)果的預(yù)測(cè)工作上.