時靜潔 陳利平 陳網(wǎng)樺
(南京理工大學(xué)化工學(xué)院安全工程系,南京210094)
結(jié)構(gòu)決定性能是化學(xué)中的一條基本規(guī)律.定量構(gòu)效關(guān)系(QSPR)方法可以將化合物的結(jié)構(gòu)信息、物理化學(xué)參數(shù)與化合物的性質(zhì)進(jìn)行分析計(jì)算,得到表征分子結(jié)構(gòu)的描述符,建立合理的數(shù)學(xué)模型,發(fā)現(xiàn)和確定對有機(jī)物的物理化學(xué)性質(zhì)起決定作用的結(jié)構(gòu)因素.1-3目前,已有研究者4-8運(yùn)用QSPR方法對預(yù)測黏度進(jìn)行了一定的研究.如張鶯4采用分子電性距離矢量(MEDV)表征酯分子的結(jié)構(gòu),分別應(yīng)用多元線性回歸(MLR)和偏最小二乘(PLS)回歸進(jìn)行了線性建模,結(jié)果較好,但只適用于酯類液體,涉及到的化合物較少,使用受到限制;而且并未對樣本集進(jìn)行訓(xùn)練集和測試集劃分,所得結(jié)果有待驗(yàn)證.Gharagheizi5對聚合物溶液黏度進(jìn)行了QSPR研究,分別建立了遺傳算法與多元線性回歸(GA-MLR)模型和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNN)模型,其結(jié)果令人滿意,但該研究并未對所建立的模型進(jìn)行全面的評價與驗(yàn)證,且模型僅適用于聚合物溶液,使用范圍較窄.
針對以上一些局限性,本文進(jìn)行了一些改進(jìn).在對樣本集進(jìn)行初步分類的基礎(chǔ)上,再對訓(xùn)練集和測試集進(jìn)行劃分,這也是本文的創(chuàng)新點(diǎn)之一.由于樣本中一些化合物結(jié)構(gòu)比較復(fù)雜,且有些化合物同時屬于幾個類別,很難將其分類,因此采用了具有試探性和人機(jī)交互功能的動態(tài)聚類算法——迭代自組織的數(shù)據(jù)分析法(ISODATA)對其進(jìn)行分類.本文采用蟻群優(yōu)化算法(ACO)對分子描述符進(jìn)行篩選,且分別與多元線性回歸法和支持向量機(jī)法組合建立預(yù)測黏度的模型,并對所建立的模型進(jìn)行了機(jī)理解釋.此外,本文還對所建立的模型進(jìn)行了比較全面的評價與驗(yàn)證,對模型的應(yīng)用域做了一定的研究.
分子描述符是建立QSPR模型的基礎(chǔ).分子描述符是用邏輯和數(shù)學(xué)程序?qū)⒎肿咏Y(jié)構(gòu)中的化學(xué)信息轉(zhuǎn)化成數(shù)值的符號表征.本文首先借助化學(xué)軟件Hyperchem7.5進(jìn)行分子結(jié)構(gòu)的輸入,隨后采用分子力學(xué)方法MM+進(jìn)行初步優(yōu)化,用量子化學(xué)半經(jīng)驗(yàn)方法PM3進(jìn)行進(jìn)一步幾何優(yōu)化,所有計(jì)算都限制在Hartree-Fock能級,采用Polar-Ribiere方法直至RMS梯度達(dá)到0.41868 kJ·mol-1,最后獲得能量最低的穩(wěn)定構(gòu)型.將優(yōu)化好的分子結(jié)構(gòu)導(dǎo)入DRAGON2.1軟件計(jì)算分子描述符,其中包括組成描述符、拓?fù)涿枋龇?、幾何描述符、電性描述符?8類共1481種分子描述符.
ISODATA算法是一種常用的動態(tài)聚類劃分算法.目前,ISODATA算法在油水層判別問題,9原油開發(fā)中判斷漏失層的存在以及漏失層的位置,10復(fù)雜體制雷達(dá)信號分選,11網(wǎng)絡(luò)路由選擇算法12等方面得到了很好的應(yīng)用.鑒于ISODATA算法的上述優(yōu)點(diǎn),本文提出基于ISODATA算法對樣本集進(jìn)行初步分類.
ISODATA主要算法思想是首先根據(jù)最小距離準(zhǔn)則獲得初始聚類,然后判斷初始聚類結(jié)果是否符合要求.若不符,則將聚類集進(jìn)行分裂和合并處理,得到新的聚類中心,再判斷聚類結(jié)果是否符合要求.如此反復(fù)迭代直到完成聚類劃分操作.ISODATA算法步驟13如下:(1)設(shè)置聚類分析控制參數(shù)是ISODATA的關(guān)鍵步驟,主要包括:期望得到的聚類數(shù)K;一個聚類中的最少樣本數(shù)θN,如小于此數(shù)就不作為一個獨(dú)立的聚類;一個聚類域中樣本距離分布的標(biāo)準(zhǔn)差θS;θC是兩聚類中心之間的最小距離,若小于此數(shù),合并兩個聚類;一次迭代運(yùn)算中可以合并的聚類中心的最多對數(shù)L;允許迭代的代數(shù)為I.(2)初始分類,讀入準(zhǔn)備分類的N個模式樣本(Xi,i=1,2,…,N),預(yù)選Nc個樣品作為初始聚類中心,根據(jù)最小距離準(zhǔn)則將各樣本分類.(3-5)按控制參數(shù)給定的要求,將前一次獲得的聚類集進(jìn)行分裂和合并處理,以獲得新的聚類中心和分類集(其中(4)為分裂處理,(5)為合并處理).(6)再次迭代運(yùn)算,重新計(jì)算各項(xiàng)指標(biāo),判別聚類結(jié)果是否符合要求,以此反復(fù)經(jīng)過多次迭代運(yùn)算,直至得到理想的聚類結(jié)果.
由于黏度受溫度等因素影響較大,因此本文選用了310種有機(jī)物在25°C的液體黏度作為研究樣本,并將所有的黏度值取自然對數(shù)(用lnη表示)作為模型的因變量.可靠的QSPR預(yù)測模型必須以可靠的實(shí)驗(yàn)樣本為基礎(chǔ),因此為了最大程度地消除實(shí)驗(yàn)數(shù)據(jù)之間的差異可能給預(yù)測模型所帶來的影響,本研究選用權(quán)威數(shù)據(jù)庫《有機(jī)化合物實(shí)驗(yàn)物性數(shù)據(jù)手冊》14作為實(shí)驗(yàn)樣本來源,以確保實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)確性和權(quán)威性.
隨后,本文并未對樣本集進(jìn)行直接劃分.應(yīng)用ISODATA算法對計(jì)算出的所有化合物描述符進(jìn)行聚類分析,再在每個類別中隨機(jī)選擇樣本作為訓(xùn)練集和測試集,訓(xùn)練集和測試集中均涵蓋了每個類別的化合物,避免訓(xùn)練集中缺失測試集中的部分信息,使得模型預(yù)測能力受到影響.本文選擇253個物質(zhì)作為訓(xùn)練集,用于變量選擇和建立模型,57個物質(zhì)作為測試集,用于外部驗(yàn)證.
大量的分子描述符中存在冗余信息,故首先利用DRAGON2.1軟件的篩選功能進(jìn)行初步篩選,篩除取值為常數(shù)或者近似常數(shù)的描述符以及相關(guān)系數(shù)達(dá)到0.95以上的描述符.經(jīng)過預(yù)先篩選,描述符的數(shù)目得到了一定程度的降低,減少至628個分子描述符(見表S1,Supporting Information),但仍無法滿足QSPR建模的需要.蟻群優(yōu)化算法(ACO)作為一種新興的種群智能優(yōu)化算法,已經(jīng)在離散的組合優(yōu)化等問題中被證明是一種高效的變量選擇方法.而參數(shù)選擇問題正屬于離散的組合優(yōu)化問題.因此,我們將蟻群優(yōu)化算法用于分子描述符參數(shù)的變量篩選,以期取得良好的效果.作為一種全局搜索算法,蟻群算法能夠有效地避免局部極優(yōu).15因此采用蟻群算法進(jìn)一步篩選,最終確定5個描述符作為模型的輸入.
運(yùn)用MATLAB語言來實(shí)現(xiàn)ISODATA算法,其主要思路是,把類的分裂合并操作看成是一種二維數(shù)組中行矢量位置移動的過程,每一個樣本作為數(shù)組中的一個行矢量,而每一行的每一列都是樣本的屬性值,使用MATLAB的矩陣運(yùn)算可以完成對樣本位置的調(diào)整,從而模擬對類的調(diào)整,最終達(dá)到聚類分析的結(jié)果.16本文向量的行數(shù)310為化合物數(shù),列數(shù)628為屬性值,即預(yù)篩選后的分子描述符數(shù).ISODATA算法部分參數(shù)設(shè)置為:K=8,θN=3,θS=1,θC=2,L=10,I=20.基于ISODATA算法聚類分析對化合物的分類如表1所示,類中心間的距離如表2所示.
表1和表2中的距離均為歐氏距離,歐氏距離是最易于理解的一種距離計(jì)算方法,源自歐氏空間中兩點(diǎn)間距離公式.兩個n維向量a(x11,x12,…,x1n)與b(x21,x22,…,x2n)間的歐氏距離:由表1可以看出,每一類化合物與相應(yīng)的類中心距離比較小,說明每一類化合物的相似度比較高.由表2可以看出,類中心間的距離均比較大,說明類與類之間差異度比較大.完成對化合物的初步分類之后再從每個類中隨機(jī)選擇樣本劃分訓(xùn)練集和測試集,其結(jié)果見表S2(Supporting Information).
運(yùn)用蟻群算法對DRAGON2.1軟件初步篩選后的628個分子描述符進(jìn)行進(jìn)一步篩選,其過程是在VC++6.0中采用C語言編程實(shí)現(xiàn).將螞蟻數(shù)量設(shè)為500,揮發(fā)率設(shè)為0.9.進(jìn)行不斷迭代直至收斂,最后篩選出5個分子描述符,分別為 G3u、Hy、H1p、R5m、X3sol.G3u屬于WHIM(權(quán)重整體不變分子指數(shù))描述符,G3u定義為第三成分對稱定向WHIM指數(shù),主要表征分子的結(jié)構(gòu)對稱性.Hy是一個與化合物親水性相關(guān)的簡單經(jīng)驗(yàn)指數(shù),它是通過有關(guān)親水性官能團(tuán)的函數(shù)獲得,主要反映該分子的親水性特征.H1p屬于GETAWAY(Geometry,Topology and Atom-Weights Assembly,幾何、拓?fù)浜驮訖?quán)重組合)描述符,以原子極化率作為加權(quán)性質(zhì)計(jì)算得到的參數(shù),用來反映相鄰原子之間原子極化率的相互關(guān)系.R5m也是GETAWAY描述符,它根據(jù)杠桿矩陣單元計(jì)算而得,該杠桿矩陣通過面心原子坐標(biāo)獲得.該描述符主要表征原子量的分布.X3sol為拓?fù)涿枋龇?由分子圖論獲得,是一種溶解連接性指數(shù).175個分子描述符相關(guān)性分析如表3所示.
相關(guān)系數(shù)大于0稱為正相關(guān),否則為負(fù)相關(guān).相關(guān)系數(shù)絕對值越大,則相關(guān)性越強(qiáng).從表3中可看出其相關(guān)系數(shù)均小于0.8,這說明參數(shù)之間不存在共線性問題,可作為建模的輸入?yún)?shù).18
針對訓(xùn)練集樣本,以ACO篩選的5個描述符作為輸入?yún)?shù),應(yīng)用SPSS軟件中的多元線性回歸(MLR)模塊,得到了MLR預(yù)測模型,結(jié)果如下:
式中l(wèi)nη為黏度自然對數(shù)值.MLR模型的性能參數(shù)見表4,表中R2為復(fù)相關(guān)系數(shù),為“留一法”交互內(nèi)部驗(yàn)證的復(fù)相關(guān)系數(shù),為交互外部驗(yàn)證的復(fù)相關(guān)系數(shù),為模型外部預(yù)測能力的驗(yàn)證系數(shù),一致性相關(guān)系數(shù)(CCC)為模型調(diào)和系數(shù),RMSE為均方根誤差,n為樣本數(shù).方程中,回歸系數(shù)為正,表明此描述符與黏度值正相關(guān),反之,回歸系數(shù)為負(fù)則為負(fù)相關(guān),且系數(shù)越大,相關(guān)程度越高.由此得出,在此模型中,各描述符與黏度的相關(guān)性大小順序依次為:Hy、R5m、H1p、X3sol、G3u.根據(jù)各描述符回歸系數(shù)的正負(fù)號和大小可知,Hy越大,即分子中所含親水基團(tuán)越多,親水性越強(qiáng),則黏度越大;R5m越大,即分子量越大,則黏度也越大;H1p越大,即相鄰原子之間原子極化率越強(qiáng),則黏度也越大;X3sol越大,即分子中的溶解連接性指數(shù)越大,則黏度也越大;而G3u指的是分子的結(jié)構(gòu)對稱性,其前面的系數(shù)最小,相關(guān)性最低,說明它對黏度的影響最小.ACO-MLR模型對訓(xùn)練集和測試集的實(shí)驗(yàn)值和預(yù)測值的結(jié)果見表S2.
表1 基于ISODATA算法聚類分析對化合物的分類Table 1 Classification of compounds based on ISODATAclustering analysis
表2 類中心間的距離Table 2 Distances among cluster centroids
表3 分子描述符相關(guān)系數(shù)Table3 Correlation coefficients of molecular descriptors
表4 ACO-MLR和ACO-SVM模型的主要性能參數(shù)對比Table4 Performance parameter comparison between ACO-MLR andACO-SVM models
隨后,對測試集樣本的黏度進(jìn)行預(yù)測,以驗(yàn)證模型的外部預(yù)測能力.ACO-MLR模型所得的黏度預(yù)測值與實(shí)驗(yàn)值的相關(guān)系數(shù)為0.934,其預(yù)測值與實(shí)驗(yàn)值的比較見圖1.
隨后,為了進(jìn)一步對黏度與分子結(jié)構(gòu)間可能存在的非線性關(guān)系進(jìn)行研究,并獲得性能更優(yōu)的預(yù)測模型,本文以MLR模型所選擇的分子描述符作為輸入變量,以黏度自然對數(shù)值作為輸出變量,應(yīng)用非線性的支持向量機(jī)(SVM)方法建立新的QSPR模型.用SVM做預(yù)測時,相關(guān)參數(shù)(主要是懲罰參數(shù)C和核函數(shù)參數(shù)γ)的選擇是個難點(diǎn),參數(shù)選擇不好,將會嚴(yán)重影響預(yù)測的精度和準(zhǔn)確率.
圖1 ACO-MLR模型對測試集所得預(yù)測值與實(shí)驗(yàn)值的比較Fig.1 Comparison between the predicted and experimental values byACO-MLR for test set
為了得到適合的相關(guān)參數(shù),選擇了應(yīng)用最為廣泛的徑向基函數(shù)(RBF)作為核函數(shù),采用格點(diǎn)搜索(GS)的方法來選擇最佳的參數(shù)組合.懲罰系數(shù)C和RBF核函數(shù)的寬度γ的搜索范圍為[2-8,28],步長為1,并根據(jù)對訓(xùn)練集進(jìn)行“留一法”交互驗(yàn)證所得的來確定最佳的模型參數(shù).最終選擇的最優(yōu)參數(shù)為:懲罰系數(shù)C=64,核函數(shù)的寬度γ=1.4142,不敏感損失函數(shù)ε=0.1.ACO-MLR模型對訓(xùn)練集和測試集的實(shí)驗(yàn)值和預(yù)測值的結(jié)果見附表S2.所得的SVM模型的主要性能參數(shù)見表4,ACO-SVM模型所得的黏度預(yù)測值與實(shí)驗(yàn)值的相關(guān)系數(shù)為0.950,其預(yù)測值與實(shí)驗(yàn)值的比較見圖2.
從圖1和圖2中可以看出,ACO-MLR模型和ACO-SVM模型對測試集中57個樣本的預(yù)測值均與實(shí)驗(yàn)值有較好的一致性,預(yù)測精度令人滿意.比較模型中訓(xùn)練集和測試集的預(yù)測結(jié)果發(fā)現(xiàn),各子集的復(fù)相關(guān)系數(shù)均比較高,預(yù)測誤差較低,而且比較接近.一般認(rèn)為,若均大于0.6,CCC大于0.85,19,20則說明所建立的模型不但比較穩(wěn)定,而且具備較強(qiáng)的預(yù)測能力和泛化推廣性能.
充分評價一個模型的預(yù)測能力,針對測試集必須要滿足以下三個條件:21(1)復(fù)相關(guān)系數(shù)R2大于0.6;(2)為實(shí)驗(yàn)值與預(yù)測值的相關(guān)系數(shù)的平方;(3)通過原點(diǎn)的回歸線斜率k和k′在0.85和1.15之間.由表4可知,測試集的復(fù)相關(guān)系數(shù)R2均大于0.6.ACO-MLR模型中,測試集的0.8724,模型中,測試集的兩模型的值均遠(yuǎn)遠(yuǎn)小于0.1.通過擬合可得ACOMLR模型的k=0.9313,k′=0.9445,ACO-SVM模型的k=1.0646,k′=0.8513.計(jì)算結(jié)果表明,兩模型通過原點(diǎn)的回歸線斜率k和k'均在0.85和1.15之間.
圖2 ACO-SVM模型對測試集所得預(yù)測值與實(shí)驗(yàn)值的比較Fig.2 Comparison between the predicted and experimental value byACO-SVM for test set
式中,r2是實(shí)驗(yàn)值與預(yù)測值的回歸線斜率,為交換橫縱坐標(biāo)后實(shí)驗(yàn)值與預(yù)測值的回歸線斜率,其回歸線均需通過原點(diǎn).是實(shí)驗(yàn)值為縱坐標(biāo)時所計(jì)算的值,而是實(shí)驗(yàn)值為橫坐標(biāo)時所計(jì)算的值.計(jì)算式如式(5)所示:
隨后,本文對ACO-MLR模型和ACO-SVM模型的樣本集進(jìn)行了殘差分析,討論模型在建立過程中是否有系統(tǒng)誤差產(chǎn)生,兩個模型的殘差圖分別見圖3和圖4.由圖3和圖4可以看出,各模型的計(jì)算殘差均隨機(jī)分布于基準(zhǔn)線的兩側(cè),不存在明顯的規(guī)律性.由此可以推斷,兩個預(yù)測模型在建立過程中未產(chǎn)生系統(tǒng)誤差.
為檢驗(yàn)所建模型是否存在機(jī)會相關(guān),本文將“Y-隨機(jī)性檢驗(yàn)”方法針對ACO-MLR和ACO-SVM模型分別運(yùn)行50次.對于ACO-MLR模型所得最大R2為0.3360,ACO-SVM模型為0.7196,其結(jié)果均不如原始模型.由此可見,本文所建立的預(yù)測模型不存在“偶然相關(guān)”現(xiàn)象,具備較強(qiáng)的穩(wěn)定性.
用Williams圖表征模型的應(yīng)用域(AD).當(dāng)化合物的標(biāo)準(zhǔn)殘差落在(-3,+3)以外時,認(rèn)為其實(shí)驗(yàn)值為離群點(diǎn);當(dāng)化合物的臂比值(Hat(hi))大于警戒值(h*)時,認(rèn)為化合物顯著影響模型的回歸效果.27
圖3 ACO-MLR模型預(yù)測值殘差與黏度實(shí)驗(yàn)值lnη關(guān)系圖Fig.3 Plot of the residuals of prediction values versus the experimental lnη values forACO-MLR model
圖4 ACO-SVM模型預(yù)測值殘差與黏度實(shí)驗(yàn)值lnη關(guān)系圖Fig.4 Plot of the residuals of prediction values versus the experimental lnη values forACO-SVM model
由圖5和圖6可以看出,在ACO-MLR和ACOSVM模型中,測試集中沒有出現(xiàn)“異常值”物質(zhì).在訓(xùn)練集中,ACO-MLR模型和ACO-SVM模型分別有四個物質(zhì)和七個物質(zhì)的標(biāo)準(zhǔn)殘差落在了(-3,+3)以外.ACO-MLR模型中的四個物質(zhì)分別是叔丁醇、二丙酮醇、甲醇、1,4-丁二醇.ACO-SVM模型中的七個物質(zhì)分別是1,1,1-三氟乙烷、1-癸醇、1-壬醇、3-甲酚、1,4-丁二醇、1-辛醇、三溴甲烷.這些物質(zhì)的實(shí)驗(yàn)值可能出現(xiàn)了比較大的偏差,被稱為“異常值”.除此以外,兩模型中十氟丁烷、甘油、鄰苯二甲酸雙(2-乙基己基)酯)、鄰苯二甲酸二辛酯,這四個物質(zhì)的臂比值hi均超過了警戒值h*,可能有兩種原因造成.第一是這些分子的某些結(jié)構(gòu)特征并未被所篩選出的分子描述符很好表征;第二是這些分子的某些結(jié)構(gòu)對于整個樣本集來說比較特別.
十氟丁烷、甘油、鄰苯二甲酸二辛酯是訓(xùn)練集樣本中的,這些物質(zhì)影響變量篩選,進(jìn)而影響所建立模型的質(zhì)量.測試集中只有鄰苯二甲酸雙(2-乙基己基)酯的hi值超過了警戒值h*,說明模型對此化合物的預(yù)測結(jié)果可能是不可靠的,它的預(yù)測結(jié)果可以被認(rèn)為是由模型外推出來的.
圖5 ACO-MLR模型訓(xùn)練集和測試集的Williams圖Fig.5 Williams plot of theACO-MLR model for the train and test sets
圖6 ACO-SVM模型訓(xùn)練集和測試集的Williams圖Fig.6 Williams plot of theACO-SVM model for the train and test sets
運(yùn)用迭代自組織數(shù)據(jù)分析技術(shù)(ISODATA)對樣本集進(jìn)行初步分類,以避免模型中部分類別的缺失.隨后本文以蟻群算法(ACO)作為分子描述符篩選方法,分別與多元線性回歸(MLR)和支持向量機(jī)(SVM)進(jìn)行組合建立了蟻群-多元線性回歸模型(ACO-MLR)與蟻群-支持向量機(jī)模型(ACO-SVM),對310個有機(jī)化合物的黏度進(jìn)行了QSPR研究.其中,以ACO-SVM模型為最佳,揭示了有機(jī)化合物黏度與其分子結(jié)構(gòu)間可能有較強(qiáng)的非線性關(guān)系,也說明了將SVM用于研究QSPR的優(yōu)越性,它能有效地解決小樣本、非線性、過擬合、維數(shù)災(zāi)難和局部極小等問題,泛化推廣的性能也較強(qiáng).
本文所建立的2個黏度QSPR模型的預(yù)測值與實(shí)驗(yàn)值非常接近,其結(jié)果令人滿意,模型性能參數(shù)均在可接受范圍之內(nèi),所建模型穩(wěn)定且可用于預(yù)測黏度.本文的研究為預(yù)測有機(jī)化合物的黏度提供了一種新的有效的方法,對于化工安全設(shè)計(jì)和風(fēng)險評價研究具有重要的意義.
Supporting Information:Molecular descriptors after a preliminary screening have been included in Table S1 and experimental and predicted values of the compound viscosity by ACO-MLR and ACO-SVM have been included in Table S2.This information is available free of chargeviathe internet at http://www.whxb.pku.edu.cn.
(1) Shi,J.J.;Chen,L.P.;Chen,W.H.;Shi,N.;Yang,H.;Xu,W.Acta Phys.-Chim.Sin.2012,28,2790.[時靜潔,陳利平,陳網(wǎng)樺,石 寧,楊 惠,徐 偉.物理化學(xué)學(xué)報,2012,28,2790.]doi:10.3866/PKU.WHXB201209273
(2) Shi,J.J.;Chen,L.P.;Chen,W.H.J.Chemom.2013,27,251.
(3)Han,C.;Yu,G.R.;Wen,L.;Zhao,D.C.;Asumana,C.;Chen,X.C.Fluid Phase Equilib.2011,300,95.doi:10.1016/j.fluid.2010.10.021
(4)Zhang,Y.Comput.Appl.Chem.2013,30,195.[張 鶯.計(jì)算機(jī)與應(yīng)用化學(xué),2013,30,195.]
(5) Gharagheizi,F.Comput.Mater.Sci.2007,40,159.doi:10.1016/j.commatsci.2006.11.010
(6)Chen,B.K.;Liang,M.J.;Wu,T.Y.;Wang,H.P.Fluid Phase Equilib.2013,350,37.
(7) Gharagheizi,F.;Mirkhani,S.A.;Keshavarz,M.H.;Farahani,N.;Tumba,K.J.Taiwan Inst.Chem.E2013,44,359.doi:10.1016/j.jtice.2012.12.015
(8)Tochigi,K.;Yamamoto,H.J.Phys.Chem.C2007,111,15989.doi:10.1021/jp073839a
(9)Feng,Y.L.;Yi,S.Q.;Feng,Z.L.;Yu,Z.G.;Xu,S.H.Pet.Geol.Oilfield Dev.in Daqing2005,24,87.[馮亞麗,伊三泉,馮卓利,于志剛,許少華.大慶石油地質(zhì)與開發(fā),2005,24,87.]
(10) Wang,S.L.;Jiang,H.Q.Transp.Porous.Med.2011,86,483.doi:10.1007/s11242-010-9634-4
(11) Zhang,H.L.;Yang,C.Z.Electro.Warfare Technol.2010,25,34.[張洪亮,楊承志.電子信息對抗技術(shù),2010,25,34.]
(12) Ma,Y.;Tan,Z.H.;Chang,G.R.;Wang,X.Y.Procedia Eng.2011,15,2966.doi:10.1016/j.proeng.2011.08.558
(13)Yang,X.M.;Luo,Y.Mining Technol.2006,6,67.[楊小明,羅 云.采礦技術(shù),2006,6,67.]
(14) Ma,P.S.Data Manual for the Physical Property of Organic Compounds;Chemical Industry Press:Beijing,2006.[馬沛生.有機(jī)化合物實(shí)驗(yàn)物性數(shù)據(jù)手冊.北京:化學(xué)工業(yè)出版社,2006.]
(15) Li,S.Y.;Chen,Y.Q.;Li,Y.Ant Colony Algorithms with Application;Institute of Technology Press:Harbin,2004.[李士勇,陳永強(qiáng),李 妍.蟻群算法及其應(yīng)用.哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2004.]
(16) Li,Y.P.;Li,Y.L.Mining Res.Dev.2005,25,79.[李元萍,李元良.礦業(yè)研究與開發(fā),2005,25,79.]
(17) Todeschini,R.;Consonni,V.Handbook of Molecular Descriptors;Wileyt-VCH:Weinheim,2000.
(18)Zhang,Y.M.;Yang,X.S.;Sun,C.;Wang,L.S.Sci.China Chem.2011,41,893.[張一鳴,楊旭曙,孫 成,王連生.中國科學(xué):化學(xué),2011,41,893.]
(19) Chirico,N.;Gramatica,P.J.Chem.Inf.Model.2011,51,2320.doi:10.1021/ci200211n
(20) Chirico,N.;Gramatica P.J.Chem.Inf.Model.2012,52,2044.doi:10.1021/ci300084j
(21)Tropsha,A.;Gramatica,P.;Gombar,V.K.QSAR Comb.Sci.2003,22,69.
(22) Roy,K.;Matra,I.;Kar,S.;Ojha,P.K.;Das,R.N.;Kabir,H.J.Chem.Inf.Model.2011,52,396.
(23)Ojha,O.K.;Mitra,I.;Das,R.N.;Roy,K.Chemom.Intell.Lab.Syst.2011,107,194.doi:10.1016/j.chemolab.2011.03.011
(24) Roy,K.;Chakraborty,P.;Mitra,I.;Ojha,P.K.;Kar,S.;Das,R.N.J.Comput.Chem.2013,34,1071.doi:10.1002/jcc.23231
(25) Mitra,I.;Saha,A.;Roy,K.Mol.Simul.2010,36,1067.doi:10.1080/08927022.2010.503326
(26) Roy,P.P.;Paul,S.;Mitra,I.;Roy,K.Molecules2009,14,1660.doi:10.3390/molecules14051660
(27) Gu,Y.L.;Fei,Z.H.;Zhang,Y.Y.J.Anal.Sci.2012,28,333.[顧云蘭,費(fèi)正皓,張玉瑩.分析科學(xué)學(xué)報,2012,28,333.]doi:10.2116/analsci.28.333