国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

有機污染物結構與生物活性關系研究*

2017-10-18 09:13:44廖立敏李建鳳雷光東
環(huán)境污染與防治 2017年6期
關鍵詞:分子結構氫原子描述符

廖立敏 李建鳳 雷光東

(內江師范學院化學化工學院,四川 內江 641100)

有機污染物結構與生物活性關系研究*

廖立敏 李建鳳 雷光東#

(內江師范學院化學化工學院,四川 內江 641100)

將有機污染物分子中的非氫原子分為4類,將不同非氫原子及非氫原子之間的關系作為分子結構描述符,對49種有機污染物分子結構進行了參數(shù)化表達。采用逐步回歸(SMR)與偏最小二乘回歸(PLS)方法構建了有機污染物結構與生物活性之間的關系模型,模型的相關系數(shù)(R2)為0.869,“留一法”交互檢驗相關系數(shù)(Q2)為0.821,可見模型穩(wěn)定性好、預測能力強,非偶然因素所致。

有機污染物 生物活性 結構描述符

有機化合物用途廣泛,在工農業(yè)生產過程中可作為原料、溶劑、添加劑等。有機化合物進入環(huán)境中,很大一部分就成了有機污染物,直接或間接危害動植物生長、發(fā)育、繁殖,甚至威脅人類健康和生命。因而,研究有機污染物結構與生物活性的關系具有重要意義。QSAR/QSPR是研究有機污染物與生物活性的重要方法,可以用于研究有機污染物的毒性[1]15-17,[2]1139-1144、生物富集因子[3-4]、溶解性[5-6]、辛醇/水分配系數(shù)[7-8]等。有機污染物分子結構的參數(shù)化表達是QSAR/QSPR的關鍵步驟之一。比較分子場法(CoMFA)[9-10]和自組織分子場法(SoMFA)[11]是目前應用比較廣泛的分子結構參數(shù)化表達方法。這兩種方法的弊端是處理步驟繁瑣、工作量大。因此,簡易、方便的分子結構參數(shù)化表達方法有待建立。本研究將有機污染物分子中的非氫原子進行染色,構建不同類型非氫原子和非氫原子之間關系的結構描述符,用于有機污染物分子結構參數(shù)化表達。構建的分子結構描述符不需要考慮分子構象優(yōu)化等問題,簡單易懂、計算方便、工作量小。采用逐步回歸(SMR)和偏最小二乘回歸(PLS)相結合的方法建立了有機污染物結構與生物活性的關系模型,模型經檢驗具有良好的穩(wěn)定性和預測能力。

1 材料與方法

1.1 實驗材料

選擇的有機污染物包括烷烴、芳烴、烯烴、醇、酚、醚、酮、酯及相應衍生物等多類化合物,具有不同的分子結構,共49種。有機污染物的生物活性以其對蝌蚪的麻醉活性(lg(1/c))表征,其中c為有機污染物對蝌蚪的麻醉質量濃度[12],μg/L。49種有機污染物及其lg(1/c)列于表1中。

1.2 實驗方法

1.2.1 有機污染物分子結構表征

有機污染物中的非氫原子及非氫原子之間的關系對化合物性質產生重要影響,而氫原子僅影響與其直接相連的非氫原子。因此,本研究首先將非氫原子分為4類[13-14],與b個其他非氫原子直接相連的非氫原子規(guī)定為第b類非氫原子,b可取1、2、3、4。然后,采用堵錫華[1]15提出的方法對非氫原子進行參數(shù)化染色,計算公式見式(1)。

表1 49種有機污染物及其lg(1/c)

(1)

式中:Zb,i為第b類非氫原子i的染色值;mi為i的最外層電子數(shù);ni為i的主量子數(shù);mC為碳原子的最外層電子數(shù);hi為與i直接連接的氫原子數(shù);XC為碳原子的Pauling電負性;Xi為i的Pauling電負性。

4類非氫原子單獨對有機污染物生物活性的影響(即結構描述符)為各類非氫原子染色值之和(見式(2))。

(2)

式中:xk為第k類結構描述符;Zb為第b類非氫原子的染色值之和。

非氫原子之間的關系對有機污染物生物活性的影響(即結構描述符)為不同類型非氫原子之間的關系(見式(3))。由于3個及3個以上的非氫原子之間的關系過于復雜,這里暫不考慮。

(3)

式中:Db1,b2為第b1類非氫原子與第b2類非氫原子之間的關系;ri,j是非氫原子i和j之間的相對距離(即i和j之間的鍵長之和與碳碳單鍵鍵長的比值,如果i、j之間有多條路徑,以最短路徑為準)。

1.2.2 建模與評價

采用SMR篩選結構描述符,PLS建模。PLS特別適合于在變量數(shù)較多而樣本數(shù)較少的情況下進行建模[15]。本研究以SMR篩選得到的結構描述符為X向量,以有機污染物對蝌蚪的麻醉活性為Y向量進行建模。用模型相關系數(shù)(R2)、“留一法”交互檢驗相關系數(shù)(Q2)及標準偏差(SD)對模型進行評價。一般認為,R2為0.64~1.00,Q2≥0.50,SD與lg(1/c)極差(最大值與最小值之差)之比在10%以內,表明模型具有良好的預測能力和穩(wěn)定性[2]1139。

2 結果與討論

將有機污染物結構進行參數(shù)化表征得到的結構描述符采用SMR進行變量篩選,以篩選得到的變量為X向量,以lg(1/c)為Y向量,運用PLS建立有機污染物結構與生物活性的關系模型,通過偏F檢驗依次篩選變量,共挑選出11個變量進行建模比較,入選變量及相應的PLS 結果見表2。

一個好的預測模型不但要對內部樣本具有較好的擬合能力,而且還應該對外部樣本具有較強的預測能力。因此,在選擇模型時,在保證對內部樣本具有良好擬合效果(R2較大)的情況下,盡量選擇Q2較大的模型。由表2可以看出,SMR步驟6篩選的變量建模所得模型最佳R2和最佳Q2同時達到最大值,因此回歸步驟6篩選的變量所建模型最好,其結構描述符列于表3中。

表2 SMR及PLS結果

表3 模型所選結構描述符及l(fā)g(1/c)

表3 模型所選結構描述符及l(fā)g(1/c)(續(xù))

圖1為SMR步驟6進行PLS建模過程中R2和Q2隨主成分數(shù)的變化情況。當主成分數(shù)為4時,R2為0.869,處于0.64~1.00,Q2達到最大值(0.821),符合Q2≥0.50。模型SD為0.366,而49種有機污染物的lg(1/c)最大值和最小值分別為4.26、0.24,由此可得SD與lg(1/c)極差之比為9.10%,小于10%。因此,SMR步驟6進行PLS建模過程中,當主成分數(shù)為4時,模型穩(wěn)定性好、預測能力強,建模效果達到最好,此時有機污染物與生物活性的關系可表達為式(4)。

lg(1/c)=-0.940+0.091x1+0.184x2+0.064x5+0.002x7-0.027x8+0.096x12

(4)

圖1 SMR步驟6進行PLS建模過程中R2和Q2隨主成分數(shù)的變化情況Fig.1 R2 and Q2 changes with the principal components in PLS regression during Step 6 of SMR

為了分析X向量與Y向量的相關性,分別提取X和Y的第1主成分t1、u1,得到t1-u1圖,如圖2所示。從圖2可以發(fā)現(xiàn),t1與u1具有一定的線性相關性,相關系數(shù)達到0.659,說明X向量的第1主成分就可以很好地解釋有機污染物對蝌蚪麻醉活性的影響。由圖2還可以發(fā)現(xiàn),t1、u1得分越高相應的lg(1/c)大體也越高。

圖2 t1-u1圖Fig.2 The t1-u1 plot

為考察模型的可信度,對模型的X向量規(guī)格化模型距離進行分析,結果見圖3。以95%的置信區(qū)間進行評價,只有叔丁醇和叔戊醇的規(guī)格化模型距離超過了臨界值(2.077),說明模型擬合的可信度高。分析49種有機污染物的結構發(fā)現(xiàn),只有叔丁醇和叔戊醇含有叔丁基,可能是結構描述符對叔丁基的表征誤差較大所致。

模型建立后又進行了20次Y向量隨機排序驗證,以進一步考察模型效果的偶然性。以Y原始向量和重新隨機排序后的Y向量的相關系數(shù)對模型的R2和Q2作圖(見圖4)。根據(jù)ANDERSSON等[16]提出的判斷標準,R2和Q2的截距應分別小于0.300、0.050。從圖4可以看到,本研究所建模型R2和Q2的截距分別為0.017、-0.485,可以認為模型的擬合結果并非偶然因素所致。

圖5為t1和X向量第2主成分(t2)的載荷圖。

圖3 X向量規(guī)格化模型距離分析Fig.3 Analysis of normalized distance to model in X vector

圖4 Y向量隨機排序驗證結果Fig.4 The verification result of Y vector random permutations

圖5 X向量t1和t2的載荷圖Fig.5 Loadings of t1 and t2 for X vector

若主成分的載荷為正,說明該主成分與Y向量正相關;若主成分的載荷為負,說明該主成分與Y向量負相關;載荷絕對值越大,相關性越高。x1、x2、x8、x12位于載荷圖的第一象限,說明這兩個主成分均與Y向量呈正相關。x5、x7位于第二象限,說明其第1主成分與Y向量呈負相關,第2主成分與Y向量呈正相關。x1、x7與第2主成分的相關性較大;x2、x8、x12與第1主成分的相關性較大。

圖6為PLS模型預測值與實測值的相關性。由圖6可見,絕大部分樣本點都分布在過原點的平分線附近,說明模型對有機污染物的lg(1/c)預測準確性高、誤差小,效果良好。

注:圖中實線為平分線。圖6 實測值與預測值相關性Fig.6 Relationship between calculated values and experimental values

3 結 論

將有機污染物分子結構用結構描述符表征,建立其與蝌蚪麻醉活性(lg(1/c))的相關關系,可以很好地預測有機污染物對生物活性的影響。采用SMR篩選變量,PLS建模,得到x2、x1、x12、x7、x5、x8作為變量時,模型效果最佳,最佳主成分數(shù)為4,穩(wěn)定性好、預測能力強,非偶然因素所致。

[1] 堵錫華.酯類化合物對四膜蟲毒性的拓撲研究[J].環(huán)境污染與防治,2005,27(1).

[2] 顧云蘭,陳鑫,簡美玲.苯胺類化合物結構與毒性的密度泛函理論研究[J].化學研究與應用,2015,27(8).

[3] 孫露,陳英杰,吳曾睿,等.有機化合物生物富集因子的計算機預測研究[J].生態(tài)毒理學報,2015,10(2):173-182.

[4] 馮惠,李鳴建.部分多氯聯(lián)苯生物富集因子的QSAR研究[J].環(huán)境科學與技術,2013,36(11):49-53.

[5] 劉天寶,彭艷芬,嚴永新,等.取代苯甲醛類化合物的分子結構與溶解度的定量關系[J].武漢大學學報(理學版),2012,58(1):40-44.

[6] 廖立敏,朱俊,李建鳳,等.芳烴類污染物結構與水溶性(-lgSw)關系研究[J].華中師范大學學報(自然科學版),2010,44(4):610-613.

[7] 王甫洋,張學勝,劉輝.鹵代苯化合物水溶解度及正辛醇/水分配系數(shù)的三維構效關系研究[J].環(huán)境科學學報,2015,35(4):1032-1039.

[8] 廖立敏.鹵代苯甲醚結構表征及醇/水分配系數(shù)模擬[J].計算機與應用化學,2015,32(7):889-892.

[9] GUARIENTO S,BRUNO O,FOSSA P,et al.New insights into PDE4B inhibitor selectivity:CoMFA analyses and molecular docking studies[J].Molecular Diversity,2016,20(1):77-92.

[10] BALASUBRAMANIAN P K,BALUPURI A,CHO S J.3D-QSAR studies on disubstituted dibenzosuberone derivatives as p38α MAP kinase inhibitors using CoMFA and CoMSIA[J].Medicinal Chemistry Research,2016,25(10):2349-2359.

[11] VERMA S K,THAREJA S.Formylchromone derivatives as novel and selective PTP-1B inhibitors:a drug design aspect using molecular docking-based self-organizing molecular field analysis[J].Medicinal Chemistry Research,2016,25(7):1433-1467.

[12] 王連生,支正良.分子連接性與分子結構—活性[M].北京:中國環(huán)境科學出版社,1992.

[13] 廖立敏.醛酮化合物結構與保留指數(shù)關系的研究[J].化學研究與應用,2015,27(5):617-623.

[14] 李建鳳,謝永紅,雷光東.部分聚合物結構與熱容變化關系研究[J].計算機與應用化學,2016,33(7):833-837.

[15] 梅虎,周原,孫立力,等.氨基酸結構描述子矢量VHSE及其在肽QSAR中的應用[J].化學通報,2005,68(7):534-540.

[16] ANDERSSON P M,SJ?STROM M,LUNDSTEDT T.Preprocessing peptide sequences for multivariate sequence - property analysis[J].Chemometrics and Intelligent Laboratory Systems,1998,42(1):41-50.

Studyonrelationshipbetweenstructureoforganicpollutantsandbiologicalactivity

LIAOLimin,LIJianfeng,LEIGuangdong.

(CollegeofChemistryandChemicalEngineering,NeijiangNormalUniversity,NeijiangSichuan641100)

The organic molecule’s non-hydrogen atoms were grouped into 4 categories. Different non-hydrogen atoms and their relationships were used as structural descriptors. 49 organic pollutants were parameterized. The stepwise regression (SMR) and partial least squares regression (PLS) methods were employed to build the relationship model between the structure of organic pollutants and biological activity. Results showed that the model correlation coefficient (R2) was 0.869 and the “l(fā)eave one out” cross validation correlation coefficient (Q2) was 0.821,indicating that the model was stable,predictive and not by chance.

organic pollutants; biological activity; structural descriptor

廖立敏,男,1981年生,碩士,副教授,主要從事分子結構與生物活性關系的研究。#

。

*四川省教育廳青年基金資助項目(No.13ZB0003);四川省科技廳應用基礎項目(No.2015JY0077)。

10.15985/j.cnki.1001-3865.2017.06.015

2016-09-08)

猜你喜歡
分子結構氫原子描述符
把握分子結構理解物質的性質
中學化學(2024年5期)2024-07-08 09:24:57
基于結構信息的異源遙感圖像局部特征描述符研究
測繪學報(2022年12期)2022-02-13 09:13:01
一維模型氫原子在啁啾激光場中的閾上電離
三步法確定有機物的分子結構
Linux單線程并發(fā)服務器探索
關于氫原子躍遷問題的難點突破
利用CNN的無人機遙感影像特征描述符學習
解讀分子結構考點
中學化學(2016年10期)2017-01-07 08:37:06
外電場中BiH分子結構的研究
對氫原子能量吸收的再認識お
新邵县| 台中市| 廊坊市| 韩城市| 垣曲县| 逊克县| 莱芜市| 霸州市| 桃源县| 繁峙县| 天等县| 志丹县| 互助| 吉安县| 会理县| 凤城市| 大庆市| 穆棱市| 浦东新区| 连城县| 临邑县| 项城市| 蓬溪县| 乌海市| 阿鲁科尔沁旗| 托里县| 牟定县| 宿松县| 伊吾县| 平顶山市| 沂源县| 望江县| 甘谷县| 南澳县| 汉中市| 新巴尔虎左旗| 璧山县| 白水县| 广灵县| 景谷| 乌恰县|