仝建波, 吳英紀(jì), 白 敏
(陜西科技大學(xué) 化學(xué)與化工學(xué)院, 陜西 西安 710021)
?
HIV-1逆轉(zhuǎn)錄酶抑制劑的3D-QSAR和分子對接研究
仝建波, 吳英紀(jì), 白敏
(陜西科技大學(xué) 化學(xué)與化工學(xué)院, 陜西 西安710021)
摘要:采用分子對接和三維定量構(gòu)效關(guān)系研究了二芳基苯胺衍生物與HIV-1非核苷類逆轉(zhuǎn)錄酶的相互作用,并運用經(jīng)典的三維全息原子場作用矢量的方法(3D-HoVAIF)和多元線性回歸方法(MLR)研究了藥物分子的化學(xué)結(jié)構(gòu)與生物活性之間的關(guān)系.MLR建模得出的復(fù)相關(guān)系數(shù)(R(cum))為0.949、 留一法交互校驗復(fù)相關(guān)系數(shù)(Q(CV))為0.799,從該結(jié)果可以看出,三維定量構(gòu)效關(guān)系對化合物的抗艾滋病活性具有比較好的預(yù)測能力.最后,運用分子對接研究了小分子藥物和大分子HIV-1逆轉(zhuǎn)錄酶的氨基酸活性殘基之間的結(jié)合模式,對今后設(shè)計合成新的抗艾滋病藥物具有很好的指導(dǎo)作用.
關(guān)鍵詞:HIV-1逆轉(zhuǎn)錄酶; 三維定量構(gòu)效關(guān)系; 多元線性回歸; 分子對接
0引言
人類免疫缺陷病毒1型(HIV-1)是致病性的逆轉(zhuǎn)錄病毒,是艾滋病(獲得性免疫缺陷綜合征)的病原體[1],嚴(yán)重地威脅著人類的健康,至今為止依然沒有可以完全治愈的藥物.根據(jù)統(tǒng)計數(shù)據(jù)顯示,2011 年約有170萬人死于與艾滋病相關(guān)的疾病[2].
HIV-1是一種逆轉(zhuǎn)錄病毒,對于病毒復(fù)制,它會編碼一個逆轉(zhuǎn)錄酶(RT)[3].對于HIV-1感染患者來說,由于藥物具有合規(guī)性、負(fù)反應(yīng)性和交叉耐藥性,所以需要發(fā)展一種新的、強效的抗突變非核苷類逆轉(zhuǎn)錄酶抑制劑,這是一個具有高挑戰(zhàn)性的任務(wù)[4].目前,二芳基苯胺衍生物已經(jīng)引起了人們的高度重視,因為其與野生型的HIV-1逆轉(zhuǎn)錄酶菌株不同,具有較好的活性并且能夠高度識別有效化合物[5,6].
本實驗先采用三維全息原子場作用矢量法和多元線性回歸法研究了藥物的三維定量構(gòu)效關(guān)系,然后運用分子對接方法對二芳基苯胺衍生物與HIV-1非核苷類逆轉(zhuǎn)錄酶殘基之間的相互作用進行了分析研究,這為今后抗艾滋病藥物的研究和發(fā)展提供了有利的基礎(chǔ).
1材料與方法
1.1軟件與硬件
三維定量構(gòu)效關(guān)系及分子對接均在Window.8系統(tǒng)下完成.其中,三維全息法涉及的軟件有Chemdraw 12.0(用于畫圖)、Spss 12.0(用于逐步線性回歸篩選)、應(yīng)用二程序集(用于多元線性回歸建模),以及AutoDock 4.2[7](用于分子對接).
1.2數(shù)據(jù)集
本實驗采用24種二苯胺衍生物作為HIV-1逆轉(zhuǎn)錄酶抑制劑,實驗活性值pEC50取自文獻[8]中,其化合物的公共結(jié)構(gòu)如圖1所示、結(jié)構(gòu)和活性數(shù)據(jù)如表1所示.
表1 二芳基苯胺衍生物的結(jié)構(gòu)及EC50活性值
續(xù)表1
No.R1R2R3R4EC50/(μM)mn5CNNO2BrNO20.1726.766.526CNNO2HNO20.5456.266.017CNNO2CNNO24.1905.385.768CNNO2MeNO20.2806.556.579cCNNO2CHONO21.5305.826.0810CNHBrNO20.3176.506.5911CNHHNO23.1475.506.0112cCNHCNNO20.2086.686.3213CNHMeNO20.0677.176.7114CNHCHONO22.1905.665.5515CNHBrNH20.0477.337.5516CNHCNNH20.0707.166.7317CNHMeNH20.0737.147.4518CNNH2BrNH20.1616.796.7619CNNH2HNH23.2265.495.5520cCNNH2CNNH20.0307.527.3221cCNNH2MeNH20.0707.166.7822CNNO2BrNH20.0167.807.7623cCNNO2CNNH20.0038.526.8924CNNO2MeNH20.0627.217.19
注:m為實驗活性值( Exp.(pEC50) );n為預(yù)測活性值((Pred.pEC50);c為測試集.
圖1 二芳基苯胺衍生物的公共結(jié)構(gòu)
1.3三維定量構(gòu)效關(guān)系
三維全息原子場作用矢量(3D Holographic Vector of Atomic Interaction Field, 3D-HoVAIF)是一種描述三維分子結(jié)構(gòu)的方法,已用于多種藥物體系中[9].它將有機分子中常見的原子(氫、碳、氮、磷、氧、硫、氟、氯、溴和碘等)按其所處元素周期表的位置分為五類.并根據(jù)原子的雜化狀態(tài),這些原子又被分為十類.因此,在一個分子中就有55種相互作用.再基于以前的靜電、立體和疏水性作用,一個有機化合物就會產(chǎn)生3×55=165種相互作用.
采用經(jīng)典的庫侖定理( Coulomb )(1)表示其靜電相互作用(Electro Static Interaction);采用 Lennard-Jones方程(2)來表征立體作用 (Steric Interaction);采用Kellogg等提出的hint 方法(3)來定義計算兩原子間的疏水作用(Hydrophobic Interraction).
(1≤m≤10, m≤n≤10)
(1)
在方程(1)中:rij是原子間Euclid 距離,單位nm;e是單位電荷電量1.602 189×10-19C;ε0為真空中的介電常數(shù)8.854 187 82×10-12C2/J·m;Z為原子凈電荷數(shù), 以電子為單位;m和n為原子所屬種類.
(1≤m≤10, m≤n≤10)
(2)
在方程(2)中:εij為原子對勢能,取文獻值[10,11];D為經(jīng)驗推導(dǎo)的原子間作用能校正常數(shù), 取0.01;Rij*=(Ch·Rii*+Ch·Rjj*)/2為校正后的原子對Vander Waals半徑;校正因子Ch當(dāng)sp3雜化時取1.00;sp2雜化時取0.95;sp雜化取0.90[12].
(1≤m≤10, m≤n≤10)
(3)
在方程(3)中:T是作用形式的二值判別函數(shù),以表明不同類型原子疏水作用的熵效應(yīng)變化方向;S為原子溶劑可及表面積(Solvent Accessible Surface Area of Atom,SASA),是以水分子(范德瓦爾斯半徑為0.14 nm)為探針在原子表面滾動其球心形成的表面面積[13];a為原子疏水性常數(shù),取文獻值[14].
在3D-QSAR研究中,24個二芳基苯胺衍生物根據(jù)活性范圍的高低被隨機地分為18個訓(xùn)練集樣本和6個測試樣本.其中,訓(xùn)練集用于多元線性回歸建模,測試集用于外部模型的有效驗證.化合物的實驗活性值和預(yù)測活性值如表1所示.
1.4分子對接方法
分子對接法是基于生物受體三維結(jié)構(gòu)的一種藥物設(shè)計方法,將小分子藥物放置于受體的活性位點處,并尋找合理的取向和構(gòu)象使得配體與受體的形狀和相互作用達到最佳匹配構(gòu)象.配體和受體的結(jié)合程度由結(jié)合過程中自由能的變化來決定.
分子對接采用AutoDock4.2軟件,通過AutoGrid程序來測定活性位點,并運用拉馬克遺傳算法(LGA)進行優(yōu)化.在這個算法中,先利用遺傳算法進行全局搜索,然后采用局部搜索法進行能量優(yōu)化.
利用半經(jīng)驗自由能的計算方法來評價配體與受體間的能量匹配,每一個化合物會產(chǎn)生10個對接構(gòu)象,根據(jù)各構(gòu)象的結(jié)合模式和結(jié)合自由能選擇合適的構(gòu)象來進行研究.其余計算參數(shù)采用應(yīng)用程序的默認(rèn)值.采用式(4)的函數(shù)形式計算[15].
(4)
在方程(4)中:ΔGvdw、ΔGH-bond、ΔGele、ΔGtor和ΔGsol都是半經(jīng)驗參數(shù),可用擬合得到;Ntor指配體在對接后被約束的可旋轉(zhuǎn)鍵的數(shù)目.
本研究選用24個二芳基苯胺衍生物中實驗活性值最高的22號藥物分子進行分子對接.HIV-1非核苷類逆轉(zhuǎn)錄酶受體的3D共晶結(jié)構(gòu)取自生物信息學(xué)研究合作實驗室(Research Collaboratory for Structural Bioinformatics,RCSB)的蛋白質(zhì)數(shù)據(jù)庫[16],它的PDB ID 為1S6Q,分辨度為3.0 ?.
在進行分子對接之前,先對配體小分子和HIV-1非核苷類逆轉(zhuǎn)錄酶受體分別進行優(yōu)化處理(這些優(yōu)化操作均在Chemdraw 12.0 中完成),包括刪除受體中原有的配體、合并其中非極性氫原子、加電荷(Gasteiger )、去水,再對小分子進行加氫、去水、加電荷(Gasteiger)操作.實驗中盒子的格點設(shè)為40×40×40,格點距離為0.037 5 nm,中心坐標(biāo)為(147.889,-24.383,73.213),其它參數(shù)均采用程序默認(rèn)數(shù)值.
2結(jié)果與討論
2.1模型分析
運用三維全息得到165個變量,再使用逐步線性回歸(Stepwise Multiple Regression,SMR)篩選得到17個非零變量.根據(jù)變量不超過樣本數(shù)1/3的經(jīng)驗規(guī)則,從變量數(shù)為6開始計算.逐步回歸按Fisher顯著性檢驗依次引入變量,隨變量的不同,每一步建模都會得到相應(yīng)的復(fù)相關(guān)系數(shù)(Rcum)、標(biāo)準(zhǔn)偏差(SD)、交互校驗復(fù)相關(guān)系數(shù)(QCV)和標(biāo)準(zhǔn)偏差(SDCV).當(dāng)模型的Rcum≥0.6、QCV≥0.5時,認(rèn)為此模型可行.最后,得出自變量數(shù)為6時結(jié)果最佳,其結(jié)果如下:
pEC50=6.660-130.531×S1-9+0.010×H5-8-75.182×E7-10+0.000×H2-2-33.024×E2-2-93.059×E5-10
N=18,Rcum=0.949,SD=0.322,F(xiàn)=16.726,
QCV=0.799,SDCV=0.460,F(xiàn)CV=7.285
其中,N為訓(xùn)練集樣本數(shù),Rcum為復(fù)相關(guān)系數(shù),SD為標(biāo)準(zhǔn)偏差,F(xiàn)為F檢驗值,QCV、SDCV、FCV為交互校驗的復(fù)相關(guān)系數(shù)、標(biāo)準(zhǔn)偏差、F檢驗值.
在模型中,S1-9指H原子與SP2雜化的O原子之間的立體作用,H5-8指SP3雜化的N原子與SP3雜化的O原子之間的疏水作用,E7-10指SP雜化的N原子與Br原子之間的靜電作用,H2-2和E2-2分別指SP3雜化的C原子之間的疏水作用和靜電作用,E5-10指SP3雜化的N原子與Br原子之間的靜電作用.
運用多元線性回歸模型來預(yù)測樣本的活性值,并將得出的預(yù)測值與實驗值做圖,如圖2所示.從圖2可以看出,此藥物模型的實驗活性值與預(yù)測活性值為線性趨勢,所有模型都在45 °線周圍.模型中內(nèi)部訓(xùn)練集的Rcum為0.949、QCV為0.799,外部測試集的Qext為0.736,從而可以總結(jié)出實驗所構(gòu)建的3D-QSAR模型具有良好的穩(wěn)定性,而且此模型對同系列化合物的活性值均有好的預(yù)測能力.因為所參考文獻[8]中的22號分子結(jié)構(gòu)與其它分子相比,差異較大、不飽和鍵較多,所以明顯偏離了45 °線,而且有些藥物在實驗測試條件下難以得出較理想的結(jié)果.但從圖的基本趨勢來看,此模型的預(yù)測能力還是比較可靠.
圖2 二芳基苯胺衍生物的實驗值與預(yù)測值散點圖
2.2分子對接研究
實驗隨機選取了結(jié)構(gòu)差異較大并且活性值相對較高的六個化合物(2、5、15、20、22、23)分別進行了分子對接,并將對接結(jié)果列于表2中,其預(yù)測的結(jié)合自由能(ΔG)與實驗活性值的關(guān)系如圖3所示.
從圖3可以觀察到,這幾個點均在擬合線附近,這些化合物結(jié)合能呈逐漸降低的趨勢,而其實驗活性值呈逐漸增大的趨勢,這說明化合物的預(yù)測結(jié)合自由能(ΔG)與實驗活性值(pEC50)呈現(xiàn)較好的單調(diào)性,這與理論上這些化合物的活性值應(yīng)該相對比較高的觀點剛好吻合,表明了分子對接計算結(jié)果具有一定的可靠性.
圖3 部分化合物實驗值與對接預(yù)測結(jié)合能的關(guān)系圖
S.NoCompΔGpEC5012-7.525.5225-7.766.76315-8.047.33420-8.467.52522-11.27.8623-8.528.52
化合物中活性最高的22號二芳基苯胺衍生物與HIV-1逆轉(zhuǎn)錄酶殘基的對接模型見圖4所示.此構(gòu)象是化合物分子與 HIV-1逆轉(zhuǎn)錄酶對接后10個構(gòu)象中結(jié)合自由能最低的構(gòu)象,其結(jié)合能是-11.4 kcal/mol,故也是結(jié)合比較穩(wěn)定的模式.從圖4可見,22號化合物與HIV-1逆轉(zhuǎn)錄酶活性部位氨基酸殘基形成了兩個氫鍵,其一是-NH中的SP3雜化H原子與LYS101的-OH基原子之間形成一個-NH…OH氫鍵,距離為2.0 nm;其二是-NH2中的SP3雜化H原子與LYS101的-OH基原子之間形成一個-NH2…OH氫鍵,距離為1.8 nm.
圖4 22號二芳基苯胺衍生物與HIV-1逆轉(zhuǎn)錄酶的對接圖
從對接后的結(jié)果可以看出,在配體與受體結(jié)合的過程中,氫鍵可以決定和影響配體在活性空腔中的位置[17].當(dāng)小分子在大分子的活性位點上與大分子結(jié)合時,小分子的活性部位與大分子活性部位中極性氨基酸殘基形成氫鍵,而小分子的疏水部分能夠與大分子活性部位中非極性氨基酸殘基產(chǎn)生疏水作用[18]. 藥物分子和生物大分子間比較常見的一種分子間作用力就是氫鍵,它能夠增加化合物的活性.二芳基苯胺衍生物苯基上的推電子基能提供孤對電子,它與LYS101氨基酸上的羥基分別形成-NH…OH和-H…OH 兩個氫鍵.
3結(jié)論
二芳基苯胺衍生物是一種具有良好外部預(yù)測能力和穩(wěn)定性的強效抗HIV藥物.本實驗通過三維定量構(gòu)效關(guān)系研究了藥物結(jié)構(gòu)和活性之間的關(guān)系,并采用分子對接分析了二芳基苯胺衍生物與HIV-1逆轉(zhuǎn)錄酶之間的相互作用.對接結(jié)果表明小分子與大分子的氨基酸殘基LYS101可以形成氫鍵.這些研究結(jié)果可以引導(dǎo)人們從多種角度設(shè)計合成有效的抗艾滋病藥物.
參考文獻
[1] Fatemi M H,Heidari A,Gharaghani S.QSAR prediction of HIV-1 protease inhibitory activities using docking derive d molecular descriptors[J].J Theor Biol,2015,369:13-22.
[2] International C.Global report:UNAIDS report on the global AIDS epidemic 2013[R].Geneva:UNAIDS,2013.
[3] Corbett J W,Ko S S,Rodgers J D,et al.Inhibition of clinically relevant mutant variants of HIV-1 by quinazolinone non-nucleoside reverse transcriptase inhibitors[J].J Med Chem,2000,43(10):193-195.
[4] Liang Y H,He Q Q,Zeng Z S,et al.Hybrid diarylbenzopyrimidine non-nucleoside reverse transcriptase inhibitors as promising new leads for improved anti-HIV-1 chemotherapy[J].Bioorg Med Chem,2010,18(13):4 601-4 605.
[5] Zeng Z S,He Q Q,Liang Y H,et al.Hybrid diarylbenzopyrimidine non-nucleoside reverse transcriptase inhibitors as promising new leads for improved anti-HIV-1 chemotherapy[J].Bioorg Med Chem,2010,18(14):5 039-5 047.
[6] Qin X,Jiang H,Lu X,et al.Diarylaniline derivatives as a distinct class of HIV-1 non-nucleoside reverse transcriptase inhibitors[J].J Med Chem,2010,53(13):4 906-4 916.
[7] Morris G M,Goodsell D S,Halliday R S,et al.Automated docking using a lamarckian genetic algorithm and an empirical binding free energy function[J].Comput. Chem,1998,19(14):1 639-1 662.
[8] Bhadoriya K S,Sharma M C,Jain S V,et al.2,4-dihydropyrano[2,3-c] pyrazole:Discovery of new lead as through pharmacophore modeling,atom-based 3D-QSAR,virtual screening and docking strategies for improved anti-HIV-1 chemotherapy[J].Journal of Taibah University for Science,2015,44(4):521-530.
[9] Damme S V,Bultinck P.3D-QSAR based on conceptual DFT molecular fields:Antituberculotic activity[J].Journal of Molecular Structure:Theochem,2010,943(1):83-89.
[10] Levitt M.Protein folding by restrained energy minimization and molecular dynamics[J].J.Mol.Biol,1983,170(3):723-764.
[11] Levitt M,Perutz M F.Aromatic rings act as hydrogen bond acceptors[J].J.Mol.Biol,1988,201(4):751-754.
[12] Hahn M.Receptor surface models.1.definition and construction[J].J.Med.Chem,1995,38(12):2 080-2 090.
[13] Hasel W,Hendrikson T F,Still W C.A rapid approximation to the solvent accessible surface areas of atoms[J].Tetrahed.Comp.Method,1988,1(2):103-116.
[14] Pei J,Wang Q,Zhou J,et al.Estimating protein-ligand binding free energy:Atomic solvation parameters for partition coefficient and solvation free energy calculation[J].J.Proteins:Struct.Funct.Genet,2004,57(40):651-664.
[15] Huey R,Morris G M,Olson A J.Software news and update a semiempirical free energy force field with charge-based desolvation[J].J Comput Chem,2007,28(6):1 145-1 152.
[16] Das K.,Clark A D.,Lewi P J.,et al.Roles of conformational and positional adaptability in structure-based design of TMC125-R165335 (Etravirine) and related non-nucleoside reverse transcriptase Inhibitors that are highly potent and effective against wild-type and drug-resistant HIV-1 variants[J].J.Med.Chem,2004,47:2 550-2 560.
[17] 李月婷,劉永瀾,史博智,等.分子對接技術(shù)用于馬來酰亞胺類GSK-3α抑制劑的作用特征分析[J].分子科學(xué)學(xué)報,2013,29(4):265-275.
[18] 孫苗,李澤生,鄭清川,等.細(xì)胞色素P450 2f1(CYP2f1)的三維結(jié)構(gòu)模建和與維甲酸的對接研究[J].分子科學(xué)學(xué)報,2005,21(2):6-10.
【責(zé)任編輯:晏如松】
Study on 3D-QSAR and molecular docking of HIV-1 reverse transcriptase inhibitors
TONG Jian-Bo, WU Ying-ji, BAI Min
(College of Chemistry and Chemical Engineering, Shaanxi University of Science & Technology, Xi′an 710021, China)
Abstract:In this study, using molecular docking and three-dimensional quantitative structure-activity relationship as a method to study the interaction between a series of diaryl aniline analogues and HIV-1 non nucleoside reverse transcriptase,through the establishment of three-dimensional quantitative structure-activity relationship model and multiple linear regression (MLR) model study the relationship between structure and biological activity of the drug moleculesl.The correlation coefficient (R(cum)) of MLR is 0.949,the correlation coefficient (Q(CV)) is 0.799,the results show that the three-dimensional quantitative structure-activity relationship has good prediction ability for the anti HIV activity of the compound.The binding model of small molecule drugs and macromolecular HIV-1 reverse transcriptase active amino acid residues was studied by molecular docking.It is a good guide for the design and synthesis of new anti AIDS drugs.
Key words:HIV-1 reverse transcriptase; three-dimensional quantitative structure-activity relationship; multiple linear regression; molecular docking
中圖分類號:O6-04
文獻標(biāo)志碼:A
文章編號:1000-5811(2016)02-0134-05
作者簡介:仝建波(1975-),男 ,山西懷仁人,副教授,博士,研究方向:計算機輔助藥物設(shè)計、相關(guān)化學(xué)信息與計量學(xué)
基金項目:國家自然科學(xué)基金項目 (21475081)
收稿日期:2015-11-14