仝建波, 白 敏, 趙 翔, 常 佳
(陜西科技大學(xué)化學(xué)與化工學(xué)院,陜西科技大學(xué)教育部輕化工助劑化學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,陜西西安 710021)
艾滋病(Acquired Immunodeficiency Syndrome,AIDS)是由人類免疫缺陷病毒(Human Immunodeficiency Virus,HIV)感染引起的全身性傳染病[1]。HIV可分為Ⅰ型(HIV-1)和Ⅱ型(HIV-2)[2,3],二者之間存在一定的免疫交叉反應(yīng)。艾滋病絕大多數(shù)由HIV-1引起。逆轉(zhuǎn)錄酶(Reverse Transcriptase,RT)在HIV-1的復(fù)制循環(huán)中起著關(guān)鍵性的作用,因此,HIV-1逆轉(zhuǎn)錄酶是抗HIV/AIDS藥物發(fā)展中的一個(gè)重要生物靶點(diǎn)[4]。針對(duì)HIV-1逆轉(zhuǎn)錄酶的藥物分為核苷類逆轉(zhuǎn)錄酶抑制劑(Nucleoside Reverse Transcriptase Inhibitors,NRTIs)和非核苷類逆轉(zhuǎn)錄酶抑制劑(Non-nucleoside Reverse Transcriptase Inhibitors,NNRTIs)[5]。NNRTIs類藥物具有活性高、毒性低、結(jié)構(gòu)多樣化、酶的結(jié)構(gòu)清楚、藥物作用靶點(diǎn)明確等優(yōu)點(diǎn)[6 - 8],因此一直是尋找新的抗艾滋病藥物的重要方向之一。
定量構(gòu)效關(guān)系(QSAR)作為一種重要的藥物設(shè)計(jì)方法,通常來講有兩種QSAR模型:2D-QSAR和3D-QSAR。CoMFA[9]是3D-QSAR中應(yīng)用比較廣泛的一種方法。本文采用第二代CoMFA方法,即Topomer CoMFA[10,11]方法對(duì)41個(gè)HIV-1逆轉(zhuǎn)錄酶抑制劑進(jìn)行3D-QSAR分析。所建立的Topomer CoMFA模型結(jié)合Topomer Search[12]技術(shù)可以進(jìn)行基于配體的虛擬篩選,為新藥的設(shè)計(jì)奠定基礎(chǔ)。不同于CoMFA的是:Topomer CoMFA是通過一系列完全客觀一致的疊合規(guī)則完成3D-QSAR分析的準(zhǔn)備工作,并且具有重復(fù)性高的優(yōu)勢(shì)。利用Topomer CoMFA方法可以快速建立預(yù)測(cè)模型并進(jìn)行分析與評(píng)價(jià),為同類小分子抑制劑的結(jié)構(gòu)優(yōu)化提供理論依據(jù)[13]。
41個(gè)HIV-1逆轉(zhuǎn)錄酶抑制劑分子結(jié)構(gòu)與活性數(shù)據(jù)見表1[14]。活性標(biāo)度為pIc50(-logIc50),其中Ic50值為HIV-1病毒感染細(xì)胞半數(shù)抑制濃度。按照隨機(jī)化原則將數(shù)據(jù)集劃分為36個(gè)訓(xùn)練集分子和5個(gè)測(cè)試集分子,訓(xùn)練集用來建立模型,測(cè)試集用以驗(yàn)證模型的外部預(yù)測(cè)能力。此外,對(duì)13號(hào)和34號(hào)分子的不同構(gòu)象進(jìn)行了驗(yàn)證,結(jié)果見表1。
表141個(gè)HIV-1逆轉(zhuǎn)錄酶抑制劑的結(jié)構(gòu)及其pIc50
No.R1R2R3XExperimental pIc50Predicted pIc5013-CF3MeCH2OCH2CH2OHO4.354.3123-FMeCH2OCH2CH2OHO5.485.4033-ClMeCH2OCH2CH2OHO4.895.0143-BrMeCH2OCH2CH2OHO5.245.1253-IMeCH2OCH2CH2OHO5.005.0563-NO2MeCH2OCH2CH2OHO4.474.5273-OHMeCH2OCH2CH2OHO4.094.1383-OMeMeCH2OCH2CH2OHO4.664.6593,5-Me2MeCH2OCH2CH2OHO6.596.71103,5-Cl2MeCH2OCH2CH2OHO5.896.0711Hi-PrCH2OCH2CH2OHO7.207.42123,5-Me2EtCH2OCH2CH2OHO7.897.52133,5-Me2i-PrCH2OCH2CH2OHO8.578.50,8.3914HMeCH2OCH2PhO7.067.0115HEtCH2OCH2MeO7.727.5816HEtCH2OCH2MeS7.587.4517a3,5-Me2EtCH2OCH2MeO8.248.67183,5-Me2EtCH2OCH2MeS8.308.5419HEtCH2O-c-HexS5.795.6920HEtCH2OCH2-c-HexS6.456.4321HEtCH2OCH2C6H4(4-Me)S7.117.1822HEtCH2OCH2C6H4(4-Cl)S7.927.9023HEtCH2OCH2CH2PhS7.047.09243,5-Cl2EtCH2OCH2MeO8.138.0325HEtCH2O-i-PrO6.476.5626aHEtCH2O-c-HexO5.405.7527HEtCH2OCH2-c-HexO6.356.4728aHEtCH2OCH2CH2PhO7.047.11294-NO2MeCH2OCH2CH2OHO3.723.6830a4-CNMeCH2OCH2CH2OHO3.603.34314-OHMeCH2OCH2CH2OHO3.563.44324-OMeMeCH2OCH2CH2OHO3.603.64334-COMeMeCH2OCH2CH2OHO3.963.96344-COOHMeCH2OCH2CH2OHO3.453.48,3.38353-CONH2MeCH2OCH2CH2OHO3.513.5336HCOOMeCH2OCH2CH2OHO5.185.1637aHCONHPhCH2OCH2CH2OHO4.744.1338HSPhCH2OCH2CH2OHO4.684.6739HCCHCH2OCH2CH2OHO4.744.6740HCCPhCH2OCH2CH2OHO5.475.52413-NH2MeCH2OCH2CH2OHO3.603.61
aChosen as the test set.
圖1 13號(hào)分子的切割方式Fig.1 Cutting style of molecule 13
采用Sybyl 2.0-X軟件包中的sketch molecule模塊繪制出化合物的結(jié)構(gòu),對(duì)所有的化合物分子進(jìn)行優(yōu)化,優(yōu)化過程采用Powell能量梯度法、Tripos力場(chǎng),能量收斂設(shè)為0.05 kcal/mol,優(yōu)化次數(shù)設(shè)定為1 000次,分子荷載電荷為Gasteiger-Huckel電荷,其余參數(shù)以Sybyl 2.0-X默認(rèn)。
以活性最高的13號(hào)分子為模板對(duì)36個(gè)訓(xùn)練集化合物的結(jié)構(gòu)進(jìn)行切割,切割方式如圖1。選擇以S為中心進(jìn)行切割生成Ra和Rb基團(tuán),接著軟件會(huì)對(duì)其余的分子結(jié)構(gòu)自動(dòng)識(shí)別并進(jìn)行切割,最后對(duì)Ra和Rb基團(tuán)周圍的立體場(chǎng)和靜電場(chǎng)進(jìn)行計(jì)算,并采用偏最小二乘回歸分析法[15]建模生成3D-QSAR模型。采用留一法交互驗(yàn)證評(píng)價(jià)模型的內(nèi)部預(yù)測(cè)能力。利用建立的Topomer CoMFA模型對(duì)5個(gè)測(cè)試集化合物的活性進(jìn)行預(yù)測(cè),以此評(píng)價(jià)模型的外部預(yù)測(cè)能力。
采用Topomer Search技術(shù)可以從大量的化合物數(shù)據(jù)庫中篩選出R基團(tuán)(R-groups)。本文利用建立的Topomer CoMFA模型對(duì)ZINC(2012)數(shù)據(jù)庫中的Drug-like類(包含130 000個(gè)分子)進(jìn)行篩選,以得到具有高活性貢獻(xiàn)的Ra和Rb基團(tuán),其中Topomer距離值設(shè)置為185,其他參數(shù)以Sybyl 2.0-X默認(rèn)。
圖2 41個(gè)抑制劑生物活性的實(shí)驗(yàn)值與預(yù)測(cè)值的線性回歸圖Fig.2 Linear regression between experimental and predicted pIC50of 41 inhibitors
圖3 Topomer CoMFA模型三維等勢(shì)圖Fig.3 3D contour of Topomer CoMFA model(a)steric field map of Ra;(b)electrostatic field map of Ra;(c)steric field map of Rb;(d)electrostatic field map of Rb.
以13號(hào)分子為模板,Topomer CoMFA三維等勢(shì)圖見圖3。圖3(a)和3(c)分別表示Ra和Rb基團(tuán)的立體場(chǎng)等勢(shì)圖,綠色區(qū)域表示引入體積較大的取代基有利于活性的提高,黃色區(qū)域表示不宜引入體積較大的取代基。圖3(b)與3(d)分別表示Ra和Rb基團(tuán)的靜電場(chǎng)等勢(shì)圖,紅色區(qū)域表示引入負(fù)電性取代基有利于活性的提高,藍(lán)色區(qū)域表示引入正電性取代基有利于活性的提高。圖3(a)中,R3取代基鏈端有大片黃色區(qū)域,R2取代基鏈端有大片綠色區(qū)域。圖3(b)中R3取代基近端有大塊藍(lán)色和紅色區(qū)域,R2取代基周圍有大塊藍(lán)色區(qū)域。圖3(c)中苯環(huán)的3位點(diǎn)和4位點(diǎn)處有大片黃色區(qū)域,5位點(diǎn)處有大塊綠色區(qū)域。圖3(d)中苯環(huán)的3位點(diǎn)、4位點(diǎn)和5位點(diǎn)處有大塊紅色區(qū)域。
綜上所述,Ra基團(tuán)的R3取代基處不適宜引入體積大的基團(tuán),例如以-CH2OCH2CH2OH取代17號(hào)分子的-CH2OCH2Me得到12號(hào)分子后活性降低。R2取代基處適宜引入體積較大的基團(tuán),例如以體積較大的異丙基取代12號(hào)分子的乙基得到13號(hào)分子后活性明顯增大。Rb基團(tuán)中苯環(huán)的3位和4位點(diǎn)處適宜引入體積較小并帶負(fù)電的基團(tuán),5位點(diǎn)處適宜引人體積較大并帶負(fù)電的基團(tuán),例如2號(hào)分子在此處引入體積小并帶負(fù)電的氟基,而7號(hào)分子引入體積比氟基大并帶正電的羥基,因此2號(hào)分子的活性大于7號(hào)分子。31、32號(hào)分子的活性較低是因?yàn)樵诒江h(huán)的4位點(diǎn)處引入了體積大的羥基和甲氧基。
Topomer Search的結(jié)果中主要包含兩項(xiàng):Topomer距離和R基團(tuán)的活性貢獻(xiàn)值。Topomer距離通過計(jì)算值評(píng)價(jià)化合物與提問結(jié)構(gòu)基團(tuán)的結(jié)構(gòu)相似性程度;而R基團(tuán)的活性貢獻(xiàn)則是基于Topomer CoMFA模型對(duì)R基團(tuán)活性值的預(yù)測(cè)打分?;赥opomer CoMFA模型,采用Topomer Search技術(shù)對(duì)ZINC(2012)數(shù)據(jù)庫進(jìn)行篩選,得到5個(gè)Ra基團(tuán)和5 000個(gè)Rb基團(tuán),以活性最高的13號(hào)分子為模板進(jìn)行過濾,挑選出明顯高于13號(hào)分子的Ra和Rb貢獻(xiàn)值的R基團(tuán)。最終得到1個(gè)Ra基團(tuán)和20個(gè)Rb基團(tuán)。
用最終篩選得到的Ra和Rb基團(tuán)分別替換13號(hào)分子的Ra和Rb基團(tuán),得到20個(gè)新化合物分子的結(jié)構(gòu),對(duì)新分子進(jìn)行優(yōu)化,優(yōu)化方法同41個(gè)樣本分子,利用建立的Topomer CoMFA模型對(duì)新化合物進(jìn)行活性預(yù)測(cè),結(jié)果有19個(gè)新設(shè)計(jì)的化合物預(yù)測(cè)活性值高于13號(hào)分子。新設(shè)計(jì)的分子Ra附近取代基團(tuán)體積增大,因此活性有所增大。另外,化合物的活性高低還會(huì)受Rb基團(tuán)影響。
本文采用Topomer CoMFA方法對(duì)36個(gè)訓(xùn)練集HIV-1逆轉(zhuǎn)錄酶抑制劑進(jìn)行了三維定量構(gòu)效關(guān)系分析,并利用所建立的模型對(duì)5個(gè)測(cè)試集抑制劑進(jìn)行了活性預(yù)測(cè)。采用Topomer Search技術(shù)對(duì)ZINC數(shù)據(jù)庫進(jìn)行R基團(tuán)的虛擬篩選,并設(shè)計(jì)出20個(gè)具有更高活性的抑制劑分子。結(jié)果表明利用Topomer CoMFA方法能夠建立有效的3D-QSAR模型,可以對(duì)未知化合物的生物活性進(jìn)行預(yù)測(cè),利用Topomer Search可以有效的從數(shù)據(jù)庫中篩選出有高貢獻(xiàn)的R基團(tuán),用以設(shè)計(jì)出新的藥物分子,為抗艾滋病新藥設(shè)計(jì)提供了新的候選物。