仝建波,王 洋,雷 珊,秦尚尚
(陜西科技大學(xué) 化學(xué)與化工學(xué)院 陜西省輕化工助劑重點實驗室,陜西 西安 710021)
獲得性免疫缺陷綜合癥(AIDS),即艾滋病病毒,是引起人類免疫缺陷病毒(HIV)的一種致命疾病[1,2].HIV可分為I型(HIV-1)和II型(HIV-2)[3-5],兩者之間存在一定的免疫交叉反應(yīng).據(jù)報道HIV-1是人類最容易傳播和感染的病毒之一,所以絕大多數(shù)艾滋病都是由HIV-1而引起的[6].逆轉(zhuǎn)錄酶(RT)在HIV-1的復(fù)制循環(huán)中起著關(guān)鍵性的作用.因而,HIV-1逆轉(zhuǎn)錄酶一直以來都是抗艾滋病藥物發(fā)展中主要的生物靶點[7].其中,非核苷類逆轉(zhuǎn)錄酶抑制劑(NNRTIs)和核苷類逆轉(zhuǎn)錄酶抑制劑(NRTIs)是如今HIV-1逆轉(zhuǎn)酶的兩大分類[8,9].NNRTIs作為高效抗逆轉(zhuǎn)錄病毒療法(HAART)中重要的藥物成分,由于作用靶點比較明確、結(jié)構(gòu)多樣化、高效毒性低、酶的結(jié)構(gòu)清楚、與其他抗HIV藥物具有協(xié)同作用等優(yōu)點[10-12],所以在抗病毒藥物的設(shè)計開發(fā)中意義重大,一直以來都是尋找新的抗艾滋病藥物的重要傾向之一[13].
S-DABO屬嘧啶酮類化合物,是最新已經(jīng)發(fā)現(xiàn)的近50類NNRTIs中較具有代表性的一類,其化學(xué)結(jié)構(gòu)是在C-6位上有取代芐基及C-2位上的烴(環(huán)烴)硫基對抗HIV活性有十分重要的影響[14].在基于配體的計算機輔助藥物設(shè)計中三維定量構(gòu)效關(guān)系(3D-QSAR)歷來都扮演著重要的角色.其中CoMFA[15]與CoMSIA[16]是兩種最傳統(tǒng)且最典型的方法.本實驗采用新一代CoMFA-Topomer CoMFA[17,18]對21個6-(1-萘甲基)取代S-DABO類化合物進行3D-QSAR研究.通過Topomer search[19,20]技術(shù)在ZINC分子數(shù)據(jù)庫中進行虛擬篩選研究,然后選取了1個R1基團和8個R2
基團得到了8個活性不低于模板分子的新藥物分子.最后采用分子對接技術(shù)研究了新設(shè)計的藥物小分子配體與生物大分子蛋白(1RT2)之間的相互作用與結(jié)合方式,為實驗工作者合成該系列新藥物提供了理論指導(dǎo).
本實驗從文獻[21]搜尋了21個具有確定結(jié)構(gòu)的6-(1-萘甲基)取代S-DABO類逆轉(zhuǎn)錄酶抑制劑(見表1),其化學(xué)結(jié)構(gòu)見圖1,活性標度為IC50的負對數(shù)(pIC50),其中IC50為HIV-1病毒感染細胞半數(shù)抑制濃度.本文借助SYBYL2.0-X軟件包中的Sketch Molecule模塊來繪制分子的結(jié)構(gòu),采用最陡梯度下降法對所有分子進行能量優(yōu)化,最終得到最低的能量構(gòu)象.整個優(yōu)化過程涉及到Powell能量梯度法,Tripos立場[22]等.其中最大迭代系數(shù)定義為1 000次,分子荷載電荷為Gasteiger-Huckel電荷,能量收斂設(shè)置為0.005 kcal/mol,其余參數(shù)都是SYBYL 2.0-X的默認值[23].
圖1 化合物結(jié)構(gòu)骨架
表1 化合物的結(jié)構(gòu)及活性數(shù)據(jù)
續(xù)表1
No.R1'R2'Exp.pIC50Pred.pIC50Residual15(4'-OCH3)Phi-Pr7.527.200.3216CH3i-Pr6.396.45-0.0617(4'-F)Phi-Pr7.107.22-0.1218(4'-Cl)Phi-Pr6.496.96-0.4719OCH3i-Pr5.355.48-0.1320*OCH2CH3i-Pr5.855.670.1821(3',5'-CH3)Phi-Pr6.626.580.04
*標記為測試集化合物
用于建立模型的訓(xùn)練集(training set)分子和用于驗證模型外部能力的測試集(test set)分子根據(jù)隨機取樣原則分別定義為16個和5個.接著以活性最高的15號分子為模板采用Topomer技術(shù)將該分子切割成三部分,切割方式如圖2所示.接著軟件會盡量保持同樣的切割方式對其他分子進行自動識別,如果個別分子與模板分子結(jié)構(gòu)差異較大軟件無法識別則需手動完成切割,最后這些碎片的3D構(gòu)象按照必然的經(jīng)驗規(guī)則進行調(diào)整,生成Topomer 模型[24].自變量為R1和R2片段周圍的立體場和靜電場參數(shù).并以IC50的負對數(shù)(pIC50)作為因變量,采用偏最小二乘回歸法(PLS)[25]建模生成3D-QSAR模型.模型的內(nèi)部預(yù)測能力是由留一法交互驗證[26]測驗的.而外部預(yù)測能力是借助建模所選取的5個測試集分子來達到目的.
圖2 21個化合物分子生物活性的實驗值與預(yù)測值的線性回歸圖
Topomer search可以非常高效地優(yōu)化先導(dǎo)化合物和搜查完整分子,是一種極其迅速的3D配體的虛擬篩選工具,且不需要考慮大分子受體作用.采用Topomer search技術(shù)可以從相應(yīng)的分子數(shù)據(jù)庫中篩選出R基團(R-groups).其原理是:采用Topomer相似性進行側(cè)鏈、骨架及完整分子的篩選,通過閾值的R-groups進一步打分,用模型預(yù)測其活性的貢獻. 本文應(yīng)用Topomer search技術(shù)對ZINC(2012)[27]分子數(shù)據(jù)庫中的Drug-like類(包含130 000個分子)進行R基團的虛擬篩選,來得到具備較高活性貢獻的R1和R2基團.除了Topomer間距設(shè)定成185之外,剩余參數(shù)均保持SYBYL 2.0-X默認值不變.
采用Surflex-dock研究21個6-(1-萘甲基)取代S-DABO類逆轉(zhuǎn)錄酶抑制劑及新設(shè)計的分子與1RT2(取自TNK-651/HIV-1RT復(fù)合物晶體結(jié)構(gòu))的作用模式和作用機制.經(jīng)過一系列修飾后,S-DABO以配體形式生成活性位點,用原型分子(Protomol)體現(xiàn)蛋白的結(jié)合位點.本文在籌備小分子的過程中,將配體的輸出構(gòu)象設(shè)定成20個,其余參數(shù)均不變,同時選擇原配體結(jié)構(gòu)為參比分子,來進行新設(shè)計的藥物小分子配體與大分子蛋白(1RT2)的對接與打分.這些表征函數(shù)有Total-Score(總的打分,打分越高越好,高于6的輸出構(gòu)象被判定為較好的輸出構(gòu)象);Crash(碰撞打分,越接近0越好);Polar(極性相互作用打分,越大越好);C-Score[28](綜合的打分標準,滿分是5,大于4說明對接結(jié)果與實驗值相似度高);Similarity(相似性參比,此值介于0與1之間,值越大,表明分子構(gòu)象越相似.一般而言,大于0.8就說明兩個分子疊合的比較好).
Topomer CoMFA是CoMFA與Topomer的聯(lián)合技術(shù),沒必要手動進行分子疊合,可自動完成分子疊合.本實驗采用三種切割方式來對數(shù)據(jù)集分子進行Topomer切割,切割方式見表2所示.利用Topomer CoMFA得到了3個不盡相同的3D-QSAR模型.表2展現(xiàn)了3個模型的建模結(jié)果.從表2可以看出,3個模型的主成分數(shù)N分別為3,3和4,F(xiàn)檢驗值分別為44.418,41.212和31.631,其中交互驗證系數(shù)(q2)均大于0.5,非交叉相關(guān)系數(shù)(r2)均不小于0.6且非常接近1,說明3個模型都得到了較為可靠的結(jié)果.綜合考慮和分析這3個模型,模型1不僅具有較高的預(yù)測準確性,而且Topomer切割方式可以較好的保持S-DABO的結(jié)構(gòu),更有利于研究核心基團與R基團的關(guān)系.所以本實驗選取模型1進行后續(xù)的分子設(shè)計與分子對接實驗.圖2為模型1的訓(xùn)練集與測試集的實驗值與預(yù)測值的線性回歸圖.從圖能夠看出化合物均勻的散布在45 °線上下,進一步表明模型1的預(yù)測結(jié)果較優(yōu)[29].
表2 Topomer CoMFA建模結(jié)果對比
以活性最高的15號化合物為例,進行Topomer CoMFA三維等勢圖解析如圖3所示.圖3(a)和圖3(c)分別表示R1和R2基團的立體場等勢圖,原則上,在立體場中,綠色區(qū)域表示引入體積較大的取代基對增大活性有幫助,黃色區(qū)域表示引入體積較大的取代基對活性的增大無益;圖3(b)與圖3(d)分別表示R1和R2基團的靜電場等勢圖,紅色區(qū)域表示引入負電性取代基對增大活性有幫助,藍色區(qū)域表示引入帶負電性的取代基對活性的增大無益[30].
在圖3(a)中,整個基團都被一大片綠色的等勢域包圍,且沒有出現(xiàn)黃色的等勢域,表明了在R1基團處引入體積較大的取代基對活性提高有幫助.例如,化合物1、8、14在R1′取代基處苯環(huán)的4'位以較小的基團甲基取代了15號分子苯環(huán)4′'位的甲氧基,它們的活性都明顯降低;化合物13的R1′取代基處是苯基,相比于15號分子也有所下降;化合物3、6、7、12、16、19、20以烴基、烷氧基取代了15號分子的芳香基,其活性降低程度更大;圖3(b)中,幾乎全被紅色的等勢域包圍,說明在R2處引入帶負電荷的取代基對活性提高有幫助,例如,化合物6、7、12、19、20由于R1′取代基引入的都是帶正電荷的烷氧基所以活性整體來說相對較小;化合物3、16活性稍有提高,是由于它們的R1′取代基是電負性大于烷氧基的甲基;其余的化合物由于R1′取代基上都有苯環(huán),所以活性都相對較高;還有化合物4的活性明顯高于化合物5、化合物10的活性明顯高于化合物11、化合物17的活性明顯高于化合物18,都是由于氟基的電負性高于氯基. 圖3(c)中R2取代基全被大片綠色覆蓋,說明此處引入體積較小的取代基對活性提高無益,例如,在保持R2基團不變的情況下比較活性,其中化合物1<化合物8<化合物14;化合物2<化合物9<化合物15;化合物4<化合物10;化合物5<化合物11;化合物6<化合物12<化合物19;化合物7<化合物20,這些都是由于烴基的體積隨著碳鏈增長而增加的緣故.圖3(d)為R2取代基的靜電場等勢域,可以發(fā)現(xiàn)此圖周圍既沒有藍色也沒有紅色,說明R2取代基不受靜電場的影響.為了驗證這一結(jié)論,觀察發(fā)現(xiàn)R2取代基分別是甲基、乙基、異丙基,由于這些都是給電子集團,電負性極小,所以可以不用考慮電負性的影響.
(a)R1基團的立體場等勢圖
(b)R1基團的靜電場等勢圖
(c)R2基團的立體場等勢圖
(d)R2基團的靜電場等勢圖圖3 立體場和靜電場三維等勢圖
基于Topomer CoMFA模型1,對R1和R2基團進行虛擬篩選研究,得到了具有高貢獻的R1為1 250個,R2為65個.以15號分子的實驗值為參照,選擇了1個R1和8個R2基團進行新藥物分子的設(shè)計.最后得到的8個分子的預(yù)測活性均不低于模板分子,其中表3為8個分子的結(jié)構(gòu)與預(yù)測活性.
表3 新設(shè)計分子的結(jié)構(gòu)及預(yù)測活性值
續(xù)表3
序號結(jié)構(gòu)預(yù)測活性值057.64067.64077.61087.61
分子對接是借助Surflex-dock模塊來完成的,分子結(jié)構(gòu)取自TNK-651/HIV-1RT復(fù)合物晶體結(jié)構(gòu)(PDB代碼:1RT2).對1RT2的預(yù)處理步驟有:加氫、加電荷、修復(fù)主鏈、修復(fù)側(cè)鏈、末端處理,除去原有配體、除去水分子和其他殘基.經(jīng)過這些處理后出現(xiàn)原型分子生成圖(如圖4),此圖顯示的是配體小分子在活性位點空間內(nèi)與大分子蛋白的相互作用模式,同時也可以看出該對接口袋為一條狹長的口袋.新設(shè)計的8個分子的優(yōu)化方式同訓(xùn)練集分子,將構(gòu)象的最大輸出值設(shè)為20,經(jīng)過對接實驗后,共得到160個輸出構(gòu)象,其他參數(shù)都是SYBYL 2.0-X默認[31].
在進行對接實驗之前,首先進行可行性驗證,其方法是先將晶體結(jié)構(gòu)中的共晶配體抽出,然后再次與晶體對接,并以原來的共晶配體為參照.如圖5所示,共晶配體在晶體結(jié)構(gòu)中的構(gòu)象與配體對接后的構(gòu)象幾乎重疊,這表明該方法能夠有效的用于分子對接結(jié)果.
接著將8個新設(shè)計的分子分別進行對接實驗,在所有輸出構(gòu)象中挑選出Total score打分在6以上,Crash打分接近0,Polar打分較大且CScore打分均為5的構(gòu)象為例來分析抑制劑與蛋白的作用機制,共得到6個滿足要求的構(gòu)象[32].現(xiàn)選擇03、04、06、08來進行研究,圖6展示的是它們的作用模式圖.03號分子中,配體中sp3雜化的O原子與LYS103中的氫原子形成氫鍵,其距離為1.860 ?,配體中sp3雜化的H原子與LYS101中的氧原子形成氫鍵,其距離為2.059 ?.04號分子中,配體中sp3雜化的H原子與LYS101中的氧原子形成氫鍵,其距離為1.767 ?.06號分子中,配體中sp3雜化的O原子與LYS103中的氫原子形成氫鍵,其距離為1.813 ?,配體中sp3雜化的H原子與LYS101中的氧原子形成氫鍵,其距離為2.094 ?.08號分子中,配體中sp3雜化的O原子與TYR318中的氫原子形成氫鍵,其距離為2.655 ?,配體中sp3雜化的H原子與LYS101中的氧原子形成氫鍵,其距離為1.855 ?.結(jié)果表明,一般地,配體分子與LYS101、LYS103、TYR318殘基具有氫鍵相互作用[33].
圖4 原型分子生成圖(灰色區(qū)域代表原型分子)
圖5 晶體結(jié)構(gòu)中共晶配體構(gòu)象與對接構(gòu)象疊合圖(綠色棒狀表示共晶配體對接構(gòu)象,紅色棒狀表示共晶配體構(gòu)象)
(a)03號分子與1RT2氫鍵作用
(b)04號分子與1RT2氫鍵作用
(c)06號分子與1RT2氫鍵作用
(d)08號分子與1RT2氫鍵作用圖6 新設(shè)計的分子與1RT2氫鍵作用圖(綠色棒狀表示氨基酸殘基,黃色虛線表示氫鍵)
為了進一步說明這個殘基的重要性,對原數(shù)據(jù)集活性中活性最高的15號分子與活性最低的7號分子分別做分子對接.實驗結(jié)果表明這兩個分子的各項表征函數(shù)都符合要求.它們的氫鍵作用圖見圖7,其中7號分子中,配體中sp3雜化的O原子與LYS101中的氫原子形成氫鍵,其距離為2.183 ?,配體中sp3雜化的H原子與LYS101中的氧原子形成氫鍵,其距離為1.622 ?.15號分子中,配體中sp3雜化的H原子與LYS101中的氧原子形成氫鍵,其距離為1.851 ?.這些氫鍵作用使配體小分子與大分子蛋白結(jié)合更加穩(wěn)定,同時也是藥物分子抑制病毒的主要作用.
(a)7號分子與1RT2氫鍵作用
(b)15號分子與1RT2氫鍵作用圖7 數(shù)據(jù)集分子與1RT2氫鍵作用(綠色棒狀表示氨基酸殘基,黃色虛線表示氫鍵)
本實驗利用Topomer CoMFA 方法對21個HIV-1逆轉(zhuǎn)錄酶抑制劑進行了3D-QSAR研究,最后得到穩(wěn)定性及預(yù)測值均很好的3D-QSAR模型.以訓(xùn)練集化合物的結(jié)構(gòu)片段為提問結(jié)構(gòu),然后采用虛擬篩選技術(shù)從ZINC數(shù)據(jù)庫篩選得到有用的結(jié)構(gòu)片段,并設(shè)計出8個新的具備較高活性的S-DABO類抑制劑.使得抗艾滋病藥物分子的候選數(shù)據(jù)庫得到了進一步擴充.運用Surflex-dock對抑制劑及其受體之間的相互作用模式進行了探索及探究,從而發(fā)現(xiàn)配體小分子中的某些原子與大分子蛋白中的一些主要氨基酸殘基形成的氫鍵作用是藥物分子發(fā)揮作用的主要依據(jù).