趙學(xué)敏,郭紅梅,余 娜,趙 鏡,付 樂,全紋萱,舒 茂
(重慶理工大學(xué) 藥學(xué)與生物工程學(xué)院,重慶 400054)
異檸檬酸脫氫酶(IDH)是細(xì)胞代謝過程中的關(guān)鍵酶,在很多生理過程中都發(fā)揮著重要作用,如血管生成、代謝等[1-2]。它包括3種同工酶,分別是IDH1、IDH2、IDH3[2]。IDH突變對(duì)腫瘤發(fā)展有很重要影響。IDH1在細(xì)胞生命活動(dòng)過程中扮演著重要角色,是一種不可或缺的酶。2-羥基戊二酸(2-HG)是1DH1突變時(shí)的產(chǎn)物。由于2-HG與α-酮戊二酸結(jié)構(gòu)極其相似,而累計(jì)的2-GH能夠發(fā)揮抑制雙加氧酶的作用,而且2-HG 本身也是一種腫瘤細(xì)胞代謝產(chǎn)物,容易引起細(xì)胞分化障礙[3-4],如可以抑制氨基酸去甲基化酶,進(jìn)而破壞組蛋白產(chǎn)生去甲基化反應(yīng),抑制參與表觀遺傳調(diào)節(jié)及調(diào)節(jié)細(xì)胞信號(hào)等[5-7],從而促進(jìn)腫瘤的發(fā)生。在近幾年的報(bào)道中發(fā)現(xiàn)IDH1的突變存在于多種血液病及癌癥中,如急性髓性白血病(AML)[8-10]、腦膠質(zhì)瘤[11-12]和骨髓增生異常綜合征(MDS)。IDHl可以抑制IDHl突變體,降低2-HG的產(chǎn)生,從而使其達(dá)到正常水平,發(fā)揮抑制腫瘤的作用[13]。小分子抑制突變IDH1(mIDH1)已被臨床驗(yàn)證為治療急性髓細(xì)胞性白血病和多發(fā)實(shí)體瘤的有前途的治療方法[14-16]。因此,IDH1抑制劑可以有效地治療癌癥。
計(jì)算機(jī)輔助藥物設(shè)計(jì)已有多年的歷史,其中三維定量構(gòu)效關(guān)系和分子對(duì)接廣泛應(yīng)用于先導(dǎo)化合物的設(shè)計(jì)和篩選[17-21]。三維定量構(gòu)效關(guān)系(3D-QSAR)利用多種描述符與其生物活性搭建結(jié)構(gòu)與活性的線性關(guān)系,如多元線性回歸和偏最小二乘法[22-23]。Lin等[15-16]設(shè)計(jì)合成的一系列喹啉酮類衍生物能夠選擇性地抑制IDH1的突變,選出的化合物具有治療多種癌癥的潛力。但是目前還未有文章報(bào)道結(jié)構(gòu)與活性之間的關(guān)系。本研究可為開發(fā)新的抑制劑提供理論參考,通過采用3D-QSAR和分子對(duì)接研究結(jié)構(gòu)與活性之間的關(guān)系。
研究了來自文獻(xiàn)的38個(gè)喹啉酮類衍生物,其分子結(jié)構(gòu)及活性數(shù)據(jù)都從文獻(xiàn)中獲取[15-16]。參考結(jié)構(gòu)的多樣性及活性的范圍,將38個(gè)化合物中的30個(gè)化合物分為訓(xùn)練集,8個(gè)分為測試集。為方便計(jì)算,將IC50(μmol/L)轉(zhuǎn)換為pIC50(pIC50-LogIC50)。利用Sybyl-X 2.0軟件進(jìn)行一系列的準(zhǔn)備工作:利用Powell能量梯度法優(yōu)化,優(yōu)化次數(shù)最大10 000次,收斂標(biāo)準(zhǔn)為能量變化不高于0.005 kJ(mol·?)-1,加上Gasteiger-Huckel電荷和Tripos力場,其余數(shù)值均為默認(rèn)。38個(gè)喹啉酮類IDH1抑制劑的結(jié)構(gòu)和活性數(shù)據(jù)參見表1。
表1 化合物的活性值與結(jié)構(gòu)
續(xù)表(表1)
將能量最小的分子在Sybyl-X 2.0軟件中進(jìn)行公共骨架的分子疊合,這是構(gòu)建3D-QSAR模型中最重要的一步[24]。在文章中,由于化合物No.30具有最高的活性,因而將其作為模板,對(duì)所有化合物進(jìn)行疊合,化合物No.30和所有分子疊合圖如圖1、2所示。
圖1 模板化合物No.30結(jié)構(gòu)圖
圖2 模板化合物No.30與所有分子的疊合圖
在SYBYL-X 2.0軟件中構(gòu)建了mIDH1抑制劑的CoMFA和CoMSIA模型,闡明化合物的生物活性與三維構(gòu)象之間的關(guān)系[25]。CoMSIA模型不僅擁有CoMFA模型所擁有的分子場,還在其基礎(chǔ)上增加了3個(gè)分子場,分別是氫鍵受體場、供體場和疏水場。不同描述符之間相互影響,為了找尋最佳交叉驗(yàn)證系數(shù)的分子場,需要計(jì)算不同分子場的組合來實(shí)現(xiàn)。進(jìn)行留一法(LOO)交叉驗(yàn)證得到內(nèi)部交叉驗(yàn)證系數(shù)(Q2)以及最佳主成分?jǐn)?shù)N,并以非交叉驗(yàn)證方法計(jì)算出模型的非交叉驗(yàn)證相關(guān)系數(shù)(r2)、F(the fischer ratio)統(tǒng)計(jì)值和標(biāo)準(zhǔn)偏差(SEE)。評(píng)價(jià)3D-QSAR模型的外部預(yù)測相關(guān)系數(shù)用下式計(jì)算[26-27]:
(1)
式中:SD為測試集中的化合物與訓(xùn)練集中的化合物的平均抑制活性偏差的平方和;PRESS為實(shí)際抑制活性與預(yù)測活性偏差的平方和。
首先,從蛋白數(shù)據(jù)庫(protein data bank,PDB)中獲取蛋白IDH1(PDB ID:6O2Y,分辨率是2.80?)的晶體結(jié)構(gòu),在sybyl軟件中對(duì)該蛋白進(jìn)行一系列的非常關(guān)鍵的準(zhǔn)備工作,如加氫、加電荷、刪除配體等。其次,使用sybyl對(duì)小分子與蛋白進(jìn)行對(duì)接,在對(duì)接過程中使用Surflex-Dock模塊,Surflex-Dock(SFXC)為關(guān)鍵的對(duì)接模式,其他參數(shù)保持默認(rèn)[28]。
隨機(jī)選擇30個(gè)化合物作為訓(xùn)練集構(gòu)建CoMFA和CoMSIA模型,剩余的化合物作為測試集被用于檢驗(yàn)?zāi)P偷臏?zhǔn)確可靠性。所得到的相關(guān)統(tǒng)計(jì)參數(shù)如表2所示。一般認(rèn)為,Q2>0.5,表明該模型是可靠的并且預(yù)測能力較好[29]。由表可知,CoMFA 模型的N=3,Q2=0.754(>0.5),R2=0.946,SEE=0.211,從模型中看出,2個(gè)場均對(duì)活性值產(chǎn)生影響,立體場的貢獻(xiàn)是0.437,靜電場的貢獻(xiàn)是0.563,從貢獻(xiàn)值可以看出立體場中的空間效應(yīng)的影響小于靜電場中的電性分布的影響。CoMSIA模型得到的結(jié)果是Q2=0.545、R2=0.955、SEE=0.196、N=4、F=132.466。立體場的貢獻(xiàn)為0.198,靜電場的貢獻(xiàn)為0.612,疏水場的貢獻(xiàn)為0.190。由于在CoMSIA模型中考慮了疏水場,因此所建立的CoMSAI-ESH模型是可靠的,并具有良好預(yù)測性的能力。將訓(xùn)練集和測試集的實(shí)驗(yàn)pIC50與預(yù)測pIC50的數(shù)值用散點(diǎn)圖對(duì)其進(jìn)行線性回歸。所得擬合曲線如圖3所示,所有化合物的預(yù)測活性都在趨勢線附近,表明該化合物的實(shí)際活性與預(yù)測活性非常吻合。數(shù)據(jù)表明,3D-QSAR模型(CoMFA和CoMSIA)具有良好的穩(wěn)定性和可靠的預(yù)測能力。
表2 CoMFA 和CoMSIA 模型的統(tǒng)計(jì)學(xué)數(shù)據(jù)
表3 CoMFA 和CoMSIA 中訓(xùn)練集與測試集化合物的pIC50實(shí)驗(yàn)值和預(yù)測值及其誤差
圖3 CoMFA和CoMSIA中訓(xùn)練集與測試集化合物的pIC50實(shí)驗(yàn)值和預(yù)測值之間的擬合曲線
使用實(shí)際活性最高的的化合物30作為模板進(jìn)行CoMFA與CoMSIA的三維等勢圖,進(jìn)而分析化合物結(jié)構(gòu)與活性的關(guān)系。圖4為CoMFA模型的立體場與靜電場等勢圖。在立體場中(圖4(a)),綠色區(qū)域顯示提高生物活性的有效方法為引入體積較大的基團(tuán),而黃色區(qū)域則相反。從圖4中可以看出,7位主要被綠色覆蓋,這說明在此處引入體積大的基團(tuán),化合物的活性會(huì)明顯提高。通過觀察化合物15,發(fā)現(xiàn)在7位沒有取代基取代,之后觀察發(fā)現(xiàn)化合物20在第7位有取代基取代,發(fā)現(xiàn)化合物20的活性高于化合物15的活性。觀察R取代基,發(fā)現(xiàn)此區(qū)域中主要被黃色塊覆蓋,表明在此區(qū)域引入體積大的基團(tuán)會(huì)影響化合物活性,化合物01(pIC50=8.508)的R取代基比化合物05的R基大,故化合物01(pIC50=6.152)的活性比化合物05的大(pIC50=5.507)。在CoMFA靜電等勢圖中,增加化合物的活性的方法為在紅色區(qū)域引入負(fù)電性基團(tuán)及在藍(lán)色區(qū)域引入正電性基團(tuán)。通過觀察圖4(b)可知,R取代基區(qū)域有藍(lán)色存在,提高活性的方法為加入正電性的基團(tuán)。發(fā)現(xiàn)在活性方面,化合物9優(yōu)于化合物6,由于在化合物9(pIC50=6.418)的3位有羥基化合物取代而化合物6(pIC50=6.175)無取代。在立體電勢與靜電電勢方面,CoMSIA模型與CoMFA模型比較相似。黃色區(qū)域的存在說明在該位置被疏水基團(tuán)取代能增強(qiáng)化合物的活性,灰色區(qū)域則相反。圖5(c)中可以看出,7位取代基上的部分灰色圖表明,增強(qiáng)此化合物的活性的有效方法為在此區(qū)域引入疏水基團(tuán)。R取代基的苯環(huán)3位上也有一部分綠色圖塊,在后面的新化合物設(shè)計(jì)中可以適當(dāng)將氧甲基換成親水基團(tuán),如羥基或氨基等。R取代基上主要是黃色區(qū)域,此處應(yīng)更多考慮疏水性基團(tuán)。
圖4 CoMFA模型等勢圖
圖5 CoMSIA模型等勢圖
為了檢驗(yàn)分子對(duì)接的可靠性,將原始配體提取出來重新對(duì)接(圖6)。圖6中黃色表示重新對(duì)接后的構(gòu)象,原始配體用綠色表示。很明顯,2個(gè)配體分子的對(duì)接構(gòu)象與其實(shí)驗(yàn)構(gòu)象疊合得很好,且RMSD值為0.515 9?(<2.0 ?)[30],說明文章采用的對(duì)接方式是可靠的。
圖6 原始配體的重新對(duì)接圖
38個(gè)喹啉酮類化合物與靶標(biāo)蛋白的結(jié)合位點(diǎn)對(duì)接圖見圖7。對(duì)接結(jié)果打分最高的是化合物No.36(TotalScore=10.308 7),No.36呈“V”形,在由Arg109、Ala111、Leu120、Trp124、Ile128、Ile130、Val255、Ala258、Met259、Trp267、Asp279、Val281、Ala282和Tyr285形成的結(jié)合口袋中。
圖7 所有化合物位于IDH1蛋白的結(jié)合位點(diǎn)對(duì)接圖
從圖8(a)中可以看出,氰基與Leu120的骨架酰胺NH形成氫鍵而取代基芐胺(NH)與Ile128的羰基形成H鍵。母核喹啉酮的6位取代基氯原子與Met259的硫原子形成氫鍵,并填充由殘基Trp267,Ala258,Trp124和Val281形成的疏水口袋。母環(huán)喹啉酮的羰基(-C=O)和氮上的H原子分別與氨基酸殘基Arg109和Asp279的氧原子形成氫鍵。殘基Trp267與母核的苯環(huán)形成π-π相互作用力。這和以前的文獻(xiàn)報(bào)道有相似之處[15-16]。氫鍵與疏水作用的存在,有助于小分子化合物與靶標(biāo)蛋白酶的結(jié)合,進(jìn)而提高抑制劑的生物活性。而打分最低的化合物No.22(TotalScore=5.937 7)只與靶標(biāo)蛋白氨基酸殘基Arg109、Met259和Asp279形成氫鍵和與Trp267形成π-π相互作用力。說明R2取代基應(yīng)考慮分子量大的基團(tuán),R基團(tuán)適當(dāng)增加一些親水基團(tuán)。這與QSAR的結(jié)果一致。從圖8(b)中可知,No.30(TotalScore=9.044)呈“S”字結(jié)合在由以上氨基酸殘基形成的結(jié)合口袋中。與No.36不同的是,氨基酸殘基Cys269的磺酸基與R2取代基的苯環(huán)形成了一個(gè)相互作用力,這也使得No.30呈“S”形,抑制作用降低。這為后續(xù)設(shè)計(jì)新化合物提供了重要的信息。
圖8 化合物No.36和No.30與蛋白相互作用二維圖
通過CoMFA和 CoMSIA模型基于相同的結(jié)構(gòu)和等勢圖的相關(guān)分析可知,在苯環(huán)的6位上應(yīng)該增加正電性基團(tuán),氨基取代基上應(yīng)該增加疏水性基團(tuán),找尋更多與受體的疏水相互作用。在本文中,采用化合物中活性最高的分子No.30作為模板對(duì)mIDH1抑制劑進(jìn)行優(yōu)化設(shè)計(jì),得到8個(gè)新的mIDH1抑制劑分子,其預(yù)測活性與對(duì)接分?jǐn)?shù)均高于模板分子。結(jié)果表明,新化合物的抑制效果優(yōu)于化合物30。其中化合物No.a2的活性較高。使用前期建立的3D-QSAR模型對(duì)新設(shè)計(jì)的化合物活性進(jìn)行預(yù)測,預(yù)測值如表4所示。之后使用新設(shè)計(jì)的化合物與蛋白進(jìn)行分子對(duì)接,分析對(duì)接結(jié)果后發(fā)現(xiàn),所有新設(shè)計(jì)的化合物的對(duì)接模式與化合物30的對(duì)接模式相同。然而對(duì)于化合物a8的基團(tuán)修飾并未很好地提高化合物與靶標(biāo)結(jié)合的對(duì)接分?jǐn)?shù),而化合物a1、a2、a4和a6的結(jié)構(gòu)改造不僅抑制活性比No.30高,而且與蛋白質(zhì)結(jié)合的對(duì)接分?jǐn)?shù)也很高。然而對(duì)于化合物a8的基團(tuán)修飾并未很好地提高化合物與靶標(biāo)結(jié)合的對(duì)接分?jǐn)?shù),而化合物a1、a2、a4和a6的結(jié)構(gòu)改造不僅得到的抑制活性比No.30高,而且與蛋白質(zhì)結(jié)合的對(duì)接分?jǐn)?shù)也很高。
表4 新化合物和模板分子的結(jié)構(gòu)及預(yù)測活性值
為了計(jì)算新化合物的ADME/T性質(zhì),利用在線服務(wù)器pkCSM(http://biosig.unimelb.edu.au/pkcsm/)[31]評(píng)估化合物的成藥性,相關(guān)參數(shù)見表5。對(duì)于新化合物合成的難易程度,運(yùn)用SwissADME(http://www.swissadme.ch/index.php)[32]在線預(yù)測,如表6所示。
表5 新化合物及模板分子類五原則
表6 No.30及其衍生物的ADME/T性質(zhì)(Lipinski類五原則)
續(xù)表(表6)
從表5、6中可以看出,新設(shè)計(jì)的化合物,其腸道吸收率(Human intestinal absorption)為90.440%至94.092(>30%),表明所有新化合物均具有高吸收性能,尤其是對(duì)于化合物a1,a4和a7。新設(shè)計(jì)的化合物在體內(nèi)均能被CYP450亞型2D6和3A4抑制劑代謝,而a4和a8對(duì)于CYP450 1A2亞型不會(huì)被代謝。根據(jù)預(yù)測的總清除率,所有化合物均可被腎臟和肝組織共同清除,也不會(huì)引起皮膚過敏。除了a6不符合分子類五原則以外,其他化合物均有潛力成為新型IDH1抑制劑。
IDH1是一種備受關(guān)注的靶點(diǎn)。在研究中,建立了3D-QSAR模型,從而揭示了化合物結(jié)構(gòu)與活性之間的關(guān)系,依據(jù)化合物與分子的對(duì)接信息,分析受體與配體之間的結(jié)合,設(shè)計(jì)并預(yù)測了8種新化合物。利用等勢圖更好地分析化合物結(jié)構(gòu)和活性之間的關(guān)系。通過分析等勢圖獲取了影響這一系列化合物活性的關(guān)鍵結(jié)構(gòu),表明新藥設(shè)計(jì)可以通過在7位增加取代基的體積來增加化合物的活性,以及在此處引入疏水性基團(tuán),還可以通過在化合物的3 位引入羥基化合物的取代基,以及R取代基處有更多的疏水性基團(tuán)取代。根據(jù)不同基團(tuán)取代對(duì)化合物進(jìn)行改造從而設(shè)計(jì)活性更高的新化合物。此外,文章還發(fā)現(xiàn)氫鍵和疏水鍵及靜電相互作用有助于配體與受體的結(jié)合。化合物大多可以與靶標(biāo)蛋白的關(guān)鍵氨基酸殘基Arg109和Asp279等形成氫鍵,這可以使化合物與活性口袋更好地結(jié)合,氫鍵的存在對(duì)增加抑制劑的活性發(fā)揮著積極作用。本文獲得了8個(gè)新穎且具有潛在IDH1抑制活性的含喹啉酮化合物,具有良好的可行性和ADMET評(píng)價(jià)結(jié)果。綜上所述,通過三維定量構(gòu)效關(guān)系模型的構(gòu)建、驗(yàn)證和分析,結(jié)合分子對(duì)接機(jī)制的分析,可為后續(xù)開發(fā)新的藥物提供新思路和新方向。