石誠,鄭珩
(中國藥科大學生命科學與技術學院,江蘇 南京 210009)
計算機輔助藥物設計(computer-aided drug design,CADD)已成為制藥公司和學術界的重要工具[1]。更快、更便宜的計算機以及相關軟硬件的發(fā)展使得以原子尺度模擬復雜生物系統(tǒng)成為可能,極大地促進了CADD的發(fā)展,如扎那米韋、伊馬替尼等藥物被成功開發(fā)上市[2]。Singh等[3]利用CADD對其所設計的乙酰靛紅腙和乙酰基螺噻嗪的文庫進行篩選,得到了具有顯著抗菌活性的乙酰靛紅1e(該化合物對大腸埃希菌的體外IC50為1.95μmol·L-1)以及針對白色念珠菌的先導化合物 1n(其體外 IC50為 15.67μmol·L-1)。通過定量構效關系(quantitative structure-activity relationship,QSAR) 對化合物的生物活性的取代基效應進行預測,并使用分子對接研究了可接受的細菌和真菌蛋白質選擇的支架,從而得到了靛紅的最高的配體效率。除此以外,分子相互作用揭示了3'N取代的靛紅衍生物可作為抑制細菌和真菌感染疾病的有效候選物。CADD的方法主要可分為2類[4]:基于蛋白質結構(三維)的藥物設計(structurebased drug design,SBDD)和基于配體(二維)的藥物設計(ligand-based drug design,LBDD)(見圖1),在本綜述中,筆者將分別介紹這2種方法在新型抗耐藥菌藥物設計和篩選中的應用。
圖1 計算機輔助藥物設計的代表性工作流程Figure 1 Representative workflow of computer-aided drug design
SBDD方法主要用于分析大分子三維結構信息,通常是蛋白質或核酸,以確定對其各自生物功能很重要的關鍵位點和相互作用。然后利用這些信息來設計抗菌藥物,其可競爭性地結合于靶標,從而中斷微生物存活所必需的生物途徑[5]。SBDD可以分為2類[6]:從頭設計(de novo)方法和虛擬篩選(virtual screening,VS)方法。此過程中往往也會使用分子動力學(molecular dynamics,MD)模擬來深入了解配體與靶蛋白的結合模式,并研究相互作用過程中結構的變化。
De novo方法利用來自3D受體的信息來發(fā)現(xiàn)與結合位點良好匹配的小片段,然后根據(jù)適當?shù)倪B接規(guī)則連接,產(chǎn)生一種結構新穎并可以合成的配體,用于進一步篩選。如Boibessot等[7]就基于這種策略設計出了一系列抑制細菌組氨酸激酶(histidine kinase,HK)的噻吩衍生物。組氨酸激酶是細菌雙組分信號轉導系統(tǒng)(twocomponent signal transduction system,TCS)的重要組成部分,細菌體內通常存在幾十對TCS,調控了包括細菌趨化性、孢子形成、營養(yǎng)元素代謝以及次級代謝產(chǎn)物合成等許多重要的生理過程。由于TCS目前只在細菌和哺乳動物之外的真核生物中被發(fā)現(xiàn),而在人類和其他哺乳動物體內尚未被發(fā)現(xiàn),因此可作為新型抗菌藥物作用靶標。在這個研究中,他們基于一個分辨率為1.61×10-10m的激酶WalK(PDB:3SL2)ATP結合結構域的X射線結構,設計了能與結構中關鍵元素形成氫鍵和疏水相互作用的片段,連接成新的配體化合物,再經(jīng)過VS方法獲得了8種能顯著抑制TCS中組氨酸激酶的噻吩衍生物(1~8),其中化合物2和8對枯草芽孢桿菌等多種細菌具有廣譜活性,最低抑菌濃度(minimum inhibitory concentration,MIC)和最低殺菌濃度(minimum bactericidal concentration,MBC)基本均在 7~32mg·L-1之間。
還有一個較好的例子是Jakopin等[8]對DNA促旋酶抑制劑的設計,DNA促旋酶和拓撲異構酶Ⅳ是Ⅱa型拓撲異構酶,它們是在轉錄和復制過程中監(jiān)督DNA拓撲狀態(tài)所需的必需細菌酶。它們的ATP酶結構域GyrB和ParE分別被認為是小分子抑制劑的可行靶標。在此研究中,作者將最近公開的一系列吡咯酰胺GyrB抑制劑作為先導結構,基于取代的5-苯基-1,2,4-二唑中心支架設計了其類似物的小型文庫。其噻唑羧酸部分被二唑-羧酸生物異構取代,通過優(yōu)化而得到的一系列化合物中,化合物9活性最好,其對大腸埃希菌DNA旋轉酶的 IC50為 1.2μmol·L-1,對糞腸球菌 ATCC29212MIC 可達 75μmol·L-1,對大腸埃希菌拓撲異構酶Ⅳ和相應的金黃色葡萄球菌ATCC25923均表現(xiàn)出顯著的抑制作用。
VS是一種快速且廉價的方法,利用小分子文庫(見表1),可以鑒定替代目標生物分子現(xiàn)有配體的具有特定生物活性的化合物,或發(fā)現(xiàn)具有可用結構信息的未探索的已知靶標的化合物[9]。
表1 計算機輔助藥物設計的各種常用軟件及資源Table 1 Various commonly used softwares and resources for computer-aided drug design
在VS過程中常需使用分子對接,用來預測化合物在特定目標結合位點的可能的結合模式,并基于其構象以及與結合口袋中發(fā)現(xiàn)的特征的互補性來估計親和性[10],隨著計算機技術的發(fā)展,VS也越來越多地被應用于生物領域,包括對抗生素耐藥性的研究[11-12],其巨大潛力和價值已經(jīng)通過各種抑制劑和拮抗劑的發(fā)現(xiàn)得到證實[13],例如4SC-101(10)[14],新型極光激酶A抑制劑(化合物11)[15],新型抗菌骨架ZINC00978022(化合物12)和ZINC24469052(13)[16]以及HIV-1逆轉錄酶和DNA聚合酶的雙重抑制劑(化合物14)[17]。
Gudzera等[18]報道了利用VS方法篩選結核分枝桿菌(M. tuberculosis)亮氨酰tRNA合成酶(Leucyl-tRNA synthetase,LeuRS)的小分子抑制劑。LeuRS在蛋白質合成中起著不可或缺的作用,它們的結構在原核生物和真核生物中存在差異,這種結構差異可用于開發(fā)抑制病原體合成酶但不抑制人類相關功能的藥物,由于其酶活性位點中關鍵氨基酸不易發(fā)生突變,因此這類酶抑制劑不太可能誘發(fā)耐藥性。最近,LeuRS已經(jīng)被臨床驗證為開發(fā)新型抗耐藥菌藥物的靶標[19]。作者通過對結核分枝桿菌和人LeuRS的氨基酸序列進行比對,發(fā)現(xiàn)2種酶活性位點的氨基酸序列具有顯著差異,可開發(fā)針對結核分枝桿菌LeuRS的選擇性抑制劑。使用已知的嗜熱棲熱菌LeuRS結構作為模板,預測了結核分枝桿菌LeuRS的三維結構,通過篩選100000個有機化合物的化合物文庫,最終發(fā)現(xiàn)6種對結核分枝桿菌LeuRS具有抑制活性的化合物。其中活性最好的化合物2,6-二溴-4-{[4-(4-硝基-苯基)-噻唑-2-基 ]-亞肼基甲基 }-苯酚(15),對結核分枝桿菌耐藥株LeuRS的IC50為2.27μmol·L-1。對所有活性化合物的抗結核分枝桿菌耐藥株H37Rv作用進行檢測,4-{[4-(4-溴-苯基)-噻唑-2-基 ]亞肼基甲基}-2-甲氧基-6-硝基-苯酚(16)表現(xiàn)出最佳活性,IC50為 10.01 μmol·L-1。
除此以外,VS也經(jīng)常與其他方法聯(lián)用,最近,Li等[20]利用分子對接模擬與基于分子相互作用的指紋(interaction fingerprints,IFPs)的方法對金屬-β-內酰胺酶(metal beta lactamase,MBL)VIM-2 晶體結構進行VS,得到能與重要的催化活性位點殘基如Arg228、Asn233、Phe61、Tyr67和Asp120以及鋅離子相互作用的化合物,再使用熒光法進行二次篩選,用核磁共振光譜方法檢測了化合物與apo-VIM-2以及含有鋅離子的Zn(II)VIM-2的結合模式,最后通過結晶學分析發(fā)現(xiàn)了MBL抑制的新模式,該化合物與活性位點鋅離子相鄰殘基結合,但不涉及金屬螯合。這可能有助于篩選臨床上有用的靶向MBL的抑制劑。
在潛在藥物靶標結構未知的情況下,使用諸如同源性建?;驈念^結構預測等方法預測該結構是具有挑戰(zhàn)性的,因此我們需要從一組對相關靶標(受體或酶)具有活性的配體中取得信息,從而鑒定能夠產(chǎn)生生物學活性的結構或物理化學性質(分子描述符)[21]。
QSAR方法主要基于將目標藥物相互作用活性與各種分子描述符相關聯(lián)的統(tǒng)計學。由于結構相似的分子傾向于顯示相似的生物活性[22],可根據(jù)計算實驗確定的生物活性與小配體結合劑的各種性質之間的相關性來獲得QSAR。QSAR和藥效團模型之間的一個區(qū)別在于,藥效團模型是基于活性配體的必要或基本特征構建的,而QSAR除了考慮基本特征外,還考慮了影響活性的特征,在建立QSAR后,可以使用交叉驗證[23]等方法對這些模型進行驗證。通過對分子特征的研究,QSAR模型可用于預測新型分子的生物活性和篩選分子數(shù)據(jù)庫以找到潛在的活性分子。
最近,為發(fā)現(xiàn)抗革蘭陰性細菌的有效抗生素,Lee等[24]對鮑氏不動桿菌 KASⅢ(abKAS III)的抑制劑YKsa-6進行了QSAR研究,評估了YKsa-6類似物中疏水基團羥基的位置和數(shù)目等對其抗革蘭陰性細菌活性的作用,發(fā)現(xiàn)這些化合物的疏水性對抗革蘭陰性細菌活性是很關鍵的?;诖撕Y選出2個活性化合物YKab-4(4-[(3-氯-4-甲基苯基)氨基亞氨基甲基 ]苯-1,3-二醇)(17)和YKab-6(4-[[3-(三氟甲基)苯基]氨基亞氨基甲基]苯酚)(18),其表現(xiàn)出強效抗菌活性,對 abKAS III的 MIC 為 2~8mg·L-1。
QSAR的成功取決于選擇的分子描述符以及模型預測生物活性的能力。通過將統(tǒng)計學方法應用于線性QSAR可以選擇對預測生物活性很重要的分子描述符,然而,生物活性與分子描述符之間的關系并不總是線性的。利用機器學習方法,如神經(jīng)網(wǎng)絡和支持向量機方法可生成QSAR非線性擬合模型來解決這個問題。通常使用主成分分析(principal component analysis,PCA)去除非獨立的描述符來簡化擬合的復雜性。如Ciura等[25]使用薄層色譜獲得大環(huán)內酯類抗生素的親脂性和疏水性參數(shù),利用色譜數(shù)據(jù)和計算的親脂性之間的統(tǒng)計學相關性構建QSAR模型,預測了大環(huán)內酯類抗生素對化膿性鏈球菌、肺炎鏈球菌和單核細胞增生李斯特菌等微生物的生物活性。
藥物篩選旨在鑒定含有不同骨架的化合物,他們具有特定的3D結構與靶標產(chǎn)生相互作用[26],因此,當前藥效團的研究可以基于候選化合物的生物活性構象,將結合位點信息也并入藥效團模型中。獲得藥效團模型的方法也?;谂潴w分子的疊合[22]。幾種常用的自動藥效團生成程序包括Discovery Studio、PHASE、LigandScout和MOE等,已經(jīng)廣泛運用到藥物篩選中,一個典型的例子是Eissa等[27]對所合成的一系列新的(6-甲氧基-2-萘基)丙酰胺衍生物潛在抗菌活性的探索,使用Discovery Studio2.5軟件進行藥效團生成,用于指導構建3D-QSAR藥效團模型,預測化合物活性。
在缺少受體3D信息和一組活性配體的情況下,可以創(chuàng)建序列衍生的3D藥效團模型。根據(jù)相似的受體可以與類似的配體結合的概念,3D藥效團可以使用同源模型和3D晶體結構來檢測蛋白質家族中配體生物分子識別的共同序列基序,并創(chuàng)建單一特征藥效團數(shù)據(jù)庫。如Koseki等[28]使用的基于藥效團的VS方法,他們使用MOE軟件構建含有461383種化合物的虛擬庫(化合物信息來自ChemBridge數(shù)據(jù)庫),通過對候選化合物KTP3的結構進行相似性搜索和篩選,鑒定了2種具有顯著活性的化合物——KTPS1和KTPS2,它們對恥垢分枝桿菌的半數(shù)最大抑制濃度分別為8.04和17.1μmol·L-1,這些化學物質的結構和生物學信息可能有助于開發(fā)用于治療結核病的新型抗生素。雖然藥效團模型也有其局限性,但這對于有限或沒有受體和配體信息的藥物靶標是具有吸引力的技術。
雖然CADD具有明顯的優(yōu)勢,但必須指出的是,CADD還面臨著一些挑戰(zhàn),例如如何準確識別和預測配體結合模式和親和力等。藥物發(fā)現(xiàn)需要面對的困難之一是藥物多態(tài)現(xiàn)象。當藥物具有不同的形式如化學式相同但結構不同時,則會發(fā)生藥物多態(tài)性,這對成功研發(fā)藥物有很大的影響。為了滿足實際的需要,研究者們往往也會同時使用SBDD和LBDD的方法,因為這2種方法在優(yōu)點和缺點上可以互補,在藥物研發(fā)工作中結合不同的基于結構和基于配體的設計策略也已經(jīng)被確認為比任何單一方法都更有效[6],一個例子是雜合對接程序HybridDock[29],它結合了基于結構和基于配體的方法。這種雜合方法能顯著改善結合構象和結合親和力的預測結果。
隨著多重耐藥的爆發(fā),CADD為抗耐藥菌新藥的研發(fā)提供了新的思路。常用策略包括對靶向突變蛋白的小分子調節(jié)劑的設計,在已知耐藥突變體結構的情況下,設計構建其與藥物結合形成的復合物,并從復合物中得到有價值的信息。Frey等[30]就是基于此,通過確定二氫葉酸還原酶(dihydrofolate reductase,DHFR)的雙突變體(H30N/F98Y)與抗葉酸劑所形成的復合物晶體結構,從而發(fā)現(xiàn)了金黃色葡萄球菌DHFR中的突變抗性機制。除此以外,借助計算機手段還有可能探索由其他機制(與蛋白質突變無關)而導致的耐藥性,一個典型的例子是β-內酰胺酶抑制劑的開發(fā)[31],研究人員使用化合物庫的VS和結構引導優(yōu)化,得到數(shù)百種晶體結構(獨立存在或與抑制劑結合的形式存在),使得可能深入了解所涉及的抑制機制,從而發(fā)現(xiàn)有效的抑制劑(內酰胺和非內酰胺)[32],如clavulanate(19)、tazobactam(20)和sulbactam(21)。除此以外,CADD也可用于描述抑制劑與不太可能發(fā)生突變的蛋白質區(qū)域的相互作用,從而揭示新的耐藥機制,避免抗性的發(fā)展[33]。
總而言之,以上的例子已經(jīng)成功證明了CADD在開發(fā)抗耐藥菌藥物方面的潛力,雖然也有著一些限制,但是毫無疑問,這種以知識為導向的方法已經(jīng)成為藥物設計過程中的一個重要部分。它能夠通過利用已有的受體-配體相互作用的知識和理論,來指導藥物的發(fā)現(xiàn)、能量和結構優(yōu)化,以及優(yōu)化合成路線,在過去的10年中,隨著基因組、后基因組計劃的開展,人們已經(jīng)鑒別出大量疾病相關的潛在靶點,理論計算方法諸如蛋白質結構預測、虛擬高通量篩選和對接等已被用于加速藥物發(fā)現(xiàn)過程,學術界和制藥工業(yè)使用基于配體的方法篩選到許多廣譜抗結核藥物,目前正在評估其臨床療效。
從算法的角度上,CADD還需要重點研究分子柔性以及溶劑,提高藥物對受體的靶向性以及計算效率。與此同時,需要整合現(xiàn)有的基于硅片的技術,將化學、結構生物學、生物信息學以及計算技術領域有機地結合起來。由此,可減輕虛擬藥物發(fā)現(xiàn)方法的一些缺點,并且盡可能挖掘CADD的全部潛力。