黎婭琳,任吉霞
(聊城大學(xué) 生命科學(xué)學(xué)院,山東 聊城 252059)
SHP2(SH2 domain-containing protein-tyrosinephosphatase-2)由PTPN11基因編碼,屬于非受體蛋白酪氨酸磷酸酶。完整的SHP2蛋白晶體結(jié)構(gòu)顯示[1],在本底狀態(tài)下,SHP2通過(guò)N-SH2域和催化位點(diǎn)PTP域間形成分子內(nèi)相互作用而處于一種自抑制的失活構(gòu)象;在生長(zhǎng)因子、細(xì)胞因子等外界環(huán)境因子的刺激下,SHP2的失活狀態(tài)被打破,變成有活性的開放構(gòu)象。研究表明,SHP2參與多種信號(hào)通路,SHP2的活化是Ras/ERK1/2通路完全激活所必需的,此外,SHP2活化PI3K/AKT,JAK/STAT,JNK和NF-κB信號(hào)通路,進(jìn)而調(diào)控細(xì)胞增殖、分化、細(xì)胞周期維持和遷移等生理功能[2]。SHP2還通過(guò)其N-SH2結(jié)構(gòu)域結(jié)合免疫檢查點(diǎn)蛋白PD-1的磷酸酪氨酸基序(pTyr motif),參與調(diào)節(jié) T 細(xì)胞的活性[3]。綜上SHP2是細(xì)胞中多種信號(hào)通路的重要信號(hào)調(diào)節(jié)分子,同時(shí)SHP2還是控制細(xì)胞因子產(chǎn)生及免疫細(xì)胞反應(yīng)的重要調(diào)控因子。
所以,當(dāng)PTPN11基因發(fā)生突變而表達(dá)異常時(shí),將導(dǎo)致細(xì)胞增殖分化異常,引起多種疾病的發(fā)生發(fā)展。近幾年大量遺傳學(xué)和臨床研究表明,在多種惡性血液病和實(shí)體瘤中都存在SHP2突變活化或過(guò)表達(dá)[4]。例如,生殖系獲得功能性PTPN11基因突變會(huì)導(dǎo)致Noonan 綜合征(40%~50%),該疾病是一種可增加惡性腫瘤風(fēng)險(xiǎn)的常染色體顯性遺傳發(fā)育障礙癥[5]。SHP2高活化突變出現(xiàn)于幼年慢性骨髓單核細(xì)胞性白血病(JMML,35%),急性B淋巴細(xì)胞白血病(7%)和急性髓性白血病(4%)[6,7]。白血病相關(guān)PTPN11E76K突變會(huì)促進(jìn)骨髓增殖性腫瘤的發(fā)生和發(fā)展[8]。SHP2過(guò)表達(dá)在多種實(shí)體瘤中非常常見,例如:在大約55%原發(fā)性乳腺癌中SHP2過(guò)表達(dá),并會(huì)導(dǎo)致預(yù)后不良[9]。最近Hana Algül課題組發(fā)現(xiàn)KRAS突變驅(qū)動(dòng)的胰腺導(dǎo)管腺癌和非小細(xì)胞肺癌依賴于SHP2[10]。據(jù)Rene Bernards課題組報(bào)道SHP2是KRAS突變型非小細(xì)胞肺癌所必需的[11]。除此之外,近期研究表明 SHP2與腫瘤免疫調(diào)節(jié)密切相關(guān),例如,Zhao等研究發(fā)現(xiàn)[12],抑制SHP2活性可激活抗腫瘤免疫力,并可以與阻斷PD-1起協(xié)同作用,這為腫瘤免疫治療提供了新的思路。以上研究均提示SHP2是一個(gè)抗腫瘤新靶標(biāo)。靶向抑制SHP2可雙管齊下,既減緩癌細(xì)胞生長(zhǎng),同時(shí)也調(diào)節(jié)免疫功能以激活其抗腫瘤作用。
綜上,研發(fā)SHP2小分子抑制劑,對(duì)靶向SHP2的抗腫瘤治療及其分子機(jī)制研究都具有十分重要的意義。目前已經(jīng)有一些 SHP2小分子抑制劑被報(bào)道,這些小分子抑制劑主要分為兩大類:催化位點(diǎn)抑制劑和變構(gòu)位點(diǎn)抑制劑[13,14]。張仲寅課題組開發(fā)了多個(gè)SHP2催化位點(diǎn)抑制劑[15-17],最近,國(guó)內(nèi)學(xué)者王文龍課題組[18]和王潤(rùn)玲課題組[19,20]也發(fā)現(xiàn)多個(gè)新型SHP2催化位點(diǎn)抑制劑。除此,還有4款小分子變構(gòu)抑制劑進(jìn)入臨床研究[21,22]。
計(jì)算機(jī)輔助藥物設(shè)計(jì)(computer aided drug design,CADD)技術(shù)已在藥物研發(fā)中得到廣泛應(yīng)用,據(jù)估計(jì) CADD 使得新藥研發(fā)周期縮短了0.9 年,研發(fā)費(fèi)用降低 1.3億美元[23]。根據(jù)藥物作用靶點(diǎn)三維結(jié)構(gòu)是否已知,CADD 大概可以分為基于配體的藥物設(shè)計(jì)(如藥效團(tuán)模型)和基于結(jié)構(gòu)(如分子對(duì)接)的藥物設(shè)計(jì)。研究證明三維藥效團(tuán)模型和分子對(duì)接技術(shù)的聯(lián)合應(yīng)用可以縮短大型化合物數(shù)據(jù)庫(kù)虛擬篩選的時(shí)間,并可提高命中率[24]。虛擬篩選獲得化合物的活性基本上在 μmol/L 水平,有少量的化合物達(dá)到 nmol/L 水平,這一活性水平的化合物可以作為先導(dǎo)化合物進(jìn)行結(jié)構(gòu)改造,以獲得活性高的類藥性化合物[25]。計(jì)算機(jī)輔助藥物分子設(shè)計(jì)作為創(chuàng)新藥物研究的新方法和新技術(shù),已經(jīng)成為一種實(shí)用化工具,加入到了創(chuàng)新藥物研究的工作流程中,成為現(xiàn)代藥物研發(fā)的核心技術(shù)之一。
本研究使用DS軟件構(gòu)建SHP2催化位點(diǎn)抑制劑和非抑制劑的貝葉斯分類模型,抑制劑的3D-QSAR藥效團(tuán)模型,利用貝葉斯分類模型對(duì)大型商業(yè)數(shù)據(jù)庫(kù)進(jìn)行篩選,預(yù)測(cè)陽(yáng)性化合物再由藥效團(tuán)進(jìn)行篩選,通過(guò)兩輪篩選的化合物利用分子對(duì)接技術(shù)對(duì)接到SHP2催化活性位點(diǎn),通過(guò)分析對(duì)接結(jié)果選出潛在活性化合物,再?gòu)墓举?gòu)買化合物實(shí)體,進(jìn)行酶水平抑制活性檢測(cè),最終得到3個(gè)具有一定潛在選擇性的SHP2新型抑制劑。并通過(guò)分析活性最高化合物和藥效團(tuán)匹配和分子對(duì)接結(jié)果,闡明化合物起抑制作用的機(jī)制。
從BindingDB數(shù)據(jù)庫(kù)下載已報(bào)導(dǎo)的SHP2小分子抑制劑的SDF文件[26],利用Discovery Studio 3.1(DS 3.1)打開文件,根據(jù)文件中提供的每個(gè)化合物的信息,刪除非活性位點(diǎn)抑制劑。利用DS 3.1的“Prepare Ligands”模塊對(duì)剩余SHP2催化位點(diǎn)小分子抑制劑進(jìn)行去重處理;將去重處理后的所有SHP2小分子抑制劑按照活性IC50進(jìn)行排序,規(guī)定IC50< 20 μmol/L為SHP2的抑制劑,添加標(biāo)注為1,IC50> 20 μmol/L為非抑制劑,添加標(biāo)注為-1。
利用DS 3.1的“Generate Training and Test Data”模塊,構(gòu)建訓(xùn)練集和測(cè)試集,將注有標(biāo)記的SHP2催化活性位點(diǎn)抑制劑作為輸入化合物,“Split Method”參數(shù)設(shè)置為“Random”,“Training Set Percentage”參數(shù)設(shè)置為80。利用DS 3.1中“Create Bayesian Model”模塊,以生成的訓(xùn)練集和測(cè)試集化合物作為輸入,構(gòu)建貝葉斯模型,設(shè)置“Calculate Properties”時(shí),先確定所用分子指紋的類型,然后將確定的分子指紋和常見的幾種分子描述符組合進(jìn)行模型構(gòu)建。為確定關(guān)鍵分子描述符,采取逐一排查法,最終確定分子指紋和分子描述符的最優(yōu)組合。
2.3.1 訓(xùn)練集化合物的選取。藥效團(tuán)建模過(guò)程中,訓(xùn)練集分子的挑選對(duì)模型的構(gòu)建具有非常重要的作用。利用DS3.1構(gòu)建3D-QSAR藥效團(tuán)模型對(duì)訓(xùn)練集分子有如下要求[27]:(1)18-25個(gè)結(jié)構(gòu)多樣性的化合物,為保證結(jié)果具有統(tǒng)計(jì)學(xué)意義,化合物分子數(shù)目不得低于15個(gè)。(2)化合物活性跨度至少為4個(gè)數(shù)量級(jí),每個(gè)數(shù)量級(jí)至少有3個(gè)化合物。(3)結(jié)構(gòu)相似的化合物活性至少相差一個(gè)數(shù)量級(jí),有相似活性的化合物結(jié)構(gòu)必須不同。(4)所有化合物提供的信息不得冗余。根據(jù)這4條要求,從搜集的SHP2催化位點(diǎn)抑制劑中選擇16個(gè)化合物構(gòu)成訓(xùn)練集。
2.3.2 3D-QSAR藥效團(tuán)的構(gòu)建。利用DS 3.1中的“3D QSAR Pharmacophore Generation”模塊以16個(gè)訓(xùn)練集化合物作為輸入化合物,兩個(gè)高活性化合物1(IC50:0.2 μmol/L)和2(IC50:0.45 μmol/L)用作建模過(guò)程中的模板分子,其對(duì)應(yīng)的參數(shù)“Principal”及“MaxOmitFeat”分別設(shè)為2和0,其余化合物的這兩個(gè)參數(shù)都設(shè)為1。
所有SHP2催化活性位點(diǎn)抑制劑利用DS 3.1的“Prepare Ligands”模塊進(jìn)行能量?jī)?yōu)化,使其初始構(gòu)象處于能量較低的狀態(tài)。在“3D QSAR Pharmacophore Generation”模塊中“Conformation Generation”參數(shù)設(shè)為Best,并將能量閾值設(shè)為“20 kcal/mol”,然后利用Poling算法對(duì)每個(gè)化合物產(chǎn)生255個(gè)構(gòu)象,這些構(gòu)象涵蓋了所有可能與SHP2催化結(jié)構(gòu)域結(jié)合的化合物的活性構(gòu)象。“Maximum Pharmacophores”參數(shù)設(shè)置為5,“Minimum Interfeature Distance”設(shè)為1.5,利用剩余SHP2抑制劑作為測(cè)試集化合物,“Fitting Method”設(shè)置為flexible,“Fisher Validation”設(shè)置為95%。除此,構(gòu)建藥效團(tuán)所需其它參數(shù)采用默認(rèn)參數(shù)。
通過(guò)對(duì)所有SHP2小分子抑制劑的觀察和相關(guān)文獻(xiàn)報(bào)道,選擇以下藥效特征元素作為初始藥效特征:氫鍵受體(Hydrogen-bond acceptor,A),氫鍵供體(Hydrogen-bond donor,D),疏水特征(Hydrophobic feature,H)),芳香環(huán)特征(Ring aromatic feature,R)和電離后呈負(fù)電荷基團(tuán)(NEG_ionizable,N)。
2.3.3 3D-QSAR藥效團(tuán)的評(píng)價(jià)。通常通過(guò)分析計(jì)算結(jié)果中給出的cost值和其它相關(guān)統(tǒng)計(jì)學(xué)參數(shù)對(duì)3D-QSAR藥效團(tuán)模型進(jìn)行初評(píng),對(duì)通過(guò)初評(píng)的藥效團(tuán)模型再利用測(cè)試集和交叉驗(yàn)證法進(jìn)行進(jìn)一步的評(píng)價(jià)。參數(shù)修改后運(yùn)算給出最好的5個(gè)藥效團(tuán)模型及其相應(yīng)參數(shù),這些參數(shù)主要有:Fixed cost,理想模型的cost值;Null cost,無(wú)意義模型的cost值,即模型預(yù)測(cè)活性和實(shí)驗(yàn)活性完全不相關(guān)時(shí)的cost值;Total cost,對(duì)應(yīng)于每個(gè)不同的藥效團(tuán)模型其值不同;相關(guān)系數(shù)(correlation coefficient),代表利用藥效團(tuán)模型預(yù)測(cè)的訓(xùn)練集分子活性值和實(shí)際實(shí)驗(yàn)活性值的相關(guān)度;Config值,代表藥效團(tuán)模型空間構(gòu)象的復(fù)雜程度;還有均方根偏差值(RMSD value)等。一個(gè)好的藥效團(tuán)模型,應(yīng)當(dāng)具有較高的相關(guān)系數(shù),其Total cost值應(yīng)該接近Fixed cost值遠(yuǎn)離Null cost值,Config值不大于17,均方根偏差越小越好。交叉驗(yàn)證法可以進(jìn)一步評(píng)價(jià)通過(guò)初評(píng)藥效團(tuán)模型的可信度(confidence level),將置信度設(shè)為95%,那么程序?qū)a(chǎn)生19個(gè)隨機(jī)表單,每個(gè)表單中化合物的結(jié)構(gòu)和活性數(shù)據(jù)是隨機(jī)混亂匹配的,但是表單中的其它參數(shù)與構(gòu)建初始藥效團(tuán)模型的參數(shù)值完全相同。通過(guò)分析隨機(jī)產(chǎn)生的19個(gè)訓(xùn)練集構(gòu)建的95個(gè)藥效團(tuán)模型的統(tǒng)計(jì)學(xué)參數(shù)可評(píng)價(jià)構(gòu)建的定量藥效團(tuán)模型的可信性。在測(cè)試集驗(yàn)證方法中,將除訓(xùn)練集之外的66個(gè)化合物組成獨(dú)立測(cè)試集,運(yùn)用構(gòu)建的定量藥效團(tuán)模型對(duì)測(cè)試集化合物進(jìn)行活性預(yù)測(cè)并與其實(shí)驗(yàn)活性做回歸分析,以驗(yàn)證藥效團(tuán)模型的預(yù)測(cè)能力。
本研究中的所有對(duì)接研究均使用GOLD 5.1來(lái)完成[28]。SHP2催化結(jié)構(gòu)域的晶體結(jié)構(gòu)來(lái)源于蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB ID: 4RDD),因?yàn)槠湓谒械腟HP2催化結(jié)構(gòu)域晶體結(jié)構(gòu)中分辨率最高(0.16 nm),所以被作為對(duì)接研究中小分子化合物的受體。通過(guò)使用DS 3.1將氫原子添加到蛋白質(zhì),然后分配ChARMM力場(chǎng)。結(jié)合位點(diǎn)被定義為一個(gè)球體,其覆蓋以配體為中心1 nm范圍內(nèi)的受體氨基酸殘基,這個(gè)球體足夠覆蓋活性位點(diǎn)中配體化合物的結(jié)合區(qū)域。通過(guò)將與SHP2催化結(jié)構(gòu)域共結(jié)晶的抑制劑對(duì)接到受體的活性部位,預(yù)先優(yōu)化了評(píng)分函數(shù)和對(duì)接參數(shù)。
使用構(gòu)建好的貝葉斯分類模型通過(guò)DS 3.1中“Calculate Molecular Properties”模塊對(duì)大型商業(yè)化合物數(shù)據(jù)庫(kù)里的化合物進(jìn)行預(yù)測(cè),利用預(yù)測(cè)為陽(yáng)性的化合物,構(gòu)建藥效團(tuán)篩選數(shù)據(jù)庫(kù)。使用DS 3.1中的“Search 3D Database”模塊,利用建立的藥效團(tuán)模型對(duì)構(gòu)建好的化合物數(shù)據(jù)庫(kù)進(jìn)行3D結(jié)構(gòu)匹配,選擇匹配值(Fit Value)超過(guò)一定閾值的化合物進(jìn)行分子對(duì)接研究,通過(guò)對(duì)對(duì)接結(jié)果的分析,選擇購(gòu)買數(shù)個(gè)化合物進(jìn)行后續(xù)的活性研究。
本研究中酶水平活性檢測(cè)選用歐洲Eurofins Discovery公司的Discovery Services模塊中的PhosphataseProfilerTM完成,該方法使用熒光法測(cè)試磷酸酶活性。參考文獻(xiàn)[29,30]并作適當(dāng)調(diào)整,以6,8-二氟-4-甲基-7-羥基香豆素磷酸酯(DiFMUP)作為底物,SHP2催化其水解產(chǎn)生6,8-二氟-4-甲基-7-羥基香豆素(DiFMU),通過(guò)Thermo Scientifific Verioskan Flash多功能讀數(shù)儀,以358 nm為激發(fā)波長(zhǎng)來(lái)檢測(cè)450 nm處的熒光值,確定SHP2的酶活。以礬酸鈉(Na3VO4·12H2O)為陽(yáng)性抑制劑,它能夠氧化蛋白酪氨酸磷酸酶的保守催化活性位點(diǎn)半胱氨酸,是一種PTPs的通用抑制劑。除了感興趣的待測(cè)化合物被正釩酸鈉取代,陽(yáng)性對(duì)照孔包含了反應(yīng)的所有組分以及控制溶劑效應(yīng)的DMSO;除了化合物,空白孔包含了反應(yīng)的所有成分。各種不同酶的活性抑制實(shí)驗(yàn)具體操作如下。
2.6.1 SHP2活性檢測(cè)。使用在大腸桿菌中表達(dá)的人重組磷酸酶PTPN11(SHP-2)。將試驗(yàn)化合物與45 ng/mL酶在37 ℃、pH 7.2的改良HEPES緩沖液中預(yù)孵育15 min。通過(guò)添加100 μmol/L DiFMUP 60 min來(lái)引發(fā)反應(yīng)。在358 nm/450 nm下用熒光光譜法讀取所形成的DiFMU的量的測(cè)定?;衔镌?0 μmol/L下進(jìn)行篩選。
2.6.2 SHP1活性檢測(cè)。使用在大腸桿菌中表達(dá)的人重組蛋白磷酸酶SHP1。將試驗(yàn)化合物與2 U/mL酶在37 ℃、pH 7.2的改良HEPES緩沖液中預(yù)孵育15 min。通過(guò)加入100 μmol/L DiFMUP 30 min來(lái)引發(fā)反應(yīng)。在358 nm/450 nm下用熒光光譜法讀取所形成的DiFMU的量的測(cè)定?;衔镌?0 μmol/L下進(jìn)行篩選。
2.6.3 PTP1B活性檢測(cè)。使用在大腸桿菌中表達(dá)的人重組蛋白磷酸酶PTP1B。將受試化合物與170 μU/mL酶在37 ℃、pH 7.2的改良HEPES緩沖液中預(yù)孵育15 min。通過(guò)加入10 μM DiFMUP 60 min來(lái)引發(fā)反應(yīng)。在358 nm/450 nm下用熒光光譜法讀取所形成的DiFMU的量的測(cè)定。化合物在10 μmol/L下進(jìn)行篩選。
2.6.4 DUSP22檢測(cè)。使用在大腸桿菌細(xì)胞中表達(dá)的人重組蛋白磷酸酶DUSP22。將受試化合物與2 μg/mL酶在37 ℃、pH 7.2的改良HEPES緩沖液中預(yù)孵育15 min。通過(guò)加入10 μmol/L DiFMUP 30 min來(lái)引發(fā)反應(yīng)。在358 nm/450 nm下用熒光光譜法讀取所形成的DiFMU的量的測(cè)定?;衔镌?0 μmol/L下進(jìn)行篩選。
總共搜集到376個(gè)SHP2催化位點(diǎn)抑制劑,其中220個(gè)化合物活性(IC50)高于20 μmol/L,在模型構(gòu)建中作為非活性化合物,標(biāo)注為-1;剩余157個(gè)化合物活性(IC50)低于20 μmol/L,在構(gòu)建模型時(shí)作為活性抑制劑,標(biāo)注為1。訓(xùn)練集化合物占比80%,剩余20%為測(cè)試集化合物,經(jīng)程序隨機(jī)分配后,訓(xùn)練集總共301個(gè)化合物,其中178個(gè)非活性化合物,123個(gè)活性化合物;測(cè)試集總共75個(gè)化合物,由42個(gè)非活性化合物和33個(gè)活性化合物組成。
模型構(gòu)建時(shí),分子指紋LCFC16與分子描述符Num_H_Donors,Molecular_Fractional Polar Surface Area為最優(yōu)組合,給出最好的二分類結(jié)果。最優(yōu)貝葉斯分類模型SHP2_BDM評(píng)價(jià)數(shù)據(jù)見表1,ROC Score,SE,SP和Concordance數(shù)值越接近1,說(shuō)明模型的二分類能力越優(yōu)。從表1中的數(shù)據(jù)可見已構(gòu)建模型是一個(gè)優(yōu)秀的貝葉斯分類模型,可用于后續(xù)虛擬篩選。
表1 SHP2催化位點(diǎn)抑制劑和非抑制劑貝葉斯分類模型的驗(yàn)證結(jié)果
3.2.1 藥效團(tuán)模型的構(gòu)建。利用選出的16個(gè)訓(xùn)練集小分子化合物(圖1),經(jīng)過(guò)運(yùn)算得到5個(gè)最佳的藥效團(tuán)模型,其參數(shù)見表2,從表2數(shù)據(jù)可見,P1-P5的Cost差值分布在53.014~63.656之間。就藥效團(tuán)有意義的顯著性而言,真正重要的是任何藥效團(tuán)的Total cost與Null cost之間的差異大小,如果二者差異為40~60,那么代表有75%~90%的可能性活性數(shù)據(jù)和化學(xué)結(jié)構(gòu)是真正相關(guān)的。Total cost和Null cost差值越大代表構(gòu)建的藥效團(tuán)預(yù)測(cè)化合物活性的能力越高。
圖1 構(gòu)建藥效團(tuán)模型的訓(xùn)練集分子化學(xué)結(jié)構(gòu)及其生物活性(IC50 : μmol/L)
表2 排名前五的SHP2催化位點(diǎn)小分子抑制劑定量藥效團(tuán)模型的統(tǒng)計(jì)學(xué)參數(shù)
圖2(a~e)顯示了構(gòu)建的5個(gè)定量藥效團(tuán)模型,包括藥效特征元素種類和藥效團(tuán)特征元素三維空間以及距離限制,圖2(f)顯示了5個(gè)藥效團(tuán)的疊合結(jié)果,從圖2可以看出5個(gè)藥效團(tuán)的藥效特征的空間排布和各個(gè)特征元素之間的距離是相差無(wú)幾的。但5個(gè)藥效團(tuán)的藥效特征的種類和數(shù)目卻有較大差別。5個(gè)藥效團(tuán)都含有空間分布類似的1個(gè)電離負(fù)電荷基團(tuán)特征,1個(gè)氫鍵受體和1個(gè)疏水特征。P2、P3和P4還各含有一個(gè)位置相似的疏水基團(tuán)特征;P1和P3還各含有一個(gè)位置類似的芳香環(huán)特征;P2在與P1和P3芳香環(huán)特征位置相似的空間位置有一個(gè)氫鍵受體;P5還在一個(gè)靠近電離負(fù)電荷特征的位置有個(gè)氫鍵供體;除此,P1、P2和P5還含有3~4個(gè)不等的排斥球,即化合物不能占據(jù)的空間。經(jīng)過(guò)分析5個(gè)藥效團(tuán)含有的藥效特征種類、數(shù)目和空間排布,本研究?jī)A向選擇P3和P5進(jìn)行后續(xù)的活性化合物篩選。
3.2.2 藥效團(tuán)模型的驗(yàn)證。好的藥效團(tuán)模型不僅能正確預(yù)測(cè)訓(xùn)練集化合物的分子活性,還應(yīng)當(dāng)具有正確預(yù)測(cè)訓(xùn)練集之外其它分子生物活性的能力。因此,本研究使用66個(gè)訓(xùn)練集分子之外的SHP2催化位點(diǎn)抑制劑組成測(cè)試集,用于測(cè)試藥效團(tuán)正確預(yù)測(cè)外部分子活性的能力。圖3顯示了5個(gè)藥效團(tuán)模型對(duì)16個(gè)訓(xùn)練集化合物和66個(gè)測(cè)試集化合物預(yù)測(cè)活性值與實(shí)驗(yàn)活性值的回歸分析結(jié)果。由圖可見,5個(gè)藥效團(tuán)模型對(duì)訓(xùn)練集化合物的活性預(yù)測(cè)是非常準(zhǔn)確的,化合物預(yù)測(cè)活性值和實(shí)驗(yàn)活性值間的相關(guān)系數(shù)在0.923 3~0.952 4。通過(guò)對(duì)5個(gè)藥效團(tuán)模型對(duì)測(cè)試集化合物預(yù)測(cè)活性值和實(shí)驗(yàn)活性值進(jìn)行回歸分析,得出藥效團(tuán)模型準(zhǔn)確預(yù)測(cè)訓(xùn)練集之外化合物活性值的能力,從圖3可見,5個(gè)藥效團(tuán)模型對(duì)66個(gè)測(cè)試集化合物的活性預(yù)測(cè)值和實(shí)驗(yàn)活性值之間的相關(guān)系數(shù)在0.822 8~0.909 1,其中P3和P5的預(yù)測(cè)準(zhǔn)確度最高,相關(guān)系數(shù)分別為0.899 8和0.909 1。通過(guò)對(duì)化合物活性預(yù)測(cè)值和實(shí)驗(yàn)值相關(guān)系數(shù)的分析,本研究?jī)A向選擇P3和P5進(jìn)行后續(xù)的虛擬篩選,以發(fā)現(xiàn)新型SHP2催化位點(diǎn)抑制劑。
圖3 5個(gè)藥效團(tuán)模型對(duì)訓(xùn)練集和測(cè)試集化合物活性預(yù)測(cè)值和實(shí)驗(yàn)值回歸分析結(jié)果
除了測(cè)試集方法,本研究采用Fisher驗(yàn)證法對(duì)藥效團(tuán)進(jìn)行隨機(jī)交叉驗(yàn)證分析。在本次驗(yàn)證中,置信水平設(shè)為95%,程序?qū)⒂?xùn)練集化合物結(jié)構(gòu)和活性值隨機(jī)混亂組合,產(chǎn)生19個(gè)輸入表單,這些表單參數(shù)與構(gòu)建藥效團(tuán)模型時(shí)使用的參數(shù)設(shè)置完全相同,程序?qū)a(chǎn)生95個(gè)藥效團(tuán)型。圖4顯示了新建的95個(gè)藥效團(tuán)模型和原始表單產(chǎn)生的5個(gè)藥效團(tuán)模型的Total cost值,比較發(fā)現(xiàn)原始表單產(chǎn)生的5個(gè)藥效團(tuán)模型除藥效團(tuán)P2外的Total cost值比隨機(jī)表單產(chǎn)生的95個(gè)藥效團(tuán)的Total cost值低的多,這說(shuō)明構(gòu)建的藥效團(tuán)模型P1、P3、P4和P5具有很強(qiáng)的可信性。
為了進(jìn)一步分析藥效團(tuán)模型P1、P3、P4和P5的有效性,將這4個(gè)藥效團(tuán)模型與訓(xùn)練集活性最高和活性最低的2個(gè)化合物進(jìn)行匹配疊合。圖5顯示了定量藥效團(tuán)模型P1、P3、P4和P5與訓(xùn)練集中活性最高的化合物1(IC50= 0.2 μmol/L)和活性最低化合物16(IC50= 500 μmol/L)的匹配情況,從圖5(a-d)可見,各藥效團(tuán)和化合物1匹配得非常完美,其每個(gè)藥效特征元素均與化合物1中的相應(yīng)化學(xué)功能基團(tuán)匹配,而在圖5(e-h)中藥效團(tuán)模型只與化合物16有部分匹配。因此,這些結(jié)果在一定程度上反映了各藥效團(tuán)的有效性。
圖5 藥效團(tuán)和訓(xùn)練集活性最高的化合物1(IC50:0.2 μmol/L)和活性最低化合物16(IC50:500 μmol/L)的匹配效果圖(a~d)P1、P3、P4和P5與活性最高的化合物1的匹配圖;(e~h)P1、P3、P4和P5與活性最低的化合物16的匹配圖(綠色:氫鍵受體;玫紅色:氫鍵供體;藍(lán)色:疏水特征;黃色:芳香環(huán)特征;灰色:排斥球)
根據(jù)藥效團(tuán)模型對(duì)訓(xùn)練集和測(cè)試集化合物的活性預(yù)測(cè)能力,Fisher驗(yàn)證法分析,藥效特征元素的組成和空間排布,及藥效團(tuán)和訓(xùn)練集化合物的匹配情況,最終選擇藥效團(tuán)P3和P5進(jìn)行后續(xù)的虛擬篩選。
由于分子對(duì)接參數(shù)和評(píng)分函數(shù)對(duì)最終對(duì)接結(jié)果具有很大影響,因此在進(jìn)行基于分子對(duì)接的虛擬篩選之前需要確定最優(yōu)對(duì)接參數(shù)和評(píng)分函數(shù)。本研究選擇SHP2催化結(jié)構(gòu)域結(jié)合1個(gè)頭孢磺啶衍生物的晶體復(fù)合物結(jié)構(gòu)(PDB ID:4RDD)作為對(duì)接研究的受體,因?yàn)樵谒幸呀Y(jié)晶SHP2催化結(jié)構(gòu)域與催化位點(diǎn)抑制劑的復(fù)合物結(jié)構(gòu)中,4RDD具有高分辨率(0.16 nm)。為了確定最佳的對(duì)接參數(shù)和評(píng)分函數(shù),將已經(jīng)與SHP2催化位點(diǎn)共結(jié)晶的4種活性化合物重新對(duì)接到SHP2的活性位點(diǎn),調(diào)整對(duì)接參數(shù)和評(píng)分函數(shù),直到小分子化合物對(duì)接構(gòu)象盡可能與原來(lái)的結(jié)晶構(gòu)象重合。經(jīng)過(guò)不斷測(cè)試,對(duì)接參數(shù)設(shè)置如:Fitness Function選用Chemscore,GA Parameters選用GOLD Default,Generate Diverse Solution設(shè)為True,Early Termination 設(shè)為False,其它參數(shù)保留軟件默認(rèn)參數(shù)。選用參數(shù)和評(píng)分函數(shù)的組合,使配體的對(duì)接構(gòu)象與它們?cè)诰w結(jié)構(gòu)中的相應(yīng)結(jié)合構(gòu)象之間有最小均方根偏差(RMSD)值。表3列出了計(jì)算的RMSD值。4個(gè)化合物中3LU具有最小RMSD值0.186 95 nm,此值可接受。其它3個(gè)化合物的RMSD值都高于0.5 nm,這是因?yàn)檫@3個(gè)化合物本身柔性較大,與SHP2催化位點(diǎn)結(jié)合不夠緊密,化合物三分之二的結(jié)構(gòu)暴露于溶劑中與受體蛋白無(wú)任何相互作用,故對(duì)接構(gòu)象與原結(jié)晶構(gòu)象差別較大。基于化合物3LU的對(duì)接結(jié)果及對(duì)接軟件GOLD5.1 在其它研究中的可靠性[29],表明GOLD軟件在一定程度上能夠重現(xiàn)配體的正確結(jié)合構(gòu)象,可用于本研究中的分子對(duì)接研究。
表3 SHP2催化位點(diǎn)抑制劑的結(jié)晶構(gòu)象和對(duì)接構(gòu)象之間RMSD值
本研究采用3種計(jì)算機(jī)輔助藥物發(fā)現(xiàn)技術(shù),即貝葉斯分類模型,藥效團(tuán)模型和分子對(duì)接技術(shù),進(jìn)行多步驟的組合虛擬篩選以發(fā)現(xiàn)潛在新型SHP2活性位點(diǎn)抑制劑。虛擬篩選工作流程如圖6所示。本研究所用3種計(jì)算機(jī)輔助藥物發(fā)現(xiàn)技術(shù)中,基于貝葉斯分類模型的虛擬篩選速度最快,所以首先利用貝葉斯分類模型對(duì)包含129 087個(gè)化合物的大型商業(yè)化合物數(shù)據(jù)庫(kù)進(jìn)行SHP2催化位點(diǎn)抑制劑的預(yù)測(cè);把預(yù)測(cè)為陽(yáng)性的48 507個(gè)化合物構(gòu)建為可用藥效團(tuán)模型進(jìn)行篩選的3D數(shù)據(jù)庫(kù),利用比分子對(duì)接速度快很多的藥效團(tuán)模型進(jìn)行3D數(shù)據(jù)庫(kù)篩選;將篩選化合物與藥效團(tuán)匹配值高于4(FitValue 大于4.0)的158個(gè)化合物進(jìn)行最后的分子對(duì)接篩選,根據(jù)對(duì)接化合物的打分值高低和觀察對(duì)接構(gòu)象與活性位點(diǎn)關(guān)鍵氨基酸殘基的相互作用,最終選取了8個(gè)化合物進(jìn)行購(gòu)買和后續(xù)的酶水平活性驗(yàn)證。圖7顯示8個(gè)購(gòu)買化合物的分子結(jié)構(gòu),表4列出8個(gè)化合物的篩選參數(shù)。
圖6 本研究的虛擬篩選流程
圖7 8個(gè)命中化合物的化學(xué)結(jié)構(gòu)
表4 8個(gè)命中化合物的篩選參數(shù),包括藥效團(tuán)匹配值、3D-QSAR藥效團(tuán)模型預(yù)測(cè)的活性值和對(duì)接打分
化合物由LifeChemical化合物數(shù)據(jù)庫(kù)國(guó)內(nèi)代理商上海陶術(shù)購(gòu)買(根據(jù)化合物售賣公司提供的材料顯示,所有化合物純度均大于等于90%),每種化合物皆用DMSO溶解,精確配置成10 mmol/L的母液,每個(gè)待測(cè)化合物取20 μL母液,寄往英國(guó)Eurofins Discovery公司完成酶水平活性檢測(cè)。圖8顯示化合物在10 μmol/L濃度下對(duì)SHP2活性的抑制率,化合物cpd2、cpd4和cpd6在濃度為10 μmol/L時(shí)對(duì)SHP2催化活性具有明顯抑制能力,抑制率分別為79%,71%和67%。為了進(jìn)一步檢測(cè)活性最高化合物抑制不同磷酸酶催化活性的選擇性,檢測(cè)了cpd2 在10 μmol/L濃度時(shí),對(duì)SHP1、PTP1B和DUSP22催化活性的抑制。如圖9所示,化合物cpd2 在10 μmol/L濃度時(shí),對(duì)SHP1、PTP1B和DUSP22的酶活抑制率分別為42%,41%和34%,與同濃度cpd2對(duì)SHP2酶活抑制率21%相比較,提示化合物cpd2具有一定潛在選擇性。酶活檢測(cè)表明,化合物cpd2是一個(gè)具有潛在選擇性的SHP2催化位點(diǎn)抑制劑,具有進(jìn)一步改構(gòu)的價(jià)值。
圖8 8個(gè)篩選命中化合物抑制SHP2酶活性結(jié)果
為了更好地解釋化合物cpd2結(jié)構(gòu)和活性間的關(guān)系,分析了該化合物和藥效團(tuán)的匹配情況,及其與SHP2催化活性位點(diǎn)的對(duì)接結(jié)果,以闡明化合物cpd2為何會(huì)抑制SHP2催化活性。
從圖10(a)中可以看到,命中化合物cpd2與藥效團(tuán)模型P3匹配效果較好。具體地說(shuō),2個(gè)疏水特征與cpd2的苯基匹配,解離負(fù)電荷特征與羧基匹配,氫鍵受體與硫氧代噻唑啉上的氧原子匹配,芳香環(huán)特征沒(méi)有匹配到化合物cpd2的結(jié)構(gòu)上。相比較,化合物cpd2與藥效團(tuán)模型P5匹配效果好于其與P3的匹配效果,如圖10(b)。具體來(lái)說(shuō),解離負(fù)電荷特征與羧基匹配,氫鍵受體與硫氧代噻唑啉上的氧原子匹配,氫鍵受體與羥基匹配,疏水特征與甲氧基匹配。圖10(c)顯示了cpd2在SHP2催化活性位點(diǎn)中可能的結(jié)合構(gòu)象,水楊酸結(jié)合在SHP2底物磷酸化部位的結(jié)合位點(diǎn),其中羧基與GLN510和GLY464形成氫鍵相互作用,羥基和CYS459形成氫鍵相互作用,苯環(huán)與ALA461形成疏水相互作用并與LYS366形成正電荷-π相互作用;硫氧代噻唑啉上的氧原子與SER460形成氫鍵相互作用,硫氧代噻唑啉的五元環(huán)與LYS364形成疏水相互作用;鄰二甲氧基苯上的一個(gè)甲氧基與ARG278形成弱氫鍵相互作用?;衔颿pd2與藥效團(tuán)的匹配結(jié)果與其和SHP2催化活性位點(diǎn)結(jié)合形成的相互作用相吻合,說(shuō)明藥效團(tuán)預(yù)測(cè)的cpd2活性構(gòu)象和分子對(duì)接預(yù)測(cè)的活性構(gòu)象基本吻合,化合物cpd2極可能是采取此種構(gòu)象結(jié)合在SHP2催化位點(diǎn)抑制其催化活性。藥效團(tuán)匹配和分子對(duì)接的結(jié)果闡明了化合物cpd2抑制SHP2催化活性的作用機(jī)制。
圖10 (a)和(b)分別是藥效團(tuán)P3和P5與化合物cpd2的匹配結(jié)果(綠色:氫鍵受體,玫紅色:氫鍵供體,藍(lán)色:疏水特征,黃色:芳香環(huán)特征,灰色:排斥球);(c)cpd2在SHP2催化活性位點(diǎn)中可能的結(jié)合構(gòu)象(綠色:氫鍵,淺粉:疏水相互作用,橙色:靜電相互作用,灰綠:弱氫鍵)
本研究利用計(jì)算機(jī)輔助藥物設(shè)計(jì)技術(shù)結(jié)合酶水平活性測(cè)試,發(fā)現(xiàn)了3個(gè)新型SHP2催化位點(diǎn)抑制劑,其中活性最高化合物cpd2具有一定的潛在選擇性。通過(guò)分析cpd2與SHP2催化位點(diǎn)抑制劑3D-QSAR藥效團(tuán)的匹配結(jié)果以及cpd2與SHP2催化活性位點(diǎn)的對(duì)接結(jié)果,發(fā)現(xiàn)藥效團(tuán)預(yù)測(cè)的活性構(gòu)象與分子對(duì)接預(yù)測(cè)的活性構(gòu)象相當(dāng)吻合,且cpd2與藥效團(tuán)關(guān)鍵藥效特征的匹配與其和SHP2催化活性位點(diǎn)關(guān)鍵氨基酸殘基的相互作用基本一致,所以闡明了cpd2抑制SHP2酪氨酸磷酸酶活性的作用機(jī)制。