陳旭東
組蛋白賴(lài)氨酸甲基化酶(HMTases)可以催化組蛋白的甲基化,參與多種生物學(xué)事件,對(duì)DNA復(fù)制、DNA損傷應(yīng)激、細(xì)胞周期循環(huán)、胞質(zhì)分離及轉(zhuǎn)錄調(diào)節(jié)等多方面有重要作用[1]。HMTases可以特異性地將甲基從s-腺苷甲硫氨酸(AdoMet)轉(zhuǎn)移到組蛋白末端的幾個(gè)特定的賴(lài)氨酸[2]。核受體結(jié)合SET域蛋白家族(NSDs)是HMTases中的一支亞家族,包括NSD1、NSD2(MMSET/WHSC1)和NSD3(WHSC1L1),都包含具有催化活性的SET結(jié)構(gòu)域,該結(jié)構(gòu)域高度保守[3]。NSD1、NSD2及NSD3在小鼠發(fā)育中是必須的,敲除NSD1及NSD2的基因會(huì)導(dǎo)致小鼠死亡[4]。研究表明,NSDs的突變和擴(kuò)增與多種發(fā)育異常疾病和腫瘤相關(guān)[5-6]。NSD1的SET結(jié)構(gòu)域可以特異性地催化H3K36[7]。NSD1的異常表達(dá)及活性改變和多種腫瘤有關(guān)。現(xiàn)已有多項(xiàng)研究以甲基化酶為靶標(biāo),開(kāi)發(fā)抑制藥物,以期待治療相應(yīng)的疾病[8-9]。本研究擬預(yù)測(cè)NSD1催化活性區(qū)域(NSD1-CD)的B細(xì)胞優(yōu)勢(shì)表位,來(lái)為應(yīng)用多肽小片段制備單克隆抗體、表位疫苗及研究其蛋白功能提供重要的依據(jù)。報(bào)道如下。
1.1 NSD1-CD段氨基酸序列的獲取 NSD1全長(zhǎng)氨基酸序列檢索于uniProt蛋白質(zhì)數(shù)據(jù)庫(kù)(http://www.uniprot.org/),NSD1-CD段的范圍參考Qiao等[10]研究。
1.2 NSD1-CD蛋白的二級(jí)結(jié)構(gòu)獲取 自PDB數(shù)據(jù)庫(kù)(https://www.rcsb.org/)獲取NSD1-CD(PDB ID 300I)的三級(jí)結(jié)構(gòu),使用蛋白質(zhì)二級(jí)結(jié)構(gòu)詞典DSSP(Definition of Secondary Structure of Proteins,DSSP)獲取其二級(jí)結(jié)構(gòu)。
1.3 NSD1-CD蛋白親水性、極性、抗原性和表面可及性的預(yù)測(cè) 利用EXPASY服務(wù)器提供的親水性參數(shù)(Hopp&Woods)、極性參數(shù)(Zimmerman)和DNAstar軟件的Protein進(jìn)行的表面可及性參數(shù)(Emini)、抗原性參數(shù)(Jameson-Wolf)和柔韌性參數(shù)(Karplus-Schulz)方法來(lái)對(duì)NSD1-CD蛋白B細(xì)胞表位進(jìn)行預(yù)測(cè)。
1.4 綜合分析 綜合以上預(yù)測(cè)方法,兼顧各項(xiàng)預(yù)測(cè)參數(shù)推斷NSD1蛋白B細(xì)胞表位,采用吳玉章等[11]建立的抗原性指數(shù)(AI)綜合評(píng)判NSD1-CD B細(xì)胞表位的優(yōu)勢(shì)區(qū)域。
1.5 結(jié)合蛋白質(zhì)三級(jí)結(jié)構(gòu)分析 在PYMOL軟件上標(biāo)出優(yōu)勢(shì)表位在NSD1-CD上的位置,在uniProt蛋白質(zhì)數(shù)據(jù)庫(kù)網(wǎng)站上通過(guò)Structure模塊的Toggle controls panel工具進(jìn)行測(cè)距。
2.1 NSD1-CD的氨基酸序列 NSD1全長(zhǎng)為2 696個(gè)氨基酸(長(zhǎng)型),相對(duì)分子質(zhì)量為296.65 kDa。NSD1-CD的范圍是1 852~2 082,其中包含3個(gè)結(jié)構(gòu)域:PRE-SET(AWS)1 890~1 940,SET 1 942~2 059,POST-SET 2 066~2 082;長(zhǎng)為231個(gè)氨基酸,相對(duì)分子質(zhì)量為26.53 kDa,具體序列如下:KELRQLQEDRKNDKKPPPYKHIKVNRPIGRVQIFTADLSEIPRCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEVEIFRTLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDAGPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGAPNCSGFLG。
2.2 NSD1-CD的二級(jí)結(jié)構(gòu) 自PDB獲取NSD1-CD的三級(jí)結(jié)構(gòu),使用蛋白質(zhì)二級(jí)結(jié)構(gòu)詞典DSSP獲取其二級(jí)結(jié)構(gòu),提示NSD1-CD蛋白的二級(jí)結(jié)構(gòu)中以無(wú)規(guī)卷曲為主-螺旋、-轉(zhuǎn)角相對(duì)較少??梢?jiàn)無(wú)規(guī)則卷曲主要位于NSD1全長(zhǎng)N端的1 865~1 870、1 879~1 887、1 893~1 910、1 917~1 926、1 940~1 943、1 949~1 953、1 959~1 966、1 992~1 997、2 022~2 026、2 045~2054及2 057~2082。見(jiàn)封二彩圖1和表1。
表1 NSD1-CD的二級(jí)結(jié)構(gòu)的構(gòu)成比 例(%)
2.3 多參數(shù)預(yù)測(cè)NSD1-CD蛋白表位 按照Hopp& Woods、Zimmerman、Jameson-Wolf、Karplus-Schulz及Emini方案分別預(yù)測(cè)NSD1-CD蛋白的親水性、極性、抗原性、柔韌性和表面可及性。其中高于閾值的肽段即為預(yù)測(cè)的抗原表位(抗原指數(shù)≥0,親水性指數(shù)≥0,表面可及性指數(shù)≥1,極性指數(shù)≥12)。綜合分析NSD1-CD的親水性、極性、柔韌性、表面可及性和抗原性顯示:應(yīng)用不同參數(shù)預(yù)測(cè)的B細(xì)胞抗原表位肽段略有差異,但位于N端的1 856~1 870,1 900~1 902,1 938~1 942,1 957~1 964在多種預(yù)測(cè)方法中一致。見(jiàn)封二彩圖2和表2。
表2 NSD1-CD親水性、極性、柔韌性、抗原性、表面可及性等參數(shù)的預(yù)測(cè)結(jié)果
2.4 NSD1-CD蛋白表位的綜合預(yù)測(cè) 綜合以上預(yù)測(cè)方法及AI計(jì)算方法,計(jì)算NSD1-CD的B細(xì)胞表位平均AI,結(jié)果顯示人NSD1-CD的1 865~1 869、1 959~1 964平均AI較高,提示其可能為B細(xì)胞表位的優(yōu)勢(shì)區(qū)域。見(jiàn)表3。
表3 NSD1-CD B細(xì)胞表位的平均抗原性指數(shù)
2.5 結(jié)合蛋白質(zhì)三級(jí)結(jié)構(gòu)分析 自PDB獲取NSD1-CD(PDB ID 300I)的三級(jí)結(jié)構(gòu)文件,通過(guò)PYMOL標(biāo)記出SET結(jié)構(gòu)域和優(yōu)勢(shì)表位的位置,可見(jiàn)SET結(jié)構(gòu)域形成了一個(gè)“口袋”狀結(jié)構(gòu),口袋中即為其活性區(qū)域,內(nèi)側(cè)可容納一個(gè)AdoMet,可催化其轉(zhuǎn)移甲基至組蛋白上。優(yōu)勢(shì)表位KTDIKK(1 959~1 964)位于SET結(jié)構(gòu)域上,但位于“口袋”的外側(cè)底部,距離活性區(qū)域較遠(yuǎn)(封二彩圖3a)。而優(yōu)勢(shì)表位KKPPP(1 865~1 869)位于PRE-SET(AWS)上,在“口袋”的“口”附近(封二彩圖3b)。在uniProt蛋白質(zhì)數(shù)據(jù)庫(kù)網(wǎng)站上通過(guò)Structure模塊的Toggle controls panel工具進(jìn)行測(cè)距,測(cè)量1 961號(hào)天冬氨酸(位于優(yōu)勢(shì)表位KTDIKK的中央)和AdoMet的距離,結(jié)果為24.22?(封二彩圖4a),測(cè)量1 867號(hào)脯氨酸(位于優(yōu)勢(shì)表位KKPPP的中央)和AdoMet的距離,結(jié)果為13.25?(封二彩圖4b)。
使用生物信息學(xué)預(yù)測(cè)B細(xì)胞表位是現(xiàn)如今廣泛使用且高效方便的方法[12-13],目前有多種B細(xì)胞表位的預(yù)測(cè)方法,但由于各種方法的差異性及局限性,不同方法預(yù)測(cè)的表位差異較大,故研究人員正不斷地改進(jìn)與完善預(yù)測(cè)評(píng)價(jià)體系,使B細(xì)胞表位的預(yù)測(cè)、評(píng)價(jià)標(biāo)準(zhǔn)化。目前得到公認(rèn)的具有較好預(yù)測(cè)結(jié)果的方法有二級(jí)結(jié)構(gòu)、親水性、抗原性、表面可及性等參數(shù)的預(yù)測(cè),本研究將以上參數(shù)與吳玉章等[11]建立的AI相結(jié)合,從而初步地做出科學(xué)、合理的預(yù)測(cè)分析。
由于NSD-1蛋白的甲基轉(zhuǎn)移活性主要是通過(guò)SET結(jié)構(gòu)域?qū)崿F(xiàn)的,本研究通過(guò)截取其中的一部分(NSD-CD),包括包含三個(gè)結(jié)構(gòu)域(PRE-SET 1 890~1940,SET1 942~2 059,POST-SET2066~2082),從而減少預(yù)測(cè)的難度。用多種方法對(duì)其B細(xì)胞表位進(jìn)行預(yù)測(cè),最終得到了2段優(yōu)勢(shì)B細(xì)胞表位,分別位于N端的1 865~1 869及1 959~1 964,其中優(yōu)勢(shì)表位KTDIKK(1 959~1 964)位于SET結(jié)構(gòu)域上,但是距離AdoMet所在的活性區(qū)域較遠(yuǎn),1 961號(hào)天冬氨酸(位于優(yōu)勢(shì)表位KTDIKK的中央)和Ado-Met的距離為24.22?,影響其活性的可能性較?。欢鴥?yōu)勢(shì)表位KKPPP(1 865~1 869)位于PRE-SET(AWS)上,且距離AdoMet所在的活性區(qū)域較近,在uniProt蛋白質(zhì)數(shù)據(jù)庫(kù)網(wǎng)站上通過(guò)Structure模塊的Toggle controls panel工具進(jìn)行測(cè)距,測(cè)量1 867號(hào)脯氨酸(位于優(yōu)勢(shì)表位KKPPP的中央)和AdoMet的距離,結(jié)果為13.25?,對(duì)SET結(jié)構(gòu)域的甲基轉(zhuǎn)移活性有影響的可能性較大。
在Qiao等[10]的研究中,POST-SET結(jié)構(gòu)域如同一個(gè)“蓋子”,覆蓋在SET結(jié)構(gòu)域的活性區(qū)域表面,被認(rèn)為對(duì)其活性有重要作用,具有作為藥物靶點(diǎn)的可能。但本研究顯示POST-SET段親水性及表面可及性較弱,難以預(yù)測(cè)出優(yōu)勢(shì)B細(xì)胞表位。本研究成功預(yù)測(cè)了NSD1的B細(xì)胞優(yōu)勢(shì)表位,為應(yīng)用多肽小片段制備單克隆抗體、表位疫苗及研究其蛋白功能提供重要的依據(jù)。