趙隆麒,李海波,吳啟航,王心倩,孫 妍,占衛(wèi)紅,余曉麗
(武漢輕工大學(xué) 生物與制藥工程學(xué)院,湖北 武漢 430023)
Rv1635c基因及其編碼蛋白質(zhì)基本特性及抗原表位的生物信息學(xué)分析
趙隆麒,李海波,吳啟航,王心倩,孫 妍,占衛(wèi)紅,余曉麗
(武漢輕工大學(xué) 生物與制藥工程學(xué)院,湖北 武漢 430023)
對基因Rv1635c進(jìn)行生物信息學(xué)分析,并對其T、B細(xì)胞的抗原表位性進(jìn)行預(yù)測和篩選。用軟件ProtParam、SingnalP、TMHMM分別對該基因編碼蛋白質(zhì)的理化性質(zhì)、信號肽區(qū)進(jìn)行分析預(yù)測。以NetMHC、Bimas、NetCTL和SYFPEITHI四個(gè)軟件來預(yù)測分析Rv1635c的T細(xì)胞表位。采用IEDB和Bcepred來預(yù)測該基因的B細(xì)胞表位。分析結(jié)果為該基因編碼的蛋白質(zhì)原子總數(shù)8573,氨基酸數(shù)目556,分子質(zhì)量60035.23,理論等電點(diǎn)9.84,理論分子式C2772H4323N747O717S14,估計(jì)半衰期30 h,不穩(wěn)定指數(shù)39;由SignalP分析得到其不含信號肽;根據(jù)TMHMM分析可知Rv1635c為跨膜蛋白;T、B細(xì)胞表位預(yù)測顯示該基因至少含有一個(gè)潛在的T、B細(xì)胞表位,可為未來疾病的預(yù)防、診斷和治療提供理論基礎(chǔ)。
Rv1635c;生物信息學(xué);細(xì)胞表位
結(jié)核病是一種有著長久歷史的傳染病,自1882年德國著名細(xì)菌學(xué)家、醫(yī)學(xué)家羅伯特·科赫發(fā)現(xiàn)結(jié)核分枝桿菌以來,結(jié)核病仍然是僅次于艾滋病的第二大致死傳染病。結(jié)核病疫情雖曾一度得到控制,但隨著養(yǎng)殖業(yè)、畜牧業(yè)的發(fā)展,全球經(jīng)濟(jì)貿(mào)易交流廣泛,以及大量的人口流動(dòng),使得耐多藥及多耐藥結(jié)核菌再次散布開來,導(dǎo)致結(jié)核病疫情在全球范圍內(nèi)卷土重來。近些年來,全球新增加數(shù)萬例耐多藥結(jié)核病,三分之一的患者因結(jié)核病死亡,其中近半數(shù)以上在中國和印度。由此可見我國的結(jié)核病疫情非常嚴(yán)峻。結(jié)核病治療的發(fā)展經(jīng)歷過一個(gè)艱難的過程,從一開始的難以醫(yī)治,到后來氨基水楊酸,異煙肼,利福平,乙胺丁醇的出現(xiàn),讓結(jié)核病的治療出現(xiàn)很大的轉(zhuǎn)機(jī)。而現(xiàn)在耐多藥及多耐藥結(jié)核菌來襲,需要科學(xué)家和醫(yī)學(xué)家聯(lián)手共同研制新型抗結(jié)核藥物。
細(xì)胞壁是細(xì)菌表面最外層的部分,細(xì)菌在侵入宿主細(xì)胞時(shí),需要細(xì)胞壁與之接觸,因此對細(xì)胞壁的成分研究必不可少。脂阿拉伯甘露聚糖(lipoarabinomannan, LAM)是結(jié)核分枝桿菌的主要成分,其核心骨架為甘露聚糖,側(cè)鏈為阿拉伯糖和甘露糖結(jié)構(gòu)[1]。LAM可以介導(dǎo)細(xì)胞免疫和體液免疫。有研究表明,LAM能夠通過對樹突狀細(xì)胞、T細(xì)胞、巨噬細(xì)胞的相互作用來介導(dǎo)細(xì)胞免疫反應(yīng)。而LAM含有的9個(gè)單克隆抗體表位,具有強(qiáng)免疫原性是其能夠介導(dǎo)體液免疫的原因[2]。我國其他科學(xué)家通過對甘露糖修飾的脂阿拉伯甘露聚糖研究后發(fā)現(xiàn)LAM可以通過在體內(nèi)與CD1d結(jié)合誘導(dǎo)調(diào)節(jié)性B細(xì)胞的產(chǎn)生,同時(shí)以B細(xì)胞分泌的IL-10來抑制CD4+T細(xì)胞介導(dǎo)的免疫反應(yīng)[3]。種種實(shí)驗(yàn)說明LAM作為結(jié)核分枝桿菌細(xì)胞壁上的主要糖脂,與結(jié)核分枝桿菌在宿主體內(nèi)的存活有很大的關(guān)系。
到目前為止,已知的LAM至少有兩類,一類是manLAM,來自結(jié)核分枝桿菌H37Rv,另一類是araLAM,來自于結(jié)核分枝桿菌H37Ra。兩者的差別為前者比后者多了甘露糖帽化結(jié)構(gòu)。Rv1635c為結(jié)核分枝桿菌H37Rv上的一段基因序列,根據(jù)有關(guān)資料顯示它可能轉(zhuǎn)錄翻譯成甘露糖基轉(zhuǎn)移酶或與甘露糖基轉(zhuǎn)移酶功能相關(guān)的蛋白。
采用生物信息學(xué)分析軟件,對Rv1635c的理化性質(zhì)、信號肽區(qū)、跨膜區(qū)和T、B細(xì)胞表位進(jìn)行前期預(yù)測。
2.1 分析目的基因Rv1635c理化性質(zhì)
使用在線分析程序ExPASy-Protparam(http://web.expasy.org/protparam/)分析該目的基因所編碼的成熟蛋白質(zhì)的分子質(zhì)量、氨基酸數(shù)目及組成等理化性質(zhì)。
2.2 預(yù)測目的基因Rv1635c信號肽結(jié)構(gòu)
SingnalP(http://www.cbs.dtu.dk/services/SignalP/)用于對目的基因是否含有信號肽的預(yù)測。
2.3 預(yù)測目的基因Rv1635c跨膜結(jié)構(gòu)
TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)用于分析目的基因是否存在跨膜區(qū)。
2.4 預(yù)測目的基因Rv1635c T細(xì)胞表位
2.4.1 預(yù)測目的基因Rv1635c CD4+T細(xì)胞表位
打開網(wǎng)頁,輸入NetMHC[4]的網(wǎng)址http://www.cbs.dtu.dk/services/NetMHCIIpan/。將Rv1635c的氨基酸序列復(fù)制粘貼后輸入方框中,設(shè)置15為aa長度,將等位基因(Select Allele)設(shè)置為DRB1_0101、DRB1_0301、DRB1_0401、DRB1_0701、DRBA_0802、DRB1_0901、DRB1_1101、DRB1_1302、DRB1_1501,設(shè)置親和值(Affinity)作為輸出結(jié)果的排列方式,點(diǎn)擊submit開始預(yù)測。
2.4.2 預(yù)測目的基因Rv1635c CD8+T細(xì)胞表位
打開網(wǎng)頁,輸入NetMHC[5]的網(wǎng)址http://www.cbs.dtu.dk/services/NetMHC/。將Rv1635c的氨基酸序列復(fù)制粘貼后輸入方框中,設(shè)置aa長度為9,選擇HLA-A 0201和HLA-A 0301[6]為等位基因。設(shè)置親和值(Affinity)作為輸出結(jié)果的排列方式,點(diǎn)擊submit開始預(yù)測。
打開網(wǎng)頁,輸入Bimas[7]的網(wǎng)址http://www-bimas.cit.nih.gov/molbio/hla_bind/。選擇HLA分子為A-0202和A3。設(shè)置aa長度為9,輸入序列點(diǎn)擊submit開始運(yùn)行。
打開網(wǎng)頁,輸入NetCTL[8]的網(wǎng)址http://www.cbs.dtu.dk/services/NetCTL/,選擇supertype為A2和A3,Sort by score選擇為Combined score,輸入其氨基酸序列,點(diǎn)擊submit開始運(yùn)行。
打開網(wǎng)頁,輸入SYFPEITHI的網(wǎng)址http://www.syfpeithi.de/bin/MHCServer.dll/EpitopePrediction.htm ,選擇MHC類型為HLA-A-0201和HLA-A-03,設(shè)置9為aa長度,輸入目的基因氨基酸序列,點(diǎn)擊run開始運(yùn)行。
2.5 預(yù)測目的基因Rv1635c B細(xì)胞表位
蛋白質(zhì)所含的某段氨基酸殘基能否作為抗原表位在于它是否存在于該蛋白質(zhì)的表面,根據(jù)這個(gè)性質(zhì)我們通過親水性、表面可及性、柔韌性、抗原性、抗原指數(shù)性以及β轉(zhuǎn)角做分析。在一個(gè)機(jī)體內(nèi),疏水基團(tuán)一般在蛋白質(zhì)內(nèi)部,而親水集團(tuán)通常位于表面,因此以親水性作為方案具有可行性。表面可及性表示蛋白質(zhì)分子所含的氨基酸殘基與溶劑分子接觸的可能性,可以反映出氨基酸殘基在蛋白質(zhì)分子內(nèi)外的分布情況?,F(xiàn)有的柔韌性分析方法是預(yù)測蛋白質(zhì)某些片段的活動(dòng)性,進(jìn)而達(dá)到預(yù)測表位的可能性??乖苑治龇ㄊ前被嵩诳乖瓍^(qū)出現(xiàn)頻率與氨基酸在蛋白質(zhì)中的頻率的比值,作為抗原性刻度值來對其成為抗原的可能性做預(yù)測分析。
這里我們采用的是IEDB和Bcepred兩個(gè)在線分析軟件對Rv1635c B細(xì)胞表位進(jìn)行預(yù)測,IEDB采用的是基于上述原理的五種參數(shù),β轉(zhuǎn)角、表面可及性、柔韌性、抗原性以及親水性。打開IEDB的網(wǎng)站http://tools.immuneepitope.org/bcell/,選取上述五種參數(shù)分別進(jìn)行分析,輸入Rv1635c的氨基酸序列,點(diǎn)擊Submit。Bcepred選取的是抗原傾向性、暴露表面、柔韌性、β轉(zhuǎn)角、親水性、表面可及性和極性這七種參數(shù)進(jìn)行分析。打開Bcepred的網(wǎng)站http://www.imtech.res.in/raghava/bcepred/bcepred_submission.html,輸入氨基酸序列,同時(shí)選擇七項(xiàng)參數(shù),然后點(diǎn)擊Submit sequence。
3.1 分析目的基因Rv1635c理化性質(zhì)
由ExPASy-Protparam軟件分析目的基因Rv1635c后得到,該目的基因編碼的蛋白質(zhì)由556個(gè)氨基酸組成,其原子總數(shù)為8573,分子質(zhì)量為60035.23,預(yù)測理論等電點(diǎn)為9.84,理論分子式C2772H4323N747O717S14,預(yù)測半衰期為30 h,不穩(wěn)定指數(shù)為39。
3.2 預(yù)測目的基因Rv1635c信號肽結(jié)構(gòu)
根據(jù)軟件SingalP的分析,顯示目的基因不含信號肽結(jié)構(gòu)。
3.3 預(yù)測目的基因Rv1635c跨膜結(jié)構(gòu)
由TMHMM的在線分析預(yù)測,顯示基因Rv1635c為跨膜蛋白,具有跨膜結(jié)構(gòu)。
3.4 預(yù)測目的基因Rv1635c T細(xì)胞表位
3.4.1 預(yù)測目的基因Rv1635c CD4+T細(xì)胞表位
由軟件NetMHCIIpan對Rv1635c基因的預(yù)測,得到如表1結(jié)果。根據(jù)表1中的數(shù)據(jù),DRB1_0901肽段結(jié)合數(shù)和Strong Binding數(shù)目都是最多的,因此在DRB1_0901中選擇細(xì)胞表位的可能性較高。32個(gè)Strong Binding為362-376PRYLILTAPAAAVIL,363-377RYLILTAPAAAVILA,361-375YPRYLILTAP
AAAVI,448-462GPIRALLATRPAAFR,447-461PGP
IRALLATRPAAF,295-309HRQYFDHSVPFAILA,542-556ERWQFHYSQVVKSTR,449-463PIRALLATRP
AAFRS,296-310RQYFDHSVPFAILAG,364-378YLI
LTAPAAAVILAV,360-374YYPRYLILTAPAAAV,541-555VERWQFHYSQVVKST,446-460RPGPIRALL
ATRPAA,294-308IHRQYFDHSVPFAIL,450-464IRA
LLATRPAAFRSL,297-311QYFDHSVPFAILAGL,
445-459WRPGPIRALLATRPA,540-554IVERWQF
HYSQVVKS,120-134HGWFAIFPPTELWSR,119-133MHGWFAIFPPTELWS,451-465RALLATRPA
AFRSLI,365-379LILTAPAAAVILAVC,393-407VVF
LLAAAAFPNYFF,359-373IYYPRYLILTAPAAA,392-406GVVFLLAAAAFPNYF,118-132LMHGWFAIFP
PTELW,228-242ALLVPAYATMVPLLA,308-322
LAGLIVAAGIAAHLA,310-324GLIVAAGIAAHLA
GA,309-323AGLIVAAGIAAHLAG,121-135GWF
AIFPPTELWSRL,298-312YFDHSVPFAILAGLI。
表1 目的基因Rv1635c與人類白細(xì)胞抗原結(jié)合表
人類白細(xì)胞抗原(HLA)分子亞型Rv1635c的總肽段數(shù)為339StrongBinding(強(qiáng)結(jié)合)WeakBinding(弱結(jié)合)DRB1_01012781DRB1_0301631DRB1_04011348DRB1_07011953DRB1_08021455DRB1_09013282DRB1_1101461DRB1_1302938DRB1_15011278
3.4.2 預(yù)測目的基因Rv1635c CD8+T細(xì)胞表位
把預(yù)測目的基因的四個(gè)軟件NetMHC、Bimas、NetCTL、SYFPEITHI預(yù)測的結(jié)果進(jìn)行統(tǒng)計(jì)匯總,如表2所示。
表2 四種軟件對CD8+T細(xì)胞表位預(yù)測匯總表
序列序號序列序列得分NetMHC(Affinity)Bimas(Score)NetCTLSYFPEITHI(Score)117—125LLMHGWFAI4.43647.0360.746824217—225LMLSILVSI6.67109.0060.844628103—111SLLGHIDAV7.26290.0250.787231388—396WLIAGVVFL8.751243.0780.693130
3.5 預(yù)測目的基因Rv1635c B細(xì)胞表位
根據(jù)IEDB和Bcepred兩個(gè)軟件的預(yù)測,選取兩軟件中得分較高的幾項(xiàng),最終選擇的序列為243—249,504—510,19—25。分別對照三個(gè)序列在IEDB和Bcepred中的得分(表3),最終得到最可能的B細(xì)胞表位為243—249。
表3 B細(xì)胞表位預(yù)測結(jié)果
參考參數(shù)IEDB分析得分Bcepred分析得分243—249504—51019—25243—249504—51019—25Hyd5.8293.7575.8711.5781.6012.488Access4.7003.9242.3522.0462.2072.137Fle1.1101.0451.0651.7471.2041.296Anti0.9490.9670.9570.6880.508-0.507Turn1.2601.2171.147-0.6600.5460.535Polarity---1.4941.8811.997Exp---2.0242.1801.870
注:Bcepred所取數(shù)據(jù)為7個(gè)數(shù)據(jù)平均值四舍五入。
目前已有的藥物并不能很好地達(dá)到治療結(jié)核病的效果,急需有新的藥物來對抗耐藥型結(jié)核病。長久以來科研工作者致力于尋找新的抗原表位,以此來為新藥的產(chǎn)生尋找契機(jī),雖然已有很多的特異性抗原表位被發(fā)現(xiàn),但在如此嚴(yán)峻的結(jié)核疫情下,需要找到更多新的靶點(diǎn)來制造新藥。
結(jié)核分枝桿菌細(xì)胞壁的主要的成分有脂甘露聚糖,脂阿拉伯甘露聚糖,磷脂酰肌醇甘露糖。磷脂酰肌醇甘露聚糖對細(xì)胞的膜的穩(wěn)定性有一定的作用。脂阿拉伯甘露聚糖是結(jié)核分枝桿菌細(xì)胞壁上的一種重要的糖脂,并且在含有甘露糖帽結(jié)構(gòu)時(shí)能夠?qū)奘杉?xì)胞有作用,從而發(fā)生免疫調(diào)節(jié)反應(yīng)。有研究認(rèn)為,脂阿拉伯甘露聚糖能夠通過抑制吞噬溶酶體合成,從而在吞噬細(xì)胞中生存。抑制原因主要是由于甘露糖基和磷脂酰肌醇錨定基與巨噬細(xì)胞上的某一部分結(jié)合,使吞噬小體的成熟被阻止,達(dá)到抑制吞噬溶酶體合成的目的。根據(jù)已有的研究表明Rv1635c跟甘露糖基轉(zhuǎn)移酶有一定關(guān)系。對于病原菌的抑制通常使用兩種方法,一種是通過其細(xì)胞上的靶位點(diǎn)對病菌進(jìn)行直接抑制,另一種是阻斷它的重要物質(zhì)的代謝過程,從而到達(dá)抑制整個(gè)病菌的目的。Rv1635c與甘露糖基轉(zhuǎn)移酶合成有關(guān),因此對Rv1635c的研究具有一定的意義。
筆者對Rv1635c做的生物信息學(xué)分析是對其基本理化性質(zhì),以及一些可能結(jié)構(gòu)的預(yù)測。對其T細(xì)胞表位做預(yù)測時(shí),由于CD4+T細(xì)胞所選用的軟件只有一個(gè),而CD8+T細(xì)胞所選用的軟件有四個(gè),故因?qū)D8+T細(xì)胞的四個(gè)軟件預(yù)測分析匯總后再與CD4+T細(xì)胞的一個(gè)預(yù)測軟件做比較,最終綜合得出T細(xì)胞表位的預(yù)測結(jié)果。B細(xì)胞表位的上述預(yù)測方法都是基于對線性B細(xì)胞表位進(jìn)行預(yù)測的。由于是線性的,故B細(xì)胞表位所包含的氨基酸數(shù)目是沒有確定數(shù)值的,在此我們選用氨基酸數(shù)目為7以便與統(tǒng)計(jì)。以上結(jié)果均是通過軟件進(jìn)行預(yù)測,存在一定的誤差。生物信息學(xué)只能作為前期尋找方向并不能直觀的說明該基因是否一定可作為抗原表位,若想確認(rèn)還需要進(jìn)一步實(shí)驗(yàn)來支撐。
[1] 彭榮,樂軍,韓敏,等. 結(jié)核分枝桿菌脂阿拉伯甘露聚糖[J]. 生命的化學(xué),2010,(05):704-707.
[2] 王芳,樂軍,彭榮. 胸水中脂阿拉伯甘露聚糖抗原檢測對結(jié)核性胸膜炎的診斷價(jià)值[J]. 檢驗(yàn)醫(yī)學(xué),2012,(03):199-201.
[3] 章曉聯(lián). 結(jié)核分枝桿菌表面脂糖的免疫抑制作用相關(guān)研究[C]//中國免疫學(xué)會(huì)(Chinese Society for Immunology).第九屆全國免疫學(xué)學(xué)術(shù)大會(huì)論文集.北京:中國免疫學(xué)會(huì)(Chinese Society for Immunology):2014:2.
[4] Andreatta M, Karosiene E, Rasmussen M, et al.Accurate pan-specific prediction of peptide-MHC class II binding affinity with improved binding core identification[J]. Immunogenetics,2015,67(11):641-650.
[5] Andreatta M, Nielsen M.Gapped sequence alignment using artificial neural networks: application to the MHC class I system[J].Bioinformatics 2016,32(4):511-7.
[6] 王心倩,孫妍,占衛(wèi)紅,雷航,陳高瞻,余曉麗. 結(jié)核分枝桿菌Rv3607c T細(xì)胞表位分布情況預(yù)測及分析[J]. 武漢輕工大學(xué)學(xué)報(bào),2016(2) : 36-39.
[7] Parker K C,Bednarek M A,Coligan J E. Scheme for ranking potential HLA-A2 binding peptides based on independent binding of individual peptide side-chains.[J]. Journal of immunology,1994,152(1):163-175.
[8] Larsen Mette V,Lundegaard Claus,Lamberth Kasper,et al.Large-scale validation of methods for cytotoxic T-lymphocyte epitope prediction.[J]. BMC Bioinformatics,2007,8(1):424.
[9] 南文龍,金寧一,魯會(huì)軍,等. H5N1亞型禽流感病毒血凝素Th和B細(xì)胞表位預(yù)測及抗原性分析[J]. 中國免疫學(xué)雜志,2009,25(7):630-633.
[10] 葉娟,張舒林,劉文第. 結(jié)核分枝桿菌RD12區(qū)T細(xì)胞表位分布情況預(yù)測及分析[J].上海交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2014,34(1) : 7-12.
[11] 劉海燦. 結(jié)核分枝桿菌八種蛋白抗原中人T/B細(xì)胞抗原表位多態(tài)性研究[D].北京:中國疾病預(yù)防控制中心,2014.
[12] 顧曉玲. 結(jié)核分枝桿菌脂阿拉伯甘露聚糖合成途徑相關(guān)基因的克隆和功能研究[D].上海:復(fù)旦大學(xué),2006.
[13] 楊依麗. α-1,6甘露糖轉(zhuǎn)移酶基因缺陷的畢赤酵母菌在流感疫苗研究中的應(yīng)用[D].北京:中國人民解放軍軍事醫(yī)學(xué)科學(xué)院,2009.
Bioinformatics analysis to characteristics and antigen epitopes of Rv1635c
ZHAOLong-qi,LIHai-bo,WUQi-hang,WANGXin-qian,SUNYan,ZHANWei-hong,YUXiao-li
(School of Biology and Pharmaceutical Engineering,Wuhan Polytechnic University,Wuhan 430023,China)
Analysising gene Rv1635c by using bioinformatics, predicting and screening T/B cell epitope.ProtParam is used to analysis the physical and chemical propertiesthe.SingnalP is used to analysis the signal peptide.And TMHMM is used to transmembrane region of the gene.The four software NetMHC、Bimas、NetCTL and SYFPEITHI is used to predict and analysis the epitope of T cell.IEDB and Bcepred is used to predict and analysis the epitope of B cell.The result shows that the protein coded by the gene comprises an atomic number of 8573,556 amino acid,a molecular mass of 60035.23, a theoretical isoelectric point of 9.84, a theoretical molecular formula of C2772H4323N747O717S14, an estimated half-life of 30h, an instability index of 39;The SignalP shows that there are not signal peptide in it.The TMHMM shows that the gene Rv1635c is a transmembrane protein.The prediction of T/B cell epitope shows that there is one potential epitope at least,which provide basis for future prevention,diagnosis and treatment.
Rv1635c;bioinformatics;cell epitope
2017-03-29.
趙隆麒(1992-),男,碩士研究生,E-mail:q304451487@vip.qq.com.
余曉麗(1963-),女,教授,E-mail:yxll268@126.com.
2095-7386(2017)02-0031-05
10.3969/j.issn.2095-7386.2017.02.006
Q 93
A