馮唐鍇
摘 要:為了進(jìn)一步掌握扎伊爾型埃博拉病毒GP蛋白基本特性,文章運(yùn)用生物信息學(xué)的一些專(zhuān)業(yè)在線(xiàn)分析軟件,選取序列號(hào)為AKG65268.1的GP蛋白序列數(shù)據(jù)作為研究對(duì)象,進(jìn)行了深入的生物信息學(xué)分析。主要內(nèi)容包括對(duì)該蛋白的理化性質(zhì)、亞細(xì)胞定位、蛋白功能和二、三級(jí)結(jié)構(gòu)等方面進(jìn)行的分析。希望能夠通過(guò)利用生物信息學(xué)方法,挖掘更多GP蛋白數(shù)據(jù)信息,獲得一些病毒同源性及病毒與受體互作的線(xiàn)索,從而進(jìn)一步探索該病毒進(jìn)化發(fā)展及起源的可能。
關(guān)鍵詞:埃博拉病毒;GP蛋白;生物信息學(xué);扎伊爾型;數(shù)據(jù)庫(kù)
中圖分類(lèi)號(hào):S852.65 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)13-0028-02
Abstract: In order to further grasp the basic characteristics of Ebola-Zaire Virus (ZEBOV) GP (Glycoprotein), the GP (Glycoprotein) sequence data with sequence number of AKG65268.1 was selected as the research object using some professional online analysis software of bioinformatics, and a further bioinformatic analysis was carried out. The main contents include the analysis of physicochemical properties, subcellular localization, protein function and secondary and tertiary structures of the protein. It is hoped that through the use of bioinformatics, we can mine more data of GP (Glycoprotein) and obtain some clues of virus homology and interaction between virus and receptor, so as to further explore the possibility of evolution and origin of the virus.
Keywords: Ebola virus; GP (Glycoprotein); bioinformatics; Ebola-Zaire; database
1 概述
埃博拉病毒(Ebola virus,EBOV)是一種能導(dǎo)致靈長(zhǎng)類(lèi)動(dòng)物患出血熱疾病的致命性病毒,該病毒可分為多種類(lèi)型,其中扎伊爾型埃博拉病毒的致死性最高。目前,多個(gè)埃博拉病毒株系的基因組都已完成測(cè)序[1]。GP蛋白(Glycoprotein)是埃博拉病毒包膜的唯一糖蛋白,參與受體結(jié)合和介導(dǎo)病毒進(jìn)入。本研究期望通過(guò)對(duì)GP蛋白進(jìn)行深入分析,從而進(jìn)一步探索該其進(jìn)化發(fā)展及起源的線(xiàn)索[2]。
2 研究方法
2.1 主要步驟
首先從Genbank數(shù)據(jù)庫(kù)下載典型的GP蛋白序列數(shù)據(jù),其次運(yùn)用生物信息學(xué)在線(xiàn)軟件較為全面的分析GP蛋白的性質(zhì)、結(jié)構(gòu)及功能,最后歸納總結(jié)分析結(jié)果并結(jié)合文獻(xiàn)開(kāi)展分析討論。
2.2 扎伊爾型埃博拉病毒GP蛋白氨基酸序列信息的獲取
扎伊爾型埃博拉病毒GP蛋白的氨基酸序列下載自Genbank數(shù)據(jù)庫(kù),登錄號(hào)(Accession)為AKG65268.1[3],共有676個(gè)氨基酸[1]。
2.3 扎伊爾型GP蛋白生物信息學(xué)分析方法
本研究參考類(lèi)似研究方法[4],選用了ProtParam、CDD、PSORT II等十種在線(xiàn)分析預(yù)測(cè)軟件,分別對(duì)GP蛋白進(jìn)行了生物信息學(xué)分析。
3 在線(xiàn)預(yù)測(cè)結(jié)果與分析
3.1 一級(jí)結(jié)構(gòu)及理化性質(zhì)預(yù)測(cè)
利用ExPASy ProtParam在線(xiàn)軟件分析GP蛋白一級(jí)結(jié)構(gòu)及理化性質(zhì)。結(jié)果顯示該蛋白含原子10375個(gè),組成式為C3298H5127N919O1015S16,相對(duì)分子質(zhì)量74404.5。共有676個(gè)氨基酸,其中丙氨酸最多,50個(gè),占7.4%。負(fù)電荷氨基酸70個(gè),正電荷氨基酸64個(gè)。理論預(yù)測(cè)等電點(diǎn)6.30,中性偏酸,帶正電荷。GP蛋白在280nm波長(zhǎng)下水溶液(M-1cm-1)中的摩爾磷消光系數(shù)為101590(全胱氨酸)或100840(全半胱氨酸)。在哺乳動(dòng)物網(wǎng)狀細(xì)胞中半衰期為30h,指示該蛋白在細(xì)胞中穩(wěn)定??偲骄H水性指數(shù)為-0.374。初步認(rèn)定為親水性蛋白。
3.2 GP蛋白激酶磷酸化修飾位點(diǎn)分析
本研究利用KinasePhos在線(xiàn)軟件預(yù)測(cè)GP蛋白磷酸化位點(diǎn),結(jié)果顯示有9個(gè)絲氨酸激酶作用位點(diǎn)。9個(gè)蘇氨酸激酶作用位點(diǎn)。5個(gè)酪氨酸激酶作用位點(diǎn)。其中263位的絲氨酸和420位的蘇氨酸作為磷酸化位點(diǎn)的預(yù)測(cè)分值(HMM Bit Score)較高,且E值(E-value)較小,都可視為較活躍的磷酸化位點(diǎn)。
3.3 GP蛋白信號(hào)肽預(yù)測(cè)
利用Signal P-4.1 Server 軟件分析GP蛋白(AKG652
68.1)中可能存在的類(lèi)信號(hào)肽片段。GP蛋白氨基酸序列信號(hào)肽預(yù)測(cè)D值最高的片段為1-32號(hào)氨基酸序列,其D=0.317,顯示GP蛋白不含有顯著的信號(hào)肽序列片段。
3.4 GP蛋白亞細(xì)胞定位預(yù)測(cè)
利用PSORT Ⅱ工具對(duì)GP蛋白可能率屬的亞細(xì)胞位置進(jìn)行了預(yù)測(cè)分析,結(jié)果如下:如果假設(shè)GP蛋白為胞內(nèi)蛋白,則其位于細(xì)胞核的概率最大,預(yù)測(cè)分值高達(dá)30.4%,這或許表明該蛋白在結(jié)構(gòu)上和某些核內(nèi)蛋白較為接近。
3.5 GP蛋白親水性/疏水性分析
運(yùn)用ProtScale在線(xiàn)軟件預(yù)測(cè)GP蛋白的親水/疏水特性。該段肽鏈中獲正分氨基酸217個(gè),獲負(fù)分氨基酸451個(gè),結(jié)果顯示該蛋白親水性氨基酸數(shù)目多于疏水性氨基酸數(shù)目。GP蛋白兩端疏水性較強(qiáng),中段親水性較強(qiáng),整體上也傾向于認(rèn)為GP蛋白親水性較強(qiáng)。
3.6 GP蛋白跨膜結(jié)構(gòu)域預(yù)測(cè)
利用TMHMM Server version 2.0在線(xiàn)軟件預(yù)測(cè)GP蛋白是否為跨膜蛋白,結(jié)果顯示該蛋白確實(shí)存在一個(gè)可能性較高的跨膜螺旋區(qū),其涉及的氨基酸期望數(shù)目(AAs)高達(dá)33.28796,可認(rèn)為GP蛋白具有跨膜蛋白特征,其核心跨膜區(qū)范圍為650-672。
3.7 GP蛋白二級(jí)結(jié)構(gòu)分析
利用SOPMA程序預(yù)測(cè)GP蛋白二級(jí)結(jié)構(gòu),結(jié)果顯示蛋白中158個(gè)氨基酸可形成α螺旋(h),占23.37%;169個(gè)氨基酸構(gòu)成β-片層(又稱(chēng)延伸鏈,e),占25.00%;295個(gè)氨基酸組成無(wú)規(guī)則卷曲(c),占43.64%;β-轉(zhuǎn)角(t)為7.99%。
3.8 GP蛋白保守結(jié)構(gòu)域預(yù)測(cè)
用NCBI的保守結(jié)構(gòu)域數(shù)據(jù)庫(kù)(Conserved Domain Database, CDD)分析GP蛋白顯示該其序列中具有一個(gè)顯著的保守結(jié)構(gòu)域:Ebola-like_HR1-HR2(保守結(jié)構(gòu)域編號(hào):cd09850)。該結(jié)構(gòu)域應(yīng)該含有一個(gè)N-末端七肽重復(fù)區(qū)和一個(gè)C-末端七肽重復(fù)區(qū),前者是一個(gè)類(lèi)似于CKS-17的抑制免疫反應(yīng)區(qū),具有一個(gè)含有鏈內(nèi)二硫鍵(C511-C556)的CX6C模體[5]。蛋白從N-末端到HR1-HR2區(qū)域是一個(gè)融合肽(FP),而C-末端則是一個(gè)跨膜區(qū)(MSR)。
3.9 GP蛋白三級(jí)結(jié)構(gòu)預(yù)測(cè)
用SWISSMODEL軟件對(duì)GP蛋白三級(jí)結(jié)構(gòu)進(jìn)行比對(duì)分析,其與5個(gè)三級(jí)結(jié)構(gòu)模型相匹配。其中模型03(編號(hào)5kel.1.A)描述為埃博拉病毒的表面糖蛋白GP1(33-308),模型04(編號(hào)為5jq7.1.B)描述為包膜糖蛋白2(GP2,502-632)。CDD軟件預(yù)測(cè)的埃博拉病毒GP蛋白保守結(jié)構(gòu)域中顯示了三聚體結(jié)構(gòu)。這與文獻(xiàn)中提到的GP蛋白在毒粒表面以三聚體的形式存在相吻合。
3.10 GP蛋白功能預(yù)測(cè)
運(yùn)用Protfun 2.2對(duì)GP蛋白的功能進(jìn)行預(yù)測(cè)。結(jié)果顯示,該蛋白作為細(xì)胞膜組成成分的可能性和機(jī)率最大,可能性(Prob)及機(jī)率(Odds)分值分別為0.794和13.024;其他功能類(lèi)型所得的分值更低,未予列出。該蛋白屬于酶類(lèi),參與免疫反應(yīng)的可能性稍大。總體而言GP蛋白功能上最接近于細(xì)胞中與免疫相關(guān)的膜蛋白。
4 結(jié)束語(yǔ)
GP蛋白是跨膜糖蛋白,與病毒的入侵過(guò)程及細(xì)胞毒性有關(guān),CDD預(yù)測(cè)該GP2中含有非常保守的,構(gòu)成跨膜亞基的七肽重復(fù)區(qū)HR1和HR2結(jié)構(gòu)域:Ebola-like_HR1-HR2(保守結(jié)構(gòu)域編號(hào):cd09850),該結(jié)構(gòu)域在絲狀蛋白中廣泛存在。病毒感染時(shí)會(huì)涉及一個(gè)三聚體的發(fā)夾結(jié)構(gòu)的形成,在這個(gè)結(jié)構(gòu)里,融合肽(插入宿主細(xì)胞膜中)和MSR(插入病毒包膜中)緊緊的靠在一起,絲狀病毒家族病毒可能需要這個(gè)結(jié)構(gòu)進(jìn)行橫向的感染。通過(guò)比較我們可知,SWISSMODEL軟件分析的GP1和GP2三維空間結(jié)構(gòu)分析結(jié)果與文獻(xiàn)中描述的GP蛋白主體結(jié)構(gòu)一致[5]。
參考文獻(xiàn):
[1]Cheng Y,Liu J,Li Y,et al.Ebola Virus Disease:virology, pathogenesis, therapy, and vaccines[J]. Chinese Science Bulletin (Chinese Version),2014,59(30):2889-2899.
[2]王國(guó)戧,趙英政,牛菊霞.埃博拉病毒包膜糖蛋白進(jìn)化特征分析[J].中華臨床感染病雜志,2015,8(2):143-146.
[3]Simon-Loriere E, Faye O, Faye O, etal. Distinct lineages of Ebola virus in Guinea during the 2014 West African epidemic[J]. Nature,2015,524(7563):102-104.
[4]汪艷璐,羅玉萍,李思光,等.南豐蜜橘β-蘿卜素羥化酶的生物信息學(xué)分析[J].江西科學(xué),2007,25(6):688-692.
[5]Lee J E,F(xiàn)usco M L, Hessell A J,etal.Structure of the Ebola virus glycoprotein bound to a human survivor antibody[J].Nature,2008,454(7201):177-182.