陳建興,薩如拉,李 靜,康玉潔,馬曉東,王彩霞
(1.赤峰學(xué)院 生命科學(xué)院,內(nèi)蒙古 赤峰 024000;2.平度市農(nóng)業(yè)局,山東 青島 266700)
黃粉蟲纖溶酶基因生物信息學(xué)初步分析
陳建興1,薩如拉1,李靜1,康玉潔2,馬曉東1,王彩霞1
(1.赤峰學(xué)院生命科學(xué)院,內(nèi)蒙古赤峰024000;2.平度市農(nóng)業(yè)局,山東青島266700)
通過對黃粉蟲(Tenebrio molitor)纖溶酶基因序列進(jìn)行生物信息學(xué)分析,結(jié)果發(fā)現(xiàn)黃粉蟲的纖溶酶基因共包含6個(gè)外顯子和5個(gè)內(nèi)含子.整個(gè)CDS區(qū)共翻譯出258個(gè)氨基酸,這些氨基酸以絲氨酸的比例最高,其次為甘氨酸,最低的為谷氨酸.黃粉蟲纖溶酶基因的編碼存在明顯的密碼子使用偏好,其偏倚程度從天冬酰胺(N)的0%到谷氨酸(E)的100%.預(yù)測黃粉蟲纖溶酶肽鏈的等電點(diǎn)pI在8.34左右,相對分子質(zhì)量為26KD.黃粉蟲纖溶酶多肽鏈?zhǔn)且杂H水區(qū)和疏水區(qū)相互交錯(cuò)出現(xiàn)構(gòu)成的.另外,黃粉蟲纖溶酶蛋白質(zhì)的二級結(jié)構(gòu)多為β折疊,其次為無規(guī)卷曲,螺旋結(jié)構(gòu)所占比重較輕.
黃粉蟲;纖溶酶基因;生物信息學(xué)分析;密碼子使用偏好
黃粉蟲(Tenebrio molitor)俗稱面包蟲,屬于昆蟲綱,鞘翅目,擬步甲科,粉甲屬.原本是一種倉庫和貯藏害蟲,但因其營養(yǎng)成分高,營養(yǎng)含量居各類活體動(dòng)物蛋白飼料之首(被譽(yù)為“蛋白質(zhì)飼料寶庫”),被作為飼料或食品用蟲為人工所飼養(yǎng).黃粉蟲具有生存能力和適應(yīng)能力強(qiáng)、生長發(fā)育快、養(yǎng)殖成本低等優(yōu)點(diǎn),已成為當(dāng)今世界上僅次于養(yǎng)蠶、養(yǎng)蜂業(yè)發(fā)展最快的養(yǎng)蟲業(yè)之一.國內(nèi)外均有近百年的飼養(yǎng)記錄,是一種飼養(yǎng)技術(shù)較為成熟的昆蟲.近年來,黃粉蟲幼蟲活蟲逐步開發(fā)為蝎子、守宮、蛙類、禽類、魚類等各種寵物飼料,幼蟲干粉正在逐步替代家畜家禽飼料中的魚粉,也有部分被開發(fā)為蛋白粉等適用于人類的高級營養(yǎng)品等產(chǎn)品.
黃粉蟲體內(nèi)不僅含有豐富的蛋白質(zhì)、脂肪、氨基酸和其它小分子次生代謝物,同時(shí)還含有豐富的纖維蛋白溶解酶類,分離純化這些纖溶活性蛋白并研究它們的性質(zhì)對于開發(fā)新型溶栓藥物具有重要的意義.為研究昆蟲類胰蛋白酶的提取和性質(zhì),黃明星分別從地鱉蟲和黃粉蟲體內(nèi)分離純化得到了各自的纖溶活性蛋白,并對這些蛋白的理化性質(zhì)進(jìn)行了研究[1].余磊和韓雅莉利用生物信息學(xué)方法分析了地鱉蟲纖溶酶成熟肽編碼序列,模擬了該酶的三維結(jié)構(gòu),為今后進(jìn)一步研究該類酶的纖溶機(jī)理提供了一定的參考[2].為了深入研究黃粉蟲纖溶酶的作用機(jī)理,余磊和韓雅莉利用生物信息學(xué)方法對黃粉蟲纖溶酶進(jìn)行了三維結(jié)構(gòu)模擬與序列分析,認(rèn)為該酶的活性中心是His(組氨酸)、Ser(絲氨酸)和Asp(天冬氨酸)三個(gè)氨基酸殘基,底物結(jié)合部位是Ser(絲氨酸)、Asp(天冬氨酸)和Gly(甘氨酸),從微觀分子水平上確認(rèn)了該酶水解纖維蛋白的機(jī)理是催化Arg(精氨酸)-Lys(賴氨酸)肽鍵的水解[3].冼永權(quán)等以干黑螞蟻為原料,通過(NH4)2SO4分段鹽析、離子交換和層析純化得到一種纖溶活性蛋白,并對該蛋白理化性質(zhì)進(jìn)行了相關(guān)研究[4].葉韻等通過RT-PCR和RACE得到了黃粉蟲幼蟲胰蛋白酶樣絲氨酸蛋白酶基因cDNA全長序列,為胰蛋白酶樣絲氨酸蛋白酶的提取及深入研究奠定了基礎(chǔ)[5].吳艷玲對分離純化得到的黃粉蟲幼蟲纖溶活性蛋白的酶學(xué)性質(zhì)進(jìn)行了研究,并發(fā)現(xiàn)該蛋白在體外能快速選擇性抑制腫瘤細(xì)胞A549的生長[6].張冰研究發(fā)現(xiàn)黃粉蟲纖溶活性蛋白具有一定的免疫原性,并且在血栓模型小鼠體內(nèi)顯示出了良好的體內(nèi)抗血栓作用[7].
本研究通過生物信息學(xué)方法初步分析了黃粉蟲纖溶酶基因的序列特征、密碼子使用、氨基酸構(gòu)成、肽鏈?zhǔn)杷?、蛋白質(zhì)二級結(jié)構(gòu)等信息,為深入研究該酶奠定了一定的基礎(chǔ).
1.1數(shù)據(jù)
本研究應(yīng)用的數(shù)據(jù)是從GenBank中查找到的黃粉蟲纖溶酶基因序列信息:GenBank Accession Number:JN662461[5].
1.2方法
本研究采用DNAMAN軟件,分析黃粉蟲纖溶酶基因序列的密碼子使用情況、氨基酸構(gòu)成和各氨基酸位點(diǎn)的疏水性情況,并對該基因編碼多肽的二級結(jié)構(gòu)進(jìn)行了預(yù)測.
2.1黃粉蟲纖溶酶基因基本構(gòu)成
圖1 黃粉蟲纖溶酶基因和mRNA結(jié)構(gòu)模式圖[3]
黃粉蟲纖溶酶基因的外顯子和內(nèi)含子的大小構(gòu)成情況如圖1,從圖中可看出,黃粉蟲纖溶酶基因共包含6個(gè)外顯子和5個(gè)內(nèi)含子,CDS區(qū)共編碼258個(gè)氨基酸.另外,圖1中顯示出了72(His)、117(Asp)、212(Ser)這三個(gè)Active sites(活性部位)和207(Asp)、228(Ser)、230(Gly)這三個(gè)Substrate binding sites(底物結(jié)合部位).
2.2黃粉蟲纖溶酶基因的密碼子使用情況分析
通過對黃粉蟲纖溶酶基因密碼子使用情況進(jìn)行分析,發(fā)現(xiàn)黃粉蟲纖溶酶基因CDS區(qū)共翻譯出由258個(gè)氨基酸構(gòu)成的多肽,圖2中共含有259個(gè)密碼子,包含一個(gè)終止密碼子UAA.從圖2可看出,除UAG、UGA兩個(gè)終止密碼子未被使用外,亮氨酸的兩個(gè)密碼子(UUA和CUA)、蘇氨酸的兩個(gè)密碼子(ACA和ACG)、精氨酸的兩個(gè)密碼子(CGA和CGG)、脯氨酸的一個(gè)密碼子(CCG)、谷氨酸的一個(gè)密碼子(GAA)、絲氨酸的一個(gè)密碼子(AGU)和甘氨酸的一個(gè)密碼子(GGG)也未被使用.而這幾種氨基酸都是由其余密碼子進(jìn)行編碼的,說明黃粉蟲纖溶酶的編碼存在明顯的密碼子使用偏好.除這幾種明顯的密碼子使用偏倚外,其余密碼子的使用上也存在不同程度的偏好.在其余52個(gè)使用過的密碼子中,使用次數(shù)最多的是編碼甘氨酸(G)的GGU 15次(58‰),其次為編碼絲氨酸(S)的AGC和編碼甘氨酸(G)的GGA都為12次(46‰),而出現(xiàn)次數(shù)最少的是編碼精氨酸(R)的AGA、丙氨酸(A)的GCA(G)、纈氨酸(V)的GUG、谷氨酸(E)的GAG、組氨酸(H)的CAU(C)、賴氨酸(K)的AAG、谷氨酰胺(Q)的CAG和苯丙氨酸(F)的UUU,都分別為1次(4‰).單純從各密碼子占同義密碼的百分率來看,甲硫氨酸(M)和色氨酸(W)都是單密碼子編碼,必然都為100%,但僅存的一個(gè)谷氨酸(E)由GAG來編碼,則其也占100%;其次為編碼谷氨酰胺(Q)的CAA,占91%.除了單密碼子的M和W,其余18種氨基酸用偏倚值即各自密碼子的最高百分率減去最低百分率來度量密碼子使用偏倚程度,發(fā)現(xiàn)偏倚最小的是天冬酰胺(N),兩種密碼子各占50%,偏倚值為0%,偏倚最大的即為谷氨酸(E),偏倚值為100%.
圖2 黃粉蟲纖溶酶基因密碼子使用情況
由表1可以看出,密碼子3個(gè)位置各個(gè)堿基所占的比例差異較大,密碼子第一位以G的比例最大(35%),C的比例最小(16%);密碼子第二位以C的比例最大(30%),A比例最小(18%);密碼子第三位以C的比例最大(40%),G比例最?。?2%).
表1 密碼子各位置堿基使用統(tǒng)計(jì)(%)
2.3黃粉蟲纖溶酶氨基酸構(gòu)成分析
從表2可看出,黃粉蟲纖溶酶基因翻譯的氨基酸種類中絲氨酸(Ser)的比例最高(17.05%,出現(xiàn)44次),其次為甘氨酸(Gly,13.56%,出現(xiàn)35次),最低的為谷氨酸(Glu,0.39%,出現(xiàn)1次).作為水溶性球形蛋白,親水值較低的氨基酸,趨向于堆積在蛋白質(zhì)的內(nèi)部,親水值較高的氨基酸,趨向于構(gòu)成蛋白質(zhì)的外部.預(yù)測的黃粉蟲纖溶酶的相對分子質(zhì)量(MW)為26093.2(≈26KD),等電點(diǎn)pI為8.34,在人體內(nèi)正常生理環(huán)境下,該酶帶正電,而纖維蛋白通常帶負(fù)電荷,所以黃粉蟲纖溶酶很容易靠近纖維蛋白,并與之結(jié)合.因此,黃粉蟲纖溶酶對血栓有一定的靶向作用.
表2 黃粉蟲纖溶酶氨基酸構(gòu)成情況
2.4黃粉蟲纖溶酶疏水性分析
對黃粉蟲纖溶酶基因編碼的258個(gè)氨基酸進(jìn)行了疏水性統(tǒng)計(jì)分析,結(jié)果見圖3,纖溶酶的多肽鏈?zhǔn)且杂H水區(qū)和疏水區(qū)相互交錯(cuò)出現(xiàn)構(gòu)成的.考慮到纖溶酶是一種水溶性蛋白,疏水性較高的區(qū)域估計(jì)趨向于堆積在蛋白質(zhì)內(nèi)部,疏水性較低的區(qū)域,趨向于構(gòu)成蛋白質(zhì)的外部.
圖3 黃粉蟲纖溶酶氨基酸序列各位點(diǎn)的疏水性
2.5黃粉蟲纖溶酶基因氨基酸序列二級結(jié)構(gòu)分析
圖4 黃粉蟲纖溶酶氨基酸序列的二級機(jī)構(gòu)預(yù)測
從圖4可看出,在對黃粉蟲纖溶酶氨基酸序列進(jìn)行二級結(jié)構(gòu)預(yù)測時(shí)發(fā)現(xiàn),β片層結(jié)構(gòu)(Strands,圖4中藍(lán)色曲線)占的比重明顯較高,并且,其概率值普遍較高,多數(shù)在8分以上;其次為紅色的無規(guī)卷曲結(jié)構(gòu)(Coils,圖4中紅色曲線),而出現(xiàn)頻率最小的是α螺旋結(jié)構(gòu)(Helices,圖4中黑色曲線).
3.1討論
纖溶酶(plasmin)是一種能夠?qū)R唤到饫w維蛋白凝膠的蛋白水解酶,是纖溶系統(tǒng)中的一個(gè)重要組份.體內(nèi)凝血和纖溶兩系統(tǒng)是相互依存緊密相聯(lián)的.機(jī)體一旦產(chǎn)生凝血反應(yīng),也幾乎同時(shí)激活了纖溶系統(tǒng),使體內(nèi)多余的血栓移去,從而避免纖維蛋白的過多凝聚,從而引起血栓.本研究主要是通過生物信息學(xué)技術(shù)分析黃粉蟲纖溶酶基因的相關(guān)信息.核酸序列分析是生命科學(xué)研究中的重要部分.利用生物信息學(xué)對核酸序列的結(jié)構(gòu)和功能進(jìn)行研究,可以充分利用現(xiàn)有的核酸及蛋白質(zhì)數(shù)據(jù)庫中的龐大資源,并能夠有效減少進(jìn)一步試驗(yàn)的盲目性.
對黃粉蟲纖溶酶基因的研究雖然已有相關(guān)的生物信息學(xué)研究報(bào)道,但他們研究的重點(diǎn)在黃粉蟲纖溶酶的三維結(jié)構(gòu)預(yù)測,并進(jìn)行了該酶作用機(jī)理的研究[3],本研究重在分析黃粉蟲纖溶酶基因的密碼子使用情況、二級結(jié)構(gòu)預(yù)測等分析.
通過對黃粉蟲纖溶酶基因密碼子使用情況進(jìn)行分析,發(fā)現(xiàn)黃粉蟲纖溶酶基因存在明顯的密碼子使用偏倚,其偏倚程度為天冬酰胺(N)的0%到谷氨酸(E)的100%.驢生長激素基因密碼子編碼的偏倚程度為半胱氨酸(C)的20%到異亮氨酸(I)、組氨酸(H)和天冬酰胺(N)的100%[8];驢另一個(gè)基因朊蛋白基因密碼子編碼的偏倚程度為苯丙氨酸(F)的0%到半胱氨酸(C)和天冬氨酸(D)的100%[9].說明基因密碼子使用偏倚不僅與物種有關(guān),而且與基因也有關(guān)系.
黃粉蟲纖溶酶基因翻譯的氨基酸種類中絲氨酸(Ser)的比例最高(17.05%,出現(xiàn)44次),其次為甘氨酸(Gly,13.56%,出現(xiàn)35次),這與余磊和韓雅莉[3]認(rèn)為該酶的活性中心是His、Ser和Asp三個(gè)氨基酸殘基,以及底物結(jié)合部位是Ser、Asp和Gly不謀而合.
3.2結(jié)論
黃粉蟲纖溶酶基因共包含6個(gè)外顯子和5個(gè)內(nèi)含子,CDS區(qū)共編碼258個(gè)氨基酸.黃粉蟲纖溶酶基因的編碼存在明顯的密碼子使用偏好,其偏倚程度從天冬酰胺(N)的0%到谷氨酸(E)的100%.黃粉蟲纖溶酶基因編碼的氨基酸以絲氨酸的比例最高,其次為甘氨酸,最低的為谷氨酸.黃粉蟲纖溶酶的等電點(diǎn)為8.34,相對分子質(zhì)量為26KD.黃粉蟲纖溶酶多肽鏈?zhǔn)且杂H水區(qū)和疏水區(qū)相互交錯(cuò)出現(xiàn)構(gòu)成的.黃粉蟲纖溶酶的二級結(jié)構(gòu)形式以β片層結(jié)構(gòu)為主,其次為無規(guī)卷曲,螺旋結(jié)構(gòu)所占比重較輕.
〔1〕黃明星.地鱉蟲和黃粉蟲纖溶活性蛋白的分離純化、性質(zhì)研究及其基因克?。跠].廣州:廣東工業(yè)大學(xué),2012.
〔2〕余磊,韓雅莉.地鱉蟲纖溶酶的三維結(jié)構(gòu)模擬與序列分析[J].湖北農(nóng)業(yè)科學(xué),2014,53(5):1185-88.
〔3〕余磊,韓雅莉.黃粉蟲纖溶酶的三維結(jié)構(gòu)模擬與序列分析[J].化學(xué)與生物工程,2013,30(9):32-34,50.
〔4〕冼永權(quán),譚竹鈞,韓雅莉.黑螞蟻纖溶活性蛋白的分離純化及其性質(zhì)研究[J].基因組學(xué)與應(yīng)用生物學(xué),2015,34(2): 284-289.
〔5〕葉韻,韓雅莉,黃明星,等.黃粉蟲胰蛋白酶樣酶基因TMTLSP全長cDNA的克隆和序列分析[J].中國生物化學(xué)與分子生物學(xué)報(bào),2012,28(2):169-176.
〔6〕吳艷玲.黃粉蟲纖溶活性蛋白的酶學(xué)性質(zhì)和抑癌作用研究[D].廣州:廣東工業(yè)大學(xué),2011.
〔7〕張冰.黃粉蟲纖溶活性蛋白免疫原性與抗血栓作用的研究[D].廣州:廣東工業(yè)大學(xué),2014.
〔8〕陳建興,孫玉江,潘慶杰,等.驢生長激素基因序列初步分析[J].湖北農(nóng)業(yè)科學(xué),2015,54(7):1751-1754.
〔9〕陳建興,王銀朝,張慶蛟,等.驢朊蛋白基因序列分析[J].赤峰學(xué)院學(xué)報(bào),2014,30(12):14-16.
Q967
A
1673-260X(2016)07-0005-03
2016-03-24
馬曉東主持2014年赤峰學(xué)院實(shí)踐創(chuàng)新教育項(xiàng)目(1402382)