国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

菜青蟲中腸表達(dá)基因密碼子使用偏好性分析

2020-06-15 09:25:40郭詩琪王威威周嘉裕
生物學(xué)雜志 2020年3期
關(guān)鍵詞:中腸菜青蟲同義

張 嫻, 郭詩琪, 王威威, 廖 海, 周嘉裕

(西南交通大學(xué) 生命科學(xué)與工程學(xué)院, 成都 610031)

菜青蟲(Pierisrapae),菜粉蝶幼蟲,屬鱗翅目粉蝶科,宿主植物廣泛,已知有9科35種,嗜食十字花科的白菜、甘藍(lán)、蘿卜、花椰菜等蔬菜,是危害嚴(yán)重的農(nóng)業(yè)害蟲之一[1]。中腸作為昆蟲消化器官的主要部位,能分泌蛋白酶、淀粉酶和脂肪酶等多種消化酶參與消化食物,同時(shí),由于其結(jié)構(gòu)功能特點(diǎn)還可以作為各種毒素、病原微生物和農(nóng)藥等的作用靶點(diǎn)[2]。因此,研究菜青蟲中腸表達(dá)基因功能不僅有助于闡明其中腸食物消化吸收機(jī)制,還為尋找新的菜青蟲危害防治提供指導(dǎo)意義。

基因異源表達(dá)常作為研究基因功能及其相互作用的重要手段之一,主要分為原核和真核兩種表達(dá)系統(tǒng),其中常用原核表達(dá)系統(tǒng)包括大腸桿菌、乳酸桿菌、枯草芽孢桿菌等表達(dá)系統(tǒng),真核表達(dá)系統(tǒng)包括酵母、昆蟲、植物和哺乳動物等表達(dá)系統(tǒng)[3]。外源蛋白的表達(dá)受多種因素影響,如表達(dá)載體和宿主選擇、基因組成及結(jié)構(gòu)特點(diǎn)、密碼子偏好性、培養(yǎng)條件、蛋白穩(wěn)定性等,其中某一因素都可能造成蛋白表達(dá)困難[4-5]。密碼子偏好性是指編碼同一種氨基酸的同義密碼子的非均衡使用,它是蛋白表達(dá)前需考慮的重要因素之一。在宿主表達(dá)系統(tǒng)中,外源基因稀有密碼子過多會嚴(yán)重影響蛋白表達(dá)水平,甚至造成翻譯的提前終止和移碼突變[4-5]。

因此,本文就實(shí)驗(yàn)室前期獲得的菜青蟲中腸轉(zhuǎn)錄組數(shù)據(jù),提取全長編碼序列,分析其密碼子組成特點(diǎn),探討菜青蟲的密碼子使用偏好性,同時(shí)分析參與蛋白消化的絲氨酸蛋白酶基因在不同宿主的密碼子使用偏好性差異,為菜青蟲絲氨酸蛋白酶異源表達(dá)提供理論依據(jù)。

1 材料與方法

1.1 數(shù)據(jù)來源

研究所采用的菜青蟲中腸轉(zhuǎn)錄組51 457條含完全閱讀框序列為實(shí)驗(yàn)室前期所獲得,該原始數(shù)據(jù)已經(jīng)提交NCBI,登錄號SRP108106[6]。大腸桿菌B、畢赤酵母、煙草、擬南芥、昆蟲High5細(xì)胞和哺乳動物HEK293S細(xì)胞6種宿主密碼子偏好性數(shù)據(jù)來自于Codon Usage Databas(http://www.kazusa.or.jp/codon/)。利用CodonW軟件(http://codonw.sourceforge.net/)計(jì)算編碼區(qū)(Coding sequences,CDS)的GC含量、GC3含量、ENC和RSCU等參數(shù),利用EMBOSS 中的CUSP(http://emboss.bioinformatics.nl/cgi-bin/emboss/cusp)和CHIPS(http://emboss.bioinformatics.nl/cgi-bin/emboss/chips)計(jì)算密碼子使用頻率。

1.2 密碼子使用偏好性分析

篩選菜青蟲中腸轉(zhuǎn)錄組數(shù)據(jù)中含有完全CDS的序列,使用CodonW軟件分析其密碼子的總GC含量、GC3含量、ENC、RSCU等參數(shù)來衡量菜青蟲的密碼子使用偏好性[7-10]。ENC數(shù)值在20~61之間,指密碼子使用偏離隨機(jī)選擇的程度,反映同義密碼子非均衡使用的偏好程度, 其值越接近20,則偏好程度越大。RSCU是指相對于某一個特定的密碼子在編碼對應(yīng)氨基酸的同義密碼子間的相對概率,當(dāng)RSCU>1時(shí),則該密碼子相對使用概率較高;當(dāng)RSCU=1時(shí),則該密碼子沒有使用偏好性;當(dāng)RSCU<1 時(shí), 則該密碼子相對使用概率較低。

1.3 最優(yōu)密碼子分析

根據(jù)Jiang等[11]的方法計(jì)算菜青蟲基因的最優(yōu)密碼子。首先,使用EMBOSS中的CUSP分析確定菜青蟲基因中的高頻密碼子,即密碼子的相對同義密碼子使用頻率單值超過60%或者超過同義密碼子平均占有頻率的1.5倍的密碼子。再將基因序列按照ENC的大小排序,選取上、下限區(qū)域10%的基因編碼區(qū)序列為兩子數(shù)集,分別計(jì)算其RSCU后進(jìn)行比較。如果密碼子RSCU在兩子集間差值大于0.3,且在高表達(dá)基因子集中大于1,在低表達(dá)基因子集中小于1,則認(rèn)為該密碼子是菜青蟲基因的最優(yōu)密碼子[12]。

1.4 絲氨酸蛋白酶基因異源表達(dá)分析

根據(jù)絲氨酸蛋白酶結(jié)構(gòu)特點(diǎn)[13],從菜青蟲中腸轉(zhuǎn)錄組中篩選出22條參與消化絲氨酸蛋白酶基因,包括11個胰凝乳蛋白酶和11個胰蛋白酶,根據(jù)從Codon Usage Database查詢的大腸桿菌B、畢赤酵母、煙草、擬南芥、昆蟲High5細(xì)胞、哺乳動物HEK293S細(xì)胞基因的稀有密碼子,計(jì)算其在6種不同宿主的稀有密碼子比例。

2 結(jié)果與分析

2.1 GC含量分析

篩選菜青蟲中腸轉(zhuǎn)錄組數(shù)據(jù),共獲得51 457條CDS序列,使用CodonW軟件對其進(jìn)行密碼子使用偏好性分析顯示,菜青蟲中腸轉(zhuǎn)錄組中表達(dá)基因的總GC含量在12.80%~84.00%之間,平均總GC含量為40.43%;GC3含量在2.10%~100.00%之間,平均GC3含量為38.16%。以上分析表明,菜青蟲基因密碼子的GC3含量偏好性不高,但不同基因間GC3含量分布范圍比總GC含量分布范圍大。

2.2 有效密碼子數(shù)分析

根據(jù)CodonW對菜青蟲中腸表達(dá)基因分析,ENC數(shù)值在22.81~61.00之間,平均ENC為53.12。根據(jù)Wright[14]和Sharp[15]等的研究,他們以ENC=35作為區(qū)分偏好性強(qiáng)弱的標(biāo)準(zhǔn),菜青蟲中腸表達(dá)基因中有1160條的ENC小于35,占總數(shù)的2.25%,50 297條的ENC大于35,占總數(shù)的97.75%。以上分析表明,菜青蟲基因密碼子使用整體偏好程度不高,但在不同基因間存在明顯密碼子使用偏好性。

2.3 密碼子使用頻率分析及最優(yōu)密碼子分析

使用EMBOSS中的CUSP分析菜青蟲中腸轉(zhuǎn)錄組中51 457條CDS序列密碼子使用頻率,確定了UGU、GAA、UUU、AAA、AUG、AAU、CAA、UGG和UAU為高頻密碼子,且菜青蟲偏好以A/U結(jié)尾的密碼子(表1)。采用高、低表達(dá)最優(yōu)密碼子分析的方法確定菜青蟲中腸轉(zhuǎn)錄組序列的最優(yōu)密碼子為GAA、UUU、AAU、UAU,分別編碼氨基酸Glu,Phe,Asn及Tyr。它們的使用頻率在高、低表達(dá)基因樣本組間差異較大,且隨基因表達(dá)水平升高而增加。

表1 菜青蟲表達(dá)基因的同義密碼子相對使用頻率分析及最優(yōu)密碼子分析

(續(xù)表1 Continued table 1)

氨基酸密碼子FractionFrequency全基因組序列低表達(dá)序列高表達(dá)序列數(shù)量RSCURSCURSCUCAG0.38812.894176 9670.8601ArgAGA0.26317.327237 8001.81.333.6AGG0.16010.546144 7371.80.671.2CGA0.16210.679146 5620.61.331.2CGC0.1409.213126 4380.61.330CGG0.1228.008109 9070.61.330CGU0.1529.995137 1800.600SerAGC0.14011.696160 5290.2700.75AGU0.18315.287209 8081.6402.25UCA0.21417.818244 5491.360.751.5UCC0.13411.163153 2010.2700UCG0.12710.571145 0810.824.50UCU0.20316.907232 0461.640.751.5ThrACA0.35519.546268 26621.332ACC0.18910.441143 29411.331ACG0.1819.991137 1180.51.330ACU0.27515.135207 7160.501ValGUA0.26314.684201 525201.33GUC0.19610.936150 0880.400GUG0.22412.544172 1590.802.67GUU0.31717.715243 1290.800TrpUGG113.238181 686010TyrUAC0.34814.540199 5490.5900.57 UAU?0.65227.255374 0611.4101.43

注:下劃線表示同義密碼子中使用頻率單值超過60%或者超過同義密碼子平均占有頻率的1.5倍的數(shù)值;星號表示最優(yōu)密碼子

2.4 絲氨酸蛋白酶基因異源表達(dá)分析

根據(jù)從Codon Usage Database查詢結(jié)果,大腸桿菌B最稀有的6個密碼子為AGG、AGA、CGA、CCC、CUA和UGU;畢赤酵母最稀有的6個密碼子為CGG、CGC、GCG、CCG、CGA和UGC;煙草最稀有的6個密碼子為CGG、CGC、ACG、CCG、UCG及CGA;擬南芥最稀有的6個密碼子為CGC、CGG、CCC、CGA、UGC和ACG;昆蟲High5細(xì)胞最稀有的6個密碼子為CGG、CGA、GGG、UCG、CUA及AUA;哺乳動物HEK293S細(xì)胞最稀有的6個密碼子為CGU、CGA、UCG、ACG、CCG和GUA。

根據(jù)CodonW軟件分析結(jié)果,菜青蟲51 457條CDS序列中有21個偏好性較強(qiáng)的密碼子,分別是GCU、UGC、GAA、UUU、GGC、CAC、AUU、AAA、CUU、UUA、CCA、CCU、CAA、AGA、AGG、AGU、UCA、UCU、ACA、GUA和UAU。經(jīng)比對發(fā)現(xiàn),AGA、AGG屬于大腸桿菌稀有密碼子,UGC屬于畢赤酵母和擬南芥稀有密碼子,GUA屬于哺乳動物HEK293S細(xì)胞稀有密碼子,如果這4個密碼子在表達(dá)基因中比例偏高,可能會在相應(yīng)宿主中表達(dá)困難;而在煙草和昆蟲High5細(xì)胞的6個最稀有密碼子中均不含有菜青蟲偏好使用的密碼子。因此,與煙草和昆蟲High5細(xì)胞相比,大腸桿菌B、畢赤酵母、擬南芥和哺乳動物HEK293S細(xì)胞與菜青蟲密碼子使用偏好性略有差異,但差別不大。

根據(jù)菜青蟲中腸轉(zhuǎn)錄組數(shù)據(jù)中的基因功能注釋,篩選消化相關(guān)酶基因,再將篩選基因序列經(jīng)菜青蟲基因組定位及結(jié)構(gòu)域驗(yàn)證,去除不確定基因序列,獲得130個絲氨酸蛋白酶,其中胰凝乳蛋白酶11個,胰凝乳蛋白酶同源物6個;胰蛋白酶11個,胰蛋白酶同源物13個(表2)。從菜青蟲基因組中下載這22個胰凝乳蛋白酶和胰蛋白酶基因的CDS序列,分別計(jì)算其與6種宿主的稀有密碼子比例,結(jié)果發(fā)現(xiàn):在胰凝乳蛋白酶中,稀有密碼子最多的是大腸桿菌B,其次是昆蟲High5細(xì)胞和哺乳動物HEK293S細(xì)胞,畢赤酵母和煙草含有稀有密碼子較少;在胰蛋白酶中,稀有密碼子最多的是大腸桿菌B,其次是昆蟲High5細(xì)胞和哺乳動物HEK293S細(xì)胞,煙草含有稀有密碼子較少(圖1)。這個分析結(jié)果與轉(zhuǎn)錄組總體偏好性分析結(jié)果基本吻合,即整體上來說,表達(dá)最困難的宿主是大腸桿菌B,其次是昆蟲High5細(xì)胞和哺乳動物HEK293S細(xì)胞,煙草、畢赤酵母和擬南芥表達(dá)難度相對較低。

圖1 菜青蟲中腸胰凝乳蛋白酶(A)和胰蛋白酶(B)基因在不同表達(dá)宿主中的稀有密碼子比例

表2 菜青蟲中腸表達(dá)的胰凝乳蛋白酶和胰蛋白酶基因

在進(jìn)行基因的異源表達(dá)時(shí),若其含有稀有密碼子比例偏高,可對稀有密碼子進(jìn)行修飾,在保持氨基酸序列不變的前提下,將其替換為適應(yīng)宿主密碼子使用偏好性的同義優(yōu)勢密碼子,來提高基因表達(dá)效率。大腸桿菌B中6個最稀有密碼子分別編碼Arg(AGG、AGA、CGA)、Pro(CCC)、Leu(CUA)及Ile(AUA),可將其修飾為同義的優(yōu)勢密碼子CGC(Arg)、CCG(Pro)、CUG(Leu)和AUU(Ile)。畢赤酵母中6個最稀有密碼子分別編碼Arg(CGG、CGC)、Ala(GCG)、Pro(CCG)、Gly(GGG)及Thr(ACG),可將其修飾為同義的優(yōu)勢密碼子AGA(Arg)、GCU(Ala)、CCA(Pro)、GGU(Gly)和ACU(Thr)。煙草6個最稀有密碼子分別編碼Arg(CGG、CGC)、Thr(ACG)、Pro(CCG)、Ser(UCG)及Ala(GCG),可將其修飾為同義的優(yōu)勢密碼子AGA(Arg)、ACU(Thr)、CCA(Pro)、UCU(Ser)和UCU(Ala)。擬南芥中6個最稀有密碼子分別編碼Arg(CGC、CGG)、Pro(CCC)、Thr(ACG)、Ala(GCG)及Gly(GGC),可將其修飾為同義的優(yōu)勢密碼子AGA(Arg)、CCU(Pro)、ACU(Thr)、GCU(Ala)和GGA(Gly)。昆蟲High5細(xì)胞中6個最稀有密碼子分別編碼Arg(CGG、CGA)、Gly(GGG)、Ser(UCG)、Leu(CUA)及Ile(AUA),可將其修飾為同義的優(yōu)勢密碼子AGA(Arg)、GGU(Gly)、UCU(Ser)、CUG(Leu)和AUC(Ile)。哺乳動物HEK293S細(xì)胞中6個最稀有密碼子分別編碼Arg(CGU、CGA)、Ser(UCG)、Thr(ACG)、Pro(CCG)和Val(GUA),可將其修飾為同義的優(yōu)勢密碼子AGA(Arg)、AGC (Ser)、ACC (Thr)、CCC (Pro)及GUG (Val)。

3 討論與結(jié)論

密碼子使用偏好性是生物體中廣泛存在的自然現(xiàn)象,不同物種間、同一物種的不同基因間、同一基因的不同區(qū)域間均存在密碼子使用的特異性,影響其形成因素包括堿基組成和GC含量、氨基酸保守性、翻譯選擇、基因長度、tRNAs豐度、蛋白質(zhì)編碼基因位置、密碼子堿基上下組成等[16-17]。密碼子使用偏好性研究具有很多運(yùn)用意義,如基因定位功能、提高基因的異源表達(dá)、影響蛋白質(zhì)的結(jié)構(gòu)與功能、翻譯起始效應(yīng)、預(yù)測進(jìn)化規(guī)律等[16-17]。

以菜青蟲中腸轉(zhuǎn)錄組51 457條全長CDS序列為數(shù)據(jù),使用CodonW、CUSP和CHIPS軟件對其密碼子偏愛性分析發(fā)現(xiàn),菜青蟲中腸轉(zhuǎn)錄組中表達(dá)基因的總GC含量在12.80%~84.00%之間,平均總GC含量為40.43%,GC3含量在2.1%~100%之間,平均GC3含量為38.16%,表明菜青蟲的GC3含量偏好性不高,但不同基因間GC3含量分布范圍與總GC含量相比分布范圍較大;ENC數(shù)值在22.81~61.00之間,平均ENC為53.12,其中有1160條的ENC小于35,占總數(shù)的2.25%,50 297條的ENC大于35,占總數(shù)的97.75%,說明菜青蟲中腸表達(dá)基因密碼子整體偏好性程度不高,但不同基因之間存在明顯密碼子使用偏好性;通過高頻密碼子分析法和相對同義密碼子使用概率確定GAA、UUU、AAU及UAU密碼子為菜青蟲的最優(yōu)密碼子,分別編碼為Glu、Phe、Asn和Tyr,它們的使用頻率在高、低表達(dá)基因樣本組間差異較大,且隨基因表達(dá)水平升高而增加。

通過計(jì)算比較菜青蟲轉(zhuǎn)錄組序列中參與蛋白消化的22條絲氨酸蛋白酶基因在6種不同宿主(大腸桿菌B、畢赤酵母、煙草、擬南芥、昆蟲High5細(xì)胞和哺乳動物HEK293S細(xì)胞)中密碼子使用偏好性差異,發(fā)現(xiàn)整體上表達(dá)最困難宿主是大腸桿菌B,其次是昆蟲High5細(xì)胞和哺乳動物HEK293S細(xì)胞,煙草、畢赤酵母和擬南芥表達(dá)難度相對較低;同種酶類基因間在不同宿主中稀有密碼子差異較大,且有些基因與6種宿主密碼子使用均有較大差異。因此,菜青蟲絲氨酸蛋白酶在進(jìn)行異源表達(dá)時(shí),除了選擇高效穩(wěn)定的表達(dá)宿主,還需考慮外源基因與宿主密碼子使用偏好性差異,將其中的稀有密碼子修飾為優(yōu)勢密碼子。

猜你喜歡
中腸菜青蟲同義
Dale Carnegie
卷心菜上的菜青蟲
我有菜青蟲般的一生
都市(2022年12期)2022-08-15 00:46:36
西夏文《同義》重復(fù)字研究
西夏學(xué)(2019年1期)2019-02-10 06:22:08
西夏文《同義》考釋三則
西夏學(xué)(2018年2期)2018-05-15 11:25:30
黃星天牛中腸中內(nèi)切葡聚糖酶的鑒定與酶活性測定
杠柳新苷P和E對粘蟲和小地老虎中腸3種解毒酶的影響
小勺貓的睡前故事
大黑鰓金龜消化與解毒相關(guān)基因的組織表達(dá)研究
腸轉(zhuǎn)位缺失并中腸扭轉(zhuǎn)1例
青神县| 哈尔滨市| 神农架林区| 南投市| 咸丰县| 丹东市| 湄潭县| 上犹县| 永登县| 百色市| 丰镇市| 肥城市| 萨嘎县| 闸北区| 连城县| 固镇县| 胶州市| 滨州市| 定陶县| 乾安县| 宁晋县| 平凉市| 和政县| 江门市| 长治市| 双牌县| 宣武区| 凌云县| 天水市| 信丰县| 定西市| 临安市| 皋兰县| 新沂市| 武汉市| 宜宾市| 莎车县| 抚顺县| 平罗县| 莫力| 怀柔区|