国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

18種苔蘚植物rbcL基因的密碼子偏性及聚類分析

2020-11-14 12:32:46張家榕雷萬鈞
關(guān)鍵詞:密碼子堿基核酸

張家榕,雷萬鈞

(山西農(nóng)業(yè)大學(xué) 生命科學(xué)學(xué)院,山西 太谷30801)

在生物體傳遞遺傳信息的過程中,作為聯(lián)結(jié)核酸和蛋白質(zhì)的密碼子扮演著重要的角色,是編碼氨基酸及遺傳信息傳遞的基本編碼單位。構(gòu)成基因組的4種核苷酸可形成64種密碼子,除去3個(gè)終止密碼子外,共有61個(gè)密碼子,用來編碼20種氨基酸[1],除甲硫氨酸和色氨酸外,其余18種氨基酸均由2個(gè)或更多密碼子編碼,這些密碼子都具有簡并性,能有效減少有害突變,即使其中的某一堿基被改變,大多數(shù)仍能編碼原來的氨基酸,保證了翻譯的穩(wěn)定性[2],在合成蛋白質(zhì)的過程中,編碼同一個(gè)氨基酸的同義密碼子并不是被平均使用的,有一定的偏好性,存在優(yōu)先使用某種密碼子的現(xiàn)象,即“密碼子偏好性”[3]。密碼子使用偏好性是生物體中廣泛存在的一種自然現(xiàn)象,這種偏好性隨種類的不同而不同[4],同一物種的不同基因間、不同物種的同一基因或同一基因的不同區(qū)域間其密碼子的使用模式均存在差異。自然選擇、遺傳漂移以及基因突變都是引起密碼子使用偏好的重要原因[5];此外堿基組成[6]、GC含量[7]、氨基酸保守性、基因長度、基因表達(dá)水平[8]、蛋白質(zhì)編碼基因的位置等也是影響其形成的一些因素[9,10]。密碼子偏好性是自然選擇、誘變及基因漂變共同作用的一個(gè)平衡狀態(tài),表明這些物種和基因在進(jìn)化過程中受到外界影響不同,故研究密碼子的使用偏性有助于了解物種間的親緣關(guān)系,進(jìn)而揭示一些物種的進(jìn)化規(guī)律[11,12]。

核酮糖-1,5-二磷酸羧化酶/加氧酶(Rubisco)是葉綠體基質(zhì)中的主要可溶性蛋白,它包含8個(gè)相同的大亞基和8個(gè)相同的小亞基,分子量約為12~18 kD[13]。Rubisco對核酮糖-1,5-二磷酸進(jìn)行羧化和加氧,參與光合作用中CO2的固定,是光合固碳過程中最重要的限速酶[14]。Rubisco全酶是由8個(gè)大亞基(rbcL)和8個(gè)小亞基(rbcS)構(gòu)成的異源十六聚體結(jié)構(gòu),其中由葉綠體基因rbcL編碼的大亞基起催化作用,而由細(xì)胞核基因rbcS編碼的小亞基具有調(diào)控RuBPCase活性的功能,全酶的組裝調(diào)節(jié)最終依賴于rbcS的表達(dá)調(diào)控。葉綠體基因rbcL編碼核酮糖-1,5-二磷酸羧化/加氧酶(Rubisco,Rbc)的大亞基,可用于植物系統(tǒng)發(fā)育研究,是因?yàn)槠溆幸恍﹥?yōu)點(diǎn):(1)rbcL基因存在于大單拷貝區(qū)(LSC),一般不發(fā)生基因轉(zhuǎn)變;(2)長度約1 400 bp,能提供比較充足的分子性狀;(3)進(jìn)化速率可用于研究屬及屬以上的分類單位間的進(jìn)化關(guān)系;(4)不存在內(nèi)含子,產(chǎn)物為大約475個(gè)氨基酸,相對保守,因此對rbcL基因的研究尤為重要[15]。

苔蘚植物是植物界的一個(gè)重要分支,在進(jìn)化地位上處于蕨類和藻類之間,具有極其重要的研究意義。從全面性狀考慮,苔蘚植物可能源于某一些綠藻或褐藻,但是它沒有直接進(jìn)化成蕨類,而是成為進(jìn)化關(guān)系中的一個(gè)側(cè)枝[16],本文以苔蘚植物門中有完整rbcL基因CDS核酸序列的具有代表性的18種苔蘚植物為研究對象,以藻類植物鈍形凹頂藻,蕨類植物松葉蕨,單子葉植物水稻,和雙子葉植物擬南芥為外類群,綜合各種軟件,對苔蘚植物的系統(tǒng)發(fā)育進(jìn)行研究,以期獲得研究苔蘚植物系統(tǒng)進(jìn)化有所幫助的工具,同時(shí)也試圖對rbcL基因是否與苔蘚植物登陸后適應(yīng)陸生生活并獲得廣泛適應(yīng)性進(jìn)行初步研究。

1 材料與方法

1.1 數(shù)據(jù)獲取

美國國立生物技術(shù)信息中心(NCBI)數(shù)據(jù)庫中下載18種苔蘚植物及藻類植物鈍形凹頂藻,蕨類植物松葉蕨,單子葉植物水稻,和雙子葉植物擬南芥rbcL基因的完整CDS核酸序列。各種植物在NCBI(http://www.ncbi.nlm.nih.gov)數(shù)據(jù)庫的登錄號見表1。

1.2 方法

1.2.1 同義密碼子的偏好性分析

下載各rbcL基因的全長CDS核酸序列,包括起始密碼子和終止密碼子,用DNAstar,Codon W計(jì)算出反映密碼子偏好性的一系列指標(biāo):(1)有效密碼子數(shù)(effective number of codons,ENC),即某基因從61個(gè)編碼氨基酸密碼子中選擇使用了密碼子的種類個(gè)數(shù),其取值范圍為20~61,小于35表示密碼子使用具有極強(qiáng)的偏好性,大于50表示密碼子使用不具有較強(qiáng)的偏好性[17],可以直接體現(xiàn)出密碼子的使用是否存在偏倚。本研究利用軟件Codon W1.4.2計(jì)算每條CDS核酸序列的ENC。(2)全長基因中各堿基含量及密碼子第三位各堿基含量。(3)同義密碼子相對使用度RSCU(relative synonymous codon usage,RSCU),是指其中一個(gè)同義密碼子的實(shí)際出現(xiàn)次數(shù)與其在完全不存在偏好性時(shí)出現(xiàn)的理論次數(shù)的比值[18],RSCU值偏離1越遠(yuǎn),密碼子使用偏好性越強(qiáng)。(4)密碼子使用頻率(Frequency,F(xiàn)re),指某一密碼子在編碼該基因總密碼子中出現(xiàn)的頻率,它的比值可以用來衡量兩物種間密碼子偏性的相似程度。

表1 rbcL基因序列登錄號Table 1 The accession number of rbcL genes

1.2.2 藻苔與其他物種基因組密碼子偏好性的比較

本文采用在線工具EMBOSS的CUSP程序計(jì)算22種植物rbcL基因CDS區(qū)核酸序列的密碼子使用頻率,并分別計(jì)算苔蘚植物中最原始的藻苔目植物藻苔與其余21種植物的密碼子使用頻率比值,當(dāng)比值小于2.0并且大于0.5時(shí),表明二者密碼子偏好接近,反之偏好性差異較大[19]。

1.2.3 RSCU及CDS的 聚類分析

本文采用2種方法對所研究的CDS核酸序列進(jìn)行聚類。第一種是利用EBI的Clustal W模塊對各植物rbcL基因的CDS核酸序列進(jìn)行聚類分析,選用Neighbour-joining法構(gòu)建系統(tǒng)進(jìn)化樹。第二種方法是利用SPSS 22軟件對密碼子的RSCU值進(jìn)行系統(tǒng)聚類分析。具體操作如下:去除3個(gè)終止密碼子(UAA、UAG、UGA)和只編碼1個(gè)氨基酸的2個(gè)密碼子(UGG、AUG),將其余59個(gè)密碼子的RSCU值作為變量,計(jì)算基因間的距離(歐拉平方距離),利用SPSS 22構(gòu)建距離系數(shù)矩陣,后進(jìn)行聚類分析,構(gòu)建系統(tǒng)進(jìn)化樹[20],歐拉平方距離的計(jì)算公式為:

2 結(jié)果與分析

2.1 rbcL基因堿基組成

本文從苔蘚植物各屬中選擇18個(gè)代表物種,對其rbcL基因的密碼子偏好性進(jìn)行研究,以期獲得研究苔蘚植物系統(tǒng)進(jìn)化有所幫助的工具,進(jìn)而對于基于18種植物rbcL蛋白質(zhì)編碼序列的系統(tǒng)進(jìn)化分析結(jié)果與基于其密碼子使用偏好性的的聚類結(jié)果進(jìn)行了比較。鑒于聚類分析和系統(tǒng)進(jìn)化分析的對應(yīng)性需要在選擇了單、雙子葉高等植物各一物種的基礎(chǔ)上,又引入了一種高等藻類植物和一種低等蕨類植物共4種外來群用于比較研究。各物種rbcL基因的ENC、總堿基構(gòu)成和密碼子末位堿基構(gòu)成見表2和表3。

表2 rbcL基因的堿基構(gòu)成Table 2 Base composition of codons in rbcL gene

有效密碼子數(shù)(ENC),是密碼子使用偏好性的一個(gè)非常直觀的體現(xiàn),可以直接體現(xiàn)出某基因或基因組對密碼子的使用是否存在偏倚。當(dāng)密碼子使用不具有任何偏好性時(shí),61種密碼子將均被使用,且被使用的概率相同,其有效密碼子數(shù)應(yīng)為61;如果有效密碼子數(shù)為20,即表示只選擇了每種氨基酸的數(shù)個(gè)簡并密碼子當(dāng)中的一個(gè)來表達(dá)該氨基酸,意味著密碼子的使用具有絕對的偏好性。全長基因中各堿基含量及密碼子第三位各堿基含量是基因或基因組的一個(gè)重要指標(biāo),其與基因組成、基因表達(dá)、基因組演進(jìn)、基因組上基因密度等具有重要關(guān)系,同時(shí)也是密碼子偏好性產(chǎn)生的主要原因之一。結(jié)果顯示,18種苔蘚植物均存在較強(qiáng)的偏好性,其中,鈍葉木靈蘚、地錢、歐黑蘚、壺苞苔、東亞小穗蘚、小立碗蘚、粗疣連軸蘚等7種苔蘚植物的ENC值小于35,表現(xiàn)出顯著的偏好性。裸蒴苔目的圓葉裸蒴苔ENC大于50,偏好性較低,但分析其A+T和G+C含量可以看出,該物種仍偏好使用A/T堿基,其余17種苔蘚植物的ENC均小于50,A/T含量均較高,A+T>50%,G/C含量相對較低,說明苔蘚植物rbcL基因均偏好使用A/T堿基。由于同義密碼子之間的差別主要體現(xiàn)在第三位堿基上,因此本文分析了密碼子第三位堿基組成,從中發(fā)現(xiàn),A+T含量明顯比G+C高,說明密碼子偏好使用A/T結(jié)尾的密碼子,而以G/C結(jié)尾的密碼子較少。

表3 rbcL基因的第三位堿基構(gòu)成Table 3 Base composition of the third base of codon in rbcL gene

2.2 rbcL基因密碼子使用特性分析

RSCU作為密碼子偏好性的衡量標(biāo)準(zhǔn),已經(jīng)被廣泛接受并使用。同義密碼子的相對使用頻率等于一個(gè)基因中某個(gè)密碼子的實(shí)際使用次數(shù)除以平均使用所有密碼子時(shí)其出現(xiàn)頻率的期望次數(shù)。實(shí)際上是某一密碼子實(shí)際所使用的頻率與理論無偏使用時(shí)的頻率的比值。RSCU等于1時(shí),表示某一密碼子的使用沒有偏好性;若RSCU大于1時(shí),表示該密碼子為同義密碼子中出現(xiàn)頻率較高的,即為偏好性密碼子。計(jì)算公式如下:

各植物rbcL基因的RSCU值如附表1所示,RSCU>1的值已加下劃線標(biāo)出,RSCU>1且密碼子以G/C結(jié)尾的值,加“*”標(biāo)出。18種苔蘚植物和4種外類群植物共22個(gè)物種的rbcL基因共使用了59個(gè)密碼子,觀察RSCU>1的密碼子時(shí)發(fā)現(xiàn),擬小鳳尾蘚、小立碗蘚、圓葉裸蒴苔、粗疣連軸蘚RSCU值大于1的密碼子數(shù)最少,有25個(gè),擬小鳳尾蘚、粗疣連軸蘚全部以A/T結(jié)尾,小立碗蘚、圓葉裸蒴苔以A/T結(jié)尾的分別有23個(gè)和19個(gè),其密碼子使用有很強(qiáng)的偏好性。歐黑蘚東亞變種、東亞小穗蘚、壺苞苔、擬小鳳尾蘚、地錢、鈍葉木靈蘚、紫葉苔目、粗疣連軸蘚、四齒蘚9種苔蘚植物與藻類植物鈍形凹頂藻,RSCU值>1的密碼子第三位全部是A/T,表現(xiàn)出很強(qiáng)的偏好性。TAA、ATT、GTT、GTA、TCT等13個(gè)密碼子在本研究的22個(gè)物種中的RSCU值均>1,是18種苔蘚植物和4種外類植物共同偏愛的密碼子。

2.3 藻苔與其他物種基因組密碼子使用頻率的比較

探究密碼子的使用偏好性對基因的異源表達(dá)、轉(zhuǎn)基因的研究有重要意義。在本研究中考慮到物種演化的發(fā)生規(guī)律,故選擇最為低等的苔蘚植物藻苔作為基準(zhǔn)物種,與其他苔蘚植物以及外類群植物進(jìn)行比較。運(yùn)用CUSP程序計(jì)算出各植物的密碼子使用頻率,并計(jì)算最低等的苔蘚植物藻苔與其他物種的頻率比值,結(jié)果如表4所示,其中A/B、A/C、A/D、A/E、A/F、A/G、A/H、A/I、

A/J、A/K、A/L、A/M、A/N、A/O、A/P、A/Q、A/R、A/S、A/T、A/U、A/V分別代表藻苔與鈍葉木靈蘚、叉苔目、地錢、擬小鳳尾蘚、光緣毛萼苔、歐黑蘚、壺苞苔、彎葉毛錦蘚、圓葉裸蒴苔、泥炭蘚、東亞小穗蘚、四齒蘚、離瓣苔、狹葉葉苔、小立碗蘚、粗疣連軸蘚、紫葉苔目、鈍形凹頂藻、松葉蕨、水稻、擬南芥的密碼子使用頻率比值。結(jié)果顯示,藻苔與其余17種苔蘚植物中的某些種類在密碼子使用頻率上均有相似性,即藻苔rbcL基因的每個(gè)密碼子在其余17種苔蘚植物中都有一種或多種苔蘚中相同密碼子的使用頻率與其相似,即該密碼子的使用頻率的比值十分接近1。其中GCA、GCT、GAT、GAA、GGA、GGT等17個(gè)密碼子在18種苔蘚植物中都有使用,且藻苔與其余各種植物在該17種密碼子的使用上有較強(qiáng)的相似性。

表4 藻苔與各物種密碼子使用頻率比Table 4 The ratio of frequency between Takakia lepidozioides and all other plants

續(xù)表

2.4 聚類分析

2.4.1 基于rbcL基因CDS序列的聚類分析

利用rbcL基因的CDS核酸序列,使用EBI在線工具的Clustal W板塊(http://www.ebi.ac.uk/clustalw/),采用Neighbour-joining法構(gòu)建系統(tǒng)進(jìn)化樹,如圖1所示。從圖中可以看出屬蘚綱的四齒蘚,歐黑蘚東亞變種,小立碗蘚,彎葉毛錦蘚,鈍葉木靈蘚,擬小鳳尾蘚,粗疣連軸蘚,東亞小穗蘚,聚成一類,屬苔綱的毛緣光萼苔,紫葉苔目,狹葉葉苔,叉苔目,離瓣苔,圓葉裸蒴苔聚成一小類,泥炭蘚和藻苔綱的藻苔聚成一小類,最后與蘚綱和苔綱聚成一大類,說明同屬苔蘚植物門的植物進(jìn)化關(guān)系較近,苔蘚植物類群中CDS核酸序列系統(tǒng)進(jìn)化分析與苔蘚植物分類系統(tǒng)相一致。水稻和擬南芥聚成一類,又與鈍形凹頂藻聚成一小類,而松葉蕨未與藻類和高等植物聚為一類,而是單獨(dú)聚為一個(gè)亞類。

圖1 基于各物種rbcL基因CDS核酸的聚類圖Fig.1 Clustal analysis dendrogram of coding secquence for rbcL genes

2.4.2 基于各物種rbcL基因RSCU值的聚類分析

將59個(gè)密碼子的RSCU值作為變量,計(jì)算歐拉平方距離,將要分類的22種植物看成22類,運(yùn)用SPSS 22計(jì)算22條序列兩兩之間的聚類指標(biāo),構(gòu)建距離系數(shù)矩陣表(表5),根據(jù)此矩陣來衡量生物序列之間的密切程度,進(jìn)行聚類分析,構(gòu)建進(jìn)化樹(圖2)。其中擬南芥、水稻、鈍形 凹頂藻與其它物種的距離系數(shù)較大,表明雙子葉植物、單子葉植物、藻類植物與苔蘚植物的密碼子使用差異較大,它們之間的進(jìn)化關(guān)系較遠(yuǎn)。同屬真蘚亞綱的鈍葉木靈蘚、粗疣連軸蘚、東亞小穗蘚、擬小鳳尾蘚聚成一小類,歐黑蘚東亞變種,四齒蘚聚在一起,壺苞苔和地錢聚在一起,離瓣苔、毛緣光萼苔、狹葉葉苔、紫葉苔目聚成一類,叉苔目、藻苔、松葉蕨聚在一起,此分類部分反映了18種苔蘚植物間進(jìn)化關(guān)系,這些小類中彼此之間的距離系數(shù)都較小,表明它們之間的密碼子使用差異較小,這一結(jié)果與劉漢梅等[12]的研究結(jié)果一致,可以用于物種間的分類研究。但結(jié)果中還出現(xiàn)有屬蘚綱的彎葉毛錦蘚與苔綱植物紫葉葉苔等聚在一起,壺苞苔、地錢與蘚綱植物歐黑蘚等聚在一起的現(xiàn)象,這種將部分苔綱植物與蘚綱植物聚類在一起的情況表明,基于rbcL單一基因密碼子使用偏好性聚類分析并不能準(zhǔn)確細(xì)化地反映物種間的系統(tǒng)進(jìn)化關(guān)系,還應(yīng)該綜合其它方面的研究。

3 討論

自從遺傳密碼得到破譯,研究發(fā)現(xiàn)基因表達(dá)與密碼子使用模式的選擇之間有很重要的聯(lián)系。同一物種不同基因或不同物種同一基因中都呈現(xiàn)出不同的密碼子使用偏好,探究密碼子使用模式的選擇及其影響因素對深入了解基因表達(dá)、在表達(dá)系統(tǒng)中引入外源基因具有重要意義。衡量密碼子使用偏性的指標(biāo)有很多,研究中使用較多的是ENC、GC1、GC2、GC3、RSCU。突變、自然選擇、基因長度、tRNA豐度等對密碼子使用模式都有一定的影響。同義密碼子的區(qū)別主要體現(xiàn)在第三位堿基上,第三位堿基的改變通常不影響基因所編碼的蛋白。在自然選擇的作用下,某一氨基酸使用的同義密碼子數(shù)有可能增多,也有可能減少[21]。當(dāng)所研究的基因較短時(shí),密碼子總數(shù)較少,得出的密碼子偏好從統(tǒng)計(jì)學(xué)的角度講具有偶然性,不能反映真實(shí)的偏好情況。mRNA上的密碼子與tRNA上的反密碼子配對結(jié)合是蛋白質(zhì)合成過程中非常重要的一步,當(dāng)tRNA較多時(shí),攜帶的反密碼子種類豐富,有利于其與更多密碼子配對,間接影響密碼子的使用模式。

表5 密碼子偏好性分析矩陣Table 5 Matrix of codon usage bias analysis

圖2 基于rbcL基因密碼子使用度的聚類圖Fig.2 Cluster analysis dendrogram of RSCU for rbcL genes

本文通過對rbcL基因密碼子的用法分析發(fā)現(xiàn),18種苔蘚植物rbcL基因的GC含量較低,尤其是密碼子第三位堿基的GC含量。進(jìn)一步研究發(fā)現(xiàn),各植物每個(gè)氨基酸在同義密碼子的使用上存在偏愛性,均偏好使用A/T結(jié)尾的密碼子。通過對密碼子使用特性的分析,我們發(fā)現(xiàn)各物種密碼子使用模式有一定相似之處。對比苔蘚植物中最低等的藻苔目植物藻苔與其余17種苔蘚植物密碼子使用頻率發(fā)現(xiàn),藻苔與17種苔蘚植物密碼子使用模式均有相似之處,其中藻苔與叉苔目、泥炭蘚的密碼子頻率之比大于2.0或小于0.5的密碼子最少,分別有13個(gè)、11個(gè)。藻苔與4個(gè)外類群的密碼子使用頻率也有相似之處?;贑DS核酸序列的聚類中,屬蘚綱的四齒蘚,歐黑蘚東亞變種,小立碗蘚,彎葉毛錦蘚,鈍葉木靈蘚,擬小鳳尾蘚,粗疣連軸蘚,東亞小穗蘚,聚成一類,屬苔綱的毛緣光萼苔,紫葉苔目,狹葉葉苔,叉苔目,離瓣苔,圓葉裸蒴苔聚成一小類,泥炭蘚和藻苔綱的藻苔聚成一小類,最后與蘚綱和苔綱聚成一大類,較準(zhǔn)確的反映了苔蘚植物門的生物學(xué)分類。密碼子偏好性分析可以為基因表達(dá)選擇更加合適的表達(dá)系統(tǒng)。但基于基因同義密碼子相對使用度RSCU值的聚類與基于蛋白編碼區(qū)CDS核酸序列的聚類結(jié)果存在一定差異,這可能是由于葉綠體基因組遺傳物質(zhì)在進(jìn)化上非常保守,雖然有核基因組的影響,但在單基因密碼子偏性聚類上進(jìn)化關(guān)系并不明顯;也有可能是單基因在進(jìn)化過程中發(fā)生了突變,致使其密碼子使用模式發(fā)生變化,而與真實(shí)的分類地位表現(xiàn)出差異。故基于RSCU的聚類并不一定能反映真實(shí)的系統(tǒng)進(jìn)化關(guān)系,只能作為一種輔助參考。

猜你喜歡
密碼子堿基核酸
測核酸
中華詩詞(2022年9期)2022-07-29 08:33:50
全員核酸
中國慈善家(2022年3期)2022-06-14 22:21:55
第一次做核酸檢測
快樂語文(2021年34期)2022-01-18 06:04:14
應(yīng)用思維進(jìn)階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
核酸檢測
中國(俄文)(2020年8期)2020-11-23 03:37:13
密碼子與反密碼子的本質(zhì)與拓展
中國科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
生命“字母表”迎來4名新成員
生命“字母表”迎來4名新成員
10種藏藥材ccmFN基因片段密碼子偏好性分析
中成藥(2018年7期)2018-08-04 06:04:10
永顺县| 吉木萨尔县| 贺兰县| 台东市| 洛川县| 望城县| 扶余县| 拉萨市| 汤原县| 桃源县| 府谷县| 宁武县| 赫章县| 阜阳市| 浦北县| 德阳市| 化州市| 武城县| 九龙坡区| 乡城县| 惠来县| 梅州市| 亳州市| 喀喇| 钟祥市| 鲜城| 安仁县| 大洼县| 汉源县| 木兰县| 临桂县| 莱芜市| 孝昌县| 喀什市| 漠河县| 河南省| 通州区| 高平市| 马公市| 安宁市| 柘城县|