唐玉娟 趙英 黃國(guó)弟 付海天 宋恩亮 李日旺 金剛
摘 ?要:本研究利用CodonW、SPSS、Excel軟件對(duì)芒果葉綠體基因組55條蛋白編碼序列的密碼子開(kāi)展了中性繪圖、PR2-plot、ENC-plot和最優(yōu)密碼子分析。結(jié)果表明,芒果葉綠體基因的有效密碼子(ENC)偏好性不強(qiáng),分布在35.38~56.56;GC3s含量26.29%,說(shuō)明密碼子末位堿基以A/T結(jié)尾為主;ENC與GC3極顯著相關(guān)。相對(duì)同義密碼子分析,RSCU>1的密碼子有31個(gè),其中,以A和T結(jié)尾的29個(gè),表明A和T是基因組偏愛(ài)的密碼子。中性繪圖、PR2-plot和ENC-plot分析表明,芒果葉綠體基因組密碼子使用偏好受突變和選擇等因素共同作用的影響。通過(guò)高頻率密碼子和高表達(dá)優(yōu)越密碼子相結(jié)合的方法進(jìn)行分析,篩選出主要以A和T結(jié)尾的芒果葉綠體基因組最優(yōu)密碼子19個(gè),分別是GCT、TGT、GAA、TTT、GGT、CAT、ATT、AAA、TTA、CCT、CAA、AGA、CGA、CGT、AGT、TCT、ACT、GTA 和CTT。
關(guān)鍵詞:芒果;葉綠體基因組;密碼子偏好性;最優(yōu)密碼子
Abstract: Codon usages of 55 chloroplast genes in mango were analyzed to obtain to the results of neutrality plot, PR2-plot ENC-plot and optimal codons by using CodoW, SPSS and SPSS softwares. The results showed that the effective number of codons (ENC) ranged from 35.38 to 56.56, indicating that the condon bias was weak. GC base pair content in the third condon position of chloroplast genomes in mango was 26.29%, indicating that the third base in the codon was terminated by A/T. Significant correlation was found between ENC and GC3.There were 31 codons with relative synonymous codon usage greater than 1, of which 29 codons ending with A and T, indicating that the third codon preferred A and T.According to neutrality plot analysis, PR2-plot and ENC-plot analysis, mutational pressure combined with selection influenced the pattern of synonymous codon usage across genes in mango chloroplast genomes. In addition 19 codons were affirmed as the optimal codons by using analysis of high-frequency codons and the high expression codons, ending with A and T. There were GCT, TGT, GAA, TTT, GGT, CAT, ATT, AAA, TTA, CCT, CAA, AGA, CGA, CGT, AGT, TCT, ACT, GTA and CTT.
Keywords: Mango; chloroplast; codon usage bias; optimal codons
遺傳密碼又稱密碼子,編碼同種氨基酸的密碼子稱為同義密碼。同義密碼子提供了基因表達(dá)和蛋白質(zhì)進(jìn)化間的聯(lián)系,維持著生物體遺傳密碼的功能完整性。密碼子的使用頻率不同,有的密碼子使用頻率高于其他同義密碼子,形成了密碼子偏好性[1]。不同物種密碼子偏性不同,但同一種物種或者親緣關(guān)系相近的物種間卻使用了相似的偏好性[2]。密碼子偏好性的使用在基因表達(dá)水平、共翻譯蛋白質(zhì)折疊、mRNA的穩(wěn)定性等[3],反映了翻譯優(yōu)化中突變偏好與自然選擇的平衡[4],因此研究物種密碼子偏好性,為探究物種的進(jìn)化模式與其在系統(tǒng)發(fā)育史上的地位提供依據(jù)。
葉綠體是植物特有的細(xì)胞器,具有高度的保守性及較低的進(jìn)化率,是研究植物條形碼最有潛力的基因序列[5-6],在植物系統(tǒng)進(jìn)化、物種鑒定等方面廣泛應(yīng)用[7-8]。完整的葉綠體基因組為認(rèn)識(shí)進(jìn)化和自然選擇提供機(jī)理性的啟示。不同基因組有其特有的密碼子使用模式,密碼子使用模式的分析有助于理解生物體適應(yīng)性及其在系統(tǒng)發(fā)育進(jìn)化史的地位[9],有益于基因表達(dá)水平的調(diào)控與基因的改造[10]。
芒果(Mangifera indicate L.)是著名的熱帶水果,享有“熱帶水果之王”之美稱[11]。外觀秀麗、果香四溢,含有豐富的維生素、蛋白質(zhì)、胡蘿卜素等,營(yíng)養(yǎng)價(jià)值極高,深受大眾的喜愛(ài),是南方熱區(qū)果農(nóng)增值創(chuàng)收的主要水果之一[12]。目前為止尚未發(fā)現(xiàn)芒果密碼子使用偏好性相關(guān)方面的研究報(bào)道,本研究通過(guò)對(duì)芒果葉綠體基因組密碼子組成及相關(guān)參數(shù)進(jìn)行分析,首次闡明芒果密碼子使用偏好性的特點(diǎn),確定芒果葉綠體基因組的最優(yōu)密碼子及密碼子偏好性發(fā)生的因素,為芒果資源保護(hù)、性狀改良及葉綠體基因組的應(yīng)用和研究提供參考依據(jù)。
1 ?材料與方法
1.1 ?基因序列
芒果葉綠體基因組GenBank登錄號(hào)為CM021858(https://www.ncbi.nlm.nih.gov/),共60個(gè)基因序列。為保證結(jié)果的準(zhǔn)確性[13],剔除重復(fù)且長(zhǎng)度小于300 bp的編碼序列,選擇以ATG為起始密碼子,以TAA、TAG、TGA為終止密碼子的序列,最終選出55條序列進(jìn)行分析。
1.2 ?中性繪圖分析
統(tǒng)計(jì)密碼子3個(gè)位置上的GC含量,以GC12為縱坐標(biāo),GC3為橫坐標(biāo)繪制散點(diǎn)圖進(jìn)行相關(guān)性分析。
1.3 ?相對(duì)同義密碼子使用度分析
利用CodonW軟件對(duì)相對(duì)同義密碼子使用度(relative synonymous codon usage, RSCU)進(jìn)行分析。RSCU表示一個(gè)密碼子的實(shí)際使用頻率與無(wú)偏好性時(shí)理論使用頻率間的比值。RSCU<1時(shí),表示該密碼子的使用頻率低于其他同義密碼子;RSCU>1時(shí),表示該密碼子的使用頻率高于其他同義密碼子;當(dāng)RSCU=1時(shí)表示該密碼子沒(méi)有偏好性[14]。
1.4 ?ENC-plot繪圖分析
以有效密碼子ENC(effective number of condon)為縱坐標(biāo),GC3s為橫坐標(biāo),繪制散點(diǎn)圖,計(jì)算公式:ENC=2+GC3s+29/[GC3s2+(1-GC3s)2]。結(jié)合ENC比值頻率對(duì)差異進(jìn)行量化分析[15]。
1.5 ?PR2-plot繪圖分析
計(jì)算各密碼子第3位上的A、T、C、G的含量,以A3/(A3+T3)為縱坐標(biāo),以G3/(G3+C3)為橫坐標(biāo)進(jìn)行PR2的偏倚分析。
1.6 ?最優(yōu)密碼子分析
最優(yōu)密碼子以芒果ENC值為偏性參考標(biāo)準(zhǔn),選擇最低和最高10%的基因構(gòu)建高低偏性庫(kù),分別計(jì)算兩組的RSCU值與△RSCU值,將RSCU>1的密碼子確定為高頻率密碼子,△RSCU>0.08的密碼子定義為高表達(dá)密碼子。同時(shí)滿足上述2種條件的密碼子定義為最優(yōu)密碼子[16]。
2 ?結(jié)果與分析
2.1 ?密碼子使用的總體特征
對(duì)55條芒果葉綠體基因組的密碼序列的堿基組成進(jìn)行分析(表1),葉綠體基因組密碼子3個(gè)位置上的GC平均含量為37.94%。從密碼子不同位置的堿基組成來(lái)看,GC在密碼子的分布不均勻,GC1、GC2、GC3含量分別為47.14%、39.73%和29.35%,第3位上的GC含量低于前兩位,分布趨勢(shì)為GC1>GC2>GC3。GC3s的含量26.29%,表明密碼子中的第3位堿基以A/T結(jié)尾為主。
ENC表示偏性的強(qiáng)弱,其理論取值范圍為21~61,其值越小表示同義密碼子的偏性越強(qiáng),反之同義密碼子的偏性越弱。當(dāng)ENC值為20時(shí),表示同義密碼子完全偏倚;當(dāng)ENC值為60時(shí),表示同義密碼子不偏倚[13]。芒果葉綠體基因組編碼序列的ENC值均(48.14)值大于40,分布于35.38~56.56之間,由此可以判斷芒果葉綠體基因組密碼子的偏性不強(qiáng)。
芒果葉綠體基因密碼子參數(shù)的相關(guān)分析顯示GCall和GC1、GC2、GC3極顯著相關(guān)(表2)。GC1和GC2、GC3顯著相關(guān),說(shuō)明芒果葉綠體基因密碼子3個(gè)位置上的堿基組成相似。ENC值與GC2顯著負(fù)相關(guān),與GC3極顯著相關(guān),表明第2、3位上的堿基組成,特別是第3位對(duì)密碼子的偏好性影響較大。
2.2 ?中性繪圖分析
芒果葉綠體基因組GC12的取值范圍在0.33~0.56之間,GC3的取值范圍在0.18~0.32之間,基因全部落在中線對(duì)角線上方(圖1)。GC12與GC3的相關(guān)系數(shù)0.279(表2),雙尾檢測(cè)相關(guān)性不顯著,回歸系數(shù)(曲線斜率)為0.3544,相關(guān)性較弱。結(jié)合圖1和表2表明芒果葉綠體基因組密碼子第1、2位和第3位堿基之間關(guān)聯(lián)性不大,自然選擇在芒果葉綠體基因組密碼子偏好使用中起主要作用。
2.3 ?ENC-plot繪圖分析
ENC-plot繪圖以ENC比值[(預(yù)期ENC值~實(shí)際ENC值)/預(yù)期ENC值]和ENC比值頻數(shù)判斷偏好性影響因素,揭示ENC與GC3s的關(guān)系,反映堿基組對(duì)密碼子偏好性的影響程度[15-19]?;蜃鴺?biāo)點(diǎn)離標(biāo)準(zhǔn)曲線的距離近且數(shù)量較多說(shuō)明偏好性主要受到突變的影響;反之說(shuō)明偏好性受選擇的影響較大。圖2結(jié)合表3顯示60%共33個(gè)基因分布在–0.05~0.05之間,這33個(gè)基因的實(shí)際ENC值與預(yù)期ENC值接近,與標(biāo)準(zhǔn)曲線的距離較近,;分布在–0.05~0.05之外的基因有22個(gè),這22個(gè)基因與預(yù)期ENC值較遠(yuǎn),在標(biāo)準(zhǔn)曲線較遠(yuǎn)的位置。說(shuō)明芒果基因組密碼子偏好性與GC3的差異有關(guān),突變對(duì)芒果葉綠體基因組密碼子偏好性的影響較大。
2.4 ?PR2-plot繪圖分析
PR2-plot繪圖通過(guò)分析密碼子第3位堿基的組成關(guān)系,揭示密碼子使用偏好性的影響因素。由圖3可以看出芒果基因在4個(gè)區(qū)域內(nèi)分布不均勻,多數(shù)分布于平面圖的左下方。T和C在密碼子第3位出現(xiàn)的頻率較高,G與C、A與T的使用頻率不相等,T的使用頻率高于A,C的使用頻率高于G,嘧啶的使用頻率高于嘌呤,說(shuō)明突變不是影響芒果密碼子使用偏好性的唯一因素,選擇等其他因素對(duì)芒果密碼子使用偏好性也產(chǎn)生一定的影響。
2.5 ?相對(duì)同義密碼子使用度分析
利用codonW 軟件對(duì)芒果55條基因序列的RSCU值進(jìn)行計(jì)算(表4)。結(jié)果顯示RSCU>1的密碼子共31個(gè),出現(xiàn)頻率相對(duì)較高的是以A(13個(gè))或T(16個(gè))結(jié)尾的密碼子,是芒果基因組偏愛(ài);以G(1個(gè))或C(1個(gè))結(jié)尾的密碼子出現(xiàn)的頻率較低且RSCU值多小于1,說(shuō)明這些是基因組非偏好的密碼子。
2.6 ?最優(yōu)密碼子分析
芒果葉綠體基因組,以△RSCU≥0.08為標(biāo)準(zhǔn)確定了24個(gè)高表達(dá)密碼子,以A結(jié)尾的8個(gè),以T結(jié)尾的12個(gè),以C結(jié)尾的3個(gè),以G結(jié)尾的1個(gè)。結(jié)合芒果葉綠體基因的相對(duì)同義密碼子使用度和同義密碼子相對(duì)使用度(表4和表5),確定19個(gè)最優(yōu)密碼子,分別是GCT、TGT、GAA、TTT、GGT、CAT、ATT、AAA、TTA、CCT、CAA、AGA、CGA、CGT、AGT、TCT、ACT、GTA、CTT。其中以A結(jié)尾的7個(gè),以T結(jié)尾的12個(gè),暗示芒果葉綠體基因組偏愛(ài)使用以A和T堿基結(jié)尾的密碼子。
3 ?討論
隨著分子生物學(xué)的飛速發(fā)展,測(cè)序技術(shù)的持續(xù)更新,基因組數(shù)據(jù)的應(yīng)用為密碼子的偏性研究提供了支持。研究發(fā)現(xiàn)GC含量可反映密碼子使用偏性突變的整體趨勢(shì)[20],密碼子第3位堿基GC3含量可作為密碼子偏好性分析的主要依據(jù)[21]。本研究通過(guò)對(duì)篩選出的芒果葉綠體基因組的55條密碼序列進(jìn)行分析發(fā)現(xiàn),GC3s含量為26.29%,暗示密碼子偏好使用末位堿基為A/T的密碼子。結(jié)果與劍麻[22]、杉木[23]偏好使用末位堿基為A/T的密碼子相似。ENC可判斷基因表達(dá)量的高低,當(dāng)其大于35時(shí)基因表達(dá)水平較低,在編碼氨基酸時(shí),對(duì)密碼子的選用偏好性也弱。芒果葉綠體基因組ENC均值為48.14,表明葉綠體基因密碼子偏好性不強(qiáng)。ENC越小,基因的密碼子使用偏好性越強(qiáng),越偏好使用A/T結(jié)尾的密碼子[24],這與本實(shí)驗(yàn)RSCU等數(shù)據(jù)揭示的芒果葉綠體基因組第3位密碼子富含A/T的結(jié)論相一致。突變和自然選擇是影響密碼子偏好性使用的主要因素,本研究通過(guò)中性繪圖分析顯示,選擇是密碼子偏好性的主要影響因素;通過(guò)ENC-plot繪圖分析則發(fā)現(xiàn),突變是密碼子偏好性的主要影響因素,本研究認(rèn)為芒果葉綠體基因組密碼子的偏好性受突變和選擇2種因素的影響應(yīng)該是相對(duì)均衡的。
同義密碼子的偏好使用影響基因的表達(dá),最優(yōu)密碼子可以提高翻譯的效率和準(zhǔn)確率[25]。有研究認(rèn)為,雙子葉植物偏好使用A/T結(jié)尾的密碼子,單子葉植物偏好使用G/C結(jié)尾的密碼子[26],但也有不同的觀點(diǎn),如有偏好使用A/T結(jié)尾的單子葉植物如糜子[27]、霍山石斛[28]等。芒果屬于雙子葉植物,本研究通過(guò)高表達(dá)優(yōu)越密碼子和高頻密碼子相結(jié)合的方法篩選出的19個(gè)最優(yōu)密碼子均以A或T結(jié)尾,表明芒果葉綠體基因組偏愛(ài)使用以A和T堿基結(jié)尾的密碼子,結(jié)論與雙子葉偏好使用A/T結(jié)尾的密碼子類似。
本研究系統(tǒng)的對(duì)芒果葉綠體基因組密碼子的偏好性及影響因素進(jìn)行了研究,發(fā)現(xiàn)芒果葉綠體基因組偏好使用以A/T結(jié)尾密碼子;突變和選擇均衡的影響密碼子的偏好性使用;研究還確定了19個(gè)芒果葉綠體基因組最優(yōu)密碼子。研究結(jié)果為今后芒果分子系統(tǒng)進(jìn)化、遺傳轉(zhuǎn)化、葉綠體基因工程等方面的研究奠定基礎(chǔ),為芒果在葉綠體基因組水平上進(jìn)行分類、性狀改良等提供參考依據(jù)。
參考文獻(xiàn)
Grantham R, Gautier C, Gouy M. Codon frequencies in 119 individual genes confirm consistent choices of degenerate bases according to genome type[J]. Nucleic Acids Research, 1980, 8(9): 1893-1912.
Grantham R, Gautier C, Gou M. et al. Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research, 1980, 8(1): 49-62.
文 ?言. 川桑密碼子使用模式與密碼子分析工具的開(kāi)發(fā)[D]. 重慶: 西南大學(xué), 2017.
Wu X M, Wu S F, Ren D M, et al. The analysis method and progress in the study of codon bias[J]. Hereditas, 2007, 29(4): 420-426.
Gielly L, Taberlet P. The use of chloroplast DNA to resolve p;ant phylogeny: noncoding versus rbcL sequences[J]. Molecular Biology and Evolution, 1994(11): 769-777.
Shaw J, Lickey E B, Beck J T, et al. The tortoise and the hare:relative utility of 21 noncoding chloroplast DNA sequences for phylogenetic analysis[J]. American Jourmal of Botany, 2005(92): 142-166.
李 ?汐, 祝 ?銘, 孫延霞, 等. 基于葉綠體rps16基因和核基因ITS片段研究肉蓯蓉屬系統(tǒng)位置[J]. 植物科學(xué)學(xué)報(bào), 2012, 30(5): 431-436.
李丹丹, 郭水良, 于 ?晶, 等. 基于4個(gè)葉綠體基因識(shí)別蓑蘚屬(Macromitrium)植物的可行性研究[J]. 植物科學(xué)學(xué)報(bào), 2013, 31(1): 23-33.
張?jiān)聵s. 禾本科葉綠體基因組密碼子使用模式及紫莖澤蘭葉綠體RNA編輯分析[D]. 楊凌: 西北農(nóng)林科技大學(xué), 2013.
劉 ?柱, 胡新文, 劉志昕. 基因及表達(dá)調(diào)控中遺傳密碼子選擇的偏愛(ài)性[J]. 生命科學(xué)研究, 2011, 5(3): 106-109.
付海天, 趙 ?英. 芒果SRAP-PCR反應(yīng)體系的優(yōu)化與退火溫度的篩選[J]. 福建農(nóng)業(yè)學(xué)報(bào), 2014, 29(4): 345-349.
唐瑩瑩, 黃國(guó)弟, 陳永森, 等. 杧果新品種‘桂熱杧3號(hào)對(duì)炭疽病和細(xì)菌性黑斑病的抗性評(píng)價(jià)初報(bào)[J]. 中國(guó)南方果樹(shù), 2020, 49(3): 35-39, 45.
Rosenberg M S, Subramanian S, Kumar S. Patterns of transitional mutation biases within and among mammalian genomes[J]. Molecular Biology and Evolution, 2003, 20(6): 988-993.
馮海悅, 張 ?羽, 吳正常, 等. 13種哺乳動(dòng)物MUC4基因密碼子使用模式分析[J]. 農(nóng)業(yè)生物技術(shù)學(xué)報(bào), 2018, 26(9): 1546-1556.
Sueoka N. Near homogeneity of PR2-bias fingerprints in the human genome and their implications in phylogenetic analyses[J]. Journal of Molecular Evolution, 2001, 53(4-5): 469-476.
原曉龍, 李云琴, 張勁峰, 等. 降香黃檀葉綠體基因組密碼子偏好性分析[J/OL]. 廣西植物, 2021, 41(4): 622-630.
劉 ?慧, 王夢(mèng)醒, 岳文杰, 等. 糜子葉綠體基因組密碼子使用偏性的分析[J]. 植物科學(xué)學(xué)報(bào), 2017, 35(3): 362-371.
Sueoka N. Directional mutation pressure and neutral molecular evolution[J]. Proceedings of the National Academy of Sciences of the United States of America, 1988, 85(8): 2653-2657.
李慧姬, 吉雪花, 朱冉冉, 等. 10種植物PSY基因密碼子使用偏好性分析, 西北農(nóng)業(yè)學(xué)報(bào), 2020,29(2): 276-284.
Zhou M, Long W, Li X. Analysis of synomous codon usage in chloroplast genome of Populus alba[J]. Journal of Forestry Research, 2008, 19(4): 293-297.
馮瑞云, 梅 ?超, 王慧杰, 等. 籽粒莧葉綠體基因組密碼子偏好性分析[J]. 中國(guó)草地學(xué)報(bào), 2019, 41(4): 8-15.
金 ?剛, 覃 ?旭, 龍凌云, 等. 劍麻葉綠體基因組編碼序列密碼子的使用特征[J]. 福建農(nóng)林大學(xué)學(xué)報(bào), 2018, 47(6): 705-710.
鄭薇瑋, 陳金慧, 郝兆東, 等. 杉木等5種針葉樹(shù)葉葉綠體密碼子偏好性分析[J]. 分子植物育種, 2016, 14(5): 1091-1097.
雷 ?慧, 李 ?鴿, 王娜玉. 金蓮花葉綠體基因組密碼子偏好性分析[J]. 山西農(nóng)業(yè)科學(xué), 2019, 47(8): 1300-1305, 1445.
Sharp P M, Matassi G. Codon usage and genome evolution[J]. Current Opinion in Genetics & Development, 1994, 4(6): 851-860.
Wang L J, Roossinck M J. Comparative analysis of expressed sequences reveals a conserved pattern of optimal codon usage in plants[J]. Plant Molecular Biology, 2006, 61(4-5): 699-710.
劉 ?慧, 王夢(mèng)醒, 岳文杰, 等. 糜子葉綠體基因組密碼子使用偏性的分析[J]. 植物科學(xué)學(xué)報(bào), 2017, 3(3): 362-371.
謝析穎, 李 ?蓉, 林玉玲, 等. 霍山石斛轉(zhuǎn)錄因子MYB1R1密碼子選用偏好性分析[J]. 分子植物育種, 2017, 15(5): 1683-1690.
責(zé)任編輯:白 ?凈