萬露露 范敦錦 王中煊 龔娜 丁祥青 陳世品 蘇小青
摘要:為了確定杜鵑(Rhododendron simsii)葉綠體基因組密碼子的使用模式,為杜鵑花科葉綠體基因組學研究提供參考依據(jù),繪制了杜鵑葉綠體基因組圖譜,對三大功能基因進行分類,統(tǒng)計各蛋白編碼基因密碼子的3位堿基的GC含量、有效密碼子數(shù)、同義密碼子相對使用度,開展中性繪圖分析和PR2-plot等分析,并系統(tǒng)分析影響杜鵑密碼子偏好性的各種因素,從而篩選出了最優(yōu)密碼子。結(jié)果顯示,杜鵑葉綠體基因組全長206 912 bp,大單拷貝區(qū)為110 234 bp,小單拷貝區(qū)為 2 606 bp,反向重復區(qū)為47 036 bp。蛋白編碼序列GC含量為36%,密碼子第3位偏好使用A/U,ENC值范圍為37.48~57.13,說明其密碼子使用偏好性較弱;中性繪圖分析顯示GC12和GC3的相關(guān)系數(shù)為0.255,擬合的回歸系數(shù)為0.345;PR2-plot分析顯示G>C,T>A;有30個密碼子的RSCU值大于1,以U或A結(jié)尾的有29個,影響其密碼子使用偏好性的最主要為自然選擇壓力;最終鑒定出最優(yōu)密碼子8個,分別為GCA、GAU、UUG、CCA、CGU、UCA、GUA、UAU??梢?,杜鵑葉綠體基因組具典型的雙鏈環(huán)狀構(gòu)造,密碼子偏好性較弱,主要受到自然和突變的共同影響。
關(guān)鍵詞:杜鵑;葉綠體基因組;密碼子偏好性;最優(yōu)密碼子
中圖分類號:S685.210.32? 文獻標志碼:A
文章編號:1002-1302(2023)13-0054-06
杜鵑(Rhododendron simsii),隸屬杜鵑花科(EricaceaeJuss)杜鵑屬(Rhododendron)映山紅亞屬(subg. Tsutsusi),其花冠為漏斗形,美艷異常,極具觀賞價值,且花期較長,是重要的育種資源。對杜鵑的研究主要集中在組培快繁、雜交育種、重要基因家族分析等方面[1-3],尚未對其密碼子的使用偏好性進行分析。葉綠體基因組具有結(jié)構(gòu)穩(wěn)定、進化保守的優(yōu)點,特定物種更傾向于使用特定的密碼子,對特定基因的功能和表達水平產(chǎn)生一定的影響[4-6]。本研究分析杜鵑密碼子使用偏好的影響因素,鑒定其最優(yōu)密碼子,揭示杜鵑葉綠體密碼子的使用模式,旨在為杜鵑葉綠體基因組在良種選育中的應用提供參考,為其后續(xù)的育種研究以及品種優(yōu)化提供幫助。
1 材料與方法
1.1 葉綠體基因組密碼子基因序列獲取
從NCBI數(shù)據(jù)庫中,下載杜鵑葉綠體基因組序列(登錄號:MT239364.1),參照Wang等的研究[7],按照國際慣例對CDS進行篩選,以便用于后續(xù)葉綠體密碼子使用偏好性的分析。
1.2 葉綠體基因組密碼子的相關(guān)參數(shù)分析
計算密碼子的各種相關(guān)參數(shù)。具體計算方法參照江淑珍等的研究[8]。
1.3 葉綠體基因組密碼子繪圖分析
以(GC3,GC12)坐標點繪制散點圖以及添加趨勢線。中性繪圖與PR2-plot偏倚分析具體方法參照龍凌云等的研究[9]。
1.4 葉綠體基因組最優(yōu)密碼子分析
將44條基因的ENC值按由大至小降序排列,構(gòu)建高、低表達庫。采用兩端篩選的各5條基因,并按照李江飛等的方法[10],定義最優(yōu)密碼子。
2 結(jié)果與分析
2.1 葉綠體基因組的基因組成
杜鵑葉綠體的基因組全長206 912 bp,具典型的雙鏈環(huán)狀構(gòu)造,大單拷貝區(qū)為110 234 bp,小單拷貝區(qū)為 2 606 bp,反向重復區(qū)分別為47 036 bp(圖 1)。相比于其他被子植物,杜鵑葉綠體基因組較大,IR區(qū)顯著擴張而SSC區(qū)顯著縮小,2個IR區(qū)相互對稱,且被LSC區(qū)和SSC區(qū)隔開,IR區(qū)的擴張是導致其葉綠體基因組較大的主要因素。葉綠體的GC含量為36%,與其他綠色植物的葉綠體含量比較接近。一共預測注釋到136個基因,包括90個蛋白編碼基因、38個tRNA基因、8個rRNA基因。在大多數(shù)情況下,AUG被用作CDS的起始密碼子,盡管在某些植物葉綠體基因組的某些CDS的起始密碼子中有時會觀察到RNA編輯。在本研究中,ndhD以GUG為起始密碼子,atpB和atpE存在4 bp重疊,psbC和psbD存在53 bp重疊,rps3和rpl22存在16 bp重疊[11]。
將葉綠體基因的不同功能分為3個大類,依次為光合作用能力、自我復制能力、其他和功能未知。光合作用的相關(guān)基因分為6個小類(7個光系統(tǒng)Ⅰ的基因、15個光系統(tǒng)Ⅱ的基因、17個NADH-脫氫酶基因、7個細胞色素b/f復合物基因、6個ATP合酶基因、1個羧化酶基因);自我復制的相關(guān)基因分為5個小類(10個核糖體大亞基的基因、14個核糖體小亞基的基因、4個RNA聚合酶基因、38個tRNA基因、8個rRNA基因);其他基因分為5個小類(表 1)。葉綠體基因組中包含2個內(nèi)含子(如rps12、ycf3),有些基因具有2個拷貝(如psaC、psaI等),均符合杜鵑屬葉綠體基因組的規(guī)律。
2.2 密碼子主要相關(guān)指數(shù)分析
密碼子組成分析表明,杜鵑葉綠體基因組蛋白編碼基因密碼子GC1 (46.78%)>GC2 (39.58%)>GC3 (27.75%),說明GC在不同位置的分布是不均勻的,但多以堿基 A、T 結(jié)尾。各基因有效密碼子數(shù)(ENC)介于37.48~57.13之間,平均值(46.63)遠大于35,且有32條基因的有效密碼子數(shù)值大于45,表明其使用偏性較弱(表2)。
對密碼子各參數(shù)之間的相關(guān)性進行了研究,結(jié)果(表3)表明:ENC與密碼子數(shù)目極顯著相關(guān),相關(guān)系數(shù)為1.000,說明基因序列大小顯著影響密碼子偏好性; GCall與GC1、 GC2、 GC3之間極顯著相關(guān) (P<0.01),這表明其葉綠體基因組密碼子堿基組成的相似度較高;GC1與ENC極顯著相關(guān)(P<0.01),說明GC1對密碼子偏好性存在較強影響。
對各氨基酸同義密碼子相對使用度進行數(shù)據(jù)分析(表4),得出:氨基酸RSCU>1的密碼子一共有30個,其中29個密碼子以堿基A、U結(jié)尾,所占比例較高(97%)。表明杜鵑葉綠體基因組偏好使用以A/U結(jié)尾的密碼子;相反,RSCU<1的密碼子,則偏好使用G/C結(jié)尾。
2.3 中性繪圖分析
對密碼子進行中性繪圖分析,結(jié)果(圖2)顯示:縱坐標GC12介于0.34~0.54,橫坐標GC3介于0.22~0.51。所有基因均處于坐標軸對角線上方,密碼子GC12 與密碼子GC3的相關(guān)性表現(xiàn)為不顯著,相關(guān)系數(shù)為0.255,擬合的回歸系數(shù)為0.345,說明密碼子的3個堿基可能有著一定差異。由此可以推斷,杜鵑葉綠體基因組的密碼子偏好性受到自然選擇的影響較大。
2.4 PR2-plot 分析
偏倚分析(圖3)表明:杜鵑在4個區(qū)域葉綠體基因分布是不均衡的,且大多數(shù)基因散布在整個平面圖的右下方,這表明4個堿基有不一樣的使用頻率,即G>C,T>A;因此,可以推斷在杜鵑葉綠體基因組密碼子使用模式上,其偏好性很可能會受到突變和自然選擇的共同作用。
2.5 最優(yōu)密碼子分析
根據(jù)ΔRSCU>0.08為高表達密碼子,已篩選出杜鵑葉綠體基因組有27個,其高表達密碼子中有5個是以堿基A結(jié)尾,3個是以堿基U結(jié)尾,9個是以堿基G結(jié)尾,10個是以堿基C結(jié)尾(表 5)。綜合考慮杜鵑葉綠體基因RSCU的分析結(jié)果(表4),最終得到最優(yōu)密碼子8個,分別為 GCA、GAU、UUG、CCA、CGU、UCA、GUA、UAU, 其中以堿基A結(jié)尾的有4個,U堿基結(jié)尾有3個,堿基G結(jié)尾僅有1個。
3 討論與結(jié)論
在杜鵑葉綠體基因組中,密碼子第3位的GC含量遠遠少于前2位堿基,說明其更偏好使用A/U,也表明了杜鵑葉綠體基因組密碼子使用模式在進化上相對保守,遵循了雙子葉植物葉綠體基因組密碼子的第3位高A/U偏好性的規(guī)律。杜鵑葉綠體基因組中存在8個最優(yōu)密碼子,分別為 GCA、GAU、UUG、CCA、CGU、UCA、GUA、UAU,其中3個以U結(jié)尾,4個以A結(jié)尾,1個以G結(jié)尾。一般認為富含A/U堿基的序列中,最優(yōu)密碼子也同樣富含A/U,而富含G/C堿基的序列中,最優(yōu)密碼子也同樣富含G/C[12],本研究證實了這一結(jié)論。同時,如果密碼子的偏好性與物種親緣性高度相關(guān),或者親緣關(guān)系更接近,那么2種生物之間的密碼子會有更相近的使用模式。賈守寧等研究表明,杜鵑屬9個物種中密碼子的偏好性均保持高度一致[13],也同樣論證了這個觀點。
在不同物種中密碼子偏好性形成的主要影響因子有較大差異。倒提壺(Cynoglossum amabile)葉綠體基因組密碼子的偏好性主要受自然選擇壓力的影響[14],這可能因為倒提壺是生長在陸地上的高等植物,在進化上比較保守。蒺藜苜蓿(Medicago truncatula)主要是受到突變壓力的影響[15],這可能是因為其植株的再生時間比較短,具有大量的突變體,生物多樣性較高。芒果(Mangifera indicate)同時受自然選擇和突變壓力的共同作用[16],這可能是由于芒果喜高溫干燥的氣候,但是不耐嚴寒低溫。鐮翅羊耳蒜(Liparis bootanensis)除了受自然選擇、突變壓力的作用,可能還受堿基組成等其他因素的影響[17],因為它是附生草本,生長環(huán)境變動較大,受到多種因素的影響。本研究中性繪圖結(jié)果表明,杜鵑葉綠體基因組密碼子的偏好性主要是受自然選擇的作用。PR2-plot分析表明,葉綠體基因組的密碼子偏好也可能受到突變壓力和自然選擇的共同作用;表明杜鵑葉綠體基因組密碼子的偏好性不是單個因素作用的結(jié)果,可能受到突變壓力、自然選擇共同因子的作用。
因杜鵑屬植物具有典型頻繁的自然雜交現(xiàn)象,當2個遺傳背景差異較大的個體產(chǎn)生可育雜交后代時,基因組發(fā)生了重組與整合,這可能會導致該屬植物的葉綠體基因組結(jié)構(gòu)發(fā)生變異。前人研究表明,杜鵑屬植物大多地處嚴寒低氧的高原地帶,受環(huán)境脅迫的影響,可能發(fā)生基因的部分缺失和復制[13]。杜鵑屬的不同物種間基因缺失的情況差別很大,說明了杜鵑屬植物葉綠體基因組具有較高的突變性。Shen等比較了8個不同杜鵑花科的葉綠體基因組,發(fā)現(xiàn)其基因組大小、結(jié)構(gòu)和GC含量存在顯著差異,這種差異被認為主要是由維持生活的營養(yǎng)方式不同導致的(自養(yǎng)和異養(yǎng))[18]。這表明,由于存在自然雜交和不同生活方式的緣故,可能會導致杜鵑和其他杜鵑屬植物的葉綠體基因組密碼子的偏好性存在相對較大偏差。劉仁林的研究表明,映山紅亞屬很可能由耳葉杜鵑(R. auriculatum)亞組最近的祖先類群演化而來,這些祖先類群大多分布于中國廣西壯族自治區(qū)、廣東省和湖南省南部;但映山紅亞屬的分布區(qū)十分廣闊,除了新疆、寧夏2地至今沒有記載之外,全國其他各省、市均有分布[19]。杜鵑在演化過程中,要適應各種自然環(huán)境變化導致的自然選擇的巨大壓力,這可能是杜鵑葉綠體基因組密碼子使用偏好性主要受自然選擇影響的原因所在;具有廣闊的分布范圍,是葉綠體基因組密碼子使用偏好性主要受自然選擇影響的植物的一種共性。
探究密碼子偏好性的使用模式,獲得最優(yōu)密碼子,具有十分重要的意義。以最優(yōu)密碼子為依據(jù),設計葉綠體基因的表達載體,能夠更有效地提升基因在葉綠體基因組中的表達效率和水平[20-21]。另外,已知密碼子的使用模式有助于推斷和預測未知基因的表達和功能[22],從而對基因工程和育種提供參考。本研究揭示了杜鵑葉綠體基因組密碼子的使用模式和最優(yōu)密碼子,旨在為杜鵑及其近緣物種的密碼子優(yōu)化提供理論依據(jù),為后續(xù)的育種研究以及品種優(yōu)化提供幫助。
參考文獻:
[1]胡計紅,陳桂信,楊惠婷,等. 屏南龍源四季杜鵑古樹組培快繁技術(shù)研究[J]. 熱帶作物學報,2020,41(4):755-763.
[2]蘇學鵬. 四季杜鵑紅山茶與山茶種間雜交技術(shù)要點淺析[J]. 南方農(nóng)業(yè),2020,14(32):219-220.
[3]楊 麗,嚴露露,李慧娥,等. 映山紅杜鵑MADS基因家族的鑒定與分析[J]. 分子植物育種,2021,19(19):6290-6301.
[4]羅 雪,嚴賢春,侯 哲,等. 珙桐葉綠體基因組密碼子使用偏好性分析[J/OL]. 分子植物育種. [2022-09-06]. https://kns.cnki.net/kcms/detail/46.1068.S.20220830.1837.009.html.
[5]朱靈芝,朱沛煌,李 榮,等. 馬尾松PmDXR基因密碼子偏好性分析[J]. 林業(yè)科學研究,2021,34(2):102-113.
[6]陸奇豐,駱文華,黃至歡.兩種梧桐葉綠體基因組密碼子使用偏性分析[J]. 廣西植物,2020,40(2):173-183.
[7]Wang Z J,Xu B B,Li B,et al. Comparative analysis of codon usage patterns in chloroplast genomes of six Euphorbiaceae species[J]. PeerJ,2020,8:e8251.
[8]江淑珍,連 輝,熊遠芳,等. 米櫧葉綠體基因組密碼子偏好性分析[J/OL]. 分子植物育.[2022-06-30]. http://kns.cnki.net/kcms/detail/46.1068.S.20210722.1131.006.html.
[9]龍凌云,黃秋偉,李慧敏,等. 金柑葉綠體基因組密碼子使用偏好性分析[J/OL]. 分子植物育種. (2022-05-20)[2022-07-01]. https://kns.cnki.net/kcms/detail/46.1068.S.20220520.1055.002.html.
[10]李江飛,王 瑜,顏廷雨,等. 云南油杉葉綠體基因組密碼子偏好性分析[J]. 中南林業(yè)科技大學學報,2022,42(4):30-39.
[11]Li H E,Guo Q,Li Q,et al. Long-reads reveal that Rhododendron delavayi plastid genome contains extensive repeat sequences,and recombination exists among plastid genomes of photosynthetic Ericaceae[J]. PeerJ,2020,8:e9048.
[12]郝丙青,夏瑩瑩,葉 航,等. 香花油茶葉綠體基因組密碼子偏好性分析[J]. 中南林業(yè)科技大學學報,2022,42(9):178-186.
[13]賈守寧,張穎敏,趙國福,等. 頭花杜鵑、隴蜀杜鵑及杜鵑屬植物葉綠體基因組比較分析[J/OL]. 廣西植物. [2022-07-05]. https://kns.cnki.net/kcms/detail/45.1134.Q.20220629.1301.002.html
[14]趙振寧,余 瀟,寸孟人,等. 倒提壺(Cynoglossum amabile Stapf et Drumm.)葉綠體基因組密碼子偏好性分析[J/OL]. 分子植物育種. [2022-07-06]. https://kns.cnki.net/kcms/detail/46.1068.S.20220630.1511.008.html
[15]楊國鋒,蘇昆龍,趙怡然,等. 蒺藜苜蓿葉綠體密碼子偏好性分析[J]. 草業(yè)學報,2015,24(12):171-179.
[16]唐玉娟,趙 英,黃國弟,等. 芒果葉綠體基因組密碼子使用偏好性分析[J]. 熱帶作物學報,2021,42(8):2143-2150.
[17]劉江楓. 鐮翅羊耳蒜葉綠體基因組密碼子偏好性分析[J]. 福建農(nóng)業(yè)學報,2021,36(6):629-635.
[18]Shen J S,Li X Q,Zhu X T,et al. The complete plastid genome of Rhododendron pulchrum and comparative genetic analysis of Ericaceae species[J]. Forests,2020,11(2):158.
[19]劉仁林.中國杜鵑屬映山紅亞屬植物系統(tǒng)分類研究[D]. 南昌:江西農(nóng)業(yè)大學:139-140.
[20]李顯煌,楊生超,辛雅萱,等. 燈盞花葉綠體基因組密碼子偏好性分析[J]. 云南農(nóng)業(yè)大學學報(自然科學版),2021(3):384-392.
[21]張海霞,王玉道,許雪妮. 苜蓿質(zhì)膜內(nèi)在蛋白編碼基因MsPIPs家族的密碼子偏好性分析[J]. 江蘇農(nóng)業(yè)學報,2021,37(6):1393-1399.
[22]Tang D F,Wei F,Cai Z Q,et al. Analysis of codon usage bias and evolution in the chloroplast genome of Mesona chinensis Benth[J]. Development Genes and Evolution,2021,231(1):1-9.