趙森 鄧力華 陳芬
摘要:為了了解植物FERONIA(FER)基因在長期進化過程中所形成的密碼子使用模式及它們之間的親緣關系,采用Codon W、CUSP在線程序和SPSS等分析軟件對不同植物的FER基因密碼子進行堿基組成分析、對應性分析、PR2-Plot分析、中性繪圖分析和ENC-Plot分析并進行聚類分析。結果表明,單子葉植物FER基因密碼子的平均G+C含量高于雙子葉植物,且單子葉植物偏好使用以G/C結尾的密碼子,而雙子葉植物偏好使用以A/T結尾的密碼子。對應性分析結果顯示,在單子葉植物、雙子葉植物中,向量軸1(Axis 1)可解釋的變異分別占總變異的42.25%、28.56%。在單子葉植物中,Axis 1與總G+C含量、GC3含量、G3含量、C3含量呈極顯著正相關(P<0.01),而在雙子葉植物中則呈極顯著負相關(P<0.01)。不同的堿基組成是單子葉植物和雙子葉植物形成密碼子使用偏好性的重要原因。PR2-Plot分析結果、中性繪圖結果和ENC-Plot分析結果表明,自然選擇是形成植物FER基因密碼子使用偏好性的主要驅動力。基于編碼序列(Coding sequence,CDS)構建的系統(tǒng)進化樹比基于同義密碼子相對使用度(RSCU)得出的聚類分析結果更接近傳統(tǒng)的分類結果。本研究結果可為進一步開展植物分子進化和基因工程研究奠定基礎。
關鍵詞:FERONIA基因;密碼子使用偏好性;分子進化
中圖分類號:Q754;Q755文獻標識碼:A文章編號:1000-4440(2020)05-1073-09
Abstract:To understand the usage pattern of codons formed in the long-term evolutionary process of FERONIA (FER) genes in plants and their genetic relationships, base composition analysis, correspondence analysis, PR2-Plot analysis, neutral plotting analysis and ENC-Plot analysis on FER gene codons of different plants were conducted by using Codon W, on line program of CUSP and analysis software like SPSS, and the cluster analysis was conducted. The results showed that the average content of G and C in FER gene codons of monocots was higher than that of dicots, and the monocots preferred G/C ending codons while dicots preferred A/T ending codons. The results of correspondence analysis showed that, Axis 1 accounted for 42.25% and 28.56% of the total variation in monocots and dicots respectively. Axis 1 presented significantly positive correlation (P<0.01) with contents of total G+C, GC3, G3 and C3 in monocots, while in dicots the correlation between Axis 1 and contents of total G+C, GC3, G3, C3 was significantly negative respectively. Different nucleotide composition is the important reason in the formation of codon usage preference in monocots and dicots. Results of PR2-Plot analysis, neutral plotting analysis as well as ENC-Plot analysis showed that, natural selection was the main driving force in the forming of codon usage preference of FER genes in plants. Phylogenetic tree constructed by coding sequence (CDS) was more similar with traditional classification results than the phylogenetic tree constructed by relative synonymous codon usage (RSCU). The results can lay foundation for further research on molecular evolution and gene engineering.
Key words:FERONIA gene;codon usage preference;molecular evolution
根據中心法則,遺傳信息流的方向是從DNA經RNA到蛋白質,密碼子則是生物體內核酸信息和蛋白質信息相互溝通的橋梁。構成生物體的氨基酸約有20種,而密碼子卻有64種,這就存在一個氨基酸由多個不同密碼子編碼的現象(甲硫氨酸、色氨酸除外)。編碼同一氨基酸的不同密碼子稱為同義密碼子,而同義密碼子并不是被隨機使用的,這種同義密碼子不能被均等使用的現象稱為密碼子使用偏好性[1]。密碼子使用偏好性在自然界普遍存在,可以通過影響RNA加工、蛋白質翻譯和蛋白質折疊等生命過程來調節(jié)基因表達,進而改變細胞功能[2]。在長期的進化過程中,每個物種都形成了其獨特的密碼子使用模式。一般來說,同一物種對基因密碼子的使用偏好性較為一致,并且物種的親緣關系越近,密碼子的使用偏好性越一致,而功能越相似的基因,其密碼子的使用偏好性越趨于一致[3]。關于密碼子使用偏好性假說主要有中性理論和選擇-突變-漂變理論[4-7]。有研究結果顯示,密碼子使用偏好性受堿基組成、堿基突變、自然選擇、tRNA豐度、基因表達水平、基因長度等因素影響[8-12]。通過對特定物種或基因進行密碼子使用偏好性分析,有望為基因結構、基因表達、環(huán)境適應和分子進化分析等研究提供幫助。
FERONIA(FER)基因是植物類受體蛋白激酶基因(RLK)家族的一員,在龐大的RLK家族中,FER基因又歸屬于植物特有的crRLK基因家族。FER蛋白編碼區(qū)只在5′-UTR(非翻譯區(qū))有1個短的內含子,在其他位置沒有內含子。FER蛋白是一種膜受體蛋白,具有明顯的4個結構域,即胞外N端的信號肽、2個重復的Malectin-like結構域、中間的跨膜結構域和胞內的絲氨酸/蘇氨酸激酶結構域[13]。FER蛋白最早是在擬南芥花粉管與助細胞的識別過程中被人們認識的,FER蛋白在胚珠助細胞的絲狀器上極性表達,當花粉管進入FER基因突變的胚珠后,花粉管頂端并不破裂而是在胚珠內部繼續(xù)生長,從而無法完成受精過程[13-15]。FER蛋白作為正調節(jié)因子,可直接激活ABI2的磷酸酶活性,從而負調節(jié)植物對ABA的響應[16]。有研究發(fā)現,FER蛋白能促進擬南芥根和葉片細胞的伸長[17-18],而在種子發(fā)育過程中則通過抑制細胞伸長來控制種子大小[19]。此外,FER蛋白還參與了Ca2+的信號轉導及植物抗病免疫[20-21]。越來越多的研究結果表明,FER蛋白在植物生長發(fā)育、應對環(huán)境脅迫及抗病免疫等過程中發(fā)揮著重要作用。目前,除了擬南芥中的FER基因結構和功能已經得到深入研究外,關于花生[22]、橡膠[23]等物種的相關研究正在開展。鑒于FER基因對植物的重要作用,本研究擬通過分析植物FER基因密碼子的堿基組成和使用偏好性,為深入研究FER基因的功能奠定基礎,同時使人們更好地理解基因的水平轉移和家族分化情況[24]。
1材料與方法
1.1數據來源
本研究選用的47種植物的FER基因序列全部來自GenBank數據庫(https://www.ncbi.nlm.nih.gov/nucleotide/),其中9種來自單子葉植物,38種來自雙子葉植物。所有FER基因的編碼序列(CDS)長度均大于300 bp,均以ATG為起始密碼子,以TAA、TAG、TGA為終止密碼子。
1.2分析方法
從GenBank數據庫中下載47種植物FER基因的CDS,參照Mazumdar等[7]的方法,使用Codon W1.4.2軟件和CUSP在線程序(http://www.bioinformatics.nl/emboss-explorer/)計算CDS密碼子第3位堿基(A3、T3、C3和G3)含量、密碼子第1位的G+C(GC1)含量、第2位的G+C(GC2)含量和第3位的G+C(GC3)含量、有效密碼子數(ENC)、同義密碼子相對使用度(RSCU)和密碼子適應指數(CAI)等參數。用Excel 2016對數據進行整理和作圖,用SPSS 22對各相關參數進行相關性分析,用Codon W 1.4.2進行對應性分析。采用鄰接法(Neighbor-joining, NJ),通過MEGA 5對所有CDS構建系統(tǒng)進化樹,并通過自檢舉法(Bootstrap method=1 000)進行校正。用SPSS 22對所有FER基因序列的RSCU進行系統(tǒng)聚類分析。
2結果與分析
2.1植物中FER基因密碼子使用偏好性相關參數比較
從表1可以看出,在單子葉植物中,FER基因的ENC均值為51.70,有7種單子葉植物FER基因的ENC大于50.00,說明這些單子葉植物的密碼子使用偏好性較弱;在雙子葉植物中,FER基因的ENC為50.93~59.05,ENC均值大于單子葉植物,為54.79,說明其對密碼子的使用偏好性比單子葉植物弱。此外,單子葉植物、雙子葉植物FER基因的CAI均值都較低,分別為0.243、0.220,這也進一步說明,在2種類型的植物中,FER基因對密碼子的使用偏好性均較弱。
從表1還可以看出,在單子葉植物中,FER基因密碼子的總G+C(總GC)含量為47.33%~58.57%,平均為54.81%,而在雙子葉植物中,FER基因密碼子的總GC含量為40.37%~55.70%,平均為45.39%。由此可見,單子葉植物中FER基因密碼子的GC含量高于雙子葉植物中FER基因密碼子的GC含量,且二者間差異極顯著(t=7.753, P<0.01)。t檢驗結果顯示,單子葉植物FER基因密碼子的GC3含量均值(64.91%)與雙子葉植物FER基因密碼子的GC3含量均值(45.82%)間差異極顯著(t=6.598, P<0.01)。值得注意的是,除谷子外,其他單子葉植物FER基因密碼子的總GC含量、GC3含量均高于50.00%,而在雙子葉植物中,FER基因密碼子的總GC含量高于50.00%的只有大桉、石榴??梢钥闯觯瑔巫尤~植物中FER基因密碼子的總GC含量、GC3含量整體上顯著高于雙子葉植物,單子葉植物FER基因偏好使用以G/C結尾的密碼子,而雙子葉植物FER基因偏好使用以A/T結尾的密碼子。
2.2植物FER基因密碼子使用偏好性的對應性分析
基于RSCU的對應性分析結果顯示,在單子葉植物中,前4個向量軸可解釋的變異分別占總變異的42.25%、18.60%、15.35%和9.54%,累計可解釋總變異的85.74%,其中Axis 1(向量軸1)的值大于其他向量軸,Axis 1對單子葉植物FER基因密碼子偏好性的影響最大。在雙子葉植物中,前4個向量軸可解釋的變異分別占總變異的28.56%、11.93%、8.94%和8.15%,累計可解釋總變異的57.58%,其中Axis 1也是影響雙子葉植物密碼子使用偏好性的主要因素。由表2可以看出,在單子葉植物中,Axis 1與C3、G3、GC3、總GC含量的相關系數分別為0.922、0.976、0.988、0.988,呈正相關且都達到極顯著水平,但Axis 1與T3、A3含量和ENC的相關系數分別為-0.907、-0.982和-0.901,呈負相關且達到極顯著水平。在雙子葉植物中,Axis 1與T3、A3含量的相關系數分別為0.866、0.660,呈正相關且均達到極顯著水平,然而Axis 1與C3、G3、GC3、總GC含量和CAI的相關系數分別為-0.942、-0.813、-0.989、-0.907和-0.481,呈負相關且達到極顯著水平。由以上結果可以看出,堿基組成是植物FER基因密碼子使用偏好性形成的主要因素,但是在單子葉植物和雙子葉植物中,影響密碼子使用偏好性的堿基組成不同。由圖1可以看出,單子葉植物和雙子葉植物在坐標系內的位置分布趨于一致,表明影響單子葉植物和雙子葉植物FER基因密碼子使用偏好性的因素可能是相同的。
2.3植物中FER基因密碼子使用偏好性的PR2-plot分析
由圖2 FER基因的PR2-plot分析結果看出,多數植物FER基因的G3/(G3+C3)或A3/(A3+T3)都偏離中心值0.5,當G3/(G3+C3)或A3/(A3+T3)不等于0.5時,表明堿基突變和自然選擇在FER基因密碼子使用偏好性形成過程中的作用不對等。由圖2還可以看出,大部分FER基因分布在G3/(G3+C3)<0.5的左側區(qū)域,說明植物中FER基因偏好使用以C結尾的密碼子;絕大部分FER基因分布在A3/(A3+T3)<0.5的下側區(qū)域,說明植物中FER基因偏好使用以T結尾的密碼子。綜上可知,植物FER基因密碼子在第3位使用嘧啶多于嘌呤。
2.4植物中FER基因密碼子使用偏好性的中性繪圖分析
相關性分析結果顯示,在單子葉植物和雙子葉植物中,GC3與GC12的相關系數分別為0.699和0.321,且都呈顯著正相關(P<0.05)。由圖3可以看出,在單子葉植物中,GC3與GC12的回歸系數為0.118 8,說明突變壓力造成的效應只占11.88%;在雙子葉植物中,GC3與GC12的回歸系數為0.081 5,說明突變壓力造成的效應只占8.15%。由此可以看出,突變在FER基因密碼子使用偏好性上起的作用比較小,并且其在雙子葉植物中的作用小于在單子葉植物中的作用。
2.5植物中FER基因密碼子使用偏好性的ENC-plot分析
在ENC-plot繪圖分析中,如果密碼子使用偏好性僅受GC3密碼子組成影響而非受選擇效應的影響,那么所有基因都會分布在期望曲線上[4,7]。從圖4可以看出,所有基因都分布在期望曲線以下的區(qū)域,絕大多數單子葉植物的GC3含量為50.00%~80.00%,而絕大多數雙子葉植物的GC3含量為30.00%~60.00%,2種類型植物的GC3含量分布范圍都很窄。以上結果說明,FER基因密碼子使用偏好性主要是由進化過程中的自然選擇引起的。
2.6植物中FER基因的聚類分析
由系統(tǒng)進化樹(圖5)可以看出,9種單子葉植物聚在一起;在雙子葉植物中,薔薇科中的4種植物聚在一起,豆科植物(除蒺藜苜蓿)聚在1個分支上,茄科植物(除煙草)聚在1個分支上。此外,大戟科植物在系統(tǒng)進化樹上分布得比較分散??傮w上來看,基于CDS的系統(tǒng)進化分析結果與人們對植物分類的傳統(tǒng)認知較一致。
基于RSCU的聚類分析結果(圖6)顯示,雙子葉植物中的茄科、豆科、十字花科和大戟科植物分別聚為1類,而單子葉植物卻聚成不同的2類。尤其需要注意的是,單子葉植物和大戟科植物的聚類結果與基于CDS的系統(tǒng)進化樹結果不同。植物學分類地位不同的植物反而聚在一起,可能與不同物種在FER基因的使用模式上趨于一致有關。
3討論
本研究結果顯示:單子葉植物中FER基因的GC3含量均值為64.91%,而雙子葉植物中FER基因的GC3含量均值為45.82%;單子葉植物偏好使用以G/C結尾的密碼子,而雙子葉植物偏好使用以A/T結尾的密碼子,與Wang等[25]對5種單子葉植物和6種雙子葉植物轉錄組的研究結果一致。FER基因會參與植物生長發(fā)育、激素應答反應和環(huán)境脅迫反應等生命過程[19,26]。ENC在單子葉植物和雙子葉植物中都較高,說明在2種類型的植物中,FER基因的密碼子使用偏好性不強,這可能與FER基因功能的保守性相關。CAI是衡量基因表達水平的重要指標[27],在本研究中,單子葉植物和雙子葉植物中的CAI都比較低,可能與FER不是管家基因且只在特定時期或特定組織中表達有關。
已有的關于茄屬植物葉綠體基因組密碼子的研究發(fā)現,堿基組成是影響密碼子使用偏好性的重要因素之一[8]。G+C堿基含量和位置是影響密碼子使用偏好性的主要因素,這也在植物CaM1基因的研究中得到證實[24]。關于非禾本科單子葉植物的研究結果顯示,G、C偏好的基因轉換(gBGC)被認為是造成密碼子使用偏好性差異和核苷酸組成差異的主要因素[7]。以上研究結果顯示,在影響密碼子使用偏好性的各因素中,堿基組成是重要因素。本研究結果也揭示,堿基組成是影響植物FER基因密碼子使用偏好性的重要因素,但是在單子葉植物和雙子葉植物中,FER基因密碼子的堿基組成差異顯著,對G、C的偏好性現象可能在單子葉植物中廣泛存在。
植物在長期進化過程中所形成的密碼子使用偏好性,取決于突變壓力、自然選擇的作用強度和方向[25]。本研究中的PR2-plot分析結果也證實,突變壓力和自然選擇可能影響植物FER基因密碼子使用偏好性。中性繪圖結果顯示,突變在FER基因密碼子使用偏好性上的作用很小。ENC-plot分析結果表明,自然選擇才是形成FER基因密碼子使用偏好性的主要因素。本研究結果與形成人類密碼子使用偏好性的原因主要是突變不同[28],而與酵母[29]、線蟲[30]等物種的密碼子使用偏好性形成模式受自然選擇作用主導類似。此外,自然選擇還可通過影響蛋白質翻譯的速度和準確性來起作用[25]。一般來說,親緣關系越近的物種,其密碼子使用偏好性越趨于一致。但是由于某些基因具有特殊的密碼子使用偏好性,使得聚類結果并不能真實反映親緣關系和分類地位[27]。本研究發(fā)現,基于CDS的聚類分析結果與基于RSCU的聚類分析結果并不完全一致,基于CDS的聚類分析結果更接近傳統(tǒng)的分類結果,與植物ICE1基因的聚類分析結果類似[31]。基于CDS的聚類能將單子葉植物聚在一起,而基于RSCU的聚類結果與傳統(tǒng)分類結果的差別較大,可能與基于RSCU的聚類分析只能在較小的分類單元中提供較為可靠的結果,而在較大的分類單元中只能作為傳統(tǒng)分類的補充有關[27]。進一步研究發(fā)現,要想對物種的進化關系進行更為準確的描述,需要對不同分析方法得出的結果進行綜合分析。
本研究通過生物信息學方法對植物FER基因密碼子使用偏好性特性進行分析,可為進一步挖掘FER基因功能和基因表達調控研究奠定基礎。
參考文獻:
[1]HERSHBERG R, PETROV D A. Selection on codon bias[J]. Annual Review of Genetics, 2008, 42: 287-299.
[2]PLOTKIN J B, KUDLA G. Synonymous but not the same: the causes and consequences of codon bias[J]. Nature Reviews Genetics, 2011, 12(1): 32-42.
[3]CHIAPELLO H, LISACEK F, CABOCHE M, et al. Codon usage and gene function are related in sequences of Arabidopsis thaliana[J]. Gene, 1998, 209(1/2): GC1-GC38.
[4]WRIGHT F. The effective number of codons' used in a gene[J]. Gene, 1990, 87(1): 23-29.
[5]BULMER M. The selection-mutation-drift theory of synonymous codon usage[J]. Genetics, 1991, 129(3): 897-907.
[6]SUEOKA N. Directional mutation pressure and neutral molecular evolution[J]. Proceedings of the National Academy of Sciences of the United States of America, 1988, 85(8): 2653-2657.
[7]MAZUMDAR P, BINTI O R Y, MEBUS K, et al. Codon usage and codon pair patterns in non-grass monocot genomes[J]. Annals of Botany, 2017, 120(6): 893-909.
[8]ZHANG R Z, ZHANG L, WANG W, et al. Differences in codon usage bias between photosynthesis-related genes and genetic system-related genes of chloroplast genomes in cultivated and wild Solanum species[J]. International Journal of Molecular Sciences, 2018, 19: 3142.
[9]SONG H, LIU J, CHEN T, et al. Synonymous codon usage pattern in model legume Medicago truncatula[J]. Journal of Integrative Agriculture, 2018, 17(9): 2074-2081.
[10]尚明照,劉方,華金平,等. 陸地棉葉綠體基因組密碼子使用偏性的分析[J]. 中國農業(yè)科學, 2011, 44(2): 245-253.
[11]續(xù)晨,蔡小寧,錢保俐,等. 葡萄基因組密碼子使用偏好模式研究[J]. 西北植物學報, 2012, 32(2): 409-415.
[12]HE W, WANG N N, TAN J M, et al. Comprehensive codon usage analysis of porcine deltacoronavirus[J]. Molecular Phylogenetics and Evolution, 2019, 141: 106618.
[13]ESCOBAR-RESTREPO J M, HUCK N, KESSLER S, et al. The FERONIA receptor-like kinase mediates male-female interactions during pollen tube reception[J]. Science, 2007, 317(5838): 656-660.
[14]ROTMAN N, ROZIER F, BOAVIDA L C, et al. Female control of male gamete delivery during fertilization in Arabidopsis thaliana[J]. Current Biology, 2003, 13(5): 432-436.
[15]HUCK N, MOORE J M, FEDERER M, et al. The Arabidopsis mutant feronia disrupts the female gametophytic control of pollen tube reception[J]. Development, 2003, 130(10): 2149-2159.
[16]YU F, QIAN L C, NIBAU C, et al. FERONIA receptor kinase pathway suppresses abscisic acid signaling in Arabidopsis by activating ABI2 phosphatase[J]. Proceedings of the National Academy of Sciences of the United States of America, 2012, 109(36): 14693-14698.
[17]KANAOKA M M, TORII K U. FERONIA as an upstream receptor kinase for polar cell growth in plants[J]. Proceedings of the National Academy of Sciences of the United States of America, 2010, 107(41): 17461-17462.
[18]DESLAURIERS S D, LARSEN P B. FERONIA is a key modulator of brassinosteroid and ethylene responsiveness in Arabidopsis hypocotyls[J]. Molecular Plant, 2010, 3(3): 626-640.
[19]YU F, LI J, HUANG Y, et al. FERONIA receptor kinase controls seed size in Arabidopsis thaliana[J]. Molecular Plant, 2014, 7(5): 920-922.
[20]SHIH H W, MILLER N D, CHENG D, et al. The receptor-like kinase FERONIA is required for mechanical signal transduction in Arabidopsis seedlings[J]. Current Biology, 2014, 24(16): 1887-1892.
[21]KESSLER S A, SHIMOSATO-ASANO H, KEINATH N F, et al. Conserved molecular components for pollen tube reception and fungal invasion[J]. Science, 2010, 330(6006): 968-971.
[22]張欣悅,李佳婷,鄒婷,等. 花生響應干旱脅迫的FERONIA類受體蛋白激酶基因克隆與表達分析[J]. 植物生理學報, 2018, 54(2): 297-304.
[23]王涼潔,秦云霞,羅紅麗. 巴西橡膠樹FERONIA類受體激酶基因(HbFER)的克隆及表達分析[J]. 熱帶作物學報, 2014, 35(7): 1347-1353.
[24]李晨輝,趙子捷,陳文燁,等. 43種植物CaM1基因密碼子使用特征及遺傳差異分析[J]. 江蘇農業(yè)科學, 2019, 47(5): 28-32.
[25]WANG L J, ROOSSINCK M J. Comparative analysis of expressed sequences reveals a conserved pattern of optimal codon usage in plants[J]. Plant Molecular Biology, 2006, 61(4/5): 699-710.
[26]YU F, TIAN W, LUAN S. From receptor-like kinases to calcium spikes: what are the missing links?[J]. Molecular Plant, 2014, 7(10): 1501-1504.
[27]趙春麗,彭麗云,王曉,等. 莧菜AtGAI基因密碼子偏好性與進化分析[J]. 中國農業(yè)大學學報, 2019, 24(12): 10-22.
[28]SUEOKA N, KAWANISHI Y. DNA G+C content of the third codon position and codon usage biases of human genes[J]. Gene, 2000, 261(1): 53-62.
[29]COGHLAN A, WOLFE K H. Relationship of codon bias to mRNA concentration and protein length in Saccharomyces cerevisiae[J]. Yeast, 2000, 16(12): 1131-1145.
[30]DURET L, MOUCHIROUD D. Expression pattern and, surprisingly, gene length shape codon usage in Caenorhabditis, Drosophila, and Arabidopsis[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96: 4482-4487.
[31]孫繼峰,韓太利,徐立功,等. 蘿卜ICE1密碼子使用偏性分析[J]. 核農學報, 2018, 32(3): 477-485.
(責任編輯:徐艷)