黃婷 唐夢 陳曉麗 李卜宇 張雪梅
摘 要:櫟屬青岡亞屬植物的系統(tǒng)發(fā)育地位長期存在著爭議,部分種的種間關(guān)系不明確。為揭示寧岡青岡(Quercus ningangensis)、曼青岡(Q. oxyodon)、毛曼青岡(Q. gambleana)、竹葉青岡(Q. neglecta)的葉綠體基因組特征及系統(tǒng)發(fā)育關(guān)系,該研究選擇以上4種櫟屬青岡亞屬植物的成熟葉片進行二代測序,對其葉綠體基因組結(jié)構(gòu)和特征進行分析,并結(jié)合相關(guān)類群進行系統(tǒng)發(fā)育研究。結(jié)果表明:(1)寧岡青岡、曼青岡、毛曼青岡、竹葉青岡的葉綠體基因組序列長度分別為160 906、160 883、160 832、160 784 bp,均編碼133個基因,包括88個蛋白質(zhì)編碼基因、37個tRNA基因、8個rRNA基因。(2)4種櫟屬青岡亞屬植物偏好以A/T結(jié)尾的密碼子,質(zhì)體基因組變異區(qū)域主要存在于非編碼序列。(3)通過IR邊界分析得出,4種櫟屬青岡亞屬植物存在ycf1假基因且在IRb/SSC區(qū)域發(fā)生擴張。(4)系統(tǒng)發(fā)育分析顯示,在殼斗科中,水青岡屬(Fagus)和輪葉三棱櫟屬(Trigonobalanus)較早分化出來,櫟亞屬(subg. Quercus)未形成一個單系群,葉綠體基因組建樹結(jié)果和核標(biāo)記、質(zhì)體標(biāo)記一致,櫟亞屬中Ilex組和Cerris組間出現(xiàn)穿插現(xiàn)象。(5)毛曼青岡的系統(tǒng)發(fā)育地位存在著爭議,《中國植物志》及部分地方植物志將毛曼青岡作為一個單獨的種處理;周浙昆、鄧敏等學(xué)者根據(jù)葉的特征將毛曼青岡作為曼青岡的一個亞種處理;而該研究根據(jù)葉綠體基因組信息并結(jié)合前人的形態(tài)分析結(jié)果,支持毛曼青岡作為一個獨立的種存在的觀點。該研究結(jié)果為探討櫟屬青岡亞屬系統(tǒng)發(fā)育地位、櫟屬青岡亞屬組的劃分、存疑種種間關(guān)系的解決提供了基礎(chǔ)資料。
關(guān)鍵詞: 殼斗科, 櫟屬青岡亞屬, 基因組比較, 葉綠體基因組, 系統(tǒng)發(fā)育研究
中圖分類號:Q949
文獻標(biāo)識碼:A
文章編號:1000-3142(2023)04-0741-14
Abstract:The phylogenetic status of Quercus subg. Cyclobalanopsis has long been controversial and the interspecific relationships of some species are unclear. At present, chloroplast genomes have been used to solve the phylogenetic problems of subg. Quercus and Castanea in the Fagaceae, but there are few researches on solving the phylogenetic problems of Quercus subg. Cyclobalanopsis with chloroplast genome information. To reveal the chloroplasts genome characteristics and phylogenetic relationships of Quercus ningangensis, Q. oxyodon, Q. gambleana and Q. neglecta. In this study, mature leaves of the above four species of Quercus subg. Cyclobalanopsis were selected for next-generation sequencing, and the chloroplast genome structure and characteristics were analyzed, phylogeny was studied in combination with related taxa. The results were as follows: (1) The chloroplast genome sequences of Q. ningangensis, Q. oxyodon, Q. gambleana and Q. neglecta were 160 906, 160 883, 160 832, 160 784 bp, respectively. They all encoded 133 genes, including 88 protein-coding genes, 37 tRNA genes and 8 rRNA genes. (2) The codons ending in A/T were preferred by the four species of Quercus subg. Cyclobalanopsis, and the variation regions of plastid genome mainly existed in non-coding sequences. (3) According to IR boundary analysis, ycf1 pseudogene was found in four species of Quercus subg. Cyclobalanopsis and expanded in IRb/SSC regions. (4) Phylogenetic analysis showed that Fagus and Trigonobalanus were differentiated early in Fagaceae, while subg. Quercus did not form a monophyly. The results of phylogenetic tree based on chloroplast genome were consistent with the nuclear marker plasmid markers. Interspersed between Ilex group and Cerris group in subg. Quercus. (5) The Flora of China and some local flora treated Q. gambleana as a separate species, while ZHOU Zhekun and DENG Min et al. treated Q. gambleana as a subspecies according to the characteristics of leaves. The phylogenetic status of Q. gambleana is still controversial. Based on the chloroplast genome information and previous morphological analysis results, the present study supported the idea that Q. gambleana existed as an independent species. This study provides basic data for discussing the phylogenetic status of the Quercus subg. Cyclobalanopsis, the division of its groups, and the resolution of doubtful relationships among them.
Key words:Fagaceae, Quercus subg. Cyclobalanopsis, genome comparison, chloroplast genome, phylogenetic study
葉綠體廣泛存于高等植物及大部分藻類中,是綠色植物進行光合作用的場所。葉綠體自身擁有獨立的遺傳物質(zhì),其基因組為四分體結(jié)構(gòu),由一個大單拷貝區(qū)域(long single copy, LSC)、一個小單拷貝區(qū)域(small simple copy, SSC)及兩個反向重復(fù)區(qū)域(inverted repeat, IRA and IRB)構(gòu)成,基因組序列和結(jié)構(gòu)都相對保守(Zhao et al., 2018)。與核基因組比較結(jié)果顯示,葉綠體基因組具有結(jié)構(gòu)簡單、分子量小、基因的替換率較低、單拷貝等特點(Korpelainen, 2004; Kwak et al., 2019)。近年來,隨著二代測序時間和成本的降低,越來越多的葉綠體基因組的測序分析結(jié)果已經(jīng)用于模糊種的鑒定和系統(tǒng)發(fā)育研究。目前,雖然已有研究利用葉綠體基因組解決殼斗科櫟亞屬(subg. Quercus)、栗屬(Castanea)的系統(tǒng)發(fā)育問題(楊顏慈, 2018;高瀟瀟, 2020),但利用葉綠體基因組信息解決櫟屬青岡亞屬系統(tǒng)發(fā)育問題的還未多見。
殼斗科(Fagaceae)櫟屬青岡亞屬(Quercus subg. Cyclobalanopsis)共有122種(Frodin & Govaerts, 1998)或150種(Huang et al., 1999),主要分布于亞洲熱帶和亞熱帶地區(qū)。我國是櫟屬青岡亞屬的重要分布區(qū)和多樣性中心之一(羅艷和周浙昆, 2001a),共有77種以及3變種,秦嶺、淮河以南為櫟屬青岡亞屬植物的主要分布區(qū),為常綠闊葉林的建群種之一(陳煥鏞和黃成就, 1998;Huang et al., 1999)。青岡類植物木材具有質(zhì)地堅硬、耐腐蝕、耐磨損等優(yōu)點,是制作船槳和其他工具的良好木材;其果實內(nèi)淀粉含量豐富,含量約為50%~60%(端木炘, 1995),可用于釀酒、制作飼料、糊料和工業(yè)淀粉等;樹皮中含有單寧,可制作栲膠。青岡類植物的系統(tǒng)發(fā)育地位長期存在著爭議,部分學(xué)者根據(jù)殼斗的排列方式將青岡類植物作為一個單獨的屬處理(徐永椿和任憲威, 1976;鄭萬鈞, 1985;陳煥鏞和黃成就, 1998;Huang et al., 1999);而多數(shù)學(xué)者根據(jù)花粉粒解剖學(xué)等形態(tài)特征及ITS序列,支持青岡類植物作為櫟屬下的一個亞屬處理(中國科學(xué)院植物研究所, 1972;劉蘭芳和房志堅, 1986;端木炘, 1992;羅艷和周浙昆, 2001b)。由于青岡類植物生殖結(jié)構(gòu)變化較大,葉的特征較為均一,不同類群間存在基因漸滲,館藏的標(biāo)本量有限,果實等重要分類特征難以觀察(鄧敏, 2007),因此其屬下沒有明確的分組,部分種的種間關(guān)系不明確,種的劃分上還存在著許多爭議。目前,關(guān)于櫟屬青岡亞屬系統(tǒng)發(fā)育的研究主要還停留在形態(tài)學(xué)方面。因此,需要更多的分子系統(tǒng)學(xué)方面的證據(jù)來協(xié)助解決櫟屬青岡亞屬的系統(tǒng)發(fā)育地位和種間關(guān)系。
本研究對4種櫟屬青岡亞屬植物的成熟葉片進行二代測序,依托4種櫟屬青岡亞屬植物的葉綠體基因組信息,擬探究以下問題:(1)4種櫟屬青岡亞屬植物的葉綠體基因組基本特征及其差異;(2)4種櫟屬青岡亞屬植物的密碼子使用偏好性;(3)毛曼青岡和曼青岡親緣關(guān)系如何。以期從葉綠體基因組層面為櫟屬青岡亞屬系統(tǒng)發(fā)育問題解決、種間關(guān)系的劃分、種的鑒定及優(yōu)良青岡木材的選育提供新資料。
1 材料與方法
1.1 實驗材料
在野外采集寧岡青岡(Quercus ningangensis)、曼青岡(Q. oxyodon)、毛曼青岡(Q. gambleana)、竹葉青岡(Q. neglecta)新鮮的、無病蟲害的成熟葉片(表 1),用濕潤的紗布擦拭后置于裝有變色硅膠的密封袋中保存,干燥后置于-80 ℃的冰箱內(nèi)備用。憑證標(biāo)本存放于西華師范大學(xué)標(biāo)本館(Herbarium, College of Life Sciences, China West Normal University)。
1.2 基因組DNA的提取與測序
用改良的CTAB法從4種櫟屬青岡亞屬植物葉片中提取總DNA。利用Illumina Hiseq對提取的DNA進行雙端測序。葉綠體全基因組DNA的提取與測序均由南京奧維森基因科技有限公司完成。
1.3 組裝與注釋
利用FASTQ軟件進行數(shù)據(jù)質(zhì)控,將質(zhì)控得到的Clean data利用GetOrganelle軟件(Jin et al., 2020)進行組裝,將原始數(shù)據(jù)map到組裝好的序列上查看覆蓋率并結(jié)合Gapcloser軟件(Zuo et al., 2017),補齊組裝出現(xiàn)的空缺(gaps)。在NCBI (https://www.ncbi.nlm.nih.gov/)上下載褐葉青岡(MN199023)的葉綠體基因組作為參考基因組,利用CPGAVAS2(Shi et al., 2019)(http://www.herbalgenomics.org/cpgavas/)進行注釋,注釋好的數(shù)據(jù)利用Geneious軟件(Kearse et al., 2012)進行手動調(diào)整和修改。利用OGDRAW軟件(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)繪制4種櫟屬青岡亞屬植物的葉綠體基因組物理結(jié)構(gòu)圖譜。最后將注釋好的數(shù)據(jù)提交到NCBI,寧岡青岡、曼青岡、毛曼青岡、竹葉青岡的序列登錄號分別為ON303301、ON258628、ON258629、ON258631。
1.4 葉綠體基因組比較分析
利用Geneious(Kearse et al., 2012)及Editseq軟件統(tǒng)計4種櫟屬青岡亞屬植物的葉綠體基因組序列SSC、LSC、IRS區(qū)域的長度、GC含量等基本信息。從NCBI上下載小葉青岡(MN199025)、褐葉青岡(MN199023)、西疇青岡(NC_036941)、青岡(NC_036930)的葉綠體基因組與本文4種櫟屬青岡亞屬植物所測的葉綠體基因組進行比較分析。
選擇以ATG為起始密碼子、長度大于300 pb的非重復(fù)序列,所有物種篩選后均剩余52條CDS序列。利用Codon W軟件(Sharp & Li, 1987)計算4種櫟屬青岡亞屬植物及其近緣種的同義密碼子相對使用度(relative synonymous codon usage, RSCU)、密碼子適應(yīng)指數(shù)(codon adaptation index, CAI)、有效密碼子數(shù)(effective number of codons, ENC)、密碼子偏好性指數(shù)(codon bias index, CBI)、最優(yōu)密碼子使用頻率(frequency of optimal codons, FOP)以及每條CDS序列的ENC值、RSCU值及密碼子第三位各堿基出現(xiàn)的概率(記為A3、T3、C3、G3),運用在線軟件EMBOSS(https://www.bioinformatics.nl/emboss-explorer/)計算各CDS序列GC1、GC2、GC3的含量。中性繪圖分析以GC1和GC2的平均值(GC12)為縱坐標(biāo),以GC3值為橫坐標(biāo),繪制散點圖,并插入y=x的函數(shù)圖像。ENC-plot分析繪制的散點圖將GC3值、ENC值分別作為橫、縱坐標(biāo),添加理論ENC值曲線,標(biāo)準(zhǔn)曲線公式為ENC=2+GC3+29/ [GC32+(1-GC3)2]。PR2-plot分析以G3/(G3+C3)為橫坐標(biāo),A3/(A3+T3)為縱坐標(biāo)繪制散點圖,分析A、T、C、G的使用頻率和偏倚性。中性繪圖、ENC-plot繪圖、PR2-plot繪圖均使用Origin軟件。
利用mVISTA軟件(https://genome.lbl.gov/vista/mvista/instructions.shtml)(Mayor et al., 2000)對4種櫟屬青岡亞屬植物及其近緣種的葉綠體基因組進行可視化對比分析。使用IRscope(https://irscope.shinyapps.io/irapp/)(Amiryousefi et al., 2018)繪制寧岡青岡、曼青岡、毛曼青岡、竹葉青岡及其近緣種的葉綠體基因組IR邊界。
1.5 系統(tǒng)發(fā)育分析
選取并下載在NCBI中公開釋放的8種殼斗科植物的葉綠體基因組序列,包括倒卵葉青岡(Q. obovatifolia,MG356785.1)、川滇高山櫟(Q. aquifolioides, KX911971.1)、刺葉高山櫟(Q. spinosa,MG678038.1)、巴東櫟(Q. engleriana, MZ196209.1)、栓皮櫟(Q. variabilis, NC031356.1)、三棱櫟(Trigonobalanus doichangensis, NC023959.1)、臺灣水青岡(Fagus hayatae,MW846258.1)、米心水青岡(F. engleriana,NC036929.1)。選用臺灣水青岡和米心水青岡作為外類群,將上述8種殼斗科植物的葉綠體基因組與本文組裝的4種櫟屬青岡亞屬植物的葉綠體基因組一起構(gòu)建系統(tǒng)發(fā)育樹。將所有葉綠體基因組序列運用MAFFT(Katoh & Standley, 2013)進行對比,將對比好的葉綠體基因組序列利用MEGA 7軟件(Kumar et al., 2016)對序列開頭和結(jié)尾未對齊部分進行適當(dāng)?shù)男藜?,運用MEGA 7軟件中Models功能尋找以上序列運用ML法構(gòu)建系統(tǒng)發(fā)育樹的最佳模型(GTR+GI),以最大似然法(maximum likelihood,ML),設(shè)置bootstrap為1 000構(gòu)建系統(tǒng)發(fā)育樹。另將修剪好的序列再運用MEGA 7軟件以鄰接法(neighbor-joining method, NJ),選用Maximum Composite Likelihood模型,設(shè)置bootstrap為10 000構(gòu)建相關(guān)物種的系統(tǒng)發(fā)育樹。
2 結(jié)果與分析
2.1 葉綠體基因組的基本特性
寧岡青岡、曼青岡、毛曼青岡、竹葉青岡的葉綠體基因組均有由一個LSC區(qū)域、兩個IRs區(qū)域、一個SSC區(qū)域構(gòu)成,為典型的四分體結(jié)構(gòu)(圖 1)。其基因組長度為160 681~160 906 bp,其中曼青岡和毛曼青岡葉綠體全基因組的長度分別為160 883 bp和160 882 bp,僅相差1個堿基。LSC區(qū)的長度范圍為90 245~90 360 bp,SSC區(qū)的長度范圍為18 891~18 929 bp,IRs的長度范圍為25 816~25 840 bp。本實驗測得的4種青岡的總GC含量(36.9%)、IRs區(qū)域的GC含量(42.8%)及CDs區(qū)域的GC含量(37.9%)均一致,LSC區(qū)域及SSC區(qū)域的GC含量也相差不大(表 2)。
寧岡青岡、曼青岡、毛曼青岡、竹葉青岡的葉綠體基因組注釋結(jié)果顯示,4種櫟屬青岡亞屬植物均有133個基因,其中包含37個tRNA基因(transfer RNA genes),8個rRNA基因(ribosomal RNA genes),以及88個蛋白質(zhì)編碼基因(protein-coding genes),(表 2)。有15個基因有1個內(nèi)含子(rpoC1、ndhA、ndhB、rpl2、rpl16、atpF、rps16、trnL-UAA、trnK-UUU、trnI-GAU、trnA-UGC、trnG-GCC、trnV-UAC、petB、petD),包含2個內(nèi)含子的基因有3個(rps12、clpP、ycf3)(表3)。
2.2 密碼子偏好性分析
2.2.1 密碼子組成分析 4種櫟屬青岡亞屬植物的密碼子數(shù)在20 996~20 977之間;有效密碼子數(shù)(effective number of codons, ENC)在49.91~49.81之間,密碼子適應(yīng)指數(shù)(codon adaptation index, CAI)均為0.167;寧岡青岡、毛曼青岡和竹葉青岡的密碼子偏好性指數(shù)(codon bias index, CBI)為-0.099,曼青岡的密碼子偏好性指數(shù)為-0.097;4種櫟屬青岡亞屬植物的最優(yōu)密碼子使用頻率(frequency of optimal codons, FOP)均為0.355,GC含量在37.93%~37.95%之間。4種櫟屬青岡亞屬圓圈內(nèi)外的灰色箭頭表示基因轉(zhuǎn)錄方向;不同的顏色代表不同功能的基因;內(nèi)圈深灰色表示GC含量,淺灰色表示AT含量。
Gray arrows inside and outside the circle indicate the direction of gene transcription; Different colors represent genes with different functions; Dark gray in the inner circle represents GC content, the light gray represents AT content.
如圖2所示,亮氨酸(Leu)、絲氨酸(Ser)精氨酸(Arg)有6個同義密碼子,色氨酸(Trp)、甲硫氨酸(Met)僅由一種密碼子編碼,其余氨基酸均由2個及以上的同義密碼子編碼。這8種櫟屬青岡亞屬植物的密碼子偏好性相似,其中ACU、UCU、UUA、GCU、UAU、GAU、AGA的使用頻率較高,而CUC、CUG、GCG、UAC、CAC、CAG、AAC、AAG、GAC、GAG、CGC、CGG、AGC、GGC的使用頻率較低。在米櫧(Castanopsis carlesii)、長果柯(Lithocarpus longinux)中UAA的使用頻率較所列的其他植物低。
2.2.2 中性繪圖分析 從4種櫟屬青岡亞屬植物葉綠體基因組篩選出以ATG為起始密碼子、長度大于300 pb的非重復(fù)序列進行中性繪圖,結(jié)果(圖 3)顯示,寧岡青岡、曼青岡、毛曼青岡、竹葉青岡GC3和GC12的相關(guān)系數(shù)分別為0.01、0.05、0.01、0.06,回歸系數(shù)分別為0.12、0.34、0.34、0.36,雙尾檢驗結(jié)果均為P<0.01,說明GC12和GC3之間的相關(guān)性較弱,組成密碼子堿基的第1、第2位和第3位之間存在顯著差異。由此推測,自然選擇對4種櫟屬青岡亞屬植物葉綠體基因組密碼子的使用偏好性的影響更大。
2.2.3 ENC-plot繪圖分析 由圖4結(jié)果顯示,大部分基因的實際ENC值在標(biāo)準(zhǔn)曲線之下,說明自然選擇對這部分基因的密碼子使用偏好性的影響更大;少部分基因的實際ENC值在標(biāo)準(zhǔn)曲線附近或上方,說明突變對其密碼子的使用偏好性影響更大。ENC比值頻率分布(表 5)顯示,寧岡青岡、曼青岡、毛曼青岡、竹葉青岡中位于-0.05~0.05區(qū)間的基因分別有19、18、18、19個,分別占37%、35%、35%、37%,表明突變對這些基因的影響較大。這4種櫟屬青岡亞屬植物中有33~34個基因的實際ENC值與理論ENC值差距較大,這部分基因受自然選擇的影響作用較大。ENC-plot分析結(jié)果和ENC比值頻率分布顯示,4種櫟屬青岡亞屬植物的葉綠體基因組密碼子偏好性雖同時受突變和自然選擇的影響,但總體而言,自然選擇的影響大于突變帶來的影響。
2.2.4 PR2-plot繪圖分析 由圖5可知,分布于中心點上或附近的基因主要受突變的影響, 而大多遠離中心的點則受自然選擇的影響。4種櫟屬青岡亞屬植物的PR2-plot繪圖分析顯示, 基因分布不均勻,大部分基因分布于右下角,說明4種櫟屬青岡亞屬植物葉綠體基因組中密碼子第3位堿基的使用頻率為A>T,G>C,表明4種櫟屬青岡亞屬植物密碼子的偏好性受到了突變和自然選擇的共同影響。
2.3 葉綠體基因組差異比較分析
選寧岡青岡的葉綠體基因組做參考,利用mVISTA對曼青岡、毛曼青岡、竹葉青岡、小葉青岡、褐葉青岡、西疇青岡、青岡的葉綠體基因組序列進行可視化比較分析。從分析結(jié)果可以看出,櫟屬青岡亞屬植物的葉綠體基因組具有較高的保守性,主要的變異區(qū)域位于非編碼區(qū),而ycf1基因在蛋白質(zhì)編碼區(qū)域發(fā)生變異較大。LSC區(qū)域的變異較大,IRs區(qū)域變異小較為保守,SSC區(qū)域的變異小于LSC區(qū)域。8種櫟屬青岡亞屬植物的rRNA基因高度保守,幾乎沒有發(fā)生變異(圖6)。
2.4 IR邊界分析
使用在線軟件IRscope分析4種櫟屬青岡亞屬植物及其近緣種葉綠體基因組的IR擴張和收縮情況,以及識別LSC、IR、SSC的邊界位置(圖7)。在8種青岡中,各邊界附近分布的基因一致,但距邊界的距離略有不同。其中,rps19基因距SSC/IRb邊界均為11 bp, 西疇青岡和青岡的trnH白色和紅色分別表示較低和較高的 RSCU 值。毛曼青岡、曼青岡、竹葉青岡、寧岡青岡為本研究組裝和注釋,其余物種均為NCBI上下載。
White and red indicate lower and higher RSCU values, respectively. Quercus gambleana, Q. oxyodon, Q. neglecta and Q. ningangensis were assembled and annotated for the study, and the remaining species were downloaded from NCBI.
基因距離IRa/LSC邊界的距離為16 bp,其余青岡為1 bp。在毛曼青岡和竹葉青岡中ndhF基因,有一個堿基位于IRb區(qū)域,其余2 255 bp均位于SSC區(qū)域,其余青岡中ndhF基因的長度為2 255 bp且均位于SSC區(qū)域。高等植物的葉綠體基因組中ycf1基因為第二長的基因,其橫跨這8種青岡葉綠體基因組的SSC/IRa邊界,在寧岡青岡、小葉青岡、褐葉青岡、西疇青岡、青岡中,ycf1基因有1 060 bp位于IRa區(qū)域,在曼青岡、毛曼青岡、竹葉青岡中分別有1 056、1 054、1 062 bp位于IRa區(qū)域,在8種青岡的IRb區(qū)域也分別拷貝了相應(yīng)長度的ycf1片段,這部分被視為ycf1假基因(ψycf1)。8種青岡中,ψycf1基因橫跨IRb/SSC,有56~58 bp位于IRb/SSC上游。
2.5 系統(tǒng)發(fā)育分析
選取NCBI上公開釋放的8種殼斗科植物的葉綠體基因組與本研究組裝的4種櫟屬青岡亞屬植物的葉綠體基因組序列,以臺灣水青岡(Fagus hayatae)和米心水青岡(F. engleriana)作為外類群,分別用ML法和NJ法構(gòu)建系統(tǒng)發(fā)育樹,來探討櫟屬青岡亞屬和櫟亞屬之間的關(guān)系及毛曼青岡和曼青岡的關(guān)系,并為櫟屬青岡亞屬系統(tǒng)發(fā)育問題的解決提供基礎(chǔ)資料。兩種方法構(gòu)建的系統(tǒng)發(fā)育樹均得到了較高的支持率且獲得的拓撲結(jié)構(gòu)一致。系統(tǒng)發(fā)育樹(圖 8)顯示,水青岡屬(Fagus)和輪葉三棱櫟屬(Formanodendron)位于系統(tǒng)發(fā)育樹的基部,為殼斗科中較早分化出來的類群。曼青岡和毛曼青岡成姐妹群關(guān)系,毛曼青岡為4種櫟屬青岡亞屬植物中最早分化出來的類群。櫟亞屬并未形成一個單系群,川滇高山櫟(Quercus aquifolioides)與櫟屬青岡亞屬的親緣關(guān)系較近。
3 討論與結(jié)論
3.1 葉綠體基因組比較及密碼子偏好性分析
被子植物的葉綠體全基因組長度在120 000~170 000 bp之間( Tangphatsornruang et al., 2010),本研究中寧岡青岡、曼青岡、毛曼青岡、竹葉青岡的葉綠體基因組長度為160 784~160 906 bp,在葉綠體基因組的大小、結(jié)構(gòu)、基因的數(shù)量、總GC含量及4個區(qū)域的長度和GC含量上均高度保守。櫟屬青岡亞屬的葉綠體基因組基本特征與其他殼斗科植物相似,殼斗科與其他科物種相比基因密度更大,對環(huán)境的適應(yīng)更強,穩(wěn)定性更高(高瀟瀟, 2020)。從4種櫟屬青岡亞屬植物的葉綠體全基因組比較分析可以看出,4種櫟屬青岡亞屬植物的葉綠體基因組高度保守,變異區(qū)域主要在非編碼區(qū)。櫟屬青岡亞屬植物的鑒定主要依據(jù)殼斗的特征,在沒有果實的情況下,部分種難以鑒定,可以利用葉綠體基因組篩選變異較大的區(qū)域,開發(fā)成DNA條形碼,便于櫟屬青岡亞屬植物的鑒定。通過對8種櫟屬青岡亞屬植物葉綠體基因組的研究,篩選出trnH-GUG~trnQ-UUG、ropC1~petN、trnT-UGC~trnM-CAU、ycf4~psbJ及ycf1區(qū)域作為DNA條形碼,為后續(xù)櫟屬青岡亞屬植物的鑒定提供便利。被子植物葉綠體基因組IR區(qū)域的擴張和收縮普遍存在于植物進化過程中(Hansen et al., 2007;Davis & Soreng, 2010;Huang et al., 2014)。櫟屬青岡亞屬植物位于IR區(qū)域的基因相同,說明櫟屬青岡亞屬IR邊界較為保守。4種櫟屬青岡亞屬植物均出現(xiàn)ycf1假基因(ψycf1),在殼斗科櫟亞屬,栗屬(Castanea)部分種中也出現(xiàn)了ycf1基因在IRb/SSC拷貝為假基因的現(xiàn)象(楊顏慈, 2018;高瀟瀟, 2020)。
密碼子使用偏好性是生物進化的重要現(xiàn)象。主要受基因組的大小、堿基突變、基因漂變、自然選擇、基因的表達水平、tRNA豐度、GC含量、蛋白質(zhì)結(jié)構(gòu)等因素影響(Romero et al., 2000;Duret , 2000;Angellotti et al., 2007)。從GC3的含量可以看出,本研究中的櫟屬青岡亞屬植物更偏好以A/T結(jié)尾的密碼子,這一現(xiàn)象在被子植物中廣泛存在(Clegg et al., 1994;Tangphatsornruang et al., 2010;Delannoy et al., 2011)。同義密碼子相對使用度結(jié)果顯示,櫟屬青岡亞屬和櫟亞屬植物的同義密碼子使用度相似,米櫧、長果柯中UAA的使用頻率較所列的其他植物低,說明殼斗科植物的密碼子使用偏好性相似,而不同的屬之間仍存在著一定的差異。3種繪圖分析結(jié)果顯示,4種櫟屬青岡亞屬植物的密碼子偏好性受選擇壓力和突變同時影響, 但選擇壓力為主要影響因素, 這與米櫧(江淑珍等,2021)、降香黃檀(Dalbergia odorifera)(原曉龍等, 2021)、燈盞花(Erigeron breviscapus)(李顯煌等,2021)等得出的結(jié)果相似。
3.2 系統(tǒng)發(fā)育關(guān)系及種間關(guān)系分析
系統(tǒng)發(fā)育樹結(jié)果顯示,水青岡屬和三棱櫟屬分化較早,與周浙昆(1999)根據(jù)化石和地理信息系統(tǒng)對殼斗科起源等研究的結(jié)果一致。前人根據(jù)花粉特征及核基因?qū)⒋ǖ岣呱綑?、刺葉高山櫟、巴東櫟歸為Ilex組、栓皮櫟歸為Cerris組(Hubert F et al., 2014),而核標(biāo)記、質(zhì)體標(biāo)記的研究結(jié)果中顯示,Ilex組的亞洲種常出現(xiàn)穿插在Cerris組中的現(xiàn)象(Simeone et al., 2013;Hubert et al., 2014)。本研究中,4種櫟亞屬植物并未形成一個單系群,刺葉高山櫟(Quercus spinosa)與巴東櫟(Q. engleriana)、栓皮櫟(Q. variabilis)聚在一枝,Ilex組和Cerris組之間出現(xiàn)穿插的現(xiàn)象,與核標(biāo)記、質(zhì)體標(biāo)記的結(jié)果一致。在《中國植物志》(陳煥鏞和黃成就, 1998)、《中國樹木志》(鄭萬鈞, 1985)、《云南植物志》(中國科學(xué)院昆明植物研究所, 1979)、《貴州植物志》 (藍開敏和李永康, 1982)、 等地方植物志中,毛曼青岡和曼青岡是作為兩個單獨的種處理(羅艷和周浙昆,2001a)。鄧敏(2007)等根據(jù)曼青岡、毛曼青岡葉背的星狀毛等特征,認為毛曼青岡應(yīng)作為曼青岡的一個變種處理,而劉凌燕等(2008)根據(jù)聚類分析的結(jié)果認為應(yīng)將毛曼青岡作為長葉青岡(Q. longifolia)的變種處理。本研究中系統(tǒng)發(fā)育分析結(jié)果顯示,曼青岡與竹葉青岡親緣關(guān)系較近,曼青岡和毛曼青岡未形成姐妹群。雖然毛曼青岡和曼青岡的果實和葉型相似,但是葉背毛的顏色和形態(tài)存在差異,并且在不同地區(qū)采集的葉背毛差距很大(鄧敏, 2007)。在掃描電鏡下觀察兩者的花粉外壁紋飾紋飾上也存在區(qū)別,毛曼青岡的花粉外壁紋飾為顆粒疣狀或聚合疣狀,曼青岡的花粉外壁為顆粒狀紋飾(王萍莉和溥發(fā)鼎, 2004)。本研究中采的毛曼青岡葉密被黃褐色星狀毛,而曼青岡葉背的星狀毛為白色且較毛曼青岡稀疏。綜上,本研究更傾向于毛曼青岡和曼青岡作為兩個種處理的觀點。本研究中的毛曼青岡采自重慶,曼青岡采自廣西,兩地相距較遠,推測可能由于生長環(huán)境存在較大差異及長期的基因交流受阻等因素導(dǎo)致本研究中的毛曼青岡和曼青岡逐漸形成兩個種。
參考文獻:
AMIRYOUSEFI A, HYVNEN J, POCZAI P, 2018. IRscope: an online program to visualize the junction sites of chloroplast genomes [J]. Bioinformatics, 34(17): 3030-3031.
ANGELLOTTI MC, BHUIYAN SB, CHEN GR et al., 2007. CodonO: codon usage bias analysis within and across genomes [J]. Nucl Acid Res, 35(Suppl. 2): W132-W136.
CHEN HY, HUANG CJ, 1998. Flora Reipublicae Popularis Sinicae: Tomus 22[M]. Beijing: Science Press: 263-334.[陳煥鏞, 黃成就, 1998. 中國植物志: 第二十二卷 [M]. 北京: 科學(xué)出版社: 263-334]
CLEGG MT, GAUT BS, LEARN GH et al., 1994. Rates and patterns of chloroplast DNA evolution [J]. Proc Nat Acad Sci, 91(15): 6795-6801.
DAVIS JI, SORENG RJ, 2010. Migration of endpoints of two genes relative to boundaries between regions of the plastid genome in the grass family (Poaceae) [J]. Am J Bot, 97(5): 874-892.
DELANNOY E, FUJII S, COLAS DES FRANCS-SMALL C et al., 2011. Rampant gene loss in the underground orchid Rhizanthella gardneri highlights evolutionary constraints on plastid genomes [J]. Molec Biol Evol, 28(7): 2077-2086.
DENG M, 2007. Anatomy, taxonomy, distribution & phylogeny of Quercus subg. Cyclobalanopsis (Oersted) Schneid. (Fagaceae) [D]. Beijing: Chinese Academy of Sciences: 3-70.[鄧敏, 2007. 殼斗科櫟屬青岡亞屬的形態(tài)解剖、分類、分布及其系統(tǒng)演化 [D]. 北京: 中國科學(xué)院研究生院: 3-70.]
DUAN MX, 1992. Studies on the Fagaceae wood-assortment in Taiwan [J]. Fujian Sci Technol, 19(4): 65-70.[端木炘, 1992. 臺灣殼斗科木材分類的研究 [J]. 福建林業(yè)科技, 19(4): 65-70.]
DUAN MX, 1995. The comprehensive utilization of the resources of Cyclobalanopsis in China [J]. J Beijing For Univ, 17(2): 109-110.[端木炘, 1995. 我國青岡屬資源的綜合利用 [J]. 北京林業(yè)大學(xué)學(xué)報, 17(2): 109-110.]
DURET L, 2000. tRNA gene number and codon usage in the C. elegans genome are co-adapted for optimal translation of highly expressed genes [J]. Trends Genet, 16(7): 287-289.
FRODIN DG, GOVAERTS R, 1998.World Checklist and Bibliography of Fagales (Betulaceae, Corylaceae, Fagaceae and Ticodendraceae) [M]. London: The Royal Botanic Gardens: 201-394.
GAO XX, 2020. Comparative whole chloroplast genomics of Castanea and Fagales family [D]. Xian: Northwest UNIVERSITY: 14-29.[高瀟瀟, 2020. 殼斗目栗屬植物比較葉綠體基因組與系統(tǒng)發(fā)育研究 [D]. 西安: 西北大學(xué): 14-29.]
HANSEN DR, DASTIDAR SG, CAI ZQ, et al., 2007. Phylogenetic and evolutionary implications of complete chloroplast genome sequences of four early-diverging angiosperms: Buxus (Buxaceae), Chloranthus (Chloran-thaceae), Dioscorea (Dioscoreaceae), and Illicium (Schi-sandraceae) [J]. Mol Phylogenet Evol, 45(2): 547-563.
HUANG CJ, ZHANG YT, BRUCE B, 1999. Flora of China Vol. 4 [M]. Beijing: Science Press and Missouri Botanical Garden Press: 314-400.
HUANG H, SHI C, LIU Y et al., 2014. Thirteen Camellia chloroplast genome sequences determined by high-throughput sequencing: genome structure and phylogenetic relationships [J]. BMC Evol Biol, 14(1): 1-17.
HUBERT F, GRIMM GW, JOUSSELIN E et al., 2014. Multiple nuclear genes stabilize the phylogenetic backbone of the genus Quercus [J]. Syst Biodivers, 12(4): 405-423.
Institute of Botany Institute of Botany, The Chinese Academy of Sciences, 1972. Iconographia Cormophytorum Sinnicorum: Tomus 1 [M]. 北京: Science Press: 439-462. [中國科學(xué)院植物研究所, 1972. 中國高等植物圖鑒:第一冊 [M]. 北京: 科學(xué)出版社: 439-462.]
JIANG SZ, LIAN H, XIONG YF, et.al., 2021. Analysis of codon bias in chloroplast genome of Castanopsis carlesii [J/OL]. Mol Plant Breed: 1-12[2022-04-28]. http://kns.cnki.net/kcms/detail/46.1068.S.20210722.1131.006.html.[江淑珍, 連輝, 熊遠芳等., 2021. 米櫧葉綠體基因組密碼子偏好性分析 [J/OL]. 分子植物育種: 1-12[2022-04-28]. http://kns.cnki.net/kcms/detail/46.1068.S.20210722.1131.006.html.]
JIN JJ, YU WB, YANG JB et al., 2020. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes[J]. Genome Biol, 21(1): 1-31.
KATOH K, STANDLEY DM, 2013. MAFFT multiple sequence alignment software version 7: improvements in performance and usability [J]. Mol Biol Evol, 30(4): 772-780.
KEARSE M, MOIR R, WILSON A et al., 2012. Geneious Basic: An integrated and extendable desktop software platform for the organization and analysis of sequence data [J]. Bioinformatics, 28(12): 1647-1649.
KORPELAINEN H, 2004. The evolutionary processes of mitochondrial and chloroplast genomes differ from those of nuclear genomes[J]. Naturwissenschaften, 91(11): 505-518.
KUMAR S, STECHER G, TAMURA K, 2016. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets [J]. Mol Biol Evol, 33(7): 1870-1874.
Kunming Institute of Botany, Chinese Academy of Sciences, 1979. Flora Yunnanica: Tomus 2 (spermatophyte) [M]. Beijing: Science Press: 322-325.[中國科學(xué)院昆明植物研究所, 1979. 云南植物志:第二卷(種子植物) [M]. 北京: 科學(xué)出版社: 322-325]
KWAK SY, LEW TTS, SWEENEY CJ et al., 2019. Chloroplast-selective gene delivery and expression in planta using chitosan-complexed single-walled carbon nanotube carriers [J]. Nat Nanotechnol, 14(5): 447-455.
LAN KM, LI YK, 1982. Guizhou botanical chronicles [M]. Guiyang: Guizhou Peoples Press: 103-105.[藍開敏, 李永康, 1982. 貴州植物志 [M]. 貴陽: 貴州人民出版社: 103-105]
LIU LF, FANG ZJ, 1986. A study on pollen morphology of Quercoideae oerst (Fagaceae) in China [J]. Guihaia, 12(4): 243-251.[劉蘭芳, 房志堅, 1986. 中國殼斗科櫟亞科花粉形態(tài)研究 [J]. 廣西植物, 12(4): 243-251.]
LIU LY, ZHANG ML, LI JQ, et.al., 2008. A numerical taxonomic study of the genus Cyclobalanopsis oersted from China [J]. Wuhan Botan Res, 26(5): 466-475.[劉凌燕, 張明理, 李建強, 等, 2008. 國產(chǎn)青岡屬的數(shù)量分類學(xué)研究 [J]. 武漢植物學(xué)研究, 26(5): 466-475.]
LI XH, YANG SC, XIN YX, et.al., 2021. Analysis of the codon usage bias of chloroplast genome in Erigeron breviscapus (Vant.) Hand-Mazz [J]. J Yunnan Agr Univ(Nat Sci Ed), 36(3): 384-392.[李顯煌, 楊生超, 辛雅萱, 等, 2021. 燈盞花葉綠體基因組密碼子偏好性分析 [J]. 云南農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)), 36(3): 384-392.]
LUO Y, ZHOU ZK, 2001a. Leaf epidermis of Quercus subgen. Cyclobalanopsis (Oerst.) Schneid. (fagaceae) [J]. Acta Phytotax Sin, 39(6): 489-501.[羅艷, 周浙昆, 2001a. 櫟屬青岡亞屬(殼斗科)的葉表皮研究[J]. 植物分類學(xué)報, 39(6): 489-501.]
LUO Y, ZHOU ZK, 2001b. Phytogeography of Quercus subg. Cyclobalanopsis [J]. Acta Bot Yunnan, 23(1): 1-16.[羅艷, 周浙昆, 2001b. 青岡亞屬植物的地理分布 [J]. 云南植物研究, 23(1): 1-16.]
MAYOR C, BRUDNO M, SCHWARTZ JR et al., 2000. VISTA: visualizing global DNA sequence alignments of arbitrary length [J]. Bioinformatics, 16(11): 1046-1047.
ROMERO H, ZAVALA A, MUSTO H, 2000. Codon usage in Chlamydia trachomatis is the result of strand-specific mutational biases and a complex pattern of selective forces [J]. Nucl Acid Res, 28(10): 2084-2090.
SHARP PM, LI WH, 1987. The codon adaptation index — a measure of directional synonymous codon usage bias, and its potential applications [J]. Nucl Acid Res, 15(3): 1281-1295.
SHI LC, CHEN HM, JIANG M et al., 2019. CPGAVAS2, an integrated plastome sequence annotator and analyzer [J]. Nucl Acid Res, 47(W1): W65-W73.
SIMEONE MC, PIREDDA R, PAPINI A et al., 2013. Application of plastid and nuclear markers to DNA barcoding of Euro-Mediterranean oaks (Quercus, Fagaceae): problems, prospects and phylogenetic implications [J]. Bot J Linn Soc, 172(4): 478-499.
TANGPHATSORNRUANG S, SANGSRAKRU D, CHANPRA-SERT J, et al., 2010. The chloroplast genome sequence of mungbean (Vigna radiata) determined by high-throughput pyrosequencing: structural organization and phylogenetic relationships [J]. DNA Res, 17(1): 11-22.
WANG PL, PU DF, 2004. Pollen morphology and biogeography of Fagaceae [M]. Guangzhou: Guangdong Sci Technol Press: 1-158.[王萍莉, 溥發(fā)鼎, 2004. 殼斗科植物花粉形態(tài)及生物地理 [M]. 廣州: 廣東科技出版社: 1-158.]
XU YC, REN XW, 1976. The classification and distribution of Fagaceae of Yunnan Province (2) [J]. J Syst Evol, 14(2): 73-88.[徐永椿, 任憲威, 1976. 云南殼斗科分類與分布(2) [J]. 植物分類學(xué)報, 14(2): 73-88.]
YANG YC, 2018. Plastid genomes of Quercus in China and the key genera in Fagaceae: comparative and phylogenetic analyses [D]. Xian: Northwest University: 19-90.[楊顏慈, 2018. 中國櫟屬植物和殼斗科主要屬質(zhì)體基因組比較分析和系統(tǒng)發(fā)育研究 [D]. 西安: 西北大學(xué): 19-90.]
YUAN XL, LI YQ, ZHANG JF, et.al., 2021. Analysis of codon usage bias in the chloroplast genome of Dalbergia odorifera [J]. Guihaia, 41(4): 622-630.[原曉龍, 李云琴, 張勁峰, 等, 2021. 降香黃檀葉綠體基因組密碼子偏好性分析 [J]. 廣西植物, 41(4): 622-630.]
ZHAO ZY, WANG X,YU Y et al., 2018. Complete chloroplast genome sequences of Dioscorea: Characterization, genomic resources, and phylogenetic analyses [J]. PeerJ, 6(12): e6032.
ZHENG WJ, 1985. Sylva Sinica: Vol. 2[M]. Beijing: China Forestry Publishing House: 2199-2356.[鄭萬鈞, 1985. 中國樹木志 第2卷 [M]. 北京: 中國林業(yè)出版社: 2199-2356]
ZHOU ZK, 1999. Fossils of the Fagaceae and their implications in systematics and biogeography [J]. Acta Phytotax Sin, 37(4): 369-385.[周浙昆, 1999. 殼斗科的地質(zhì)歷史及其系統(tǒng)學(xué)和植物地理學(xué)意義[J]. 植物分類學(xué)報, 37(4): 369-385.]
ZUO LH, SHANG AQ, ZHANG S et al., 2017. The first complete chloroplast genome sequences of Ulmus species by de novo sequencing: Genome comparative and taxonomic position analysis [J]. PLoS ONE, 12(2): e0171264.
(責(zé)任編輯 李 莉 王登惠)