李傅達(dá) 黃欣 韋波 毛純 秦波 黃紅寶 孫開道 周啟華
摘要:大泰竹(Thyrsostachys oliveri)是一種在東亞地區(qū)廣泛分布的竹子,具有重要的生態(tài)和經(jīng)濟(jì)價值。為獲取大泰竹的葉綠體分子生物學(xué)特性及明確其系統(tǒng)發(fā)育位置,本研究采用高通量測序技術(shù)對其葉綠體基因組進(jìn)行了測序和組裝,獲得了完整的大泰竹葉綠體基因組序列,并對其進(jìn)行基因組特征解析和系統(tǒng)發(fā)育分析。結(jié)果表明:(1)大泰竹的葉綠體基因組為一個典型的雙環(huán)狀結(jié)構(gòu),全長為139,454 bp,LSC區(qū)域的長度為82,986 bp,SSC區(qū)域的長度為12,878 bp,IR區(qū)域的長度為21,795 bp,全基因組的GC含量為38.90%,共編碼了131個基因;(2)共檢測到123個SSR位點(diǎn),其中單核苷酸SSR最多,為102個,占總數(shù)的82.93%;(3)系統(tǒng)發(fā)育分析表明,大泰竹為禾本科竹亞科中的一個明確分支,與牡竹屬(Dendrocalamus)的麻竹(D.? latiflorus)和大葉慈(D.? farinosus)親緣關(guān)系較近。研究結(jié)果明確了大泰竹在竹類植物中的系統(tǒng)發(fā)育位置,同時可為竹類分類和鑒定提供新的分子依據(jù)。
關(guān)鍵詞:大泰竹;葉綠體基因組;系統(tǒng)發(fā)育;SSR
中圖分類號:S792.99 文獻(xiàn)標(biāo)志碼:A
Chloroplast Whole Genome and Phylogenetic
Analysis of Thyrsostachys oliveri
Abstract: Thyrsostachys oliveri is a bamboo widely distributed in East Asia, with important ecological and economic value. To deepen our comprehension of the molecular biology and evolutionary placement of T. oliveri, the research employed advanced high-throughput sequencing techniques to meticulously sequence and piece together the chloroplast genome. This effort culminated in the acquisition of a fully intact chloroplast genome sequence for T. oliveri, which was then subjected to an exhaustive analysis of its genomic features and phylogenetic analysis. The results showed that: (1) The chloroplast genome of T. oliveri is a typical double ring structure, with a total length of 139454 bp, an LSC region length of 82986 bp, an SSC region length of 12878 bp, and an IR region length of 21795 bp. The GC content of the entire genome is 38.90%, encoding a total of 131 genes; (2) A total of 123 SSRs were detected, with a maximum of 102 single nucleotide SSRs, accounting for approximately 82.93%; (3) The phylogenetic tree shows that T. oliveri belongs to a clear branch of the Bambusoideae in the Poaceae, and is closely related to Dendrocalambus latiflorus and D. farinosus. The research results were of great significance for understanding the phylogenetic of T. oliveri in bamboo plants and provided new basis for bamboo identification.
Keywords: Thyrsostachys oliveri; chloroplast genome; phylogeny; SSR
大泰竹(Thyrsostachys oliveri)屬禾本科(Poaceae)竹亞科,自然分布區(qū)主要在東南亞,在中國主要分布在云南。大泰竹被廣泛用作建筑原材料[1],也被用作觀賞竹[2]。大泰竹葉小枝高,木質(zhì)素含量高,具有優(yōu)異的物理和機(jī)械性能[3],且其α-纖維素含量高于其他竹材,因而還可以作為生物精煉原料的來源之一[4]。傳統(tǒng)上,竹子的識別和分類主要基于其生物學(xué)形態(tài)特征,如竹莖形態(tài)、葉片結(jié)構(gòu)和分枝模式。然而,由于物種之間的微妙差異以及趨同進(jìn)化等因素,僅依靠形態(tài)特征進(jìn)行準(zhǔn)確識別可能變得復(fù)雜且不可靠。近年來高通量測序技術(shù)成熟,為闡明物種間親緣關(guān)系遠(yuǎn)近及物種識別提供直接分子水平證據(jù),同時還能揭示它們的演化歷史,這為竹資源的分類及科學(xué)利用提供了可靠的分析依據(jù)。
大泰竹作為一種多用途竹種,其系統(tǒng)進(jìn)化關(guān)系尚未明確。本研究利用高通量測序技術(shù),對大泰竹葉綠體基因組進(jìn)行測序,通過分析其序列基礎(chǔ)特征,構(gòu)建系統(tǒng)進(jìn)化樹以明確其系統(tǒng)進(jìn)化位置,為大泰竹的物種鑒定和開發(fā)利用提供依據(jù),并進(jìn)一步補(bǔ)充完善竹類的葉綠體基因組信息庫。
1 材料與方法
1.1 試驗材料
試驗材料為大泰竹(Thyrsostachys oliveri),植株位于廣西南寧市E 108.21°,N 20.55°。2022年6月采集其新鮮嫩葉,放入干燥硅膠中保存?zhèn)溆谩M瑫r,剪取其枝葉制作憑證標(biāo)本(標(biāo)號為TO2022060801)保存于廣西壯族自治區(qū)林業(yè)科學(xué)研究院標(biāo)本館。
1.2 試驗方法
1.2.1 基因組DNA提取及測序
取適量的大泰竹葉片,使用改良的CTAB法[5]提取總DNA,對其濃度和質(zhì)量進(jìn)一步檢測,符合送測要求后,利用Illumina Hiseq測序技術(shù)對樣品總DNA進(jìn)行paired-end測序。
1.2.2 葉綠體基因組組裝和注釋
測序完成后,首先使用NGS QC Toolkit軟件[6]對原始測序序列(Raw reads)進(jìn)行質(zhì)量控制,去除接頭和低質(zhì)量序列,得到高質(zhì)量的待分析序列(Clean reads);利用NGSQC[6]對測序數(shù)據(jù)進(jìn)行質(zhì)控,使用SPAdes軟件[7]、Bowtie 2[8]完成葉綠體基因組的從頭組裝;使用DOGMA[9]和CpGAVAS[10]在線工具預(yù)測葉綠體基因組中的蛋白編碼基因、轉(zhuǎn)移RNA(tRNA)基因和核糖體RNA(rRNA)基因;使用PGA[11]對這些基因進(jìn)行功能注釋,并使用OGDRAW[12]在線軟件繪制大泰竹葉綠體基因組的物理圖譜。
1.2.3 葉綠體基因組SSR特征分析
利用MISA在線軟件[13]鑒定大泰竹葉綠體基因組中的SSR位點(diǎn),搜索重復(fù)參數(shù)依次設(shè)置為:1/8、2/5、3/4、4/3、5/3、6/3,位點(diǎn)間最小長度設(shè)置為100 bp,其余參數(shù)使用默認(rèn)值。
1.2.4 系統(tǒng)發(fā)育分析
利用NCBI數(shù)據(jù)庫下載總計19個物種的葉綠體基因組,所有物種均來自禾本科,包含牡竹屬(Dendrocalamus)等11個屬,共19個種,物種拉丁名及葉綠體基因組登錄號詳見表1。從每個物種的葉綠體基因組中挑選75個共有的同源蛋白基因,使用MAFFT 7.037軟件[14]和FFT-NS-2策略進(jìn)行序列比對。接著,使用PhyloSuite軟件ModelFinder選擇TPM3+F+I+G4模型[15]。最后,利用IQtree 2.0軟件[16]基于最大似然法(ML方法)構(gòu)建系統(tǒng)發(fā)育樹,bootstrap值為1000。
2 結(jié)果與分析
2.1 葉綠體基因組基本特征
通過高通量測序和葉綠體基因組物理圖譜構(gòu)建的結(jié)果顯示(表2和圖1),大泰竹葉綠體基因組為一個典型的雙鏈閉合環(huán)狀結(jié)構(gòu),長度為139, 454 bp,平均測序深度為260X,其中IR(Inverted repeats)長度為21, 795 bp,LSC(Large single copy)長度為82, 986 bp,SSC(Small single copy)長度為12, 878 bp,全基因組GC含量為38.90%。而且,共編碼131個基因,包括蛋白編碼基因86個、rRNA基因7個、38個tRNA基因(表3)。獲得的大泰竹葉綠體基因組已上傳NCBI數(shù)據(jù)庫,序列號為? ? ?NC_068070.1。
2.2 SSR特征分析
MISA在線軟件的分析結(jié)果顯示(表4),在大泰竹葉綠體基因組中共檢測到123個SSR位點(diǎn);其中,單核苷酸SSR數(shù)量最多,共102個,占比為82.93%,包括A/T重復(fù)(98個)、C/G重復(fù)(4個);二核苷酸SSR數(shù)量有4個,包括AG/CT重復(fù)(1個)和AT/AT重復(fù)(3個);三核苷酸SSR數(shù)量為4個,包括AAG/CTT重復(fù)(2個)、AAT/ATT重復(fù)(1個)、AGC/CTG重復(fù)(1個);四核苷酸SSR數(shù)量為13個,具有6種不同的重復(fù)類型;在大泰竹葉綠體基因組中未發(fā)現(xiàn)五核苷酸和六核苷酸SSR。
2.3 系統(tǒng)發(fā)育分析
基于19個禾本科物種葉綠體基因組共有的75個同源蛋白,構(gòu)建最大似然(ML)系統(tǒng)發(fā)育樹。系統(tǒng)發(fā)育樹結(jié)果顯示(圖2),大泰竹為禾本科(Poaceae)竹亞科(Bambusoideae)的一個明確分支,大泰竹葉綠體基因組(NC_068070.1)與參試的牡竹屬(Dendrocalamus)麻竹Dendrocalamus latiflorus,NC_013088.1)和大葉慈(D. farinosus,NC_063702.1)親緣關(guān)系較近。
3 討論與結(jié)論
泰竹屬包含大泰竹和泰竹兩個物種,本研究測序的大泰竹葉綠體基因組大小為139, 454 bp,與同屬的泰竹葉綠體基因組(139, 522 bp)[17]大小相比相差68 bp,其GC含量一致;大泰竹編碼基因131個,比泰竹(139個)少了8個編碼基因。
SSR分子標(biāo)記數(shù)量多、多態(tài)性高,在鑒別物種、研究物種遺傳多樣性、構(gòu)建遺傳圖譜方面有著較高應(yīng)用價值。本研究在大泰竹葉綠體基因組中共發(fā)現(xiàn)123個SSR位點(diǎn),與親緣關(guān)系較近的大慈竹(D. farinosus)相比SSR多出56個[18],在大泰竹最主要重復(fù)類型為單核苷酸序列重復(fù)(98個),而在大慈竹中單核苷酸重復(fù)僅包含17個,較高的遺傳多樣性表明了大泰竹能夠適應(yīng)更廣泛的環(huán)境,該結(jié)果為后期竹亞科的分子生物學(xué)研究提供了較為豐富的SSR標(biāo)記。
前人的研究結(jié)果表明,泰竹屬與牡竹屬(Dendrocalamus)、滇竹屬(Gigantochloa)、梨藤竹屬(Melocalamus)、慈竹屬(Neosinocalamus)和銳藥竹屬(Oxytenanthera)為姐妹群[19, 20]。本研究中大泰竹與牡竹屬植物聚為一支,這與前人研究結(jié)果一致。然而,本研究發(fā)現(xiàn)同為泰竹屬的大泰竹和泰竹兩個物種并未聚在一起,推測與其形態(tài)特征差異有關(guān),大泰竹葉色、葉型、桿型等與泰竹相似,但大泰竹桿高、直徑、葉長葉寬等均明顯大于泰竹[21]。同時,傳統(tǒng)意義上的分類學(xué),主要依靠植物的形態(tài)學(xué)特征來探討和揭示物種的生物學(xué)特征和其在生態(tài)系統(tǒng)中的位置,而分子聚類則基于遺傳信息來揭示物種間的親緣關(guān)系。本研究大泰竹和泰竹在分子聚類中的分離,也表明了形態(tài)學(xué)特征可能不足以反應(yīng)所有遺傳差異,也可能是由于形態(tài)學(xué)特征的趨同演化、遺傳變異的非均勻分布,或者是雜交事件、網(wǎng)狀進(jìn)化等所導(dǎo)致的。通過整合形態(tài)學(xué)和分子數(shù)據(jù),可以更準(zhǔn)確地描述物種的邊界,并為保護(hù)和管理竹類植物資源提供科學(xué)依據(jù)。
參考文獻(xiàn)
[1] CHAOWANA K, WISADSATORN S, CHAOWANA P. Bamboo as a sustainable building material—Culm characteristics and properties[J]. Sustainability, 2021, 13(13): 7376.
[2] BANIK R L. Silviculture of South Asian Priority Bamboos[M]. Singapore: Springer Singapore, 2016: 261-276.
[3] ZHANG Z H, RAO F, WANG Y J. Morphological, chemical, and physical-mechanical properties of a clumping bamboo (Thyrsostachys oliveri) for construction applications[J]. Polymers, 2022, 14(17): 3681.
[4] HOSSAIN M J, GHOSH R K, DAS A K, et al. Investigation of the potentiality of five bamboo species in biorefinery through analysis of chemical profiles[J]. Journal of Wood Chemistry and Technology, 2022, 42(3): 204-210.
[5] 樊守金, 郭秀秀. 植物葉綠體基因組研究及應(yīng)用進(jìn)展[J]. 山東師范大學(xué)學(xué)報(自然科學(xué)版), 2022, 37(1): 22-31.
[6] PATEL R K, JAIN M. NGS QC toolkit: A toolkit for quality control of next generation sequencing data[J]. PLoS One, 2012, 7(2): e30619.
[7] BANKEVICH A, NURK S, ANTIPOV D, et al. SPAdes: A new genome assembly algorithm and its applications to single-cell sequencing[J]. Journal of Computational Biology: a Journal of Computational Molecular Cell Biology, 2012, 19(5): 455-477.
[8] LANGMEAD B. Bowtie: An accelerated, memory-efficient short read aligner [J]. Nature Methods, 2010, 7(4): 335-336.
[9] WYMAN S K, JANSEN R K, BOORE J L. Automatic annotation of organellar genomes with DOGMA[J]. Bioinformatics, 2004, 20(17): 3252-3255.
[10] LIU C, SHI L C, ZHU Y J, et al. CpGAVAS, an integrated web server for the annotation, visualization, analysis, and GenBank submission of completely sequenced chloroplast genome sequences[J]. BMC Genomics, 2012, 13: 715.
[11] QU X J, MOORE M J, LI D Z, et al. PGA: A software package for rapid, accurate, and flexible batch annotation of plastomes[J]. Plant Methods, 2019, 15: 50.
[12] GREINER S, LEHWARK P, BOCK R. OrganellarGenomeDRAW (OGDRAW) version 1.3.1: Expanded toolkit for the graphical visualization of organellar genomes[J]. Nucleic Acids Research, 2019, 47(W1): W59-W64.
[13] BEIER S, THIEL T, M?NCH T, et al. MISA-web: A web server for microsatellite prediction[J]. Bioinformatics, 2017, 33(16): 2583-2585.
[14] KATOH K, STANDLEY D M. A simple method to control over-alignment in the MAFFT multiple sequence alignment program[J]. Bioinformatics, 2016, 32(13): 1933-1942.
[15] KALYAANAMOORTHY S, MINH B Q, WONG T K F, et al. ModelFinder: Fast model selection for accurate phylogenetic estimates[J]. Nature Methods, 2017, 14(6): 587-589.
[16] MINH B Q, SCHMIDT H A, CHERNOMOR O, et al. IQ-TREE 2: New models and efficient methods for phylogenetic inference in the genomic era[J]. Molecular Biology and Evolution, 2020, 37(5): 1530-1534.
[17] TANG S L, XIE J H, CAI J Z. The complete plastid genome of Thyrsostachys siamensis (Poaceae, Bambusoideae)[J]. Mitochondrial DNA. Part B, Resources, 2021, 6(6): 1781-1783.
[18] YANG H Q, YANG J B, PENG Z H, et al. A molecular phylogenetic and fruit evolutionary analysis of the major groups of the paleotropical woody bamboos (Gramineae: Bambusoideae) based on nuclear ITS, GBSSI gene and plastid trnL-F DNA sequences[J]. Molecular Phylogenetics and Evolution, 2008, 48(3): 809-824.
[19] PEI J L, WANG Y, ZHUO J, et al. Complete chloroplast genome features of Dendrocalamusfarinosus and its comparison and evolutionary analysis with other bambusoideae species[J]. Genes, 2022, 13(9): 1519.
[20] YANG J B, YANG H Q, LI D Z, et al. Phylogeny of Bambusa and its allies (Poaceae: Bambusoideae) inferred from nuclear GBSSI gene and plastid psbA-trnH, rpl32-trnL and rps16 intron DNA sequences[J]. TAXON, 2010, 59(4): 1102-1110.
[21] 陳松河. 泰竹生物學(xué)特性研究初報[J]. 竹子研究匯刊, 2006, 25(2): 28-30, 34.