秦煜 鄭向麗 林鐘員
摘 要:為了解紅萍在不同氮濃度脅迫下紅萍轉(zhuǎn)錄組中SSR、SNP分子標記的詳細情況,分析轉(zhuǎn)錄組數(shù)據(jù)中分布的SSR和SNP位點。通過提取紅萍根和葉的RNA,構(gòu)建cDNA文庫并利用二代測序平臺進行高通量測序,利用MISA對測序數(shù)據(jù)進行SSR特征分析,同時采用軟件STAR進行比對并通過GATK進行SNP識別。結(jié)果表明:紅萍轉(zhuǎn)錄組共有9 009個SSR位點,SSR位點頻率為30.12%。其中,以三核苷酸重復和單核苷酸重復為主,分別占總比例的43.66%和26.41%。SNP位點有439 217個,包括轉(zhuǎn)換類型(282 532個)和顛換類型(156 685個);轉(zhuǎn)換類型占比(64.33%)顯著大于顛換類型(35.67%)。C/T在所有變異類型中所占比率最高,占總量的17.33%;G/A 位居其次(17.01%)。紅萍轉(zhuǎn)錄組SSR和SNP位點豐富,可為紅萍遺傳多樣性、遺傳結(jié)構(gòu)與分化以及功能基因的開發(fā)利用等研究提供依據(jù)。關(guān)鍵詞:紅萍;轉(zhuǎn)錄組;SSR;SNP
中圖分類號:S 511.41 ??文獻標志碼:A?? 文章編號:0253-2301(2023)06-0044-05
DOI: 10.13651/j.cnki.fjnykj.2023.06.006
Characteristic Analysis of SSR and SNP in Azolla imbircata Basedon Transcriptome Sequencing
QIN Yu1,2, ZHENG Xiang-li3, LIN Zhong-yuan1,4*
(1. College of Geography and Oceanography, Minjiang University, Fuzhou, Fujian 350002, China;
2. College of Future Technology, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China;
3. Institute of Agricultural Ecology, Fujian Academy of Agricultural Sciences, Fuzhou, Fujian 350002, China;
4. Fuzhou Technological Innovation Center of Seawater Planting Industry, Fuzhou, Fujian 350002, China)
Abstract: In order to understand the detailed information of SSR and SNP molecular markers in the transcriptome of Azolla imbircata under different nitrogen concentration stress, the SSR and SNP loci distributed in the transcriptomic data were analyzed. By extracting RNA from the roots and leaves of Azolla imbircata, the cDNA library was constructed and the high-throughput sequencing was performed using the next generation sequencing platform. The SSR characteristics of the sequencing data were analyzed using MISA, and the software STAR was used for the comparison and the SNP identification was performed by GATK. The results showed that: there were a total of 9009 SSR loci in the transctiptome group of Azolla imbircata, and the frequency of SSR loci was 30.12%. Among them, the trinucleotide and mononucleotide repeats were the two most SSR type, which accounted for 43.66% and 26.41% of the total repeats, respectively. There were 439217 SNP loci, including the conversion types (282532) and transversion types (156685). The proportion of conversion types (64.33%) was significantly higher than that of transversion types (35.67%). Among all the variation types, C/T had the highest proportion, accounting for 17.33% of the total SNP loci, followed by G/A with 17.01%. The transcription group of Azolla imbircata had abundant SSR and SNP loci, which could provide a basis for the study of genetic diversity and the genetic structure and differentiation, as well as the development and utilization of functional genes.
Key words: Azolla imbircata; transcriptome group; SSR; SNP
紅萍,也稱為滿江紅,是一種小型水生浮游蕨類植物,它的葉腔內(nèi)共生著固氮的魚腥藻,具有高效的固氮能力。它起源于晚白堊紀之前,在植物進化上處在獨特的位置[1];同時,也是地球上生長最快的植物之一,是潛在的重要碳匯[2]。在最佳生長狀態(tài)時,紅萍的倍殖時間僅為2~5 d[3]。紅萍既能無性繁殖,又能有性繁殖,孢子果作為紅萍的有性器官,一般在一定的季節(jié)交替時期生成[4]。紅萍具有重要經(jīng)濟價值和生態(tài)效益,比如作為人類的食物、動物的飼料、農(nóng)田中重要生物肥料,以及可應用于藥物生產(chǎn)、沼氣生產(chǎn)和水體凈化等[5]。紅萍特別是在家畜飼料的潛在應用價值方面?zhèn)涫苻r(nóng)業(yè)界的關(guān)注[6-7]。福建省農(nóng)業(yè)科學院建設(shè)有國家紅萍種質(zhì)資源圃,保存著來自世界各地紅萍種質(zhì),共有500多份。但是,很少有對紅萍種質(zhì)遺傳結(jié)構(gòu)方面、基因功能開發(fā)等的研究。紅萍主要為無性繁殖,新老品種數(shù)量繁多且易混雜,實際應用中有時對一些品種混雜及親本無法區(qū)分和判斷。陳堅等[8]指出解決紅萍系統(tǒng)學問題需要分子生物學技術(shù)手段。SSR和SNP分子標記對于種質(zhì)資源鑒定和遺傳多樣性分析尤為有效。因此,十分有必要挖掘可用于紅萍種質(zhì)分類鑒定的SSR和SNP分子標記。雖然細綠萍基因組已經(jīng)被解析,但其他紅萍品種的基因組仍未見報道[2]。紅萍在分子生物學水平的研究報道較少,其組學研究也相對滯后。迄今為止,紅萍轉(zhuǎn)錄組應用在孢子果誘導[9-10]、共生關(guān)系[2, 11]、激素信號[12-13]、維管結(jié)構(gòu)發(fā)育[14]、高氮脅迫[15]等挖掘候選基因研究。Coppenolle等[16]應用隨機引物擴增多態(tài)性DNA (RAPD)分析25個紅萍的系統(tǒng)關(guān)系;Pereira等[17]開發(fā)了RAPD分子標記區(qū)分不同紅萍品種;Sood等[18]利用RFLP構(gòu)建可靠的指紋圖譜鑒別不同的紅萍品種;鐘珍梅等[19]利用ISSR分子標記對雜交紅萍后代進行鑒定分析。雖有上述紅萍的分子標記研究報道,但至今尚未有通過轉(zhuǎn)錄組測序分析紅萍SSR和SNP分布特征的研究報道。其他蕨類植物轉(zhuǎn)錄組挖掘分子標記研究值得借鑒。比如,Mossion等[20]研究報道了蕨類植物扇羽陰地蕨轉(zhuǎn)錄組范圍的SNP分析其倍性及遺傳結(jié)構(gòu)。Yang等[21]研究報道了SSR分子標記可用于研究所有水蕨居群的遺傳變異及其地理分布模式。本研究基于前期工作中對紅萍在不同濃度氮脅迫的轉(zhuǎn)錄組數(shù)據(jù),使用MISA(MIcroSAtellite identification tool)軟件和GATK2分別鑒定所有轉(zhuǎn)錄組中的SSR和SNP位點信息,分析其分布及組成特征,將為今后紅萍遺傳多樣性、遺傳結(jié)構(gòu)與分化以及功能基因的開發(fā)利用等研究提供依據(jù)。
1 材料與方法
1.1 轉(zhuǎn)錄組測序數(shù)據(jù)
材料來自福建省農(nóng)業(yè)科學院國家紅萍種質(zhì)資源圃,供試紅萍品種為覆瓦狀滿江紅500。培養(yǎng)溫度25℃光照14 h/溫度18℃黑暗10 h。材料分別用含0、30和90 mg·L-1的總氮濃度(利用NH4NO3配制)處理5 d后,分別采集葉和根,液氮速凍后超低溫冰箱保存。提取紅萍RNA,構(gòu)建測序文庫,利用Illumina平臺測序。去冗余后的Clean data利用Trinity(https://github.com/trinityrnaseq/trinityrnaseq/wiki)以De novo組裝策略進行組裝,獲得Unigene序列
[22]。
1.2 SSR和SNP分析方法
通過MISA(MIcroSAtellite identification tool)工具對篩選得到的1 kb以上的Unigene搜索SSR位點。按重復類型分類,可分為:單核苷酸重復、二核苷酸重復、三核苷酸重復、四核苷酸重復、五核苷酸重復和六核苷酸重復6種類型。
利用Picard-tools v1.41和samtools v0.1.18整理去除重復序列和融合比對的每個樣本bam,并通過GATK2對變異位點的功能、位置和突變類型統(tǒng)計,識別SNP位點[23]。
2 結(jié)果與分析
2.1 紅萍轉(zhuǎn)錄組測序及SSR檢索結(jié)果
完成了18個紅萍樣品的轉(zhuǎn)錄組測序,獲得118.29 Gb Clean data,Q30堿基百分比在94%以上。組裝共得到100 043條Unigene,其中長度在1 kb以上的Unigene有29 907條。Unigene的N50為1 634 bp,組裝完整性較高?;赨nigene庫的基因結(jié)構(gòu)分析,其中SSR分析共獲得9 009個SSR標記。
2.2 紅萍轉(zhuǎn)錄組SSR特征分析
2.2.1 紅萍轉(zhuǎn)錄組SSR位點數(shù)量與密度分布 由表1可知,從紅萍轉(zhuǎn)錄組中SSR重復類型分析結(jié)果看,9 009個SSR中,以三核苷酸重復型SSR數(shù)最多,達3 933個,占總比例為43.66%,出現(xiàn)頻率為13.15%;其次為單核苷酸重復,占總比例為26.41%,出現(xiàn)頻率為7.95%。
由圖1可知,從紅萍轉(zhuǎn)錄組SSR基序類型分布看,不同類型的SSR密度分布不同。經(jīng)篩選后的1 kb以上的Unigene序列長度共有61 Mb。本研究發(fā)現(xiàn)三核苷酸重復型SSR密度最高,為64.48%,核苷酸重復型SSR密度次之,為39.00%,而五核苷酸和六核苷酸重復型SSR密度最低,均為0.30%。
2.2.2 紅萍轉(zhuǎn)錄組SSR基序重復類型和長度 由表2可知,紅萍轉(zhuǎn)錄組中SSR重復數(shù)主要分布為5~23次,其中集中在5~15次的SSR占比為99.39%,且重復數(shù)隨著基序核苷酸數(shù)的增加呈現(xiàn)下降趨勢,說明SSR重復數(shù)存在一定的分布特征。單核苷酸重復類型最多,有12種類型,重復數(shù)包括10~20和23,其中10次重復占比最高,占單核苷酸SSR位點的52.96%。核苷酸重復基序有6種重復單元長度,其中含23次重復。
由圖2可知,紅萍轉(zhuǎn)錄組SSR位點序列長度分布在10~222 bp,其中長度在10~14 bp的SSR位點有3 521個,長度在15~19 bp的有4 351個,長度在20~29 bp有697個,長度在30~49 bp的有130個,長度在50~100 bp的有185個,長度>100 bp僅有125個,占比分別為39.08%、48.30%、7.74%、1.44%、2.05%、1.39%(圖2)。其中,SSR長度為15 bp的位點數(shù)量最多,占總位點的28.64%;長度為18 bp的SSR位點數(shù)量次之,占總位點的15.18%。
2.3 紅萍轉(zhuǎn)錄組SNP位點分析
由圖3可知,對紅萍100 043條序列進行SNP位點識別,成功搜索到SNP位點439 217個,包括282 532個轉(zhuǎn)換類型和156 685個顛換類型;轉(zhuǎn)換類型(64.33%)顯著大于顛換類型(35.67%)。C/T在所有變異類型中所占比率最高,占總量的17.33%;G/A 位居其次(17.01%),且這兩種變異均屬于轉(zhuǎn)換類型。在顛換類型中,A/T所占比例最高,占總量的4.59%;A/C 所占比例最低,占總量的4.20%。
3 討論與結(jié)論
隨著測序技術(shù)的發(fā)展,新一代測序技術(shù)為更多物種的基因組研究提供了可能。測序產(chǎn)生的大量數(shù)據(jù)為挖掘SSR和SNP等分子標記提供了寶貴的資源。本研究利用MISA軟件對不同濃度氮脅迫紅萍轉(zhuǎn)錄組數(shù)據(jù)進行分析,檢測到了9 009個SSR位點。在紅萍轉(zhuǎn)錄組SSR類型中,三核苷酸重復類型所占的比例最大(43.66%)。三核苷酸重復基序是蕨類植物芒萁的主要SSR基序[24],紅萍的該核苷酸重復基序情況與芒萁類似。三核苷酸重復基序含量最高的原因可能是相較于其他的重復類型更加穩(wěn)定,因為每3個堿基對應翻譯成1個氨基酸,生物體為保證蛋白質(zhì)結(jié)構(gòu)的穩(wěn)定性,使得序列極少發(fā)生移碼突變[25]。SSR多態(tài)性高低進行分類,SSR序列長度小于12 bp其多態(tài)性極低,SSR序列長度在12~19 bp其多態(tài)性中等,SSR序列長度大于等于20 bp其多態(tài)性較高[26]。SSR多態(tài)性的高低是評價其可作為分子標記的標準,而SSR長度是影響SSR多態(tài)性的主要因素。紅萍的SSR序列長度在15~19 bp的比例為48.30%,推測本研究紅萍轉(zhuǎn)錄組SSR多態(tài)性屬于中等,表明后續(xù)開發(fā)分子標記具有較大的應用潛力。
通過對紅萍轉(zhuǎn)錄組SNP分析發(fā)現(xiàn),含有439 217個SNP位點,并且轉(zhuǎn)換位點比顛換位點所占比例高。其中C/T轉(zhuǎn)換的比例最高,可能是C易于甲基化,脫氨后轉(zhuǎn)變成T,與前人研究一致。紅萍SNP 轉(zhuǎn)換概率約為顛換的1.80倍,小于理論值(轉(zhuǎn)換的概率:顛換的概率=0.5),屬于轉(zhuǎn)換偏差現(xiàn)象。類似情況在不少植物中也存在,最早在水稻中發(fā)現(xiàn)[27]。出現(xiàn)該現(xiàn)象可能與紅萍在水環(huán)境中進化過程的選擇相關(guān)。
綜上,利用新一代高通量轉(zhuǎn)錄組測序技術(shù),開發(fā)紅萍SSR和SNP分子標記不失為一種可行的方法。通過大數(shù)據(jù)篩選通用性高、覆蓋度廣的分子標記,為紅萍種質(zhì)資源鑒定及功能基因的開發(fā)利用提供一定的理論依據(jù)。
參考文獻:
[1]QIU YL, YU J.Azolla-a model organism for plant genomic studies[J].Genomics, Proteomics & Bioinformatics, 2003, 1(1):15-25.
[2]LI F W, BROUWER P, CARRETERO-PAULET L, et al.Fern genomes elucidate land plant evolution and cyanobacterial symbioses[J].Nature plants, 2018, 4(7):460-472.
[3]ZIMMERMAN W J.Biomass and pigment production in three isolates of Azolla II.Response to light and temperature stress[J].Annals of Botany, 1985, 56(5):701-709.
[4]唐龍飛, 鄭德英.我國紅萍育種概況及其展望[J].福建農(nóng)業(yè)學報, 1993, 8(1):40-43.
[5]WAGNER G M.Azolla: A review of its biology and utilization[J].Botanical Review, 1997, 63(1):1-26.
[6]KUMAR U, KUMAR A, UMAKANTA N, et al.Nutrient profiling and identification of genetic marker for Azolla sp[C]∥XXIII International Grassland Congress-IGC, 2015; 2015.
[7]KHARE A, CHATTERJEE A, MONDAL M, et al.Effect of supplementing Azolla microphylla on feed intake and blood parameters in growing crossbred female calves[J].Indian Journal of Animal Nutrition, 2016, 33(2):224-227.
[8]陳堅,徐國忠.滿江紅屬系統(tǒng)學研究的新進展[J].植物學通報, 2001,18(4):485-489.
[9]BROUWER P, BRUTIGAM A, KLAHOGLU C, et al.Azolla domestication towards a biobased economy?[J].New Phytologist, 2014, 202(3):1069-1082.
[10]DIJKHUIZEN L W, TABATABAEI B E S, BROUWER P, et al.Far-Red Light-Induced Azolla filiculoides Symbiosis Sexual Reproduction: Responsive Transcripts of Symbiont Nostoc azollae Encode Transporters Whilst Those of the Fern Relate to the Angiosperm Floral Transition[J].Frontiers in Plant Science, 2021, 12:693039.
[11]EILY A N, PRYER KM, LI F-W.A first glimpse at genes important to the Azolla-Nostoc symbiosis[J].Symbiosis, 2019, 78(2):149-162.
[12]DE VRIES J, FISCHER A M, ROETTGER M, et al.Cytokinin-induced promotion of root meristem size in the fern Azolla supports a shoot-like origin of euphyllophyte roots[J].New Phytologist, 2016, 209(2):705-720.
[13]DE VRIES S, DE VRIES J, TESCHKE H, et al.Jasmonic and salicylic acid response in the fern Azolla filiculoides and its cyanobiont[J].Plant, Cell & Environment, 2018, 41(11):2530-2548.
[14]BROUWER P, BRUTIGAM A, BUIJS V A, et al.Metabolic Adaptation, a Specialized Leaf Organ Structure and Vascular Responses to Diurnal N2 Fixation by Nostoc azollae Sustain the Astonishing Productivity of Azolla Ferns without Nitrogen Fertilizer[J].Frontiers in Plant Science, 2017, 8:442.
[15]ZHENG X, LIN Z, LU J, et al.De novo transcriptome analysis reveals the molecular regulatory mechanism underlying the response to excess nitrogen in Azolla spp.[J].Aquatic Toxicology, 2022, 248:106202.
[16]COPPENOLLE BV, WATANABE I, HOVE CV, et al.Genetic diversity and phylogeny analysis of Azolla based on DNA amplification by arbitrary primers[J].Genome, 1993, 36(4):686-693.
[17]PEREIRA A L, MARTINS M, OLIVEIRA M M, et al.Morphological and genetic diversity of the family Azollaceae inferred from vegetative characters and RAPD markers[J].Plant Systematics and Evolution, 2011, 297:213-226.
[18]SOOD A, PRASANNA R, SINGH PK.Fingerprinting of freshly separated and cultured cyanobionts from different Azolla species using morphological and molecular markers[J].Aquatic Botany, 2008, 88(2):142-147.
[19]鐘珍梅,黃勤樓,黃毅斌,等. 7種紅萍的生物學特性研究與ISSR分子標記[J]. 熱帶作物學報, 2011, 32(10):1873-1877.
[20]MOSSION V, DAUPHIN B, GRANT J, et al.Transcriptome-wide SNPs for Botrychium lunaria ferns enable fine-grained analysis of ploidy and population structure[J].Molecular Ecology Resources, 2022, 22(1):254-271.
[21]YANG X, LONG Z, GICHIRA A, et al.Development of microsatellite markers in the tetraploid fern Ceratopteris thalictroides (Parkeriaceae) using RAD tag sequencing[J].Genetics and Molecular Research, 2016, 15(15):gmr7550.
[22]GRABHERR M G, HAAS B J, YASSOUR M, et al.Full-length transcriptome assembly from RNA-Seq data without a reference genome[J].Nature Biotechnology, 2011, 29(7):644-652.
[23]MCKENNA A, HANNA M, BANKS E, et al.The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data[J].Genome Research, 2010, 20(9):1297-1303.
[24]劉麗婷,溫強,黃小春,等.蕨類植物芒萁幼孢子體轉(zhuǎn)錄組高通量測序及特征分析[J].林業(yè)科學研究, 2016, 29(4):500-507.
[25]METZGAR D, BYTOF J, WILLS C.Selection against frameshift mutations limits microsatellite expansion in coding DNA[J].Genome Research, 2000, 10(1):72-80.
[26]TEMNYKH S, DECLERCK G, LUKASHOVA A, et al.Computational and experimental analysis of microsatellites in rice (Oryza sativa L.): frequency, length variation, transposon associations, and genetic marker potential[J].Genome Research, 2001, 11(8):1441-1452.
[27]MORTON B R.Neighboring base composition and transversion/transition bias in a comparison of rice and maize chloroplast noncoding regions[J].Proceedings of the National Academy of Sciences, 1995, 92(21):9717-9721.
(責任編輯:柯文輝)
收稿日期:2023-05-20
作者簡介:秦煜,男,1999年生,碩士研究生,主要從事水生植物分子生物學研究。
*通信作者:林鐘員,男,1988年生,博士,副教授,主要從事海藻、水生植物功能基因組學研究(E-mail:lzy2019@mju.edu.cn)。
基金項目:福建省自然科學基金項目(2020J01862)。