李珊珊,曾艷飛,何彩云,張建國,2*
(1.國家林業(yè)局林木培育重點實驗室,中國林業(yè)科學(xué)研究院林業(yè)研究所,北京 100091;2.南京林業(yè)大學(xué)南方現(xiàn)代林業(yè)協(xié)調(diào)創(chuàng)新中心,江蘇 南京 210037)
基于沙棘轉(zhuǎn)錄組序列開發(fā)EST-SSR分子標記
李珊珊1,曾艷飛1,何彩云1,張建國1,2*
(1.國家林業(yè)局林木培育重點實驗室,中國林業(yè)科學(xué)研究院林業(yè)研究所,北京 100091;2.南京林業(yè)大學(xué)南方現(xiàn)代林業(yè)協(xié)調(diào)創(chuàng)新中心,江蘇 南京 210037)
沙棘;轉(zhuǎn)錄組;EST-SSR;引物
沙棘屬(Hippophae)屬于胡頹子科(Elaeagnaceae),是多年生落葉灌木、小喬木或喬木,風媒傳粉,雌雄異株,具有固氮作用,適應(yīng)性極強,主要分布于中歐和中亞地區(qū)[7]。依據(jù)Sun等[7]和Bartish等[8]學(xué)者的系統(tǒng)分類,分為7個種和8個亞種。沙棘是集生態(tài)效益、經(jīng)濟效益和社會效益為一體的多用途樹種,因其果實富含Vc和沙棘油,枝葉含高蛋白,根系有根瘤等特點備受矚目[9]。近些年,隨著DNA 分子標記技術(shù)的不斷發(fā)展與完善,針對沙棘遺傳多樣性、親緣關(guān)系和品種鑒定等的研究得到進展[10],如利用RFLP、ITS、cpDNA等分子標記對沙棘進行了研究[7-8, 11],但利用SSR分子標記對沙棘的研究較少, 同時目前開發(fā)可用的沙棘SSR引物較少,僅有孫燕琳等[12]利用葡萄SSR引物篩選適用于沙棘的SSR引物,Wang等[13]利用磁珠富集法開發(fā)的9對SSR引物和Jain等[14]利用EST開發(fā)的11對EST-SSR引物。為了豐富沙棘的SSR分子標記,本研究通過對向陽沙棘轉(zhuǎn)錄組序列進行分析,開發(fā)出大量EST-SSR標記,為沙棘親本分析、遺傳多樣性、遺傳育種等研究提供支持。
1.1 植物材料及DNA提取
本研究中涉及轉(zhuǎn)錄組測序的沙棘品種“向陽”(H.rhamnoidessubsp. mongolica al Xiangyang)是俄羅斯專家通過天然蒙古沙棘選育所得。隨機選取采自新疆青河縣莫齊克村的天然種群蒙古沙棘中的16個個體,采用植物全基因組DNA提取試劑盒(北京天根生物公司)從其葉片中提取總DNA,用于引物篩選和多樣性檢測。
1.2 EST序列來源、SSR檢測及SSR引物設(shè)計
1.2.1 EST序列來源 沙棘EST序列來源于本實驗室對“向陽”品種的轉(zhuǎn)錄組測序所得。收集向陽沙棘新鮮根、莖、葉提取RNA,構(gòu)建cDNA文庫,再利用Illumina Hiseq2000測序平臺 (IlluminaInc)進行高通量測序,最后用 Trinity[15]軟件將測序序列拼接成無冗余的獨立基因集,即由EST序列組成的一個轉(zhuǎn)錄組。該實驗由北京諾禾致源生物信息科技有限公司完成。所得轉(zhuǎn)錄組序列已提交到NCBI數(shù)據(jù)庫,序列號為SRP067785。
1.2.2 EST-SSR位點統(tǒng)計和引物設(shè)計 利用軟件MISA(http://pgrc.ipk-gatersleben.de/misa/misa.html)檢測轉(zhuǎn)錄組序列中簡單重復(fù)序列,確定SSR位點。SSR的搜索標準為:單、二、三、四、五和六核苷酸的最少重復(fù)次數(shù)分別為10、6、5、5、5、5,同時搜索復(fù)合SSR。對不同SSR類型在轉(zhuǎn)錄組中的密度分布進行統(tǒng)計。
1.3 EST-SSR位點PCR擴增和篩選
1.4 沙棘EST-SSR多態(tài)性分析
從篩選出具有多態(tài)性(等位基因數(shù)≥2)的引物中,進一步篩選在蒙古沙棘個體中擴增成功率高、且上機檢測峰圖明晰的EST-SSR位點。利用GENALEX 6軟件計算每個位點在這16個沙棘個體中的等位基因數(shù)量、觀測雜合度(Ho)和期望雜合度(HE)。
2.1 沙棘ESR-SSR重復(fù)類型及頻率
對沙棘轉(zhuǎn)錄組中的EST序列去冗余后共收集17 383條具有SSR位點的序列,其中包括復(fù)合SSR類型序列828條,因其特殊性不計入SSR類型分析。在非復(fù)合的SSR類型中,單核苷酸重復(fù)類型數(shù)量最多,所占比例達到62.77%(10 392);其次是二核苷酸和三核苷酸重復(fù)類型,所占比例分別為21.82%(3 613)和13.77%(2 279)。四核苷酸、五核苷酸、六核苷酸重復(fù)類型較少,分別僅占1.45%(240)、0.09%(15)、0.10%(16)。
在所檢測到的3 613個二核苷酸重復(fù)EST-SSR中,AT和AG兩種類型的重復(fù)基元出現(xiàn)的次數(shù)較多,分別為1 814個(50.21%)和1 521(42.10%)(圖1a)。在檢測到的2 279個三核苷酸重復(fù)中,AAG為優(yōu)勢類型,共783個(34.36%),ATC和ATA兩種類型次之,分別為400個(17.55%)和395個(17.33%)(圖1b)。
圖1 沙棘ESR-SSR二核苷酸(a)和三核苷酸(b)重復(fù)基元類型及其數(shù)量Fig.1 Observed counts of identified microsatellite loci for different repeat sequence motifs of(a) di-nucleotide and (b) tri-nucleotide repeats from the transcriptome sequences of Hippophae
2.2 ESR-SSR的引物設(shè)計與篩選
利用Primer 3.0為9 291條EST序列設(shè)計了適宜的SSR擴增引物,剩余的8 092條序列沒能得到合適的引物。從設(shè)計的引物中隨機挑選179對二核苷酸、三核苷酸重復(fù)的EST-SSR引物進行PCR擴增檢測,發(fā)現(xiàn)142個位點能夠在預(yù)期片段大小的位置擴增出清晰的條帶,擴增效率為79.33%。
表1 沙棘17個多態(tài)EST-SSR位點的引物信息Table 1 Information of 17 Hippophae EST-SSR loci in transcriptome sequences and tested with 16 sample
3.1 沙棘EST-SSR特性分析
本研究通過對具有SSR位點的17 383條EST序列的分析發(fā)現(xiàn),在沙棘轉(zhuǎn)錄組序列中,單核苷酸重復(fù)類型的SSR最多,其次是二核苷酸重復(fù)類型和三核苷酸重復(fù);四核苷酸,五核苷酸和六核苷酸重復(fù)類型的總和不到1.7%。由于單核苷酸的特殊性,大多數(shù)研究不將其作為SSR的研究對象[18]。因此,忽略單核苷酸重復(fù)不計,沙棘的EST-SSR位點以二核苷酸和三核苷酸重復(fù)類型為主,這與目前大多數(shù)植物的研究一致[19]。先前研究表明,二核苷酸重復(fù)在許多種的基因組中是常見類型,但是在編碼區(qū)出現(xiàn)的頻率低于非編碼區(qū),編碼區(qū)常見的重復(fù)類型為三核苷酸。這可能是因為編碼區(qū)的序列為密碼子序列,隨著三核苷酸的增加或減少會改變閱讀框架[6],但是不會引起移碼突變[20],而本研究中,二核苷酸重復(fù)類型所占比例高于三核苷酸重復(fù)類型,不同于胡楊EST-SSR的研究[20]。這可能是由于不同研究搜索SSR的標準(SSR重復(fù)類型、次數(shù)、長度等)不同造成的差異[19]。
在沙棘二核苷酸重復(fù)基元的EST-SSR位點中,AT 和AG是出現(xiàn)次數(shù)最多的兩種類型,分別占50.21%和42.10%;在三核苷酸重復(fù)基元中,AAG為優(yōu)勢重復(fù)類型,占34.36%,ATC與ATA基元所占比例之和將近35%。沙棘的重復(fù)基元的主要類型與白樺、銀杏、楊樹、北美鵝掌楸、火炬樹、蒙古櫟等木本植物基本相同[2],與水稻、高粱、玉米等作物存在差異,不同物種之間重復(fù)基元存在的差異可能與各研究所用EST來源及數(shù)目不同,也可能與物種轉(zhuǎn)錄組的特異性等有關(guān)[21]。
3.2 沙棘EST-SSR引物擴增效果及多態(tài)性
本研究設(shè)計的EST-SSR引物在天然蒙古沙棘種群中擴增效率較高,達到79.33%。剩余引物無法擴增的原因可能是:基因組DNA存在許多內(nèi)含子片段,SSR位點所設(shè)計的一端或兩端引物的位置剛好位于內(nèi)含子或者外顯子剪切點,致使引物在基因組中找不到結(jié)合位點[19]。另外,在引物的初篩過程中統(tǒng)一采用55 ℃退火進行PCR,這也可能造成最適退火溫度低的引物無法成功擴增。
判斷SSR分子標記可用性的主要依據(jù)是其多態(tài)性,本研究通過對天然蒙古沙棘種群的16個個體分析,發(fā)現(xiàn)40對具有多態(tài)性的引物,多態(tài)比率為43.48%,低于胡楊(P.euphraticaOliv.,52.5%)[20]和中華獼猴桃(ActinidiachinensisPlanch.,81.25%)[22],高于銀杏(GinkgobilobaLinn.,31.9%)[23]。對17個擴增穩(wěn)定且上機峰圖明細的位點進一步分析,得到來自新疆的天然蒙古沙棘種群遺傳多樣性處于中等水平(HO=0.488,HE=0.514)。由于沙棘為雌雄異株,所以沙棘種群的遺傳多樣性相對較高,不同位點多樣性水平差別較大,但是這些位點的平均多樣性水平仍高于Wang等[13]利用磁珠法開發(fā)的基因組SSR所估算的中國沙棘亞種的多樣性。這說明利用編碼區(qū)的SSR位點估計的遺傳多樣性水平不一定低于基因組SSR位點。
本研究利用EST序列成功開發(fā)了40對具有多態(tài)性的沙棘引物。利用蒙古沙棘的16個樣品對2種開發(fā)的引物進行多態(tài)性水平的檢驗和多態(tài)性相關(guān)分析,發(fā)現(xiàn)利用序列數(shù)據(jù)開發(fā)的引物多樣性高且多態(tài)性信息含量相對比較豐富,可為沙棘屬植物進行遺傳多樣性分析、遺傳圖譜構(gòu)建系統(tǒng)發(fā)育分析和分子育種等多個方面的研究提供有力的支持
[1] Tautz D.Hypervariabflity of simple sequences as a general source for polymorphic DNA markers[J]. Nucleic acids research, 1989,17(16): 6463-6471.
[2] 許玉蘭, 蔡年輝, 康向陽, 等. EST-SSR 標記的開發(fā)及其在木本植物中的分布特點[J]. 中國農(nóng)學(xué)通報, 2012, 28(4): 1-7.
[3] Kalia R K, Rai M K, Kalia S,etal. Microsatellite markers: an overview of the recent progress in plants[J]. Euphytica, 2011, 177(3): 309-334.
[4] 程小毛, 黃曉霞. SSR 標記開發(fā)及其在植物中的應(yīng)用[J]. 中國農(nóng)學(xué)通報,2011, 27(5): 304-307.
[5] 趙 罕, 朱高浦, 劉夢培, 等.微衛(wèi)星分子標記及其在林業(yè)中的應(yīng)用[J]. 世界林業(yè)研究, 2013,26(6): 21-26.
[6] Ueno S, Moriguchi Y, Uchiyama K,etal. A second generation framework for the analysis of microsatellites in expressed sequence tags and the development of EST-SSR markers for a conifer[J].Cryptomeriajaponica. BMC Genomics, 2012, 13: 136.
[7] Sun K, Chen X, Ma R,etal. Molecular phylogenetics ofHippophaeL. (Elaeagnaceae) based on the internal transcribed spacer (ITS) sequences of nrDNA[J]. Plant Systematics and Evolution, 2002, 235(1): 121-134.
[8] Bartish I V, Jeppsson N, Nybom H,etal. Phylogeny ofHippophae(Elaeagnaceae) inferred from parsimony analysis of chloroplast DNA and morphology[J]. Systematic Botany, 2002,27(1): 41-54.
[9] 齊虹凌, 于澤源, 李興國. 沙棘研究概述[J]. 沙棘, 2005, 18(2): 37-41.
[10] 李 蓉, 于永濤. DNA 分子標記及在沙棘遺傳育種中的應(yīng)用展望[J]. 國際沙棘研究與開發(fā), 2008, 6(2): 19-25.
[11] Wang A, Schluetz F, Liu J. Molecular evidence for double maternal origins of the diploid hybridHippophaegoniocarpa(Elaeagnaceae)[J]. Botanical Journal of the Linnean Society, 2008, 156(1): 111-118.
[12] 孫燕琳, 阮成江, 金 華. 沙棘 SSR 分子標記的開發(fā)[J]. 安徽農(nóng)業(yè)科學(xué), 2007, 35(1): 45-46.
[13] Wang A, Zhang Q, Wan D,etal. Nine microsatellite DNA primers forHippophaerhamnoidesssp.sinensis(Elaeagnaceae)[J]. Conservation Genetics, 2008, 9(4): 969-971.
[14] Jain A, Ghangal R, Grover A,etal. Development of EST-based new SSR markers in seabuckthorn[J]. Physiology and Molecular Biology of Plants, 2010, 16(4): 375-378.
[15] Grabherr M G, Haas B J, Yassour M,etal. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nature biotechnology, 2011, 29(7): 644-652.
[16] Grabherr M G, Haas B J, Yassour M,etal. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nature biotechnology, 2011, 29(7): 644-652.
[17] Schuelke M. An economic method for the fluorescent labeling of PCR fragments[J]. Nature biotechnology, 2000, 18(2): 233-234.
[18] 貫春雨, 張含國, 張 磊, 等. 基于松科樹種 EST 序列的落葉松 SSR 引物開發(fā)[J]. 東北林業(yè)大學(xué)學(xué)報, 2011, 39(1): 20-23.
[19] 高麗霞. 桑樹 EST—SSR 引物開發(fā)[J]. 南方農(nóng)業(yè)學(xué)報, 2013, 44(8): 1254-1257.
[20] Du F K, Xu F, Qu H,etal. Exploiting the transcriptome of Euphrates Poplar,Populuseuphratica(Salicaceae) to develop and characterize new EST-SSR markers and construct an EST-SSR database[J]. PloS one, 2013, 8(4): e61337.
[21] 李文娟, 馬 宏, 李正紅, 等. 基于芭蕉屬 EST 序列的地涌金蓮 SSR 引物開發(fā)[J]. 林業(yè)科學(xué)研究, 2012, 25(2): 111-116.
[22] 孟 蒙, 唐 維, 劉 嘉, 等. 基于中華獼猴桃 “紅陽” 轉(zhuǎn)錄組序列開發(fā) EST-SSR 分子標記[J]. 應(yīng)用與環(huán)境生物學(xué)報, 2014, 20(4): 564-570.
[23] 李廣平, 曹福亮. 銀杏 EST-SSR 引物開發(fā)[J]. 西北農(nóng)業(yè)學(xué)報, 2012, 21(12): 149-152.
(責任編輯:詹春梅)
Development of EST-SSR Markers Based on Seabuckthorn Transcriptomic Sequences
LIShan-shan1,ZENGYan-fei1,HECai-yun1,ZHANGJian-guo1,2
(1.Key Laboratory of Tree Breeding and Cultivation, State Forestry Administration, Research Institute of Forestry, Chinese Academy of Forestry,Beijing 100091, China; 2.Collaborative Innovation Center of Sustainable Forestry in Southern China, Nanjing Forestry University,Nanjing 210037, Jiangsu, China)
[Objective]The transcriptomes ofHippophaerhamnoidessubsp.mongolicacv‘Xiangyang’ were analyzed to design primers and develop EST-SSR (Expressed Sequence Tags-Simple Sequence Repeat) markers.[Method]The primers were designedand the SSR was developed based on the Expressed Sequence. 179 pairs of primers were validated randomly. [Result]17 383 SSR-ESTs (SSR-containing EST) were identified. Of the total EST-SSRs, the mononucleotiderepeat was the most dominant type, accounting for 62.77%, followed by dinucleotiderepeats and trinucleotiderepeats, accounting for 21.82% and 13.77%, respectively. AT and AG were the most abundant dinucleotide motifs; AAG, ATC and ATA were repeated dominant motifs in trinucleotide. Based on these SSR-ESTs, 9 291 pairs of EST-SSR primers were designed; 179 pairs of primers were randomly selected and compounded for PCR amplification, among which 142 loci were amplified successfully. Amplificationproductions of 92 loci were genotyped using the DNA analyzer, of which 40 loci (43.48%) were identified as polymorphism. At last, 17 loci that amplified highly successfully and genotyped easily were recommend and analyzed for naturalH.rhamnoidessubsp.mongolicaindividuals, with observedheterozygosity (HO) ranged from 0.083 to 0.875 and expected heterozygosity (HE) ranged from 0.180 to 0.750. [Conclusion]These EST-SSR markers would be valuable for further research on genetic diversity analysis, linkage mapping construction and molecular breeding of the genusHippophae.
Hippophaerhamnoides; transcriptome; EST-SSR; primer
10.13275/j.cnki.lykxyj.2017.01.0010
2016-01-04
林業(yè)公益性行業(yè)科研專項(201504103)
李珊珊(1989—),女,河北邢臺人,碩士,主要從事分子生態(tài)學(xué)研究.
* 通訊作者.E-mail: zhangjg@caf.ac.cn
S718.46
A
1001-1498(2017)01-0069-06