王久利 朱明星 徐明行 陳世龍 張發(fā)起*
(1.中國科學(xué)院高原生物適應(yīng)與進(jìn)化重點(diǎn)實(shí)驗(yàn)室,中國科學(xué)院西北高原生物研究所,西北生態(tài)環(huán)境資源研究院,西寧 810001; 2.中國科學(xué)院大學(xué),北京 100039; 3.青海大學(xué)生態(tài)環(huán)境工程學(xué)院,西寧 810016)
基于RAD-seq技術(shù)的異型花SSR信息分析
王久利1,2朱明星3徐明行3陳世龍1張發(fā)起1*
(1.中國科學(xué)院高原生物適應(yīng)與進(jìn)化重點(diǎn)實(shí)驗(yàn)室,中國科學(xué)院西北高原生物研究所,西北生態(tài)環(huán)境資源研究院,西寧 810001;2.中國科學(xué)院大學(xué),北京 100039;3.青海大學(xué)生態(tài)環(huán)境工程學(xué)院,西寧 810016)
用RAD-seq(restriction-site associated DNA sequencing)對(duì)異型花(Sinoswertiatetraptera(Maxiowicz) T.N.Ho,S.W.Liu & J.Q.Liu)進(jìn)行簡化基因組測(cè)序,并借此分析異型花的SSR(simple sequence repeats)信息。利用SR search軟件甄別所得序列中的SSR,得到了雙端各有至少100 bp的SSR位點(diǎn)5 844個(gè),其中5 339個(gè)(91.38%)成功設(shè)計(jì)引物,而三核苷酸SSR位點(diǎn)最多(3 323個(gè));在能成功設(shè)計(jì)引物的SSR位點(diǎn)中,重復(fù)序列長度包括17種(12~36 bp);重復(fù)序列的基序共277種,其中五核苷酸基序種類最多(106種);隨機(jī)挑選10對(duì)SSR引物,用4個(gè)異型花居群的32個(gè)個(gè)體檢測(cè)檢測(cè)其可用性和多態(tài)性,經(jīng)PCR和聚丙烯酰氨凝膠電泳檢測(cè),有4對(duì)(ST2、ST3、ST6和ST10)成功擴(kuò)增并表現(xiàn)出多態(tài)性;經(jīng)GENEPOP 4.4對(duì)4個(gè)位點(diǎn)分析,顯示其等位基因數(shù)量均值為6,多態(tài)性較高且不連鎖(P<0.01);4個(gè)位點(diǎn)在多數(shù)居群中偏離哈迪溫伯格平衡(P<0.01)且存在較高的純合子數(shù)量(觀測(cè)雜合度均值0.023),該結(jié)果歸因于異型花主要進(jìn)行自花授粉,在自然界中很難形成進(jìn)行自由交配的居群;此外,ST2和ST6可在橢圓葉花錨(HaleniaellipticaD.Don)中成功擴(kuò)增,具有潛在通用性。本研究將為日后基于異型花SSR標(biāo)記的相關(guān)研究提供數(shù)據(jù)庫支持。
RAD-seq;簡化基因組測(cè)序;異型花;SSR;獐牙菜亞族
異型花(Sinoswertiatetraptera(Maxiowicz) T.N.Ho,S.W.Liu & J.Q.Liu)又名四數(shù)獐牙菜,是龍膽科(Gentianaceae)異型花屬(Sinoswertia)的青藏高原特有的一年生草本植物[1~3]。特有種的DNA記錄了其對(duì)特殊環(huán)境的響應(yīng)等信息,這些信息對(duì)物種演化的研究具有重要意義[4~6];異型花也是一種重要的藏藥,主要應(yīng)用于肝膽疾病的治療[7],隨著近年來人們對(duì)傳統(tǒng)醫(yī)藥的重視以及加工技術(shù)的發(fā)展,市場(chǎng)對(duì)傳統(tǒng)藥材的需求量增大,異型花也因此受到一定的威脅,因此有必要研究其DNA水平上的遺傳多樣性[8];目前對(duì)異型花的研究多集中在植物化學(xué)分析領(lǐng)域[8],然而在DNA水平上研究異型花遺傳多樣性的研究,已見報(bào)道的僅有Yang等[9]利用ISSR指紋圖譜分析了異型花的居群遺傳結(jié)構(gòu),并提出了對(duì)異型花的遺傳多樣性高的區(qū)域進(jìn)行保護(hù)的保護(hù)策略。
簡單重復(fù)序列(simple sequence repeats,SSR)又稱微衛(wèi)星(microsatellite),一般認(rèn)為是由2至6個(gè)堿基對(duì)(base pair,bp)為重復(fù)單元的序列,大量分布于真核生物和原核生物基因組中。其共顯性和高重復(fù)性比RAPD、ISSR和AFLP等分子標(biāo)記更具優(yōu)勢(shì)[10],因而被用于指紋圖譜、遺傳變異分析、物種起源進(jìn)化、基因定型、遺傳圖譜構(gòu)建、品種評(píng)估和微生物鑒定等研究中[11~16]。
簡化基因組測(cè)序(Reduced-representation sequencing)是一類利用不同方法得到目的基因組的部分區(qū)域,并對(duì)這些區(qū)域進(jìn)行測(cè)序,從而反映基因組一部分序列結(jié)構(gòu)信息的一種新興的測(cè)序技術(shù),其與全基因組測(cè)序相比具有低成本優(yōu)勢(shì)[17]。緊隨技術(shù)的發(fā)展,簡化基因組測(cè)序有產(chǎn)生了多種不同的方法,而利用限制性酶切位點(diǎn)相關(guān)的DNA測(cè)序(Restriction-site associated DNA sequence,RAD-seq)[18]是其中具有代表性的方法。RAD-seq具有通量高、準(zhǔn)確性高、數(shù)據(jù)利用率高、實(shí)驗(yàn)周期短、不受基因組序列的限制以及性價(jià)比高等諸多優(yōu)點(diǎn)[19],因而其廣泛應(yīng)用于分子標(biāo)記開發(fā)、系統(tǒng)發(fā)育研究、種群結(jié)構(gòu)分析、基因功能研究、物種起源研究等眾多領(lǐng)域[20~23]。
為了在利用異型花資源的同時(shí)能更好地保護(hù)這一珍貴物種,本研究中將基于RAD-seq技術(shù)分析異型花的SSR信息并討論基于RAD-seq技術(shù)開發(fā)異型花的多態(tài)性SSR標(biāo)記的可行性,為異型花的SSR多態(tài)性位點(diǎn)引物的設(shè)計(jì)提供便利的數(shù)據(jù)庫,進(jìn)一步為基于異型花SSR多態(tài)性位點(diǎn)相關(guān)研究奠定基礎(chǔ)。
1.1 樣品的采集與DNA提取
本研究所用異型花樣品分別采自定西、果洛、臨夏和甘孜的4個(gè)自然居群,所用橢圓葉花錨的樣品采自5個(gè)自然居群,各采樣點(diǎn)的坐標(biāo)和海拔信息在采集地中心使用GPS全球定位系統(tǒng)Etres GIS采集器記錄(Garmin,中國臺(tái)灣)(表1)。憑證標(biāo)本保存于中國科學(xué)院西北高原生物研究所青藏高原植物標(biāo)本館(HNWP)。從每個(gè)居群隨機(jī)選取的一個(gè)個(gè)體的葉片用于提取DNA,葉片的采集、處理的方法以及DNA提取的方法同Zhang等[24],并用1%的瓊脂糖凝膠電泳和分光光度計(jì)NanoDrop 2000C(Thermo Scientific,USA)檢測(cè)所提取的DNA,以保證DNA的總量和純度。
1.2 文庫構(gòu)建與測(cè)序
將來自4個(gè)不同居群異型花的合格DNA樣品等量混合之后,交由北京諾禾致源生物信息科技有限公司進(jìn)行建庫測(cè)序。建庫過程具體參見Davey和Blaxter[25]。本研究回收300~700 bp的序列,通過HiSeq 2000基因分析系統(tǒng)(Illumina,USA)進(jìn)行雙向測(cè)序。
1.3 SSR位點(diǎn)甄別與引物設(shè)計(jì)
利用SR search軟件(Novogene,中國北京)以重復(fù)單元長度2~6 bp、SSR最小長度12為標(biāo)準(zhǔn),檢測(cè)DNA序列所有SSR;過濾掉其中距離過近的SSR序列,兩個(gè)SSR的最小距離為12 bp;為方便引物設(shè)計(jì),SSR的重復(fù)序列的上下游各有長度為不短于100 bp的序列;然后利用SR search軟件中的primer3模塊設(shè)計(jì)SSR引物[26];參數(shù)設(shè)置:引物長度20~28 bp,最適長度24 bp,引物退火溫度60~65℃且每對(duì)引物退火溫度差最大值為1,最佳退火溫度63℃。
表1 異型花和橢圓葉花錨樣品的居群信息
1.4 PCR擴(kuò)增與檢測(cè)
隨機(jī)抽取10對(duì)SSR引物(對(duì)應(yīng)的位點(diǎn)囊括二、三、四、五、六核苷酸重復(fù)類型,表4),利用梯度退火溫度PCR反應(yīng)選定引物的最佳退火溫度:在20 μL的PCR反應(yīng)總體積中,含30 ng·μL-1的DNA模板(4個(gè)來自不同居群的個(gè)體的混合DNA)0.9 μL,10×PCR Buffer 2.0 μL,10 μM正反向引物各0.4 μL,10 mmol·L-1dNTPs 0.7 μL,Taq DNA聚合酶(5 U·μL-1)0.1 μL,ddH2O 15.5 μL。PCR擴(kuò)增在Mastercycler pro PCR儀(Eppendorf,德國)上進(jìn)行,擴(kuò)增程序?yàn)椤?5℃,5 min;(94℃,30 s;Tm,60 s;72℃,60 s)×25;72℃,7 min;16℃,∞】(Tm為各引物的退火溫度)。接著,用1.5%的瓊脂糖凝膠對(duì)PCR產(chǎn)物進(jìn)行電泳檢測(cè),以溴化乙錠(ethidium bromide,EB)染色,在GelDoc 2000凝膠成像系統(tǒng)(Bio-Rad,美國)上拍照。根據(jù)瓊脂糖凝膠電泳結(jié)果選定可成功PCR擴(kuò)增的引物及其最佳退火溫度。
然后用4個(gè)自然居群總共32個(gè)異型花個(gè)體(表1)對(duì)能成功擴(kuò)增引物按照上述體系和程序進(jìn)行PCR,其中退火溫度換成相應(yīng)引物的最佳退火溫度。然后將PCR產(chǎn)物進(jìn)一步用20%的聚丙烯酰氨凝膠進(jìn)行電泳檢測(cè),然后同樣以EB染色并在GelDoc 2000凝膠成像系統(tǒng)上拍照。
2.1 RAD-seq測(cè)序數(shù)據(jù)質(zhì)量評(píng)估
異型花混池DNA的RAD測(cè)序共產(chǎn)生Raw data 2.76G,過濾后得到Clean data 2.71G。Phred數(shù)值大于20、30的堿基占總體堿基的百分比分別不低于93.35%和88.0%,GC含量為36.12%;RAD-Tag捕獲率為97.68%。可見,樣本的數(shù)據(jù)量足夠,測(cè)序質(zhì)量合格,GC分布正常,建庫測(cè)序成功。
2.2 聚類
對(duì)樣本含有酶識(shí)別位點(diǎn)reads用Cd-hit-est把RAD-tag相近的reads聚集到一個(gè)類中[27]。對(duì)每一類的reads支持?jǐn)?shù)進(jìn)行初步的過濾,過濾標(biāo)準(zhǔn)為每類中reads支持?jǐn)?shù)為10~400,數(shù)據(jù)聚類后共得到1 275 817類,用于聚類的所有reads數(shù)為7 818 523,對(duì)reads支持深度進(jìn)行過濾之后所剩下的pair reads數(shù)為5 127 265,過濾之后的reads數(shù)與所有參加聚類reads的比例(Cut/Pair)為65.58%。
2.3 組裝
根據(jù)聚類結(jié)果用Velvetopt對(duì)篩選后的每一類進(jìn)行局部組裝[28],得到組裝序列后過濾掉125 bp以下的contig。本次組裝總長度為93 655 566 bp,組裝總數(shù)為301 821,contig平均長度為310,序列從大到小排列,當(dāng)長度達(dá)到組裝總長度一半時(shí),contig的長度N50=425 bp。組裝結(jié)果中的GC含量為35.83%,而所有reads的GC含量為36.12%。
將去重復(fù)之后的reads通過Burrows-Wheeler alignment tool(BWA)軟件比對(duì)到組裝結(jié)果中[29],利用SAMtools檢測(cè)變異情況[30]。檢測(cè)結(jié)果顯示,所有能比對(duì)上組裝基因組的reads占所有參加比對(duì)reads的88.8%;每個(gè)位點(diǎn)深度為16.04;reads能夠覆蓋組裝基因組的98.56%;reads能夠覆蓋組裝基因組且深度不低于4×的比例是79.63%;自身reads比對(duì)組裝結(jié)果所檢測(cè)出的SNP數(shù)為252 614,其中雜合SNP為241 335,雜合比例為95.54%。樣本比對(duì)率反映了樣本Clean data的利用情況,覆蓋深度和覆蓋度足以直接反應(yīng)測(cè)序數(shù)據(jù)的均一性及與組裝基因組的一致性。
2.4 SSR位點(diǎn)及其引物
利用SR search軟件對(duì)樣本組裝contig進(jìn)行過濾,最終獲得雙端各有100 bp的SSR位點(diǎn)共5 844個(gè),并成功設(shè)計(jì)5 339對(duì)SSR引物,成功設(shè)計(jì)率為91.38%。已成功設(shè)計(jì)引物的SSR位點(diǎn)的部分信息列于表2,我們獲得的SSR最多的是三核苷酸(3 323條),其次是二核苷酸(1 167條),最少的是六核苷酸(89條);但是,重復(fù)序列的基序種類共277種,其中基序種類數(shù)最多的是五核苷酸(106種),其次是六核苷酸(89種),最少的是二核苷酸(11種)。從能成功設(shè)計(jì)引物的5 339個(gè)SSR位點(diǎn)的重復(fù)序列長度包括17種(12~36 bp),從其分布(表3)來看,長度在12 bp的SSR位點(diǎn)多達(dá)3 028個(gè),占總SSR位點(diǎn)數(shù)的56.71%;其次是16 bp的SSR位點(diǎn),為594個(gè)(11.13%);而不短于25 bp的SSR位點(diǎn)有127個(gè)占總數(shù)的12.38%(成功設(shè)計(jì)引物的5 339個(gè)SSR位點(diǎn)詳細(xì)信息參見附件1)。
2.5 異型花SSR引物的有效性分析
通過梯度退火溫度PCR從10對(duì)備選SSR引物中篩選出可在S.tetraptera中成功擴(kuò)增的引物分別是ST2、ST3、ST6和ST10,并確定這4對(duì)引物的最佳退火溫度。聚丙烯酰氨凝膠電泳顯示這4對(duì)引物都表現(xiàn)出多態(tài)性,等位基因的大小變化范圍見表4。
表2異型花SSR序列的信息
Table2InformationofSSRsequencesinS.tetraptera
SSR類型SSRtype數(shù)量Number百分比Percentage平均長度Averagelength(bp)重復(fù)序列的基序的種類數(shù)Motiftypenumber二核苷酸Di?nucleotide116721.8614.2511三核苷酸Tri?nucleotide332362.2413.3159四核苷酸Tetra?nucleotide56010.4917.2412五核苷酸Penta?nucleotide2003.7517.25106六核苷酸Hexa?nucleotide891.6725.6989總計(jì)Total5339100—277
表3異型花SSR位點(diǎn)重復(fù)序列的長度分布
Table3DistributionofthelengthofSSRsequenceslociofS.tetraptera
長度Length(bp)SSR位點(diǎn)數(shù)NumberofSSRloci分布百分比Distributionpercentage12302856.71142424.531558710.991659411.13182604.87202805.2421621.1622250.47241342.51≥251272.38
表4 異型花的10對(duì)引物特點(diǎn)
利用GENEPOP 4.4[31]分析聚丙烯酰氨凝膠電泳結(jié)果。所檢測(cè)的4對(duì)引物所對(duì)應(yīng)的位點(diǎn)的等位基因數(shù)為4~9,均值為6,多態(tài)性較高;連鎖不平衡(Linkage Disequilibrium)分析顯示4個(gè)SSR位點(diǎn)不連鎖(P<0.01);而ST2、ST3、ST6和ST10的觀測(cè)雜合度分別為0、0、0.093和0,均值0.023。
異型花屬是單型屬,其近緣類群為花錨屬(HaleniaBorkh.)和獐牙菜屬(SwertiaLinn.)[2~3],因而用橢圓葉花錨(HaleniaellipticaD.Don)對(duì)異型花多態(tài)性引物進(jìn)行近緣物種交叉檢驗(yàn),發(fā)現(xiàn)ST2和ST6可以在橢圓葉花錨中成功擴(kuò)增。
目前,異型花尚未獲得全基因組或轉(zhuǎn)錄組數(shù)據(jù),甚至也沒有龍膽科內(nèi)近緣物種的可參考全基因組序列。因而我們采用RAD-seq技術(shù)對(duì)異型花進(jìn)行簡化基因組測(cè)序,測(cè)序結(jié)果成功,獲得了異型花基因組水平上的序列信息。所得的序列經(jīng)聚類和組裝后,也呈較高的組裝準(zhǔn)確性,從側(cè)面反映組裝結(jié)果能夠代表部分基因組。樣本比對(duì)率(88.80%)反映了樣本Clean data的高利用率,覆蓋深度和覆蓋度足以直接反映測(cè)序數(shù)據(jù)的均一性及與組裝基因組的一致性。
利用SR search軟件對(duì)獲得的序列進(jìn)行SSR甄別,獲得雙端各有100 bp的SSR位點(diǎn)多達(dá)5 844個(gè),并成功設(shè)計(jì)5 339對(duì)SSR引物,成功設(shè)計(jì)率高達(dá)91.38%。在能成功設(shè)計(jì)引物的SSR位點(diǎn)中,重復(fù)序列的基序種類共277種,而且重復(fù)序列長度包括17種,可見已成功設(shè)計(jì)引物的異型花的SSR多樣性較高。隨機(jī)挑選的10對(duì)SSR引物中,經(jīng)PCR和凝膠電泳檢測(cè),有4對(duì)可在S.tetraptera中成功擴(kuò)增,并且表現(xiàn)出多態(tài)性。經(jīng)GENEPOP 4.4對(duì)已獲得的位點(diǎn)分析,顯示其等位基因的均值為6,多態(tài)性較高,并且相互之間不連鎖;4個(gè)位點(diǎn)偏離哈迪溫伯格平衡,這是因?yàn)楫愋突ㄖ饕M(jìn)行自花授粉,在自然界中很難形成進(jìn)行自由交配的居群[2~3],較高的純合子數(shù)量(觀測(cè)雜合度均值0.023)可能也歸因于其授粉方式;4對(duì)引物中有2對(duì)可以在其近緣異屬中成功擴(kuò)增,表現(xiàn)出了一定的通用性??梢姡狙芯繉楹罄m(xù)的基于SSR標(biāo)記的異型花居群遺傳和指紋圖譜等研究提供足夠的SSR標(biāo)記數(shù)據(jù)庫。
值得補(bǔ)充的是,我們用同樣的方法開發(fā)了肉果草(LanceatibeticaHook.F. et Thoms)[23]和橢圓葉花錨(待發(fā)表數(shù)據(jù))的多態(tài)性SSR位點(diǎn),通過與我們以往的窄葉鮮卑花(Sibiraeaangustata(Rehder) K.S.Hao)[32]、繡線菊屬(SpiraeaLinn.)[33]、西川紅景天(Rhodiolaalsia(Frod.) S.H.Fu)[34]和黃綠蜜環(huán)菌(Armillarialuteo-virens(Aalb.et Schw:Fr.)Sacc.)[35]等物種的SSR標(biāo)記開發(fā)研究的比較,我們發(fā)現(xiàn)基于RAD-seq技術(shù)進(jìn)行SSR標(biāo)記研究表現(xiàn)出了RAD-seq技術(shù)本身所具備的優(yōu)勢(shì),包括通量高、準(zhǔn)確性高、數(shù)據(jù)利用率高、實(shí)驗(yàn)周期短、不受基因組序列的限制以及性價(jià)比高[18~19],在SSR位點(diǎn)開發(fā)方面明顯優(yōu)于傳統(tǒng)的FIASCO(Fast Isolation by AFLP of Sequences Containing Repeats)[36]等方法。所以,對(duì)于尚無足夠核酸序列數(shù)據(jù)參考的物種,RAD-seq是目前的一種比較理想的SSR信息研究技術(shù)。
1.He T N,Liu S W,Chen S L.Nomenclatural novelities inSwertia(Gentianaceae)[J].Plant Diversity and Resources,2013,35(3):386-392.
2.He T N,Liu S W,Liu J Q.A new Qinghai-Tibet Plateau endemic genusSinoswertiaand its pollination mode[J].Plant Diversity and Resources,2013,35(3):393-400.
3.Ho T N,Liu S W.A worldwide monograph ofSwertiaand its allies[M].Beijing:Science Press,2015:301-308.
4.Fu P C,Gao Q B,Zhang F Q,et al.Responses of plants to changes in Qinghai-Tibetan Plateau and glaciations:Evidence from phylogeography of aSibiraea(Rosaceae) complex[J].Biochemical Systematics and Ecology,2016,65:72-82.
5.Gao Q B,Zhang D J,Duan Y Z,et al.Intraspecific divergences ofRhodiolaalsia(Crassulaceae) based on plastid DNA and internal transcribed spacer fragments[J].Botanical Journal of the Linnean Society,2012,168(2):204-215.
6.Wang L Y,Abbott R J,Zhang W,et al.History and evolution of alpine plants endemic to the Qinghai-Tibetan Plateau:Aconitumgymnandrum(Ranunculaceae)[J].Molecular Ecology,2009,18(4):709-721.
7.中國科學(xué)院西北高原生物研究所.藏藥志[M].青海:青海人民出版社,1991:111-112.
Northwest Institute of Plateau Biology,Chinese Academy of Sciences.Handbook of Tibetan medicine[M].Qinhai:Qinghai People’s Publishing Press,1991:111-112.
8.楊路存,陳桂琛,周國英,等.四數(shù)獐牙菜ISSR-PCR反應(yīng)體系的正交優(yōu)化[J].生物技術(shù)通報(bào),2010,20(9):123-128.
Yang L C,Chen G C,Zhou G Y,et al.Optimization for ISSR-PCR reaction system inSwertiatetrapterausing orthogonal design[J].Biotechnology Bulletin,2010,20(9):123-128.
9.Yang L C,Zhou G Y,Chen G C.Genetic diversity and population structure ofSwertiatetraptera(Gentianaceae),an endemic species of Qinghai-Tibetan Plateau[J].Biochemical Systematics and Ecology,2011,39(4-6):302-308.
10.Wang X R,Szmidt A E.Molecular markers in population genetics of forest trees[J].Scandinavian Journal of Forest Research,2001,16(3):199-220.
11.何平.真核生物中的微衛(wèi)星及其應(yīng)用[J].遺傳,1998,20(4):42-47.
He P.Abundance,Polymorphism and applications of microsatellite in eukaryote[J].Hereditas,1998,20(4):42-47.
12.Doerge R W.Mapping and analysis of quantitative trait loci in experimental populations[J].Nature Reviews Genetics,2002,3(1):43-52.
13.Liu W J,Nie H,Wang S B,et al.Mapping a resistance gene in wheat cultivar Yangfu 9311 to yellow mosaic virus,using microsatellite markers[J].Theoretical and Applied Genetics,2005,111(4):651-657.
14.Yoshimoto K,Yoshida J,Ishii G,et al.Two lung adenocarcinomas in the same lobe:multiple primaries or intrapulmonary metastasis?[J].Annals of Thoracic and Cardiovascular Surgery,2011,17(6):584-587.
15.陶星辰,尚秋菊,劉曉英,等.云南省部分地區(qū)鴿糞中新型隱球菌的分離與鑒定[J].中國病原生物學(xué)雜志,2014,9(10):873-876.
Tao X C,Shang Q J,Liu X Y,et al.Isolation and identification ofCryptococcusneoformansfrom pigeon droppings in parts of Yunnan Province[J].Journal of Pathogen Biology,2014,9(10):873-876.
16.Conti S,Gallo E,Sioletic S,et al.Molecular genetic alterations in egfr CA-SSR-1 microsatellite and egfr copy number changes are associated with aggressiveness in thymoma[J].Journal of Thoracic Disease,2016,8(3):386-395.
17.石璇,王茹媛,唐君,等.利用簡化基因組技術(shù)分析甘薯種間單核苷酸多態(tài)性[J].作物學(xué)報(bào),42(5):641-647.
Shi X,Wang R Y,Tang J,et al.Analysis of interspecific SNPs in sweetpotato using a Reduced-Representation genotyping technology[J].Acta Agronomica Sinica,2016,42(5):641-647.
18.Miller M R,Dunham J P,Amores A,et al.Rapid and cost-effective polymorphism identification and genotyping using restriction site associated DNA(RAD) markers[J].Genome Research,2016,17(2):240-248.
19.王洋坤,胡艷,張?zhí)煺?RAD-seq技術(shù)在基因組研究中的現(xiàn)狀及展望[J].遺傳,2014,36(1):41-49.
Wang Y K,Hu Y,Zhang T Z.Current status and perspective of RAD-seq in genomic research[J].Hereditas,2014,36(1):41-49.
20.Willing E M,Hoffmann M,Klein J D,et al.Paired-end RAD-seq for de novo assembly and marker design without available reference[J].Bioinformatics,2011,27(16):2187-2193.
21.Hou Y,Nowak M D,Mirr V,et al.RAD-seq data point to a northern origin of the arctic-alpine genusCassiope(Ericaceae)[J].Molecular Phylogenetics and Evolution,2016,95:152-160.
22.Gamble T,Coryell J,Ezaz T,et al.Data from:Restriction site-associated DNA sequencing(RAD-seq) reveals an extraordinary number of transitions among gecko sex-determining systems[J].Molecular Biology and Evolution,2015,32(5):1296-1309.
23.Tian Z Z,Zhang F Q,Liu H R,et al.Development of SSR markers for a Tibetan medicinal plant,Lanceatibetica(Phrymaceae),based on RAD sequencing[J].Applications in Plant Sciences,2016,4(11):1600076.
24.Zhang F Q,Lei S Y,Gao Q B,et al.Isolation of microsatellite loci forRhodiolaalsia(Crassulaceae):an important ethno-medicinal herb endemic to the Qinghai-Tibetan plateau[J].Genetics and Molecular Research,2015,14(2):5266-5269.
25.Davey J W,Blaxter M L.RADSeq:next-generation population genetics[J].Briefings in functional genomic,2010,9(5-6):416-423.
26.Rozen S,Skaletsky H.Primer3 on the WWW for general users and for biologist programmers[M].//Misener S,Krawetz S A,eds.Bioinformatics Methods and Protocols.Totowa,NJ:Humana Press,1999:365-386.
27.Li W Z,Godzik A.Cd-hit:a fast program for clustering and comparing large sets of protein or nucleotide sequences[J].Bioinformatics,2006,22(13):1658-1659.
28.Zerbino D R,Birney E.Velvet:algorithms for de novo short read assembly using de Bruijn graphs[J].Genome Research,2008,18(5):821-829.
29.Li H,Durbin R.Fast and accurate long-read alignment with burrows-wheeler transform[J].Bioinformatics,2010,25(5):589-595.
30.Li H,Handsaker B,Wysoker A,et al.The sequence alignment/map format and SAMtools[J].Bioinformatics,2009,25(16):2078-2079.
31.Rousset F.GENEPOP’007:A complete re-implementation of the GENEPOP software for Windows and Linux[J].Molecular Ecology Resources,2008,8(1):103-106.
32.Arranz S E,Avarre J C,Balasundaram C,et al.Permanent Genetic Resources added to Molecular Ecology Resources Database 1 December 2012-31 January 2013[J].Molecular Ecology Resources,2013,13(3):546-549.
33.張金華,Khan G,付鵬程,等.基于磁珠富集法的繡線菊SSR分子標(biāo)記分離與篩選[J].生物學(xué)雜志,2014,31(3):79-83.
Zhang J H,Khan G,Fu P C,et al.Isolation and screening of molecular genetic marker SSR inSpiraeabased on magnetic beads enriched[J].Journal of Biology,2014,31(3):79-83.
34.王久利,雷淑蕓,陳世龍,等.基于磁珠富集法開發(fā)并篩選西川紅景天的微衛(wèi)星標(biāo)記[J].廣西植物,2017(03):342-347.
Wang J L,Lei S Y,Chen S L,et al.Development and screening of SSR markers inRhodiolaalsiabase on magnetic beads method[J].Guihaia,2017(03):342-347.
35.邢睿,高慶波,張發(fā)起,等.基于454測(cè)序技術(shù)的青藏高原黃綠蜜環(huán)菌微衛(wèi)星引物的開發(fā)[J].微生物學(xué)報(bào),2014,54(9):1045-1052.
Xing R,Gao Q B,Zhang F Q,et al.Isolation and characterization of 27 polymorphic microsatellite markers inArmillarialuteo-virens(Physalacriaceae)[J].Acta Microbiologica Sinica,2014,54(9):1045-1052.
36.Zane L,Bargelloni L,Patarnello T.Strategies for microsatellite isolation:a review[J].Molecular Ecology,2002,11(1):1-16.
National Natural Science Foundation of China(31400322);Applied Basic Research Programs of Qinghai Province(2016-ZJ-761)
introduction:WANG Jiu-Li(1991—),male,doctoral candidate,Botany major.
date:2016-12-26
AnalysisonSSRinSinoswertiatetrapteraBaseonRAD-seq
WANG Jiu-Li1,2ZHU Ming-Xing3XU Ming-Hang3CHEN Shi-Long1ZHANG Fa-Qi1*
(1.Key Laboratory of Adaptation and Evolution of Plateau Biota,Northwest Institute of Plateau Biology,Northwest Institute of Eco-Environment and Resources,Chinese Academy of Sciences,Xining 810008;2.University of the Chinese Academy of Sciences,Beijing 100039;3.College of Ecology-Environment Engineering,Qinghai University,Xining 810016)
We used the restriction-site associated DNA sequencing(RAD-seq) technology to analyze simple sequence repeats(SSR) information ofSinoswertiatetraptera(Maxiowicz) T.N.Ho, S.W.Liu & J.Q.Liu. The 5844 SSR loci, with at least 100 bp at two ends, were identified using SR search software. The 5339(91.38%) loci’s primers were designed successfully. Among which, amount of tri-nucleotide SSR loci is the most(3323); repeat sequence length type number is 17, while repeat motif type number is 227, and type number of penta-nucleotide motif is the most(106). We employed 32 individuals from 4 natural populations ofS.tetrapterato estimate usability and polymorphism of 10 pairs of SSR primers selected randomly from the 5 339 pairs of primers. According to the result of PCR and Polyacrylamide gel electrophoresis, four pairs of primers(ST2, ST3, ST6 and ST10) amplified favorably and showed polymorphism. By the GENEPOP 4.4, the mean number of alleles of the four loci is 6; these loci do not link to each other(P<0.01); these loci deviate from HWE(P<0.01) in most populations and have many homozygotes(observed heterozygosity mean 0.023), which due to the cleistogamous pollination mode ofS.tetraptera. ST2 and ST6 were successfully amplified inHaleniaelliptica. Our study will offer a SSR dataset in the future based on SSR markers ofS.tetraptera.
RAD-seq;reduced-representation sequencing;Sinoswertiatetraptera;SSR;subtribe Swertiinae
國家自然科學(xué)基金(31400322);青海省應(yīng)用基礎(chǔ)研究計(jì)劃(2016-ZJ-761)
王久利(1991—),男,博士研究生,主要從事植物學(xué)方面的研究。
* 通信作者:E-mail:fqzhang@nwipb.cas.cn
2016-12-26
* Corresponding author:E-mail:fqzhang@nwipb.cas.cn
Q949.776.4
A
10.7525/j.issn.1673-5102.2017.03.016