姚嘉瑜 張立武 趙 捷 徐 益,2 祁建民 張列梅,*
?
黃麻全基因組SSR鑒定與特征分析
姚嘉瑜1,**張立武1,2,**趙 捷1徐 益1,2祁建民1張列梅1,*
1福建農(nóng)林大學(xué)作物遺傳育種與綜合利用教育部重點(diǎn)實(shí)驗(yàn)室 / 福建省作物設(shè)計育種重點(diǎn)實(shí)驗(yàn)室 / 作物科學(xué)學(xué)院, 福建福州 350002;2福建農(nóng)林大學(xué)海峽聯(lián)合研究院基因組與生物技術(shù)中心, 福建福州 350002
黃麻是世界上重要的天然韌皮部纖維作物之一。然而, SSR標(biāo)記的缺乏限制了黃麻的遺傳改良。本研究從圓果種黃麻測序品種CVL-1的基因組、基因、CDS和cDNA中挖掘SSR信息, 利用SSR Primer軟件查找SSR位點(diǎn), 并分析其分布特征。結(jié)果表明, 基于基因組序列共開發(fā)了153,242個基因組SSR, 平均密度為467.20個SSR Mb–1; 基于cDNA序列開發(fā)了10,747個SSR, 平均密度為260.85 SSR Mb–1。大部分重復(fù)基元為二至四核苷酸, 占76.91%, 其中cDNA序列SSR中三核苷酸重復(fù)基元數(shù)量較多而基因組SSR中二核苷酸重復(fù)基元數(shù)量較多。對于不同類型的SSR重復(fù)基元, 隨著重復(fù)單元數(shù)量的增加, 其基因組和cDNA的SSR分布頻率呈現(xiàn)逐步降低特征。黃麻全基因組SSR標(biāo)記鑒定, 不僅可以豐富黃麻分子標(biāo)記的數(shù)量, 而且為剖析黃麻重要農(nóng)藝性狀的遺傳機(jī)制奠定基礎(chǔ)。
黃麻; 基因組; cDNA; SSR
黃麻為錦葵科(Malvaceae)黃麻屬(spp.)一年生次生韌皮部纖維作物, 其纖維產(chǎn)量占世界麻類纖維總產(chǎn)量的80%。黃麻屬有100多個種, 具有栽培價值的有圓果種()和長果種(), 兩者具有不同生長習(xí)性, 存在生殖隔離, 皆為二倍體(2= 14), 主要在孟加拉、印度和中國等國家種植[1-3]。在世界范圍內(nèi), 黃麻的產(chǎn)量和種植面積僅次于棉花, 是麻紡工業(yè)的重要原料, 每年黃麻生產(chǎn)產(chǎn)值達(dá)到23億美元[3]。
開發(fā)重復(fù)性和穩(wěn)定性好的SSR分子標(biāo)記, 對于黃麻遺傳多樣性研究、重要性狀的遺傳基礎(chǔ)剖析等具有重要意義。然而, 相對于水稻等模式作物, 黃麻分子標(biāo)記開發(fā)與其他作物差距很大, 目前國內(nèi)外報道較少[2-6]。這些研究報道主要集中在RAPD、AFLP、SSR、ISSR等分子標(biāo)記, 少量基于二代測序獲得的RAD[7-8]或SLAF[9]等分子標(biāo)記。如Nishat等[5]用抗寒性有差別的2個親本O-9897和Acc.1805, 創(chuàng)建了F2代作圖群體, 用8個ISSR引物構(gòu)建了總長度為87.3 cM的包括3個連鎖群的長果種黃麻遺傳連鎖圖譜, 3個連鎖群的大小在4.8~ 52.9 cM之間, 相鄰標(biāo)記平均距離為8.73 cM, 該圖譜遠(yuǎn)遠(yuǎn)不能滿足基因定位、基因克隆等研究的要求。Das等[6]用纖維品質(zhì)有差別的2個親本JRO524和PPO4, 創(chuàng)建了F6代RIL作圖群體, 用36個SSR標(biāo)記構(gòu)建長果種黃麻遺傳連鎖圖譜, 但其只有6條連鎖群, 標(biāo)記密度達(dá)21.8 cM。由于SSR標(biāo)記具有高效、高共顯性等優(yōu)點(diǎn), 尤其是重復(fù)性好, 不同研究間可互比較, 是物種的起源與進(jìn)化、遺傳連鎖圖譜構(gòu)建等研究優(yōu)先考慮的分子標(biāo)記[10]。國內(nèi)外學(xué)者開發(fā)了水稻[11]、大麥[12]、玉米[13]、油菜[14-16]等作物的SSR標(biāo)記, 為研究該作物的遺傳多樣性、遺傳連鎖圖譜構(gòu)建、關(guān)聯(lián)分析等打下了基礎(chǔ)。
最近, Islam等[3]發(fā)表了黃麻基因組草圖(draft)。該研究利用二代測序技術(shù)Roche/454對黃麻基因組測序, 經(jīng)組裝發(fā)現(xiàn), 圓果種CVL-1基因組大小為338 M (13.69 Gb raw data, Scaffold N50為4.1 Mb)。這表明已獲得黃麻基因組草圖, 但還沒有組裝到染色體水平。然而, 對于黃麻全基因組SSR鑒定尚未見報道。本研究旨在分析圓果種黃麻CVL-1基因組、基因、CDS和cDNA中SSR信息, 發(fā)掘SSR位點(diǎn)并分析其特征, 為黃麻遺傳育種研究提供SSR信息。
通過NCBI公共數(shù)據(jù)庫(https://www.ncbi.nlm. nih.gov/)獲得圓果種CVL-1基因組、基因、CDS和cDN A序列(Sequence Read Archive [SRA]: SRP053213)。利用SSR Primer工具(http://hornbill. cspp.latrobe.edu.au/ ssrdiscovery.html)搜索這些序列所包含的SSR。篩選SSR的標(biāo)準(zhǔn)為, 二核苷酸重復(fù)次數(shù)>6次, 三核苷酸重復(fù)次數(shù)>4次, 四核苷酸重復(fù)次數(shù)>3次, 五核苷酸重復(fù)次數(shù)>2次。利用Primer 3軟件查找SSR位點(diǎn)。
分析了黃麻重復(fù)基元為2~6 bp, 且重復(fù)長度不短于12 bp的SSR分類和分布情況, 如表1所示。黃麻全基因組大小為338 Mb, 共開發(fā)了153,242個完整的SSR, 平均密度為467.20個SSR Mb–1。其中, I類(重復(fù)序列長度 ≥ 20 bp) SSR有38,917個(25.40%), 平均密度為118.65個SSRs Mb–1; 而II類(重復(fù)序列長度 ≥ 12 bp和<20 bp) SSR有114,325 (74.60%), 平均密度為348.55個SSR Mb–1。黃麻所有基因的cDNA大小為41.20 Mb, 共開發(fā)了10,747個SSR, 平均密度為260.85 SSR Mb–1, 包括1251個 (11.64%) I類SSR和9496 (88.36%) II類SSR, 其平均密度分別為30.36個SSR Mb–1和230.49個SSR Mb–1。
經(jīng)過比較可以發(fā)現(xiàn): 與基因組序列相比, cDNA序列具有較低的SSR密度, 而且具有較高的GC含量(57.79%)。I類SSR分布密度低于II類SSR。I類SSR在基因組、基因、CDS和cDNA中平均密度為118.65、81.67、19.87和30.36個SSR Mb–1, 而II類SSR相應(yīng)的平均密度顯著偏高, 分別348.55、295.20、163.15與230.49個SSR Mb–1。這表明I類SSR分布密度低于II類SSR。
表1 黃麻SSR的分布特征
I類SSR指重復(fù)序列長度大于20 bp, 而II類SSR指重復(fù)序列長度大于12 bp且小于20 bp。
SSRs of class I mean repeat length ≥ 20 bp, SSRs of class II mean repeat length ≥ 12 bp and < 20 bp.
對于II類SSR來說, 全基因組和cDNA中比例最多的SSR重復(fù)序列平均長度是12 bp, 分別占全基因組和cDNA中的45.98%和38.14% (圖1-a), 占全基因組和cDNA中II類SSR的52.03%和48.19% (圖1-b)。比例較多的SSR重復(fù)序列平均長度是15 bp, 分別占全基因組和cDNA中的18.90%和14.91%, 占全基因組和cDNA中II類SSR的21.39%和18.83%。
與II類SSR相比, 全基因組和cDNA中I類SSR的比例最多重復(fù)序列平均長度表現(xiàn)不同(圖1-c)。全基因組中I類SSR比例最多的重復(fù)序列平均長度是20 bp, 具有7646個SSR; 而cDNA序列中I類SSR比例最多的重復(fù)序列平均長度是24 bp, 占29.58%, 其次是21 bp重復(fù)序列平均長度。
圖1 黃麻SSR重復(fù)序列長度的頻率分布
SSR重復(fù)基元在全基因組中比例較多的SSR重復(fù)基元是二核苷酸、三核苷酸、四核苷酸, 分別占22%、19%和23%。經(jīng)比較, 不同重復(fù)基元的頻率高低與核苷酸數(shù)量沒有嚴(yán)格的相關(guān)性。如全基因組中四核苷酸重復(fù)基元的SSR總數(shù)略多于三核苷酸。同樣地, 在cDNA中, 三核苷酸重復(fù)所占比例最多, 為43%, 其次是四核苷酸重復(fù), 占13.3%, 二核苷酸重復(fù)和五核苷酸重復(fù)比較少, 分別占9.7%和7.1% (圖2-a)。
按不同類型SSR來統(tǒng)計各重復(fù)基元的分布頻率(圖2-b和圖2-c)。cDNA中I類SSR, 三核苷酸重復(fù)基元遠(yuǎn)遠(yuǎn)高于其他類型; cDNA中II類SSR呈現(xiàn)類似的特點(diǎn), 推測作為蛋白質(zhì)遺傳密碼子模板的cDNA, 三核苷酸重復(fù)基元在cDNA_SSR中數(shù)量比較突出。而基因組中I類SSR, 二核苷酸重復(fù)基元遠(yuǎn)遠(yuǎn)高于其他類型; 基因組中II類SSR, 二、三、四核苷酸重復(fù)基元均較多。
圖2 黃麻基因組、基因、CDS和cDNA的SSR重復(fù)基元的頻率分布
圖3列出了黃麻SSR重復(fù)基元及平均重復(fù)序列長度的頻率分布。隨著分析的五種重復(fù)基元(2~6 bp)的數(shù)量增加, SSR分布的頻率逐步降低, 特別是對于較長重復(fù)基元(如四至六核苷酸), 其頻率降低最顯著。
圖3 黃麻基因組和cDNA的SSR重復(fù)基元及平均重復(fù)序列長度的頻率分布
如表2所示, 重復(fù)基元的重復(fù)次數(shù)對于不同重復(fù)基元種類而言是不同的, 如三核苷酸重復(fù)基元的重復(fù)次數(shù)在基因組和cDNA中分別是二核苷酸的0.9倍和5.4倍, 分別是四核苷酸的0.9倍和3.5倍, 體現(xiàn)出三核苷酸重復(fù)基元在cDNA中較頻繁地發(fā)生。對比黃麻SSR重復(fù)基元在全基因組和cDNA中的分布頻率, 可以發(fā)現(xiàn), SSR在基因組中, 二、三核苷酸的平均重復(fù)序列長度比其他種類要長, 顯示出二、三核苷酸重復(fù)在黃麻基因組SSR中較頻繁地發(fā)生, 且其重復(fù)基元數(shù)量在基因組SSR中比例也最多。統(tǒng)計黃麻SSR, 黃麻最長的平均重復(fù)序列長度為三核苷酸重復(fù)基元。其中, 重復(fù)基元AAT重復(fù)次數(shù)達(dá)2511, 重復(fù)序列長度達(dá)到7533 bp; 其次重復(fù)基元AAG, 重復(fù)次數(shù)達(dá)2246。Karaoglu等[17]研究顯示, 較長的重復(fù)序列長度通常傾向于具有較高的突變率, 這與SSR的多態(tài)性息息相關(guān)。
考慮到二、三核苷酸重復(fù)在黃麻基因組SSR中比重大, 進(jìn)一步分析其優(yōu)勢重復(fù)基元, 如圖4所示。二核苷酸重復(fù)基元的SSR在基因組中, 以AT為主, 占75.88%。而CG重復(fù)基元則相當(dāng)罕見, 僅占0.04%; 在cDNA中, 以AT和AG重復(fù)基元較多, 分別占32.9%和37.6%。三核苷酸重復(fù)基元的SSR在基因組中, AAT、AAG、ATA和ATT所占比例較多, 分別占13.4%、11.8%、11.7%和11.1%; 在cDNA中, AAG、AGA、CTT所占比例較多, 分別占13.4%、11.5%、9.4%和11.5%。
為了比較不同物種間SSR重復(fù)類型的頻率分布特征, 我們選取基因組大小差不多的5個物種, 分別為2個單子葉植物(水稻和高粱)和3個雙子葉植物(擬南芥、黃瓜L.和葡萄)。應(yīng)用相同的標(biāo)準(zhǔn)來研究這6個物種基因組SSR分布特征, 即統(tǒng)計重復(fù)基元為2~6 bp, 重復(fù)長度不短于12 bp的SSR。表2列出黃麻和這5個物種SSR分布的總體特征。從SSR分布密度來看, 這6個物種的SSR分布密度變異范圍從315.5 SSR Mb–1到738.5 SSR Mb–1。黃麻在分析的6個物種中SSR分布密度中等(467.2 SSR Mb–1)。高粱的SSRs密度最低, 僅為315.5 SSR Mb–1, 略低于擬南芥(364.1 SSR Mb–1)。
SSR標(biāo)記對植物的遺傳學(xué)、生態(tài)學(xué)、分類學(xué)、進(jìn)化等研究至關(guān)重要。分析黃麻SSR在基因組、基因、CDS和cDNA中不同層面的重復(fù)基元分布頻率和平均重復(fù)序列長度等信息, 有助于黃麻基因組的遺傳研究, 并提供SSR位點(diǎn)信息。
本研究從公共數(shù)據(jù)庫獲得黃麻基因組草圖序列, 共開發(fā)了153,242個基因組SSR; 基于cDNA序列開發(fā)了10,747個SSR。結(jié)果表明, 大部分重復(fù)基元為二至五核苷酸, 其中cDNA序列中三核苷酸重復(fù)基元數(shù)量較多而基因組序列中二核苷酸重復(fù)基元數(shù)量較多。這與在大多數(shù)植物基因組中三核苷酸重復(fù)的分布頻率較高的結(jié)果是一致的[14-16]。Hong等[19]分析白菜中SSR重復(fù)基元發(fā)現(xiàn), 三核苷酸重復(fù)出現(xiàn)的頻率是37%。Goff等[20]在水稻中, 也發(fā)現(xiàn)基因組SSR中三核苷酸重復(fù)占59%。本研究中, 黃麻SSR的分析結(jié)果顯示, 二、三、四核苷酸中所有的重復(fù)基元類型都有, 但不同重復(fù)基元的比例存在顯著差異。其中二核苷酸重復(fù)中AT類型最豐富, 三核苷酸重復(fù)中AAT和AAG最多。二核苷酸重復(fù)基元的SSR在基因組中, 以AT為主, 這與課題組前期利用公共數(shù)據(jù)庫數(shù)據(jù)得出的結(jié)論類似[18]。
Temnykh等[11]研究發(fā)現(xiàn), SSR長度大于或等于20 bp的SSR具有較高的多態(tài)性。為此, 將SSR劃分為兩類, 即I類SSR指重復(fù)序列長度大于20 bp, 而II類SSR指重復(fù)序列長度大于12 bp且小于20 bp。在黃麻全基因組和cDNA中, 較短的II類SSR比I類更為豐富。這種趨勢可能是由于較長的I類重復(fù)是由較短的II類重復(fù)不對稱配對產(chǎn)生的, 也可能是較長的I類重復(fù)具有不穩(wěn)定性, 而較短的II類重復(fù)可能更耐受突變和保留。
在黃麻基因組中, 大多數(shù)SSR是二、三和四核苷酸重復(fù)序列, 它們占所有SSR的76.91%, 且三者的量相對比較平均。對于不同類型的SSR重復(fù)基元, 隨著重復(fù)單元的數(shù)量增加, 其在基因組和cDNA的SSR分布頻率呈現(xiàn)逐步降低; 隨著重復(fù)次數(shù)的增加, 較長的重復(fù)基元, 五核苷酸和六核苷酸的分布頻率會顯著降低。
Morgante等[21]報道, 基因組大小與SSR密度或SSR數(shù)量之間呈現(xiàn)負(fù)相關(guān)。研究黃麻和另外5個物種基因組SSR分布特征印證這一點(diǎn), 具有最大基因組(739 Mb)的高粱, SSR密度最低。在大豆(1115 Mb)和玉米(2365 Mb)基因組中也觀察到類似的趨勢[22]。在這6種植物的cDNA中, 三核苷酸SSR是最豐富的, 其次是四核苷酸和二核苷酸。作為蛋白質(zhì)遺傳密碼子模板的cDNA, 三核苷酸重復(fù)基元在SSR中數(shù)量比較突出, 較頻繁地發(fā)生, 可能具有類似于簡并密碼子的作用。黃麻基因組中的SSR密度高于基因組的轉(zhuǎn)錄區(qū)域cDNA, 這種現(xiàn)象與黃瓜和葡萄相一致, 而與擬南芥、高粱相反。
黃麻全基因組大小約為338 Mb, 開發(fā)了153,242個SSR, 平均密度為467.20個SSR Mb–1。黃麻所有基因的cDNA大小為41.20 Mb, 開發(fā)了10,747個SSR, 平均密度為260.85 SSR Mb–1。大部分重復(fù)基元為二至四核苷酸, 占76.91%, 其中cDNA序列SSR中三核苷酸重復(fù)基元數(shù)量較多而基因組SSR中二核苷酸重復(fù)基元數(shù)量較多。不同物種間, 黃麻具中等SSR分布密度(467.2 SSR Mb–1)。
[1] 熊和平. 麻類作物育種學(xué). 北京: 中國農(nóng)業(yè)科學(xué)技術(shù)出版社, 2008. pp 208–296. Xiong H P. Breeding Sciences of Bast and Leaf Fiber Crops. Beijing: China Agricultural Science and Technology Press, 2008. pp 208–296 (in Chinese).
[2] 祁建民, 李維明, 吳為人. 黃麻的起源與進(jìn)化研究. 作物學(xué)報, 1997, 23: 677–682. Qi J M, Li W M, Wu W R. Studies on origin and evolution of jute., 1997, 23: 677–682 (in Chinese with English abstract).
[3] Islam M S, Saito J A, Emdad E M, Ahmed B, Islam M M, Halim A, Hossen Q M M, Hossain M Z, Ahmed R, Hossain M S, Kabir S M T, Khan M S A, Khan M M, Hasan R, Aktar N, Honi U, Islam R, Rashid M M, Wan X H, Hou S B, Haque T, Azam M S, Moosa M M, Elias S M., Hasan A M M, Mahmood N, Shafiuddin M, Shahid S, Shommu N S, Jahan S, Roy S, Chowdhury A, Akhand A I, Nisho G M, Uddin K S, Rabeya T, Hoque S M E, Snigdha A R, Mortoza S, Matin S A, Islam M K, Lashkar M Z H, Zaman M, Yuryev A, Uddin M K, Rahman M S, Haque M S, Alam M M, Khan H, Alam M. Comparative genomics of two jute species and insight into fibre biogenesis., 2017, 3: 16223–16230.
[4] Basu A, Ghosh M, Meyer R, Powell W, Basak S L, Sen S K. Analysis of genetic diversity in cultivated jute determined by means of SSR markers and AFLP profiling., 2004, 44: 678–685.
[5] Nishat S, Haseena K, Nadim A, Sharkar M T K. Construction of an intraspecific linkage map of jute., 2006, 5: 758–762.
[6] Das M, Banerjee S, Dhariwal R, Vyas S, Mir R, Topdar N, Kundu A, Khurana J, Tyagi A, Sarkar D, Sinha M, Balyan H, Gupta P. Development of SSR markers and construction of a linkage map in jute., 2012, 91: 21–31.
[7] Biswas C, Dey P, Karmakar P G, Satpathy S. Discovery of large-scale SNP markers and construction of linkage map in a RIL population of jute ()., 2015, 35: 1–10.
[8] Kundu A, Chakraborty A, Mandal N, Das D, Karmakar P G, Singh N K, Sarkar D. A restriction-site-associated DNA (RAD) linkage map, comparative genomics and identification of QTL for histological fibre content coincident with those for retted bast fibre yield and its major components in jute (L., Malvaceae s. l.)., 2015, 35: 1–17.
[9] Tao A, Huang L, Wu G, Afshar R K, Qi J M, Xu J T, Fang P P, Lin L H, Zhang L W, Lin P Q. High-density genetic map construction and QTLs identification for plant height in white jute (L.) using specific locus amplified fragment (SLAF) sequencing., 2017, 18: 355–376.
[10] Zhang L W, Li S P, Chen L, Yang G S. Identification and mapping of a major dominant quantitative trait locus controlling seeds per silique as a single Mendelian factor inL., 2012, 125: 695–705.
[11] Temnykh S, DeClerck G, Lukashova A, Lipovich L, Cartinhour S, McCouch S. Computational and experimental analysis of microsatellitess in rice (L.): frequency, length variation, transposon associations, and genetic marker potential., 2001, 11: 1441–1452.
[12] Russell J, Fuller J, Macaulay M, Hatz B, Jahoor A, Powell W, Waugh R. Direct comparison of levels of genetic variation among barley accessions detected by RFLPs, AFLPs, SSRs and RAPDs., 1997, 95: 714–722.
[13] Pejic I, Ajmone-Marsan P, Morgante M, Kozumplick V, Castiglioni P, Taramino G, Motto M. Comparative analysis of genetic similarity among maize inbred lines detected by RFLPs, RAPDs, SSRs and AFLPs., 1998, 97: 1248–1255.
[14] Cheng X, Xu J, Xia S, Gu J, Yang Y, Fu J, Qian X, Zhang S C, Wu J S, Liu K. Development and genetic mapping of microsatellite markers from genome survey sequences in., 2009, 118: 1121–1131.
[15] Li H, Chen X, Yang Y, Xu J S, Gu J X, Fu J, Qian X J, Zhang S C, Wu J S, Liu K. Development and genetic mapping of microsatellite markers from whole genome shotgun sequences in., 2010, 28: 585–596.
[16] Xu J, Qian X, Wang X, Li R, Cheng X, Yang Y, Fu J, Zhang S C, King G J, Wu J S, Liu K. Construction of an integrated genetic linkage map for the A genome ofusing SSR markers derived from sequenced BACs in., 2010, 11: 594–603.
[17] Karaoglu H, Lee C M Y, Meyer W. Survey of simple sequence repeats in completed fungal genomes., 2005, 22: 639–649.
[18] 張立武, 袁民航, 何雄威, 徐建堂, 祁建民, 劉星, 方平平, 林荔輝, 陶愛芬. 基于GenBank黃麻EST-SSR標(biāo)記的開發(fā)及其通用性評價. 作物學(xué)報, 2014, 40: 1028–1034. Zhang L W, Yuan M H, He X W, Xu JT, Qi J M, Liu X, Fang P P, Lin L H, Tao A F. Development and universality evaluation of EST-SSR markers in jute (spp.) from GenBank database., 2014, 40: 1028–1034.
[19] Hong C, Piao Z, Kang T, Batley J, Yang T, Hur Y K, Bhak J, Park B S, Edwards D, Lim Y P. Genomic distribution of simple sequence repeats in., 2007, 23: 349–356.
[20] Goff S, Ricke D, Lan T, Presting G, Wang R, Dunn M, Glazebrook J, Sessions A, Oeller P, Varma H, Hadley D, Hutchison D, Martin C, Katagiri F, Lange M, Moughamer T, Xia Y, Budworth P, Zhong J, Miguel T, Paszkowski U, Zhang S, Colbert M, Sun W, Chen L, Cooper B, Park S, Charles T, Mao L, Quail P, Wing R, Dean R, Yu Y, Zharkikh A, Shen R, Sahasrabudhe S, Thomas A, Cannings R, Gutin A, Pruss D, Reid J, Tavtigian S, Mitchell J, Eldredge G, Scholl T, Miller R M, Bhatnagar S, Adey N, Rubano T, Tusneem N, Robinson R, Feldhaus R, Macalma T, Oliphant A, Briggs S. A draft sequence of the rice genome (L. ssp.)., 2002, 296: 92–100.
[21] Morgante M, Hanafey M, Powell W. Microsatellites are preferentially associated with nonrepetitive DNA in plant genomes., 2002, 30: 194–200
[22] Huo N, Lazo G, Vogel J, You F M, Ma Y, Hayden D M, Coleman-Derr D, Hill A, Dvorak J, Anderson O D, Luo M C, Gu Y Q. The nuclear genome of: analysis of BAC end sequences., 2008, 8: 135–147.
Evaluation and characteristic analysis of SSRs from the whole genome of jute ()
YAO Jia-Yu1,**, ZHANG Li-Wu1,2,**, ZHAO Jie1, XU Yi1,2, QI Jian-Min1, and ZHANG Lie-Mei1,*
1Key Laboratory for Genetics, Breeding and Multiple Utilization of Crops of Ministry of Education / Fujian Key Laboratory for Crop Breeding by Design / College of Crop Science, Fuzhou 350002, Fujian, China;2Center for Genomics and Biotechnology of Haixia Institute of Science and Technology, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China
Jute is one of the most important natural bast fiber crops worldwide. However, the lack of SSR markers limits the genetic improvement of jute. In this study, simple sequence repeats (SSRs) were identified from the genome, genes, CDS and cDNA of CVL-1, a sequenced variety in. SSR loci was called using SSR Primer software and the characteristics of SSR loci were analyzed. The 153,242 genomic SSRs were called based on the genomic sequence with an average density of 467.20 SSRs Mb–1. Based on the cDNA sequence, we called 10,747 SSRs were developed with an average density of 260.85 SSRs Mb–1. The majority of repeat types were di- to tetra-nucleotides, accounting for 76.91%. Among them, the tri-nucleotide repeat types were the highest abundance repeat types in the cDNA_SSRs while the di-nucleotide repeat types were the highest abundance repeat types in the genomic SSRs. For different SSR repeat types, the genomic and cDNA-SSR frequency decreased dramatically as repeat times increased. Identification of SSR markers in the whole genome can not only enrich the number of molecular markers, but also lay a foundation for the analysis of genetic basis of important agronomic traits in jute.
jute (); genome; cDNA; SSRs
2018-05-18;
2018-08-20;
2018-09-14.
10.3724/SP.J.1006.2019.84072
通信作者(Corresponding author): 張列梅, E-mail: zhangliemei@126.com
**同等貢獻(xiàn)(Contributed equally to this work)
姚嘉瑜, E-mail: 3533551417@qq.com; 張立武, E-mail: lwzhang@fafu.edu.cn, zhang_liwu@hotmail.com
本研究由國家自然科學(xué)基金項(xiàng)目(31771369), 國家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(xiàng)(CARS-19-E06), 農(nóng)業(yè)部東南黃紅麻實(shí)驗(yàn)觀測站(農(nóng)科教發(fā)2011)和福建省麻類種質(zhì)資源共享平臺(2010N2002)資助。
This study was supported by the National Natural Science Foundation of China (31771369), the China Agriculture Research System (CARS-19-E06), the Experiment Station of Jute and Kenaf in Southeast China (Nongkejiaofa 2011), and the Construction of Germplasm Resources Platform for Bast Fiber Crops in Fujian, China (2010N2002).
URL:http://kns.cnki.net/kcms/detail/11.1809.s.20180912.1326.002.html