国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

適于陸地棉品種身份鑒定的SNP核心位點(diǎn)篩選與評價(jià)

2018-11-06 01:57朱國忠李樂晨牛二利郭旺珍
作物學(xué)報(bào) 2018年11期
關(guān)鍵詞:多態(tài)性分型指紋

朱國忠 張 芳 付 潔 李樂晨 牛二利 郭旺珍

?

適于陸地棉品種身份鑒定的SNP核心位點(diǎn)篩選與評價(jià)

朱國忠 張 芳 付 潔 李樂晨 牛二利 郭旺珍*

南京農(nóng)業(yè)大學(xué) / 作物遺傳與種質(zhì)創(chuàng)新國家重點(diǎn)實(shí)驗(yàn)室 / 雜交棉創(chuàng)制教育部工程研究中心, 江蘇南京 210095

利用全基因組SNP信息, 篩選陸地棉品種特異的核心SNP位點(diǎn)組合, 可為陸地棉品種身份鑒定提供準(zhǔn)確高效的檢測手段。本研究利用棉花CottonSNP80K芯片對326份不同來源的陸地棉種質(zhì)進(jìn)行SNP分型。以南京農(nóng)業(yè)大學(xué)陸地棉TM-1基因組(AD1) genome NBI v1.1版本為參考序列, 對SNP位點(diǎn)進(jìn)行注釋。結(jié)果表明, 93.85% (72 990/77 774)的位點(diǎn)檢出率超過99%, 61 595 (79.20%)個(gè)SNP位點(diǎn)具有多態(tài)性, 其中76.32% (47 009)的位點(diǎn)最小等位基因頻率(MAF)大于0.1。基于位點(diǎn)檢出率大于0.99、位點(diǎn)具多態(tài)性、MAF大于0.2、雜合率小于0.05、每條染色體的SNP密度為400 kb/SNP左右等要求, 最終獲得4857個(gè)覆蓋全基因組的高質(zhì)量核心SNP位點(diǎn)組合。這些核心SNP位點(diǎn)組合平均檢出率接近100%; 平均MAF值為0.34; 平均雜合率為0.02; 99%以上的陸地棉材料均能夠被準(zhǔn)確鑒定。統(tǒng)計(jì)分析表明利用核心SNP位點(diǎn)組合與CottonSNP80K的鑒定結(jié)果呈極顯著相關(guān)。本研究提供了包含4857個(gè)SNP位點(diǎn), 適于陸地棉品種指紋圖譜繪制的核心SNP位點(diǎn)組合, 可實(shí)現(xiàn)陸地棉品種身份鑒定和品種確權(quán)。

DNA芯片; 指紋圖譜; SNP; 核心位點(diǎn); 陸地棉

棉花(spp.)是世界性重要的天然纖維作物, 也是重要的油料作物之一, 在農(nóng)業(yè)生產(chǎn)和國民經(jīng)濟(jì)中占有重要地位。陸地棉和海島棉是兩大異源四倍體栽培棉種。陸地棉產(chǎn)量高, 適應(yīng)性廣, 纖維品質(zhì)中等, 占全球棉花種植面積的95%以上[1]。中國是世界最大的棉花生產(chǎn)、消費(fèi)和紡織大國, 在棉花種植和新品種培育方面有悠久的歷史和豐富的經(jīng)驗(yàn)[2]。然而, 中國非棉花起源國, 生產(chǎn)上種植的陸地棉栽培品種遺傳背景狹窄。隨著育種進(jìn)程的加快, 少數(shù)骨干親本的集中應(yīng)用, 以及轉(zhuǎn)基因等新技術(shù)在棉花育種中的應(yīng)用, 棉花品種間的遺傳多樣性越來越小[3-4]。再加上品種套種等銷售過程的不規(guī)范現(xiàn)象, 僅僅依靠形態(tài)性狀越來越難辨別棉花品種, 給種子生產(chǎn)、經(jīng)營、管理、維權(quán)等諸多環(huán)節(jié)帶來挑戰(zhàn), 急需從DNA水平研制準(zhǔn)確表明每一品種身份的“指紋”。

基于各種類型的分子標(biāo)記, 很多研究者已經(jīng)開展標(biāo)記技術(shù)在棉花品種鑒定中的應(yīng)用[5-6]。其中SSR (Simple Sequence Repeats)分子標(biāo)記以重復(fù)性好、操作簡單、呈共顯性等優(yōu)點(diǎn), 應(yīng)用最為廣泛。利用SSR標(biāo)記技術(shù), 武耀廷等繪制了4個(gè)高優(yōu)勢雜交種的指紋圖譜[7], 馬軒等[8]建立了18個(gè)彩色棉品系的DNA指紋圖譜, 秦利等[9]開展了新疆部分主栽品種的指紋圖譜構(gòu)建和雜交種純度鑒定研究。趙亮等通過全基因組范圍SSR標(biāo)記篩選, 獲得一套多態(tài)性高, 易于鑒別, 且涉及四倍體陸地棉26條連鎖群的26對SSR引物, 并用于棉花品種DNA條形碼數(shù)據(jù)庫構(gòu)建[10]。上述研究對棉花品種身份及純度鑒定起到了一定的作用。但相比于全基因組覆蓋的SNP (Single Nucleotide Polymorphism)標(biāo)記, SSR標(biāo)記仍存在基因組中分布不均勻、基因分型多態(tài)性不高, 以及基因組覆蓋度不夠等問題, 尚不能滿足不同基因型高通量分子鑒定及選擇的需求。SNP標(biāo)記是基因組中分布最廣泛, 數(shù)量最豐富的DNA分子標(biāo)記。利用覆蓋全基因組的SNP芯片, 可以通過一次雜交實(shí)現(xiàn)數(shù)以萬計(jì)、十萬計(jì)、乃至百萬計(jì)的SNP位點(diǎn)分型, 具有成本低、通量高、獲得的信息量大等優(yōu)勢, 受到廣泛的關(guān)注和應(yīng)用[11-12]。匡猛等[13]基于KASP技術(shù)開發(fā)了一套適用于我國棉花雜交純度檢測的核心SNP技術(shù), 為棉花指紋圖譜構(gòu)建提供支撐。孫正文等[14]利用CottonSNP63K芯片篩選了393個(gè)核心SNP位點(diǎn), 構(gòu)建了719份陸地棉資源材料的特征DNA指紋圖譜。

結(jié)合芯片技術(shù), 篩選覆蓋全基因組的核心SNP位點(diǎn), 繪制陸地棉栽培品種SNP指紋圖譜, 開展自動(dòng)化、高通量、準(zhǔn)確的棉花種子質(zhì)量監(jiān)控研究, 可為棉花種業(yè)安全提供保障。前期本研究室公布了較高質(zhì)量的異源四倍體棉種陸地棉遺傳標(biāo)準(zhǔn)系TM-1基因組信息[15], 結(jié)合100余份不同來源陸地棉材料的重測序信息, 研發(fā)了覆蓋全基因組、適于陸地棉種內(nèi)基因型鑒定的高多態(tài)SNP芯片(CottonSNP80K), 該芯片位點(diǎn)源于陸地棉種內(nèi)差異, 可尋址, 多態(tài)性高, 能有效用于陸地棉種內(nèi)基因型鑒定和目標(biāo)基因發(fā)掘[16]。本研究利用CottonSNP80K芯片對300余份不同來源陸地棉品種/材料的分型結(jié)果, 通過分析不同位點(diǎn)遺傳多樣性鑒定信息, 篩選高多態(tài)、可重復(fù)、易分辯、強(qiáng)專一的SNP位點(diǎn)集合, 用于構(gòu)建陸地棉品種指紋圖譜和品種確權(quán)分析, 服務(wù)種子產(chǎn)業(yè)化和品種知識(shí)產(chǎn)權(quán)保護(hù)需求。

1 材料與方法

1.1 試驗(yàn)材料

共326份, 包括遺傳背景廣泛, 不同來源的陸地棉品種/材料312份(編號(hào)C21-C332), 和不同的近等基因系14份(編號(hào)E7-E20)。材料信息及編號(hào)與Cai等[16]一致。所有資源材料引自中國農(nóng)業(yè)科學(xué)院棉花研究所國家棉花種質(zhì)中期庫, 由南京農(nóng)業(yè)大學(xué)棉花研究所自交保存。

1.2 DNA提取與質(zhì)量控制

針對每一供試材料, 選取健康種子發(fā)芽, 生長到二葉一心時(shí), 摘取棉花嫩葉, 采用CTAB法提取基因組DNA[17]。用1%瓊脂糖電泳檢測所提樣品的DNA質(zhì)量, 要求DNA條帶單一、無彌散、無RNA殘留。利用One Drop-OD 1000進(jìn)一步檢測DNA質(zhì)量和濃度, 要求光吸收值260/280介于1.7~2.1、樣品濃度 > 50 ng μL–1、單個(gè)樣品總量 > 1 μg。

1.3 SNP檢測與數(shù)據(jù)分析

利用我們自主研發(fā)的棉花CottonSNP80K芯片[16], 進(jìn)行供試材料的基因組SNP分型分析。參照標(biāo)準(zhǔn)實(shí)驗(yàn)流程(基于光纖微珠芯片的Infinium技術(shù), the Illumina protocols)檢測SNP, 用iScan芯片掃描儀對雜交結(jié)果掃描。委托北京康普森生物技術(shù)有限公司完成全基因組掃描。將通過芯片掃描獲得的原始數(shù)據(jù)導(dǎo)入GenomeStudio軟件(V2011.1, Illumina, Inc.)進(jìn)行SNP分型。由于GenomeStudio只能以二倍體模式分型, 針對異源四倍體陸地棉, 我們在默認(rèn)分型的結(jié)果上進(jìn)行了人工調(diào)整, 使分型結(jié)果更加準(zhǔn)確[16]。SNPs的位置對應(yīng)南京農(nóng)業(yè)大學(xué)陸地棉TM-1基因組(AD1) genome NBI v1.1版本的參考基因組序列信息[15]。軟件分型后自動(dòng)輸出SNP位點(diǎn)檢出率。根據(jù)SNP位點(diǎn)的分型結(jié)果, 使用Microsoft Excel軟件計(jì)算與統(tǒng)計(jì)分析最小等位基因頻率(MAF)、雜合率和多態(tài)信息含量(PIC)。

1.4 SNP位點(diǎn)分型結(jié)果驗(yàn)證

使用在線工具WebSNAPER (pga.mgh.harvard. edu/cgi-bin/snap3/websnaper3.cgi)對擬選擇驗(yàn)證的SNP位點(diǎn)進(jìn)行特異性引物設(shè)計(jì)。首先隨機(jī)選擇芯片檢測有多態(tài)的棉花材料TM-1、I4005、DPL15、泗棉3號(hào)等對所開發(fā)的SNP引物進(jìn)行多態(tài)性篩選, 進(jìn)一步選擇不同來源的24份陸地棉材料進(jìn)行SNP位點(diǎn)的驗(yàn)證分析。統(tǒng)計(jì)比較聚丙烯酰胺凝膠電泳(PAGE)與芯片的分型結(jié)果, 評價(jià)芯片的分型準(zhǔn)確率。SNP-PCR擴(kuò)增的反應(yīng)程序?yàn)? 95℃ 5 min預(yù)變性; 94℃ 30 s變性, 65℃ 30 s退火, 72℃30 s延伸, 28循環(huán)數(shù); 72℃終延伸10 min。擴(kuò)增產(chǎn)物經(jīng)非變性PAGE電泳(恒壓226 V, 1.0~1.5 h), 通過銀染DNA顯帶, 記錄多態(tài)性數(shù)據(jù)。

2 結(jié)果與分析

2.1 SNP位點(diǎn)特性評估

前期我們研發(fā)了覆蓋全基因組、適于陸地棉種內(nèi)基因型鑒定的高多態(tài)SNP芯片(CottonSNP80K), 并利用該芯片獲得300余份不同來源陸地棉品種/材料的基因組分型結(jié)果[16]。為了進(jìn)一步發(fā)掘核心SNP位點(diǎn), 用于陸地棉栽培品種指紋圖譜構(gòu)建, 統(tǒng)計(jì)分析了CottonSNP80K芯片中所有位點(diǎn)的檢測結(jié)果(圖1)。CottonSNP80K中包含77 774個(gè)有效的SNP位點(diǎn), 63.61% (49 477)的SNP位點(diǎn)間的距離在2~10 kb, 15.05% (11 706)的位點(diǎn)間距大于30 kb, 標(biāo)記的染色體密度為24.9 kb/SNP。利用該芯片對312份陸地棉材料(編號(hào): C21~C332)進(jìn)行SNP分型, 99.40% (77 304)的位點(diǎn)檢出率大于95%, 93.85% (72 990)的位點(diǎn)檢出率超過99%, 表明該芯片對陸地棉SNP位點(diǎn)有很高的分型效率。73.02% (56 672)的位點(diǎn)雜合率低于5%, 但有14.89% (11 554)的位點(diǎn)雜合率高于50%。高雜合率的位點(diǎn)主要源于異源四倍體棉花A、D亞基因組間雜合。61 595 (79.20%)個(gè)SNP位點(diǎn)顯示多態(tài)性, 其中76.32% (47 009)的位點(diǎn)MAF大于0.1。在此基礎(chǔ)上進(jìn)一步篩選和簡化, 獲得適于陸地棉品種分型的核心SNP位點(diǎn)組合。

圖1 CottonSNP80K芯片SNP位點(diǎn)特征統(tǒng)計(jì)

橫坐標(biāo)代表被統(tǒng)計(jì)的SNP特征參數(shù), 依次為位點(diǎn)檢出率、最小等位基因頻率、雜合率和相鄰SNP之間的距離。縱坐標(biāo)代表SNP的分布數(shù)目。

The abscissa represents statistical SNP characteristic parameters, involved in loci call frequency, minor allele frequency (MAF), heterozygosity and distance between adjacent SNPs. The ordinate represents the number of SNPs.

2.2 用于品種指紋圖譜構(gòu)建的核心SNPs挖掘

基于CottonSNP80K中77 774個(gè)SNP位點(diǎn)的多態(tài)性和相鄰SNP間距信息, 進(jìn)一步開展分層篩選, 確定核心SNP位點(diǎn)。(1)去除檢出率小于99%的SNP位點(diǎn)后, 余72 990個(gè)位點(diǎn); (2)去除供試材料中表現(xiàn)SNP單態(tài)的位點(diǎn), 余57 244個(gè)位點(diǎn); (3)篩選MAF大于0.2的位點(diǎn), 獲得28 851個(gè)位點(diǎn); (4)篩選雜合率小于0.05的位點(diǎn), 獲得19 934個(gè)位點(diǎn); (5)基于前期研究提供的陸地棉栽培品種連鎖不平衡(LD)距離[16], 標(biāo)記密度選擇平均每條染色體400 kb/SNP, 分型相對簡單, 具有二倍體作物SNP特性。結(jié)合人工過濾, 刪除由多拷貝產(chǎn)生的復(fù)雜分型位點(diǎn), 確保核心位點(diǎn)的特異性, 最終獲得4857個(gè)多態(tài)性高、重復(fù)性好、二維表型易分辯、特異性強(qiáng)的高質(zhì)量SNP位點(diǎn)。

表1顯示, 中選的4857個(gè)SNP位點(diǎn)中, 2908個(gè)位于A亞組, 分布密度為399.0 kb/SNP; 1949個(gè)位于D亞組, 分布密度為397.3 kb/SNP。由于陸地棉群體LD衰減距離約為700 kb[16], 本研究篩選的核心SNP位點(diǎn)其分布密度可以覆蓋全基因組。

表1 用于指紋圖譜繪制的核心SNP位點(diǎn)染色體分布

4857個(gè)候選SNP位點(diǎn)的各參數(shù)與CottonSNP80K上的原始位點(diǎn)檢測結(jié)果比較, 本研究用于品種指紋圖譜分析的核心位點(diǎn)檢出率接近100%; 平均MAF值為0.34, 平均PIC為0.44, 多態(tài)性顯著提高; 同時(shí), 候選位點(diǎn)的平均雜合率降低到0.02, 更加有利于陸地棉品種身份及真實(shí)性檢測(表2)。

表2 用于品種指紋圖譜分析的核心SNP位點(diǎn)特征統(tǒng)計(jì)

2.3 核心SNP組合鑒定陸地棉栽培品種效率評估

使用核心SNP位點(diǎn)組合對312份陸地棉品種/材料進(jìn)行身份鑒定, 99%以上的品種均能實(shí)現(xiàn)準(zhǔn)確有效的鑒別, 其遺傳距離最大為0.6047, 最小為0.0001。為了評估候選SNP對不同陸地棉品種的鑒定效率, 分別用CottonSNP80K總77 774位點(diǎn)和用于指紋圖譜繪制的4857個(gè)位點(diǎn)對312份陸地棉品種材料進(jìn)行遺傳距離相關(guān)性分析(圖2), 結(jié)果顯示, 利用核心SNP位點(diǎn)組合與CottonSNP80K的鑒定結(jié)果呈極顯著線性相關(guān)(< 0.01)。表明本研究所篩選的核心SNP位點(diǎn)集合具有代表性, 可有效用于陸地棉品種身份鑒定。

為了進(jìn)一步評估核心SNP位點(diǎn)組合的分辨力, 選擇14份近等基因系材料(編號(hào): E7~E20)進(jìn)行遺傳多樣性分析。基于核心位點(diǎn)SNP檢測結(jié)果, 通過兩兩比較, 獲得近等基因系材料之間的差異位點(diǎn)數(shù)(多態(tài)位點(diǎn))并計(jì)算其占總位點(diǎn)的比例(多態(tài)率)。與CottonSNP80K芯片上77 774個(gè)SNP位點(diǎn)的檢測結(jié)果相比[16], 遺傳背景相近的近等基因系間其多態(tài)率均顯著提高(表3)。其中新鄉(xiāng)小吉和新鄉(xiāng)小吉無絨無絮突變體間的多態(tài)率由16.1%提升到25.0%; 徐州142和徐州142無絨無絮突變體間由19.0%提升到30.6%; 7235和7235纖維突變體間由25.0%提升到52.4%。另外陸地棉遺傳標(biāo)準(zhǔn)系TM-1與其5個(gè)纖維發(fā)育突變體間的多態(tài)性范圍從22.7%~30.6%提高到44.7%~64.2%。上述分析表明, 新篩選的4587個(gè)核心SNP位點(diǎn)多態(tài)性高, 非常適用于陸地棉品種指紋圖譜的繪制和身份鑒定。

表3 基于核心SNP位點(diǎn)的陸地棉近等基因系多態(tài)性檢測

總位點(diǎn): 數(shù)據(jù)來自CottonSNP80K中77 774個(gè)位點(diǎn)的分析結(jié)果; 核心位點(diǎn): 數(shù)據(jù)來自篩選后4857個(gè)核心位點(diǎn)的分析結(jié)果。

The analysis from total loci was performed using a total of 77 774 loci in CottonSNP80K, and the analysis from core loci was performed using 4857 core loci screened.

圖2 312份陸地棉品種遺傳距離相關(guān)性分析

橫坐標(biāo)代表利用芯片總位點(diǎn)計(jì)算的材料間遺傳距離, 縱坐標(biāo)代表利用核心位點(diǎn)計(jì)算的材料間遺傳距離。
The abscissa represents the genetic distance between the materials calculated by the total loci in CottonSNP80K. The ordinate represents the genetic distance between the materials calculated by the core loci.

為了驗(yàn)證核心SNP位點(diǎn)的準(zhǔn)確性, 從核心SNP位點(diǎn)中隨機(jī)挑選了14個(gè)SNP位點(diǎn)開發(fā)特異性SNP引物, 選擇24份陸地棉材料進(jìn)行SNP位點(diǎn)和芯片分型結(jié)果的驗(yàn)證分析。芯片分型結(jié)果與SNP-PCR一致性高達(dá)98.8% (表4和圖3)。 進(jìn)一步證明這些核心SNP位點(diǎn)的可利用性和基于芯片SNP分型的準(zhǔn)確性。

3 討論

隨著分子技術(shù)的不斷發(fā)展與完善, 及國家不斷加強(qiáng)對種子的管理, 作物品種指紋圖譜的構(gòu)建及身份鑒定技術(shù)的提升勢在必行。中國是世界最大的棉花生產(chǎn)、消費(fèi)和紡織大國, 但并非棉花起源國, 棉花的生產(chǎn)和育種都是從引進(jìn)品種發(fā)展起來的。陸地棉原產(chǎn)于中美洲, 1865年最先被引入上海種植。直到20世紀(jì)20年代, 我國才開始陸地棉育種工作[18]。加上早期的引進(jìn)品種有限, 使得中國的陸地棉栽培品種遺傳背景十分狹窄, 利用傳統(tǒng)的形態(tài)鑒別方法區(qū)分不同棉花品種十分困難, 迫切需要一套高精度的指紋圖譜。棉花指紋圖譜的繪制研究較早, 目前已經(jīng)研發(fā)出許多基于SSR標(biāo)記的指紋圖譜, 并在某些特定棉花品種純度及真實(shí)性鑒定方面取得較好結(jié)果[7-10]。但是由于標(biāo)記數(shù)目限制, 往往不能區(qū)分遺傳背景相似的品種。同時(shí), 諸多SSR指紋圖譜適用范圍不同, 難以形成統(tǒng)一的鑒定標(biāo)準(zhǔn)。此外, 在大批量的品種檢測過程中, 低通量標(biāo)記技術(shù)檢測也消耗大量的人力和時(shí)間, 直接影響檢測效率。因此, 自動(dòng)化和信息化的品種鑒定方法是棉花種業(yè)發(fā)展的必然趨勢, 而高通量測序和基因芯片技術(shù)的成熟, 大大推動(dòng)了棉花品種身份精準(zhǔn)鑒定的進(jìn)程。

表4 芯片分型與SNP-PCR一致性分析

最近幾年, 棉花基因組序列解析及應(yīng)用取得顯著進(jìn)展。2012年, 美國Paterson實(shí)驗(yàn)室牽頭, 聯(lián)合國際多家研究單位, 開展棉花基因組多倍化及纖維發(fā)育研究, 同時(shí)釋放了二倍體D基因組雷蒙德氏棉種全基因組序列信息[19]。中國在不同倍性、不同栽培棉種的基因組信息解析上取得了突出進(jìn)展。中國農(nóng)業(yè)科學(xué)院棉花研究所先后于2012年、2014年公布了二倍體雷蒙德氏棉(D基因組)、亞洲棉(A基因組)全基因組序列信息[20-21]; 南京農(nóng)業(yè)大學(xué)和中國農(nóng)業(yè)科學(xué)院棉花研究所于2015年分別公布了異源四倍體棉種陸地棉遺傳標(biāo)準(zhǔn)系TM-1基因組信息[15,22]; 溢達(dá)集團(tuán)和華中農(nóng)業(yè)大學(xué)于2015年分別公布了海島棉新海21及3-79的基因組信息[23-24]。以TM-1基因組為參考序列, 南京農(nóng)業(yè)大學(xué)、華中農(nóng)業(yè)大學(xué)和河北農(nóng)業(yè)大學(xué)分別通過對不同來源的棉花材料的全基因組重測序分析, 結(jié)合多年多點(diǎn)的主要農(nóng)藝性狀表型鑒定, 發(fā)掘出一批與棉花品種改良相關(guān)的產(chǎn)量、纖維品質(zhì)、黃萎病抗性等關(guān)聯(lián)位點(diǎn), 揭示了從早期美棉品種到全球最大纖維作物改良過程中的遺傳基礎(chǔ)和馴化特征, 為棉花“精準(zhǔn)育種”提供了優(yōu)異的基因資源和理論指導(dǎo)[3-4,25]。

圖3 基于SNP-PCR技術(shù)驗(yàn)證SNP位點(diǎn)芯片分型結(jié)果

M: DNA marker; 1: TM-1; 2: 7235; 3: J02-508(7-50); 4: 岱字棉16; 5: 鄂棉21; 6: 鄂棉23; 7: 國欣棉9; 8: 邯鄲885; 9: 黑山棉1號(hào); 10: 冀122; 11: 軍棉1號(hào); 12: 山農(nóng)棉8號(hào); 13: 山西W1; 14: 山西W8; 15: 斯字棉2B; 16: 泗棉3號(hào); 17: 皖棉17; 18: 新陸早32; 19: 新陸早7號(hào); 20: 新陸中26; 21: 新陸中35; 22: 豫棉15; 23: 中棉所12; 24: 中棉所41。

M: DNA marker; 1: TM-1; 2: 7235; 3: J02-508 (7-50); 4: DPL16; 5: Emian 21; 6: Emian 23; 7: Guoxinmian 9; 8: Handan 885; 9: Heishanmian 1; 10: Ji 122; 11: Jummian 1; 12: Shannongmian 8; 13: Shanxi W1; 14: Shanxi W8; 15: Stoneville 2B; 16: Simian 3; 17: Wanmian 17; 18: Xinluzao 32; 19: Xinluzao 7; 20: Xinluzhong 26; 21: Xinluzhong 35; 22: Yumian 15; 23: Zhongmiansuo 12; 24: Zhongmiansuo 41.

借鑒棉花參考基因組, 通過分析不同來源陸地棉材料的重測序信息, 我們研發(fā)了覆蓋全基因組、適宜于陸地棉種內(nèi)基因型鑒定的高多態(tài)SNP芯片(CottonSNP80K芯片), 并用于陸地棉栽培品種遺傳多樣性分析[16]。在此基礎(chǔ)上, 本研究通過嚴(yán)格的條件控制最終篩選出適用于陸地棉品種檢測的核心位點(diǎn)組合。通過陸地棉不同品種基因型區(qū)分能力評估以及位點(diǎn)分型真實(shí)性評估, 證明了篩選獲得的核心位點(diǎn)組合具有高效的陸地棉品種鑒定能力。與孫正文等[14]開發(fā)的SNP指紋圖譜具有97%的陸地棉品種鑒定能力相比, 我們的研究顯示出多方面的優(yōu)勢?;谝淹瓿傻年懙孛迏⒖蓟蚪MTM-1的序列[15], 本研究選擇的SNP標(biāo)記具有高檢出率、單拷貝、全基因組覆蓋和位點(diǎn)可尋址等優(yōu)點(diǎn)。針對供試品種, 準(zhǔn)確鑒定效率超過99%, 對遺傳背景相近的品種也具有較好的鑒別能力。另外本研究廣泛的基因組覆蓋度使得指紋圖譜的鑒定和組合具有更高的擴(kuò)展性, 對已育成品種及未來育成的新品種身份鑒定均有很好的應(yīng)用價(jià)值。

由于遺傳背景狹窄, 陸地棉品種鑒定難度要遠(yuǎn)遠(yuǎn)高于其他多數(shù)作物。僅僅靠表型或一至兩套DNA指紋圖譜, 難以準(zhǔn)確鑒定出不同來源、遺傳背景不清的陸地棉栽培種。同時(shí), 鑒定品種數(shù)目和范圍的不同, 所選擇的方法也有所差別。例如, 鑒定少數(shù)幾個(gè)棉花品種或雜交種, 可以根據(jù)本SNP集合針對材料特點(diǎn)選擇特異SNP位點(diǎn), 通過KASP或定點(diǎn)測序技術(shù)鑒定品種, 或結(jié)合多態(tài)性SSR標(biāo)記組合鑒定; 開展大范圍的棉花品種身份鑒定, 可以通過低密度的SNP芯片繪制指紋圖譜; 而對遺傳背景相似的品種, 則需要繪制高密度SNP指紋圖譜或開發(fā)品種特異性SNP標(biāo)記, 達(dá)到深度鑒定的目的。另外, 隨著育種技術(shù)的發(fā)展, 未來的新品種鑒定也需要拓寬現(xiàn)有技術(shù)手段。因此, 多技術(shù)多方法的組合式鑒定是陸地棉身份鑒定的核心, 同時(shí)在快速發(fā)展的育種技術(shù)背景下, 也需要進(jìn)一步開發(fā)新技術(shù)新方法。

4 結(jié)論

基于CottonSNP80K芯片的陸地棉品種/材料分型結(jié)果篩選出4857個(gè)覆蓋全基因組的高質(zhì)量核心SNP位點(diǎn)組合, 該組合適于陸地棉品種指紋圖譜繪制, 可實(shí)現(xiàn)陸地棉品種身份鑒定和品種確權(quán)。

[1] Chen Z J, Scheffler B E, Dennis E, Triplett B A, Zhang T, Guo W, Chen X, Stelly D M, Rabinowicz P D, Town C D, Arioli T, Brubaker C, Cantrell R G, Lacape J M, Ulloa M, Chee P, Gingle A R, Haigler C H, Percy R, Saha S, Wilkins T, Wright R J, Van Deynze A, Zhu Y, Yu S, Abdurakhmonov I, Katageri I, Kumar P A, Mehboob Ur R, Zafar Y, Yu J Z, Kohel R J, Wendel J F, Paterson A H. Toward sequencing cotton () genomes., 2007, 145: 1303–1310

[2] 喻樹迅, 范術(shù)麗. 我國棉花遺傳育種進(jìn)展與展望. 棉花學(xué)報(bào), 2003, 15: 120–124 Yu S X, Fan S L. The evolutions and prospect of cotton genetics and breeding in China., 2003, 15: 120–124 (in Chinese with English abstract)

[3] Fang L, Wang Q, Hu Y, Jia Y, Chen J, Liu B, Zhang Z, Guan X, Chen S, Zhou B, Mei G, Sun J, Pan Z, He S, Xiao S, Shi W, Gong W, Liu J, Ma J, Cai C, Zhu X, Guo W, Du X, Zhang T. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits., 2017, 49: 1089–1098

[4] Wang M, Tu L, Lin M, Lin Z, Wang P, Yang Q, Ye Z, Shen C, Li J, Zhang L, Zhou X, Nie X, Li Z, Guo K, Ma Y, Huang C, Jin S, Zhu L, Yang X, Min L, Yuan D, Zhang Q, Lindsey K, Zhang X. Asymmetric subgenome selection and-regulatory divergence during cotton domestication., 2017, 49: 579–587

[5] 郭旺珍, 張?zhí)煺? 潘家駒, 何金龍. 我國棉花主栽品種的RAPD指紋圖譜研究. 農(nóng)業(yè)生物技術(shù)學(xué)報(bào), 1996, 4: 29–34 Guo W Z, Zhang T Z, Pan J J, He J L. Analysis of RAPD fingerprinting on main cotton cultivars in China., 1996, 4: 29–34 (in Chinese with English abstract)

[6] Abdalla A M, Reddy O U K, El-Zik K M, Pepper A E. Genetic diversity and relationships of diploid and tetraploid cottons revealed using AFLP., 2001, 102: 222–229

[7] 武耀廷, 張?zhí)煺? 郭旺珍, 殷劍美. 陸地棉品種SSR標(biāo)記的多態(tài)性及用于雜交種純度檢測的研究. 棉花學(xué)報(bào), 2001, 13: 131–133Wu Y T, Zhang T Z, Guo W Z, Yin J M. Detecting polymorphism among upland cotton (L.) cultivars and their roles in seed purity of hybrids with SSR markers., 2001, 13: 131–133 (in Chinese with English abstract)

[8] 馬軒, 杜雄明, 孫君靈. 18個(gè)彩色棉品系的SSR指紋分析. 植物遺傳資源學(xué)報(bào), 2003, 4: 305–310 Ma X, Du X M, Sun J L. SSR fingerprinting analysis on 18 colored cotton lines., 2003, 4: 305–310 (in Chinese with English abstract)

[9] 秦利, 李冰, 范玲, 李磊, 胡保民, 王沛政. 新疆陸地棉SSR標(biāo)記指紋圖譜構(gòu)建和雜種純度鑒定研究. 新疆農(nóng)業(yè)科學(xué), 2005, 42: 399–401 Qin L, Li B, Fan L, Li L, Hu B M, Wang P Z. Analysis on esteblishment of finger printing of SSR mark for upland cotton and purity of hybrid seed in Xinjiang., 2005, 42: 399–401 (in Chinese with English abstract)

[10] 趙亮, 蔡彩平, 梅鴻獻(xiàn), 郭旺珍. 用于區(qū)別不同棉花品種基因組特征的微衛(wèi)星位點(diǎn)篩選. 作物學(xué)報(bào), 2012, 38: 1810–1817 Zhao L, Cai C P, Mei H X, Guo W Z. Screening of microsatellite loci for identifying genome barcoding of cotton cultivars., 2012, 38: 1810–1817 (in Chinese with English abstract)

[11] McNally K L, Bruskiewich R, Mackill D, Buell C R, Leach J E, Leung H. Sequencing multiple and diverse rice varieties. Connecting whole-genome variation with phenotypes., 2006, 141: 26–31

[12] Ganal M W, Altmann T, Roder M S. SNP identification in crop plants., 2009, 12: 211–217

[13] 匡猛, 王延琴, 周大云, 馬磊, 方丹, 徐雙嬌, 楊偉華, 魏守軍, 馬峙英. 基于單拷貝SNP標(biāo)記的棉花雜交種純度高通量檢測技術(shù). 棉花學(xué)報(bào), 2016, 28: 227–233 Kuang M, Wang Y Q, Zhou D Y, Ma L, Fang D, Xu S J, Yang W H, Wei S J, Ma Z Y. High-throughput genotyping assay technology for cotton hybrid purity based on single-copy SNP markers., 2016, 28: 227–233 (in Chinese with English abstract)

[14] 孫正文, 匡猛, 馬峙英, 王省芬. 利用CottonSNP63K芯片構(gòu)建棉花品種的指紋圖譜. 中國農(nóng)業(yè)科學(xué), 2017, 50: 4692–4704 Sun Z W, Kuang M, Ma Z Y, Wang X F. Construction of cotton variety fingerprints using CottonSNP63K array., 2017, 50: 4692–4704 (in Chinese with English abstract)

[15] Zhang T, Hu Y, Jiang W, Fang L, Guan X, Chen J, Zhang J, Saski C A, Scheffler B E, Stelly D M, Hulse-Kemp A M, Wan Q, Liu B, Liu C, Wang S, Pan M, Wang Y, Wang D, Ye W, Chang L, Zhang W, Song Q, Kirkbride R C, Chen X, Dennis E, Llewellyn D J, Peterson D G, Thaxton P, Jones D C, Wang Q, Xu X, Zhang H, Wu H, Zhou L, Mei G, Chen S, Tian Y, Xiang D, Li X, Ding J, Zuo Q, Tao L, Liu Y, Li J, Lin Y, Hui Y, Cao Z, Cai C, Zhu X, Jiang Z, Zhou B, Guo W, Li R, Chen Z J. Sequencing of allotetraploid cotton (L. acc. TM-1) provides a resource for fiber improvement., 2015, 33: 531–537

[16] Cai C, Zhu G, Zhang T, Guo W. High-density 80 K SNP array is a powerful tool for genotypingaccessions and genome analysis., 2017, 18: 654

[17] Paterson A H, Brubaker C L, Wendel J F. A rapid method for extraction of cotton (spp.) genomic DNA suitable for RFLP or PCR analysis., 1993, 11: 122–127

[18] 黃滋康. 中國棉花品種及其系譜(修訂本). 北京: 中國農(nóng)業(yè)出版社, 2007 Huang Z K. Cotton Varieties and Their Genealogy in China (revised and enlarged edition). Beijing: China Agriculture Press, 2007 (in Chinese)

[19] Paterson A H, Wendel J F, Gundlach H, Guo H, Jenkins J, Jin D, Llewellyn D, Showmaker K C, Shu S, Udall J, Yoo M J, Byers R, Chen W, Doron-Faigenboim A, Duke M V, Gong L, Grimwood J, Grover C, Grupp K, Hu G, Lee T H, Li J, Lin L, Liu T, Marler B S, Page J T, Roberts A W, Romanel E, Sanders W S, Szadkowski E, Tan X, Tang H, Xu C, Wang J, Wang Z, Zhang D, Zhang L, Ashrafi H, Bedon F, Bowers J E, Brubaker C L, Chee P W, Das S, Gingle A R, Haigler C H, Harker D, Hoffmann L V, Hovav R, Jones D C, Lemke C, Mansoor S, ur Rahman M, Rainville L N, Rambani A, Reddy U K, Rong J K, Saranga Y, Scheffler B E, Scheffler J A, Stelly D M, Triplett B A, Van Deynze A, Vaslin M F, Waghmare V N, Walford S A, Wright R J, Zaki E A, Zhang T, Dennis E S, Mayer K F, Peterson D G, Rokhsar D S, Wang X, Schmutz J. Repeated polyploidization ofgenomes and the evolution of spinnable cotton fibres., 2012, 492: 423–427

[20] Wang K, Wang Z, Li F, Ye W, Wang J, Song G, Yue Z, Cong L, Shang H, Zhu S, Zou C, Li Q, Yuan Y, Lu C, Wei H, Gou C, Zheng Z, Yin Y, Zhang X, Liu K, Wang B, Song C, Shi N, Kohel R J, Percy R G, Yu J Z, Zhu Y X, Wang J, Yu S. The draft genome of a diploid cotton., 2012, 44: 1098–1103

[21] Li F, Fan G, Wang K, Sun F, Yuan Y, Song G, Li Q, Ma Z, Lu C, Zou C, Chen W, Liang X, Shang H, Liu W, Shi C, Xiao G, Gou C, Ye W, Xu X, Zhang X, Wei H, Li Z, Zhang G, Wang J, Liu K, Kohel R J, Percy R G, Yu J Z, Zhu Y X, Wang J, Yu S. Genome sequence of the cultivated cotton., 2014, 46: 567–572

[22] Li F G, Fan G Y, Lu C R, Xiao G H, Zou C S, Kohel R J, Ma Z Y, Shang H H, Ma X F, Wu J Y, Liang X M, Huang G, Percy R G, Liu K, Yang W H, Chen W B, Du X M, Shi C C, Yuan Y L, Ye W W, Liu X, Zhang X Y, Liu W Q, Wei H L, Wei S J, Huang G D, Zhang X L, Zhu S J, Zhang H, Sun F M, Wang X F, Liang J, Wang J H, He Q, Huang L H, Wang J, Cui J J, Song G L, Wang K B, Xu X, Yu J Z, Zhu Y X, Yu S X. Genome sequence of cultivated Upland cotton (TM-1) provides insights into genome evolution., 2015, 33: 524–530

[23] Liu X, Zhao B, Zheng H J, Hu Y, Lu G, Yang C Q, Chen J D, Chen J J, Chen D Y, Zhang L, Zhou Y, Wang L J, Guo W Z, Bai Y L, Ruan J X, Shangguan X X, Mao Y B, Shan C M, Jiang J P, Zhu Y Q, Jin L, Kang H, Chen S T, He X L, Wang R, Wang Y Z, Chen J, Wang L J, Yu S T, Wang B Y, Wei J, Song S C, Lu X Y, Gao Z C, Gu W Y, Deng X, Ma D, Wang S, Liang W H, Fang L, Cai C P, Zhu X F, Zhou B L, Chen Z J, Xu S H, Zhang Y G, Wang S Y, Zhang T Z, Zhao G P, Chen X Y.genome sequence provides insight into the evolution of extra-long staple fiber and specialized metabolites., 2015, 5: 14139

[24] Yuan D J, Tang Z H, Wang M J, Gao W H, Tu L L, Jin X, Chen L L, He Y H, Zhang L, Zhu L F, Li Y, Liang Q Q, Lin Z X, Yang X Y, Liu N A, Jin S X, Lei Y, Ding Y H, Li G L, Ruan X A, Ruan Y J, Zhang X L. The genome sequence of Sea-Island cotton () provides insights into the allopolyploidization and development of superior spinnable fibres., 2015, 5: 17662

[25] Ma Z Y, He S P, Wang X F, Sun J L, Zhang Y, Zhang G Y, Wu L Q, Li Z K, Liu Z H, Sun G F, Yan Y Y, Jia Y H, Yang J, Pan Z E, Gu Q S, Li X Y, Sun Z W, Dai P H, Liu Z W, Gong W F, Wu J H, Wang M, Liu H W, Feng K Y, Ke H F, Wang J D, Lan H Y, Wang G N, Peng J, Wang N, Wang L R, Pang B Y, Peng Z, Li R Q, Tian S L, Du X M. Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield., 2018, 50: 803–813

Genome-wide Screening and Evaluation of SNP Core Loci for Identification of Upland Cotton Varieties

ZHU Guo-Zhong, ZHANG Fang, FU Jie, LI Le-Chen, NIU Er-Li, and GUO Wang-Zhen*

State Key Laboratory of Crop Genetics & Germplasm Enhancement / Hybrid Cotton R&D Engineering Research Center (the Ministry of Education) / Nanjing Agricultural University, Nanjing 210095, Jiangsu, China

Utilizing the genome-wide SNP information to screen the core SNP loci may provide an accurate and efficient method for the identification of upland cotton varieties. Using the CottonSNP80K array, SNP genotyping was performed within 326 upland cotton accessions. Then, the SNP loci were annotated with TM-1 genomic sequence of(AD1) genome NBI v1.1 Upland cotton of Nanjing Agricultural University as reference sequence. Statistical analysis of all loci in CottonSNP80K showed that the call rate of 93.85% loci (72 990 in 77 774) was more than 99%, and 61 595 (79.20%) SNPs were polymorphic loci among the tested upland cotton accessions. Among them, minor allele frequency (MAF) of 76.32% (47 009) loci was greater than 0.1. Based on call frequency for each locus > 0.99; loci with polymorphism; MAF > 0.2; heterozygosity rate < 0.05; SNP density with ~400 kb/SNP in each chromosome, we obtained 4857 high-quality core SNP loci. The characteristic statistics of the core SNP loci combination showed that the average call rate was nearly 100%; the average MAF was 0.34; and the average hete-rozygosity was 0.02. Using these core SNPs, more than 99% of the materials could be identified accurately and effectively. In addition, the identification results of core SNP loci showed extremely significant linear correlation with that of CottonSNP80K. Taken together, a core combination containing 4857 SNP loci for fingerprint identification of upland cotton varieties is constructed, which can accurately identify the purity and reality of modern upland cotton varieties.

DNA array; fingerprint; SNP; core loci; Upland cotton

2018-02-25;

2018-08-20;

2018-09-04.

10.3724/SP.J.1006.2018.01631

通信作者(Corresponding author): 郭旺珍, E-mail: moelab@njau.edu.cn

E-mail: zhugz@njau.edu.cn

本研究由國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2017YFD0102000)和江蘇現(xiàn)代作物生產(chǎn)協(xié)同創(chuàng)新中心(No.10)項(xiàng)目資助。

This study was supported by the National Key R&D Program for Crop Breeding (2017YFD0102000) and Jiangsu Collaborative Innovation Center for Modern Crop Production Project (No.10).

URL: http://kns.cnki.net/kcms/detail/11.1809.S.20180903.1521.008.htmll

猜你喜歡
多態(tài)性分型指紋
單核苷酸多態(tài)性與中醫(yī)證候相關(guān)性研究進(jìn)展
MTHFR C677T基因多態(tài)性與頸動(dòng)脈狹窄及其側(cè)支循環(huán)形成的關(guān)系
RANTES及其受體CCR5基因多態(tài)性及環(huán)境因素在昆明漢族T2DM發(fā)生中的交互作用
CLOCK基因rs4580704多態(tài)性位點(diǎn)與2型糖尿病和睡眠質(zhì)量的相關(guān)性
像偵探一樣提取指紋
為什么每個(gè)人的指紋都不一樣
針刀治療不同分型腰椎間盤突出癥的研究進(jìn)展
成人型髖關(guān)節(jié)發(fā)育不良的分型與治療
唯一的指紋
可疑的指紋
鸡西市| 获嘉县| 贡觉县| 天等县| 宜黄县| 藁城市| 南乐县| 静海县| 镇坪县| 金坛市| 施秉县| 视频| 铁岭市| 宜春市| 舞钢市| 北流市| 五华县| 夹江县| 资源县| 衡东县| 襄樊市| 嫩江县| 叶城县| 东莞市| 定州市| 巧家县| 庆元县| 勐海县| 霞浦县| 略阳县| 分宜县| 怀安县| 武汉市| 深水埗区| 东山县| 遂溪县| 双柏县| 禄劝| 乌鲁木齐县| 平度市| 长泰县|