劉麗華,龐斌雙,劉陽娜,李宏博,王 娜,王 拯,趙昌平
(北京市農(nóng)林科學(xué)院雜交小麥工程技術(shù)研究中心,雜交小麥分子遺傳北京市重點實驗室,北京 100097)
傳統(tǒng)的品種鑒定主要依靠田間表型鑒定,該方法易受環(huán)境影響,費(fèi)時費(fèi)力,難以鑒定親緣關(guān)系,無法保證檢測的準(zhǔn)確性和時效性。以SSR和SNP標(biāo)記為代表的DNA指紋檢測技術(shù)因具備共顯性、高多態(tài)性、在基因組上均勻分布、高準(zhǔn)確性、較好的重復(fù)性、較高通量、易實現(xiàn)自動化等優(yōu)點,可通過構(gòu)建標(biāo)準(zhǔn)樣品的DNA指紋數(shù)據(jù)庫,快速有效地實現(xiàn)品種保護(hù)和管理。這兩種標(biāo)記已相繼被國際植物新品種保護(hù)聯(lián)盟(International Union for the Protection of New Varieties of Plants,UPOV)[1-2]、國際種子聯(lián)盟(International Seed Federation,ISF)和國際種子檢驗協(xié)會(International Safe Transit Association,ISTA)推薦作為作物品種鑒定和指紋數(shù)據(jù)庫構(gòu)建的優(yōu)選標(biāo)記。目前,我國已建立了小麥[3]、玉米[4]、水稻[5]等作物的SSR標(biāo)記品種鑒定標(biāo)準(zhǔn),為我國農(nóng)作物品種管理提供了有力的技術(shù)支撐。在實際使用過程中,SSR標(biāo)記具有不易實現(xiàn)數(shù)據(jù)整合和通量低等缺陷。新發(fā)展起來的SNP標(biāo)記為二等位基因,數(shù)據(jù)統(tǒng)計簡單,同時,國內(nèi)外大公司相繼推出了各種SNP高通量檢測平臺,能很好地彌補(bǔ)SSR標(biāo)記的技術(shù)缺陷。迄今,SNP標(biāo)記已被初步用于玉米[6-7]、水稻[8]、大豆[9]、大麥[10-11]、棉花[12]等作物的品種鑒定研究中,應(yīng)用前景廣泛。
現(xiàn)階段高通量的 SNP 分型方法主要有樣本高通量和位點高通量兩種平臺,不同平臺各有優(yōu)劣。位點高通量平臺主要是基于芯片技術(shù)的平臺,如Illumina公司開發(fā)的90K iSelect assay SNP芯片[13]以及中國農(nóng)科院發(fā)布的660K小麥基因組特異SNP芯片,一次實驗即可獲取幾萬甚至幾十萬個SNP位點的數(shù)據(jù),適于少量樣本大量位點的檢測;樣本高通量主要有LGC公司推出的KASP(Kompetitive Allele Specific PCR,競爭性等位基因特異性PCR)技術(shù),可在廣泛的基因組DNA樣品中,對SNPs進(jìn)行精準(zhǔn)的雙等位基因判斷,具有高通量、高質(zhì)量、低成本、靈活、快速等優(yōu)點,適于大量樣本少量位點的檢測。在實際品種鑒定過程中,既要考慮檢測樣本量大、高度近似品種少等情況,又要兼顧準(zhǔn)確、靈活、經(jīng)濟(jì)、快速和通量高等需求,因此,如何利用兩種平臺研發(fā)一種適于小麥高通量身份鑒定的模式顯得尤為重要。本研究以380個小麥種質(zhì)材料為研究對象,利用小麥Illumina 90K SNP芯片進(jìn)行評價,以期篩選出適合小麥高通量身份(KASP技術(shù))鑒定的最少SNP位點組合,探索小麥品種高通量身份鑒定模式,為小麥品種高通量身份鑒定技術(shù)體系的建立和指紋數(shù)據(jù)庫的構(gòu)建奠定基礎(chǔ)。
用于候選SNP標(biāo)記篩選的小麥材料共380個,包括核心種質(zhì)、引進(jìn)品種、核心不育系、核心恢復(fù)系以及審定品種372個、近等基因系2個、雜交小麥及其雙親3個、DH系樣品1個(區(qū)分純合SNP位點的內(nèi)參)、小麥品種中國春1個(小麥全基因組測序標(biāo)準(zhǔn)參照序列),1個品種的第二次重復(fù)(重復(fù)率內(nèi)參)。隨機(jī)選取95個材料用于核心SNP標(biāo)記在芯片和KASP平臺的驗證。
采用CTAB法[14]提取380個材料的基因組DNA,用TE溶解保存。DNA的質(zhì)量和濃度用紫外分光光度計和瓊脂糖凝膠電泳進(jìn)行測定,要求DNA樣本濃度在50 ng·μL-1以上,OD260/280在1.7~2.1之間,DNA總量大于2 μg。
按照Illumina公司提供的基于光纖微珠芯片Infinium技術(shù)的操作流程,利用Illumina公司的wheat 90K iSelect Bead Chips全基因組芯片(SNP位點數(shù)目為81 587個)對380個樣本進(jìn)行分析。在獲得原始數(shù)據(jù)后將其直接導(dǎo)入Genome Studio軟件進(jìn)行基因分型,以獲得每個樣本每個位點的SNP基因分型數(shù)據(jù)。
將篩選出的SNP標(biāo)記側(cè)翼序列信息提交LGC公司(Laboratory of the Government Chemist,Hoddeston,UK)進(jìn)行KASP引物的設(shè)計和合成;PCR體系約為1 μL,包括烘干的DNA(1.5 μL濃度為10 ng·μL-1的DNA ),KASP Mix 0.5 μL(LGC Genomics,Hoddeston,UK),0.014 μL KASP Assay Mix和0.5 μL ddH2O。PCR反應(yīng)條件為:94 ℃ 15 min;94 ℃ 20 s,61~55 ℃ 60 s(每個循環(huán)降低0.6 ℃),10個循環(huán);94 ℃ 20 s,55 ℃ 60 s,26~36個循環(huán)。PCR結(jié)束后,使用熒光微孔板檢測儀進(jìn)行終點法讀數(shù)檢測結(jié)果,Klaster caller軟件分析待測樣品的SNP位點基因型。
采用杜邦先鋒公司提供的Uniqueness軟件進(jìn)行統(tǒng)計分析(基于組合最優(yōu)化算法),獲得小麥品種鑒定最少的SNP位點組合。采用Powermarker V3.25軟件[15],基于Nei’s(1983)遺傳距離的UPGMA(Unweighted pair-group method with arithmetic means)方法繪制聚類圖。
利用小麥全基因組SNP芯片(Illumina 90K)對380個小麥材料進(jìn)行全基因組掃描分析,根據(jù)以下原則篩選候選SNP標(biāo)記:(1)每個SNP位點的得分值(GeneTrain Score)大于0.6;(2)以重復(fù)試驗樣品為材料,以“Edit replicates”為條件進(jìn)行重復(fù)性驗證,刪除不具備重復(fù)性的位點;(3)以雜交種及其雙親為材料,用Edit Parental Relationships進(jìn)行遺傳規(guī)律驗證,刪除親本與其對應(yīng)的雜交種基因型不符合遺傳規(guī)律的位點;(4)以DH系為材料,進(jìn)行位點可靠性的驗證,刪除不可靠的位點;(5)刪除整體信號弱、數(shù)據(jù)缺失率大于5%和雜合率較高的位點;(6)根據(jù)遺傳圖譜位置,刪除重復(fù)或者連鎖的位點;(7)篩選單拷貝位點(三種基因型cluster具備明顯界限且同時具有AA和BB基因型的位點);(8)篩選MAF值(Minor Allele Frequency,最小等位變異頻率)大于0.2的位點。從81 587個SNP標(biāo)記中最終篩選出高質(zhì)量、高分辨率、單拷貝、均勻分布于21條染色體的候選SNP標(biāo)記384個。380個材料在理想SNP位點上的基因分型圖(圖1)中,195個材料表現(xiàn)為AA基因型,184個材料表現(xiàn)為BB基因型,1個材料(雜交種)表現(xiàn)為AB基因型。剔除雜交種及重復(fù)材料后剩余378個常規(guī)材料,分析這些材料在384個SNP位點的基因型,結(jié)果表明,384個SNP位點能區(qū)分其中的376個材料,未區(qū)分的兩個材料(農(nóng)大211和農(nóng)大212)為近等基因系,僅在粒色上有差異。
藍(lán)色和紅色表示純合基因型,紫色表示雜合基因型。
Blue and red indicate homozygous genotypes; purple represents heterozygous genotype.
圖1380個材料在理想SNP位點上的基因分型圖
Fig.1Genotypingof380wheatmaterialsattheperfectgenotypingSNPlocus
基于378個常規(guī)材料384個SNP位點的基因型數(shù)據(jù),采用杜邦先鋒公司提供的Uniqueness軟件的組合最優(yōu)化算法分析,獲得了小麥材料鑒定最少SNP位點組合一套,包括14個SNP位點。圖2顯示SNP位點的區(qū)分能力曲線圖,隨著SNP位點數(shù)的增加,區(qū)分材料數(shù)不斷增加,當(dāng)位點數(shù)達(dá)到14個時,區(qū)分材料數(shù)達(dá)到飽和,即14個SNP標(biāo)記與384個SNP標(biāo)記的區(qū)分能力相同,可區(qū)分378個材料中的376個材料,未區(qū)分的兩個材料仍然是農(nóng)大211和農(nóng)大212。基于378個材料14個SNP位點的基因型數(shù)據(jù),繪制了378個材料的聚類圖(圖3),可以很清晰地看見,14個位點僅不能區(qū)分農(nóng)大211和農(nóng)大212兩個材料,其他材料均能區(qū)分,區(qū)分能力達(dá)99.5%。14個SNP標(biāo)記的組合方式有多種,根據(jù)SNP基因分型質(zhì)量(Genetrain>0.6)、MAF值(MAF>0.2)和染色體分布較均勻等指標(biāo),確定了一套小麥材料身份鑒定最佳的14個SNP位點組合(表1)。其中,1B、2A、3B、3D、4A、4B、6A、6B、6D和7B染色體各1個SNP位點,7A和5D染色體各2個SNP位點;最小等位變異頻率變化范圍為0.37~0.50,平均為0.46;平均基因多樣性和多態(tài)性信息指數(shù)(PIC,Polymorphism Information Content)值分別為0.49和0.37。
獲取14個SNP位點的側(cè)翼序列,依據(jù)KASP原理設(shè)計引物,并在KASP平臺上進(jìn)行基因分型。從380個材料中選取95個樣品,加上1個陰性對照(H2O),采用設(shè)計好的14對SNP引物進(jìn)行基因分型。結(jié)果顯示,14個位點均能在KASP平臺上獲得明確、三型獨立的基因分型結(jié)果,且與芯片平臺結(jié)果一致。圖4為SNP3位點的芯片和KASP技術(shù)分型圖,66個樣品表現(xiàn)為AA基因型,29個樣品表現(xiàn)為BB基因型。
圖2 SNP位點組合區(qū)分378個品種的能力Fig.2 Ability of SNP loci to distinguish 378 materials
此圖旨在直觀闡述材料之間的離散程度,至于哪些材料之間有差異或者材料之間差異多少,并不是本文需要表達(dá)的觀點,加之材料數(shù)太多,所以無法也無需在圖上標(biāo)注出材料名稱或代號?!鳌?兩個近等基因系。
The purpose of the diagram is to intuitively explain the discrete degree between materials,as for which materials are different or the number of differences between materials is not the point that needs to be expressed in this article. In addition,due to the large number of materials,the name or code of materials can not be marked on the map.△△:Two NILs(near isogenic lines).
圖3 基于UPGMA法的Nei’s遺傳距離聚類圖
基于以上結(jié)果獲得的一套小麥品種鑒定最少SNP位點組合(包含14個SNP標(biāo)記),不僅能將近等基因系以外的材料區(qū)分開,而且還兼容芯片和KASP兩種平臺,說明在實際材料鑒定過程中用少量的SNP位點在KASP平臺上快速區(qū)分大部分材料是可行的。考慮實際材料鑒定過程中檢測樣品量大、高度近似材料少等情況,權(quán)衡準(zhǔn)確、經(jīng)濟(jì)、靈活、快速、通量高等需求,材料SNP高通量身份鑒定可采取“核心位點+擴(kuò)展位點”模式進(jìn)行。首先啟用核心位點,核心位點僅需幾十個至上百個位點,在LGC-KASP平臺(樣本高通量檢測平臺)上進(jìn)行,一人一天即可完成上千份樣品的基因分型;當(dāng)少數(shù)幾對材料用核心位點不能區(qū)分時,可啟用擴(kuò)展位點,擴(kuò)展位點可達(dá)幾萬甚至幾十萬個,在芯片平臺(位點高通量檢測平臺)上進(jìn)行,一次實驗即可完成幾(十)萬個位點的基因分型。
藍(lán)色和紅色表示純合基因型,紫色表示雜合基因型。
Blue and red indicate homozygous genotypes; purple represents heterozygous genotype.
圖495個樣品在芯片平臺(A)和KASP平臺(B)上的基因分型結(jié)果
Fig.4Genotypingresultsof95sampleson90KSNParray(A)andKASPplatform(B)
單拷貝位點、最小等位變異頻率高、無連鎖、分布較均勻等是保證品種鑒定準(zhǔn)確性的重要因素。本研究通過利用380個材料掃描90K芯片,從81 587個SNP標(biāo)記中僅篩選出384個高質(zhì)量、高分辨率、單拷貝、均勻分布于21條染色體的候選SNP標(biāo)記,選出率只有0.47%,明顯偏低,說明90K芯片存在一些不足,如大多數(shù)SNP標(biāo)記為多拷貝位點難以準(zhǔn)確分型,多態(tài)性較低,連鎖或重復(fù)標(biāo)記多,有效標(biāo)記數(shù)量少,D染色體基因組上的標(biāo)記太少,分布不均勻等。為滿足規(guī)模化的準(zhǔn)確檢測與指紋數(shù)據(jù)庫構(gòu)建的需要,還需采用中國農(nóng)科院釋放的660K芯片進(jìn)行大量SNP標(biāo)記的篩選工作,以達(dá)到理想的品種鑒定效果。
探索一種準(zhǔn)確、經(jīng)濟(jì)、靈活、快速、高通量的小麥品種SNP身份鑒定模式是建立高通量鑒定技術(shù)體系和指紋數(shù)據(jù)庫構(gòu)建的前提,本研究提出的材料身份鑒定模式“核心位點+擴(kuò)展位點”很明顯可實現(xiàn)以上目的,但核心位點和擴(kuò)展位點分別選取多少合適,還需進(jìn)一步研究與探討。杜邦先鋒公司的研究表明,其選用的16個SNP位點可將公司99%的玉米自交系區(qū)分開,不能區(qū)分的少量自交系有高度系譜相關(guān)性,即使再增加SNPs的數(shù)目也只有很小的效果,權(quán)衡成本、準(zhǔn)確性、高通量等因素,目前僅采取16個SNP位點用于玉米自交系的鑒定。本研究結(jié)果顯示在已知的378個測試材料中,僅需14個SNP位點即可區(qū)分99.5%的材料,與杜邦先鋒公司的研究結(jié)果比較一致。但從品種鑒定對象來說,杜邦先鋒公司的鑒定對象是有限的已知品種,而我國的鑒定對象是無限的未知品種,選擇的14個SNP位點作為核心位點是否已經(jīng)足夠,還需進(jìn)行大量審定標(biāo)準(zhǔn)樣品的驗證,以確定合適的核心位點數(shù)目。
參考文獻(xiàn):
[1] International Union for the Protection of New Varieties of Plants,UPOV.Guidelines for DNA-profiling:Molecular marker selection and database construction “(BMT guidelines”)[M].Geneva,Switzerland:UPOV,2007.
[2] International Union for the Protection of New Varieties of Plants,UPOV.Guidelines for DNA-profiling:Molecular marker selection and database construction “(BMT guidelines”)[M].Geneva,Switzerland:UPOV,2010.
[3] 中華人民共和國農(nóng)業(yè)部.NY/T2859-2015.主要農(nóng)作物品種真實性SSR分子標(biāo)記檢測—普通小麥[S].北京:中國農(nóng)業(yè)出版社,2015.
Ministry of Agriculture of the People’s Republic of China.NY/T2859-2015.Variety genuineness testing of main crops with SSR markers - Wheat(TriticumaestivumL.) [S].Beijing:China Agriculture Press,2015.
[4] 中華人民共和國農(nóng)業(yè)部NY/T1432-2014.玉米品種鑒定DNA指紋方法[S].北京:中國農(nóng)業(yè)出版社,2014.
Ministry of Agriculture of the People’s Republic of China NY/T1432-2014.Protocol for the identification of maize varieties - SSR marker method[S].Beijing:China Agriculture Press,2014.
[5] 中華人民共和國農(nóng)業(yè)部NY/T1433-2014.水稻品種鑒定DNA指紋方法[S].北京:中國農(nóng)業(yè)出版社,2014.
Ministry of Agriculture of the People’s Republic of China NY/T1433-2014.Protocol for identification of rice varieties-SSR marker method [S].Beijing:China Agriculture Press,2014.
[6] JONES E S,SULLIVAN H,BHATTRAMAKKI D A.Comparison of simple sequence repeat and single nucleotide polymorphism marker technologies for the genotypic analysis of maize(ZeamaysL.) [J].TheoreticalandAppliedGenetics,2007,115:361.
[7]TIAN H L,WANG F G,ZHAO J R,etal.Development of maize SNP3072,a high-throughput compatible SNP array,for DNA fingerprinting identification of Chinese maize varieties[J].MolecularBreeding,2015,35:136.
[8] SHIRASAWA K,SHIOKAI S,YAMAGUCHI M,etal.Dot-blot-SNP analysis for practical plant breeding and cultivar identification in rice [J].TheoreticalandAppliedGenetics,2006,113:147.
[9] YOON M S,SONG Q J,CHOI I Y,etal.BARCSoySNP23:A panel of 23 selected SNPs for soybean cultivar identification[J].TheoreticalandAppliedGenetics,2007,114:885.
[10] JONES H,NORRIS C,SMITH D,etal.Evaluation of the use of high-density SNP genotyping to implement UPOV model 2 for DUS testing in barley [J].TheoreticalandAppliedGenetics,2013,126(4):901.
[11] 張利莎,董國清,扎 桑,等.基于EST-SSR和SNP標(biāo)記的大麥麥芽純度檢測[J].作物學(xué)報,2015,41(8):1147.
ZHANG L S,DONG G Q,ZHA S,etal.EST-SSR and SNP markers based barley malt purity detection [J].ActaAgronomicaSinica,2015,41(8):1147.
[12] KUANG M,WEI S J,WANGY Q,etal.Development of a core set of SNP markers for the identification of upland cotton cultivars in China [J].JournalofIntegrativeAgriculture,2016,15(5):954.
[13] WANG S,WONG D,FORREST K,etal.Characterization of polyploid wheat genomic diversity using a high-density 90 000 single nucleotide polymorphism array [J].PlantBiotechnologyJournal,2014,12:787.
[14] 季 偉,王立新,孫 輝,等.小麥SSR分析體系的簡化[J].農(nóng)業(yè)生物技術(shù)學(xué)報,2007,15(5):907.
JI W,WANG L X,SUN H,etal.Predigestion of wheat SSR analysis protocol [J].JournalofAgriculturalBiotechnology,2007,15(5):907.
[15] LIU K,MUSE S V.Power marker:An integrated analysis environment for genetic marker data [J].Bioinformatics,2005,21(9):2128.