田海燕,張海娜,王永強(qiáng),周永萍,張瑩璐
(河北省農(nóng)林科學(xué)院棉花研究所/農(nóng)業(yè)農(nóng)村部黃淮海半干旱區(qū)棉花生物學(xué)與遺傳育種重點(diǎn)實(shí)驗(yàn)室,國家棉花改良中心河北分中心,石家莊 050051)
作物優(yōu)良品種的選育和推廣是實(shí)現(xiàn)農(nóng)業(yè)高產(chǎn)優(yōu)質(zhì)的前提和基礎(chǔ),是保障中國糧食安全的重要環(huán)節(jié)。品種鑒定是優(yōu)良品種選育和推廣的重要保障,是品種審定和種子市場監(jiān)管的主要內(nèi)容,在新品種培育、種子生產(chǎn)、加工及經(jīng)營等過程中具有重要意義[1]。
檢測方法是對品種進(jìn)行精準(zhǔn)鑒定的關(guān)鍵。傳統(tǒng)的田間表型鑒定,試驗(yàn)周期長、易受環(huán)境影響,并且隨著育種親本遺傳基礎(chǔ)的日益狹窄,新品種之間相似度增加,不易區(qū)分,難以滿足快速、準(zhǔn)確鑒定品種的需求[2]。20世紀(jì)后期,分子標(biāo)記技術(shù)實(shí)現(xiàn)了從DNA水平對品種進(jìn)行鑒定,從而區(qū)分親緣關(guān)系較近的品種,與傳統(tǒng)的田間表型鑒定相比,分子標(biāo)記技術(shù)具有鑒定效率高、周期短、結(jié)果準(zhǔn)確等諸多優(yōu)點(diǎn)[3-4]。以RFLP為代表的第1代分子標(biāo)記和以RAPD、AFLP、SSR等為代表的第2代分子標(biāo)記在品種鑒定中發(fā)揮了重要作用。隨著分子標(biāo)記技術(shù)的不斷深入研究,第3 代分子標(biāo)記SNP逐漸應(yīng)用于品種鑒定領(lǐng)域,有效彌補(bǔ)了第1、2 代分子標(biāo)記在實(shí)際應(yīng)用過程中存在的試驗(yàn)可重復(fù)性差、數(shù)據(jù)整合困難、檢測通量低等缺陷[5]。近年來,SNP分子標(biāo)記在玉米[6]、水稻[7]、小麥[8]、棉花[9]、大豆[10]等農(nóng)作物種子的真實(shí)性鑒定、純度檢測、指紋數(shù)據(jù)庫構(gòu)建、親緣關(guān)系分類等方面得到了廣泛應(yīng)用。本文主要從SNP 分子標(biāo)記的特點(diǎn)、檢測方法及在主要農(nóng)作物品種鑒定中的應(yīng)用等方面展開闡述,以期為后續(xù)利用SNP標(biāo)記開展品種鑒定工作提供參考。
單 核 苷 酸 多 態(tài) 性 (Single Nucleotide Polymorphism, SNP),由美國學(xué)者Lander 于1996 年首次提出[11],是指基因組DNA序列上單個堿基的變異所引起的DNA序列多態(tài)性,由單個核苷酸的顛換、轉(zhuǎn)換、缺失和插入產(chǎn)生,其中轉(zhuǎn)換和顛換兩種突變形式占絕大部分,插入和缺失兩種突變形式幾乎可以不計[12]。作為第3代分子標(biāo)記,SNP標(biāo)記具有以下突出特點(diǎn):
一是高密度性,在動植物基因組中普遍存在。SNP 標(biāo)記在動植物基因組中分布廣泛,且數(shù)量巨大。在人類基因組中,SNP 的平均密度約為1 個SNP/1000bp;在水稻基因組中,SNP標(biāo)記的平均密度約為1個SNP/154bp;在玉米基因組中,SNP標(biāo)記的平均密度約為1個SNP/57 bp。在基因組的非編碼區(qū),SNP標(biāo)記出現(xiàn)的概率更高,可以在任何一個目的基因的內(nèi)部或附近找到[13]。二是突變率低,一般僅為10-9,能夠在生物體基因組中穩(wěn)定遺傳,相比SSR等多態(tài)性標(biāo)記遺傳穩(wěn)定性更高[14]。三是通常為二等位多態(tài)性,在進(jìn)行基因組篩查時,對于檢測結(jié)果只需進(jìn)行是與非的判斷即可,而不用分析片段的長度,操作簡便,檢測效率高,易于實(shí)現(xiàn)自動化和不同來源數(shù)據(jù)的整合和標(biāo)準(zhǔn)化[12,15]。四是具有較強(qiáng)的代表性,當(dāng)SNP分子標(biāo)記位于基因編碼區(qū)時,可能會直接影響蛋白質(zhì)結(jié)構(gòu)或表達(dá)水平,因此有可能為性狀遺傳研究提供一定的參考依據(jù)[16]。
SNP 分子標(biāo)記的檢測方法很多,分類方法也有多種,但總的來說早期檢測主要是以凝膠電泳為基礎(chǔ),包括單鏈構(gòu)象多態(tài)性、酶切擴(kuò)增多態(tài)性序列、變性梯度凝膠電泳、等位基因特異性PCR 等,這些傳統(tǒng)方法技術(shù)簡便,成本低,適用于已知SNP的判斷,且僅適用于少量樣本的檢測[17]。隨著分子生物技術(shù)的發(fā)展,研究人員對SNP 的檢測方法不斷進(jìn)行探索和改進(jìn),快速、準(zhǔn)確、高通量、自動化程度較高的檢測方法逐步應(yīng)用并成為主要檢測手段,包括變性高效液相色譜法、高分辨率溶解曲線、質(zhì)譜檢測法、DNA 測序、基因芯片、競爭性等位基因特異性PCR、靶向測序基因型檢測等[18-19],下面著重介紹幾種在農(nóng)作物研究中常用的高通量檢測方法。
高分辨率熔解曲線(High Resolution Melting,HRM)是在PCR 基礎(chǔ)上通過實(shí)時監(jiān)測DNA 雙鏈溶解曲線變化來檢測突變的方法。其原理是將用熒光染料標(biāo)記的PCR產(chǎn)物在一定的溫度范圍內(nèi)進(jìn)行變性,熒光染料從解鏈的DNA分子脫落,熒光信號下降。存在突變的異源雙鏈DNA 變性溫度低于同源雙鏈DNA,會提前解鏈,通過實(shí)時監(jiān)測DNA在溶解過程中熒光信號強(qiáng)度隨時間變化的曲線即可鑒定是否存在SNP。由于SNP位點(diǎn)的堿基類型和數(shù)目對溶解曲線峰形的影響不同,因此HRM 技術(shù)可以有效區(qū)分不同的SNP 位點(diǎn)和基因型[17]。該技術(shù)具有高通量、低成本、操作簡單、結(jié)果準(zhǔn)確、不受檢測位點(diǎn)限制等優(yōu)點(diǎn),在作物研究中得到較為廣泛的應(yīng)用。馮俊彥等[20]利用簡化基因組測序技術(shù)開發(fā)出基于HRM 技術(shù)的甘薯特異SNP 分子標(biāo)記,并將其中的34 對Hrm-bat 引物應(yīng)用于52 份甘薯種質(zhì)材料的親緣關(guān)系分析,所有引物在全部參試材料間的平均多態(tài)性達(dá)到59.35%,證明了這些分子標(biāo)記在甘薯種質(zhì)材料間具有豐富的遺傳多態(tài)性,可用于遺傳多樣性研究。另外HRM技術(shù)還應(yīng)用于作物突變體鑒定[21]、分子標(biāo)記輔助選擇[22-23]等方面。該方法在基因型相對不多、樣品量極大時具有顯著優(yōu)勢。HRM技術(shù)的不足之處為不能完全替代測序,只能通過對熔解曲線不同的代表性樣品的測序而大大減少測序的工作量[24]。另外,由于不同DNA分子間的SNP所導(dǎo)致的Tm值差異細(xì)微,這對檢測設(shè)備提出了較高的要求,要求熒光檢測設(shè)備靈敏度高,而且控溫準(zhǔn)確、精確[25]。
競爭性等位基因特異性PCR( Kompetitive Allele Specific PCR,KASP)是一種基于熒光檢測的基因分型技術(shù),能夠在復(fù)雜的基因組DNA 中對特定位點(diǎn)上的SNP和插入缺失序列進(jìn)行精準(zhǔn)的雙等位基因檢測。檢測體系包括DNA模板、2個通用熒光探針、2個通用淬滅探針、2 個與目標(biāo)位點(diǎn)特異結(jié)合的引物(5'末端添加通用標(biāo)簽序列)以及共同的反向引物。在PCR 擴(kuò)增中,首先等位基因特異引物識別特定等位基因模板,完成等位基因識別,之后擴(kuò)增產(chǎn)物中出現(xiàn)攜帶通用標(biāo)簽序列的模板,攜帶熒光的探針通過與通用標(biāo)簽序列互補(bǔ)的DNA 鏈結(jié)合而添加到PCR 產(chǎn)物中,最終實(shí)現(xiàn)PCR 產(chǎn)物的熒光檢測分析[26]。由于KASP 技術(shù)不需要針對每個SNP 位點(diǎn)設(shè)計熒光探針,只需合成2 個帶有不同顏色的熒光基團(tuán)和雙鏈通用探針,大幅降低了試驗(yàn)成本;還可同時滿足低、中、高通量基因分型的要求,具有通量高、成本低、準(zhǔn)確、靈活的特點(diǎn),已成功應(yīng)用于超過100 多個物種的親緣關(guān)系研究[27]、種質(zhì)鑒定[28]、分子標(biāo)記輔助育種[29]、遺傳圖譜構(gòu)建與基因定位[30]、品種純度檢測[31]等方面。但相較于基因芯片、靶向測序基因型檢測等更高通量的檢測方法,KASP同HRM 技術(shù)一樣更適合于基因型相對不多,樣品量極大的檢測。
基因芯片是基于堿基互補(bǔ)配對原則的核苷酸序列雜交。首先將設(shè)計合成好的核苷酸探針用特殊的方法高密度地覆蓋在經(jīng)過處理的固相載體上,然后將待測樣本經(jīng)過熒光染料標(biāo)記(一般用Cy3和Cy5標(biāo)記)后與芯片上的探針在適宜條件下雜交,如果待測樣本的序列與探針序列完全互補(bǔ),發(fā)出的熒光信號就會很強(qiáng),反之,熒光信號就會很弱,雜交結(jié)束后通過芯片掃描儀檢測熒光信號,并將熒光信號轉(zhuǎn)化為數(shù)字信號后進(jìn)行分析[5,32]?;蛐酒且环N高集成、高通量、微型化和自動化的SNP 檢測方法[33],只需一次雜交就可以實(shí)現(xiàn)成千上萬個位點(diǎn)的篩查,是作物遺傳多樣性[34]、群體結(jié)構(gòu)[35]、QTL 定位[36]等研究的有效技術(shù)手段。相比其他檢測方法,基因芯片技術(shù)適合于育種工作中對大量群體樣本進(jìn)行基因型鑒定,以及超高通量的標(biāo)記檢測,如高精度的GWAS 分析等。但缺點(diǎn)是定制和檢測服務(wù)的費(fèi)用相對較高。
測序法是檢測出SNP 信息量最多且最直接的方法。通過測序,可直接獲得目的片段的堿基序列,序列間比對后可直觀有效地獲得SNP,檢出率高達(dá)100%,同時還可以確定SNP的準(zhǔn)確位置以及發(fā)生的類型,是最準(zhǔn)確的檢測方法。第二代測序技術(shù)的出現(xiàn),與第一代測序技術(shù)相比,向高通量、低成本方向邁進(jìn)了一大步,同時也推動了測序技術(shù)在基因分型檢測上的發(fā)展[37]。基于簡化基因組測序的基因分型測序技術(shù)(Genotyping By Sequencing,GBS),在作物親緣關(guān)系和遺傳多樣性分析、遺傳圖譜構(gòu)建和基因定位等方面有較為廣泛的應(yīng)用。賴國榮等[38]以玉米自交系X178 和NX531 為親本,構(gòu)建了150 個株系的重組自交系群體,基于GBS 技術(shù)獲得基因型純合的多態(tài)性SNP 位點(diǎn),得到7278 個重組bin 標(biāo)記,構(gòu)建了總長為2569 cM的高密度遺傳圖譜,標(biāo)記間平均遺傳距離為0.35 cM,通過對重組自交系群體籽粒脂肪含量、賴氨酸含量、蛋白質(zhì)含量和淀粉含量4 個營養(yǎng)品質(zhì)性狀進(jìn)行QTL定位,共檢測到20 個QTL,驗(yàn)證了高密度遺傳圖譜的可靠性。測序法進(jìn)行基因分型具有精準(zhǔn)度高,突變位點(diǎn)信息量大的優(yōu)勢,但是對于具有復(fù)雜和重復(fù)基因組的植物,測序和基因分型大量個體仍需要較高的成本。另外測序產(chǎn)生的數(shù)據(jù)龐大而復(fù)雜,在數(shù)據(jù)分析方面對科研人員提出了較高的要求,需要進(jìn)一步尋找快速和準(zhǔn)確的數(shù)學(xué)算法和數(shù)據(jù)處理技術(shù)以提高數(shù)據(jù)分析的效率和質(zhì)量。
靶向測序基因型檢測(Genotyping By Target Sequencing,GBTS)是近年發(fā)展起來的一種標(biāo)記檢測技術(shù),是從基因組DNA中挑選特定的靶向位點(diǎn)進(jìn)行測序和基因型檢測,由基于多重PCR 的GenoPlexs 體系和基于液相探針雜交的GenoBaits兩個技術(shù)體系組成,可廣泛用于資源評價、基因定位和克隆、遺傳圖譜構(gòu)建、分子標(biāo)記輔助選擇、品種權(quán)保護(hù)等領(lǐng)域[39]。目前在小麥[40]、玉米[41]、棉花[42]、大豆[43]、油菜[44]、蠶豆[45]、花生[46]等作物中均研制出基于GBTS 的液相芯片,并得到初步應(yīng)用。如CHEN等[47]利用浙江大學(xué)研制的棉花40K液相芯片,采用GBTS 技術(shù)對612 份棉花材料進(jìn)行基因分型,種群聚類分析將612 份材料劃分為4 類,對5種環(huán)境下的5 個纖維品質(zhì)性狀進(jìn)行了GWAS 分析,共檢測到42個與目標(biāo)性狀相關(guān)的SNP位點(diǎn),可為將來開展棉花品質(zhì)育種提供更精確的分子標(biāo)記。GBTS技術(shù)是一種自動化、智能化和高通量的檢測方法?;贕BTS 的液相芯片與固相芯片相比具有較強(qiáng)的靈活性,可隨時升級添加標(biāo)記位點(diǎn),而且不受檢測樣本量的限制,成本低于常規(guī)固相芯片,但不足的是無法達(dá)到固相芯片所能實(shí)現(xiàn)的標(biāo)記的超高密度,不適合高精度的GWAS分析[48]。
綜上,SNP的檢測方法很多,但各種方法適用類型及對試驗(yàn)條件要求等各不相同,應(yīng)根據(jù)研究目標(biāo)、試驗(yàn)條件等綜合考慮選擇合適的方法,也可幾種方法一并使用,以達(dá)到最佳檢測效果。
快速、精準(zhǔn)地對品種進(jìn)行真實(shí)性和純度鑒定,是保護(hù)種業(yè)知識產(chǎn)權(quán)和消費(fèi)者權(quán)益的基礎(chǔ)和前提。建立快速、準(zhǔn)確、高通量的檢測技術(shù)是生產(chǎn)中亟待解決的實(shí)際問題,與傳統(tǒng)的表型鑒定相比,分子水平上的真實(shí)性和純度鑒定除了具有周期短、結(jié)果準(zhǔn)確、可大規(guī)模操作等諸多優(yōu)點(diǎn)外,尤其適用于親緣關(guān)系較近的資源和品種的鑒定。SNP標(biāo)記以其高密度、遺傳穩(wěn)定、易于實(shí)現(xiàn)自動化分析等優(yōu)勢成為當(dāng)今品種鑒定的重要技術(shù)選擇。近年來,在小麥、玉米、水稻等主要糧食作物真實(shí)性和純度鑒定上得到廣泛應(yīng)用。劉麗華等[49]利用wheat 90K SNP 芯片對380 份小麥品種進(jìn)行全基因組掃描、分析和評價,篩選出高質(zhì)量、高分辨率、單拷貝和均勻分布的候選SNP標(biāo)記384個,并進(jìn)一步獲得14個核心SNP 的KASP 標(biāo)記組合一套,提出了“核心位點(diǎn)+擴(kuò)展位點(diǎn)”的高通量鑒定模式。李樂等[50]發(fā)明了一套用于小麥品種純度檢測的包含21 個高質(zhì)量和高多態(tài)性的SNP 標(biāo)記組合及其應(yīng)用方法,為小麥品種純度的精準(zhǔn)檢測提供了可靠技術(shù)支持。鄭向華等[51]利用3000 份水稻種質(zhì)資源信息,通過SNP-index 的方法篩選得到4084個秈粳特異SNP位點(diǎn),采用大規(guī)模簡單隨機(jī)取樣等統(tǒng)計分析方法對秈粳特異位點(diǎn)進(jìn)行數(shù)據(jù)降維處理后,精簡至40個SNP位點(diǎn),并驗(yàn)證了40-SNP對品種鑒定的可靠性。徐建龍等[52]發(fā)明了用于水稻種質(zhì)資源和品種鑒定的SNP標(biāo)記組合,包含70個核心SNP位點(diǎn)和130 個擴(kuò)展SNP 位點(diǎn),可為水稻品種和種質(zhì)資源身份鑒別、純度鑒定及品種確權(quán)提供強(qiáng)有力的技術(shù)支撐。YU 等[53]開發(fā)了基于水稻全基因組SNP 信息的芯片RICE6K,該芯片包含了秈粳稻亞種間和秈粳稻亞種內(nèi)品種間的多態(tài)性信息,可用于水稻品種的純度和真實(shí)性鑒定。JOSIA 等[54]使用92 個KASP-SNP 標(biāo)記對26個玉米自交系進(jìn)行了遺傳純度評價,結(jié)果表明67%的自交系是遺傳純系,剩余雜合度<5%,33%的自交系雜合度>5%,需要進(jìn)一步純化,證明了SNP標(biāo)記是遺傳純度評價的一種有效、可靠標(biāo)記。李雪等[55]分析比較了SNP芯片和SSR熒光毛細(xì)管電泳兩種方法在玉米品種真實(shí)性鑒定中的應(yīng)用,結(jié)果顯示兩種標(biāo)記都具備較高的品種區(qū)分能力,而且SNP 標(biāo)記在數(shù)據(jù)整合共享、位點(diǎn)通量等方面展現(xiàn)了較強(qiáng)的優(yōu)勢。除了在主要糧食作物中的應(yīng)用,SNP標(biāo)記還應(yīng)用在棉花、大豆以及其他蔬菜、水果、豆類等作物品種的真實(shí)性和純度鑒定中,更多應(yīng)用情況詳見表1。隨著各類作物品種審定數(shù)量逐漸增多,同質(zhì)化問題凸顯,對品種真實(shí)性鑒定和純度檢測均提出了更高的要求。試驗(yàn)結(jié)果證實(shí),SNP 標(biāo)記在品種真實(shí)性和純度鑒定中結(jié)果準(zhǔn)確可靠,與傳統(tǒng)的SSR標(biāo)記相比,在不同的應(yīng)用場景,SNP標(biāo)記可以靈活實(shí)現(xiàn)低、中、高通量的檢測,而且檢測方法更加自動化,可滿足新形勢下品種鑒定需求,有良好的研究潛力和應(yīng)用前景。
親緣關(guān)系分析與分類是作物種質(zhì)資源研究的重要內(nèi)容,應(yīng)用分子標(biāo)記技術(shù)在DNA水平上進(jìn)行親緣關(guān)系分析,可以對作物的遺傳物質(zhì)進(jìn)行大范圍評價比較,能更全面地反應(yīng)其遺傳多樣性,為親緣關(guān)系分析與分類提供分子水平的客觀依據(jù)。鑒于上述SNP 標(biāo)記的優(yōu)點(diǎn),其在親緣關(guān)系分析和分類以及種質(zhì)資源遺傳多樣性研究中具有較大的應(yīng)用潛力。在主要糧食作物品種上,白彥明等[56]利用小麥660K SNP芯片對北方小麥原始骨干親本螞蚱麥、小白麥及其衍生品種(系)進(jìn)行全基因組掃描,分析其遺傳多樣性,結(jié)果表明螞蚱麥和小白麥衍生系的遺傳多樣性較低,需引入新的種質(zhì)資源,增加優(yōu)異基因擴(kuò)寬遺傳基礎(chǔ)。KASSA 等[57]通過掃描小麥90K SNP芯片,獲得多態(tài)性標(biāo)記28798個,評估了196個加拿大春小麥品種(系)的遺傳多樣性,將196份材料分為八類,為加拿大春小麥遺傳育種研究提供了基礎(chǔ)數(shù)據(jù)和技術(shù)支持。高嵩等[58]利用6973 個SNP 位點(diǎn)對來自7個類群的205份自交系材料進(jìn)行群體遺傳結(jié)構(gòu)和遺傳多樣性分析,205份自交系被劃分為7個雜種優(yōu)勢群,劃群結(jié)果和系譜來源具有較好的一致性,分析結(jié)果為玉米強(qiáng)優(yōu)勢雜交種的選育奠定了基礎(chǔ)。樸日花等[59]利用SNP分子標(biāo)記對54份香型粳稻和8份非香稻資源進(jìn)行遺傳多樣性分析,62 份材料共分為3 個類群,相似系數(shù)為0.82,大多數(shù)材料并沒有按地理來源明顯分開,表明材料間的遺傳距離很近,地域間資源交流廣泛,研究結(jié)果可為北方香型粳稻種質(zhì)資源研究及育種親本選配提供參考。此外,SNP 標(biāo)記還被用于其他作物的親緣關(guān)系分析、分類中,詳細(xì)應(yīng)用信息見表1。利用分子標(biāo)記開展作物親緣關(guān)系分析研究的報道較多,早期所用標(biāo)記多為AFLP、SSR等2代分子標(biāo)記,標(biāo)記數(shù)量相對較少,難以覆蓋全基因組,近年來,隨著SNP 標(biāo)記技術(shù)的發(fā)展,基因芯片、GBS、GBTS 等高通量檢測技術(shù)的應(yīng)用,為作物親緣關(guān)系分析與分類提供了更廣闊的研究和應(yīng)用空間。
在中國新《種子法》實(shí)施、種業(yè)知識產(chǎn)權(quán)保護(hù)進(jìn)入新時代的大背景下,檢測需求也不斷發(fā)生變化,對檢測方法、檢測成本、標(biāo)記鑒別效率、數(shù)據(jù)分析等均提出了更高的要求。未來,SNP 標(biāo)記在作物品種鑒定上的發(fā)展方向應(yīng)為:(1)高效低成本檢測方法的進(jìn)一步研發(fā)與應(yīng)用。目前,SNP 標(biāo)記的開發(fā)及高通量檢測技術(shù)的成本仍然相對較高,在一定程度上限制了其應(yīng)用,隨著SNP 技術(shù)的進(jìn)一步成熟,高通量、高準(zhǔn)確率、低成本的檢測方法是研究的重要方向。(2)提高標(biāo)記鑒別效率。針對不同作物,進(jìn)一步篩選核心SNP 標(biāo)記,達(dá)到使用少量標(biāo)記鑒別大量品種的目的。(3)數(shù)據(jù)處理系統(tǒng)的進(jìn)步。雖然SNP數(shù)據(jù)非常豐富,但其中也包括了大量冗余信息,海量數(shù)據(jù)的處理和分析使得研究人員很難快速準(zhǔn)確的獲得有用信息,需要進(jìn)一步研究快速、準(zhǔn)確、易于操作的數(shù)據(jù)處理系統(tǒng)以提高數(shù)據(jù)分析的效率和質(zhì)量。隨著各方面研究的進(jìn)一步發(fā)展和完善,檢測成本的逐步下降,SNP 標(biāo)記必將在作物品種鑒定領(lǐng)域發(fā)揮更大的作用。