王亞琦, 孫子淇, 鄭 崢, 黃冰艷, 董文召, 湯豐收, 張新友,
(1.河南科技大學農學院,河南洛陽 471000; 2.河南省農業(yè)科學院經(jīng)濟作物研究所/農業(yè)部黃淮海油料作物重點實驗室/河南省油料作物遺傳改良重點實驗室,河南鄭州 450002)
傳統(tǒng)的植物育種主要依賴于育種家對植株表現(xiàn)型的選擇。環(huán)境條件、基因間互作、基因型與環(huán)境互作等多種因素均會影響植株表型選擇準確性從而降低育種效率。一個優(yōu)良品種的培育往往需花費7~8年甚至十幾年時間。如何提高選擇效率,是育種工作的關鍵。近年來,隨著分子生物學和基因組學的快速發(fā)展,分子選擇育種應運而生,利用已掌握的植物表型與基因型相關信息,研究人員可以直接利用基因型數(shù)據(jù)對表型進行選擇。分子選擇育種包括前景選擇和背景選擇,前景選擇建立在基因定位和QTL作圖的基礎之上,前景選擇的可靠性取決于標記與目標基因之間的連鎖程度,標記與目標基因連鎖越緊密,則標記輔助育種的準確率越高,而背景選擇主要指遺傳背景的恢復,育種材料間遺傳距離、親緣關系分析等。
分子選擇育種經(jīng)歷了2個重要的階段,第1個階段為分子標記輔助選擇(molecular marker assisted selection,MAS),第2個階段為全基因組選擇(GS)[1]。分子標記輔助育種,采用與目標基因緊密連鎖的分子標記,篩選具有特定基因型的個體,并結合常規(guī)育種方法選育優(yōu)良品種,此方法建立在QTL作圖和基因定位的研究基礎和數(shù)據(jù)之上。全基因組選擇可以被定義為在全基因組水平上進行分子選擇育種的方法。全基因組策略包括對收集的種質資源的全基因組測序,分析重要、優(yōu)異(或低劣)性狀單倍型、重要基因區(qū)段、功能基因的分子標記開發(fā)等。全基因組選擇要配合建立多個環(huán)境下目標性狀高效的表型鑒定系統(tǒng),同時考慮影響基因、基因型、完整植株表現(xiàn)的相關環(huán)境因素信息的整合。
相比于傳統(tǒng)育種,分子選擇育種具備以下優(yōu)點:(1)可縮短育種年限,提高育種效率,節(jié)約大量的人力、物力;(2)分子標記可在作物生長的各個階段進行檢測,大幅度減少田間性狀調查時間;(3)分子標記選擇不受外界環(huán)境的影響,可在任何環(huán)境條件(溫室、異地等)下進行分子標記選擇,提高了某些特殊性狀,如僅在特定環(huán)境下表達的性狀抗病基因、耐脅迫基因被選擇的有效性;(4)相對于表型選擇,分子標記選擇對于遺傳力低的性狀(如抗旱、產量性狀),隱形性狀(如抗病性狀),表型鑒定困難、花費高的性狀(如加工品質),多個抗性基因聚合的性狀的選擇具有顯著作用[2-5]。
1.1.1雙親作圖群體選擇合適的作圖親本及構建適當?shù)娜后w類型是成功和高效進行基因型及QTL定位的2個關鍵因素。目前,已有多種類型的群體用于遺傳圖譜的構建,其中最常用的是雙親作圖群體。按照其特征進行分類,可分為暫時性群體和永久性群體。其中,暫時性群體主要包括F2群體及其衍生的F3家系、BC1群體。暫時性分離群體最顯著的特點是含有可發(fā)生分離的雜合基因型后代,遺傳信息豐富。永久性群體主要包括重組自交系群體、雙單倍體群體、F1花粉分化和用于QTL精細定位的近等基因系群體、染色體片段代換系群體等。永久性分離群體最顯著的特點是不同株系間的基因型存在差異,而同一個株系內不同個體間的基因型無差異,永久性分離群體后代穩(wěn)定,通過自交其后代不會再分離,故其可永久使用。
Khedikar等利用高產易感晚斑病和銹病的花生材料TAG24和高產抗葉斑病和銹病的材料GPBD4構建RIL群體,利用SSR表記進行遺傳圖譜構建,結合田間表型調查數(shù)據(jù)對晚斑病抗性QTL和銹病抗性QTL進行定位,結果獲得1個銹病抗性主效QTL,可解釋6.90%~55.20%的表型變異,標記IPAHM 103與該QTL緊密關聯(lián),可解釋55.20%的表型變異[6]。利用多份抗病材料和易感材料對IPAHM 103進行驗證,結果表明,該標記可靠,可進一步用于花生抗銹病的分子標記輔助育種中。針對分子標記育種效率還不太高等問題,研究人員提出了一系列的對策。Tanksley等提出,利用高代回交導入系同時進行QTL分析和遺傳改良,其主要是將QTL的定位分析推遲到如BC2、BC3等高世代,使QTL的檢測和有利等位變異的導入相結合[7]。同時在該類群體的基礎上可以進一步構建高級群體,即在QTL初定位基礎上選擇目標QTL區(qū)間雜合的單株再自交或回交1~2次,結合分子標記輔助選擇即可得到QTL的近等基因系(QTL-NILs)。利用此近等基因系一方面可以驗證QTL的真實性,另一方面又可以獲得經(jīng)過改良特定數(shù)量性狀的穩(wěn)定品系,直接應用于大田生產。
研究表明,基于雙親群體的QTL作圖是定位數(shù)量性狀的有效方法之一[8-9],但雙親作圖群體仍存在一些弊端:(1)由于這些群體建立在雙親的遺傳基礎之上,導致群體遺傳差異僅限于雙親之間;(2)雙親作圖群體只能對目標性狀或相關性狀進行定位;(3)由于雙親作圖群體有限的重組使得定位區(qū)間偏大,若想進一步對目標性狀進行精細定位,發(fā)掘目標基因,進行分子標記輔助選擇育種和群體改良,需要進一步縮小定位區(qū)間。此外,對于某些自花授粉作物來說,雙親之間的多態(tài)性更低,利用雙親構建群體進行QTL定位,效果不太理想。
1.1.2多親本作圖群體巢式關聯(lián)作圖群體是由一個共同親本和多個親本雜交獲得一系列重組自交系群體的集合。Yu等采用25個具有遺傳多樣性的玉米自交系與參考系進行雜交,構建了包含約250個自交系的25個RIL群體[10]。Kump等利用包含25個家系的NAM群體對玉米小斑病進行全基因組關聯(lián)分析,鑒定獲得32個QTLs,其中包含多個微效基因,認為NAM可顯著提高作圖分辨率[11]。Bergelson等系統(tǒng)比較了巢式關聯(lián)作圖與巢式連鎖作圖,發(fā)現(xiàn)將二者結合起來有利于圖譜的精細定位[12]。另外,多親本高級世代互交系是另外一個多親本作圖群體,它是利用多個親本雜交、然后互交,再隨機交配,最后自交產生重組自交家系。
由于多個親本的互交使其多態(tài)性增加,可以提高QTL定位精度。Kover等在擬南芥上利用19個材料互交獲得包含572個RILs的MAGIC群體,并利用1 026個SNPs標記對該多親本高級世代互交系群體進行了全基因組掃描,分析結果表明,利用該群體定位的QTL與已知的QTL極為接近,并縮小了定位區(qū)間。說明多親作圖群體進行全基因組掃描功效更高且更加精確[13]。
1.1.3自然群體自然群體進化歷史的各種變異和交換重組,大大增加了QTL定位精度,甚至可以直接定位到基因本身,因此,更有利于分子標記輔助育種的應用及QTL克隆。但是,自然群體的群體結構往往會產生假陽性結果。高通量基因分型技術的不斷提高,DNA測序技術的不斷更新,以及關聯(lián)作圖中群體結構統(tǒng)計方法的發(fā)展促進了作物自然群體在全基因組關聯(lián)作圖中的應用。作為關聯(lián)分析在植物應用上的里程碑,Atwell等對擬南芥107表型進行全基因組關聯(lián)分析,獲得多個相關性狀的主效基因,GWAS在擬南芥上的成功應用為其他作物進行GWAS分析提供了良好的思路[14]。Zhao等利用44 100個SNPs對來自82個國家的具有遺傳多樣性的413份水稻材料進行全基因組關聯(lián)分析,就形態(tài)、發(fā)育、農藝性狀等34個性狀展開了系統(tǒng)的研究,發(fā)現(xiàn)大量復雜性狀的常見變異基因,并將遺傳變異和代謝途徑有效的結合在一起,為品種發(fā)展和作物改良提供了平臺[15]。Morris等對收集的971份全球各地適應多種農業(yè)氣候的高粱品種進行測序,獲得約265 000個SNPs標記用于圖譜構建,并發(fā)掘經(jīng)典株高位點,花序結構候選基因[16]。該圖譜可用于分子標記輔助育種和全基因組選擇。于志遠等收集了327大豆材料,這些材料由優(yōu)異親本材料和東北主推品種組成;利用186對SSR標記對所有材料基因型進行檢測,并進一步對所收集大豆材料的含油量和蛋白質含量進行關聯(lián)分析;最終檢測到12個與含油量極顯著關聯(lián)的位點,11個與蛋白質含量極顯著關聯(lián)的位點[17]。
分子標記及其在基因組中的位置對分子育種策略的選擇起著至關重要的作用。分子標記種類較多,大致可分為以下幾類:(1)基于DNA-DNA分子雜交的分子標記,如RFLP(restriction fragment length polymorphism)標記、CAPS(cleaved amplified polymorphic Sequence)標記、VNTR(variable number of tandem repeats)標記等。(2)基于PCR(polymerase chain reaction)的分子標記、如SSR(simple sequence repeat)標記、ISSR(inter-simple sequence repeat)標記、ISTR(inverse sequence-tagged repeat)標記,STS(sequence tag site)標記等。(3)基于PCR與限制性酶切技術結合的分子標記,如AFLP(amplified fragments length polymorphism)標記等。(4)基于測序的單核苷酸多態(tài)分子標記,如SNP(single Nucleotide polymorphisms)標記。分子育種技術也在不斷地發(fā)展與更新。相對于第一代基于分子雜交的RFLP標記,基于PCR的SSR標記大大減少了基因分型的費用和時間,從而促進分子育種的快速發(fā)展與應用。相對于SSR標記,SNP標記在基因組中覆蓋率更廣,近年來,隨著測序技術的快速發(fā)展,多種作物中大量的SNP標記被開發(fā)出來,并構建了高密度分子圖譜,從而為分子育種奠定了堅實的基礎[18-20]。
此外,單倍型也被認為是一種分子標記,它常常被定義為來自一個特異基因區(qū)段或單個染色體上多個標記的組合,還可以是來自不同染色體上控制同一目標性狀的標記的組合。試驗表明,利用單倍型替代SNP進行目標性狀的多樣性分析和關聯(lián)作圖效果更加理想。植物中第1個單倍型圖譜來自于擬南芥,研究人員利用包含341 602個非單態(tài)型SNPs的基因芯片對19個樣本進行分析,并獲得了全基因組LD[21]。Gore等利用27份多樣化的玉米自交系進行單倍型作圖,最終獲得圖譜包含300萬以上個SNP標記,平均每40 bp就可以檢測到1個SNP[22]。我國研究人員已在玉米中發(fā)現(xiàn)了5 000萬以上個SNPs,并利用這些標記構建玉米的第2個單倍型圖譜[23]。Huang等在水稻中,利用新一代測序技術對517份水稻品種進行測序,識別了300萬以上個SNPs,并利用這些標記構建水稻單倍型圖譜[24]。
與其他標記相比,功能標記不會與基因發(fā)生重組,因此,功能標記是分子育種的理想標記。目前,小麥的抗白粉病功能標記[25-28]、抗條銹病功能標記[29]、玉米高直鏈淀粉功能標記[30]、花生高油酸功能標記[31-32]陸續(xù)被開發(fā)出來,從而為相關目標性狀的分子標記育種奠定了堅實基礎。
基因分型大致分為3個階段,分別是凝膠電泳、基因芯片和測序。伴隨著基因分型技術的發(fā)展,基因分型通量大幅度提高——由原來的少數(shù)幾個標記增加到到成千上萬個標記同時對樣品進行基因分型。相比于凝膠電泳,基因芯片技術(DArT)在增加基因分型通量的同時降低了基因分型的費用[33],該技術已在小麥、大麥、高粱等作物上得到廣泛應用[34-37]。還有其他類型芯片,如affymetrix基因芯片、Sequenom質譜分型芯片等。隨著高通量測序成本的不斷降低,測序分型迅速成為進行高通量基因分型的一種方法,越來越受到廣大科研工作者的青睞。Wang等利用新一代測序技術對包含100個單株的F1群體進行測序,共開發(fā)出1 814個高質量的SNP標記,并構建一張包含1 646個標記的葡萄遺傳圖譜[38]。Zhou等利用新一代測序技術對包含166個單株的RIL群體及雙親進行測序,構建了一張包含1 621個SNPs的花生遺傳圖譜[39]?;蚍中图夹g的發(fā)展為分子標記育種大規(guī)模應用創(chuàng)造了條件。
常用的作圖方法有連鎖作圖、關聯(lián)作圖。連鎖作圖常以雙親本群體或多親本群體為作圖群體,它利用標記和標記、標記和基因之間的重組率來確定其在染色體上的相對位置,進而構建遺傳圖譜。隨著測序技術的發(fā)展和SNP標記的應用,以連鎖不平衡為基礎的關聯(lián)作圖逐漸成為一種可信賴的作圖方法。相比于連鎖作圖,關聯(lián)作圖有以下幾點優(yōu)勢:(1)關聯(lián)作圖可以直接利用自然群體,不需要構建群體,因此節(jié)省大量的人力物力。(2)關聯(lián)作圖利用自然群體廣泛的遺傳背景和長期積累的歷史變異及大量的重組信息,大大增加了圖譜的分辨率,有效提高了QTL的定位精度。(3)關聯(lián)作圖可以同時檢測多個性狀,而連鎖作圖僅能檢測目標性狀及相關少數(shù)幾個性狀。(4)關聯(lián)作圖可以直接利用已有的歷史數(shù)據(jù)進行關聯(lián)分析。Erena等通過關聯(lián)作圖發(fā)掘出穩(wěn)定遺傳的小麥籽粒產量QTL,并獲得與之緊密關聯(lián)的分子標記[40]。Su等對200個美國冬小麥進行關聯(lián)分析,鑒定出3個同時與小麥千粒質量和粒長緊密關聯(lián)的SNP標記[41]。但關聯(lián)作圖也存在一些弊端,如自然群體存在一定的群體結構和親緣關系,容易引起假陽性的關聯(lián),關聯(lián)分析對效應值較大的稀有等位基因定位效果較差,而連鎖分析對于該類等位基因定位效果較好,由此可見,連鎖作圖與關聯(lián)作圖是存在互補的。
為了有效地結合連鎖作圖與關聯(lián)作圖的優(yōu)勢,Myles等提出了連鎖圖譜與關聯(lián)作圖圖譜整合的策略[42]。Lu等利用3個RIL群體構建連鎖圖譜,并利用包含305個自交系的自然群體進行關聯(lián)作圖,最終將連鎖圖譜與關聯(lián)圖譜進行整合,構建了玉米的第1張整合圖譜,并因此發(fā)現(xiàn)了單獨作圖未能定位的18個玉米抗旱相關QTL[43]。Li等利用雙親群體和自然群體對玉米株高和穗高進行連鎖作圖和關聯(lián)作圖,共定位21個QTLs、41個SNPs,同時結合連鎖和關聯(lián)分析,獲得1個株高候選基因和1個穗高候選基因,為玉米株高、穗高遺傳研究提供了基礎[44]。
隨著分子生物學和基因組學等學科的飛速發(fā)展,分子選擇育種也在不斷發(fā)展。近年來,測序技術的不斷發(fā)展及測序成本的降低使得全基因組大規(guī)模測序成為可能,從而形成了基于全基因組策略的分子選擇育種[1]。全基因組策略可以被定義為在全基因組水平上進行分子選擇育種的工具包和方法論。全基因組策略的發(fā)展包括對所有登記在冊的種質資源進行全基因組測序,重要基因組區(qū)域、基因及功能基因區(qū)域分子標記的開發(fā),多種目標性狀高效的表型鑒定系統(tǒng)(在多個環(huán)境中進行測量)的建立,基因、基因型、表現(xiàn)型及相關環(huán)境因素的整合等。
第一階段的分子標記輔助選擇包括分子標記輔助回交選擇和分子標記輔助輪回選擇。這個階段可利用的分子標記數(shù)量有限,并且主要依賴于主效QTL的定位精度。在具體的育種過程中一般會選取2~10個與目標QTL緊密連鎖的分子標記,同時對目標QTL進行檢測[45-48]。Peng等認為,當分子標記與目標基因之間的距離小于2 cM時,單個標記檢測的準確率可≥90%[49]。李進波等研究結果表明,當分子標記與目標基因間的距離在1.0 cM以內時,可用單個分子標記進行輔助育種[50],Peng等利用分子標記選擇目標基因的準確率均接近100%。
2.1.1分子標記輔助回交選擇在分子標記輔助回交選擇中,除了需要對目標QTL進行選擇外,還需要至少200個覆蓋全基因組的標記進行背景選擇,以保證所選植株與受體材料保持高度一致[1]。目前,分子標記輔助回交選擇已經(jīng)在農作物抗病性育種[51-54]、品質育種[55-56]得到廣泛應用。Zhao等將玉米抗黑穗病基因經(jīng)過多代回交逐漸滲入到10個玉米自交系中,最終10個自交系均抗黑穗病且其他大部分性狀均未改變[54]。Barloy等利用RAPD和SCAR標記,將野生牧草中的2個谷物孢囊線蟲抗性基因分別滲入到小麥中,并同時將2個抗性基因聚合到小麥中[57]。結果表明,聚合2個抗性基因的小麥抗性高于滲入單個抗性基因的小麥,但低于野生牧草抗性。朱映東等以純和香型水稻與非香型巨胚水稻雜交,F(xiàn)1自交得F2,選取F2中巨胚特性種子繼續(xù)種植自交。提取F2葉片基因組DNA[55],采用可以識別香味基因特異位點的限制性內切酶選擇純和香型基因,連續(xù)自交到F8獲得3個香型巨胚水稻品系。Zhou等利用SSR與RFLP標記輔助選擇,通過3次回交1次自交將恢復系中控制加工品質和口感的基因滲入到品質不理想的珍汕97中(常用作雜交稻母本),改良后的珍汕97直鏈淀粉含量下降,黏稠度與糊化溫度均有所提高[56]。然而,由于遺傳圖譜無法定位效應較小的QTL,導致分子標記回交育種只能聚合效應較大的QTL,對于效應較小的QTL及一些稀有變異則無法應用到回交育種中。Varshney等利用分子標記輔助回交選擇將栽培花生GPBD4中抗銹病QTL(可解釋82.62%的表型變異)分別導入3個易感銹病的材料中,通過2~3代的回交及自交,獲得81個抗性提高的基因漸滲系[58]。利用與抗銹病QTL連鎖的13個分子標記對43個表現(xiàn)良好的基因漸滲系進行篩選,最終在11份基因漸滲系中發(fā)現(xiàn)目標QTL。因此,這些分子標記可用于花生抗銹病的育種過程中。Chu等以栽培花生Tifguard(抗線蟲)為輪回親本,分別和栽培花生Georgia-02C和Florida-07(油酸含量較高)雜交,利用分子標記輔助回交選擇,將抗線蟲性狀與高油酸性狀聚合在了一起[59]。
2.1.2分子標記輔助輪回選擇分子標記輔助輪回選擇在90年代被提出[60-61]。該方法在每一代選擇中利用分子標記對所有需要改良性狀或重要性狀進行選擇,并將每一代中獲得的優(yōu)良單株互相雜交,然后雜交后代中通過上述標記選出優(yōu)良單株。經(jīng)過多代連續(xù)雜交與分子輔助選擇,最終獲得具備理想基因型的植株[62-63]。這個方法適用于多個親本優(yōu)良基因的聚合。在沒有QTL信息的情況下,可通過標記與性狀的相關性進行選擇。模擬研究發(fā)現(xiàn),分子標記輔助輪回選擇聚合有利基因的效率要比表型選擇高出3%~20%[64]。
分子標記輔助育種在質量性狀或由單個主效基因控制的數(shù)量性狀改良中得到成功應用,已經(jīng)成為輔助作物遺傳育種改良的有力工具。但由于數(shù)量性狀遺傳基礎的復雜性和QTL定位的限制性,導致分子標記輔助育種在復雜數(shù)量性狀改良特別是由多個微效基因控制的數(shù)量性狀改良中的應用受到諸多限制[65]。全基因組選擇有效避免了以上限制,它利用覆蓋全基因組的分子標記同時關聯(lián)主效和微效基因,并進行復雜性狀育種值預測[66]。全基因組選擇簡單來講就是全基因組的分子標記輔助選擇,不需要進行傳統(tǒng)意義上標記和性狀的關聯(lián)。它是基于連鎖不平衡理論,即假設標記與相鄰的QTL處于連鎖不平衡狀態(tài),利用覆蓋全基因組的分子標記將染色體分成若干區(qū)段,然后通過模擬群體的基因型和表型估算每個染色體片段的效應值。由于標記和QTL的連鎖不平衡,所以利用相同標記估算的染色體片段的效應在不同群體中是相同的,基于以上結果,研究人員可以利用相同標記進行其他個體或群體的育種值的預測。與傳統(tǒng)育種相比,全基因組選擇分子育種技術選擇更準確,更高效,可使育種周期縮短Y3~Y2。以全基因組序列為指導的新一代育種技術效率更高,成本大大降低。全基因組選擇分為3個步驟:(1)基于參考群體全基因組分子標記與表型鑒定數(shù)據(jù)建立BLUP(best linear unbiased prediction)模型,估計每一標記的育種值;(2)利用同樣的分子標記對其他材料育種值進行預測;(3)根據(jù)預測育種值進行選擇[67]。
相比于MAS依賴于QTL定位的準確性及其附近標記,僅選用少量分子標記進行預測少量的QTL效應,全基因組選擇采用覆蓋整個基因組的分子標記來捕獲整個基因組上的變異并對育種值進行有效預測。顯著性差異不明顯的分子標記無法應用到MAS中,但可以用于全基因組選擇對育種值進行估計,這點對由大量微效基因控制的數(shù)量性狀尤為重要[68]。對于植物育種來說,全基因組選擇具有革命性意義。因為,全基因組選擇可以減少表型鑒定的頻率,并且其選擇依賴于基因型而不是表型,因此選擇結果更加可靠。全基因組選擇育種的方法可以同時對多個性狀進行選擇,并顯著提高選擇的效率,同時全基因組選擇選用覆蓋整個基因組的分子標記,這樣可以將每個起作用基因的效應包括在內,增加了選擇的準確性。模擬研究[69]與實際研究[70]均發(fā)現(xiàn),在相同時間內,全基因組選擇比傳統(tǒng)的表型選擇擁有更大收益。VanRaden等首次在動物上進行全基因組選擇[70-71],隨后,全基因組選擇在其他動物上成功應用[72]。Daetwyler等闡述了如何利用全基因選擇分析人類遺傳病[73]。Bernardo等展示了全基因組選擇在植物中的應用前景[74-76]。
目前,相關研究表明,科研人員利用育種數(shù)據(jù)(個體基因型,中等密度到高等密度的標記)可以在不同環(huán)境下對植物的一些性狀(如籽粒產量、生物學產量、抗病性、開花習性)進行預測,預測的準確性依賴于性狀的遺傳力、群體大小、標記數(shù)目、參考群體與檢驗群體之間的關系以及基因與環(huán)境互作[77-81]。Ornella等利用5個抗稈銹病小麥品種(Juchi、Pavon76、Muu、Kingbird、K-Nyangumi)分別和中度感病品種(PBW343)雜交構建RIL群體,然后在不同環(huán)境下檢測群體對桿銹病的抗性,并利用1 400個DArT(diversity arrays technology)標記進行基因分型。利用1個群體對另1個群體進行預測的準確度相對較高,利用其他4個群體對另1個群體預測的準確性也較高。有趣的是,在群體結構存在的情況下,群體之間桿銹病預測的準確度依然很高,這說明性狀結構對預測結果起著重要作用。一些復雜性狀(如籽粒產量)預測結果不太理想。Windhausen等收集了255份多樣化的玉米系,通過6次試驗將其分成8個群體,在其他群體標記效應估計基礎之上分別對每個群體進行預測,預測能力幾乎為零,結果說明群體結構對預測結果的準確率起重要作用[82]。Zhang等利用30 000多個SNP標記對309份大豆材料進行種子質量的全基因組關聯(lián)分析,同時以該群體為模擬群體估算種子質量的育種值,并與分子標記輔助選擇作比較發(fā)現(xiàn),隨著SNP標記的數(shù)目和模擬群體大小的變化,GS和MAS的預測準確率分別是0.75~0.87和0.62~0.75[83]。表明GS擁有更加準確的預測值及更高的育種效率。Arruda等分別利用全基因組選擇和分子標記輔助選擇對273份軟紅冬麥進行赤霉病抗性的預測和選擇,MAS統(tǒng)計模型以研究最多的Fhb-1為基礎進行選擇,而全基因組選擇模型利用分布于整個基因組的19 992個SNPs進行預測選擇,分別利用普通最小二乘法和最佳無偏線性回歸預測進行標記效應值的估算,結果表明,基因組選擇預測精度在0.4~0.9之間,而MAS精度低于0.3,由此可知,在小麥赤霉病抗性育種中,GS為最優(yōu)選擇[84]。
全基因組選擇育種需要考慮以下幾點因素:(1)標記密度要有效地覆蓋整個基因組,使得每個基因區(qū)域至少有1個標記與之處于連鎖不平衡狀態(tài)。覆蓋整個基因組所需要的標記數(shù)取決于LD衰減程度[85]。(2)模擬群體數(shù)量要足夠大并具有代表性,包括了待預測群體的親本及與其親緣關系很近的材料,同時模擬群體要進行多代模擬,從而保證了全基因組選擇的高度準確性。(3)估計標記效應。模擬全基因組選擇模型統(tǒng)計方法的準確性取決于標記效應的強度。(4)性狀的遺傳力。全基因組選擇中遺傳力低的性狀需要大的模擬群體提高育種估計值的準確性,因為遺傳力的降低會導致育種值估計準確性降低[86]。
近年來,隨著擬南芥、水稻、玉米、芝麻等植物全基因組測序的完成,植物基因組學研究已經(jīng)由簡單的質量性狀轉向復雜的數(shù)量性狀,特別是大量豐富且廉價SNP標記的開發(fā)以及生物信息學的迅猛發(fā)展,利用全基因組選擇方法進行植物數(shù)量性狀改良成為遺傳學研究的熱點之一。Zhang等利用不同標記密度對不同環(huán)境中的19個熱帶玉米雙親群體的不同性狀進行全基因組選擇精度的對比,發(fā)現(xiàn)對于中高度遺傳力的簡單性狀,低標記密度(約200個標記)可以達到較高精度的全基因選擇,而對于復雜數(shù)量性狀,則需要高密度標記才可以達到較高精度的全基因組選擇預測;環(huán)境表型互作的全基因組預測模型精度高于非環(huán)境表型互作的全基因組預測模型[87]。Spindel等利用70 000多個標記對363個水稻自交系進行全基因組關聯(lián)分析,并進行基因組預測,發(fā)現(xiàn)株高和產量的預測精度在0.31~0.34之間,而開花期的預測精度高達0.63[88]。
MAS(marker assisted selection)建立在QTL的精細定位基礎之上,目前,仍有許多作物,尤其是自花授粉作物QTL定位精度不夠,導致分子標記難以用于實際的育種過程當中。某些已經(jīng)完成精細定位并成功用于實際育種當中的QTLs大部分都是主效QTL,而一些微效QTLs則很少被利用。復雜性狀受環(huán)境影響較大,在實際定位過程中往往會遺漏一些QTLs,并且即便通過MAS將目標QTLs滲入受體中,在環(huán)境影響下,目標QTLs的表達可能會受影響。隨著基因分型成本的快速降低和統(tǒng)計方法的快速發(fā)展,基因組標記密度越來越大,復雜性狀的基因分析和操控更有效,具有更多優(yōu)勢的全基因組選擇的育種方法應運而生,并快速應用于植物遺傳育種。相信隨著人們對植物基因組水平的認識不斷深入,標記密度不斷增加以及演算方法不斷完善,全基因組選擇將會成為作物遺傳育種的最有效方法。
參考文獻:
[1]Xu Y B,Lu Y L,Xie C X,et al. Whole-genome strategies for marker-assisted plant breeding[J]. Molecular Breeding,2012,29(4):833-854.
[2]Hill C B,Taylor J D,Edwards J,et al. Whole-genome mapping of agronomic and metabolic traits to identify novel quantitative trait loci in bread wheat grown in a water-limited environment[J]. Plant Physiology,2013,162(3):1266-1281.
[3]Tyrka M,Perovic D,Wardynska A,et al. A new diagnostic SSR marker for selection of theRym4/Rym5 locus in barley breeding[J]. Journal of Applied Genetics,2008,49(2):127-134.
[4]Cavanagh C R,Taylor J,Larroque O,et al. Sponge and dough bread making:genetic and phenotypic relationships with wheat quality traits[J]. Theoretical and Applied Genetics,2010,121(5):815-828.
[5]Tester M,Langridge P. Breeding technologies to increase crop production in a changing world[J]. Science,2010,327(5967):818-822.
[6]Khedikar Y P,Gowda M C,Sarvamangala C,et al. A QTL study on late leaf spot and rust revealed one major QTL for molecular breeding for rust resistance in groundnutArachishypogaeaL.[J]. Theoretical and Applied Genetics,2010,121(5):971-984.
[7]Tanksley S D,Nelson J C. Advanced backcross QTL analysis:a method for the simultaneous discovery and transfer of valuable QTLs from unadapted germplasm into elite breeding lines[J]. Theoretical and Applied Genetics,1996,92(2):191-203.
[8]Moncada M D P,Tovar E,Montoya J C,et al. A genetic linkage map of coffee (CoffeaarabicaL.) and QTL for yield,plant height,and bean size[J]. Tree Genetics & Genomes,2015,12(1):1-17.
[9]Lee S,F(xiàn)reewalt K R,Mchale L K,et al. A high-resolution genetic linkage map of soybean based on 357 recombinant inbred lines genotyped with BARCSoySNP6K[J]. Molecular Breeding,2015,35(2):58.
[10]Yu J M,Holland J B,Mcmullen M D,et al. Genetic design and statistical power of nested association mapping in maize[J]. Genetics,2008,178(1):539-551.
[11]Kump K L,Bradbury P J,Wisser R J,et al. Genome-wide association study of quantitative resistance to southern leaf blight in the maize nested association[J]. Nature Genetic,2011,43(2):163-168.
[12]Bergelson J,Roux F. Towards identifying genes underlying ecologically relevant traits inArabidopsisthaliana[J]. Nature Reviews Genetics,2010,11(12):867-879.
[13]Kover P X,Valdar W,Trakalo J,et al. A multiparent advanced generation inter-cross to fine-map quantitative traits inArabidopsisthaliana[J]. PLoS Genetics,2009,5(7):e1000551.
[14]Atwell S,Huang Y S,Vilhjalmsson B J,et al. Genome-wide association study of 107 phenotypes inArabidopsisthalianainbred lines[J]. Nature,2010,465(7298):627-631.
[15]Zhao K Y,Tung C W,Eizenga G C,et al. Genome-wide association mapping reveals a rich genetic architecture of complex traits inOryzasativa[J]. Nature Communications,2011,2(1):1-10.
[16]Morris G P,Ramu P,Deshpande S P,et al. Population genomic and genome-wide association studies of agroclimatic traits in sorghum[J]. Proceedings of the National Academy of Sciences of the United States of America,2013,110(2):453-458.
[17]于志遠,王偉威,魏崍,等. 利用關聯(lián)分析方法挖掘自然群體中大豆油分和蛋白質含量相關SSR標記[J]. 大豆科學,2015,34(6):977-981.
[18]Spindel J,Wright M,Chen C,et al. Bridging the genotyping gap:using genotyping by sequencing (GBS) to add high-density SNP markers and new value to traditional bi-parental mapping and breeding populations[J]. Theoretical and Applied Genetics,2013,126(11):2699-2716.
[19]Zhou X J,Xia Y L,Ren X P,et al. Construction of a SNP-based genetic linkage map in cultivated peanut based on large scale marker development using next-generation double-digest restriction-site-associated DNA sequencing(ddRADseq)[J]. BMC Genomics,2014,15(351):1-14.
[20]Liu L Z,Qu C M,Wittkop B,et al. A high-density SNP map for accurate mapping of seed fibre QTL inBrassicanapusL.[J]. PLoS One,2013,8(12):e83052.
[21]Kim S,Plagnol V,Hu T T,et al. Recombination and linkage disequilibrium inArabidopsisthaliana[J]. Nature Genetics,2007,39(9):1151-1155.
[22]Gore M A,Chia J M,Elshire R J,et al. A first-generation haplotype map of maize[J]. Science,2009,326(5956):1115-1117.
[23]Chia J M,Song C,Bradbury P J,et al. Maize HapMap2 identifies extant variation from a genome in flux[J]. Nature Genetics,2012,44(7):803-807.
[24]Huang X,Wei X,Sang T,et al. Genome-wide association studies of 14 agronomic traits in rice landraces[J]. Nature Genetics,2010,42(11):961-967.
[25]吳金華,張西平,胡言光,等. 小麥抗白粉病相關基因GST克隆與表達[J]. 西北植物學報,2013,33(1):34-38.
[26]劉新穎,王曉杰,薛杰,等. 小麥鈣調素新亞型TaCaM5的克隆及表達分析[J]. 作物學報,2010,36(6):953-960.
[27]王坤,王海燕,劉大群. 葉銹菌與“TcLr19”小麥互作體系中PR1基因的克隆及分析[J]. 河北農業(yè)大學學報,2012,35(2):1-6.
[28]Wang C R,Sheng C,Yu S B. Functional markers developed from multiple loci in GS3 for fine marker-assisted selection of grain length in rice[J]. Theoretical and Applied Genetics,2011,122(5):905-913.
[29]Fu D L,Uauy C,Assaf D,et al. A kinase-START gene confers temperature-dependent resistance to wheat stripe rust[J]. Science Express,2009,323(5919):1357-1360.
[30]寧麗華,陳亭亭,劉懷華,等. 高直鏈淀粉玉米amylose-extender基因功能標記的開發(fā)及應用[J]. 分子植物育種,2011,9(2):185-189.
[31]Lopez Y,Nadaf H L,Smith O D,et al. Isolation and characterization of the Δ12-fatty acid desaturase in peanut(ArachishypogaeaL.)and search for polymorphisms for the high oleate trait in Spanish marker-type lines[J]. Theoretical and Applied Genetics,2000,10(17):1131-1138.
[32]Chen Z,Wang M L,Barkley N A,et al. A simple allele-specific PCR assay for detectingFAD2 alleles in both A and B genomes of the cultivated peanut for high-oleate trait selection[J]. Plant Molecular Biology Reporter,2010,28(3):542-548.
[33]Jaccoud D,Peng K,F(xiàn)einstein D,et al. Diversity arrays:a solid state technology for sequence information independent genotyping[J]. Nucl Acids Res,2001,29(4):e25.
[34]Akbari M,Wenzl P,Caig V,et al. Diversity arrays technology(DArT)for high-throughput profiling of the hexaploid wheat genome[J]. Theoretical and Applied Genetics,2006,113(8):1409-1420.
[35]Mace E S,Xia L,Jordan D R,et al. DArT markers:diversity analyses and mapping in Sorghum bicolor[J]. BMC Genomics,2008,9(1):26.
[36]Mace E S,Rami J F,Bouchet S,et al. A consensus genetic map of sorghum that integrates multiple component maps and high-throughput Diversity Array Technology (DArT) markers[J]. BMC Plant Biology,2009,9(1):13.
[37]Wenzl P,Li H,Carling J,et al. A high-density consensus map of barley linking DArT markers to SSR and RFLP loci and agronomic traits[J]. BMC Genomics,2006,7(1):206-228.
[38]Wand N,F(xiàn)ang L C,Xin H P,et al. Construction of a high-density genetic map for grape using next generation restriction-site associated DNA sequencing[J]. BMC Plant Biology,2012,12(1):148.
[39]Xiao J Z,Xia Y L,Ren X P,et al. Construction of a SNP-based genetic linkage map in cultivated peanut based on large scale marker development using next-generation double-digest restriction-site-associated DNA sequencing(ddRADseq)[J]. BMC Genomics,2014,15(1):351.
[40]Erena A,Patrick F B,Scott D H,et al. Genome wide association mapping of yield and yield components of spring wheat under contrasting moisture regimes[J]. Theoretical and Applied Genetics,2014,127(4):791-807.
[41]Su Z Q,Jin S J,Lu Y E,et al. Single nucleotide polymorphism tightly linked to a major QTL on chromosome 7A for both kernel length and kernel weight in wheat[J]. Molecular Breeding,2016,36(2):15-25.
[42]Myles S,Peiffer J,Brown P J,et al. Association mapping:critical considerations shift from genotyping to experimental design[J]. Plant Cell,2009,21(8):2194-2202.
[43]Lu Y,Zhang S H,Shah T,et al. Joint linkage-linkage disequilibrium mapping is a powerful approach to detecting quantitative trait loci underlying drought toleranceinmaize[J]. Proceedings of the National Academy of Sciences of the United States of America,2010,107(45):19585-19590.
[44]Li X P,Zhou Z J,Ding J Q,et al. Combined linkage and association mapping reveals QTL and candidate genes for plant and ear height in maize[J]. Front Plant Sci,2016,7:833.
[45]Shamsudin N A,Swamy B P,Ratnam W,et al. Marker assisted pyramiding of drought yield QTLs into a popular Malaysian rice cultivar,MR219[J]. BMC Genetics,2016,17(1):30.
[46]Salameh A,Buerstmayr M,Steiner B,et al. Effects of introgression of two QTL for fusarium head blight resistance from Asian spring wheat by marker-assisted backcrossing into European winter wheat on fusarium head blight resistance,yield and quality traits[J]. Molecular Breeding,2011,28(4):485-494.
[47]Yang L Q,Wang W,Peng Y,et al. Marker-assisted selection for pyramiding the waxy and opaque-16 genes in maize using cross and backcross schemes[J]. Molecular Breeding,2013,31(4):767-775.
[48]Hao X M,Li X W,Yang X H,et al. Transferring a major QTL for oil content using marker-assisted backcrossing into an elite hybrid to increase the oil content in maize[J]. Molecular Breeding,2014,34(2):739-748.
[49]Peng J H,F(xiàn)ahima T,Roder M S,et al. Microsatellite high-density mapping of the stripe rust resistance gene YrH52 region on chromosome 1B and evaluation of its marker-assisted selection in the F-2 generation in wild emmer wheat[J]. New Phytologist,2000,146(1):141-154.
[50]李進波,王春連,夏明元,等. 分子標記輔助選擇Xa23基因培育雜交稻抗白葉枯病恢復系[J]. 作物學報,2006,32(10):1423-1429.
[51]Vida G,Gál M,Uhrin A,et al. Molecular markers for the identification of resistance genes and marker-assisted selection in breeding wheat for leaf rust resistance[J]. Euphytica,2009,170(1/2):67-76.
[52]董娜,張亞娟,張軍剛,等. 分子標記輔助小麥抗白粉病基因Pm21和Pm13聚合育種[J]. 麥類作物學報,2014,34(12):1639-1644.
[53]Singh A K,Singh V K,Singh A,et al. Introgression of multiple disease resistance into a maintainer of Basmati rice CMS line by marker assisted backcross breeding[J]. Euphytica,2015,203(1):97-107.
[54]Zhao X R,Tan G Q,Xing Y E,et al. Marker-assisted introgression ofqHSR1 to improve maize resistance to head smut[J]. Molecular Breeding,2012,30(2):1077-1088.
[55]朱映東,時亞瓊,周鋒利,等. 分子標記輔助選育香型巨胚水稻[J]. 上海師范大學學報(自然科學版),2013,42(6):623-628.
[56]Zhou P H,Tan Y F,He Y Q,et al. Simultaneous improvement for four quality traits of Zhenshan 97,an elite parent of hybrid rice,by molecular marker-assisted selection[J]. Theoretical and Applied Genetics,2003,106(2):326-331.
[57]Barloy D,Lemoine J,Abelard P,et al. Marker-assisted pyramiding of two cereal cyst nematode resistance genes from Aegilops variabilis in wheat[J]. Molecular Breeding,2007,20(1):31-40.
[58]Varshney R K,Manish K P,PasupuletiJanila,et al. Marker assisted introgression of a QTL region to improve rustresistance in three elite and popular varieties of peanut(ArachishypogaeaL.)[J]. Theoretical and Applied Genetics,2014,127(8):1771-1781.
[59]Chu Y,Wu C L,Holbrook C C,et al. Marker-assisted selection to pyramid nematode resistance and the high oleic trait in peanut[J]. The Plant Genome,2011,4(2):110-117.
[60]Edwards M,Johnson L. Proceedings of symposium on analysis of molecular marker data[M]. Corvallis:American Society of Horticultural Science and Crop Science Society of America,1994:33-40.
[61]Stam P. Proceedings of the 9th meeting of EUCARPIA section on biometrics in plant breeding (1994) centre for plant breeding and reproduction research[M]. Wageningen:the Netherland,1995:32-44.
[62]Peleman J D,vander V J. Breeding by design[J]. Trends in Plant Science,2003,8(7):330-334.
[63]van Berloo R,Stam P. Simultaneous marker-assisted selection for multiple traits in autogamous crops[J]. Theoretical and Applied Genetics,2001,102(6):1107-1112.
[64]Bernardo R. Molecular markers and selection for complex traits in plants:learning from the last 20 years[J]. Crop Science,2008,48(5):1649-1664.
[65]Meuwissen T H,Hayes B J,Goddard M E. Prediction of total genetic value using genome-wide dense marker maps[J]. Genetics,2001,157(4):1819-1829.
[66]吳永升,邵俊明,周瑞陽,等. 植物數(shù)量性狀全基因組選擇研究進展[J]. 西南農業(yè)學報,2012,25(4):1510-1514.
[67]Rutkoski J E,Heffner E L,Sorrells M E. Genomic selection for durable stem rust resistance in wheat[J]. Euphytica,2011,179(1):161-173.
[68]Wong C K,Bernardo R. Genomewide selection in oil palm:increasing selection gain per unit time and cost with small populations[J]. Theoretical and Applied Genetics,2008,116(6):815-824.
[69]Lorenzana R E,Bernardo R. Accuracy of genotypic value predictions for marker-based selection in biparental plant populations[J]. Theoretical and Applied Genetics,2009,120(1):151-161.
[70]VanRaden P M. Genomic measures of relationship and inbreeding[J]. Interbull Bulletin,2007,37:33-36.
[71]VanRaden P M,Van Tassell C P,Wiggans G R,et al. Invited review:reliability of genomic predictions for North American Holstein bulls[J]. Dairy Science,2008,92(1):16-24.
[72]Hayes B J,Bowman P J,Chamberlain A J,et al. Invited review:genomic selection in dairy cattle:progress and challenges[J]. Journal of Dairy Science,2009,92(2):433-443.
[73]Daetwyler H D,Villanueva B,Woolliams J A. Accuracy of predicting the genetic risk of disease using a genome-wide approach[J]. PLoS One,2008,3(10):e3395.
[74]Bernardo R,Yu Y. Prospects for genome-wide selection for quantitative traits in maize[J]. Crop Science,2007,47(3):1082-1090.
[75]Lorenzana R E,Bernardo R. Accuracy of genotypic value predictions for marker-based selection in biparental plant populations[J]. Theoretical and Applied Genetics,2009,120(1):151-161.
[76]Heffner E L,Jannink J L,Sorrells M. Genomic selection accuracy using multifamily prediction models in a wheat breeding program[J]. The Plant Genome,2011,4:65-75.
[77]de los Campos G,Naya H,Gianola D,et al. Predicting quantitative traits with regression models for dense molecular markers and pedigree[J]. Genetics,2009,182(1):375-385.
[78]Crossa J,de los Campos G,Perez P,et al. Prediction of genetic values of quantitative traits in plant breeding using pedigree and molecular markers[J]. Genetics,2010,186(2):713-724.
[79]Pérez P,de los Campos G,Crossa J,et al. Genomic-enabled prediction based on molecular markers and pedigree using the Bayesian Linear Regression Package in R[J]. The Plant Genome,2010,3(2):106-116.
[80]Pérez-Rpdríquez P,Gianola D,González-Camacho J M,et al. Comparison between linear and non-parametric regression models for genome-enabled prediction in wheat[J]. Genes Genomes Genet,2012,2(12):1595-1605.
[81]Ornella L,Sukhwinder-Singh S,Perez P,et al. Genomic prediction of genetic values for resistance to wheat rusts[J]. The Plant Genome,2012,5(3):136-148.
[82]Windhausen V S,Atlin G N,Crossa J,et al. Effectiveness of genomic prediction of maize hybrid performance in different breeding populations and environments[J]. Genes Genomes Genet,2012,2(11):1427-1436.
[83]Zhang J P,Song Q J,Cregan P B,et al. Genome-wide association study,genomic prediction and marker-assisted selection for seed weight in soybean (Glycinemax)[J]. Theoretical and Applied Genetics,2016,129(1):117-130.
[84]Arruda M P,Lipka A E,Brown P J,et al. Comparing genomic selection and marker-assisted selection for Fusarium head blight resistance in wheat(TriticumaestivumL.)[J]. Molecular Breeding,2016,36(7):84.
[85]Flint-Garcia S,Thornsberry J M,Buckler E S. Structure of linkage disequilibrium in plants[J]. Annual Review of Plant Biology,2003,54(4):357-374.
[86]Hayes B J,Bowman P J,Chamberlain A J,et al. Genomic selection in dairy cattle:progress and challenges[J]. Journal of Dairy Science,2009,92(2):433-443.
[87]Zhang X,Pérez-Rodríguez P,Semagn K,et al. Genomic prediction in biparental tropical maize populations in water-stressed and well-watered environments using low-density and GBS SNPs[J]. Heredity,2015,114(3):291-299.
[88]Spindel J,Begum H,Akdemir D,et al. Genomic selection and association mapping in rice (Oryzasativa):effect of trait genetic architecture,training population composition,marker number and statistical model on accuracy of rice genomic selection in elite,tropical rice breeding lines[J]. PLoS Genetics,2015,11(2):e1004982.