涂雨辰,田 云,盧向陽(yáng)
(1.湖南省農(nóng)業(yè)生物工程研究所,湖南 長(zhǎng)沙410128;2.湖南農(nóng)業(yè)大學(xué)生物科學(xué)技術(shù)學(xué)院,湖南 長(zhǎng)沙410128)
重要的農(nóng)藝性狀如產(chǎn)量、作物品質(zhì)以及植物抗病性是由多個(gè)基因控制的,均受連續(xù)變化且脆弱的環(huán)境影響。與單基因控制的性狀相比,其遺傳基礎(chǔ)更為復(fù)雜。Visscher等[1]指出,眾多科學(xué)和生物的發(fā)現(xiàn)已通過全基因組關(guān)聯(lián)分析(GWAS)所驗(yàn)證。GWAS是經(jīng)典的定量遺傳理論的拓展,對(duì)基因的研究具有重大意義。作為一個(gè)整體,定量特征是由許多具有同等作用的微效基因互相影響,通過建立遺傳模型和估計(jì)遺傳方差,選擇統(tǒng)計(jì)參數(shù)來進(jìn)行研究。許多經(jīng)典的定量遺傳模型都在育種實(shí)踐中發(fā)揮著重要作用,比如籽粒的淀粉[2]和維生素A原含量[3]、小麥的籽粒大小和研磨品質(zhì)[4]、擬南芥(Arabidopsis thaliana)的開花期[5]和抗病性[6]等。然而,在“Micro-effect gene”理論中,具體影響數(shù)量性狀的基因尚未發(fā)現(xiàn),分子生物學(xué)機(jī)制的定量特征變化也未能得出確切結(jié)論。近年隨著生物技術(shù)的發(fā)展,尤其是分子標(biāo)記技術(shù)的出現(xiàn)與發(fā)展,人們對(duì)量化特征的認(rèn)識(shí)從基因水平發(fā)展到數(shù)量性狀分析水平,充分說明理解遺傳機(jī)制的定量特征已經(jīng)上升到分子水平的高度。
此外,植物的數(shù)量性狀往往受到等位基因多樣性的影響,而傳統(tǒng)研究?jī)H能得到有限的基因組相關(guān)解析。GWAS克服傳統(tǒng)基因映射方法的一些局限性,通過提供更高的分辨率,在基因水平上利用樣本的數(shù)量關(guān)聯(lián)到表型變化的差異。由于高密度單核苷酸(SNP)多態(tài)性的出現(xiàn),進(jìn)行全基因組掃描時(shí),能識(shí)別很小范圍的與數(shù)量性狀變異顯著相關(guān)的單元型域。這些方法的出現(xiàn)使得研究性狀的可能性不斷增大。目前,GWAS已經(jīng)確定了許多與性狀相關(guān)的重要位點(diǎn),為生產(chǎn)實(shí)踐提供理論指導(dǎo)。
與日益普及的基因組多態(tài)性數(shù)據(jù)相比,GWAS正成為研究遺傳學(xué)定量特征的默認(rèn)方法。通過GWAS,已經(jīng)發(fā)現(xiàn)了數(shù)以百計(jì)的遺傳變異與人類疾病相關(guān)的復(fù)雜的特征,徹底改變了人類基因圖譜,并且現(xiàn)在也廣泛應(yīng)用于植物研究中。
GWAS的研究原理是:在基因水平上通過分子標(biāo)記的手段,對(duì)整個(gè)基因組內(nèi)的SNP進(jìn)行綜合分析與分型,再將不同表現(xiàn)的性狀變異統(tǒng)計(jì)出來,提出假設(shè),并且驗(yàn)證其與期望性狀間的關(guān)聯(lián)性。
GWAS的研究策略類似于傳統(tǒng)的候選基因法。在設(shè)計(jì)初始GWAS實(shí)驗(yàn)時(shí),一般分成兩個(gè)階段:首先對(duì)整個(gè)基因組SNP基因分型芯片和SNP多態(tài)性進(jìn)行統(tǒng)計(jì)分析,通常能夠篩選少量陽(yáng)性SNPs,然后在更多樣本中對(duì)這些陽(yáng)性SNPs進(jìn)行基因分型,最后整合兩個(gè)階段的結(jié)果進(jìn)行分析。GWAS兩階段研究策略減少了工作量和成本,通過重復(fù)實(shí)驗(yàn)也減小了誤測(cè)率;但是在第一階段,所有可能與疾病相關(guān)聯(lián)的SNP多態(tài)性的樣本量不足。為了尋找更多的易感基因位點(diǎn),目前常用的方法是擴(kuò)大GWAS的樣本量,即在同一時(shí)間適當(dāng)放寬第一階段的選擇標(biāo)準(zhǔn)并擴(kuò)大驗(yàn)證SNP多態(tài)性的范圍。
在過去的20年中,伴隨著基因組學(xué)以及分子標(biāo)記技術(shù)的飛速發(fā)展,作物遺傳育種方面的研究得到有效且深入的開展。在玉米研究方面,2011年《Nature Genetics》上發(fā)表了1篇關(guān)于GWAS研究玉米相關(guān)性狀的文章。文中通過GWAS得到一個(gè)玉米嵌套的關(guān)聯(lián)映射面板,確定了玉米重要葉片結(jié)構(gòu)的基礎(chǔ)架構(gòu)特征和一些關(guān)鍵基因,并證明了葉片性狀、基因結(jié)構(gòu)是受基因多效性及環(huán)境相互作用的影響。GWAS結(jié)果表明,突變體基因的變化導(dǎo)致更多的葉片向上生長(zhǎng)。玉米的多樣性對(duì)GWAS來說是個(gè)挑戰(zhàn),然而,在玉米Hap Map中160萬(wàn)個(gè)SNPs位點(diǎn)被鑒定、嵌套關(guān)聯(lián)繪圖(NAM)也有所發(fā)展之后,在玉米研究中有效開展GWAS不再是難題。玉米NAM嵌板是基于一個(gè)參考線,由25條不同的交叉線組成,然后產(chǎn)生5000個(gè)重組自交系(RILs)。作者運(yùn)用這種新型的玉米NAM設(shè)計(jì)并分析向上葉片角度的結(jié)構(gòu)、葉片長(zhǎng)度以及寬度,再運(yùn)用Joint stepwise regression鑒定出30~36個(gè)QTLs,解釋了74.8%~80.3%的表型變異,以及大于83%的遺傳方差。為了進(jìn)一步剖析這些QTLs,通過輸入160萬(wàn)個(gè) Hap Map SNPs位點(diǎn)進(jìn)行GWAS分析,發(fā)現(xiàn)27個(gè)NAM母系映射到RILs上。在160萬(wàn)個(gè)測(cè)試的SNPs中,作者探測(cè)到與葉片角度、長(zhǎng)度、寬度相關(guān)的SNP位點(diǎn)分別是203、287、295。在其它復(fù)雜的玉米性狀里也能觀察到類似的基因結(jié)構(gòu)[7,8],與動(dòng)物一樣[9],對(duì)自花授粉植物有更大的 影響[10-12]。這些結(jié)果表明復(fù)雜性狀的基因結(jié)構(gòu)在異形雜交和自交的物種中的進(jìn)化程度相同。
Lorenz等[13]研究發(fā)現(xiàn),大麥中單獨(dú)關(guān)聯(lián)到早熟性狀的位點(diǎn)對(duì)應(yīng)著33個(gè)染色體區(qū)域,并確定了15個(gè)與其它性狀相關(guān)的重要標(biāo)記和7個(gè)區(qū)域[14]。對(duì)于每一個(gè)性狀的分析,都需要經(jīng)過包括SSR、SNP和DArT在內(nèi)的760個(gè)標(biāo)記來確定。研究發(fā)現(xiàn),共有130個(gè)顯著特征關(guān)聯(lián)標(biāo)記以及8~22個(gè)重要位點(diǎn),這也代表了62個(gè)標(biāo)記存在于除染色體5d之外的所有染色體上。而觀察圖譜的位置,最明顯的候選基因(Ppd-1,Vrn-1,Vrn-2,Vrn-3,Vrn-4,Rht-1)也表現(xiàn)出顯著的相關(guān)性[15-18]。而在大豆中,關(guān)聯(lián)到重要性狀的重要位點(diǎn)分別為I、T、W1、R、O[19,20],這些位點(diǎn)的確定對(duì)植物生長(zhǎng)和作物生產(chǎn)實(shí)踐都起到重大的作用。
世界上約一半人口以大米為主食,但其產(chǎn)量常常受到大量病原微生物或昆蟲的嚴(yán)重威脅[21-23]。為了有效識(shí)別遺傳多樣性的種植水稻種質(zhì)資源,挖掘水稻高品質(zhì)性狀相關(guān)的基因、培養(yǎng)遺傳改良品種的水稻,對(duì)水稻實(shí)踐生產(chǎn)意義重大。
近年來開展的全基因組測(cè)序分析可通過基因組之間的差異挖掘出與水稻重要性狀相關(guān)的位點(diǎn)。研究者分別對(duì)517類不同的水稻種質(zhì)測(cè)序,鑒定出360萬(wàn)個(gè)SNP序列,構(gòu)成一個(gè)水稻基因高密度單體型圖。通過GWAS研究,解釋了水稻品種中36%的表型方差,將其分為以下5類農(nóng)藝性狀:形態(tài)特征(分蘗數(shù)、葉角度)、收益率(谷粒寬度、粒長(zhǎng)、千粒重和小穗數(shù))、糧食質(zhì)量(糊化溫度和直鏈淀粉含量)、著色(頂端顏色、果皮顏色和外殼顏色)和生理特性(抽穗期、抗旱能力和種子破碎的程度)。通過GWAS研究,確定了稻秈亞種的14個(gè)農(nóng)藝性狀。研究者將高通量基因組測(cè)序技術(shù)應(yīng)用于950份來自不同國(guó)家的水稻種質(zhì)材料中,通過基因分型鑒定基因的變異。該體系能高效、準(zhǔn)確地確定多個(gè)重要性狀的關(guān)聯(lián)位點(diǎn),分別鑒定出1個(gè)控制花期的位點(diǎn)和10個(gè)與糧食主產(chǎn)性狀相關(guān)的32個(gè)新位點(diǎn)[24]。
研究復(fù)雜性狀的遺傳基礎(chǔ),如開花時(shí)間、伸長(zhǎng)速度和產(chǎn)量,已經(jīng)成為改善作物和了解植物適應(yīng)性的重點(diǎn)。擬南芥分布廣泛,一直是研究植物自然變異和適應(yīng)性的極具價(jià)值的模式植物。通過全基因組基因分析,Aranzana等確定了擬南芥基因中控制自然變異、開花時(shí)間和病原體抵抗的相關(guān)位點(diǎn)。通過分析擬南芥的107種表型,GWAS搜尋到250 000個(gè)SNP位點(diǎn)[25]。通過GWAS來識(shí)別潛在的反應(yīng)變異,其中最為明顯的反應(yīng)為控制下胚軸的伸長(zhǎng)。結(jié)果表明,這些性狀的變異受基因座的影響,符合YUCCA5、YUCCA9和RGA1 3組基因的控制模式。YUCCA5和YUCCA9都參與生長(zhǎng)素生物合成,而RGA1是DELLA家族的成員。下胚軸表型包括在這項(xiàng)研究中,它們是高度的高R:FR條件(模擬太陽(yáng))、高度的低R:FR條件(模擬陰影)和2個(gè)不同指數(shù)響應(yīng)低R:FR條件。GWAS結(jié)果表明,這些性狀的變異由許多基因座的低到中度影響控制。
不同作物重要性狀的相關(guān)位點(diǎn)見表1。
表1不同作物重要性狀的相關(guān)位點(diǎn)Tab.1 The related loci of important traits for different species
GWAS為大量的基因組測(cè)序提供了一個(gè)很好的平臺(tái),由于其技術(shù)方法能擴(kuò)展到在生態(tài)環(huán)境中且能適應(yīng)遺傳變異的結(jié)構(gòu)化背景,與人類疾病GWAS相比,在植物研究中獲得了更大的成功[30]。為了能更高效地運(yùn)用GWAS技術(shù),首先,在選擇基因樣本時(shí),應(yīng)盡量選擇優(yōu)質(zhì)品種的優(yōu)良基因,以提高分析的精確度與有效性;其次,SNP位點(diǎn)對(duì)作物性狀的影響基于影響基因的表達(dá)程度,所以應(yīng)該提高對(duì)基因編碼區(qū)以及相關(guān)調(diào)控方式的認(rèn)識(shí),更確切地了解植物復(fù)雜性狀的成因;最后,GWAS能夠一次性對(duì)重要性狀進(jìn)行輪廓性概覽,適用于復(fù)雜性狀的研究。在全基因組層面上,開展多中心、大樣本、反復(fù)驗(yàn)證的基因與性狀的關(guān)聯(lián)研究,是全面揭示疾病發(fā)生、控制其發(fā)展的重要手段。
由于植物性狀與基因組之間的關(guān)系受多種因素的作用[31],GWAS也面臨著一些問題,如結(jié)果不能完全解釋某些復(fù)雜性狀等。但隨著功能標(biāo)記開發(fā)、反向遺傳學(xué)研究及生理學(xué)等學(xué)科的綜合推進(jìn),作為一種綜合性的分析方法,GWAS必將迎來更為廣闊的發(fā)展空間。在提高自動(dòng)化和高效率的同時(shí),通過降低成本、挖掘與植物重要經(jīng)濟(jì)性狀或生理性狀相關(guān)的位點(diǎn),GWAS必將在植物遺傳育種中發(fā)揮更大的作用。
[1]Visscher P M,Brown M A,McCarthy M I,et al.Five years of GWAS discovery[J].Am J Hum Genet,2012,90(1):7-24.
[2]Wen W,Mei H,F(xiàn)eng F,et al.Population structure and association mapping on chromosome 7using a diverse panel of Chinese germplasm office(Oryza sativa L.)[J].Theor Appl Genet,2009,119(3):459-470.
[3]Harjes C E,Rocheford T R,Bai L,et al.Natural genetic variation in Lycopene epsilon cyclase tapped for maize biofortification[J].Science,2008,319(5861):330-333.
[4]Breseghello F,Sorrells M E.Association mapping of kernel size and milling quality in wheat(Triticum aestivum L.)cultivars[J].Genetics,2006,172(2):1165-1177.
[5]Olsen K M,Halldorsdottir S S,Stinchcombe J R,et al.Linkage disequilibrium mapping of Arabidopsis CRY2flowering time alleles[J].Genetics,2004,167(3):1361-1369.
[6]Aranzana M J,Kim S,Zhao K,et al.Genome-wide association mapping in Arabidopsis identifies previously known flowering time and pathogen resistance genes[J].PLoS Genet,2005,1(5):e60.
[7]Buckler E S,Holland J B,Bradbury P J,et al.The genetic architecture of maize flowering time[J].Science,2009,325(5941):714-718.
[8]Laurie C C,Chasalow S D,LeDeaux J R,et al.The genetic architecture of response to long-term artificial selection for oil concentration in the maize kernel[J].Genetics,2004,168(4):2141-2155.
[9]Flint J,Mackay T F C.Genetic architecture of quantitative traits in mice,flies,and humans[J].Genome Res,2009,19(5):723-733.
[10]Koornneef M,Alonso-Blanco C,Vreugdenhil D.Naturally occurring genetic variation in Arabidopsis thaliana[J].Annu Rev Plant Biol,2004,55(4):141-172.
[11]Takahashi Y,Teshima K M,Yokoi S,et al.Variations in Hd1 proteins,Hd3apromoters,and Ehd1expression levels contribute to diversity of flowering time in cultivated rice[J].Proc Natl Acad Sci USA,2009,106(11):4555-4560.
[12]Turner A,Beales J,F(xiàn)aure S,et al.The pseudo-response regulator Ppd-H1provides adaptation to photoperiod in barley[J].Science,2005,315(5750):1031-1034.
[13]Lorenz A J,Hamblin M T,Jannink J L.Performance of single nucleotide polymorphisms versus haplotypes for genome-wide association analysis in barley[J].PLoS One,2010,5(11):e14079.
[14]Jin X L,Wei K,Zhang G P.A genome-wide association analysis of quantitative trait loci for protein fraction content in Tibetan wild barley[J].Biotechnology Letters,2012,34(1):159-165.
[15]Pasam R K,Sharma R,Malosetti M,et al.Genome-wide association studies for agronomical traits in a world wide spring barley collection[J].BMC Plant Biol,2012,12(1):16.
[16]Varshney R K,Paulo M J,Grando S,et al.Genome wide association analyses for drought tolerance related traits in barley(Hordeum vulgare L.)[J].Field Crops Research,2012,126(1):171-180.
[17]Wang H Y,Smith K P,Combs E,et al.Effect of population size and unbalanced data sets on QTL detection using genome-wide association mapping in barley breeding germplasm[J].Theoretical and Applied Genetics,2012,124(1):111-124.
[18]Wang M H,Jiang N,Jia T,et al.Genome-wide association mapping of agronomic and morphologic traits in highly structured populations of barley cultivars[J].Theoretical and Applied Genetics,2012,124(2):233-246.
[19]Yang K,Jeong N,Moon J K,et al.Genetic analysis of genes controlling natural variation of seed coat and flower colors in soybean[J].J Hered,2010,101(6):757-768.
[20]Palmer R G,Pfeiffer T W,Buss G R,et al.Qualitative Genetics in Soybeans:Improvement,Production,and Uses(3rd ed)[M].Madison(WI):ASA,CSSA,and SSSA,2004:137-214.
[21]Clark R M.Genome-wide association studies coming of age in rice[J].Nat Genet,2010.42(11):926-927.
[22]Inagaki Y S,Etherington G,Geisler K,et al.Investigation of the potential for triterpene synthesis in rice through genome mining and metabolic engineering[J].New Phytol,2011,191(2):432-448.
[23]Huang X H,Zhao Y,Wei X H,et al.Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm[J].Nat Genet,2012,44:32-39.
[24]Arite T,Umehara M,Ishikawa S,et al.d14,A strigolactone-insensitive mutant of rice,shows an accelerated outgrowth of tillers[J].Plant Cell Physiol,2009,50(8):1416-1424.
[25]Atwell S,Huang Y S,Vilhjálmsson B J,et al.Genome-wide association study of 107phenotypes in Arabidopsis thaliana inbred lines[J].Nature,2010,465(7298):627-631.
[26]Huang X H,Wei X H,Sang T,et al.Genome-wide association studies of 14agronomic traits in rice landraces[J].Nat Genet,2010,42(11):961-967.
[27]Li Q,Yang X,Xu S,et al.Genome-wide association studies identified three independent polymorphisms associated withα-tocopherol content in maize kernels[J].PLoS One,2012,7(5):e36807.
[28]Raman H,Stodart B,Ryan P R,et al.Genome-wide association analyses of common wheat(Triticum aestivumL.)germplasm identifies multiple loci for aluminum resistance[J].Genome,2010,53(11):957-966.
[29]Yu L X,Morgounov A,Wanyera R,et al.Identification of Ug99 stem rust resistance loci in winter wheat germplasm using genome-wide association analysis[J].Theor Appl Genet,2012,125(4):749-758.
[30]Hindorff L A,Sethupathy P,Junkins H A,et al.Potential etiologic and functional implications of genome-wide association loci for human diseases and traits[J].Proc Natl Acad Sci USA,2009,106(23):9362-9367.
[31]Ku C S,Loy E Y,Pawitan Y,et al.The pursuit of genome-wide association studies.Where are we now?[J].J Hum Genet,2010,55(4):195-206.