王竹林 劉曙東 奚亞軍
摘要 以分子標(biāo)記技術(shù)為基礎(chǔ)的作物數(shù)量性狀基因(QTL)的研究成為目前作物遺傳育種研究的熱點。QTL定位的基本原理是分析標(biāo)記基因型和數(shù)量性狀值之間的連鎖關(guān)系。進(jìn)行QTL定位通常需要適當(dāng)?shù)姆蛛x群體,群體的表型數(shù)據(jù),群體的基于分子標(biāo)記的基因型數(shù)據(jù),然后統(tǒng)計分析所有的標(biāo)記基因型和表型的關(guān)系,從而在全基因組上確定所有可能的數(shù)量性狀在染色體上的位置及效應(yīng)。QTL分析軟件winQTLCart2.0使用程序包括:數(shù)據(jù)準(zhǔn)備、軟件運行、基因(QTL)定位和分析、制圖。QTL定位分析的新方法關(guān)聯(lián)分析利用不同基因座等位變異(基因)間的連鎖不平衡關(guān)系,進(jìn)行標(biāo)記與性狀的相關(guān)性分析,以達(dá)到鑒定特定目標(biāo)性狀基因(或染色體區(qū)段)的目的,關(guān)聯(lián)分析大大提高了目標(biāo)性狀基因或者相關(guān)QTL的挖掘和定位。
關(guān)鍵詞 QTL;定位;winQTLCart2.0;關(guān)聯(lián)分析
中圖分類號 S188;Q-31 文獻(xiàn)標(biāo)識碼 A 文章編號 0517-6611(2014)31-10858-03
Program of winQTLCart2.0 and New Method of QTL Analysis—Correlation Analysis
WANG Zhulin, LIU Shudong, XI Yajun
(Agronomy College, Northwest A&F University, Yangling, Shaanxi 712100)
Abstract The research of crop quantitative trait locus(QTL) based on molecular markers become a hot topic in the study of genetic breeding of crops. The principle of QTL location is analysis of chain relation between marker genotypes and value of quantitative traits. QTL positioning usually needs appropriate separation populations, phenotypic data of group, and genotype data based on the molecular markers of group. As to confirm the position and effect of all possible QTL on chromosomes in the genome, statistical analysis of genotype and phenotype will be done. Software winQTLCart2.0 always be used in QTL analysis. The program includes data preparation and the software running, gene(QTL) positioning and analysis, drawing. Association analysis which is a new method of QTL location can be used to identification of QTL or chromosome segments of specific traits using correlation analysis based on different loci alleles (genes) linkage disequilibrium between the marker and the trait. Association analysis can greatly improve the mining and locate the target character gene or QTL.
Key words QTL; Positioning; winQTLCart2.0; Correlation analysis
作物的許多農(nóng)藝性狀如產(chǎn)量、品質(zhì)、抗逆性等都是數(shù)量性狀,由微效多基因控制,這些基因稱為數(shù)量性狀基因(Quantitative Trait Locus,QTL)。傳統(tǒng)的數(shù)量遺傳學(xué)把這些微效多基因作為一個整體,用統(tǒng)計學(xué)方法分析其總的遺傳效應(yīng),無法把微效多基因分解為一個個孟德爾因子[1]。分子標(biāo)記技術(shù)的出現(xiàn)和發(fā)展為高密度的遺傳連鎖圖譜的構(gòu)建提供了基礎(chǔ),成為作物各種農(nóng)藝性狀基因分析和定位的重要手段,以分子標(biāo)記為基礎(chǔ)的QTL研究是目前作物遺傳育種研究的熱點[2]。自PATERSON等[3]首次應(yīng)用RFLP連鎖圖在番茄中定位QTL之后,國際和國內(nèi)已有大量的關(guān)于QTL研究的報道。QTL研究在分子標(biāo)記、作圖群體和統(tǒng)計分析方法等方面都取得了極大的進(jìn)展。QTL 定位工作現(xiàn)已成為數(shù)量性狀遺傳研究的一種標(biāo)準(zhǔn)程序。QTL研究從一個生育階段的靜態(tài)定位發(fā)展到全生育期的動態(tài)定位,從常規(guī)可見的表型發(fā)展到生理指標(biāo)甚至基因的表達(dá)水平[1]。利用分子標(biāo)記進(jìn)行遺傳連鎖分析,可將QTL定位,并借助與QTL連鎖的分子標(biāo)記,提高作物育種中對數(shù)量性狀優(yōu)良基因型選擇的準(zhǔn)確性。更為重要的是越來越多的作物包括番茄、水稻、小麥等許多重要性狀QTL被分離克隆。筆者介紹QTL分析的原理、軟件和最新進(jìn)展。
1 QTL分析原理、方法和軟件
QTL定位的基本原理是分析整個染色體組的標(biāo)記基因型和數(shù)量性狀值之間的連鎖[4]。QTL定位工作的基本要素包括合適的分離群體,分子標(biāo)記連鎖圖以及合適的統(tǒng)計模型與分析方法。QTL定位的一般步驟包括:選擇具有目標(biāo)相對性狀的純系雜交獲得作圖群體;用大量分子標(biāo)記檢測分離群體,獲得分離群體中每一個體的標(biāo)記基因型;分析群體標(biāo)記基因型,構(gòu)建該群體的遺傳連鎖圖;檢測分離世代群體中每一個體的數(shù)量性狀值;在獲得了遺傳連鎖圖和分離世代群體中每一個體的數(shù)量性狀值之后,需要分析標(biāo)記基因型和數(shù)量性狀值的關(guān)系,確定QTL在染色體上的相對位置。QTL定位的分析方法有方差分析法、區(qū)間作圖法、復(fù)合區(qū)間作圖、基于最小二乘的復(fù)合區(qū)間作圖和基于混合線形模型的復(fù)合區(qū)間作圖等[2,4]。由于對大量數(shù)據(jù)進(jìn)行分析和處理的復(fù)雜性,所以必須借助計算機(jī)軟件才能完成。QTL分析常見軟件有QTLnetwork、PLABQTL、MAPMAKER /QTL1.1 、QGene 2.29、QTLMapper2.0和winQTLCart2.0等[1]。
2 QTL分析方法winQTLCart2.0使用程序
2.1 數(shù)據(jù)準(zhǔn)備
準(zhǔn)備6個文本數(shù)據(jù)文件:Chromosome label(連鎖群的名稱),mark number(每個連鎖群上的標(biāo)記的數(shù)目),Mark labels(標(biāo)記名稱),Mark positions(標(biāo)記之間的距離),Mark genetype(標(biāo)記基因型),Trait value(性狀值),標(biāo)記基因型從原來的橫排轉(zhuǎn)置成豎排,標(biāo)記順序按照染色體的順序。
2.2 運行軟件
winQTLCart2.0軟件運行時間較長,在運算時不可運行其他大型程序,否則可能引起死機(jī)。
打開winQTLCart2.0,點擊“new”,出現(xiàn)Step 1 of 2對話框,在里面填上相應(yīng)數(shù)據(jù),如該試驗連鎖群(Cromosome number)為“20”,性狀(Trait)為“1”,單株數(shù)(Individual number)為“218”,群體(Crossing type)為“SF2”。單株的標(biāo)記帶型記錄:“AA”記為“A”,表示該單株包含親本A的純合等位基因。“aa”記為“B”,表示該單株包含來自親本a的純合等位基因?!癆a”記為“H”,表示該單株是同時攜帶A和a 2個等位基因的雜合體?!癮_”記為“C” 表示該單株是A的等位基因的非純合體(要么是aa基因型,要么是Aa基因型)?!癆_”記為“D” 表示該單株是a的等位基因的非純合體(要么是AA基因型,要么是Aa基因型)。“—”表示某單株的數(shù)據(jù)在該位點缺失(圖1)。
3 QTL分析新方法—關(guān)聯(lián)分析
3.1 關(guān)聯(lián)分析在QTL分析中的應(yīng)用
關(guān)聯(lián)分析(Association analysis)又稱連鎖不平衡作圖(LD mapping)或關(guān)聯(lián)作圖(Association mapping),是利用不同基因座等位變異(基因)間的連鎖不平衡關(guān)系,進(jìn)行標(biāo)記與性狀的相關(guān)性分析,以達(dá)到鑒定特定目標(biāo)性狀基因(或染色體區(qū)段)的目的[5]。與傳統(tǒng)的連鎖分析相比,關(guān)聯(lián)分析具有如下優(yōu)勢:①作圖定位更精確。關(guān)聯(lián)分析利用的是自然群體在長期進(jìn)化中所積累的重組信息,具有較高的解析率,可實現(xiàn)數(shù)量性狀基因(位點)的精細(xì)定位,甚至直接定位到基因本身;②可同時考察一個基因座的多個等位基因。關(guān)聯(lián)分析可實現(xiàn)對其作圖群體(自然群體)一個基因座上所有等位基因的考察;③不需構(gòu)建作圖群體。關(guān)聯(lián)分析利用的群體是自然群體,不需再人工構(gòu)建,省時省力,并有較多的群體可供利用。④可發(fā)現(xiàn)較連鎖分析更多的QTL位點。鑒于關(guān)聯(lián)分析本身存在的優(yōu)勢,目前已廣泛應(yīng)用于多種作物不同生物特性的研究,如玉米籽粒油分的生物合成[6]、水稻的開花時間和籽粒產(chǎn)量[7]和小麥的籽粒大小和研磨品質(zhì)[8]等。MACCAFERRI等[9]利用225個分布于21條染色體上的SSR標(biāo)記對164個硬粒小麥品種的苗期和成株抗葉銹性進(jìn)行關(guān)聯(lián)分析,鑒定出3個具有較大效應(yīng)的QTL位點,分別位于7BL末端(Lr14附近)、2A和2B染色體上,其中位于7BL的末端的QTL位點為硬粒小麥中重要的抗病基因,15%的供試品種中都攜帶該抗病基因位點。張學(xué)勇等[10]發(fā)現(xiàn)關(guān)聯(lián)分析定位的QTL比以往作圖結(jié)果豐富,發(fā)現(xiàn)了Xgwn1491534BL和Xgwm130132 7AS與粒重顯著相關(guān)。CROSSA等[11]進(jìn)一步證明了關(guān)聯(lián)分析能有效地定位和挖掘小麥產(chǎn)量性狀基因,在實際育種和種質(zhì)資源研究中具有重要應(yīng)用價值。HAO等[12]對266個小麥微核心種質(zhì)抗赤霉病表型性狀和3B染色體3.1Mb區(qū)段42個標(biāo)記的關(guān)聯(lián)分析結(jié)果表明,cfb6059與小麥赤霉病Type II抗性顯著相關(guān),且與已廣泛應(yīng)用于抗赤霉病育種的選擇標(biāo)記umn10非常接近。可見關(guān)聯(lián)分析大大提高了目標(biāo)性狀基因或者相關(guān)QTL的挖掘和定位,是基因(QTL)定位分析的另一重要方法。
3.2 關(guān)聯(lián)分析程序
3.2.1 連鎖不平衡分析。
(1)基因型頻率統(tǒng)計分析:運用PLINK v1.07 軟件進(jìn)行一般的統(tǒng)計分析,包括等位基因頻率、標(biāo)記的雜合率、材料的雜合度等。
(2)連鎖不平衡(LD)分析:首先從所有標(biāo)記中篩選出單個標(biāo)記缺失率小于10%同時最小等位頻率大于10%的標(biāo)記,然后去除標(biāo)記間距小于50 Kb 的標(biāo)記,再隨機(jī)選擇幾千個標(biāo)記,進(jìn)一步進(jìn)行群體結(jié)構(gòu)分析。用選擇的幾千個標(biāo)記,運用Structure V2.3.3 軟件對500個左右品種或高代品系組成的關(guān)聯(lián)分析群體進(jìn)行遺傳結(jié)構(gòu)分析。根據(jù)關(guān)聯(lián)分析群體的遺傳組成,將與特定亞群的遺傳相似性比例大于60%的材料劃分到相應(yīng)亞群中,而將與任何亞群的遺傳相似性比例均小于60%的材料劃分到混合亞群中。
(3)鄰近LD窗口分析:用TASSEL進(jìn)行材料間遺傳距離計算,并運用Neighborjoining 算法進(jìn)行聚類圖構(gòu)建。用進(jìn)化樹查看軟件FigTree v1.3.1 進(jìn)行畫圖。
(4)單倍型分析:采用統(tǒng)計算法,以LD 為基礎(chǔ),如果2標(biāo)記存在―強(qiáng)LD,則將該標(biāo)記劃入一種單倍型。單倍型分析用軟件PLINK v1.07完成。
3.2.2 關(guān)聯(lián)作圖。首先將PLINK 生成的單倍型塊(Haplotype blocks)結(jié)果在Excel中生成可以輸入TASSEL 的多態(tài)性文件格式(如果單倍型中有任何標(biāo)記缺失,則將該單倍體基因型定為缺失),然后將單倍型數(shù)據(jù)導(dǎo)入TASSEL對500份左右品種或高代品系的表型數(shù)據(jù)和SNP數(shù)據(jù)進(jìn)行關(guān)聯(lián)作圖,找到與目標(biāo)基因(QTL)緊密連鎖的SNP標(biāo)記,并定位相關(guān)基因(QTL)。
4 結(jié)語
關(guān)聯(lián)分析較傳統(tǒng)QTL分析存在優(yōu)勢,它是建立在自然群體基礎(chǔ)之上,可以對一些骨干親本、大面積推廣品種進(jìn)行全基因組高密度掃描,找到這些重要品種的重要基因組區(qū)段,弄清骨干親本及推廣品種的基因組學(xué)基礎(chǔ),為分子育種奠定基礎(chǔ)。但關(guān)聯(lián)分析也有局限性,如結(jié)果受群體結(jié)構(gòu)的影響大,大量數(shù)據(jù)所導(dǎo)致的統(tǒng)計分析方法的不足以及對遺傳多樣性低的物種群體作圖效果差等。因此,在QTL分析時,應(yīng)將關(guān)聯(lián)分析與QTL連鎖分析相結(jié)合,相互補(bǔ)充,相互印證,取長補(bǔ)短,最終實現(xiàn)目標(biāo)性狀的精細(xì)作圖。
參考文獻(xiàn)
[1] 楊紹華.植物QTL研究進(jìn)展[J].中國農(nóng)學(xué)通報,2011,27(3):226-231.
[2] 薛永國,劉麗君,高明杰,等.作物中 QTL 的研究進(jìn)展及展望[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2007,38(4):542-547.
[3] PATERSON A H,LANDER E S,HEWITT J D,et al Resolution of quantitative traits into Mendelian factors,using a complete linkage map of restriction fragment length polymorphisms[J].Nature,1988,335:721-726.
[4] 章元明.作物QTL 定位方法研究進(jìn)展[J].科學(xué)通報,2006(19):2223-2231.
[5] FLINTGARCIA S A,THORNSBERRY J M,BUCKLER E S.Structure of linkage disequilibrium in plants[J].Annual Review of Plant Biology,2003,54:357-374.
[6] LI H,PENG Z,YANG X,et al.Genomewide association study dissects the genetic architecture of oil biosynthesis in maize kernels[J].Nature Genetics,2013,45:43-50.
[7] HUANG X,ZHAO Y,WEI X,et al.Genomewide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm[J].Nature Genetics,2012,44:32-39.
[8]
BRESEGHELLO F,SORRELLS M E.Association mapping of kernel size and milling quality in wheat (Triticum aestivum L.) cultivars[J].Genetics,2006,172:1165-1177.
[9] MACCAFERRI M,SANGUINETI M C,MANTOVANI P,et al.Association mapping of leaf rust response in durum wheat[J].Molecular Breeding,2010,26:189-228.
[10] 張學(xué)勇,童依平,游光霞,等.選擇牽連效應(yīng)分析:發(fā)掘重要基因的新思路[J].中國農(nóng)業(yè)科學(xué),2006,39(8):1526-1535.
[11] CROSSA J,BURGUENO J,DREISIGACKER S,et al.Association analysis of historical wheat germplasm using additive genetic covariance of relatives and population structure[J].Genetics,2007,177:1889-1913.
[12] HAO C Y,WANG Y Q,HOU J,et al.Association mapping and haplotype analysis of a 3.1Mb genomic region involved in Fusarium head blight resistance on wheat chromosome 3BS[J].PLOS ONE,2012,7(10):46444.