高 歌 楊 媛3, 鄭 軍 張紅偉,*
(1 吉林農(nóng)業(yè)大學(xué)農(nóng)學(xué)院, 吉林 長春 130118;2 中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所,北京 100081;3 中國農(nóng)業(yè)大學(xué)農(nóng)學(xué)院, 北京 100193)
株高是作物重要的株型性狀。玉米株高與玉米的產(chǎn)量和抗倒伏等性狀密切相關(guān),培育合適株高的玉米品種對于玉米的高產(chǎn)穩(wěn)產(chǎn)具有重要意義[1-2]。朱永興等[3]利用122份玉米雜交組合作為試驗材料,通過分析雜交種的重要農(nóng)藝性狀發(fā)現(xiàn),株高與產(chǎn)量的相關(guān)性最大。株高過高會增加作物倒伏的風(fēng)險,過低則影響生物量,降低光合產(chǎn)物的積累,最終導(dǎo)致產(chǎn)量降低,因此,適宜的株高有助于玉米高產(chǎn)[4-6]。
玉米株高是一個由多基因控制的數(shù)量性狀,遺傳機制復(fù)雜且易受環(huán)境影響[7]。研究影響玉米株高變異的遺傳基礎(chǔ),是精細定位株高數(shù)量性狀位點(quantitative trait locus, QTL)和挖掘候選基因的鋪墊工作?;陔p親群體的QTL定位是檢測作物遺傳變異的有效途徑[8-10]。隨著分子技術(shù)水平的提高及數(shù)量性狀定位方法的改進,研究者們已鑒定到大量控制株高的QTL和基因。例如,Zhou等[11]利用Ye478×Qi319(Y/H)群體鑒定到14個株高相關(guān)QTL,并篩選到1個可能調(diào)控株高的候選基因GRMZM2G325907。Du等[12]利用2個加倍單倍體(doubled haploid, DH)群體,基于高密度遺傳連鎖圖譜,鑒定到22個株高相關(guān)的QTL,其中qHT_YZ5a位于第5號染色體147.4~217.3 Mb區(qū)間,可解釋11.6%~15.3%的株高和穗位高變異。同樣,Li等[13]基于連鎖圖譜,在多個環(huán)境下共鑒定到21個控制株高和穗位高的QTL,并利用近等基因系(near isogenic lines, NIL)群體驗證了位于第1號染色體上的QTL。雖然前人對株高的遺傳機制研究已經(jīng)取得了一定進展,但是利用不同親本組配的分離群體檢測到的QTL位置不同,因此仍需構(gòu)建不同群體,對株高進行進一步解析。
全基因組關(guān)聯(lián)分析(genome-wide association study, GWAS)是基于連鎖不平衡的原理,在全基因組范圍內(nèi)檢測表型性狀和單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)標記之間關(guān)系的分析方法[14-15],該方法能以較高的分辨率和靈敏度識別出目標性狀關(guān)聯(lián)的候選基因[16-17]。近年來,GWAS已廣泛應(yīng)用于不同作物復(fù)雜性狀的遺傳機制研究。Liu等[18]對236個玉米不同自交系進行全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)73個與玉米粗縮病抗性相關(guān)的SNPs,并在連鎖不平衡(linkage disequilibrium, LD)區(qū)域內(nèi)鑒定出41個候選基因。Zhang等[19]通過GWAS在大豆中鑒定到11個與開花天數(shù)、成熟度和株高相關(guān)的候選基因。以上研究表明GWAS是實現(xiàn)對作物性狀進行QTL定位的有效方法。
利用生產(chǎn)中主流栽培種親本構(gòu)建的群體進行株高QTL定位,能夠反映出主流栽培種中株高的遺傳變異規(guī)律,具有重要的應(yīng)用價值。因此,本研究擬利用優(yōu)良雜交種光玉335的父本PH4CV,與雜交種鄭單958的母本鄭58共同構(gòu)建的481個BC1F3∶4家系為研究材料,結(jié)合兩年兩點4個環(huán)境下的株高表型和基因型,進行基于混合線性模型(mixed linear model, MLM)的GWAS分析,旨在篩選出玉米株高相關(guān)QTL位點,并對主效QTL進行驗證,為株高QTL的進一步精細定位奠定基礎(chǔ)。
本研究所用試驗材料是以先玉335的父本PH4CV自交系為輪回親本,與鄭單958的母本鄭58雜交獲得的F1代,后與輪回親本PH4CV進行回交,構(gòu)建BC1F1代回交群體,再經(jīng)過不斷自交,最終得到481個 BC1F3∶4家系[20]。
包含481份家系的BC1F3∶4群體于2016和2017年分別在北京及新疆進行種植,2年2點共計4個環(huán)境,分別以16BJ、16XJ、17BJ、17XJ命名,其中BJ表示北京、XJ表示新疆,16和17分別表示2016和2017年。在以上4個環(huán)境中,均設(shè)計2次重復(fù),并以完全隨機的方式,每個家系播種單行區(qū),單粒播種,行長5 m,每行21粒,株行距分別為25、60 cm。于散粉結(jié)束后人工測量玉米株高。
利用混合線性模型計算最佳線性無偏預(yù)測值(best linear unbiased estimation, BLUE)[20],用 Excel 2019對測得的株高表型數(shù)據(jù)進行整理和分析,得到群體株高的最大值、最小值、平均值、標準差、變異系數(shù)等基本統(tǒng)計量。
利用改良的十六烷基三甲基溴化銨(cetyltrimethylammonium bromide, CTAB)方法從481份BC1F3∶4群體材料中分離出高質(zhì)量的基因組DNA,通過NanoDrop2000超微量分光光度計(ThermoFisher,美國)對其濃度及純度進行檢測,再抽取部分樣品用1%瓊脂糖凝膠電泳進行鑒定,鑒定到的DNA濃度在20 ng·μL-1以上,純度指標OD280/OD260值為1.70~1.90,且電泳檢測到單一條帶,亮度較高無雜帶,即樣品符合基因型鑒定標準,送至北京博奧晶典生物技術(shù)有限公司利用基因芯片進行SNP基因分型[21]。由于基因型數(shù)據(jù)的準確性對后續(xù)的關(guān)聯(lián)分析有較大影響,通過一系列篩選過濾條件對SNP原始的分型結(jié)果進行嚴格質(zhì)控:去除在群體中缺失率大于5%的標記,保留檢出率大于97%的位點,去除在兩親本間無多態(tài)性差異的位點,去除最小等位基因頻率小于0.05的標記位點。最終獲得11 781個在基因組上均勻分布的高質(zhì)量SNP標記及對應(yīng)群體材料的基因型數(shù)據(jù)[20]。
在R語言中利用lme4包計算群體的BLUE值,結(jié)合基因芯片鑒定得到的基因型數(shù)據(jù),利用R語言中的sommer_3.5包進行基于混合線性模型[22]的GWAS分析,以錯誤發(fā)現(xiàn)率(false discovery rate, FDR)為0.05時的P值確定閾值來鑒定顯著相關(guān)的SNP標記。最后用R語言qqman軟件包繪制曼哈頓圖(Manhattan plot)和Q-Q圖(Q-Q plot)。
依據(jù)線性回歸模型,對關(guān)聯(lián)分析篩選到的顯著SNP標記進行表型變異率(phenotype variance explained, PVE)計算,保留PVE在1%以上的標記。先計算每個顯著標記的平方和,依次相加得到標記總體的平方和,單個標記的平方和除以標記的總平方和即獲得每個顯著標記的PVE[20]。假定1表示輪回親本PH4CV的基因型,0表示雜合的基因型,-1表示供體親本鄭58的基因型,標記的加性效應(yīng)值為基因型為1的家系株高表型平均值與基因型為-1的家系表型平均值間差值的一半。
以PH4CV為輪回親本構(gòu)建得到BC1F1群體,經(jīng)不斷自交獲得具有大量分離表型的BC1F5:6家系群體。在效應(yīng)最大的標記上下游5 Mb處各設(shè)計1對在親本間具有多態(tài)性的Indel標記,經(jīng)聚丙烯酰胺凝膠電泳對兩親本和BC1F5:6的1個家系群體進行基因型鑒定。用Excel 2019對群體基因型結(jié)果進行篩選,對照親本帶型,分別獲得此群體中每個Indel標記處兩親本基因型個體,結(jié)合測得的群體株高表型,計算對應(yīng)的株高平均值,基于雙樣本等方差t檢驗分析不同基因型之間的株高表型差異。
對2016和2017年北京及新疆4個環(huán)境的株高數(shù)據(jù)進行基本的描述統(tǒng)計分析,結(jié)果見表1。株高變化范圍在154.94~271.63 cm之間,其中17XJ(2017年,新疆)的平均株高明顯高于其他3個環(huán)境下的平均株高,為222.78 cm;16XJ(2016年,新疆)的變異系數(shù)最大,為14.27%。進一步對株高進行方差分析發(fā)現(xiàn),基因型之間存在極顯著差異(表2),表明基因型之間的差異可能與遺傳因素有關(guān)。玉米株高在不同環(huán)境中均符合數(shù)量性狀分布特點,不同環(huán)境間均呈顯著線性相關(guān),相關(guān)性系數(shù)在0.55~0.83范圍內(nèi)(圖1),其中2017年北京和新疆2個環(huán)境存在最強的顯著相關(guān)性,表明該群體在不同環(huán)境下的株高有共同的遺傳基礎(chǔ),同時環(huán)境條件的改變也會對玉米株高產(chǎn)生一定程度的影響。
本研究對基因型進行過濾篩選后,得到11 781個高質(zhì)量的多態(tài)性SNPs?;诨旌暇€性模型,利用BLUE值和SNP基因型數(shù)據(jù)進行關(guān)聯(lián)分析,以FDR等于0.05時的P值確定閾值(圖2)。從曼哈頓圖和 Q-Q 圖可以看出,利用16BJ、16XJ、17BJ環(huán)境下的株高進行GWAS分析,未找到顯著性的SNP位點;利用17XJ環(huán)境的株高進行GWAS分析,在第2號染色體上發(fā)現(xiàn)9個顯著關(guān)聯(lián)的SNPs。利用整合4個環(huán)境株高得到的BLUE值進行GWAS分析,發(fā)現(xiàn)10個顯著關(guān)聯(lián)的SNPs,其中9個SNPs位于第2號染色體上,1個SNP位于第5號染色體上。-log10(P)值最大的SNP位點位于第2號染色體的長臂末端,物理位置為194 690 794 bp(玉米B73參考基因組V3版本),表明該位點附近可能存在一個與株高有關(guān)的基因。
表1 BC1F3:4群體在4個環(huán)境下株高表型描述性統(tǒng)計Table 1 Descriptive statistics of plant height phenotypes in BC1F3:4 population in four environments
表2 株高的雙因素方差分析Table 2 Two-factor variance analysis of plant height
圖1 4個環(huán)境下株高的分布和相關(guān)性分析Fig.1 Distribution and correlation analysis of plant height in four environments
注:A:16BJ株高曼哈頓圖和Q-Q圖;B:16XJ株高曼哈頓圖和Q-Q圖;C:17BJ株高曼哈頓圖和Q-Q圖;D:17XJ株高曼哈頓圖和Q-Q圖;E:4個環(huán)境整合后的曼哈頓圖和Q-Q圖。Note: A: Manhattan plot and Q-Q plot of plant height in 16BJ. B: Manhattan plot and Q-Q plot of plant height in 16XJ. C: Manhattan plot and Q-Q plot of plant height in 17BJ. D: Manhattan plot and Q-Q plot of plant height in 17XJ. E: Manhattan plot and Q-Q plot of plant height after 4 environment integration.圖2 株高性狀的關(guān)聯(lián)分析Fig.2 GWAS analysis of plant height
為了進一步揭示SNP位點的效應(yīng),利用-log10(P)值在顯著性閾值4.34以上的SNPs和群體的BLUE值進行線性回歸分析,發(fā)現(xiàn)表型貢獻率在1%以上的顯著標記共計2個(圖3),分別解釋了16%、1%的表型變異,位于第2號染色體的Chr2_194690794標記的表型貢獻率明顯高于第5號染色體的Chr5_214144001標記。通過對這2個標記的加性效應(yīng)值計算,發(fā)現(xiàn)Chr2_194690794標記具有4.23的正效應(yīng),Chr5_214144001的效應(yīng)值為2.66,PH4CV基因型起正向貢獻。
依據(jù)全基因組關(guān)聯(lián)分析結(jié)果,于關(guān)聯(lián)最顯著的位點Chr2_194690794兩側(cè)5 Mb范圍內(nèi)各設(shè)計了1對Indel標記(表3),對兩親本和 BC1F5∶6家系群體進行基因型鑒定,篩選出兩親本基因型個體并計算相應(yīng)株高表型平均值,通過雙樣本等方差t檢驗比較各標記雙親基因型間株高的差異(圖4),發(fā)現(xiàn)兩標記處親本基因型間株高均在P<0.05水平上存在差異,進一步證實了第2號染色體上存在一個控制玉米株高的QTL。
表3 BC1F5:6群體基因型鑒定Indel標記引物信息Table 3 Indel marker primer information for BC1F5:6 population genotyping
注:柱子上的數(shù)據(jù)為加性效應(yīng)值。Note: The data on top of each column is additive effect.圖3 顯著性SNP標記表型變異率Fig.3 Phenotypic variation explained by significant SNP markers
注:*表示在P<0.05水平上差異顯著。Note: * indicates significant difference at 0.05 level.圖4 BC1F5:6群體顯著標記處差異顯著性分析Fig.4 Significance analysis of BC1F5:6 population at significant markers
近年來隨著對玉米株型性狀改良的不斷深入研究,研究學(xué)者們通過不同研究策略在玉米全基因組的不同染色體上已經(jīng)鑒定到大量株高QTL[11-13]。本研究以PH4CV和鄭58為雙親構(gòu)建得到包含481個家系的BC1F3∶4群體,利用11 781個高質(zhì)量SNP標記,通過多年多點的表型及基因型鑒定,進行基于混合線性模型的關(guān)聯(lián)分析發(fā)現(xiàn)位于第2號染色體長臂末端的Chr2_194690794標記處存在一個與株高顯著關(guān)聯(lián)的位點,該位點所在區(qū)域與前人研究鑒定到的株高QTL位置相近。如尤詩婷等[23]使用自交系B73分別與矮桿自交系K22和TY22構(gòu)建BC2F5群體,基于高密度SNP圖譜挖掘株高相關(guān)QTL,最終在2個群體中共鑒定到6個QTL,其中2號染色體上的qPH2-2在兩群體及兩個環(huán)境下均可檢測到,該位點的表型貢獻率達29.55%。于永濤等[24]在其附近也定位到株高相關(guān)QTL。李浩川等[25]以鄭單958及農(nóng)大高誘5號為親本構(gòu)建的DH系群體為試驗材料,利用復(fù)合區(qū)間作圖法在兩個地點均檢測到位于2號染色體主效QTL,且表型貢獻率均達到15%以上。這些結(jié)果進一步證明在玉米第2號染色體長臂上存在一個株高主效QTL,同時表明玉米株高可由多個主效基因和微效基因共同控制,印證了株高性狀的遺傳結(jié)構(gòu)復(fù)雜性。
在玉米生產(chǎn)及育種研究中,隨著分子標記的廣泛應(yīng)用,研究者們已利用骨干親本構(gòu)建群體解析了產(chǎn)量及其他重要性狀的遺傳基礎(chǔ)[26]。如前人利用骨干自交系“黃早四”構(gòu)建的重組自交系(recombinant inbred line,RIL)群體,對玉米的株高、穗位高等株型性狀[27]及產(chǎn)量[28]進行了遺傳結(jié)構(gòu)分析,并發(fā)掘了相關(guān)QTL。但是不同歷史時期的主流栽培品種不同,利用育種中已經(jīng)淘汰的材料進行QTL定位,檢測到的QTL并不能反映主流栽培品種中性狀的遺傳變異基礎(chǔ)。本研究所使用的兩個優(yōu)良自交系親本PH4CV和鄭58分別為先玉335和鄭單958[29]的親本。這2個品種屬于目前我國廣泛種植的主要玉米雜交種,并且在玉米遺傳育種中廣泛應(yīng)用。我國目前有許多玉米品種含有這2個雜交種親本的血緣(maizedata.cn)。利用這2個品種的親本進行株高等性狀的QTL定位更能反映目前主要玉米雜交種的遺傳變異情況。因此本研究中的所定位的QTL對于株高的遺傳改良具有一定的參考價值。
本研究通過全基因組關(guān)聯(lián)分析,于第2號染色體上檢測到顯著關(guān)聯(lián)的SNP標記,其中-log10(P)值最大的SNP標記為2號染色體的Chr2_194690794。經(jīng)過進一步表型變異率及效應(yīng)值分析,發(fā)現(xiàn)Chr2_194690794,解釋了16%的表型變異,效應(yīng)值為4.23厘米,且是來源于PH4CV的正效應(yīng)。對顯著位點進行基因型驗證的結(jié)果表明,Chr2_194690794兩側(cè)標記處親本基因型間玉米株高均存在差異,進一步證明了此位點與玉米株高高度相關(guān)。