張 楠,彭義峰,李亞青,張士昌,李孟軍,何明琦
(石家莊市農(nóng)林科學(xué)研究院,河北省小麥工程技術(shù)研究中心,河北石家莊 050041)
隨著人民生活水平的不斷提高,市場(chǎng)對(duì)優(yōu)質(zhì)小麥的需求量不斷增長(zhǎng)。當(dāng)前,優(yōu)質(zhì)小麥生產(chǎn)面臨著大面積推廣應(yīng)用品種少、品種抗逆性不佳、品質(zhì)不穩(wěn)定等問(wèn)題。在優(yōu)質(zhì)小麥育種實(shí)踐中,可選用的育種親本數(shù)目有限,僅師欒02-1、藁優(yōu)2018、濟(jì)南17、新麥26、西農(nóng)979等優(yōu)質(zhì)強(qiáng)筋小麥可作為育種的親本。利用分子標(biāo)記(如SSR、SNP芯片)分析優(yōu)質(zhì)小麥品種的親緣關(guān)系和遺傳相似度,對(duì)優(yōu)質(zhì)小麥種質(zhì)創(chuàng)新和育種具有重要意義,但目前有關(guān)優(yōu)質(zhì)小麥遺傳多樣性的研究報(bào)道較少。利用SNP芯片對(duì)中國(guó)主要優(yōu)質(zhì)小麥品種的遺傳多樣性進(jìn)行系統(tǒng)研究尚未見(jiàn)報(bào)道。
小麥基因組測(cè)序工作的不斷深入,極大促進(jìn)了SNP標(biāo)記的研究與開發(fā)。SNP芯片具有標(biāo)記數(shù)量多、通量高等優(yōu)點(diǎn)。目前,已開發(fā)的小麥SNP芯片主要有9K iSelect、90K iSelect、820K Axiom array、35K Axiom array、50K TraitBreed、15K、660K Axiom array、55K等。研究表明,小麥SNP芯片是研究小麥遺傳多樣性、群體結(jié)構(gòu)和QTL定位的有效技術(shù)手段。與小麥其他SNP芯片比較,55K SNP芯片的標(biāo)記有效性更高,已用于QTL定位、農(nóng)藝性狀關(guān)聯(lián)分析、遺傳多樣性分析等研究。本研究選取中國(guó)主要優(yōu)質(zhì)小麥品種,利用55K SNP芯片揭示其遺傳多樣性和親緣關(guān)系,以期為優(yōu)質(zhì)小麥育種親本選配、種質(zhì)資源創(chuàng)制和分子標(biāo)記輔助選擇提供參考依據(jù)。
45個(gè)優(yōu)質(zhì)小麥品種來(lái)自國(guó)家產(chǎn)業(yè)體系歷年種質(zhì)資源征集品種;5個(gè)優(yōu)質(zhì)高代品系(品鑒01、品鑒02、品鑒03、品鑒04和品鑒05)由石家莊市農(nóng)林科學(xué)研究院小麥研究所提供。所有材料現(xiàn)保存于石家莊市農(nóng)林科學(xué)研究院分子育種實(shí)驗(yàn)室,品種(系)的具體信息見(jiàn)表1。
表1 供試小麥品種(系)的來(lái)源及其雜合率Table 1 Origin and heterozygote rate of wheat cultivars(lines)used in the study
(續(xù)表1 Continued table 1)
用于SNP芯片分析的50個(gè)小麥品種(品系)為經(jīng)過(guò)連續(xù)2代田間選擇的單株。試驗(yàn)材料在植物生長(zhǎng)室中培養(yǎng),待長(zhǎng)至二葉一心時(shí),取小麥葉片,用CTAB法提取基因組DNA。
對(duì)Dish QC(DQC)>0.82和標(biāo)記檢出率(CR)>95% 的樣品進(jìn)行SNP位點(diǎn)質(zhì)控。以缺失率(MISS)<0.1和最小等位基因頻率(MAF)>0.05為標(biāo)準(zhǔn)對(duì)SNP標(biāo)記進(jìn)行過(guò)濾。以雜合標(biāo)記數(shù)除以總標(biāo)記數(shù)計(jì)算品種的雜合率。以基因型一致的標(biāo)記數(shù)除以成功分型的標(biāo)記數(shù)計(jì)算品種的遺傳相似度。使用Structure軟件進(jìn)行群體結(jié)構(gòu)分析。使用TreeBest軟件的NJ-tree模型構(gòu)建進(jìn)化樹。
染色體低多態(tài)性區(qū)段是指SNP多態(tài)性低的染色體區(qū)段,由MAF值較低的一段SNP位點(diǎn)組成。55K SNP芯片共有53 007個(gè)探針位點(diǎn),通過(guò)對(duì)DQC>0.82 和CR>95%的樣本進(jìn)行SNP位點(diǎn)質(zhì)控,共獲得36 691個(gè)有效標(biāo)記,去除無(wú)染色體和物理位置的標(biāo)記,最終獲得33 876個(gè)有效標(biāo)記,可用于染色體低多態(tài)性區(qū)段分析。其中,多態(tài)性標(biāo)記有33 202個(gè),占有效標(biāo)記數(shù)的98.01%。B基因組多態(tài)性位點(diǎn)最多,為13 207個(gè),占比 39.78%,其中4B染色體最多;A基因組上多態(tài)性位點(diǎn)有12 873個(gè),占比38.77%,其中5A染色體上最多;D基因組上多態(tài)性位點(diǎn)最少,為7 122個(gè),占比21.45%,4D和5D染色體上分別僅有648和674個(gè)。多態(tài)性SNP位點(diǎn)在部分同源群上的分布頻率大小依次為7號(hào)染色體>4號(hào)染色體>3號(hào)染色體>2號(hào)染色體>5號(hào)染色體>1號(hào)染色體>6號(hào)染色體。
在33 876個(gè)有效標(biāo)記中,MAF在0.00~ 0.20之間的SNP標(biāo)記占比31.45%(圖1A),因此,進(jìn)一步分析閾值為0.10和0.05兩種情況(圖1B和1C)。低多態(tài)性區(qū)段在優(yōu)質(zhì)小麥品種(系)染色體上的分布表明,A基因組和D基因組染色體上的低多態(tài)性區(qū)段均多于B基因組。6A、4D和6D染色體上的低多態(tài)性區(qū)段多于其他染色體 (圖1)。
雜合率反映優(yōu)質(zhì)小麥品種(系)在基因組水平上的雜合程度。一般而言,自交代數(shù)越高的材料,其雜合率越低。利用55K SNP芯片對(duì)50個(gè)小麥品種(系)進(jìn)行分析,結(jié)果(表1)發(fā)現(xiàn),在45個(gè)優(yōu)質(zhì)小麥品種中,除藁優(yōu)2018的雜合率為7.154%外,其余44個(gè)優(yōu)質(zhì)小麥品種的雜合率變化范圍為0.496%~1.457%,平均值為0.849%,表明這些優(yōu)質(zhì)小麥品種的純合程度整體較高。5個(gè)優(yōu)質(zhì)高代品系中,品鑒2為F代株系,雜合率高達(dá) 8.399%,但其群體農(nóng)藝性狀表現(xiàn)一致。
遺傳相似度分析能夠?yàn)閮?yōu)質(zhì)小麥親本組配(相似度低的材料)和群體改良(相似度高的材料)提供數(shù)據(jù)支撐。45個(gè)優(yōu)質(zhì)小麥品種間的遺傳相似度系數(shù)(genetic similarity,GS)變化范圍為 0.488~0.928,平均值為0.603;有1 944個(gè)GS變化范圍為0.500~0.800,占98.18%,其中 0.500~0.600、0.600~0.700和0.700~0.800分別占54.34%、38.18%和5.66%。GS小于 0.500的有20個(gè)(1.01%),大于0.800的有16個(gè)(0.81%)。因此,中國(guó)優(yōu)質(zhì)小麥品種間具有相對(duì)較低的遺傳多樣性。
河北省15個(gè)優(yōu)質(zhì)小麥品種間的GS變化范圍為0.467~0.928,平均值為0.618;山東省8個(gè)優(yōu)質(zhì)品種間的GS變化范圍為0.557~0.740,平均值為0.638;河南省9個(gè)優(yōu)質(zhì)品種間的GS變化范圍為0.564~0.736,平均值為0.630??梢钥闯?,河北省優(yōu)質(zhì)小麥品種間的GS低于山東省和河南省。系譜分析顯示,這種現(xiàn)象與河北省優(yōu)質(zhì)小麥的育種親本較為廣泛有關(guān)。
品種間GS低于0.500的優(yōu)質(zhì)小麥品種為:(1)師欒02-1和藁優(yōu)2018;(2)藁優(yōu)2018和藁優(yōu)5818;(3)高優(yōu)503和龍麥40;(4)藁優(yōu)8901和西農(nóng)889;(5)藁優(yōu)8901和藁優(yōu)2018;(6)白硬冬和龍麥40;(7)邯優(yōu)3475和鎮(zhèn)麥168;(8)泛麥8號(hào)和藁優(yōu)8901;(9)藁優(yōu)2018和科農(nóng)2009;(10)冀麥738和運(yùn)旱618,這些優(yōu)質(zhì)小麥品種分別來(lái)自河北、河南、黑龍江、江蘇、陜西和山西,親緣關(guān)系較遠(yuǎn)。品種間GS高于0.800的優(yōu)質(zhì)小麥品種為:(1)西農(nóng)20和存麥5號(hào);(2)石4366和石優(yōu)17;(3)石優(yōu)20和濟(jì)南17;(4)中麥578和濟(jì)麥44;(5)西農(nóng)979、西農(nóng)9718、藁優(yōu)5218和藁優(yōu)5818;(6)龍麥26和龍麥40;(7)藁優(yōu)5766和藁優(yōu)5218。其中龍麥26和龍麥40、藁優(yōu)5766和藁優(yōu)5218的GS均高于0.900。這些品種屬于近似品種,在優(yōu)質(zhì)小麥種質(zhì)創(chuàng)新和育種中應(yīng)予以注意。
a、b和c分別表示染色體上0.00≤MAF≤0.20、0.00≤MAF≤0.10和0.00≤MAF≤0.05的低多態(tài)性區(qū)段。藍(lán)色表示小于等于MAF閾值的多態(tài)性區(qū)段,紅色表示大于閾值的多態(tài)性區(qū)段。a,b and c indicate low-diversity chromosomal regions with 0.00≤MAF≤0.20,0.00≤MAF≤0.10 and 0.00≤MAF≤0.05,respectively.Red indicates the MAFs of chromosomal regions are higher than threshold value,and blue indicates the other regions.圖1 低多態(tài)性區(qū)段在優(yōu)質(zhì)小麥品種(系)染色體上的分布Fig.1 Distribution of low-diversity regions on high-quality wheat chromosomes
群體結(jié)構(gòu)分析是按照一定標(biāo)準(zhǔn)將一個(gè)群體分為若干亞群,處于同一亞群內(nèi)的個(gè)體親緣關(guān)系較高。群體結(jié)構(gòu)分析可了解自然群體的遺傳多樣性和遺傳分化情況。在群體結(jié)構(gòu)分析中,最低的交叉驗(yàn)證誤差(cross-validation error,CV error)對(duì)應(yīng)的值(群數(shù))是最理想的選擇。在50個(gè)小麥品種(系)中,=2 時(shí),CV errors最低(1.15),因此,選擇=2進(jìn)行進(jìn)一步分析。當(dāng)=2時(shí),有12個(gè)優(yōu)質(zhì)小麥品種(系)血統(tǒng)混雜,在不同的群結(jié)構(gòu)分析中可能發(fā)生變化,但不影響整體分群評(píng)估(圖2A)。
使用TreeBest軟件的NJ-tree模型將50個(gè)小麥品種(系)分為2個(gè)類群,這與群體結(jié)構(gòu)分析結(jié)果一致。其中,類群1包含6個(gè)亞群(亞群Ⅰ~Ⅵ),有39個(gè)品種(系);類群2僅包含亞群Ⅶ,有11個(gè)品種(系)。類群1中,亞群I包含6個(gè)品種(系),其中品鑒01與中麥578親緣關(guān)系較近,聚類在一個(gè)分支上。亞群Ⅱ包含5個(gè)品種,其中,石優(yōu)17是石4366的父本,聚類在一個(gè)分支上。亞群Ⅲ包含3個(gè)品種,濟(jì)南17是石優(yōu)20和新麥26的父本。亞群Ⅳ包含6個(gè)品種(系),其中,鄭麥7698是品鑒03、品鑒04和品鑒05的父本;鄭麥366是西農(nóng)20和存麥5號(hào)的共同親本。亞群Ⅴ包含10個(gè)品種,其中鄭麥98、煙農(nóng)21、西農(nóng)889、泛麥8號(hào)、鄭麥366血統(tǒng)混雜,該亞群聚類結(jié)果與系譜關(guān)系不明;亞群Ⅵ包含9個(gè)品種,有2個(gè)分支,其中,1個(gè)分支是西農(nóng)2611或西農(nóng)979的后代;另1個(gè)分支包含4個(gè)品種,其中3個(gè)為龍麥系列品種,龍麥26是龍麥35的父本。類群2中,濟(jì)麥229、邯麥18、冀麥738、龍麥20和邯優(yōu)3475血統(tǒng)混雜。類群2有2個(gè)分支,其中1個(gè)分支為臨漳麥或藁優(yōu)8901的后代,另1個(gè)分支中,邯麥18、師欒02-1和冀麥738均具有藁優(yōu)8901血統(tǒng),龍麥20和邯優(yōu)3475的聚類結(jié)果與系譜關(guān)系不明(圖2B)。
A:群體結(jié)構(gòu)分析;B:進(jìn)化樹分析。品種(系)編號(hào)對(duì)應(yīng)的品種(系)見(jiàn)表1。綠色和藍(lán)色字體表示不同類群,圖B中分枝線條顏色與圖A不同類群對(duì)應(yīng);紅色字體表示血統(tǒng)混雜品種(系)。A:Population structure analysis;B:Phylogeny tree analysis.Cultivars(lines)correspond to numbers showed in table 1.Green and red fonts represent different population,and the colors of branch lines in figure B correspond to different groups in figure A;Red font represents mixed ancestry cultivars(lines).圖2 供試小麥品種(系)的群體遺傳結(jié)構(gòu)和進(jìn)化樹分析Fig.2 Population structure and phylogeny tree analysis of the tested wheat cultivars(lines)
本研究發(fā)現(xiàn),55K SNP芯片中有效標(biāo)記和多態(tài)性標(biāo)記數(shù)量分別占總標(biāo)記數(shù)量的63.91%和62.64%。有效標(biāo)記中多態(tài)性標(biāo)記占比高達(dá) 98.01%。D基因組中有效標(biāo)記和多態(tài)性標(biāo)記數(shù)量顯著低于A基因組和B 基因組,但多態(tài)性比例無(wú)顯著差異。7個(gè)部分同源群上的有效標(biāo)記數(shù)量為3 686~5 051個(gè),相應(yīng)多態(tài)性標(biāo)記占比 97.38%~98.90%。且55K SNP芯片中有效標(biāo)記的多態(tài)性以及在不同基因組和7個(gè)部分同源群上的分布均優(yōu)于90K SNP芯片。因此,55K SNP 芯片適用于對(duì)中國(guó)優(yōu)質(zhì)小麥開展遺傳多樣性研究。
GS反映不同小麥品種(系)間在基因組水平上的相似程度。鄭永勝等基于SSR標(biāo)記,建議在DUS測(cè)試中與申請(qǐng)品種遺傳相似度系數(shù)高于0.800的已知品種作為近似品種進(jìn)行田間種植和特異性評(píng)價(jià)。王立新等利用Genomic-SSR、EST-SSR、AFLP-SCAR標(biāo)記篩查547個(gè)國(guó)家冬小麥區(qū)域試驗(yàn)品系及134個(gè)國(guó)審品種,發(fā)現(xiàn)絕大多數(shù)相似品種(系)間的GS 均大于0.900。曹廷杰等利用90K SNP芯片對(duì)96個(gè)河南省小麥品種進(jìn)行遺傳多樣性分析,發(fā)現(xiàn)品種間GS變化范圍為0.552~0.998,平均值為0.719,94.3%的品種GS分布在0.652~0.812 之間;李珊珊等利用90K SNP芯片對(duì)143份河北省推廣小麥品種進(jìn)行遺傳多樣性分析,發(fā)現(xiàn)品種間GS變化范圍為 0.438~0.997,平均值為0.602,89.23%的品種間GS分布在0.520~0.730之間。本研究表明,中國(guó)優(yōu)質(zhì)小麥GS變化范圍為0.488~0.928,平均值為0.603,98.18%的品種間GS分布在 0.500~0.800之間。這表明,中國(guó)優(yōu)質(zhì)小麥品種遺傳多樣性總體不高。隨著中國(guó)優(yōu)質(zhì)小麥品種審定標(biāo)準(zhǔn)的提高,優(yōu)質(zhì)小麥的遺傳多樣性有進(jìn)一步降低的趨勢(shì)。在45個(gè)優(yōu)質(zhì)小麥品種中,0.81%的優(yōu)質(zhì)小麥品種間GS高于0.800,但其農(nóng)藝性狀存在顯著差異,因此,這些品種均具有特異性,符合現(xiàn)行國(guó)家小麥品種審定標(biāo)準(zhǔn)。SNP芯片探針根據(jù)基因組SNP設(shè)計(jì),很多標(biāo)記與重要農(nóng)藝性狀基因無(wú)關(guān),可能是導(dǎo)致上述現(xiàn)象的原因之一。
本研究群體結(jié)構(gòu)和進(jìn)化樹分析結(jié)果表明,50個(gè)供試小麥品種(系)僅分成 2個(gè)類群7個(gè)亞群,同時(shí),2個(gè)類群間存在較嚴(yán)重的混血現(xiàn)象,這種現(xiàn)象是遺傳多樣性較低的一種表現(xiàn)。50個(gè)小麥品種(系)有12個(gè)血統(tǒng)混雜,這些血統(tǒng)混雜品種在不同群結(jié)構(gòu)分析中變化較大,但不影響整體分群評(píng)估。聚類結(jié)果與系譜比較分析表明,除亞群Ⅴ外,供試小麥品種(系)聚類分析與系譜分析結(jié)果基本吻合。因此,利用55K SNP芯片能夠較好地反映中國(guó)小麥品種(系)的遺傳多樣性和親緣關(guān)系。
在50個(gè)供試小麥品種(系)中,多態(tài)性SNP標(biāo)記數(shù)量在B基因組中最多,A基因組次之,D基因組最少,與利用RFLP標(biāo)記、SSR標(biāo)記和90K SNP芯片對(duì)小麥遺傳多樣性的研究結(jié)果一致。A基因組和D基因組的染色體低多態(tài)性區(qū)段均多于B基因組,這與多態(tài)性標(biāo)記的分布規(guī)律相符合。6A、4D和6D染色體上的低多態(tài)性區(qū)段多于其他染色體,這表明,在優(yōu)質(zhì)小麥育種過(guò)程中,6A和6D染色體這些區(qū)段受到高強(qiáng)度選擇。一般認(rèn)為,六倍體小麥D基因組的遺傳多樣性較低,4D染色體上的多態(tài)性標(biāo)記最少。本研究在50個(gè)供試優(yōu)質(zhì)小麥品種(系)中,4D染色體上的多態(tài)性標(biāo)記也最少(674個(gè)),多態(tài)性標(biāo)記在有效標(biāo)記中的比例也最低 (88.77%)。供試小麥品種(系)染色體上的SNP標(biāo)記MAF在 0.00~0.20之間的占比31.45%,且4D染色體上占比39.04%,這表明,4D染色體在優(yōu)質(zhì)小麥育種過(guò)程中也受到了高強(qiáng)度選擇。