李 春,段迎輝,琚 銘,苗紅梅,杜 華,張海洋
(1. 河南省農(nóng)業(yè)科學(xué)院 芝麻研究中心,河南 鄭州 450002;2. 河南省特色油料基因組學(xué)重點(diǎn)實(shí)驗(yàn)室,河南 鄭州 450002)
芝麻(Sesamum indicumL.)是世界上最古老的優(yōu)質(zhì)油料作物之一,也是我國(guó)重要的特色優(yōu)質(zhì)農(nóng)產(chǎn)品,在食品加工中具有重要的地位。2016—2020 年世界芝麻年均種植面積1 215 萬(wàn)hm2,年均產(chǎn)量約610 萬(wàn)t[1],主要分布在亞洲、非洲、拉丁美洲等發(fā)展中國(guó)家,蘇丹、印度、緬甸、坦桑尼亞、尼日利亞和中國(guó)是芝麻主要生產(chǎn)國(guó)。2016—2020 年,我國(guó)芝麻年均種植面積為26.26 萬(wàn)hm2,年均產(chǎn)量為41.51 萬(wàn)t,年均單產(chǎn)1 578 kg/hm2,在世界芝麻生產(chǎn)和國(guó)際貿(mào)易中占有重要地位[1]。截至目前,我國(guó)芝麻育種家通過(guò)常規(guī)選育、復(fù)合雜交、理化誘變、輪回雜交、遠(yuǎn)緣雜交等育種技術(shù)共選育出181個(gè)芝麻品種[2-3]。但受芝麻栽培種物種進(jìn)化單一等因素限制,現(xiàn)有芝麻種質(zhì)遺傳基礎(chǔ)相對(duì)狹窄,育成品種遺傳多樣性相對(duì)降低,進(jìn)一步選育高產(chǎn)穩(wěn)產(chǎn)芝麻新品種的難度逐步增大[3-4]。
近年來(lái),為解析芝麻種質(zhì)資源重要性狀的遺傳特征,加快芝麻育種研究進(jìn)程,國(guó)內(nèi)外芝麻學(xué)者相繼開(kāi)展了芝麻種質(zhì)資源的遺傳多樣性和群體結(jié)構(gòu)分析[4-9]。岳文娣等[4]利用42 對(duì)具明顯多態(tài)性的SSR(Simple sequence repeat)標(biāo)記,分析了國(guó)內(nèi)外545 份芝麻品種的遺傳多樣性和群體結(jié)構(gòu),發(fā)現(xiàn)我國(guó)芝麻種質(zhì)資源遺傳基礎(chǔ)較為狹窄,遺傳多樣性與地理分布不完全相關(guān),而國(guó)外資源遺傳多樣性豐富。WU等[5]選用88 個(gè)SSR 和InDel 標(biāo)記對(duì)130 份中國(guó)芝麻種質(zhì)材料進(jìn)行分析,通過(guò)PCA(Principal coordinate analysis)、進(jìn)化樹(shù)和AMOVA(Analysis of molecular variance)分析,將130 份材料分為5 個(gè)亞群。WEI等[6]通過(guò)簡(jiǎn)化基因組測(cè)序發(fā)現(xiàn),705份芝麻材料大體可分為與緯度相關(guān)的2 個(gè)亞群,分別對(duì)應(yīng)北方材料和南方材料。DOSSA等[7]選用33對(duì)SSR標(biāo)記分析了來(lái)自22 個(gè)國(guó)家的96 份芝麻種質(zhì),結(jié)果將材料劃分為5 個(gè)亞群,并指出亞群分布與材料起源地存在關(guān)系。同時(shí),CUI 等[8]采用89 924 個(gè)SNP 標(biāo)記和366 份芝麻種質(zhì)材料,也獲得了類(lèi)似的結(jié)論,發(fā)現(xiàn)材料中存在3個(gè)亞群,分別為南方材料、北方材料和混合型材料。BASAK 等[9]采用5 292 個(gè)SNP 標(biāo)記分析了地中海地區(qū)的芝麻核心種質(zhì),發(fā)現(xiàn)來(lái)自美洲和歐洲地區(qū)的材料多樣性較高,且材料的親緣關(guān)系與地區(qū)分布間無(wú)明顯的關(guān)聯(lián)。
在芝麻育成品種遺傳多樣性研究方面,WEI等[2]選用140 對(duì)分子標(biāo)記開(kāi)展了151 個(gè)芝麻品種的指紋圖譜構(gòu)建,發(fā)現(xiàn)芝麻品種材料間的相似度為0.51~0.99,指出我國(guó)芝麻育成品種相似度較高,遺傳多樣性相對(duì)較低。WEI 等[6]研究了705 份芝麻種質(zhì)材料的多樣性,指出我國(guó)芝麻育成品種的分子多樣性顯著低于地方種,且親緣關(guān)系較為集中,同時(shí)也發(fā)現(xiàn)與產(chǎn)量、油脂含量、抗病性緊密連鎖的31 個(gè)SNP位點(diǎn)在地方種和育成品種中的等位基因頻率改變程度超過(guò)30%。但截至目前,尚未有對(duì)我國(guó)芝麻育成品種中遺傳多樣性顯著改變的位點(diǎn)、數(shù)量或分布等特征進(jìn)行系統(tǒng)分析的研究報(bào)道;同時(shí),基因多樣性如何與品種人工改良發(fā)生關(guān)聯(lián)也不甚清晰。為此,以95 份我國(guó)芝麻育成品種和610 份國(guó)內(nèi)外種質(zhì)資源(其中國(guó)外種質(zhì)資源205 份,國(guó)內(nèi)地方種405份)為材料,基于基因組測(cè)序數(shù)據(jù),比較分析了材料間的分子多樣性,探明在芝麻育成品種中被富集的部分位點(diǎn),為構(gòu)建芝麻分子育種技術(shù)體系提供重要理論和技術(shù)參考信息。
705 份芝麻種質(zhì)資源材料基因組PE 雙末端(Pair-end)測(cè)序數(shù)據(jù)(NCBI Bioproject PRJEB8078)共617.86 Gb(Giga bases),單個(gè)樣品數(shù)據(jù)量為199~5 401 Mb(Million bases),平均每個(gè)樣品數(shù)據(jù)量為876.39 Mb[6]。數(shù)據(jù)通過(guò)NCBI 下載。705 份芝麻種質(zhì)資源材料包括95 份我國(guó)育成芝麻品種(Modern cultivar,簡(jiǎn)寫(xiě)為MC)、405 份國(guó)內(nèi)地方種(Land race,簡(jiǎn)寫(xiě)為L(zhǎng)R)以及205份國(guó)外種質(zhì)[6]。
以芝麻豫芝11 號(hào)(Yuzhi 11)為參考基因組[10],對(duì)上述705份基因組測(cè)序數(shù)據(jù)進(jìn)行比對(duì)分析。采用軟件Trimmomatic 0.33[11]以默認(rèn)參數(shù)進(jìn)行堿基質(zhì)量控制;通過(guò)BWA(Burrows wheeler aligner)0.7.17 程序[12]比對(duì)至參考基因組(默認(rèn)參數(shù)),獲得SAM(Sequence alignment/Map)文件,然后以SAM 文件為基礎(chǔ),通過(guò)SAMtools[13]篩選獲得高質(zhì)量比對(duì)序列。通過(guò)GATK 4.0 程序,依據(jù)Short variants calling best practice[14],確 定 各 樣 本 的SNP(Single nucleotide polymorphism)及InDel(Insert/deletion)變異位點(diǎn)。以最低材料數(shù)量(Min count)和稀有等位基因頻率(Minor allele frequency,MAF)為主要參數(shù),使用TASSEL 5.2.43程序[15]過(guò)濾并篩選上述變異位點(diǎn)。
使用河南省農(nóng)業(yè)科學(xué)院芝麻遺傳育種研究團(tuán)隊(duì)獲得的560份芝麻核心種質(zhì)材料的基因組重測(cè)序數(shù)據(jù)(簡(jiǎn)稱(chēng)為GWAS560,未公開(kāi))和搭建的SNP/InDel變體數(shù)據(jù)庫(kù),進(jìn)一步對(duì)在多個(gè)材料中普遍存在的變異位點(diǎn)進(jìn)行篩選,以獲得群體間材料多樣性比較的穩(wěn)定結(jié)果。
依據(jù)ZHANG 等[10]構(gòu)建的芝麻超高密度SNP 遺傳圖譜(13條染色體),采用滑動(dòng)窗口法分析變異位點(diǎn)在芝麻13 條染色體上的分布,窗口大小設(shè)置為10 kb(Kilo bases),步移設(shè)置為2 kb。
依據(jù)GATK 4.0 程序產(chǎn)生的VCF(Variant call format)文件,使用VCFtools 0.0.17 程序[16]計(jì)算芝麻育成品種和地方種的核苷酸多樣性指數(shù)π[17]及群體間的遺傳分化系數(shù)Fst[18]。
通過(guò)模擬置換檢驗(yàn)(Permutation test)進(jìn)行核苷酸多樣性指數(shù)π和遺傳分化系數(shù)Fst的顯著性檢驗(yàn)。在核苷酸多樣性指數(shù)π的檢驗(yàn)中,從500 份(95 份育成品種和405 份國(guó)內(nèi)地方種)材料中隨機(jī)抽取95 份樣本,組成模擬群體。在遺傳分化系數(shù)Fst的檢驗(yàn)中,將500 份材料隨機(jī)分為2 個(gè)群體,群體大小分別為95 和405,組成2 個(gè)模擬群體。以自主編寫(xiě)的PERL 腳本進(jìn)行1 000 次模擬假設(shè)檢驗(yàn),顯著性閾值設(shè)定為P=0.001。
為確定705 份芝麻樣本的變異位點(diǎn),以豫芝11號(hào)基因組為參考,分析了705 份芝麻種質(zhì)材料的基因組PE 數(shù)據(jù),確定了7 799 977 個(gè)原始變異位點(diǎn)(6 757 883個(gè)SNP和1 042 094個(gè)InDel),建立了705份樣本的變異位點(diǎn)矩陣。在該矩陣中,69.13%的變異位置覆蓋度≤2 層,41.55%的變異位置覆蓋度為0,表明上述材料的測(cè)序數(shù)據(jù)量較少,對(duì)變異位點(diǎn)的可靠度分析有一定影響。
為進(jìn)一步篩選在多個(gè)材料中普遍存在的變異位點(diǎn),剔除稀有等位基因及群體特異性變異,以用于群體間材料多樣性的比較,選用了560 份芝麻種質(zhì)的全基因組重測(cè)序數(shù)據(jù)和變異位點(diǎn)數(shù)據(jù)庫(kù)(GWAS560 數(shù)據(jù)庫(kù)),分別以“Min count=564(總材料的80%)、493(70%)或420(60%)”和“MAF=0.05”為參數(shù),對(duì)上述原始變異位點(diǎn)進(jìn)行過(guò)濾。結(jié)果顯示,以“Min count=564”結(jié)合“MAF=0.05”參數(shù),獲得了12 704 個(gè)位點(diǎn),其中12 654 個(gè)(99.61%)位點(diǎn)可同時(shí)在GWAS560 數(shù)據(jù)庫(kù)中被檢測(cè)到。因而,確認(rèn)上述12 704 個(gè)位點(diǎn)為多個(gè)材料中普遍存在的變異位點(diǎn)。
在上述12 704 個(gè)變異位點(diǎn)中,共有8 384 個(gè)變異位點(diǎn)分布于13 條染色體上,每條染色體為116(Chr8)~1 445 個(gè)標(biāo)記(Chr3)(圖1)?;瑒?dòng)窗口法(Window size=10 kb,Step=2 kb)分析結(jié)果顯示,在8 384 個(gè)位點(diǎn)中,每窗口內(nèi)變異位點(diǎn)數(shù)量為1~203個(gè),平均為9.55 個(gè),部分變異位點(diǎn)存在聚集現(xiàn)象(圖1)。
圖1 8 384個(gè)變異位點(diǎn)在13條染色體上的分布密度曲線Fig.1 The density plot of 8 384 SNP/InDel variants on the 13 chromosomes of sesame
為分析材料間的進(jìn)化關(guān)系,依據(jù)上述12 704 個(gè)變異位點(diǎn),對(duì)材料進(jìn)行系統(tǒng)進(jìn)化分析。結(jié)果(圖2)顯示,705 份材料可被劃分為4 個(gè)進(jìn)化亞組,分別為Ⅰ(包含79 份材料)、Ⅱ(52 份)、Ⅲ(182 份)和Ⅳ(392 份)組。其中,國(guó)外種質(zhì)材料主要分布在亞組Ⅳ,共包括了160 份國(guó)外資源,占國(guó)外材料的78.05%;育成品種主要集中在亞組Ⅰ(51 份),在其余3 個(gè)亞組中,育成品種呈零散分布(Ⅱ組6 個(gè),Ⅲ組14個(gè),Ⅳ組24個(gè))。
圖2 芝麻育成品種、地方種和國(guó)外材料的系統(tǒng)進(jìn)化樹(shù)Fig.2 The Phylogenetic tree of the sesame modern cultivars,landraces and germplasm lines collected from the other countries
隨后,以核苷酸多樣性指數(shù)π為參數(shù),比較了95 份芝麻育成品種和405 份國(guó)內(nèi)地方種的遺傳多樣性(圖3)。結(jié)果顯示,在育成品種和地方種中具有多樣性的變異位點(diǎn)共計(jì)12 670 個(gè);育成品種材料的π值為0~0.653,平均為0.158,地方種的π值為0.006~0.622,平均0.246,地方種顯著高于育成品種(One tailT-test,P<0.01)。同時(shí),在芝麻的13條染色體中,育成品種的多樣性也明顯低于地方種。
圖3 芝麻育成品種和地方種間核苷酸多樣性小提琴圖比較Fig.3 The violin plot comparison of nucleotide diversity between the sesame cultivars and landraces across the 13 chromosomes of sesame
此外,使用Permutation 置換檢驗(yàn)對(duì)上述變異位點(diǎn)的多樣性進(jìn)行分析。結(jié)果發(fā)現(xiàn),在育成品種中,有2 483 個(gè)位點(diǎn)(19.60%)表現(xiàn)出多樣性顯著降低(P<0.001),有115 個(gè)位點(diǎn)表現(xiàn)為多樣性顯著升高(P<0.001)。
為明確我國(guó)芝麻育成品種與地方種之間在分子多樣性方面的差異,選用遺傳分化系數(shù)Fst為參數(shù),比較了2 組樣本的12 704 個(gè)變異位點(diǎn)的分化特征(圖4)。通過(guò)1 000 次模擬假設(shè)檢驗(yàn),共發(fā)現(xiàn)1 290 個(gè)位點(diǎn)在芝麻育成品種和地方種間表現(xiàn)為顯著分化(P<0.001)。其中,1 125 個(gè)位點(diǎn)與核苷酸多樣性指數(shù)π顯示育成品種多樣性顯著降低的位點(diǎn)相同,80個(gè)位點(diǎn)與育成品種多樣性顯著升高的位點(diǎn)相同(圖4)。
圖4 育成品種材料(MC)中多樣性顯著升高、降低位點(diǎn),以及育成品種-地方種(LR)間分化位點(diǎn)Venn圖Fig.4 The venn diagram across the variants with significantly lower or higher nucleotide diversity in modern cultivars(MC),and the ones significantly divergent between cultivars and landraces(LR)
進(jìn)一步分析顯示,在芝麻育成品種和地方種間顯著分化的1 290 個(gè)位點(diǎn)中,1 081 個(gè)(83.80%)變體位點(diǎn)呈現(xiàn)聚集性,相鄰位點(diǎn)間的距離小于2 kb。如,顯著分化的位點(diǎn)Chr1:3380935、3381182 和3381193,集中于500 bp 的區(qū)間內(nèi)。使用滑動(dòng)窗口法計(jì)算Fst,也獲得了類(lèi)似的結(jié)果。
為探索芝麻育成品種中富集的等位基因,進(jìn)一步對(duì)上述在育成品種中多樣性顯著升高且在育成品種和地方種間顯著分化的80 個(gè)位點(diǎn)進(jìn)行分析。結(jié)果(表1)顯示,80 個(gè)變異位點(diǎn)共分布于9 個(gè)染色體和2 個(gè)重疊群(Contig)上;其中,共有79 個(gè)變異位點(diǎn)具有2 個(gè)等位變異,僅SNP 位點(diǎn)Chr2:8177102 存在3 個(gè)等位變異。此外,有3 個(gè)變異位點(diǎn)(Chr1∶26400643、Chr13∶3548465 和Chr13∶3608441)只在育成品種中存在多樣性(表1)。
在80 個(gè)變異位點(diǎn)中,17 個(gè)(21.25%)分布于13個(gè)基因的外顯子中,11 個(gè)(13.75%)位于基因間區(qū)(Intergenic),52 個(gè)(65.00%)位 于 基 因 上 下 游(Upstream/Downstream)。位于基因外顯子區(qū)的17個(gè)變異引起了基因突變,其中同義突變(Synonymous)3 個(gè)(Chr2∶8177098、Chr10∶3442162和Chr10:3442942),錯(cuò)義突變(Missense)12 個(gè),移碼框突變(Frame shift)1個(gè)(Chr1:27360152),以及終止密 碼 子 丟 失 突 變(Stop codon lost)1 個(gè)(C22∶4704132)。上述變異位點(diǎn)中,錯(cuò)義突變、移碼框突變和終止密碼子丟失突變(共14 個(gè))具有強(qiáng)突變效應(yīng),可能影響了U0183.30(Cytochrome P450)、C_2_2.176(Disease resistance NB-LRR protein)、C37.81(Disease resistance NB-LRR protein)和aC22.188(Retrotransposon gag protein)的基因功能(表1)。在影響上述2 個(gè)抗病相關(guān)基因(C_2_2.176和C37.81)的強(qiáng)突變效應(yīng)位點(diǎn)中,位點(diǎn)Chr2:8176782 和Chr10∶3441593 在育成品種中的基因頻率較地方種分別提高了12.93倍和3.44倍(表1)。
表1 通過(guò)核苷酸多樣性和遺傳分化分析選定的80個(gè)位點(diǎn)統(tǒng)計(jì)信息及變異效應(yīng)預(yù)測(cè)Tab.1 The statistical information and variant effect annotation of the 80 loci selected from the intersection of the nucleotide diversity and population divergent analysis
續(xù)表1 通過(guò)核苷酸多樣性和遺傳分化分析選定的80個(gè)位點(diǎn)統(tǒng)計(jì)信息及變異效應(yīng)預(yù)測(cè)Tab.1(Continued) The statistical information and variant effect annotation of the 80 loci selected from the intersection of the nucleotide diversity and population divergent analysis
續(xù)表1 通過(guò)核苷酸多樣性和遺傳分化分析選定的80個(gè)位點(diǎn)統(tǒng)計(jì)信息及變異效應(yīng)預(yù)測(cè)Tab.1(Continued) The statistical information and variant effect annotation of the 80 loci selected from the intersection of the nucleotide diversity and population divergent analysis
本研究通過(guò)705份芝麻種質(zhì)材料的變異位點(diǎn)發(fā)掘與分布分析,系統(tǒng)比較了95 份育成芝麻品種和405 份國(guó)內(nèi)地方種的變異位點(diǎn)分布特征和分化差異,揭示了80 個(gè)變異位點(diǎn)受人工選擇后的分化差異,為后續(xù)芝麻分子育種技術(shù)體系構(gòu)建提供了理論和技術(shù)支持。人工選擇是改良農(nóng)作物品種性狀、改變遺傳多樣性的重要手段。人工選擇可導(dǎo)致一些重要農(nóng)藝性狀相關(guān)的位點(diǎn)發(fā)生多樣性改變,并促進(jìn)個(gè)別等位基因被保留下來(lái)[19-20]。因此,群體間多樣性的差異分析結(jié)果可反映一些與重要農(nóng)藝性狀相關(guān)的變異位點(diǎn)。CAVANAGH 等[21]以2 994份小麥地方種和育成品種為材料,通過(guò)比較各亞群間的Fst系數(shù),鑒定出了32個(gè)與育成品種改良相關(guān)的基因組區(qū)域,其中就包含了在“綠色革命”中發(fā)揮了重大作用的矮稈基因Rht-B1。QIN 等[22]通過(guò)類(lèi)似的方法在辣椒基因組中鑒定出包含乙烯響應(yīng)元件結(jié)合因子、10 個(gè)抗病基因等在內(nèi)的34 個(gè)重要位點(diǎn)。在芝麻種質(zhì)GWAS(Genome-wide association study,全基因組關(guān)聯(lián)分析)分析中,WEI 等[6]確定了調(diào)控芝麻每葉腋花數(shù)(一葉三花或一葉一花)性狀的等位基因,該等位基因位點(diǎn)的頻率從59.5%(種質(zhì)資源)富集提升到98.9%(育成品種)。
研究結(jié)果表明,農(nóng)作物基因組中一般有2%~7%的基因位點(diǎn)在育種過(guò)程中被人工選擇過(guò)。如,玉米中被人工選擇的基因位點(diǎn)占全部基因的2%~4%[23],大豆被人工選擇位點(diǎn)占比約7%[24]。本研究依據(jù)多樣性在育成品種中顯著升高且在育成品種-地方種間顯著分化的原則,獲得了80 個(gè)位點(diǎn),并認(rèn)定這些位點(diǎn)上的某個(gè)等位變異在芝麻育成品種中被富集。在80個(gè)位點(diǎn)中,發(fā)現(xiàn)3個(gè)位點(diǎn)只在育成品種中芝23號(hào)(Zhongzhi 23,ID 為G564)、中芝13 號(hào)(Zhongzhi 13,G610)和皖芝3 號(hào)(Wanzhi 3,G689)等材料中發(fā)現(xiàn)了多樣性,在地方種無(wú)多樣性,推測(cè)這些品種中可能引入了材料342(5)(ID 為G456,日本)、U.C.R/82NO201NS(G478,美國(guó))、Padathar(G513,緬甸)或/和K2(G593,幾內(nèi)亞)等材料的血統(tǒng)。
在芝麻遺傳育種研究中,選育高產(chǎn)、抗?。箍菸?、莖點(diǎn)枯?。?、抗逆(耐漬、耐旱、抗倒伏)、適于機(jī)收等優(yōu)異新品種是當(dāng)前國(guó)內(nèi)外芝麻育種家們的共同目標(biāo)[3,25]。本研究中,在80 個(gè)位點(diǎn)涉及的13 個(gè)基因內(nèi),發(fā)現(xiàn)了2 個(gè)抗病相關(guān)的基因C_2_2.176和C37.81,這2 個(gè) 基 因 均 編 碼NB-LRR(Nucleotide binding site leucine rich repeat)蛋白,且位點(diǎn)的變異均引起了氨基酸的錯(cuò)義突變。同時(shí),在2個(gè)基因內(nèi),育成品種中等位變異的基因頻率較地方種分別最高提高了12.93倍和3.44倍。該結(jié)果說(shuō)明,上述2個(gè)基因在育成品種中被富集,并可能在提升品種的抗病性方面發(fā)揮了重要作用。NB-LRR類(lèi)基因是植物R 基因(Resistance gene)中較大的一類(lèi)基因家族,且可分為2 類(lèi):TIR-NB-LRR(Toll/inte rleukin receptorNB-LRR)和CC-NB-LRR(Coiled-coilNB-LRR)[26]。C_2_2.176和C37.81均屬于CC-NB-LRR(CNL)類(lèi)的抗病基因,與擬南芥RPP8(抗黑脛?。?、RPS4(抗斑點(diǎn)?。┮约靶←淟r10(抗葉銹?。┑然蛲碵27-28]。NB-LRR相關(guān)R 基因在芝麻中的研究還較少。此外,本研究也發(fā)現(xiàn)了基因U0183.30發(fā)生了移碼突變,其等位變異在育成品種中較地方種提升了2.70 倍。該基因編碼細(xì)胞色素P450(Cytochrome P450)相關(guān)基因,也與植物的抗病性相關(guān)[29]。
本研究以核苷酸多樣π為參數(shù),比較芝麻育成品種和地方種間的差異。對(duì)于一個(gè)含有2個(gè)等位基因的位點(diǎn),π的計(jì)算公式可簡(jiǎn)化為π=n*2pq/(n-1),其中p和q分別為2 個(gè)等位基因的頻率,且q=1-p;n為樣本量[17]。依據(jù)該公式,π在p與q相等時(shí)取最大值。文中選擇的π顯著升高的位點(diǎn),實(shí)際上是在地方種中p和q差異較大而在育成品種群體中趨于縮小的位點(diǎn)。但是,該策略忽略了另一類(lèi)在育種過(guò)程中發(fā)揮重要作用的位點(diǎn),如經(jīng)歷了Selective sweep(選擇性清除)的位點(diǎn)[30]。這類(lèi)位點(diǎn)在種質(zhì)資源中,各個(gè)等位基因的基因頻率差異不大,表現(xiàn)為p和q差異較??;但在育成品種群體中某個(gè)等位基因被富集,獲得了極高的等位基因頻率(下文稱(chēng)之為B 類(lèi)位點(diǎn))。
本研究共發(fā)現(xiàn)了2 483個(gè)B類(lèi)位點(diǎn),占總位點(diǎn)數(shù)量的近20%,遠(yuǎn)高于其他作物中估計(jì)的2%~7%,暗示著其中應(yīng)包含較多數(shù)量的假陽(yáng)性位點(diǎn),其原因可能是B 類(lèi)位點(diǎn)的檢測(cè)受測(cè)序深度制約較大[31]。本研究所用基因組數(shù)據(jù)量少,基因組覆蓋度較低,難以有效進(jìn)一步降低假陽(yáng)性位點(diǎn)的數(shù)量。WEI 等[6]針對(duì)與產(chǎn)量、油脂含量、抗病性緊密連鎖的31 個(gè)SNP 位點(diǎn)開(kāi)展多樣性分析,發(fā)現(xiàn)這些位點(diǎn)在芝麻地方種和育成品種中的等位基因頻率改變程度>30%。該結(jié)果暗示了在育種過(guò)程中發(fā)揮重要作用的優(yōu)異等位變異,其等位基因頻率在育成品種和地方種間可能發(fā)生了明顯的改變。而在本研究獲得的育成品種中多樣性顯著升高且在育成品種-地方種間顯著分化的80 個(gè)位點(diǎn)中,大多位點(diǎn)(78 個(gè))的等位基因頻率在育成品種和地方種中發(fā)生了顯著變化,差異倍數(shù)均超過(guò)了2.0,這些位點(diǎn)受假陽(yáng)性的影響應(yīng)較有限。為揭示芝麻品種變異位點(diǎn)選擇與進(jìn)化特征,后續(xù)研究將選用測(cè)序深度更高的種質(zhì)數(shù)據(jù)庫(kù)GWAS560,進(jìn)一步分析并闡明芝麻育成品種中的重要變異位點(diǎn)和選擇區(qū)域,為搭建完善的芝麻分子育種技術(shù)體系奠定堅(jiān)實(shí)的基礎(chǔ)。