国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SLAF-seq技術的甘蔗遺傳多樣性和選擇信號分析

2022-01-25 11:50林萍萍徐良年鄧祖湖王勤南趙新旺
亞熱帶農(nóng)業(yè)研究 2021年4期
關鍵詞:甘蔗基因組測序

林萍萍, 張 慧, 徐良年, 鄧祖湖, 王勤南, 趙新旺,3

(1.福建農(nóng)林大學國家甘蔗工程技術研究中心,福建 福州 350002;2.廣東省科學院南繁種業(yè)研究所,廣東 廣州 510310;3.廣西大學廣西甘蔗生物學重點實驗室,廣西 南寧 530004)

甘蔗是熱帶、亞熱帶重要的經(jīng)濟作物[1]。由于甘蔗是非整倍的多倍體作物,遺傳方式復雜且遺傳多樣性豐富,可為“高貴化”育種提供優(yōu)良的親本材料[2]。甘蔗倍性復雜且不易開花,主要以無性繁殖為主,使育種進展緩慢[3]。目前應用于遺傳育種的分子標記有很多,單核苷酸多態(tài)性(single nucleotide polymorphisms, SNP)標記由于具有數(shù)量多、方便基因分型、覆蓋范圍廣、效率高及可以大規(guī)模篩查的優(yōu)勢[4-6],得以普遍應用于探究遺傳多樣性。簡化基因組測序技術(specific-locus amplified fragment sequencing, SLAF-seq)是一種高通量的測序技術,可簡便、快速獲得覆蓋全基因組的SNP標記以及基因型。SLAF-seq技術具有構建文庫簡單快速、成本較低、準確性高、有效標記多等特點,已應用于甘薯[7]、大豆[8]、水稻[9]等作物遺傳多樣性分析和性狀的QTL定位等研究。

研究甘蔗種質資源的遺傳多樣性可以挖掘控制優(yōu)良性狀的等位基因,通過人工選擇使有利等位基因的基因頻率不斷提高,甚至固定下來。由于連鎖,有利基因周圍的基因組區(qū)域也隨之穩(wěn)定遺傳。甘蔗細莖野生種(SaccharumspontaneumL.)俗稱割手密,具有抗逆性強、適應性廣等優(yōu)良性狀。推廣種植的甘蔗栽培品種大多含有割手密血緣。在全基因組范圍檢測選擇性清除信號,能掃描到與遺傳進化有關的受選擇基因或基因組區(qū)域[10-11]。目前利用SNP標記對甘蔗遺傳多樣性及選擇性清除進行分析的相關研究相對較少。本研究以甘蔗近緣屬割手密為參考基因組,對107份甘蔗材料進行簡化基因組測序,分析不同群體的遺傳多樣性,并利用遺傳分化指標(Fst)和核苷酸多態(tài)性(π)對不同群體進行選擇性清除分析,進一步分析甘蔗基因組中受人工選擇的區(qū)域及優(yōu)良基因,以期為甘蔗分子育種提供參考。

1 材料與方法

1.1 試驗材料

選用107份甘蔗材料進行簡化基因組測序,包括83份栽培種及24份細莖野生種。其中,粵甘49在兩次引種過程中表型有所差異,但性狀都優(yōu)良,分別編號為粵甘49-1、粵甘49-2。甘蔗葉片主要采自福建、海南、廣西等地。取新鮮幼嫩無病害的葉片放于錫箔紙中,置-80 ℃冰箱備用。

1.2 試驗方法

1.2.1 DNA的提取 采用2×CTAB法[12]提取甘蔗葉片DNA,并用1.0%瓊脂糖凝膠電泳。使用紫外分光光度計測定DNA的純度和濃度,選擇單一、無拖帶的DNA樣品置于-20 ℃?zhèn)溆谩?/p>

1.2.2 酶切建庫及SNP標記的開發(fā) 以甘蔗近緣屬割手密基因組(S.spontaneumAP85-441 genome, http://sugarcane.zhangjisenlab.cn/sgd/html/index.html)為參考,利用北京百邁客生物科技有限公司的酶切預測軟件對割手密基因組進行最佳酶切方案預測,并對107份甘蔗DNA樣品進行酶切。對得到的SLAF標簽進行3′端加A處理,連接Dual-index測序接頭,通過PCR目的片段的擴增、純化、混樣,選取目的片段,構建合格的測序文庫。以水稻品種‘日本晴’作為對照進行測序,評估酶切的準確性。利用BWA軟件[13]將測序后的數(shù)據(jù)比對到參考基因組上,并使用GATK和SAMtools[13]兩種軟件檢測SNP。兩種方法取交集以確認最終的SNP位點,并且以最小等位基因頻率(minor allele frequency, MAF)大于0.05以及位點完整度大于0.5為標準進行數(shù)據(jù)過濾,獲得高質量的SNP。

1.2.3 系統(tǒng)發(fā)育樹構建與群體結構分析 采用MEGA 6軟件[14],基于鄰接法、Kimura 2-parameter模型和自展值重復1 000次,構建系統(tǒng)發(fā)育樹?;诤Y選出的SNP分別對材料進行群體結構和主成分(PCA)分析。(1)通過Admixture軟件[15]分析群體結構。預先設定亞群數(shù)目(K值)為1~10進行聚類,并對聚類結果進行交叉驗證。根據(jù)交叉驗證錯誤率的谷值確定最優(yōu)分群數(shù)。(2)通過EIGENSOFT軟件進行PCA分析,對所有材料進行聚類。

1.2.4 Fst和π的計算及選擇性清除分析 基于高質量的SNP,按照100 kb的窗口、10 kb的步長對染色體進行選擇性清除區(qū)域檢測。使用R語言的PopGenome軟件包,計算Fst、π和多樣性變化倍數(shù)(θπratio)等,并利用Fst值繪制曼哈頓圖。在篩選選擇性清除區(qū)域時,分別以Fst和π前5%分位數(shù)對應的數(shù)據(jù)作為閾值,取該區(qū)域的交集為選擇性清除區(qū)域。

1.2.5 候選基因的檢測與注釋功能富集分析 將鑒定的選擇性清除區(qū)域通過Interproscan軟件[16]進行GO注釋分析。在網(wǎng)站(http://plantregmap.cbi.pku.edu.cn/go.php)上進行GO富集分析,并與Swiss-Prot[17]、GO[18]和KEGG[19]等數(shù)據(jù)庫進行對比得到注釋信息。參考NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/)以及割手密基因組數(shù)據(jù)庫,對受選擇區(qū)域的基因進行功能注釋,對候選基因進行GO功能富集分析。

2 結果與分析

2.1 測序數(shù)據(jù)統(tǒng)計與評估

通過對107份甘蔗基因組DNA進行SLAF酶切及建庫,總共獲得223.63 Mb序列數(shù)據(jù)。其中,云南82-29獲得的數(shù)據(jù)量(4.66 Mb)最大,湛蔗80-101等樣品的數(shù)據(jù)量(0.27 Mb)最小(表1)。107份材料測序結果顯示,GC含量在42.08%~45.69%之間,平均44.11%;測序堿基質量值Q30在89.41%~93.08%之間,平均90.93%,說明堿基測序錯誤率較低,獲得的數(shù)據(jù)可靠。本研究中第42個樣品即新臺糖26號的堿基含量分布和質量分布見圖1。通過序列分析,從107份甘蔗材料中共獲得7 869 726個高質量的SNP。根據(jù)SNP在染色體上的分布,繪制SNP在染色體上的分布圖(圖2)。由圖2可知,開發(fā)的SNP標記在染色體上分布比較均勻,Chr7D的SNP位點相對較多,Chr8C的SNP位點相對較少。

表1 SLAF-seq基因組測序數(shù)據(jù)統(tǒng)計表Table 1 Summary of genomic sequences generated by SLAF-seq

續(xù)表1

圖1 新臺糖26號的堿基含量及測序質量分布Figure 1 Base distribution and quality distribution of Xintaitang 26 reads

每個條帶代表一條染色體,橫坐標為染色體長度,顏色越深代表SNP標記數(shù)越多。圖2 SNP標簽在甘蔗染色體上的分布Figure 2 Distribution of SNPs on the chromosomes of sugarcane

2.2 甘蔗系統(tǒng)發(fā)育分析及群體結構劃分

為了從基因水平上分析栽培種群體與細莖野生種群體的遺傳結構,利用篩選出的7 869 726個高質量的SNP,通過Admixture軟件進行107份甘蔗材料群體結構分析(圖3)。根據(jù)交叉錯誤率確定最優(yōu)分群。當K從1到2時,交叉錯誤率逐漸減?。粡?到10時,交叉錯誤率逐漸增大(圖3C)。說明K=2時,交叉錯誤率最小。因此,107份甘蔗群體可分為2個亞群,一個為栽培種群體,另一個為細莖野生種群體(圖3D)。

利用SNP信息,構建107份甘蔗材料的進化樹(圖3A)。從進化樹可見,細莖野生種群體、栽培種群體分別聚在一起,說明栽培品種間的序列相似性較高,與細莖野生種存在一定的差異。利用R軟件繪制主成分分析圖(圖3B),發(fā)現(xiàn)2個亞群在PC1軸上的分布存在差異。該結果與聚類分析結果相一致。周珊等[20]研究表明,甘蔗不同亞群間存在遺傳滲透,尤其是栽培種群體中混有細莖野生種的遺傳成分。細莖野生種將優(yōu)良的抗性基因滲入栽培品種中,通過品種間不斷地雜交、人工選擇及自然選擇,豐富了甘蔗遺傳背景,培育出抗逆性強和產(chǎn)量高的優(yōu)良品種[21],與本研究遺傳多樣性的分析結果相類似。

A.進化樹分析,Ⅰ為栽培種群體、Ⅱ為細莖野生種群體;B.群體主成分分析;C.群體結構交叉驗證錯誤分析;D.群體結構。圖3 107份甘蔗材料遺傳結構的分析Figure 3 Genetic structure analysis of 107 sugarcane varieties

2.3 甘蔗群體遺傳分化分析

為了探究甘蔗群體的分化,本研究分析了栽培種群體和細莖野生種群體的Fst值,并利用100 kb滑動窗口對基因組區(qū)域Fst值進行分析(圖4)。從圖4可見,栽培種群體與細莖野生種群體之間Fst=0.216,栽培種群體的核苷酸多樣性(π=8.93×10-6)高于細莖野生種群體(π=6.11×10-6)??赡苁且驗樵耘喾N遺傳背景較為復雜,除了割手密血緣外,還有熱帶種血緣或者大莖野生種血緣[22],導致栽培種群體遺傳多樣性可能高于細莖野生種群體,深層次原因需進一步研究。

2.4 差異化的候選區(qū)域及候選基因

利用群體間的群體分化系數(shù)以及核苷酸多樣性比率進行選擇性清除分析。使用100 kb的滑動窗口以及10 kb步長分別計算群體分化系數(shù)和核苷酸多樣性比率,并取基因組前5%的交集區(qū)域作為選擇清除區(qū)域(圖5)。以割手密基因組為參考,分析107份甘蔗差異基因組區(qū)域中的基因。從圖5可見,在栽培種群體和細莖野生種群體中共檢測到72個受選擇區(qū)域,其中439個基因具有強烈選擇信號。進一步對選擇性掃描的區(qū)域進行基因功能注釋,發(fā)現(xiàn)富集的基因組區(qū)域中包含UBA3、CBP2、GSTU8等與抗性相關的基因(表2、圖5)。

紅點和藍點分別表示Fst和多樣性變化倍數(shù)大于95%群體間篩選出的基因組區(qū)域。圖4 甘蔗栽培種與細莖野生種群體間的差異基因組區(qū)域Figure 4 Different genomic regions between cultivated sugarcane population and wild S.spontaneum population

紅色、藍色線分別表示基因組前1%、前5%水平的閾值線;對受選擇區(qū)域的基因進行功能注釋分析獲得箭頭所示基因。圖5 甘蔗栽培種與細莖野生種群體分化系數(shù)在染色體上的整體分布Figure 5 Global Fst distribution between cultivated sugarcane population and wild S.spontaneum population

表2 甘蔗栽培種與細莖野生種群體間高差異基因組區(qū)域前5% SNP的部分基因Table 2 Partial candidate genes from highly different genomic regions between cultivated sugarcane population and wildS.spontaneum population (top 5% of SNPs in each region)

通過富集的基因進行GO注釋和富集分析發(fā)現(xiàn),兩個群體受選擇基因主要富集在泛素蛋白轉移酶活性過程、核苷酸結合過程、對熱的反應過程、磷酸蛋白酶活性過程、復制后修復過程、絲氨酸/蘇氨酸蛋白激酶活性過程、谷胱甘肽轉移酶活性過程、鉀離子跨膜轉運過程和絲氨酸型羧肽酶活性過程等通路。其中,位于2號染色體的候選區(qū)域錨定在10.63~10.64 Mb之間,基因Sspon.02G0053560-1C與野生土豆抗病蛋白RGA2同源[23],說明抗性基因在選擇性清除中受到選擇。

3 討論

3.1 野生種質是拓寬甘蔗遺傳基礎的有效途徑

本研究通過簡化基因組測序對107份甘蔗材料進行全基因組SNP標記的開發(fā),獲得7 869 726個高質量的SNP,并進行群體遺傳結構分析。利用Admixture軟件對甘蔗自然群體的群體結構分析表明,K=2時交叉錯誤率最小。因此,107份甘蔗材料劃分成2個亞群,分別為栽培種群體和細莖野生種群體。該結果與進化樹和主成分分析結果一致,說明甘蔗群體結構分析結果較可靠。值得注意的是,栽培種群體結構存在細莖野生種血緣的滲透現(xiàn)象。郎榮斌等[24]研究顯示,甘蔗是多倍體植物且為非整倍體,遺傳背景復雜,經(jīng)過多年人工雜交,有較為明顯的血緣滲透,大多數(shù)推廣的栽培種中混有細莖野生種的遺傳成分。本研究選用了83份栽培種和24份細莖野生種,之中的栽培品種是我國近50年育成及推廣應用的品種,細莖野生種是我國甘蔗育種中應用最多的野生資源[25]。因此,該107份材料在一定程度上能反映我國甘蔗育成品種的遺傳多樣性。同時也說明利用甘蔗野生種質資源可以拓寬甘蔗遺傳基礎,是提高遺傳多樣性的有效途徑[26]。

3.2 我國甘蔗栽培品種遺傳多樣性良好

本研究表明,栽培種群體的核苷酸多樣性(π=8.93×10-6)高于細莖野生種群體(π=6.11×10-6),可能是因為栽培種遺傳背景較為復雜[27]。田春艷等[28]研究統(tǒng)計,我國現(xiàn)有甘蔗栽培品種中超過90%的甘蔗含有POJ2878的血緣,栽培品種中大多數(shù)的血緣來自于熱帶種、細莖野生種和印度種。通過甘蔗的“高貴化”育種[29],將細莖野生種作為父本,與熱帶種進行雜交并回交以選育出優(yōu)良的品種,說明大多數(shù)甘蔗栽培材料含有細莖野生種血緣,提高了栽培群體的核苷酸多樣性。

3.3 抗性基因在甘蔗育種中受到選擇

甘蔗栽培品種在選育和生產(chǎn)過程中,經(jīng)常受干旱[30]、寒害[31]、黑穗病[32]和花葉病[33]等脅迫,一定程度上制約了甘蔗的生產(chǎn)。在甘蔗抗性性狀的遺傳改良方面,細莖野生種使甘蔗種質的開發(fā)取得突破性的進展。利用分子標記挖掘細莖野生種優(yōu)良的抗性基因有利于提升甘蔗抗逆水平。通過對107份材料進行選擇性清除分析發(fā)現(xiàn),抗性基因在育種過程中持續(xù)受到選擇。如沈懌丹[34]研究表明,GST家族在作物抗旱、耐鹽、耐高溫等環(huán)境脅迫上起重要作用,并且朱丹等[35]發(fā)現(xiàn)在干旱、高溫脅迫中薄荷GSTU8基因上調(diào)表達; 殷龍飛等[36]研究發(fā)現(xiàn),GRAS家族在調(diào)控植物信號傳導的過程中具有重要作用,在干旱脅迫下作物莖葉部和根部調(diào)控SCL9基因的表達,SCL9基因是GRAS家族的成員之一。本研究中抗性基因在甘蔗育種過程中得到了強烈的選擇,這能夠為甘蔗抗逆分子育種提供候選基因,并為后續(xù)關聯(lián)分析挖掘優(yōu)良基因提供參考。

猜你喜歡
甘蔗基因組測序
兩種高通量測序平臺應用于不同SARS-CoV-2變異株的對比研究
“植物界大熊貓”完整基因組圖譜首次發(fā)布
我國小麥基因組編輯抗病育種取得突破
宏基因組測序輔助診斷原發(fā)性肺隱球菌
第一代基因組設計的雜交馬鈴薯問世
牛參考基因組中發(fā)現(xiàn)被忽視基因
生物測序走在前
甘蔗的問題
基因測序技術研究進展
甜甜的甘蔗
镇远县| 二连浩特市| 通江县| 永德县| 西安市| 广饶县| 克东县| 紫云| 潢川县| 行唐县| 宿松县| 甘孜县| 汾阳市| 乐清市| 莱州市| 唐河县| 那坡县| 邻水| 苍梧县| 治县。| 池州市| 安丘市| 乌拉特前旗| 黄浦区| 房山区| 金沙县| 宁德市| 两当县| 贺州市| 盐山县| 琼结县| 江都市| 广南县| 江源县| 南溪县| 河西区| 青神县| 木里| 商洛市| 迭部县| 兰州市|