金彥龍,李艷軍,張新宇,孫 杰,薛 飛
(石河子大學(xué) 農(nóng)學(xué)院,石河子大學(xué)新疆生產(chǎn)建設(shè)兵團(tuán)綠洲生態(tài)農(nóng)業(yè)重點(diǎn)實(shí)驗(yàn)室,新疆石河子 832003)
小麥(TriticumaestivumL.)是全世界最重要的糧食作物之一,在其生產(chǎn)過程中常面臨銹病、赤霉病和白粉病的危害。其中小麥白粉病是由子囊菌亞門的布氏白粉菌Blumeriagraminis(DC) Speer f.sp.tritici引發(fā)的世界性小麥病害。由于小麥白粉菌生理小種變異速度快,以及單一抗性品種的大面積推廣,導(dǎo)致品種抗性極易喪失。選擇和配置多基因聚合的抗病品種是最經(jīng)濟(jì)、有效且環(huán)境友好的防治方法[1]。發(fā)掘有效且持久的抗性基因資源,并進(jìn)行精細(xì)定位,將有助于現(xiàn)有抗源的合理利用,最終實(shí)現(xiàn)小麥的持久抗 病性。
對(duì)于大規(guī)模SNP和InDel標(biāo)記開發(fā),SLAF-Seq(Specific length amplified fragment sequencing)具有低成本和高通量的特性,彌補(bǔ)了SSR標(biāo)記在基因組分布不均的不足。SLAF-Seq技術(shù)結(jié)合BSA(Bulked segregant analysis)方法已被廣泛應(yīng)用于玉米花序[2]、擬南芥疫霉病[3]、黃瓜果肉[4]、大麥葉色[5]、油菜種子[6]、桃樹溫敏半矮化[7]、甜瓜風(fēng)味[8]、番茄葉霉病[9]、水稻分蘗[10]、棉花雄性不育[11]等性狀的分子標(biāo)記開發(fā)、QTLs鑒定和候選基因關(guān)聯(lián)分析等。
中國(guó)小麥農(nóng)家品種非常豐富,其中‘小白冬麥’經(jīng)歷漫長(zhǎng)年代至今仍保持著一定抗白粉病能力。然而,‘小白冬麥’所持有的抗白粉病基因mlxbd并沒有得到充分的研究和利用。本研究將通過構(gòu)建‘小白冬麥’與感病材料‘陜優(yōu)225’的F2:3作圖群體,基于SLAF-Seq結(jié)合BSA方法進(jìn)一步縮小mlxbd所在染色體候選區(qū)域,基于序列差異查找SNP和Indel。并通過生物信息學(xué)數(shù)據(jù)庫(kù)對(duì)定位染色體區(qū)間內(nèi)的候選基因進(jìn)行分析,為進(jìn)一步圖位克隆抗白粉病基因mlxbd以及深入研究Pm5抗病基因位點(diǎn)提供理論依據(jù)。
農(nóng)家品種‘小白冬麥’作為抗病親本與感病材料‘陜優(yōu)225’雜交,獲得F1代,自交獲得F2:3分離群體。小麥白粉病生理小種E09由中國(guó)農(nóng)業(yè)科學(xué)院植物保護(hù)研究所麥類病害組提供。
對(duì)‘小白冬麥’和‘陜優(yōu)225’組合的F2:3分離群體接種BgtE09進(jìn)行苗期(1到2葉期)抗病性鑒定,待對(duì)照組‘陜優(yōu)225’充分發(fā)病時(shí)對(duì)F2:3分離群體進(jìn)行鑒定,按照0~4級(jí)分級(jí)標(biāo)準(zhǔn)調(diào)查小麥白粉病反應(yīng)型[12]。
選取經(jīng)鑒定的F2:3免疫及近免疫(等級(jí)為0;和0)和高感(等級(jí)為4)兩個(gè)極端個(gè)體各50株,抗病親本‘小白冬麥’與感病親本‘陜優(yōu)225’各1株,分別取植株的第1片或第2片葉,液氮冷凍研磨,采用優(yōu)化的CTAB法[13]提取基因組DNA。用Nanodrop 1000紫外分光光度計(jì)檢測(cè)樣品:質(zhì)量濃度≥30 ng/μL,OD260/280為1.8~2.2, 10 g/L的瓊脂糖凝膠電泳檢測(cè)DNA質(zhì)量。
根據(jù)小麥的基因組大小以及GC含量等信息,以小麥CSS(Chromosome survey sequence)基因組(http://plants.ensembl.org/Triticum_aestivum/Info/Annotation/)作為參考基因組(IWGSC,2014),并組裝到染色體水平(ftp://ftp.ensemblgenomes.org/pub/plants/release30/ fasta/Triticumaestivum/dna/)。
為評(píng)估酶切試驗(yàn)方案的準(zhǔn)確性,選用水稻(Oryzasativa)作為對(duì)照進(jìn)行測(cè)序。通過對(duì)照(水稻)測(cè)序數(shù)據(jù)的評(píng)估監(jiān)控試驗(yàn)過程是否正常,確定酶切方案實(shí)施的有效性(http://rapdb. dna.affrc.go.jp/)。文庫(kù)質(zhì)檢合格后用Illumina HiSeqTM,PE125bp進(jìn)行測(cè)序。對(duì)得到的序列進(jìn)行GC含量、Q30以及原始reads進(jìn)行分析,以保證測(cè)序質(zhì)量。
利用Dual-index[14]對(duì)測(cè)序原始數(shù)據(jù)進(jìn)行識(shí)別,得到各個(gè)樣品的reads。過濾測(cè)序reads的接頭后,進(jìn)行測(cè)序質(zhì)量和數(shù)據(jù)量評(píng)估。通過將reads與參考基因組比對(duì),在親本和混池中開發(fā)SLAF標(biāo)簽,尋找在親本中存在多態(tài)性的SLAF標(biāo)簽和在reads覆蓋區(qū)域的SNP。利用歐氏距離(Euclidean Distance,ED)關(guān)聯(lián)分析和SNP-index關(guān)聯(lián)分析兩種方法,獲得與性狀緊密關(guān)聯(lián)的位點(diǎn),并根據(jù)關(guān)聯(lián)閾值確定候選區(qū)域。
依據(jù)中國(guó)春IWGSC RefSeq v1.0基因組(IWGSC,2018)(https://wheat-urgi.versailles.inra.fr/ Seq-Repository/Assemblies)獲得候選區(qū)域位置?;蚬δ軈⒄誌WGSC RefSeq v1.0注釋(https://urgi.versailles.inra.fr/download/iwgsc/IWGSC_RefSeq_Annotations/v1.0/),在候選區(qū)域內(nèi)篩選出含有核苷酸結(jié)合位點(diǎn)(Nucleotide binding site,NBS)或富亮氨酸(Leucine rich repeat,LRR)等抗病基因保守結(jié)構(gòu)域的基因。利用小麥表達(dá)數(shù)據(jù)庫(kù)expVIP[15-16](http://www.wheat-expression.com/)進(jìn)行候選基因表達(dá)分析并用HemI軟件制作熱圖。
圖1 親本‘小白冬麥’和‘陜優(yōu)225’ 接種Bgt E09后第8天的表型Fig.1 Phenotype of resistant parent ‘Xiaobaidongmai’ and susceptible parent ‘Shaanyou 225’ on 8th day post-inoculation with Bgt isolate E09
通過SLAF文庫(kù)構(gòu)建和高通量測(cè)序,88.61 M的數(shù)據(jù)被開發(fā),其中雙端作圖reads占 73.6%,單端作圖reads占9.07%,非作圖reads占17.33%。Q30的比例為87.87%~ 89.38%,平均比率為88.53%,GC含量為 45.72%。SLAF標(biāo)記在每個(gè)染色體上分布均勻且完整性和準(zhǔn)確性高。利用參考基因組開發(fā)31 090個(gè)SLAF標(biāo)簽。根據(jù)基因組SLAF-Seq定位的數(shù)據(jù),獲得每個(gè)染色體上SLAF標(biāo)簽數(shù)量(表2)。依據(jù)等位基因分析和基因序列之間的差異,其中99 990個(gè)具有多態(tài)性,SLAF多態(tài)率為32.16%。SLAF標(biāo)簽的雙親平均測(cè)序深度為30.07x,混合池為65.42x。
表1 抗白粉病基因mlxbd的遺傳分析Table 1 Genetic analysis of powdery mildew resistance gene mlxbd
表2 每個(gè)染色體上SLAF標(biāo)簽和SNP標(biāo)記的分布統(tǒng)計(jì)Table 2 Distribution statistics of SLAF labels and SNP markers on each chromosomes
SNP標(biāo)記在每個(gè)染色體上分布良好且完整性和準(zhǔn)確性高。SNP的檢測(cè)主要使用GATK軟件工具包[17]實(shí)現(xiàn),不同染色體上的SNP標(biāo)記分布如表2。
在關(guān)聯(lián)分析之前,首先對(duì)2 069 543個(gè)低質(zhì)量的SNP進(jìn)行過濾,過濾多個(gè)基因型的SNP位點(diǎn) 3 938個(gè),其次過濾reads支持度小于4的SNP位點(diǎn)1 496 393個(gè),再次過濾混池之間基因型一致的SNP位點(diǎn)270 832個(gè)以及隱性混池基因不是來自于隱性親本的SNP位點(diǎn)198 390個(gè),最終得到高質(zhì)量可信SNP位點(diǎn)99 990個(gè)用于后續(xù)關(guān)聯(lián)分析。
通過歐氏距離算法[17],共有99 990個(gè)候選多態(tài)性SLAFs標(biāo)簽用于關(guān)聯(lián)分析,關(guān)聯(lián)閾值為 0.08(圖2)。依據(jù)關(guān)聯(lián)結(jié)果,在染色體7B上共得到2個(gè)關(guān)聯(lián)區(qū)域,總長(zhǎng)度為18.47 Mb。
通過SNP_index方法[18-19],對(duì)99 990個(gè)候選多態(tài)性SLAFs標(biāo)簽進(jìn)行關(guān)聯(lián)分析,關(guān)聯(lián)閾值為0.67(圖3)。依據(jù)關(guān)聯(lián)結(jié)果,在染色體2B、3B和7B上共得到6個(gè)區(qū)域,總長(zhǎng)度為37.04 Mb。
取兩種關(guān)聯(lián)方法交集,將其縮小到染色體7B的3個(gè)候選區(qū)域內(nèi)(表3)。對(duì)候選區(qū)域內(nèi)開發(fā)的SLAF標(biāo)簽進(jìn)行分析,發(fā)現(xiàn)有788個(gè)SNP和47個(gè)InDel。
通過關(guān)聯(lián)分析,候選區(qū)域被定位在小麥染色體7BL上220 006 508~245 380 515[(參照小麥CSS(Chromosome survey sequence)基因組(IWGSC,2014)],將其對(duì)應(yīng)到‘中國(guó)春’IWGSC RefSeq v1.0基因組(IWGSC,2018)上,位置是611 088 744~723 157 603,包含3 043個(gè)基因(高置信度基因1 134個(gè)(TraesCS7B01G353300.1~Traes CS7B01G466600.1)和低置信度基因 1 909個(gè)(TraesCS7B01G590100LC.1~TraesCS7B 01G780900LC.1),其中含有NBS或LRR抗病結(jié)構(gòu)域的基因109個(gè)。利用轉(zhuǎn)錄組數(shù)據(jù)庫(kù)(expVIP)對(duì)候選基因的表達(dá)情況進(jìn)行分析,發(fā)現(xiàn)56個(gè)基因受白粉病菌誘導(dǎo),其中42個(gè)基因在接種后上調(diào)表達(dá),14個(gè)基因在接種后下調(diào)表達(dá)(圖4)。
橫坐標(biāo)代表染色體名稱,彩色的點(diǎn)代表每個(gè)SNP位點(diǎn)的ED值,黑色的線為擬合后的ED值,紅色的線代表顯著性關(guān)聯(lián)閾值。ED值越高,代表該點(diǎn)關(guān)聯(lián)效果越好 X-axis represents wheat chromosomes and colored dots represents the ED value of each SNP locu.Black lines show all fitting results of ED,red lines show the threshold of ED. The larger the ED value is,the stronger the association is.
圖2 ED關(guān)聯(lián)分析在染色體上的分布結(jié)果
Fig.2 Distribution results of ED association analysis on chromosomes
橫坐標(biāo)代表染色體名稱,彩色的點(diǎn)代表計(jì)算出來的ΔSNP-index值。黑色線為擬合后的ΔSNP-index,紅色線為ΔSNP-index的關(guān)聯(lián)閾值,ΔSNP-index值越高,代表該點(diǎn)關(guān)聯(lián)效果越好 X-axis represents wheat chromosomes and the colored dots represent the SNP-index value. The black lines show all fitting results of ΔSNP-index,the red lines show the threshold of ΔSNP-index. The larger the ΔSNP-index value is,the stronger the association is.
圖3 SNP-index關(guān)聯(lián)分析在染色體上的分布結(jié)果
Fig.3 Distribution results of SNP-index association analysis on chromosomes
表3 兩種關(guān)聯(lián)分析結(jié)果交集的信息統(tǒng)計(jì)Table 3 Intersection Information statistics of two association analysis results
結(jié)合mlxbd和mlmz的遺傳連鎖圖譜[20-21],將mlxbd基因定位在Xgwm611和Xgwm577之間。根據(jù)側(cè)翼標(biāo)記,進(jìn)一步縮小候選區(qū)域,對(duì)應(yīng)‘中國(guó)春’IWGSC RefSeq v1.0基因組(IWGSC,2018)位置是700 631 952~711 234 115,包含高置信度基因157個(gè)(TraesCS7B01G432900.1 ~TraesCS7B01G448500.1),低置信度基因191個(gè) (TraesCS7B01G735300LC.1~TraesCS7B01 G754300LC.1),其中含有NBS或LRR抗病結(jié)構(gòu)
域基因9個(gè)(表4)。在小麥表達(dá)數(shù)據(jù)庫(kù)中,基因TraesCS7B01G440800.1在白粉病菌誘導(dǎo)后下調(diào)表達(dá),基因TraesCS7B01G437300.1、TraesCS7 B01G437400.1、TraesCS7B01G441600.1和TraesCS7B01G441700.1在白粉病菌誘導(dǎo)后上調(diào)表達(dá)(圖4)。
Pm5(Pm5a~Pm5e)是所有抗白粉病位點(diǎn)中唯一一個(gè)隱性復(fù)等位基因位點(diǎn)。其中Pm5a~Pm5c并沒有進(jìn)行精細(xì)定位及遺傳圖譜構(gòu)建[22];而Pm5d被定位在染色體7BL遠(yuǎn)端區(qū)域,有6個(gè)微衛(wèi)星標(biāo)記與其緊密連鎖,其中側(cè)翼標(biāo)記為Xgwm611和Xgwm577,遺傳距離分別為2.1 cM和2.0 cM[23];Pm5e被Huang等[24]發(fā)現(xiàn)由7個(gè)分子標(biāo)記與其緊密連鎖,其中兩個(gè)共顯性標(biāo)記Xgwm783和Xgwm1267相對(duì)較近,兩側(cè)遺傳距離分別為11.0 cM和6.6 cM。除Pm5復(fù)等位基因外,許多重要的抗白粉病基因也被定位在小麥染色體7BL遠(yuǎn)端區(qū)域上,如mlxbd[20]、mlmz[21]、PmH[22]、PmTm4[25]、PmHYM[26]、PmBYYT[27]和PmSGD[28],其中PmTm4、PmHYM、PmBYYT和PmSGD已被精細(xì)定位。已有研究表明,在小麥7BL染色體上Pm5位點(diǎn)可能存在更多復(fù)等位基因或抗白粉病基因簇[29]。
圖4 候選區(qū)域內(nèi)抗病基因在接種Bgt E09后的表達(dá)分析Fig.4 Expression analysis of resistance genes (56 genes) in candidate regions after inoculation with Bgt isolate E09
基因名 Gene name染色體位置 Chromosome position功能注釋 Functional annotation TraesCS7B01G735900LC.1chr7B:700 820 349..700 821 167Leucine-rich repeat receptor-like protein TraesCS7B01G740600LC.1chr7B:703 703 155..703 706 321Disease resistance family protein/LRR family protein TraesCS7B01G437300.1chr7B:703 714 206..703 718 796 Disease resistance protein RPM1 TraesCS7B01G437400.1chr7B:703 719 566..703 723 769Disease resistance protein (NBS-LRR class) family TraesCS7B01G440800.1chr7B:706 083 250..706 090 834Disease resistance protein (TIR-NBS-LRR class) family TraesCS7B01G441600.1chr7B:706 808 371..706 811 012NBS-LRR resistance-like protein TraesCS7B01G441700.1chr7B:706 811 897..706 816 722Disease resistance protein (NBS-LRR class) family TraesCS7B01G748500LC.1chr7B:708 846 276..708 855 429Disease resistance protein RPM1 TraesCS7B01G748600LC.1chr7B:708 866 559..708 867 224Disease resistance protein RPM1
隨著SLAF-Seq、BSR-Seq(Bulked segregant RNA-Seq)、GBS (Genotyping-by-sequencing)以及外顯子捕獲等技術(shù)的出現(xiàn),越來越多的SNP標(biāo)記被開發(fā),并被廣泛應(yīng)用于小麥各項(xiàng)研究中[5,28,30-31]。本研究基于SLAF-Seq技術(shù)在候選區(qū)域內(nèi)開發(fā)788個(gè)SNP和47個(gè)InDel。薛飛等[20]研究表明,‘小白冬麥’和‘唐麥4號(hào)’抗譜相同,且都位于Pm5位點(diǎn)附近區(qū)域,推測(cè)mlxbd和PmTm4可能含有相同的白粉病抗性基因。PmTm4基因[25]最近的側(cè)翼標(biāo)記為WGGC6892和WGGC5746。本研究通過SLAF測(cè)序發(fā)現(xiàn),在WGGC6892和WGGC5746之間的SNP和InDel分別為15個(gè)和2個(gè),這些SNP和InDel將有助于進(jìn)一步精細(xì)定位抗白粉病基因mlxbd。
隨著新技術(shù)和新方法的不斷出現(xiàn)和成熟,二代測(cè)序技術(shù)的成本急劇下降,一方面加快傳統(tǒng)圖位克隆的進(jìn)程,另一方面也可以作為圖位克隆的補(bǔ)充技術(shù),將大大促進(jìn)小麥未知基因的克隆和功能研究。隨著‘中國(guó)春’小麥全基因組測(cè)序的完成[32],小麥基因組研究已進(jìn)入一個(gè)全新的時(shí)代。Thind等[33]利用TACCA(Targeted chromosome based cloningvia long-range assembly)技術(shù)快速構(gòu)建抗葉銹病基因Lr22a精細(xì)遺傳圖譜,并獲得4個(gè)NLR類型的候選基因,最終結(jié)合單倍型及EMS突變體確定目標(biāo)基因NLR1。Xing等[34]采用抗病基因富集測(cè)序技術(shù)(RenSeq),合理運(yùn)用靶序列富集,克隆到Pm21小麥抗白粉病基因。Arora等[35]結(jié)合關(guān)聯(lián)分析和抗病基因捕捉測(cè)序,開發(fā)AgRenSeq(Associationgenetics with R gene enrichment sequencing)技術(shù),在短時(shí)間內(nèi)同時(shí)克隆多個(gè)稈銹病(Stem rust,Sr)抗病基因。Steuernagel等[36]利用MutRenSeq方法(結(jié)合化學(xué)誘變、外顯子捕捉和高通量測(cè)序分析)從六倍體小麥中快速克隆兩個(gè)稈銹病抗病基因Sr22和Sr45。Snchez-Martín等研發(fā)出染色體分離測(cè)序技術(shù)(MutChromSeq),分別對(duì)大麥無(wú)蠟質(zhì)基因(Eceriferum-q,位于2H染色體)和小麥Pm2(位于5D染色體)抗白粉病基因的突變體進(jìn)行分離測(cè)序,驗(yàn)證了此方法的有效性[37],為快速克隆目標(biāo)基因奠定基礎(chǔ)。本研究中,通過SLAF-Seq、‘中國(guó)春’IWGSC RefSeq v1.0參考基因組(IWGSC,2018)以及小麥表達(dá)譜數(shù)據(jù)庫(kù)確定mlxbd基因的候選區(qū)間。其中9個(gè)基因含有NBS或LRR抗病結(jié)構(gòu)域,4個(gè)基因在白粉病菌誘導(dǎo)后表達(dá)增強(qiáng),可能是mlxbd的候選基因。然而,在不同品種之間,不僅所含抗病基因不同,且存在候選基因缺失的情況。因此,進(jìn)一步精細(xì)定位抗病基因以及構(gòu)建抗白粉病基因所在染色體區(qū)域的飽和分子遺傳連鎖圖,將為更好的利用現(xiàn)有抗源,以及深入了解mlxbd基因和Pm5位點(diǎn)的關(guān)聯(lián)性提供理論 依據(jù)。