史晨琳,王長(zhǎng)彪,趙興華,劉 江,韓 斌,任永康,牛瑜琦,唐朝暉
(1.山西大學(xué)生物工程學(xué)院,山西太原030006;2.山西省農(nóng)業(yè)科學(xué)院生物技術(shù)研究中心,山西太原030031;3.山西省農(nóng)業(yè)科學(xué)院作物科學(xué)研究所,山西太原030031)
分子標(biāo)記在小麥遺傳育種中有著重要作用,主要體現(xiàn)在遺傳圖譜的構(gòu)建、基因標(biāo)記和定位、品種鑒定和指紋圖譜繪制、物種親緣關(guān)系和遺傳多樣性研究及分子標(biāo)記輔助育種等方面[1]。分子標(biāo)記包括兩類,一類是基于非PCR 技術(shù)或者雜交技術(shù),如RRFLP(限制片段長(zhǎng)度多態(tài)性);二類是基于PCR技術(shù)的任意引物或序列非特異技術(shù),如RAPD(隨機(jī)擴(kuò)增多態(tài)性DNA),AFLP(擴(kuò)增片段長(zhǎng)度多態(tài)性)和序列靶向PCR 技術(shù)(如SSR,SNPs)[2]。SSR 分子標(biāo)記在遺傳基礎(chǔ)較窄的普通小麥基因組中隨機(jī)分布,具有多位點(diǎn)、豐富的多態(tài)性、大部分位點(diǎn)有特異性,因此,在小麥的遺傳育種研究中已廣泛應(yīng)用[3-4]。
SCHULER[5]于1997 年第一次提出電子PCR(Electronic PCR,e-PCR)的概念,被用于DNA 片段染色體定位和基因組輔助作圖等方面[6]。電子克隆技術(shù)是指在已有的網(wǎng)絡(luò)資源和數(shù)據(jù)庫(kù)(EST、核苷酸數(shù)據(jù)庫(kù)、基因組數(shù)據(jù)庫(kù)等)中采用聚類、同源性檢索、序列拼裝等生物學(xué)方法,利用計(jì)算機(jī)技術(shù)來(lái)延伸EST 序列,從而得到部分或者全長(zhǎng)cDNA 序列的技術(shù)[7],具有簡(jiǎn)單、快速、成本低等特點(diǎn)[8]。
隨著小麥及其祖先種基因組測(cè)序工作的完成,產(chǎn)生了大量可分析數(shù)據(jù)[9]。多種基因預(yù)測(cè)軟件被用于預(yù)測(cè)各種生物基因結(jié)構(gòu)及功能[10],其中,F(xiàn)genesh可用于真核生物的預(yù)測(cè),直接對(duì)某生物的cDNA 序列或蛋白質(zhì)的相似性來(lái)預(yù)測(cè),準(zhǔn)確性極高[11]。Blast2go 是一種利用GO 功能注釋和分析的相似性搜索工具,便于對(duì)大批量功能基因組學(xué)信息進(jìn)行搜索[12]。通過大量的圖形和分析工具來(lái)處理數(shù)據(jù)[13],對(duì)基因或蛋白質(zhì)序列進(jìn)行功能注釋和分析,注釋時(shí)對(duì)每個(gè)基因或基因產(chǎn)物生成一個(gè)與之相關(guān)的GO 術(shù)語(yǔ)列表[14]。KEGG(Kyoto Encyclopedia of Genes and Genomes)即京都基因和基因組百科全書[15]。KEGG通路圖用圖形將基因、酶和各種代謝網(wǎng)絡(luò)信息相結(jié)合,每個(gè)代謝途徑構(gòu)成一個(gè)含有酶或EC 號(hào)的網(wǎng)絡(luò)[16]。作為一個(gè)豐富的生物信息學(xué)資源庫(kù),KEGG 是基因功能預(yù)測(cè)、尋找基因涉及的代謝途徑,挖掘代謝產(chǎn)物、基因、調(diào)節(jié)物質(zhì)三者間關(guān)系的重要工具[17]。
本研究通過從已發(fā)表文獻(xiàn)中尋找與小麥抗白粉病、抗銹病相關(guān)的特異性分子標(biāo)記,并進(jìn)行篩選,將其定位在六倍體中國(guó)春小麥和祖先種烏拉爾圖小麥、粗山羊草的全基因組數(shù)據(jù)庫(kù)中,對(duì)能夠成功定位的序列進(jìn)行功能預(yù)測(cè)、GO 功能注釋以及KEGG 分析,獲得與小麥白粉菌、銹菌互作過程中的基因表達(dá)信息,較全面認(rèn)識(shí)基因在抗性反應(yīng)網(wǎng)絡(luò)中基因間的相互關(guān)系,為揭示小麥病害的發(fā)病機(jī)理、發(fā)掘和克隆抗病新基因和開發(fā)分子標(biāo)記奠定基礎(chǔ)。
由山西省農(nóng)業(yè)科學(xué)院作物科學(xué)研究所提供的34 份小麥材料:中國(guó)春、烏拉爾圖小麥(Triticum urartu)、擬斯卑爾脫山羊草(Ae.Speltoides Tausch)、粗山羊草(Aogilops.tauschii)、野生一粒小麥(Triticum boeoticum Boiss)、Sy95-71、運(yùn)旱618、運(yùn)旱20410、銘賢169、晉麥47、晉麥66、98M71、Moro、先麥12、豐尤8 號(hào)、百農(nóng)121、鄭132、鄭369、阜0608、良星99、濟(jì)麥22、山農(nóng)20、中麥247、良星66、寧麥5 號(hào)、舜麥1718、百農(nóng)64、皖麥38、MY559、蘭考906、石家莊8 號(hào)、中麥175、長(zhǎng)6878、周麥28。
從已發(fā)表的相關(guān)文獻(xiàn)中尋找與小麥抗白粉病、銹病的相關(guān)分子標(biāo)記150 個(gè)。
1.2.1 標(biāo)記篩選 在Linux 平臺(tái)上將小麥抗病標(biāo)記在中國(guó)春及其祖先種烏拉爾圖小麥(Triticum urartu)、粗山羊草(Aogilops.tauschii)中進(jìn)行電子定位,確定其在染色體上的實(shí)際位置。再通過PAGE 篩選,篩選出41 個(gè)對(duì)小麥高感材料與高抗材料特異性的分子標(biāo)記。
1.2.2 生物信息學(xué)分析 對(duì)能成功進(jìn)行電子定位的位點(diǎn),提取兩翼各2 000 bp 的序列,進(jìn)行了電子克隆。使用Fgenesh 對(duì)相關(guān)定位位點(diǎn)的兩翼序列進(jìn)行功能基因預(yù)測(cè)。為了深入的研究小麥相關(guān)抗病基因的分子機(jī)理和功能,使用Blast2go 軟件對(duì)獲得的功能基因進(jìn)行基因的GO 功能注釋及KEGG 的代謝途徑分析。
統(tǒng)計(jì)電子定位結(jié)果,其中分別定位在六倍體小麥的2B 染色體,烏拉爾圖小麥(Triticum urartu)的2 號(hào)染色體,粗山羊草(Aogilops.tauschii)的2 號(hào)染色體上的最多。同一標(biāo)記定位在不同染色體上,或者同一染色體不同位置。
對(duì)能夠成功定位位點(diǎn)的上游和下游分別提取2kb 的基因組序列,使用在線基因預(yù)測(cè)軟件Fgenesh對(duì)提取到的基因組序列進(jìn)行基因預(yù)測(cè),共預(yù)測(cè)出96個(gè)功能基因。
用B1ast2go 軟件把預(yù)測(cè)到的96 個(gè)功能基因的DNA 序列進(jìn)行GO 功能注釋,其中,成功注釋的有60 個(gè)序列,未成功注釋的有36 個(gè)。注釋結(jié)果共有58 條術(shù)語(yǔ)信息:參與生物學(xué)途徑(P)的有24 條,占41.38%;細(xì)胞組件(C)的10 條,占17.24%;分子功能(F)的有24 條,占41.38%。功能基因二級(jí)水平的GO 注釋如圖1 所示。
2.3.1 分子功能(F)GO 術(shù)語(yǔ)分析 參與分子功能(F)的功能基因有54 個(gè),分子功能二級(jí)水平包括結(jié)合、催化活性、營(yíng)養(yǎng)庫(kù)活性以及轉(zhuǎn)運(yùn)活性4 種反應(yīng)類型,其中,參與結(jié)合(42.2%)和催化活性(35.6%)這2 種類型中的功能基因占多數(shù),說明細(xì)胞內(nèi)正?;顒?dòng)離不開包括催化活性、雜環(huán)化合物結(jié)合、有機(jī)環(huán)狀化合物結(jié)合、離子結(jié)合、轉(zhuǎn)移酶活性、核酸結(jié)合、催化活性,作用于蛋白質(zhì)、營(yíng)養(yǎng)庫(kù)活性等。其具體結(jié)果如圖2 所示。
2.3.2 生物學(xué)途徑(P)GO 術(shù)語(yǔ)分析 參與生物學(xué)途徑的共有51 個(gè)功能基因,生物學(xué)途徑(P)二級(jí)水平中包括代謝過程、細(xì)胞反應(yīng)、定位、細(xì)胞成分或生物發(fā)育、刺激反應(yīng)、多生物反應(yīng)、生物過程調(diào)控以及生物調(diào)控8 種途徑類型。8 種途徑中參與代謝過程(29.0%)、細(xì)胞過程(26.9%)的功能基因最多。代謝途徑在植物與病原菌長(zhǎng)期的共同進(jìn)化過程中產(chǎn)生的復(fù)雜免疫系統(tǒng)中有著重要的作用,代謝過程中產(chǎn)生一系列產(chǎn)物,如水楊酸、植物凝集素以及次生代謝產(chǎn)物植保素、木質(zhì)素、胼胝質(zhì),這些物質(zhì)具有抵抗各種病原微生物入侵等提高植物抗病性的特點(diǎn)。這些基因參與細(xì)胞正常生命活動(dòng),在細(xì)胞增殖、分化、凋亡、遷移過程中起到重要的調(diào)控作用。其具體結(jié)果如圖3 所示。
2.3.3 細(xì)胞組件(C)GO 術(shù)語(yǔ)分析 參與細(xì)胞組件的相關(guān)功能基因共有59 個(gè)。細(xì)胞組件二級(jí)水平包括細(xì)胞組分、細(xì)胞、細(xì)胞器、膜、膜組分、蛋白復(fù)合物以上6 種反應(yīng)類型。其中,在細(xì)胞(24.5%)、細(xì)胞組分(24.5%)、細(xì)胞器(19.4%)參與的功能基因最多。植物細(xì)胞是其一系列生命活動(dòng)的結(jié)構(gòu)與功能的基本單位,從結(jié)構(gòu)方面,可分為細(xì)胞壁、質(zhì)膜、細(xì)胞核與細(xì)胞質(zhì)。細(xì)胞核是遺傳物質(zhì)儲(chǔ)存和復(fù)制的場(chǎng)所、對(duì)細(xì)胞整體代謝和發(fā)育起重要作用。植物細(xì)胞核中不同細(xì)胞器具有不同的作用,比如,葉綠體是植物細(xì)胞能進(jìn)行光合作用最重要的細(xì)胞器,線粒體是細(xì)胞進(jìn)行有氧呼吸的主要場(chǎng)所。這表明小麥功能基因的實(shí)現(xiàn)都是在細(xì)胞內(nèi)發(fā)生,離不開細(xì)胞內(nèi)各種細(xì)胞器和細(xì)胞組分的相互作用。其具體結(jié)果如圖4 所示。
用KEGG 數(shù)據(jù)庫(kù)對(duì)得到的96 個(gè)功能基因進(jìn)行代謝途徑分析,代謝KO 結(jié)果及對(duì)應(yīng)基因序列如表1 所示。
表1 代謝通路及基因序列
R35_chr2:c15247710-1524354 定義為乙醇脫氫酶(alcohol dehydrogenase,ADH,EC1.1.1.1),EC1.1.1.1 在原核生物、真菌、植物及動(dòng)物中高度保守,可以將乙醇與乙醛相互轉(zhuǎn)化,在抵御低氧、低溫、澇害、干旱和鹽脅迫等非生物脅迫過程中有著重要作用[18]。R56_Tu1:14506450-14510636-2 定義為過氧化物酶(peroxidase,EC:1.11.1.7),EC:1.11.1.7 功能多樣,在植物抗逆、生長(zhǎng)發(fā)育、遺傳育種、木質(zhì)素合成及其他生理過程中具有重要作用[19]。李華琴等[20]試驗(yàn)表明,小麥感病品種的過氧化物酶活性比抗病品種的顯著增強(qiáng),并且酶活性的增強(qiáng)與葉片癥狀相關(guān)聯(lián)。R48_5A:c702503970-702499760-1 定義為木葡聚糖內(nèi)糖基轉(zhuǎn)移酶基因(XET),XET 通過改變木葡聚糖的結(jié)構(gòu)引起細(xì)胞壁松弛,從而對(duì)植物生長(zhǎng)發(fā)育產(chǎn)生影響[21]。R07_6D:455131969-455136142-2(R07_chr6:479075589-479079762-2)定義為SWEET基因(sugarswilleventuallybeexported transporter),SWEET 家族參與宿主-病原菌之間的互作,但只有部分與病原菌互作的機(jī)理得到闡述,而病原菌特異性識(shí)別SWEET 基因的途徑是未知的[22]。植物進(jìn)化出用以監(jiān)控、抑制病原菌效應(yīng)子的R 基因,宿主R 基因與病原物致病性的無(wú)毒基因(Avr)相互作用下產(chǎn)生抗性,是引發(fā)宿主免疫反應(yīng)的前提。R60_5B:701460124-701464231 定義為RIN4,RIN4 在與植物病原菌相互作用中具有重要的作用,AvrRpm1 和AvrB 誘導(dǎo)RIN4 磷酸化,可能會(huì)增強(qiáng)RIN4 作為植物防御的負(fù)調(diào)節(jié)因子的活性,促進(jìn)病原菌的生長(zhǎng)[23]。代謝通路如圖5 所示。
本研究通過對(duì)篩選出的特異性分子標(biāo)記,對(duì)提取到的基因組序列進(jìn)行基因功能預(yù)測(cè)和注釋,再使用Fgenesh 預(yù)測(cè)出96 個(gè)功能基因,對(duì)獲得的基因序列進(jìn)行GO 功能注釋以及KEGG 代謝途徑分析。在GO 注釋結(jié)果中,生物學(xué)途徑(P)與分子功能(F)的GO 術(shù)語(yǔ)數(shù)目較多。在生物學(xué)途徑中,以代謝過程為主;細(xì)胞組件中,以在細(xì)胞和細(xì)胞器中起作用的為主;分子功能中,具有結(jié)合和催化活性功能的基因數(shù)目最多,說明獲得的功能基因主要通過在細(xì)胞內(nèi),各種物質(zhì)通過結(jié)合與催化功能進(jìn)行代謝活動(dòng)。KEGG 代謝通路分析得到了對(duì)應(yīng)的KO 代謝途徑及EC 編碼等相關(guān)信息。
其中,R35_chr2:c15247710-15243542、R60_5B:701460124-701464231、R07_6D:455131969-455136 142-2(R07_chr6:479075589-479079762-2)可能與抗病相關(guān)聯(lián);S5_2A:729575149-729597382-2(S5_chr2:575741567-575745800、S5_2D:595544071-59 5548304)、R48_5A:c702503970-702499760-1、R56_Tu1:14506450-14510636-2、R51_7B:c718434553-718430309-1(R51_Tu7:698386587-698390868-1)、020_2D:595544128-595548276(020_2B:72344079 5-723444943、020_chr2:575741624-575745772)與植物抗逆性以及生長(zhǎng)發(fā)育有關(guān)。
雖然通過生物信息手段預(yù)測(cè)到了和抗病相關(guān)的基因,但是這些基因在實(shí)際應(yīng)用是否和抗病關(guān)聯(lián),還需要進(jìn)一步進(jìn)行功能驗(yàn)證,這為下一步進(jìn)行小麥抗白粉病、銹病基因的定位及克隆、基因編輯和分子育種奠定了基礎(chǔ)。