劉淑娟 ,朱 艷 ,張曉軍 ,李 欣 ,郭慧娟 ,暢志堅 ,喬麟軼
(1.山西大學(xué)生物工程學(xué)院,山西太原 030006;2.山西省農(nóng)業(yè)科學(xué)院作物科學(xué)研究所,作物遺傳與分子改良山西省重點實驗室,農(nóng)業(yè)部黃土高原作物基因資源與種質(zhì)創(chuàng)制重點實驗室,山西太原 030031)
谷類作物提供了人體每天所需20%的熱量和25%的蛋白(www.fao.org/faostat)。其中,小麥是最為重要的糧食作物。異源六倍體小麥的全基因組是由來自3個不同祖先、親緣關(guān)系較近的基因組組成,因此,存在大量同源的3個等位基因(大于85%)。與模式植物擬南芥(基因組大小130~140 Mb)和禾谷類模式植物水稻(基因組大小400 Mb)相比,小麥的基因組較大,為17 Gb。除了在模式體系中需要較小基因組外,基因發(fā)現(xiàn)策略的一個重要組成部分依賴于植物的轉(zhuǎn)化效率,這2點使得其在基因組學(xué)的研究遠落后于水稻和玉米等二倍體作物[1]。隨著近年來測序技術(shù)和功能基因組學(xué)的飛速發(fā)展,以及基因組學(xué)研究方法的不斷改進和完善,為小麥基因組研究創(chuàng)造了機會,因而,小麥基因組學(xué)迎來了新的時代。
多倍體小麥主要有2種類型:四倍體栽培小麥(硬粒小麥,Triticum durum,AABB)和六倍體面包小麥(Triticum aestivum,AABBDD),二者祖先均為四倍體野生二粒小麥。早期野生二粒小麥經(jīng)馴化成為四倍體栽培小麥,與二倍體粗山羊草(Aegilops tauschii)雜交形成普通小麥[2]。鑒于小麥多倍體物種的同源性,存在于四倍體和六倍體小麥中的基因大部分呈現(xiàn)2~3個功能拷貝,稱為“同源”,編碼序列間的相似性高達97%。
缺乏完整的參考基因組一直限制著小麥測序的研究進展[3]。最初致力于用long-insert法構(gòu)建個體染色體BAC文庫。隨著第2代測序技術(shù)的出現(xiàn),可以對全基因組或單染色體臂進行鳥槍法測序。盡管這是個階段性成果,但數(shù)百萬個contigs仍是高度片段化的。自2017年起,公共和私人領(lǐng)域的組裝技術(shù)有了質(zhì)的飛躍[4-5],使六倍體小麥“中國春”的參考基因組組裝到了其21條染色體上。
小麥的研究領(lǐng)域已進入“后中國春”時代,即實現(xiàn)了對不同小麥品種進行快速且低成本的完整測序和組裝。該技術(shù)已經(jīng)用于小麥祖先品種和栽培品種中,已新公布了5個小麥品種:Robigus,Paragon,Claire,Cadenza和Kronos。盡管與中國春相比,這些品種數(shù)據(jù)庫的組裝序列較少,但包含了大量的編碼蛋白質(zhì)序列,可對其進行詳細的功能分析。2017年小麥基因組研究領(lǐng)域從擁有一個高度片段化的單一參考基因組到擁有一個麥族泛基因組,包括了大麥、小麥和多個祖先種的全基因組數(shù)據(jù)以及15個四倍體和六倍體小麥品種的重測序數(shù)據(jù)。
隨著小麥參考基因組序列的不斷改進,可以對這些序列進行額外的注釋,在已測序完成的幾個小麥品種中,最初的基因注釋側(cè)重于描述小麥啟動子區(qū)DNA的甲基化模式。這些模式在同源群間大都是保守的,只有少部分存在基因組特異性[6]。RNA測序分析結(jié)果也顯示,整體上不存在單個基因組優(yōu)勢,盡管在某種細胞類型或某個特異階段確實觀察到一定程度的基因組特異現(xiàn)象。最近發(fā)布了一套基于PacBio cDNA reads技術(shù)改進的編碼蛋白和長非編碼RNA的基因注釋[4],這將有利于鑒定出那些具有重要農(nóng)藝性狀的完整基因家族。另外,這些注釋已被用于比對400多個公共RNA-seq樣本數(shù)據(jù),從而完善小麥的基因表達圖譜[7-8]。
此外,改進的基因組和基因注釋[9]為研究選擇壓力在不同倍性水平下對同源基因的作用提供了可能。這將更好的理解編碼和非編碼序列(如啟動子)的進化過程、表觀遺傳變化[6]和開放染色質(zhì)結(jié)構(gòu)[10],進而了解多倍體是如何將各自同源基因組的信息整合后呈現(xiàn)最終的表型。
中國春物理圖譜和多個品種重測序數(shù)據(jù)也為小麥育種提供了新的研究方法。例如,小麥科研人員和育種家已經(jīng)普遍將單核苷酸多態(tài)性標記(SNP)芯片技術(shù)用于研究[11],但這些SNP只是基于拼接不完全的短序列開發(fā),并被粗略地定位在很大的基因區(qū)域中[12]。而新的物理圖譜和多品種重測序數(shù)據(jù)將使得建立長序列的單倍型成為可能[13]。利用大規(guī)模的SNP數(shù)據(jù),可以鑒定出與重測序結(jié)果一致的基因組區(qū)段,而不一致的位點則可以用來預(yù)測新的單倍型。例如,2005—2018年英國推廣了118個小麥品種,其中69%的品種來源于1個親本,這個親本與已經(jīng)重測序的Cadenza,Robigus和Claire具有相關(guān)性。這類結(jié)果對于關(guān)聯(lián)分析[14]、圖位克隆、基因丟失和結(jié)構(gòu)重排診斷等研究都有很好的促進作用,此外還能確定基因的拷貝數(shù)變異,這對于一些重要調(diào)節(jié)基因(如 VRN-A1,Ppd-B1,CBF等)的功能變異是非常關(guān)鍵的。更重要的是,通過鑒定出目前優(yōu)良品種中的單倍型,可以據(jù)此有針對性的從小麥祖先種和地方種中發(fā)掘變異類型。這使得對那些在馴化過程中或20世紀小麥育種早期丟失的單倍型進行選擇和評估成為可能[15]。
在模式作物中,已經(jīng)可以用測序作圖的方法對控制質(zhì)量性狀或數(shù)量性狀的基因進行克隆[16]。而在多倍體小麥中,龐大基因組的測序費用高昂導(dǎo)致近幾年一直缺乏一個完整的參考基因組圖譜,使得在該領(lǐng)域落后于模式作物。而大部分精力都集中在簡化基因組上,研究對象就是那些基于RNA-seq[17-18],DNA捕獲[19-20]或測序分型得到的特定序列。這些方法最初被用于自然變異定位,最近則擴展到誘變突變?nèi)后w中的多態(tài)性鑒定。這些基于構(gòu)建突變?nèi)后w的方法被統(tǒng)稱為“突變基因組學(xué)”[21],為在小麥等龐大復(fù)雜的基因組中發(fā)現(xiàn)變異類型提供了一個新的思路。例如,最早為抗病基因[21-22]開發(fā)的外顯子捕獲平臺(主要是抗病基因)已被用于對大量突變體中的DNA進行捕獲和測序,從而診斷出目標基因的隱性等位基因。而為了避免那些無法預(yù)測的新基因類型還開發(fā)了基于染色體的研究方法。這些方法已經(jīng)在多倍體小麥被證實對那些由單基因控制的功能缺失表型非常有價值,但是對于大部分復(fù)雜性狀,NGS遺傳學(xué)可能不具有很高的效率。
與二倍體模式物種相比,小麥中一直缺乏反向遺傳中用于驗證基因功能的材料。這是由于小麥同源群之間序列的高度相似性,隱性等位基因的效應(yīng)被其他同源群的等位變異所掩蓋,緩沖了小麥中正常的自然變異。當(dāng)然,這種掩蓋效應(yīng)也使小麥獲得了比二倍體物種更耐受高突變密度的能力[2]。然而,這種冗余也提供給多倍體小麥一種與二倍體物種相比的高突變密度的持續(xù)耐受力。高蘭英等[23-24]最近開發(fā)了一套用于小麥功能基因組學(xué)分析的新材料。他們對2 735份EMS誘導(dǎo)的四倍體小麥(Kronos)突變體和六倍體小麥(Cadenza)突變體材料進行DNA外顯子捕獲測序,從編碼區(qū)鑒定出1 000多萬個高度可信(P>0.99)的突變位點,平均每個四倍體和六倍體小麥中分別有2 705,5 351個突變位點,然后將66%的突變位點進行了定位。進一步研究發(fā)現(xiàn),大約有3%的突變造成了讀碼框提前終止或轉(zhuǎn)錄本錯誤剪接,而有38%的突變?yōu)殄e義突變。
除了突變?nèi)后w以外,基因編輯技術(shù)的進步同樣為多倍體小麥中基因的缺失驗證提供了新途徑。WANG等[25]利用類轉(zhuǎn)錄激活因子效應(yīng)核酶技術(shù)(Transcription activator-like effector nucleases,TALENs)首次同時下調(diào)了小麥MLO的3個同源拷貝,從而使植株表現(xiàn)出對白粉病的抗性。隨后,他們又運用最新的CRISPR/Cas9技術(shù)實現(xiàn)了同樣的實驗結(jié)果。此外,病毒誘導(dǎo)基因沉默技術(shù)(virus induced gene silencing,VIGS)[26]和 RNA 干涉技術(shù)(RNA-interference,RNAi)也被充分應(yīng)用在小麥的功能驗證中。
毫無疑問,目前取得的進展將在未來幾年內(nèi)大大促進小麥研究。目前人們已經(jīng)可以分離出定位圖譜區(qū)間內(nèi)的所有基因序列,并能通過分析數(shù)百個RNA-seq樣本來驗證這些序列的表達模式,還能比對基因在不同品種間的序列差異來確定單倍型,甚至可以在幾天內(nèi)通過篩選突變體庫來驗證功能。這些進展有助于快速、準確地檢測小麥品種資源所攜帶的基因,并將用于抗病、優(yōu)質(zhì)小麥品種和遺傳材料的選育,可大大加快育種步伐[11]。面對不斷更新的基因組數(shù)據(jù)和資源,需要科研人員和育種家加強學(xué)科交流,有效地將基因組學(xué)與大田育種相結(jié)合,從而更快更好的將小麥科研的最新成果盡快轉(zhuǎn)化為農(nóng)民和消費者需要的優(yōu)良小麥品種。
[1]代君麗,李振岐.小麥的比較基因組學(xué)和功能基因組學(xué)[J].西北植物學(xué)報,2004,24(5):949-953.
[2] DUBCOVSKY J,DVORAK J.Genome plasticity a key factor in the success of polyploid wheat under domestication [J].Science,2007,316:1862-1866.
[3]凌宏清.小麥及其近緣種基因組測序研究進展與發(fā)展趨勢[J].麥類作物學(xué)報,2016,36(4):397-403.
[4]CLAVIJO B J,VENTURINI L,SCHUDOMA C,et al.An improved assembly and annotation of the allohexaploid wheat genome identifies complete families of agronomic genes and provides genomic evidence for chromosomal translocations [J].Genome Research,2017,27(5):885.
[5]POZNIAK C.IWGSC whole genome shotgun sequencing of Chinese Spring:towards a reference sequence of wheat[C]//Plant and animal genome XXIV.San Diego:The International Wheat Genome SequencingConsortium,2016.
[6]GARDINER L J,QUINTON M,OLOHAN L,et al.A genome-wide survey of DNA methylation in hexaploid wheat[J].Genome Biol,2015,16:273.
[7] BORRILL P,RAMIREZ R,UAUY C.expVIP:a customizable RNA-seq data analysis and visualisation platform[J].Plant Physiol,2016,170:2172-2186.
[8] PEARCE S,VAZQUEZ H,HERIN S Y,et al.WheatExp:an RNA-seq expression database for polyploid wheat[J].BMC Plant Biol,2015,15:299.
[9]王長彪,韓斌,劉江,等.小麥相關(guān)功能基因的全基因組電子定位及基因注釋[J].山西農(nóng)業(yè)科學(xué),2016,44(7):894-899.
[10] RODGERS E,VERA D L,BASS H W,et al.Open chromatin reveals the functional maize genome[J].Proc Natl Acad Sci USA,2016,113:3177-3184.
[11]韓斌,王長彪,任永康,等.小麥分子育種研究進展IV.小麥相關(guān)分子標記[J].山西農(nóng)業(yè)科學(xué),2015,43(4):489-492.
[12] MASCHER M,MUEHLBAUER G J,ROKHSAR D S,et al.Anchoring and ordering NGS contig assemblies by population sequencing(POPSEQ)[J].Plant J,2013,76:718-727.
[13] JORDAN K W,WANG S,LUN Y,et al.A haplotype map of allohexaploid wheat reveals distinct patterns of selection on homoeologous genomes[J].Genome Biol,2015,16:48.
[14]HUANG X,HAN B.Natural variations and genome-wide association studies in crop plants[J].Annu Rev Plant Biol,2014,65:531-551.
[15]UAUY C,DISTELFELD A,F(xiàn)AHIMA T,et al.A NAC gene regulating senescence improves grain protein,zinc,andiron content in wheat[J].Science,2006,314:1298-1301.
[16]SCHNEEBERGER K.Using next-generation sequencing to isolate mutant genes from forward genetic screens[J].Nat Rev Genet,2014,15:662-676.
[17] RAMIREZ R H,SEGOVIA V,BIRD N,et al.RNA-Seq bulked segregant analysis enables the identification of high-resolution genetic markers for breedingin hexaploid wheat[J].Plant Biotechnol J,2015,13:613-624.
[18]TRICKM,ADAMSKI NM,MUGFORDSG,et al.CombiningSNP discoveryfromnext-generation sequencingdata with bulked segregant analysis(BSA)tofine-map genes in polyploid wheat[J].BMC Plant Biol,2012,12:14.
[19] GARDINERLJ,BANSEPTP,OLOHANL,etal.Map-ping-by-sequencing in complex polyploid genomes using genic sequence capture:a case study to map yellow rust resistance in hexaploid wheat[J].Plant J,2016,87:403-419.
[20]KING R,BIRD N,RAMIREZ R,et al.Mutation scanning in wheat by exon capture and next-generation sequencing[J].PLoS One,2015,10:e0137549.
[21] STEUERNAGEL B,PERIYANNAN S K,HERNANDEZ I,et al.Rapid cloning of disease-resistance genes in plants using mutagenesis and sequence capture [J].Nat Biotechnol,2016,34:652-655.
[22] JUPE F,WITEK K,VERWEIJ W,et al.Resistance gene enrichment sequencing(RenSeq)enables reannotation of the NB-LRR gene family from sequenced plant genomes and rapid mapping of resistance loci in segregating populations[J].Plant J,2013,76:530-544.
[23]高蘭英,馬慶.誘發(fā)突變技術(shù)在小麥育種研究中的應(yīng)用[J].山西農(nóng)業(yè)科學(xué),2009,37(6):7-12.
[24] KRASILEVA KV,VASQUEZ H,HOWELL T,et al.Uncovering hidden variation in polyploid wheat[J].Proc Natl Acad Sci USA,2017,114:912-913.
[25]WANGY,CHENGX,SHANQ,et al.Simultaneous editingofthree homoeoalleles in hexaploid bread wheat confers heritable resistance topowderymildew[J].Nat Biotechnol,2014,32:947-951.
[26]張鵬鈺,袁珍,王國瑞,等.普通小麥Trx59基因的克隆及功能驗證[J].華北農(nóng)學(xué)報,2017,32(5):1-6.