巨偉,王紅日,薛春芝,龐亞男,吳德豪,郭憲峰,程敦公,韓冉,劉愛(ài)峰,李豪圣,劉建軍,曹新有,宋健民,訾妍
(1.山東省農(nóng)業(yè)科學(xué)院作物研究所,山東 濟(jì)南 250100;2.山東魯研農(nóng)業(yè)良種有限公司,山東 濟(jì)南 250100;3.菏澤市牡丹區(qū)種子資源開(kāi)發(fā)保護(hù)中心,山東 菏澤 274000)
轉(zhuǎn)錄組測(cè)序是解析生物經(jīng)濟(jì)性狀形成分子機(jī)制、發(fā)掘基因資源的重要手段之一[1],該技術(shù)為差異基因表達(dá)分析、功能基因和轉(zhuǎn)錄因子挖掘、等位基因特異性表達(dá)研究等提供了新的手段,尤其是對(duì)全面解析復(fù)雜性狀的遺傳調(diào)控網(wǎng)絡(luò)非常有效,已成功應(yīng)用于水稻、玉米、小麥、黃瓜、黃豆、番茄等多種作物研究。因此,獲得高質(zhì)量的轉(zhuǎn)錄組對(duì)于作為重要糧食作物之一的小麥具有重要的研究意義。近年來(lái),針對(duì)小麥抗旱、耐熱、抗病等性狀進(jìn)行了一些轉(zhuǎn)錄組研究,篩選出部分目的基因,并對(duì)篩選到的基因進(jìn)行了深入分析[2-5]。
小麥?zhǔn)称芳庸て焚|(zhì)是決定其生產(chǎn)應(yīng)用和市場(chǎng)競(jìng)爭(zhēng)力的關(guān)鍵因素,小麥品質(zhì)主要受蛋白、淀粉等籽粒主要成分理化特性的控制,而蛋白和淀粉的合成受一系列基因和調(diào)控因子的復(fù)雜網(wǎng)絡(luò)調(diào)控,因此利用RNA-Seq技術(shù)構(gòu)建不同面包、面條品質(zhì)類型典型品種籽粒轉(zhuǎn)錄組文庫(kù),篩選差異表達(dá)基因,發(fā)掘調(diào)控面包、面條品質(zhì)的關(guān)鍵基因和調(diào)控因子,解析小麥品質(zhì)形成的生理代謝機(jī)制和調(diào)控網(wǎng)絡(luò),對(duì)于指導(dǎo)我國(guó)小麥品質(zhì)遺傳改良具有重要意義。小麥品質(zhì)性狀非常復(fù)雜,過(guò)去研究多局限于單一或個(gè)別性狀的影響和調(diào)控分析,研究方法也多是統(tǒng)計(jì)分析,很少在全基因組水平全面解析小麥品質(zhì)的遺傳調(diào)控網(wǎng)絡(luò)。RNA-Seq技術(shù)的發(fā)展,為從轉(zhuǎn)錄組水平全面解析小麥品質(zhì)遺傳調(diào)控提供了可能。Yu等[6]通過(guò)動(dòng)態(tài)轉(zhuǎn)錄組分析,鑒定出8個(gè)對(duì)淀粉與蛋白質(zhì)合成以及壓力脅迫響應(yīng)相關(guān)的基因。利用我們前期研究中篩選出的6類有代表性的小麥材料:面包優(yōu)質(zhì)小麥、面包劣質(zhì)小麥、面條優(yōu)質(zhì)小麥、面條劣質(zhì)小麥、面包和面條兼優(yōu)小麥、面包和面條均劣小麥各2份,本研究利用RNA-Seq技術(shù)分析了其灌漿不同時(shí)期(開(kāi)花后7、17、27 d)的基因表達(dá)情況,以期篩選調(diào)控面包、面條品質(zhì)性狀的差異基因和調(diào)控因子,結(jié)合蛋白和淀粉理化特性篩選關(guān)鍵基因進(jìn)行qRT-PCR驗(yàn)證,這對(duì)全面解析小麥品質(zhì)遺傳調(diào)控網(wǎng)絡(luò)、促進(jìn)小麥品質(zhì)遺傳改良具有重要意義。
供試品種為6類12個(gè)小麥品種,分別是面包優(yōu)質(zhì)小麥(GB)JM4072、ZM12,面條優(yōu)質(zhì)小麥(GN)JM19、ZM18,面包劣質(zhì)小麥(BB)TN18、QF1,面條劣質(zhì)小麥(BN)LM1、LM19,面包面條均優(yōu)小麥(GBN)JM20、ZM366,面包面條均劣小麥(BBN)LM14、XM18。
試驗(yàn)于2014—2016年在山東省農(nóng)業(yè)科學(xué)院實(shí)驗(yàn)站(36°42′N、117°05′E)進(jìn)行。試驗(yàn)采用隨機(jī)區(qū)組設(shè)計(jì),播種密度為3×106株/hm2,行距25 cm,小區(qū)面積6 m2(4.0 m×1.5 m),重復(fù)3次。2014年10月和2015年10月播種,2015年6月和2016年6月收獲,均按高產(chǎn)田常規(guī)栽培措施管理。
1.2.1 樣本采集及RNA提取、純化 分別于花后7、17、27 d取同一天開(kāi)花的小穗中部籽粒,送至廣州基迪奧生物科技有限公司,利用Trizol法提取總RNA,采用DNaseⅠ(RNase-free)消化所得RNA樣本中的殘余DNA。
1.2.2 轉(zhuǎn)錄組測(cè)序 樣品提取總RNA后,經(jīng)富集、打斷、六堿基隨機(jī)引物(random hexamers)合成、末端修復(fù)、加堿基A、加測(cè)序接頭、PCR擴(kuò)增等過(guò)程制備測(cè)序文庫(kù),構(gòu)建好的文庫(kù)用Illumina-HiSeqTM進(jìn)行測(cè)序。
1.2.3 RNA-Seq質(zhì)量評(píng)估和序列比對(duì) 在全部測(cè)序結(jié)果中選擇錯(cuò)誤率小于1%的用于后續(xù)轉(zhuǎn)錄組分析,更嚴(yán)格過(guò)濾得到high quality clean reads,同時(shí)計(jì)算Q20和Q30。小麥參考基因組從http://www.wheatgenome.org/下載,選取HISAT軟件將過(guò)濾后的測(cè)序序列進(jìn)行基因組定位分析。樣本之間(包括3個(gè)生物學(xué)重復(fù))的基因表達(dá)水平則采用皮爾遜相關(guān)性檢測(cè)進(jìn)行分析。
1.2.4 差異基因篩選 將同一類型的兩個(gè)品種作為一組,進(jìn)行不同組間小麥品種的差異基因分析?;虮磉_(dá)量的計(jì)算采用FPKM(fragments per kilobase of exon per million fragments mapped reads)法[7]。使用DESeq R軟件包(1.18.0)[8]對(duì)不同類型小麥之間的差異表達(dá)基因進(jìn)行研究。當(dāng)FDR校正后的p值<0.05且時(shí)則認(rèn)為該基因表達(dá)差異顯著。
1.2.5 GO注釋和KEGG分析 Gene Ontology(簡(jiǎn)稱GO,http://www.geneontology.org/)富集分析采用軟件為GOseq[9],GO分為分子功能(molecular Function)、生物過(guò)程(biological process)和細(xì)胞組成(cellular component)三個(gè)部分。
KEGG(Kyoto Encyclopedia of Genes and Genomes,http://www.kegg.jp/)是系統(tǒng)分析基因功能、基因組信息數(shù)據(jù)庫(kù),分析內(nèi)容包括碳水化合物、核苷、氨基酸等的代謝及有機(jī)物的生物降解[10]。
1.2.6 qRT-PCR驗(yàn)證 為了驗(yàn)證RNA-Seq檢測(cè)出的基因表達(dá)水平是否正確,從RNA-Seq測(cè)序用總RNA中取出1μg用于qRT-PCR實(shí)驗(yàn)。使用Primer Premier 5軟件進(jìn)行引物設(shè)計(jì),引物序列由擎科生物技術(shù)有限公司合成,釆用PAGE純化(表1)。
使用羅氏公司的LightCycler 480Ⅱ進(jìn)行熒光定量PCR。熒光定量PCR反應(yīng)體系10μL包括:2×SYBR Premix Ex TaqⅠ5μL,正向引物與反向引物各0.5μL,cDNA 1μL,ddH2O 3μL。PCR程序?yàn)椋?5℃1 min預(yù)變性;40×(95℃15 s,55℃15 s,72℃15 s)收集熒光信號(hào);95℃1 s,60℃1 s,95℃1 s,37℃1 s為熔解曲線階段。采用2-ΔΔCt法[11]分析目的基因的相對(duì)表達(dá)量。
對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)過(guò)濾去除大量的測(cè)序接頭序列、低質(zhì)量的讀段、序列N的比例大于10%的reads,最終得到2 882 357 526條clean reads,每個(gè)樣本測(cè)序量超過(guò)10 G,達(dá)到文庫(kù)采樣深度的要求。質(zhì)量達(dá)到Q30級(jí)別的堿基占總堿基數(shù)的84%以上(表2)。51%以上的reads可以比對(duì)到參考基因組上,50%以上的reads能夠比對(duì)到唯一轉(zhuǎn)錄本上,2%左右的reads可比對(duì)到多個(gè)轉(zhuǎn)錄本上。且reads打斷隨機(jī)性好,在參考基因組各個(gè)位置分布均勻。比對(duì)到唯一轉(zhuǎn)錄本的reads可以用來(lái)進(jìn)行下一步的分析工作。
表2 RNA-Seq測(cè)序結(jié)果質(zhì)量評(píng)估
為了鑒別6類不同加工品質(zhì)小麥的差異表達(dá)基因(DEGs),對(duì)組間基因表達(dá)量進(jìn)行了比對(duì)分析。以同期GB小麥為對(duì)照,花后7 d共找到4 529個(gè)差異表達(dá)基因,其中有2 549、1 980個(gè)基因表達(dá)量分別呈上調(diào)和下調(diào);花后17 d共找到3 198個(gè)差異表達(dá)基因,其中有1 775、1 423個(gè)基因表達(dá)量分別呈上調(diào)和下調(diào);花后27 d共找到2 955個(gè)差異表達(dá)基因,其中,1 731、1 224個(gè)基因表達(dá)量分別呈上調(diào)和下調(diào)(圖1)。6類品種在花后7 d差異表達(dá)基因最多,其次是花后17 d,花后27 d最少,這可能是因?yàn)楣酀{前期籽粒膨大生長(zhǎng)階段差異基因較多。
圖1 不同類型小麥組間差異表達(dá)基因的維恩圖
發(fā)現(xiàn)花后7、17、27 d分別有1 743、1 195、981個(gè)DEGs在優(yōu)質(zhì)小麥(GN與GBN)中上調(diào),在劣質(zhì)小麥(BB、BN與BBN)中下調(diào),對(duì)差異表達(dá)的基因進(jìn)行GO功能分類分析發(fā)現(xiàn),三個(gè)時(shí)期差異基因均主要分布在生物過(guò)程(biological process)的metabolic process和cellular process、細(xì)胞成分(cell component)的cell和cell part以及分子功能(molecular function)的binding和catalytic activity中。
利用KEGG分析研究了與品質(zhì)相關(guān)的生物代謝通路。發(fā)現(xiàn)花后7 d篩選出的1 743個(gè)DEGs被富集到103條通路中,包括DNA及RNA的合成及轉(zhuǎn)運(yùn)、碳循環(huán)、氮代謝、氨基酸代謝、淀粉及糖代謝等,富集DEGs數(shù)目最多的代謝通路有:protein processing in endoplasmic reticulum(36)、starch and sucrose metabolism(22)、spliceosome(20)、plant-pathogen interaction(18)、RNA transport(17)(圖2A)?;ê?7 d篩選出的1 195個(gè)DEGs被富集到98條通路中,包括DNA及RNA的合成及轉(zhuǎn)運(yùn)、植物激素信號(hào)轉(zhuǎn)導(dǎo)、氨基酸的生物合成、碳循環(huán)等,富集DEGs數(shù)目最多的代謝通路有:RNA transport(15)、spliceosome(12)、biosynthesis of amino acids(12)、plant-pathogen interaction(12)(圖2B)?;ê?7 d篩選出的981個(gè)DEGs被富集到89條通路中,包括DNA及RNA的合成及轉(zhuǎn)運(yùn)、氨基酸生物合成、內(nèi)質(zhì)網(wǎng)蛋白合成、淀粉及糖代謝等,富集DEGs數(shù)目最多的代謝通路有:RNA transport(14)、protein processing in endoplasmic reticulum(10)、spliceosome(9)、biosynthesis of amino acids(9)、starch and sucrose metabolism(9)(圖2C)。
對(duì)蔗糖與淀粉代謝通路進(jìn)行研究發(fā)現(xiàn),在以GB為對(duì)照的條件下,花后7、17 d及27 d BB與GB、BBN與GB間淀粉合成通路中差異表達(dá)基因最多?;ê? d,相較于GB小麥,其他類型小麥下調(diào)差異基因較多,花后17 d與花后27 d,BB小麥與GN小麥均為上調(diào)基因較多,其他類型為下調(diào)基因較多(表3)。
圖2 花后7 d(A)、17 d(B)及27 d(C)差異表達(dá)基因KEGG富集分析
對(duì)淀粉與蔗糖代謝通路的差異表達(dá)基因進(jìn)行分析,以GB小麥為對(duì)照,從花后7 d的BB、GN、BN、GBN、BBN品種中分別篩選到14、5、8、6和12個(gè)差異表達(dá)基因,從花后17 d的BB、GN、BN、GBN、BBN品種中分別篩選到14、4、6、4和4個(gè)差異表達(dá)基因,從花后27 d的BB、GN、BN、GBN、BBN品種中分別篩選到7、4、7、4和5個(gè)差異表達(dá)基因,主要涉及糖代謝過(guò)程中的蔗糖合成酶(sucrose synthase,SuS,EC2.4.1.13)和轉(zhuǎn)化酶(invertase,INV,EC3.2.1.26)、蔗糖磷酸酯酶(sucrose phosphatase,SPP)、蔗糖磷酸合酶(sucrosephosphate synthase,SPS),淀粉代謝過(guò)程中的去分支酶(debranching enzyme,DBE)、α-淀粉酶(alpha-amylase,EC3.2.1.1)和 β-淀粉酶(beta-amylase,EC3.2.1.2)。
SPS基因花后7 d在BN小麥中上調(diào),花后17 d在BB小麥中下調(diào),花后27 d在GN、BN與BBN小麥中均上調(diào)。相反,SuS在花后7 d的BB、BN小麥中上調(diào),在GN與BBN中下調(diào),花后17 d的BB、GN、BN以及BBN小麥中均上調(diào),花后27 d的BB小麥中上調(diào);INV在花后7 d的BB、BN與GBN中均下調(diào),花后17 d在BB、BN和GBN小麥中均下調(diào),花后27 d在BB、GN、GBN、BBN小麥中均下調(diào)(表4—表6)。推測(cè)花后7 d GN小麥、GBN及BBN小麥蔗糖分解能力較弱;花后17 d GN小麥及BBN小麥蔗糖分解能力高于GB小麥;花后27 d GN、BN與BBN小麥的蔗糖合成能力高于GB小麥。
6-磷酸葡萄糖異構(gòu)酶(glucose-6-phosphate isomerase,GPI,EC5.3.1.9)基因在花后7、17、27 d的BB小麥中均上調(diào)。DBE基因在花后不同時(shí)期其他5類小麥中均上調(diào),推測(cè)與成熟期GB小麥總淀粉含量最低一致。α-淀粉酶和β-淀粉酶基因在花后7 d的BB小麥中下調(diào),但花后17 d BB小麥中的α-淀粉酶上調(diào),可以進(jìn)一步推測(cè)是成熟期支鏈淀粉含量低于GB小麥的原因之一。
表3 不同時(shí)期不同類型DEGs及與淀粉合成相關(guān)的DEGs匯總
表4 花后7 d與蔗糖和淀粉代謝通路相關(guān)的DEGs
表5 花后17 d與蔗糖和淀粉代謝通路相關(guān)的DEGs
表6 花后27 d與蔗糖和淀粉代謝通路相關(guān)的DEGs
為驗(yàn)證轉(zhuǎn)錄組測(cè)序結(jié)果的真實(shí)性,從淀粉合成通路中隨機(jī)挑選了7個(gè)候選基因(Traes_7BL_11C5C7BC4、Traes_7AS_7D1CD8641、Traes_3B_55B913FD2、Traes_6BL_C22DEC10D、Traes_2AL_0C8275227、Traes_6BL_FC54B7E8F和Traes_7DS_E488AA1F2)進(jìn)行qRT-PCR驗(yàn)證(圖3、4、5)。將驗(yàn)證結(jié)果與RNA-seq數(shù)據(jù)進(jìn)行相關(guān)性分析,兩者的相關(guān)系數(shù)較高且表達(dá)趨勢(shì)基本相同,表明RNA-Seq的分析結(jié)果可靠。
圖5 qRT-PCR驗(yàn)證花后27 d RNA-Seq結(jié)果
本研究采用RNA-Seq技術(shù)分析不同面包、面條品質(zhì)類型小麥在花后7、17、27 d的差異表達(dá)基因。以相同時(shí)期面包優(yōu)質(zhì)小麥為對(duì)照,分別發(fā)現(xiàn)4 529、3 198、2 955個(gè)差異表達(dá)基因。通過(guò)對(duì)不同加工品質(zhì)小麥差異表達(dá)基因的GO富集分析,發(fā)現(xiàn)不同類型小麥在淀粉代謝通路中的差異表達(dá)基因及其參與的生物過(guò)程以及本身的分子功能。與面包優(yōu)質(zhì)小麥進(jìn)行比較,不同類型小麥在花后不同時(shí)期差異表達(dá)的基因主要參與代謝過(guò)程、細(xì)胞生理過(guò)程、細(xì)胞、細(xì)胞組分、結(jié)合功能以及催化活性。對(duì)不同類型小麥的KEGG通路注釋結(jié)果發(fā)現(xiàn),不同類型小麥之間的差異表達(dá)基因在蛋白質(zhì)合成的內(nèi)質(zhì)網(wǎng)加工過(guò)程通路、淀粉和蔗糖代謝通路、剪接體通路、RNA轉(zhuǎn)錄通路、氨基酸合成通路以及核糖體通路等通路富集較多。
淀粉與蔗糖代謝在植物發(fā)育、抗逆反應(yīng)等多個(gè)生物學(xué)過(guò)程中發(fā)揮重要作用。小麥淀粉含量及特性對(duì)小麥品質(zhì)特別是面條品質(zhì)影響較大,培育面包面條兼優(yōu)小麥的其中一個(gè)思路即為在面包優(yōu)質(zhì)小麥的基礎(chǔ)上提高面條品質(zhì)。因此,我們重點(diǎn)對(duì)淀粉與蔗糖代謝通路進(jìn)行分析。對(duì)淀粉與蔗糖代謝通路的差異表達(dá)基因進(jìn)行分析,以面包優(yōu)質(zhì)小麥為對(duì)照,從花后7、17、27 d的面包劣質(zhì)、面條優(yōu)質(zhì)、面條劣質(zhì)、包條兼優(yōu)以及包條均劣品種分別篩選到一些差異表達(dá)基因,主要涉及糖代謝過(guò)程中的蔗糖合成酶(SuS)和轉(zhuǎn)化酶(INV)、蔗糖磷酸酯酶(SPP)、蔗糖磷酸合酶(SPS),淀粉代謝過(guò)程中的去分支酶(DBE)、α-淀粉酶和β-淀粉酶。在蔗糖代謝方面,蔗糖在蔗糖合酶和轉(zhuǎn)化酶調(diào)控下參與淀粉的合成[12],蔗糖磷酸酯酶和蔗糖磷酸合酶在蔗糖合成中起關(guān)鍵作用[13,14]。INV對(duì)蔗糖的水解作用是單向的,而SuS能可逆地催化蔗糖代謝,通常認(rèn)為SuS主要起水解蔗糖的作用。SPS在碳水化合作物代謝方面發(fā)揮重要作用,可以調(diào)控碳在淀粉合成和碳水化合物積累間的分配[15]。
催化6-磷酸果糖和6-磷酸葡萄糖相互轉(zhuǎn)化的6-磷酸葡萄糖異構(gòu)酶(GPI)[16]基因在花后7、17、27 d的BB小麥中均上調(diào),而6-磷酸葡萄糖是合成ADPG的重要物質(zhì)基礎(chǔ)[17],因此推測(cè)BB籽粒中ADPG的合成能力高于GB小麥,這與BB小麥具有最高的總淀粉及直鏈淀粉含量相符合。α-淀粉酶與β-淀粉酶是淀粉水解過(guò)程中的關(guān)鍵酶,其中α-淀粉酶可以水解淀粉內(nèi)部的α-1,4-糖苷鍵,β-淀粉酶能將直鏈淀粉分解為麥芽糖;淀粉脫支酶(DBE)專一水解α-1,6-糖苷鍵,支鏈淀粉經(jīng)淀粉酶水解產(chǎn)生的極限糊精,由脫支酶水解去除α-1,6-糖苷鍵,再在α-淀粉酶和β-淀粉酶的作用下徹底水解[18]。
不同品質(zhì)類型小麥籽粒中蔗糖代謝形成淀粉合成前體的相關(guān)酶類(SPS、INV、SuS)以及淀粉代謝相關(guān)酶類(DBE、α-淀粉酶與β-淀粉酶)存在差異,是總淀粉含量及其組分的差異原因之一。面包劣質(zhì)小麥籽粒淀粉含量及直鏈淀粉含量均高于面包優(yōu)質(zhì)小麥,可能是由于其6-磷酸葡萄糖異構(gòu)酶基因的高表達(dá)導(dǎo)致。其他5類小麥品種中DBE與α-淀粉酶基因均高于面包優(yōu)質(zhì)小麥,可能是面包優(yōu)質(zhì)小麥總淀粉含量較低、支鏈淀粉含量較高的原因。因此調(diào)控籽粒蔗糖代謝通路以及淀粉水解通路可以作為調(diào)控小麥加工品質(zhì)的新思路。