解夢汐,于淼,魯明,付欣,張良晨,石太淵
(遼寧省農業(yè)科學院食品與加工研究所,遼寧 沈陽 110034)
花生(Arachis hypogaeaL.)又名“長生果”,是我國一種重要的經濟作物和油料作物,含有大量蛋白質、膳食纖維和不飽和脂肪酸?;ㄉl(fā)芽過程中總酚含量和反式白藜蘆醇等生物活性成分增加,具有高抗氧化活性,因此發(fā)芽花生被專家視為理想的新型功能芽菜品種,也稱花生芽[1]?;ㄉ诎l(fā)芽過程中通過調控苯丙烷代謝途徑提高苯丙烷類化合物如酚酸、白藜蘆醇和黃酮類物質的含量。大量研究證實了酚類物質的產生有助于植物應對多種外界生物和非生物的脅迫,而這些物質的產生涉及植物次生代謝過程信號傳導途徑的調控作用[2,3]。
在實際生產中,為解決花生芽生產周期長、活性成分富集消減速度慢等問題,國內外學者通過利用物理場誘導如超聲處理[4-6]、紫外照射[7,8]、外源添加[9]、高壓靜電場[10]等手段對花生或發(fā)芽花生的生物活性成分進行富集。Sales等[8]研究表明,經過超聲誘導的花生總酚含量從0.84 mg GAE/g提升至1.22~1.89 mg GAE/g;Yu等[4,5]研究表明超聲誘導能夠顯著提高發(fā)芽花生的白藜蘆醇含量,且隨著超聲頻率和發(fā)芽時長而變化,此現象也與花生品種的差異密切相關。但是未見超聲誘導對發(fā)芽花生苯丙烷類活性物質合成相關基因的表達調控的研究報道。
為了加強對發(fā)芽花生更深層次的開發(fā)利用,本研究選用超聲誘導處理后的發(fā)芽花生作為研究對象進行轉錄組測序,并利用生物信息學方法對其測序數據進行功能注釋分類、代謝通路分析,探討超聲誘導處理對發(fā)芽花生苯丙烷類合成相關基因的表達的作用。
材料于2020年6月采自遼寧省農業(yè)科學院沙地治理研究所花生研究基地,所選品種為阜花23號。選取大小均一且無破損的200粒花生籽粒放在紗布上,用體積分數為 1%的次氯酸鈉(次氯酸鈉:水=1:100)浸泡消毒20 min,再用純凈水沖洗三次,避光浸泡6 h后,連同紗布放在燒杯里,燒杯加水沒過花生,放入超聲儀器中進行超聲處理。超聲參數設置為 35 ℃、30 min、240 W(60%)、85 kHz。處理后,種子放置在托盤上,底部鋪上濾紙,鋪上紗布然后另一半紗布蓋上進行避光發(fā)芽。經過72 h后,取空白對照組和超聲誘導下的花生胚芽置于液氮中快速冷凍,于-80 ℃冰箱中保存?zhèn)溆茫椭辽虾C兰镉邢薰尽?/p>
從組織樣品中提取total RNA,利用Nanodrop 2000對所提RNA的濃度和純度進行檢測,瓊脂糖凝膠電泳檢測RNA完整性,Agilent 2100測定RIN值。樣品檢測合格后利用帶有 Oligo(dT)的磁珠與 ployA 進行A-T堿基配對,加入fragmentation buffer,可以將mRNA隨機斷裂,通過磁珠篩選分離出300 bp左右的小片段。在逆轉錄酶的作用下,加入六堿基隨機引物(random hexamers),以mRNA為模板反轉合成一鏈cDNA,隨后進行二鏈合成,形成穩(wěn)定的雙鏈結構。然后加入End Repair Mix將其補成平末端,隨后在3’末端加上一“A”堿基,用于連接Y字形的接頭。最后通過PCR擴增,純化PCR產物,得到最終文庫。文庫質量檢測合格后,不同文庫按照目標下機數據量進行 pooling,利用Illumina平臺進行測序(PE文庫,讀長2×150 bp)。
使用軟件SeqPrep去除reads中的接頭序列,去除由于接頭自連等原因導致沒有插入片段的reads;將序列末端(3’端)低質量(質量值小于30)的堿基修剪掉,如剩余序列中仍然有質量值小于10的堿基,則將整條序列剔除,否則保留;去除含N比率超過10%的reads;舍棄去adapter及質量修剪后長度小于50 bp的序列得到clean data,使用TopHat2(http://tophat.cbcb.umd.edu/)軟件進行序列比對分析。
以樣品KB組作為對照樣品,與樣品CS進行基因表達量的比較。將錯誤發(fā)現率(false discovery rate,FDR)≤0.001且差異倍數(fold change)≥2作為DEG的篩選標準,滿足此篩選標準的基因即為DEG。
通過BLAST軟件將篩選到的所有DEG分別與NCBI非冗余蛋白數據庫(Non-redundant Protein Sequence Database,NR)、京都基因與基因組百科全書(Kyoto Encyclopedia of Genesand Genomes,KEGG)數據庫、基因本體論(GeneOntology,GO)、蛋白質直系同源簇數據庫(COG)、蛋白質序列數據庫(Swiss-Prot)、蛋白數據庫(TrEMBL)和非冗余蛋白序列庫(NR)等一系列數據庫,并對基因進行功能注釋、分析以及統(tǒng)計。
表1 發(fā)芽花生轉錄組測序統(tǒng)計Table 1 Transcriptomic sequencing statistics of peanut sprout
將構建好的發(fā)芽花生轉錄組文庫通過HiSeq 2000高通量測序,得到超聲處理 CS組和空白對照組 KB的三次生物學重復間的相關系數均大于0.9,ReadSum的平均值分別為46208369條和49367041條,數據過濾后超聲處理CS組和空白對照組KB的平均總堿基數分別是6.98 Gb和7.45 Gb,GC含量分別為45.00%和45.13%,這些序列的Q20和Q30分別在98%和94%以上。以上數據說明全部樣品轉錄組測序質量較高,可為后續(xù)的差異表達基因分析提供了科學的依據。
將組裝獲得的所有基因和轉錄本與 NR、Swiss-Prot、Pfam、EggNOG、GO和KEGG六個常用數據庫進行序列比對(圖1),最終獲得有注釋信息的表達基因數目為 48660,各個數據庫注釋到的表達基因有較大的區(qū)別,其中NR數據庫注釋到47998個表達基因,占比98.64%,GO和COG分別有27880個和46411個表達基因,占比57.30%和95.38%,得到注釋最少的數據庫為KEGG,僅有22200個表達基因,占比為 45.62%。長度位于 300~1000 bp和長度≥1000 bp的數目分別有18310個和19233個(表2)。
表2 基因功能注釋統(tǒng)計Table 2 Functional annotation of ref genes
為研究發(fā)芽花生響應超聲誘導的基因表達情況,對超聲處理后的差異表達基因進行分析(圖2)。兩組樣品中共篩選出1104個DEGs,其中上調DEGs共有583個,用紅色點表示;下調DEGs共有521個,用綠色點表示;灰色點代表非差異表達基因。結果表明,上調DEGs的數目低于下調DEGs的數目。
將DEGs和COG數據庫進行比對,并對DEGs的功能進行預測和統(tǒng)計歸類,結果顯示,共有 14497條DEGs與數據庫中的基因相似度高。根據功能分類,可初步將花生種子轉錄組中的差異基因分為21類(圖3),數據分析發(fā)現,DEGs的COG功能涉及大多數的生命活動,其中種類全面,數量最多的是轉錄類的基因,其次是碳水化合物的運輸和代謝、重復和修復及翻譯后修飾、蛋白代謝、信號轉導機制、氨基酸轉運和代謝等類別;輔酶的運輸和代謝類數量最少,只有4個;與油脂轉運及代謝相關的基因有654個;此外仍有643個DEGs未知功能類別(圖3)。
對超聲誘導下發(fā)芽花生的DEGs進行了GO富集分析,共分為生物進程(biological process)、分子功能(molecular functions)和細胞組分(cellular component)三個大類。在DEGs富集數目的共33個亞類中(圖4),生物進程注釋到13個分支,DEGs主要集中在細胞組成或生物發(fā)生和細胞進程,分別有292個和241個基因功能得到注釋,說明細胞組分類的相關基因在超聲誘導花生發(fā)芽的生物進程中起著非常重要的作用。富集在細胞組分的DEGs主要分為10個分支,其中細胞組分包含的基因數目最多,共有217個,其次是膜的組成部分。在分子功能的9個分支中,參與催化活性和涉及結合功能的基因數量遠超過參與其他生物過程的基因數,分別有338個和245個基因。
為了進一步探索DEGs的生物學功能,解析花生芽在超聲誘導下的代謝調控網絡,對 DEGs進行了KEGG富集分析,共有327個DEGs富集到了97條通路中。在富集顯著的前20條代謝通路中(圖5),包含苯丙烷生物合成(24)、植物激素信號轉導(15)、胞吞作用(12)、植物與病原體的相互作用(11)、黃酮類生物合成(10)、淀粉和蔗糖代謝(8)、核糖體(8)、剪接體(7)、亞油酸代謝(6)、磷酸肌醇代謝(6)、谷胱甘肽代謝(6)、甘油磷脂代謝(6)、錯配修復(6)、同源重組(6)、基因復制(6)、內質網中的蛋白質加工(5)、類胡蘿卜素的生物合成(5)、氨酰基tRNA的生物合成(5)、抗壞血酸和藻酸鹽代謝(5)、α-亞麻酸代謝(5)、精氨酸和脯氨酸代謝(5)、氨基糖和核苷酸糖代謝(5)、糖酵解/糖異生(5)、RNA轉運(5)、核苷酸切除修復(5)等。富集分析結果說明花生芽通過代謝、合成次生代謝物等途徑參與超聲誘導的響應。
轉錄因子在調控植物非生物脅迫抗性方面起著重要作用[11-13],本研究分析超聲誘導下花生芽的DEGs,共屬于48個轉錄因子家族。其中B3家族包含293個基因,其次是MYB家族288個、bHLH家族281個,MYB_related家族261個以及ERF家族210個,說明這些家族轉錄因子的表達在發(fā)芽花生受超聲誘導下調控效果顯著。
本研究發(fā)現B3轉錄因子是發(fā)芽花生在超聲處理下表達量變化最多的家族。研究表明已知MYB、B3、WRKY、bHLH、bZIP等轉錄因子表達量變化能提高植物適應逆境的能力[14]。其中B3家族是一類含有B3功能域的轉錄因子家族,在植物的生長發(fā)育過程中發(fā)揮重要的調控作用,其功能域是一種可以和DNA特異結合且高度保守的結構域[15]。B3家族轉錄因子除了有參與DNA結合B3結構域外,還有其他保守的結構域,包括AP2,生長素應答因子,生長素/吲哚-3-乙酸等。bHLH轉錄因子家族是植物中最大的基因家族之一,廣泛的參與了植物代謝、發(fā)育及對各種脅迫的應答機制[16]。MYB轉錄因子是植物中最大的轉錄因子家族之一,廣泛參與植物生理生化過程,包括植物表皮組織細胞分化、外界環(huán)境因素響應、激素應答等[17]。研究表明,MYB轉錄因子的功能多種多樣,對植物的生長發(fā)育至關重要。例如,MYB轉錄因子可通過控制各個細胞分裂時期來實現對細胞周期的調控,也可通過調節(jié)植物次生代謝相關基因的表達來調節(jié)花青素、類黃酮等次生代謝產物的合成,在非生物脅迫和生物脅迫響應中也扮演了重要的角色[15]。此外,MYB轉錄因子還能調控植株對植物激素的響應[16]。
苯丙烷類生物合成途徑為DEGs富集數目最多的代謝通路,分析該調控途徑對研究玉米響應鹽脅迫的分子機制具有重要意義(圖7)。發(fā)現共有21 DEGs得到富集,其中過氧化物酶(E1.11.1.7)注釋到10個,下調3個,上調7個;β-葡糖苷酶上調(EC3.2.1.21)1個;四氫大麻酸合酶上調1個;甘露醇脫氫酶上調2個;網狀氧化酶樣蛋白上調1個;4-香豆酸酯-CoA連接酶上調2個;亞精胺羥肉桂?;D移酶上調1個;氰基β-葡萄糖苷酶上調1個,下調1個;咖啡酰-CoAO-甲基轉移酶上調2個;肉桂?;?CoA還原酶上調2個。
前人研究報道白藜蘆醇在植物體內是以苯丙氨酸為底物,通過苯丙烷途徑生成[18],因此本研究所得的所有轉錄本與KEGG通路數據庫中的苯丙烷合成途徑(map00940)進行比對,結果發(fā)現花生芽中arahy.Tifrunner.gnm1.ann1.DXZI51、arahy.Tifrunner.gnm1.ann1.VGN2GE、arahy.Tifrunner.gnm1.ann1.Y23DM6這三個基因顯著上調與白藜蘆醇合成途徑相關,其中arahy.Tifrunner.gnm1.ann1.DXZI51為肉桂酰基輔酶A還原酶(Cinnamoyl-CoA reductase 2)參與了肉桂酸的合成。苯丙氨酸(PHE,Phenylalanine)首先經過苯丙氨酸解氨酶(PAL,phenylalanine ammonia lyase)脫氨基作用失去氨基之后轉化為肉桂酸(Cinnamic acid),肉桂酸再通過肉桂酸羥化酶(C4H,cinnamate-4-hydroxylase)發(fā)生羥基化磷脂反應得到對香豆酸(Cinnamoyl-COA),在本通路結果中arahy.Tifrunner.gnm1.ann1.VGN2GE、arahy.Tifrunner.gnm1.ann1.Y23DM6基因均為4-香豆酸酯-CoA連接酶(4-coumarate-CoA ligase),參與了由4-香豆酸輔酶A連接酶(4CL,4-coenzyme A ligase)得到對香豆輔酶A的生物合成。前人報道香豆輔酶A(4-coumaroyl-COA)最后在外界因素刺激下,開啟白藜蘆醇生成途徑,由1分子的對香豆酰輔酶A和3分子的丙二酰輔酶A(Malonyl-COA)在芪合酶(STS,stilbene synthase)的催化作用下縮合生成1分子的反式白藜蘆醇[19]。由此可以說明在花生芽在超聲誘導下產生機械損傷,通過調控arahy.Tifrunner.gnm1.ann1.DXZI51、arahy.Tifrunner.gnm1.ann1.VGN2GE、arahy.Tifrunner.gnm1.ann1.Y23DM6促進白藜蘆醇的富集。
本研究發(fā)現苯丙烷類生物合成途徑是富集數目最顯著的一條代謝通路,共有21個相關基因得到注釋。在植物次生代謝途徑中,所有黃酮類物質、木質素和白藜蘆醇等大部分酚類物質均經苯丙氨酸代謝途徑合成,研究已經表明,植物體內這些關鍵酶在應對外界生物及非生物逆境時起到至關重要的調控次生代謝作用[20-23]。例如,PAL活性的提高增強了大豆根部木質素的合成進;甘草黃酮類物質的提高與PAL、C4H基因及其酶活性的增加有著不可分割的聯系[24,25]。上述結果表明,超聲誘導提高了發(fā)芽花生苯丙烷類合成途徑中基因的表達,這意味著發(fā)芽花生苯丙烷代謝途徑中的下游產物也將可能被超聲誘導所改變,這也進一步驗證了本研究在前期試驗中發(fā)現超聲誘導能夠顯著提高發(fā)芽花生的白藜蘆醇含量的結果[4-6]。殷向靜[26]利用超聲誘導葡萄富集白藜蘆醇,發(fā)現白藜蘆醇的富集受到白藜蘆醇合酶的轉錄控制,而超聲處理能夠引起白藜蘆醇合酶活性升高。此外,李淑瑩[27]的研究表明,超聲聯合苯丙氨酸誘導可對花生芽中白藜蘆醇的富集產生協同效應,原因是由于超聲可以提高肉桂酸-4-羥基化酶、4-香豆酸-輔酶A連接酶、類黃酮3-O-葡萄糖基轉移酶4種酶的活性。Ling等[28]研究超聲處理(400 W,6 min)與0.4%過乙酸在20 ℃對枇杷貯藏過程中生理變化的影響,結果表明,聯合超聲和乙酸處理后,枇杷果實中總黃酮含量在第3 d達到最高值,且高于對照組。這可能是因為超聲聯合過乙酸在處理可以提高枇杷果實內多酚氧化酶和過氧化物酶的活性,而這兩種酶則是參與苯丙烷途徑和氧化過程的重要酶,從而產生多種具有結構和防御功能的酚類化合物[2]。此外,卞紫秀等[23]研究表明,利用超聲處理可以有效地促進苦蕎麥種子的萌發(fā),從而富集苦蕎芽苗中黃酮類化合物。這可能要歸因于超聲處理能有效激活植物種子萌發(fā)期的各種酶類的活性[24],顯著提高種子萌發(fā)率,同時誘導種子中一些生物活性成分的合成,這與本研究發(fā)現的結果相一致,說明超聲誘導能夠調控發(fā)芽花生苯丙烷類生物合成代謝途徑的基因表達情況。
為了揭示發(fā)芽花生如何應答超聲外源場誘導,篩選在超聲誘導后起重要調節(jié)作用的基因,本研究在前期研究基礎上,選出適宜富集白藜蘆醇的花生品種阜花23號為試驗原料,是較有代表性的一個研究材料,為此次研究奠定了良好的材料基礎。研究了經超聲誘導后的發(fā)芽花生(CS)和未經誘導處理的發(fā)芽花生(KB)的轉錄組差異,證實了超聲能夠影響發(fā)芽花生苯丙烷類物質的生物合成,從兩組樣品中共篩選出1104個差異基因,其中上調583個,下調521個。通過與七大數據庫的比對分析,解析了發(fā)芽花生在超聲誘導下所涉及到的功能分類、代謝通路及生物進程的調控,功能注釋表明差異基因主要富集在遺傳信息處理、代謝途徑和蛋白質轉換。并挖掘到 3個(arahy.Tifrunner.gnm1.ann1.DXZI51、arahy.Tifrunner.gnm1.ann1.VGN2GE、arahy.Tifrunner.gnm1.ann1.Y23DM6)參與發(fā)芽花生苯丙烷類物質的顯著基因,這些研究結果為揭示發(fā)芽花生苯丙烷類物質的生物合成途徑提供一定的參考依據。但眾多基因復雜的調控網絡及發(fā)芽過程中酚酸、木質素及總黃酮等物質在超聲誘導處理下的代謝機理需要進一步深入探討,目的在于將來通過外援手段改變此類基因的調節(jié)功能,讓發(fā)芽花生的營養(yǎng)和功能性成分的變化向對人類有利的發(fā)現發(fā)展。